-r--r--r--

Google rezultātu apstrādāšana

Šodien, drūmi lūrot rakstu vācekli, uzdūros uz PHPDeveloper raksta par PHP skripta izmantošanu, lai savāktu Google Ajax Search API rezultātus ar visu skripta paraugu sānos (kuram nez kāda iemesla dēļ ir norauts sākums, bet to protams izdomāt nav nekāda māksla). Iesākumam viss izskatījās ļoti jauki, bet papētot dziļāk nebija viss gan tik skaisti.

Pirmais, kas ieleca acīs bija mazais rezultātu skaits (4 vienā prasījumā, nu c’mon es zinu, ka Google māk un var labāk :), bet papētot dziļāk Google Ajax Search API atradu maģisko “rsz” mainīgo, kas atbild par to cik daudz rezultātu Google tante pasniegs Tev. Daudz gan iespēju mainīgajam nav, tik kā small (kas atbildē atsūtīs 4 rezultātus) un large (8 rezultātus), bet tas tomēr bija labāk nekā noklusējums.

Tad nāca jautājums par bradāšanu pa rezultātu lapām.  Ar to nodarbojas “start” mainīgais, ko nu nenācās grūti atrast, jo tāds pats tiek lietots parastajos Google meklējumos. Bet te nu spēlējoties atklāju vienu nepatīkamu fīču. Tu esi ierobežots līdz 56 rezultātiem un ne viena vairāk. Manās acīs riesās asaras, jo man nepatīk, kad tieku ierobežots. It īpaši labi zinot, ka ir vēl daudz interesantu rezultātu. Bet lai nu tā būtu, ja ir nepieciešams apstrādāt tikai Googlei populārākos rezultātus vaicājumam.

Tad nu nonācu līdz tam brīdim, kad bija jāuzdrukā vienkārša un jauka funkcija, ko varētu lietot kāda botā, kas sarok nepieciešamo informāciju (piem. e-pasta adreses spamošanai, ne nu jokojos takš :) un rezultāta ieguvu, ko līdzīgu šim (lai viss jauki darbotos nepieciešamas cURL un JSON). Lietojiet uz veselību.

Pastāv, gan viens jautājums “Vai Googlei patīk bloķēt šādus botīgus meklējumus caur Ajax Search API?” uz ko pagaidām atbildi nezinu.  Zinu tik to, kad ja parsēsi Google rezultātus no www.google.lv/search?q=foo ātri vien Google sāks aizdomīgi skatīties uz Tavu skriptu un liks aizpildīt captcha. Bet nu šai problēmai es esmu atradis risinājumu, bet to citā vakara pasaciņā :)