Vyhľadávanie vo vyhľadávačoch často krát vykonávame intuitívne. Preto je úplne prirodzené, že užívatelia svoj hľadaný výraz opakovane preformulujú. Zmena a prepísanie hľadaného výrazu sa veľa krát deje opakovane.
Dôvod je jednoduchý. Dostať sa k presnejšiemu a relevantnejšiemu výsledku na výraz ktorý hľadáme. V niektorých prípadoch pomôže našepkávanie (“suggestion”) slovných výrazov, ktoré nám ponúkne samotný vyhľadávač.
Zmena slovného spojenia, alebo zmena poradia slov však veľa krát nestačí. Vyhľadávanie si vyžaduje priamejšiu kontrolu nad súvislosťami medzi hľadanými slovnými spojeniami. Výsledky častokrát nezodpovedajú tomu, čo hľadáme.
Výsledok vyhľadávania je dokonca ovplyvnený personalizáciou Google konta. Čo to znamená? Ak je človek prihlásený do akejkoľvek služby, napr. Gmail, sú nám podsúvané výsledky na základe nášho profilu a teda podľa toho čo sme predtým hľadali.
Faktorov, ktoré nám skresľujú výsledky, je veľa. Patrí medzi ne napríklad: geolokácia, typ zariadenia či to, aký máme navolený operačný systém. To je naozaj základné minimum.
Aby sme sa vyhli preklikávaniu jednotlivých stránok výsledkov na pomoc sa hodí dodatočné filtrovanie výsledkov. Tu prichádzajú na pomoc Google operátory.
Článok je členený do jednotlivých podkapitol. Slúži ako čiastočný návod pre prácu s Google operátormi a s pokročilými Google operátormi. Následne prinesie pár príkladov ako používať tzv. Google dorks. Po jeho prečítaní sa budete mať šancu dostať k žiadaným a omnoho hodnotnejším výsledkom omnoho ľahšie.
Čo sú google operátory
Google a jeho vyhľadávanie má vo svojej výbave špecifické výrazy. Tieto sa volajú aj Google operátory. Tých nie je až tak veľa a preto, ak si chcete uľahčiť vyhľadávanie, odporúčame vám ich zahrnúť pri vyhľadávaní do svojho repertoáru.
Spomenuté výrazy – google operátory – pomáhajú spresniť hľadaný zámer. Pomáhajú vyšpecifikovať, obmedziť, prípadne inak filtrovať výsledky k žiadanej spokojnosti za použitia dodatočných “príkazov”, prípadne ich kombinácií.
V praxi to znamená spresnenie vašej vyhľadávacej techniky tak, aby ste sa dostali k informáciám, ktoré by ste bežnou vyhľadávacou technikou nenašli.
Google dorks – Google hacking
Inou nie až takou známou technikou je používanie tzv. “Google dorks“ alebo “Google Dorking”.
“Dorking“ nie je nič iné ako použitie pokročilej syntaxe vyhľadávania na odhalenie skrytých informácií na verejne dostupných webových stránkach. “Google Dorking“ je vo svojej podstate spôsob, ako využiť známeho vyhľadávacieho giganta, Google, na identifikáciu slabých miest a nedostatkov pri nastavení zverejnených webových stránok. Napríklad ich nedostatočné zabezpečenie pred indexáciou či dohľadaniu citlivých informácií z nich, ktoré možno ďalej využiť a spracovať.
Čo je to GHDB
Áno, hádate správne. Je to skratka z anglického termínu “Google Hacking DataBase”. Jedná sa o kategóriu vyhľadávacích dopytov zadávaných do internetového vyhľadávača navrhnutých tak, aby odhalili zaujímavé a zvyčajne senzitívne informácie zverejnené na internete.
História Google dorks
Používanie “dorks” má svoje korene v roku 2002. Johnny Long (penetračný tester) hľadal konkrétne prvky webových stránok pomocou vlastných vyhľadávaní – tzv. dopytov. Časť týchto špecifických vyhľadávacích dopytov zadával pri svojom postupe práve do textového vyhľadávača Lynx.
Johnny Long sa preslávil ako aktívny autor a pomerne známy rečník k témam o počítačovej bezpečnosti. John Long sa vyprofiloval ako odborník v oblasti hackovania Google a bol jedným z prvých priekopníkov v tejto oblasti.
Ešte dodnes je zaujímavá jeho prednáška z DEFCON 13: Google Hacking for Penetration Testers, ktorá sa konala v Las Vegas 29. – 31. 2005, Na tejto konferencii dokonca vtipkoval, že ďalšia prednáška bude o Yahoo vyhľadávači.
Johnny Long o spomenutom postupe napísal aj knihu – Google Hacking for Penetration Testers. Prednáška na DEFCON nebola jediná, kde sa prezentoval.
Aktuálne je dostupných cez 7000 “Google dorks” operátorov na verejne dostupnej databáze Exploit Database, pričom za rok 2022 pribudlo do tejto databázy cez 150 operátorov. Sumarizovaná a publikovaná prezentácia od Johnny Longa pod názvom Using Google as a Security Testing Tool stojí aj dnes za prezretie.
Ako používať základné a pokročilé Google operátory
Základné ale aj pokročilé operátory pomáhajú zošľachťovať a vylepšovať vaše vyhľadávanie.
Základné operátory sú zadávané súčasne spolu s ďalším slovným údajom bez medzery. Sú tu však výnimky ako napríklad pri operátore OR a | ,kde sa vyžaduje uvádzať medzeru. Ďalšou výnimkou je operátor * (hviezdička). Operátor * vyžaduje pri svojom použití za slovným spojením medzeru. V prípade, že budete používať * (hviezdičku) aj v kombinácii s ďalšími operátormi, tam sa medzera nevyžaduje. Viac nájdete na následných príkladoch nižšie.
Tak ako základné operátory aj pokročilé operátory sú vpisované do vyhľadávania (input poľa Google vyhľadávača) a sú zahrnuté ako súčasť štandardného vyhľadávacieho dopytu. Pokročilé operátory používajú syntax, ako napríklad:
operátor:vyhľadávaný_výraz
Medzi operátorom, dvojbodkou a znakom nie je žiadna medzera pre hľadaný výraz. Medzi jednotlivými operátormi sa ponecháva medzera, ale ako sme uviedli v texte vyššie, medzera sa zadáva až keď chceme použiť ďalší operátor. Dôvod je zrejmý. Pridávame ďalší príkaz pre filtrovanie výsledkov vyhľadávania.
Tvorba operátorov je jednoduchá. Kombinujete podľa potreby nasledovné operátory.
operátor1:vyhľadávaný_výraz_A operátor2:vyhľadávaný_výraz_B
Základné operátory
Spresnenie vyhľadávania je možné realizovať už aj za použitia základných operátorov. Pre zrealizovanie dodatočnej filtrácie výsledkov vám postačí ich naozaj základná kombinácia.
operátor | funkcia | príklad |
“ ” | presná zhoda | “hľadaný výraz” |
* | akékoľvek slovo (wildcard) | elon musk * twitter |
– | vylúčenie | elon musk -twitter |
$ / € | cena | ipad $200 / ipad €200 |
.. | rozsah hodnoty alebo dátumu | ipad €200..€400 / ipad 2021..2022 |
OR / | | kombinácie | second hand | použité „knihy“ |
# | hashtag | #piestany site:twitter.com |
Presná zhoda výrazu
Operátor | Príklad: |
“ ” | “related:dennikn.sk” |
Hľadanie presného výrazu na webe za pomoci umiestnenia do úvodzoviek. Úvodzovky priraďujú k hľadanému výrazu prioritu. Inak povedané: zameriavajú sa presne na daný hľadaný výraz v zátvorkách.
Popis: Zadaný operátor hľadá explicitne celý termín “related:dennikn.sk” a teda v tomto príklade samotný operátor. Pozor nemýliť si s príkazom related:nazovdomeny.sk (bez úvodzoviek). Ten hľadá súvisiace a príbuzné domény k uvedenej doméne v príkaze. Takýmto spôsobom môžete vyhľadávať aj kúsky samotného kódu, respektíve premení hľadaný príkaz, kód na slovné spojenie.
Výsledok: Nájdete takto lukratívnu a rezidentnú zmienku o Denníku N, na oficiálnom webe Google Support. Neprekáža, že sa z textu nelinkuje, zmienka z tak autoratívneho webu má svoju váhu pre podporu brandového slovného spojenia.
Akékoľvek slovo
Operátor | Príklad: |
* | elon musk * twitter |
Hľadanie akéhokoľvek slova v použitom slovnom spojení. Inými slovami jeho doplnenie medzi použité slová. Operátor je nazývaný aj ako wildcard.
Popis: Uvedený operátor dopĺňa a hľadá akékoľvek slovné spojenie medzi vyhľadávanými slovnými spojeniami.
Výsledok: Poskytuje výsledky pri akých možných témach bolo meno Elon Musk a slovnom spojení Twitter zmienené a tak dokáže odhaliť do hĺbky spracovanie tejto témy webovými stránkami, médiami, atď.
Vylúčenie
Operátor | Príklad: |
– | elon musk -twitter |
Odstránenie slovného spojenia alebo iného operátora z výsledkov.
Popis: Použitie operátora je jednoduché. Dbajte aby medzi operátorom a výrazom nebola medzera. Operátor je možné použiť aj pre vyradenie domény alebo TLD domény z výsledkov napr. -twitter.com alebo “recept na halušky” -site:.sk -site:.cz pre vyradenie SK a CZ domén a hľadanie receptu na zahraničných weboch.
Výsledok: Za použitia operátoru docielite vyradenie aktuálneho buzzwordu twitter s ktorým je osoba Elon Musk aktuálne a prednostne spájaná a tak sa dozviete zmienky o iných projektoch na ktorých sa podiela.
Cena
Operátor | Príklad: |
$ alebo € | ipad $200 |
Hľadanie konkrétnej ceny vo vopred definovanej mene.
Popis: Hľadaný operátor definuje (cenu) menu v ktorej hľadáte uvedený produkt.
Výsledok: Operátor poskytne ponuku webov ako Ebay a Amazon s uvedeným produktom, ale nie je dokonalý bez použitia vylučovacieho operátora, ktorý pomôže odstrániť weby s koncovkou SK. Celé znenie operátora v ideálnom príklade by bolo: ipad $200 -.sk
Rozsah číselnej hodnoty alebo dátumu
Operátor | Príklad: |
.. | site:ifocus.sk 2018..2020 |
Definujete tak rozsah ceny alebo dátumu.
Popis: Operátor pri kombinácii s webovým sídlom zverejní vo výsledkoch podstránky, ktoré obsahujú dátum zverejnenia a korešpondujú s uvedeným rozsahom dátumov.
Výsledok: Poskytne tak výsledky, ktoré uverejnia v približne chronologickom poradí zverejnené, v tomto prípade historicky publikované podstránky.
Kombinácie
Operátor | Príklad: |
OR alebo | | second hand | použité “knihy” |
Použitie operátorov pre docielenie variability hľadania.
Popis: Konkrétny operátor je vhodné použiť v kombinácii s hľadanými výrazmi alebo s inými základnými operátormi.
Výsledok: Výsledky vo vyhľadávači ponúkajú webstránky zmieňujúce sa o oboch výrazoch na ich celom obsahu s dôrazom na slovo “knihy”.
Hashtag
Operátor | Príklad: |
# | #piestany site:twitter.com |
Vyhľadávanie konkrétneho hashtagu, konkrétnej stránky v indexovanej stránke
Popis: Operátor podmieňuje prednostné zahrnutie postov zo sociálnej siete Twitter.com, ktoré používajú hashtag #piestany a sú indexované vo vyhľadávači Google.sk
Výsledok: Výsledky ponúkajú všetky indexované posty sociálnej siete Twitter s použitím uvedeného hastagu. Výsledky nie sú úplne čisté a pre presné využitie je vhodné použiť s presnou zhodou a tak celý operátor znie: “#piestany” site:twitter.com.
Pokročilé operátory
Uvedené operátory pomáhajú definovať informácie viazané hlavne ku konkrétnemu webovému sídlu. V kombinácii so základnými operátormi dokážu veľmi efektívne vyfiltrovať výsledky k žiadanému výsledku.
operátor | funkcia | príklad |
site: | konkrétny web | site:wikipedia.org |
related: | príbuzný web | related:ifocus.sk |
cache: | dátum a čas indexácie (cachovania) | cache:apple.com |
define: | definícia slovného výrazu | define:ppc |
imagesize: | presná veľkosť obrázka | imagesize:500×400 elon musk |
inurl:/allinurl: | hľadanie v ur adrese | inurl:admin / allinurl:blog seo |
intitle:/allintitle: | hľadanie v titulke webu | intitle:služby / allintitle:kontaktný formulár |
intext:/allintext: | hľadanie v texte webu | intext:google ads / allintext:google ads skripty |
inanchor:/allinanchor: | hľadanie odkazu | inanchor:návody / allinanchor:free pdf books |
link: | linkovanie na zdroj | link:gorila.sk |
filetype: / ext: | súbor (typ súboru, extension) | site:volkswagen.sk filetype:pdf |
Konkrétny web
Operátor | Príklad: |
site: | site:alza.sk “zľava” |
Tento operátor prehľadáva výhradne na zvolenom webovom sídle. Dá sa efektívne skombinovať aj s iným operátorom.
Popis: Vyhľadávanie vo všetkých indexovaných podstránkach domény Alza.sk so zmienkou slovného výrazu “zľava” kdekoľvek na podstránke.
Výsledok: Výsledok vyhľadávania poskytne všetky dostupné zľavy bez percentuálneho alebo inak číselného obmedzenia. Operátor je možné použiť aj na filtrovanie výhradne napríklad slovenských domén s použitím presnej zhody.
Operátor site:.sk “príklad slova” hľadanie konkrétneho výrazu len v slovenských (SK) doménach. Vyradí tak iné, zahraničné domény, ktoré môžu “presakovať” do výsledkov Google.sk ako COM, AT, HU, CZ a podobne.
Operátor býva často použitý aj na orientačnú informáciu o počte indexovaných podstránok v Google a teda site:nazovdomeny.sk, kde pod input poľom zobrazí informáciu “About 1234 results”.
Príbuzný web
Operátor | Príklad: |
related: | related:bbc.co.uk |
Hľadanie príbuzných a inak súvisiacich domén k uvedenej doméne.
Popis: Vyhľadanie súvisiacich domén indexovaných vo vyhľadávači. Weby sú definované istou formou “tématickej príbuznosti”, ktorá ich môže radiť do podobnej skupiny pri zadaní vybraného webového sídla.
Výsledok: Zvolený príklad ponúka iné súvisiace webové sídla. V tomto prípade ponúka dostatočný počet výsledkov, keďže má dostatok dát, ktoré tento operátor vyžaduje. Pri použití v Google.sk častokrát neponúka príliš obstojné výsledky – nemá dostatok dát.
Operátor sa dá použiť aj na dohľadanie linkbuildingových príležitostí a teda webov na získanie spätného odkazu, keďže vráti do výsledkov vyhľadávania tématicky príbuzné weby.
Dátum a čas indexácie (cache)
Operátor | Príklad: |
cache: | cache:apple.com |
Zobrazenie presného času a dátumu kedy bol web zahrnutý do indexu Google (cache)
Popis: Zobrazenie údajov o poslednej snímke ktorú zrealizoval Google bot o webe v podobe posledného dátumu a času s možnosťou náhľadu plnej verzie webu, jeho iba textovej podoby alebo zdrojového kódu.
Výsledok: Dozviete sa tak presný dátum a čas indexácie. Od realizácie snímky sa pochopiteľne web mohol zmeniť a prejsť aktualizáciou.
Definícia výrazu
Operátor | Príklad: |
define: | define:ppc |
Popis: Identifikácia významu hľadaného výrazu PPC.
Výsledok: Výsledok je definícia výrazu zobrazená z webu s najlepšie popísaným významom slova. Obdobný výsledok je možné získať aj po zadaní výrazu: PPC meaning.
Presná veľkosť obrázku
Operátor | Príklad: |
imagesize: | imagesize:500×500 “spiderman” |
Presná definícia rozmeru hľadaného obrázku
Popis: Vyhľadanie obrázku o rozmere 500 pixelov na 500 pixelov pre slovo “spiderman”.
Výsledok: Zobrazenie obrázkov, ktoré zodpovedajú uvedenému rozmeru a slovnému spojeniu.
Hľadanie v URL
Operátor | Príklad: |
inurl:/allinurl: | inurl:login / allinurl:blog python |
Zobrazenie hľadaného výrazu v URL štruktúre alebo celého viacslovného výrazu v URL.
Popis: Hľadanie jedného výrazu v adrese webstránok alebo viacerých výrazov v URL adrese.
Výsledok: Výsledkom sú všetky indexované login stránky webových sídiel alebo blogy ktoré majú v URL zmienené slovo blog a python. Operátor môže poslúžiť aj na auditovanie HTTPS pripojenia. S použitím ďalšieho operátora site:cewe.sk -inurl:https identifikujeme napríklad, ktoré stránky sú ešte nezabezpečené ale zaindexované.
Hľadanie v titulke webu
Operátor | Príklad: |
intitle:/allintitle: | intitle:kontakt / allintitle:currency converter |
Zobrazenie hľadaného výrazu v titulke webu alebo celého viacslovného výrazu v titulke.
Popis: Identifikácia zaindexovaných stránok s titulkou kontakt alebo obsahujúcich slovné spojenie currency converter.
Výsledok: Výsledkom sú stránky obsahujúce titulku s textom kontakt. Stránky, ktoré sa venujú “konvertoru mien” sú korektne zobrazené vo výsledkoch po použití horeuvedeného operátora.
Hľadanie v texte webu
Operátor | Príklad: |
intext:/allintext: | intext:chatgpt / allintext:chatgpt errors |
Zobrazenie hľadaného výrazu v texte webu alebo celého viacslovného výrazu v texte.
Popis: Hľadanie v texte webu informácie o chat gpt-3 a hľadanie zmienok o chybách chat gpt-3
Výsledok: Výsledky sú popisné a relatívne presné.
Hľadanie odkazu
Operátor | Príklad: |
inanchor:/allinanchor: | inanchor:návody / allinanchor:free pdf books |
Popis: Zahrnie do výsledkov vyhľadávania webové stránky, na ktoré smerujú odkazy z iných stránok obsahujúcich v linkovanom texte výraz zadaný hneď za operátorom.
Výsledok: Výsledky sú popisné a relatívne presné.
Linkovanie na web
Operátor | Príklad: |
link: | link:gorila.sk |
Vyhľadanie domén odkazujúcich na konkrétnu webstránku
Popis: Identifikácia domén ktoré linkujú na eshop s knihami Gorila.sk
Výsledok: Výsledok je zoznam domén, ktoré linkujú na spomenutý eshop.
Typ súboru
Operátor | Príklad: |
filetype: alebo ext: | site:ford.com filetype:pdf |
Vyhľadanie konkrétneho typu súboru
Popis: Vyhľadanie pdf súboru na doméne značky Ford
Výsledok: Výsledky sú pdf dokumentácie uložené na doméne Ford.com
Google dorks príklady
Teraz si uvedieme 5 praktických príkladov ako použiť Google dorks pre dôslednú kontrolu nastavenia indexácie nedávno alebo dlhšie spusteného webu. Skontrolovať tak jeho spracovania obsahu webu Google botom.
Je pravdou, že veľa opensource CMS riešení už pokrýva základné blokovanie indexácie pomerne spoľahlivo. Často krát však pri zmene správcov webu môže dôsť k neevidovaným zmenám. Problém môže nastať aj pri použití custom CMS (napríklad v PHP programovacom jazyku), alebo nedostatočným serverovým nastavením.
Kontrola admin a login
Kontrola či nedošlo k indexácii login alebo admin sekcie spusteného webu na custom CMS riešení.
site:*.vasadomena.sk inurl:login filetype:php
Kontrola WordPressu
Používaním neoverených a neauktualizovaných pluginov sa na webe môže prihodiť dostupnosť admin sekcie. Skontrolujte nedostupnosť vašeho admin rozhrania na WordPress webe v prípade ak ste jeho defaultné znenie wp-admin už dávno nezmenili.
Problém sa týka aj iných neaktualizovaných opensource riešení. Google dork si upravte podľa adresárovej štruktúry konkrétneho CMS.
site:vasadomena.sk intitle:"Index of" wp-admin
site:vasadomena.sk inurl:/wp-admin/admin.php intitle:"Log In"
site:vasadomena.sk inurl:/wp/wp-admin/
Kontrola nechcených subdomén
Na FTP a v DNS zápisoch máte možno trošku neporiadok. Určite však nechcete aby sa vám v Google indexe zobrazovali subdoménové adresáre? Je na čase to preveriť.
site:*.vasadomena.sk
Orientačná kontrola indexácie jazykových verzií webu
Spustili ste svoj web v rozličných jazykových mutáciách? Potrebujete však aspoň orientačne skontrolovať či došlo k indexácii.
site:vasadomena.sk inurl:en
Dostupnosť dokumentov
Svoj firemný web používate ako úložisko dokumentov vo formáte PDF. Sú však na interné použitie. Čas od času pošlete link na tieto súbory svojmu obchodnému partnerovi. Áno, aj v čase uvedomelej bezpečnosti sa dejú nechcené indexácie takýchto súborov.
site:*.vasadomena.sk ext:pdf
Efektivita pri vyhľadávaní
V návode sme obsiahli najdôležitejšie operátory, ktoré Vás posunú k žiadaným výsledkom vo vyhľadávaní. Spresníte tak výsledky a odfiltrujete nepodstatné weby z výsledkov. Dodatočný výber Google operátorov s popisom funkcie a príkladom použitia nájdete na Moz.com a zoznam 42 pokročilých operátorov na Ahrefs.com.