spájame
slovenskú
IT komunitu
pridaj sa
Registrácia · Login

Matúš Kočiš 18.4.2014
Hodnoť článok:
3 5

Komerčné a cielené indexovanie webstránok

Indexovanie webu je silný nástroj s rôznymi možnosťami využitia. Vôbec sa o ňom nehovorí. Zdá sa, že sa ani vôbec nevyužíva. Pritom ide o plne legálny spôsob získavania množstva cenných verejne dostupných informácii, ktoré inak nie je možné získať.

Na objavovanie verejne dostupných webových stránok sa používa softvér pod názvom webový indexový prehľadávač. Spoločnosť Google používa Googlebot, ktorý je naprogramovaný tak, aby prechádzal webovými stránkami, získaval z nich hypertextové odkazy, účelne ukladal zdrojový kód navštívenej stránky a posielal ich na serveri spoločnosti. Zdá sa, že tým má spoločnosť Google prehľad o tom, čo a kde sa na internete nachádza a následne to vie ukázať (v podobe relevantných stránok) používateľom. Každá spoločnosť, ktorá prevádzkuje internetový vyhľadávač má vlastný spôsob indexovania stránok. Ktokoľvek (pokiaľ si vie naprogramovať takýto softvér) môže indexovať akékoľvek internetové stránky a získavať z nich informácie.

Prehľadávanie webu indexovaním spoločnosťou Google na účely získavania informácii pre vyhľadávanie sa deje plne automaticky a je ovplyvňované vlastníkmi stránok informáciami v hlavičke či v súboroch sitemap. Určuje sa tak, ktoré stránky sa majú prehľadávať, ako často a aj akou rýchlosťou. Vlastník stránky môže robotom zanechať informáciu, že si neželá danú podstránku indexovať (nebude sa nachádzať v katalógu internetového vyhľadávača).

Existuje slovenská spoločnosť, ktorá spustila službu komerčného využívania cieleného indexovania webstránok. Ich squellou ponukou je naprogramovanie a prevádzkovanie robota, ktorý pre klienta zabezpečí cielené indexovanie klientom vybranej domény (webovej stránky), podobne ako to robí Google. Je potrebné poznamenať, že ide o plne legálny spôsob získavania informácii. Robot sa vie dostať len na verejne dostupné podstránky všade tam, kde by sa mohol kedykoľvek dostať (alebo kde má prístupové údaje) aj bežný používateľ cez internetový prehliadač. Nejde pritom o žiadnu novinku, alebo prevratnú službu. Je všeobecne známe, že je možné spustiť takéhoto robota v podobe skriptu z jednej domény, ktorá nesie v sebe funkcionalitu indexovania inej domény. Je možné, že vaša konkurencia alebo ktokoľvek už dnes cielene indexuje vaše webové stránky. Istotne na to však nebude chcieť upozorňovať, aby nedávala návod svojej konkurencii.

Cieleným indexovaním je možné v pravidelných intervaloch navštevovať stránky produktov vašej konkurencie. Budete mať vždy prehľad o tom, aké ceny uvádza vaša konkurencia. A to bez toho, aby ste vy (alebo vaši zamestnanci) navštívili stránky konkurencie (alebo si nechávali vypracovávať prieskumy trhu, vývoja cien a podobne). Na základe týchto informácii, môže váš systém ceny automaticky upraviť na najnižšie na trhu. Indexovať môžete dokonca aj portály porovnávania cien - všeobecne akúkoľvek stránku na ktorú sa môže bežný používateľ dostať.

Môžu vás tiež zaujímať konkrétne, už kategorizované informácie v daných katalógoch a robotom sa na nich zameriate. Môžete napríklad indexovať všetky inzeráty, ukladať informácie do databázy a pri výpisoch tieto informácie rôzne filtrovať. Napríklad zo stránok bazos.sk, inzeraty.sk, topreality.sk môžete ukladať všetky reality a následne len vypisovať tie, ktoré sú podľa vašich požiadaviek. Spustíte indexovanie a každý deň je výsledkom filtrovaný zoznam realít.

Je možné sa zameriavať aj na denne aktualizované informácie, ako sú grafy, štatistické dáta a aktualizované obrázky. Môžete si z nazbieraných informácii nastaviť vlastné zostavy dát a prehľadov. Môžu byť naprogramované aj automatické mailové avíza či upozorňovanie na rôzne udalosti. Takéto techniky indexovania webu dnes sú štandardom pre investorov alebo spoločnosti zaoberajúcimi sa investovaním na burzách.

Nechať prehľadávať web robotom je oveľa rýchlejšie a efektívnejšie akoby to mal robiť človek (kopírovaním údajov). V okamihu niekoľkých hodín je možné získať z katalógov všetky zverejnené mailové adresy, kontaktné údaje a množstvo cenných kategorizovaných informácii (všetky vtipy, vyžrebované čísla lotérie, všetky články, všetky obrázky). Upozornil by som, že indexovaním ukladáte informácie do databázy, kde s nimi ďalej viete pracovať. Indexovať a ukladať je možné text, obrázky a všeobecne všetko, čo je obsiahnuté v HTML zdrojovom kóde (aj skryté, respektíve zakomentované údaje).

Cielené indexovanie sa neriadi a ani neakceptuje informácie o neindexovaní daných podstránok a správa sa tak ako aj bežný používateľ. Pokiaľ máte odkaz, kedykoľvek môžete legálne indexovanie webu spustiť. Informácie získavate v štruktúrovanej forme do chvíle kým programátor výrazne nepozmení HTML kód. Na zmeny sa však vždy dá reagovať, upraviť pravidlá indexovania a opäť získavať štruktúrované dáta. Je potrebné si tiež uvedomiť, že každá zmena v zdrojom kóde ovplyvní čítanie webu (Googlebotom) a v konečnom dôsledku aj SEO optimalizáciu danej domény, čo zmení pozície vo výsledkoch vyhľadávania.

Ako vydavateľ alebo šíriteľ médii, môžete sledovaním vytipovaných stránok kontrolovať, či dané stránky nelegálne nekopírujú vaše texty, články, obrázky a informácie. Algoritmy nazbierané dáta môžu aj percentuálne vyhodnocovať a monitorovať internetový trh. Európska komisia si spolu s členskými štátmi nedávno posvietila na internetové stránky, cez ktoré sa predávajú letenky, ubytovanie a ďalšie služby v cestovnom ruchu - naindexovala ich verejne dostupné informácie.

Indexovanie webu je možné využívať aj na vedecké účely. Takéto niečo najlepšie zobrazuje naozaj silný nástroj vo vašich rukách. Naprogramovanie webového indexového prehľadávača (Googlebota) nie je vôbec nič náročné. Začnete na stránke zoznam.sk a indexovaním budete ukladať všetky hypertextové odkazy a prepojenia stránok. Každý deň budete formovať mapu celého internetu.

Indexovanie webu je pre vás silný nástroj s rôznymi možnosťami využitia a obrovskej pridanej hodnote či úspore času. Ponúka vám možnosť lepšie a správne sa rozhodnúť, efektívne osloviť potencionálnych klientov a získať veľmi rýchlo veľmi cenné dáta, ktoré by ste inak nemali šancu ani získať - a to vždy plne legálne. Už nemusíte kopírovať z webových stránok kategorizované informácie. Môžete ich mať všetky zverejnené v priebehu niekoľkých hodín. Taktiež nemusíte financovať analýzy či monitoring ani kupovať si prieskumy trhu. Tieto informácie, môžete získavať plne vo vlastnej réžii.

Matúš Kočiš Matúš Kočiš

má niekoľkoročné skúsenosti s podnikaním na internete, ktoré začínali v angažovaní sa na referaty.sk, pokračovali v založení zadanie.sk, písaní na medialne.sk, založení publikovane.sk a stále sa prehlbujú pri poskytovaní konzultácii, managementu a squellých služieb v spoločnosti, ktorú založil.


Hodnoť článok:
3 5

0 komentárov k článku:

Komentovať môžu iba prihlásení

Zaregistruj sa cez bezplatnú registráciu alebo použi login cez Facebook (FB Connect)

Prihlás sa tu, ak už máš profil na Zajtra.sk:


Zabudol som heslo

Zajtra.sk > Marketing > SEO/SEM > Komerčné a cielené indexovanie webstránok


Kritika

Vieš ako robiť veci lepšie? Pomôž našim odvážnejším členom a skritizuj im projekty!

Reklama

Seriály zo Zajtra.sk

Reklama