Google pristatė ilgai lauktą “universal search” modelį

Google Pagaliau! Paieškos sistemų lyderė žengė didelį žingsnį priekin ir patobulino savo (ir taip gerą) paieškos algoritmą ir pradėjo taikyti “universal search” modelį. T.y., nuo šiol, paieška bus vykdoma visose Google padaliniuose dalyse - web, nuotraukas, naujienas, video ir t.tGoogle universal interface

Toks paieškos modelio pakeitimas patobulinimas reikalauja technologinių atnaujinimų.

Google is also in the process of deploying a new technical infrastructure that will enable the search engine to handle the computationally intensive tasks required to produce universal search results. The company is also releasing the first stage of an upgraded ranking mechanism that automatically and objectively compares different types of information.

Atitinkamai prstatytas navigacijos paieškos rezultatuose atnaujinimas. Pagal turinio tipus (video, web, naujienas) paieškos rezultatuose bus generuojami dinaminiai meniu elementai.

New dynamically generated navigation links have been added above the search results to suggest additional information that is relevant to a user’s query. For example, a search for “python” will now generate links to Google Blog Search(TM), Google Book Search(TM), Google Groups(TM), and Google Code(TM), to let the user know there is additional information on his or her query in each of those areas.

Kas iš to paprastiems vartotojams ieškotojams žmonėms? Na, vienareikšmiškai atsakyti sunku. Iš vienos pusės - “viskas viename” principas, kai norėdami rasti informacijos apie kokį nors žmogų, įtaisą ar technologiją, naujo algoritmo dėka “iššukuojame” visus interneto Google užkaborius ir paieškos rezultatuose matome viską vienoje vietoje (meta paieškos principas). Iš kitos pusės, puolę į nevil nusiminę SEO ekspertai ir svetainių kūrėjai, nes pakliūti į paieškos rezultatų viršūnę tapo žyyyyymiai sunkiau, kadangi rezultatai kompiliuojami iš įvairių šaltinių (web, nuotraukų, naujienų ir t.t.). Norint užkopti į viršūnę, teks optimizuoti ne tik svetainių turinį, bet ir publikuojamas nuotraukas, audio, video turinį.

Kaip rinkau savo šiukšles iš paieškų sistemų

Situacija: Keliaujant iš gricius.net į gricius.lt buvo peržiūrėtas ir išvalytas dienoraščio turinys bei nuotraukų galerija.

Rezultatas: Daug įrašų loguose su klaidos kodu 404. Paieškos sistemose pilna rezultatų, vedančių į nebegzistuojantį turinį.

Sprendimas: Atsisiunčiau Wordpress įskiepį 404 Notifier. Įdiegęs pasirinkau, kad apie 404 klaidas būtų pranešama RSS kanalu. Apsilankiau Google Webmaster Central. Pasirinkau Site status skyrių. O jame rada visus Google pamestus rezultatus.404resultatai

Rezultatus importavau į M$ Excel. Pasirinkau URL Removal. Nurodžiau, kad noriu pašalinti specifinius URL, kurių yra po vieną. Kadangi dauguma įrašų buvo apie nerastas galerijos nuotraukas, kurių URL prasideda vienodai, buvo labai nepatogu 40 kartų kartoti tą pačią URL šalinimo procedūrą. Apie kitų robotų generuojamas 404 pranešė WP įskiepis. Todėl į robots.txt įtraukiau tokias eilutes:

User-agent: *
Disallow: /v
Disallow: /tag
Disallow: /dev

Blokuoju prieigą prie URL, kurie nebeegzistuoja. Tuo nušaunu du zuikius. Sekantį kartą, bet kuris paieškos robotas apsilankęs svetainėje ir perskaitęs draudžiantį įrašą, giliau ta kryptimi nelįs ir pašalins iš savo indekso ten vedančius rezultatus.

Išvada: Pradžioje gaudavau apie 40-50 klaidos 404 pranešimų. Dabar liko 1 pranešimas.

SEO: Jūsų rss ar svetainę, kurį indeksuoti?

Web2.0 kažkada rašė apie FeedBurner servisą ir trumpai apžvelgė, kaip naudotis pagrindinėmis funkcijomis. Tačiau liko nepaminėtas vienas labai svarbus punktas.

Tam tikrais atvejais paieškos sistemos sėkmingai suindeksuoja ne tik svetainės turinį, bet ir rss kanalo turinį. Tokiu atveju gauname turinio dubliavimą už kurį skaudžiai baudžia visos paieškos sistemos - sumažinamas jūsų svetainės reitingas, paieškos rezultato pozicija ir t.t. Blogiausiu atveju galima sulaukti net bano. Kaip to išvengti?

FeedBurner turi vieną savybę - galimybė uždrausti paieškos sistemoms indeksuoti jūsų rss kanalą. FeedBurner NoIndex

Taip nesunkiai galima išspręsti šią problemą.

REDAGUOTA: sprendimas uždrausti visiems botams priėjimą prie jūsų rss kanalo per robots.txt nėra pati idealiausia išeitis, todėl išimu tai iš siūlomų galimybių.

Kitas puslapis »