Google a anunțat zilele acestea finalizarea unui nou sistem de indexare a paginilor web denumit Caffeine. Noul index oferă rezultate cu 50% mai rapid decât vechiul sistem și reușește să stocheze o baza de date impresionantă.
Noul index oferă pe de o parte o serie de beneficii utilizatorului obișnuit dar captează în același timp și atenția webmasterilor nevoiți să-si optimizeze paginile web pentru a fi mai ușor indexate.
Vechea modalitate de lucru presupunea reindexarea paginilor în funcție de importanța acestora și de frecvența cu care erau actualizate, rezultând uneori întârzieri de câteva săptămâni între informația postată pe site și cea oferită de Google. Caffeine analizează întreg spațiul web mai frevent, pe porțiuni mai mici, iar paginile noi găsite sunt adăgate la nou index indiferent de momentul la care au fost publicate.
In fiecare secundă Caffeine indexează sute de mii de pagini în paralel, dacă informațiile ar fi scrise pe hârtie și puse unele peste altele, grosimea acestora ar crește cu 4.8 kilometri în fiecare secundă. Noul sistem are nevoie de 100 de milioane de gigabytes în baza de date iar în fiecare zi adaugă sute de mii de gigabytes.
Noul sistem de indexare denumit sugestiv Caffeine a fost gândit ținându-se cont de evoluția Internetului pe viitor. Acesta este scalabil și se poate adapta la o creștere masivă a volumului de date stocate pe serverele din lumea întreagă.
Modul în care Google analizează paginile web existente este explicat pe înțelesul tuturor în clipul de mai jos: