IL GIORNO CHE CAMBIÒ IL WEB (SECONDA PARTE)




Nata come progetto accademico, nel 1998 Google attira in brevissimo tempo altri investitori, nonché menti brillanti a capo di sfide informatiche senza precedenti. Tuttavia la situazione finanziaria resta quella di una start-up ambiziosa ma con entrate limitate, persino senza un vero e proprio business plan. Sarà solo con l’introduzione di AdWords, nel 2000, che Google inizierà a capitalizzare veramente il suo prodotto.
Per sostenere le centinaia di migliaia di ricerche giornaliere, Google acquista server il più velocemente possibile. Nel primo periodo, una ricerca impiega in media tre secondi e mezzo, non si possono superare le 10 richieste al secondo, e già a metà della giornata si raggiunge il limite massimo, con le interrogazioni successive che non approdano a niente. Google aggiorna la propria indicizzazione delle pagine su base mensile fino all’estate 2003, quando per ovvie necessità la cadenza diventa quotidiana. Miliardi di documenti web si aggiungono ogni anno e la presenza stessa di un motore di ricerca come Google contribuisce a incentivare il ritmo, permettendo alle persone di accedere a informazioni che non avrebbero trovato altrimenti.
Il 2003 è anche l’anno in cui Google stringe un accordo con Yahoo! per gestire tutto il traffico di ricerca, registrando un aumento di traffico del 50% in due mesi. Avere molti più dati, analizzati ed estratti, rende Google la macchina di apprendimento definitiva. Google è già diventato indicatore del comportamento umano: controllando quali interrogazioni vengono maggiormente inserite, è possibile sapere in tempo reale quello a cui il mondo è interessato, per esempio il fatto che nei fine settimana c’è un’impennata dei problemi casalinghi.
Page e Brin capiscono che ogni aspetto del comportamento degli utenti ha un valore, e che i registri di Google raccontano molto più di quando o come la gente fa ricerche: raccontano le loro storie, che tipo di persone sono e come la pensano. Questo feedback immediato può diventare la base di un meccanismo di apprendimento per l’intelligenza artificiale.

La prima squadra che ha lavorato per Google (fonte)

In poco tempo il livello di accuratezza nella conoscenza di Google cresce al punto da consentirgli di scegliere quando scambiare una parola con un’altra. Nelle ricerche, le persone non usano necessariamente le parole più corrette per esprimere ciò che hanno in mente: per esempio, se sono interessato a “immagini di cani” potrei digitare istintivamente “foto di cuccioli”. Google capisce che “cani” e “cuccioli” sono intercambiabili. Allo stesso modo, analizzando come le persone tornano indietro sui propri passi dopo un errore di ortografia, Google ha ideato il proprio controllo ortografico e fornisce risultati corretti anche se io digito parole imprecise. Un aspetto ancora più decisivo è la capacità di definire le parole dal contesto, cioè quali parole sono vicine le une alle altre: ad esempio “hot dog” può trovarsi nelle ricerche che contengono “pane”, “senape” o “baseball”, ma non “cani in fiamme”.
Tutti questi nuovi segnali (secondo le dichiarazioni ufficiali, circa 200 fino al 2009, ma probabilmente sono di più) vengono integrati man mano nel motore di ricerca e combinati col punteggio di PageRank, per meglio determinare la pertinenza dei risultati.
In altre parole, Google è in grado di applicare il tipo di distinzioni che farebbe una qualunque persona.

Page e Brin

Per diversi anni Google implementa filtri anti-spamming nelle ricerche (la cosiddetta SafeSearch), cosa che gli fa guadagnare la fiducia degli utenti. Dal fronte opposto, però, i siti lavorano subdolamente creando “fabbriche di link” per pompare i valori di PageRank (pratica che si definisce SEO, Search Engine Optimization). Se ne può vedere il risultato quando si digita il nome di un hotel e i primi risultati, anziché mostrare il sito di quell’hotel, rimandano alle agenzie specializzate nelle prenotazioni alberghiere.
Per un sito, dunque, essere in posizione alta può portare milioni di dollari di rendita. Page e Brin se ne rendono conto quando diventa incombente dover restituire guadagni ai fiduciosi investitori. Con AdWords (2000), il primo servizio pubblicitario self-service basato sul testo, Google finalmente inizia a produrre utili. E parecchio. Seguono AdWords Select (2002), che introduce un modello ad asta e un quality score, e infine AdSense (2003), estensione della pubblicità di Google a tutto il web tramite l'analisi contestuale.
E voilà, in un paio d’anni nasce il colosso finanziario che oggi ben conosciamo.

La sede di Google

Parallelamente a questi prodotti, Page e Brin non perdono mai di vista l'obiettivo del motore di ricerca, che si sposta dalla semplice scansione del web all'organizzazione di tutte le informazioni esistenti. E ciò include video, mappe dei luoghi, notizie e, con pareri controversi, la scansione di milioni di libri. Iniziano con l’implementare una serie di ricerche verticali in cui l’utente sceglie il tipo di risultato desiderato, ma nel 2004 si arriva a inglobare tutte le fonti in una sola ricerca omnicomprensiva (Universal Search).
Progetti come Google Translate (basato su modelli statistici invece che su regole linguistiche umane) e il riconoscimento vocale, servono a nutrire il "cervello virtuale" dell’intelligenza artificiale, che in prospettiva i due fondatori vogliono raggiungere. Pensate che nel 2001 Google era già disponibile in 26 lingue. Per ogni lingua esaminata, il sistema di Google ha creato un modello linguistico molto più grande di qualunque altro mai costruito. Il passo successivo è stato quello di lavorare con testi che erano già stati tradotti, e lasciare che la macchina capisse gli algoritmi impliciti che determinano il modo in cui si traduce da una lingua a un’altra. Naturalmente più dati hai, migliore è la qualità del sistema… e Google ha a disposizione l’intero web. Data una serie di parole, gli algoritmi sanno predire la parola che viene dopo.
Un altro punto sulla lista dei to-do è mostrare, alla ricerca della parola “hamburger”, i menu e le recensioni dei locali nelle vicinanze dove sia possibile mangiare un hamburger: così nasce Google Maps (2005), il cui sviluppo passa prima da Google Earth (2004, grazie all’acquisizione di Keyhole).

L'interfaccia Google nel 2006 con le ricerche verticali (fonte)

La lista delle applicazioni che hanno fatto del mondo Google quello che conosciamo è lunga: Gmail (2004, con 1 GB di spazio/utente, oggi salito a 15), Google Docs (2006, inizio della suite di produttività online, grazie all'acquisizione di Writely), Street View (2007, integrazione di immagini stradali in Google Maps), Google Chrome (2008, lancio del browser proprietario), Google Voice (2009, gestione intelligente delle chiamate e trascrizione messaggi), Google Goggles (2010, inizio della ricerca visiva tramite immagini).
E questo solo nel primo decennio. Applicazioni che nessun altro è stato in grado di fornire, almeno non a quel prezzo. Cioè gratis in termini economici per l’utente, ma a un costo elevato se parliamo di dati. E i dati hanno enorme valore, cosa che Page e Brin hanno realizzato agli albori del loro progetto.
Da quasi trent’anni, Google acquisisce la gran parte delle decisioni, grandi e piccole, che prendiamo nel corso della giornata. E questo “noi”, oggi, ha superato la metà delle persone del pianeta: nel 2026, infatti, si stima che Google abbia 4,5 miliardi di utenti attivi, ovvero il 55% circa della popolazione globale (8,3 miliardi di persone secondo le ultime stime).
Nel bene e nel male, gli attuali Large Language Models (LLMs), che chiamiamo IA, sono l’ultimo derivato nello sfruttamento e nella capitalizzazione di questa smisurata mole di dati, che rappresenta un pezzo della vita di tutti noi.

Commenti