Ci sono stati diversi tentativi in passato di arginare i motori di ricerca nel loro continuo censimento arbitrario delle pagine web ma, di fatto, si registrano solo sporadici casi in cui è stata limitata questa loro attività.
Il problema è duplice: da un lato i motori di rierca catturano ogni informazione on-line che riescono ad individuare senza richiedere autorizzazione alcuna (e facendone peraltro ragione del loro business); nel contempo, catalogando file di ogni tipo, espongono gli utenti al rischio di virus o di altri documenti potenzialmente pericolosi.
Sul primo aspetto, i search engines applicano una specie di silenzio - assenso: se i gestori dei siti web non fanno nulla, le pagine web dei loro siti diventano censibili, altrimenti devono impostare un apposito file (robots.txt) che ne inibisce o ne limita la cattura. Il problema è che l'azione di scandaglio dei motori di ricerca è alquanto invasiva e tende ad acquisire qualsiasi documento presente on-line (file Wod, Excel, PDF, audio video, ecc.), situazione non necessariamente voluta dai rispettivi proprietari dei file.
L'aspetto sicurezza è ancora più rilevante. Abacus SEO, un weblog che tratta di search engines, ha giustamente evidenziato come l'archivio di Google contenga anche molti documenti (in particolare di tipo VBS e REG) che potenzialmente possono contenere applicazioni dannose, senza che l'ultente sia salvagardato in alcun modo. Ancora più evidente la presenza di documenti Word, i quali spesso sono proprio utilizzati per diffondere virus.
Secondo me gli hacker non ci hanno ancora pensato... ma non tarderanno a farlo, magari inondando Google & Co. di documenti radioattivi. Quindi: occhio alle ricerche!











