:.: Se o conjunto de termos de busca usados durante um período pode definir um grupo de usuários, qual é o método que o Google usa para elaborar o seu Zeitgeist?

:.: Uma análise mais apurada da lista divulgada mensalmente pelo Google sugere que ela não é fiel aos termos usados pelos usuários, mas na verdade uma seleção. O próprio Google, na apresentação do Zeitgeist, revela: “para compilar estas listas e gráficos, nós reunimos uma variedade dentre os termos mais populares digitados no Google”.

:.: O raciocínio faz sentido, uma vez que seria necessário agrupar alguns termos para que eles chegassem aos primeiros lugares. Por exemplo, o terceiro termo mais buscado no Brasil em novembro de 2006 – pasme – foi rbd. Para quem não sabe, trata-se do Rebeldes, da novelinha de mesmo nome. Mas acho difícil que todas as adolescentes apaixonadas que teclaram em busca do grupo digitaram simplesmente rbd. Algumas buscaram rebeldes, assim, com minúsculas. Outras, quem sabe, Rebelde, no singular. Mas, agrupados, todos viraram um termo só, que galgou os primeiros lugares.

:.: Como isso é possível? E como é possível, ainda, que os internautas estejam tão bem comportados, que ninguém usou qualquer termo relacionado a “temas adultos” (sexo, para deixar o eufemismo de lado)? Sim, porque se é feito um agrupamento, vários termos como … bem, você sabe quais, poderiam ser agrupados em apenas um, sexo. Mas, não, parece que nenhum usuário do Google tem interesse nisso.

:.: O assunto chamou a atenção da revista Business 2.0, que entrevistou Douglas Merrill, o VP do Google responsável pelo Zeitgeist. E ele assumiu: a lista do Zeitgeist é realmente fruto de um algoritmo, ou seja, complexos cálculos matemáticos. Merrill diz que a intenção do Google não é mesmo listar os termos mais populares, mas aqueles que estão ganhando popularidade mais rápido. Os únicos termos eliminados, informa, são “Google”e seus produtos. “Por pura modéstia”, afirma.

:.: E a procupação do internauta com o sexo? Merrill diz que isso continua constante. Mas como já representava boa parte do interesse de quem fazia busca, a popularidade desses termos não variou o suficiente para que aparecessem na lista.

:.: É uma explicação, mas a mim levanta mais dúvidas que respostas.

Primeiro, não entendo porque os critérios são tão obscuros.
Segundo, uma vez que nao aparecem empresas na lista, isso quer dizer que os interesses comerciais dos usuários são descartados ou apenas não revelados gratuitamente?
Terceiro, como fazer para ter dados realmente confiáveis sobre o que Battelle chama de “base de dados de intenções”, ou seja, como ter uma idéia real dos termos mais usados pelos usuários?
Quarto, será que os analistas e estudiosos ( que utilizam o Zeitgeist para reportagens e teses ) estão atentos aos critérios adotados na definição da lista? Porque se não estão, muito do que já foi dito não merece crédito…