ERRO NO SISTEMA - Resultados errados de busca causam confusão na web


Erika Gonçalves - Grupo Folha
Erika Gonçalves - Grupo Folha

Se não tem no Google, das duas, uma: ou não existe ou você não soube procurar, costumamos dizer. Muitas pessoas, entretanto, recentemente acabaram achando o que não procuravam. A primeira polêmica veio quando usuários relataram que ao buscar pelo significado de “professora”, aparecia um termo nada lisonjeiro: “prostituta que inicia os adolescentes na vida sexual”.  


Nas redes sociais as pessoas compartilhavam prints e pediam que outros usuários relatassem o problema para o Google. A empresa explicou que estabelece parcerias com dicionários e que o significado exibido era apenas um resultado fornecido por outros e não elaborado pelo próprio buscador. O significado acabou excluído pelos parceiros e assim, o problema foi resolvido. Será?




Tudo parecia normal quando uma nova polêmica surgiu. A combinação das palavras “mulher negra dando aula” resultou em imagens com conteúdo pornográfico. O mesmo não ocorria quando a pesquisa era por apenas “mulher dando aula” ou “mulher branca dando aula”.  


ERRO NO SISTEMA - Resultados errados de busca causam confusão na web
iStock
 

 


Questionada, a empresa respondeu com uma nota através de sua assessoria de imprensa: “Quando as pessoas usam a Busca, queremos oferecer resultados relevantes para os termos usados nas pesquisas e não temos a intenção de mostrar resultados explícitos para os usuários, a não ser que estejam buscando isso. Claramente, o conjunto de resultados para o termo mencionado não está à altura desse princípio e pedimos desculpas. Estamos investigando o problema e, como sempre, vamos buscar uma solução para aprimorar os resultados não somente para este termo, como também para outras pesquisas que possam apresentar desafios semelhantes." 


Caso semelhante já havia acontecido neste ano na França. A busca pelo termo "lesbienne" (lésbica, em francês) também direcionava para muitos resultados com cunho pornográfico. Após reclamações dos usuários, o Google melhorou o algoritmo para que o termo remeta a conteúdos mais informativos, como a Wikipedia, páginas jornalísticas ou blogs especializados. O mesmo foi aplicado a termos como "gay" e "homossexual". Não é possível dizer que seja o mesmo caso do que ocorre no Brasil, mas é um sinal de que o problema pode ser resolvido.   



Mas como esse problema pode ser causado?


Buscadores e bots


  

Segundo Márcio de Abreu Moreira, professor da PUCPR, Campus Londrina, os sistemas têm uma forma parecida de funcionar. 


"Para que o mecanismo de busca funcione com a velocidade que os usuários estão acostumados, muitas atividades estão envolvidas por de trás de uma simples ação de consulta a uma palavra ou frase. No caso do Google, há um programa desenvolvido pela própria empresa (Googlebot) que rastreia toda a internet em busca de páginas públicas que são constantemente criadas e atualizadas. Cada empresa tem os seus bots. Cada página encontrada passa a fazer parte do índice do buscador, este processo é chamado de indexação. É como se a cada instante uma nova página de um livro fosse criada com todo o seu conteúdo (imagens, textos, gráficos, etc.) e referenciada no índice deste livro, e, quando alguém quer localizar algum assunto dentro deste grande livro não é necessário ler todo o livro para encontrar a página que contenha o assunto específico, basta inicialmente buscar pelo assunto no índice do livro”, explica. 


Segundo ele, quando se trata de um buscador, lidamos um enorme volume de dados e informações que são criadas constantemente e disponibilizadas através da rede mundial de computadores. São bilhões de páginas inspecionadas pelos programas, que identificam e armazenam dados de cada uma delas, como o endereço da página na rede, o título e o conteúdo em formato de texto. “Todas estas informações da página são indexadas. Para identificar novas páginas e/ou atualizações de conteúdo, os programas rastreadores buscam por links(ligações) que os direcionam para outras páginas web e, em cada página visitada é verificado se já existe registro da mesma no índice, caso não exista ela será indexada, caso contrário seu conteúdo é analisado afim de identificar atualizações”, diz Moreira. 


ERRO NO SISTEMA - Resultados errados de busca causam confusão na web
 




Quando realizamos uma busca, é feita a consulta nas bases de dados do buscador que contêm a indexação das páginas relacionadas a palavra ou a combinação de palavras buscadas.  O professor explica também que existem classificações feitas pelos programas rastreadores que indicam o quanto uma página é relevante com relação a um determinado assunto. 


“Isto é possível devido às diversas parametrizações, à diversas análises que levam em consideração critérios específicos. Um deles, utilizado para classificação de uma página como relevante ou não, é a quantidade de citações que a página possui, isto é, quantas vezes a página analisada é referenciada em outras páginas web. Esta quantificação é realizada justamente no processo de análise dos dados de cada página visitada pelos rastreadores. Quanto mais vezes um link para um determinado endereço de página for identificado, maior é sua relevância. A quantidade de palavras repetidas encontradas no texto de uma página, relacionadas a um determinado assunto, também é considerado um fator que pode influenciar na classificação da página como uma página com conteúdo relevante. Quanto mais a palavra aparece no texto, maior é a possibilidade de que a página trate de um determinado assunto buscado. Outro fator que pode ser considerado é a menção da página em redes sociais.” 


Moreira explica também que, por mais bem projetados e desenvolvidos que sejam os programas rastreadores, estes estão sujeitos a falhas, que podem causar transtorno e desconforto aos usuários por causa de resultados fora do contexto esperado. Alguns buscadores disponibilizam filtros para evitar essas situações, principalmente em computadores usados no trabalho ou por crianças. "A Google possui um recurso chamado de SafeSearch que permite filtrar os resultados das pesquisas evitando conteúdo explícitos, imagens fortes, etc”, aponta. O SafeSearch pode ser habilitado no item "Configurações" - configurações de pesquisa - Filtros do SafeSearch. 


O Bing traz dentro de suas configurações a possibilidade de configurar os resultados da busca quando se trata de conteúdo adulto, através da “Pesquisa Segura”, podendo escolher entre “restrita” (filtra texto, imagens e vídeos adultos dos resultados), “moderada” (filtra imagens e vídeos adultos, mas não o texto) e “desativada”. 


O Yahoo Search tem o Filtro Familiar, que ajuda a bloquear conteúdos explícitos nos resultados de busca. Ele pode ser programado como Restrito (sem conteúdo adulto), Moderado (sem imagens ou vídeo) e Desativado (sem restrições). 


A FOLHA entrou em contato com alguns buscadores para entender melhor como funciona o sistema de cada um deles. Apenas o Google retornou.


CONTINUE LENDO:

Como o sistema de buscas funciona segundo o Google.




Continue lendo


Últimas notícias