Meta buscador multimídia
No ano passado a Jéssica e o Robson, sob minha orientação, desenvolveram, no Trabalho de Conclusão de Curso (TCC) deles, um meta buscador multimídia. O conceito de meta buscador é simples. Trata-se de um componente que recebe uma consulta, repassa esta consulta para outros buscadores e retorna os resultados obtidos ao usuário que digitou a consulta.
O meta buscador desenvolvido pela Jéssica e pelo Robson é multimídia porque repassa a consulta e trata os resultados do YouTube, Flickr, Yahoo e Delicious. Ou seja, para uma só consulta o meta buscador retorna fotos, vídeos e documentos.
No entanto, o objetivo do TCC não foi desenvolver um meta buscador multimídia. O objetivo do TCC, segundo o que consta na introdução foi: "o objetivo deste trabalho é desenvolver um método de expansão de consultas para sistemas de recuperação de informação multimídia na Web que leva em consideração tags de sistemas de folksonomia" [1].
Expansão de consultas é um método amplamente utilizado na área de Recuperação de Informação (RI), utilizando principalmente ontologias e taxonomias para isso [2, 3]. O nosso objetivo com o TCC da Jésica e do Robson era verificar o quanto tags de um sistema de folksonomia poderiam ser utilizadas na expansão de consultas.
Uma pessoa digita uma consulta; cada termo da consulta é procurado em um sistema de folksonomia [4] (i.e., delicious); procura-se por sinônimos neste sistema de folksonomia, e; cada sinônimo encontrado é adicionado à consulta formando-se a consulta expandida. Trata-se de um algoritmo simples, mas nós queríamos ver a aplicabilidade disto, ou seja, se a eficiência da consulta expandida é maior ou não que a eficiência da consulta original.
Para tanto, foi desenvolvido o meta buscado multimídia chamado Folkaliza. Um meta buscador que expande a consulta original do usuário usando tags do delicious e submete a consulta expandida ao YouTube, Flickr, Delicious e Yahoo. No caso do YouTube e do Flickr os termos da consulta expandida são procurados nas meta informações dos vídeos e fotos. No caso do Delicious e Yahoo os termos da consulta expandido são utilizados nas próprios mecanismos de busca destes sites.
Para validar a proposta foi utilizado um método quantitativo baseado em questionário. Trata-se de um método diferente do tradicional método de benchmarking utilizado na avaliação de sistemas de RI (se você desejar saber um pouco mais sobre estes métodos então dê uma olhada no capítulo 4 do texto "Uma breve introdução ao tema Recuperação de Informação"). Optou-se por utilizar um método baseado em questionário pois nós não tínhamos nenhuma coleção de referência para analisar.
Os resultados encontrados foram otimistas: 28% das pessoas que responderam o questionário acharam os resultados retornados pelo Folkaliza ótimos e 51% acharam bons (ver figura abaixo).
[caption id="attachment_190" align="aligncenter" width="167" caption="Resultado do nível de satisfação dos usuários com relação aos resultados retornados pelo Folkaliza"][/caption]
Claro que foram realizadas outras medições. Os resultados completos, assim como detalhes de implementação, podem ser vistos no TCC da Jésica e do Robson.
Uma pergunta que surgiu ao longo do trabalho foi: "O que significa realmente expandir consultas utilizando tags genéricas de um sistema de folksonomia?" A palavra genéricas está grifada na pergunta anterior porque no desenvolvimento do Folkaliza foram utilizadas as tags de todos os usuários para a expansão da consulta de um único usuário. Em outros trabalhos [5] esta abordagem é implementada utilizando apenas as tags do próprio usuário na tentativa de personalizar a consulta. No caso do Folkaliza não. No caso do Folkaliza utiliza-se as tags mais frequentes no momento. Qual será o impacto disto?