Descrição da Linha de Pesquisa
O Grupo de Banco de Dados e Recuperação da Informação (BDRI) do IComp atua nas linhas de Gerência de Dados (GR), Recuperação de Informação (RI) e Mineração de Dados (MD), em diferentes contextos como Web, ambientes móveis e comércio eletrônico. A excelência do BDRI é evidenciada por sua produção científica, protótipos de software criados em nossos laboratórios e parcerias com companhias através das quais os resultados da pesquisa são revertidos em desenvolvimento econômico e social.
A pesquisa relacionada com Gerência de Dados envolve fundamentalmente problemas relacionados com a coleta, extração, consulta, modelagem, armazenamento, transformação e integração de informação semi-estruturada. No contexto de Recuperação de Informação, os tópicos de pesquisa envolvem a proposta e implementação de modelos de dados textuais e multimídia, considerando aspectos como eficiência, representação e remoção de ruídos. Finalmente, a pesquisa em Mineração de Dados foca no desenvolvimento de processos de análise de dados para a coleta e extração de conhecimento.
Estas áreas estão intrinsecamente integradas, de tal forma que cada uma delas fornece importantes ferramentas tanto para o desenvolvimento das demais quanto para soluções efetivas em várias aplicações, tais como sistemas de recomendação, sistemas de publicidade e mineração de opiniões.
O grupo ainda mantém cooperação com vários outros grupos no Brasil e exterior, entre as quais citamos: University of Utah (USA), University of Alberta (Canada), Virginia Polytechnic Institute and State University (USA), Instituto Superior Técnico de Lisboa e Porto (Portugal), Universidade Federal de Minas Gerais - UFMG, Universidade Federal do Rio Grande do Sul - UFRGS, Universidade Federal de São Carlos - UFSCar, Universidade Estadual de Campinas - UNICAMP, Universidade de São Paulo - USP.
Tópicos de Pesquisa Investigados
Dentro das linhas de pesquisa do grupo, uma série de tópicos têm sido alvo de estudo, dos quais citamos
-
Extração de informação de fontes textuais, semi-estruturadas ou não estruturadas.
-
Extração de informação em fontes não textuais, como imagens e sons.
-
Consultas a Bancos de Dados baseadas em palavras-chave.
-
Integração de dados e seus problemas associados, tais como eliminação de informação redundante ou inconsistente.
-
Coleta de informação restrita a tópicos específicos
-
Proposta de novos modelos de Recuperação de Informação
-
Questões de Eficiência em RI, o que envolve tópicos diversos como estratégias de cache, compressão, processamento eficiente de consulta, remoção de ruído, etc.
-
Modelagem de usuário, comportamento e interesses, o que inclui tópicos de consulta, contexto de usuário, reputação, assinaturas de comportamento, etc.
-
Modelos de previsão aplicados a problemas diversos como qualidade de documentos, classificação de palavras-chave, séries temporais, etc.
-
Mineração de Opinião
-
Sistemas de Publicidade na Web
-
Sistemas de Recomendação