Projeto REMINDS providencia sistema de aprendizagem automática para deteção de relevância
O projeto REMINDS (Relevance Mining and Detection System) tem como objetivo disponibilizar um sistema baseado em aprendizagem automática, com interface web, capaz de detetar conteúdo potencialmente relevante nas redes sociais.
Este trabalho foi desenvolvido internacionalmente, no âmbito da colaboração de Portugal com o programa UT Austin, e contou com a colaboração do INESC TEC, através do Centro de Sistemas de Computação Avançada (CRACS), do Laboratório de Inteligência Artificial e Apoio à Decisão (LIAAD) e do Centro de Sistemas de Informação e Computação Gráfica (CSIG), em parceria com a Faculdade de Ciências da Universidade do Porto, a Faculdade de Letras da Universidade do Porto, o Instituto Politécnico do Porto e o CISUC (Centre for Informatics and Systems) da Universidade de Coimbra. Do lado americano, colaborou o Texas Advanced Computing Center (TACC), a School of Information, ambos da UT@Austin, e ainda a IBM-NewYork.
Destinado em especial a jornalistas, mas também ao público em geral, este sistema prevê automaticamente se uma publicação no Facebook ou no Twitter é relevante ou não, usando mais de 30 recursos, entre os quais: o conteúdo da publicação e suas estatísticas, o sentimento que transmite e obtém como feedback, o sentimento associado às entidades nele referidas, a dinâmica do feedback recebido e o tipo de links externos usados. Além de tudo isso, esta nova abordagem integra o uso de “recursos substitutos” (surrogate features), confiáveis para critérios jornalísticos de deteção de relevância e que de outra forma seriam difíceis de serem computados.
Durante o período de duração do projeto, foram criados vários modelos de relevância, existindo já um protótipo totalmente funcional, que integra um desses modelos e que está alojado no CRACS. Apesar de ter terminado no final de 2017, este projeto ainda se encontra a produzir resultados, uma vez que a equipa está atualmente a tratar as bases de dados, no sentido de as disponibilizar livremente, e a estudar formas de alterar dinamicamente o modelo usado no protótipo, em função das características da publicação a analisar.
Na procura de aperfeiçoar esses “filtros” na informação, foram também criados modelos de: desambiguação de entidades mencionadas; identificação de correspondência de notícias semelhantes; evolução do sentimento associado a entidades ao longo do tempo; e concordância de opinião humana sobre relevância.
A equipa do INESC TEC foi constituída por Álvaro Figueira (CRACS; PI do projeto), Nuno Guimarães (CRACS), Pedro Ribeiro (CRACS), Luís Torgo (LIAAD) e Paula Fortuna (CSIG).
Os investigadores mencionados na notícia têm vínculo ao INESC TEC e à UP-FCUP.