Teixeira, JoãoBarata, GabrielGonçalves, DanielMealha, Óscar and Madeira, Joaquim and Tércio, Daniel and Sousa Santos, Beatriz2021-06-182021-06-182021978-3-03868-153-3https://doi.org/10.2312/pt.20101173https://diglib.eg.org:443/handle/10.2312/pt20101173Hoje em dia, a Internet é uma fonte enorme de informação sobre os mais diversos ramos do conhecimento. No entanto, este conhecimento encontra-se disperso por muitos sítios, sem qualquer ligação ente eles, o que torna difícil inter-relaciona-lo e compreendê-lo. O objectivo deste trabalho é identificar e avaliar métodos de extracção de informação de forma simples e eficaz, sem recorrer a parsing de língua natural ou bases complexas de conhecimento anotado. Queremos mostrar que é possível extrair informação de forma implícita na Web através de métodos estatísticos. Para além disso, dados em bruto são normalmente de difícil compreensão. Como tal, procurámos também estudar como permitir aos utilizadores usar técnicas de visualização de informação de forma simples e eficaz para melhor os analisar e entender. Neste trabalho, propomos uma nova abordagem onde os utilizadores podem criar os seus próprios extractores de informação e respectivas visualizações, sem precisar de escrever uma única linha de código, de uma maneira fácil e altamente flexível, através de uma interface especialmente desenvolvida para o efeito. Um protótipo deste sistema, MetaBrain, foi desenvolvido e encontra-se em fase de testes e afinações.Extracção de conhecimentoinferência probabilísticadata miningvisualizaçãoInternetMetabrain – Conhecimento na era do PetaByte10.2312/pt.20101173155-158