Mestrado em Engenharia Informática e Tecnologia Web | Master’s Degree in Informatics Engineering and Web Technology - TMEITW
Permanent URI for this collection
Browse
Browsing Mestrado em Engenharia Informática e Tecnologia Web | Master’s Degree in Informatics Engineering and Web Technology - TMEITW by Author "Schatz, Jan Paulo Borges"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
- Automation of the genealogical process: information extraction for GEDCOM filesPublication . Schatz, Jan Paulo Borges; Rocio, VitorO presente estudo visa investigar as etapas de um sistema construído para o processo de automatização da recolha de informação genealógica: reconhecimento de caracteres a partir de fontes físicas e extração de dados da World Wide Web, recuperação de informações relevantes, extração de relações familiares, inserção dos dados em ficheiros de formato apropriado e, consequentemente, visualização gráfica num formato claro e com o menor número possível de distorções. Campos da informática que evoluíram do estudo do reconhecimento de padrões e da teoria da aprendizagem computacional em inteligência artificial são atualmente utilizados para resolver a tarefa de extração de relações de entidades, o que ajuda muito o processo de investigação genealógica. Alguns trabalhos já procuraram nos últimos anos medir a capacidade de identificar texto e extrair informação útil, otimizando a relação entre a fonte de informação e a sua exibição em diagramas. Uma aplicação promissora é a conversão de texto em formato livre utilizando técnicas de processamento de linguagem natural, seguida de treino de um modelo de aprendizagem de máquina. Finalmente, as relações escolhidas podem ser convertidas em ficheiros GEDCOM que permitem facilmente a criação de árvores genealógicas.