Repository logo
 

Search Results

Now showing 1 - 4 of 4
  • Influência de fatores socioeconómicos no sistema de ensino português
    Publication . Pombinho, Paulo; Cavique, Luís; Correia, Luís
    O presente artigo estuda a influência dos fatores socioeconómicos dos diferentes municípios no sucesso educacional dos estudantes. Para verificar a existência de fatores relevantes para o percurso académico dos estudantes, foram obtidos datasets com descritores socioeconómicos por município, médias das notas dos exames nacionais e as taxas de sucesso dos alunos. Estes datasets foram submetidos a uma técnica de K-nearest neighbours para permitir encontrar valores de atributos em municípios com valores em falta. Foram, de seguida, aplicados algoritmos de classificação, através de árvores de decisão e regressão, que permitiram analisar quais os atributos socioeconómicos que tinham, potencialmente, maior relação com o sucesso escolar. O trabalho efetuado permite identificar alguns fatores como alvos de potenciais estudos futuros sem, no entanto, se verificar correlações fortes com nenhum atributo socioeconómico.
  • Logical Analysis of Inconsistent Data (LAID) for a paremiologic study
    Publication . Cavique, Luís; Mendes, Armando B.; Funk, Matthias
    A paremiologic (study of proverbs) case is presented as a part of a wider project, based on data collected by thousands of interviews made to people from Azores, and involving a set of twenty-two thousand Portuguese proverbs, where we searched for the minimum information needed to identify the birthplace island of an interviewee. The concept of birthplace was extended for all respondents that have lived in any locations more than 5 years,unintentionally introducing inconsistencies in the data classification task. The rough sets differ from classical sets by their ability to deal with inconsistent data. A parallel approach to data reduction is given by the logical analysis of data (LAD). LAD handicaps, like the inability to cope with the contradiction and the limited number of classification classes, will be overcome in this version of Logical Analysis of Inconsistent Data (LAID).
  • Prospeção de dados: classificação de dados de vinho e indígenas
    Publication . Passinho, Francisco; Cavique, Luís
    O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.
  • Segmentação de clientes e análise dos atributos mais relevantes dos clusters
    Publication . Lopes, Nuno; Cavique, Luís
    Tendo por base um conjunto de dados dos clientes de uma empresa de produtos alimentares, tentamos implementar duas estratégias de data mining com o objetivo de compreender quais os atributos que melhor podem segmentar estes consumidores. Aplicamos primeiro um algoritmo de segmentação (k-means) para agrupar estes clientes e, seguidamente, utilizamos um algoritmo de classificação (árvore de decisão) para análise visual dos atributos que definiram os clusters da segmentação. Através da análise visual dos gráficos resultantes da indução de árvores de decisão conseguimos verificar que só o valor do salário dos clientes pode segmentar este conjunto de dados.