Loading...
4 results
Search Results
Now showing 1 - 4 of 4
- Influência de fatores socioeconómicos no sistema de ensino portuguêsPublication . Pombinho, Paulo; Cavique, Luís; Correia, LuísO presente artigo estuda a influência dos fatores socioeconómicos dos diferentes municípios no sucesso educacional dos estudantes. Para verificar a existência de fatores relevantes para o percurso académico dos estudantes, foram obtidos datasets com descritores socioeconómicos por município, médias das notas dos exames nacionais e as taxas de sucesso dos alunos. Estes datasets foram submetidos a uma técnica de K-nearest neighbours para permitir encontrar valores de atributos em municípios com valores em falta. Foram, de seguida, aplicados algoritmos de classificação, através de árvores de decisão e regressão, que permitiram analisar quais os atributos socioeconómicos que tinham, potencialmente, maior relação com o sucesso escolar. O trabalho efetuado permite identificar alguns fatores como alvos de potenciais estudos futuros sem, no entanto, se verificar correlações fortes com nenhum atributo socioeconómico.
- Prospeção de dados: classificação de dados de vinho e indígenasPublication . Passinho, Francisco; Cavique, LuísO data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.
- Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mistaPublication . Pombinho, Paulo; Cavique, Luís; Correia, LuísA qualidade dos dados é essencial para uma correta compreensão dos conceitos que representam. Em projetos de prospeção de dados é especialmente relevante evitar dados com qualidade inferior uma vez que se usam algoritmos que dependem de dados corretos para criar modelos e previsões precisos. Neste artigo, propomos uma abordagem de avaliação de qualidade que considera métricas que lidam com atributos individuais e, adicionalmente, uma análise longitudinal de fluxo, que permite fazer uma avaliação de qualidade que tem em consideração informação contextual. São propostas métricas de Qualidade de Dados por Entrada e Qualidade de Dados por Atributo e, finalmente, é proposta uma medida de Qualidade Global de Dados baseada nessas métricas.
- Segmentação de clientes e análise dos atributos mais relevantes dos clustersPublication . Lopes, Nuno; Cavique, LuísTendo por base um conjunto de dados dos clientes de uma empresa de produtos alimentares, tentamos implementar duas estratégias de data mining com o objetivo de compreender quais os atributos que melhor podem segmentar estes consumidores. Aplicamos primeiro um algoritmo de segmentação (k-means) para agrupar estes clientes e, seguidamente, utilizamos um algoritmo de classificação (árvore de decisão) para análise visual dos atributos que definiram os clusters da segmentação. Através da análise visual dos gráficos resultantes da indução de árvores de decisão conseguimos verificar que só o valor do salário dos clientes pode segmentar este conjunto de dados.