Loading...
Person
CIRÍACO PINHEIRO POMBINHO DE MATOS, PAULO MIGUEL
4 results
Search Results
Now showing 1 - 4 of 4
- Data pre-processing and data generation in the student flow case studyPublication . Cavique, Luís; Pombinho, Paulo; Tallón Ballesteros, Antonio J.; Correia, LuísEducation covers a range of sectors from kindergarten to higher education. In the education system, each grade has three possible outcomes: dropout, retention and pass to the next grade. In this work, we study the data from the Department of Statistics of Education and Science (DGEEC) of the Education Ministry. DGEEC maintains those outcomes for each school year, therefore, this study seeks a longitudinal view based on student flow. The document reports the data pre-processing, a stochastic model based on the pre-processed data and a data generation process that uses the previous model.
- Errors of identifiers in anonymous databases: impact on data qualityPublication . Pombinho, Paulo; Cavique, Luís; Correia, LuísData quality is essential for a correct understanding of the concepts they represent. Data mining is especially relevant when data with inferior quality is used in algorithms that depend on correct data to create accurate models and predictions. In this work, we introduce the issue of errors of identifiers in an anonymous database. The work proposes a quality evaluation approach that considers individual attributes and a contextual analysis that allows additional quality evaluations. The proposed quality analysis model is a robust means of minimizing anonymization costs.
- Influência de fatores socioeconómicos no sistema de ensino portuguêsPublication . Pombinho, Paulo; Cavique, Luís; Correia, LuísO presente artigo estuda a influência dos fatores socioeconómicos dos diferentes municípios no sucesso educacional dos estudantes. Para verificar a existência de fatores relevantes para o percurso académico dos estudantes, foram obtidos datasets com descritores socioeconómicos por município, médias das notas dos exames nacionais e as taxas de sucesso dos alunos. Estes datasets foram submetidos a uma técnica de K-nearest neighbours para permitir encontrar valores de atributos em municípios com valores em falta. Foram, de seguida, aplicados algoritmos de classificação, através de árvores de decisão e regressão, que permitiram analisar quais os atributos socioeconómicos que tinham, potencialmente, maior relação com o sucesso escolar. O trabalho efetuado permite identificar alguns fatores como alvos de potenciais estudos futuros sem, no entanto, se verificar correlações fortes com nenhum atributo socioeconómico.
- Qualidade de dados em bases de dados anonimizadas: uma abordagem de avaliação mistaPublication . Pombinho, Paulo; Cavique, Luís; Correia, LuísA qualidade dos dados é essencial para uma correta compreensão dos conceitos que representam. Em projetos de prospeção de dados é especialmente relevante evitar dados com qualidade inferior uma vez que se usam algoritmos que dependem de dados corretos para criar modelos e previsões precisos. Neste artigo, propomos uma abordagem de avaliação de qualidade que considera métricas que lidam com atributos individuais e, adicionalmente, uma análise longitudinal de fluxo, que permite fazer uma avaliação de qualidade que tem em consideração informação contextual. São propostas métricas de Qualidade de Dados por Entrada e Qualidade de Dados por Atributo e, finalmente, é proposta uma medida de Qualidade Global de Dados baseada nessas métricas.