Repository logo
 
Loading...
Thumbnail Image
Publication

Prospeção de dados: classificação de dados de vinho e indígenas

Use this identifier to reference this record.
Name:Description:Size:Format: 
RCC_16_p. 47-80.pdf1.99 MBAdobe PDF Download

Advisor(s)

Abstract(s)

O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.
Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.

Description

Keywords

Classificação Prospeção de dados Classification Data mining

Citation

Passinho, Francisco; Cavique, Luís - Prospeção de dados: classificação de dados de vinho e indígenas. "Revista de Ciências da Computação" [Em linha]. ISSN 1646-6330 (Print) 2182-1801 (Online). Vol. 16 (2021), p. 47-80

Research Projects

Organizational Units

Journal Issue