Prospeção de dados: classificação de dados de vinho e indígenas

Passinho, Francisco; Cavique, Luís

http://hdl.handle.net/10400.2/11549

Utilize este identificador para referenciar este registo.

Nome:	Descrição:	Tamanho:	Formato:
RCC_16_p. 47-80.pdf		1.99 MB	Adobe PDF	Ver/Abrir

Contacte-nos

Autores

Passinho, Francisco

Cavique, Luís

Resumo(s)

O data mining é uma área multidisciplinar que tem como objetivo extrair e descobrir padrões em grandes grupos de dados através de algoritmos de inteligentes. Neste artigo, foi realizado um estudo de classificação de dois datasets amplamente usados na literatura: dados de reconhecimento de vinhos italianos e dados de diabetes de indígenas Pima. Foi realizada uma análise estatística dos dados e a respetiva classificação com vários algoritmos de classificação. Foram obtidos resultados semelhantes e em alguns casos superiores aos reportados na literatura. Os melhores classificadores foram as Florestas Aleatórias e as Redes Neuronais com valores de exatidão acima dos 80%.

Data mining is a multidisciplinary area that aims to extract and find patterns in large groups of data using intelligent algorithms. In this paper, we performed a classification study of two widely used datasets in the literature: Italian wine recognition data and Pima indigenous diabetes data. A statistical analysis of the data and the respective classification was carried out with several classification algorithms. Similar results and, in some cases, better results were obtained when compared to those reported in the literature. The best classifiers were Random Forests and Neural Networks with accuracy values above 80%.

Palavras-chave

Classificação Prospeção de dados Classification Data mining

URI

http://hdl.handle.net/10400.2/11549

Citação

Passinho, Francisco; Cavique, Luís - Prospeção de dados: classificação de dados de vinho e indígenas. "Revista de Ciências da Computação" [Em linha]. ISSN 1646-6330 (Print) 2182-1801 (Online). Vol. 16 (2021), p. 47-80

Editora

Universidade Aberta

DOI

10.34627/rcc.v16i0.265

Coleções

RCC - Revista de Ciências da Computação

Licença CC

cclicense-by

Métricas Alternativas

Ver registo completo