Repository logo
 
Loading...
Thumbnail Image
Publication

Feature engineering: techniques and applications

Use this identifier to reference this record.
Name:Description:Size:Format: 
RCC_18_43-54.pdf1.23 MBAdobe PDF Download

Advisor(s)

Abstract(s)

Machine Learning is a rising concept in today's society. In the past decade, ML-based systems have become part of people's daily routines, and their usage has been disseminated through diverse sectors. This evolution is supported by the exponential increase in data created worldwide. Feature Engineering is a critical process focused on transforming data into suitable inputs for Machine Learning algorithms. This work explores the Feature Engineering process by developing a baseline for its implementation. Hence, a pipeline of Feature Engineering techniques and their taxonomy is proposed, along with a set of R scripts to implement. The validity of the code is then demonstrated through its application to a real-world dataset.
MachineLearning é um conceito em crescente evolução na sociedade atual. Na última década, os sistemas baseados em ML tornaram-se parte do quotidiano da população e a sua aplicação tem vindo a disseminar-se por diversos setores. Este crescimento é suportado pelo aumento exponencial da quantidade de dados gerados a nível mundial. FeatureEngineering surge, assim, como um processo chave que permite transformar dados em inputs adequados para os algoritmos de MachineLearning. O presente trabalho pretende explorar o processo de FeatureEngineering, com vista a desenvolver uma base de suporte à sua implementação. Por conseguinte, é proposta uma pipeline de técnicas de FeatureEngineering em paralelo com a sua taxonomia, juntamente com um conjunto de scripts R, para as implementar. A validade do código é, posteriormente, demonstrada através da sua aplicação a um conjunto de dados reais.

Description

Keywords

Data science Machine learning Data engineering Feature engineering Data transformation Ciência de dados Engenharia de dados Engenharia de atributos Transformação de dados

Citation

Teixeira, Mariana; Cavique, Luís - Feature engineering: techniques and applications. "Revista de Ciências da Computação" [Em linha]. ISSN 1646-6330 (Print) 2182-1801 (Online). Vol. 18 (2023), p. 43-54

Research Projects

Organizational Units

Journal Issue