Repository logo
 
Publication

Feature engineering: techniques and applications

datacite.subject.sdg04:Educação de Qualidadept_PT
dc.contributor.authorTeixeira, Mariana
dc.contributor.authorCavique, Luís
dc.date.accessioned2023-12-20T12:05:33Z
dc.date.available2023-12-20T12:05:33Z
dc.date.issued2023-12
dc.description.abstractMachine Learning is a rising concept in today's society. In the past decade, ML-based systems have become part of people's daily routines, and their usage has been disseminated through diverse sectors. This evolution is supported by the exponential increase in data created worldwide. Feature Engineering is a critical process focused on transforming data into suitable inputs for Machine Learning algorithms. This work explores the Feature Engineering process by developing a baseline for its implementation. Hence, a pipeline of Feature Engineering techniques and their taxonomy is proposed, along with a set of R scripts to implement. The validity of the code is then demonstrated through its application to a real-world dataset.pt_PT
dc.description.abstractMachineLearning é um conceito em crescente evolução na sociedade atual. Na última década, os sistemas baseados em ML tornaram-se parte do quotidiano da população e a sua aplicação tem vindo a disseminar-se por diversos setores. Este crescimento é suportado pelo aumento exponencial da quantidade de dados gerados a nível mundial. FeatureEngineering surge, assim, como um processo chave que permite transformar dados em inputs adequados para os algoritmos de MachineLearning. O presente trabalho pretende explorar o processo de FeatureEngineering, com vista a desenvolver uma base de suporte à sua implementação. Por conseguinte, é proposta uma pipeline de técnicas de FeatureEngineering em paralelo com a sua taxonomia, juntamente com um conjunto de scripts R, para as implementar. A validade do código é, posteriormente, demonstrada através da sua aplicação a um conjunto de dados reais.pt_PT
dc.description.versioninfo:eu-repo/semantics/publishedVersionpt_PT
dc.identifier.citationTeixeira, Mariana; Cavique, Luís - Feature engineering: techniques and applications. "Revista de Ciências da Computação" [Em linha]. ISSN 1646-6330 (Print) 2182-1801 (Online). Vol. 18 (2023), p. 43-54pt_PT
dc.identifier.doihttps://doi.org/10.34627/rcc.v18i0.295pt_PT
dc.identifier.eissn2182-1801
dc.identifier.issn1646-6330
dc.identifier.urihttp://hdl.handle.net/10400.2/15286
dc.language.isoengpt_PT
dc.peerreviewedyespt_PT
dc.publisherUniversidade Abertapt_PT
dc.relation.publisherversionhttps://journals.uab.pt/index.php/rcc/article/view/295/251pt_PT
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_PT
dc.subjectData sciencept_PT
dc.subjectMachine learningpt_PT
dc.subjectData engineeringpt_PT
dc.subjectFeature engineeringpt_PT
dc.subjectData transformationpt_PT
dc.subjectCiência de dadospt_PT
dc.subjectEngenharia de dadospt_PT
dc.subjectEngenharia de atributospt_PT
dc.subjectTransformação de dadospt_PT
dc.titleFeature engineering: techniques and applicationspt_PT
dc.title.alternativeFeature engineering: técnicas e aplicaçõespt_PT
dc.typejournal article
dspace.entity.typePublication
oaire.citation.endPage54pt_PT
oaire.citation.startPage43pt_PT
oaire.citation.titleRevista de Ciências da Computaçãopt_PT
person.familyNameCavique
person.givenNameLuís
person.identifier.ciencia-id911E-84AC-3956
person.identifier.orcid0000-0002-5590-1493
rcaap.rightsopenAccesspt_PT
rcaap.typearticlept_PT
relation.isAuthorOfPublication40906a16-46a2-42f1-b26d-7db7012294ee
relation.isAuthorOfPublication.latestForDiscovery40906a16-46a2-42f1-b26d-7db7012294ee

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
RCC_18_43-54.pdf
Size:
1.23 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
9 B
Format:
Item-specific license agreed upon to submission
Description: