Repository logo
 
Publication

Seleção de atributos de dados inconsistentes em ambiente HDF5+Python na cloud INCD

datacite.subject.sdg04:Educação de Qualidadept_PT
dc.contributor.authorApolónia, João
dc.contributor.authorCavique, Luís
dc.date.accessioned2019-12-19T10:46:59Z
dc.date.available2019-12-19T10:46:59Z
dc.date.issued2019-12
dc.description.abstractO tratamento de conjuntos de dados de grande dimensão é uma questão que é recorrente nos dias de hoje. Uma das abordagens possíveis passa por realizar uma seleção de atributos que permita diminuir, consideravelmente, a dimensão dos dados sem aumentar a inconsistência dos mesmos. A Análise Lógica de Dados Inconsistentes (LAID) é uma metodologia sistematizada, robusta, sendo fácil de interpretar e consegue lidar com dados inconsistentes. O paradigma, relativamente ao manuseamento de grandes volumes de dados, tem-se alterado. Antes, o tratamento dos dados era efetuado num único computador e o acesso era realizado depois do seu carregamento em memória. A tendência atual é aceder aos dados em disco, num ambiente cloud. Este trabalho pretende validar o novo paradigma, com recurso ao sistema de dados HDF5 e ao ambiente remoto disponibilizado pela. Pelo facto de o HDF5 ser o sistema adotado pela comunidade Python para lidar com dados de grande dimensão, esta linguagem foi escolhida para implementação do LAID.pt_PT
dc.description.abstractThe treatment of large datasets is an issue that is often addressed today and whose task is not simple, given the computational limitations that still exist.One possible approach is to perform a feature selection that allows a considerably reduction of data size without increasing inconsistency. Logical Analysis of Inconsistent Data (LAID) is a systematic, robust methodology that is easy to interpret and can handle inconsistent data.The paradigm regarding the handling of large data has hasbeen changing over. Previously, data processing was performed on a single computer, with in-memory data access. The current trend is to access data on disk, in a cloud environment. The present work intends to validate this new paradigm, using HDF5 data system and remote environment provided by INCD. Because HDF5 is the system adopted by Python’s community to handle large datasets, this language was chosen for LAID algorithm implementation.pt_PT
dc.description.versioninfo:eu-repo/semantics/publishedVersionpt_PT
dc.identifier.citationApolónia, João; Cavique, Luís - Seleção de atributos de dados inconsistentes em ambiente HDF5+Python na cloud INCD. "Revista de Ciências da Computação" [Em linha]. ISSN 2182-1801 (Online). Vol. 14 (2019), p. 85-112pt_PT
dc.identifier.doihttps://doi.org/10.34627/rcc.v14i0.184pt_PT
dc.identifier.issn2182-1801
dc.identifier.urihttp://hdl.handle.net/10400.2/8912
dc.language.isoporpt_PT
dc.peerreviewedyespt_PT
dc.publisherUniversidade Abertapt_PT
dc.relation.publisherversionhttps://journals.uab.pt/index.php/rcc/article/view/184pt_PT
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt_PT
dc.subjectData Miningpt_PT
dc.subjectSeleção de atributospt_PT
dc.subjectLAIDpt_PT
dc.subjectHDF5pt_PT
dc.subjectPythonpt_PT
dc.subjectINCDpt_PT
dc.subjectFeature selectionpt_PT
dc.titleSeleção de atributos de dados inconsistentes em ambiente HDF5+Python na cloud INCDpt_PT
dc.title.alternativeFeature selectionof inconsistent datain HDF5+Python environment on INCD cloudpt_PT
dc.typejournal article
dspace.entity.typePublication
oaire.citation.conferencePlaceLisboapt_PT
oaire.citation.endPage112pt_PT
oaire.citation.startPage85pt_PT
oaire.citation.titleRevista de Ciências da Computaçãopt_PT
person.familyNameCavique
person.givenNameLuís
person.identifier.ciencia-id911E-84AC-3956
person.identifier.orcid0000-0002-5590-1493
rcaap.rightsopenAccesspt_PT
rcaap.typearticlept_PT
relation.isAuthorOfPublication40906a16-46a2-42f1-b26d-7db7012294ee
relation.isAuthorOfPublication.latestForDiscovery40906a16-46a2-42f1-b26d-7db7012294ee

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
184-Texto Artigo-680-1-10-20191206.pdf
Size:
1014.36 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
9 B
Format:
Item-specific license agreed upon to submission
Description: