Luís Manuel Pereira Sales Cavique Santos

Search Results

Now showing 1 - 10 of 52

Data mining process models: a roadmap for knowledge discovery
Publication . Mendes, Armando B.; Cavique, Luís; Santos, Jorge M. A.
Extracting knowledge from data is the major objective of any data analysis process, including the ones developed in several sciences as statistics and quantitative methods, data base \ data warehouse and data mining. From the latter disciplines the data mining is the most ambitious because intends to analyse and extract knowledge from massive often badly structured data with many specific objectives. It is also used for relational data base data, network data, text data, log file data, and data in many other forms. In this way, is no surprise that a myriad of applications and methodologies have been and are being developed and applied for data analysis functions, where CRISP-DM (cross industry standard process for data mining) and SEMMA (sample, explore, modify, model, assessment) are two examples. The need for a roadmap is, therefore, highly recognised in the field and almost every software company has established their own process model.
2012Book part Open access Show more
Seleção de atributos de dados inconsistentes em ambiente HDF5+Python na cloud INCD
Publication . Apolónia, João; Cavique, Luís
O tratamento de conjuntos de dados de grande dimensão é uma questão que é recorrente nos dias de hoje. Uma das abordagens possíveis passa por realizar uma seleção de atributos que permita diminuir, consideravelmente, a dimensão dos dados sem aumentar a inconsistência dos mesmos. A Análise Lógica de Dados Inconsistentes (LAID) é uma metodologia sistematizada, robusta, sendo fácil de interpretar e consegue lidar com dados inconsistentes. O paradigma, relativamente ao manuseamento de grandes volumes de dados, tem-se alterado. Antes, o tratamento dos dados era efetuado num único computador e o acesso era realizado depois do seu carregamento em memória. A tendência atual é aceder aos dados em disco, num ambiente cloud. Este trabalho pretende validar o novo paradigma, com recurso ao sistema de dados HDF5 e ao ambiente remoto disponibilizado pela. Pelo facto de o HDF5 ser o sistema adotado pela comunidade Python para lidar com dados de grande dimensão, esta linguagem foi escolhida para implementação do LAID.
2019-12Journal article Open access Show more
Data science e big data
Publication . Cavique, Luís
2014Conference object Open access Show more
A feature selection approach in the study of azorean proverbs
Publication . Cavique, Luís; Mendes, Armando B.; Funk, Matthias; Santos, Jorge M. A.
A paremiologic (study of proverbs) case is presented as part of a wider project based on data collected among the Azorean population. Given the considerable distance between the Azores islands, we present the hypothesis that there are significant differences in the proverbs from each island, thus permitting the identification of the native island of the interviewee, based on his or her knowledge of proverbs. In this chapter, a feature selection algorithm that combines Rough Sets and the Logical Analysis of Data (LAD) is presented. The algorithm named LAID (Logical Analysis of Inconsistent Data) deals with noisy data, and we believe that an important link was established between the two different schools with similar approaches. The algorithm was applied to a real world dataset based on data collected using thousands of interviews of Azoreans, involving an initial set of twenty-two thousand Portuguese proverbs.
2013-11Book part Open access Show more
Ramex-Forum: a tool for displaying and analysing complex sequential patterns of financial products
Publication . Tiple, Pedro; Cavique, Luís; Marques, Nuno C.
Financial data provides a valuable up‐to‐date knowledge of the world economy. However, it is presented in extremely large data volumes, in diverse formats, and is constantly being updated at a high speed. The Ramex‐Forum algorithm is oriented to guide financial experts in finding new and relevant information.We present a sensitivity analysis and newvisualizations using an improved version of the Ramex‐Forum algorithm. The proposed algorithm is applied to two case studies – the petroleum production chain and the European financial institutions risk analysis. Different combinations of parameters and new ways to visualize data are used. Results highlight the importance of Ramex‐Forum for analysing relevant relationships in price variations in financial markets.
2016Journal article Open access Show more
Clique communities in social networks
Publication . Cavique, Luís; Mendes, Armando B.; Santos, Jorge M. A.
Given the large amount of data provided by the Web 2.0, there is a pressing need to obtain new metrics to better understand the network structure; how their communities are organized and the way they evolve over time. Complex network and graph mining metrics are essentially based on low complexity computational procedures like the diameter of the graph, clustering coefficient and the degree distribution of the nodes. The connected communities in the social networks have, essentially, been studied in two contexts: global metrics like the clustering coefficient and the node groups, such as the graph partitions and clique communities.
2011Working paper Open access Show more
Big data e data science
Publication . Cavique, Luís
Neste artigo foram apresentados os conceitos básicos de Big Data e a nova área a que deu origem, a Data Science. Em Data Science foi discutida e exemplificada a noção de redução da dimensionalidade dos dados.
2014Journal article Open access Show more
Aplicação para planeamento de carteiras de ações: algoritmo de ordenação bi-critério
Publication . Neves, Pedro Bastos das; Cavique, Luís
O planeamento das suas atividades é um fator crítico de sucesso da Inspeção Tributária e Aduaneira. O presente artigo apresenta a implementação de uma aplicação web, denominada PlanIT, na Direção de Finanças de Leiria que visa dar suporte ao planeamento e ao controlo da atividade da inspeção tributária naquela unidade orgânica de âmbito regional. A ordenação da carteira de ações de inspeção tributária considera dois critérios a prioridade e o montante em risco. Estes dois critérios têm grande semelhança com a urgência e importância da matriz de Eisenhower, pelo que se apresenta um novo algoritmo bi-critério para a ordenação das atividades.
2018Journal article Open access Show more
Editorial 12
Publication . Cavique, Luís
Apresentamos o mais recente número da Revista de Ciências da Computação. As primeiras palavras de agradecimento vão para os autores, para os membros do conselho editorial encarregues das revisões científicas e para os revisores de língua portuguesa e inglesa. Os artigos estão organizados por ordem de chegada. Para abrir o décimo segundo número oferece-se ao leitor um artigo na área do machine learning. O segundo artigo trata de um projecto didáctico para a programação paralela distribuída. Segue-se um interessante artigo de um diplomado da universidade sobre um simulador de poker. O quarto artigo discute o problema da sociedade do Big Data. Finalmente é apresentado uma abordagem histórica das necessidades do cálculo. Se houver solicitações por parte dos leitores, este número terá uma edição em papel disponível na Amazon com o título Revista de Ciências das Computação nº12. Entretanto, convidam-se os autores a submeter trabalhos originais em língua portuguesa ou inglesa para o próximo número da Revista das Ciências da Computação da Universidade Aberta.
2017Journal article Open access Show more
Editorial 5
Publication . Cavique, Luís
É com muita satisfação que apresentamos o mais recente número da Revista de Ciências da Computação. As primeiras palavras de agradecimento vão para os autores, para os membros do conselho editorial encarregues das revisões científicas e pelos revisores de língua portuguesa e inglesa. É de realçar neste volume que procurámos seguir as regras definidas pelo novo acordo ortográfico, na sequência da adoção da nova norma. Neste quinto número, oferece-se ao leitor uma diversidade temática que se concentra em áreas de específicas da computação e em áreas de integração de domínios científicos. i) O primeiro conjunto de três artigos contempla as áreas de Análise de Dados, Sistemas Periciais Difusos e de Gestão de Projetos Informáticos. ii) Na área de integração são apresentados dois artigos: Tomo-GPU integra áreas da computação paralela e da computação gráfica, o segundo a economia computacional, tal como o nome indica combina duas áreas muito diversas. Entretanto, convidam-se os autores a submeter trabalhos originais em língua portuguesa ou inglesa para o nº 6 da Revista das Ciências da Computação da Universidade Aberta até final de Outubro de 2011.
2010Journal article Open access Show more

Cavique, Luís

Filters

Author

Subject

Date

Entity

Settings

Sort By

Results per page

Search Results