Mestrado em Tecnologias e Sistemas Informáticos Web | Master’s Degree in Web Technologies and Systems - TMTSIW
Permanent URI for this collection
Browse
Browsing Mestrado em Tecnologias e Sistemas Informáticos Web | Master’s Degree in Web Technologies and Systems - TMTSIW by advisor "Cavique, Luís"
Now showing 1 - 4 of 4
Results Per Page
Sort Options
- O algoritmo PageRank aplicado a redes de recomendações para seleção de recursos humanosPublication . Fernandes, David Paiva; Cavique, LuísUm dos principais desafios encontrados num processo de recrutamento de recursos humanos prende-se com a dificuldade prática de analisar de forma objetiva todos os candidatos. A grande quantidade de curricula vitae normalmente envolvida num processo deste tipo dificulta, quando não impede mesmo, uma leitura completa e, portanto, uma análise detalhada. Neste trabalho procura mostrar-se a aplicabilidade do algoritmo PageRank a redes de recomendações profissionais entre pares no âmbito de processos de recrutamento de recursos humanos. Assim, através de técnicas de data-mining, procedeu-se à extracção de dados de teste do conteúdo HTML de páginas de alguns profissionais registados no site LinkedIn, concretamente as recomendações efectuadas por cada um para um conjunto de outros profissionais por especialidade. Com os dados extraídos contruiram-se redes de recomendações por especialidade, em que os vértices são os profissionais analisados e os arcos são as relações de recomendação, redes sobre as quais se aplicou o algoritmo PageRank para classificação ordenada de cada profissional por especialidade. A extensão para várias especialidades é realizada através de um algoritmo de avaliação multicritério que, aplicado aos valores de PageRank, possibilita a classificação de um profissional tendo em conta mais do que uma especialidade.
- Aplicação de técnicas da data mining em redes sociais : estudo dos próximos locais a visitar na rede FoursquarePublication . Bilro, Eudália; Cavique, LuísA comunicação nas redes sociais surgiu da necessidade que o ser humano tem em partilhar assuntos, ideias, preferências comuns criando assim laços assentes em afinidades. A constante presença dos utilizadores nas redes sociais expressando as suas opiniões sobre produtos, marcas, pessoas, gostos, ou costumes tem vindo a desencadear um grande interesse por parte de empresas e pessoas em analisar essas informações. Numa sociedade que diariamente é capaz de produzir dados em massa, é cada vez mais necessária a criação de ferramentas para a sua análise e interpretação de forma a disponibilizar todo um conjunto de informações úteis para a tomada de decisões. Neste contexto, este trabalho descreve o processo de aplicação de técnicas de Data Mining em dados extraídos da rede social Foursquare de forma a obter informações relevantes que auxiliem na identificação de padrão de comportamentos. Através da descoberta de padrões sequenciais, este estudo irá permitir a visualização dos dados organizados numa poli-árvore com o objetivo de estudar os próximos locais a visitar na rede Foursquare.
- Modelos para incremento da retenção em serviços desportivos regulares : análise preditiva e ações de fidelizaçãoPublication . Pinheiro, Paulo; Cavique, LuísAtrair um novo cliente pode custar até cinco vezes mais do que manter um cliente atual satisfeito e por isso a capacidade de detetar, o mais cedo possível, quais os clientes que irão abandonar ou deixar de adquirir um determinado produto ou serviço, bem como as medidas que podem ser implementadas para evitar esse abandono ou quebra nas vendas são questões que todas as empresas gostariam de ver respondidas. Neste trabalho é apresentado um sistema inteligente que gera conhecimento acionável (“actionable knowledge”) baseado em dados reais e orientado para acções de fidelização de clientes de serviços desportivos regulares onde ocorrem elevadas taxas de cancelamento. Seguindo os passos do Database Marketing o sistema evolui em três fases: numa primeira fase, parte de dados obtidos nas bases de dados dos sistemas ERP e CRM existentes nas instalações desportivas, dos quais extrai, transforma e carrega dados num Data Warehousing; numa segunda fase são aplicados modelos preditivos para identificar perfis mais suscetíveis de abandono; e por fim, são aplicadas ações de fidelização direcionadas a cada um dos perfis encontrados com o objetivo de aumentar a fidelização e a taxa de retenção.
- Seleção de atributos de dados inconsistentesPublication . Apolónia, João; Cavique, LuísO tratamento de conjuntos de dados de grande dimensão é uma questão que é recorrente nos dias de hoje e cuja tarefa não é simples, dadas as limitações computacionais, ainda, existentes. Uma das abordagens possíveis passa por realizar uma seleção de atributos que permita diminuir, consideravelmente, a dimensão dos dados sem aumentar a inconsistência dos mesmos. “Rough Sets” é uma abordagem que difere doutras técnicas de seleção de atributos pela sua capacidade de lidar com dados inconsistentes. Outra abordagem para redução de dados é conhecida como Análise Lógica de Dados (LAD). A Análise Lógica de Dados Inconsistentes (LAID) junta as vantagens destas duas abordagens. Com o grande aumento do volume de dados, o paradigma, relativamente ao seu manuseamento, tem-se alterado. Antes, o tratamento dos dados era efetuado num único computador e o acesso era realizado depois do seu carregamento em memória. A tendência atual é aceder aos dados em disco, num ambiente cloud. O trabalho realizado pretende validar este novo paradigma, com recurso ao sistema de dados HDF5 (Hierarchical Data Format) e ao ambiente remoto disponibilizado pela INCD (Infraestrutura Nacional de Computação Distribuída). Pelo facto de o HDF5 ser o sistema adotado pela comunidade Python para lidar com dados de grande dimensão, esta linguagem foi escolhida para implementação do LAID. A presente dissertação é mais um contributo para o aprofundamento das técnicas de Data Mining (extração de conhecimento de dados). Nomeadamente, aborda a seleção de atributos (feature selection) aplicada a conjunto de dados de grande dimensão, guardados no formato HDF5, com avaliação da inconsistência dos dados, através da aplicação do algoritmo LAID, codificado em Python, num ambiente cloud.