Mestrado em Estatística, Matemática e Computação | Master's Degree in Statistics, Mathematics and Computation - TMEMC
Permanent URI for this collection
Browse
Browsing Mestrado em Estatística, Matemática e Computação | Master's Degree in Statistics, Mathematics and Computation - TMEMC by Title
Now showing 1 - 10 of 82
Results Per Page
Sort Options
- 10º problema de Hilbert para subanéis de QPublication . Raimundo, António Pedro da Silva; Edmundo, Mário Jorge; Mamino, MarceloNesta dissertação estudamos o artigo de Bjorn Poonen [Poo03b], Hilbert‘s tenth problem and Mazur‘s conjecture for large subrings of Q e investigamos computacionalmente os diversos conjuntos caracterizados no artigo. Começamos por introduzir a teoria referente às variedades algébricas e às curvas elípticas , conceitos necessários ao entendimento do artigo em estudo. No artigo de Poonen é demonstrada a inexistência dum algoritmo para decidir se equações polinomiais com coeficientes em certos subanéis de Q têm ou não solução nesses subanéis ou seja o 10o problema de Hilbert para esses anéis tem uma solução negativa. A ideia da prova é a partir duma curva elíptica construir um modelo diofantino do anel Z. Com esse fim, partindo duma curva elíptica estuda-se alguns conjuntos infinitos de números primos que são recursivos. Na parte prática da dissertação definimos alguns algoritmos e calculamos alguns elementos destes conjuntos.
- Administração de tráfego telefônico: utilização de método numérico e simulação para estimar congestionamento e demanda de tráfego em sistemas de perda (loss systems)Publication . Sampaio, Paulo Celso; Nunes, Catarina S.Este trabalho tem como objetivo geral propor um modelo probabilístico que possibilite estimativas sobre congestionamento e demanda de tráfego telefônico e está dividido em duas partes. Na primeira parte, uma abordagem exploratória, é apresentado um método numérico e dois métodos de simulação: simulação estática (Monte Carlo) e simulação dinâmica (eventos discretos), para calcular congestionamento em um determinado período de observação, utilizando apenas dois dados de entrada: o tempo total de ocupação e a quantidade de meios disponíveis para escoamento de chamadas, através da Fórmula B de Erlang para sistemas de perda, que tem origem no processo estocástico de nascimento e morte “número de meios ocupados em determinado instante”. Os resultados de congestionamento obtidos por método numérico e simulação se apresentaram bastante próximos. Além da medida de congestionamento, são apresentadas outras medidas de tráfego que vão compor uma grade mínima de indicadores operacionais para a gestão do tráfego telefônico. Na segunda parte, de natureza confirmatória, são feitos testes de aderência sobre o processo de chegadas e sobre a distribuição do tempo de ocupação dos meios, que são dois pressupostos básicos de um sistema de perda (loss system) o qual consiste em um modelo de fila markoviano onde não há espera, ou seja, quando todos os meios estão ocupados uma nova tentativa é perdida. Nos testes de aderência, sobretudo com respeito ao processo de chegadas, não houve rejeição da hipótese inicial 𝐻0: “as chegadas / unidade de tempo tem distribuição de Poisson”. Já com respeito à distribuição dos tempos de ocupação, não foi observada uma aderência forte à distribuição Exponencial em pesquisas de rotas onde escoam chamadas de naturezas distintas, tais como as rotas de tráfego interurbano (de longa distância) onde trafegam chamadas interurbanas de fixo para fixo, sempre de maior duração, misturadas com chamadas que têm um telefone celular em uma das pontas, sendo estas em geral de menor duração
- Análise conjunta de regressões com desenvolvimentos computacionais em Linguagem RPublication . Martins, Márcio do Carmo; Oliveira, AmílcarR é uma linguagem e um ambiente de desenvolvimento integrado, para cálculos estatísticos e gráficos. R é também altamente expansível com o uso dos pacotes, que são bibliotecas para funções específicas ou áreas de estudo específicas. Por outro lado, a Análise Conjunta de Regressões (ACR) é uma técnica com bastante aplicabilidade na comparação e selecção de cultivares. Na ACR existe um conjunto de procedimentos que permitem fazer a comparação e selecção de cultivares. A técnica ACR consiste no ajustamento de regressões lineares do rendimento de cada cultivar no respectivo índice ambiental. Para o mesmo ajustamento, usualmente recorremos ao algoritmo Zig-Zag. Após a obtenção dos coeficientes ajustados, podemos através do Método do Contorno Superior, mostrar quais os cultivares que integram esse contorno, num determinado intervalo de índices ambientais. Neste trabalho, após o enquadramento da técnica ACR, baseada em Oliveira (2007) e Pinto (2006), pretende-se o desenvolvimento de procedimentos e de um programa em linguagem R que permita a obtenção do Contorno Superior, indicação gráfica desse Contorno e dos cultivares dominantes (que integram esse contorno superior) num determinado intervalo de índices ambientais. Por fim, aplicaremos o mesmo programa a um conjunto de dados reais para verificação da aplicabilidade do mesmo.
- Análise conjunta de regressões lineares : revisão e desenvolvimento computacionais em RPublication . Monteiro, Adriano Arcanjo; Oliveira, AmílcarO R é em simultâneo uma linguagem de programação e um ambiente para computação estatística e gráficos. Estaremos interessados em compreender a funcionalidade dos packages do R, criando um novo, capaz de executar automaticamente a Análise Conjunta de Regressões, ACR. A ACR é uma técnica muito utilizada para interpretar redes de ensaios no domínio da avaliação de cultivares. Nesta técnica encontramos um conjunto de procedimentos que nos permite na sua utilização fazer a comparação e seleção de cultivares. Numa primeira fase recorremos ao algoritmo zigzag no ajustamento de regressões lineares, uma por cultivar, onde nas regressões a variável controlada é o índice ambiental que mede a produtividade dos vários ambientes. Os valores dos índices ambientais e dos coeficientes das regressões serão ajustados simultaneamente pelo referido algoritmo, que segundo Oliveira, A. (2007) se baseia num processo iterativo onde as minimizações alternam entre os coeficientes de regressão e os índices ambientais. Para avaliarmos a qualidade do ajustamento obtida pelo algoritmo calcularemos o coeficiente de determinação R2 através dum modelo linear para os resíduos. Contrariamente ao que é usual, neste caso estamos interessados em obter valores baixos de R2, pois um valor próximo a zero indica um bom ajuste, enquanto valores maiores indicam que o algoritmo zigzag não foi capaz de extrair toda a informação relevante dos dados. Através do Método do Contorno Superior exemplificaremos, quais os cultivares integram esse contorno e posteriormente, através do teste t e dos métodos de comparação múltipla de Scheffé, Bonferroni e Tukey, averiguaremos quais os cultivares, ao nível de significância de 5%, são significativamente dominantes ou dominados, nos determinados intervalos de dominância. Neste trabalho, após apresentação dos aspetos teóricos, no Capitulo 5 desenvolveremos um conjunto de funções e rotinas, criando um “package” em linguagem R que nos permitirá, analisar no Capitulo 6, um conjunto de dados simulados para verificação da aplicabilidade do mesmo. Através da utilização de dados simulados referentes ao ensaio de cultivares, mostraremos como utilizar a ACR em planos de melhoramento com auxílio ao package „jra‟, desenvolvido para cumprir um dos objetivos desta dissertação.
- Análise de correlação canónica : extensões e aplicaçõesPublication . Luís, Idálio Esperança; Ramos, Maria do RosárioNeste trabalho apresentamos a teoria da análise de correlação canónica, uma técnica de análise estatística multivariada para o estudo da relação, simultânea, entre dois, três ou mais grupos de variáveis. Descrevemos a natureza da correlação canónica com três ou mais variáveis, com modelos matemáticos, fazendo uma síntese dos métodos de generalização de correlação canónica nomeadamente o método Ssqcor, método Sumcor, método Ecart, método Maxvar, método Minvar, e o método de Carroll. Apresentamos uma aplicação utilizando dados provenientes do cálculo do Índice de Preços no Consumidor IPC, produzido pelo INE - STP (Instituto Nacional de Estatística de São Tomé e Príncipe), referente ao período 2010 a 2014. Estamos interessados em conhecer as correlações canónicas entre grupos de variáveis relacionadas com o cabaz de produtos pré-estabelecido para o cálculo do índice de preços no consumidor, concretamente os produtos alimentares (PA), produtos para bebidas (PB) e produtos não alimentares (PNA), constituindo assim os três grandes grupos de variáveis da nossa pesquisa.
- Análise de sobrevivência : uma aplicação a eventos de golo em jogos de futebolPublication . Borges, Joaquim Manuel Jorge; Serranho, PedroEste estudo tem como principal objetivo caracterizar e comparar a sobrevivência a eventos de golo em jogos de futebol estendendo os resultados de trabalhos anteriormente publicados (Nevo e Ritov,2012) a um conjunto mais alargado de ligas e a diferentes eventos de golo. Centra-se, assim, na aplicação de técnicas estatísticas da área da Análise de Sobrevivência, subárea da Estatística, que se dedica à definição de métodos e modelos destinados à análise de dados de sobrevivência, isto é, dados em que a principal variável em estudo é o tempo até ao evento. A análise baseou-se em dados relativos a 5 épocas (2012-2017) de 6 ligas europeias (Portugal, Espanha, Alemanha, Inglaterra, França, Itália). Para estes dados foram calculadas as estimativas de Kaplan-Meier da função de sobrevivência e foi feito o ajustamento dos dados ao modelo de riscos proporcionais de Cox. Os eventos de interesse considerados foram os eventos de marcador correspondentes ao 1.o golo, 2.o golo e 3.o golo. Concluímos que, relativamente ao 1.o golo, à semelhança dos resultados de outros autores, o fator casa é de facto determinante para a definição do resultado final. Por outro lado, a taxa de falha do 2.o golo, quando marcado pela equipa de casa estando esta a vencer, revelou que o 1.o golo induz a ocorrência de 2.o golo mas este ocorre com maior probabilidade após um intervalo de 45-50 minutos. No caso do 3.o golo, concentrámo-nos nos eventos de golo correspondentes ao desempate, onde constatámos uma tendência de crescimento ao longo do tempo muito semelhante para os dois tipos de eventos: golo da equipa de casa (2-1), golo da equipa de fora (1-2). Alguns dos aspetos que poderão ser objeto de estudos futuros incluem o enriquecimento com inclusão de mais covariáveis, a extensão a um maior número de ligas e épocas desportivas e o recurso à extensão do modelo de Cox com uma variável fragilidade.
- A análise de trajetórias : uma aplicação à modelação da satisfação de um paciente com o seu médicoPublication . Ventura, Mónica Figueiredo; Ramos, Maria do RosárioNos estudos da área da Psicologia muitas das investigações realizadas têm como objetivo estudar as relações existentes entre as variáveis psicológicas em observação e procurar variáveis que sejam determinantes de outras. Investigam-se, então, modelos que tentam traduzir os modelos conceptuais que ligam as variáveis importantes para um estudo. Estes modelos conceptuais tentam por vezes estabelecer relações causais. Os objetivos podem cingir-se exclusivamente a concluir sobre um grupo ou um estudo de caso, mas dada a crescente capacidade de obtenção de amostras por meio de planos de amostragem rigorosamente aplicados, assim como a recolha de dados em quantidades elevadas, é possível realizar estudos com o objetivo de generalização de conclusões para as populações. Um dos passos mais importantes destes estudos é realizar ajustamentos estatísticos dos modelos hipotéticos e testes de significância. A modelação pode ser feita com recurso a várias técnicas estatísticas como a Regressão Linear Múltipla, a Análise de Trajetórias, a Modelação de Equações Estruturais, entre outras. A Análise de Trajetórias é uma técnica de análise estatística que teve na sua origem a ideia de modelar relações de causalidade entre variáveis observadas. Serve assim para testar modelos previamente conjeturados e estudados ou para experimentar novas conceções. Nesta dissertação aprofunda-se a caraterização da Análise de Trajetórias, fazendo a ponte com a primeira técnica utilizada nesta análise, a Regressão Linear Múltipla e mostrando como se articula com a técnica atualmente mais utilizada, a Modelação de Equações Estruturais. Na última parte da dissertação apresenta-se uma aplicação da Análise Trajetórias à modelação do nível de satisfação de pacientes com o seu médico, realizado com base num questionário internacional sobre o tema mais geral da satisfação dos pacientes com a comunicação com os profissionais de saúde. São testados dois modelos que estabelecem um conjunto de relações hipotetizadas como causais entre um conjunto de variáveis independentes e mediadoras e uma variável dependente, que é satisfação do paciente com o seu médico.
- Análise e avaliação do risco por aplicação do método de Monte CarloPublication . Costa, Ana Mafalda Teixeira; Oliveira, Teresa A.Neste trabalho foram estudadas metodologias avançadas nas áreas da Estatística e da Simulação no âmbito da Análise e Avaliação do Risco. Ao nível computacional foi explorado o software @Risk e seus packages nestas áreas, sendo que o foco da pesquisa incidiu sobretudo em aplicações no âmbito do consumo alimentar. O panorama alimentar na Europa, em especial nos países da comunidade europeia é exemplar e único no mundo. A regulamentação é exigente e permitiu nos últimos 30 anos alcançar parâmetros de excelência, nos aspetos de segurança alimentar. O conceito de segurança do “Prado ao Prato” (WHO Food Safety, 2015) é total e a sua implementação obrigou a constantes melhorias dos processos produtivos para obtenção dos géneros alimentícios. Estas práticas crescentes de melhoria contínua permitiram, atualmente, ultrapassar os requisitos regulamentares, alterado assim o paradigma dos sistemas de controlo baseados em valores limites. O processo de avaliação de risco baseado no consumo alimentar é a nova ferramenta de trabalho das organizações governamentais, que executam os controlos oficiais para os aspetos relacionados com a segurança alimentar. Esta dissertação pretende dar a conhecer de forma detalhada, o método que neste momento é o mais requisitado pelos avaliadores de risco para estudos de exposição a contaminantes químicos por via do consumo alimentar. A simulação por Monte Carlo é um método estocástico, que utiliza evidências científicas para gerar diferentes probabilidades de eventos individuais, que se combinam para determinar a probabilidade de um resultado adverso à saúde. A metodologia baseia-se na estimação da Probabilidade (P) da ocorrência do efeito adverso, resultante da exposição ao perigo estudado utilizando no cálculo a relação dose-resposta. A análise probabilística utiliza distribuições de probabilidade e funções de densidade de probabilidade das variáveis aleatórias associadas ao problema. A metodologia do cálculo da incerteza é constituída por várias fases, começando desde logo, por distinguir o significado de incerteza e variabilidade, passando pela classificação e organização dos dados, o ajuste das distribuições aos dados e as estatísticas de ajuste entre as distribuições. A fase seguinte é relativa à execução do processo de reamostragem, à análise do resultado obtido (incerteza), à análise das fontes que a influenciam e por fim ao reconhecimento do valor da incerteza.
- Análise estatística da mortalidade infanto-juvenil em Angola : causas e associação com incadores sócio-económicosPublication . Toni, Lupini; Oliveira, Teresa A.; Oliveira, AmílcarUm dos Objectivos de Desenvolvimento do Milénio (ODM) consiste na redução da mortalidade infantil e infanto-juvenil para 2/3 até 2015. Para atingir esta meta, esforços são concentrados para delinear a melhor estratégia e, agências internacionais defendem a afectação de mais recursos financeiros para o sector da saúde. Uma das saídas passa pela identificação dos factores sócio culturais, económicos, demográficos e sanitários que afectam a mortalidade infantil e infanto-juvenil, que uma vez manipulados, permite canalizar de forma adequada os recursos escassos de que dispõem os Paises. O presente estudo visa examinar a importância que reveste os factores sócio culturais, económicos, demográficos e sanitários na mortalidade infanto-juvenil em Angola, fazendo uso dos dados obtidos no Inquérito sobre Bem-estar da População (IBEP) realizado em 2008-2009. Foi ajustado um modelo de regressão logística para seleccionar os factores determinantes da mortalidade infanto-juvenil, quer na área urbana como área rural. A magnitude da importância de cada variável foi testada pelo teste de Wald e os factores foram classificados de acordo com os respectivos p-value (valores de prova). Enquanto a mortalidade infanto-juvenil foi fixada em 194 /1000 nascimentos vivos, observou-se associação significativa (p-value=0,00) entre as variáveis sexo da criança, uso do mosquiteiro, técnico que consultou, administração de antipaludico, vacina antitetanica, actividade económica do pai, tratamento da água, tipo de sanitário instalado na habitação, idade da mãe e números de filhos na área urbana. Quanto a área rural, foi verificado associação significativa (p-value=0,00) entre as variáveis nível de escolaridade concluído pela mãe, uso do mosquiteiro, local onde defeca habitualmente, técnico que consultou nas visitas pré-natais, técnico que assistiu no parto, local do parto, actividade económica do pai, tipo da habitação, material utilizado para cobrir a habitação, tipo da habitação, número de divisões que tem habitação, idade da mãe e número de filhos. Estes resultados evidenciam a importância do nível sócio cultural, económicos, demográficos e sanitário na determinação dos óbitos infanto-juvenil.
- Análise estatística do processo de reconhecimento, validação e certificação de competências no CNO dos CTTPublication . Regra, Carlos Manuel Fernandes; Oliveira, Teresa A.A presente dissertação assenta na análise descritiva de Variáveis e na Identificação de Associações relativas ao Processo RVCC, no CNO dos CTT. Pretendeu-se, também, efectuar a análise da avaliação de desempenho dos trabalhadores que viram certificadas as suas competências ao nível do 9º ano, antes e após a frequência deste processo. Procurámos ainda, no âmbito das Técnicas de Visualização Gráfica, explorar e aplicar as Metodologias de Superfície de Resposta, na análise das variáveis consideradas e inerentes ao estudo do processo RVCC. Neste trabalho foram aplicados conhecimentos matemáticos e, na área da estatística, a inclusão de técnicas de estatística não paramétrica com recurso à utilização das ferramentas informáticas SPSS e à programação em R. Seguidamente, procede-se à síntese de cada um dos capítulos: No capítulo I, apresenta-se a Introdução à Dissertação e explicitam-se as razões pelas quais se decidiu efectuar este trabalho. No capítulo II, faz-se o enquadramento do CNO dos CTT, explicam-se as razões que levaram à criação deste Centro e efectua-se a caracterização da população alvo dos CTT, que potencia o número de adultos em processo RVCC. No capítulo III, analisam-se as variáveis consideradas mais importantes. De seguida, faz-se uma análise de Associações entre Variáveis e, por fim, a análise de Correlações e Regressão Linear. Trata-se, portanto, de um capítulo teórico sobre o trabalho a desenvolver nos capítulos seguintes. No capítulo IV, efectua-se a análise descritiva para a comparação de Regiões. Considerou-se, por razões de estratégia, importância e tempo de realização da dissertação, que seriam analisadas as regiões do Porto, Coimbra e Lisboa, e a comparação com a totalidade do País. No capítulo V, apresenta-se uma descrição das Técnicas de Inferência Estatística Não Paramétrica mais relevantes que, sempre que possível, procurámos utilizar na análise da avaliação de desempenho. No capítulo VI, apresenta-se a análise da Inferência Não Paramétrica aplicada à Avaliação de Desempenho dos trabalhadores que concluíram o processo RVCC, certificados com o 9º ano de escolaridade e faz-se a comparação de resultados e comportamentos dos testes efectuados em SPSS e no R. O Capítulo VII é dedicado às Técnicas de Visualização Gráfica e Metodologias de Superfície de Resposta. Apresentamos um desenvolvimento histórico sobre as técnicas de visualização gráfica e a análise e explicação das MSR – Metodologias de Superfície de Resposta. No Capítulo VIII sintetizam-se as principais ideias desta dissertação e exploram-se eventuais perspectivas de trabalho futuro.