Mestrado em Estatística, Matemática e Computação | Master's Degree in Statistics, Mathematics and Computation - TMEMC
Permanent URI for this collection
Browse
Recent Submissions
- Variabilidade e quebras de estruturas em séries temporais: comparação de métodos e aplicação a séries económico-financeirasPublication . Moro, Pedro Guilherme Frade; Ramos, Maria do RosárioNesta dissertação, exploramos a análise de séries temporais financeiras, focando em métodos clássicos e mais recentes. Investigámos a deteção de pontos de mudança e a previsão de volatilidade em séries como a taxa de juro SELIC, os preços do ouro, os ETFs (fundos negociados em bolsa) e as criptomoedas. Realizámos uma análise de pontos de mudança, utilizando os métodos PELT (Pruned Exact Linear Time) e SONDE (Self Organizing Neural Network for Detecting Novelties). Foram detetadas diversas rupturas na estrutura da série, consistentes com eventos de mercado conhecidos como a crise financeira de 2008 e a pandemia de COVID-19. Utilizámos modelos como SARIMA, Filtro de Kalman e GARCH, diretamente sobre as séries e sobre as suas componentes obtidas pela decomposição por modo empírico (EMD). Observámos que as séries de volatilidade financeira apresentam diversos desafios na aplicação de um único método a toda a série, entre outros motivos pela quantidade de pontos de mudança, no entanto uma abordagem em janela móvel pode gerar resultados satisfatórios. Chama-nos a atenção o mau desempenho do algoritmo GARCH em relação ao SARIMA e ao Filtro de Kalman na nossa abordagem. Discutimos a aplicação destes resultados em séries temporais reais do mercado financeiro e as suas aplicações práticas neste mesmo contexto, tais como a gestão de carteiras e a gestão de relações com clientes. A investigação sugere que há muito a explorar nesta área dinâmica e desafiante.
- Modelação estatística aplicada a admissão dos estudantes na Universidade de São Tomé e PríncipePublication . Nascimento, Wadiley Sousa do; Carolino, Elisabete Teresa M. Almeida; Ramos, Maria do RosárioO presente estudo investiga alguns fatores que influenciam a admissão de estudantes na Universidade de São Tomé e Príncipe (USTP) por meio da aplicação de técnicas avançadas de análise estatística, de forma a proporcionar insights que possam conduzir a melhorias nas práticas de selecção e a formulação de políticas mais inclusivas. Dada a heterogeneidade das disciplinas que compõem os cursos do ensino secundário, esta análise contemplou duas situações distintas: uma para os alunos de Letras (História como nuclear) e outra para os alunos de Ciências (Matemática como nuclear). Os resultados revelaram que variáveis como a idade, género, notas em disciplinas específicas (Biologia, Física/Química, Língua Portuguesa, Matemática, História, Direito, Psicologia/Sociologia), e a escola de origem dos candidatos possuem efeitos estatisticamente significativos tanto na média final do ensino secundário quanto na probabilidade de admissão em diferentes departamentos da universidade. A análise indicou que mais de 75% da variação na média do ensino secundário pode ser explicada pelas variáveis incluídas no modelo de Regressão Linear Múltipla. Com base nos dados do período em estudo, verificou-se que no grupo dos alunos admitidos em cursos de Ciências a média final diminui em média 0,211 pontos com o aumento da idade e que, inversamente, a média final dos alunos dos cursos de Letras aumenta 0,009 pontos, em média, com o aumento da idade. A Regressão Logística Multinomial mostrou que os modelos que incorporaram as variáveis idade, média final do 12º ano, notas em Matemática, Língua Portuguesa, História, Direito, Física/Química, Sociologia/Psicologia, género, residência e as escolas onde os estudantes concluíram o ensino secundário contribuem significativamente para a discriminação dos cursos afetos aos departamentos da USTP. Igualmente, mostrou que a probabilidade de inscrição em determinados cursos diminui ou aumenta significativamente com base nas variáveis analisadas. O estudo realizado mostrou que a modelação estatística é uma ferramenta eficaz para compreender e melhorar o processo de admissão na USTP, fornecendo insights valiosos para a tomada de decisões e contribuindo para a formação de um corpo discente mais diversificado e talentoso. Além disso, os modelos revelaram que mais 60% dos estudantes matricularam-se nos cursos afetos aos departamentos onde as probabilidades de admissão eram mais altas.
- Aplicação de métodos de estatística espacial e multivariada na análise da qualidade da àgua no Sul do Mar do NortePublication . Ody, Christopher Ricardo; Carolino, Elisabete Teresa da Mata Almeida; Ramos, Maria do RosárioA região do Sul do Mar do Norte desempenha um papel vital tanto para a economia quanto para a sociedade dos países circunvizinhos. A análise da qualidade da sua água é um processo crítico que envolve a avaliação de parâmetros físicos, químicos e biológicos, essencial para garantir a sustentabilidade ambiental e a saúde das comunidades locais e ecossistemas marinhos. Utilizando métodos de Estatística Multivariada e Espacial, esta investigação busca identificar padrões e autocorrelações espaciais para avaliar a qualidade da água naquela região. Os dados utilizados foram coletados em cruzeiro científico realizado em dezembro de 2020 a bordo da embarcação RV Meteor, liderado por uma equipe de pesquisadores alemães. Os dados brutos passaram por pré-tratamento orientado pelo protocolo de Controle de Qualidade de Dados da SeaDataNet, um projeto internacional de oceanografia destinado a disponibilizar dados marítimos europeus. Foram realizados testes de pico e gradiente, além da padronização dos dados e imputação através de interpolação de ponderação pela distância inversa. Para um melhor entendimento da área estudada, os dados foram agregados por zonas para determinadas análises e, por vezes, foram considerados globalmente. Foi realizada uma análise exploratória de dados espaciais (AEDE) de modo a resumir suas principais características. Também realizou-se uma redução da dimensionalidade dos dados originais através da análise de componentes principais como ferramenta auxiliar à análise espacial. A autocorrelação espacial foi analisada através do cálculo da Estatística 𝐼 de Moran global e local. As conclusões indicaram uma autocorrelação espacial significativa para todas as variáveis consideradas nas zonas de águas doce e um expressivo achatamento da amplitude das variáveis nas zonas de mar aberto, o que possivelmente ocasionou a inexistência de autocorrelação espacial significativa naquelas zonas.
- Metodologias estatísticas na avaliação da qualidade da prestação de serviços no ensino superior aplicando modelo SERVQUAL: perceção dos estudantes do Instituto Superior Dom BoscoPublication . Parruque, Castigo Jossefa; Ferreira, Dário Jorge; Oliveira, TeresaEste estudo tem como objetivo investigar a qualidade dos serviços educacionais no Instituto Superior Dom Bosco (ISDB), em Maputo, Moçambique, utilizando questionário na Escala de Likert e, como ferramenta de avaliação, o modelo SERVQUAL. Ao analisarmos as dimensões do modelo SERVQUAL individualmente na avaliação da qualidade de serviços de ensino superior pelo ISDB, verificamos que as áreas de Tangibilidade, Confiabilidade, Presteza e Empatia obtiveram pontuações iguais ou superiores a 3.88. Isto reflete a perceção dos estudantes sobre a qualidade dos serviços prestados pelo ISDB, em comparação com as suas expectativas. A qualidade da educação superior é um fator determinante para a formação e o sucesso dos estudantes, e a utilização do modelo SERVQUAL, que engloba as dimensões tangibilidade (a aparência física das instalações, equipamentos e pessoal), confiabilidade (a capacidade de prestar o serviço prometido de forma confiável e precisa), capacidade de resposta (a vontade de ajudar os estudantes e fornecer um serviço rápido), segurança (o conhecimento e a cortesia dos funcionários e sua capacidade de transmitir confiança e credibilidade) e empatia (a atenção individualizada fornecida aos estudantes e a disposição para entender suas necessidades), oferece uma estrutura abrangente para a análise. Uma amostra de 288 estudantes de diferentes cursos, onde foram considerados género, ano, regime e grau de frequência no ISDB, foi selecionada para participar da pesquisa. Os participantes responderam a um questionário baseado na Escala de Likert de 5 pontos, avaliando sua perceção em relação a cada item das cinco dimensões do modelo SERVQUAL. Os dados recolhidos foram submetidos a análises estatísticas descritivas e inferenciais. Os resultados apontaram para uma avaliação positiva da qualidade dos serviços educacionais no geral, com médias de concordância próximas de 4 em todas as dimensões: Tangibilidade, confiabilidade, presteza e empatia. Estas dimensões obtiveram a maior pontuação média no desempenho do ISDB na prestação de serviços com qualidade segundo os padrões do modelo SERVQUAL, em comparação com a pontuação média obtida segundo as expetativas dos estudantes, isto é, os estudantes percebem o serviço a um nível satisfatório na aparência física das instalações, nos equipamentos, funcionários da instituição, na capacidade e na vontade de ajudar que o ISDB tem, de prestar o serviço prometido de forma confiável, precisa e rápida e na disposição com que o ISDB dá atenção individualizada e procura atender as necessidades dos estudantes. A dimensão "Segurança" apresentou a menor pontuação média no desempenho do ISDB, em comparação com a pontuação média obtida na avaliação de qualidade de serviços segundo as expetativas dos estudantes, indicando possíveis oportunidades de melhoria em relação ao conhecimento e à cortesia dos funcionários e sua capacidade de transmitir confiança e credibilidade nos estudantes. Na inferência estatística, com uma significância de 5%, os resultados indicaram que a satisfação global em relação ao serviços educacionais, segundo as expetativas e o desempenho nas dimensões do modelo SERVQUAL, não variou de acordo com a faixa etária, o curso, a frequência e o regime dos estudantes. No entanto, variou significativamente segundo o ano de frequência. As expetativas dos estudantes e o desempenho do ISDB na prestação de serviços de qualidade, segundo a perceção dos estudantes, influenciaram positivamente e negativamente, respetivamente, na satisfação global. Os dados foram provenientes das expetativas e do desempenho do ISDB foram adequados (KMO acima de 0.9) para análise fatorial (AF). A fiabilidade e consistência interna dos fatores retidos na AF revelaram-se excelentes, com um valor do coeficiente alfa de Cronbach superior a 0.9. A pesquisa enfatiza a relevância de avaliar constantemente a qualidade da educação superior para garantir aprimoramentos contínuos. A combinação da Escala de Likert com o modelo SERVQUAL proporciona uma abordagem completa para a avaliação da qualidade, permitindo que as instituições de ensino identifiquem pontos fortes e áreas de desenvolvimento. Compreender as perceções dos estudantes é crucial para aprimorar a experiência académica e garantir que os serviços educacionais atendam às necessidades e expetativas dos estudantes.
- Aplicação da análise espectral singular à análise de riscoPublication . Sarmento, Carla Alexandra da Silva; Oliveira, AmílcarA análise de risco é um campo de vital importância para as sociedades. Pelo facto de as decisões serem tomadas com base em incertezas, a estatística e em particular a modelação e previsão de dados, tem um papel muito importante na análise do risco. É muito comum, a modelação e previsão de dados recorrendo a diversas técnicas/métodos estatísticos para a análise de séries temporais, que permitem obter uma melhor compreensão dos dados e consequentemente, avaliação, gestão e mitigação dos riscos. Esses métodos de análise de séries temporais estão amplamente desenvolvidos na literatura, nomeadamente, os métodos clássicos. Contudo, os modelos clássicos obrigam ao cumprimento de determinadas suposições em relação às caraterísticas dos dados, sendo uma tarefa que obriga a um maior esforço por parte do analista, principalmente, quando estamos perante séries temporais com dados reais. Em alternativa, pode-se utilizar uma técnica relativamente moderna, ainda pouco utilizada na comunidade científica Portuguesa, e muito poderosa conhecida como Análise Espectral Singular (SSA, do inglês Singular Spectrum Analysis). A SSA é uma técnica em que não é necessário conhecer o modelo paramétrico da série temporal, baseando-se apenas nos dados e pode ser aplicado em qualquer série com algum potencial de estrutura. Esta técnica tem como objetivo decompor a série temporal original numa soma de componentes independentes e interpretáveis, que representam a tendência, o comportamento periódico e o ruído sem estrutura. Uma vez determinadas as componentes, as mesmas são selecionadas para reconstruir uma aproximação à série temporal sem ruído e, em seguida, são usadas para realizar previsões. A presente dissertação tem como objetivo apresentar o desenvolvimento teórico da técnica SSA e a sua aplicação prática à temática da análise de risco, na área da hidrologia. Com esta finalidade foi aplicado o modelo SSA a uma série temporal com dados reais que dizem respeito ao volume de água armazenado em um conjunto de albufeiras, por forma a contribuir para uma avaliação do risco de escassez de água. De uma forma geral, observou-se que a técnica SSA refletiu de forma aproximada o comportamento da série temporal original e que o algoritmo recorrente de previsão SSA representou de forma adequada as variações existentes nos dados. Por forma a comparar a técnica SSA com os modelos clássicos realizou-se a análise da mesma série temporal, com a aplicação, aos dados do modelo Autorregressivo Integrado de Médias Móveis (ARIMA, do inglês Autoregressive Integrated Moving Average), embora sem recurso a uma análise muito pormenorizada. Concluiu-se que o SSA, em geral, produziu resultados tão bons, até mesmo superiores, aos resultados gerados pelo método clássico considerado nesta investigação científica, com uma menor intervenção por parte do analista. O SSA será cada vez mais utilizado por estatísticos profissionais, especialistas em processamento de sinais e imagens, especialistas em várias áreas interessados em usar métodos estatísticos na análise de séries temporais e na comunidade académica, quer pela sua simplicidade no entendimento dos dados, quer pelo bom desempenho do mesmo.
- Movimento de partículas auto-propulsionadas. Modelo de Cucker-Smale e variantes: análise e simulaçõesPublication . André, Ricardo J. R.; Costa, Fernando Pestana daNa secção 1, apresenta-se o modelo de Cucker-Smale. O modelo é de tipo Newtoniano com a aceleração a depender da vontade dos agentes em alinhar a sua velocidade com a dos outros agentes. O modelo é flexível pois baseia-se numa função de comunicação entre os agentes, ψ, dependente das suas posições relativas que podem assumir diversas formas. No caso em análise contém um factor β que determina a persistência da interação à distância. Definem-se comportamentos resultantes, nomeadamente alinhamento e formação de bando. Descrever o modelo relativamente ao centro de massa permite alguma simplificação. Na secção 2, apresentamos algumas ferramentas de caráter geral úteis para a análise posterior. O teorema de Picard-Lindelöf estabelece condições para a existência de soluções únicas. Definem-se alguns tipos de órbitas e de estabilidade. Introduz-se o teorema da estabilidade de Lyapunov e as funções de Lyapunov. Na secção 3, analisa-se o modelo aplicado a duas partículas em R. Estabelece-se a condição para a formação de bando independentemente dos valores iniciais de posição e velocidade. Esta sucede para β < 1, quando a comunicação à distância é mais persistente. No caso contrário estabelecem-se condições em função dos valores iniciais. Esboça-se a mesma análise usando uma função do tipo de Lyapunov. Na secção 4, faz-se uma análise a várias dimensões e para N pássaros. Com uma escolha adequada de normas, ‖x‖∞ e ‖v‖∞, e de função de Lyapunov, os resultados são formalmente idênticos aos da secção precedente quanto à existência de formação de bando, com as relações a passarem de igualdades para desigualdades. Na secção 5, apresentam-se algumas variantes. Alterando a análise, a função de comunicação ou adaptando a estrutura do modelo obtém-se como resultado a análise de múltiplos bandos, o impedimento de colisões, uma maior adaptabilidade ou um condicionamento da formação de bandos. Na secção 6, apresenta-se uma simulação passível de ser utilizada por quem deseje observar alguns dos modelos em ação.
- Equações diferenciais estocásticas e aplicações em RPublication . General, Ângelo Rafael; Brites, Nuno Miguel Baptista; Oliveira, TeresaA presente dissertação aborda o tema sobre as equações diferenciais estocásticas e suas aplicações em R, com recurso às técnicas computacionais. A abordagem teórica baseia-se nas equações diferenciais estocásticas derivadas dos processos estocásticos. Neste, apresenta-se, também, o teorema de Itô, que se revela fundamental para o alcance dos objectivos pretendidos. Importa, portanto, realçar que o teorema de Itô facilitou a implementação prática dos modelos usados para aplicação das equações diferenciais tomadas como exemplo em finanças, através de algorítmos computacionalmente escritos no software R. O trabalho baseiase, ainda, no processo de Wiener, em que foi abordado o conteúdo sobre as equações diferenciais estocásticas que serviram de suporte para a abordagem do cálculo de Itô. Outrossim, houve a aplicação computacional do software R, nos packages “sde” e “mixedsde”. E, entre vários, o modelo de Black-Scholes foi usado como um dos exemplos a considerar na aplicação das equações diferenciais estocásticas em finanças, em que foram feitos cálculos manuais e computacionais. Nesta ordem de ideia, sobre aplicação das equações diferenciais estocásticas em R, o package “sde” foi explorado a partir de uma das suas funções - o “sde.sim” - baseado na simulação de equações diferenciais estocásticas, com um interface de aplicação de diferentes métodos e modelos de simulação, e o package “mixedsde”foi explorado através de uma das suas várias funções - o “mixedsde.sim” - baseado na geração de trajectórias de processos estocásticas, usando alguns dos seus modelos.
- Explorando métodos de controlo estatístico em cenários epidemiológicos e na gestão de processos: um estudo comparativoPublication . Leidenfrost, Gleice Mendonça; Oliveira, Teresa; Henning, ElisaControlo Estatístico de Processos é um tema que ainda suscita muitas dúvidas quanto ao seu real conceito e à sua aplicação eficaz nas organizações. Apesar de sua longa trajetória, esses assuntos não são geralmente associados às atividades cotidianas das pessoas. A dificuldade aumenta quando é necessário reunir e explorar temas diversos, incluindo processos, recorrendo a métodos estatísticos. Para engenheiros, estatísticos ou profissionais atuantes na área da qualidade, esses temas são, possivelmente, simples de serem analisados em conjunto. No entanto, para muitos envolvidos na gestão das organizações, e até mesmo na gestão de processos, tanto a análise quanto a interpretação de dados estatísticos são frequentemente encaradas como complexas ou pouco claras. Considerando as barreiras enfrentadas no uso de métodos de controlo estatístico no âmbito empresarial, podemos também questionar como esses métodos são aplicados para análise de cenários epidemiológicos. Ainda que lidemos com dados estatísticos relacionados à observação de doenças e casos clínicos, o uso do controlo estatístico da qualidade como ferramenta de auxílio para prevenção de riscos na área da Saúde é um tema que carece de investigação aprofundada. Diante disso, esta dissertação teve o objetivo de explorar a aplicação dos métodos de controlo estatístico em âmbito organizacional e epidemiológico. Para isso, realizouse um levantamento de estudos com o intuito de destacar a importância dos conhecimentos estatísticos para os profissionais envolvidos nessa área. Além disso, avaliou-se os possíveis níveis de conhecimento dos profissionais que atuam na gestão de processos no Brasil em relação ao uso de métodos estatísticos, considerando as particularidades e desafios presentes no tema. As semelhanças e diferenças entre a aplicação do controlo estatístico em processos operacionais e em estudos epidemiológicos foram exploradas para melhor compreender cada cenário. Também foram destacadas as contribuições e potenciais benefícios dessa abordagem para a área da saúde pública e realizado um estudo introdutório da similaridade entre o uso desses métodos na análise de cenários epidemiológicos e em processos operacionais, abordando conceitos fundamentais e principais técnicas utilizadas.
- Proof Mining: análise quantitativa de demonstrações matemáticasPublication . Fino, António Miguel Dias; Ferreira, Gilda; Pinto, Pedro Miguel dos SantosEsta dissertação foca-se em dois resultados obtidos através da utilização de ferramentas de proof mining. O programa tem como objectivo obter informação adicional de teoremas matemáticos já deduzidos utilizando ferramentas ou técnicas da lógica matemática. O intuito será obter versões quantitativas dos teoremas de convergência para a iteração implícita de Browder e explícita de Halpern para famílias de funções não expansivas (Sn) e ponto de ancora u ∈ C, onde C indica um subconjunto fechado, limitado e convexo de um espaço de Banach (Teoremas 7 e 8) obtidos por T. Suzuki em [28], onde a ferramenta crucial é a utilização de interpretações funcionais. De forma resumida, estas interpretações São aplicações que traduzem fórmulas A para fórmulas do tipo ∀x∃yAf (x, y), onde Af (x, y) é uma fórmula livre de quantificadores. Começamos por apresentar e caracterizar a linguagem formal L ω da aritmética de tipos finitos PAω e respetivos modelos standard e dos funcionais fortemente majorizáveis. Em seguida, é expresso a interpretação funcional a ser utilizada no decorrer desta tese, designada por interpretação funcional limitada e a representação formal de números reais, mais concretamente, ao nível de espaços normados, onde a teoria da aritmética de Peano em todos os tipos finitos é extendida a espaços normados (PAω,X ⊴ ). Uma prova modificada do teorema de Browder é então introduzida para mostrar como evitar argumentos de compacidade fraca sequencial através de provas modificadas. Essa subsecção ´e finalizada, introduzindo um Princípio generalizado, e a respetiva versão quantitativa, de forma a eliminar a compacidade fraca sequencial pela utilização de ferramentas de proof mining. A ultima secção é dedicada às versões quantitativas dos teoremas de convergência de Browder e Halpern, desenvolvidas por U.Kohlenbach e P.Pinto em [17].
- O uso da análise espacial no estudo da relação entre a expectativa docente e a proficiência de escolares do 9º ano do ensino fundamental no BrasilPublication . Ribeiro, Paulo Marcos; Ramos, Maria do RosárioNo Brasil, a qualidade educacional é medida bianualmente por meio de testes padronizados, aplicados aos alunos, e questionários contextuais, aplicados aos gestores, professores e alunos dos anos finais da escolarização básica, sob a responsabilidade do Sistema Nacional de Avaliação da Educação Básica (SAEB). Este sistema apura o domínio de habilidades esperadas para cada etapa educacional, chamada de proficiência, e os fatores a ela relacionados. As expectativas de professores sobre o desempenho dos estudantes, é um importante fator de sucesso, amplamente divulgado pelo SAEB, mas ainda pouco estudado no que se refere à sua distribuição espacial. Com a finalidade de contribuir para essa lacuna de conhecimento, este trabalho teve por objetivo avaliar a influência da expectativa docente sobre a proficiência por meio do uso de componente espacial. Utilizou-se dados secundários do questionário docente e os resultados da proficiência em Matemática e Língua Portuguesa dos alunos do 9º ano do ensino fundamental – estudantes com 14 anos de idade – extraídos das edições SAEB de 2013 e 2017, agregados por municípios. A partir da construção de três variáveis de expectativa docente, através de uma Análise de Componentes Principais (PCA) e do emprego da variação das variáveis, com fins de controlar os efeitos fixos que não mudam com o tempo, aplicaram-se técnicas da econometria espacial. A Análise Exploratória de Dados Espacial (AEDE) indicou forte dependência espacial nas variáveis de desempenho discente, assim como os modelos espaciais estimados Modelo Espacial Autoregressivo (SAR), Modelo de Erro Espacial (SEM) e Combinação Autoregressiva Espacial (SAC) captaram o contundente papel da proximidade para a composição da interação espacial entre os fenômenos em avaliação. Os resultados indicaram que municípios nos quais a percepção docente sobre a indisciplina dos alunos e alto nível de faltas é maior, o desempenho discente é menor. Em termos práticos, principalmente para pesquisadores da educação, as evidências apontadas no estudo direcionam para a importância da modelagem espacial no estudo do desempenho de alunos do ensino fundamental no Brasil.