Mestrado em Estatística, Matemática e Computação | Master's Degree in Statistics, Mathematics and Computation - TMEMC
Permanent URI for this collection
Browse
Browsing Mestrado em Estatística, Matemática e Computação | Master's Degree in Statistics, Mathematics and Computation - TMEMC by Sustainable Development Goals (SDG) "09:Indústria, Inovação e Infraestruturas"
Now showing 1 - 2 of 2
Results Per Page
Sort Options
- Aplicação de máquinas de vector suporte para classificação de ratos transgénicos através de imagem da retinaPublication . Valentim, Érick Braga; Serranho, Pedro; Bernardes, Rui Manuel Dias Cortesão dos SantosO objetivo deste trabalho consistiu na criação de modelos de aprendizagem supervisionada baseados nas técnicas de Support Vector Machine (SVM) e Support Vector Machine com informação privilegiada (SVM+) capazes de distinguir entre ratos saudáveis (C) e transgénicos (D) por meio de análise de textura da imagem de tomografia de coerência óptica (OCT) de retinas do olho direito. A amostra é composta por 74 ratos, sendo 40 saudáveis e 34 transgénicos. A tomografia de coerência óptica foi utilizada para obtenção da imagem da retina dos ratos que, por sua vez, foi dividida em 4 quadrantes. A partir destes, obteve-se uma imagem de fundo 2D e foram aplicados 20 indicadores de análise de textura de imagem de fundo, usados como features para o modelo SVM. As features com maior capacidade de separação entre grupos e que possuem coeficiente de correlação inferior a 0,7 entre elas foram Inertia (primeiro, segundo e quarto quadrantes), INN (Inverse difference normalized; terceiro quadrante), IMC2 (Information measure of correlation; terceiro quadrante) e ClusterShade (terceiro quadrante). Considerando as 6 features mais relevantes foram criados os modelos SVM e SVM+ cujos parâmetros foram afinados de maneira a obter os modelos com a melhor precisão na classificação dos ratos nas categorias saudável e transgénico. A técnica de validação cruzada em 5 grupos foi utilizada para validar os resultados dos modelos criados. Tanto para o conjunto de teste como para o conjunto de dados total o modelo SVM obteve 100% precisão, enquanto que a precisão obtida pelo modelo SVM+ foi de 93,33% (erro de apenas 1 caso em 15 – conjunto de teste) na classificação dos dados do conjunto de teste e 98,65% (erro de apenas 1 caso em 74 – conjunto de dados total) no conjunto de dados total.
- Modelação linear e extensões: aplicação da regressão logística no estudo de câncer da mamaPublication . Vaz, Fernando Emílio da Cruz Ribeiro; Ramos, Maria do RosárioUma pesquisa realizada pela Agência Internacional de Pesquisa em Câncer (IARC) indica que o câncer de mama é um dos três tipos de maior incidência, e é o que mais atinge as mulheres a nível mundial, representando um sério problema de saúde pública com predomínio de diagnóstico em fase avançada da doença em países em desenvolvimento como Cabo Verde. Neste trabalho, foi feito um estudo quantitativo do câncer de mama com o objetivo de elaborar um modelo que possa auxiliar no diagnóstico de câncer de mama. Foi feito um apanhado das metodologias com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM), destacando o modelo de regressão logística e apresentando procedimentos computacionais, no âmbito de pesquisas relacionadas ao câncer de mama. O modelo de regressão logística é amplamente utilizado em estudos na área médica dada a sua flexibilidade e tipo de resultados, que podem ser interpretados de forma bastante prática, uma vez que, possibilita identificar fatores de risco para um desfecho da variável de interesse, desde que o modelo esteja bem ajustado. Para ilustrar o uso da regressão logística foi utilizado um banco de dados real com 116 pacientes do sexo feminino no âmbito de um estudo sobre o câncer de mama usando diversos biomarcadores antropométricos, obtidos por meio de análise ao sangue. Com isso, recorreu-se a técnicas de seleção de variáveis implementadas no R-Studio e no SPSS, seleção stepwise, para construir modelos que permitiram selecionar as variáveis que influenciam o sucesso no diagnóstico de câncer de mama. Para avaliar o desempenho do modelo construído recorreu-se à Curva ROC analisando a respetiva área. Este trabalho permitiu identificar que a Idade, o índice de massa corporal, o nível de glicose no sangue e a resistina são fatores de risco na previsão do câncer de mama. Os resultados indicaram que a presença do câncer de mama nas mulheres pode ser predito com uma chance de acerto de 77,6% e uma sensibilidade e especificidade de 75 e 79,7%, respetivamente.