Logo do repositório
 
Publicação

Modelação estatística aplicada à avaliação da condição de turbinas eólicas com base em dados SCADA

datacite.subject.sdg04:Educação de Qualidade
datacite.subject.sdg09:Indústria, Inovação e Infraestruturas
dc.contributor.advisorCarvalho, Alda
dc.contributor.advisorSilva, Tiago Alexandre Narciso da
dc.contributor.authorNhantingo, José Jonas
dc.date.accessioned2026-06-12T14:27:18Z
dc.date.available2026-06-12T14:27:18Z
dc.date.issued2026-05-12
dc.date.submitted2026-06-12
dc.descriptionMestrado em Estatística, Matemática e Computação, apresentada à Universidade Aberta
dc.description.abstractA monitorização do estado de turbinas eólicas a partir de dados SCADA, constitui um desafio significativo devido à elevada variabilidade operacional, à natureza não estacionária dos regimes do vento e à ausência de registos históricos de falhas devidamente rotulados. Neste contexto, este trabalho propõe uma abordagem probabilística integrada para a modelação do estado de condição de turbinas eólicas sob incerteza, combinando regressão quantílica e modelos bayesianos orientados à detecção de novidade. O termo “deteção de novidade” foi adoptado na formulação de Bishop (1994), uma vez que o objetivo central não é era identificação de falhas previamente conhecidas, mas sim a identificação de padrões de comportamento que se desviam do regime normal aprendido, podendo ou não estar associados a condições de degradação ou falha. Esta formulação permite uma abordagem mais robusta e flexível, especialmente adequada a ambientes industriais onde a definição explícita de classes de falha é limitada ou inexistente. Neste trabalho assume-se que não há informação prévia fiável sobre a frequência relativa de falhas, devido à ausência de registos históricos completos e de rotulagem supervisionada nos dados SCADA. Numa primeira etapa, a regressão quantílica é aplicada à curva de potência com o objectivo de caracterizar o comportamento operacional esperado da turbina em diferentes regimes de vento, permitindo a definição de bandas estatísticas de funcionamento normal por meio de quantis inferior e superior. Esta etapa possibilita uma pré-classificação robusta de dados SCADA, mitigando os efeitos de heterocedasticidade, valores extremos e elevada variabilidade operacional. Com base neste enquadramento, o problema de controlo de condição é formulado como um problema de classificação binária, no qual o estado de saúde da turbina é modelado como uma variável latente. São então aplicados e comparados três modelos estatísticos para estimar a verosimilhança dos dados sob hipótese de funcionamento normal: (i) um método dos bins baseado em intervalos de velocidade do vento e limites quantílicos, (ii) modelos baseados na distribuição normal multivariada e (iii) modelos de cópulas, incluindo as cópulas Gaussianas e t-Student, considerando versões estáticas e com actualização temporal. Assumindo probabilidades a priori uniformes, a decisão de classificação baseia-se exclusivamente na improbabilidade conjunta das observações face ao regime operacional saudável, seguindo o princípio de detecção de novidade. O desempenho dos métodos é avaliado por meio de métricas estatísticas clássicas de classificação, permitindo uma comparação sistemática da sua capacidade de identificar estados normais e anómalos. Os resultados mostraram que métodos simples baseados em limiares por bins são insuficientes para captar a complexidade das dependências multivariadas dos dados SCADA. Em contraste, os modelos probabilísticos multivariados apresentam melhorias significativas em métricas como acurácia, especificidade, F1- score e coeficiente de correlação de Matthews, evidenciando maior robustez em ambientes ruidosos e não estacionários. A incorporação da dependência temporal (one-step-ahead), revelou-se crucial para a detecção precoce de trajectórias anómalas e padrões evolutivos de degradação, destacando os modelos baseados na distribuição normal multivariada one-step-ahead como a abordagem mais eficaz para o controlo de condição e suporte à manutenção preditiva de turbinas eólicas.por
dc.description.abstractMonitoring the condition state of wind turbines using SCADA data poses a significant challenge due to high operational variability, the non-stationary nature of regimes, and the frequent lack of properly labeled historical failure records. In this context, this work proposes an integrated probabilistic approach for modeling wind turbine condition states under uncertainty, combining quantile regression with Bayesian models oriented toward novelty detection. In a first stage, quantile regression is applied to the power curve to characterize the expected operational behavior of the turbine under different wind regimes, enabling the definition of statistical bands of normal operation through conditional quantiles. This step allows a robust pre-classification of SCADA data, mitigating the effects of heteroscedasticity, extreme values, and high operational variability. Based on this framework, the condition monitoring problem is formulated as binary probabilistic task, in which the turbine health state is modeled as a latent variable. Three statistical models are then applied and compared to estimate the data likelihood under the normal operating hypothesis: (i) a bin-based method relying on wind speed intervals and quantile limits, (ii) models based on the multivariate normal distribution, and (iii) copula-based models, including Gaussian and t-Student copulas, considering both static and one-step-ahead versions. Assuming uniform prior probabilities, the classification decision relies exclusively on the joint improbability of observations with respect to the healthy operational regime, following the novelty detection principle. The performance of the methods is assessed using classical statistical classification metrics, enabling a systematic comparison of their ability to identify normal and abnormal states. The results show that simple bin-based threshold methods are insufficient to capture the complexity of multivariate dependencies present in SCADA data. In contrast, multivariate probabilistic models achieve significant improvements in metrics such as accuracy, specificity, F1-score, and the Matthews correlation coefficient, demonstrating greater robustness in noisy and non-stationary environments. The incorporation of temporal dependence proves to be crucial for the early detection of anomalous trajectories and evolving degradation patterns, with temporally updated multivariate normal models emerging as the most effective approach for wind turbine condition monitoring and predictive maintenance support.eng
dc.identifier.urihttp://hdl.handle.net/10400.2/22184
dc.language.isopor
dc.rights.uriN/A
dc.subjectTurbinas eólicas
dc.subjectRegressão quantílica
dc.subjectControlo de condição
dc.subjectDados SCADA
dc.subjectInferência bayesiana
dc.subjectDetecção de novidade
dc.subjectWind turbines
dc.subjectQuantile regression
dc.subjectCondition monitoring
dc.subjectSCADA data
dc.subjectBayesian inference
dc.subjectNovelty detection
dc.titleModelação estatística aplicada à avaliação da condição de turbinas eólicas com base em dados SCADApor
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameMestrado em Estatística, Matemática e Computação

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
TMEMC_JoseNhantingo.pdf
Tamanho:
2.19 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
1.97 KB
Formato:
Item-specific license agreed upon to submission
Descrição: