Name: | Description: | Size: | Format: | |
---|---|---|---|---|
4.23 MB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
Esta dissertação apresenta uma análise detalhada de vários métodos de transformação de dados, com particular ênfase na sua aplicabilidade, culminando no desenvolvimento de uma ferramenta (framework) para o apoio à decisão de técnicas de transformação. A pesquisa aborda a complexidade na preparação de dados para análise estatística, onde a escolha apropriada de transformações pode ter impacto na qualidade da análise estatística. O estudo examina detalhadamente cada método de transformação, considerando as suas propriedades matemáticas, limitações, pressupostos subjacentes e impacto nos dados originais. A implementação dos métodos é ilustrada com código elaborado na linguagem Python. A framework proposta integra características fundamentais dos dados (como a distribuição, formato, tipo e intervalo de dados) com os requisitos específicos da análise estatística a ser realizada, fornecendo um processo para a seleção da transformação mais adequada. Para complementar, foi desenvolvida uma ferramenta web de forma a agilizar o processo de escolha. A metodologia foi aplicada a alguns casos de estudo de áreas distintas permitindo uma comparação do seu desempenho. Os resultados demonstram que a eficácia das transformações está dependente das características dos dados e dos objetivos.
This dissertation presents a detailed analysis of various data transformation methods, with particular emphasis on their applicability, culminating in the development of a framework for decision support of transformation techniques. The research addresses the complexity of preparing data for statistical analysis, where the appropriate choice of transformations can have an impact on the quality of the statistical analysis. The study analyses each transformation method in detail, considering its mathematical properties, limitations, underlying assumptions and impact on the original data. The implementation of the methods is illustrated with code written in the Python language. The proposed framework integrates fundamental data characteristics (such as data distribution, format, type and range) with the specific requirements of the statistical analysis to be performed, providing a process for selecting the most appropriate transformation. To complement this, a web tool was developed to speed up the selection process. The methodology was applied to a number of case studies from different areas, allowing a comparison of their performance. The results show that the effectiveness of the transformations depends on the characteristics of the data and the objectives.
This dissertation presents a detailed analysis of various data transformation methods, with particular emphasis on their applicability, culminating in the development of a framework for decision support of transformation techniques. The research addresses the complexity of preparing data for statistical analysis, where the appropriate choice of transformations can have an impact on the quality of the statistical analysis. The study analyses each transformation method in detail, considering its mathematical properties, limitations, underlying assumptions and impact on the original data. The implementation of the methods is illustrated with code written in the Python language. The proposed framework integrates fundamental data characteristics (such as data distribution, format, type and range) with the specific requirements of the statistical analysis to be performed, providing a process for selecting the most appropriate transformation. To complement this, a web tool was developed to speed up the selection process. The methodology was applied to a number of case studies from different areas, allowing a comparison of their performance. The results show that the effectiveness of the transformations depends on the characteristics of the data and the objectives.
Description
Tese de Mestrado em Bioestatística e Biometria, apresentada à Universidade Aberta
Keywords
Transformação de dados Análise estatística Framework de decisão Pré-processamento de dados Data transformation Statistical analysis Decision framework Data pre-processing