Título:
|
Study of the distribution and behaviour of the "0" values in large omic data arrays
|
Autores:
|
Fidalgo Gómez, Helena
|
Tipo de documento:
|
texto impreso
|
Editorial:
|
Facultad de Estudios Estadísticos, 2020
|
Dimensiones:
|
application/pdf
|
Nota general:
|
info:eu-repo/semantics/openAccess
|
Idiomas:
|
|
Palabras clave:
|
Estado = Publicado
,
Materia = Ciencias: Estadística
,
Materia = Ciencias: Estadística: Análisis Multivariante
,
Materia = Ciencias Biomédicas: Medicina
,
Materia = Ciencias Biomédicas: Medicina: Oncología
,
Materia = Ciencias Biomédicas: Biología
,
Tipo = Trabajo Fin de Máster
|
Resumen:
|
Existen evidencias de que muchas enfermedades no están determinadas sólo por alteraciones genéticas. Un claro ejemplo es el cáncer que engloba muchas enfermedades producidas por la interacción de factores genéticos y no genéticos durante toda la vida. Entre los factores no-genéticos se encuentran la forma en que los seres humanos viven e interactúan con el medio ambiente y el microbioma; ambas exposiciones pueden ser caracterizadas con datos ómicos. Las tecnologías ómicas representan una reciente área de estudio que engloba diversas disciplinas biológicas. Las tecnologías aplicadas a las ómicas permiten estudiar, a nivel molecular los diferentes elementos que componen los sistemas biológicos. Hoy en día, el foco se encuentra en una nueva área: la microbioma, puesto que se han encontrado diversas asociaciones entre ciertos microorganismos y enfermedades. El reto principal en el análisis de datos de microbioma es el escaso número en los datos de conteo de microbioma, los cuales son de gran dimensión y contienen una gran proporción de ceros.
En este proyecto se pretende mostrar diferentes alternativas para el análisis de datos de conteo que se caracterizan por una clara sobre dispersión y exceso de ceros. Aplicando modelos de regresión como los modelos de inflación de cero o los modelos Hurdle pude establecer qué tipo de ceros se encuentran en la base de datos. Estos modelos y sus correspondientes distribuciones están sometidos a diferentes criterios de selección con el objetivo de establecer cuál es el modelo que mejor se ajuste a los datos en función del porcentaje de ceros que presente. Ello me ha permitido definir relaciones entre diferentes microorganismos y expresiones genéticas, estadios tumorales, subtipos inmunes, género, IMC, ...
|
En línea:
|
https://eprints.ucm.es/id/eprint/62726/1/e-print%20TFM_Helena%20Fidalgo%20_MBioEstad.pdf
|