Nacionalidad:
Grado académico:
2992-7293
Resumen
La producción animal tiene como objetivo, transformar productos y subproductos animales en alimento nutritivo, para esto, se hace hincapié en mejorar el manejo, la nutrición y la cría de los animales de granja. La cría animal, implica un mejoramiento genético de las características seleccionadas generación tras generación, lo que lleva a los criadores a aplicar intensos programas de selección en sus animales. Para maximizar la efectividad de la selección, se deben conocer de manera precisa los parámetros genéticos y los métodos basados en máxima verosimilitud son usados de manera típica para este fin. El objetivo de esta investigación, fue calcular la repetibilidad de la suavidad del musculo del pecho de pavos usando los métodos de máxima verosimilitud (ML) y máxima verosimilitud restringida (REML). Los resultados manuales y usando el paquete estadístico SAS, nos indican que las estimaciones para ML y REML son diferentes, siendo la segunda preferible debido a que es insesgada y mantiene los estimadores en su área de parámetros.
Palabras clave: repetibilidad, componentes de varianza, máxima verosimilitud, máxima verosimilitud restringida.
Introducción.
La crianza de animales ha contribuido al mejoramiento de la producción ganadera desde hace muchos años. Cuando se cuenta con registros de producción, para dirigir la selección y determinar el cambio, lo resultados son prometedores. La combinación de la cría (genética), nutrición y manejo produce un éxito notable en las ganaderías que aplican de manera correcta estos principios, por lo tanto, es de esperarse que se obtenga un desempeño mayor.
Cuando se seleccionan los mejores fenotipos para un rasgo particular, se espera que las características de la siguiente generación de animales, sean superiores. A medida que se desarrollaron métodos de estimación de parámetros más eficientes, la estimación de los parámetros genéticos se ha hecho más precisa, por lo tanto, tiene sentido estimar parámetros estadísticos según lo dictaminen los datos y no según algún método “favorito”. El método de máxima verosimilitud, se ha utilizado de manera típica para estimar parámetros genéticos, aunque hoy en día existen otros métodos como los bayesianos, los métodos basados en verosimilitud aun se siguen utilizando debido a su fácil aplicabilidad y a sus propiedades asintóticas.
Revisión de literatura.
1. Parámetros genéticos.
La varianza es el elemento más importante de las valoraciones genéticas en los animales. El hecho de que haya individuos que produzcan más que otro nos proporciona una oportunidad de mejora, más aún si esta variabilidad es de origen genético. La varianza de los fenotipos, conocida como varianza fenotípica puede descomponerse en varianzas de diferente origen (Gutiérrez 2012):
Donde:
Y la varianza genética total, se divide en los siguientes componentes:
Donde:
Un parámetro de interés en mejora genética es llamado repetibilidad, el cual indica cuánto de la varianza total entre medidas de un mismo animal es debida al efecto de factores que son permanentes (por lo tanto, lleva una varianza ambiental permanente en su fórmula). En general este parámetro es un indicador del número de registros necesarios para poder aplicar la selección. Su expresión matemática es (Gutierrez, 2012):
2. El modelo lineal mixto y sus estimaciones máxima verosímiles.
Cuando se asume la existencia de factores fijos, el modelo estadístico lineal es conocido como modelo mixto. En zootecnia consideramos un efecto fijo a cualquier factor medible (no genético) que pueda alterar la aptitud fenotípica de los animales, por ejemplo: época del año, edad, sexo, número de lactancia entre otros. Cuando se emplea un modelo mixto el efecto de los factores fijos es removido de la estimación de los factores aleatorios, lo que genera, estimadores ajustados a las condiciones de cada sistema de producción animal.
El modelo mixto de 2 factores sin interacción, en algebra de escalares es:
Yijk = µ + si + bj + εijk
Dónde:
µ = Media o promedio del rebaño.
Yij = Variable respuesta o rasgo particular
bj = Efecto del j-esimo factor fijo
ai = Efecto del i-esimo semental.
εij = Efecto aleatorio denominado error residual.
Para el caso de n factores aleatorios y fijos, es necesario estudiar el modelo lineal mixto en su forma matricial, el cual puede expresarse como (Mrode y Thompon, 2005):
y = Xb + Zu + e
Dónde:
b = vector de efectos fijos asociados con registros en y por X.
u = vector de efectos aleatorios asociados con registros en y por Z.
X = Matriz de incidencia que relaciona observaciones con efectos fijos.
Z = Matriz de incidencia que relaciona observaciones con efectos aleatorios.
y = vector de observaciones.
e = vector de residuales.
Hartley y Rao (Hartley y Rao, 1968) propusieron el método de máxima verosimilitud (ML) para estimar parámetros en modelos lineales mixtos, este método se basa en maximizar la función de verosimilitud de los parámetros a estimar. De forma general el método ML se basa en derivar el logaritmo de la función de densidad conjunta (donde se asume normalidad) de los parámetros y resolver el sistema de ecuaciones resultante, lo que genera un estimador de la varianza fenotípica que viene dado por:
Esta definición de esta sesgada, ya que está asociada a “n” grados de libertad, por lo tanto, es un estimador confiable solo con muestras de gran tamaño.
Los estimadores máximos verosímiles, para el modelo mixto con dos factores sin interacción y data balanceada son (Searle y col, 1992):
Y las sumas de cuadrados, grados de libertad y cuadrados medios necesarios, se estiman usando la siguiente tabla (Searle y col, 1992):
Donde K es el número de réplicas del diseño (Becker, 1986).
Puesto que el estimador ML esta sesgado, el método conocido como máxima verosimilitud “restringida” (REML) propuesto por Patterson y Thompson (Patterson y Thompson, 1971) da una descripción más adecuada para un modelo lineal o mixto. REML puede considerarse un intento de tomar en cuenta la “pérdida de grados de libertad” resultante de estimar los efectos fijos. En REML el conjunto de datos original se remplaza por un conjunto de contrastes estimados a partir de los datos, y la función de probabilidad se maximiza en función de la distribución de probabilidad de estos contrastes, la principal ventaja de este método es que mantiene el valor de los componentes de varianza en su área de parámetros (valores positivos). La varianza fenotípica estimada vía REML tiene la siguiente expresión matemática:
Esta definición de es insesgada, ya que está asociada a “n-1” grados de libertad.
El método REML, se ha convertido en el método preferido de análisis de datos en cría de animales, debido a sus excelentes propiedades estadísticas. Las restricciones impuestas por REML garantizan que las estimaciones estén dentro del área de parámetros, es decir, que todas las variaciones sean positivas, que todas las estimaciones de correlación estén en el rango de -1 a +1, y que todas las correlaciones parciales sean consistentes entre sí. En términos estadísticos, esto es equivalente al requisito de que la matriz de covarianza estimada sea semidefinida positiva, es decir, que ninguno de sus autovalores sea negativo, (Meyer y col, 2004)
Los componentes de varianza de REML para el modelo mixto de dos factores y data balanceada son (Searle y col, 1992):
Cuando se cuenta con muestras con grandes cantidades de datos, la estimación REML es una garantía, ya que el error de muestreo se reduce en función aumenta el tamaño de la muestra. Pero en casos con muestras de tamaños no tan grandes y especialmente en modelos multivariados, el error de muestreo genera un sesgo en los estimadores generados por REML, lo cual los hacen menos confiables, puesto que estos se alejan del valor poblacional. Ante este problema K. Meyer y col ( Meyer y col, 2010) propusieron un método para reducir el error de muestreo en las matrices de covarianza estimada por REML el cual se denomina penalización.
Materiales y métodos.
Se usaron los datos de la medida de suavidad en el musculo del pecho en pavos de raza Broad para estimar el índice de constancia (Repetibilidad). Diez medida de suavidad fueron medidas en el musculo del pavo, como las medidas fueron tomadas por 2 operadores diferentes, el efecto operador fue considerado como fijo. El modelo estadístico lineal que se utilizo es el siguiente:
Suavidad = media + efecto del animal + efecto de operador + error
Los datos utilizados son:
En la base de datos, se tiene 60 registro (n) de suavidad, 6 niveles del factor animal (aleatorio) y 2 niveles para el efecto operador (fijo).
Los componentes de varianza se estimaron usando las fórmulas para ML y REML y también con el paquete estadístico SAS versión 9.1, usando el procedimiento mixed.
La repetibilidad se estimó usando la siguiente formula (Becker, 1986):
Donde:
Los programas SAS usados son:
Programa SAS para ML.
Programa SAS para REML.
Resultados y discusiones.
En el cuadro 1, se presentan el cálculo de las sumas de cuadrados, grados de libertad y cuadrados medios del análisis.
Los resultados encontrados nos muestran una varianza dentro de las medidas del mismo individuo menor que la varianza entre los individuos.
Los resultados muestran componentes de varianza más pequeños para ML y más grandes para REML.
Los resultados demuestran una estimación de repetibilidad más grande con REML y más pequeña con ML.
En el cuadrado 4, se presentan los reportes del programa SAS para los componentes de varianza estimados.
Los resultados encontrados son idénticos a los calculados de manera manual, por lo tanto, se afirma que el cálculo es correcto.
La estimación de R por ML es pequeña debida a que su varianza fenotípica está asociada a n grados de libertad, es decir, esta sesgada, por lo tanto, es aconsejable la utilización de REML si se tiene la incertidumbre de que el sesgo ocasionado en la estimación de ML es insignificante (en muestras grandes, el sesgo es mínimo en ML).
Bibliografía.
Becker, Walter. (1986). Manual de Genética Cuantitativa. Academic Enterprises.
Gutiérrez, Pablo. (2012). Iniciación a la valoración Genética Animal. Metodología adaptada al EEES. Editorial Complutense.
Hartley, H. O. y Rao, J. N. K. (1967), “Maximum Likelihood Estimation for the Mixed Analysis of Variance Model”, Biometrika, 54, 93-108.
Meyer, K. and Mark K. (2004) Restricted maximum likelihood estimation of genetic principal components and smoothed covariance matrices. Animal Genetics and Breeding Unit, University of New England.
Karin Meyer and Mark Kirkpatrick (2010). Better estimates of genetic covariance matrices by ‘bending’using penalized maximum likelihood. Animal Genetics and Breeding Unit1. University of New England, Armidale NSW 2351, Australia.
Mrode, Raphael and Thompson, Robin. (2005) linear models for the prediction of animal breeding values second edition. CABI Publishing is a division of CAB International.
Patterson, H. D. y Thompson, R. (1971), “Recovery of Inter-Block Information When Block Sizes are Unequal,” Biometrika, 58, 545-554.
Searle, S. R.; Casella, G. and McCulloch, C. E. (1992). Variance Components, New York: Wiley.