







NOIA (interaccións naturais e ortogonais) é un modelo de efectos xenéticos. Estes modelos expresan os valores xenotípicos (os fenotipos agardados para cada xenotipo) en parámetros con significado biolóxico. Exemplos destes significados son o efecto de substitucións alélicas (feitas sobre xenotipos individualis ou a nivel poboacional) en fenotipos, cal é (se hai) a interacción entre alelos ou como de bos son os individuos como reprodutores.
O redescubrimento das leis de Mendel da herdanza de factores xenéticos deu lugar á disciplina da xenética. Porén, logo de máis dun século de esforzo científico, @s xenetistas aínda carecemos dunha descrición matemática xeral do seu cerne conceptual: como poden os xenes determinar os caracteres. Estas descricións chámanse funcións xenotipo-fenotipo, ou modelos de efectos xenéticos, e son necesarias tanto para esclarecer a arquitectura xenética dos caracteres (atopar os xenes subxacentes e os seus efetos individuais e interaccións) como para empregar esta información para investigar a evolución fenotípica, para incrementar a resposta á selección en caracteres de importancia comercial e analizar a regulación xenética das enfermidades.
Menos de dúas décadas despois de que xenética emerxese a partires das leis de Mendel, a descomposición dos valores xenotípicos en efectos xenéticos aditivos, dominantes e de interacción deu unha base axeitada á xenética cuantitativa (Fisher 1918). Isto foi posíbel achegando unha descrición matemática satisfactoria de como a herdanza mendeliana multifactorial é compatíbel cos achados que a biometría atopara dende mediados do século XIX. O modelo de Fisher (1918) de efectos xenéticos abriu camiños ao achegar mecanismos xenéticos explícitos para os cambios fenotípicos ao longo das xeracións na teoría da evolución de Darwin. A modelaxe xenética foi, xa que logo, o centro neurálxico da teoría sintética da evolución.
A teoría de Fisher (1918) está construída arredor dunha regresión linear do fenotipo agardado para cada xenotipo (os valores xenotípicos) ao contido xénico. Esta regresión establece unha ligazón formal entre fenotipos e xenotipos a través dos efectos xenéticos que cuantifican a achega de substitucións alélicas nos fenotipos (efectos aditivos) e cal é a interacción de dous alelos do mesmo xene cando están presentes simultaneamente (efectos de dominancia). Tanto os efectos aditivos coma os de dominancia están formulados de dous xeitos. En primeiro lugar, de xeito máis ou menos arbitrario como desviacións dos valores xenotípicos dos homocigotos, o cal foi eventualmente chamado modelo Finfinito (Mather and Jinks 1982).
En segundo lugar, tamén están descritos como efectos promediados no contexto dunha poboación particular, é dicir, como desviacións da media poboacional. A descomposición dos efectos xenéticos en efectos promedio aditivos e dominantes (os modelos estatísticos de efectos xenéticos) permítenos describir as propiedades evolutivas dun rasgo a través da descomposición da varianza xenética dese rasgo nunha poboación. Kempthorne (1954) e Cockerham (1954) publicaron achegas significativas a esta teoría estendendo a descomposición da varianza xenética para ter en conta axeitadamente os efectos epistáticos, de xeito que as propiedades alxébricas e estatísticas das estimas de efectos xenéticos se mantiveron (seguiron sendo independentes, polo menos baixo certas condicións). De feito, a propiedade clave destes modelos é que permiten a obtención de descomposicións ortogonais (en compoñentes independentes) da varianza xenética.
Na fin do século XX, as novas técnicas moleculares deron lugar a retos e oportunidades en xenética cuantitativa. A análise de caracteres cuantitativos, QTL (Lander and Botstein 1989) é un exemplo paradigmático deste feito. A metodoloxía de análise de QTL persegue atopar os loci que determinan un carácter, para o cal depende inevitabelmente dos modelos de efectos xenéticos, os cales emprega de xeito inverso (para atopar a base xenética a partires de datos fenotípicos). De feito, esta dependencia inherente da análise de QTL nos modelos de efectos xenéticos puxo de manifesto certas carencias dos desenvolventos matemáticos dispoñíbeis naquel intre.
Neste contexto, Cheverud e Routman (1995) alertaron de certos problemas no emprego de modelos de efectos xenéticos estatísticos (dependentes da poboación) na análise de QTL. Subliñaron a diferenza entre efectos xenotípicos e xénicos e propuxeron interpretar os resultados das análises de QTL a partires dos primeiros, aos que chamaron fisiolóxicos, en contraste cos estatísticos. A súa perspectiva está en consonancia coa primeira definición de epistase (Bateson 1909) e coa parametrización Finfinito de Fisher (1918). Hansen e Wagner (2001) foron máis aló examinando a relación entre efectos xenéticos funcionais (i.e. fisiolóxicos) e estatísticos. O seu modelo multilinear é unha versión simplificada da función xenotipo-fenotipo, baseada en parámetros que capturan o papel fundamental das interaccións xénicas na evolución. Un concepto clave nos desenvolvementos de Hansen e Wagner (2001) é a ferramenta de cambio de referencia, que permite obter efectos xenéticos como efectos de substitucións alélicas sobre calquera xenotipo de referencia.
Yang (2004) e Zeng e colaboradores (Kao and Zeng 2002; Wang and Zeng 2006; Zeng et al. 2005), á súa vez, centráronse na outra cara da moeda (os modelos estatísticos), alegando dúas razóns principais. Primeiro, a cuantificación de efectos xenéticos en modelos reducidos é consistente cando os modelos empregados son ortogonais. Isto permite unha comparación directa de modelos aniñados na selección de modelos. Segundo, cada efecto xenético nun modelo ortogonal pode ser estimado independentemente e afecta só á súa compoñente de varianza. Yang (2004) publicou un modelo ortogonal para dous loci, válido con desviacións das proporcións de Hardy-Weinberg.
Até ese intre, a falta de xeneralidade dos modelos de efectos xenéticos empregados na análise de QTL estaba constrinxindo os resultados obtidos de dous xeitos. Primeiro, dificultando atopar arquitecturas xénicas que non estaban descritas axeitadamente polos modelos empregados. Segundo, non era posíbel transformar as estimas obtidas conferíndolles significados acaídos para a interpretación e predicción de fenómenos evolutivos. As implementacións feitas en diferentes direccións non se coordinaran para atacar estes problemas. De feito, a estimación de efectos xenéticos en análises de QTL reflectiuse na polémica entre os defensores dos modelos funcionais e estatísticos. Era preciso artellar un modelo que integrase estas dúas formulacións nun único marco teórico de xeito convincente. Álvarez-Castro e Carlborg (2007) fixeron unha proposta unificadora neste sentido, o modelo NOIA.
NOIA consiste polo tanto en unificar e continuar implementando as diferentes e necesarias achegas á modelaxe de efectos xenéticos. NOIA (Álvarez-Castro e Carlborg 2007) xeneraliza as formulacións funcionais previas aplicando o cambio de referencia do modelo multilinear (Hansen and Wagner 2001) a un marco completamente xeral (Yang and Álvarez-Castro 2008) e proporcionando unha interpretación grafica dos modelos funcionais de efectos xenéticos, similar á de Fisher para os modelos estatísticos (Fisher 1918). NOIA tamén xeneraliza as formulacións estatísticas previas implementando modelos ortogonais con desviacións das frecuencias de Hardy-Weinberg (Yang 2004) con múltiples loci (Tiwari and Elston 1997) e estendendo o cambio de referencia dende a formulación funcional á estatística. Asemade, NOIA permite as transformacións entre efectos xenéticos funcionais e estatísticos, xeneralizando ligazóns entre formulacións puntuais feitas con anterioridade (e.g. Van Der Veen 1959).
A orixinalidade do marco integrador do modelo NOIA fixo polo tanto posíbel aproveitar as vantaxes dos modelos funcionais e estatísticos, os cales poden agora ser empregados simultaneamente. Isto posibilita, en particular, o emprego das expresións matemáticas que son máis axeitadas para obter estimas a partires de datos experimentais sen menoscabo de poder posteriormente formular as estimas obtidas cun significado diferente. Os novos valores así obtidos poden estar asociados tanto a substitucións alélicas dende un xenotipo concreto, poñamos por caso o dun xenotipo ancestral dende o que evoluíron varias poboacións (i.e. significado funcional), como á descrición das propiedades dunha poboación cunhas frecuencias xénicas determinadas. Poden tamén estar asociados a modelos máis restrinxidos, coma o modelo multilinear, agora integrado no marco máis xeral do modelo NOIA (Le Rouzic and Álvarez-Castro 2008).
O modelo NOIA (Álvarez-Castro and Carlborg 2007) está conformado por un conxunto de expresións que xeneralizan e unifican modelos previos de efectos xenéticos que posibilitan varias descomposicóns dos valores xenotípicos dun carácter. O caso dun locus con dous alelos sen impronta amósase a continuación. As expresións de NOIA son da forma G=SE, onde G é o vector de valores xenotípicos, S é a matriz de deseño de efectos xenéticos, formada polos escalares (contrastes), e E é o vector de efectos xenéticos, incluíndo tamén o punto de referencia do sistema xenético. Polo de agora temos descritos dous tipos principais de descomposicións que necesitan formulacións matemáticas distintas, as formulacións funcional e estatística.
A formulación estatística expresa os valores xenotípicos en termos dos efectos promedio de substitucións alélicas dende a media da poboación. Podemos obtela como a regresión dos valores xenotípicos ao contido xénico. Para un locus con dous alelos, a expresión xeral da formulación estatística como función das frecuencias xénicas e xenotípicas da poboación é G=SSES. O subíndice S indica “estatística” e o punto de referencia do modelo é a media da poboación, μ. Esta descomposición pode expandirse do seguinte xeito:
Esta expresión traduce os valores xenotípicos noutros parámetros (a media poboacional e os efectos aditivo e dominante), que reflicten propiedades fundamentais do sistema xenético. De feito, a formulación estatística coincide coa descomposición dos valores xenotípicos de Fisher (1918), dando lugar á descomposición ortogonal da varianza xenética, á súa vez baseada na regresión linear dos valores xenotípicos no contido xénico (o número dun dos alelos no xenotipo). A diferenza entre a descomposición de Fisher e esta formulación é que esta última é máis xeral, pois inclúe desviacións das frecuencias de Hardy-Weinberg e polo tanto permite descomposicións ortogonais da varianza xenética en situacións xerais.
O punto de referencia da formulación estatística (dende o que medimos os efectos xenéticos como desviacións) é a media fenotípica da poboación, μ. Non sendo posíbel practicar unha regresión linear a un só punto, esta formulación non ten senso cando precisamos obter os efectos xenéticos dende a referencia dun xenotipo concreto. De feito, se tentamos usar a formulación estatística para obter unha expresión tal (i.e. substituíndo as tres frecuencias xenotípicas por unha unidade e dous ceros) dá como resultado divisións por cero. Para expresar os valores xenotípicos en forma de efectos de substitucións alélicas naturais dende un xenotipo dado (en troques de efectos promedio) empregamos a formulación funcional. Esta pode ser obtida empregando primeiro un xenotipo como referencia e estendendo as expresións ao resto dos posíbeis xenotipos (Álvarez-Castro and Carlborg 2007). A expresión xeral para a formulación funcional é G=SFEF, onde F significa “funcional”. Para un locus con dous alelos, esta expresión expándese a:
A descomposición funcional dos valores xenotípicos describe o sistema xenético en termos dos efectos de substitucións alélicas dende un xenotipo concreto (como vimos de explicar) cando os parámetros se substitúen por cero, agás o correspondente a un dos xenotipos, que debe ser un. Deste xeito, o punto de referencia do sistema xenético, R, pasa a ser o valor xenotípico deste xenotipo.
Unha propiedade oportuna desta notación é que aplicando o produto de Kronecker se poden obter doadamente as expresións multilocus, incluíndo efectos epistáticos (Álvarez-Castro and Carlborg 2007). Aínda que aquí só amosamos as expresións máis simples con dous alelos, tamén obtivemos expresións de NOIA para un número arbitrario de alelos, incluíndo formulacións nas que os parámetros son os excesos promedio (e.g. Yang and Álvarez-Castro 2008). Tanto a formulación funcional como a estatística de NOIA comprenden modelos previos como casos particulares. Este é o caso para o Finfinito, o F2, o G2A de Zeng, o modelo "fisiolóxico" de Cheverud e o modelo multilinear (Álvarez-Castro and Carlborg 2007, Le Rouzic and Álvarez-Castro 2008).
Os efectos xenéticos asociados a dúas descomposicións diferentes dos valores xenotípicos poden intercambiarse doadamente a través dos propios valores xenotípicos, que permanecen constantes. Dadas dúas descomposicións diferentes, i.e. dúas formulaciós distintas e/ou dende puntos de referencia diferentes, G=S1E1 e G=S2E2, podemos obter E2 dende E1 como:
E2=(S2)-1S1E1
Este é o cerne de NOIA como enfoque integrativo e unificador. Como exemplo, esta expresión permite estudar os procesos de domesticación mediante a obtención de estimas en cruzamentos entre individuos domesticados e outros procedentes das poboacións salvaxes orixinais, empregando a formulación estatística axeitada, e logo transformalos en efectos de substitucións alélicas dende a poboación salvaxe (ver Álvarez-Castro et al. 2008). A notación matricial é o factor clave para realizar estas transformacións de xeito doado (facilitando por exemplo a súa inclusión en programas informáticos).
Porén, é notorio que a aplicabilidade destas transformacións depende significativamente da xeneralidade acadada para cada unha das formulacións. É obvio que a notación matricial per se non nos permitirá transformar os nosos parámetros noutros para os que descomposicións axeitadas non fosen descritas. Por poñer un exemplo, co modelo G2A (o modelo xeral de dous alelos de Zeng et al. 2005) non podemos obter transformacións a parámetros con desviacións das frecuencias de Hardy-Weinberg, que si son posíbeis co emprego de NOIA. É desexábel, polo tanto (e unha das máis importantes metas dos proxectos aquí presentados) obter expresións da forma G=SE que sexan apropiadas para describir as propiedades de calquera sistema xenético en calquera poboación.
A utilidade do modelo NOIA xa foi exemplificada en publicacións científicas. Álvarez-Castro et al. (2008) fixeron unha primeira aplicación de NOIA aos resultados de análises de QTL. Un paquete informático está dispoñíbel para investigador@s que queiran empregar NOIA para obter estimas de efectos xenéticos a partires de datos empíricos (Le Rouzic and Álvarez-Castro 2008). Empregando esta ferramenta, obtivéronse estimas funcionais cun xenotipo concreto como referencia por primeira vez a partires de datos reais (Álvarez-Castro et al. 2008). Neste traballo, efectos xenéticos da taxa de crecemento de polos foron obtidos para estudar o proceso de domesticación do "White Leghorn Layer" dende o seu ancestro, o "Red Junglefowl". Tamén se obtivo información sobre o proceso de domesticación mediante o emprego de NOIA a partires dunha rede de oito QTL (Le Rouzic et al. 2008). En conxunto, NOIA foi empregado como unha nova e potente ferramenta para a análise de procesos complexos, anteriormente fóra do noso alcance.
Este diagrama ilustra o emprego de NOIA en análises de QTL. A frecha discontinua [1] refírese á realización de escaneados de QTL coa formulación estatística, cuxa ortogonalidade facilitaría comparar redes de QTL como posíbeis responsábeis do control do carácter. En calquera caso, calquera que sexa o método empregado para localizar a base xenética, cada locus estará asociado en cada individuo a unhas probabilidades xenotípicas. A partires destas, un modelo xenético ten que ser empregado para calcular efectos xenéticos. Os efectos xenéticos que proveñen de estudos de QTL son os que se obtiveron co modelo empregado no escaneado. Pero este modelo non será en xeral o acaído á pregunta ou preguntas que o estudo quere respostar. A frecha [2] sinala o emprego da formulación estatística de NOIA para proporcionar estimas de efectos xenéticos como efectos promedio na poboación experimental.
Aínda que estas estimas teñen un significado controlado, este non ten por que ser o desexado. A frecha [3] sinala o emprego da ferramenta de transformación de NOIA para proporcionar estimas estatísticas nunha poboación diferente (con diferentes frecuencias xenotípicas) ou funcionais. Tamén existe a posibilidade de peneirar os valores xenotípicos para eliminar certos efectos xenéticos. É frecuente, por exemplo, que a epistase de orde superior a dous se queira descartar. Cando se calculan os valores xenotípicos simplemente como medias dos fenotipos observados, as inevitábeis imprecisións xeran todo tipo de interaccións. NOIA pode ser empregado para obter un vector de valores xenotípicos no que os efectos non desexados sexan eliminados. A frecha [5] sinala o emprego de NOIA para recuperar efectos xenéticos dende un vector peneirado de valores xenotípicos.
Varios grupos de investigación teñen empregado e/ou están a empregar NOIA con datos reais (e.g. Hu et al. 2010; Pavlicev et al. 2010; Rubin et al. 2010). Estás a aplicar o modelo NOIA e queres facérnolo saber? Faino aquí!
Álvarez-Castro, J. M., and
Ö. Carlborg. 2007. A unified model for functional and statistical
epistasis and its application in quantitative trait loci analysis.
Genetics 176:1151-67.
Álvarez-Castro, J. M., A. Le Rouzic, and Ö.
Carlborg. 2008. How to perform meaningful estimates of genetic
effects. PLoS Genetics 4:e1000062.
Bateson, W. 1909. Mendel's Principles of Heredity. Cambridge University Press, Cambridge.
Cheverud, J. M., and E. J. Routman. 1995. Epistasis and its contribution to genetic variance components. Genetics 139:1455-61.
Cockerham,
C. C. 1954. An extension of the concept of partitioning hereditary
variance for analysis of covariances among relatives when epistasis is
present. Genetics 39:859-882.
Fisher, R. A. 1918. The correlation
between relatives on the supposition of Mendelian inheritance. Trans.
Roy. Soc. Edinburgh 52:339-433.
Hansen, T. F., and G. P. Wagner.
2001. Modeling genetic architecture: a multilinear theory of gene
interaction. Theor Popul Biol 59:61-86.
Hu, G., S. Wang, J. Tian, L.
Chu, and H. Li. 2010. Epistatic effect between ACACA and FABP2 gene on
abdominal fat traits in broilers. J Genet Genomics 37:505-12.
Kao, C. H., and Z. B. Zeng. 2002. Modeling epistasis of quantitative trait loci using Cockerham's model. Genetics 160:1243-61.
Kempthorne,
O. 1954. The correlation between relatives in a random mating
population. Proc. R. Soc. Lond. B. Biol. Sci. 143:102-113.
Lander,
E. S., and D. Botstein. 1989. Mapping mendelian factors underlying
quantitative traits using RFLP linkage maps. Genetics 121:185-99.
Le
Rouzic, A., and J. M. Álvarez-Castro. 2008. Estimation of Genetic
Effects and Genotype-Phenotype Maps. Evolutionary Bioinformatics
4:225-235.
Le Rouzic, A., J. M. Álvarez-Castro, and Ö. Carlborg.
2008. Dissection of the genetic architecture of body weight in chicken
reveals the impact of epistasis on domestication traits. Genetics
179:1591-1599.
Mather, K., and J. L. Jinks. 1982. Introduction to Biometrical Genetics. Chapman and Hall, London.
Pavlicev,
M., A. Le Rouzic, J. M. Cheverud, G. P. Wagner, and T. F. Hansen.
2010. Directionality of epistasis in a murine intercross population.
Genetics 185:1489-505.
Rubin, C. J., M. C. Zody, J. Eriksson, J. R.
Meadows, E. Sherwood, M. T. Webster, L. Jiang, M. Ingman, T. Sharpe, S.
Ka, F. Hallbook, F. Besnier, O. Carlborg, B. Bed'hom, M.
Tixier-Boichard, P. Jensen, P. Siegel, K. Lindblad-Toh, and L.
Andersson. 2010. Whole-genome resequencing reveals loci under
selection during chicken domestication. Nature 464:587-91.
Tiwari, H.
K., and R. C. Elston. 1997. Deriving components of genetic variance
for multilocus models. Genetic Epidemiology 14:1131-1136.
Wang, T.,
and Z. B. Zeng. 2006. Models and partition of variance for
quantitative trait loci with epistasis and linkage disequilibrium. BMC
Genet 7:9.
Yang, R.-C. 2004. Epistasis of quantitative trait loci under different gene action models. Genetics 167:1493-505.
Yang,
R.-C., and J. M. Álvarez-Castro. 2008. Functional and statistical
genetic effects with miltiple alleles. Current Topics in Genetics
3:49-62.
Zeng, Z. B., T. Wang, and W. Zou. 2005. Modeling quantitative trait Loci and interpretation of models. Genetics 169:1711-25.