INTRODUCCIÓN
El maíz es un importante cultivo a nivel mundial con una producción aproximada de 1.148 millones de toneladas. Argentina es el cuarto productor con un total de 43,5 millones de toneladas cosechadas en el ciclo agrícola 2018/19. Entre otros factores, su producción es afectada por la presencia de enfermedades que pueden amenazar el cultivo y consecuentemente la seguridad alimentaria y la sustentabilidad agrícola (Nelson et al., 2018). Las enfermedades más comunes en maíz son causadas por virus y hongos (Agrios, 2005) aunque entre las patologías emergentes, se encuentran las producidas por bacterias. Las enfermedades producidas por bacterias patógenas en maíz han incrementado su prevalencia en Argentina (Plazas, 2018), debido posiblemente a la masiva adopción de la siembra directa. Es notable la ausencia de genotipos resistentes a este tipo de enfermedades (Gurr y Rushton, 2005). La base genética de la respuesta a la infección por bacterias o bacteriosis (BD) ha sido significativamente menos investigada que aquélla relacionada con enfermedades fúngicas y virales en maíz (Rossi et al., 2019). Entre las enfermedades virales, el Mal de Río Cuarto (MRC) juega un rol prevalente para el cultivo de maíz en Argentina ya que ha causado severas pérdidas de rendimiento con diferentes valores de incidencia y severidad a través de los años (Giménez Pecci et al., 2012). El agente causal es el Mal de Río Cuarto virus (MRCV), el cual se clasifica como un miembro del género Fijivirus, familia Reoviridae (King et al., 2012) y se transmite de manera persistente propagativa por insectos vectores, principalmente por la chicharrita Delphacodes kuscheli Fennah (Ornaghi et al., 1993). La resistencia genética es el método más eficiente y efectivo para el control de MRC y por ello se han realizado numerosas evaluaciones de material genético en la zona donde la enfermedad es endémica (Di Renzo et al., 2004; Bonamico et al., 2012; Rossi et al., 2015). Numerosos QTL (Quantitative trait loci) para resistencia a MRC se han identificado a través del fenotipado de poblaciones biparentales generadas localmente. El mapeo por asociación (GWAS, genome wide association study) también es usado para la identificación de variantes alélicas específicas que incrementan la resistencia a enfermedades (Zila et al., 2014). Para GWAS, es esencial contar con poblaciones compuestas por individuos genotípica y fenotípicamente diversos, que presenten una alta densidad de polimorfismos en la secuencia de ADN (Yan et al., 2011). Germoplasmas diversos de especies alógamas como el maíz demandan alta densidad de marcadores. Esto se debe a que el desequilibrio de ligamiento puede disminuir entre dos sitios polimórficos a una distancia corta (unos pocos miles pares de bases) a causa de la alta frecuencia de recombinación (Remington et al., 2001). Las líneas de maíz del Centro Internacional de Mejoramiento de Maíz y Trigo (CIMMYT), desarrolladas durante los últimos 25 años, se han convertido en la principal fuente pública de germoplasma diverso de maíz (Chen et al., 2016). La genotipificación densa de este germoplasma de alta diversidad genómica aporta información para la implementación de GWAS para identificar loci de resistencia a enfermedades presentes en la región maicera de Argentina. Si bien es común que los mejoradores evalúen múltiples caracteres en sus esquemas de selección (Malosetti et al., 2008) en programas de mejoramiento genético, la evaluación de resistencia a MRC no se ha realizado simultáneamente con BD. El enfoque multicarácter incrementa el poder de detección de aquellos QTL que afectan a más de un carácter simultáneamente (Knott y Haley, 2000). El ajuste de un modelo que permita caracterizar genotipos considerando más de un carácter y sus potenciales correlaciones (Covarrubias Pazaran, 2016) representa una forma novedosa de abordar la resistencia a enfermedades. El objetivo del presente estudio fue identificar regiones genómicas de maíz promisorias para la mejora de la resistencia a la enfermedad MRC y a BD en un germoplasma diverso de maíz.
MATERIALES Y MÉTODOS
Material vegetal y ensayo de campo
Se sembró una población diversa de 185 líneas de maíz del Centro Internacional de Mejoramiento de Maíz y Trigo (CIMMYT) para determinar su resistencia a Mal de Río Cuarto (MRC) y a bacteriosis (BD) durante el ciclo de cultivo 2019-2020 en Río Cuarto, Córdoba, Argentina (64° 20′ W, 33° 8′ S). Se utilizó un diseño parcialmente repetido (p-rep) (Cullis et al., 2006). El diseño implicó el uso de tres repeticiones en 50 líneas (de modo que p= 27%) y parcelas individuales en las 135 líneas restantes. Cada línea se sembró en una parcela que consistió de un surco de 2,5 m de longitud y 0,52 m de ancho. Se sembró a doble densidad y se ralearon plantas, tres semanas posteriores a la emergencia para obtener 10 plantas por parcela. La infección de ambas enfermedades ocurrió de manera natural. Líneas experimentales susceptibles se evaluaron conjuntamente en el ensayo para verificar la ocurrencia de MRC. Ambas enfermedades se evaluaron mediante la observación de síntomas en la etapa de floración (95- 100 días post siembra). La incidencia de MRC y BD se estimó como la proporción de plantas que presentaron síntomas sobre el total de plantas de cada parcela (INCMRC y INC-BD, respectivamente). La severidad en ambas enfermedades (SEV-MRC y SEV-BD) se evaluó utilizando las escalas propuestas por Ornaghi et al. (1999) y Schuelter et al. (2003) para MRC y BD, respectivamente. Para SEV-MRC, cada planta se clasificó por el grado de severidad: 0= sin síntomas; 1= presencia de enaciones; 2= presencia de enaciones + acortamiento de entrenudos + láminas foliares atrofiadas en el tercio superior; 3= máximo desarrollo de la enfermedad con enaciones + acortamiento de entrenudos + láminas foliares atrofiadas en el tercio superior + espigas pequeñas, múltiples y sin granos. Para SEV-BD, las plantas de cada parcela se evaluaron visualmente por la lesión foliar, siendo 1= sin lesiones; 2= lesiones dispersas; 3= hasta el 50% de las hojas con lesiones, con lesiones graves en el 25% de las hojas inferiores; 4= hasta el 75% de las hojas con lesiones, con lesiones graves en el 50% de las hojas inferiores; 5= 100% de las hojas con lesiones, con lesiones graves en el 75% de las hojas inferiores; 6= planta muerta. Para el análisis estadístico se usó la severidad promedio por parcela.
Datos genómicos
La caracterización genotípica realizada por Wu et al. (2016) con marcadores moleculares del tipo SNP utilizada en este trabajo se encuentra disponible en http://data.cimmyt.org/dvn. De un total de 362.008 SNPs se seleccionaron 78.376 marcadores distribuidos en los 10 cromosomas de maíz. La selección de marcadores se basó en la calidad, y en un primer paso, se eliminaron marcadores con una frecuencia alélica menor a 0,05 o con errores de secuenciación. Posteriormente, se eliminaron los marcadores con una tasa de datos faltantes superior al 35%. La base de datos utilizada en este trabajo está disponible en https://github.com/PlantbreedingUNRC/GWAS-MRC-BD.
Análisis estadístico
Los datos fenotípicos se analizaron utilizando un modelo lineal mixto (MLM) multicarácter (Maier et al., 2015). La base de datos utilizada en el modelo consta de 185 líneas de maíz evaluadas mediante cuatro caracteres (INCMRC, SEV-MRC, INC-BD y SEV-BD). Se usó un modelo lineal mixto multivariado para obtener el predictor lineal del efecto aleatorio de genotipo, es decir un BLUP multivariado de efectos de genotipo que considera los cuatro caracteres evaluados simultáneamente. La observación yijk para el carácter k es escrito como una función lineal del efecto del bloque desde donde es observada y del efecto de genotipo,
para el carácter k donde yijk es la observación fenotípica para el carácter k=INC-MRC, SEV-MRC, INC-BD, SEV-BD, μ es la media general, βi es el efecto aleatorio deli-ésimobloque βi ~ N (0, σ2 b), Gj es el efecto aleatorio del j-ésimogenotipo y εijk es el componente de error aleatorio independiente que se supone normal con media y varianza constante. El MLM multivariado es un modelo para el vector de observaciones Y donde se consideran las observaciones de los k caracteres y que estima no sólo varianzas de los caracteres sino también covarianzas entre ellos. En este trabajo se ajustó utilizando la función “mmer” del paquete “sommer” (CovarrubiasPazaran, 2016), software R (R Core Team, 2016). Los componentes de varianza obtenidos del MLM multivariado fueron usados para estimar la heredabilidad del carácter k, tal como lo propusieron Hallauer y Miranda (1988).
donde es la varianza genotípica para el carácter k-ésimo, es la varianza residual asociada a las observaciones de ese carácter, y p es una media ponderada del número de repeticiones (Holland et al., 2003). Las varianzas genéticas estimadas para cada carácter y las covarianzas genética entre pares de caracteres, obtenidas del ajuste del MLM multivariado, permitieron estimar la correlación genética (rg) entre los caracteres l y m:
donde es la covarianza genética entre los caracteres l y m, y los elementos del denominador corresponden a las varianzas genéticas de ambos caracteres.
Asociación entre variación fenotípica y variación genotípica
El software Tassel 5.2.60 (Bradbury et al., 2007) se utilizó para realizar el análisis de asociación entre variación fenotípica y variación genotípica. El GWAS se llevó a cabo con 78.376 SNPs. La incidencia y la severidad de MRC y BD fueron usadas como variables dependientes. Para llevar a cabo la asociación se ajustaron seis modelos. Los modelos fueron: 1) el modelo Naive, que realiza la asociación de la información genotípica y fenotípica sin tener en cuenta la posible existencia de estructura genética en la población en estudio; 2) el modelo Q, que utiliza la matriz de estructura poblacional definida con el programa Structure (Pritchard, 2000) considerando la correlación genética entre líneas; 3) el modelo PCA, el cual modela la estructura poblacional subyacente en la población de líneas de maíz, mediante la incorporación de cinco componentes principales (Price et al., 2006). También se ajustaron modelos que incorporaron la matriz de Kinship para modelar la relación genética entre dos líneas de la población en estudio, 4) el modelo K (Parisseaux y Bernardo, 2004); 5) el modelo Q + K (Yu et al., 2006); y 6) el modelo PCA + K (Zhao et al., 2007). A partir del gráfico de quantilesquantiles (Q-Q plot) se seleccionaron los modelos apropiados para cada carácter. Este gráfico compara los valores observados del -log10 (valor-p) para cada marcador con los valores esperados del -log10 (valor-p) bajo la hipótesis nula de no asociación entre marcadores moleculares y los caracteres en estudio. El procedimiento de Li y Ji (2005) se utilizó para realizar correcciones de los valores p por multiplicidad. Los marcadores SNPs que superaron el umbral de -log10 (valor-p) >4 (p<0,0001), se consideraron asociados de manera significativa con el carácter. Los gráficos Q-Q plot y Manhattan plot se realizaron con el paquete “qqman” (Turner, 2018) del software R (R Core Team, 2016) utilizando las salidas de GWAS del software Tassel.
RESULTADOS
Para ambas enfermedades se observaron tanto valores mínimos como valores máximos de las respectivas escalas de evaluación de síntomas. El valor medio de INCMRC fue 43% y de SEV-MRC 0,88, mientras que para INC-BD y SEV-BD fueron 83% y 2,5, respectivamente. El valor estimado de heredabilidad varió entre 0,35 (INC-BD) y 0,7 (SEV-BD) (Tabla 1).
El MLM multivariado reveló que la correlación genética entre caracteres es positiva y significativa cuando se trata de INC y SEV de una misma enfermedad, mientras que la correlación entre caracteres de distinta enfermedad no resultó estadísticamente significativa (Tabla 2).
A partir de la frecuencia alélica de los loci de cada línea, se clasificaron con el software Structure los genotipos del panel en tres grupos. El primer grupo estuvo compuesto por cuatro líneas, el segundo por 108 líneas y el tercer grupo por 73 líneas. Consecuentemente, la estructura genética que determina el agrupamiento de líneas fue contemplada en los modelos de asociación entre la variación fenotípica y la genotípica ajustadas carácter por carácter. El modelo Q (modelo que considera la estructura de grupos sugerida por el software Structure) fue el modelo de mejor ajuste para INCMRC y SEV-MRC. Sin embargo, para INC-BD y SEVBD la estructura de grupos fue menos discreta y quedó mejor representada por el modelo de asociación PCA + K, modelo que consideró cinco componentes del análisis de componentes principales de los datos moleculares como covariable y que además incorpora la correlación genética entre pares de líneas mediante la matriz de parentesco K (Figura 1). El mapeo asociativo utilizando los 78.376 SNPs para GWAS, se realizó con el modelo más apropiado para cada carácter (Figura 1).
Cinco regiones fueron declaradas como estadísticamente significativas tanto en el carácter INC-MRC como para SEV-MRC. Se identificaron otras 15 regiones como aportantes de alelos promisorios para INC-BD y SEV-BD. No se encontraron regiones genómicas que fuesen promisorias para mejorar la resistencia de ambas enfermedades simultáneamente. La proporción de variación fenotípica explicada por cada región cromosómica identificada como de alto potencial para la selección por resistencia a MRC osciló entre 0,11 y 0,19; valores similares fueron observados para BD (Tabla 3 y 4).
DISCUSIÓN
La población diversa de líneas de maíz del CIMMYT evaluada en Río Cuarto, presentó amplia variabilidad fenotípica y genotípica respecto a la reacción de las líneas para resistencia a Mal de Río Cuarto (MRC) y a bacteriosis (BD). Los modelos mixtos ofrecen un enfoque apropiado para analizar conjuntamente los caracteres evaluados para la identificación de mejores genotipos considerando la posible correlación entre éstos (Malosetti et al., 2008). La correlación entre caracteres puede ser positiva, negativa o nula. Wisser et al. (2011) y López Zuniga et al. (2019) observaron correlación positiva en caracteres de resistencia medido para tres enfermedades causadas por Cochliobolus heterostrophus, Setosphaeria turcica, y Cercosporazeae maydis en maíz. Sin embargo, en nuestro estudio no se observó correlación entre la respuesta al MRC y a la BD. Consecuentemente, el MLM multivariado constituye una herramienta útil para evaluar simultáneamente INC y SEV de MRC o de BD, pero no para el tratamiento de ambas enfermedades ya que la correlación genética entre resistencia a MRC y a BD fue baja. Los síntomas de BD se desarrollan principalmente en las hojas, mientras que, los síntomas de MRC afectan toda la planta cuando el ataque es severo (Abdala et al., 1997). La reducción de la lámina foliar puede, consecuentemente, dificultar la evaluación de la resistencia a bacteriosis produciendo subestimaciones en las correlaciones genéticas entre caracteres. Respecto a la estructura genética poblacional detectada por Structure, observamos alta consistencia con el agrupamiento de líneas como Lowland, Subtropical y Highland propuesto por Wu et al. (2016), quienes trabajaron con un set de líneas en el cual están contenidas las líneas del presente estudio. Al igual que lo observado por Gutiérrez et al. (2015), no hubo un único modelo GWAS que ajustara adecuadamente para todos los caracteres. El modelo que mejor ajustó para los caracteres INC-MRC y SEV-MRC fue el modelo Q (Pritchard, 2000); mientras que para INC-BD y SEV-BD ajustó el modelo PCA + K (Zhao et al., 2007) que sugiere un agrupamiento más difuso y más dependiente de las relaciones de pares de líneas que el modelo Q. El análisis de GWAS permitió identificar regiones genómicas previamente reportadas para la presencia de genes de resistencia a enfermedades. Di Renzo et al. (2004) y Bonamico et al. (2012) detectaron una región genómica que confiere resistencia a MRC en el bin 8.03 en una población segregante F2:3 y en una población de RIL, ambas derivadas del cruzamiento entre las líneas de maíz Mo17 (susceptible) y BLS14 (resistente). Gowda et al. (2015), detectó una región genómica en el bin 1.05 para resistencia a Maize lethal necrosis disease en un germoplasma tropical de maíz. Gomes de Paula Lana et al. (2017), evaluaron la resistencia a bacteriosis, Maize white spot, en una población biparental y al igual que en el presente estudio detectaron regiones genómicas asociadas para resistencia en los bin 2.07 y 8.03. Rossi et al. (2020) informaron dos regiones genómicas asociadas para resistencia a Maize white spot en los bin1.01 y 8.03 a partir de una población de líneas tropicales de maíz. Coincidentemente, estas dos regiones fueron asociadas significativamente con resistencia a bacteriosis en el presente estudio donde se utilizó una población diversa de diferente procedencia.
La variabilidad fenotípica y genotípica existente en el germoplasma diverso constituido por las líneas de maíz de CIMMYT resulta importante para apoyar programas de mejoramiento genético de maíz locales. El GWAS detectó regiones genómicas con alelos promisorios tanto para MRC como para BD, que individualmente explican una proporción de la variación fenotípica que oscila entre 10 y 20% de la variación total, pero no se identificaron regiones genómicas comunes a ambas enfermedades. Estudios multiambientales permitirán confirmar si estas regiones genómicas resultan promisorias para incorporar resistencia a Mal de Río Cuarto y a bacteriosis en programas locales de mejoramiento genético de maíz.