Bitte beachten Sie: Im Zeitraum vom 21.12.2024 bis zum 07.01.2025 werden auf hohPublica keine Anfragen oder Publikationen durch das KIM bearbeitet. Please note: KIM will not process any requests or publications on hohPublica between December 21, 2024 and January 7, 2025.
 

A new version of this entry is available:

Loading...
Thumbnail Image
Doctoral Thesis
2021

Integration of hyperspectral, genomic, and agronomic data for early prediction of biomass yield in hybrid rye (Secale cereale L.)

Abstract (English)

Currently, the combination of a growing bioenergy demand and the need to diversify the dominant cultivation of energy maize opens a highly attractive scenario for alternative biomass crops. Rye (Secale cereale L.) stands out for its vigorous growth and increased tolerance to abiotic and biotic stressors. In Germany, less than a quarter of the total harvest is used for food production. Consequently, rye arises as a source of renewables with a reduced bioenergy-food tradeoff, emerging biomass as a new breeding objective. However, rye breeding is mainly driven by grain yield while biomass is destructively evaluated in later selection stages by expensive and time-consuming methods. The overall motivation of this research was to investigate the prospects of combining hyperspectral, genomic, and agronomic data for unlocking the potential of hybrid rye as a dual-purpose crop to meet the increasing demand for renewable sources of energy affordably. A specific aim was to predict the biomass yield as precisely as possible at an early selection stage. For this, a panel of 404 elite rye lines was genotyped and evaluated as testcrosses for grain yield and a subset of 274 genotypes additionally for biomass. Field trials were conducted at four locations in Germany in two years (eight environments). Hyperspectral fingerprints consisted of 400 discrete narrow bands (from 410 to 993 nm) and were collected in two points of time after heading for all hybrids in each site by an uncrewed aerial vehicle. In a first study, population parameters were estimated for different agronomic traits and a total of 23 vegetation indices. Dry matter yield showed significant genetic variation and was stronger correlated with plant height (r_g=0.86) than with grain yield (r_g=0.64) and individual vegetation indices (r_g: =<|0.35|). A multiple linear regression model based on plant height, grain yield, and a subset of vegetation indices surpassed the prediction ability for dry matter yield of models based only on agronomic traits by about 6 %. In a second study, whole-spectrum data was used to indirectly estimate dry matter yield. For this, single-kernel models based on hyperspectral reflectance-derived (HBLUP) and genomic (GBLUP) relationship matrices, a multi-kernel model combining both matrices, and a bivariate model fitted also with plant height as a secondary trait, were considered. HBLUP yielded superior predictive power than the models based on vegetation indices previously tested. The phenotypic correlations between individual wavelengths and dry matter yield were generally significant (p < 0.05) but low (r_p: =< |0.29|). Across environments and training set sizes, the bivariate model yielded the highest prediction abilities (0.56 – 0.75). All models profited from larger training populations. However, if larger training sets cannot be afforded, HBLUP emerged as a promising approach given its higher prediction power on reduced calibration populations compared to the well-established GBLUP. Before its incorporation into prediction models, filtering the hyperspectral data available by the least absolute shrinkage and selection operator (Lasso) was worthwhile to deal with data dimensionally. In a third study, the effects of trait heritability, as well as genetic and environmental relatedness on the prediction ability of GBLUP and HBLUP for biomass-related traits were compared. While the prediction ability of GBLUP (0.14 - 0.28) was largely affected by genetic relatedness and trait heritability, HBLUP was significantly more accurate (0.41 - 0.61) across weakly connected datasets. In this context, dry matter yield could be better predicted (up to 20 %) by a bivariate model. Nevertheless, due to environmental variances, genomic and reflectance-enabled predictions were strongly dependant on a sufficient environmental relationship between data used for model training and validation. In summary, to affordably breed rye as a double-purpose crop to meet the increasing bioenergy demands, the early prediction of biomass across selection cycles is crucial. Hyperspectral imaging has proven to be a suitable tool to select high-yielding biomass genotypes across weakly linked populations. Due to the synergetic effect of combining hyperspectral, genomic, and agronomic traits, higher prediction abilities can be obtained by integrating these data sources into bivariate models.

Abstract (German)

Die Kombination eines wachsenden Bioenergiebedarfs und die Notwendigkeit, den vorherrschenden Anbau von Energiemais zu diversifizieren, eröffnen ein äußerst attraktives Szenario für alternative Biomassekulturen. Roggen (Secale cereale L.) zeichnet sich, durch ein kräftiges vegetatives Wachstum und eine erhöhte Toleranz gegenüber abiotischen und biotischen Stressfaktoren. In Deutschland wird weniger als ein Viertel der gesamten Roggenernte für die Lebensmittelproduktion verwendet. Daher gewinnt Roggen durch einen geringeren Zielkonflikt zwischen Bioenergie- und Lebensmittelnutzung an Bedeutung als Quelle für erneuerbare Energien, wobei Biomasse als neues Züchtungsziel auftaucht. Die Roggenzüchtung konzentriert sich derzeit jedoch hauptsächlich auf den Kornertrag, während die Biomasse in späteren Selektionsstadien durch teure und zeitaufwändige Methoden destruktiv erfasst wird. Die übergeordnete Motivation dieser Arbeit war es, die Aussichten der Kombination von hyperspektralen, genomischen und agronomischen Daten für die Erschließung des Potenzials von Hybridroggen als Zweinutzungspflanze zu untersuchen, um den steigenden Bedarf an erneuerbaren Energiequellen kostengünstig zu decken. Das spezifische Ziel war es, den Biomasseertrag in einem frühen Selektionsstadium so genau wie möglich vorherzusagen. Dazu wurde ein Panel von 404 Elitelinien genotypisiert und als Testkreuzungen für Kornertrag - eine Teilmenge von 274 Genotypen auch für Biomasse-Ertrag – ausgewertet. Feldversuche wurden an vier Standorten in zwei Jahren in Deutschland (entspricht acht Umwelten) durchgeführt. Die hyperspektralen Daten (400 diskreten Banden; 410-993 nm) wurden zu zwei Zeitpunkten nach dem Ährenschieben für alle Testkreuzungen an jedem Ort von einer Drohne gesammelt. In einer ersten Studie wurden Populationsparameter für verschiedene agronomische Merkmale und insgesamt 23 Vegetationsindizes geschätzt. Der Trockenmasseertrag zeigte eine signifikante genetische Variation und korrelierte stärker mit der Wuchshöhe (r_g=0.86) als mit dem Kornertrag (r_g=0.64) und den einzelnen Vegetationsindizes (r_g: =<|0.35|). Ein multiples lineares Regressionsmodell, welches auf Wuchshöhe, Kornertrag und den besten Vegetationsindizes basierte, übertraf die Vorhersagefähigkeit für den Trockenmasseertrag von Modellen, die nur auf agronomischen Merkmalen basierten, um etwa 6%. In einer zweiten Studie wurde das ganze Wellenlängenspektrum verwendet, um den Trockenmasseertrag indirekt abzuschätzen. Hierzu wurden Einzelkernmodelle (single-kernel models) basierend auf genomischen (GBLUP) oder hyperspektralen (HBLUP) Beziehungsmatrizen, ein Mehrkernmodell (multi-kernel model), das beide Matrizen kombiniert, sowie ein bivariates Modell, welches auch Wuchshöhe als ein sekundäres Merkmal enthielt, analysiert. HBLUP lieferte eine bessere Vorhersagekraft als die Modelle, die auf Vegetationsindizes basierten. Die phänotypische Korrelationen zwischen einzelnen Wellenlängen und dem Trockenmasseertrag waren im Allgemeinen signifikant (p<0,05), jedoch geringfügig (r_p: =<|0.29|). Über alle Umwelten und Trainingssatzgrößen hinweg ergab das bivariate Modell die höchsten Vorhersagefähigkeiten (0,56-0,75). Alle Modelle profitierten von größeren Trainingspopulationen. Wenn jedoch keine größeren Trainingssätze bereitgestellt werden können, zeigte HBLUP eine höhere Vorhersagefähigkeit als das etablierte GBLUP. Vor der Einbeziehung in Vorhersagemodelle hat sich das Filtern der verfügbaren Hyperspektraldaten durch den least absolute shrinkage and selection operator (Lasso) als notwendig erwiesen, um die Dimensionalität der Daten zu verringern. In einer dritten Studie wurden die Auswirkungen der Heritabilität sowie der Ähnlichkeit innerhalb von Genotypen und Umwelten auf die Vorhersagefähigkeit von GBLUP und HBLUP für biomassebezogene Merkmale verglichen. Während die Vorhersagefähigkeit von GBLUP (0,14-0,28) weitgehend durch genetische Verwandtschaft und die Merkmalsheritabilitäten beeinflusst wurde, war HBLUP in wenig verwandten Datensätzen signifikant genauer (0,41-0,61). In diesem Zusammenhang konnte der Trockenmasseertrag durch ein bivariates Modell bis zu 20% besser vorhergesagt werden. Aufgrund hoher Genotyp-Umwelt-Interaktionen waren genomische und reflexionsbasierte Vorhersagen nur schlecht geeignet, um die Leistung fehlender Umwelten vorherzusagen. Zusammenfassend ist es für eine kostengünstige Züchtung von Roggen als Zweinutzungspflanze zur Deckung des steigenden Bioenergiebedarfs entscheidend, die Biomasse über Selektionszyklen hinweg frühzeitig vorherzusagen. Die hyperspektrale Bildgebung hat sich als geeignetes Instrument zur Auswahl ertragreicher Biomasse-Genotypen auch in wenig verwandten Populationen erwiesen. Dank des synergetischen Effekts der Kombination von hyperspektralen, genomischen und agronomischen Merkmalen können durch die Integration dieser Datenquellen in bivariaten Modelle höhere Vorhersagefähigkeiten erzielt werden.

File is subject to an embargo until

This is a correction to:

A correction to this entry is available:

This is a new version of:

Notes

Publication license

Publication series

Published in

Faculty
State Institutes
Institute
State Plant Breeding Institute

Examination date

2021-07-20

Edition / version

Citation

DOI

ISSN

ISBN

Language
English

Publisher

Publisher place

Classification (DDC)
630 Agriculture

Original object

Sustainable Development Goals

BibTeX

@phdthesis{Galán2021, url = {https://hohpublica.uni-hohenheim.de/handle/123456789/6674}, author = {Galán, Rodrigo José}, title = {Integration of hyperspectral, genomic, and agronomic data for early prediction of biomass yield in hybrid rye (Secale cereale L.)}, year = {2021}, school = {Universität Hohenheim}, }
Share this publication