بررسی واکنش ژنوتیپ‌های گندم به بیماری‌های رایج با استفاده از الگوریتم‌های یادگیری ماشین

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استاد، گروه تولیدات گیاهی، دانشکده کشاورزی و منابع طبیعی، دانشگاه گنبد‌کاووس، گنبدکاووس، ایران.

2 استادیار، گروه تولیدات گیاهی، دانشکده کشاورزی و منابع طبیعی، دانشگاه گنبدکاووس، گنبدکاووس، ایران.

3 گروه تحقیقات علوم کشاورزی و باغبانی، مرکز تحقیقات و آموزش منابع کشاورزی مازندران، سازمان تحقیقات، آموزش و ترویج کشاورزی (AREEO)، ساری، ایران.

4 دانشجوی سابق دکتری، گروه اصلاح نباتات، دانشکده علوم زراعت، دانشگاه علوم کشاورزی و منابع طبیعی گرگان، گرگان، ایران.

5 دانشجوی کارشناسی ارشد، گروه تولیدات گیاهی، دانشکده کشاورزی و منابع طبیعی. دانشگاه گنبدکاووس، ایران.

چکیده

هدف: به‌منظور پیش‌بینی واکنش 297 ژنوتیپ گندم به بیماری‌های رایج منطقه، از 71 و 81 نشانگر iPBS و SSR استفاده شد.
مواد و روش‌ها: ژنوتیپ‌های گندم به‌صورت اگمنت و  قالب طرح بلوک‌های کامل تصادفی در مزرعه ایستگاه تحقیقات کشاورزی قراخیل قائمشهر کشت شدند. داده‌های مورد بررسی شامل داده‌های مولکولی و داده‌های فنوتیپی بودند. برای تجزیه و تحلیل داده‌ها، از الگوریتم‌های انتخاب ویژگی و دسته‌بندی مانند RandomForest و مدل ارزیابی InfoGainAttributeEval استفاده شد.
نتایج: نتایج نشان داد که ژنوتیپ‌های گندم از نظر داده‌های مولکولی و فنوتیپی دارای تنوع ژنتیکی قابل توجهی هستند. با این حال، کارایی الگوریتم‌های به‌کاررفته در پیش‌بینی واکنش ژنوتیپ‌ها به بیماری‌های مختلف بسته به نوع بیماری متفاوت بود. در مورد بیماری‌های لکه خرمایی و فوزاریوم سنبله، داده‌های مولکولی و الگوریتم‌های مورد استفاده نتوانستند به‌طور مؤثر واکنش ژنوتیپ‌ها را پیش‌بینی کنند. این عدم کارایی نشان می‌دهد که این داده‌ها ممکن است برای تشخیص حساسیت یا مقاومت به این بیماری‌ها کافی نباشند. در مقابل، برای بیماری زنگ زرد، الگوریتم‌های به‌کاررفته توانستند واکنش ژنوتیپ‌ها را با دقت بالایی پیش‌بینی کنند. همچنین، میانگین دقت پیش‌بینی برای بیماری لکه خرمایی حدود 90/34 درصد بود که نشان‌دهنده کارایی نسبی پایین این روش در پیش‌بینی این بیماری است. در مورد بیماری‌های سفیدک پودری و زنگ قهوه‌ای، الگوریتم‌های مورد استفاده عملکردی بهتری داشتند. بالاترین دقت پیش بینی مربوط به بیماری زنگ زرد بود که به‌طور متوسط 70 درصد دقت نشان داد. به‌طور میانگین، دقت پیش‌بینی برای سفیدک پودری 00/56  درصد و برای زنگ قهوه‌ای 28/56 درصد بود. با این حال، بررسی داده‌ها نشان داد که برای بیماری سفیدک پودری، داده‌های فنوتیپی دقت بیشتری در پیش‌بینی واکنش ژنوتیپ‌ها داشتند، در‌حالی‌که برای زنگ قهوه‌ای، داده‌های مولکولی عملکرد دقیق‌تری ارائه دادند. همچنین، داده‌های مولکولی SSR و iPBS زمانی که با استفاده از الگوریتم دسته‌بندی RandomForest و مدل ارزیابی InfoGainAttributeEval مورد بررسی قرار گرفتند، توانستند درصد قابل توجهی از واکنش ژنوتیپ‌ها را به‌درستی پیش‌بینی کنند.
نتیجه‌گیری: نتایج نشان داد که پیش‌بینی واکنش ژنوتیپ‌ها به برخی بیماری‌ها بر اساس داده‌های مولکولی و به برخی دیگر بر اساس داده‌های مورفولوژیک دقیق‌تر انجام می‌شود. علاوه بر این، در مورد بیماری زنگ زرد، داده‌های مولکولی و فنوتیپی توانستند واکنش ژنوتیپ‌ها را با دقت بالایی پیش‌بینی کنند.

کلیدواژه‌ها


عنوان مقاله [English]

Investigating the response of wheat genotypes to common diseases using machine learning algorithms

نویسندگان [English]

  • hossein sabouri 1
  • Seyed javad Sajadi 2
  • Fakhtak Taliei 2
  • Hossein Ali Fallahi 3
  • Borzo Kazerani 4
  • Aylin Zebarjad 5
1 Professor, Department of Plant Production, Faculty of Agriculture and Natural Resources, Gonbad Kavous University, Gonbad Kavous, Iran.
2 Assistant Professor, Department of Plant Production, Faculty of Agriculture and Natural Resources, Gonbad Kavous University, Gonbad Kavous, Iran.
3 Department of Agricultural and Horticultural Sciences Research, Mazandaran Agricultural Resources Research and Education Center, Agricultural Research, Education and Extension Organization (AREEO), Sari, Iran.
4 Former PhD Student, Department of Plant Breeding, Faculty of Agriculture Science, Gorgan Agriculture Science and Natural Resource University, Iran.
5 MSc Student, Department of Plant Production, Faculty of Agriculture and Natural Resources, Gonbad Kavous University, Gonbad Kavous, Iran.
چکیده [English]

Objective
This study aimed to predict the response of 297 wheat genotypes to common regional diseases using 71 iPBS and 81 SSR molecular markers.
Materials and Methods
The wheat genotypes were cultivated using an augmented design within a completely randomized layout at the Qarahkil Agricultural Research Station in Qaemshahr. Both molecular and phenotypic data were analyzed. Feature selection and classification algorithms were employed for data analysis, including Random Forest and the InfoGainAttributeEval evaluation model.
Results
The analysis revealed substantial genetic diversity among wheat genotypes at both the molecular and phenotypic levels. However, the effectiveness of the predictive algorithms varied depending on the disease. The algorithms showed limited predictive accuracy for diseases such as tan spot and Fusarium head blight, suggesting that the available data may be insufficient to determine genotype resistance or susceptibility reliably. In contrast, yellow rust demonstrated the highest prediction accuracy, averaging 70%, indicating that the models were highly effective in predicting genotype responses. The algorithms also performed relatively well for powdery mildew and brown rust, achieving average prediction accuracies of 56.00% and 56.28%, respectively. However, prediction accuracy for brown spots was low, averaging 34.90%, indicating limited model performance for this disease.
Further analysis showed that phenotypic data were more effective in predicting responses to powdery mildew, whereas molecular data provided better predictions for brown rust. Overall, the SSR and iPBS markers, combined with the Random Forest classification algorithm and the InfoGainAttributeEval model, enabled accurate prediction of genotype responses for several diseases.
Conclusion
The findings indicate that the predictive power of molecular and phenotypic data varies by disease. While molecular data were more accurate for some diseases, phenotypic data were more effective for others. Notably, both data types accurately predicted genotype responses to yellow rust.

کلیدواژه‌ها [English]

  • Feature selection
  • Machine learning
  • Prediction
  • Wheat diseases