Krasnodar, Krasnodar, Russian Federation
UDK 004.89 Прикладные системы искусственного интеллекта. Интеллектуальные системы, обладающие знаниями
The paper discusses an innovative approach to monitoring grain ecosystems, based on the use of neural network technologies. A classification of the tasks of monitoring the phytosanitary condition of crops in a grain field has been carried out, and the corresponding intellectualization tools have been identified. The main attention is paid to the problems of detection, classification and development of diseases in crops, for the effective solution of which it is proposed to use computer vision methods, including a complex of convolutional architectures GoogleNet, DenseNet, U-Net, which have shown high performance in classification and segmentation problems on test samples of images of wheat diseases, obtained as a result of three years of field experiments in the Krasnodar Region. The results of the study show that the use of neural network methods in the process of monitoring grain ecosystems contributes to the effective solution of complex problems associated with diagnostic procedures, allowing to reduce the level of uncertainty in the decision-making process, which is especially important under the influence of environmental factors with a high level of randomness and variability. The main barrier to the intellectualization of production processes is the lack of methodology for working with artificial intelligence, big data and other digital technologies at different levels of management in the agricultural sector of the economy, which affects not only issues of technical implementation and implementation of artificial intelligence, but also organizational aspects, including work with data, staffing the intellectualization process, information infrastructure, defining the roles and responsibilities of participants in the process, as well as the integration of intelligent solutions with the agricultural solutions module of the national platform “Digital Agriculture”.
artificial intelligence, monitoring of grain ecosystems, grain production, neural networks, computer vision
Введение. Современное сельское хозяйство постепенно становится одной из наиболее технологически оснащенных отраслей в мире, в которой инновационные методы производства выступают базовым условием прогресса. Широкое проникновение инноваций сопровождается цифровым перерождением агропромышленного комплекса. Технологические революции в области робототехники, датчиков, технологий больших данных, интернета вещей открывают новые возможности для повышения эффективности сельскохозяйственного производства на всех этапах цепочки создания ценности, начиная от закупки семян у поставщиков и заканчивая транспортировкой готовой продукции до конечного потребителя.
Важнейшей технологической инновацией, выполняющей роль цифрового базиса на этапе трансформации, выступает искусственный интеллект (ИИ), насыщающий производственные процессы новой полезной информацией и знаниями, извлекаемыми из первичных баз данных (во многом недостоверных), полученных с помощью различных сенсоров, дронов, машин и других источников. Извлечение важных закономерностей и выявление скрытых зависимостей, которые могли остаться незамеченными при традиционных методах анализа, способствует принятию более обоснованных и детализированных решений участниками сельскохозяйственной деятельности.
Несмотря на принятие стратегических документов и инициатив по развитию ИИ, важнейшим из которых является Указ Президента «О развитии искусственного интеллекта в Российской Федерации», в основе которого лежит Национальная стратегия, определяющая, с одной стороны, цели и задачи развития данной технологии, с другой ‒ меры, направленные на ее использование в целях обеспечения национальных интересов [1]. Применение ИИ в сельском хозяйстве остается на этапе догоняющего развития не только в мировом рейтинге, но и внутри страны.
На рисунке 1 приведена информация об удельном весе сельскохозяйственных организаций, реализующих цифровые технологии, напрямую или косвенно связанные с ИИ, откуда следует, что практически по всем группам показателей в 2021 г. сельское хозяйство отставало от аналогичных групп по стране. Хотя по сравнению с 2020 г. и наблюдался незначительный прирост в доле компаний по всем перечисленным технологиям, кроме цифровых платформ, где доля предприятий снизилась на 0,4 пункта.
Рис. 1. Использование цифровых технологий в сельскохозяйственных организациях в сравнении с данными по стране, % от общего числа. 2021 г. [2, 3]
Отставание аграрной отрасли в использовании цифровых интеллектуальных технологий может быть объяснено несколькими факторами, среди которых инфраструктурный барьер, выражающийся, например, в ограниченном доступе сельских территорий к высокоскоростному Интернету; ограниченность бюджета сельскохозяйственных организаций для инвестирования в новые технологии; недостаток специалистов с необходимыми цифровыми навыками для работы с ИИ-технологиями; сложная координация и масштабирование цифровых решений, вызванные большим количеством мелких предприятий и т.д. [4].
Однако основной причиной такого отставания является отсутствие методологии для работы с искусственным интеллектом, большими данными и другими цифровыми технологиями на разных уровнях управления в аграрном секторе экономики. Данная методология должна базироваться на конкретных цифровых инструментах (или их прототипах), направленных на решение отдельных задач и обеспечение определенных функций в рамках управления бизнес-процессами в различных отраслях сельского хозяйства. Методология, ориентированная на конкретные цифровые решения, имеет ряд преимуществ и рациональных соображений. Во-первых, она способствует прагматичной разработке стратегии внедрения интеллектуальных систем, избегая абстрактных концепций, сосредоточившись на практических результатах. Во-вторых, только в этом случае можно учесть существующие технические возможности и барьеры, что способствует разработке более реалистичных и эффективных планов. В-третьих, использование конкретных решений в рамках методологии обеспечивает более четкую возможность оценки потенциальных рисков и преимуществ внедрения, включая экономическую эффективность. Отсутствие абстрактных элементов позволяет провести точную оценку того, как данные решения будут взаимодействовать с существующими бизнес-процессами и системами.
Для конкретизации проводимого исследования сосредоточимся на двух аспектах. Во-первых, остановимся на зерновом производстве, как наиболее крупной и стратегически важной подотрасли сельского хозяйства. Во-вторых, рассмотрим базовый (нижний) уровень управления, основу которого составляет мониторинг зернового производства, как средство обеспечения сохранности, безопасности и качества зерна, а оперативной мерой обеспечения такого мониторинга является непрерывный контроль фитосанитарного состояния посевов (фитосанитарный мониторинг).
Цель исследования. Предложить принципиальную схему функционирования процесса мониторинга посевов зерновых с использованием технологий нейросетевого моделирования.
Задачи исследования: провести классификацию основных задач мониторинга зерновых экосистем; предложить инструменты интеллектуального решения поставленных задач; оценить их производительность на основе опытных данных, полученных на территории Краснодарского края; рассмотреть мониторинг с позиций процессного подхода и отразить в нем его основные структурные элементы и этапы.
Материалы и методы исследования. Теоретическим базисом исследования послужили работы по использованию цифровых технологий управления зерновым производством [5, 6, 7] в контексте задач, поставленных ведомственным проектом «Цифровое сельское хозяйство» в части цифровых агрорешений (продукты и технологии) в АПК, а также Федеральной научно-технической программой развития сельского хозяйства на 2017–2030 годы. В качестве методологической основы исследования взяты концепции социогенеза, законы развития цифровой экономики (Мура, Хуанга, Кека), определяющие ключевые направления и тенденции развития в условиях внедрения новых технологий, а также процессный подход, позволяющий рассмотреть мониторинг зерновых экосистем как набор взаимосвязанных шагов и действий.
Результаты исследования и их обсуждение. Многообразие задач мониторинга предполагает наличие различных типов адаптивных ИИ-моделей (машинного обучения), способных эффективно их решать (рис. 2).
Рис. 2. Соответствие задач мониторинга посевов зерновых
с инструментами интеллектуализации
Главная задача моделей классификации ‒ детерминация объектов на различные предопределенные категории или классы на основе их характеристик или признаков. Существуют два приоритетных подхода к классификации: мультикласс и мультилейбл. В первом из них каждый объект соотносится с меткой одного единственного класса (Mutually Exclusive Classification). В контексте задач мониторинга объектами выступают зерновые культуры или их изображения, а метками классов – болезни растений. Во втором случае классификация выполняется на невзаимоисключающие классы (NoN-Exclusive Classification), что становится особенно актуально, если растение поражено сразу несколькими болезнями. Обе ситуации непрерывно сопровождают процесс мониторинга, для которого постоянное отслеживание состояния культур и классификация болезней является одним из приоритетных направлений.
Для подтверждения концепции интеллектуализации данного блока мониторинга автором был разработан интеллектуальный нейросетевой классификатор трех патогенов, входящих в патокомплекс пшеницы Краснодарского края: желтая ржавчина (Puccinia striiformis f. sp. tritici West.), бурая ржавчина (Puccinia triticina f. sp. tritici Erikss.) и желтая пятнистость (Pyrenophora tritici-repentis (Died.) Drechsler), как наиболее вредоносных и опасных заболеваний, потери урожая от которых могут составить от 30 до 100 % [8]. Точная и своевременная идентификация возбудителей данных патогенов играет ключевую роль в принятии решений о необходимых мерах по борьбе с ними, включая применение средств защиты растений. В то же время в процессе классификации различных видов ржавчин и пятнистостей лица, осуществляющие диагностику, нередко сталкиваются с неопределенностью, вызванную схожестью симптомов в проявлениях заболеваний (например, бурая и желтая ржавчины), в особенной степени на ранней стадии заражения.
В качестве нейросетевых архитектур были выбраны хорошо зарекомендовавшие себя в задачах классификации DenseNet и GoogleNet, показавшие прекрасные результаты в главном международном соревновании по компьютерному зрению ImageNet [8]. Способность извлекать сложные признаки из изображений и эффективно работать с различными аспектами данных, механизмы для снижения потери информации при обработке изображений, работа с разными масштабами признаков, что особенно полезно при анализе изображений растений, определили выбор данных архитектурных решений.
Данные для настройки параметров (обучения) моделей были собраны на опытных полях ФГБНУ Всероссийский научно-исследовательский институт защиты растений (ВНИИЗР) в период с 2019 по 2022 г. В процессе закладки опытов были использованы 35 сортов озимой пшеницы, возделываемых на юге России и отличающихся по степени устойчивости исследуемых патогенов. В результате общий объем обучающей выборки составил 5169 изображений, в том числе бурая ржавчина – 227, желтая ржавчина – 1283, желтая пятнистость – 3659.
Для оценки предсказательной способности и производительности моделей для каждого ИИ-решения были построены матрицы ошибок (рис. 3) ‒ инструмент, показывающий, насколько точно модель классифицирует объекты разных классов. Она представляет собой таблицу, в которой по вертикали указаны истинные классы объектов, а по горизонтали – предсказанные [9]. Каждая ячейка матрицы характеризуется количеством объектов, отнесенных алгоритмом к определенному классу (предсказанный класс), при условии, что корректным классом был другой класс (истинный класс). Таким образом, по диагонали матрицы находятся правильно классифицированные объекты, а вне диагонали – ошибочно классифицированные.
Даже без расчета специальных метрик качества алгоритмов из рисунка 3 следует, что ошибка классификации минимальна. Модель GoogleNet ошиблась 27 раз, а классификатор DenseNet ровно 2 раза на 1718 объектах тестовой выборки (доля правильных ответов составила 97,8 и 99,4 % соответственно). Тестовая выборка представляет собой набор данных, который не использовался в процессе обучения модели, и служит для оценки того, насколько хорошо она способна обобщить свои знания на новых данных. Эти результаты свидетельствуют о высокой производительности обеих моделей, указывая на их способность находить и обобщать структуры в данных, невидимые или малозаметные для человеческого глаза, и могут быть рекомендованы для использоваться в производственном цикле в качестве основы систем поддержки принятия решений для фермеров, агрономов и других специалистов зернового производства.
Рис. 3. Матрицы ошибок классификаторов (получено автором на основе
результатов моделирования)
Наряду с задачами обнаружения и классификации вредных организмов важное с практической точки зрения значение имеет проблема диагностики степени развития болезни. В настоящее время считается, что основной критерий применения химических средств защиты растений на посевах ‒ экономический порог вредоносности (ЭПВ). Это не только показатель для начала обработок, но и уровень, до которого необходимо снижать численность вредного организма, чтобы не допустить потерь урожая. Поэтому, обладая точной информацией о степени интенсивности поражения посевов болезнью, фермеры и агрономы могут принимать обоснованные решения относительно целесообразности использования агрохимии в заданном месте и промежутке времени. Это, в свою очередь, имеет прямой выход на экономический и экологический эффект, поскольку способствует оптимизации внесения средств защиты, минимизируя расходы и воздействие на окружающую среду, а также снижает риски для здоровья человека.
Традиционный метод определения интенсивности болезней зерновых культур основан на визуальном анализе, который включает наблюдение за внешним состоянием растений и оценку видимых признаков поражения. Однако, несмотря на свою распространенность, он имеет некоторые недостатки. Визуальная оценка подвержена субъективности и зависит от опыта и квалификации эксперта, особенно на ранних стадиях заражения, когда визуальные признаки могут быть слабовыраженными. Также следует отметить трудоемкость визуального анализа, который требует значительных затрат времени и физических усилий, особенно на больших площадях посевов.
Со всеми перечисленными барьерами позволяет успешно справиться использование нейросетевых моделей сегментации, автоматизирующих процесс выделения пораженных участков растений на изображениях, снижая степень субъективизма при экспертизе человеком и повышая объективность оценки за счет обработки больших объемов данных более быстро и эффективно. Современные методы компьютерного зрения основываются и демонстрируют высокое качество диагностики объектов на изображениях. Тем не менее, их применение к рассматриваемой проблеме находится, скорее, в зачаточном состоянии. В последнее время только начинают появляться статьи отечественных авторов, посвященные данной проблематике.
На рисунке 4 представлены результаты семантической сегментации двух болезней пшеницы: желтая пятнистость (синяя разметка) и желтая ржавчина (красная разметка), полученные автором в результате применения простой, но в то же время одной из самых эффективных архитектур семантической сегментации ‒ U-Net [9]. Одним из значительных достоинств архитектуры U-Net является ее относительная легкость и возможность эффективной работы на мобильных устройствах. Это важно, если решение задачи требуется в реальных полевых условиях, где доступ к высокопроизводительным вычислительным ресурсам может быть ограничен. Выбор U-Net для исследования обусловлен не только его простотой и эффективностью, но и способностью к сегментации объектов даже при ограниченных объемах обучающих данных, что очень актуально для области сельскохозяйственного производства, где не всегда возможно сформировать наборы значительных объемов в фиксированные сроки. Это делает предложенную архитектуру перспективным вариантом определения степени развития болезней растений, особенно в контексте ограниченной доступности данных.
Рис. 4. Результаты сегментации ржавчин и пятнистостей пшеницы методами компьютерного зрения (получено автором на основе результатов
моделирования)
Из рисунка 4 следует, что модельный прогноз достигает уровня точности, который сравним с результатами, полученными экспертами-фитопатологами при ручной разметке. Данный результат был достигнут при обучении модели всего на 214 изображениях (в общей сложности использовалось 268 объектов, 214 изображений в качестве тренировочного набора и 54 ‒ в качестве тестового набора для оценки производительности модели).
Третий блок задач мониторинга зернового производства – прогноз распространения (оценка вероятности распространения болезни в определенной области или на определенный участок) и прогноз вредоносности (оценка потенциального ущерба, который может быть нанесен фермеру в результате заражения болезнью), решение которых относится к важнейшим составляющим всего производственного процесса, так как напрямую связано с обеспечением устойчивого роста и продуктивностью зерновых. Формально обе задачи относятся к классу регрессионных, решение которых сводится к нахождению количественных значений вероятности и ущерба соответственно.
В сложных и многофакторных задачах, таких как задачи прогнозирования в зерновом производстве, ключевым аспектом для достижения наилучших результатов и высокой точности является сбалансированный подход, который объединяет экспертные знания и высокотехнологичные методы интеллектуального анализа данных. В рамках прогнозирования интеллектуальные системы имеют стратегическую цель снизить уровень неопределенности для принимающих решения лиц. Эта неопределенность обычно связана с множеством переменных, тесно связанных с результатом прогноза и при этом обладающих высокой изменчивостью в силу своей природы. К таким, например, относятся состояние растений, наличие инфекционных агентов, степень развития болезни, диагностика сорной растительности, состояние почв, погодные условия и т.д.
Экспертные знания необходимы для понимания особенностей процесса и его контекста. Опытные специалисты могут предоставить ценные исходные данные, связав между собой очищенные от неопределенности факторы с помощью искусственного интеллекта с результирующим показателем – прогнозом распространения и/или вредоносности. Только совместное использование экспертных оценок и методов искусственного интеллекта позволяет создать комплексные и адаптивные модели прогнозирования, способные учесть широкий спектр факторов и условий. Такой сбалансированный подход обеспечивает надежные и точные результаты, способствуя устойчивому развитию зернового производства, повышению качества мониторинга, а следовательно, минимизации рисков и устойчивому развитию всей отрасли.
В рамках данной работы были предложены инструменты нейросетевого анализа, образующие в совокупности цифровой аналитический инструментарий, направленный на решение диагностических задач мониторинга в зерновом производстве. Данные IT-решения обладают высоким потенциалом для повышения эффективности всей системы управления, и в особой степени ее базового уровня – мониторинга. Внедрение и практическое использование перечисленных методов и моделей может привести к положительным изменениям в следующих ключевых аспектах деятельности: точное и оперативное реагирование на угрозы в агробиоценозах; разработка стратегий защиты и оптимизация использования ресурсов на основе прогнозов; снижение негативного воздействия агрохимии на окружающую среду и здоровье человека; адаптация к изменяющимся условиям и учет опыта предыдущих сезонов и др.
При этом эффективное использование ИИ требует не только наличия самих инструментов, но и разработки стратегий, организационных мероприятий и подходов к управлению, то есть методологических положений, основные структурные элементы которых приведены на рисунке 5. Разработка этих элементов является главной целью будущих авторских исследований.
Рис. 5. Методологические принципы организации процесса мониторинга посевов зерновых на базе нейросетевых технологий (разработано автором)
Заключение. Результаты настоящей работы подтверждают основные положения концепции интеллектуализации бизнес-процессов АПК, в частности, процесса мониторинга зерновых экосистем о том, что использование современных средств и технологий нейросетевого анализа играет важную роль в обеспечении устойчивого роста и повышении продуктивности зернового производства. Показано, что интеллектуальные системы способствуют снижению уровня неопределенности в процессе мониторинга, вызванного множеством факторов внешней среды, подверженных обычно высокой изменчивости. В качестве примеров реализации нейросетевого анализа приведены сверточные архитектуры компьютерного зрения, показавшие высокие результаты в задачах классификации и сегментации на тестовых выборках изображений болезней пшеницы. Подчеркивается необходимость разработки, и вербализируются основные принципы формирования методологии использования информационных технологий, основанных на нейронных сетях в зерновом производстве, особенно в свете текущего тренда на цифровую трансформацию всех отраслей (Национальная программа «Цифровая экономика РФ») и внедрения интеллектуальных технологий в аграрную сферу (ведомственная программа «Цифровое сельское хозяйство).
1. Nacional'naya programma «Cifrovaya ekonomika Rossiyskoy Federacii», utverzhdennaya protokolom zasedaniya prezidiuma Soveta pri Prezidente Rossiyskoy Federacii po strategicheskomu razvitiyu i nacional'nym proektam ot 4 iyunya 2019 g. № 7. URL: https://www.consultant.ru/document/ cons_doc_LAW_328854.
2. Indikatory cifrovoy ekonomiki: 2022: st. sb. / G.I. Abdrahmanova, S.A. Vasil'kovskiy, K.O. Vishnevskiy [i dr.]; Nac. issled. un-t «Vysshaya shkola ekonomiki». M.: NIU VShE, 2023. 332 s.
3. Cifrovaya ekonomika: 2023: st. sb. / G.I. Abdrahmanova, S.A. Vasil'kovskiy, K.O. Vishnevskiy [i dr.]; Nac. issled. un-t «Vysshaya shkola ekonomiki». M.: NIU VShE, 2023. 120 s.
4. Arinichev I.V., Sidorov V.A., Arinicheva I.V. Intellektual'nye tehnologii fitosanitarnoy diagnostiki ekosistem: neyrosetevoy podhod // Trudy Kubanskogo gosudarstvennogo agrarnogo universiteta. 2022. № 99. S. 66–70.
5. Deep learning for plant diseases: detection and daliency map visualization / M. Brahimi, M. Arsenovic, S. Sladojevic [et al.] // Human and Machine Learning. 2018. P. 93–117.
6. Fuentes A., Soon Y. Robust deep-learning-based detector for real-time tomato plant diseases and pests recognition // Sensors. 2022. № 17(9).
7. Zhang S., Huang W., Zhang C. Three-channel convolutional neural networks for vegetable leaf disease recognition // Cognitive Systems Research. 2019. T. 53. P. 31–41.
8. Arinichev I.V. Ispol'zovanie cifrovyh intellektual'nyh tehnologiy dlya diagnostiki zabolevaniy hlebnyh zlakov Kubani // Agrarnyy nauchnyy zhurnal. 2022. № 5. S. 70–73.
9. Arinichev I.V., Polyanskih S.V., Arinicheva I.V. Semanticheskaya segmentaciya rzhavchin i pyatnistostey pshenicy // Komp'yuternaya optika. 2023. T. 47. № 1. S. 118–125.