Широкая вариабельность признаков зерновок - одна из основных проблем при идентификации. В [2; 3] предлагается основанная на Фурье-анализе и статистической теории распознавания образов методика идентификации сортов риса по геометрической форме их контуров как генетически наследуемому признаку, с погрешностью при разделении сортов в доли процента. Дальнейшее развитие и распространение метода возможно, если при анализе каждого объекта учитывать не только его контур, но и цветовые характеристики - общий цветовой фон, локальные всплески отдельных оттенков и т.д. [3]. Для анализа цветовой составляющей исследуемых объектов перспективен метод двумерного дискретного вейвлет-преобразования.
В данной работе рассмотрена возможная достижимая точность распознавания и выделения примесей с помощью нейросетевых методов для различных сортов злаковых культур по вейвлет-спектру цветовой окраски и формы плодов плоского изображения зерновок.
Общий алгоритм нейросетевого распознавания включает следующие этапы создания «обучающей» базы данных (БД) для спектрального анализа плоского изображения зерновок и последующего распознавания изображений [7-11]:
Тритикале
Рис. 1. Исходные изображения сортов риса: Rg - Регул, Iz - Изумруд, Kr - Краснодарский 424, Kl - Кулон, Lm - Лиман
Объектами исследований являлись элитные сорта риса, зерна шлифованного и шелушёного риса одного сорта, сорт с трудно отделимым засорителем (шлифованный рис и битое стекло) и трудноотделимые сорта (тритикале Авангард и пшеница Победа-50). В качестве инструмента для разработки топологии и обучения НС были использованы наиболее известные пакеты-нейроимитаторы: Neural Networks Toolbox (расширение MatLab 7.0.1), NeuroPro 0.25, STATISTICA Neural Networks (SNN). Важным достоинством является возможность генерации исходного кода программы функционирования обученной НС.
Элитные сорта риса Краснодарский 424, Лиман, Кулон, Регул, Изумруд (рис. 1), произведенные на сортучастках ВНИИ риса, являлись тестовыми для дальнейшего развития метода [3, 8]. Представлены все ветви, группы и практически все классы, поскольку исследуемые сорта риса, согласно традиционной классификации профессора Г.Г. Гущина, относятся к китайско-японской ветви, за исключением сорта Изумруд из индийской ветви. Каждый из сортов представлен выборкой из шести фотографий по 50 зерен в каждой. Для проверки адекватности нейросетевой модели вся выборка разделена на три части: обучающую, контрольную и тестовую. На рис. 2 показана НС, полученная средствами нейроимитатора STATISTICA 6.1 Neural Networks (SNN). Архитектурой сети является трехслойный персептрон, функция активации - сигмоидная, функция ошибки - SOS (равна сумме (взятой по всем наблюдениям) квадратов разностей целевых и фактических значений). Алгоритмами обучения являлись метод обратного распространения и метод сопряженных градиентов.
Рис. 2. Архитектура сети
При классификации 5 сортов нешлифованного риса были получены следующие результаты: из 269 зерен сорта Регул были ошибочно классифицированы 3 зерна, из 284 зерен сорта Изумруд были правильно классифицированы все, из 185 зерен сорта Краснодарский-424 были ошибочно распознаны 4, из 136 зерен сорта Кулон были неправильно опознаны 4, из 139 зерен сорта Лиман также 4 зерна были классифицированы неправильно. Итоговая ошибка обобщения составила 1,5% (правильно опознаны 98,5% зерен).
Оценка построенной модели осуществляется путем ее тестирования с помощью различных выборок. Рассмотрим решение нескольких важных задач с помощью полученной выше нейросетевой модели.
Одной из сложных задач классификации является разделение зерен шлифованного и шелушёного риса одного сорта (рис. 3). У шелушёного риса при предварительной очистке удаляется только шелуха, поверхностный слой. Поэтому он имеет более темную окраску, чем рис шлифованный (рис. 3а). Рис шлифованный - это зерна, с которых полностью удалены цветочные пленки, плодовые и семенные оболочки, большая часть алейронового слоя и зародыша. Рис шлифованный получается путем шлифования шелушёных зерен. После удаления шелухи и отрубевой оболочки остается белое зерно риса. Зерна такого риса имеют гладкую и ровную поверхность, они белоснежные и полупрозрачные (рис. 3в).
Рис. 3. Исходные изображения и вариабельность контура: а, б - рис шелушенный; в, г - рис шлифованный
Из 115 шлифованных зерен были правильно классифицированы все (100% точности), а из 121 шелушёных - 2 были классифицированы как шлифованные (98,35% точности).
При обработке шлифованного риса самым трудно отделимым засорителем является битое стекло, так как по цвету и полупрозрачности, а иногда и по форме, оно имеет большое сходство с зерновкой (рис. 4).
а
б
Рис. 4. а - шлифованное зерно риса; б - примесь из кусочка битого стекла.
В количество 121 шт. шлифованных зерен было добавлено 20 кусочков битого стекла, по форме и размеру наиболее близкие к зерновкам. Все примеси были выделены со 100%-ным результатом.
Тритикале - гибрид, в котором удалось соединить наследственные качества традиционно возделываемых культур - пшеницы и ржи. Сорт Авангард является сортом тритикале зернового направления использования и является кормовой культурой. Зерно крупное, удлиненное, светло-красное (рис. 4а). По внешним признакам сильно напоминает зерна пшеницы. Наличие зерен тритикале в виде примеси при производстве хлебопекарной муки изменяет ее качество в сторону ухудшения. Рассмотрим задачу выделения примеси сорта Авангард из пшеницы сорта Победа-50. Этот сорт является полукарликовым высококачественным зимостойким сортом озимой мягкой пшеницы. Зерно крупное, янтарно-коричневое, яйцевидно-удлиненной формы (рис. 4б).
Рис. 5. Исходные изображения и вариабельность контура: а, б - тритикале Авангард; в, г - пшеница Победа-50
Из 60 зерен сорта Авангард только одно зерно тритикале было опознано как пшеница (98,33% точности), все 72 зерна пшеницы Победа-50 были правильно классифицированы (100% правильной классификации).
Таким образом, применение стандартной топологии нейронной сети - многослойного персептрона, без изменения функции активации и функции ошибки, с использованием градиентных методов обучения первого и второго порядка, позволило провести достаточно качественную классификацию и выделение примеси для зерновых культур.
Данная работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований и администрации Краснодарского края, грант № 08-07-99033-р_офи.
Рецензенты:
Работа получена 04.08.2011