- а) экспертная идентификация сорта и определение его количественного содержания в сортосмеси;
- б) выделение семян, имеющих различные мелкие точечные дефекты (плесень, вирус и т.п.);
- в) наличие дефектов внешних повреждений на поверхности зерновки;
- г) наличие посторонних примесей в зерновой массе и их идентификация;
- д) идентификация в зерновой массе обрушенных, целых и дробленых ядер;
- е) техническое зрение в ультрафиолетовом или инфракрасном диапазоне, для отделения гнилых, испорченных зерен, которые имеют повышенную влажность;
- ж) отслеживание изменения геометрической формы зерновки, белизны ядра и наличия необработанных участков на ее поверхности в процессе шлифования крупяных культур и т.п.
Широкая вариабельность признаков зерновок - одна из основных проблем при идентификации. В [2; 3] предлагается основанная на Фурье-анализе и статистической теории распознавания образов методика идентификации сортов риса по геометрической форме их контуров как генетически наследуемому признаку, с погрешностью при разделении сортов в доли процента. Дальнейшее развитие и распространение метода возможно, если при анализе каждого объекта учитывать не только его контур, но и цветовые характеристики - общий цветовой фон, локальные всплески отдельных оттенков и т.д. [3]. Для анализа цветовой составляющей исследуемых объектов перспективен метод двумерного дискретного вейвлет-преобразования.
В данной работе рассмотрена возможная достижимая точность распознавания и выделения примесей с помощью нейросетевых методов для различных сортов злаковых культур по вейвлет-спектру цветовой окраски и формы плодов плоского изображения зерновок.
Общий алгоритм нейросетевого распознавания включает следующие этапы создания «обучающей» базы данных (БД) для спектрального анализа плоского изображения зерновок и последующего распознавания изображений [7-11]:
- фотосъемка зерновок на однотонном фоне; для «обучающей» БД - известного сорта, для рабочего режима - сортосмеси, подлежащей распознаванию;
- применение алгоритмов отделения фона и выделения пиксельных изображений отдельных единичных зерновок;
- установить центр масс объекта, угол поворота относительно начальной системы координат и размеры каждого изображения, перенести начало координат в центр масс объекта и произвести поворот осей координат таким образом, чтобы ось абсцисс проходила вдоль максимального удлинения объекта;
- нормализовать размеры объекта таким образом, чтобы вне зависимости от разрешения анализируемого изображения геометрические размеры всех объектов совпадали;
- провести дискретное вейвлет-преобразование цветовых составляющих всех точек (пикселей), принадлежащих выделенной в предыдущих пунктах области; упорядочить полученные коэффициенты; отбросить незначащие элементы полученного упорядоченного массива;
- для «обучающей» БД - сохранить полученные данные в БД единичных вейвлет-спектров;
- для нейросетевых методов распознавания БД единичных вейвлет-спектров является обучающей выборкой. Разработать топологию и провести обучение НС;
- для рабочего режима вейвлет-спектр элементов сортосмеси, подлежащей распознаванию, подается на вход разработанной НС. Выход НС идентифицирует элементы сортосмеси.
Рис. 1. Исходные изображения сортов риса: Rg - Регул, Iz - Изумруд, Kr - Краснодарский 424, Kl - Кулон, Lm - Лиман
Объектами исследований являлись элитные сорта риса, зерна шлифованного и шелушёного риса одного сорта, сорт с трудно отделимым засорителем (шлифованный рис и битое стекло) и трудноотделимые сорта (тритикале Авангард и пшеница Победа-50). В качестве инструмента для разработки топологии и обучения НС были использованы наиболее известные пакеты-нейроимитаторы: Neural Networks Toolbox (расширение MatLab 7.0.1), NeuroPro 0.25, STATISTICA Neural Networks (SNN). Важным достоинством является возможность генерации исходного кода программы функционирования обученной НС.
Элитные сорта риса Краснодарский 424, Лиман, Кулон, Регул, Изумруд (рис. 1), произведенные на сортучастках ВНИИ риса, являлись тестовыми для дальнейшего развития метода [3, 8]. Представлены все ветви, группы и практически все классы, поскольку исследуемые сорта риса, согласно традиционной классификации профессора Г.Г. Гущина, относятся к китайско-японской ветви, за исключением сорта Изумруд из индийской ветви. Каждый из сортов представлен выборкой из шести фотографий по 50 зерен в каждой. Для проверки адекватности нейросетевой модели вся выборка разделена на три части: обучающую, контрольную и тестовую. На рис. 2 показана НС, полученная средствами нейроимитатора STATISTICA 6.1 Neural Networks (SNN). Архитектурой сети является трехслойный персептрон, функция активации - сигмоидная, функция ошибки - SOS (равна сумме (взятой по всем наблюдениям) квадратов разностей целевых и фактических значений). Алгоритмами обучения являлись метод обратного распространения и метод сопряженных градиентов.
Рис. 2. Архитектура сети
При классификации 5 сортов нешлифованного риса были получены следующие результаты: из 269 зерен сорта Регул были ошибочно классифицированы 3 зерна, из 284 зерен сорта Изумруд были правильно классифицированы все, из 185 зерен сорта Краснодарский-424 были ошибочно распознаны 4, из 136 зерен сорта Кулон были неправильно опознаны 4, из 139 зерен сорта Лиман также 4 зерна были классифицированы неправильно. Итоговая ошибка обобщения составила 1,5% (правильно опознаны 98,5% зерен).
Оценка построенной модели осуществляется путем ее тестирования с помощью различных выборок. Рассмотрим решение нескольких важных задач с помощью полученной выше нейросетевой модели.
Одной из сложных задач классификации является разделение зерен шлифованного и шелушёного риса одного сорта (рис. 3). У шелушёного риса при предварительной очистке удаляется только шелуха, поверхностный слой. Поэтому он имеет более темную окраску, чем рис шлифованный (рис. 3а). Рис шлифованный - это зерна, с которых полностью удалены цветочные пленки, плодовые и семенные оболочки, большая часть алейронового слоя и зародыша. Рис шлифованный получается путем шлифования шелушёных зерен. После удаления шелухи и отрубевой оболочки остается белое зерно риса. Зерна такого риса имеют гладкую и ровную поверхность, они белоснежные и полупрозрачные (рис. 3в).
Рис. 3. Исходные изображения и вариабельность контура: а, б - рис шелушенный; в, г - рис шлифованный
Из 115 шлифованных зерен были правильно классифицированы все (100% точности), а из 121 шелушёных - 2 были классифицированы как шлифованные (98,35% точности).
При обработке шлифованного риса самым трудно отделимым засорителем является битое стекло, так как по цвету и полупрозрачности, а иногда и по форме, оно имеет большое сходство с зерновкой (рис. 4).
а б
Рис. 4. а - шлифованное зерно риса; б - примесь из кусочка битого стекла.
В количество 121 шт. шлифованных зерен было добавлено 20 кусочков битого стекла, по форме и размеру наиболее близкие к зерновкам. Все примеси были выделены со 100%-ным результатом.
Тритикале - гибрид, в котором удалось соединить наследственные качества традиционно возделываемых культур - пшеницы и ржи. Сорт Авангард является сортом тритикале зернового направления использования и является кормовой культурой. Зерно крупное, удлиненное, светло-красное (рис. 4а). По внешним признакам сильно напоминает зерна пшеницы. Наличие зерен тритикале в виде примеси при производстве хлебопекарной муки изменяет ее качество в сторону ухудшения. Рассмотрим задачу выделения примеси сорта Авангард из пшеницы сорта Победа-50. Этот сорт является полукарликовым высококачественным зимостойким сортом озимой мягкой пшеницы. Зерно крупное, янтарно-коричневое, яйцевидно-удлиненной формы (рис. 4б).
Рис. 5. Исходные изображения и вариабельность контура: а, б - тритикале Авангард; в, г - пшеница Победа-50
Из 60 зерен сорта Авангард только одно зерно тритикале было опознано как пшеница (98,33% точности), все 72 зерна пшеницы Победа-50 были правильно классифицированы (100% правильной классификации).
Таким образом, применение стандартной топологии нейронной сети - многослойного персептрона, без изменения функции активации и функции ошибки, с использованием градиентных методов обучения первого и второго порядка, позволило провести достаточно качественную классификацию и выделение примеси для зерновых культур.
Данная работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований и администрации Краснодарского края, грант № 08-07-99033-р_офи.
Рецензенты:
- Семенчин Е.А., д.ф.-м.н., профессор, зав. кафедрой высшей алгебры и геометрии Кубанского государственного университета, МО РФ, г. Краснодар.
- Камалян Р.З., д.т.н., профессор, зав. кафедрой общей и прикладной математики Академии маркетинга и социально-информационных технологий, г. Краснодар.
Работа получена 04.08.2011