Введение
Эффективное развитие науки и высоких технологий требует интенсивной обработки и анализа фундаментальных знаний, накопленных в различных исследовательских организациях. Это приводит к потребности в развитии информационных технологий для накопления, извлечения и анализа предметно-ориентированных профессиональных знаний на основе разрабатываемых универсальных и специализированных моделей организации и представления научных данных и знаний в электронных ресурсах для их использования профессиональным сообществом.
Таким образом, создание электронных информационных ресурсов в Интернет, предназначенных для сбора, хранения, верификации, извлечения, распространения и производства новых профессиональных знаний в различных предметных областях является актуальной научной и научно-практической задачей.
Целью настоящей работы является разработка облачной многоагентной программно-технологической архитектуры для предметно-ориентированной системы научной осведомленности по физической химии радикальных реакций [Т1] (далее система), описание назначения используемых интеллектуальных агентов в решении задач предсказания физико-химических свойств органических молекул по экспериментальным данным.
Краткие сведения о системе
Подробное описание системы и принципов ее программно-технологической архитектуры дано в [5]. Система является англоязычной и включает в себя следующие информационные компоненты: базу данных по энергиям диссоциации связей органических молекул, базу данных по энтальпиям образования свободных радикалов и органических молекул, базу данных по константам скорости радикальных жидкофазных реакций.
В системе представлены активные компоненты, предназначенные для предсказания физико-химических характеристик органических молекул и их реакционной способности в радикальных реакциях (далее подсистема прогноза), а именно, экспертная система предсказания энергии диссоциации связей органических молекул по кинетическим данным, программы с элементами искусственно интеллекта для предсказания реакционной способности органических молекул в радикальных бимолекулярных реакциях и энтальпии образования свободных радикалов по кинетическим данным.
Методы исследования
В процессе разработки системы на настоящем этапе были использованы следующие облачные технологии: инфраструктура как услуга (IaaS), программное обеспечение как услуга (SaaS) и рабочее место как услуга (WaaS) [2]. Кроме того, система изначально разрабатывалась в многоагентной программной архитектуре и c применением технологий хранилищ данных и знаний, интеллектуальных программных агентов, искусственных нейронных сетей, а в последнее время и технологии нечетких баз знаний.
Основными задачами исследования являются разработка и реализация программных интеллектуальных агентов для использования их в подсистеме прогноза физико-химических свойств органических молекул по экспериментальным данным для рассматриваемой системы.
Результаты исследования и их обсуждение
Программно-технологическая архитектура электронного образовательного ресурса реализована на основе многоагентных технологий в частном облаке. Основные компоненты его архитектуры приведены на Рис. 1.
Рисунок 1. Программно-технологическая архитектура системы на настоящем этапе.
Электронные коллекции физико-химических свойств органических соединений, объединенные в системе [5], позволяют ставить и решать задачи извлечения новых знаний о свойствах этих соединений. Технология интеллектуальных программных агентов позволяет поэтапно расширять возможности разработанной системы. Анализ выборок из этих баз данных позволяет искать зависимости в данных и предсказывать новые значения физико-химических свойств органических соединений, таких как реакционная способность, прочность связи, энтальпия образования радикала.
Агентами принято называть программы, обладающие свойствами автономности, реактивности и обладающие социальным поведением в многоагентных средах [10]. Разрабатываемые нами агенты относятся к типу «Агенты по анализу и извлечению данных» [9].
Для извлечения новых знаний о физико-химических свойствах органических молекул используются три экспертные системы: для оценки энергии диссоциации связей органических молекул по кинетическим данным бимолекулярных радикальных реакций, оценке реакционной способности органических молекул в бимолекулярных радикальных реакциях по термохимическим данным, оценке энтальпии образования свободных радикалов по кинетическим данным. Все системы используют общее хранилище знаний.
На Рис. 2. схематически показана многоагентная программная архитектура встроенных в портал экспертных систем. На приведенной схеме программные агенты функционируют в рамках простой модели «Запрос-Ответ-Соглашение». После получения входных данных производится опрос резидентных агентов. На основе полученных ответов принимается решение, какому агенту поручить выполнение предусмотренных в экспертной системе действий. После опроса агентов формируется матрица ответов, на основе анализа которой принимается решение о том, какому агенту отдать решение задачи. При некоторых условиях решение задачи может быть отдано двум агентам.
Рисунок 2. Многоагентная программная архитектура встроенной экспертной системы.
Интеллектуальные программные агенты разрабатываются либо как самостоятельные компоненты системы, либо как компоненты, которые взаимодействуют с ранее упомянутыми экспертными системами.
Программные интеллектуальные агенты, реализующие искусственные нейронные сети для предсказания реакционной способности молекул в радикальных реакциях, обученные по экспериментальным выборкам, работают как самостоятельно, так и во взаимодействии с экспертной системой оценки реакционной способности [6]. Программные интеллектуальные агенты, реализующие искусственные нейронные сети для предсказания энергии диссоциации связей органических молекул, обученные по экспериментальным выборкам, работают автономно [3]. Программные интеллектуальные агенты, реализующие алгоритмы кластерного анализа, работают автономно [7].
Программные интеллектуальные агенты, идентифицирующие зависимости в данных нечеткими базами знаний, работают автономно. Рассмотрим основы построения интеллектуального программного агента, идентифицирующего зависимости в данных. Методикам идентификации нелинейных, в том числе и эмпирических, зависимостей нечеткими базами знаний посвящено достаточно много работ, обстоятельный обзор которых можно найти в монографии [4].
Приведем пример разработки нечеткой базы знаний для идентификации эмпирической зависимости энергии активации реакций фенил радикалов (C6Hº5, 4-CH3- C6Hº5, 4-Br-C6Hº5, 4-Cl-C6Hº5 и т. д.) с углеводородами в жидкой фазе для предсказания последней.
Для определения пространства параметров идентификации (входных данных) энергии активации радикальной реакции Eэкс в настоящей работе используется модель пересекающихся термов Морзе, которая определяется корреляционным соотношением [1]:
(1)
Параметры, входящие в формулу (1) имеют следующий смысл [Д3]:
1) DHe = Di - Df + 0,5 (hLni - hLnf) – энтальпия реакции, включающая разницу энергий нулевых колебаний рвущейся и образующейся связей. Здесь h – постоянная Планка, L – число Авогадро, ni – частота колебания молекулы вдоль разрываемой связи, nf – частота колебания молекулы вдоль образующейся связи, Di – энергия диссоциации разрываемой связи, Dei = Di + 0,5hLni, Df – энергия диссоциации образующейся связи, Def = Df + 0,5hLnf.
2) Ee = Eэкс – 0.5(hLυi – RT) – классический потенциальный барьер активации, который включает в себя энергию нулевого колебания рвущейся связи, R – газовая постоянная, T – температура в К.
3) Параметры b = p(2mi)1/2ni и bf = p(2mf)1/2nf описывают зависимость потенциальной энергии от амплитуды колебаний атомов вдоль рвущейся (i) и образующейся (f) валентной связи. 2b2 – силовая постоянная связи, mi – приведенная масса атомов для разрываемой связи, mf – приведенная масса атомов для образующейся связи.
4) Параметр re равен суммарному растяжению рвущейся и образующейся связей в переходном состоянии.
5) Параметр a2 – равен отношению силовых постоянных рвущейся и образующейся связей.
Предполагается, что классический потенциальный барьер активации задается нелинейным объектом (параметр a остается постоянным для всей выборки):
(2)
Для моделирование зависимости используются два качественных параметра S1 – характеристика реакционного центра углеводорода (определяемая классом соединения, рассматривается 40 классов) и S2 – характеристика растворителя (неполярный, полярный, комплексообразующий полярный, комплексообразующий неполярный). Выборка (647 реакций) получена из базы данных по константам скорости радикальных жидкофазных реакций системы. Особенностью выборки является сочетание количественных и качественных параметров в одной модели идентификации.
При построении нечеткой базы данных входные и выходная переменные в зависимости (2) рассматриваются как лингвистические переменные, заданные на соответствующих универсальных множествах. В качестве функции принадлежности элемента к нечеткому терму G выбрана:
(3)
где начальные значения параметров b и с были выбраны экспертным образом. Нечеткая база знаний задается системой логических высказываний в виде:
(4)
Где x1÷x4 – лингвистические оценки входных переменных Dei, Def, S1, S2; dj – лингвистическая оценка выходной переменной Ee, wjp – весовая матрица правил.
Для экспериментальной выборки для реакций фенил радикалов с углеводородами нечеткая база знаний была настроена с помощью генетического алгоритма [4]. В настоящий момент она включает 634 нечетких правила.
В Табл. 1 приведено сравнение значений классического потенциального барьера активации реакции фенил радикалов с углеводородами Ee, полученными с помощью нечеткой базы знаний, с вычисленными по экспериментальным значениям энергии активации Eкл_экс соответствующих реакций.
Таблица 1. Сравнение значений классического потенциального барьера активации реакции фенил радикалов с углеводородами.
Радикал |
Углеводород |
Растворитель |
Ee, кДж/моль |
Eкл_экс, кДж/моль |
C6H5º |
цикло-[CH=CHCH=CH(CH2)2] |
Неполярный с комплексом |
12,01 |
11,96 |
C6H5º |
C6H5CH(CH3)2 |
Полярный с комплексом |
21,10 |
21,06 |
C6H5º |
(CH3)2CHOH |
Полярный |
21,40 |
21,37 |
C6H5º |
(CH3)2CHOH |
Полярный |
21,46 |
21,44 |
C6H5º |
cyclo-[CH=CH(CH2)4] |
Полярный |
21,78 |
21,81 |
C6H5º |
C6H5CH2OH |
Полярный с комплексом |
21,90 |
21,86 |
4-NO2-C6H5º |
C6H5CH(CH3)2 |
Неполярный с комплексом |
24,0 |
23,98 |
C6H5º |
C6H5CH(CH3)2 |
Неполярный с комплексом |
24,0 |
23,98 |
4-Br-C6H5º |
C6H5CH(CH3)2 |
Неполярный с комплексом |
24,41 |
24,38 |
C6H5º |
C6H5CH2CH3 |
Полярный |
24,43 |
24,42 |
C6H5º |
CH3CH2OH |
Полярный с комплексом |
24,50 |
25,51 |
C6H5º |
C6H5C(CH3)2CH(O) |
Неполярный с комплексом |
25,58 |
25,55 |
Как видно из Табл. 1, наблюдается хорошее согласие между экспериментальными и полученными путем нечеткого логического вывода значениями классического потенциального барьера активации.
Выводы
Предложена облачная программно-технологическая архитектура электронного ресурса по физической химии радикальных реакций, дано описание его функционала.
Разработанная многоагентная модель среда системы [5] позволяет выполнять анализ экспериментальных данных и извлекать новые знания и по свое архитектуре (она доступна для совместной работы пользователям интернет) представляет собой вариант системы искусственного «роевого интеллекта» (Swarm Intelligence) [8].
Впервые на примере реакций фенил радикалов с углеводородами была выполнена попытка идентифицировать зависимость классического потенциального барьера активации радикальной реакции нечеткой базой знаний, построенной на основе количественных и качественных параметров.
Рецензенты:
Волохов В.М., д.ф.-м.н., зав. отделом, Институт проблем химической физики РАН, г.Черноголовка.
Психа Б.Л., д.х.н., зав. лабораторией, Институт проблем химической физики РАН, г.Черноголовка.