Сетевое издание
Современные проблемы науки и образования
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 0,940

ТЕОРЕМА БАЙЕСА В КОГНИТИВНОЙ СЕМАНТИКЕ ОБРАЗОВАТЕЛЬНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ

Болбаков Р.Г. 1
1 Московский государственный технический университет радиотехники, элетроники и автоматики
В работе рассматривается раскрытие таких понятий как “когнитивность” и “семантика”, а также их соединение в направлении информационных образовательных системах. В статье впервые делается попытка объединить смысловую оценку сетевого отклика, его семантику с оценкой самого акта познания и приращения знаний (негэнтропии знания) в одном понятии – когнитивная семантика. Формализацию этого нового понятия автор предлагает выполнить с привлечением вероятностной теории Байеса (Bayes). Предметом исследования когнитивной семантики образовательной информации автором выбрана модель информационного поля портально-сетевого консорциума, находящегося в распоряжении объекта обучения. На основе теории Байеса производится моделирование когнитивной семантики сетевого микропортального консорциума. В качестве примера приводится решение задачи определения когнитивности ресурса трех вертикальных образовательных порталов. Основные существенные результаты заключаются в получении детерминированного метода прогнозирования когнитивной образовательной информации в консорциуме на основе теоремы Байеса как регулятора когнитивной семантики в информационном образовательном поле для сбора и ведения статистики когнитивной семантики.
семантика
пертинентность
релевантность
когнитивность
когнитивная семантика
1. Болбаков Р. Г. Математическое описание когнитив-энтропии макромедиа образовательных систем. Динамика неоднородных систем / Под ред. Ю. С. Попкова. Вып. 14. - М.: ЛЕНАНД, 2010. - С. 252-260. (Труды Института системного анализа РАН; Т. 53 (2)). Регистрационный номер ПИ № 77-14194. ISBN 978-5-397-00676-7.
2. Казаков И. А., Манцивода А. В. Базы данных как онтологии // Известия Иркутского государственного университета. Серия: Математика. - 2011. - Т. 4. № 1. - С. 20-30.
3. Куракин Д. В., Шемончук Д. С. Расширение использования мультимедиа технологий в сфере образования // Информатизация образования и науки. - 2009. - № 4. - С. 43-50.
4. Лийв Э. Х. Инфодинамика. Обобщённая энтропия и негэнтропия. - Таллинн, 1998. - 200 с. Библ. 131 ед.
5. Малых А. А., Манцивода А. В. Онтологии, метаданные и семантическое программирование // Вестник Новосибирского государственного университета. Серия: Математика, механика, информатика. - 2007. - Т. 7. - № 2. - С. 29-51.
6. Хренников А. Ю. Формула полной вероятности с интерференционным членом и представление колмогоровской модели в гильбертовом пространстве // Теория вероятностей и ее применения. - 2006. - Т. 51. № 3. - С. 518-536.
7. Эддоус М., Стенсфилд Р. Методы принятия решений / Пер. с англ., под ред. член-корр. РАН И.И. Елисеевой. - М.: Аудит, ЮНИТИ, 1997. - С. 22-26.
8. Bayes, Thomas, and Price, Richard, An Essay towards solving a problem in the Doctrine of Chance. By the late Rev. Mr. Bayes, communicated by Mr. Price, in a letter to John Canton, M. A. and F.R.S.] // Philosophical Transactions of the Royal Society of London 53. - 1763. - Р. 370-418.
9. Berners-Lee T., Hendler J., Lassila O. The Semantic Web: Overview / Semantic Web // The Scientific American. - 2008. - № 5. - Р. 32-45.
10. Kolmogoroff A. N., Grundbegriffe der Wahrscheinlichkeitsrechnung, Springer-Verlag, Berlin, 1933, 62 pp.; Рус. перев.: Колмогоров А. Н. Основные понятия теории вероятностей. -М.: Наука, 1974. - 119 с. MathSciNet.
В теории информационных процессов и сиcтем термин «когнитивность»  используется в широком смысле, обозначая меру достижения познания или, что тоже самое, приращение знания (нeгэнтропию знания) [8]. В такой постановке этот термин может быть интерпретирован в дидактическом плане как обозначающий появление и «становление» знания и концепций, связанных с этим знанием, выражающих себя как в мысли, состоянии, так и в действии. Нередко термин «когнитивность» употребляется в процессах изучения так называемого «контекстного знания», т.е. в предметных областях, где фигурируют такие понятия как знание, умение или обучение. Извлечение и применение контекстных знаний опираются на понятие семантики, являющей формализацию ключей к этим знаниям. Именно с этих позиций, а также с учётом воздействия технологических факторов автор настоящей статьи оценивает возможности моделирования и регулирования когнитивной семантики информационных процессов и систем, обслуживающих образовательную индустрию. Цель настоящей работы - показать на конкретном примере продуктивность этой парадигмы и дать её развитие до уровня наглядного модельного описания и рекомендаций.

Под термином «cемантика» понимают [2, 5, 9] интерпретацию связи содержания с формой, систему правил определения поведения отдельных языковых конструкций. Объединение понятий «когнитивность» и «семантика» позволяет не только формализовать субъективную сторону познания, но также выработать оценку семантической конструкции, в том числе по принципу полноты и «удобства» её восприятия конкретным субъектом. Отсюда возникает обобщённое обновляющее понятие «когнитивная семантика». Когнитивная семантика может служить достаточно перспективным, ёмким и унифицированным мерилом и инструментом регулирования функциональных достоинств информационных систем в образовании, в том числе электронных библиотек, систем дистанционного обучения и консорциумов образовательных порталов. Плодотворность этой парадигмы подтверждена на примерах многоуровневых портальных консорциумов, исследованием, созданием и сопровождением которых автор длительное время занимался в рамках соответствующих отраслевых высшей школы и московских научно-производственных образовательных программ.

В предшествующей публикации автора [1] и отчётах по соответствующим НИР и НИОКР, проведенных в МГТУ МИРЭА в период 2008-2011 гг. показано, что практический интерес в образовательных информационных технологиях представляет применение методов когнитивной семантики, для количественной оценки вероятности извлечения «когнитивного документа» из совокупного информационного ресурса сетевого портального консорциума, а также для определения вероятности, с какой этот документ может находиться в одной из  подсистем этого консорциума. Здесь термин «когнитивная семантика» трактуется и применяется в уточнённом дидактическом смысле, то есть как оценка истинности и комфортности обнаружения поиска, извлечения, полноценного раскрытия и восприятия объектом обучения откликов информационной системы на его запросы, причём откликов, содержащих истинную знаниевую информацию.

В семантических системах пертинентность ответов ИС (точное и полное соответствие содержания выданного документа сути запроса) автоматически означает его релевантность (соответствие содержания документа формулировке запроса по формальным признакам, в частности, идентификаторам мультимедиа контейнера, файла или атома в составе HTML файла). Однако не все выданные системой документы, имеющие признаки пертинентности, с позиции восприятия их конечным пользователем «дружественны», доступны быстрой оценке и реально пригодны к использованию. Иными словами нарушаются мажоритарный и эргодический принципы функционирования дидактических информационных систем, условно отнесённые выше к термину «комфортность» работы со знаниевой информацией в составе информационных образовательных консорциумов. Из совокупности пертинентных ответов системы пользователь по его собственным критериям отбирает наиболее полезную и удобную для себя  информацию как по форме, так и по содержанию, то есть наиболее мажоритарную. Таким образом, когнитивную семантику конкретного документа, другими словами, его когнитивность, в реальной образовательной практике представляется возможным определить не только по соответствию выданного документа формализованному на уровне соблюдения релевантности запросу, но  также с учётом  компетентностных и психо-эмоциональных особенностей пользователя. Формализацию этого нового понятия предлагается выполнить с привлечением хорошо развитого математического аппарата описания обширного разнообразия энтропийных оценок информационного морфизма, т.е. функционала взаимодействия, информационных систем между собой и с конечным пользователем [1]. При этом опора делается на широко известный авторитетный подход на основе вероятностной теории Байеса - Колмогорова [6-8, 10].

В качестве типового примера рассмотрим задачу моделирования когнитивной семантики, базируясь на априорном знании когнитивности образовательной информации в информационном ресурсе портально-сетевого консорциума, включающего на аддитивной основе три образовательных микропортала [1]. Полный ресурс консорциума в эксперименте составляет 10000 элементарных семантических единиц (ЭСЕ), отобранных случайным образом из образовательного портала, включая до 10 % системной и сопутствующей информации, которая не учитывается в решении задачи. При этом первый из микропорталов содержит 25 % совокупного информационного ресурса, второй - 35 %, третий - 40 %. При этом методом экспертных оценок в практических упражнениях преподавателем определена потенциальная когнитивность ЭСЭ для каждого из микропорталов, соответственно 5, 4 и 2 %. (заметим, что в многократных опытах подобного рода образующиеся численные значения были схожими с приведёнными выше). Доступ к образовательным ресурсам микропорталов осуществляется последовательным запросом каждого из ЭСЕ без повторения. Отметим также, что сбор статистики запросов к микропорталам или другим образовательным ИС в реальных образовательных условиях осуществляется за определенный отрезок времени, будь то день, неделя, месяц или год, абстрагируясь от чего в ходе моделирования, запросы к микропорталам задаются последовательно и не зависят от времени. Сведения о ресурсах, участвующих в эксперименте микропорталов, сведены в таблицу 1.

Таблица 1. Распределение ЭСЕ в микропорталах сетевого консорциума

Микропорталы

ЭСЕ

Кол-во ЭСЕ микропорталов

Когнитивность/ЭСЕ

1

25 %

2500

5 % / 12,5

2

35 %

3500

4 % / 14

3

40 %

4000

2 % / 8

Далее, задачу определения вероятности получения отклика ИС в виде когнитивного файла (ЭСЕ) будем решать по формуле полной вероятности [1, 2].

Если событие А наступает лишь при появлении одного из несовместных событий (далее гипотез) , то вероятность события А вычисляется по формуле полной вероятности:

, (2)

 где   -  вероятность гипотезы ,

А - событие, которое появляется после появления событий . В нашем случае  А - получение дефектного (некогнитивного) файла из числа образовательных ЭСЕ ( ), с выявлением вероятности поддерживания одним из трех микропорталов ( ) портального-сетевого консорциума;

 , - условная вероятность события при выполнении гипотезы  ( ).

Представим формулу полной вероятности графом с выделенной вершиной А:

Рис. 1. Граф полной вероятности

Полная вероятность события А равна весу всего вероятностного графа с гипотезами.

Теперь рассмотрим ресурс образовательного консорциума с позиции теории Байеса [8].

Если до опыта вероятности гипотез были , , ..., , а в результате опыта появилось событие А, то с учетом этого события «новые», т.е. условные вероятности гипотез вычисляются по:

, (3)

где  и   (4)

Включая описываемый здесь фрагмент в регулирование когнитивности образовательных порталов, автор исходит из того, что в общепринятом представлении теорема Байеса (формула Байеса) [7, 8] дает возможность «пересмотреть» вероятность гипотез с учетом наблюдавшегося результата опыта. Условная вероятность  может находиться как отношение веса ветви, проходящей через вершину, соответствующую гипотезе , к весу всего вероятностного графа.

В объявленную выше постановку определения вероятности получения отклика ИС в виде когнитивного файла (ЭСЕ) могут быть добавлены две дополнительные развивающие задачи:

  • Оценить вероятность того, что случайно вызванная ЭСЕ когнитивна.
  • Определить, какому микропорталу принадлежит случайно выбранный из консорциума элемент,  оказавшийся некогнитивным.

Ниже приводятся следующее возможное решение этих задач.

Пусть рассматривается событие А = {выбрать дефектный файл}. Сформулируем  три возникающие в процессе рассмотрения гипотезы:

={файл поддерживается первым микропорталом},  =0,25 (25 % - 2500 ЭСЕ), = 0,05 (5 % ЭСЕ первого микропортала);

={файл поддерживается вторым микропорталом},  =0,35 (35% - 3500 ЭСЕ), = 0,04 (4 % ЭСЕ второго микропортала);

={файл поддерживается третьим микропорталом}, =0,4 (40% - 4000 ЭСЕ), = 0,02 (2 % ЭСЕ третьего микропортала).

Рис. 2. Граф выдвигаемых гипотез

 (5)

Если полная вероятность равна , то каждая случайно вызванная ЭСЕ будет когнитивна для всех 9000 образовательных ЭСЕ консорциума. В нашем случае , т.е. с вероятностью 0,0345 ЭСЕ консорциума окажется когнитивным, тогда  примерно 34 ЭСЕ из всего ресурса образовательного портально-сетевого консорциума могут оказаться когнитивными.

 (6)

Результаты расчетов (5) и (6) показывают, что примерно каждая 345 ЭСЕ может быть когнитивна при  и, с большей вероятностью, будет принадлежать второму микропорталу, равному 0,41, поскольку > > . Приведенная процедура расчета вероятности когнитивности извлекаемого ЭСЕ может оказаться применимой в расчетах вероятности получения пертинентных откликов конкретной образовательной ИС. Процедура успешно и без единого сбоя применялась автором в течение четырёх лет в процессе создания и сопровождения упоминавшихся выше многоуровневых образовательных консорциумов. Данная процедура может быть полезна при практическом определении когнитивности ресурса образовательных информационных систем в обычных и дистанционных формах обучения.       

Рецензенты:

  • Раев Вячеслав Константинович, доктор технических наук, профессор кафедры ТИССУ ФГБОУ ВПО МГТУ МИРЭА, г. Москва.
  • Петров Андрей Борисович, доктор технических наук, профессор, декан факультета «Информационные технологии» ФГБОУ ВПО МГТУ МИРЭА, г. Москва.

Библиографическая ссылка

Болбаков Р.Г. ТЕОРЕМА БАЙЕСА В КОГНИТИВНОЙ СЕМАНТИКЕ ОБРАЗОВАТЕЛЬНЫХ ИНФОРМАЦИОННЫХ СИСТЕМ // Современные проблемы науки и образования. – 2012. – № 5. ;
URL: https://science-education.ru/ru/article/view?id=7074 (дата обращения: 27.09.2021).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1.074