Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

THE SEMANTIC ANALYSIS SPATIAL NATURE RESOURCE AND THE NATURE PROTECTION INFORMATION FROM BASES OF THE SPATIAL DATA ON THE BASIS OF P RODUCTION RULES

Pavlov S.V. 1 Pavlov A.S. 1 Khristodulo O.I. 1
1 Ufa State Aviation Technical University, Ufa, Russia
1091 KB
The most important (often occurring) structural characters of spatial data are considered, which are used as a basis for a set of productional rules for formalized presentation expert’s knowledge about spatial natural resource and natural protection region data ‘s structural specifics and semantics which allows, by-turn, to organize process of intelligent selection spatial data at transfer it from databases different information systems into the common database current organizations(on Ministry of wildlife management and ecology Bashkortostan Republic example).
spatial data
production rules
database
Эффективность поддержки принятия решения по управлению природными ресурсами и охране окружающей среды во многом зависит от качества природоресурсной и природоохранной информации об объектах управления (природных ресурсах, природопользователях, состоянии окружающей среды, объектах экологического мониторинга) и их окружении (природном и антропогенном) [1, 2, 7, 8].

Процессы управления природными ресурсами и состоянием окружающей среды сопровождаются ростом числа задач, при решении которых возникает необходимость в совместной обработке большого количества природоресурсной и природоохранной пространственной информации. Поэтому для обеспечения всех категорий пользователей полной, своевременной, непротиворечивой пространственной информацией о  текущем и прогнозируемом состоянии  объектов окружающей природной среды и природных ресурсов представляется наиболее перспективным разработка и внедрение информационных систем, позволяющих автоматизировать процессы ввода, накопления, хранения, обработки и анализа природоресурсной информации [1, 6].

В Республике Башкортостан сбором, обобщением и анализом природоресурсной и природоохранной информации с целью минимизации ущерба для окружающей среды и населения занимается Министерство природопользования и экологии (Минэкологии РБ) [5]. С целью повышения эффективности и оперативности использования этой информации в министерстве создается автоматизированная система поддержки принятия решений по управлению природными ресурсами и охраной окружающей среды (далее АСППР УПР), которая включает ряд информационных систем (ИС) [4].

Практически во всех ИС министерства ведется обработка разнородной природоресурсной и природоохранной информации (пространственной и атрибутивной). При этом, согласно [3, 9, 10], пространственные данные (ПД) можно разделить на базовые, многократно используемые в каждой ИС, и специализированные, используемые для решения задач только в одной конкретной ИС. Во избежание дублирования информации, а тем более ее противоречивости, что может существенно повлиять на эффективность принятия решений по управлению природными ресурсами и охране окружающей среды, при создании АСППР УПР необходимо выявлять общую для нескольких ИС пространственную информацию и хранить ее в единой базе пространственных данных.

Обозначим i-ю информационную систему министерства - ИСi, а её базу данных БДi, где , n - общее количество ИС.

Выделим в каждой из БДi две части: БДi1 - та часть БДi, данные из которой находятся как в БДi, так и в других базах данных, БДi2 - часть БДi, использующаяся только в ИСi и не содержащаяся в других базах данных, при этом:

                                            , .     (1)

Для исключения (или минимизации) дублирования данных необходимо, чтобы общие для всех (или нескольких) БДi данные хранились в единой базе данных, которую обозначим БД0 , тогда,  

                                        , для всех .       (2)

Поскольку базы данных ИС министерства содержат как пространственные,  так и атрибутивные данные,  то представим БДi как совокупность двух частей, описывающих атрибутивную -  и пространственную -  информацию [3, 9]:

                                           .    (3)

Особенностью организации баз ПД является возможность формирования тематических информационных подсистем (слоев), структурированных в интересах неограниченного количества потребителей. Тогда, каждая  из (1) может быть представлена как совокупность тематических слоев:

                                              ,     (4)

где ,mi    - количество слоев, хранящихся в .

Под слоем Sij будем понимать совокупность однотипных пространственных объектов, относящихся к одной теме (классу объектов), в пределах некоторой территории и в единой системе координат (водные объекты, гидрологические посты наблюдения, изолинии, отметки высот, промышленные объекты и др.):

                                    , ,    (5)

где -  число объектов в слое ;

 -  однотипный пространственный объект: точечный, линейный или полигональный, представленный множеством координат:

                                                 ,       (6)

где ,  - число описывающих объект  пар координат;

 - совокупность атрибутивных характеристик каждого объекта;

 - метаданные  слоя Sij, предназначенные для поиска, оценки назначения, пригодности и возможности обработки пространственных данных:

                                               =( , ,..., , )                                       (7)

где  - тип геометрии объектов слоя (одно из трех значений: точечный, линейный, полигональный), - число объектов в слое, - класс географических объектов, представленный данным слоем, - наличие топологии  и т.д.

Поскольку в Минэкологии РБ в процессе многолетнего создания и использования ПД накоплены их значительные объемы, отличающиеся как качественными, так и количественными характеристиками, этап создания единой базы ПД представляется весьма трудоемким и нуждается в формализации и автоматизации процесса выбора пространственной информации из существующих и вновь создаваемых БД информационных систем министерства, основанного на использовании знаний экспертов о структурных особенностях ПД. Пространственную информацию, важную с точки зрения решения той или иной функциональной тематической задачи, необходимо извлечь из баз данных ИС с целью последующего переноса в единую БД министерства. При этом необходимо найти набор признаков, наиболее существенных в контексте этой процедуры. Рассмотрим продукционные правила, описывающие  наиболее важные (часто встречающиеся) структурные признаки ПД, которые могут дать представление об их семантике и должны  быть проверены экспертами в процессе анализа пространственной информации из  для последующей передачи в  [3, 9].

Группа правил установления принадлежности слоя некоторой территории (региону, району).

Данная группа правил используется для выбора слоёв, находящихся на территории некоторого региона. Если рассматриваемый слой из  не принадлежит территории, для которой формируется единая база данных, его перенос в  не является необходимым (рис. 1, в)), если, напротив, слой полностью приходится на целевую область, его нужно включить в  (рис. 1, а)). Если слой частично попадает на территорию региона (пересекает его границы), решение о переносе должен принимать эксперт (рис. 1, б)).

Обозначим множество точек, описывающих территорию некоторого региона (например, территорию Республики Башкортостан), включающее границу региона и ограниченную ею область, как:

                                      ,        (9)

где N - количество этих точек.

Если обозначить множество точек, описывающих местоположение однотипных пространственных объектов F, входящих в тематический слой S j i через

                          ,       (10)

где , t - число объектов в данном слое, bi - число пар координат, описывающих t-й объект. Таким образом, правило принадлежности i-го слоя Sji € БДi базе общих пространственных данных может быть сформулировано следующим образом:

R1,1

Если   То  Sj € БД0  ;    (11)

R1,2

Если  И    То решение о принадлежности  S j € БД0  принимает эксперт;   (12)

R1,3

Если  То  Sj  БД0   .   (13)

Данная группа правил позволяет определить, относится ли анализируемый слой из БДi, содержащий пространственную информацию, к территории региона (района) (рис. 1).

Группа правил выбора слоев. Данная группа правил, в свою очередь,  включает следующие правила: правила выбора слоев на основе классов географических объектов и  непересекающихся слоев, группу правил выбора слоев на основе  типа геометрии, группу правил выбора слоев на основе  количества объектов, наличия топологических отношений и атрибутивной информации.

Правила выбора слоев применяются только к тем слоям, которые принадлежат (относятся) к территории рассматриваемого региона (района). Каждый слой Sj, перенесенный в БД0, будем обозначать как , , где m - текущее число слоёв в БД0.

Правило выбора слоев на основе классов географических объектов. Данное правило используется для того, чтобы определить слои, не дублирующие данные о каком либо классе географических объектов. Поскольку один и тот же класс географических объектов может быть описан различными слоями, содержащимися в различных БДi, то в результате перенесения информации в единую базу данных такие слои могут дублироваться. Следовательно, в том случае, когда в единой базе данных не содержится слоя, описывающего тот же класс географических объектов, слой должен быть перенесен в БД0.

Пусть для некоторых слоев Sji и Slk, метаданные Mji и Mlk содержат записи об одинаковых классах географических объектов, то есть согласно (6) dji =dlk , тогда будем считать, что эти слои описывают один и тот же класс географических объектов.

Таким образом, можно записать продукционное правило выбора слоев на основе классов географических объектов следующим образом:

R2,1  Если  То .        (14)

Данное правило позволяет определить, дублируется ли  анализируемый слой из БДi в БД0. Если слой, описывающий данный класс географических объектов, не содержится в БД0, то он переносится в единую БД. Слои, оставшиеся в БДi, будут анализироваться с помощью следующих правил.

Правило выбора непересекающихся слоев

В источниках пространственной информации могут находиться слои, описывающие одинаковые объекты на одной и той же территории, поэтому при переносе слоев из БДi в БД0, описывающих один и тот же класс географических объектов, необходимо сравнивать области территории, на которых расположены описываемые объекты. При этом возможны два варианта:

  • слои, описывающие один и тот же класс географических объектов (например, промышленные предприятия), могут приходиться на разные области одной территории (например, Уфимский и Бирский административные районы РБ). Следовательно, если в БД0 не содержится слоя, описывающего тот же класс объектов и ту же область территории, то такой слой можно перенести в единую БД.
  • слои, описывающие один и тот же класс географических объектов, могут приходиться на совпадающие или пресекающиеся области (например, слой гидротехнических сооружений на всю территорию РБ и слой на один из административных районов на территории РБ пересекаются).

Данное правило применяется для выбора из набора слоев, описывающих пространственные объекты, находящиеся на территории целевого региона и содержащих информацию об одном и том же классе пространственных объектов, тех слоев, которые не приходятся на пересекающиеся или совпадающие области региона с уже имеющимися в .

Можно записать продукционное правило выбора слоев, не приходящихся на пересекающиеся области как:

R3,1   Если  И  , =)  То ;        (15)

Группа правил выбора слоев на основе типа геометрии

Данная группа правил используется для выбора слоёв, которые находятся на территории целевого региона, описывают одни и те же классы географических объектов и приходятся на одну и ту же область, что и некоторый слой (слои), уже находящиеся в единой базе данных.

Если любой слой из БД0, описывающий тот же класс пространственных объектов, приходящийся на одну и ту же или пресекающиеся области региона ( ), что и рассматриваемый слой, имеет отличный от него тип геометрии, его необходимо добавить в единую базу данных.  Другими словами, если в БД0 не существует слоя той же геометрии, приходящегося на ту же область региона, то данный слой добавляется в БД0.

Если слои приходятся на пресекающиеся области региона, имеют одинаковые типы геометрии, то решение о том, какой из них необходимо добавить в единую базу данных, должен принимать эксперт.

Если в БД0 существует слой, описывающий область, содержащуюся в области рассматриваемого слоя, либо, напротив, слой из БД0 включает в себя данный слой, то необходимо добавить в БД0 слой, описывающий большую область данных (рис 2, а), б), в)), то есть тот, что полностью содержит другой.

Тогда, учитывая формализованное описание слоя с учетом всех его составляющих, согласно (4) - (6), где  - тип геометрии объектов слоя (принимающий одно из трех значений: точечный, линейный, полигональный), продукционные правила данной группы можно записать как:

Если же рассматриваемый слой приходится на ту же область региона, что и слой, находящийся в БД0, то к нему применяется группа правил выбора слоев на основе  количества объектов, топологических отношений и атрибутивной информации.

Группа правил выбора слоев на основе  количества объектов, наличия топологических отношений и атрибутивной информации.

Эта группа правил используется для выбора слоёв из находящихся на территории целевого региона, если в БД0 существуют слои, описывающие те же классы географических объектов, приходящиеся на одну и ту же область региона ( ) и имеющие одинаковые типы геометрии.

Если области расположения таких слоев полностью совпадают, но число объектов в них не равное или в каком-либо слое присутствуют топологические отношения, то решение о выборе слоя должен принимать эксперт (рис 3, а),б)).

Если слои, приходящиеся на одну и ту же территорию, содержат одинаковое число объектов, имеют одинаковые типы геометрии,  они могут отличаться атрибутивными данными, поэтому решение,  какой слой может быть перенесен в единую базу данных, принимается экспертом (рис. 4). Если же такие слои содержат одинаковые атрибутивные данные, один из них не должен быть добавлен в , поскольку дублирует информацию.

Тогда, учитывая формализованное описание слоя с учетом всех его составляющих, согласно (4) - (6) , где gji - число объектов в слое, z ji - наличие топологии,  - атрибутивные характеристики, продукционные правила данной группы можно записать как:

 

То решение о выборе слоя из Sk0 и Sji принимает эксперт; (22)                                               

Примеры применения данной группы правил показаны на рисунках 3 и 4.

Рассмотренные в статье продукционные правила для формализованного представления знаний экспертов о структурных особенностях и семантике пространственной природоресурсной и природоохранной информации региона позволяют организовать процесс интеллектуального выбора пространственной информации при переносе ее из баз данных различных информационных систем в единую базу данных Минэкологии РБ, что позволит обеспечить ее актуальность.

Заключение

Для современных систем обработки природоресурсной и природоохранной информации характерна тенденция комплексного использования разнородной информации, и как следствие, повышение требований к интегрируемости используемых ИС. Поскольку в большинстве предприятий и организаций, в частности, в Минэкологии РБ, в процессе многолетнего создания и использования ПД  накоплены их значительные объемы, отличающиеся как качественными, так и количественными характеристиками, этап создания единой базы ПД представляется весьма трудоемким и нуждается в формализации и автоматизации процесса выбора пространственной информации из существующих и вновь создаваемых БД информационных систем министерства, основанного на использовании знаний экспертов о структурных особенностях ПД. На основе семантического анализа пространственной природоресурсной и природоохранной информации сформулированы наиболее важные (часто встречающиеся) структурные признаки ПД, которые позволили сформулировать ряд продукционных правил, с помощью которых пространственную информацию, важную с точки зрения решения той или иной функциональной тематической задачи, необходимо извлечь из баз данных ИС с целью последующего переноса в единую БД.

Рецензенты:

  • Бакиров Ф.Г., д.т.н., профессор, зав. кафедрой «Авиационной теплотехники и теплоэнергетики» ФГБОУ ВПО «Уфимский государственный авиационный технический университет», г. Уфа.
  • Ямалов И.У., д.т.н., профессор, заместитель министра связи и массовых коммуникаций Республики Башкортостан, г. Уфа.

Работа получена 02.09.2011.