Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 0,931

THE GEOPHYSICAL AND SEISMOLOGICAL DATA SYSTEMATIZATION AND STORAGE USING RELATIONAL DATABASE TECHNOLOGY

Tereschenko M.V. 1 Grib N.N. 1
1 Technical Institute (branch) of North-Eastern Federal University named after M. K.Ammosov
В данной статье рассматривается необходимость организации результатов геофизических и сейсмологических наблюдений в реляционную базу данных. На основании анализа накопленных в результате исследований данных определены соответствующие требования к базе данных. Автором предложена схема базы данных в составе комплекса обработки информации и ее программная реализация. Приведен алгоритм импорта экспериментальных данных в базу данных. Рассмотрены недостатки существующего подхода к хранению информации в виде текстовых файлов и электронных таблиц Excel. Обосновано применение СУБД MySQL для решения поставленной задачи. Предложено применение математических фильтров для обработки исходных данных с целью исключения случайных выбросов и результатов системных ошибок. Формирование базы данных и применение математического аппарата для обработки экспериментальных данных позволит осуществить математическое моделирование сейсмических событий по геофизическим предвестникам.
This article discusses the necessity of organizing the geophysical and seismological observations results in a relational database. The article identifies the relevant requirements to the database based on the analysis of accumulated research data. The author proposed database schema as part of the information processing complex and its software implementation. The article describes an algorithm for experimental data import into the database. It is concluded that the existing approach to storing information in text files and Excel spreadsheets has some significant drawbacks. The author justified the MySQL using to solve the problem. It is proposed to apply mathematical filters to process the source data to prevent accidental emissions and system errors effects. The database creation and mathematical apparatus application will allow the seismic events mathematical modeling using geophysical forerunner.
seismic events prediction
geophysical forerunner
seismic data
geophysical data
earthquakes
database
mathematical model

Среди природных катастроф землетрясения занимают одно из первых мест по наносимому экономическому, экологическому и социальному ущербу. В настоящее время задача определения ключевых параметров возможных сильных землетрясений занимает центральное место при сейсмологических исследованиях. При этом очевидно, что для ее решения необходимо проведение детальных комплексных наблюдений, как за сейсмическими процессами, так и геофизическими полями. Необходимо установить закономерности их динамики во времени и пространстве, аномальное поведение в период подготовки землетрясения в зонах с высокой сейсмической активностью.

Учитывая сложность процесса, недоступность для непосредственного изучения объекта исследования, наличие помехообразующих факторов и ограниченную во времени и объеме достоверную базу данных о сейсмических событиях, прогноз землетрясений носит вероятностный характер. И, таким образом, документирование землетрясений играет значимую роль в научных исследованиях, связанных с прогнозированием сейсмических событий.

Детальные геофизические и сейсмотектонические исследования, в результате которых выделены потенциально опасные сейсмогенерирующие зоны и блоки [3, 6], свидетельствуют о необходимости изучения сейсмической активности Южной Якутии, параметров регистрируемых землетрясений для последующей оценки, районирования и прогнозирования сейсмической опасности региона.

В настоящее время в г. Нерюнгри на базе Технического института (ф) СВФУ функционирует лаборатория мониторинга и прогноза сейсмических событий, оснащенная цифровой сейсмологической станцией, а также комплексом геофизической аппаратуры нового поколения. Сейсмостанция регистрирует все сейсмические события в реальном режиме времени, а комплекс геофизического оборудования – изменения геофизических параметров, связанных с геодинамическими процессами в земной коре.

Для построения математической модели сейсмологических событий необходимо выявить закономерности в статистике эмпирических сейсмологических и геофизических данных, отражающих изменение сейсмического режима региона. При этом предполагается наличие детальной информации о значениях и состояниях, которые принимали те либо иные характеристики изучаемого явления, объекта. Отсутствие данных за определенный период может стать причиной снижения статистической значимости полученных результатов.

Таким образом, качество модели и точность оценки параметров прогнозируемых сейсмических событий зависит как от методов и средств регистрации сейсмических событий, так и от качества информации, хранимой в накопленной базе данных, и методов ее первичной обработки.

Указанные обстоятельства обуславливают актуальность разработки базы данных (БД) сейсмических событий и реализации методик обработки экспериментальных геофизических данных, содержащихся в указанной БД (рис.1). Реализация указанных задач позволяет исследователю варьировать набором параметров с целью повышения адекватности модели реальным геодинамическим условиям региона и разработать математическую модель сейсмических событий на основании определенного им самостоятельно набора предвестников и характеристик сейсмического процесса.

Рис.1. База данных в составе комплекса обработки информации

Систематизация и хранение геофизической и сейсмологической информации с применением технологии реляционных баз данных позволяет обеспечить:

  • многопользовательский режим работы с экспериментальными данными;
  • удаленный режим работы с данными различных исследователей;
  • оперативную обработку информации за счет устранения избыточности информации, применения оптимальных методов обработки табличных данных, специализированного языка программирования SQL.

Проведение многолетних регулярных наблюдений за вариациями геофизических полей (гравиметрические и магнитометрические наблюдения, электромагнитные, барометрические, температурные) определило необходимость изменения подхода к организации хранения экспериментальных данных.

Применение текстовых файлов на раннем этапе позволило неким образом сгруппировать исходную информацию, обеспечить универсальность доступа и устойчивость данных. Вместе с тем данный формат обладает низкой энтропией при неэффективных способах доступа к информации и ее обработке [7].

Переход от хранения в файлах текстового формата к использованию электронных таблиц Excel (рис. 2) позволил представить информацию более наглядно, но проблема работы со значительными выборками данных, тем не менее, осталась не решенной. Это связано с:

  • дублированием информации в пределах как одного, так и разных файлах;
  • ограничением наглядности представления информации;
  • ограничением возможностей многопользовательского доступа;
  • скоростью обработки информации;
  • отсутствием контроля применения единого формата при обозначении параметров и способов их представления. Например, как и в случае txt файлов время регистрации может быть представлено и в кратком формате даты-время, и в любом другом виде;
  • ограниченным объемом файла электронной таблицы в более ранних версиях.

Рис_Файл_Каталог2002 испр.jpg

Рис. 2. Пример организации каталога сейсмологических событий в формате Excel

Помимо этого, отметим необходимость обеспечения совместимости информации, представленной в файлах более ранних версий. Зачастую это вызывает ошибки, системные вопросы при открытии и сохранении файлов, а значит, и снижение быстродействия. А также необходимость ручного контроля соответствия полей в разных файлах, типов данных и наименований информационных файлов.

Анализ накопленной информации, а также технических характеристик применяемого в исследованиях оборудования позволил сформулировать требования к организации хранения экспериментальных геофизических и сейсмологических данных:

  • соблюдение требований теории реляционных баз данных;
  • устранение дублирования информации;
  • возможность корректировки экспертным методом хранимой информации;
  • обеспечение необходимой точности хранения информации;
  • гарантия сохранности информации в течение длительного времени;
  • масштабируемость и переносимость на другие платформы;
  • расширяемость, универсальный доступ с использованием специализированного широко распространенного стандартизированного языка доступа к данным SQL.

Импорт ретроспективных данных (рис.3) и оперативной информации в реляционную базу данных, спроектированную с применением правил нормализации, позволяет получить оптимальную структуру для хранения данных, а также возможность организации их графической интерпретации и оперативной обработки.

БлокСхема.jpg

Рис. 3. Блок-схема обработки экспериментальных данных

Применение языка SQL обеспечивает минимизацию времени обработки пользовательских запросов, что с учетом объема накопленной информации дает значительную экономию временных ресурсов.

База данных (рис. 4) реализована в системе управления базами данных MySQL (СУБД). Соответствующий выбор определен тем фактом, что указанная СУБД предоставляет полноценные возможности организации хранения значительных объемов данных, многопользовательский доступ к информации, обеспечивает взаимодействие с различными WEB-серверами, свободна к распространению для использования в образовательных и научных целях и характеризуется оптимальным быстродействием [1].

СхемаБД.jpg

Рис. 4. Фрагмент схемы базы данных SeismicEvents

Предлагаемая структура обеспечивает хранение необходимых регистрируемых параметров сейсмических событий с заданной точностью, целостность данных и отсутствие дублирования информации.

Отметим, что при формировании базы данных на основании проводимого сейсмического и геофизического мониторинга получаемая последовательность значений может содержать как систематические, случайные ошибки, так и выбросы [4]. Выбросы могут быть вызваны влиянием внешних источников: статический разряд, неисправность регистрирующей аппаратуры, перепады напряжения и т.п. Перед обработкой данных такие значения необходимо устранить, поскольку иначе это приводит к некорректному описанию данных одной функцией распределения, искажению результатов статистического анализа [5].

Применение математических фильтров, усреднения экспериментальных данных с определенным шагом на временном интервале позволяет исключить значения, относящиеся к случайным выбросам, системным ошибкам; а также установить тренды в хранимых временных рядах. Вместе с тем нельзя исключать факт значимости каждого отдельного зафиксированного значения в выявлении и формулировке зависимости параметров сейсмических событий. На основании этого в описываемой базе данных обеспечено сохранение данных значений для последующей оценки после накопления более значительного массива информации (рис.5).

Импорт_в_БД.jpg

Рис.5. Форма импорта исходных данных модуля SeismicAnalysis

Формирование указанной базы данных направлено на создание условий для автоматического выявление аномалий, предваряющих сейсмические события, или надежных предвестников [2], с целью последующего моделирования сейсмических событий.

Рецензенты:

Имаев В.С., д.г.-м.н., профессор, гл. научный сотрудник Института земной коры СО РАН, г. Иркутск;

Трофименко С.В., д.г.-м.н., профессор, ведущий научный сотрудник лаборатории сейсмологии и сейсмотектоники ФГБУН Институт тектоники и геофизики им. А.Ю. Косыгина Дальневосточного отделения Российской академии наук, г. Хабаровск.