Информация играет важную роль в современном обществе. Проблема совершенствования и развития информационных технологий — общая для практически всех областей человеческой деятельности. Создание и организация баз данных, электронных хранилищ, информационных систем являются значимой потребностью.
В последнее время широкое распространение получили автоматизированные информационные системы, предназначенные для регистрации, хранения и обработки данных. В большинстве случаев такие информационные системы разрабатываются как базы данных.
Количественное увеличение объёмов данных во всех областях науки и промышленности является следствием стремительного роста потока информации в современном обществе. Не составляют исключения и геолого-геофизические данные. Значительную роль в них играет обработка большого объёма разнородной геолого-геофизической и промысловой информации, на основании анализа которой решаются задачи моделирования.
В данной статье описаны подходы и проблемы, связанные как с обработкой имеющейся геолого-геофизической информации, так и с разработкой системы управления базами данных. Основное внимание уделено проблемам подготовки данных на первоначальном этапе работ.
Экспериментальной базой послужили данные Научно-исследовательской лаборатории «Мониторинга и прогноза сейсмических событий» (НИЛ МиПСС) на базе Технического института (филиала) Северо-Восточного федерального университета им. М.К.Аммосова в г.Нерюнгри (ТИ (ф) СВФУ)[3].
В качестве геофизических параметров рассматривались магниторазведка, давление, сейсмические события, температура и показания гравиметра.
При изучении геофизических полей используются огромные массивы данных. Изучение геофизических полей дает возможность решать следующие задачи: прогноз землетрясений, выбор метода и стратегии поиска месторождений полезных ископаемых и т.д. Обработка геолого-геофизических данных является важным этапом анализа экспериментальных данных. В процессе геофизических исследований обычно собирается огромное количество разнородной информации, которая может быть представлена в виде текста, графиков, таблиц, карт и т.д. По этой причине становится очень актуальным применение баз данных для систематизации, упорядочивания, хранения и анализа большого объема геофизической информации. Прежде чем приступить к фактической разработке базы данных необходимо полностью верифицировать исходные данные[1].
На первоначальном этапе разработки базы данных необходимо проверить исходные данные. При работе с геофизической информацией необходимо определить основные этапы работ(рис.1).
Рис.1. Основные этапы работы с геофизической информацией
Цель работы состоит в накоплении, систематизации данных для дальнейших исследований и представлении сведений, необходимых для осуществления исследований, принятия решений. Проектирование и заполнение базы данных для НИЛМ и ПСС позволит систематизировать имеющуюся геолого-геофизическую информацию и на основании имеющихся данных выявить наличие взаимосвязей между исследуемыми параметрами [4].
Этап сбора информации включает в себя как сбор уже имеющейся, так и создание новой, дополнительной информации. На этом этапе важно определить основные параметры нужной информации: ограничить тематику и степень детализации, а также глубину проработки выбранной темы в соответствии с целью работы.
Систематизация и обработка данных — важный этап информационной работы. Он предполагает организацию данных в виде, удобном для работы, хранения и последующего обращения к ней.
На практике, обычно, малое время уделяется подготовке и обработке данных, в то время как подготовка является важным шагом для работоспособности автоматизированных информационных систем. Неправильная подготовка данных может сделать анализ сложным и невозможным. В том случае, когда приходится работать с огромными массивами данных, подготовка данных становится самостоятельной задачей, которая может занимать значительную часть времени и усилий, затраченных на разработку базы данных.
Для удобства процесс проверки и подготовки данных разделим на фазы[2]:
-
Разбиение огромного массива данных на части;
-
Проверка данных. Цель данной фазы – поиск ошибок в исходных данных. При анализе данных была выявлена основная проблема – наличие огромного количества пропусков в данных;
-
Обработка данных. На этом этапе проводятся исправления и корректировки, найденных ошибок на предыдущем этапе. Для примера рассматривались таблицы «Показания гравиметра» и «Магниторазведка». При этом было уменьшено количество исходных данных, были удалены выбросы (рис.2) и исправлены ошибки, которые возникли в результате человеческого фактора (рис.3). В большинстве случаев ошибки, допущенные по вине оператора ПК, возникают по оплошности, из-за недосмотра и слепого ввода данных (вместо клавиши «6» вводят «9» или «3», вместо клавиши «4» - клавиши «7» и «1»).
Рис.2.Магниторазведка. Выбросы в исходных данных
Рис.3.Показания гравиметра. Ошибки из-за слепого ввода данных
Рис.4.Показания гравиметра. Исправленные ошибки
Аналогичные действия произведены с таблицами «Магниторазведка», «Давление», «Сейсмические события», «Температура», «МГР».
Современные информационные системы, в которых человек или группа людей взаимодействуют с техническими устройствами в процессе обработки информации, рассматриваются как человеко-машинная система. В таких системах и человек, и компьютер рассматриваются как неотъемлемые составляющие всей системы. Любая составляющая такой системы является уязвимой, в силу зависимости от разнородных факторов. Человеко-машинная система – не автоматизированная система, поэтому одним из решающих факторов, влияющих на работу системы, является, непредсказуемый человеческий фактор.
Человеческий фактор влияет на достоверность, своевременность и полноту обрабатываемой информации. При длительном монотонном вводе данных, в процессе утомления человек начинает делать ошибки при вводе, пропускать данные, переставлять их местами.
Задача интерпретации — это установить смысл, значение собранной информации. Содержанием интерпретации может быть, в частности, обобщение информации — установление закономерностей на основе собранных фактов, выявление причинно-следственных связей между явлениями.
Рис.5. Модель базы данных
На основании исходных данных, была разработана модель для базы данных (рис.5), которая включает в себя следующие блоки: Исходные данные, верификация исходных данных, проверка форматов данных и подготовка таблиц, заполнение базы данных, выявление наличия взаимосвязей между исследуемыми параметрами.
Начальным этапом в создании базы данных были выполнены проверка данных, с целью поиска ошибок в исходных данных, и обработка данных для исправления и корректировки найденных ошибок. Было выявлено, что большинство выявленных ошибок возникли в результате человеческого фактора.
Созданная база данных обеспечивает быстрый и удобный доступ пользователя к информации о геофизических параметрах. Данное приложение позволит пользователю систематизировать имеющуюся геолого-геофизическую информацию и на основании имеющихся данных выявить наличие взаимосвязей между исследуемыми параметрами.
Рецензенты:
Гриб Н.Н., д.т.н., профессор, заместитель директора по научно-исследовательской работе, ТИ (ф) ФГАОУ ВПО «СВФУ», г. Нерюнгри.
Трофименко С.В., д.г.-м.н., профессор, профессор кафедры Математики и информатики, ТИ (ф) ФГАОУ ВПО «СВФУ», г. Нерюнгри.
Библиографическая ссылка
Туманова К.С. СОЗДАНИЕ БАЗЫ ДАННЫХ СЕЙСМИЧЕСКОЙ И ГЕОФИЗИЧЕСКОЙ ИНФОРМАЦИИ НА ПРИМЕРЕ ЮЖНО-ЯКУТСКОГО РЕГИОНА // Современные проблемы науки и образования. – 2014. – № 6. ;URL: https://science-education.ru/ru/article/view?id=17060 (дата обращения: 19.02.2025).