Сетевое издание
Современные проблемы науки и образования
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

К ВОПРОСУ О СИСТЕМАТИЗАЦИИ ДАННЫХ В АВИАЦИОННОЙ И КОСМИЧЕСКОЙ МЕДИЦИНЕ

Артамонов А.А. 1
1 Федеральное государственное бюджетное учреждение науки Государственный научный центр Российской Федерации Институт медико-биологических проблем Российской академии наук
Целью исследования является обзор методов систематизации данных с целью выработать общий подход, который позволил бы оптимизировать сбор и анализ данных, полученных в авиакосмической медицине и биологии. Для поиска научной литературы использовалась поисковая система Google Scholar. Глубина поиска составила 5 лет. Языки поиска: русский; английский. В обзоре проведен анализ областей знаний, где активно используются базы данных. На основе этого анализа представлены современные требования, предъявляемые к базам данных. Рассмотрены основные подходы и методы структурирования баз данных. Проведен анализ методов систематизации и обработки информации. Был сделан вывод, что качественные базы данных позволяют использовать различные инструменты анализа данных и получать важные результаты и ценность баз данных со временем и их объемом только возрастает. Однако необходимо заранее планировать структуру базы данных и особенности накопления этих данных, чтобы будущая база данных имела значительную ценность. Результаты проведенного анализа научной литературы были адаптированы под специфику сбора и обработки информации в авиакосмической биологии и медицине. На основе анализа требований к базам данных, предъявляемых сотрудниками, работающими в области авиакосмической биологии и медицины, были сформулированы требования и характеристики баз данных, максимально адаптированных под решения задач анализа информации. Было установлено, что наиболее подходящая форма для баз данных в авиакосмической биологии и медицине – реляционная (с двумя типами данных – категориальные и количественные данные). Структурирование и моделирование внутри баз данных возможны на основе феноменологических моделей, поскольку эти модели включают в себя все возможные формы взаимосвязей. Работа выполнена в рамках темы FMFR-2024-0042 программы фундаментальных научных исследований РАН.
база данных
систематизация
структурирование
анализ данных
авиакосмическая биология и медицина
1. Кулакова Е.Н., Настаушева Т.Л., Кондратьева И.В. Систематическое обзорное исследование литературы по методологии scoping review: история, теория и практика // Вопросы современной педиатрии. 2021. Т. 20. №. 3. С. 210-222. DOI: 10.15690/vsp.v20i3/2271.
2. Тихонова О.В., Авачёва Т.Г., Гречушкина Н.В. Тренды развития цифровых технологий в медицине // Медицинская техника. 2022. Т. 332. №. 2. С. 43.
3. Гринёв А.В. Проблемы наукометрии и ее пригодность для управления научной деятельностью в современной России // Управленческие науки. 2024. Т. 14. №. 1. С. 117-132. DOI: 10.26794/2404-022X-2024-14-1-117-132.
4. Кужевская Е.Б., Скоробогатый А.В. Наукометрические показатели и их влияние на научную деятельность. Зарубежный опыт // Образование. Наука. Научные кадры. 2024. №. 1. С. 348-355. DOI: 10.24412/2073-3305-2024-1-348-355.
5. Наркевич А.Н., Виноградов К.А. Наиболее частые ошибки, совершаемые при проведении медицинских исследований // Экология человека. 2020. №. 7. С. 59-64. DOI: 10.33396/1728-0869-2020-7-59-64.
6. Данцигер Д.Г., Андриевский Б.П., Часовников К.В. Пятидесятилетний опыт (1970-2020 гг.) работы кафедры организации здравоохранения и общественного здоровья Новокузнецкого института усовершенствования врачей // Теория и практика современной науки. 2020. С. 124-140.
7. Заболотная Н.В., Гатилова И.Н., Заболотный А.Т. Цифровизация здравоохранения: достижения и перспективы развития // Экономика. Информатика. 2020. Т. 47. №. 2. С. 380-389. DOI 10.18413/2687-0932-2020-47-2-380-389.
8. Урманцева Н.Р., Курамшина А.В. Система поддержки принятия решений в медицине: подходы и методы применения во флебологии // Вестник кибернетики. 2022. №. 3 (47). С. 66-74. DOI: 10.34822/1999-7604-2022-3-66-74.
9. Кривогузова М.В., Меньшенин Б.С., Копылов А.В. Прогнозирование заболеваемости населения регионов РФ // Стратегия и тактика управления предприятием в переходной экономике. 2023. С. 230-233.
10. Белобородов В.А., Воробьёв В.А., Семинский И.Ж. Порядок выполнения систематического обзора и мета-анализа по протоколу PRISMA // Система менеджмента качества: опыт и перспективы. 2023. № 12. С. 5-9.
11. Атаева О.М., Серебряков В.А., Тучкова Н.П. Модель поиска схожих документов в семантической библиотеке // Научный сервис в сети Интернет. 2021. Т. 23. С. 54-64. DOI: 10.20948/abrau-2021-24.
12. Болтанова Е.С., Имекова М.П. Виды биологических баз данных (биобанков) // Вестник Томского государственного университета. Право. 2021. №. 41. С. 136-148. DOI: 10.17223/22253513/41/12.
13. Коломейцев В.В., Горин С.Л. База данных по океанографии восточной части Охотского моря // Известия ТИНРО. 2023. Т. 203, №1. С. 200–213. DOI: 10.26428/1606-9919-2023-203-200-213.
14. Тужилова-Орданская Е.М., Ахтямова Е.В. Проблемы гражданско-правового регулирования в сфере защиты прав гражданина в Российской Федерации при использовании генетической информации // Вестник Пермского университета. Юридические науки. 2021. №. 52. С. 263-284. DOI: 10.17072/1995-4190-2021-52-263-284.
15. Орлова Н.В., Суворов Г.Н., Горбунов К.С. Этика и правовое регулирование использования больших баз данных в медицине // Медицинская этика. 2022. Т. 10. №. 3. С. 4-9. DOI: 10.24075/medet.2022.056.
16. Оппедизано М., Луиджиевич Д., Артюх Л.Ю. Роль медицинских информационных систем в организации системы здравоохранения // Forcipe. 2022. Т. 5. №. 4. С. 9-15.
17. Овчинникова М.А., Жиленкова Ю.И., Черныш Н.Ю. Применение Big Data в лабораторной медицине // Российский журнал персонализированной медицины. 2023. Т. 3. №. 4. С. 77-87. DOI: 10.18705/2782-3806-2023-3-4-77-87.
18. Хаджаев С.И. Цифровые технологии в медицине: преимущества и перспективы // Молодые ученые. 2023. Т. 1. №. 4. С. 10-11. DOI: 10.5281/zenodo.7969078.
19. Абдуганиева Ш.Х., Никонорова М.Л. Цифровые решения в медицине // Крымский журнал экспериментальной и клинической медицины. 2022. Т. 12. №. 2. С. 73-85. DOI: 10.29039/2224-6444-2022-12-2-73-85.
20. Иванова А.А. Применение Big Data в сфере здравоохранения: российский и зарубежный опыт // Научные записки молодых исследователей. 2020. №. 5. С. 42-53.
21. Монаков Д.М., Алтунин Д.В. Медицинские информационные системы: современные реалии и перспективы // Российский журнал телемедицины и электронного здравоохранения. 2022. Т. 8. №. 4. С. 46-53. DOI: 10.29188/2712-9217-2022-8-4-46-53.
22. Афонин А.Н., Головина Т.Б., Петров Р.В. Врачебные ошибки и проблема квалификации // Актуальные проблемы управления здоровьем населения. 2020. С. 191-196.
23. Хадарцев А.А. Методология многофакторного анализа в решении задач резервометрии в спорте высших достижений // Ученые записки Крымского федерального университета имени ВИ Вернадского. Биология. Химия. 2021. Т. 7. №. 2. С. 179-190. DOI: 10.37279/2413-1725-2021-7-2-179-190.
24. Тожимаматов И.Н. Задачи интеллектуального анализа данных // Pedagog. 2023. Т. 6. №. 4. С. 514-516. DOI: 10.5281/zenodo.783107.
25. Яхшибоева Д.Э., Эрметов Э.Я., Яхшибоев Р.Э. Развитие цифровых технологии в медицине // Journal of new century innovations. 2023. Т. 20. №. 1. С. 100-107.
26. Опанасенко В.Н., Шишкин В.А., Рыбалкин Е.П. Программное обеспечение для создания базы данных в биологических исследованиях // Бюллетень Государственного Никитского ботанического сада. 2021. №. 141. С. 114-119.
27. Кобринский Б.А. Системы искусственного интеллекта в медицинской практике: состояние и перспективы // Вестник Росздравнадзора. 2020. №. 3. С. 37-43. DOI: 10.35576/2070-7940-2020-3.
28. Мелдо А.А., Уткин Л.В., Трофимова Т.Н. Искусственный интеллект в медицине: современное состояние и основные направления развития интеллектуальной диагностики // Лучевая диагностика и терапия. 2020. Т. 11. №. 1. С. 9-17. DOI: 10.22328/2079-5343-2020-11-1-9-17.
29. Денисенко В.В. Использование искусственного интеллекта для обработки персональных данных // Международный журнал гуманитарных и естественных наук. 2020. №. 7-1. С. 110-114. DOI: 10.24411/2500-1000-2020-10858.
30. Бузова Н.В. Искусственный интеллект и использование баз данных как объектов смежных прав // Lex russica. 2020. №. 8 (165). С. 62-69. DOI: 10.17803/1729-5920.2020.165.8.062-069.
31. Расулов А.М., Тошматов Ш.М. Создание базы данных и классификация для Graphic Detection проекта искусственного нейронного сети // Central Asian Journal Of Mathematical Theory And Computer Sciences. 2023. Т. 4. №. 4. С. 15-21. DOI: 10.17605/OSF.IO/C56NX.
32. Климонтов В.В., Бериков В.Б., Сайк О.В. Искусственный интеллект в диабетологии // Сахарный диабет. 2021. Т. 24. №. 2. С. 156-166. DOI: 10.14341/DM12665.
33. Адамова Л.Е., Варламов О.О. Применение миварных технологий для внедрения в инженерном и экономическом образовании индивидуальных траекторий студентов // Известия Кабардино-Балкарского научного центра РАН. 2020. №. 1 (93). С. 18-34. DOI: 10.35330/1991-6639-2020-1-93-18-34.
34. Yuan Y., Yu J., Zhang Y. Research on Technology Trend for Civil Aviation Safety based on Patent Big Data Analysis // 2020 IEEE 2nd International Conference on Civil Aviation Safety and Information Technology, 2020. P. 987-991. DOI: 10.1109/ICCASIT50869.2020.9368640.
35. Dou X. Big data and smart aviation information management system // Cogent Business & Management. 2020. Vol. 7. №. 1. P. 1766736. DOI:10.1080/23311975.2020.1766736.
36. Čestić M.M., Sokolović V.S., Dodić M.D. Technical aspects of flight safety of military aircraft // Vojnotehnički glasnik/Military Technical Courier. 2022. Vol. 70. №. 4. P. 1017-1038. DOI: 10.5937/vojtehg70-39238.
37. Koryagina Yu.V. Analytical review and systematization of data from prospective studies related to the examination of the functional state of the cardiorespiratory system of astronauts // Contemporary issues in biomedicine. 2021. Vol. 5. №. 2.
DOI: 10.51871/2588-0500_2021_05_02_8.
38. Mendes Zambetta R. Effects of weightlessness on the cardiovascular system: a systematic review and meta-analysis // Frontiers in Physiology. 2024. Vol. 15. P. 1438089. DOI:10.3389/fphys.2024.1438089.
39. Silva I.C. Physiological Adaptations to Life in Space: An Update // Journal of Aerospace Technology and Management. 2023. Vol. 15. P. e2823. DOI:10.1590/jatm.v15.1319.
40. Charvat J.M. Long-term cardiovascular risk in astronauts: comparing NASA mission astronauts with a healthy cohort from the Cooper Center Longitudinal Study // Mayo Clinic Proceedings. Elsevier, 2022. Vol. 97. №. 7. P. 1237-1246. DOI: 10.1016/j.mayocp.2022.04.003.
41. Ji L., Zhang M. A comprehensive experimental framework based on analysis of the pilot’s EEG and NASA-TLX questionnaire in a VR environment // Proceedings of the Institution of Mechanical Engineers, Part H: Journal of Engineering in Medicine. 2023. Vol. 237. №. 7. P. 869-878. DOI: 10.1177/09544119231179842.
42. Tran K.A. Evidence supporting the management of medical conditions during long-duration spaceflight: protocol for a scoping review // JMIR Research Protocols. 2021. Vol. 10. №. 3. P. e24323. DOI: 10.2196/24323.
43. Zenchenko T.A., Breus T.K. The possible effect of space weather factors on various physiological systems of the human organism // Atmosphere. 2021. Vol. 12. №. 3. P. 346. DOI: 10.3390/atmos12030346.
44. Dolzhenko N. Unification of Training Programs for Aviation Professionals as a Flight Safety Criterion // Journal of Aerospace Technology and Management. 2024. Vol. 16. P. e0124. DOI: 10.1590/jatm.v16.1320.
45. Strollo F. Technological innovation of Continuous Glucose Monitoring (CGM) as a tool for commercial aviation pilots with insulin-treated diabetes and stakeholders/regulators: A new chance to improve the directives? // Diabetes Research and Clinical Practice. 2021. Vol. 172. P. 108638. DOI: 10.1016/j.diabres.2020.108638.
46. Overbey E. G. The Space Omics and Medical Atlas (SOMA) and international astronaut biobank // Nature. 2024. Vol. 632. №. 8027. P. 1145-1154. DOI: 0.1038/s41586-024-07639-y.
47. Scott J.P.R. The role of long-term head-down bed rest in understanding inter-individual variation in response to the spaceflight environment: a perspective review // Frontiers in Physiology. 2021. Vol. 12. Р. 614619. DOI: 10.3389/fphys.2021.614619.
48. Sönmez D. The effect of space travel on the mental health of astronauts // Hipokrat Tıp Dergisi. 2024. Vol. 4. №. 1. P. 37-40. DOI: 10.58961/hmj.1430150.
49. Faerman A., Clark J.B., Sutton J.P. Neuropsychological considerations for long-duration deep spaceflight // Frontiers in Physiology. 2023. Vol. 14. P. 1146096. DOI: 10.3389/fphys.2023.1146096.
50. Feichtinger E. Long-duration isolation experiments in preparation of interplanetary missions: Psychological support of international crews // Journal of Space Safety Engineering. 2022. Vol. 9. №. 2. P. 223-230. DOI: 10.1016/j.jsse.2022.02.006.

Введение

Особенность поисковых НИР и НИОКР заключается в том, что заранее не известно о возможных взаимосвязях и закономерностях, которые будут получены в результате выполнения НИР и НИОКР [1, 2]. По этой причине накопление данных может происходить неправильно [3, 4]. Результатом могут быть и неполный комплект данных, необходимых для описания явления, и недостаточная периодичность сбора данных, и неструктурированность базы данных (непригодность для дальнейшей обработки), и прочее [5, 6]. Помимо этого, в практике работы научных учреждений до сих пор нет реестров полученных научных результатов, нет взаимосвязи между лабораториями и научными группами [7, 8]. Такая ситуация постоянно реализуется из-за отсутствия понимания того, каким образом необходимо упорядочить данные, для каких целей собирать данные в общую базу данных [9]. Таким образом, на разных уровнях (от отдельного научного сотрудника до научных организаций) ощущается отсутствие систематизации получаемых научных результатов.

Хорошим примером проблемы систематизации данных могут служить медицинские организации, где сотрудники, как правило, не имеют опыта и знаний в области естественных наук и программирования, но при этом сталкиваются со значительным объемом медицинских данных. Медицинские данные требуют валидации и верификации, и эти данные чувствительны ко времени. Изначально неправильная структура базы данных может привести к потере важных данных, которые невозможно впоследствии восстановить (из-за смерти пациента или из-за его излечения). Ценность баз данных, содержащих медицинскую информацию, напрямую зависит от начальной структуры баз данных. Избыточные блоки базы данных (совокупность переменных) способны привести к избыточной нагрузке (по ведению базы данных) на медицинский персонал. Однако недостаток медицинской информации может сильно ограничить возможности статистического анализа. Еще более трудная ситуация складывается в авиакосмической медицине и биологии, где сочетаются сложность взаимосвязей, новизна и малый объем данных. По вполне понятным причинам ценность данных в авиакосмической медицине и биологии многократно выше, чем аналогичных данных «земной» медицины и биологии.

Цель исследования: провести обзор методов систематизации данных с целью выработать общий подход, который позволил бы оптимизировать сбор и анализ данных, полученных в авиакосмической медицине и биологии.

Материалы и методы исследования

Работа выполнена в соответствии с рекомендациями, изложенными в публикации [10]. Для поиска научной литературы использовалась поисковая система Google Scholar. Глубина поиска составила 5 лет. Языки поиска: русский; английский. Поисковый запрос: Систематизация данных в авиационной и космической медицине. Найдено 649 источников на русском и 11800 на английском языках. Отобрано к рассмотрению: 77 источников на русском языке и 361 на английском языке. Использовалось в анализе: 33 публикаций на русском языке и 17 на английском языке.

Результаты исследования и их обсуждение

Область применения баз данных

Ниже автор представил лишь незначительную часть тех областей знаний, где применяются базы данных.

Базы данных находят свое применение: в математике [11]; в биологии [12]; в географических исследованиях [13]. Базы данных создаются для гуманитарных наук, например в теории права [14, 15]. Наиболее значимыми считаются базы данных в медицинских науках [16, 17]. Несмотря на обширность областей применения баз данных, к ним предъявляются основные функциональные требования [18, с. 35]: поиск данных в базе данных; сортировка; использование фильтра данных; запросы на выборку; хранение данных; построение зависимостей; операции с данными.

Однако есть глобальные базы данных, к которым предъявляется расширенный список требований.

Активно создаются международные базы данных с открытым доступом для реализации различных цифровых решений [19]. Эти базы данных отличают высокая структурированность и интегрируемость. Как правило, это базы биологических и медицинских дата-сетов [20]. Именно в этих областях знаний наиболее остро встает вопрос о структуре и функциональности будущей базы данных, поскольку эти базы данных должны быть интегрируемы в медицинские информационные системы [21]. Сложность и многофакторность медицинских и биологических баз данных обусловлены тем, что данные могут быть различных форматов (числовые, текстовые) и связи между этими данными могут быть неоднозначны. В связи с этим особое внимание уделяют предварительному анализу возможных взаимосвязей внутри базы данных. По этой причине изучают способы формализации данных [22].

В целом, базы данных можно считать основой для всех методов анализа данных. Схематично можно изобразить эту зависимость от баз данных в последовательности методов анализа данных: базы данных; статистика; теория информации; методы оптимизации; data mining; распознавание образов; машинное обучение; нейрокомпьютерные вычисления; искусственный интеллект.

По сути, метод анализа данных зависит от того, насколько база данных многомерна и структурирована.

Подходы и методы структурирования баз данных

            Первым этапом построения функциональной и структурированной базы данных является проверка самих данных на наличие в них ошибок. К наиболее распространенным ошибкам данных можно отнести: формальные ошибки; ошибки сбора данных; ошибки, допущенные при обработке исходных данных; ошибки, допущенные при регистрации данных [23].

Как правило, формальные ошибки заметны на этапе фиксирования данных в базе данных. Ошибки сбора данных отслеживать достаточно сложно, но можно предусмотреть некую границу возможных значений данных, и при несоответствии этой границе данные могут обратить на себя внимание оператора. Ошибки, допущенные при обработке исходных данных, легко обнаруживаются на дополнительном этапе машинной проверки вычислений. Ошибки, допущенные при регистрации данных, относятся к тем видам ошибок, которые возникают на этапе планирования структуры базы данных. Существует хорошо зарекомендовавшая себя стратегия подготовки данных к их регистрации в базе данных [24]. В этой стратегии считается важным использование оптимального числа независимых переменных (факторов). Независимость факторов можно предварительно проверить путем попарного нахождения взаимосвязей между факторами. Необходимо оставить только те факторы, которые отвечают целям и задачам исследования. Лишние факторы приводят к сложности интерпретации полученных моделей и взаимосвязей. Помимо этого, следует помнить о сложности вычислений, которые могут быть описаны как О(n3), где n – исходный объем данных [25, с.67].

Для упрощения анализа данных часто перед структуризацией базы данных используют интеллектуальный анализ данных: анализ предметной области, формулировка целей и задач исследования; извлечение и сохранение данных; обработка данных; содержательный анализ; интерпретация результатов; генерация и использование новых знаний [26].

При этом выделяют следующие варианты закономерностей, которые помогают проводить классификацию внутри базы данных: ассоциация; последовательность; классы; кластеры; временные ряды; статистические модели; феноменологические модели. Автор рассмотрел все 7 типов закономерностей и может сказать, что для использования и анализа будет достаточно только два типа данных. Как правило, в медико-биологических исследованиях для структуризации и классификации достаточно применять категориальные и количественные данные [27].

Базы данных и искусственный интеллект

С развитием искусственного интеллекта (ИИ) значимость баз данных увеличивается многократно. Появились такие виды баз данных, которые ориентированы на ИИ [28]. Эти базы данных лежат в основе так называемых экспертных систем [29]. В этих базах данных информация максимально структурирована и классифицирована. В ряде работ отмечено, что  системы с ИИ обучаются на множестве примеров и уже начинают конкурировать с экспертными системами, иногда дополнять, а иногда и замещать их [30, 31].

Перспективным решением в области ИИ являются миварные технологии. Мивар – наименьший структурный элемент, который способен описать рассматриваемый объект с заданной полнотой связей (даже потенциальных связей). По сути, мивар можно представить как некий универсальный классификатор, способный описать некую совокупность данных. Однако мивар – это и прообраз базы данных, пригодной для работы объяснимого искусственного интеллекта. Такие базы данных подойдут для моделей машинного обучения – обучение «с учителем», где происходит обучение на исходной выборке, на которой можно выявить решающее правило (феноменологическую модель или дерево решений) [32, 33].

Однако основным ориентиром являются непосредственно заказчики, которые работают с данными и которым необходима помощь в создании баз данных. С целью выяснения функциональных характеристик баз данных в авиакосмической медицине и биологии был проведен анализ требований, которые заказчики (сотрудники ИМБП РАН) предъявляют к базам данных.

Систематизация данных в авиационной и космической медицине

Систематизацию данных в авиационной медицине производят, прежде всего, в целях безопасности полетов [34, 35, 36]. В космической медицине мы можем наблюдать особенно выраженную систематизацию данных относительно кардио- [37, 38] и респираторной системы космонавтов [39]. Также кардиореспираторная система находится в центре внимания авиационной медицины [40, 41]. В целом, физическое состояние космонавтов [42, 43] предлагается оценивать в стандартных протоколах. В авиационной медицине давно используются стандартные протоколы для летчиков [44, 45], что позволяет заниматься систематизацией этих результатов. Особого внимания заслуживает атлас космической омики и медицины (SOMA) – это значительное достижение в области космической медицины, представляющее собой интегрированное хранилище клинических, клеточных и мультиомных исследований, полученных в ходе различных космических миссий. SOMA представляет собой значительное увеличение количества общедоступных данных по омике человека в космосе, что упрощает прецизионную аэрокосмическую медицину, предлагая обширные молекулярные и физиологические профили [46]. Системный анализ и математическое моделирование были использованы для понимания физиологической адаптации к космическим полетам, о чем свидетельствует всесторонний анализ данных Skylab. Этот подход объединяет биомедицинские данные, позволяющие лучше понять, как адаптироваться к микрогравитации, и способствует разработке прогнозных моделей для космической медицины [47]. Помимо этого, значительный объем структурированной информации в области психологии и нейрофизиологии представлен в современных публикациях [48–50].

Требования, предъявляемые к базам данных

            С 2018 года были собраны требования к разрабатываемым базам данных среди заказчиков (сотрудников ИМБП РАН) и проведен их анализ. Эти требования были связаны с созданием и последующей систематизацией, структурированием и обработкой баз данных из имеющихся у заказчиков данных. Были оценены требования 57 заказчиков. Все заказчики были сотрудниками Института медико-биологических проблем РАН, работающими в области авиакосмической медицины и биологии. С каждым заказчиком была проведена беседа с целью разъяснения возможных вариантов работы с данными заказчиков. Помимо этого, фиксировались знания и понимание заказчиков в тематике обработки информации, проверялась как структура исходных баз данных, так и сами значения в ячейках данных. Фиксировались типы ошибок, которые допускались заказчиками. Оценивались возможные последствия допущенных ошибок с целью определения приоритетных направлений разработки метода структурирования баз данных.

            В результате проведенной работы был обнаружен значительный разрыв между современными возможностями анализа и обработки информации и знаниями и опытом заказчиков. Однако удалось собрать ряд характерных требований, предъявляемых к базам данных.

Ниже в таблице 1 представлены требования, предъявляемые заказчиками к выполняемым работам.

Таблица 1

Требования к базам данных

Требования

N

1

Государственная регистрация базы данных (РОСПАТЕНТ)

57

2

Использование для хранения и наполнения базы данных Microsoft Excel

57

3

Описательная статистика

57

4

Сравнительная статистика

33

5

Построение регрессионных моделей

30

6

Построение прогностических моделей

27

7

Корреляционный анализ

20

8

Построение статистических моделей

17

9

Дисперсионный анализ

17

10

Построение феноменологических моделей

10

11

Создание баз данных, пригодных для использования объяснимого ИИ

10

12

Факторный анализ

5

Проанализированы характеристики баз данных (табл. 2). Эти базы данных были согласованы с заказчиками и соответствовали их задачам и целям. Была проведена государственная регистрация всех баз данных в РОСПАТЕНТ, тем самым были подтверждены эффективность построения структуры баз данных и эффективность выбранных инструментов для анализа и проверки баз данных заказчиков. 

Таблица 2

Характеристики баз данных

Характеристики баз данных

N

1

Табличная модель данных

57

2

Реляционные базы данных

57

3

Не более 10 группирующих признаков

57

4

До 500 значений для каждой переменной

50

5

Более 500 значений для каждой переменной

7

В данной работе автор постарался учесть как запрос заказчиков к  базам данных, так и возможность разнообразных методов анализа и обработки данных. Так сформировались некий образ востребованных в авиакосмической медицине и биологии баз данных и их характеристики.

Заключение

            На основе анализа методов структурирования баз данных наиболее подходящей формой признана реляционная (с двумя типами данных – категориальные и количественные данные). Структурирование и моделирование внутри баз данных можно проводить на основе феноменологических моделей, поскольку эти модели включают в себя все возможные формы взаимосвязей. Помимо этого, таким способом структурированные базы данных пригодны для государственной регистрации в РОСПАТЕНТ.

Основными заказчиками баз данных, требования которых были рассмотрены в данной работе, были сотрудники, занятые в области авиационной и космической биологии и медицины. Анализ потребностей и специфики требований заказчиков подтвердил начальную гипотезу о том, что исходные базы данных заказчиков плохо структурированы, имеют ошибки в данных и в самой структуре базы. Заказчики, как правило, не способны провести предварительный интеллектуальный анализ данных из-за отсутствия исходной структуры базы данных и соответствующего опыта. В большинстве случаев базы данных заказчикам нужны для статистического анализа и поиска закономерностей внутри базы данных.

Описанные выше результаты говорят об актуальности проблемы систематизации информации, а наиболее приемлемое решение – систематизация в виде структурированных баз данных. Эти результаты актуальны не только для области авиакосмической медицины, но и для всей медицины и биологии в целом. По сути, структурированные базы данных с валидированной и верифицированной информацией представляют значительный интерес как со стороны науки, так и со стороны бизнеса. Это обусловлено тем, что качественные базы данных позволяют использовать различные инструменты анализа данных и получать важные результаты. Ценность баз данных со временем и возрастанием их объема только увеличивается. Однако необходимо заранее планировать структуру базы данных и особенности накопления этих данных, чтобы будущая база данных имела значительную ценность.


Библиографическая ссылка

Артамонов А.А. К ВОПРОСУ О СИСТЕМАТИЗАЦИИ ДАННЫХ В АВИАЦИОННОЙ И КОСМИЧЕСКОЙ МЕДИЦИНЕ // Современные проблемы науки и образования. – 2024. – № 5. ;
URL: https://science-education.ru/ru/article/view?id=33701 (дата обращения: 08.11.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674