<?xml version="1.0" encoding="UTF-8"?>
<article xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="JATS-archive-oasis-article1-4.xsd" article-type="research-article" dtd-version="1.4" xml:lang="ru">
  <front>
    <journal-meta>
      <journal-title-group>
        <journal-title>Журнал Современные проблемы науки и образования</journal-title>
      </journal-title-group>
      <issn>2070-7428</issn>
      <publisher>
        <publisher-name>Общество с ограниченной ответственностью &amp;quot;Издательский Дом &amp;quot;Академия Естествознания&amp;quot;</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="publisher-id">ART-11307</article-id>
      <title-group>
        <article-title>МЕРА ИНФОРМАЦИОННОГО ПОДОБИЯ ДЛЯ АНАЛИЗА СЛАБОСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name-alternatives>
            <name xml:lang="ru">
              <surname>Бутакова</surname>
              <given-names>М.А.</given-names>
            </name>
          </name-alternatives>
          <name-alternatives>
            <name xml:lang="en">
              <surname>Butakova</surname>
              <given-names>M.A.</given-names>
            </name>
          </name-alternatives>
          <email>inf-rgups@yandex.ru</email>
          <xref ref-type="aff" rid="aff240fe138"/>
        </contrib>
        <contrib contrib-type="author">
          <name-alternatives>
            <name xml:lang="ru">
              <surname>Климанская</surname>
              <given-names>Е.В.</given-names>
            </name>
          </name-alternatives>
          <name-alternatives>
            <name xml:lang="en">
              <surname>Klimanskaya</surname>
              <given-names>E.V.</given-names>
            </name>
          </name-alternatives>
          <email>elenaklimanskaja@rambler.ru</email>
          <xref ref-type="aff" rid="aff240fe138"/>
        </contrib>
        <contrib contrib-type="author">
          <name-alternatives>
            <name xml:lang="ru">
              <surname>Янц</surname>
              <given-names>В.И.</given-names>
            </name>
          </name-alternatives>
          <name-alternatives>
            <name xml:lang="en">
              <surname>Yants</surname>
              <given-names>V.I.</given-names>
            </name>
          </name-alternatives>
          <email>v.i.yants@pmvt.ru</email>
          <xref ref-type="aff" rid="affe3503ba9"/>
        </contrib>
      </contrib-group>
      <aff id="aff240fe138">
        <institution xml:lang="ru">ФГБОУ ВПО «Ростовский государственный университет путей сообщения»</institution>
        <institution xml:lang="en">Rostov State Transport University</institution>
      </aff>
      <aff id="affe3503ba9">
        <institution xml:lang="ru">ФГБОУ ВПО «Ростовский государственный строительный университет»</institution>
        <institution xml:lang="en">Rostov State Building University</institution>
      </aff>
      <pub-date date-type="pub" iso-8601-date="2013-06-25">
        <day>25</day>
        <month>06</month>
        <year>2013</year>
      </pub-date>
      <issue>6</issue>
      <fpage>130</fpage>
      <lpage>130</lpage>
      <permissions>
        <license xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This is an open-access article distributed under the terms of the CC BY 4.0 license.</license-p>
        </license>
      </permissions>
      <self-uri content-type="url" hreflang="ru">https://science-education.ru/ru/article/view?id=11307</self-uri>
      <abstract xml:lang="ru" lang-variant="original" lang-source="author">
        <p>В статье предложена новая мера информационного подобия для анализа слабоструктурированных документов, базирующаяся на интерференционно-волновом подходе. Дано описание предметной области исследований слабоструктурированных данных. Приведены примеры возникновения явления слабой структурированности документов. Представлены принципы организации хранения слабоструктурированных документов в базах данных и описан существующий инструментарий бессхемных баз данных и баз данных с изменяемой схемой данных. Подробно изложен принцип построения интерференционной волны и векторов интерференции. Приведена формула вычисления меры на основе векторов интерференции. Описан процесс индексации и нахождения релевантной информации по мере. Предложена модификация интерференционно-волновой меры информационного подобия в обобщенном виде. Проведено тестирование модели на экспериментальной базе данных. Установлено, что алгоритм вычислений по предложенной мере имеет линейную сложность вычислений Сделаны выводы о возможности применения предложенного метода в больших базах данных.</p>
      </abstract>
      <abstract xml:lang="en" lang-variant="translation" lang-source="translator">
        <p>The paper proposes a new measure of information for the analysis of similarity of semistructured documents based on interference-wave approach. A description of the subject area of research semistructured data is done. There examples of the phenomenon of weak structured documents are presented. The principles storage organization semistructured documents in databases and tools in schema-less existing databases and databases with variable data schema are described. The principle of interference wave vectors and interference is expounded. The formula calculating the measures on the basis vectors of interference is done. The process of indexing and finding relevant information on the measure is described. A modification of the interference-wave measures of similarity information in summary form is developed. Testing of the model on an experimental database is executed. Found that the proposed algorithm for computing least has a linear computational complexity conclusions about the possibility of applying the method in large databases.</p>
      </abstract>
      <kwd-group xml:lang="ru">
        <kwd>слабоструктурированные данные</kwd>
        <kwd>мера подобия</kwd>
        <kwd>поиск</kwd>
        <kwd>индексация</kwd>
        <kwd>базы данных</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>semistructured data</kwd>
        <kwd>database</kwd>
        <kwd>measures of similarity</kwd>
        <kwd>search</kwd>
        <kwd>indexing</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <ref>
        <note>
          <p>1. Бутакова М.А. Организация хранения и обработки слабоструктурированных документов в информационно-управляющих системах на железнодорожном транспорте / Бутакова М.А., Климанская Е.В., Янц В.И. // Вестник Ростовского государственного университета путей сообщения. – 2013. – №4. – C. 42-47.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>2. Климанская Е.В. Методы обработки слабоструктурированных данных в автоматизированных системах на железнодорожном транспорте / Климанская Е.В. Чернов А.В., Янц В.И. // Известия высших учебных заведений. Северо-Кавказский регион. Серия технические науки. – 2013. – №1. – С. 118-123.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>3. Паращенко И.Г. Классификация моделей надежности программного обеспечения / Паращенко И.Г., Чернов А.В. [Электронный ресурс] // «Инженерный вестник Дона». – 2012. – №4 (часть 2). URL: http://ivdon.ru/magazine/archive/n4p2y2012/1319 (дата обращения: 05.12.2013).</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>4. Редмонд Э. Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL / Редмонд Э., Уилсон Д.Р. – М.: ДМК Пресс, 2013. – 384 с.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>5. Bounhas I. A hierarchical approach for semi-structured document indexing and terminology extraction / Bounhas I., Slimani Y. // International Conference on Information Retrieval and Knowledge Management (CAMP). – 2010. PP. 315-320.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>6. Buneman P. Semistructured data // In Proceedings of the Sixth ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, Tucson. – 1997. – P. 117-121.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>7. Guezouli L. Gestion de documents plurimedia et recherche d'informations dans un syst&amp;#232;me collaboratif, PhD Th.: Universit&amp;#233; Denis Diderot, Paris VII / AdVestigo. – 2006.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>8. Guezouli L. CASIT: Content based identification of textual information in a large database / Guezouli L., Essafi H. // IEEE 24th International Conference on Advanced Information Networking and Applications Workshops. – 2010. –PP.621-625.</p>
        </note>
      </ref>
    </ref-list>
  </back>
</article>
