<?xml version="1.0" encoding="UTF-8"?>
<article xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="JATS-archive-oasis-article1-4.xsd" article-type="research-article" dtd-version="1.4" xml:lang="ru">
  <front>
    <journal-meta>
      <journal-title-group>
        <journal-title>Журнал Современные проблемы науки и образования</journal-title>
      </journal-title-group>
      <issn>2070-7428</issn>
      <publisher>
        <publisher-name>Общество с ограниченной ответственностью &amp;quot;Издательский Дом &amp;quot;Академия Естествознания&amp;quot;</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="publisher-id">ART-19046</article-id>
      <title-group>
        <article-title>СОЗДАНИЕ НАЦИОНАЛЬНОГО КОРПУСА ЧУВАШСКОГО ЯЗЫКА: ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name-alternatives>
            <name xml:lang="ru">
              <surname>Желтов</surname>
              <given-names>П.В.</given-names>
            </name>
          </name-alternatives>
          <name-alternatives>
            <name xml:lang="en">
              <surname>Zheltov</surname>
              <given-names>P.V.</given-names>
            </name>
          </name-alternatives>
          <email>chnk@mail.ru</email>
          <xref ref-type="aff" rid="aff0c631b40"/>
        </contrib>
      </contrib-group>
      <aff id="aff0c631b40">
        <institution xml:lang="ru">ФГБОУ ВПО «ЧГУ им. И.Н.Ульянова»</institution>
        <institution xml:lang="en">Chuvash State University</institution>
      </aff>
      <pub-date date-type="pub" iso-8601-date="2015-01-14">
        <day>14</day>
        <month>01</month>
        <year>2015</year>
      </pub-date>
      <issue>1</issue>
      <fpage>338</fpage>
      <lpage>338</lpage>
      <permissions>
        <license xlink:href="https://creativecommons.org/licenses/by/4.0/">
          <license-p>This is an open-access article distributed under the terms of the CC BY 4.0 license.</license-p>
        </license>
      </permissions>
      <self-uri content-type="url" hreflang="ru">https://science-education.ru/ru/article/view?id=19046</self-uri>
      <abstract xml:lang="ru" lang-variant="original" lang-source="author">
        <p>В статье рассматривается задача создания Национального корпуса чувашского языка и связанные с ней проблемы и перспективы. Национальные языковые корпуса включают в себя большие массивы электронных текстов разных жанров и стилей, что дает возможность всесторонне и полно исследовать различные языковые явления. В отсутствии необходимого финансирования предлагается не добиваться создания полной текстовой базы чувашских текстов, а сделать репрезентативную выборку. Составлен минимальный список компьютерных программ, необходимых для работы с этой текстовой базой данных, рассмотрены вопросы разработки разметки для корпуса, а также обеспечения многопользовательского доступа через Интернет. Также рассмотрены вопросы безопасности. Отмечено, что наиболее безопасным будет использование отдельного сервера.</p>
      </abstract>
      <abstract xml:lang="en" lang-variant="translation" lang-source="translator">
        <p>In the paper is analyzed the problem of creating the National corpora of Chuvash language and the problems and perspectives linked with it. The national linguistic corporas include large arrays of electronic text of different genres and styles, which gives the possibility to investigate comprehensively and fully different language phenomenas. While lacking necessary financement is proposed not to seek the creation of a full database of Chuvash texts but to make a representative selection. Was composed a shortlist of computer software, necessary for the work with this textual database, were considered questions of elaboration of a tagging system of the corpora, as well as the provision of multiuser access through the Internet. Were also considered question of security. Was noted that the best strategy would be the use of separate server.</p>
      </abstract>
      <kwd-group xml:lang="ru">
        <kwd>многопользовательский доступ.</kwd>
        <kwd>экстралингвистическая и лингвистическая разметка</kwd>
        <kwd>машинный фонд</kwd>
        <kwd>лингвистический корпус</kwd>
      </kwd-group>
      <kwd-group xml:lang="en">
        <kwd>multiuser access.</kwd>
        <kwd>extra linguistic and linguistic tagging</kwd>
        <kwd>machine foundation</kwd>
        <kwd>linguistic corpora</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <back>
    <ref-list>
      <ref>
        <note>
          <p>1. Машинный фонд русского языка: идеи и суждения //Материалы I Всесоюзной конференции по созданию МФРЯ. – М.: Наука, 1986. – 234 с.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>2. Материалы II Всесоюзной конференции по созданию МФРЯ. – М.: Наука, 1988. – 230 с.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>3. Материалы III Всесоюзной конференции по созданию МФРЯ. – М.: Изд-во МГУ имени М.В. Ломоносова, 1990. – 148 с.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>4. Плунгян В.А. Национальный корпус русского языка: опыт создания корпуса текстов современного русского языка / В.А. Плунгян, Д.В. Сичинава // Труды международной конференции «Корпусная лингвистика-2004». – СПб: Изд-во Санкт-Петербургского университета, 2004. – С. 216-238.</p>
        </note>
      </ref>
      <ref>
        <note>
          <p>5. Бускунбаева Л.А. Система разметок в национальном корпусе башкирского языка /Л.А. Бускунбаева, З.А. Сиразитдинов // Материалы международной конференции «Языки меньшинств в компьютерных технологиях: опыт, задачи и перспективы». – Йошкар-Ола, 2011. – С. 46-51.</p>
        </note>
      </ref>
    </ref-list>
  </back>
</article>
