Scientific journal
Modern problems of science and education
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

DATA APPLICATION OF COMPUTATIONAL LINGUISTICS IN ANALISING PHONOSTYLISTICS OF FINNO-UGRIC SACRED TEXTS ON THE SEGMENTAL LEVEL

Anduganova M.Yu. 1
1 Ugra State university
The article gives basic information about the subject of computational linguistics on modern science. It also defines interpretation of sacred texts by different researchers. The paper shows the degree of studies in the field of Finno-Ugric sacred texts by language experts. The basic aim is to demonstrate methods of application of phonostylistics on segmental level of texts processing by computational linguistics data. There are shown methods of computation of stylistic devices such as allitiration, assonans, consonace,rhyme. The results will be usefull not only in the field of linguistic stilistics, but alsow in psycolinguistics and in alanalysis of sound and symbol of Finno-Ugric sacred texts.
segmental level
phonostylistics
sacred text
computational linguistics
Информатизация современного общества заметно повлияла на укрепление значимости компьютерной лингвистики, которая наряду с вычислительной и инженерной имеет объединенный и обобщенный термин - прикладной лингвистики.  Эти три направления появились на стыке глубоко гуманитарной науки лингвистики (языковедения), изучающей законы развития и использования языком как могучим средством мышления и коммуникации, и компьютерных технологий, с помощью которой машине передается все большая часть технического и интеллектуального труда, выполняемого ранее человеком. Компьютерная лингвистика  тесно связана с лингвистическим обеспечением информатики. Исследования в данной области опираются на основные единицы языковых уровней, таких как слово, словосочетание, а также на семантику текста (речи). Определить и описать их роль и значимость в современной машинной обработке текстов и гипертекстов не всегда представляется возможным. В узком смысле проблематика компьютерной лингвистики часто связывается с междисциплинарным прикладным направлением для решения задач лингвистического обеспечения информатики.

Основной целью является демонстрация способов применения данных компьютерной лингвистики для обработки фоностилистики текста на сегментном уровне. При ее реализации были применены не только общенаучные методы и приемы, но и собственно лингвистические и математические (контекстологический, количественный, типологический, описательный и т.д.). Объектом нашего внимания  стали сакральные тексты (СТ) в общем и религиозные сакральные тексты в частности. Это связано с тем, что на современном этапе лингвистических исследований сакральных текстов выявляется разный подход к трактовкам этого понятия. Так, одни исследователи под СТ понимают лишь тексты библейского происхождения [15, 13, 14, 8, 3, 10, 4, 6, 2] и посвящают им свои лингвистические исследования как при анализе словарного состава, так фразеологии и даже дискурса.

Другие как, например, Н. И. Коновалова  сакральность понимают в более широком ее значении и считают, что СТ является отражением устной народной традиции в виде парологической, языческой, дохристианской картины мира [5: 8].

В финно-угристике проблеме сакральности мало уделено внимания в работах лингвистов, вернее данный вопрос практически не исследован в должной мере. Это справедливо объясняется тем, что искомое направление является совершенно новым как в отечественном и зарубежном языкознании [5:6], так и в финно-угроведении. К такой проблематике обратились лишь в 90-х гг. XX века [5:5]. Мы не ставим цели раскрывать детально историю вопроса, поскольку она может быть освещена отдельно. В рамках данной статьи весьма уместно могло бы быть упоминание фоностилистики как частного направления исследований стиля, которое подразделяется на два уровня - сегментного и суперсегментного. Ввиду того, что нами определено освещение вопроса «применения данных компьютерной лингвистики в сегментной фоностилистике финно-угорских СТ»,  то, следует заметить, что сегментный уровень является первым, т.е. элементарным в фоностиле [1:73]. Результаты компьютерной лингвистики на этом уровне могут применяться в части автоматической обработки языка, которую выделяет Е. П. Соснина. По ее мнению,  при определении границ предметной области компьютерной лингвистики существуют два аспекта:1) автоматическая обработка языка (Language Processing), включающая задачи анализа и моделирования языковой структуры; 2) прикладное направление.

К  автоматической обработке языка относятся: графематический / фонематический анализ языка; морфологический анализ; лексико-грамматический анализ языка; синтаксический анализ или парсинг; анализ и моделирование семантической структуры; задача синтеза языковых элементов, в т.ч. генерация текстов; автоматическая лингвостатистика.

Прикладным направлением является: машинный перевод; распознавание и синтез речи; разработка и использование искусственных языков;  разработка и использование языков программирования;  разработка и использование языков информационных систем; компьютерная лексикография и терминография;  лингвистические основы информационного поиска;  автоматическое индексирование, реферирование и классификация текстов; автоматический контент-анализ; авторизация текстов; гипертекстовые технологии представления текста; корпусная лингвистика; компьютерная лингводидактика [12, 16].

Поскольку сегментный  фоностиль основан на экспрессии повторов фонем, их частоты, периодичности и т.д., то многие данные можно выявить благодаря незамысловатым операциям и использовании Word. Так, благодаря простой замене можно выявить количество слов в тексте, начинающихся с той или иной фонемы. Это важно для того, чтобы показать потенциально возможную частоту аллитерации и реальную ее частоту. Особенно при анализе текстов в финно-угристике, поскольку аллитерация является одной из основополагающих стилистических средств устного народного творчества [11:131].  Заметим, что для проведения такой операции не требуется дорогостоящий компьютер или сверхновая программа и операционная система, например:

Используемый компьютер: 486 DX, операционная оболочка WINDOWS 3.11, текстовый редактор WORD 6.0.

Задача: Произвести подсчет графемы в набранном тексте на марийском языке (например: сколько звуков "а", "ж" и т.д.), а также подсчет количества  сочетаний конкретных графем (например: сколько сочетаний "аб", "ак" и т.д.).

Нами был осуществлен анализ 65 текстов марийских языческих молитв, в котором применялся данный подход. Помимо обработки каждой молитвы был получен обобщенный результат графемной представленности в текстах молитв из разных источников.

Таблица 1

Частотность употребления графем в позиции начала слова

Графема

Кол-во

Графема

Кол-во

Графема

Кол-во

Графема

Кол-во

А

1062

Ж

24

О

779

Ϋ

338

Ä

6

И

788

Ö

55

Х

3

Б

20

Й

982

П

3613

Ч

328

В

1588

К

5003

Р

223

Ш

2411

Г

1107

Л

614

С

1194

Ы

876

Д

858

М

1395

Т

2357

Э

248

Е

244

Н

643

У

715

Ю

814

 

 

 

 

 

 

Я

102

Таким образом, наиболее частотными в позиции абсолютного начала слова в текстах марийских языческих являются согласные, а именно: к, п, т, й, ш. Полученные результаты лишь подтверждают выявленные фонетические законы, как в марийском, так и в других финно-угоских языках. Это касается и части исконно финно-угросных согласных, присутствовавших в финно-угорском языке-основе. Что же касаемо  частотности  фонемы ш, то она, как указанно в «Основах финно-угорского языкознания», объединила в себе три согласных, а именно: s, š, s [10: 122]. Необходимо также отметить, что представленность  гласных фонем в позиции абсолютного начала лексем составляет лишь 5-10 % .   

При анализе 1335 строк сакральных текстов Песни Пелымского Торума (ППТ), исполняемых на Медвежьих игрищах хантов, применительно к сегментному уровню фоностиля ППТ с абсолютной уверенностью можно констатировать тот факт, что основным наиболее продуктивным фоностилистическим  средством является повтор (t)  и (йt). Подсчет их общей количественной представленности составил  4717 случаев.  Из них 1206 фактов, когда они образовывают межстрочную рифму. Вот один из отрывков, где перевод песни материал представлен Т. А. Молдановой:

69. Панта(йt)  увты  увиеk(t)                               По руслу протекали, [то] течение [реки]

 85.  Муваyа Пулум муват(t) киньща(йt)         Быть может на [священной] высоте30

                                                                                                                                           появились.

        Мосаy па(йt) па паkkа(йt) тыви(йt)kумаk(t)  Земли [имеющий] Пелым, земли его,

        Муваyа Пулум мувиеk(t).                           Деревья [имеющий] Пелым,  [они] выше

                                                                                                  [других] деревьев

                                                                             [7].

Таким образом, наглядно показано, что можно производить подсчеты элементов фоностиля, в частности: аллитерации, ассонанса, консонанса, рифмы, что позволит выявлять наиболее активные фонемы в том или ином тексте. Такие данные могут принести неоценимую помощь не только в исследованиях по лингвистической стилистике, но и психолингвистике, а особенно при анализе звукосимволизма сакральных текстов на финно-угорских языках, что позволит получить дополнительную информацию, полезную не только для лингвистов, но и возможно фольклористов, этнографов, психологов, литераторов, философов, культурологов и др.

Рецензенты:

Долженко Н.Г., д.фил.н., проф. кафедры филологии  Югорского государственного университета, г. Ханты-Мансийск;

Вафеев Р.А., д.фил.н., проф. кафедры филологии  Югорского государственного университета, г. Ханты-Мансийск.