Основной целью является демонстрация способов применения данных компьютерной лингвистики для обработки фоностилистики текста на сегментном уровне. При ее реализации были применены не только общенаучные методы и приемы, но и собственно лингвистические и математические (контекстологический, количественный, типологический, описательный и т.д.). Объектом нашего внимания стали сакральные тексты (СТ) в общем и религиозные сакральные тексты в частности. Это связано с тем, что на современном этапе лингвистических исследований сакральных текстов выявляется разный подход к трактовкам этого понятия. Так, одни исследователи под СТ понимают лишь тексты библейского происхождения [15, 13, 14, 8, 3, 10, 4, 6, 2] и посвящают им свои лингвистические исследования как при анализе словарного состава, так фразеологии и даже дискурса.
Другие как, например, Н. И. Коновалова сакральность понимают в более широком ее значении и считают, что СТ является отражением устной народной традиции в виде парологической, языческой, дохристианской картины мира [5: 8].
В финно-угристике проблеме сакральности мало уделено внимания в работах лингвистов, вернее данный вопрос практически не исследован в должной мере. Это справедливо объясняется тем, что искомое направление является совершенно новым как в отечественном и зарубежном языкознании [5:6], так и в финно-угроведении. К такой проблематике обратились лишь в 90-х гг. XX века [5:5]. Мы не ставим цели раскрывать детально историю вопроса, поскольку она может быть освещена отдельно. В рамках данной статьи весьма уместно могло бы быть упоминание фоностилистики как частного направления исследований стиля, которое подразделяется на два уровня - сегментного и суперсегментного. Ввиду того, что нами определено освещение вопроса «применения данных компьютерной лингвистики в сегментной фоностилистике финно-угорских СТ», то, следует заметить, что сегментный уровень является первым, т.е. элементарным в фоностиле [1:73]. Результаты компьютерной лингвистики на этом уровне могут применяться в части автоматической обработки языка, которую выделяет Е. П. Соснина. По ее мнению, при определении границ предметной области компьютерной лингвистики существуют два аспекта:1) автоматическая обработка языка (Language Processing), включающая задачи анализа и моделирования языковой структуры; 2) прикладное направление.
К автоматической обработке языка относятся: графематический / фонематический анализ языка; морфологический анализ; лексико-грамматический анализ языка; синтаксический анализ или парсинг; анализ и моделирование семантической структуры; задача синтеза языковых элементов, в т.ч. генерация текстов; автоматическая лингвостатистика.
Прикладным направлением является: машинный перевод; распознавание и синтез речи; разработка и использование искусственных языков; разработка и использование языков программирования; разработка и использование языков информационных систем; компьютерная лексикография и терминография; лингвистические основы информационного поиска; автоматическое индексирование, реферирование и классификация текстов; автоматический контент-анализ; авторизация текстов; гипертекстовые технологии представления текста; корпусная лингвистика; компьютерная лингводидактика [12, 16].
Поскольку сегментный фоностиль основан на экспрессии повторов фонем, их частоты, периодичности и т.д., то многие данные можно выявить благодаря незамысловатым операциям и использовании Word. Так, благодаря простой замене можно выявить количество слов в тексте, начинающихся с той или иной фонемы. Это важно для того, чтобы показать потенциально возможную частоту аллитерации и реальную ее частоту. Особенно при анализе текстов в финно-угристике, поскольку аллитерация является одной из основополагающих стилистических средств устного народного творчества [11:131]. Заметим, что для проведения такой операции не требуется дорогостоящий компьютер или сверхновая программа и операционная система, например:
Используемый компьютер: 486 DX, операционная оболочка WINDOWS 3.11, текстовый редактор WORD 6.0.
Задача: Произвести подсчет графемы в набранном тексте на марийском языке (например: сколько звуков "а", "ж" и т.д.), а также подсчет количества сочетаний конкретных графем (например: сколько сочетаний "аб", "ак" и т.д.).
Нами был осуществлен анализ 65 текстов марийских языческих молитв, в котором применялся данный подход. Помимо обработки каждой молитвы был получен обобщенный результат графемной представленности в текстах молитв из разных источников.
Таблица 1
Частотность употребления графем в позиции начала слова
Графема |
Кол-во |
Графема |
Кол-во |
Графема |
Кол-во |
Графема |
Кол-во |
А |
1062 |
Ж |
24 |
О |
779 |
Ϋ |
338 |
Ä |
6 |
И |
788 |
Ö |
55 |
Х |
3 |
Б |
20 |
Й |
982 |
П |
3613 |
Ч |
328 |
В |
1588 |
К |
5003 |
Р |
223 |
Ш |
2411 |
Г |
1107 |
Л |
614 |
С |
1194 |
Ы |
876 |
Д |
858 |
М |
1395 |
Т |
2357 |
Э |
248 |
Е |
244 |
Н |
643 |
У |
715 |
Ю |
814 |
|
|
|
|
|
|
Я |
102 |
Таким образом, наиболее частотными в позиции абсолютного начала слова в текстах марийских языческих являются согласные, а именно: к, п, т, й, ш. Полученные результаты лишь подтверждают выявленные фонетические законы, как в марийском, так и в других финно-угоских языках. Это касается и части исконно финно-угросных согласных, присутствовавших в финно-угорском языке-основе. Что же касаемо частотности фонемы ш, то она, как указанно в «Основах финно-угорского языкознания», объединила в себе три согласных, а именно: s, š, s [10: 122]. Необходимо также отметить, что представленность гласных фонем в позиции абсолютного начала лексем составляет лишь 5-10 % .
При анализе 1335 строк сакральных текстов Песни Пелымского Торума (ППТ), исполняемых на Медвежьих игрищах хантов, применительно к сегментному уровню фоностиля ППТ с абсолютной уверенностью можно констатировать тот факт, что основным наиболее продуктивным фоностилистическим средством является повтор (t) и (йt). Подсчет их общей количественной представленности составил 4717 случаев. Из них 1206 фактов, когда они образовывают межстрочную рифму. Вот один из отрывков, где перевод песни материал представлен Т. А. Молдановой:
69. Панта(йt) увты увиеk(t) По руслу протекали, [то] течение [реки]
85. Муваyа Пулум муват(t) киньща(йt) Быть может на [священной] высоте30
появились.
Мосаy па(йt) па паkkа(йt) тыви(йt)kумаk(t) Земли [имеющий] Пелым, земли его,
Муваyа Пулум мувиеk(t). Деревья [имеющий] Пелым, [они] выше
[других] деревьев
[7].
Таким образом, наглядно показано, что можно производить подсчеты элементов фоностиля, в частности: аллитерации, ассонанса, консонанса, рифмы, что позволит выявлять наиболее активные фонемы в том или ином тексте. Такие данные могут принести неоценимую помощь не только в исследованиях по лингвистической стилистике, но и психолингвистике, а особенно при анализе звукосимволизма сакральных текстов на финно-угорских языках, что позволит получить дополнительную информацию, полезную не только для лингвистов, но и возможно фольклористов, этнографов, психологов, литераторов, философов, культурологов и др.
Рецензенты:
Долженко Н.Г., д.фил.н., проф. кафедры филологии Югорского государственного университета, г. Ханты-Мансийск;
Вафеев Р.А., д.фил.н., проф. кафедры филологии Югорского государственного университета, г. Ханты-Мансийск.
Библиографическая ссылка
Андуганова М.Ю. ПРИМЕНЕНИЕ ДАННЫХ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ ПРИ АНАЛИЗЕ СЕГМЕНТНОЙ ФОНОСТИЛИСТИКИ ФИННО-УГОРСКИХ САКРАЛЬНЫХ ТЕКСТОВ // Современные проблемы науки и образования. – 2015. – № 1-1. ;URL: https://science-education.ru/ru/article/view?id=18725 (дата обращения: 06.10.2024).