Сетевое издание
Современные проблемы науки и образования
ISSN 2070-7428
"Перечень" ВАК
ИФ РИНЦ = 1,006

К ПРОБЛЕМЕ ГЕНЕРАЦИИ РАСШИРЕННОЙ ФОНЕТИЧЕСКОЙ ТРАНСКРИПЦИИ НА ОСНОВЕ ВЕКТОРНЫХ ПОРОЖДАЮЩИХ ГРАММАТИК

Личаргин Д.В. 1 Сотникова В.В. 1 Усова А.А. 1 Бутовченко В.В. 1
1 ФГАОУ ВПО «Сибирский федеральный университет»
Цель работы состоит в необходимости описать принцип работы векторных порождающих грамматик, которые могут быть использованы при генерации транскрипционного описания, включающего интонационно-фонетические оттенки произношения звуков языка. Для решения этой задачи предлагается применить метод гибридизации векторного представления данных и порождающих грамматик, позволяющий выработать принципы и алгоритмы для получения правильной и неправильной транскрипции. Необходимо описать основные признаки классификации, позволяющие генерировать транскрипцию с учетом вариативности фонетических оттенков языка, которая позволит эффективно и максимально быстро изучить язык, а также понять его эмоциональную сторону. Успешно разрабатывается программа генерации транскрипции на различных европейских языках в учебных целях. Делается вывод о необходимости расширения порождающих грамматик в рамках их гибридизации с синтаксисом векторного представления данных.
генерация осмысленной речи.
генерация учебных заданий
компьютерная лингвистика
1. Зыкова Т.В., Кытманов Т.В., Цибульский Г.М., Шершнева В.А. Обучение математике в среде Moodle на примере электронного обучающего курса // Вестник Красноярского государственного педагогического университета имени В.П. Астафьева. – 2012. – № 1. – С. 60-63.
2. Личаргин Д.В. Методы и средства порождения семантических конструкций естественного языкового интерфейса программных систем : дис. … канд. тех. наук: 05.13.17. Защищена 05.07.2004, Утв. 10.12.2004; №137428. - Красноярск, 2004. - 154 с.
3. Личаргин Д.В., Кузнецов А.С., Царев Р.Ю. Активные методы обучения в рамках инициативы Cdio по направлению «программная инженерия» // Современные проблемы науки и образования. – 2014. – № 3; URL: www.science-education.ru/117-13696.
4. Личаргин Д.В., Кузнецов А.С., Царев Р.Ю. Модель описания учебного процесса при реализации инициативы Cdio // Современные проблемы науки и образования. – 2014. – № 4.
5. Личаргин Д.В., Ладе А.В., Мищенко Д.Д., Гордеева А.Т. О функции плановых языков на современном этапе и их применении в качестве языков нетерминальных символов порождающих грамматик // Вестник Сибирского государственного аэрокосмического университета [Красноярск]. - 2014. – № 1. - С. 44-48.
6. Личаргин Д.В., Маглинец А.Ю., Рыбков М.В., Бачурина Е.П. Статистические методы анализа естественного языка как способ повышения эффективности его генерации на основе семантических шаблонов // Информатизация образования и науки. – 2014. - № 4 (24). – С. 92-103.
7. Личаргин Д.В., Сафонов К.В., Егорушкин О.И., Бачурина Е.П. К вопросу об упорядочении многоуровневой семантической сети на иерархии семантической классификации // Вестник Сибирского государственного аэрокосмического университета. - 2014. - № 2. - С. 44-50.
8. Личаргин Д.В., Таранчук Е.А. Иерархическая структура учебного электронного курса и его вариабельность для обучения иностранному языку // Дистанционное и виртуальное обучение. – 2011. – № 4. – С. 56-75.
9. Личаргин Д.В., Трушакова А.И., Сафонов К.В., Бачурина Е.П. Разработка системы рекурсивных порождающих грамматик для решения задачи автоматического построения интонационных шаблонов языковых выражений // Вестник Сибирского государственного аэрокосмического университета. – 2014. - № 5. – 11 с.
10. Полякова О.С., Подлесный А.О., Личаргин Д.В., Кравченко М.В. Оценка расстояния в семантическом и грамматическом пространстве между отдельными языковыми единицами и фрагментами текстов // Современные проблемы науки и образования. – 2014. – № 6; URL: www.science-education.ru/120-15802.
Широкое использование информационных технологий в сфере образования обусловлено современным уровнем развития методики обучения и компьютерной техники.  Применение программного и технического обеспечения предоставляет большие возможности в традиционном обучении. Электронные образовательные ресурсы – важные компоненты, образующие информационно-образовательную среду. Именно образовательные ресурсы представляют собой базу для обеспечения высокого качества прохождения учащимися учебного процесса [8].

Преимущества использования электронных обучающих программ и ресурсов состоят в том, что:

1)        учащиеся имеют доступ к процессу обучения в подходящее им время и в удобном месте;

2)        имеет место нужное соотношение самостоятельной работы и контакта с преподавателем;

3)        независимость от места проживания и отсутствие временных и финансовых расходов на транспорт;

4)        возможность обеспечения индивидуального графика обучения [10].

В настоящее время практически в каждой научной дисциплине применяют электронные ресурсы или издания. В традиционном учебном процессе активно используется интеграция электронных образовательных ресурсов на базе сетевых технологий.

В данной работе рассматривается использование векторных порождающих грамматик при генерации учебных материалов по фонетике языка.

На сегодняшний день широко распространены и разрабатываются разнообразные системы электронных обучающих ресурсов [1]. Разработка требует от преподавателя увеличения затрат времени на создание учебного материала, что затрудняет реализацию индивидуальной траектории обучения студентов [3; 4]. При этом студенты, изучающие иностранные языки, также испытывают трудности с изучением правил чтения текстов на иностранных языках. Возникла задача максимально сократить время разработки курсов и материалов по фонетике иностранного языка.

Актуальность состоит в необходимости преодоления  недостаточно высокого уровня навыков аудирования у студентов высших учебных заведений, что не дает возможность осуществления беглой коммуникации в англоязычной среде с минимальным количеством фонетических ошибок.

Исследования затрагивают такие аспекты предметных областей, как информатика, компьютерная лингвистика, математика и математическая логика [2; 5-7].

Грамматики Хомского (порождающие грамматики) это классический способ, при помощи которого можно определить язык через порождающую процедуру.

Порождающая грамматика нужна для вывода (порождения) цепочки языка из некоторой первоначальной цепочки с помощью обусловленных правил подстановки. Порождение представляет собой пошаговый процесс получения новой цепочки из составленной на предыдущем шаге, с использованием правил замены.

Порождающая грамматика задается четверкой: G<S, T, N, R>, где S – начальный символ порождающей грамматики G, T – множество терминальных символов (совпадает с алфавитом языка, задаваемого грамматикой), N – множество нетерминальных символов (нетерминальные символы используются в промежуточных порождениях цепочек), R – множество правил трансформации одной строки в другую [9].

Рассмотрим использование векторного представления для порождающих грамматик.

Векторное представление слова W: words à Rn — параметризованная функция, отображающая слова из некоторого естественного языка в векторы большой размерности.

Однако вопрос нуждается в дальнейшем исследовании, так как векторные представления слов и фраз способны значительно улучшить качество работы некоторых методов автоматической обработки естественного языка.

Был разработан программный продукт, который может помочь студентам и лицам, изучающим иностранные языки, овладеть навыками чтения текста на иностранном языке за минимальное время, на основе опоры в виде практической и/или международной транскрипции (рис. 1).

Рис. 1. Генерация транскрипции английского языка

            Предлагается модель программы генерации правильной и неправильной транскрипции (рис. 2).

Цель данной работы состоит в разработке принципа применения векторного представления для порождающих грамматик в целях генерации фонетических описаний английских предложений, позволяющих обеспечить успешность навыков аудирования студентов.

Задачи данной работы заключаются в:

1)                                разработке правил порождающих грамматик, с помощью которых можно составить допустимые последовательности элементов, образующие все соответствующие грамматике предложения языка;

2)                                разработке синтаксиса фонетических описаний. Поиск новых методов анализа и синтеза речи. Синтаксис должен обеспечить как однозначность, так и точную передачу нюансов при фонетической трансформации звуковых оттенков фраз;

3)                                апробации и эксперименте по увеличению эффективности процесса генерации данного материала и их использования.

             Основная идея работы заключается в использовании векторного метода для порождающих грамматик, позволяющего обеспечить «векторную транскрипцию» с учетом вариативности интонации.

Подчеркнем, что количество эмоциональных синонимов в языке огромно, и они захватывают очень многие пласты лексики литературного языка. Вариации эмоциональных значений часто сочетаются с небольшим видоизменением логического значения слов.

 

Рис. 2. Генерация транскрипции на немецком языке

         Поэтому важно учитывать данные критерии при составлении транскрипции слов: напряженность, резкость, временной компонент (время до и после произнесения звука) и слитность (с плавными переходами между звуками) и мн. др.

На основе таких параметров составляется вектор признаков классификации. Признаки одного ряда могут иметь тождественные элементы с предыдущими, что обозначается знаком «<», что делает текст векторного фонетического описания более читабельным.

T= t1[напряженность, резкость, временной компонент, слитность], t2[напряженность, резкость, временной компонент, слитность],…, tn[напряженность, резкость, временной компонент, слитность], где T – слово языка, t1… tn – буква с рядом критериев.

Признаки классификации. Вектор признаков классификации задается перечислением множества значений фонетических элементов и их оттенков для каждого уровня классификации, то есть для каждого элемента вектора отдельно.

Рис. 3. Блок-схема алгоритма генерации векторной транскрипции

          Приведем некоторые примеры использования векторных порождающих грамматик. Грамматики Хомского, традиционно имевшие вид AB..CàDE..F, могут быть записаны в виде: AiBi..CiàDiEi..Fi. Значениями элементов векторов могут быть как константы, так и переменные. Например: [напряженность, x…y, z...w] à [резкость, x…y, q…r] + [временной компонент, x…y, z…w].

          Новизна работы состоит в сочетании нового принципа генерации строк с линейно представленной матричной структурой и подхода к изучению фонетических особенностей речевого строя английского языка. Выше приводится общий алгоритм работы программы (рис. 3).

            В рамках данной работы предлагается использование векторных порождающих грамматик при генерации учебных материалов по фонетике языка, которая позволяет эффективно и максимально быстро изучить язык, а также понять его эмоциональную сторону. Успешно разрабатывается программа генерации транскрипции на различных европейских языках в учебных целях. Программа на сегодняшний момент генерирует стандартную транскрипцию языка, по выбору пользователя, практическую или международную.

            Рассмотрим различные признаки звуковых элементов при их произношении. Так, например, при произношении фразы: «It’s time to have a bite», возможна различная раскладка векторов описания фонетических оттенков звуковых элементов языка.

Таблица 1

Описание оттенков звуков при произношении в различных ситуациях

Звук

Длина

Форма при произношении

Тенденции при произношении

До

В начале

В середине

В конце

После

i

Как у взрывного звука

Готовясь к t, более высоко

Не вибрирует, грубовато, суховато

Резкое, слышное начало

Четко, громко

Менее громко и четко, гладко

Едва слышно, язык с разворотом вверх

Пауза с долю взрывного звука

t

Как у взрывного звука

Взрыв тонкой и узкой расслабленной перемычки

Очень маленькая амплитуда открытия щели

-

Щелчок

Сильный выдох в узкую щель

-

-

s

Как протяженность предыдущего звука

Тонкая и широкая щель

Вибрация при звучании

-

-

Узкая тонкая щель

Окончание выдоха, уход с места произношения

Пауза в 2-3 звука

t

Больше, чем у взрывного звука

Резкий взрыв напряженной перемычки

Полное открытие щели с переходом в открытую позицию

Напряженная пауза

Резкий приступ

Сильный выдох в расширяющуюся щель, придыхание

Усиливающееся придыхание

-

Дольше, чем у среднего дифтонга

На одном скольжении

С эмоцией изящества и игры

Язык еще загнут вверх, гласный уже слышен

Язык скользит вверх, челюсть вниз

Язык скользит вверх, челюсть останавливается

Язык вертикально «поглаживает» позицию i

Челюсть еще более смыкается

m

Как у гласной с затуханием

Легко сомкнутые губы

Монотонная, но яркая назальная вибрация

Губы смыкаются, мягкое небо начинает открываться

Губы сомкнуты, мягкое небо открыто

Пауза

             Как видно из таблицы, каждому звуковому элементу соответствуют определенные характеристики, как общие, так и соответствующие особым этапам звучания. В таблице приводятся лишь некоторые элементы вектора признаков для элементов звучания фраз на естественном языке.

           Характеристики каждого звука определяются соотнесением всей фразы к различным классам и иерархии подклассов речевого высказывания по таким признакам классификации, как пол, комплекция, тип говорящего, его настроение, выражаемая система отношений и эмоциональной оценки.

В заключение необходимо отметить, что предложенная модель генерации является эффективным средством порождения и позволяет автоматизировать процесс генерации транскрипции с учетом вариативности интонации и особенностей произношения.

Рецензенты:

Ченцов С.В., д.т.н., профессор, заведующий кафедрой «Системы автоматики, автоматизированного управления и проектирования» Сибирского федерального университета, г. Красноярск;

Бронов С.А., д.т.н., профессор, руководитель научно-учебной лаборатории систем автоматизированного проектирования кафедры «Системы искусственного интеллекта» Сибирского федерального университета, г. Красноярск.

 


Библиографическая ссылка

Личаргин Д.В., Сотникова В.В., Усова А.А., Бутовченко В.В. К ПРОБЛЕМЕ ГЕНЕРАЦИИ РАСШИРЕННОЙ ФОНЕТИЧЕСКОЙ ТРАНСКРИПЦИИ НА ОСНОВЕ ВЕКТОРНЫХ ПОРОЖДАЮЩИХ ГРАММАТИК // Современные проблемы науки и образования. – 2015. – № 2-1. ;
URL: https://science-education.ru/ru/article/view?id=20933 (дата обращения: 16.04.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674