авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 ||

«Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН ...»

-- [ Страница 2 ] --

Однако в речи каждого диктора встретились внеязыковые элементы с частотой основного тона Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи превышающей среднее значение. Во-вторых, за исключением элемента h.e у всех хезитаций наблюдается довольно стабильное значение частотой основного тона. Поскольку вокализованные участки нехарактерны для артефактов речи, то и значение частоты основного тона в них крайне нестабильное.

Также были проведены эксперименты по распознаванию выявленных внеязыковых элементов.

Точность распознавания всех элементов составила 86,98 %. В таблице 5 показаны результаты распознавания каждого внеязыкового элемента.

Таблица 5. Анализ результатов распознавания внеязыковых элементов Распозна- Результат распознавания, % ваемый ar.brth ar.clth ar.smck h.a h.au h.e h.em h.eu h.m h.me h.mne элемент ar.brth 0,60 0,00 0,00 0,00 0,60 0,30 0,00 1, 0,00 0, 96, ar.clth 2,00 0,00 0,00 0,00 0,00 0,00 0,00 4, 0,00 0, 94, ar.smck 0,00 0,00 100,00 0,00 0,00 0,00 0,00 0,00 0, 0,00 0, h.a 0,00 0,00 0,00 100,00 0,00 0,00 0,00 0,00 0, 0,00 0, h.au 0,00 0,00 0,00 0,00 100,00 0,00 0,00 0,00 0, 0,00 0, h.e 1,23 0,82 0,00 3,29 0,00 3,91 5,56 5, 0,62 0, 79, h.em 0,00 0,00 0,00 2,38 0,00 4,76 0,00 7, 0,00 0, 85, h.eu 0,00 0,00 0,00 0,00 0,00 6,25 0,00 0, 0,00 0, 93, h.m 7,59 5,06 0,00 0,00 0,00 3,80 2,53 0, 0,00 0, 81, h.me 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0, 100,00 0, h.mne 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0, 0,00 100, Из таблицы видно, что точность распознавания пяти элементов (ar.smck, h.a, h.au, h.me, h.mne) составила 100 %. Хуже всего распознавалась заполненная пауза h.e, точность распознавания которой оказалась равной 79,22 %. Как было видно из таблицы 4 элемент h.e имел сильную вариативность значений частоты основного тона, что в конечном итоге привело в ухудшению точности его распознавания. Этот элемент путался с элементами: ar.brth, ar.clth, h.a, h.em, h.eu, h.m, h.me. В дальнейшем, вероятно, следует проверить точность сегментации элемента h.e в корпусе и при необходимости ввести дополнительные варианты произнесения этого типа хезитаций. Также точность распознавания ниже 90 % оказалась у элементов h.em, h.m, при распознавании эти элементы путались между собой.

Проведенные эксперименты показали достаточно высокий процент распознавания внеязыковых элементов. В дальнейшей работе планируется увеличить количество моделируемых внеязыковых элементов и провести эксперименты по проверке правильности отделения внеязыковых элементов от ключевых слов. Работа выполнена в рамках НИР СПбГУ № 31.37.103.2011 и федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно технологического комплекса России на 2007-2013 годы» (ГК № 11.519.11.4025).

ЛИТЕРАТУРА Кипяткова И.С. Система идентификации акустических событий в интеллектуальном пространстве // 1.

"Информационно-измерительные и управляющие системы". 2011. №11. Т.9. С. 27-30.

Лингвистический энциклопедический словарь / под ред. В. Н. Ярцевой. М.: Советская энциклопедия. 1990.

2.

685 с.

Пилипенко В.В., Ладошко О.Н. Аннотация и учет речевых сбоев в задаче автоматического распознавания 3.

спонтанной украинской речи // Искусственный интеллект. 2010. №3. C. 238-248.

4. Karpov A., Kipyatkova I., Ronzhin A. Very Large Vocabulary ASR for Spoken Russian with Syntactic and Morphemic Analysis // In Proc. INTERSPEECH-2011 International Conference, ISCA Association, Florence, Italy. 2011. pp. 3161-3164.

Ронжин А.Л., Евграфова К.В. Анализ вариативности спонтанной речи и способов устранения речевых 5.

сбоев // Известия высших учебных заведений. Гуманитарные науки. 2011. Т. 2. Вып. 3. С. 227-231.

Подлесская В.И., Кибрик А.А. Самоисправления говорящего и другие типы речевых сбоев как объект 6.

аннотирования в корпусах устной речи // Научно-техническая информация. Серия 2. 2007. № 2. С. 2-23.

7. Stouten F., Duchateau J., Martens J.-P., Wambacq P. Coping with disfluencies in spontaneous speech recognition:

acoustic detection and linguistic context manipulation // Speech Communication. 2006. Vol. 48. pp. 1590-1606.

8. Masataka G., Katsunobu I., Satoru H. A Real-Time System Detecting Filled Pauses for Spontaneous Speech // IEICE Transactions on Information and Systems. 2000. Pt.2. Vol. J83-D-2. No.11. pp. 2330-2340.

9. Boersma P., Weenink D. 2006. Praat: doing phonetics by computer (Ver. 5.3.13).

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи УДК 534:612.014. И.И. Кириченко МОДЕЛИРОВАНИЕ ТЕСТОВЫХ СИГНАЛОВ ТОНАЛЬНОЙ И РЕЧЕВОЙ АУДИОМЕТРИИ Технологический институт Южного Федерального университета Россия, 347928, г. Таганрог, ГСП-17а, пер. Некрасовский, Тел.: (8634) 37-17- E-mail: igork@fep.tti.sfedu.ru В работе рассмотрены вопросы моделирования тестовых сигналов для тональной аудиометрии и анализа речевых сигналов на основе вейвлет-преобразования. Показана возможность применения разработанных тестовых сигналов для исследования методами тональной и речевой аудиометрии. В работе представлены результаты моделирования и формирования тональных тестовых сигналов и анализа речевых сигналов с использованием вейвлет-преобразования.

Анализ методов аудиометрии и результатов компьютерного анализа тональных аудиограмм показали, что для создания условий ранней диагностики заболеваний слухового анализатора, необходимо совершенствовать методы, алгоритмы и программные средства биотехнических систем диагностики и интерпретации данных компьютерного анализа, полученных в ходе исследования [1, 2, 3]. База тестовых сигналов содержит оцифрованные тональные сигналы заданного динамического диапазона и диапазона частот в виде двумерного массива с адресацией по индексам i, j. Установка исходных параметров определяет инициализацию всей системы компьютерного анализа – установку переменных работы программы, зоны временных интервалов воздействия, начальный уровень амплитуды, определяющий верхний и нижний порог работы, параметры обратной связи «пациент-врач», интерфейс тестирования и общую информацию. Циклы переключения частоты и амплитуды формируют диагностический сигнал, воздействующий на пациента. Реакция пациента в виде обратной связи (односторонней или двухсторонней, в зависимости от методики исследования) поступает в биотехническую систему компьютерного анализа, и по окончании теста – в электронную карту пациента [4].

Обобщенный алгоритм теста тональной аудиометрии рассмотрен в [3]. В каждом интервале динамического диапазона (в рассматриваемом примере их 10: от 0дБ до –45дБ) тональный сигнал воспроизводится в течение не менее 1 сек, чтобы пациент успел оценить и отреагировать на акустическое воздействие. Таким образом определяется чувствительность пациента на данной частоте. Для остальных частот используется аналогичный алгоритм тестирования, после чего строится аудиограмма воздушной или костной проводимости, которая заносится в базу данных для компьютерного анализа аудиограмм.

Количество зон определяется динамическим диапазоном и составляет до 20 – 25 (при шаге 5дБ, что в целом соответствует от 95дБ до 120дБ). Следует отметить, что использование компьютерного формирования тестового сигнала обеспечивает более высокую точность установки по амплитуде (90 дБ) и частоте (менее 0,01%).

На рис. 1 показана структура тестового сигнала для тональной аудиометрии со следующими характеристиками: частота 1 кГц, время теста 10 сек, шаг изменения динамического диапазона 5дБ/сек, динамический диапазон 45 дБ, отношение сигнал/шум 96 дБ. Большее влияние на качество тонального сигнала определяет не частота дискретизации, а разрядность. При этом на восприятие звукового сигнала человеком оказывает влияние вид сигнала. Так, разницы между восприятием тонального синусоидального сигнала с разной частотой дискретизации и разрядностью практически не наблюдается.

Количественная оценка слуховой функции начинается с определения расстояния между произносящим звуки, слова или цифры исследователем и ухом испытуемого, при котором он слышит речь – шепотную, разговорную, громкую или крик. При этом второе ухо закрывается. Применяются также различные способы маскировки в случаях несимметричной потери слуха и изучения хуже слышащего уха (способы Венгера, Кайзера, Барани и др.). Подобная диагностика речью широко применяется при массовых обследованиях в случаях отсутствия специальной аппаратуры для оценки степени сохранения слуха. Основная проблема таких исследований – отсутствие стандартизации интенсивности предъявляемых речевых сигналов [1, 2]. Для речевого сигнала из-за его широкого спектра при уменьшении как частоты, так и разрядности, ухудшается его восприятие. Особую роль в данном случае играет величина шумовой составляющей по всему спектру. Главной математической основой спектрального анализа является преобразование Фурье, которое связывает пространственный или временной сигнал (либо некоторую модель этого сигнала) с его представлением в частотной области. Но преобразование Фурье дает информацию только о частоте, которая присутствует в сигнале и не дает никакой информации о том, в какой промежуток времени эта частота присутствует в сигнале.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Рис. 1. Структура тестового сигнала для тональной аудиометрии Оконное преобразования Фурье, в отличии от обычного преобразования Фурье, уже является функцией от времени, частоты и амплитуды. То есть она позволяет получать характеристику распределения частоты сигнала (с амплитудой) во времени. Но главной проблемой в использовании оконного преобразования Фурье для получения частотно-временной характеристики сигнала является так называемый принцип неопределенности Гейзенберга, который возникает для параметров времени и частоты сигнала [5, 6]. В связи с этим возникает проблема разрешающей способности. Вейвлет преобразование было создано как инструмент, который решает проблему неопределенности Гейзенберга для построение частотно-временных характеристик сигнала.

Рис. 2. Исходный сигнал В данной работе представлены результаты вейвлет-преобразования одного сигнала с помощью различных материнских вейвлетов. В качестве исходного сигнал взят звук «Т», записанный с помощью программы AdobeAudition (рис. 2, 3). Основная идея вейвлет-преобразования заключается в том, чтобы Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи для поиска локальной особенности использовать разложение по функциям, похожим на искомую особенность.

Был проведен анализ исходного сигнала на основе вейвлет-преобразований: вейвлет Гаусса 1-го порядка;

вейвлет Мейера;

вейвлет Морле;

вейвлет Хаара 1-го порядка;

вейвлет Добеши 1-го порядка.

Результаты анализа исходного сигнала с использованием наиболее часто встречающиеся вейвлет преобразований показаны на рис. 4 – 6.

Рис. 3. Спектр исходного сигнала Рис. 4. Результат вейвлет преобразования сигнала (вейвлет Гаусса 1-го порядка) Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Рис. 5. Результат вейвлет преобразования сигнала (вейвлет Мейера) Рис. 6. Результат вейвлет преобразования сигнала(вейвлет Морле) ЛИТЕРАТУРА 1. Джафек Б.У., Старк Э.К. Секреты оториноларингологии. Пер. с англ. М. – СПб.: БИНОМ – Невский диалект. – 2001. – 624 с.

2. Палчун В.Т., Крюков А.И. Отоларингология: Руководство для врачей. – М.: Медицина, 2001. – 616 с.

3. Бондаренко Р.П., Кириченко И.А. Биотехническая система для аудиометрии с нелинейным преобразованием речевого сигнала / Известия ТРТУ.- Таганрог: Изд-во ТРТУ, 2006. №11, С.160-161.

4. Бондаренко Р.П., Кириченко И.И., Рябец М.Н. Разработка базы тестовых сигналов для аудиометрии // Известия ЮФУ. Технические науки. – 2009. – №7(96). – С. 241-243.

5. Фант Г. Акустическая теория речеобразования. М.: Наука.- 1964. – 264с.

6. Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. М: Радио и связь. – 1981 – 496 с.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи УДК: 612. Ляксо Е.Е, Григорьев А.С., Куражова А.В., Гайкова Ю.С., Бедная Е.Д., Чеклярова Я.В.

АКУСТИКА ДЕТСКОЙ РЕЧИ:

ДИНАМИКА СПЕКТРАЛЬНЫХ ХАРАКТЕРИСТИК ГЛАСНЫХ Санкт-Петербургский государственный университет, Биолого-почвенный факультет 199034, Санкт-Петербург, Университетская наб., 7- Тел. (812)3213361;

Факс (812) e-mail: lyakso@gmail.com Проанализированы акустические характеристики гласноподобных в вокализациях и гласных в слоговых конструкциях и в словах 100 детей в возрасте от 3 месяцев до 7 лет. Анализируемый материал составил гласноподобных и гласных. Выявлены изменения в значениях и вариабельности длительности, частоты основного тона (ЧОТ) и формантных частот гласных в зависимости от возраста детей. Полученные на материале русского языка данные подтверждают имеющиеся сведения на разных языках, о том, что уменьшение длительности стационарных участков и частотных характеристик гласных с возрастом является одной из основных тенденций развития акустической стороны речи у нормально развивающихся детей.

Серия наших исследований посвящена изучению становления акустического аспекта речи в онтогенезе. Цель настоящей работы заключалась в изучении динамики акустических характеристик гласноподобных из вокализаций и гласных из слов детей первых семи лет жизни.

При анализе гласноподобных звуков детей первого года жизни, показано, что выделенные в вокализациях детей, на основе перцептивного анализа и описанные посредством символов международного фонетического алфавита (МФА) и САМПА, гласноподобные звуки характеризуются высокими значениями частоты основного тона (ЧОТ, F0) и частот двух первых формант (F1 и F2). Их значения занимают обширные области расположения на двухформантной плоскости, захватывающие области различных гласных. Значения ЧОТ младенческих гласноподобных соответствуют значениям F гласных [o], [u], [i] взрослой речи. Тенденция к снижению ЧОТ наблюдается со второго полугодия жизни детей преимущественно для гласноподобных звуков, продуцируемых в спокойном состоянии. Значения F и F2 гласноподобных звуков детей первого месяца жизни занимают на двухформантной плоскости высокочастотные области. Для пар звуков [o], [u] и [e], [ы] – области их расположения практически сливаются;

для гласноподобных [I], [a] - перекрываются по F1, и частично по F2 [1]. С шестимесячного возраста выявляются различия (р 0,01 в значениях второй форманты звуков [a] и [e], к девятому месяцу – в значениях первых формант (р0,05) [o] и [u] –гласноподобных звуков [2].

При анализе речепродукции детей второго года жизни критерием правильности распознавания слова аудиторами явилось значение, определяемое матерью ребенка. Простые слова легко распознаются в возрасте 1 год 3 месяца и 1 год 6 месяцев. Слова, состоящие из трех разных слогов или содержащие два последовательно следующих друг за другом согласных звука, распознаются хуже. Преобладающим в совокупности распознанных аудиторами гласных из слов детей оставался, как и на первом году жизни, гласный [а]. Не выявлено четкой динамики улучшения распознавания гласных звуков с увеличением возраста детей, при тенденции к улучшению распознавания гласных [e] и [o] ко второй половине второго года жизни детей. На двухформантной плоскости гласные [a], [e], [ы], [o] занимают соответствующие области. Значения F1 для гласного [I] смещены в область гласного [e]. Это обусловлено тем, что значения F0 остаются высокими. Следует отметить совпадение значений формант гласных [o] и [u] на двухформантной плоскости и расположение их в области гласного [o]. Значимых различий по значениям формантных частот гласных не выявлено, что возможно связано с особенностями из произнесения в словах.

Подобная тенденция сохраняется и для значений двух первых формант гласных из слов детей третьего года жизни. К концу третьего года жизни дети четко произносят слова, состоящие из 3-х и 4-х слогов, комбинируя их во фразы из 3-5 слов. На третьем году жизни формируется ударность гласного.

Длительность ударного гласного больше чем безударного для всех гласных на уровне тенденции.

Характерной особенностью гласных из слов трехлетних детей является уменьшение разброса значений, преимущественно по второй форманте. Это может свидетельствовать о формировании у ребенка определенного произносительного эталона ударного и безударного гласного. Сохраняющиеся высокие значения ЧОТ приводят к тому, что гласные [I], [u], [ы], при их четкой идентификации в словах (независимо от ударного или безударного положения), не могут быть описаны только на основе абсолютных значений двух первых формант [1]. Начинается формирование оппозиции твердости мягкости согласных фонем, которое проявляется в характеристиках гласных, следующих за ними. Для Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи слов, произнесенных детьми в три года, обнаружена тенденция к появлению значимых различий (0,05p0,1) между относительными значениями F2 в неназализованном переднеязычном контексте для мягких и твердых согласных. В заднеязычном и назализованном переднеязычном контексте между этими значениями обнаружены значимые различия (p0,05) [3]. Прослеживается тенденция (0,05p0,1) к появлению различий между абсолютными значениями F2 на участке перехода от согласного, оцененного аудиторами как твердый, к гласному [a], и перехода от мягкого согласного к гласному [и], что свидетельствует о начале формирования артикуляционной модели твердых согласных. При сравнении значений F2 на переходном и стационарном участках в переднеязычном неназализованном контексте выявлены значимые различия между гласным [a] после твердого (по оценке аудиторов) согласного и гласным [i]. (Различия в словах детей первого полугодия третьего года жизни – 0,02p0,03;

в словах, произносимых детьми во втором полугодие третьего года жизни - 0,04p0,05). Аналогичных различий между гласным [a] после мягкого согласного и гласным [u], между гласными [a] после согласных, по разному оцененных аудиторами, не обнаружено [3].

В возрасте 4 лет в речи всех детей длительность ударного гласного и его стационарного участка, а также их разность, выше, чем для безударного гласного. В 5 лет у всех детей разница между длительностью ударного гласного и его стационарного участка выше, чем для безударного гласного. К четырем годам сформировано словесное ударение, ударный гласный выделяется на основе длительности и ЧОТ. Отличие ударных гласных по ЧОТ у некоторых детей в 4 года более выражено, чем в 5 лет, что позволяет предположить, что в речи этих детей наблюдаются те признаки, с помощью которых обычно оформлено ударение в русском языке. Более высокие значения ЧОТ ударного гласного по сравнению с безударным гласным также воздействуют на расположение безударных гласных на двухформантной плоскости. На акустические характеристики безударного гласного большое воздействие имеет контекст, что коррелирует с его редукцией по длительности. К пятилетнему возрасту расположение значений F1 и F2 на двухформантной плоскости остается неинформативным [4].

Значения ЧОТ ударных гласных в словах детей 6 и 7 лет значимо не различаются при тенденции к уменьшению в 7 летнем возрасте детей. Длительность ударных гласных значимо выше, чем безударных в словах 6 и 7 летних детей. К 7 годам ударный гласный в словах выделяется по значениям длительности, признака, релевантного для русского языка. Эффекты коартикуляции, исследуемые с учетом и без учета контекста, выражены в 6 и 7 лет [5].

Таким образом, в каждом из описанных исследований проводилось сравнение характеристик гласных только в пределах анализируемых возрастных периодов. В этой связи целью настоящей работы явилось выявление динамики спектральных характеристик гласных.

Осуществлен анализ вокализаций детей первого года жизни, слоговых конструкций и слов детей второго года жизни и слов из речи детей 3-7 летнего возраста. Запись вокализаций и речевого материала детей проведена в период с 2000 – 2012 гг. Записывающая аппаратура менялась на протяжении этого периода: 2000 – 2001 гг. - магнитофон -«Pioneer» CT-W704RS, микрофон-MD-59;

2002-2005гг – “Marantz PMD222”, с 2007 г - цифровой магнитофон “Marantz PMD660” с выносным микрофоном “SENNHEIZER e835S”.

Анализируемый материал составили лонгитюдные записи 5 детей с 3х до 84 месяцев;

для каждого ребенка по 10 вокализаций в 3 и 12 месяцев, по 10 слов и речеподобных конструкций – в 24 месяца;

по фраз, содержащих одно – трех слоговые слова - в 36 месяцев;

по 100 слов – в 48- 84 месяца. Записи вокализаций 30 детей первого года жизни – по 50 вокализаций в 3,6,9, 12 месяцев;

по 40 слов для детей 2, 3 и 4 летнего возраста, по 100 слов 15 детей 5 лет, 10 детей 6 и 7 лет. Общее количество проанализированных гласноподобных и гласных детей составило 85000 звуков, материал взрослой речи – 50 звуков.

Перцептивный анализ звуков и слов детей осуществлялся взрослыми – носителями русского языка: 3 -12 мес. – 137 аудитора, 24 мес. – 103 аудитора, 36 мес. – 137 аудиторов, 48-60 мес. – аудиторов;

72-84 мес. – 100 аудиторов. Если более 75% аудиторов распознавали гласные (в вокализациях и в словах), то эти гласные анализировали.

В звуковом редакторе «Cool Edit» определяли длительность гласного и его стационарного участка, на котором считали значения частоты основного тона (ЧОТ, F0), двух первых формант (F1, F2).

По этим же параметрам по критерию Манна-Уитни сравнивали гласные /a/, /i/ и /u/, взятые после согласных: /k/ и /d/ для /a/, /b/ и /g/ для /u/ и /t’/ для /i/.

Статистическую обработку проводили с использованием непараметрического критерия Манна Уитни.

Длительность гласноподобных звуков детей снижается на уровне тенденции к 12 месячному возрасту, длительность гласных в словах детей 2 – 4 лет имеет максимальные значения и значимо Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи снижается к 5 годам, достигая минимальных значений к 7 годам (рис. 1.А). К трехлетнему возрасту ударный и безударный гласный в словах различаются по длительности. Начиная с этого возраста и до лет, длительность ударного гласного и его стационарного участка статистически значимо выше длительности безударного гласного (рис.1 Б). Исключение составляют гласные из слов детей пятилетнего возраста, в которых длительность стационарного участка ударного гласного ниже длительности стационарного участка безударного.

гл_стац гласный А Б 240 уд_стац уд * длительность гласного, мс длительность гласного, мс б/уд_стац * б/уд 160 *** *** * * 100 3 12 24 36 48 60 72 84 3 12 24 36 48 60 72 возраст детей, мес возраст детей,мес Рис.1 Длительность гласноподобных и гласных из слов детей с 3 месяцев до 7 лет.

А – длительность гласных, Б – длительность стационарных участков гласных.

По горизонтали - возраст, мес.;

по вертикали – длительность, мс. Толстая линия – данные для гласного (А) и его стационарного участка (Б), пунктир – тоже для ударного гласного, тонкая линия – тоже для безударного гласного.

Выявлена тенденция к снижению значений ЧОТ с возрастом ребенка, при значимом понижении к 7 годам (рис.2). При сравнении значений ЧОТ между ударными и безударными гласными без учета контекста и качества гласного показано, что различия между ними более выражены в 3, 4 и 6 лет, чем в лет. Значения ударных и безударных гласных значимо не различаются в словах детей 7 летнего возраста.

уд гласный Б 600 б/уд А стац ** ** * F0, Гц F0, Гц ** 36 48 60 72 3 12 24 36 48 60 72 возраст детей, мес возраст детей, мес Рис.2. Значение ЧОТ гласноподобных и гласных из слов детей с 3 месяцев до 7 лет.

А – значение ЧОТ для гласных (на всем протяжении) и их стационарных участков, Б – тоже для ударных и безударных гласных (на стационарном участке). Светлые столбики – данные для гласного, белые – для стационарного участка, черные – ударный гласный, наклонная штриховка – безударный гласный. * - p.05, ** p. Попарное сравнение гласных по значениям двух первых формант показало, что первые различия отмечаются при формировании системы гласных звуков уже на первом году жизни, однако включение гласных в слова, вновь приводит к их нечеткой артикуляции. По частотным характеристикам гласные семилетних детей отличаются от соответствующих характеристик гласных взрослой речи, при наименьшем отличии при сравнении гласных [a/u], [a/o], [u/e], [o/e] и наибольшем - гласных [i/e], [u/o] (табл. 1).

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Таблица 1. Сравнение гласноподобных из вокализаций детей первого года жизни и гласных из слов детей 2-7 лет и взрослых по значениям первой и второй формант.

Возраст/значения Гласные F1, F2, Гц [i]/[a] [i]/[u] [i]/[o] [i]/[e] [a]/[u] [a]/[o] [a]/[e] [u]/[o] [u]/[e] [o]/[e] 3 мес. F1 - - - - - - - - - F2 - - - - - - - - - 6 мес. F1 - - - - - - - - - F2 - - - - - - + - - 9 мес. F1 - - - - - - - + - F2 - - - - - - + - - 12 мес. F1 - - - - - - - - - F2 - + - - - - + - - 24 мес. F1 - - - - - - - - - F2 - ++ - - - - - - - 36 мес. F1 - - - ++ - - - - F2 ++ +++ - + - - - - 48 мес. F1 ++ - - - - - - - F2 +++ +++ - + - - - - 60 мес. F1 +++ + - - + +++ +++ - - F2 +++ +++ + - + ++ +++ - + ++ 72 мес. F1 + + - - - _ - - - F2 +++ +++ +++ - - + +++ - - +++ 84 мес. F1 - - - - +++ +++ + - + F2 ++ ++ +++ - + +++ +++ - ++ +++ Взросл. F1 +++ +++ +++ +++ +++ ++ +++ +++ +++ F2 +++ +++ +++ - +++ ++ +++ +++ +++ +++ Примечание:

- - различия не значимы;

+ - различия значимы (0,05p0,01);

++ - различия очень значимы (0,01p0,001);

+++ - различия экстремально значимы (p0,001);

p - непараметрический критерий Манна-Уитни.

Таким образом, в ходе лонгитюдного исследования показано, что к семи годам формируется признак длительности ударного гласного, релевантный для русского языка, но артикуляционная модель гласных не сформирована.

В этой связи перспективным является продолжение исследования возрастной динамики спектральных характеристик гласных и сравнение характеристик ударных и безударных гласных с учетом контекста и без него.

Работа выполнена при частичной финансовой поддержке РГНФ (проект 11-06-12019в) и тематического плана СПБГУ (1.0.133.2010).

ЛИТЕРАТУРА Ляксо Е.Е., Челибанова О.В., Громова А.Д., Новикова И.В., Галунов В.И. Формирование 1.

помехоустойчивости речи в раннем онтогенезе // Сборник трудов XIV сессии РАО, Акустика речи, медицинская и биологическая акустика. М.: ГЕОС., 2003. Т.3. С. 101- Галунов В.И., Ляксо Е.Е. Формирование акустического образа звуковых сигналов на ранних этапах развития 2.

// Сборник трудов XI сессия РАО, Акустика речи и биологическая акустика. М.: ГЕОС., 2001. Т.3. С.20-24.

Ляксо Е.Е., Громова А.Д., Фролова О.Е., Романова О.Д. Акустический аспект формирования речи ребенка 3.

на третьем году жизни //Физиологический журнал. 2004. Т.90., №1 C.83- 4. Lyakso E., Gromova A. The acoustic characteristics of Russian vowels in children of 4 and 5 years of age // Psychology of Language and Communication, 2005. Vol. 9 № 2. P5 - 14.

5. Lyakso E., Frolova O., Grigoriev A. Acoustic Characteristics of Vowels in 6 and 7 Years Old Russian Children// Interspeech, 2009. P. 349-357.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи УДК 53.072. С.Д. Тиунов, Р.В. Мещеряков КЛАССИФИКАЦИЯ ЗВУКОВ РЕЧИ ДЛЯ ЗАДАЧИ ОБУЧЕНИЯ ИНОСТРАННОМУ ЯЗЫКУ Томский государственный университет систем управления и радиоэлектроники 634050 г. Томск, пр. Ленина, тел. (факс) (3822) 413-426;

E-mail: office@keva.tusur.ru В докладе предлагается подход к классификации звуков речи, основанный на математическом моделировании, который позволяет получать оценки близости двух аллофонов (произнесенного и эталонного) по различным информативным признакам. При данном подходе общая модель классификации конкретизируется путем задания некоторых признаков аллофонов, а также некоторой классификационной шкалы. Для оценки информативности признаков и применимости конкретизированной модели предлагается использовать статистический эксперимент. Приводится пример конкретной модели, а также планирования и результатов статистического эксперимента, выводы о возможности ее использования.

Математическое моделирование находит широкое применение в речевых технологиях. Одной из распространенных задач является оценка качества речи. В качестве примера рассмотрим систему обучения иностранному произношению. Обычный процесс работы студента с такой системой выглядит следующим образом: система предлагает ему произнести определенный звук (слово, фразу) из звукового строя иностранного языка, студент пытается произнести его, и система должна оценить качество произнесенного звука (слова, фразы) [2].

Исторически использование распознавателей речи в режиму усиленного выравнивания стало первым и основным методом обнаружения сегментных ошибок и было применено в первых работах по тренировке произношения [2, 5, 7]. Структура первых систем тренировки произношения показана на рисунке 1.

Рисунок 1. Структура первых систем тренировки произношения Выбор такого решения был вполне обоснованным, поскольку первые два блока (выделение параметров распознавание с усиленным выравниванием) к тому времени (середина 1990-х гг.) были реализованы в виде автоматических распознавателей речи. Такие системы работали следующим образом:

1. студент читает заданную фразу;

2. распознаватель речи в режиме усиленного выравнивания возвращает оценки уверенности;

3. оценки качества произношения звуков могут быть приняты равными оценкам уверенности, возвращенными распознавателем речи [2, 6], либо каким-либо образом получены из них [7];

4. обнаружение ошибок производится путем сравнения оценок качества произношения звуков с некоторым порогом: если оценка выше (ниже) порога, то звук считается правильным, иначе - неправильным. Порог может быть задан как единым для всех звуков [7], так и отдельно для каждого звука [2], а также вычислен из других параметров (например, длины фразы) [3].

Современные системы обучения иностранной речи используют аналогичный подход к оценке качества входной речи. Такой подход имеет существенный недостаток. Оценка «уверенности»

распознавателя является одномерной величиной и не содержит объяснения значения оценки (в частности, причины низкой оценки). Поэтому невозможно организовать корректирующую обратную связь обучающей системы и студента, а она имеет решающее значение в системах тренировки произношения [1].

Рассмотрим множество возможных объектов предметной области (например, звуков речи) X = {x}.

Предположим, что существует классификация g : X Y, которая сопоставляет каждому объекту x X единственную метку класса y Y, где множество Y состоит из конечного числа меток:

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Y = { y1,, yi,, ym }. Также предположим, что непосредственное осуществление классификации объектов является достаточно сложной задачей и может быть выполнено только человеком-экспертом.

Для того чтобы решить проблему автоматической классификации, вводится набор признаков - вычислимых функций f 1,, f j,, f n :

j = 1 n f j : X Z j Признак f j сопоставляет каждому объекту x X некоторое значение z j Z j. В отличие от функционала классификации g признаки f j являются вычислимыми функциями, и поэтому могут быть вычислены с помощью ЭВМ. Кортеж значений признаков объекта x является его признаковым описанием z :

z = f ( x) = ( f 1 ( x),, f j ( x),, f n ( x)) Множеством допустимых значений таких признаковых описаний z является следующее множество Z, которое также называется пространством признаков:

Z = Z 1 Z j Z n Рассмотрим подмножество X i = {x X : g ( x) = yi } -- класс объектов x, который имеет метку yi, где i = 1 m. Ему соответствует подмножество признакового пространства Z i = {z : z = f ( x), x X i }.

Очевидно, что подмножества X i не пересекаются (т.к. yi y j, если i j ), в то время как множества Z i могут пересекаться.

Для иллюстрации предположим, что n = 2, Z 1 = [ Z min, Z max ] R, Z 2 = [ Z min, Z max ] R. Тогда 1 1 2 признаковое пространство Z можно изобразить на плоскости (см. рисунок 2).

Задача классификации объекта может быть решена с помощью предложенной модели следующим образом. Пусть задан некоторый объект x X и необходимо произвести классификацию, то есть получить метку класса y = g ( x). Сперва вычислим признаковое описание объекта z = f ( x). Проверим, какие из множеств Z1,, Z m содержат z. Рассмотрим несколько случаев. Пусть в первом случае z содержится в единственном множестве Z i. Тогда заключаем, что объект x принадлежит классу X i, поэтому возвращаем метку yi. Пусть во втором случае z содержится в нескольких множествах Z i1,, Z ir. Тогда имеем несколько вариантов классов: X i1,, X ir, однако необходимо выбрать один - наиболее подходящий. Для этого можно использовать, например, вычисление некоторой метрики от точки z до каждого из множеств Z i или аппарат нечетких функций.

Рисунок 2. Пример применения модели для классификации объектов Аналогичным образом с помощью предложенной модели может быть решена задача оценки качества объекта. Пусть задан некоторый объект x X и некоторая метка целевого класса yi, и Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи необходимо дать оценку, насколько объект x близок к классу X i. Сперва вычисляется признаковое описание объекта z = f ( x). Тогда оценкой качества объекта станет значение некоторой метрики от точки z до множества Z i или значение функции принадлежности точки z нечеткому множеству Z i.

Для применения предложенной модели для классификации объектов необходимо:

1. определить множество возможных меток классов yi ;

2. определить набор признаков f ;

j 3. получить набор множеств Z i.

Множество меток классов, как правило, является наиболее очевидным: это набор меток (названий) возможных классов в рассматриваемой классификации. Набор признаков должен быть задан в виде вычислимых функций. Разумеется, что для успешной работы необходимо, чтобы набор признаков был достаточно информативен по отношению к классам объектов. Набор множеств Z i предлагается получить с помощью статистического эксперимента. Для этого необходима репрезентативная выборка объектов из множества X = X 1 X m. Каждому объекту x из выборки должны быть сопоставлены метка yi класса (проставляется экспертом) и признаковое описание z (вычисляется с помощью ЭВМ). Таким образом, множества Z i = {z : z = f ( x), x X i } получаются статистически.

Приведем пример приложения предложенной модели для задачи оценки качества произношения русских гласных. Определим метки классов гласных звуков: «А», «О», «Э», «У», «И». Как уже упоминалось, наиболее важным моментом является выбор набора информативных признаков. Гласные звуки характеризуются наиболее развитым описанием признаков: в частности, широко известны описания формант гласных [8, 4]. В статье [9] предложены признаки ударных гласных звуков: частоты двух наиболее интенсивных гармоник в области до 800 Гц и в области 800-2400 Гц. Данные признаки просто вычисляются, и по-видимому, являются информативными для описания ударных гласных звуков.

Для статистического эксперимента была сделана выборка следующей размерности: 18 дикторов ( мужчин, 9 женщин), по 7 фраз на диктора, и около 300 (в общей сложности) реализаций каждого звука. На рисунках 3, 4, 5 показаны графики рассеяния в координатах выбранных признаков. Из приведенных графиков можно сделать вывод, что в большинстве случаев гласные звуки можно различить по гармоникам максимальной интенсивности (рисунок 3), а в спорных ситуациях – по гармоникам, вторым по интенсивности (рисунки 4, 5).

Основное преимущество данного подхода от применяемых в существующих системах тренировки произношения – это возможность непосредственной организации корректирующей обратной связи и создание на этой основе интерактивных обучающих программ. В частности, благодаря сильной связи используемых признаков с подъемом и рядом гласного система тренировки может давать детальные (а не только общие) инструкции по изменению артикуляции прямо в процессе произношения. Создание таких инструментов – это основное направление дальнейшей работы.

Рисунок 3. График рассеяния в координатах наиболее интенсивной гармоники в области до 800 Гц и наиболее интенсивной гармоники в области 800-2400 Гц Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Рисунок 4. График рассеяния в координатах двух наиболее интенсивных гармоник в области до 800 Гц Рисунок 5. График рассеяния в координатах двух наиболее интенсивных гармоник в области 800-2400 Гц ЛИТЕРАТУРА 1. Maxine Eskenazi. An Overview of Spoken Language Technology for Education. Speech Communication, 51(10):832-844, 2009.

2. Maxine Eskenazi. Detection of Foreign Speakers' Pronunciation Errors for Second Language Training Preliminary Results. In ICSLP '96, pages 1465-1468, 1996.

3. Horacio Franco, Leonardo Neumeyer, Yoon Kim, Orith Ronen. Automatic pronunciation scoring for language instruction. In Proceedings of ICASSP-97, pages 1471-1474, 1997.

4. Jonathan Harrington. Сhapter Acoustic Phonetics. 2006.

5. Leonardo Neumeyer, Horacio Franco, Mitchel Weintraub, Patti Price. Automatic Text-Independent Pronunciation Scoring of Foreign Language Student Speech. Proc. of ICSLP 96, pages 1457-1460, 1996.

6. Bob Sevenster, Guus de Krom, Gerrit Bloothooft. Evaluation and Training of Second-Language Learners' Pronunciation Using Phoneme-Based HMMs. In proc. STiLL - Speech Technology in Language Learning, Marholmen, Sweden, 1998.

7. Silke Witt. Use of Speech Recognition in Computer-assisted Language Learning. PhD thesis, University of Cambridge, 1999.

8. Бондарко Л.В. Звуковой строй современного русского языка. Просвещение, М., 1977.

9. Конев А.А., Мещеряков Р.В., Тиунов С.Д., Черных Д.В., Чижевская С.Ю Параметрическое описание ударных гласных звуков. Сборник трудов XXII сессии Российского акустического общества, М.:

ГЕОС. 2010. с.41-45.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи УДК 616. А.Г. Понизов, Р.В. Мещеряков УСТРОЙСТВО УПРАВЛЕНИЯ ПРОЦЕССОМ ИССЛЕДОВАНИЯ СЛУХА Томский государственный университет систем управления и радиоэлектроники 634050 г. Томск, пр. Ленина, тел. (факс) (3822) 413-426;

E-mail: office@keva.tusur.ru Исследование слуха представляют особый интерес в связи с важностью оценки состояния здоровья человека.

Предлагается устройство портативный аудиометр с расширенным функционалом. Важной составляющей исследования является оценка точно воспроизведения тестовых акустических сигналов. Приводятся экспериментальные исследования.

Актуальность темы исследования обусловлена отсутствием средств или методик позволяющих провести исследование слухового анализатора человека в бытовых условиях. Вместе с тем существует серьёзная проблема понижения слуха у населения, по данным ВОЗ на сегодняшний день нарушением слуха страдают 6% населения земли, [1] по оценкам специалистов через 10 лет это число возрастёт на 30% и составит 8% общего населения земли [2]. Отчасти эта проблема связана с тем, что с развитием аудио – акустических систем нагрузка на слух человека существенно увеличилась. Стоит отметить тот факт, что на данный момент оценить состояние своего слуха возможно лишь в специализированных медицинских центрах. Понижение слуха происходит постепенно, в силу своего психофизиологического строения человек способен заметить снижение слуха только тогда, когда это начинает доставлять ему дискомфорт, что происходит уже когда, функции слухового анализатора существенно понижены. Таким образом для практического здравоохранения задача по создание не дорогого, портативного устройства для управления процессом исследования слуха является крайне важно.

Все современные решения в области аудиометрии используют для своей работы генерацию звуков определенной частоты и интенсивности. Для этого подбирается отдельный генератор звука (либо несколько генераторов) под каждый конкретный вид исследования. Например, для реализации аудиометра 3-го класса (в соответствии с ГОСТ 27072-86) требуется четыре генератора: один для исследования воздушной проводимости, два для исследования костной проводимости и ещё один для обеспечения маскировки. Недостатки такого подхода следующие:

1. Трудно создать автономное устройство из-за большого количества генераторов и большого потребления энергии.

2. Трудно создать портативное устройство, удовлетворяющее широкому спектру медицинских запросов. Отсутствие портативности не позволяет проводить исследование слуха вне стен медицинского учреждения.

3. Функциональность прибора сильно привязана к конкретной реализации аппаратной части.

4. Невозможно провести модернизацию имеющихся устройств для поддержки новых для этих устройств видов исследования.

5. Привязка к реализации повышает стоимость устройства как мелкосерийного. В зависимости от места использования устройства, производятся разные, непохожие друг на друга устройства, что объясняет мелкосерийность производства.

6. Сильная зависимость между функциональностью и реализацией аппаратной части не позволяет проводить модернизацию прибора, проводить опыты отличные по своим входным параметрам от заводских предустановок.

Использование методов исследования слуха требует высокий уровень квалификации испытателя, что затрудняет проведение корректного, частого и воспроизводимого эксперимента. Ярким примером этого является камертональный опыт исследования слуха. Испытатель должен уметь возбудить камертон несколько раз с одинаковой интенсивностью и правильно его фиксировать на пациенте, прежде чем колебания камертона затухнут.

Выходом из сложившейся ситуации может стать отказ от генерации звуков в пользу воспроизведения заранее подготовленных и сохраненных звуковых файлов. Такое решение позволит использовать одну и ту же аппаратную платформу с отличающимся, в зависимости от назначения прибора, программным обеспечением. Такой подход позволит сократить стоимость прибора из – за перехода на массовое (по сравнения с современными решениями) производство, основанное на выпуске одной и той же аппаратной части. Такой прибор не имеет сильной связи между его функциональностью и реализацией аппаратной части, т.к. все изменения в функциональности обусловлены изменениями программного обеспечения. Это делает процесс аудиометрических исследований более гибким. У Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи медицинских работников появляется возможность модифицировать приборы, меняя только программное обеспечение, что технически проще и дешевле чем менять весь прибор.

В рамках работы был сконструирован портативный прибор для оценки качества слуха. Этот прибор был разработан для проведения аудиологических тестов основанных на костной проводимости.

Принята патентная заявка на изобретение и метод использования разработанного прибора. Прибор прошёл предклинические испытания. При использовании сконструированного аудиометра проведение аудиологических исследований существенно упрощаются, в частности проведение основных камертональных опытов. Отпадает необходимость специфического возбуждения инструмента для проведения камертональных опытов, упрощается процесс фиксации инструмента, а также существенно сокращается время проведения камертональных опытов (до 50%).

Калибровка разработанного устройства происходила в соответствии с разработанной методикой.

Исходя из ГОСТ 27072-86 «Генераторы сигналов диагностические звуковые. Аудиометры. Общие технические требования и методы испытаний», откуда следует, что сила нажима костного вибратора должна составлять (5,4 ± 0,5) Н., была смоделирована установка для проведения экспериментально – исследовательских работ, данная установка представлена на рис. 1.


1 – штифт;

2 – костный вибратор;

3 - вибропреобразователь общего назначения со встроенной электроникой «АР98-100 – 01»;

4 – защитная трубка;

5 – придерживающие кольца;

6 – груз массой 540 грамм;

7 – портативный аудиометр;

8 – четырехканальный шумомер, виброметр, анализатор спектра «SVAN-959».

Рисунок 1. Экспериментальная установка Методика измерений заключалась в том, что на костный вибратор по очереди подавался за ранее сгенерированный синусоидальный сигнал частотой 500 Гц, 1000 Гц, 2000 Гц, 4000 Гц, 8000 Гц. На каждой частоте изменялась амплитуда напряжения сигнала, таким образом, чтобы костный вибратор производил вибрацию 5 дБ, 10 дБ, 15 дБ, 20 дБ, 25 дБ, 30 дБ, 35 дБ и 40 дБ регистрировавшуюся при помощи виброметра «SVAN-959». Таким образом, в процессе измерений, возможно, получить зависимость вибрации от напряжения на каждой заявленной частоте.

Было произведено три измерения результаты, которых приведены в таблицах 1, 2 и 3, в таблице приведены усреднённые значения всех измерений. Все значения напряжений приведены в милливольтах.

Таблица 1. Результаты первого измерения Инте Значение Значение Значение Значение Значение нсивн поданного поданного поданного поданного поданного ость, напряжения на напряжения на напряжения на напряжения на напряжения на дБ 500 Гц, мВ 1000 Гц, мВ 2000 Гц, мВ 4000 Гц, мВ 8000 Гц, мВ 5 2 2 11 35 10 3 4 19 63 15 5 7 32 111 20 9 12 57 197 25 16 21 100 348 30 28 37 177 614 35 49 65 312 1084 40 88 117 550 1894 Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Таблица 2. Результаты второго измерения Инте Значение Значение Значение Значение Значение нсивн поданного поданного поданного поданного поданного ость, напряжения на напряжения на напряжения на напряжения на напряжения на дБ 500 Гц, мВ 1000 Гц, мВ 2000 Гц, мВ 4000 Гц, мВ 8000 Гц, мВ 5 2 2 11 38 10 3 3 19 68 15 5 4 34 121 20 9 8 63 213 25 13 13 110 377 30 23 25 194 661 35 40 44 342 1170 40 67 79 598 2011 Таблица 3. Результаты третьего измерения Инте Значение Значение Значение Значение Значение нсивн поданного поданного поданного поданного поданного ость, напряжения на напряжения на напряжения на напряжения на напряжения на дБ 500 Гц, мВ 1000 Гц, мВ 2000 Гц, мВ 4000 Гц, мВ 8000 Гц, мВ 5 1,6 3,5 11 53 10 2,9 6,2 19,6 94 15 4,9 11,3 35 166 20 8,2 19,5 62 294 25 14,8 36 109 519 30 28 61,7 193 906 35 48 109,5 339 1586 40 97 200 596 2796 Таблица 4. Усреднённые значения всех измерений Инте Значение Значение Значение Значение Значение нсивн поданного поданного поданного поданного поданного ость, напряжения на напряжения на напряжения на напряжения на напряжения на дБ 500 Гц, мВ 1000 Гц, мВ 2000 Гц, мВ 4000 Гц, мВ 8000 Гц, мВ 5 1,9 2,5 11,0 42,0 110, 10 3,0 4,4 19,2 75,0 195, 15 5,0 7,4 33,7 132,7 344, 20 8,7 13,2 60,7 234,7 602, 25 14,6 23,3 106,3 414,7 1075, 30 26,3 41,2 188,0 727,0 1879, 35 45,7 72,8 331,0 1280,0 3245, 40 84,0 132,0 581,3 2233,7 По полученным данным были построены графические зависимости, представленные на рис. 2.

частота 500 Гц частота 1000 Гц Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи частота 2000 Гц частота 4000 Гц частота 8000 Гц Рисунок 2. График зависимости вибрации от напряжения для частот Таким образом, было разработано устройство для формирования тестовых акустических сигналов.

Разработанное устройство позволяет проводить исследования костного звукопроведения, на частотах 500, 1000, 2000, 4000 и 8000 Гц с интенсивностью от 5 до 40 дБ, с шагом 5 дБ. Излучатель костной вибрации крепится непосредственно на корпусе устройства позволяя тем самым проводить не только тональные пороговые исследования костной звукопроводимости, но и также позволяет проводить основные камертональные опыты (опыт Вебера, Ринне, Желле и Федеричи.) Разработанное устройство является портативным (вес - 0.3 кг;

габаритные размеры - 170х80х40, в дальнейшем, возможно, уменьшить размеры устройства и ориентировочно добиться размеров 110х50х30), так же устройство является автономным (не зависит от сети). Фотографии готового устройства приведены на рис. 3.

Рисунок 3. Фотография готового устройства ЛИТЕРАТУРА 10. World Health Organization. (2009). Deafness and hearing impairment. Retrieved April 2, 2010, from http://www.who.int/mediacentre/factsheets/fs300/en/index.html.

11. Wilson, R. H., & Oyler, A. L. (1997). Psychometric functions for the CID W-22 and NU Auditory Test No. 6 Materials spoken by the same speaker. Ear and Hearing, 18, 430-433.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи УДК 534.784, 534.785.

М.А. Ондар, А.С. Сарыглар О СИНХРОНИЗАЦИИ КОЛЕБАНИЙ В ЗВУКАХ ГОРЛОВОГО ПЕНИЯ Тувинский государственный университет, Россия, Республика Тыва, 667000 Кызыл, ул.Ленина, д. Тел.: (394) 22-38368;

E-mail: tgu@tuva.ru Наблюдение за динамикой формирования звука в голосовом аппарате методами прямого наблюдения, т.е., рентгеном или методом назофарингологической эндоскопии, обусловили нас использовать в исследованиях комбинированный корреляционно-спектральный метод. Он основан на знании исследователем соответствий между интонациями в произношении звуков и артикуляционными конфигурациями речевых органов. Такой подход полагает владение исследователем методами изучения речи, особенно, горловым пением. При исследовании горлового пения этим методом удалось установить, что вестибулярные складки активно участвуют в формировании звуков всех стилей. По кратности частот гармоник спектров всех стилей установлено, что колебания двух источников звука: голосового аппарата и вестибулярных складок, синхронизированы. Это обстоятельство определяет спектральный состав опорного звука в сольномдвухголосии, из которого формируются мелодии данного стиля. А сами мелодии стилей, как и речь, формируются в голосовом тракте в соответствии с артикуляционной конфигурацией речевых органов.

В ходе эволюции дыхательная система человека приобрела дополнительную функцию производство членораздельной речи в голосовом аппарате за счет колебаний голосовых связок. Участие вестибулярных складок, называемых также ложными голосовыми связками, расположенных чуть выше голосовых связок, считается незначительным в формировании речи [1].

Рентгеновский снимок глоточной области певца при горловом пении в стиле «сыгыт» [2] показал, что в напряженно сжатых вестибулярных складках возникает «аэродинамический свист». В монографии [3] отмечается, что при исследовании гортани певца методом назофарингологической эндоскопии мышцы глоточной области расслаблены. Казалось бы, что авторы сделали взаимоисключающие выводы [4].

Однако, возможность нахождения вестибулярных складок в напряженном и расслабленном состояниях и показывают их подвижность и участие в формировании исходного звука горлового пения наряду с голосовыми связками.

Трудности наблюдения за динамикой формирования исходного звука в голосовом аппарате методами прямого наблюдения обусловили нас использовать в своих исследованиях корреляционно спектральный подход. Он основан на использовании соответствий между интонациями в произношении и артикуляционными конфигурациями речевых органов. Последние, как известно, определяют формантную структуру спектра, характеризующую степень участия резонансных полостей в формировании вокальных звуков, и скорость воздушного потока в различных областях голосового тракта. Корреляционно – спектральный метод полагает владение горловым пением самим исследователем и методами исследования речи. В этом плане один из авторов обучался горловому пению и предложен им метод «звучащих»

спектров [5].Это обстоятельство позволило нам еще раз критически рассмотреть результаты выполненных ранее работ и проанализировать новые записи звуков «сыгыт» шестерых певцов.

При просушивании звуков «сыгыт» установлены области осциллограмм звуков с характерным для этого стиля тембром. Воспроизводство подобного звука позволил нам установить артикуляционную конфигурацию речевых органов, как соответствующую произношению согласного звука «ль». В работе [4] мы показали, что при такой артикуляции голосовой тракт перекрывается языком и частично зубами.

Такая конфигурация голосового тракта в данной статье для краткости названа закрытым трактом.

В новых записях звуков «сыгыт» двухголосие регистрируется спектрах в виде опорного звука со сложным составом (постоянно звучащий фоновый звук) и мелодии. В работе [4] мы показали, что опорный звук состоит из десяти гармоник с частотами от 150 Гц до 600 Гц с постоянной интенсивностью при пении. В спектрах этих же звуков при квантовании с шагом 8 кГц проявляются еще две неинтенсивные гармоники с частотами 50 Гц и 100 Гц. Таким образом, опорный звук стиля «сыгыт»


состоит из 12 гармоник с частотами кратными 50 Гц. В свою очередь, четыре интенсивные гармоники опорного звука, расположенные в порядке возрастания частоты, кратны 150 Гц. А резонансная частота мелодии «сыгыт» закрытой конфигурации изменяется между второй и третьей речевой формантами в диапазоне 1400 Гц до 2200 Гц. В некоторых записях мелодий «сыгыт» в том же диапазоне изменений мелодии прослушивается звук в открытом тракте. Тембр этого звука близок к тембру звука в закрытом тракте. Его опорный звук также состоит из 12 гармоник с постоянной интенсивностью. Все это означает, что этот звук формируются в открытом тракте по такому же механизму, что и «сыгыт» в закрытом тракте. Таким образом, можно однозначно утверждать, что источником звука при пении в стиле «сыгыт»

являются вестибулярные складки и голосовые связки, колеблющиеся одновременно и синхронно. А его Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи мелодия формируется в верхней части голосового тракта из опорных звуков, вырабатываемых голосовыми связками и вестибулярными складками.

О возможности синхронизации колебаний вестибулярных складок и голосовых связок при горловом пении была высказана нами в работе [5]. Они, по сути, являются генераторами, работающими на общую нагрузку, на речевой тракт. В теории синхронизации колебаний указывается, что два или несколько генераторов могут работать эффективно при совпадении или кратности их частот. Ещё, согласование частот колебаний вестибулярных складок и голосовых связок важно для экономичного расхода энергии воздуха, запасенного в легких.

На синхронность колебаний вестибулярных складок и голосовых связок при горловом пении указывает кратность частот гармоник в спектрах всех стилей горлового пения. Так в спектре «сыгыт»

основная частота колебаний вестибулярных складок в напряженном состоянии не должна быть высокой, поэтому она равна частоте первой гармоники в 50 Гц. К основной частоте колебаний голосовых связок в этом стиле относится более интенсивная линия в спектре опорных звуков с частотой 150 Гц. Из сравнения интенсивностей этих гармоник можно заключить, что при пении «сыгыт» происходит синхронизация слабых по интенсивности колебаний вестибулярных складок под частоту более интенсивных колебаний голосовых связок. Влияние вестибулярных складок на качество звука при синхронизации колебаний источников проявляется в возрастании числа гармоник спектре «сыгыт» и кратных 50 Гц. Поэтому тембр высокочастотных мелодий в «сыгыт» более благозвучен, чем звук аэродинамического свиста.

Особенности спектров горлового пения в стилях «каргыраа» и «хоомей» интерпретируются также как спектр «сыгыт» с учетом синхронизации колебаний тех же двух источников звука в голосовом аппарате.

В работе [6] из спектра речи певца мы определили диапазон изменений основного тона голоса его речи в пределах 120-150 Гц. При пении основной тон его голоса повышается от 190 Гц до 280 Гц. В работе [7]мы показали, что двухголосие в мелодии «каргыраа» обеспечивается согласованным звучанием пяти низких тонов с частотами 70 Гц, 140 Гц, 210 Гц, 280 Гц, 350 Гц, воспринимаемым на слух как постоянно звучащий низкочастотный фон и высокочастотных гармоник (мелодий), сгруппированных в областях трех речевых формант. Приняв основную частоту колебаний вестибулярных складок принять равным 70 Гц, а голосовых связок 210 Гц, учитывая интенсивность первой гармоники и кратность гармоник всего спектра 70 Гц, можно утверждать, что при исполнении «каргыраа» происходит синхронизация колебаний голосовых связок под частоту вестибулярных складок. Понижение частоты гармоник в спектре «каргыраа» до 70 Гц и увеличение объема резонаторной полости при снижении подъёма в задней части языка обусловило присутствие в его мелодии низких тонов.

В отличие от стилей «сыгыт» и «каргыраа» спектр звуков горлового пения в стиле «хоомей»

начинается с гармоники с частотой 130 Гц. Основная частота голосовых связок в речи певца изменяется в пределах от 120 Гц до 150 Гц [6]. В «звучащем» спектре «хоомея» тоже отмечается два звука. Один из них воспринимается как низкочастотный звук (постоянно звучащий фоновый звук), второй – как мелодия «хоомея». Фоновый звук «хоомея» состоит из трех гармоник с частотами 130 Гц, 260 Гц, 390 Гц. Они кратны самой низкой частоте спектра. Кратны частоте 130 Гц также все гармоники спектра. В этом стиле возрастает вклад увеличившейся по объёму полости в передней части голосового тракта при артикуляции губами, соответствующем произношению тувинского звука О.

Учитывая равенство основных частот вестибулярных складок и голосовых связок, интенсивностей их колебаний можно допустить, что при пении «хоомей» имеет место взаимная синхронизация колебаний указанных источников.

Таким образом, корреляционно-спектральный подход в анализе звуков горлового пения показал, что сольное двухголосие в горловом пении возникает с участием двух вестибулярных складок и голосовых связок. Эффективность их работы определяется синхронизацией колебаний этих источников и спектром частот опорного звука. Особенности мелодии стилей горлового пения определяется спектром опорного звука и окончательно формируется в мелодию в голосовом тракте при определенной артикуляционной конфигурации органов речи.

Л И Т Е Р А Т У Р А:

1. Физический энциклопедический словарь. М.: Советская энциклопедия, 1983. - С.687.

2. Чернов Б.П. и Маслов В.Т., Дмитриев Л.Б. Тайна тувинского «дуэта» или свойство гортани человека формировать механизм аэродинамического свиста. - Новосибирск, 1992.

3. Кыргыс З.К. Тувинское горловое пение. - Новосибирск: «Наука», 2002.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи 4. Ондар М.А., Сарыглар А.С.О двухступенчатом механизме формирования звуков «сыгыта» //Научные труды ТывГУ, Вып. 6. Том.2. - Кызыл, РИО ТывГУ. -2008. -С. 69- 5. Ондар М.А., Сарыглар А.С. О физической природе звуков тувинского горлового пения // В материалах Международной научно-практической конференции «Вопросы изучения истории и культуры народов Центральной Азии и сопредельных регионов» - Кызыл, 2006. - С.371- 6. Ондар М.А., Сарыглар А.С.Различия в спектрах речи, пения и сольного двухголосия // Научные труды ТывГУ, Вып.8. Том.2. РТ. - Кызыл, РИО ТывГУ, 2010. - С. 110- 7. Ондар М.А.,.Сарыглар А.С. Частотный диапазон звуков горлового пения // В сборнике материалов V-го Международного этномузыкологического симпозиума «Хоомей (горловое пение) – феномен культуры народов Центральной Азии» - Кызыл, 2008.–С.143-158.

УДК 534.12, 534.14, 534. М.А.-Х. Ондар, Т.О. Доржу УСТАНОВКА ДЛЯ ИССЛЕДОВАНИЯ ВИБРАЦИЙ ХОМУСА ФГБОУ ВПО «Тувинский государственный университет»

Россия, 667000 Республика Тыва, г. Кызыл, ул. Ленина д. Тел: 8(394-22) 3-23-68;

Факс 8(394-22) 3-19-69;

E-mail: fizkaf.tuvsu@yandex.ru Хомус является одним из основных музыкальных инструментов народов Сибири и Центрально-азиатского региона. Звук хомуса возникает по многоступенчатому механизму: колебания язычка – вибрации корпуса хомуса и костной системы челюсти – колебания воздушного столба голосового тракта. Управляя резонансными явлениями в голосовом тракте, при помощи артикуляции органов речи формируется благозвучная мелодия хомуса. В таком многоступенчатом механизме возникновения звука и мелодии важно согласованное взаимодействие отдельных органов речевого тракта между собой и их взаимодействие с хомусом. Ключевым звеном в такой системе формирования мелодии является проблема согласованности колебаний корпуса хомуса и его язычка. Для экспериментального изучения взаимодействия язычок-корпус хомуса нами разработана установка по исследованию колебательных свойств хомуса. Она представляет собой небольшую стальную платформу, на которой установлены микрометр, служащий в качестве вертикально установленного тиска, между губками которого зажимается хомус и два микроштатива.

Установка комплектуется генератором низкой частоты, микрофоном с усилителем, стробоскопом, осциллографом, компьютером. Из результатов опыта на этой установке можно сделать вывод о кратности колебаний язычка и корпуса хомуса. «Размытость» некоторых резонансных частот указывает либо на необходимость более точной подгонки размеров язычка и корпуса при изготовлении хомусов, либо является характерным свойством звуков хомуса, обогащающим звуковой спектр инструмента. При исследовании язычка хомуса на этой установке обнаружены также и нелинейные эффекты в его колебаниях.

Хомус (варган, маультромель) является одним из основных музыкальных инструментов народов Сибири и Центрально-азиатского региона. Человек, впервые взявший в руки этот инструмент, после первых же упражнений может создавать на нем несложные мелодии. Кажущаяся простота игры на хомусесоздает неправильное представление о примитивности инструмента и отвлекает внимание от детального исследования механизма формирования звука хомуса.

Попытка составить системные представления по механическим и акустическим хомусе впервые были предпринята на Всесоюзной конференции по варгану в 80-х годах в Якутии [1]. Более детальное описание музыковедческих аспектов хомуса выполнено в работе В.Ю. Сузукей [2].Методологические основы различий в организации звука в классических и тувинских музыкальных инструментов рассмотрены в работе [3].Нелинейные эффекты и возможность возбуждения параметрических колебаний в язычке хомуса рассмотрены в работе [4]. В этой работе отмечается, что эти эффекты связаны с переменной шириной (клинообразностью) язычка.

Механизм возникновения звука в хомусе во многом схож с классическими музыкальными инструментами. Во время игры одна из развилок корпуса хомуса прижата к верхним зубам играющего.

Колебания язычка вызываются периодическими легкими ударами пальца по нему, которые возбуждают вибрациюразвилок корпуса хомуса. В свою очередь, колебания развилоквызывают вибрации костной системы челюстей, возбуждающих колебания в воздушном столбе в голосовом тракте. Далее, управляя резонансными явлениями в голосовом тракте и артикуляцией органов речи, формируют благозвучную мелодию из звуков хомуса. В таком многоступенчатом механизме возникновения мелодии важно согласованное взаимодействие отдельных органов речевого тракта между собой и их взаимодействие с хомусом. Ключевым звеном в такой системе формирования мелодии является проблема согласованности колебаний корпуса хомуса и его язычка.

Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи Для экспериментального изучения взаимодействия язычок - корпус хомуса нами разработана установка по исследованию вибраций корпуса хомуса (рис.1).

Она представляет собой небольшую стальную платформу 1, на которой установлены микрометр 2 и два микроштатива 3, 4.

99 6 Микрометр служит в качестве тисска, между губками которого зажимается хомус 9. микроштативы установлены на магнитных держателях, которые позволяют при необходимости регулировать расстояния между отдельными деталями установки. К штативу закреплена штанга с пьезодатчиком 6. На верхней платформе закреплена катушка индуктивности с магнитопроводом с 3 заостренным концом 8. Хомус 9 является частью магнитопровода катушки, так как магнитное поле катушки замыкается заостренный конец и язычок хомуса.

Установка комплектуется генератором низкой частоты, микрофоном с усилителем, стробоскопом, осциллографом, через компьютером (они на рисунках 1 и2 не показаны).

Рис. 1. Установка для исследования хомуса Принцип работы установки показан на рисунке 2. Колебание язычка хомуса возбуждается небольшой катушкой индуктивности, создающей переменное магнитное поле. Катушка питается генератором переменного тока 1, поэтому частота магнитного поля равна частоте генератора. Поскольку магнитное поле замыкается через язычок хомуса, последний совершает вынужденные колебания с частотой магнитного поля. Таким способом установка позволяет изменять частоту колебаний язычка в пределах от 20 Гц и выше.

Однако с повышением частоты переменного поля проявляется инерционность язычка и возрастают магнитные потери. Поэтому в экспериментах катушку питали токами с частотами в пределах 20-2000 Гц.

Рис. 2.Схема взаимодействия элементов установки Вибрацию корпуса хомуса регистрировали при помощи пьезодатчика 2. Преобразованные им вибрации наблюдаются на осциллографе и записываются на компьютер с использованием линейного входа звуковой карты.

Частота вынужденных колебаний язычка, несколько, отличается от частоты генератора. Поэтому для контроля использовался и стробоскопический эффект. Для этого использован стробоскоп ССЭШ- 2.

При испытании установки выяснилось, что при возбуждении колебаний с частотами от 200Гц и выше становятся слышимыми звуки на некоторых частотах. Поэтому установка укомплектована микрофоном, сигнал с которого усиливается предусилителем и тоже записывается на компьютер.

На такой установке проведено исследование собственных колебаний хомуса. Колебания язычка хомуса, закрепленного между губками микрометра, возбуждались вручную, отклонением язычка от положения равновесия, или при помощи магнитного поля создаваемого катушкой питаемого генератором переменного тока. Измерение частоты колебания язычка определенная с помощью стробоскопа сопоставляется с частотой генератора.

Подача переменного тока в катушку и вариация его частоты в пределах от 20 Гц до 2000 Гц позволяют визуально и на слух определять несколько резонансов в колебаниях язычка и корпуса. Первый визуально наблюдаемый резонанс возникает при частоте генератора в 36 Гц. Второй более сильный резонанс наблюдается вблизи 76 Гц. Третий резонанс несколько «размыт» и проявляется в диапазоне частот от 94 Гц до 105 Гц.

Стробирование колебаний язычка (без корпуса) при ручном возбуждении позволило установить, что его собственная частота определяется в пределах 65-70 Герц. Этот же язычок установленный в корпус хомуса колеблется уже с повышенной частотой в пределах 70-75 Гц. Результаты этого опыта указывают на то, что первый и третий резонансы возникают при частотах переменного тока кратных собственной частоте колебания язычка хомуса. Так переменный ток частотой 35-38 Гц, т.е., в 2 раза ниже собственной частоты язычка может возбудить в системе резонанс.

«Размытость» третьего резонанса в диапазоне от 94 Гц до 105 Гц объясняется рядом обстоятельств. Из опыта видно, чторезонанс может наблюдаться и при полуторной кратности частот. При Содержание XXV сессия Российского акустического общества, Сессия Научного совета по акустике РАН Акустика речи этом нестабильность этого явления, вероятнее всего, связана с уменьшением амплитуды колебаний язычка при повышении частоты переменного тока питающего катушку. Поэтому с частот выше 105 Гц резонансные явления проявляются в возникновении звука на определенных частотах переменного тока. А «размытость» резонанса можно объяснить возникновением биений между колебаниями язычка и корпусас повышением частоты.

Первый усиленное звучание прослушивается в узком интервале частот переменного тока 140- Гц, почти равной частоте второй гармоники колебаний язычка. Наблюдается и второй «размытый»

звуковой резонанс в колебаниях щечек корпуса, прослушивающийся в интервале частот 200-220 Гц. Эти колебания близки к третьей гармонике колебания язычка хомуса.

Последующие звуковые резонансы более слабые по громкости прослушиваются на частотах 560 620 Гц, 850 - 930 Гц и даже в области 1920-2000 Гц. Эти частоты также кратны собственной частоте язычка в 75 Гц и составляют 8, 12, 26 гармоники колебаний язычка хомуса. Примечательно, что эти резонансы тоже «размыты» в узком интервале частот.

Рис.3. Спектр колебания язычка Исследовано свободное колебание язычка хомуса при помощи пьезодатчика. Спектр свободного колебания язычка (рис.3) состоит из 56 гармоник: в диапазоне от 48 Гц до 4000 Гц (таблицу). Обращает на себя то, что есть частоты гармоник кратные 74-76 Гц.

Таблица.

Диапазон частот гармоник звуков хомуса № Частота, № Частота, № Частота, № Частота, № Частота, гармоники Гц гармоники Гц гармоники Гц гармоники Гц гармоники Гц 1 13 25 37 48 600 1599 2490 2 14 26 38 74 670 1675 2576 3 15 27 39 97 750 1738 2640 4 16 28 40 148 828 1824 2726 5 17 29 41 193 900 1902 2794 6 18 30 42 226 978 1980 2876 7 19 31 43 244 1052 2041 2943 8 20 32 44 279 1120 2105 3019 9 21 33 300 1203 2191 10 22 34 375 1287 1177 11 23 35 453 1378 2341 12 24 36 527 1525 2414 Из результатов этого опыта покаможно сделать вывод о кратности колебаний язычка и корпуса хомуса. Обнаруженная «размытость» резонансных частот указывает либо на необходимость более точной подгонки размеров язычка и корпуса при изготовлении хомусов, либо является характерным свойством звуков хомуса, обогащающим звуковой спектр инструмента. Это обстоятельство указывает на необходимость ведения системных исследований звука хомуса, в которых основное место должно быть отведено экспериментальным методам.В этой связи установка для исследования вибраций хомуса станет необходимым инструментом, как для исследователя,так и для мастера по изготовлению хомуса.

ЛИТЕРАТУРА Варган (хомус) и его музыка. //Материалы I-й Всесоюзной конференции / Якутск, 1989.

1.

Сузукей В.Ю.«Бурдонно-обертоновая основа традиционного инструментального музицирования тувинцев», 2.

Кызыл: ТНИИЯЛИ, 1993.

Ондар М.А.-Х., Сузукей В.Ю.Сходства и различия в звукообразованиях некоторых музыкальных 3.

инструментов и хомуса.//Ученые записки ТИГИ. Кемерово – 2007. –Вып.21. – С.296-301.

Ондар М.А.-Х., Доржу Т.О. Нелинейные эффекты в колебаниях язычка хомуса. //Научные труды ТывГУ.

4.

Вып. 6. Том 2. – Кызыл: РИО ТывГУ, 2008. – С.73-76.



Pages:     | 1 ||
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.