03.07.2020

Слуховой аппарат для улучшения разборчивости речи. Как улучшить четкость речи. Аппарат с повышенной разборчивостью речи


Жилинская Екатерина Викторовна

Актуальность темы исследования

По данным Всемирной организации здравоохранения (ВОЗ) к настоящему времени в мире насчитывается около 360 млн. людей с нарушениями слуха, а среди лиц старше 65 лет приблизительно треть страдает от инвалидизирующей тугоухости (ВОЗ, 2017).
Одна из основных проблем пациентов со снижением слуха, существенно ухудшающая их качество жизни, - нарушение разборчивости речи, ведущее к социальной изоляции больных. Принято считать, что подавляющее большинство случаев снижения разборчивости речи обусловлено периферическими расстройствами (на уровне улитки), однако все больше исследований доказывают высокую распространенность нарушений разборчивости речи, вызванных патологией центральных отделов слуховой системы, при этом пороги слуха пациентов по результатам тональной пороговой аудиометрии могут быть даже в пределах нормы. Особенно высока частота встречаемости центральных слуховых расстройств у лиц пожилого и старческого возраста: они имеют место у 74% лиц старше 55 лет (Golding M. et al., 2004).
На настоящий момент не разработано эффективного медикаментозного лечения дисфункций центральной нервной системы, приводящих к нарушению разборчивости речи (Chermak G.D., Musiek F.E., 2014), поэтому даже при хорошо настроенном слуховом аппарате проблемы пациентов в общении зачастую остаются нерешенными. Это вызывает необходимость поиска новых подходов к диагностике и коррекции нарушений разборчивости речи у пациентов с хронической сенсоневральной тугоухостью.
Степень разработанности темы исследования. Исследование нарушений разборчивости речи занимает существенное место в сурдологии и неврологии; отмечен прогресс в направлении создания новых методов диагностики и коррекции данных расстройств. Накапливающиеся научные и клинические данные улучшают наше понимание причин нарушений разборчивости речи, в том числе центрального генеза, механизмов их возникновении, возможностей компенсации дефицита. Число исследований и публикаций, посвященных центральным слуховым расстройствам, включающим нарушение разборчивости речи, в последние годы значительно увеличилось, что показывает растущий интерес к этой теме, критериям постановки диагноза и способам реабилитации (Musiek F.E., Chermak G.D., 2014). Однако большинство исследований и публикаций проводятся в зарубежных странах, и преобладающее количество методов диагностики и коррекции разработано для англоязычных пациентов, в России же на данный момент этой теме не уделяется достаточного внимания, существует немного доступных апробированных тестов и методик реабилитации.
Поиск более точных методик диагностики нарушений разборчивости речи, способов коррекции дефицита приведет к увеличению эффективности реабилитации.

Цель исследования – повышение эффективности топической диагностики и реабилитации при нарушениях речевой разборчивости у пациентов с хронической сенсоневральной тугоухостью (ХСНТ).

При центральных нарушениях органа слуха вследствие перенесенной инфекции или приема ототоксических антибиотиков, а также при возрастных нарушениях слуха, разборчивость речи не достигает 100% даже при значительной громкости звука, при этом возможно даже снижение разборчивости при повышении громкости. В литературе это описано как феномен ускоренного нарастания громкости (ФУНГ) и является признаком нарушения звуковосприятия.

Чем дольше длится этот процесс, тем сложнее и более дорогостояще будет эффектное слухопротезирование. Центры слуха головного мозга «забывают» звуки и они не «складываются» в понимание речи. Также требуется более длительная адаптация к слуховому аппарату , а так же к новым ощущениям звука. Даже при полноценной коррекции слуха у части пациентов слуховой аппарат не всегда обеспечивает полное восстановление разборчивости речи. При этом у пациента сохраняются проблемы восприятия речи, не смотря на то, что он стал слышать звуки лучше. Более глубокие нарушения требуют не только качественного слухопротезирования, но и дополнительной компенсации – чтение по губам, субтитры по телевидению, выбор позиции при общении, повышенного внимания к собеседнику, уменьшение окружающих фоновых звуков.

Современные слуховые аппараты имеют возможность при настройке ограничить усиление громких звуков, сохранить комфортную громкость звуков средней громкости и обеспечить хорошую громкость тихих звуков. Эта функция называется стратегия обработки сигнала WDRC (Wide Dynamic Range Compression), причем имеется возможность изменения коэффициента компрессии для более комфортного звука. Этим достигается высокая разборчивость речи.

Также в современных слуховых аппаратах внедрена технология нелинейной частотной компрессии (SoundRecover), что позволяет слышать звуки, недоступны расширенному частотному диапазону. Этот метод дозировано сжимает и перемещает высокие частоты, обеспечивая слышимость и естественное звучание. При настройке аппарата также имеется возможность установить достаточный коэффициент нелинейной частотной компрессии для качественного и комфортного звука.

Многоканальность аппаратов тоже способствует повышению разборчивости речи в связи с установлением различного усиления в различных каналах, что обеспечивает необходимое усиление в соответствии с различными потерями чувствительности на различных частотах. Это позволяет добиться большей разборчивости речи при меньшей громкости, что дает больший комфорт использования слухового аппарата.

Необходим постоянный тренинг, т.е. повышение времени ношения аппарата, привыкание к новым звукам, повышение селективности звука и выделение речи. Частотная селективность имеет большое значение в процессе понимания речи, повышается дефференцирование, а следовательно, и понимание речи.

На способность различения звуков при нарушениях звуковосприятия влияет и временной интервал. При перцептивных нарушениях (нарушение восприятия) снижается способность разделения звуков, поэтому человек с сенсорными нарушениями просит собеседника говорить не громче, а медленнее. Со временем скорость обработки слов повышается, что тоже является элементом тренировки.

Чем ранее выполнено качественное слухопротезирование, тем больший эффект можно достичь и сократить время адаптации и восстановить разборчивость речи.

Снижение слуха и нарушение мозгового кровообращения. Факты и рекомендации

Снижение слуха и нарушения речи являются распространенными осложнениями острых или хронических нарушений мозгового кровообращения , что приводит к большой социальной дезадаптации пациентов. Плохой слух, выраженное ухудшение разборчивости речи, расстройство артикуляции речи, наличие афазии ведут к изоляции пациента не только в обществе, но и в семье.

Нарушение мозгового кровообращения приводит к необратимой деструкции, по сути гибели, нервных структур головного мозга в связи с недостаточностью артериального кровотока и оксигенации (насыщения кислородом) клеток. Нарушения могут носить ишемический или геморрагический характер.

Причиной ишемии является блок кровеносных сосудов, снабжающих артериальной кровью головной мозг.

Геморрагическое нарушение кровообращения связано с разрывом сосудов и кровоизлиянием в ткани головного мозга.

Любое из этих видов сосудистых расстройств может приводить к стойкому ухудшению или утрате функции тех участков мозга, которые кровоснабжаются поврежденными сосудами. В результате мы имеем дело с дефицитом неврологических функций различных органов и систем организма, в том числе органов чувств.

Согласно современным статистическим данным, снижение слуха является одним из самых распространенных последствий нарушения мозгового кровообращения. Однако существует большая недооценка частоты распространения этих нарушений. Главной причиной является относительно скрытая природа тугоухости на фоне других более явных расстройств функций, таких как трудности с глотанием, координацией, походной, или речи. Зачастую пациентов приводят родственники с жалобами на трудности коммуникации, объясняя эти факты сложностями вербального (речевого) общения. И лишь подробное уточнение обстоятельств и симптомов выводит на первый план снижение остроты слуха и разборчивости речи после перенесенного инсульта .

Основной формой тугоухости , с которой сталкиваются специалисты у пациентов после развития нарушения мозгового кровообращения, является сенсоневральная тугоухость . Причиной нарушения звуковосприятия становится повреждение рецепторных клеток внутреннего уха (улитки), слуховой части предверно-улиткового нерва или центральных проводящих путей и коркового отдела слухового анализатора, расположенного в височной области головного мозга. Такие исходы наиболее вероятны у пациентов, имеющих историю атеросклероза, длительно курящих, страдающих сахарным диабетом или с высоким артериальным давлением. Существенный рост случаев сенсоневральной тугоухости наблюдается у людей с сочетанием нескольких предрасполагающих негативных факторов.

Среди всех причин нарушения слуха у людей, перенесших инсульт, самой распространенной является ишемия . В частности, речь идет о случаях инфаркта передне-нижней мозжечковой артерии, составляющих 83% всех наблюдений. Реже встречаются нарушения слуха при инфаркте задне-нижней мозжечковой артерии - 12% случаев. В упомянутых примерах типичными являются наблюдения одностороннего нарушения слуха на стороне расстройства кровообращения. Отсюда вытекает эмпирическое правило: необходима обязательная оценка состояния кровообращения при всех наблюдениях одностороннего расстройства слуха по сенсоневральному типу.

Значительно реже наблюдаются случаи инфаркта верхней мозжечковой артерии, сопровождающихся потерей слуха на противоположной стороне головы. Наименее часто встречается снижение слуха из-за нарушения мозгового кровообращения ствола головного мозга или его срединных структур - менее 1% случаев.

Геморрагические инсульты приводят к снижению слуха у меньшинства пациентов. Они характеризуются своей клинической вариабельностью: одно- или двусторонняя тугоухость, разная степень выраженности процесса от легкой потери слуха до глухоты. Встречаются также случаи частичного спонтанного улучшения остроты слуха в течение нескольких последующих недель.

Исходя из всего вышеизложенного хочется обратиться к пациентам, перенесшим эпизод нарушение кровообращения, и их родственникам с рекомендацией обязательно обратиться на аудиологическое исследование к специалистам (сурдологи, лор-врачи) как только позволит состояние здоровья. Во-время выполненная аудиометрия или объективные методы исследования слуховой функции (КСВП, отоакустическая эмиссия, регистрация акустических рефлексов) не позволят пропустить симптомы сенсоневрального нарушения слуха и позволят своевременно осуществить реабилитационные мероприятия с лучшим прогнозом.
В специализированных учреждениях также ведутся обучающие программы для родственников с целью помочь им приложить правильные усилия, ориентировать на научно обоснованные и доказавшие свою эффективность методы психологической, логопедической, слухопротезной и социальной помощи.

Понятность и разборчивость речи

Понятность речи - основная характеристика, определяющая пригодность тракта для передачи речи. Непосредственное определение этой характеристики может быть осуществлено статистическим методом с привлечением большого числа слушателей и дикторов. Количественное определение понятности речи – разборчивость .

Разборчивостью речи называют относительное или процентное число правильно принятых элементов речи из общего числа переданных по тракту. Элементы речи – сложные звуки, слова, фразы, цифры. Соответственно различают слоговую , звуковую , словесную , смысловую и цифровую разборчивости . Между ними существует статистическая взаимосвязь. В практике преимущественно используют слоговую, словесную и смысловую разборчивости.

Для измерений разборчивости разработаны специальные таблицы слогов с учетом встречаемости их в русской речи. Эти таблицы называются артикуляционными . Разборчивость измеряют с помощью тренированной бригады слушателей без нарушений слуха и речи путем проведения субъективно-статистических экспертиз. При этом измерения могут проводиться различными методами, например, методом бальной оценки, методом определения процента правильно принятых слов и т.д.

Зависимость между разборчивостью речи и ее понятностью, приведена в табл. 16.1. В этой таблице понятность речи оценена четырьмя градациями:

1) отличная, если понятность полная, без переспросов;

2) хорошая, если у слушателей возникла необходимость в отдельных переспросах редко встречающихся слов или отдельных названий;

3) удовлетворительная, если слушатели сообщили, что им трудно понимать, имели место частые переспросы;

4) предельно допустимая, если требовались неоднократные переспросы одного и того же материала с передачей отдельных слов по буквам при полном напряжении слуха.

Таблица 16.1

Причинами снижения разборчивости являются акустические шумы в помещении, помехи от реверберации и диффузного звука, недостаточное усиление сигналов первичного источника звука.

Системы озвучения и звукоусиления должны обеспечивать требуемую понятность речи. При передаче информационных программ, проведении митингов и собраний необходима отличная понятность речи, которая обеспечивается при 80 % слоговой и 98 % словесной разборчивостях. Для диспетчерской связи полная разборчивость речи (удовлетворительная понятность) получается при 40...50 % слоговой и 87...93 % словесной разборчивостях. Поэтому при расчете диспетчерской связи ориентируются на меньшие величины разборчивости, чем при расчетах систем широкого применения.

Существует связь между разборчивостью речи, условиями приема и характеристиками трактов передачи, которую удалось установить при помощи формантной теории, разработанной Флетчером и Коллардом.

Области концентрации энергии в том или ином участке частотного диапазона называются формантами . Их расположение зависит как от положения звука в слове или фразе, так и от индивидуальных особенностей артикуляционного аппарата человека. Каждый звук имеет несколько формант. Форманты звуков речи заполняют частотный диапазон от 150 до 7000 Гц.

Этот диапазон частот условились поделить на 20 полос, в каждой из которых вероятность появления формант одинакова. Такие полосы частот назвали полосами равной разборчивости . Они определены для ряда языков, в том числе для русского. Установили, что вероятность появления фомант подчиняется правилу аддитивности. При достаточно большом количестве звукового материала вероятность появления формант в каждой полосе равна 0,05.

Форманты имеют различные уровни интенсивности: у звонких звуков они выше, чем у глухих. При увеличении уровня акустических шумов сначала маскируются форманты с низкими уровнями, а затем с более высокими. В результате маскировки уменьшается вероятность восприятия формант. Коэффициент, определяющий это уменьшение в к - й полосе, называют коэффициентом восприятия или разборчивости к ф . Иначе говоря, в к -ой полосе вероятность приема формант

где коэффициент восприятия формант к ф зависит от уровня ощущения, который в свою очередь определяется разностью между средним спектральным уровнем речи В р в полосе равной разборчивости и спектральным уровнем шумов и помех в той же полосе В ш :

Е ф = В р - В ш . (16.2)

Коэффициент восприятия (разбогрчивости) может быть определен по графику, представленному на рис. 16.1. На этом графике приведены уровни ощущения Е ф и соответствующие им коэффициенты восприятия к ф .

Для уровней ощущения 0-18 дБ к ф может быть определен приближенно по формуле k ф =(Е+ 6)/30.

Рисунок 16.1.Интегральное распределе­ние уровней речи.

В общем случае для каждой полосы равной разборчивости коэффициент восприятия будет разным. Общая формантная разборчивость в речевом диапазоне частот определяется из

(16.3)

Рисунок 16.2.Зависимость слоговой разборчивости от формантной.

Зависимость между формантной и другими видами разборчивости была найдена экспериментально. Такая зависимость для слоговой разборчивости показана на рис. 16.2. Из этого рисунка видно, что почти полная понятность речи (слоговая разборчивость равна 80 %) получается при приеме лишь половины всех формант (формантная разборчивость равна 0,5), что свидетельствует об избыточности речи и комбинационной способности мозга.

Определение разборчивости речи для озвучиваемых помещений прежде всего осуществляют для точек озвучиваемой поверхности с минимальным уровнем прямого звука и максимальным уровнем акустичеких шумов. Спектральный уровень прямого звука у слушателя, находящегося в такой точке,

, (16.4)

где В рм -спектральный уровень речи у микрофона (определяется из таблиц);

,

где r м - удаление микрофона от оратора; - спектральный уровень речи на расстоянии 1 м (определяется из справочных таблиц);
- индекс усиления (индекс тракта - разность между уровнями звука, создаваемыми громкоговорителем системы звукоусиления у уха слушателя и первичным источником звука на входе микрофона).

Эти данные определяют для каждой полосы равной разборчивости. Для этих же полос спектральные уровни шумов и помех в месте слушания

где В аш - спектральный уровень акустических шумов (определяется из справочных таблиц); В п - спектральный уровень помех от речи (самомаскировка речи),

где
- поправка на помехи от диффузного звука (R - акустическое отношение в расчетной точке); N д - дифракционная поправка, поправка на отражение от головы слушателя (определяется из справочных таблиц);
- поправка на реверберационные помехи (Т р - время реверберации).

Уровень акустических шумов не зависит от индекса тракта, в то время как уровень помех от речи растет с увеличением индекса тракта (16.4), (16.6). Поэтому для повышения уровня ощущения целесообразно увеличивать индекс тракта. После достижения условия

В п = В аш + 6 (16.7)

дальнейшее увеличение индекса тракта не рационально, так как уровень ощущения в пределе может повыситься лишь на 1 дБ. Это условие с учетом (16.4), (16.6), (16.7) определяет индекс тракта

Такой индекс тракта называют рациональным . Он в основном определяется максимальным значением акустического отношения
в расчетной точке и временем реверберации.

При рациональном усилении из (16.5) следует, что

В ш = В п + 1, (16.9)

т.е. вклад акустических шумов В аш в общий уровень шумов и помех незначителен.

Полученные выражения позволяют определить разборчивость и понятность речи. Для этого по формулам (16.4), (16.6), (16.9) находят уровни речи, шумов и помех и далее по формуле (16.2) определяют уровень ощущения формант Е ф для каждой полосы равной разборчивости. Графическая зависимость, представленная на рис. 16.1, позволяет найти коэффициенты разборчивости к ф , соответствующие полученным значениям Е ф . Общая формантная разборчивость А в речевом диапазоне частот находится из выражения (16.3), а соответствующая ей слоговая разборчивость определяется по рис. 16.2. Понятность речи определяется по табл. 16.1.

Методы повышения разборчивости речи

    Снижение уровней помех. (На практике этого достигнуть удается не всегда). Стараются увеличивать L p у слушателя(приближение микрофона, увеличение уровня голоса говорящего).

    Повышение уровня звукового давления у слушателя по прямому звуку, приближением микрофона к источнику звука, повышением уровня голоса говорящего, увеличением индекса тракта.

    Сжатие D речевого сигнала - повышение уровней звукового давления слабых звуков при сохранении максимальных уровней звукового давления.

Предельным случаем сжатия D является амплитудное ограничение - клиппирование . При этом речевой сигнал превращается в последовательность импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами (телеграфный режим работы). В результате все звуки речи будут иметь одинаковый (максимальный) уровень при приеме. Качество звучания в этом случае ухудшается, но разборчивость резко повышается, так как слабые звуки не клиппированной речи, маскирующиеся помехами, при таком способе передачи окажутся выше уровней помех.

    Применение вокодеров.

Вокодер представляет собой устройство, в передающей части которого из речевого сигнала выделяются параметры, определяющие информативность речи: спектральные огибающие звуков речи и параметры основного тона речи, т.е. медленно меняющиеся во времени признаки звуков речи.

В приемной части вокодера имеется сложный фильтр, имитирующий акустическую систему речевого тракта для звонких звуков речи и глухих. Уровнем синтезируемых звуков и параметрами фильтров управляют сигналы, выделенные на передающем конце вокодера, в результате чего восстанавливается спектральная огибающая речевого сигнала. Качество и разборчивость восстановленного сигнала получаются достаточно высокими.

    Увеличение средней мощности сигнала, а следовательно разборчивости, за счет разделения сигнала на огибающую и мгновенную фазы и их особая обработка.

Расчет разборчивости речи

    Вычисляем спектральные уровни речи с поправкой на расстояние от микрофона

, (16.10)

где В’ p – спектральный уровень речи на расстоянии 1 м (определяется из справочных таблиц).

2. По заданному спектру и уровню акустических шумов находим его спектральные уровни В а (определяется из справочных таблиц).

3. Определяем суммарную поправку ΣΔ L .

4. Определяем фактический индекс тракта Q мс .

5. Все данные заносятся в таблицу.

6. Вычисляем спектральные уровни речи у слушателя

(16.11)

7. Вычисляем спектральные уровни помех

. (16.12)

8. Суммируем спектральные уровни помех со спектральными уровнями акустических шумов

9. Вычитаем из спектрального уровня речи спектральный уровень суммарных помех и шумов и получаем уровень ощущения формант

. (16.14)

10. По найденному уровню ощущения находим коэффициент разборчивости k ф;

для 0. (16.15)

или находим его точные значения по таблице. Все вычисленные значения заносим в сводную таблицу.

11. Суммируем полученные величины коэффициентов разборчивости и находим формантную разбочивость

. (16.16)

По формантной разборчивости определяем слоговую S и словестную W разборчивсти и понятность речи.

Из анализа данных коэффициента разборчивости следует, что нижние частоты передаются намного хуже верхних. Так как есть запас по предельному индексу тракта на этих частотах, то можно спроектировать их примерно на 4 дБ. Разборчивость от этого практически не изменится, но повысится качество звучания.

Для ориентировочного определения разборчивости речи можно воспользоваться сокращенной методикой расчета. Если спектры речи и шумов изменяются по частоте не очень резко,то нет смысла вычислять их для всехполос равной разборчивости, а достаточно расчитать из на октавных частотах.

Октаве 173-350 Гц соотетствует одна полоса равной разборчивости (200-350 Гц).

Октава 350-700 Гц охватывает три полосы (330-465);

Октава 700-1400 Гц включает в себя 4 полосы (750-900);

Октава 1400-2800 Гц → 6 полос (1410-2840).

Октава 2800-5600 Гц → 5 полос (2840-5640).

Участок дапазона 5600-7000 Гц соответствует последней полосе равной разборчивости (5640-7000).

С учетом этого формантная разборчивость определяется по формуле

где k ф1 - k ф6 – коэффициенты разборчивости на октавных частотах.

УДК 534.773

И.В. ПРАСОЛ, канд. техн. наук, ХНУРЭ (г. Харьков),

А.С. НЕЧИПОРЕНКО, ХНУРЭ (г. Харьков)

СПОСОБ ПОВЫШЕНИЯ РАЗБОРЧИВОСТИ РЕЧИ У БОЛЬНЫХ

НЕЙРОСЕНСОРНОЙ ТУГОУХОСТЬЮ

Запропоновано новий спосіб підвищення розбірливості мови у хворих на нейросенсорну тугоухість, який базується на фільтрації мовного сигналу. В результаті фільтрації відбувається відокремлення найбільш значущих областей мовного спектру, що впливають на сприйняття мови хворим. Даний спосіб дозволяє поліпшити сприйняття мови у хворих з втратою чутності у діапазоні частот вище 1 кГц.

A new method to improve phrase intelligibility of people sick neurosurgery sensory hearing loss is suggested. It is based on the filtering voice. As a result of the filtering the most significant areas of speech spectrum which affect on speech perception patients are detected. This method helps improve the perception of speech of patients with hearing loss in the range above 1 kHz.

Постановка проблемы. В настоящее время всё большее число людей страдают нарушениями слуха. Причины снижения слуха могут быть разными, это и длительное воздействие чрезмерного шума, и общее ухудшение экологии, и осложнения после перенесенных болезней, травмы, генетические нарушения. Среди патологий слуховой системы лидирует нейросенсорная тугоухость, - ослабление слуха с сохранившимся восприятием речи, обусловленное поражением звуковоспринимающего аппарата или центрального отдела слухового анализатора. Она может быть следствием поражения как нейросенсорных эпителиальных клеток спирального органа, так и подкорковых, и корковых слуховых центров . Однако чаще всего нейросенсорная тугоухость обусловлена патологией рецептора и корешка преддверно-улиткового нерва. Данное заболевание не излечимо хирургическим путем, поэтому больному назначают слухопротезирование. Слуховой аппарат должен скорректировать индивидуальные особенности слуха, характерные для данного вида патологии . Для этих целей существует ряд алгоритмов обработки звука, реализованных в аналоговых слуховых аппаратах. Это алгоритмы частотно зависимого усиления, амплитудной компрессии, фильтрации помех. Однако реализация сложных алгоритмов обработки речевых сигналов, адаптируемых к индивидуальному характеру потерь слуха у пациентов, возможна только в цифровых слуховых аппаратах . Цифровая обработка сигналов позволяет применять высокоэффективные адаптивные алгоритмы с возможностью индивидуальной настройки параметров при неизменном аппаратном ядре.

Анализ литературы. Проведен анализ методов цифровой обработки сигналов . Изучены особенности восприятия речевого сигнала, существующие методы выделения формант из его спектра , а также методы

обработки речевого сигнала, позволяющие повысить разборчивость сигнала как для пациентов с нормальным слухом, так и для слабослышащих пациентов с диагнозом нейросенсорная тугоухость . Однако существующие методы повышения разборчивости речи не учитывают такую особенность нейросенсорной патологии как потеря слышимости в диапазоне свыше 1 кГц. Формантный анализ не использовался для создания адаптивных алгоритмов повышения словесной разборчивости.

Цель данной статьи - разработать способ повышения разборчивости речи у больных нейросенсорной тугоухостью.

Разборчивость речи у больных нейросенсорной тугоухостью.

Известно, что нейросенсорная тугоухость характеризуется повышением порогов слышимости, а также ухудшением слышимости в диапазоне свыше 1 кГц, что, в свою очередь, приводит к потере восприятия у таких больных высокочастотных компонент речи. Следствием такого ограниченного восприятия является значительное ухудшение разборчивости речи. Причина этого кроется в особенности локализации звуков речевого сигнала, а именно: согласные звуки в большинстве своём находятся в области частот выше 1 кГц, а гласные - в низкочастотном диапазоне. Поскольку на разборчивость речи преимущественно влияет восприятие согласных, то оставшийся речевой спектр из-за превалирования в нём гласных звуков становится нечётким и трудным для понимания. Исходя из вышесказанного, предлагается улучшить разборчивость речевого сигнала путём увеличения чёткости за счёт удаления частей спектра.

Особенности восприятия речевого сигнала. Любой речевой сигнал состоит из простейших звуков речи, называемых фонемами . Известно, что каждой фонеме соответствует своя форма голосового тракта человека, которая варьируется в соответствии с изменением положения языка, губ, зубов, в зависимости от этого меняются и частоты голосового тракта, в том числе и резонансные. Области спектральных максимумов речевого сигнала, соответствующие резонансным частотам голосового тракта, называются формантами. Форманта характеризуется частотой, шириной и амплитудой . Распознавание фонем базируется на восприятии формант как наиболее информативных признаков речевого сигнала. Также следует отметить, что распознавание каждой фонемы происходит в основном по положению первых двух формант. Учитывая данные факторы, а также такую особенность больных нейросенсорной тугоухостью как снижение частотной селективности, предлагается удалить из речевого спектра области, граничащие с формантными полосами.

Фильтрация речевого сигнала. В ходе эксперимента обрабатывалось несколько различных сигналов разных дикторов. Речевой сигнал преобразовывался в цифровой код и обрабатывался на ЭВМ. Для

идентификации формантных пиков гласных был использован программный пакет «Cool Edit Pro» , который позволяет проводить спектральный анализ речевого сигнала. Для получения спектральной характеристики аналогового сигнала, представленного в дискретной форме было использовано быстрое преобразование Фурье (БПФ), результатом которого является представление сигнала в виде набора из n частот

F = {F1,F2,...,Fn }. (1)

Влияние шумовых источников на речевой сигнал может привести к образованию пиков моментального спектра, не являющихся частью речевого сигнала. Такие пики называются ложными .

Определим пик как максимум интенсивности энергии сигнала в определенном интервале d на оси частот и выразим функцию P(Fk, d) проверки максимума в интервале d следующим образом:

Г1, при A, > max Л, k Ф j,

I к к-d

P(Fk, d) = \ j (2)

10, при Ak < ІШХ Aj , k ф j.

^ k-d

Тогда нахождение всех пиков сведется к нахождению частот разложения F є F, для которых выполняется условие P(F, d) = 1. Данный способ нахождения пиков называют последовательным проходом.

Поскольку наибольшее влияние на распознавание речевого сигнала оказывают первые две форманты, осуществляем фильтрацию формантных областей первых двух пиков. На рис. 1 изображен моментальный спектр

сигнала (одна выделенная форманта) до фильтрации. На рис. 2 изображен

моментальный спектр после фильтрации. Фильтрация производилась по формулам:

Fa = Fk - mx2 1 , (3)

F = F + _2--------maxL (4)

A b i max 1 2 ’ ^"

где Fa, F1, Fb, F2 - границы формантных областей подлежащих удалению; Fmax - пиковая частота форманты.

F = F + F 2 F max (4)

В результате фильтрации происходит выделение наиболее значимых областей речевого спектра, а также уменьшение маскировки нижних граничных частот последующих полос, оставшихся формантными полосами.

Для создания необходимых фильтров был проведен частотный анализ гласных и согласных звуков. Спектральная огибающая содержит большое число пиков отдельных частот, однако большая их часть неинформативна и находится в области выше 1 500 Гц. Основную речевую информацию несут в

себе пики с относительно большой амплитудой в диапазоне 70 Гц - 900 Гц . На рис. 3 представлен спектр звука "Е", где отчётливо различимы формантные пики в данном диапазоне.

Рис. 2. Формантная линия после фильтрации

Рис. 3. Спектр звука "Е" до фильтрации 163

Рис. 4. Спектр звука "Е" после фильтрации

Удаление частотных полос осуществлялось с помощью фильтров, которые создавались в опции меню РБТ-фильтр, согласно расчётным данным. В результате получена спектральная характеристика сигнала, представленная на рис. 4, откуда можно сделать вывод о сужении формантных областей, а также об увеличении амплитуды сигнала в области первых двух формантных пиков.

На рис. 5 - 8 представлены спектральные характеристики звуков Ж, Б до и после фильтрации.

Рис. 5. Спектр звука "Ж" до фильтрации 164

Таким образом проводилась обработка каждого звука всей речевой последовательности. Поскольку падение кривой слышимости у больных нейросенсорной тугоухостью начинается с 1кГц, на спектр также накладывался фильтр, отсекающий частоты выше 1кГц.

Рис. 6. Спектр звука "Ж" после фильтрации

Рис. 7. Спектр звука "Б" до фильтрации

Рис. 8. Спектр звука "Б" после фильтрации

Оценка влияния предлагаемого способа обработки на восприятие

речи. Для оценки влияния предлагаемого способа обработки на восприятие речевого сигнала группе больных нейросенсорной тугоухостью из 20 человек было предложено прослушать и сравнить два сигнала: исходный и прошедший предварительную обработку. Все больные имели опыт пользования слуховыми аппаратами в течение ряда лет. Следует отметить, что больные обладали невысокой исходной разборчивостью речи (менее 51%). Для оценки разборчивости были использованы речевые таблицы многосложных слов Гринберга, учитывающие фонетические особенности, характерные для русской речи . Выходной сигнал не подвергался никаким дополнительным преобразованиям, кроме регулировки громкости для комфортного восприятия конкретным пациентом. Результаты исследования для 6 человек приведены в таблице.

Результаты исследования

Испытуемые с диагнозом нейросенсорная тугоухость Разборчивость исходного речевого сигнала (%) Разборчивость обработанного речевого сигнала (%)

Степень тугоухости Возраст испытуемого

Выводы. Анализируя полученные данные можно сделать вывод о повышении разборчивости речи у больных в пределах 5 - 18 %. Результаты исследования для остальных пациентов аналогичны, значения разборчивости находятся в пределах вышеуказанного диапазона. Следовательно, в результате фильтрации частотных полос спектра, граничащих с формантами, увеличивается чёткость речевого сигнала. Выделение наиболее информативных областей спектра способствует улучшению восприятия речевой последовательности, речь становится более внятной и понимаемой. Использование предлагаемого способа обработки речевого сигнала позволяет достоверно повысить разборчивость речевого сигнала у больных нейросенсорной тугоухостью. Таким образом, это открывает возможность создания адаптивного алгоритма повышения словесной разборчивости.

Список литературы: 1. Нейман Л.В., Богомильский М.Р. Анатомия, физиология и патология органов слуха и речи. - "Владос", 2001. - 224 с. 2. Прасол И.В., Кобылинский А.В. Методика оптимизации цифровых схем биомедицинских устройств // Прикладная радиоэлектроника. - 2007. -Т. 6. - № 1. - С. 51-55. 3. Прасол И.В., Кобылинский А.В. Алгоритмы проектирования адаптивных цифровых слуховых аппаратов / 7-я научно-техническая конференция "Медикотехнические технологии на страже здоровья". Сборник научных трудов. - М.: МГТУ им. Н.Э. Баумана, 2005. - С. 54-56. 4. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. - М.: Мир, 1978. - 848 с. 5. Гельфанд С.А. Слух: Введение в психологическую и физиологическую акустику. - М.: Медицина, 1984. 6. Петров С.М. Полосовая фильтрация речевого сигнала - восприятие речи в норме и при нейросенсорной тугоухости // Вестник оториноларингологии. - 2000. - N° 3. - С. 55-56. 7. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. - М.: Радио и связь, 1981. - 496 с. 8. ttp://www.adobe.com/special/ products/audition/syntrillium.html. 9. Сердюков В.Д. Опознавание речевых сигналов на фоне мешающих факторов. - Тбилиси: Наука, 1987. - 142 с. 10. Чистович Л.А., Венцов А.В., ГранстремМ.П. Физиология речи. Восприятие речи человеком. - Л.: Наука, 1976. - 388 с. 11. Джеймс Л. Фланаган Анализ, синтез и восприятие речи. - М.: Связь, 1968. - 396 с.




© 2024
womanizers.ru - Журнал современной женщины