Моделирование речевого сигнала

Автор работы: Пользователь скрыл имя, 12 Марта 2014 в 15:03, реферат

Краткое описание

Акустический речевой сигнал возникает в результате сложных
координированных движений, происходящих в ряде органов, вся
совокупность которых и называется речевым аппаратом (рис. 1., А).
Легкие со всей дыхательной мускулатурой обеспечивают развитие
давлений и возникновение воздушных потоков в речевом тракте. Последний
(рис. 1, Б, В) представляется гортанью и рядом воздушных полостей,
конфигурация которых существенно изменяется в процессе речеобразования.
Ведущую роль играют движения небной занавески, языка, губ и нижней
челюсти.

Прикрепленные файлы: 1 файл

Моделирование речевого сигнала.pdf

— 940.52 Кб (Скачать документ)
Page 1
МОДЕЛИРОВАНИЕ РЕЧЕВОГО СИГНАЛА
Акустический речевой сигнал возникает в результате сложных
координированных движений, происходящих в ряде органов, вся
совокупность которых и называется речевым аппаратом (рис. 1., А).
Легкие со всей дыхательной мускулатурой обеспечивают развитие
давлений и возникновение воздушных потоков в речевом тракте. Последний
(рис. 1, Б, В) представляется гортанью и рядом воздушных полостей,
конфигурация которых существенно изменяется в процессе речеобразования.
Ведущую роль играют движения небной занавески, языка, губ и нижней
челюсти.
Механизмы возбуждения акустических колебаний связаны либо с
работой гортани, либо с возникновением шумных или импульсных звуков
при прохождении воздушного потока через сужения, образующиеся в
определенных местах речевого тракта.
Возбужденные акустические колебания подвергаются частотной
фильтрации в воздушных полостях речевого тракта, действующих как
акустические частотные фильтры. Конфигурация и объемы этих полостей в
процессе
речеобразования
определенным
образом
изменяются.
Соответственно этому изменяется и спектр исходных звуковых колебаний,
создаваемых акустическими источниками.

Page 2

Рис. 1. Схема речеобразующего аппарата А - анатомическое
изображение; Б - функциональные элементы; В -эквивалентная блок-схема.
На А: 1 - грудная клетка, 2 - лёгкие, 3 - трахея, 4 -голосовые связки, 5 -
гортанная трубка, 6 - полость глотки, 7 - нёбная занавеска, 8 - полость рта, 9 -
полость носа. На Б: 1 - сила дыхательных мышц, 2 - объём легких, 3 - трахея,
4 - голосовые связки, 5 - гортанная трубка, 6 - полость глотки, 7 - нёбная
занавеска, 8 - полость рта, 9 - полость носа, 10 - излучение из ротового
отверстия, 11 - излучение из носовых отверстий. На В: 2, 3 - ёмкость легких и
трахеи, 4 - голосовой источник колебаний, 5, 6 - ёмкость гортани и глотки, 7 -
механизм нёбной занавески, 8 - емкость полости рта, 9 - емкость полостей
носа, 10 - выходной сигнал ротового тракта, 11 - выходной сигнал носового
тракта, 12 - шумовой источник.
Образование воздушных потоков, работа механизма гортани, все
движения органов, образующих речевой тракт («артикуляторов»),
происходят закономерно и координировано. Благодаря этой динамически

Page 3

слаженной деятельности и возникают сигналы связной речи.
При акустическом моделировании каждый участок РА (полость,
сужение) представляется в виде секции, параметры в которой можно считать
распределенными равномерно.
Акустические параметры полостей РА неравномерно распределены
вдоль его оси.
На рис. 2 изображён схематический разрез речевого аппарата (РА) при
произнесении диктором гласных (и, о, у). Хотя конфигурация полостей РА
отличается сложной формой, в РА можно выделить ротовую, глоточную и
носовую полости. При образовании русских гласных проход из полости
глотки в носовую полость закрыт нёбной занавеской. Полости рта и глотки
разделены сужением, образуемым спинкой языка и нёбом. Второе сужение
образуется с участием губ и двух рядов зубов.
Введем ряд упрощений, которые, с некоторым приближением позволят
получить достаточно наглядное описание процессов происходящих в РА. По
измерениям, проведённым академиком В.Н. Сорокиным, площадь голосовой
щели во время фонации не превышает 0.2-0.4 см
2
; площадь же поперечного
сечения глотки имеет величину в 10-20 раз большую. Поэтому голосовую
щель можно рассматривать как источник с большим внутренним
сопротивлением, т.е. как источник объемной скорости.
Точно так же можно пренебречь упругостью стенок полостей. В
результате получим акустическую модель РА, изображенную на рис. 2,б.
Голосовые связки изображены в виде поршня.

Page 4

Рис. 2. Акустическая модель речевого аппарата
а) - продольное сечение ГА; б) - акустическая модель; в) - эквивалентная
электрическая схема; г) - упрощённая эквивалентная схема.
Секция S
1
представляет собой полость гортани, секция S
2
- область
сжатия, образуемую спинкой языка, секция S
3
- ротовую полость и секция S
4
- область сжатия, образуемую ротовым отверстием. Звуковая энергия,
излучаемая из ротового отверстия, отражается от лица говорящего, т.е. лицо
как бы является отражательной доской. Речевой аппарат имеет следующие
среднестатистические размеры: длина вдоль его оси от голосовой щели до
ротового отверстия равна 17.5 см, площадь поперечного сечения полостей -
не более 5... 15 см
2
. При таких размерах распространение звуковых волн
вдоль оси РА не зависит от изгибов формы. Для сигнала с частотой ниже

Page 5

некоторой граничной f
0
в РА выполняется условие распространения плоских
волн. Для полого цилиндра диаметром 2R
R
c
17
.1
f
0

=
,
где с = 3.53 10
2
м/с - скорость распространения звука при t = 37° С. При
f
0
=6кГц,

R
8.
6
)
10
6/(
10
10
53
.3
17
.1
2
2
3
2
2
=





=

, т.е. больше поперечного
размера РА в любой его точке.
При длине волны
0
/ f
с
=
λ
, значительно превышающей длину PA
(

f
1000Гц), допустима
замена
распределенных
параметров
на
сосредоточенные.
Составим электрический аналог акустической модели. Путем замены
каждой полости Т-образной эквивалентной схемой получим схему,
изображенную на рис. 2,в. Генератор e
г
является аналогом голосовой щели и
представляет собой источник тока i
0
с внутренним сопротивлением z
r
. Ток i,
проходящий через активное R
H
и индуктивное L
H
сопротивления,
представляют собой аналог объемной скорости в ротовом отверстии.
Величины R
H
и L
H
-представляют собой сопротивление излучения и массу
воздуха в ротовом отверстии.
Последние определяются по формулам:
r
L
c
R
H
H



=



=
2
2
3
8
2
π
ρ
π
ω
ρ
,
(3.4)
где
ρ
= 1.14 10
-6
кг/м
3
- плотность воздуха;
r - радиус кругового отверстия, равного площади ротового
отверстия.
Г. Фант рассматривал голову как отражающую доску, имеющую
радиус 9 см, в центре которой действует поршневая диафрагма. Действие

Page 6

отражающей доски учитывается коэффициентом
)
(
ω
S
K
входящим в
формулу для сопротивления излучения. На низких частотах
)
(
ω
S
K
=1, на
частотах около 2 кГц
)
(
ω
S
K
=1.7, а на более высоких частотах коэффициент
)
(
ω
S
K
опять уменьшается. В формулах выше коэффициент
)
(
ω
S
K
=2, что
соответствует отражению от бесконечно большой доски.
Введем в схему рис. 2, в следующие упрощения: пусть х
11
соединен
последовательно с большим внутренним сопротивлением генератора z
г
и им
можно пренебречь. Сопротивления упругости x
22
и х
24
представляют
соответственно небольшие области сжатия в ротовой полости между спинкой
языка и нёбом и в ротовом отверстии. Их величина велика и поэтому ими
также можно пренебречь. Итак, с принятыми упрощениями схема,
приобретает вид, изображенный на рис. 2, г.
С учетом формулы (3.4)
;
c
l
sin
S
c
x
x
1
1
21
1
C
¹
·
¨
©
§



=
=
ω
ρ
;
c
l
sin
S
c
x
x
3
3
23
2
C
¹
·
¨
©
§



=
=
ω
ρ
¸
¹
·
¨
©
§




+
¹
·
¨
©
§





+
¹
·
¨
©
§




=

+
+

=
c
2
l
tg
S
c
c
2
l
tg
S
c
2
c
2
l
tg
S
c
x
2
1
x
x
2
1
x
3
3
2
2
1
1
13
12
11
1
L
ω
ρ
ω
ρ
ω
ρ
;
r
3
c
8
c
2
l
tg
S
c
2
c
2
l
tg
S
c
x
x
x
2
1
x
2
4
4
3
3
H
14
13
2
L




+
¹
·
¨
©
§





+
¹
·
¨
©
§




=
+
+

=
π
ρ
ω
ρ
ω
ρ
. (3.5)
Соотношение объемных скоростей на выходе и входе РА:
(
)
.
1
x
1
x
1
x
x
x/
x
i
i
2
L
2
C
1
C
1
L
2
C
1
C
0

¸
¸
¹
·
¨
¨
©
§



=
(3.6)
Поскольку потери R и G в формантной модели не учитываются, то на
резонансных частотах


0
/i
i
при условии, что x
L2
.

0.
Таким образом, для нахождения резонансных частот в модели

Page 7

необходимо решить уравнение
(
)
0
1
x
1
x
1
x
x
2
L
2
C
1
C
1
L
=

¸
¸
¹
·
¨
¨
©
§



, (3.7)
Согласно графическому решению уравнения (3.7) резонансные частоты
для модели [i] равны 330, 2320 и 2750 Гц при S
1
=7,7 см
2
, S
2
=0,9 см
2
, S
3
=1,5
см
2
; l
1
=7 см, 1
2
=1.5 см, l
3
=4.5 см. Эти значения довольно близки к
среднестатистическим значениям, равным 270, 2290 и 3010 Гц.
Задание.
1.
Составить формулу для расчета частотного отклика речевого
тракта с использованием рисунков 2, в и г для полной и
упрощенной электрических эквивалентных схем.
2.
Подставить параметры формулы из текста и рассчитать в
диапазоне речевого сигнала 70-7000 Гц.
3.
Результаты расчета построить на одном графике и сравнить.
Сделать выводы.

Информация о работе Моделирование речевого сигнала