Что показал гармонический анализ гласных. Анализ звука. Дискретные методы гармонического анализа

НЕ УВИДЕЛА ОБСУЖДЕНИЯ ЭТИХ ЗАДАЧ! СПРОШУ УСТНО!

За-да-ние 20 № 44. Элек-три-че-ская дуга — это

А. из-лу-че-ние света элек-тро-да-ми, при-со-единёнными к ис-точ-ни-ку тока.

Б. элек-три-че-ский раз-ряд в газе.

Пра-виль-ный ответ

1) толь-ко А

2) толь-ко Б

4) ни А, ни Б

Элек-три-че-ская дуга

Элек-три-че-ская дуга — это один из видов га-зо-во-го раз-ря-да. По-лу-чить её можно сле-ду-ю-щим об-ра-зом. В шта-ти-ве за-креп-ля-ют два уголь-ных стерж-ня за-острёнными кон-ца-ми друг к другу и при-со-еди-ня-ют к ис-точ-ни-ку тока. Когда угли при-во-дят в со-при-кос-но-ве-ние, а затем слег-ка раз-дви-га-ют, между кон-ца-ми углей об-ра-зу-ет-ся яркое пламя, а сами угли рас-ка-ля-ют-ся до-бе-ла. Дуга горит устой-чи-во, если через неё про-хо-дит по-сто-ян-ный элек-три-че-ский ток. В этом слу-чае один элек-трод яв-ля-ет-ся всё время по-ло-жи-тель-ным (анод), а дру-гой — от-ри-ца-тель-ным (катод). Между элек-тро-да-ми на-хо-дит-ся столб рас-калённого газа, хо-ро-шо про-во-дя-ще-го элек-три-че-ство. По-ло-жи-тель-ный уголь, имея более вы-со-кую тем-пе-ра-ту-ру, сго-ра-ет быст-рее, и в нём об-ра-зу-ет-ся углуб-ле-ние — по-ло-жи-тель-ный кра-тер. Тем-пе-ра-ту-ра кра-те-ра в воз-ду-хе при ат-мо-сфер-ном дав-ле-нии до-хо-дит до 4 000 °С.

Дуга может го-реть и между ме-тал-ли-че-ски-ми элек-тро-да-ми. При этом элек-тро-ды пла-вят-ся и быст-ро ис-па-ря-ют-ся, на что рас-хо-ду-ет-ся боль-шая энер-гия. По-это-му тем-пе-ра-ту-ра кра-те-ра ме-тал-ли-че-ско-го элек-тро-да обыч-но ниже, чем уголь-но-го (2 000—2 500 °С). При го-ре-нии дуги в газе при вы-со-ком дав-ле-нии (около 2 ·10 6 Па) тем-пе-ра-ту-ру кра-те-ра уда-лось до-ве-сти до 5 900 °С, т. е. до тем-пе-ра-ту-ры по-верх-но-сти Солн-ца. Столб газов или паров, через ко-то-рые идёт раз-ряд, имеет ещё более вы-со-кую тем-пе-ра-ту-ру — до 6 000—7 000 °С. По-это-му в стол-бе дуги пла-вят-ся и об-ра-ща-ют-ся в пар почти все из-вест-ные ве-ще-ства.

Для под-дер-жа-ния ду-го-во-го раз-ря-да нужно не-боль-шое на-пря-же-ние, дуга горит при на-пря-же-нии на её элек-тро-дах 40 В. Сила тока в дуге до-воль-но зна-чи-тель-на, а со-про-тив-ле-ние не-ве-ли-ко; сле-до-ва-тель-но, све-тя-щий-ся га-зо-вый столб хо-ро-шо про-во-дит элек-три-че-ский ток. Иони-за-цию мо-ле-кул газа в про-стран-стве между элек-тро-да-ми вы-зы-ва-ют сво-и-ми уда-ра-ми элек-тро-ны,ис-пус-ка-е-мые ка-то-дом дуги. Боль-шое ко-ли-че-ство ис-пус-ка-е-мых элек-тро-нов обес-пе-чи-ва-ет-ся тем, что катод на-грет до очень вы-со-кой тем-пе-ра-ту-ры. Когда для за-жи-га-ния дуги вна-ча-ле угли при-во-дят в со-при-кос-но-ве-ние, то в месте кон-так-та, об-ла-да-ю-щем очень боль-шим со-про-тив-ле-ни-ем, вы-де-ля-ет-ся огром-ное ко-ли-че-ство теп-ло-ты. По-это-му концы углей силь-но разо-гре-ва-ют-ся, и этого до-ста-точ-но для того, чтобы при их раз-дви-же-нии между ними вспых-ну-ла дуга. В даль-ней-шем катод дуги под-дер-жи-ва-ет-ся в накалённом со-сто-я-нии самим током, про-хо-дя-щим через дугу.

За-да-ние 20 № 71. Гар-мо-ни-че-ским ана-ли-зом звука на-зы-ва-ют

А. уста-нов-ле-ние числа тонов, вхо-дя-щих в со-став слож-но-го звука.

Б. уста-нов-ле-ние ча-стот и ам-пли-туд тонов, вхо-дя-щих в со-став слож-но-го звука.

Пра-виль-ный ответ:

1) толь-ко А

2) толь-ко Б

4) ни А, ни Б

Ана-лиз звука

При по-мо-щи на-бо-ров аку-сти-че-ских ре-зо-на-то-ров можно уста-но-вить, какие тоны вхо-дят в со-став дан-но-го звука и ка-ко-вы их ам-пли-ту-ды. Такое уста-нов-ле-ние спек-тра слож-но-го звука на-зы-ва-ет-ся его гар-мо-ни-че-ским ана-ли-зом.

Рань-ше ана-лиз звука вы-пол-нял-ся с по-мо-щью ре-зо-на-то-ров, пред-став-ля-ю-щих собой полые шары раз-но-го раз-ме-ра, име-ю-щих от-кры-тый от-ро-сток, встав-ля-е-мый в ухо, и от-вер-стие с про-ти-во-по-лож-ной сто-ро-ны. Для ана-ли-за звука су-ще-ствен-но, что вся-кий раз, когда в ана-ли-зи-ру-е-мом звуке со-дер-жит-ся тон, ча-сто-та ко-то-ро-го равна ча-сто-те ре-зо-на-то-ра, по-след-ний на-чи-на-ет гром-ко зву-чать в этом тоне.

Такие спо-со-бы ана-ли-за, од-на-ко, очень не-точ-ны и кро-пот-ли-вы. В на-сто-я-щее время они вы-тес-не-ны зна-чи-тель-но более со-вер-шен-ны-ми, точ-ны-ми и быст-ры-ми элек-тро-аку-сти-че-ски-ми ме-то-да-ми. Суть их сво-дит-ся к тому, что аку-сти-че-ское ко-ле-ба-ние сна-ча-ла пре-об-ра-зу-ет-ся в элек-три-че-ское ко-ле-ба-ние с со-хра-не-ни-ем той же формы, а сле-до-ва-тель-но, име-ю-щее тот же спектр, а затем это ко-ле-ба-ние ана-ли-зи-ру-ет-ся элек-три-че-ски-ми ме-то-да-ми.

Один из су-ще-ствен-ных ре-зуль-та-тов гар-мо-ни-че-ско-го ана-ли-за ка-са-ет-ся зву-ков нашей речи. По темб-ру мы можем узнать голос че-ло-ве-ка. Но чем раз-ли-ча-ют-ся зву-ко-вые ко-ле-ба-ния, когда один и тот же че-ло-век поёт на одной и той же ноте раз-лич-ные глас-ные? Дру-ги-ми сло-ва-ми, чем раз-ли-ча-ют-ся в этих слу-ча-ях пе-ри-о-ди-че-ские ко-ле-ба-ния воз-ду-ха, вы-зы-ва-е-мые го-ло-со-вым ап-па-ра-том при раз-ных по-ло-же-ни-ях губ и языка и из-ме-не-ни-ях формы по-ло-сти рта и глот-ки? Оче-вид-но, в спек-трах глас-ных долж-ны быть какие-то осо-бен-но-сти, ха-рак-тер-ные для каж-до-го глас-но-го звука, сверх тех осо-бен-но-стей, ко-то-рые со-зда-ют тембр го-ло-са дан-но-го че-ло-ве-ка. Гар-мо-ни-че-ский ана-лиз глас-ных под-твер-жда-ет это пред-по-ло-же-ние, а имен-но: глас-ные звуки ха-рак-те-ри-зу-ют-ся на-ли-чи-ем в их спек-трах об-ла-стей обер-то-нов с боль-шой ам-пли-ту-дой, причём эти об-ла-сти лежат для каж-дой глас-ной все-гда на одних и тех же ча-сто-тах не-за-ви-си-мо от вы-со-ты про-пе-то-го глас-но-го звука.

За-да-ние 20 № 98. В масс-спек-тро-гра-фе

1) элек-три-че-ское и маг-нит-ное поля слу-жат для уско-ре-ния за-ря-жен-ной ча-сти-цы

2) элек-три-че-ское и маг-нит-ное поля слу-жат для из-ме-не-ния на-прав-ле-ния дви-же-ния за-ря-жен-ной ча-сти-цы

3) элек-три-че-ское поле слу-жит для уско-ре-ния за-ря-жен-ной ча-сти-цы, а маг-нит-ное поле слу-жит для из-ме-не-ния на-прав-ле-ния её дви-же-ния

4) элек-три-че-ское поле слу-жит для из-ме-не-ния на-прав-ле-ния дви-же-ния за-ря-жен-ной ча-сти-цы, а маг-нит-ное поле слу-жит для её уско-ре-ния

Масс-спек-тро-граф

Масс-спек-тро-граф — это при-бор для раз-де-ле-ния ионов по ве-ли-чи-не от-но-ше-ния их за-ря-да к массе. В самой про-стой мо-ди-фи-ка-ции схема при-бо-ра пред-став-ле-на на ри-сун-ке.

Ис-сле-ду-е-мый об-ра-зец спе-ци-аль-ны-ми ме-то-да-ми (ис-па-ре-ни-ем, элек-трон-ным уда-ром) пе-ре-во-дит-ся в га-зо-об-раз-ное со-сто-я-ние, затем об-ра-зо-вав-ший-ся газ иони-зи-ру-ет-ся в ис-точ-ни-ке 1. Затем ионы уско-ря-ют-ся элек-три-че-ским полем и фор-ми-ру-ют-ся в узкий пучок в уско-ря-ю-щем устрой-стве 2, после чего через узкую вход-ную щель по-па-да-ют в ка-ме-ру 3, в ко-то-рой со-зда-но од-но-род-ное маг-нит-ное поле. Маг-нит-ное поле из-ме-ня-ет тра-ек-то-рию дви-же-ния ча-стиц. Под дей-стви-ем силы Ло-рен-ца ионы на-чи-на-ют дви-гать-ся по дуге окруж-но-сти и по-па-да-ют на экран 4, где ре-ги-стри-ру-ет-ся место их по-па-да-ния. Ме-то-ды ре-ги-стра-ции могут быть раз-лич-ны-ми: фо-то-гра-фи-че-ские, элек-трон-ные и т. д. Ра-ди-ус тра-ек-то-рии опре-де-ля-ет-ся по фор-му-ле:

где U — элек-три-че-ское на-пря-же-ние уско-ря-ю-ще-го элек-три-че-ско-го поля; B — ин-дук-ция маг-нит-но-го поля; m и q — со-от-вет-ствен-но масса и заряд ча-сти-цы.

Так как ра-ди-ус тра-ек-то-рии за-ви-сит от массы и за-ря-да иона, то раз-ные ионы по-па-да-ют на экран на раз-лич-ном рас-сто-я-нии от ис-точ-ни-ка, что и поз-во-ля-ет их раз-де-лять и ана-ли-зи-ро-вать со-став об-раз-ца.

В на-сто-я-щее время раз-ра-бо-та-ны мно-го-чис-лен-ные типы масс-спек-тро-мет-ров, прин-ци-пы ра-бо-ты ко-то-рых от-ли-ча-ют-ся от рас-смот-рен-но-го выше. Из-го-тав-ли-ва-ют-ся, на-при-мер, ди-на-ми-че-ские масс-спек-тро-мет-ры, в ко-то-рых массы ис-сле-ду-е-мых ионов опре-де-ля-ют-ся по вре-ме-ни пролёта от ис-точ-ни-ка до ре-ги-стри-ру-ю-ще-го устрой-ства.

Если у пианино нажать на педаль и сильно крикнуть на него, то от него можно будет услышать отзвук, который будет слышится некоторое время, с тоном (частотой) очень похожим на первоначальный звук.

Анализ и синтез звука.

При помощи наборов акустических резонаторов можно устано­вить, какие тоны входят в состав данного звука и с какими амплитудами они присутствуют в данном звуке. Такое установле­ние гармонического спектра сложного звука называется его гармоническим анализом. Раньше такой анализ действительно производился с помощью наборов резонаторов, в частности резонаторов Гельмгольца, представляющих собой полые шары разного размера, снабженные отростком, вставляющимся в ухо, и имеющие отверстие с противоположной стороны.

Для анализа звука существенно то, что всякий раз, когда в анализируемом звуке содержится тон с частотой резонатора, резонатор начинает громко звучать в этом тоне.

Такие способы анализа очень неточны и кропотливы. В на­стоящее время они вытеснены значительно более совершенными, точными и быстрыми электроакустиче­скими способами. Суть их сводится к тому, что акустическое колебание сначала преобра­зуется в электрическое колебание с сохранением той же формы, а следовательно, имеющее такой же спектр; затем уже электри­ческое колебание анализируется электрическими методами.

Можно указать один существенный результат гармонического анализа, касающийся звуков нашей речи. По тембру мы можем узнать голос человека. Но чем различаются звуковые колебания, когда один и тот же человек поёт на одной и той же ноте различные гласные: а, и, о, у, э? Другими словами, чем разли­чаются в этих случаях периодические колебания воздуха вызы­ваемые голосовым аппаратом при разных положениях губ и языка и изменениях формы полостей рта и горла? Очевидно, в спектрах гласных должны быть какие-то особенности, характерные для каждого гласного звука, сверх тех особенностей, которые создают тембр голоса данного человека. Гармонический анализ гласных подтверждает это предположение, а именно, гласные звуки характеризуются наличием в их спектрах областей оберто­нов с большой амплитудой, причём эти области лежат для каждой гласной всегда на одних и тех же частотах, независимо от высоты пропетого гласного звука. Эти области сильных оберто­нов называют формантами. Каждая гласная имеет две характерные для неё форманты.

Очевидно, если искусственным путём воспроизвести спектр того или иного звука, в частности спектр гласной, то наше ухо получит впечатление этого звука, хотя его естественный источ­ник отсутствовал бы. Особенно легко удаётся осуществлять такой синтез звуков (и синтез гласных) с помощью электроаку­стических устройств. Электрические музыкальные инструменты позволяют очень просто изменять спектр звука, т.е. менять его тембр. Простое переключение делает звук похожим на звуки то флейты, то скрипки, то человеческого голоса или же совсем своеобразным, непохожим на звук ни одного из обычных инстру­ментов.

Эффект Доплера в акустике.

Частота звуковых колебаний, которые слышит неподвижный наблюдатель в случае, если источник звука приближается или удаляется от него, отлична от частоты звука, воспринимаемой наблюдателем, который движется вместе с этим источником звука, или и наблюдатель и источник звука стоят на месте. Изменение частоты звуковых колебаний (высоты звука), связанное с относительным движением источника и наблюдателя называется акустическим эффектом Доплера. Когда источник и приемник звука сближаются, то высота звука повышается, а если они удаляются. то высота звука понижается. Это связано с тем, что при движении источника звука относительно среды, в кото­рой распространяются звуковые волны, скорость такого движения векторно складывается со скоростью распространения звука.

Например, если машина с включенной сиреной приближается, а затем, проехав мимо, удаляется, то сначала слышен звук высокого тона, а затем низкого.

Звуковые удары

Ударные волны возникают при выстреле, взрыве, электриче­ском разряде и т.п. Основной особенностью ударной волны является резкий скачок давления на фронте волны. В момент прохождения ударной волны максимум давления в данной точке возникает практически мгновенно за время порядка 10-10 с. При этом одновременно скачком изменяются плотность и темпера­тура среды. Затем давление медленно падает. Мощность ударной волны зависит от силы взрыва. Скорость распространения удар­ных волн может быть больше скорости звука в данной среде. Если, например, ударная волна увеличивает давление в полтора раза, то при этом температура повышается на 35 0С и скорость распространения фронта такой волны примерно равна 400 м/с. Стены средней толщины, которые встречаются на пути такой ударной волны будут разрушены.

Мощные взрывы будут сопровождаться ударными волнами, ко­торые создают в максимальной фазе фронта волны давление, в 10 раз превышающее атмосферное. При этом плотность среды увели­чивается в 4 раза, температура повышается на 500 0C, и ско­рость распространения такой волны близка к 1 км/с. Толщина фронта ударной волны имеет порядок длины свободного пробега молекул (10-7 - 10-8 м), поэтому при теоретическом рассмотрении можно считать, что фронт ударной волны представляет собой поверхность взрыва, при переходе через которую параметры газа изменяются скачком.

Ударные волны так же возникают, когда твёрдое тело дви­жется со скоростью, превышающей скорость звука. Перед самолё­том, который летит со сверхзвуковой скоростью, образуется ударная волна, которая является основным фактором, определяю­щим сопротивление движению самолёта. Чтобы это сопротивление ослабить, сверхзвуковым самолётам придают стреловидную форму.

Быстрое сжатие воздуха перед движущимся с большой скоростью предметом приводит к повышению температуры, которая с нарастанием скорости предмета - увеличивается. Когда ско­рость самолёта достигает скорость звука, температура воздуха достигает 60 0C. При скорости движения вдвое выше скорости звука, температура повышается на 240 0C, а при скорости, близкой к тройной скорости звука - становится 800 0С. Скорости близкие к 10 км/с приводят к плавлению и превращению движущегося тела в газообразное состояние. Падение метеоритов со скоростью в несколько десятков километров в секунду приво­дит к тому, что уже на высоте 150 - 200 километров, даже в разрежённой атмосфере метеоритные тела заметно нагреваются и светятся. Большинство из них на высотах 100 - 60 километров полностью распадаются.

Шумы.

Наложение большого количества колебаний беспорядочно сме­шанных одно относительно другого и произвольно изменяющих интенсивность во времени, приводят к сложной форме колебаний. Такие сложные колебания, состоящие из большого числа простых звуков различной тональности, называют шумами. Примерами могут служить шелест листьев в лесу, грохот водопада, шум на улице города. К шумам также можно отнести звуки, выражаемые согласными. Шумы могут отличатся распределением по силе звука, по частоте и продолжительности звучания во времени. Длительное время звучат шумы, создаваемые ветром, падающей воды, морским прибоем. Относительно кратковременны раскаты грома, рокот волн - это низкочастотные шумы. Механические шумы могут вызываться вибрацией твёрдых тел. Возникающие при лопании пузырьков и полостей в жидкости звуки, которые сопро­вождают процессы кавитации, приводят к кавитационным шумам.

При помощи наборов акустических резонаторов можно установить, какие тоны входят в состав данного звука и с какими амплитудами они присутствуют в данном звуке. Такое установление гармонического спектра сложного звука называется его гармоническим анализом. Раньше такой анализ действительно производился с помощью наборов резонаторов, в частности резонаторов Гельмгольца, представляющих собой полые шары разного размера, снабженные отростком, вставляющимся в ухо, и имеющие отверстие с противоположной стороны (рис. 43). Действие такого резонатора, как и действие резонансного ящика камертона, мы объясним ниже (§51). Для анализа звука существенно то, что всякий раз, когда в анализируемом звуке содержится тон с частотой резонатора, последний начинает громко звучать в этом тоне.

Рис. 43. Резонатор Гельмгольца

Такие способы анализа, однако, очень неточны и кропотливы. В настоящее время они вытеснены значительно более совершенными, точными и быстрыми электроакустическими способами. Суть их сводится к тому, что акустическое колебание сначала преобразуется в электрическое колебание с сохранением той же формы, и следовательно, имеющее такой же спектр (§ 17); затем уже это электрическое колебание анализируется электрическими методами.

Укажем один существенный результат гармонического анализа, касающийся звуков нашей речи. По тембру мы можем узнать голос человека. Но чем различаются звуковые колебания, когда один и тот же человек поет на одной и той же ноте различные гласные: а, и, о, у, э? Другими словами, чем различаются в этих случаях периодические колебания воздуха, вызываемые голосовым аппаратом при разных положениях губ и языка и изменениях формы полостей рта и горла? Очевидно, в спектрах гласных должны быть какие-то особенности, характерные для каждого гласного звука, сверх тех особенностей, которые создают тембр голоса данного человека. Гармонический анализ гласных подтверждает это предположение, а именно, гласные звуки характеризуются наличием в их спектрах областей обертонов с большой амплитудой, причем эти области лежат для каждой гласной всегда на одних и тех же частотах, независимо от высоты пропетого гласного звука. Эти области сильных обертонов называются формантами. Каждая гласная имеет две характерные для нее форманты. На рис. 44 показано положение формант гласных у, о, а, э, и.

Очевидно, если искусственным путем воспроизвести спектр того или иного звука, в частности спектр гласной, то наше ухо получит впечатление этого звука, хотя бы его «естественный источник» отсутствовал. Особенно легко удается осуществлять такой синтез звуков (и синтез гласных) с помощью электроакустических устройств. Электрические музыкальные инструменты позволяют очень просто изменять спектр звука, т. е. менять его тембр.

Артефакты спектрального анализа и принцип неопределённости Гейзенберга

На предыдущей лекции мы рассмотрели проблему разложения любого звукового сигнала на элементарные гармонические сигналы (составляющие), которые в дальнейшем мы будем называть атомарными информационными элементами звука. Повторим основные выводы и введём некоторые новые обозначения.

Будем обозначать исследуемый звуковой сигнал так же, как и на прошлой лекции, .

Комплексный спектр это сигнала находится с помощью преобразования Фурье так:

. (12.1)

Этот спектр позволяет нам определить, на какие элементарные гармонические сигналы разных частот раскладывается наш исследуемый звуковой сигнал . Иными словами, спектра описывает полный набор гармоник, на которые раскладывается исследуемый сигнал .

Для удобства описания, вместо формулы (12.1) часто используют более выразительную следующую запись:

, (12.2)

подчёркивая тем самым, что на вход преобразования Фурье подаётся временная функция , а на выходе получается функция, зависящая не от времени, а от частоты.

Чтобы подчеркнуть комплексность получаемого спектра, его обычно представляют в одном из следующих видов:

где - это амплитудный спектр гармоник, (12.4)

а - это фазовый спектр гармоник. (12.5)

Если правую часть уравнения (12.3) прологарифмировать, то мы получим следующее выражение:

Получается так, что реальная часть логарифма от комплексного спектра равна амплитудному спектру в логарифмической шкале (что совпадает с законом Вебера-Фехнера), а мнимая часть логарифма от комплексного спектра равна фазовому спектру гармоник, значения которых (фазовых значений) наше ухо не ощущает. Такое интересное совпадение поначалу может обескуражить, но мы на это не будем обращать внимание. Но подчеркнём принципиально важное для нас сейчас обстоятельство – преобразование Фурье переводит любой сигнал из временной физической сигнальной области в информационное частотное пространство, в котором инвариантны частоты гармоник, на которые раскладывается звуковой сигнал.


Обозначим атомарный информационный элемент звука (гармонику) следующим образом:

Воспользуемся графическим образом, отражающий область слышимости гармоник с разными частотами и амплитудами, взятый из замечательной книги E. Zwicker and H. Fastl “Psychoacoustics: facts and models” (Second Edition, Springer, 1999) на странице 17 (см. рис. 12.1).

Если некоторый звуковой сигнал будет состоять из двух гармоник:

то их положение на слуховом информационном пространстве может иметь, например, такой вид, какой показан на рис. 12.2.

Глядя на эти рисунки, легче можно понять, почему отдельные гармонические сигналы мы назвали атомарными информационными элементами звука. Всё слуховое информационное пространство (рис. 12.1) ограничено снизу кривой порога слышимости, а сверху – кривой болевого порога звучащих гармоник разных частот и амплитуд. Это пространство имеет несколько неправильные очертания, но оно несколько напоминает по форме другое информационное пространство, которое имеется в нашем глазу – сетчатку глаза. В сетчатке атомарными информационными объектами являются палочки и колбочки. Аналогом их в цифровой информационной технологии являются пискелы. Эта аналогия не вполне корректна, поскольку в изображении все пикселы (в двумерном пространстве) играют свою роль. В нашем же звуковом информационном пространство не могут две точки находиться на одной вертикале. И поэтому любой звук отражается в этом пространстве, в лучшем случае, лишь в виде некоторой кривой линии (амплитудного спектра), начинающейся слева на низких частотах (около 20 Гц), и заканчивающейся справа на высоких частотах (около 20 кГц).

Подобные рассуждения выглядят, довольно-таки, красиво и убедительно, если только не считаться с реальными законами природы. Дело в том, что, даже если исходный звуковой сигнал состоит всего лишь из одной единственной гармоники (некоторой частоты и амплитуды), то реально наша слуховая система «не увидит» её виде точки в информационном слуховом пространстве. В действительности эта точка несколько размоется. Почему? Да потому, что все эти рассуждения справедливы для спектров бесконечно долго звучащих гармонических сигналов. А реальная наша слуховая система анализирует звуки на относительно небольших временных интервалах. Длина этого интервала колеблется от 30 до 50 мс. Получается так, что наша слуховая система, которая как и весь нейронный механизм мозга, работает дискретно с частотой кадров 20-33 кадра в секунду. Поэтому спектральный анализ должен проводиться по кадрам. А это приводит к некоторым неприятным эффектам.

На первых этапах исследования и анализа звуковых сигналов с помощью цифровых информационных технологий, разработчики просто нарезали сигнал на отдельные кадры, как, например, показано на рис. 12.3.

Если один кусочек этого гармонического сигнала в кадре отправить на преобразование Фурье, то мы не получим одиночную спектральную линию, как показано для примера на рис. 12.1. А получится график амплитудного (логарифмического) спектра, показанного на рис. 12.4.

На рис. 12.4 красным цветом показано истинное значение частоты и амплитуды гармонического сигнала (12.7). Но тонкая спектральная (красная) линия существенно размылась. И, что хуже всего, – появилось множество артефактов, фактически сводящих полезность спектрального анализа на нет. Действительно, если каждая гармоническая компонента звукового сигнала будет вносить свои подобные артефакты, то отличить истинные следы звука от артефактов не удастся.



В этой связи в 60-е годы прошлого века многие ученые предприняли усиленные попытки улучшить качество получаемых спектров от отдельных кадров звукового сигнала. Оказалось, что если кадр вырезать не грубо («прямыми ножницами»), а умножать сам звуковой сигнал на некоторую гладкую функцию, то артефакты можно существенно подавить.

Например, на рис. 12.5 показан пример вырезания кусочка (кадра) сигнала с помощью одного периода функции косинуса (это окно иногда называют окном Хеннинга). Логарифмический спектр вырезанного таким образом одиночного гармонического сигнала показан на рис. 12.6. На рисунке хорошо видно, что артефакты спектрального анализа в значительной мере исчезли, но, всё равно, ещё остались.

В те же годы известный исследователь Хемминг предложил комбинацию из двух типов окон – прямоугольного и косинусного – и рассчитал их соотношение таким образом, чтобы величина артефактов была минимальной. Но и эта лучшая из лучших комбинаций простейших окон оказалась, на самом деле, не лучшей в принципе. Лучшим во всех отношения окон оказалось окно Гаусса.

Для сравнения вносимых артефактов всеми типами временных окон на рис. 12.7 показаны результаты применения этих окон на примере получения амплитудного спектра одиночного гармоничного сигнала (12.7). А на рис. 12.8 показан спектр гласного звука «о».

Из рисунков хорошо видно, что временное окно Гаусса не создаёт артефактов. Но что следует особо отметить, так это одно замечательное свойство получаемого амплитудного (не в логарифмическом, а в линейном масштабе) спектра всё того же одиночного гармонического сигнала. Оказывается, что график получаемого спектра сам имеет виду функции Гаусса (см. рис. 12.9). Причём, полуширина временного окна Гаусса связана с полушириной получаемого спектра следующим простым отношением:

Это соотношение отражает принцип неопределённости Гейзенберга. Рассказать о самом Гейзенберге. Привести примеры проявления принципа неопределённости Гейзенберга в ядерной физике, в спектральном анализе, в математической статистике (критерий Стьюдента), в психологии и в социальных явлениях.



Принцип неопределённости Гейзенберга позволяет получить ответы на многие вопросы, связанные с тем, почему следы некоторых гармонических составляющих сигнала не различаются на спектре. Общий ответ на этот вопрос можно сформулировать так. Если мы построим спектральный фильм с частотой кадров , то гармоники, различающиеся по частоте, менее, чем на , мы не различим – их следы на спектре сольются.

Рассмотрим это утверждение на следующем примере.


На рис. 12.10 показан сигнал, про который известно лишь то, что он состоит из нескольких гармоник разных частот.


Вырезая с помощью временного окна Гаусса маленькой ширины (т. е. относительно мало) один кадр этого сложного сигнала, мы получим амплитудный спектр, показанный на рис. 12.11. Из-за того, что очень мало, полуширина амплитудного спектра от каждой гармоники будет настолько велика, что спектральные лепестки от частот всех гармоник сольются и перекроют друг друга (см. рис. 12.11).

Увеличив немного ширину временного окна Гаусса, мы получим другой спектр, показанный на рис. 12.12. По этому спектру уже можно предположить, что в исследуемом сигнале имеются, по крайней мере, две гармонические составляющие.

Продолжая увеличивать ширину временного окна, мы получим спектр, показанный на рис. 12.13. Затем – спектры на рис. 12.14 и 12.15. Останавливаясь на последнем рисунке, можно с большой степенью уверенности утверждать, что сигнал на рис. 12.10 состоит из трёх отдельных составляющих. После столь больших по объёму иллюстраций, вернёмся к вопросу поиска гармонических компонент в реальных речевых сигналах.

Здесь следует подчеркнуть, что в чистом виде гармонических компонентов в реальном речевом сигнале не бывает. Иначе говоря, мы не продуцируем гармонические компоненты типа (12.7). Но, тем не менее, квазигармонические компоненты в речи, всё же, присутствуют.

Единственными квазигармоническими компонентами в речевом сигнале являются затухающие гармоники, возникающие в резонаторе (в речевом тракте) после хлопка голосовых связок. Взаимное расположение частот этих затухающих гармоник и определяет формантную структуру речевого сигнала. Синтезированный пример затухающего гармонического сигнала показан на рис. 12.16. Если вырезать из этого сигнала с помощью временного окна Гаусса маленький фрагмент, и отправить его на преобразование Фурье, то получится амплитудный спектр (в логарифмическом масштабе), показанный на рис. 12.17.


Если же вырезать из реального речевого сигнала один период между двумя хлопками голосовых связок (см. рис. 12.18), и где-то посреди этого фрагмента разместить временное окно спектрального оценивания, то мы получим амплитудный спектр, показанный на рис. 12.19. На этом рисунке красными линиями показаны значения проявившихся частот сложных резонансных колебаний речевого тракта. На этом рисунке хорошо видно, что с выбранной маленькой шириной временного окна спектрального оценивания далеко не все резонансные частоты речевого тракта проявились в спектре достаточно хорошо.

Но это неизбежно. В этой связи можно сформулировать следующие рекомендации по визуализации следов резонансных частот речевого тракта. Частота кадров спектрального фильма должна быть на порядок (раз в 10) больше частоты работы голосовых связок. Но увеличивать частоту кадров спектрального фильма до бесконечности нельзя, поскольку из принципа неопределенности Гейзенберга следы формант на сонограмме начнут сливаться.



А как бы выглядел спектр на предыдущем слайде, если бы прямоугольное окно вырезало бы ровно N периодов гармонического сигнала? Вспомнить о ряде Фурье.

Артефакт - [от лат. arte искусственно + factus сделанный] – биол. образования или процессы, возникающие иногда при исследовании биологического объекта вследствие воздействия на него самих условий исследования.

Эту функцию называют по-разному: весовой функцией, оконной функцией, взвешивающей функцией или взвешивающим окном.



Похожие статьи

© 2024 parki48.ru. Строим каркасный дом. Ландшафтный дизайн. Строительство. Фундамент.