WYKŁAD zawiera wykład (lub wykłady) na temat w zasadzie dowolny, lecz raczej poważny i przydatny. Celem tego działu jest, aby Czytelnik po jego przeczytaniu pomyślał: Aha! Więc to jest tak! No, wreszcie rozumiem!; niestety bowiem nie każdy wykład kończy sie takim westchnieniem ulgi. Ambicją moją byłoby, aby w tym dziale stało sie to regułą, jednak w przypadku tematów zaawansowanych niekoniecznie musi się to udać, nawet jeśli dyskurs będzie nienaganny. Przeszkodą może być wymagany, bazowy poziom wiedzy. Dlatego też powinien on zawsze zostać określony na początku wykładu.

Od numeru X rozpoczynam cykl wykładów poświęconych syntezie i przetwarzaniu dźwieku. Kilka pierwszych służy przypomnieniu podstawowych pojęć z fizyki (akustyki) potrzebnych w dalszych wykładach.


Dla zrozumienia tego wykładu nie jest potrzebne żadne specjalne przygotowania poza elementarnymi wiadomościami z matematyki i fizyki. Zainteresowanie może on jednak wzbudzić raczej u tych, którzy z muzyką elektroniczną mieli praktycznie do czynienia.


Rezonator Helmholtza.


ANALIZA I RESYNTEZA.

Większość technik syntezy dźwięku opartych na modelowaniu widma działa dwuetapowo. Pierwszym etapem jest analiza – drugim resynteza.

ANALIZA.

Analiza polega na wydobyciu z dźwięku pewnych jego charakterystycznych parametrów, które mogą być dalej użyte w procesie powtórnej syntezy – resyntezy. Paramterami tymi mogą być przykładowo skład widmowy dźwieku, czestotliwości formantowe etc. Najbardziej rozpowszechnione narzędzia analizy to:

Analiza fourierowska. Omówiona szczegółowo w numerze XIII i XIV.

Analiza falkowa (ang.: wavelets analysis). Jest to względnie nowa technika pozwalająca na skuteczną redukcję konfliktu pomiędzy rozdzielczością czestotliwościową i czasową. Istota tej metody polega na uzależnieniu rozmiaru okna od analizowanych częstotliwości. Pozwala to na zwiększenie rozdzielczości czasowej w zakresie wiekszych częstotliwości oraz częstotliwościowej w zakresie mniejszych. Metoda ta wymaga wprawdzie wiekszej mocy obliczeniowej niż FFT, jednak ze względu na stały przyrost mocy obliczeniowej komputerów można przewidywać jej coraz większe rozpowszechnienie.

Analiza formantowa. (ang.: formant analysis). Polega ona na wyznaczeniu tak zwanych częstotliwości formantowych, czyli lokalnych maksimów energii w widmie dźwięku. Technika ta pozwala ustalić własności rezonansowe instrumentu, stąd też jej przydatność w analizie dźwięku instrumentów naturalnych.

Analiza predykcyjna (ang.: predictive analysis). Jest to jedna z możliwych technik analizy formantowej. Polega ona na współdziałaniu dwóch typów filtrów tzw. „all-pole-filter” oraz „all-zero filter” [All-pole-filter jest to w żargonie elektronicznycm filtr powodujący rezonanse przy pewnych częstotliwościach, zaś all-zero-filter jest to filtr powodujący wytłumienie pewnych częstotliwości.] Celem analizy predykcyjnej jest obliczenie parametrów filtru typu „all-zero”. Jest to dokonywane metodą kolejnych przybliżeń. Najpierw zostaje pobrany fragment analizowanego dźwięku i na jego podstawie obliczne są współczynniki filtru typu all-pole. Następnie są one odwracane, zastosowane do filtru typu all-zero i porównywane z sygnałem oryginalnym. Teoretycznie zastosowanie tak obliczonego filtru powinno dać w efekcie sygnał pobudzający. W praktyce algorytm ten „zakłada”, że sygnał pobudzający jest albo białym szumem, albo ciągiem impulsów. Założenie to ogranicza zastosowanie tej metody głównie do analizy mowy i niektórych instrumentów dętych.

Analizy dokonujemy wtedy, kiedy chcemy w procesie resyntezy uzyskać dźwięki podobne do dźwięku analizowanego. Typowym przykładem może tu być opracowywanie nowego typu syntezatora. Dla przykładu niech będzie to syntezator pracujący z najnowszą technika syntezy zwaną – „zzzz”. Jeśli teraz, prócz innych dźwięków, chcemy nasz syntezator wyposażyć w tradycyjne (powiedzmy fletu i wiolonczeli) musimy dokonać analizy dźwięku tych instrumentów i w oparciu o otrzymane dane uzyskać możliwie wierne dźwięki metodą „zzzz”. Innym typowym przykładem takiej sytuacji może być synteza mowy, kiedy to staramy się uzyskać możliwie naturalną wypowiedź używając jakiejś metody syntezy dźwięku.

Jeżeli decydujemy się budować jakiś dźwięk „od podstaw” – możemy ten etap oczywiście pominąć.

RESYNTEZA.

Jest to etap właściwego kształtowania dźwięku w oparciu o dane (ewentualnie zmodyfikowane) uzyskane w procesie analizy. Do typowych technik resyntezy należą:

Resynteza przez odwrócenie analizy fourierowskiej. Technika ta polega na użyciu danych uzyskanych podczas analizy fourierowskiej do syntezy nowego dźwięku. Istotą takiego podejścia jest fakt, że analizy fourierowskiej dokonywać możemy z założoną przez nas dokładnością, tak więc możemy otrzymać względnie złożone dźwięki operując tylko niezbędną liczba danych. Dźwięk analizowany jest w pewnych odcinkach czasu (oknach), a następnie resyntetyzowany „w podobnym rytmie” [Stąd też inna stosowana nazwa tej techniki – overlapadd (dodawanie nakładek)] kolejnych okien. Główną wadą tej metody jest jej wrażliwość na zmiany danych – łatwo można zakłócić integralność syntetyzowanego sygnału, (co zresztą w pewnych wypadkach może być pożądane). Dlatego też z muzycznego (kompozytorskiego) punktu widzenia technika ta jest raczej mało przydatna.

Resynteza addytywna. Działa podobnie do poprzednio opisanej, z tym, że dane z analizy fourierowskiej wykorzystywane są do sterowania syntezatora pracującego metodą syntezy addytywnej. Dane te przedstawiane są w postaci obwiedni (trajektorii) czestotliwości i amplitud. W tej postaci nadają dobrze zarówno do sterowania syntezatorem, jak i do wszelkiego rodzaju manipulacji na nich (skalowania, przesuwania etc.).

Resynteza subtraktywna. Technika ta wykorzystuje analizę formantów w celu ustalenia parametrów filtrów. Podstawową jej zaletą w porównaniu z resyntezą addytywną jest niezależne traktowanie widma i wysokości dźwięku. W syntezie addytywnej przy przesunięciu częstotliwości podstawowej, całe widmo zostanie przesunięte w górę lub w dół bez zmiany kształtu; w resyntezie subtraktywnej częstotliwości formantowe są niezależne od sygnału wejściowego. Jest to korzystne, ponieważ wiele rzeczywistych źródeł dźwięku tak się własnie zachowuje. Dla przykładu zarówno instrumenty dęte, jak i głos ludzki maja pewne stałe częstotlwiości rezonansowe zależne od ich budowy i nie zmieniające się z wysokością dźwięku pobudzającego (stroika, strun głosowych). Warto jednakże zauważyć, że nie zawsze w sygnale wejściowym muszą się znajdować częstotliwości „pasujące” do użytych filtrów.

Resynteza przez reintegrację utraconych elementów. Metoda ta polega na na dokonaniu analizy fourierowskiej i „prowizorycznej” resyntezy addytywnej. Uzyskany tą drogą dźwięk jest odejmowany od oryginalnego, co daje w efekcie owe „utracone resztki”, które pozwalają obliczyć parametry syntezy subtraktywnej (użytej dalej). Przeważnie stanowią one składowe szumowe dźwięku oryginalnego. Następnie dokonywana jest właściwa resynteza addytywna z użyciem danych z analizy fourierowskiej, oraz resynteza subtraktywna z użyciem danych z szumowych „resztek”, następnie obydwa produkty resyntezy są sumowane. Zaletami tej metody jest oddzielna obróbka składowych sinusoidalnych i szumowych, oraz połączenie zalet analizy harmonicznej i formantowej.

Cdn.

[mc]