WYKŁAD - zawiera wykład (lub wykłady) na temat w zasadzie dowolny, lecz raczej poważny i przydatny. Celem tego działu jest, aby Czytelnik po jego przeczytaniu pomyślał: Aha! Więc to jest tak! No, wreszcie rozumiem!; niestety bowiem nie każdy wykład kończy sie takim westchnieniem ulgi. Ambicją moją byłoby, aby w tym dziale stało sie to regułą, jednak w przypadku tematów zaawansowanych - niekoniecznie musi się to udać, nawet jeśli dyskurs będzie nienaganny. Przeszkodą może być wymagany, bazowy poziom wiedzy. Dlatego też powinien on zawsze zostać określony na początku wykładu.





Dla zrozumienia treści tego wykładu nie jest w zasadzie potrzebne żadne szczególne przygotowanie, choć podstawowe wiadomości z zakresu muzyki i elektroniki pozwolą zapewne na głębsze zrozumienie i oszczędzą „przeskakiwania” trudniejszych fragmentów.

Modułowy syntezator Mooga.

W tym numerze przedostatni już raz o historii syntezy dźwięku; w następnym Czytelnik znajdzie jeszcze „bardzo praktyczną” tablicę chronologiczną.

Dalsze lata rozwoju, które nastąpiły po „epoce Mooga” to już nie tyle historia wielkich indywidualności, ile raczej zespołowej, mrówczej pracy badawczej i stopniowych udoskonaleń. Jednakże i tutaj dadzą się wyróżnić pewne punkty zwrotne, którymi były:

Sytuacja obecna. Sytuację obecną (rok 2006) charakteryzują następujące zjawiska i tendencje:

Perspektywy rozwoju - "podstawowa trudność".

Jak dotąd (kwiecień 2006) nie ma „idealnej metody” syntezy dźwięku. Cóż, gdyby istniała – wszyscy stosowaliby tylko ją i nie byłoby się nad czym zastanawiać. Skoro jednak nadal jej nie ma (i trudno przypuścić, aby się w najbliższych latach pojawiła) warto sobie uświadomić, co stoi na przeszkodzie w jej urzeczywistnieniu. Sytuacja jest w zasadzie dość paradoksalna. Z jednej strony mamy, bowiem takie urządzenie jak komputer wyposażony w przetwornik D/A. Jeśli więc wpiszemy do pamięci potrzebny ciąg liczb i „każemy go komputerowi odegrać”, to zasadniczo możemy otrzymać dowolny słyszalny dźwięk. Można to ująć jeszcze inaczej. Wszystkie liczby z płyty CD możemy przepisać do komputera. Mamy więc w jego pamięci dowolną muzykę, jaką możemy zapisać na CD. Zamiast tego moglibyśmy wygenerować jakiś liczby w komputerze w inny sposób i przepisać je z powrotem na CD (bądź odegraać bezpośrednio z użyciem karty dźwiękowej na przykład). Mamy więc wypuszczonego z butelki wszechmocnego dżina, gotowego wytworzyć, co tylko zechcemy. Kłopot w tym, że nie wiemy tak naprawdę, co mu rozkazać. Innymi słowy: tym, co ogranicza możliwości syntezy dźwięku jest już obecnie nie sprawność sprzętu, lecz niedostatek wiedzy.

Formułując jak najprościej – komputer „zagra” wszystko, co się da usłyszeć – lecz my nie wiemy – jak(!) mu to rozkazać.

Łatwo się o tym samemu przekonać w prostym eksperymencie myślowym. Przypomnijmy sobie jakiś znany dźwięk (dla przykładu – czyjś głos). Pomyślmy teraz, czy potrafilibyśmy poskładać taki dźwięk z tonów prostych? Mało tego – czy nawet dysponując najdoskonalszą obecnie techniką – potrafilibyśmy na przykład poskładać czyjś dobrze znajomy głos z jakichś prostych elementów? Idąc dalej – czy nawet mając nagrane przez kogoś różne wyrazy potrafilibyśmy stworzyć syntetycznie naturalnie brzmiącą wypowiedź danej osoby? Chyba nie. Przecież ten sam wyraz brzmi różnie w zależności od kontekstu. Musielibyśmy więc mieć nagrane słowa w dziesiątkach lub setkach wariantów etc. A nagranie i odtworzeni takiej wypowiedzi jest technicznie wręcz banalne! Myślę, że ten przykład już dość dobrze uświadamia trudności piętrzące się na tej drodze.

Pewną pociechą jest fakt, że do celów muzycznych używamy jedynie dość ograniczonego zakresu dźwięków, ponadto możemy korzystać z różnych technik naprzemiennie.

Głównym więc zadaniem jakie stoi przed ludźmi zajmującymi się syntezą dźwięku jest znalezienie sposobów przekładu naszych wyobrażeń dźwiękowych na język zrozumiały dla maszyn. Eksperymenty tego rodzaju są rzeczywiście przeprowadzane z użyciem metod AI (proszę mnie nie łapać za słowo, chodzi mi o umowna nazwę pewnych metod programowania). Przykładem może być program „Artist” (Eduardo Reck Miranda).

Pomimo cząstkowych sukcesów – problem ten pozostaje jednak nadal nierozwiązany.

Koniec części czwartej.

[mc]