Digitaalinen ääni

teme_l

Käyttäjä
Liittynyt
1.8.2006
Viestejä
221
Koska yleissivisty digitaalitekniikasta, digitaalisesta äänestä ja niiden vaikutuksesta äänenlaatuun näyttää yleisesti olevan huonolla mallilla, ajattelin unettomuuttani kirjoittaa tänne pienen setin asiasta.

Alkuun heti disclaimer: kirjoittelen tämän pitkälti ulkomuistista, jotain asioita menee varmasti väärin, joten korjatkaa ihmiset ihmeessä.

Ja toinen disclaimer myös heti alkuun: ethän ota tätä liian vakavasti? En ole tässä julistamassa, etteikö digitaalisten laitteiden välillä voi olla eroja. Olen tässä lähinnä yleissivistyksen kannalta liikenteessä, että tuommoiset turhat tappelut tekniikasta häviäisivät. Ne ovat ikävää luettavaa, kun keksitään kaikkea omaa, jotta voidaan väittää näille "TTY:n DI:lle" vastaan (kumma homma ku niiden "TTY:n DI:kin" pitää aina tulla tänne pätemään :D)

Miten ääni esitetään digitaalisesti?
Analoginen äänisignaali (siis ääniaallon muoto) näytteistetään. Näytteistyksessä signaalin arvo (jännite) mitataan tietyin aikavälein. Jännitteelle (esim. 5V) etsitään vastaava puhdas numeerinen lukuarvo (esim. 128), joka esitetään laitteissa bittijonona. Nämä lukuarvot jaetaan tasan tietylle jännitekaistalle. Koska bittejä on rajallinen määrä, esim. 16bittiä, jokaista mahdollista jännitearvoa ei voida esittää omalla numerolla: joudutaan päätämmään kumpaan suuntaan väliin putoavat arvot pyöristetään. Tästä syntyy myöhemmin takaisin analogiseksi signaaliksi muodostettaessa nk. kvantisointikohinaa, eli vääristymää äänessä. Eli äänisignaali on digitaalisessa muodossaan peräkkäisiä numeroita, eikä siitä pystytä rekonstruoimaan täysin samaa ääntä, mikä äänitystilanteessa tallennettiin.

Mitä äänelle voidaan tehdä digitaalisessa maailmassa?
Äänelle voidaan tehdä monenlaisia juttuja digitaalisessa maailmassa. Esim. näytteiden arvoa kuvaavan numeron kokoa voidaan kasvattaa (16bit -> 24bit), näytteiden ottotaajuutta voidaan kasvattaa (tällöin uudet väliin tulevat näytteet arvataan vanhojen perusteella), äänestä voidaan suodattaa taajuuskaistoja pois (suodatus voidaan tehdä paljon tarkemmin kuin analogisessa maailmassa). Ehkä tärkeintä on ymmärtää, että äänisignaali voi muuttua digitaalisena ollessaan. Tällöin muutos tapahtuu käytännössä laskemalla näytteitä yhteen tai vähentämällä niitä toisistaan tai kertomalla toistensa kanssa: tuloksena on siis uusi numeroarvo näytteelle ja ääni on muuttunut.

Miten mahdolliset bittivirheet vaikuttavat ääneen?
Näytteiden numeroarvot kuvataan siis bitteinä, bitit kuvataan digitaalisissa laitteissa kahtena eri jännitetasona, joita vastaavat loogiset arvot 0 ja 1. Nämä jännitetason eivät suinkaan ole ideaalisia ja niissä esiintyy häiriöitä. Nämä häiriöt voivat johtaa siihen, ettei bittiä voida tulkita tai se tulkitaan väärin. Jos käytämme kahdeksaa bittiä esittämään näytteitä, voimme esitää esim. luvut 0..255 niiden avulla. Ajatellaan lukua 128, mikä on bitteinä esitettynä 10000000. Jos nyt ylin bitti tulkitaankin arvosta 1 arvoksi 0, näyte tulkitaan numeroksi 0 ja siten jännitetasoksi 0V. Jos aikaisempi 128 kuvasi 5V jännitetasoa äänisignaalissa ko. ajan hetkellä, niin nyt siihen kohdalle tuleekin 0V!

Herääkin mielenkiintoinen kysymys, että miltä tämä kuulostaa? Jos näytteitä otetaan yleisellä 44.1kHz taajuudella tarkoittaa se sitä, että yksi vahingoittunut näyte aiheuttaa n. 20us mittaisen muutoksen ääniaallon muotoon. En osaa itsekkään sanoa varmaksi, voiko tämän kuulla.. kyse on jo oikeastaan kaiuttimen kyvystä toistaa näin nopeita vaihteluja signaalissa. Olen joskus mielenkiinnosta asiaa vähän testannut ja silloin sain sopivalla yhden bitin muunnoksella aikaan selvästi kuultavan virheen.

Tarkastellaan uudelleen vielä näytettä arvoltaan 128. Entäpä jos viimeinen bitti muuttuu 0->1? Tällöin saadaan arvoksi 129 ja tätä virhettä onkin jo hyvin vaikea huomata. Joka tapauksessa yhden bitin virhe voi johtaa erittäin suureen signaalin vääristymään tai sitten mitättömän pieneen. Kyseessä on puhdas tuuripeli ja yleisesti voidaan sanoa, että kun se johtaa suureen vääristymään, asia kuullaan selvänä virheenä ääneessä.

Voiko bittivirheitä esiintyä digitaalisissa piireissä?
Voi. Ja taatusti joskus esiintyykin. Jos kyse on pelkästä digitaalisesta piiristä, on bittivirheen todennäköisyys kuitenkin hyvin hyvin pieni nykypäivänä. Mutta siis täysin mahdollinen! Asian pihvi onkin siinä, että bittien muuttuminen digitaalisessa piirissä on lähes aina satunnaista! Tämä tarkoittaa siis sitä, että jos kyseessä olisi äänentoiston kannalta merkittävä ilmiö, jokaisella kerralla, kun kuuntelee saman kappaleen, tulisi sen olla erilainen ääneltään! Siis jos bittivirheet vaikuttaisivat selvästi äänenlaatuun. Asiasta voi toki vääntää kättä sillä, että toinen soitin tekee näitä useammin kuin toinen ja kuulostaa siksi erilaiselta.. ihan mahdollista, mutta edelleen täytyy muistaa, että kyseessä on satunnainen ilmiö. Ilmiö on satunnaista lähes aina sen takia, että piiriin on voinut eksyä suunnitteluvika, mikä johtaa tietyn bittikuvion kanssa nk. glitchiin ja siten digitaalisen piirin väärin toimimiseen aina tietyssä kohtaa tiettyä kappaletta. Todellisuudessa tälläinen on erittäin harvinainen tilanne, mutta mahdollinen.

Entäpä kun digitaalista ääntä siirretään, voiko bittivirheitä syntyä?
Sama kuin edellä, voi ja varmasti joskus syntyykin, mutta suurimmassa osassa tapauksista kyseessä on lähes täysin satunnainen ilmiö. Siirtotiellä bittivirheiden voi sanoa olevan todennäköisempiä kuin itse laitteen sisällä olevien digitaalisten piirien kohdalla.

Mystinen jitter. Mitä se on ja mikä on sen vaikutus ääneen?
Digitaalinen ääni on siis jono lukuarvoja, joita on ladottu paljon peräkkäin ja jokaiselle arvolle on oma hetkensä, milloin se pitää toistaa. Jitterillä tarkoitetaan tilannetta, jossa siirettäessä jonoa lukuarvoja paikasta toiseen, luetaankin jonoa (hetkellisesti) väärästä kohtaa. Tilanteeseen voi johtaa moni asia, mutta yleisesti jitteri jaetaan kahteen luokkaan: satunnaiseen tai ennustettavaan. Periaatteessa ennustettavan jitterin ei pitäisi olla ongelma, koska siihen voidaan reagoida. Eri asia tehdäänkö asialle mitään ja ennustettava jitteri voi siis esiintyä tietyllä datalla aina samassa kohtaa. Satunnaiseen jitteriin pätevät pitkälti samat teesit kuin bittivirheisiin. Jotkin laitteet voivat toki aiheuttaa enemmän jitteriä kuin toiset, mutta jälleen seurauksena on todennäköisesti satunnaisesti vaihteleva ääni. (tämä on ehdottomasti esittämistäni asioista se, mistä olen heikoimmin perillä..)

Entäpä CD:n lukeminen? Eikö siinä voi tapahtua paljon virheitä?
CD:n lukemisessa voi tapahtua paljon virheitä ja monia erillaisia. Sen takia CD:hen on otettu mukaan menetelmä, jolla virheitä voidaan korjata. Korjaaminen onnistuu varsin pitkälle ja jos jostain syystä se ei onnistuu, niin saatetaan arvata välistä puuttuvia lukukelvottomia näytteitä. On täysin soitinkohtaista miten arvauskohdassa menetellään. Kun korjaus ei onnistu ja arvaamista ei edes yritetä, on seurauksen selvä virhe äänessä.

Vertasin kahta erilaista koaksiaalista digitaalikaapelia ja kuulin niiden välillä selvän eron!
Hyvä että kuulit, ompahan jotain harrastettavaa. Eron syynä on todennäköisemmin analogisen maailman ilmiöt: kaapelit saattaavat sovittaa laitteet sähköisesti erilailla toisiinsa, millä voi olla suora vaikutus äänenlaatuun. Väite, että bitit kulkisivat kaapelissa paremmin kuin toisessa tai että erot syntyisivät bittitasolla, on hivenen absurdi ja todennäköisesti väärä.

Vertasin kahta erilaista optista digitaalikaapeli ja kuulin niiden välillä eroja!
No sitten kuulit, joten niiden välillä on jotain eroa! Digitaalisella maailmalla niitä eroja ei ehkä kannata alkaa selittämään, ellei erona ollut toisen kaapelin häiriöäänet. Ehkä siirsit toisen laitteen verkkojohtoa vähän vaihtaessasi kaapelia?

Taas yksi TTY:n DI pätemässä, kun joku proffa sanoi ettei eroja voi olla
Jep. Niin on nytkin. Taidat kuulla eroja? Kova paikka, kun joku selittää ettei siellä voi olla eroja? Koet ehkä itsesi uhatuksi, koska tämä DI -idiootti on täysin varma, ettet ole voinut kuulla eroja? Älä suotta. Se "idiootti" tietänee ko. tekniikasta enemmän kuin sinä ja on luultavasti monista tekniikan asioista paremmin perillä kuin sinä.. mutta mitä sitten? Kuulet eroja, joten siellä niitä eroja on. Jos se idiootti ei usko, niin älköön sitten uskokoon. Kehoita sitä idioottia testaamaan joskus itse! Mutta muista myös itse omat lähtökohtasi tekniikan suhteen.. voi olla että se johtuu laitteiden/johtojen eroista, voi olla että ei, mutta mitä väliä sillä on mistä ne johtuvat, kun ne siellä on... ei siinä kannata alkaa yrittämään keksiä syytä eroille.


Nimim. viittävaille valmis DI TTY:ltä (eli siis se idiootti, joka on väärässä ;)), jolla on varsin kattava kokemus ja näkemys koko digitaalisesta maailmasta ja kuvittelee siten tietävänsä kaikesta kaiken.

P.S Tämän ei ole tarkoitus olla päänaukomista kenellekkään (no ehkä vähän meille insinörteille). Toivoisin että kaikki ottaisivat tästä vähän oppia ja lakkaisivat murehtimasta ja tappelemasta turhaan mutu -pohjalta.

P.P.S Toistan vielä kerran tähän loppuun teesini: harrastakaa, kokeillaa kaikkea, avoimin mielin. Jos siellä niitä eroja on, niin sitten on! Kertokaa niistä kokemuksista myös rohkeasti, vaikka nämä tekniikkahörhöt sinne ilmestyvätkin aukomaan päätään, ettei ole mahdollista. Siihen kannattaa todeta, että ehkä ei ole, mutta minä niitä kuulin.. koskas itse olet testannu?

P.P.P.S Niille DI -kollegoille, joiden mielestä tässä on paljon pikkuasiavirheitä: tiedän, että asiat ei ihan joka kohdassa mene juuri niikuin esitin. Yritin kuitenkin pitää tämän "kansantajuisena".
 
Kiitos! Minulle tämä oli ainakin (insinöörinä :) ) mukavaa luettavaa. Tieto ilman väitettyä absoluuttista totuutta on sitä mitä haluan tältä foorumiltakin. Jotkut asiat ovat faktoja, mutta paljon on vielä sellaisia elementtejä äänentoistossakin, joiden vaikutuksista emme ole selvillä.

Digitaalitekniikka kun ei ole minun osaamisaluettani millään tavalla. On mukava tietää ja ehkä ymmärtää pikkasen syvemmältä miten kaikki toimii (siis pikkasen syvemmältä), silloin ehkä osaa tehdä oikeita asioita korjatakseen äänentoistoa haluamaansa suuntaan. Siis kuuntelun perusteella havaittujen, itselle ei niin mieluisten äänentoistollisten elementtien poistaminen tai niiden muuttaminen itselle mieluisampaan suuntaan.

Minä sain tästä siis muutaman kaivatun taustafaktan :)
 
Hyvää materiaalia. Bittivirheiden kohdalla ehkä olisi vielä voinut mainita pariteettibitit ja virheenkorjauksen. Yksittäiset lukuvirheet esim kun eivät kuulu lainkaan ja virheet pystytään CD:n tapauksessa korjaamaan täysin originaalia vastaavaksi vaikka keskiöstä vedettäisiin 2mm paksu naarmu koko CD:n matkan ulkokehälle saakka. Ehkäpä tähän voisin copy pastea paremmalla ajalla jotain kirjoittamiani teesejä tuolta toisesta ketjusta tätä koskien...
 
Gretch sanoi:
Hyvää materiaalia. Bittivirheiden kohdalla ehkä olisi vielä voinut mainita pariteettibitit ja virheenkorjauksen. Yksittäiset lukuvirheet esim kun eivät kuulu lainkaan ja virheet pystytään CD:n tapauksessa korjaamaan täysin originaalia vastaavaksi vaikka keskiöstä vedettäisiin 2mm paksu naarmu koko CD:n matkan ulkokehälle saakka. Ehkäpä tähän voisin copy pastea paremmalla ajalla jotain kirjoittamiani teesejä tuolta toisesta ketjusta tätä koskien...

Gretch, mulla on cd-r jossa on jonkin verran naarmuja. Viimeisissä biiseissä käy niin että se kuulostaa ihan LP:ltä kun ääni räpsyy niin paljon. Tein myös toisen testin: jos optinen kaapeli on hieman huonosti töpselissään (tai hyvin lähellä sitä), niin ääneen saa räpsimistä, mutta musiikki kuuluu silti.
 
Hieno artikkeli!

Jitterin osalta tekstiä voisi ehkä vähän täydentää. Tässä olisi hyvä artikkeli pohjaksi:
http://www.stereophile.com/reference/396bits/index.html

Artikkelissa pohditaan jitterin vaikutusta signaaliin ja sitä onko mahdollista että ero ylittää kuulokynnyksen. Lisäksi artikkelissa pohditaan miten digikaapelin kaistanleveys voi jitterin kautta vaikuttaa signaaliin (eli löytää tekninen perustelu sille että digikaapelit voivat kuulostaa erilaisilta). Oman rajoittuneen osaamiseni kautta luettuna en ainakaan löydä teknisissä perusteluissa aukkoja. Oman rajoittuneen osaamiseni johdosta en kuitenkaan osaa kirjoittaa asiaa auki yhteä selkeästi kuin teme_l osaisi. Ehkä teme_l tai joku muu voisi vielä jitteristä kirjoittaa vähän lisää?
 
Hyvä artikkeli. Annoit myös tilaa heille, jotka kuulevat eroja mm. optisissa kaapeleissa, vaikka sain sellaisen käsityksen, ettet niihin usko. Hienoa!
 
Gretch sanoi:
Hyvää materiaalia. Bittivirheiden kohdalla ehkä olisi vielä voinut mainita pariteettibitit ja virheenkorjauksen. Yksittäiset lukuvirheet esim kun eivät kuulu lainkaan ja virheet pystytään CD:n tapauksessa korjaamaan täysin originaalia vastaavaksi vaikka keskiöstä vedettäisiin 2mm paksu naarmu koko CD:n matkan ulkokehälle saakka. Ehkäpä tähän voisin copy pastea paremmalla ajalla jotain kirjoittamiani teesejä tuolta toisesta ketjusta tätä koskien...

Gretch, mites tuo virheenkorjaus käytännössä on hoidettu cd:llä? Tarkistusbiteillä?
 
Jitteristä: Luettuani jutun sain käsityksen että "väärä bitti soitetaan oikeaan aikaan". Käsittääkseni kysymyksessä on kuitenkin tilanne jossa "oikea bitti soitetaan väärään aikaan".
 
teme_l sanoi:
Miten ääni esitetään digitaalisesti?
Analoginen äänisignaali (siis ääniaallon muoto) näytteistetään. Näytteistyksessä signaalin arvo (jännite) mitataan tietyin aikavälein. Jännitteelle (esim. 5V) etsitään vastaava puhdas numeerinen lukuarvo (esim. 128), joka esitetään laitteissa bittijonona. Nämä lukuarvot jaetaan tasan tietylle jännitekaistalle. Koska bittejä on rajallinen määrä, esim. 16bittiä, jokaista mahdollista jännitearvoa ei voida esittää omalla numerolla: joudutaan päätämmään kumpaan suuntaan väliin putoavat arvot pyöristetään. Tästä syntyy myöhemmin takaisin analogiseksi signaaliksi muodostettaessa nk. kvantisointikohinaa, eli vääristymää äänessä. Eli äänisignaali on digitaalisessa muodossaan peräkkäisiä numeroita, eikä siitä pystytä rekonstruoimaan täysin samaa ääntä, mikä äänitystilanteessa tallennettiin.
Kvantisointikohina on kyllä epäluonnollisen kuuloista ihmiskorvalle, mutta jos signaaliin lisätään ditheröintiä voidaan ongelma välttää. Olen joskus lukenut seuraavanlaisen analogian digitoinnista ja ditheristä: Jos laittaa käden tekstin päälle sormet harallaan, voi ainoastaan lukea ne kirjaimet, jotka näkyvät sormien välissä, mutta tekstistä on erittäin vaikea saada selvää. Tämä vastaa kvantisointikohinaa. Ditheröinnin lisääminen vaikuttaa samalla tavalla kuin käden heiluttaminen nopeasti tekstin päällä. Käsi ehdelleen häiritsee lukemista, mutta tekstin pystyy lukemaan. Ditherin lisääminen siis mahdollistaa alle LSB-tasoisten signaalien kuulemisen kohinan seasta!

Tässä hyvää luettavaa DI:lle ja muillekin:
What is suggested is that because (for example) a 16 bit system defines 64K steps,
that the smallest signal that can be ‘seen’ is 1/64K or about –96dB. Signals dropping off because they
are smaller than the smallest step or Least Significant Bit (LSB) is a process we call truncation. Now –
you can arrange for a PCM channel to truncate data below the LSB – but no engineer worth his salt has
worked like that for over ten years. One of the great discoveries in PCM was that, by adding a small
random noise (that we call dither) the truncation effect can disappear. Even more important was the
realisation that there is a right sort of random noise to add, and that when the right dither is used [27],
the resolution of the digital system becomes infinite. What results from a sensible digitisation or digital
operation then is not signal plus a highly-correlated truncation distortion, but the signal and a benign
low level hiss. In practical terms, the resolution is limited by our ability to resolve sounds in noise. Just
to reinforce this, we have no problem measuring (and hearing) signals of –110dB in a well-designed 16-
bit channel.
http://www.meridian-audio.com/w_paper/Coding2.PDF
 
Optisista liitynnäistä eräs havainto: Detaileja en muista kun en ollut itse tekemässä mutta kokeen tekijä oli todennut perinteiset sähköstä valoksi ja valosta sähköksi muuntimet (toslink) aivan säälittävän huonolaatuisiksi. En tiedä oliko kyse huonoista yksilöistä mutta mitä ilmeisemmin pulssit pyöristyivät matkalla niin paljon ettei edes "ihan oikeasti kallis" mittalaite tahtonut saada niistä tolkkua. Koaksiaalilla kaikki toimi normaalisti.

Pekka
 
Samu sanoi:
Gretch, mites tuo virheenkorjaus käytännössä on hoidettu cd:llä? Tarkistusbiteillä?

Lainaan tuolta toisesta ketjusta kirjoittamaani pätkää
Gretch sanoi:
Kyllä kyseessä on aikalailla sama maalaisjärki. CD:llä on tarkistusbittejä, eli virhe kyllä havaitaan välittömästi kun sellainen sattuu. Jos tarkastussumma ei vastaa luettua, voidaan lukea niin kauan uudelleen, kunnes virhettä ei ilmene. Tämä nimenomaan on ripatessa vahvuutena, koska normaali pöytätoistin ei tähän välttämättä kykene, ellei siinä ole puskurimuistia, jolla siis turvataan se, että lukupää ehtii lukea virhekohdan uudelleen ilman musiikin katkeamista. Tämä on siis epäsuora korjaus, eli yksinkertaisesti ongelmakohta vain luetaan uudelleen. Tässä on tietty kohdistusongelma, että mistä luetaan uudelleen ja minkä verran, mutta tässäkin toimii eri lukukertojen vertailu limittäin.

Tämän jälkeen on vielä erikseen suora korjaus, mitä jo sivusitkin. Missään nimessä bittejä ei vain arvota, vaan kyseessä on suhteellisen simppeli matematiikka (polynomit/algebra), eli voidaan laskea virheelle oikea korjaus. Teknisesti pidemmälle ehtineet voivat googlettaa esim Reed-Solomon hakusanalla tietoa. Tämä on CD:llä ja esim kiintolevyillä käytetty virheenkorjaus. Kunhan signaalia saadaan luettua riittävästi oikein, voidaan virheet korjata täydellisesti. CD:llä kyseessä on tarkemmin CIRC virheenkorjaus. Käytännössä 2.4mm matka cd-raidassa saa olla lukukelvotonta, ennen kuin virhettä ei voida korjata. Se on pitkä viilto kehän suuntaan! Varsinainen "arvaus" tapahtuu vasta, kun ollaan jo todella syvällä suossa, eli virheiden määrä on todella suuri ja niitä tapahtuu paljon peräkkäin. Tällöin vasta turvaudutaan interpolointiin ja tehdään "valistunut arvaus", jotta ääneen ei tulisi rasahdusta. Yleensä nämä virheet jääkin kuulematta. CD:llä on 44100 näytettä sekunnissa, eli siitä voi jokainen laskea kuinka kauan ajallisesti yksi virhe kuuluu signaalissa (ja sekin interpoloituna viereisten arvojen perusteella).
 
Back
Ylös