Kompresi audio/video adalah salah
satu
bentuk kompresi data yang bertujuan untuk mengecilkan ukuran file audio/video dengan metode
• Lossy Æ format : Vorbis, MP3;
• Loseless Æ format : FLAC; pengguna : audio engineer, audiophiles
Kompresi dilakukan pada saat pembuatan file
audio/video dan pada saat
distribusi file audio/video tersebut!
Kendala kompresi audio:
• Perkembangan sound recording yang cepat dan beranekaragam
• Nilai dari audio sample berubah dengan cepat
Losless audio codec tidak
mempunyai
masalah
dalam kualitas suara, penggunaannya dapat difokuskan pada:
• Kecepatan kompresi dan dekompresi
• Derajat kompresi
• Dukungan hardware dan software
Lossy audio codec penggunaannya difokuskan pada:
• Kualitas audio
• Faktor kompresi
• Kecepatan kompresi dan dekompresi
• Inherent latency of algorithm (penting bagi real-time streaming)
• Dukungan hardware dan software
Metode Kompresi Audio
- Metode Transformasi
o Menggunakan
algoritma seperti
MDCT
(Modified Discreate
Cosine Transform) untuk
mengkonversikan gelombang bunyi
ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20
Hz s/d 20kHz) , yaitu menjadi frekuensi
2 s/d 4kHz dan 96 dB.
- Metode Waktu
o Menggunakan
LPC
(Linier Predictive
Coding)
yaitu digunakan untuk speech (pidato), dimana
LPC akan menyesuaikan sinyal data
pada suara
manusia,
kemudian mengirimkannya ke pendengar. Jadi
seperti layaknya komputer yang
berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps
Teknik kompresi
audio
dengan
format
MPEG
(Moving
Picture
Expert
Group)
- MPEG-1 menggunakan bandwidth
1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan
untuk video sedangkan
0,3 Mbits/sec digunakan untuk audio.
Nilai 0,3 Mbits/sec ini
lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD
Audio yang tidak terkompres
sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja.
- Untuk ratio kompresi 6:1 untuk 16 bit stereo
dengan frekuensi 48kHz dan bitrate 256 kbps CBR akan menghasilkan ukuran file terkompresi
kira-kira 12.763 KB, sedangkan ukuran file tidak terkompresinya adalah
75.576 KB
- MPEG-1 audio mendukung frekuensi dari 8kHz, 11kHz,
12kHz, 16kHz,
22kHz, 24 kHz, 32 kHz, 44kHz, dan 48 kHz.
Juga mampu bekerja
pada mode mono (single
audio channel), dual audio channel, stereo, dan
joint-stereo
Algoritma MPEG Audio
- Menggunakan filter untuk membagi sinyal audio: misalnya
pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
- Memberikan pembatas pada masing-masing
frekuensi yang telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi)
- Jika sinyal
suara terlalu rendah,
maka tidak dilakukan encode
pada sinyal
suara tersebut
- Diberikan
bit
parity
yang
digunakan
untuk
mengecek
apakah
data tersebut rusak atau
tidak (yang mungkin disebabkan
oleh gangguan / noise),
apabila
rusak, maka bit tersebut akan digantikan bit yang
jenisnya sama dengan bit terdekatnya.
Kompresi Audio MP3
- Asal-usul MP3
dimulai
dari
penelitian IIS-FHG (Institut Integriette Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual.
- Penelitian tersebut menghasilkan suatu algoritma yang
menjadi
standard sebagai ISO-MPEG
Audio Layer-3 (MP3)
Format Header MP3
File MP3 terdiri
atas
2
bagian
data:
- Header : berfungsi sebagai tanda pengenal bagi file MP3 agar dapat dibaca oleh MP3 player yang berukuran
4 byte
Beberapa karakteristik yang dibaca komputer
adalah bit ID, bit layer, bit sampling frequency dan bit mode.
- Data audio : berisi data file mp3.
Teknik kompresi MP3
Beberapa karakteristik dari MP3 memanfaatkan kelemahan
pendengaran manusia.
1. Model psikoakustik
o Model psikoakustik adalah
model
yang
menggambarkan karakteristik pendengaran manusia.
o Salah
satu karakteristik pendengaran
manusia
adalah
memiliki batas frekuensi 20 Hz s/d
20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah
ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak
perlu dikodekan.
2. Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu
dengan amplitudo tertentu jika pada frekuensi
di dekatnya terdapat suara dengan amplitudo
yang jauh lebih tinggi.
3. Critical band
Critical band
merupakan daerah frekuensi
tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi
bit dan alokasi sub-band
pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
4. Joint stereo
Terkadang dual
channel stereo mengirimkan informasi
yang sama. Dengan menggunakan joint stereo, informasi
yang sama ini cukup ditempatkan dalam salah satu channel saja
dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.
0 komentar:
Posting Komentar