Kamis, 18 Desember 2014

Komperensi Audio atau Video

Kompresi  audio/video  adalah  salah  satu  bentuk  kompresi  data  yang bertujuan untuk mengecilkan ukuran file audio/video dengan metode
 Lossy Æ format : Vorbis, MP3;

 Loseless Æ format : FLAC; pengguna : audio engineer, audiophiles

Kompresi dilakukan pada saat pembuatan file audio/video dan pada saat

distribusi file audio/video tersebut!

Kendala kompresi audio:

 Perkembangan sound recording yang cepat dan beranekaragam


 Nilai dari audio sample berubah dengan cepat

Losless  audio  codec  tidak  mempunyai  masalah  dalam  kualitas  suara, penggunaannya dapat difokuskan pada:
 Kecepatan kompresi dan dekompresi

 Derajat kompresi

 Dukungan hardware dan software

Lossy audio codec penggunaannya difokuskan pada:

 Kualitas audio
 Faktor kompresi

 Kecepatan kompresi dan dekompresi

 Inherent latency of algorithm (penting bagi real-time streaming)

 Dukungan hardware dan software

Metode Kompresi Audio

-   Metode Transformasi

o Menggunakan   algoritma   seperti   MDCT   (Modified   Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20
Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB.

-   Metode Waktu

o Menggunakan  LPC  (Linier  Predictive  Coding)  yaitu  digunakan untuk speech (pidato), dimana LPC akan menyesuaikan  sinyal data        pada   suara   manusia,   kemudian   mengirimkannya   ke pendengar.   Jadi  seperti  layaknya  komputer  yang  berbicara dengan  bahasa manusia dengan kecepatan 2,4 kbps

 
Teknik  kompresi  audio  dengan  format  MPEG  (Moving  Picture  Expert

Group)

-      MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2 Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio.
Nilai 0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel > 1,4 Mbits/sec yang hanya terdiri dari suara saja.
-      Untuk ratio kompresi 6:1 untuk 16 bit stereo dengan frekuensi 48kHz dan bitrate 256 kbps CBR akan menghasilkan ukuran file terkompresi
      kira-kira 12.763 KB, sedangkan ukuran file tidak terkompresinya adalah

75.576 KB

-   MPEG-1 audio mendukung frekuensi dari 8kHz, 11kHz, 12kHz, 16kHz,

22kHz, 24 kHz, 32 kHz, 44kHz, dan 48 kHz.  Juga mampu bekerja pada mode mono (single audio channel), dual audio channel, stereo, dan joint-stereo


Algoritma MPEG Audio

-      Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi menjadi 32 subband frekuensi.
-      Memberikan  pembatas  pada  masing-masing   frekuensi  yang  telah dibagi-bagi, jika tidak akan terjadi intermodulasi (tabrakan frekuensi)
-      Jika sinyal suara terlalu rendah, maka tidak dilakukan  encode  pada sinyal suara tersebut
-      Diberikan  bit  parity  yang  digunakan  untuk  mengecek  apakah  data tersebut rusak atau tidak (yang mungkin disebabkan oleh gangguan / noise),  apabila  rusak,  maka  bit  tersebut  akan  digantikan  bit  yang
jenisnya sama dengan bit terdekatnya. 
 

Kompresi Audio MP3

-      Asal-usul  MP3  dimulai  dari  penelitian  IIS-FHG  (Institut  Integriette Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga penelitian terapan di Munich, Jerman dalam penelitian coding audio perceptual.
-      Penelitian   tersebut   menghasilkan   suatu   algoritma   yang   menjadi standard sebagai ISO-MPEG Audio Layer-3 (MP3)


Format Header MP3

File   MP3   terdiri   atas   2   bagian   data:

-      Header : berfungsi sebagai tanda pengenal bagi file MP3 agar dapat dibaca oleh MP3 player yang berukuran 4 byte
Beberapa karakteristik yang dibaca komputer adalah bit ID, bit layer, bit sampling frequency dan bit mode.
-   Data audio : berisi data file mp3.

Teknik kompresi MP3

Beberapa  karakteristik  dari  MP3  memanfaatkan  kelemahan  pendengaran manusia.
1. Model psikoakustik

o Model    psikoakustik    adalah    model    yang    menggambarkan karakteristik pendengaran manusia.
o Salah  satu  karakteristik  pendengaran  manusia  adalah  memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.
2. Auditory masking

Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.

3. Critical band

Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.

4. Joint stereo

Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.

0 komentar:

Posting Komentar