Selasa, 14 Juni 2016

Hi Res = USELESS!

Bikin judul yang heboh supaya yg baca tertarik XD  
Ini ntah bener ato nggak, sekedar sharing aja :D
Btw, ini bikin doc/filenya udah 2 taon lalu, taon 2014. Tadi mau edit nambahin doang tapi ntah kenapa ga bisa, terpaksa delete doc lama, dan copas sebagian isinya kesini, dijadiin doc baru.
==================================================
So anyway,   lagi browsing dan ketemu videonya si lachlan di youtube, jelasin bit depth myth  http://www.youtube.com/watch?v=nLEhfieoMq8
Audio File 01: Bit Depth & The 24 Bit Audio Myth  Dia share links di about/notes video itu sumber2 referensi dia, dan salah satunya adalah ini
http://people.xiph.org/~xiphmont/demo/neil-young.html
Isinya bagus, walaupun bahasa Inggris yang agak technical, gw orang awam rada mabok bacanya XD
 Simplenya sih gini yang bisa gw tangkep, CMIIW banget :
 1) 24 bit = useless di playback. Kepake cuma saat mastering, saat playback akan mubazir (kecuali kalo kita denger lagunya di luar angkasa yg vacuum)
 2) 192 kHz sampling contents ultrasonic nya malah bersifat merugikan  
3) 24/192 ini jadi katanya cuman akal2an marketing produser rekaman doang (and hardware manufacturers) ---- Question : Tapi gw pernah denger kualitas rekaman 24/96 / SACD / DSD /etc yang suaranya jaooooh banget bedanya ama kualitas cd !!!!! #ngotot ---- Answer : Itu emang master rekamannya beda :p
4) 16 bit/44.1kHz udah lebih dari cukup untuk kuping kita, selain itu mubazir.  Penjelasan ttg apa itu 16 bit / 44.1kHz ada dibawah, monggo scroll down.
==============================================
Trus kalo gw mo denger suara HI RES gimana ?
 1. Coba pake headphone/iem/earbuds yang bagusan (subjektif, sesuai selera)
2. Pakai lossless format.
 Lah ? Diatas baru bilang mp3 320kbps udah cukup ? Koq sekarang disuruh pake lossless ?
 Bener, mp3 320kbps udah cukup, sayangnya banyak encoder peninggalan jadul (20 taonan lalu), yg hasil convertnya jelek, jadi akan lebih bagus kalo pake lossless
3. Berdoa semoga cd/file donlod kita berasal dari master recording yang bagus, bukan korban loudness war (http://en.wikipedia.org/wiki/Loudness_war)
4. Kalo masih berasa kurang juga, silahkan tempel stiker Hi Res di perangkat audio lu, mayan untuk placebo effect nyeneng nyenengin diri sendiri XD
=======================================================
EDIT : 5 Mei 2016
Okay, kita masuk yang agak teknikal dikit ya.
Sebenernya apa sih 16bit / 24bit etc dll dst nya di audio file itu ?
16 bit dll itu = bit depth = seberapa banyak informasi yang ada dalam tiap sample (point in time dalam recording/playback *kalo ga salah terjemahin :p * (baca https://en.wikipedia.org/wiki/Audio_bit_depth & https://en.wikipedia.org/wiki/Sampling_(signal_processing) )
Dalam dunia audio kita, yang kepake ato yg jadi efek dari bit depth ini adalah terutama “Dynamic Range “ (baca : https://en.wikipedia.org/wiki/Dynamic_range atau nonton https://www.youtube.com/watch?v=_hRE2RKUV2E
Simpelnya, Dynamic Range adalah jarak (dalam decibel) antara suara paling kecil dalam suatu lagu/audio file ke suara paling nyaring di lagu/audio file tersebut.
suara berbisik ------------------- (DYNAMIC RANGE ) -------------------- suara teriak
kira2 begitulah ilustrasinya diatas.
Secara matematis, dynamic range dari file dengan bit depth 16 bit mentok di 96db, tapi dengan proses dithering (https://en.wikipedia.org/wiki/Dither) dynamic range file 16bit bisa mencapai 120db
Pertanyaannya, apa sih artinya Dynamic Range 120db itu ??
GOOD QUESTION !!
Here’s the answer : “ 120dB is greater than the difference between a mosquito somewhere in the same room and a jackhammer a foot away.... or the difference between a deserted 'soundproof' room and a sound loud enough to cause hearing damage in seconds.” -- jadi suatu file audio dengan dynamic range 120db, suara terkecilnya kira2 seperti bunyi nyamuk yang ada didalam satu ruangan dengan kita DAN suara ternyaringnya adalah kira2 sebanding dengan suara orang ngebor jalanan dengan jarak hanya 1 foot/30cm dari kita.
Abis nonton ulang videonya Lachlan, dan dapet penjelasan lebih simple lagi.
Gini, dalam kegiatan sehari2 kita kan pasti ada noise. Bahkan kalo lagi di kamar mau tidur pun ada humm ac / white noise, lagi depan compie pun ada bunyi kipasnya etc.
Ilustrasi dynamic range 96db (angka mentoknya file 16 bit) itu kurang lebih seperti ini, bayangin kita lagi dalam perpustakaan, sunyi, ga boleh ribut, tapi pasti tetep ada background noise (bunyi kipas. bunyi ac, bunyi halaman buku dibalik dll dll), kita anggep aja noise floor (suara noise terkecil itu) di 30db.

Nah, dynamic range 96db artinya suara ternyaring di perpustakaan itu 96 db lebih kencang dari suara terkecil atau ekuivalen dengan suara orang ngebor pake jackhammer 30 cm disamping kita.

Kalau rekaman 24 bit ?

Dynamic rangenya 144 db. Artinya kalau suara terkecil di 30db, berarti suara terkencangnya 144 db lebih gede, atau ekuivalen dengan suara launching roket space shuttle :p
Sekedar ilustrasi, suatu lagu klasik yang recordingnya bagus, akan punya dynamic range sekitar 60+ db (artinya dalam lagu tersebut, suara ternyaring - katakanlah suara gong ato organ ato apalah - lebih loud 60 db dibanding suara terkecil - katakanlah suara flute/violin solo )
Jadi dengan penjelasan ttg dynamic range diatas, harusnya udah obvious banget 16 bit recording itu sudah lebih dari cukup untuk kita dengar.
Rasanya ga ada ada lagu yg dynamic rangenya diatas 120db deh, gendang telinga meledak kalo beda suara terkecil & ternyaringnya diatas itu XD

--------------------------------------------------------------------------------------------------

 Ok, itu tadi tentang bit depth. Trus angka 44.1 kHz itu apaan ?
Good question !!
Angka itu adalah sampling rate (https://en.wikipedia.org/wiki/Sampling_(signal_processing)#Audio_sampling )
Simpelnya gini : Kuping kita standarnya bisa mendengar frekuensi suara dari 20Hz ke 20kHz. Dibawah 20Hz ga kedenger, diatas 20kHz ga kedengeran juga - dan saat kita semakin tua, kita pasti akan kehilangan kemampuan mendengar suara di frekuensi tinggi, (More on this later.)
Menurut Nyquist Theorem (https://en.wikipedia.org/wiki/Nyquist%E2%80%93Shannon_sampling_theorem), untuk ngerekam seluruh frekuensi suara yg bisa kita denger itu, kurang lebih butuh 2x lipat/double rate, makanya dengan asumsi kuping bisa denger sampai 20kHz, yang dibutuhkan adalah ke 44.1kHz (angka ini dipilih karena lebih gede dari 40kHz - yg dibutuhkan untuk rekam frekuensi 20kHz - dan karena kompatibel dengan sistem PAL yang di pake di Eropa & NTSC yang dipake di Amrik)
Untuk ilustrasinya, vid ini bagus : https://www.youtube.com/watch?v=BNVVq-iVPy8 <-- jelasin bit depth & sample rate, great vid, nonton ini aja udah cukup untuk menjelaskan apa itu bit depth & sampling rate
Kalo gitu 44.1kHz (standar rekaman CD) ato maksimal ke 48kHz (standar rekaman DVD) udah cukup dong ? Kalo diatas itu toh ga kedengeran juga ama kuping ??
Err... yes & no.
Untuk playback, yes, 44.1kHz (standar CD Audio) atau 48kHz (standar DVD) udah cukup.
Bit Depth & Sample Rate diatas 16bit / 44.1kHz itu kepake saat recording/mastering, supaya sound engineers dll yg gawe disitu punya “headroom, noise floor & convenience” saat kerja.
Setelah proses mastering & recording selesai, toh akan diconvert balik jadi 16/44.1kHz saat “burn” ke CD      
---------------------------------------------------------------------------------------------------------
T ambahan :
Sedikit caveat - all things being equal, format CD/DVD (16 bit/44.1kHz - 16 bit/48kHz) sudah pas untuk apa yg bisa ditangkap kuping kita.
Problemnya, banyak lagu/album yang sudah diremaster dan dirilis secara digital dengan format yang "lebih tinggi" (ie 24/96 - 24/192 - dll). In this case, maybe ga ada pilihan lain selain "terpaksa" mendownload format yang "lebih tinggi" tersebut untuk menikmati hasil yang lebih enak di kuping.
Yang perlu dicermati, yang bikin lebih enak itu bukan formatnya (misalnya 16/44.1 vs 24/96), tapi karena lagu/album tersebut telah diremaster - telah dipoles lagi sebelum dirilis kembali.
Bottom line, bukan format 24 bit / 96kHz etc nya yang bikin lebih bagus, tapi proses remasteringnya.
---------------------------------------------------------------------------------------------------------
Segitu dulu yg bisa gw tangkep dari youtube clip + web itu, itu opini mereka, gw translate sebisa mungkin aja, please kindly CMIIW banget   ===========================================================
 Kalo sempet / inget akan diupdate lagi :p    ============================================================  
27 Juli 2014 - 14:00 WITA   Nambahin links lagi :
http://xiph.org/video/vid2.shtml  
http://www.sonicscoop.com/2013/08/29/why-almost-everything-you-thought-you-knew-about-bit-depth-is-probably-wrong/
 http://www.head-fi.org/t/415361/24bit-vs-16bit-the-myth-exploded   =========================================================  
27 Juli 2014 - 15:40 WITA  
So what is Loudness War ?   Penjelasan singkat, tepat, padat, jelas dari youtube    http://www.youtube.com/watch?v=3Gmex_4hreQ  
Link nemu dari rant nya Tyll di innerfidelity disini    http://www.innerfidelity.com/content/its-masters-damit   ================================================================ Audio Myth Youtube   http://www.youtube.com/watch?v=BYTlN6wjcvQ  
Awal2nya bagus pas si JJ & Poppy Crum ngomong   Pas si Ethan Winer ngomong juga bagus, cuman agak technical  
Yang bagus dari presentasi si Ethan di bagian Bit Reduction, start dari menit 45:50 di clipnya   Dia puter sampel lagu 24 bit, dan diturunin terus bit ratenya.
Coba dengerin pake headphone deh. Di kuping gw 24 ke 16 ga kedengeran ada perubahan apa2, baru mulai ada noise dll 10- 8 bit kebawah.  
Then again, noise / hiss di 8 bit itu yah practically sama aja dengan hiss kalo puter kaset jadul/magnetic tape.   ================================================================
http://en.wikipedia.org/wiki/Psychoacoustics  
Psychoacoustics ALIAS Apaan sih mp3 ???  
Gini, teorinya kuping manusia bisa denger frekuensi antara 20Hz - 20.000Hz (20KHz). TAPI, semakin tua kita, semakin sulit menangkap suara diatas 16Khz , bisa dicoba sendiri pake headphone/earphone kamu disini : http://www.audiocheck.net/audiotest...  <-- gw cuma bisa denger max sampai 16kHz sekarang, diatas itu ga bisa denger apa2 lagi :(
SideNote : Kalo mo ngetest seberapa bagus pendengaran kamu sekarang, coba mampir kesini deh http://hearingtest.online/ :)
Sedangkan frekuensi terendah yang masih kita dengar & masih bisa disebut "musical" itu di 12Hz, ini pun hanya dicoba di dalam suasana / situasi lab test yg ideal banget.
Tones antara 4Hz - 16Hz bukannya kita denger, tapi kita rasakan (ie getaran subwoofer)  
Lah terus hubungannya teori diatas ama mp3 apaan coba ? Bosen nih bacanya !!!!  
Sabar, ini MP3 dari wiki :   The compression works by reducing accuracy of certain parts of sound that are considered to be beyond the auditory resolution ability of most people. This method is commonly referred to as perceptual coding. It uses psychoacoustic models to discard or reduce precision of components less audible to human hearing, and then records the remaining information in an efficient manner.  
Nah, jadi kompresi mp3 itu ngebuang ato ngompres ato ngasih prioritas rendah ke bunyi2an yg diluar frekuensi normal manusia. Yg difokusin itu ke frekuensi2 yang kita artikan sebagai "bagus".   Tentu saja makin gede kompresi, makin banyak yg di cut off, makanya kuping kaleng kita pun akan bisa ngebedain mp3 320 ama mp3 64 :p    
Sidenote: ini wiki tentang perceptual coding ato psychoacoustic :  

The psychoacoustic model provides for high quality lossy signal compression by describing which parts of a given digital audio signal can be removed (or aggressively compressed) safely — that is, without significant losses in the (consciously) perceived quality of the sound.   It can explain how a sharp clap of the hands might seem painfully loud in a quiet library, but is hardly noticeable after a car backfires on a busy, urban street.  

This provides great benefit to the overall compression ratio, and psychoacoustic analysis routinely leads to compressed music files that are 1/10th to 1/12th the size of high quality masters, but with discernibly less proportional quality loss. Such compression is a feature of nearly all modern lossy audio compression formats.    Some of these formats include Dolby Digital (AC-3), MP3, Ogg Vorbis, AAC, WMA, MPEG-1 Layer II (used for digital audio broadcasting in several countries) and ATRAC, the compression used in MiniDisc and some Walkman models.  

Psychoacoustics is based heavily on human anatomy, especially the ear's limitations in perceiving sound as outlined previously. To summarize, these limitations are:
· High frequency limit ---> http://en.wikipedia.org/wiki/High_frequency_limit
· Absolute threshold of hearing ---> http://en.wikipedia.org/wiki/Absolute_threshold_of_hearing
· Temporal masking ---> http://en.wikipedia.org/wiki/Temporal_masking
· Simultaneous masking ---> http://en.wikipedia.org/wiki/Simultaneous_masking

Given that the ear will not be at peak perceptive capacity when dealing with these limitations, a compression algorithm can assign a lower priority to sounds outside the range of human hearing. By carefully shifting bits away from the unimportant components and toward the important ones, the algorithm ensures that the sounds a listener is most likely to perceive are of the highest quality.    
===============================================================
Bicara sound quality itu adalah bicara PERSEPSI SUBJEKTIF, alias nggak bisa objektif dan diukur, semuanya kembali ke kuping masing2, gimana otak kita nangkap, ngolah & menyimpulkan "kualitas" suara/lagu.    
================================================================

Tidak ada komentar:

Posting Komentar