Thứ Tư, 5 tháng 4, 2017

[Giải ngố 2] Các định dạng file âm thanh


(Bài dịch từ: HTG Explains: What Are the Differences Between All Those Audio Formats?)

Khái niệm âm thanh điện tử ngày nay có lẽ không còn là điều quá mới mẻ, và mỗi chúng ta đều hẳn đã từng phải bơi giữa hàng chục những định dạng audio khác nhau trong quá trình làm việc của mình. Bài viết này sẽ giới thiệu, phân biệt và giải thích về những định dạng thông dụng nhất trong số đó.
Trước khi đi vào cụ thể từng định dạng,  bạn cần nắm bắt vài khái niệm cơ bản mà cụ thể ở đây là PCM (Pulse Code Modulation- điều chế mã xung). Sau đó, chúng ta sẽ làm việc với các định dạng nén khác nhau sau.

PCM Audio: Khởi thủy

Pulse-Code Modulation được sáng tạo ra vào năm 1937 và cũng là dạng lưu trữ tín hiệu gần nhất với âm thanh analog. Công nghệ PCM xử lí và lưu trũ sóng âm analog một bằng việc lấy mẫu liên tục theo tần xuất xác định. Điều này được đặc trưng bởi 2 yếu tố sau: sample rate - Tần số/tần suất lấy mẫu và bit depth - độ sâu/chi tiết của mẫu tính bằng bit.
Sample rate thể hiện mức độ tần suất (số lần trên giây) cường độ tín hiệu của âm thanh được lưu lại và bit depth thể hiện số lượng giá trị có thể cho mỗi lần lấy mẫu đó. Cơ bản là thế...
Âm thanh trong thế giới thực của chúng ta là một chuỗi liên tục trong khi trong thế giới số thì không phải như vậy. Để giải thích điều này, hãy thử so sánh công nghệ lưu trữ âm thanh với công nghệ lưu trữ video chẳng hạn. Điều mà chúng ta diễn giải là độ “mượt” của một video, thay vì là một chuỗi chuyển động không ngừng thực chất lại là một loạt các hình ảnh tính được chiếu liền kề nhau. Tương tự như vậy, biên độ của sóng âm cũng được ghi lại theo từng mốc một thay vì là một chuỗi chạy dài và liên tục.
  image
Image from Wikipedia
Ví dụ như trong hình trên, các biên độ của âm thanh tại thời điểm lấy mẫu được lưu lại tại một trong 16 giá trị cho sẵn (bit depth = 16 bit) với tần suất lẫy mẫu không đổi (các mốc cách đều nhau) và đưa ra hình ảnh mang tính tương đối của sóng âm thật sự.
Nếu điều này vẫn còn khó hiểu, chúng ta sẽ lại tiếp tục so sánh sâu hơn nữa giữa âm thanh PCM và analog.
Tưởng tượng âm thanh analog là một dòng chảy nước đi ra từ một vòi nước. Nhiệt độ của nước có thể được so sánh với biên độ sóng âm (amplitude) - một đặc tính giúp đảm bảo bạn có được mức nước vừa phải để sử dụng. Việc lấy mẫu (sampling) là số lần bạn nhúng tay vào dòng nước để kiểm tra nhiệt độ.  Bạn càng nhúng nhiều và liện tục, sự thay đổi trong dòng nước càng được cảm thấy một cách cụ thể, liền mạch và chi tiết hơn. Và tưởng tượng việc bạn có thể nhúng tay vào dòng nước ấy 44,100 lần mỗi giây thì cũng khá là tương đương với việc giữ ngón tay trong nước suốt khoảng thời gian đó, phải không? Đó là ý tưởng đằng sau việc lưu trữ âm thanh bằng cách lấy mẫu.
Bit depth thì hơi phức tạp hơn một xíu. Thay vì dùng ngón tay, hãy tưởng tượng bạn đang sở hữu một cái nhiệt kế siêu lởm mà chỉ thể hiện 2 giá trị là “nóng” hay “lạnh”. Khi đó, dù bạn có nhúng tay nhiều cỡ nào thì thực chất cũng chẳng có máy thông tin hữu dụng. Nhưng một lần nữa, tưởng tượng thay vì chỉ 2 giá trị, bạn có tận 16 khả năng khác nhau cho kết quả của chiếc nhiệt kế đó, khi đấy mọi chuyện bắt đầu dễ kiểm soát hơn phải không?  Bit depth hoạt động theo cách đó, bit depth càng cao thì mức độ thay đổi trong sóng âm được ghi lại càng tinh tế.
So sánh các mức bit depth thông dụng:
Như đã nói, PCM là nền tảng của lưu trữ âm thanh điện tử.  PCM nhắm đến việc tái hiện sóng âm thanh analog một cách chi tiết hết mức có thể.  Phần lớn các định dạng âm thanh/ phương thức lưu trữ âm thanh khác sử dụng thuật toán nhất định và cần được giải mã khi chơi. PCM thì đơn giản hơn và gần như có thể được bật trên mọi thiết bị. Các file audio sử dụng công nghệ PCM được coi là “lossless” (không thất thoát) và cũng không được nén lại, và hiển nhiên cũng tốn kha khá nhiều dung lượng ổ cứng.

Những định dạng không nén: WAV, AIFF

4183878043_e093b05f91_z

Image by codepo8
Cả WAV (Waveform Audio File Format ) và AIFF (Audio Interchange File Format) là các định dạng lossless dựa trên PCM, với một vài sự khác biệt nhỏ trong cách thức lưu trữ dự liệu.  File audio PCM với phần lớn mọi người nằm ở 2 định dạng này, tùy theo hệ điều hành mà bạn sử dụng là Windows hay OS X và có thể được convert qua lại mà không làm giảm chất lượng. Cả 2 đều là file PCM “lossless” với tín hiệu không nén và 2 kênh tiếng riêng biệt (stereo). Ở sample rate là 44.1 kHz ( 44100 lần lấy mẫu/giây) và bit depth là 16 bits (“CD quality”), trung bình mỗi phút nhạc chiếm 10 MB dung lượng.  Đây là mức chất lượng lí tưởng cho việc thu âm tại gia phục vụ cho mixing.
449435816_104052436d_z
Image by CyboRoZ

Các định dạng lossless nén: FLAC, ALAC, APE

Các định dạng trên lần lượt là viết tắt của Free Lossless Audio Codec, Apple Lossless Audio Codec và Monkey’s Audio.  Chúng là các định dạng âm thanh được nén lại bằng thuật toán riêng biệt, nhưng vấn giữ âm thanh ở mức lossless. Sự khác biệt giữa một file WAV hay AIFF được zip lại và FLAC nằm ở 2 điểm: 1: FLAC được thiết kế chuyên biệt cho âm thanh và đảm bảo chất lượng nén tốt hơn trong khi không làm mất dữ liệu. 2: FLAC có thể được chơi trực tiếp từ các trình nghe nhạc hỗ trợ nó thay vì phải giải nén ra mỗi lần bật file. File ở các định dạng nén lossless này thường nặng xấp xỉ một nửa file không nén, nghĩa là là tầm 5MB cho mỗi phút nhạc.
Điều hay ở các định dạng này là chúng đều có thể được convert ngược về WAV mà không hề mất dữ liệu.  Nếu bạn là một audiophile với dàn loa/tai nghe miễn bàn và hàng lô những file nhạc ở mọi thể loại khác nhau tranh chân chiếm chỗ trong ổ cứng, đây là sự lựa chọn của bạn
Các định dạng lossy: MP3, AAC, WMA, Vorbis
2919149349_7781ba8dc2_z
Image by patrick h lauke
Phần lớn các định dạng bạn bắt gặp ngày nay được phần loại là “lossy”; điều này nghĩa là một lượng nhất định chất lượng âm thanh đã được hi sinh để đổi lại là dung lượng file nhỏ hơn nhiều lần. Ví dụ, một file mp3 trung bình chỉ chiếm 1MB/ phút.
Mặc dù được gọi là định dạng nén, nhưng các dạng file này không thể được covert ngược lại mà không mất đi chất lượng ban đầu. Các định dạng lossy khác nhaydùng các thuật toán khác nhau để lưu dữ liệu nên cùng một chất lượng kích cỡ file giữa khác định dạng cũng có thể tường đối khác biệt.  
Các định dạng lossy dùng khác niệm bitrate để nói về chất lượng âm thanh (“192 kbit/s” hay “192 kbps” chẳng hạn, nhìn quen chứ?)  Con số này thể hiện lượng thông tin lưu trữ trong mối giây nhạc, số các lớn thì các tương đương với mức lưu trữ cao hơn.
Dưới đây là một vài định dạng lossy thường gặp
  • MP3: MPEG 1 Audio Layer 3, bộ giải mã (codec) âm thanh thông dụng nhất quả đất. Mặc dù dính dáng tới hàng loạt các vấn đề bản quyền khác nhau, file mp3 vẫn thông dụng đến đáng kinh ngạc. Bạn có dám nói là bạn không sở hữu file nào trong máy chăng?
  • Vorbis: một định dạng lossy miễn phí với mã nguồn mở. File vorbits hay được thấy cùng các PC games như Unreal Tournament 3 chẳng hạn. Dân mã nguồn mở hay người sử dụng linux có lẽ sẽ thường xuyên bắt gặp định dạng này.
  • AAC:  Advanced Audio Coding, chuẩn audio được dùng trong các video MPEG4 nhờ có tính tương thích với DRM ( VD: Apple’s FairPlay), sự tiên tiến so với mp3  và vì không cần có giáy phép khi phát hành nội dung dưới định dạng này. Fan của  Apple thường sẽ tàng trữ kha khá file AAC.
  • WMA:  Windows Media Audio, Microsoft’s lossy audio format.  Được phát triển và sử dụng để tránh các vấn đè bản quyền liên quan tới MP3, WMA sở hữu kha nhiều tính ưu việt và khả năng tương thích với DRM.  Trước khi iTunes xuất hiện và thống trị thị trường nhạc DRM, WMA thực sự đã rất phổ biến.
Các định dạng lossy này được sử dụng rộng rãi trong việc nghe và lưu trữ âm thành thông thường nhờ tính tiết kiệm dung lượng của chúng. VIệc dụng định dạng nào phụ thuộc vào trình/thiết bị chơi nhạc bạn sử dụng, dung lượng bạn còn hay độ khó tính về chất lượng âm thanh bạn đòi hỏi. Ngày nay, máy tính có thể giải mã mọi định dạng và các máy chơi nhạc (trừ hàng Apple..) ngày càng mở rộng lượng định dạng hỗ trợ hơn, thậm chí bao gồm FLAC hay APE.  Apple thì vẫn chỉ yêu MP3, ALAC và AAC mà thôi.

Chất lượng âm thanh liệu chỉ mang tính chủ quan?

image
Hiển nhiên. Hẳn mỗi chúng ta đều nhớ về ngày đầu sưu tập nhạc số, khi mà file mp3 128kbps thực ra nghe chẳng khác gì 320kbps. Rồi dần thì nhu cầu tăng lên khi bạn nhận ra 256 kbit nghe …. Hay hơn nhiều. Đến khi nào đó, sở hữu một đôi tai nghe/loa thật tốt, bạn lại dần đẩy mình lên tới mức CD quality (1440kbps).
Nhưng cũng sẽ có khi bạn nhận ra rằng có những khi nghe một bản nhạc bạn yêu thích, nặng 69MB, trên một đôi tai nghe làng nhàng …. 6 triệu có lẽ lại chẳng thể xúc động bằng đột nhiên gặp lại một giai điệu bạn bỏ quên, trên chiếc loa bèm bẹp lắp sẵn trên xe bus chở bạn đi làm.
Tạo cho mình sự lựa chọn riêng về phương thức lưu trữ, và chỉ đến đó thôi. Phần còn lại của tâm hồn hãy dành cho âm nhạc, đơn giản và thuần túy.
Chúc vui, làm nhạc, nghe nhạc và sống nhạc.

0 nhận xét:

Đăng nhận xét


Get Email Updates
Subscribe to Get Latest Updates Free
(Nhấn 'Subsribe' để cập nhật các bài viết mới nhất)

Donate to Wave- vex Team

Love our articles. Click Image to go to the Donation Site!