วิธีตรวจสอบคุณภาพเสียงที่แท้จริงของการสตรีมเสียง

เมื่อสองสามปีก่อนเราได้เขียนบทความเกี่ยวกับวิธีกำหนดบิตเรตที่แท้จริงของไฟล์เสียงใด ๆ รวมทั้งทำไมการแปลง YouTube เป็น MP3 320kbps จึงเสียเวลา เป้าหมายของเราคือช่วยให้ผู้ใช้กำหนดคุณภาพเสียงที่แท้จริงของไฟล์เพลงที่พวกเขาจ่ายและดาวน์โหลดเพื่อหลีกเลี่ยงบริการเพลงที่อ้างว่าให้เสียงคุณภาพสูงแบบไม่สูญเสียข้อมูล แต่ให้บริการ MP3 ที่แปลงเป็น FLAC เป็นต้น

ผู้ใช้หลายคนถามว่าพวกเขาสามารถกำหนดคุณภาพเสียงที่แท้จริงของไฟล์ สตรีมมิ่ง เพลงแทนที่จะเป็นไฟล์ในเครื่อง นี่เป็นคำถามที่ยอดเยี่ยมเนื่องจากบริการสตรีมมิ่งไฮไฟจำนวนมากได้ผุดขึ้นในช่วงไม่กี่ปีที่ผ่านมาโดยอ้างว่านำเสนอสตรีมเพลงแบบไม่สูญเสียคุณภาพสูงให้กับผู้ใช้

คุณอาจคิดว่าทำได้เพียงบันทึกเสียงสตรีมมิงบันทึกไว้ในเครื่องเป็นไฟล์. WAV และเรียกใช้ผ่านเครื่องวิเคราะห์สเปกตรัมเช่น Spek ไม่สามารถทำได้ เป็นไปไม่ได้ที่จะจับภาพเสียงที่สมบูรณ์แบบจากแหล่งสตรีมมิ่งโดยใช้การ์ดเสียงของเมนบอร์ดปกติของคุณ

ดังนั้นสิ่งที่เราต้องทำคือใช้เครื่องวิเคราะห์สเปกตรัมที่แม่นยำเกือบสมบูรณ์แบบสำหรับการสตรีมเสียงและทำความเข้าใจวิธีการอ่านแบบเรียลไทม์

ข้อกำหนด:

  • ซอฟต์แวร์ MusicScope
  • บริการเสียงสตรีมมิ่งที่คุณเลือก

MusicScope เป็นเครื่องมือวิเคราะห์และวัดเสียงแบบเรียลไทม์ซึ่งสามารถให้ข้อเสนอแนะที่แม่นยำมากเกี่ยวกับการสตรีมเสียง น่าเสียดายที่นักพัฒนาหยุดขายใบอนุญาตสำหรับซอฟต์แวร์ แต่เวอร์ชันทดลองใช้ช่วยให้คุณทดสอบเสียงได้นานถึง 30 วินาที

สำหรับวัตถุประสงค์ของคู่มือนี้เราจะยกตัวอย่างการใช้ซอฟต์แวร์กับไฟล์ในเครื่องในรูปแบบต่างๆ อย่างไรก็ตามข้อมูลทั้งหมดที่ให้มาสามารถนำไปใช้กับการสตรีมเสียงได้อย่างเท่าเทียมกันเช่นจาก Spotify, Deezer เป็นต้น

การกำหนดความถี่และช่วงความดังของ LRA

มาลองติดตามเพลง“ A Stroll Through the Sky” แบบไม่สูญเสีย (.M4A ALAC) จากภาพยนตร์เรื่องนี้กัน Howl’s Moving Castle. เป็นการบันทึกเสียงดนตรีดังนั้นเราควรได้รับตัวอย่างที่ดีของช่วงความถี่ทั้งหมด ตัวอย่างเช่นเราสามารถเห็นยอดความถี่สูงที่แยกได้เช่นฉิ่ง shimmers ระหว่าง 11 ถึง 22 kHz

ขณะที่เราดูกราฟใน MusicScope เราจะเห็นว่ามีไดนามิกเรนจ์สูงมากอย่างที่เราคาดหวังจากการบันทึกเสียงออเคสตร้า

สิ่งที่ MusicScope สามารถให้เราได้คือ LRA (ช่วงความดัง) ซึ่งวัดความแตกต่างระหว่างความถี่ที่นุ่มนวลและดังที่สุด สำหรับแทร็กเฉพาะนี้เราจะเห็นว่ามีความแตกต่างกันประมาณ 23 เดซิเบลระหว่างทางเดินที่นุ่มนวลและดังที่สุด

ในแง่ของไมโครไดนามิกแทร็กเฉพาะนี้มีช่วงไดนามิกที่สูงมากซึ่งเราคาดหวังได้จากการบันทึกออเคสตราคุณภาพสูง แต่ก็มีสิ่งที่น่าสนใจเกิดขึ้นเช่นกัน

MusicScope สามารถบอกเราได้ว่าแทร็กจะได้รับประโยชน์จากการควบคุมด้วยความละเอียดที่สูงขึ้นหรือไม่ ดังนั้นโดยเฉพาะแทร็กนี้จึงบันทึกด้วยความลึก 16 บิตที่อัตราตัวอย่าง 44 kHz แต่เราสามารถบอกได้ว่าแทร็กมีเฮดรูมมาก ตั้งแต่ 0 ถึง 6 เดซิเบลต่ำกว่าเต็มสเกลไม่มีข้อมูลใน Linear Frequency Spectrum

ดังนั้นแทร็กนี้จึงมีบิตเรตที่มีประสิทธิภาพเพียงประมาณ 14 ถึง 15 บิตซึ่งหมายความว่าพวกเขาสามารถใช้การบีบอัดช่วงไดนามิกในระหว่างการบันทึกหลักหรือไมโครโฟนที่ใช้ในระหว่างการบันทึกไม่ได้รับข้อมูลทั้งหมด

ดังนั้นแม้ว่าไฟล์นี้จะมีเวอร์ชัน 96 kHz แต่ก็ไม่ได้รับประโยชน์ใด ๆ เนื่องจากเป็นไปได้มากว่าไมโครโฟนที่ใช้ระหว่างการบันทึกจะไม่รับข้อมูลทั้งหมด เนื่องจากไมโครโฟนส่วนใหญ่ได้รับการออกแบบมาเพื่อจับคู่กับความถี่ของช่วงการได้ยินของมนุษย์ดังนั้นในความจริงแล้วการบันทึกเสียง 96 kHz / 24 บิตของแทร็กนี้จะไม่ให้ความแตกต่างที่เห็นได้ชัดเจน

สิ่งที่ได้จากสิ่งนี้คือเพื่อปรับปรุงคุณภาพเสียงเรามุ่งเน้นไปที่สิ่งที่เกิดขึ้นระหว่างขั้นตอนการบันทึกและการควบคุม การโฟกัสที่ไฟล์เสียง "ความละเอียดสูง" มากเกินไปเพื่อประโยชน์ของไฟล์ความละเอียดสูงจะทำให้เราเสียสมาธิจากสิ่งที่สำคัญจริงๆซึ่งก็คืออุปกรณ์บันทึกเสียงและกระบวนการที่ใช้

จะรู้ได้อย่างไรว่าเพลงจะมีเวอร์ชั่นเสียงที่ดีกว่านี้

มาลองใช้แทร็ก EDM "Zebra" จาก Oneohtrix Point Never ในรูปแบบ 24 บิต 44 kHz สิ่งที่น่าสนใจเกี่ยวกับแทร็กนี้เป็นเพียงความหนาแน่นของข้อมูลดนตรีในแทร็กนี้ คุณสามารถเห็นบล็อกสีเขียวทึบบนสเปกโตรแกรมและดูมันเต็มตลอดแทร็ก

แทร็กนี้มี LRA ประมาณ 12.9 ซึ่งค่อนข้างสูงสำหรับแทร็ก EDM สิ่งที่น่าสนใจคือคุณจะเห็นว่าเป็นการติดตามแบบ 24 บิตที่ใช้ช่วงไดนามิกเกือบ 24 บิตทั้งหมด เพลงที่นุ่มนวลที่สุดในการบันทึกนี้อยู่ที่ประมาณ 100 dB ต่ำกว่าเสียงที่ดังที่สุด

ดังนั้นคุณสามารถบอกได้ว่าเพียงแค่มองไปที่สเปกโตรแกรมว่าแทร็กนี้ถูกตัดออกที่ 22 กิโลเฮิร์ตซ์มันเป็นการตัดที่ยากมากและจุดสูงสุดของความถี่สูงที่ประมาณ 22 กิโลเฮิรตซ์มีค่าเพียง 60 เดซิเบลต่ำกว่าเต็มสเกล

ซึ่งหมายความว่าหากเรามีแทร็กนี้ในเวอร์ชัน 96 kHz อาจมีข้อมูลเหลืออยู่มากมายที่สูงกว่า 22 kHz ซึ่งไม่ได้ทำให้เป็นแทร็กเวอร์ชันนี้

พูดง่ายๆว่าประสบการณ์การฟังของคุณน่าจะได้รับประโยชน์จากเพลงที่มีความละเอียดสูงกว่านี้ แทร็กนี้ถึงขีด จำกัด ของรูปแบบ (อัตราตัวอย่าง 44 kHz) เมื่อคุณเข้าใจกระบวนการคิดที่นี่แล้วคุณจะเริ่มเข้าใจได้อย่างแท้จริงว่าคุณได้รับการใช้งานแทร็กเวอร์ชันที่ดีที่สุดบนบริการสตรีมไฮไฟหรือไม่

วิธีบอกการบันทึกเสียงที่มีคุณภาพไม่ดี

มาใช้แทร็ก“ Fly Away” ของ TeddyLoid ในรูปแบบ 16 บิต 44 kHz เราทำได้ ได้ยินทันที ว่าแทร็กนั้นเชี่ยวชาญอย่างมาก

จากการดูกราฟเรดาร์เราจะเห็นว่าแทร็กถึงจุดสูงสุดตลอดระยะเวลาของเพลงอย่างต่อเนื่องดังนั้นเพลงจึงตัดต่อแบบเต็มสเกลได้อย่างต่อเนื่อง ดังนั้นหากคุณเล่นเพลงนี้ผ่านอุปกรณ์ระดับกลางก็น่าจะบิดเบือนได้มาก

นอกจากนี้แทร็กนี้ยังมี LRA ประมาณ 2.3 ซึ่งหมายความว่ามีการแพร่กระจายของช่วงไดนามิก 2.3 เดซิเบลตลอดทั้งแทร็กซึ่งดูเหมือนจะบ้ามาก

คุณภาพไม่ดีหรือตั้งใจผลิต?

เมื่อพิจารณาแทร็กอย่าง“ Fly Away” เราต้องพิจารณาด้วยว่าแท้จริงแล้วเป็นแทร็กที่เชี่ยวชาญไม่ดีเหมือนกับการผลิตมือสมัครเล่นหรือว่าเป็นความตั้งใจ แทร็ก“ Fly Away” มีความหมายว่าเป็นแทร็กเต้นรำที่ดังแบบ“ ใช้แล้วทิ้ง” ดูเหมือนว่ากำลังเล่นผ่านลำโพงที่ไม่ดีซึ่งในความเป็นจริงแล้วอาจเป็น ความตั้งใจ เบื้องหลังการควบคุมแทร็ก

คิดว่ามันเหมือนฟิลเตอร์กล้อง หากคุณถ่ายเซลฟี่ความละเอียดสูงแล้วใช้ฟิลเตอร์ซีเปียและเพิ่มเอฟเฟกต์เบลอบางอย่างเป็นต้น ผู้คนอาจคิดว่าคุณถ่ายภาพที่พร่ามัวและมีคุณภาพไม่ดี แต่แท้จริงแล้วเป็นความตั้งใจของคุณ สิ่งเดียวกันนี้สามารถเกิดขึ้นได้ในการผลิตเพลงเช่นเพลง "Garage punk" ที่มีเจตนาไม่ดี

เพื่อสรุป เราสามารถใช้ MusicScope เพื่อกำหนดข้อมูลทุกประเภทเกี่ยวกับแทร็กเพลง แต่เราควรพิจารณาด้วยว่าอะไรคือความตั้งใจของศิลปินและการเรียนรู้ที่มีคุณภาพต่ำนั้นเป็นรูปแบบของงานศิลปะหรือไม่หรืออะไรทำนองนั้น

Facebook Twitter Google Plus Pinterest