Want to enhance video quality? Checkout our new video quality enhancer.Try it now
Back to Blog

ทำไมการปรับปรุงเสียง AI ถึงฟังดูเป็นโลหะ (และวิธีแก้ไข)

ทำไมการปรับปรุงเสียง AI ถึงฟังดูเป็นโลหะ (และวิธีแก้ไข)
Ana Clara
Ana Clara

ข้อร้องเรียนทั่วไปจากพอดคาสเตอร์ ครีเอเตอร์วิดีโอ และผู้สัมภาษณ์คือเสียงที่ปรับปรุงด้วย AI บางครั้งฟังดูเป็นโลหะ เทียม หุ่นยนต์ หรือประมวลผลมากเกินไป นี่ไม่ใช่เรื่องเล็ก ในหลายกรณี เวอร์ชันที่ปรับปรุงแล้วฟังดูแย่กว่าเดิม

ฉันได้ยินข้อเสนอแนะนี้นับครั้งไม่ถ้วนจากครีเอเตอร์ที่ลอง เครื่องมือปรับปรุงเสียง AI เพียงเพื่อจบลงด้วยเสียงที่ฟังดูเหมือนถูกประมวลผลโดยหุ่นยนต์ บทความนี้อธิบายว่าอะไรผิดพลาดจริงๆ ภายใต้ประทุน ทำไมสิ่งนี้เกิดขึ้นกับเครื่องมือบางตัวมากกว่าตัวอื่น และการแก้ไขที่เชื่อถือได้มากที่สุดในวันนี้คืออะไร

สาเหตุที่แท้จริง: การกดดันมากเกินไปและการสร้างใหม่ที่บังคับ

เสียงโลหะหรือหุ่นยนต์ที่คนส่วนใหญ่บ่นไม่ใช่แบบสุ่ม มันมักจะมาจากการแลกเปลี่ยนทางเทคนิคเดียวกัน

Audio enhancers AI ส่วนใหญ่ทำสองสิ่งพร้อมกัน พวกเขากดดันเสียงรบกวนและเสียงก้องอย่างก้าวร้าว แล้วสร้างเสียงพูดขึ้นมาใหม่ในที่ที่ข้อมูลถูกลบออก เมื่อการกดดันไปไกลเกินไป โมเดลจะลบไม่เพียงแค่เสียงรบกวน แต่ยังรวมถึงรายละเอียดเล็กๆ ในเสียง ฮาร์โมนิกธรรมชาติ และสัญญาณห้องที่ละเอียดอ่อนที่ทำให้เสียงพูดฟังดูเป็นมนุษย์

เพื่อชดเชย โมเดลจะสร้างส่วนของสัญญาณที่เชื่อว่าหายไปขึ้นมาใหม่ การสร้างใหม่นั้นคือที่ที่พื้นผิวโลหะหรือสังเคราะห์ปรากฏ ฉันได้ประมวลผลการบันทึกที่ AI ลบออกมากจนต้องเดาว่าเสียงควรฟังดูอย่างไร และการเดาเหล่านั้นมักฟังดูเทียม

ทำไมสิ่งนี้เกิดขึ้นกับเครื่องมือ AI บางตัวมากกว่าตัวอื่น

หลังจากทดสอบเครื่องมือปรับปรุง AI ต่างๆ ฉันสังเกตเห็นรูปแบบที่ชัดเจนว่าตัวไหนสร้างอาร์ติแฟกต์โลหะหรือหุ่นยนต์และตัวไหนไม่

การประมวลผลแบบเดียวสำหรับทุกคน

Enhancers หลายตัว โดยเฉพาะฟรีหรือ freemium ใช้โปรไฟล์ที่ก้าวร้าวแบบเดียวกับเสียงทั้งหมด โปรไฟล์นั้นถูกออกแบบมาเพื่อสร้างความประทับใจในการบันทึกที่แย่ ลบเสียงรบกวนให้มากที่สุด และสร้างการเปรียบเทียบก่อน/หลังที่ชัดเจน

ปัญหาคือการบันทึกทั้งหมดไม่ต้องการการทำความสะอาดที่ก้าวร้าว เสียงแตกต่างกันอย่างมากในเสียง และห้องและไมโครโฟนทำงานแตกต่างกัน โดยไม่มีการปรับตัว โมเดลจะเกินไป และอาร์ติแฟกต์ปรากฏ

ฉันเห็นเครื่องมือเดียวกันสร้างผลลัพธ์ที่สมบูรณ์แบบในการบันทึกหนึ่งและอาร์ติแฟกต์โลหะในอีกอัน เพียงเพราะมันใช้การตั้งค่าที่ก้าวร้าวเดียวกันสำหรับทั้งสอง

ไม่มีการควบคุมความแรงของการประมวลผล

หากเครื่องมือไม่ให้คุณลดความเข้ม คุณติดอยู่กับสิ่งที่โมเดลตัดสินใจว่าดีที่สุด นั่นเป็นเหตุผลที่ผู้ใช้มักรายงานว่าระดับฟรีฟังดูรุนแรงกว่าระดับที่ต้องจ่ายเงิน โดยมีอาร์ติแฟกต์โลหะหรือหุ่นยนต์ปรากฏบ่อยขึ้นในเวอร์ชันฟรี

คุณกำลังฟังการแก้ไขมากเกินไปโดยไม่มีทางออก ฉันได้ประมวลผลการบันทึกผ่านเครื่องมือฟรีที่ฟังดูดีแต่มีคุณภาพหุ่นยนต์ที่ละเอียดอ่อน และไม่มีอะไรที่ฉันสามารถทำได้เพื่อแก้ไขโดยไม่ต้องอัปเกรด

ทางลัดแบบสร้างแทนการฟื้นฟูแบบอนุรักษ์นิยม

Enhancers บางตัวพึ่งพาการสร้างใหม่แบบสร้างมากเกินไปแทนการลดเสียงรบกวนแบบอนุรักษ์นิยม สิ่งนี้ทำงานได้ดีสำหรับเสียงที่แย่มากและการแปลงแบบสาธิต แต่สำหรับการพูดจริง มันเพิ่มความเสี่ยงของเสียงสังเคราะห์ พื้นผิวหุ่นยนต์ และการสูญเสียอัตลักษณ์ของผู้พูด

โมเดลเริ่มสร้างเสียงพูดแทนที่จะเปิดเผยมัน ฉันได้ประมวลผลการบันทึกที่การปรับปรุง AI ทำให้ผู้พูดฟังดูเหมือนคนอื่นโดยสิ้นเชิง โดยมีเสียงที่สะอาดทางเทคนิคแต่ไม่เป็นธรรมชาติโดยสิ้นเชิง

ทำไมการแก้ไขในหลังการผลิตจึงไม่ค่อยได้ผล

เมื่ออาร์ติแฟกต์โลหะหรือหุ่นยนต์ถูกนำเข้ามา การปรับความถี่ไม่สามารถลบออกได้ทั้งหมด การ de-essing เพียงแค่ปกปิดอาการ และการลดเสียงรบกวนเพิ่มเติมมักจะทำให้แย่ลง นั่นเป็นเพราะปัญหาถูก "อบ" เข้าไปในสัญญาณแล้ว

ณ จุดนั้น การแก้ไขที่แท้จริงไม่ใช่ปลั๊กอินอื่น มันคือการไม่สร้างอาร์ติแฟกต์ตั้งแต่แรก ฉันได้พยายามแก้ไขเสียงที่ประมวลผลมากเกินไปด้วย ซอฟต์แวร์แก้ไขด้วยตนเอง และแม้ว่าคุณจะปรับปรุงได้เล็กน้อย คุณไม่สามารถกู้คืนตัวละครธรรมชาติที่สูญหายไปได้อย่างสมบูรณ์ ปัญหาคือเมื่ออาร์ติแฟกต์ถูก "อบ" แล้ว แม้แต่เครื่องมือแก้ไขมืออาชีพก็มีปัญหาในการลบออกอย่างสมบูรณ์

การแก้ไขที่เชื่อถือได้เพียงอย่างเดียว: ใช้ enhancer ที่ให้ความสำคัญกับความเป็นธรรมชาติ

ในทางปฏิบัติ ครีเอเตอร์ที่หยุดเห็นอาร์ติแฟกต์โลหะหรือหุ่นยนต์เปลี่ยนไปใช้ enhancers ที่อนุรักษ์นิยมโดยค่าเริ่มต้น ปรับการประมวลผลให้เข้ากับอินพุต รักษาฮาร์โมนิกเสียง หลีกเลี่ยงการเติมแบบสร้างที่ก้าวร้าว และมุ่งไปที่การพูดที่เป็นธรรมชาติแทนการทำความสะอาดสูงสุด

นั่นเป็นเหตุผลที่เครื่องมือบางตัวสร้างผลลัพธ์ที่สะอาดอย่างสม่ำเสมอแม้ในเอคโค่หนัก ห้องที่มีเสียงดัง การสัมภาษณ์ระยะไกล และเสียงวิดีโอ ในขณะที่อื่นๆ ล้มเหลวในกรณีเหล่านั้นพอดี ความแตกต่างไม่ได้อยู่ที่ว่าพวกเขาทำความสะอาดมากแค่ไหน แต่อยู่ที่ว่าพวกเขาสร้างสมดุลระหว่างการทำความสะอาดกับการรักษาได้อย่างไร สำหรับ การเปรียบเทียบโดยละเอียดของ audio enhancers ที่ให้ความสำคัญกับความเป็นธรรมชาติ ดูคู่มือของเราเกี่ยวกับเครื่องมือที่ดีที่สุดที่มีอยู่ในวันนี้

ที่ AudioEnhancer.com เข้ากันได้

AudioEnhancer.com ถูกสร้างขึ้นรอบข้อจำกัดหลัก: ไม่เคยแก้ไขเสียงโดยทำลายเสียง แทนที่จะผลักการกดดันไปถึงขีดจำกัด มันมุ่งเน้นที่การรักษาพื้นผิวเสียง ลดเอคโค่และเสียงรบกวนโดยไม่ทำให้ฮาร์โมนิกแบน หลีกเลี่ยงความเงางาม AI ที่เครื่องมือหลายตัวทำให้เกิด และสร้างเสียงพูดที่ยังฟังดูเหมือนคนจริง

นั่นเป็นเหตุผลที่ในทางปฏิบัติ มันจัดการการบันทึกที่ยากโดยไม่มีอาร์ติแฟกต์โลหะหรือหุ่นยนต์ที่ผู้ใช้เชื่อมโยงกับการปรับปรุง AI ไม่ใช่เพราะมันทำความสะอาดแรงกว่า แต่เพราะมันรู้ว่าเมื่อไหร่ไม่ควรทำ

หากคุณต้องการฟังความแตกต่างด้วยตัวเอง ดู ตัวอย่างเสียง ในหน้าหลักของเรา คุณสามารถเปรียบเทียบการบันทึกที่มีเสียงรบกวนหนักและเอคโค่ก่อนและหลังการปรับปรุง และคุณจะสังเกตเห็นว่าเวอร์ชันที่ปรับปรุงแล้วรักษาลักษณะเสียงธรรมชาติโดยไม่มีคุณภาพโลหะหรือหุ่นยนต์นั้น

สรุป

การปรับปรุงเสียงที่เป็นโลหะหรือหุ่นยนต์เกิดขึ้นเมื่อเครื่องมือให้ความสำคัญกับการทำความสะอาดที่ก้าวร้าวมากกว่าความเป็นธรรมชาติ การแก้ไขไม่ใช่การเพิ่มการประมวลผลมากขึ้น มันคือการใช้เครื่องมือที่เข้าใจความแตกต่างระหว่างการทำความสะอาดเสียงและการรักษาสิ่งที่ทำให้เสียงพูดมนุษย์ฟังดูเป็นมนุษย์

เมื่อ enhancer รู้ว่าเมื่อไหร่ควรหยุด คุณจะได้ผลลัพธ์คุณภาพมืออาชีพโดยไม่มีอาร์ติแฟกต์ เมื่อมันไม่ทำ คุณจะได้เสียงที่สะอาดทางเทคนิคแต่ฟังดูเหมือนถูกประมวลผลโดยหุ่นยนต์