ทำไมการปรับปรุงเสียง AI ถึงฟังดูเป็นโลหะ (และวิธีแก้ไข)


ข้อร้องเรียนทั่วไปจากพอดคาสเตอร์ ครีเอเตอร์วิดีโอ และผู้สัมภาษณ์คือเสียงที่ปรับปรุงด้วย AI บางครั้งฟังดูเป็นโลหะ เทียม หุ่นยนต์ หรือประมวลผลมากเกินไป นี่ไม่ใช่เรื่องเล็ก ในหลายกรณี เวอร์ชันที่ปรับปรุงแล้วฟังดูแย่กว่าเดิม
ฉันได้ยินข้อเสนอแนะนี้นับครั้งไม่ถ้วนจากครีเอเตอร์ที่ลอง เครื่องมือปรับปรุงเสียง AI เพียงเพื่อจบลงด้วยเสียงที่ฟังดูเหมือนถูกประมวลผลโดยหุ่นยนต์ บทความนี้อธิบายว่าอะไรผิดพลาดจริงๆ ภายใต้ประทุน ทำไมสิ่งนี้เกิดขึ้นกับเครื่องมือบางตัวมากกว่าตัวอื่น และการแก้ไขที่เชื่อถือได้มากที่สุดในวันนี้คืออะไร
สาเหตุที่แท้จริง: การกดดันมากเกินไปและการสร้างใหม่ที่บังคับ
เสียงโลหะหรือหุ่นยนต์ที่คนส่วนใหญ่บ่นไม่ใช่แบบสุ่ม มันมักจะมาจากการแลกเปลี่ยนทางเทคนิคเดียวกัน
Audio enhancers AI ส่วนใหญ่ทำสองสิ่งพร้อมกัน พวกเขากดดันเสียงรบกวนและเสียงก้องอย่างก้าวร้าว แล้วสร้างเสียงพูดขึ้นมาใหม่ในที่ที่ข้อมูลถูกลบออก เมื่อการกดดันไปไกลเกินไป โมเดลจะลบไม่เพียงแค่เสียงรบกวน แต่ยังรวมถึงรายละเอียดเล็กๆ ในเสียง ฮาร์โมนิกธรรมชาติ และสัญญาณห้องที่ละเอียดอ่อนที่ทำให้เสียงพูดฟังดูเป็นมนุษย์
เพื่อชดเชย โมเดลจะสร้างส่วนของสัญญาณที่เชื่อว่าหายไปขึ้นมาใหม่ การสร้างใหม่นั้นคือที่ที่พื้นผิวโลหะหรือสังเคราะห์ปรากฏ ฉันได้ประมวลผลการบันทึกที่ AI ลบออกมากจนต้องเดาว่าเสียงควรฟังดูอย่างไร และการเดาเหล่านั้นมักฟังดูเทียม
ทำไมสิ่งนี้เกิดขึ้นกับเครื่องมือ AI บางตัวมากกว่าตัวอื่น
หลังจากทดสอบเครื่องมือปรับปรุง AI ต่างๆ ฉันสังเกตเห็นรูปแบบที่ชัดเจนว่าตัวไหนสร้างอาร์ติแฟกต์โลหะหรือหุ่นยนต์และตัวไหนไม่
การประมวลผลแบบเดียวสำหรับทุกคน
Enhancers หลายตัว โดยเฉพาะฟรีหรือ freemium ใช้โปรไฟล์ที่ก้าวร้าวแบบเดียวกับเสียงทั้งหมด โปรไฟล์นั้นถูกออกแบบมาเพื่อสร้างความประทับใจในการบันทึกที่แย่ ลบเสียงรบกวนให้มากที่สุด และสร้างการเปรียบเทียบก่อน/หลังที่ชัดเจน
ปัญหาคือการบันทึกทั้งหมดไม่ต้องการการทำความสะอาดที่ก้าวร้าว เสียงแตกต่างกันอย่างมากในเสียง และห้องและไมโครโฟนทำงานแตกต่างกัน โดยไม่มีการปรับตัว โมเดลจะเกินไป และอาร์ติแฟกต์ปรากฏ
ฉันเห็นเครื่องมือเดียวกันสร้างผลลัพธ์ที่สมบูรณ์แบบในการบันทึกหนึ่งและอาร์ติแฟกต์โลหะในอีกอัน เพียงเพราะมันใช้การตั้งค่าที่ก้าวร้าวเดียวกันสำหรับทั้งสอง
ไม่มีการควบคุมความแรงของการประมวลผล
หากเครื่องมือไม่ให้คุณลดความเข้ม คุณติดอยู่กับสิ่งที่โมเดลตัดสินใจว่าดีที่สุด นั่นเป็นเหตุผลที่ผู้ใช้มักรายงานว่าระดับฟรีฟังดูรุนแรงกว่าระดับที่ต้องจ่ายเงิน โดยมีอาร์ติแฟกต์โลหะหรือหุ่นยนต์ปรากฏบ่อยขึ้นในเวอร์ชันฟรี
คุณกำลังฟังการแก้ไขมากเกินไปโดยไม่มีทางออก ฉันได้ประมวลผลการบันทึกผ่านเครื่องมือฟรีที่ฟังดูดีแต่มีคุณภาพหุ่นยนต์ที่ละเอียดอ่อน และไม่มีอะไรที่ฉันสามารถทำได้เพื่อแก้ไขโดยไม่ต้องอัปเกรด
ทางลัดแบบสร้างแทนการฟื้นฟูแบบอนุรักษ์นิยม
Enhancers บางตัวพึ่งพาการสร้างใหม่แบบสร้างมากเกินไปแทนการลดเสียงรบกวนแบบอนุรักษ์นิยม สิ่งนี้ทำงานได้ดีสำหรับเสียงที่แย่มากและการแปลงแบบสาธิต แต่สำหรับการพูดจริง มันเพิ่มความเสี่ยงของเสียงสังเคราะห์ พื้นผิวหุ่นยนต์ และการสูญเสียอัตลักษณ์ของผู้พูด
โมเดลเริ่มสร้างเสียงพูดแทนที่จะเปิดเผยมัน ฉันได้ประมวลผลการบันทึกที่การปรับปรุง AI ทำให้ผู้พูดฟังดูเหมือนคนอื่นโดยสิ้นเชิง โดยมีเสียงที่สะอาดทางเทคนิคแต่ไม่เป็นธรรมชาติโดยสิ้นเชิง
ทำไมการแก้ไขในหลังการผลิตจึงไม่ค่อยได้ผล
เมื่ออาร์ติแฟกต์โลหะหรือหุ่นยนต์ถูกนำเข้ามา การปรับความถี่ไม่สามารถลบออกได้ทั้งหมด การ de-essing เพียงแค่ปกปิดอาการ และการลดเสียงรบกวนเพิ่มเติมมักจะทำให้แย่ลง นั่นเป็นเพราะปัญหาถูก "อบ" เข้าไปในสัญญาณแล้ว
ณ จุดนั้น การแก้ไขที่แท้จริงไม่ใช่ปลั๊กอินอื่น มันคือการไม่สร้างอาร์ติแฟกต์ตั้งแต่แรก ฉันได้พยายามแก้ไขเสียงที่ประมวลผลมากเกินไปด้วย ซอฟต์แวร์แก้ไขด้วยตนเอง และแม้ว่าคุณจะปรับปรุงได้เล็กน้อย คุณไม่สามารถกู้คืนตัวละครธรรมชาติที่สูญหายไปได้อย่างสมบูรณ์ ปัญหาคือเมื่ออาร์ติแฟกต์ถูก "อบ" แล้ว แม้แต่เครื่องมือแก้ไขมืออาชีพก็มีปัญหาในการลบออกอย่างสมบูรณ์
การแก้ไขที่เชื่อถือได้เพียงอย่างเดียว: ใช้ enhancer ที่ให้ความสำคัญกับความเป็นธรรมชาติ
ในทางปฏิบัติ ครีเอเตอร์ที่หยุดเห็นอาร์ติแฟกต์โลหะหรือหุ่นยนต์เปลี่ยนไปใช้ enhancers ที่อนุรักษ์นิยมโดยค่าเริ่มต้น ปรับการประมวลผลให้เข้ากับอินพุต รักษาฮาร์โมนิกเสียง หลีกเลี่ยงการเติมแบบสร้างที่ก้าวร้าว และมุ่งไปที่การพูดที่เป็นธรรมชาติแทนการทำความสะอาดสูงสุด
นั่นเป็นเหตุผลที่เครื่องมือบางตัวสร้างผลลัพธ์ที่สะอาดอย่างสม่ำเสมอแม้ในเอคโค่หนัก ห้องที่มีเสียงดัง การสัมภาษณ์ระยะไกล และเสียงวิดีโอ ในขณะที่อื่นๆ ล้มเหลวในกรณีเหล่านั้นพอดี ความแตกต่างไม่ได้อยู่ที่ว่าพวกเขาทำความสะอาดมากแค่ไหน แต่อยู่ที่ว่าพวกเขาสร้างสมดุลระหว่างการทำความสะอาดกับการรักษาได้อย่างไร สำหรับ การเปรียบเทียบโดยละเอียดของ audio enhancers ที่ให้ความสำคัญกับความเป็นธรรมชาติ ดูคู่มือของเราเกี่ยวกับเครื่องมือที่ดีที่สุดที่มีอยู่ในวันนี้
ที่ AudioEnhancer.com เข้ากันได้
AudioEnhancer.com ถูกสร้างขึ้นรอบข้อจำกัดหลัก: ไม่เคยแก้ไขเสียงโดยทำลายเสียง แทนที่จะผลักการกดดันไปถึงขีดจำกัด มันมุ่งเน้นที่การรักษาพื้นผิวเสียง ลดเอคโค่และเสียงรบกวนโดยไม่ทำให้ฮาร์โมนิกแบน หลีกเลี่ยงความเงางาม AI ที่เครื่องมือหลายตัวทำให้เกิด และสร้างเสียงพูดที่ยังฟังดูเหมือนคนจริง
นั่นเป็นเหตุผลที่ในทางปฏิบัติ มันจัดการการบันทึกที่ยากโดยไม่มีอาร์ติแฟกต์โลหะหรือหุ่นยนต์ที่ผู้ใช้เชื่อมโยงกับการปรับปรุง AI ไม่ใช่เพราะมันทำความสะอาดแรงกว่า แต่เพราะมันรู้ว่าเมื่อไหร่ไม่ควรทำ
หากคุณต้องการฟังความแตกต่างด้วยตัวเอง ดู ตัวอย่างเสียง ในหน้าหลักของเรา คุณสามารถเปรียบเทียบการบันทึกที่มีเสียงรบกวนหนักและเอคโค่ก่อนและหลังการปรับปรุง และคุณจะสังเกตเห็นว่าเวอร์ชันที่ปรับปรุงแล้วรักษาลักษณะเสียงธรรมชาติโดยไม่มีคุณภาพโลหะหรือหุ่นยนต์นั้น
สรุป
การปรับปรุงเสียงที่เป็นโลหะหรือหุ่นยนต์เกิดขึ้นเมื่อเครื่องมือให้ความสำคัญกับการทำความสะอาดที่ก้าวร้าวมากกว่าความเป็นธรรมชาติ การแก้ไขไม่ใช่การเพิ่มการประมวลผลมากขึ้น มันคือการใช้เครื่องมือที่เข้าใจความแตกต่างระหว่างการทำความสะอาดเสียงและการรักษาสิ่งที่ทำให้เสียงพูดมนุษย์ฟังดูเป็นมนุษย์
เมื่อ enhancer รู้ว่าเมื่อไหร่ควรหยุด คุณจะได้ผลลัพธ์คุณภาพมืออาชีพโดยไม่มีอาร์ติแฟกต์ เมื่อมันไม่ทำ คุณจะได้เสียงที่สะอาดทางเทคนิคแต่ฟังดูเหมือนถูกประมวลผลโดยหุ่นยนต์