Back to Blog

Tại sao tăng cường âm thanh AI nghe có vẻ kim loại (Và cách sửa)

Tại sao tăng cường âm thanh AI nghe có vẻ kim loại (Và cách sửa)
Ana Clara
Ana Clara

Một khiếu nại phổ biến từ người làm podcast, người sáng tạo video và người phỏng vấn là âm thanh được tăng cường AI đôi khi nghe có vẻ kim loại, nhân tạo, robot hoặc được xử lý quá mức. Điều này không tinh tế. Trong nhiều trường hợp, phiên bản được tăng cường nghe tệ hơn bản gốc.

Tôi đã nghe phản hồi này vô số lần từ những người sáng tạo đã thử công cụ tăng cường âm thanh AI, chỉ để kết thúc với âm thanh nghe như thể nó đã được xử lý qua một robot. Bài viết này giải thích điều gì thực sự đang xảy ra sai dưới lớp vỏ, tại sao điều này xảy ra nhiều hơn với một số công cụ so với những công cụ khác, và giải pháp đáng tin cậy nhất ngày nay là gì.

Nguyên nhân thực sự: ức chế quá mức và tái tạo bắt buộc

Âm thanh kim loại hoặc robot mà hầu hết mọi người phàn nàn không phải ngẫu nhiên. Nó hầu như luôn đến từ cùng một sự đánh đổi kỹ thuật.

Hầu hết các công cụ tăng cường AI làm hai việc cùng một lúc. Chúng tích cực ức chế tiếng ồn và phản xạ, và sau đó tái tạo giọng nói nơi thông tin đã được loại bỏ. Khi ức chế đi quá xa, mô hình loại bỏ không chỉ tiếng ồn, mà còn chi tiết vi mô trong giọng nói, hài hòa tự nhiên, và tín hiệu phòng tinh tế làm cho giọng nói nghe như con người.

Để bù đắp, mô hình sau đó xây dựng lại các phần của tín hiệu mà nó tin là thiếu. Sự tái tạo đó là nơi kết cấu kim loại hoặc tổng hợp xuất hiện. Tôi đã xử lý các bản ghi nơi AI loại bỏ quá nhiều đến mức nó phải đoán giọng nói nên nghe như thế nào, và những đoán đó thường nghe nhân tạo.

Tại sao điều này xảy ra nhiều hơn với một số công cụ AI so với những công cụ khác

Sau khi thử nghiệm các công cụ tăng cường AI khác nhau, tôi đã nhận thấy các mẫu rõ ràng trong những công cụ nào tạo ra các hiện tượng không mong muốn kim loại hoặc robot và những công cụ nào không.

Xử lý một kích cỡ phù hợp với tất cả

Nhiều công cụ tăng cường, đặc biệt là miễn phí hoặc freemium, áp dụng một hồ sơ tích cực duy nhất cho tất cả âm thanh. Hồ sơ đó được thiết kế để gây ấn tượng trên các bản ghi kém, loại bỏ càng nhiều tiếng ồn càng tốt, và tạo ra một so sánh rõ ràng trước và sau.

Vấn đề là không phải tất cả các bản ghi đều cần làm sạch tích cực. Giọng nói khác nhau rất nhiều về tông màu, và phòng và micro hoạt động khác nhau. Không có sự thích ứng, mô hình vượt quá, và các hiện tượng không mong muốn xuất hiện.

Tôi đã thấy cùng một công cụ tạo ra kết quả hoàn hảo trên một bản ghi và các hiện tượng không mong muốn kim loại trên bản ghi khác, đơn giản vì nó sử dụng cùng các cài đặt tích cực cho cả hai.

Không có kiểm soát về độ mạnh xử lý

Nếu công cụ không cho phép bạn giảm cường độ, bạn bị mắc kẹt với bất cứ điều gì mô hình quyết định là tốt nhất. Đây là lý do tại sao người dùng thường báo cáo các gói miễn phí nghe khắc nghiệt hơn các gói trả phí, với các hiện tượng không mong muốn kim loại hoặc robot xuất hiện thường xuyên hơn trong phiên bản miễn phí.

Bạn đang nghe sửa chữa quá mức mà không có lối thoát. Tôi đã xử lý các bản ghi qua các công cụ miễn phí nghe ổn nhưng có chất lượng robot tinh tế đó, và không có gì tôi có thể làm để sửa nó mà không nâng cấp.

Lối tắt tạo sinh thay vì khôi phục bảo thủ

Một số công cụ tăng cường dựa quá nhiều vào tái tạo tạo sinh thay vì giảm tiếng ồn bảo thủ. Điều này hoạt động tốt cho âm thanh cực kỳ kém và các biến đổi kiểu demo, nhưng đối với giọng nói thực, nó làm tăng nguy cơ tông màu tổng hợp, kết cấu robot, và mất danh tính người nói.

Mô hình bắt đầu phát minh giọng nói thay vì tiết lộ nó. Tôi đã xử lý các bản ghi nơi tăng cường AI làm cho người nói nghe như một người hoàn toàn khác, với giọng nói kỹ thuật sạch nhưng hoàn toàn không tự nhiên.

Tại sao sửa nó trong hậu sản xuất hiếm khi hoạt động

Một khi các hiện tượng không mong muốn kim loại hoặc robot được đưa vào, EQ không thể loại bỏ chúng hoàn toàn. De-essing chỉ che giấu các triệu chứng, và giảm tiếng ồn thêm thường làm cho nó tệ hơn. Đó là vì vấn đề được nướng vào tín hiệu.

Ở thời điểm đó, sửa chữa thực sự không phải là một plugin khác. Đó là không tạo ra các hiện tượng không mong muốn ngay từ đầu. Tôi đã cố gắng sửa âm thanh được xử lý quá mức với phần mềm chỉnh sửa thủ công, và trong khi bạn có thể cải thiện nó một chút, bạn không bao giờ có thể hoàn toàn khôi phục đặc tính tự nhiên đã bị mất. Vấn đề là một khi các hiện tượng không mong muốn được nướng vào, ngay cả các công cụ chỉnh sửa chuyên nghiệp cũng gặp khó khăn trong việc loại bỏ chúng hoàn toàn.

Giải pháp đáng tin cậy duy nhất: sử dụng công cụ tăng cường ưu tiên tự nhiên

Trong thực tế, những người sáng tạo ngừng thấy các hiện tượng không mong muốn kim loại hoặc robot chuyển sang các công cụ tăng cường bảo thủ theo mặc định, thích ứng xử lý với đầu vào, bảo tồn hài hòa giọng hát, tránh điền tạo sinh tích cực, và nhắm đến giọng nói tự nhiên thay vì làm sạch tối đa.

Đây là lý do tại sao một số công cụ liên tục tạo ra kết quả sạch ngay cả trong tiếng vang nặng, phòng ồn ào, phỏng vấn từ xa, và âm thanh video, trong khi những công cụ khác thất bại chính xác trên những trường hợp đó. Sự khác biệt không phải ở mức độ chúng làm sạch, mà ở cách chúng cân bằng làm sạch với bảo tồn. Để có so sánh chi tiết về công cụ tăng cường âm thanh ưu tiên tự nhiên, hãy xem hướng dẫn của chúng tôi về các công cụ tốt nhất có sẵn ngày nay.

Nơi AudioEnhancer.com phù hợp

AudioEnhancer.com được xây dựng xung quanh một ràng buộc cốt lõi: không bao giờ sửa âm thanh bằng cách phá hủy giọng nói. Thay vì đẩy ức chế đến giới hạn, nó tập trung vào việc bảo tồn kết cấu giọng hát, giảm tiếng vang và tiếng ồn mà không làm phẳng hài hòa, tránh độ bóng AI mà nhiều công cụ đưa vào, và tạo ra giọng nói vẫn nghe như một người thực.

Đó là lý do tại sao, trong thực tế, nó xử lý các bản ghi khó mà không có các hiện tượng không mong muốn kim loại hoặc robot mà người dùng liên kết với tăng cường AI. Không phải vì nó làm sạch mạnh hơn, mà vì nó biết khi nào không làm.

Nếu bạn muốn nghe sự khác biệt cho chính mình, hãy xem mẫu âm thanh trên trang chủ của chúng tôi. Bạn có thể so sánh các bản ghi với tiếng ồn và tiếng vang nặng trước và sau tăng cường, và bạn sẽ nhận thấy rằng các phiên bản được tăng cường duy trì đặc điểm giọng nói tự nhiên mà không có chất lượng kim loại hoặc robot đó.

Điểm rút ra cuối cùng

Tăng cường âm thanh nghe có vẻ kim loại hoặc robot xảy ra khi các công cụ ưu tiên làm sạch tích cực hơn tự nhiên. Sửa chữa không phải là thêm xử lý. Đó là sử dụng các công cụ hiểu sự khác biệt giữa làm sạch âm thanh và bảo tồn những gì làm cho giọng nói của con người nghe như con người.

Khi một công cụ tăng cường biết khi nào dừng lại, bạn nhận được kết quả chất lượng chuyên nghiệp mà không có các hiện tượng không mong muốn. Khi nó không biết, bạn nhận được âm thanh kỹ thuật sạch nhưng nghe như thể nó đã được xử lý bởi một robot.