AI của YouTube đã có thể mô tả hiệu ứng âm thanh

     YouTube từ lâu đã có một hệ thống phụ đề tự động, nhờ vào những tiến bộ trong công nghệ tính năng này hoạt động ngày càng tốt. Dù vây Google vẫn không ngừng cố gắng hoàn thiện nó, theo công bố từ Google hôm 23/03, việc phụ đề có thể cải thiện thêm bằng cách chú thích một số âm thanh.

YouTube đã có phụ đề tự động cho các video của video từ năm 2009, và hiện giờ nó đang mở rộng tính năng để có thể phụ đề cho các hiệu ứng âm thanh. Dịch vụ video sử dụng máy học để phát hiện các hiệu ứng âm thanh trong video và thêm phụ đề [APPLAUSE], [MUSIC] và [LAUGHTER] tới hàng triệu video.

Mặc dù ba trong số đó là những âm thanh chú thích theo cách thủ công thường xuyên nhất, YouTube cho biết tính năng này chỉ nằm trong những cấp độ ban đầu để tạo ra những cải tiến cho người khiếm thính và những khách hàng gạp khó khăn trong việc lắng nghe. Công ty cho biết phụ đề như tiếng chuông, sủa và gõ được sắp xếp theo thứ tự, nhưng một số người còn đòi hỏi phải giải mã nhiều hơn ngoài những tiếng cười đơn giản hoặc âm nhạc.

Trong phần phụ trợ, hệ thống phụ đề âm thanh của YouTube dựa trên mô hình Deep Neural Network, một nhóm đã đào tạo về một tập hợp các dữ liệu có nhãn thấp. Bất cứ khi nào video mới được tải lên YouTube, hệ thống mới sẽ chạy và cố gắng xác định những âm thanh này.

Quỳnh Vương – Saostyle.vn