Bộ giải pháp xử lý âm thanh Voices - Made by CMC

Sau nhiều nỗ lực nghiên cứu và phát triển, Viện Nghiên cứu Ứng dụng CMC (CIST) ra mắt bộ giải pháp xử lý âm thanh Voices. Bộ giải pháp có tính năng nhận dạng giọng nói và tổng hợp tiếng nói, có hiệu năng cao, tự động hóa nhanh chóng, mang lại sự tùy biến và tích hợp dễ dàng cho doanh nghiệp trong quá trình chuyển đổi số.

Voices còn dễ dàng ghi lại nội dung cuộc trò chuyện hay buổi họp mặt một cách chính xác, giúp tăng tốc độ sản xuất nội dung, từ đó giúp tiết kiệm chi phí nhân sự, vận hành, nâng cao năng suất hoạt động của doanh nghiệp.

Tiếng Việt được coi là một ngôn ngữ khó học với người nước ngoài bởi ngữ pháp, thanh điệu và đặc trưng vùng miền. Máy tính cũng giống như người nước ngoài - để nó nghe hiểu và diễn giải được giọng nói tiếng Việt thành dạng văn bản không phải là việc dễ dàng. Vì vậy, giải pháp ra đời khẳng định năng lực công nghệ và nỗ lực của các kỹ sư CMC.

Giải pháp Voices của CMC có 2 tính năng nổi bật

Tính năng Text to Speech - Chuyển đổi văn bản thành giọng nói tương thích với mọi hệ thống của khách hàng, cho phép chuyển đổi từ văn bản qua giọng nói tự nhiên, đa dạng vùng miền. Hơn thế nữa, tính năng còn có thể dễ dàng tùy chỉnh tốc độ, ngắt nghỉ và nhấn nhá theo yêu cầu. Vì vậy, Text to Speech được ứng dụng mạnh mẽ vào sách nói, call center, thuyết minh phim, tạo clip, trợ lí ảo,...

 

Tính năng chuyển đổi âm thanh qua văn bản - Speech to Text có độ chính xác cao về ngữ pháp, chính tả; phân biệt được giọng nói vùng miền lên đến 96%; thời gian xử lý nhanh (10 giây audio chỉ trong 300 mili giây, trên CPU); có khả năng đáp ứng với tiếng ồn và môi trường khác nhau. Tính năng được triển khai nhanh chóng, mạnh mẽ trong lĩnh vực y tế, smart-home, thiết bị IoT, loa thông minh, ghi chú phòng họp.

Các đối tượng có nhu cầu sử dụng Bộ giải pháp xử lý âm thanh Voices của CMC là các khách hàng tổ chức có sử dụng hệ thống smarthome, loa thông minh, thiết bị IoT, ghi chú phòng họp; các doanh nghiệp bất động sản, tài chính, bán lẻ, y tế,... có sử dụng hệ thống chăm sóc khách hàng bằng giọng nói hay cũng có thể là các khách hàng sử dụng sách nói, trợ lý ảo, tạo clip, làm thuyết minh phim, ....

Đại diện khách hàng sử dụng giải pháp thử nghiệm cho biết, khi được ứng dụng vào thực tế, giải pháp đã giúp ích rất nhiều. Giờ đây tại các cuộc họp, các hội nghị lớn nhỏ, chúng ta không cần phải ghi chép biên bản họp. Thông tin được chuyển đổi tức thì thành văn bản trong lúc đại biểu đang phát biểu.

Giải pháp còn là công cụ hỗ trợ đắc lực cho những nhà làm nội dụng video, giúp họ có thể tạo phụ đề tiếng Việt một cách dễ dàng. Voices còn có thể rút ngắn 10 lần thời gian ban hành thông tin (với đoạn băng dài 60 phút, phần mềm chỉ cần 6 phút để hoàn thành việc chuyển đổi), chuyển đổi các định dạng file âm thanh nhanh chóng với độ chính xác lên tới 98%, giúp tiết kiệm thời gian đánh máy, ban hành thông tin, giảm rủi ro sai lệch thông tin.