Quay về chương trình
SEAS 2025
XỬ LÝ NGÔN NGỮ MIỀN TRUNG
Bối cảnh
- Tiếng nói miền Trung có nhiều đặc điểm riêng về phát âm, ngữ điệu và cách biểu đạt
- Trong khi đó, các hệ thống nhận diện giọng nói hiện nay thường được tối ưu cho tiếng Việt phổ thông
- Vì vậy, việc xây dựng một mô hình có thể nhận diện và chuẩn hóa ngôn ngữ miền Trung là rất cần thiết
- Giọng nói miền Trung có sự khác biệt rõ rệt giữa các địa phương, độ tuổi và giới tính
- Điều này gây khó khăn cho các hệ thống nhận diện giọng nói thông thường
- Cần một mô hình có khả năng nhận diện chính xác giọng nói miền Trung và chuyển đổi thành văn bản dễ hiểu hơn
Giải pháp
- Xây dựng hệ thống xử lý ngôn ngữ nói dành riêng cho miền Trung
- Sử dụng mô hình PhoWhisper để nhận diện giọng nói và chuyển âm thanh thành văn bản
- Huấn luyện mô hình trên dữ liệu giọng nói đa dạng nhằm tăng khả năng nhận diện các biến thể vùng miền
- Thu thập dữ liệu giọng nói từ nhiều nguồn, bao gồm nhiều độ tuổi và giới tính khác nhau
- Tiền xử lý và chuẩn hóa dữ liệu âm thanh trước khi huấn luyện
- Mô hình được tinh chỉnh để nhận diện các cách phát âm đặc trưng của miền Trung và hiển thị kết quả dưới dạng văn bản
Mục tiêu
- Nhận diện chính xác giọng nói miền Trung hơn so với các hệ thống thông thường
- Chuẩn hóa ngôn ngữ nói thành văn bản dễ đọc và dễ hiểu
- Mở rộng khả năng hỗ trợ cho nhiều tỉnh thành và nhiều phong cách diễn đạt khác nhau
Ứng dụng
- Góp phần bảo tồn và số hóa ngôn ngữ vùng miền tại Việt Nam
- Có thể ứng dụng trong trợ lý ảo, nhập liệu bằng giọng nói và các hệ thống chuyển giọng nói thành văn bản
- Hỗ trợ người dùng miền Trung tiếp cận công nghệ ngôn ngữ tự nhiên thuận tiện hơn
- Tạo nền tảng để phát triển các hệ thống AI ngôn ngữ toàn diện và gần gũi hơn với người Việt
Thành viên
Giảng viên hướng dẫn: Luân, Hoàng, Hoàng K. Nguyễn
Thành viên nhóm: Nguyễn Minh Anh, Nguyễn Thị Nguyệt Tâm, Trần Đình Quân, Phan Thanh Đạt, Lê Quang Huy, Trần Việt Hưng
