SEAS 2025

XỬ LÝ NGÔN NGỮ MIỀN TRUNG

Bối cảnh

Tiếng nói miền Trung có nhiều đặc điểm riêng về phát âm, ngữ điệu và cách biểu đạt
Trong khi đó, các hệ thống nhận diện giọng nói hiện nay thường được tối ưu cho tiếng Việt phổ thông
Vì vậy, việc xây dựng một mô hình có thể nhận diện và chuẩn hóa ngôn ngữ miền Trung là rất cần thiết
Giọng nói miền Trung có sự khác biệt rõ rệt giữa các địa phương, độ tuổi và giới tính
Điều này gây khó khăn cho các hệ thống nhận diện giọng nói thông thường
Cần một mô hình có khả năng nhận diện chính xác giọng nói miền Trung và chuyển đổi thành văn bản dễ hiểu hơn

Giải pháp

Xây dựng hệ thống xử lý ngôn ngữ nói dành riêng cho miền Trung
Sử dụng mô hình PhoWhisper để nhận diện giọng nói và chuyển âm thanh thành văn bản
Huấn luyện mô hình trên dữ liệu giọng nói đa dạng nhằm tăng khả năng nhận diện các biến thể vùng miền
Thu thập dữ liệu giọng nói từ nhiều nguồn, bao gồm nhiều độ tuổi và giới tính khác nhau
Tiền xử lý và chuẩn hóa dữ liệu âm thanh trước khi huấn luyện
Mô hình được tinh chỉnh để nhận diện các cách phát âm đặc trưng của miền Trung và hiển thị kết quả dưới dạng văn bản

Mục tiêu

Nhận diện chính xác giọng nói miền Trung hơn so với các hệ thống thông thường
Chuẩn hóa ngôn ngữ nói thành văn bản dễ đọc và dễ hiểu
Mở rộng khả năng hỗ trợ cho nhiều tỉnh thành và nhiều phong cách diễn đạt khác nhau

Ứng dụng

Góp phần bảo tồn và số hóa ngôn ngữ vùng miền tại Việt Nam
Có thể ứng dụng trong trợ lý ảo, nhập liệu bằng giọng nói và các hệ thống chuyển giọng nói thành văn bản
Hỗ trợ người dùng miền Trung tiếp cận công nghệ ngôn ngữ tự nhiên thuận tiện hơn
Tạo nền tảng để phát triển các hệ thống AI ngôn ngữ toàn diện và gần gũi hơn với người Việt

Thành viên

Giảng viên hướng dẫn: Luân, Hoàng, Hoàng K. Nguyễn

Thành viên nhóm: Nguyễn Minh Anh, Nguyễn Thị Nguyệt Tâm, Trần Đình Quân, Phan Thanh Đạt, Lê Quang Huy, Trần Việt Hưng