SEAS
Quay về chương trình

SEAS 2025

XỬ LÝ NGÔN NGỮ MIỀN TRUNG

Bối cảnh

  • Tiếng nói miền Trung có nhiều đặc điểm riêng về phát âm, ngữ điệu và cách biểu đạt
  • Trong khi đó, các hệ thống nhận diện giọng nói hiện nay thường được tối ưu cho tiếng Việt phổ thông
  • Vì vậy, việc xây dựng một mô hình có thể nhận diện và chuẩn hóa ngôn ngữ miền Trung là rất cần thiết
  • Giọng nói miền Trung có sự khác biệt rõ rệt giữa các địa phương, độ tuổi và giới tính
  • Điều này gây khó khăn cho các hệ thống nhận diện giọng nói thông thường
  • Cần một mô hình có khả năng nhận diện chính xác giọng nói miền Trung và chuyển đổi thành văn bản dễ hiểu hơn

Giải pháp

  • Xây dựng hệ thống xử lý ngôn ngữ nói dành riêng cho miền Trung
  • Sử dụng mô hình PhoWhisper để nhận diện giọng nói và chuyển âm thanh thành văn bản
  • Huấn luyện mô hình trên dữ liệu giọng nói đa dạng nhằm tăng khả năng nhận diện các biến thể vùng miền
  • Thu thập dữ liệu giọng nói từ nhiều nguồn, bao gồm nhiều độ tuổi và giới tính khác nhau
  • Tiền xử lý và chuẩn hóa dữ liệu âm thanh trước khi huấn luyện
  • Mô hình được tinh chỉnh để nhận diện các cách phát âm đặc trưng của miền Trung và hiển thị kết quả dưới dạng văn bản

Mục tiêu

  • Nhận diện chính xác giọng nói miền Trung hơn so với các hệ thống thông thường
  • Chuẩn hóa ngôn ngữ nói thành văn bản dễ đọc và dễ hiểu
  • Mở rộng khả năng hỗ trợ cho nhiều tỉnh thành và nhiều phong cách diễn đạt khác nhau

Ứng dụng

  • Góp phần bảo tồn và số hóa ngôn ngữ vùng miền tại Việt Nam
  • Có thể ứng dụng trong trợ lý ảo, nhập liệu bằng giọng nói và các hệ thống chuyển giọng nói thành văn bản
  • Hỗ trợ người dùng miền Trung tiếp cận công nghệ ngôn ngữ tự nhiên thuận tiện hơn
  • Tạo nền tảng để phát triển các hệ thống AI ngôn ngữ toàn diện và gần gũi hơn với người Việt

Thành viên

Giảng viên hướng dẫn: Luân, Hoàng, Hoàng K. Nguyễn

Thành viên nhóm: Nguyễn Minh Anh, Nguyễn Thị Nguyệt Tâm, Trần Đình Quân, Phan Thanh Đạt, Lê Quang Huy, Trần Việt Hưng