Hiện nay, trên thị trường không thiếu các trợ lý tiếng nói có thể giúp bạn tìm và chơi một bản nhạc yêu thích như Alexa của Amazon, Siri của Apple, Google Assistant của Google… Tuy nhiên, có rất ít các ứng dụng nghe nhạc tích hợp trợ lý ảo nhằm hỗ trợ nhu cầu này của người dùng.

Với Zing MP3, người dùng trên hệ điều hành iOS và Android chỉ cần ra lệnh bằng giọng nói ngay trong ứng dụng để tìm nhạc mà không cần phải thao tác bằng tay.

Zing MP3 sở hữu một kho bài hát Việt Nam và nước ngoài phong phú, vì vậy việc tìm kiếm bài hát yêu thích có thể gây tốn kém thời gian cho người dùng, đặc biệt trong những tình huống khiến đôi tay bận rộn như khi lái xe trên đường.

Vì thế, tính năng ra lệnh bằng giọng nói trên Zing MP3 cho phép bạn tiết kiệm thời gian tìm nhạc chỉ bằng vài thao tác đơn giản.

Dùng trợ lý ảo Zing MP3 như thế nào?

Để sử dụng tính năng điều khiển bằng giọng nói trên Zing MP3, người dùng cần cập nhật phiên bản ứng dụng mới nhất. Đầu tiên, bạn vào màn hình chính của ứng dụng, chọn biểu tượng micro ở thanh tìm kiếm góc phải trên cùng.

Lúc này, trợ lý ảo Zing sẽ cần người dùng cho phép sử dụng một số quyền trên thiết bị. Các thao tác tìm nhạc bằng giọng nói sẽ chỉ được thực hiện khi nhấn vào biểu tượng micro để kích hoạt.

Các bước sử dụng trợ lý ảo Zing MP3 Các bước sử dụng trợ lý ảo Zing MP3.

Tiếp theo, trên màn hình sẽ hiển thị trợ lý ảo và giới thiệu đến người dùng các tiện ích điều khiển bằng giọng nói như: mở và dừng nhạc, chuyển nhạc, hẹn giờ tắt nhạc, tìm kiếm thông tin bài hát và nghệ sĩ, thêm bài hát vào danh sách yêu thích… Người dùng sẽ ra lệnh bằng giọng nói cho trợ lý ảo.

Người dùng cần lưu ý nói chậm, rõ từng từ vào micro để trợ lý ảo có thể nhận diện giọng nói và thực hiện yêu cầu. Cuối cùng, trợ lý ảo sẽ phát playlist theo chủ đề thích hợp với yêu cầu.

Ví dụ, khi muốn nghe ca khúc “Hoa hải đường”, người dùng sẽ nói vào micro “Mở bài hát Hoa hải đường”, ngay sau đó trình phát nhạc sẽ mở bài hát này, đồng thời hiển thị thêm album, mv… của bài hát.

Hay khi muốn thưởng thức các sản phẩm của Erik, người dùng chỉ cần ra lệnh cho trợ lý ảo "Mở nhạc của Erik". Trình phát nhạc sẽ mở danh sách phát các ca khúc của nam ca sĩ này.

Tính năng trợ lý ảo hỗ trợ người dùng tìm nhạc trên Zing MP3 Tính năng trợ lý ảo hỗ trợ người dùng tìm nhạc trên Zing MP3.

Với lợi thế sở hữu hơn 85% bản quyền nhạc Việt, trong đó khoảng 80% là các bản ghi phát hành độc quyền, cùng với vai trò đối tác phân phối nhạc có bản quyền của các hãng thu âm và sản xuất nhạc hàng đầu thế giới, trợ lý ảo Zing hoàn toàn có thể gợi ý nhiều bài hát phù hợp với thể loại, tâm trạng và hoạt động hàng ngày của bạn.

“Mở nhạc buồn, "Mở nhạc vui", "Bật nhạc để đi du lịch", "Bật nhạc để làm việc"..., hay "Nghe nhạc rap", "Bật nhạc EDM", "Phát nhạc Hàn Quốc", "Mở nhạc u Mỹ"..., Zing MP3 sẽ thực hiện bất kỳ yêu cầu nào của bạn.

Video Tăng Phúc & Trương Thảo Nhi (chủ nhân bản hit Chỉ là không cùng nhau) trải nghiệm tìm nhạc bằng trợ lý ảo Zing MP3

Nền tảng công nghệ đằng sau tính năng trợ lý ảo

Zing MP3 sử dụng công nghệ xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) giúp thiết bị thông minh hiểu cách con người giao tiếp và phản hồi.

Trình tự xử lý ngôn ngữ tự nhiên như sau:
1. Người dùng ra lệnh và trợ lý tiếng nói dùng công nghệ nhận dạng giọng nói tự động (Automatic Speech Recognition - ASR) để tiếp nhận thông tin, chuyển dữ liệu giọng nói thành văn bản.
2. Công nghệ phân tích ý định người dùng (Natural Language Understanding - NLU) giúp máy hiểu ý định của bạn. Hệ thống sẽ thực hiện xử lý ý định người dùng dựa trên dữ liệu nhạc, sở thích mỗi người và đưa ra câu trả lời tương ứng.
3. Câu trả lời này sẽ được chuyển đổi thành âm thanh (Text to Speech - TTS) và phát trở lại người dùng.

Nghe thì có vẻ đơn giản, nhưng thực tế, ngôn ngữ con người rất phức tạp để các thiết bị có thể hiểu được. Điểm thách thức nhất là làm thế nào NLP giúp trợ lý tiếng nói hiểu được ý nghĩa đằng sau các cụm từ, bằng cách phân tích cú pháp, ngữ nghĩa, giọng vùng miền, thậm chí tiếng lóng.

Đây là thử thách lớn bởi nó đòi hỏi sự kết hợp giữa khoa học máy tính, trí tuệ nhân tạo và ngôn ngữ học. Dù công nghệ nhận dạng giọng nói đã phát triển nhanh chóng trong những năm qua, nhưng các thiết bị điều khiển bằng giọng nói với độ chính xác cao vẫn có thể hiểu sai các ngữ cảnh.

Điều quan trọng trong bài toán tìm nhạc của Zing MP3 là phải xử lý được các hành vi và thói quen “bất thường” của người dùng như: phát âm sai, nhớ sai tên bài hát, chỉ thuộc một đoạn trong lời, thậm chí phần lời thuộc cũng không chính xác.

Chính vì vậy, ngoài công nghệ nhận dạng giọng nói tự động (ASR), trợ lý tiếng nói của Zing MP3 còn phải giải quyết bài toán nhận biết lời bài hát và dự đoán gần chính xác tên bài hát để trả về kết quả phù hợp yêu cầu người dùng.

Hiện nay trên thế giới, các trợ lý tiếng nói đa số sử dụng tiếng nước ngoài chứ chưa hỗ trợ tiếng Việt.

Điểm sáng của tính năng trợ lý ảo trên Zing MP3 là khả năng nhận diện giọng nói bằng tiếng Việt, thậm chí cả giọng địa phương, và phản hồi bằng tiếng Việt nhờ vào công nghệ chuyển đổi dữ liệu thành âm thanh (TTS).

Ưu thế này giúp việc tìm nhạc bằng giọng nói trên Zing MP3 trở nên gần gũi, tiện lợi đối với người dùng đại chúng tại Việt Nam.

Hướng phát triển trong tương lai của Zing MP3

Việc ứng dụng công nghệ ra lệnh bằng giọng nói, hay trợ lý ảo, đã trở thành bước tiến quan trọng và sáng tạo của Zing MP3, với những nỗ lực mang đến những trải nghiệm tốt nhất cho hàng chục triệu người dùng thường xuyên của mình.

Thời gian gần đây, “ông hoàng” trang nghe nhạc trực tuyến Việt Nam còn liên tục cập nhật các tính năng nổi bật khác như: miễn phí nghe nhạc chất lượng cao 320Kbps, cá nhân hóa playlist theo sở thích người nghe, hát karaoke, tính năng phòng nhạc, tính năng theo dõi trang cá nhân của nghệ sĩ.

Ngoài ra, người dùng Zing MP3 có thể hỏi thêm các thông tin khác như thời tiết, giá vàng… trực tiếp trên ứng dụng.

Đồng thời, bạn đã có thể kết nối ứng dụng này trên xe hơi và thực hiện các tác vụ như bật tắt nhạc, tăng giảm âm lượng, tìm nhạc, tìm đường đi… hoàn toàn bằng giọng nói. Khi đang lái xe, chỉ cần nhấn nút "tiếp theo" (next) hai lần là trợ lý ảo đã được kích hoạt, giúp thao tác nhanh chóng và đảm bảo an toàn cho người lái.

Theo VTV