Năm 24 tuổi, Nguyễn Hoàng Bảo Đại cùng đồng đội giành giải nhất cuộc thi Zalo AI Challenge trong thử thách nhận diện giọng nói. Hai năm sau, anh tự xây dựng mô hình "AI sáng tác nhạc" của riêng mình.

Cơ duyên đến với trí tuệ nhân tạo

Ban đầu, Bảo Đại mất phương hướng trong việc lựa chọn ngành học đại học. Vì vậy, Đại hỏi cậu bạn thân thi gì và nộp hồ sơ thi chung để sau này "học chung cho vui". Cuối cùng, Đại thi vào ngành Công nghệ Thông tin của Đại học Khoa học Tự nhiên.

"Lúc đó mình nghĩ Công nghệ Thông tin cũng hay, chắc là học về word, excel, Photoshop rồi những thứ trên máy tính chứ không hề có một chút khái niệm nào về ngành này.

Mình cũng càng không thể ngờ quyết định đó lại đưa mình đến với AI như bây giờ".

- Bảo Đại nói.

"Đến năm thứ 3, mình bắt đầu được học về trí tuệ nhân tạo, học máy. Lúc này mình thấy thích thú vô cùng vì nó hoàn toàn mới mẻ, có thể nghiên cứu, sáng tạo nhiều thứ. AI lúc ấy như vị cứu tinh của đời mình."

null Nguyễn Hoàng Bảo Đại tại Lễ trao giải Tech Awards 2019.


Đại mê say nghiên cứu về AI, máy học, dù lúc đó chưa thực sự biết sau này có thể ứng dụng vào việc gì. Song song đó, anh tiếp tục nuôi dưỡng đam mê âm nhạc bằng cách theo học các khóa học chuyên sâu bên ngoài.

Năm 2015 - 2016, khi AI bắt đầu rộ lên, máy học đạt được nhiều thành tựu đáng kinh ngạc, Bảo Đại cũng bắt đầu nghiên cứu về các mô hình AI trên thế giới.

"So với lĩnh vực hình ảnh, AI về âm thanh, đặc biệt là âm nhạc ít được quan tâm hơn. Mình nghĩ AI có thể vẽ tranh thì 'nó' cũng có thể viết nhạc.

Vì vậy, mình bắt đầu ấp ủ dự định về một mô hình AI viết nhạc cho người Việt và theo thị hiếu của người Việt".

Quá trình xây dựng chương trình gặp nhiều khó khăn

Khi nghiên cứu về các mô hình AI trong âm nhạc đang được xây dựng trên thế giới, Bảo Đại đúc kết ba mô hình có thể tạo được nhạc:

Mạng neuron truyền thẳng; vanilla RNN (mạng neuron hồi quy) và Transformer.

Tuy nhiên, nhược điểm của những mô hình này là sáng tác nhạc cổ điển, khác rất nhiều với thị hiếu nghe nhạc của người Việt là những bản nhạc nhẹ, nhạc Pop. 

null Nhược điểm của những mô hình AI trong âm nhạc là sáng tác nhạc cổ điển, khác với thị hiếu nghe nhạc của người Việt.


"Hơn nữa, những mô hình này vẫn còn một số hạn chế, như nhiều quãng nghịch, nghe chói và không bắt tai. Mình nghĩ, nếu cứ chờ, sẽ không biết đến bao giờ mới có một mô hình AI viết nhạc cho người Việt. Nếu muốn nhanh, chỉ có cách tự mình xây dựng một thuật toán cho riêng mình."

- Bảo Đại nói.

Tuy nhiên, việc xây dựng một mô hình AI không đơn giản, hầu hết các sản phẩm AI đều thuộc các công ty công nghệ hoặc viện nghiên cứu.

Ngoài vấn đề về kinh phí, nhân lực, hai thách thức lớn nhất với bất kỳ ai làm về AI là dữ liệu đầu vào để huấn luyện máy học và phải có một hệ thống máy tính lớn để làm các thuật toán.

Mô hình Đại dùng để huấn luyện AI là Encoder - Decoder kết hợp thuật toán Attention và một vài công cụ cho nhạc pop Việt Nam. Để máy đọc được các giai điệu, dữ liệu đầu vào phải là file ở định dạng Midi.

Theo Đại, máy móc nghe nhạc ở định dạng Wav, Mp3... sẽ không thể tự tách hoà âm, phối khí ra để lấy giai điệu nên phải dùng nhạc định dạng Midi.

Khó khăn tiếp theo là âm nhạc định dạng Midi trên Internet rất hiếm. Bảo Đại phải "lang thang" khắp các diễn đàn âm nhạc để thu thập các bản nhạc, nhưng vẫn không đủ dữ liệu. Cuối cùng anh phải tự nghe đi nghe lại các bài hát và đàn lại để lấy dữ liệu cho máy học.

Đến nay kho dữ liệu của Bảo Đại có khoảng 30.000 bài hát, trong đó 60% là do anh tự đàn. Trong hai năm ròng rã, anh đã đàn gần 18.000 bài hát.
Thành công đến sau nhưng cố gắng

Sau hai năm xây dựng, mô hình AI này đã có thể viết được 10 bài hát trong vòng một giây. AI sáng tác nhạc của Đại hoạt động theo mô hình: Nhạc sĩ "mớm" cho máy 3 - 5 nốt nhạc, sau đó, AI sẽ tự hoàn thiện, đưa ra một bài hát hoàn chỉnh. 

Theo Bảo Đại, điều đặc biệt của mô hình AI này là người dùng chỉ cần chọn một giai điệu ngắn muốn viết, sau đó bấm nút. Máy sẽ cho ra các lựa chọn khác nhau, bạn sẽ chỉ cần nghe và chọn giai điệu mình thích.

Trong từng giai điệu cũng có thể tiếp tục điều chỉnh theo ý mình và yêu cầu AI viết tiếp đến khi ưng ý.

null Mô hình AI của Bảo Đại là dự án cá nhân, toàn bộ chi phí đều do anh tự trang trải.


Thuật toán ngẫu nhiên trong AI cho phép tạo ra các bản nhạc không trùng nhau. Vì vậy, nỗi lo về bản quyền cũng có thể được kiểm soát bằng chính AI.

Mô hình AI này cũng không tuân theo một phong cách nhất định, vì vậy, "nó" luôn đưa ra những lựa chọn mới, không đơn điệu, một màu. Thậm chí khi nhạc sĩ không có ý tưởng nào, không đưa ra bất kỳ gợi ý nào, AI cũng có thể tự sáng tác nhạc theo ý muốn của "nó".

"Cha đẻ" của mô hình "AI viết nhạc" tin rằng bản chất của AI vẫn là giúp con người giải quyết những công việc tiêu hao nhiều thời gian, công sức. Con người vẫn phải chịu trách nhiệm cuối cùng về sản phẩm mình làm ra.

Theo VNExpress