BabyT: Phần mềm AI dịch tiếng khóc của trẻ sơ sinh

Hành trình cho ra đời chiếc máy phiên dịch BabyT (Baby Translator)

Trả lời phỏng vấn Interesting Engineering tại Triển lãm di động toàn cầu (MWC), CEO Roberto Iannone cho rằng trẻ em khóc mỗi khi chúng có nhu cầu nào đó, và thiết bị của Zoundream sẽ giúp phụ huynh thấu hiểu con mình tốt hơn.

Tiếng khóc của trẻ sơ sinh ẩn chứa thông điệp riêng, nhưng người lớn không phải lúc nào cũng hiểu. Tiếng khóc của trẻ sơ sinh ẩn chứa thông điệp riêng, nhưng người lớn không phải lúc nào cũng hiểu.

Phần mềm học máy (machine learning) của Zoundream đã phân tích những đoạn ghi âm tiếng khóc trẻ sơ sinh kéo dài hàng nghìn giờ.

Sau đó phân loại tiếng khóc thành 4 nhóm biểu thị cho 4 nhu cầu khác nhau: khi trẻ bị đau, đói bụng, đầy hơi hay chỉ đơn giản là muốn được ôm ấp, dỗ dành.

CEO Roberto Iannone - đồng sáng lập công ty cùng với nhà khoa học dữ liệu Ana Laguna khi ông phát hiện Laguna đang thu thập và nghiên cứu dữ liệu tiếng khóc em bé.

Kể lại quá trình tạo ra phần mềm, ban đầu Iannone và Laguna mua máy ghi âm giá rẻ phát cho một số phụ huynh, thậm chí phải trả tiền cho họ, để ghi âm tiếng khóc của trẻ nhỏ.

Chiếc máy phiên dịch BabyT (viết tắt của Baby Translator). Chiếc máy phiên dịch BabyT (viết tắt của Baby Translator).

Đây là một quá trình tốn nhiều thời gian. Sau đó, họ phát triển cỗ máy lọc tất cả âm thanh không phải tiếng khóc của trẻ. Khi đã xây dựng được cơ sở dữ liệu, họ bắt đầu tạo phần mềm.

Bước tiếp theo của công ty là hợp tác với các tổ chức và nhãn hàng ở châu Âu và châu Á để đưa phần mềm ra thị trường.

Thông qua công nghệ AMSI để xác định chính xác nguyên nhân khiến trẻ khóc

Zoundream đã dành ra vài tháng đưa ra giải pháp tốt nhất để xác định và chuyển âm thanh do con người tạo ra thành ý nghĩa thực tế của nó, đặc biệt là đối với trẻ em trước khi biết nói.

Có một số cách tiếp cận trong tài liệu về học máy để giải quyết thách thức này, nhưng tiếc là không có cách nào trong số chúng thực sự phù hợp để hoạt động trên một luồng âm thanh đến liên tục.

null

Vì vậy, Zoundream đã tự tạo ra giải pháp dựa trên học sâu tùy chỉnh của mình. AMSI, là từ viết tắt của Acoustic MultiStage Interpreter, xử lý âm thanh thành một loạt các mô hình học sâu bên trong để rút ra ý nghĩa của tiếng khóc trẻ sơ sinh.

Nghĩ về việc hiểu các chữ cái, sau đó là các từ, sau đó là các câu có nghĩa.

Đó chính xác là những gì AMSI làm. AMSI có thể thích ứng với nhiều vấn đề khác nhau và chúng tôi sẽ sớm có thể xác định các bệnh lý và hành vi không bình thường của em bé.

Zoundream cho rằng em bé có “ngôn ngữ riêng”

Zoundream cho biết trẻ em giao tiếp bằng ngữ điệu thay vì lời nói như người lớn, điều này đã có từ khi chúng ở trong bụng mẹ.

Theo ông, đó là "ngôn ngữ riêng" của em bé, cũng là trọng tâm trong nghiên cứu của Zoundream.

"Trong 3 năm qua, chúng tôi đã tặng thiết bị miễn phí mang tên BabyT chuyên phát hiện và dịch tiếng khóc cho bất cứ ai có nhu cầu. Họ có thể giữ bao lâu tùy thích và chúng tôi giữ dữ liệu cho mục đích nghiên cứu", Iannone cho biết.

Những phụ huynh tham gia thử nghiệm rất thích chiếc máy phiên dịch do Zoundream cung cấp, nhưng không vì thế mà vai trò của cha mẹ trong việc thấu hiểu con trẻ lại trở nên kém quan trọng.

CEO Zoundream khẳng định rằng hầu hết phụ huynh vẫn hiểu con mình cần gì qua những tiếng khóc, do đó chiếc máy chỉ là công cụ hỗ trợ giúp họ cảm thấy yên tâm hơn trong những tháng đầu tiên sau khi con chào đời.

Theo Cafebiz