Hai nghiên cứu hử chứng minh máy moi có thể hiểu những gì con người nói mà chẳng cần nhai giọng nói cụm từ gia tộc.

Máy móc hiểu con người mà không cần nhai giọng nói

Trí tuệ nhân tạo hơn hẳn con người trong suốt dấn thể tiếng nói từ tín hiệu muôi. Ảnh: MIT Technology Review.

Hiểu từ của từ cạch ra hiệu muôi là đơn bài toán khó, phụ chọc hếtnh ngộ và khả hay am hiểu hiểu tiếng nói chuẩn y tín hiệu thị giác. Tuy nhiên, cạc nhà nghiên cứu hử chứng minh rằng máy moi có thể dấn thể tiếng nói từ đơn khúc video câm đặt hơn hết những người hiểu cạch ra hiệu muôi chuyên nghiệp.

Nhóm nghiên cứu chọc ngành Khoa gia tộcc máy tính cụm từ đại gia tộcc Oxford hử phát triển hệ thống trí óc nhân tạo đem thằng LipNet. Hệ thống đặt xây dựng trên cơ sở dữ liệu GRID, tạo thành ra từ đơn xê ri clip trực tiếp bay những người còn đọc cạc mẫu ta cú đơn giản.

Nhóm hử sử dụng dữ liệu nào đặt phát triển đơn hệ thống nơ-ron công nghệ dấn mặt tiếng nói. Dù hệ thống dấn mặt lệch lạc từ của giàu dò, quá trình gia tộcc đặt liên kết am hiểu báo tới giảng giải những gì còn đặt nói hử diễn ra, vì nhẽ tín hiệu muôi liền ít hơn mạng âm thanh mà chúng biểu hiện.

Từ đây, máy moi bắt đầu coi xét ắt khúc video, phát triển khả hay hiểu khúc văn từ cạc cú đặt phân tách.

Khi thử nghiệm, hệ thống có thể dấn mặt chính thi hài tới 93,4%. Trong khi đấy, những từ nguyện hòn đặt đề nghị đọc tín hiệu muôi trong suốt bài tập nào đoán đúng chỉ 52,3% mạng từ.

Bên mép đấy, theo tờ New Scientist, đơn nhen khác chọc ngành Khoa gia tộcc kĩ kể cụm từ đại gia tộcc Oxford, công việc cùng Google DeepMind, hử nghiên cứu vấn đề cùng đơn bài tập khó hơn bay tiếng nói. Thay vì sử dụng cơ sở dữ liệu đơn giản và nhất quán như GRID, nhen nào sử dụng tới 100.000 video ở gấp chừng từ của rộng và phát âm phức tạp từ đài hoa BBC.

Với phương pháp tương từ, nhen từ Oxford và DeepMind hử xây dựng đơn bộ máy cùng khả hay dấn mặt đúng 46,8% ắt từ của. Kết trái nào cho chộ chúng hoạt chừngng đặt hơn hết con người cùng chỉ 12,4% từ đúng.

Gác lại những dị biệt, hết hai thể nghiệm chứng tỏ trí óc nhân tạo hơn hẳn con người trong suốt dấn thể tiếng nói từ tín hiệu muôi, và chẳng lâu nữa, chúng ta rồi sẽ chứng kiến những vận dụng chật tần hay cho lĩnh vực nào.

Trong mai sau, biết đâu Skype cũng sẽ vận dụng chúng kì cọ cạch ghi lại lãi thoại, khi người đòi còn ở đơn nơi ầm ĩ, hay người nhai gặp khó khăn đặt giữ smartphone và lắng nhai trọn vẹn vẹn đầu dãy đằng kia?

Theo Zing/New Scientist

ĐỂ LẠI BÌNH LUẬN