Nhiều người trong chúng ta nghe cuộc gọi này (bằng tiếng Anh), họ sẽ không nhận thấy điều gì lạ: đó là một người đặt lịch hẹn tại tiệm làm tóc. Vấn đề là có cái gì đó kỳ lạ ở đó, vì chúng ta đang lắng nghe một cuộc trò chuyện thời gian thực giữa một con người và một cỗ máy.

Tiết lộ đã khiến mọi người ngạc nhiên bởi vì, không giống như các lĩnh vực khác (chẳng hạn như nhận dạng con người), các thuật toán trí tuệ nhân tạo luôn tìm thấy những giới hạn lớn trong việc hiểu và sản xuất ngôn ngữ truyền miệng, đến mức lĩnh vực này được định hình là thách thức thực sự 'trí tuệ nhân tạo. Sau cùng, tất cả chúng ta phải mất vài giây để nhận ra một cuộc gọi điện thoại thực từ một cuộc gọi được thực hiện bằng giọng nói đã được ghi âm. Hoặc ít nhất, cho đến bây giờ.

Trong tài liệu thuyết trình của Google Duplex (đây là tên của công nghệ) chúng tôi sẽ chú ý nhiều thách thức mà các nhà phát triển đã phải đối mặt (rõ ràng là đang giải quyết chúng) và chúng tôi, những người làm việc trong lĩnh vực giao tiếp bằng lời nói đều biết rõ:


  • Không giống như tìm kiếm Google, đặt chỗ bằng giọng nói nhiều hơn không chính xác: chứa ngập ngừng, từ lặp lại nhiều lần, tự sửa. Do đó, một trong những nhiệm vụ của máy là “làm sạch” tín hiệu và trích xuất nội dung thông tin
  • Mọi người thường nói chuyện nhanh chóng và khi họ ở trên điện thoại, họ có thể có tiếng ồn xung quanh. Do đó, một nhiệm vụ khác của máy là xác định và cô lập tin nhắn
  • Nội dung có thể được mơ hồ: như trong ví dụ do trang Google cung cấp, trong tiếng Anh "Ok cho 4" có thể có nghĩa là "Ok cho 4: oo" hoặc "Ok cho 4 người". Do đó, nhiệm vụ của máy là xác định và xác định các tình huống có thể xảy ra
  • Nhận ra các khía cạnh thực dụng: đôi khi máy phải trả lời bằng các hành động đối với các yêu cầu rõ ràng, ví dụ "Bạn có thể đợi một phút không?", "Bạn có thể lặp lại không?", "Bạn có thể nói từng chữ một được không?"

Thật thú vị, thực tế là, để trông tự nhiên hơn, hệ thống phải chính xác hơn: "cô gái" đến hẹn sử dụng các câu nói xen vào, do dự và cải biên với mục đích duy nhất là trông tự nhiên hơn.

May mắn thay cho chúng tôi, Song sinh sẽ phải tự nhận mình là robot trước khi bắt đầu một cuộc trò chuyện qua điện thoại với chúng tôi.

Thực tế là những khám phá được thực hiện để vượt qua tất cả những khó khăn được mô tả ở trên có thể có tác động rất lớn đến mô hình hiểu biết và sản xuất ngôn ngữ.

Bắt đầu nhập và nhấn Enter để tìm kiếm

lỗi: Nội dung được bảo vệ !!
Đọc chia sẻ