Sự phát triển của trợ lý ảo cá nhân đã cho phép chúng thực hiện một số tác vụ cấp cao như tìm kiếm hoặc điều khiển các thiết bị IoT. Tuy nhiên, chúng vẫn chưa hoàn hảo vì không thể hiểu các lệnh theo ngữ cảnh như “Cái này là gì?” hoặc “Bật cái kia lên”. Những từ ngữ mơ hồ như “cái này” và “cái kia” là những thuật ngữ mà trợ lý giọng nói không thể thực sự hiểu được cho đến khi bạn cung cấp cho chúng ngữ cảnh. Tuy nhiên, điều này có thể thay đổi rất sớm trong tương lai khi các nhà nghiên cứu của Viện Tương tác Người-Máy tính tại Đại học Carnegie Mellon đã phát triển một phần mềm mới có thể cải thiện đáng kể sức mạnh của trợ lý ảo trong tương lai.
Contents
WorldGaze là một công nghệ mới được phát triển bởi Sven Mayer, Gierad Lapu và Chris Harrison, một nhóm các nhà nghiên cứu của Đại học Carnegie Mellon. Nó có thể cung cấp cho trợ lý giọng nói ngữ cảnh bằng cách người dùng chỉ cần nhìn vào một vật gì đó. Điều này sẽ cho phép các trợ lý hiểu các lệnh theo ngữ cảnh dễ dàng hơn.
Về cơ bản, đây là một phần mềm sử dụng cả camera trước và sau của thiết bị di động đồng thời để cung cấp ngữ cảnh cho phần mềm trợ lý giọng nói. Phần mềm sử dụng camera sau để ghi lại những gì người dùng đang nhìn thấy và sử dụng camera trước để theo dõi đầu của người dùng ở chế độ 3D. Tổng cộng, phần mềm có thể có được trường nhìn 200 độ từ cả hai camera.
WorldGaze Hoạt Động Như Thế Nào?
WorldGaze hoạt động bằng cách kết hợp dữ liệu từ cả camera trước và sau của điện thoại thông minh. Camera sau ghi lại hình ảnh về những gì người dùng đang nhìn, trong khi camera trước theo dõi vị trí đầu và hướng mắt của họ trong không gian ba chiều. Sau đó, phần mềm sẽ sử dụng thông tin này để xác định chính xác đối tượng mà người dùng đang tập trung vào.
WorldGaze 1
Ứng Dụng Thực Tế Của WorldGaze
Trên Đường Phố
Hãy tưởng tượng bạn đang đi bộ trên phố và nhìn thấy một nhà hàng. Bạn hỏi trợ lý giọng nói của mình, “Khi nào cái này mở cửa?”. Đừng mong đợi nhận được câu trả lời từ trợ lý vì nó không thể hiểu “cái này” là gì trong câu hỏi. Tuy nhiên, nếu bạn đi bộ trên cùng con phố đó với chiếc điện thoại thông minh tích hợp WorldGaze trong tay và hỏi câu hỏi tương tự khi bạn nhìn thẳng vào nhà hàng, phần mềm sẽ cung cấp ngữ cảnh liên quan cho trợ lý giọng nói để nó hiểu được “cái này” trong câu hỏi của bạn. Vì phần mềm sử dụng camera trước để theo dõi “ánh nhìn đầu” của bạn ở chế độ 3D, nó biết bạn đang nhìn vào cái gì tại một thời điểm nhất định.
Trong Cửa Hàng và Tại Nhà
Điều tương tự cũng áp dụng trong các cửa hàng bán lẻ vì WorldGaze cũng đi kèm với tích hợp AR. Vì vậy, nếu bạn đang ở trong một cửa hàng bán lẻ, bạn chỉ cần nhìn vào bất kỳ mặt hàng nào và phần mềm sẽ cho bạn biết đó là gì bằng cách đặt nhãn AR bên cạnh các mặt hàng. Vì vậy, khi bạn đang nhìn vào một chiếc ghế hoặc bàn, bạn có thể sử dụng các lệnh như “Thêm cái này vào danh sách mua sắm của tôi” và trợ lý cá nhân trong thiết bị di động của bạn sẽ thêm mặt hàng cần thiết vào danh sách mà không cần bất kỳ câu hỏi nào nữa. Tương tự, các trợ lý giọng nói cũng sẽ có thể hiểu các lệnh giọng nói theo ngữ cảnh cho các thiết bị gia dụng. Vì vậy, bạn chỉ cần hướng điện thoại thông minh của mình về phía một chiếc TV thông minh và nói “Hey Google/Siri/Alexa, Bật” và trợ lý sẽ bật TV.
WorldGaze
Hạn Chế và Hướng Phát Triển Của WorldGaze
Một trong những hạn chế lớn nhất của công nghệ này là nó yêu cầu người dùng luôn giữ điện thoại thông minh trong tay. Nếu không, phần mềm không thể sử dụng camera để hoạt động. Đây là lý do tại sao công nghệ này vẫn chỉ là một bằng chứng về khái niệm tính đến thời điểm hiện tại. Tuy nhiên, các nhà nghiên cứu đang lên kế hoạch tích hợp phần mềm vào kính thông minh trong tương lai.
Ưu Điểm Nổi Bật Của WorldGaze So Với Các Công Nghệ Hiện Tại
- Hiểu ngữ cảnh tốt hơn: WorldGaze cho phép trợ lý ảo hiểu các lệnh phức tạp và mơ hồ bằng cách xác định chính xác đối tượng mà người dùng đang quan tâm.
- Tương tác tự nhiên hơn: Người dùng có thể tương tác với trợ lý ảo một cách tự nhiên hơn, chỉ cần nhìn vào đối tượng và ra lệnh.
- Ứng dụng đa dạng: WorldGaze có thể được ứng dụng trong nhiều lĩnh vực khác nhau, từ mua sắm, giải trí đến điều khiển thiết bị thông minh.
WorldGaze là một công nghệ đầy hứa hẹn có thể cách mạng hóa cách chúng ta tương tác với trợ lý ảo. Bằng cách cho phép trợ lý ảo hiểu được ngữ cảnh thông qua ánh nhìn của người dùng, WorldGaze có thể mở ra những khả năng mới cho tương tác người-máy và giúp chúng ta làm việc hiệu quả hơn. Mặc dù vẫn còn một số hạn chế cần vượt qua, nhưng WorldGaze chắc chắn là một công nghệ đáng để theo dõi trong tương lai. Bạn có thể tham khảo thêm thông tin chi tiết tại nghiên cứu đầy đủ của nhóm.
Những Câu Hỏi Thường Gặp Về WorldGaze (FAQ)
-
WorldGaze hoạt động trên những thiết bị nào?
Hiện tại, WorldGaze được thiết kế để hoạt động trên điện thoại thông minh có cả camera trước và sau. Trong tương lai, công nghệ này có thể được tích hợp vào kính thông minh và các thiết bị đeo khác. -
Độ chính xác của WorldGaze là bao nhiêu?
Độ chính xác của WorldGaze phụ thuộc vào nhiều yếu tố, bao gồm chất lượng camera, điều kiện ánh sáng và khoảng cách đến đối tượng. Tuy nhiên, các thử nghiệm ban đầu cho thấy WorldGaze có độ chính xác khá cao trong việc xác định đối tượng mà người dùng đang nhìn. -
WorldGaze có thể nhận diện được những loại đối tượng nào?
Về lý thuyết, WorldGaze có thể nhận diện được bất kỳ loại đối tượng nào mà camera có thể nhìn thấy. Tuy nhiên, hiệu suất nhận diện có thể khác nhau tùy thuộc vào kích thước, hình dạng và độ phức tạp của đối tượng. -
WorldGaze có ảnh hưởng đến quyền riêng tư của người dùng không?
WorldGaze sử dụng camera để theo dõi ánh nhìn của người dùng, điều này có thể gây ra lo ngại về quyền riêng tư. Tuy nhiên, các nhà phát triển của WorldGaze cam kết bảo vệ quyền riêng tư của người dùng và đảm bảo rằng dữ liệu được thu thập chỉ được sử dụng cho mục đích cải thiện hiệu suất của phần mềm. -
Khi nào WorldGaze sẽ được thương mại hóa?
Hiện tại, WorldGaze vẫn đang trong giai đoạn nghiên cứu và phát triển. Tuy nhiên, các nhà nghiên cứu hy vọng rằng công nghệ này sẽ sớm được thương mại hóa và tích hợp vào các sản phẩm và dịch vụ khác nhau. -
WorldGaze có thể hoạt động trong điều kiện ánh sáng yếu không?
Hiệu suất của WorldGaze có thể bị ảnh hưởng bởi điều kiện ánh sáng yếu. Tuy nhiên, các nhà nghiên cứu đang làm việc để cải thiện khả năng hoạt động của phần mềm trong các môi trường thiếu sáng. -
WorldGaze có cần kết nối internet để hoạt động không?
Một số tính năng của WorldGaze có thể yêu cầu kết nối internet, chẳng hạn như truy cập thông tin về đối tượng từ cơ sở dữ liệu trực tuyến. Tuy nhiên, các tính năng cơ bản, chẳng hạn như theo dõi ánh nhìn và xác định đối tượng, có thể hoạt động ngoại tuyến.