Mountain View, California - Google DeepMind đã ra mắt Gemini Robotics, một mô hình AI tiên tiến được thiết kế cho robot tự hành.
Gemini Robotics cho phép robot hoạt động mà không cần phụ thuộc vào đám mây, sử dụng xử lý trên thiết bị để có các hệ thống nhanh hơn, đáng tin cậy hơn. Mô hình này được xây dựng trên Gemini 2.0 và kết hợp các khả năng thị giác-ngôn ngữ-hành động (VLA).
Các tính năng chính bao gồm:
Xử lý trên thiết bị để loại bỏ độ trễ mạng.
Học ít lần, cho phép thích ứng với 50-100 lần trình diễn.
Khả năng thích ứng với nhiều loại robot khác nhau, bao gồm ALOHA, Franka FR3 và Apollo.
Google đã phát hành SDK Gemini Robotics thông qua một chương trình chọn lọc. Động thái này nhấn mạnh sự thay đổi chiến lược hướng tới việc bảo vệ lợi thế cạnh tranh của mình. Thị trường toàn cầu về lắp đặt robot công nghiệp đã đạt 16,5 tỷ đô la, với “AI Vật lý” là một xu hướng chủ chốt.
Khả năng tạo ra của mô hình vượt xa các lệnh đơn giản, cho phép robot thực hiện các tác vụ mới. Điều này định vị Google trong bối cảnh cạnh tranh của việc xây dựng thế hệ máy móc thông minh tiếp theo.