Paris, Prancis - Meta telah meluncurkan V-JEPA 2, sebuah "model dunia" AI canggih yang dirancang untuk memahami dan memprediksi dunia fisik.
Model sumber terbuka baru ini dapat memahami lingkungan 3D dan pergerakan objek. Ini merupakan langkah signifikan melampaui model bahasa besar, yang memungkinkan AI untuk belajar, merencanakan, dan membuat keputusan lebih seperti manusia.
V-JEPA 2 dapat mengenali bahwa bola yang menggelinding dari meja akan jatuh. Ia bernalar dalam ruang "laten" yang disederhanakan untuk memahami bagaimana objek bergerak dan berinteraksi.
Kepala ilmuwan AI Meta, Yann LeCunn, menyoroti perbedaan antara memahami bahasa dan dunia fisik. Ia menjelaskan bahwa model dunia bertindak sebagai kembaran digital abstrak dari realitas, yang memungkinkan AI untuk memprediksi konsekuensi dari tindakannya.
Meta berinvestasi besar-besaran dalam AI, dengan investasi yang direncanakan sebesar $14 miliar di Scale AI. Perusahaan berfokus pada AI untuk bersaing dengan raksasa teknologi lain seperti OpenAI dan Google.
V-JEPA 2 dimaksudkan untuk digunakan dalam robot pengiriman dan mobil self-driving. Mesin-mesin ini perlu memahami lingkungan mereka secara real-time untuk navigasi.
Perusahaan lain juga mengembangkan model dunia. DeepMind dari Google sedang mengerjakan Genie, yang dapat mensimulasikan game dan lingkungan 3D. Fei-Fei Li mengumpulkan $230 juta untuk startup bernama World Labs, yang berfokus pada model dunia besar.