Pada Mei 2025, sebuah makalah yang memperkenalkan TrajPrism muncul di arXiv, sebuah benchmark serbaguna untuk memahami lintasan perkotaan dengan landasan bahasa (language grounding). Penulis mengusulkan serangkaian tugas di mana model harus memprediksi, menghasilkan, dan menjawab pertanyaan tentang pergerakan agen di lingkungan kota secara bersamaan, dengan mengandalkan deskripsi tekstual dari konteks tersebut.
Berbeda dengan dataset sebelumnya yang lebih fokus pada koordinat numerik dan data visual, TrajPrism menyertakan persyaratan eksplisit untuk integrasi bahasa alami. Model tidak hanya menerima data lintasan, tetapi juga deskripsi niat, kondisi jalan, atau faktor sosial, yang memungkinkan pengujian kemampuan sistem dalam menghubungkan pola spasial-temporal dengan semantik.
Metodologi benchmark ini mencakup empat tugas utama: memprediksi segmen jalur berikutnya, menghasilkan lintasan berdasarkan permintaan teks, menjawab pertanyaan tentang alasan penyimpangan, serta koordinasi multi-agen. Meskipun penulis melaporkan hasil dari beberapa model dasar, mereka tidak menyediakan studi ablasi yang menyeluruh, sehingga kontribusi masing-masing komponen masih menjadi tanda tanya.
Jika dibandingkan dengan karya sebelumnya seperti TrajNet++ atau Social-LSTM, benchmark baru ini secara signifikan mengalihkan fokus dari pemodelan geometris murni ke interaksi multimodal. Hal ini mendekatkannya pada pendekatan yang dikembangkan dalam bidang embodied AI, namun di saat yang sama menyingkap kelemahan arsitektur saat ini dalam menangani konteks panjang dan norma sosial yang implisit.
Hasil pada tugas pembuatan lintasan sangatlah menarik: model sering kali mengabaikan petunjuk bahasa yang halus mengenai preferensi pejalan kaki atau batasan waktu, yang mengindikasikan kurangnya kedalaman grounding. Fenomena ini memicu pertanyaan tentang sejauh mana metode pra-pelatihan yang ada benar-benar belajar menghubungkan bahasa dengan ruang fisik, dan bukan sekadar mereproduksi korelasi statistik.
Dalam konteks yang lebih luas, TrajPrism menekankan meningkatnya kebutuhan akan benchmark yang tidak hanya menguji akurasi prediksi, tetapi juga interpretabilitas keputusan. Hal ini sangat krusial bagi aplikasi dalam transportasi otonom dan perencanaan kota, di mana kesalahan dalam memahami niat dapat membawa konsekuensi nyata.
Namun demikian, masih belum jelas seberapa baik hasil pada skenario perkotaan yang sintetis atau terbatas dapat diterapkan pada megakota nyata dengan dinamikanya yang kacau. Verifikasi independen dan perluasan dataset ke wilayah baru akan menjadi langkah penting berikutnya untuk mengonfirmasi nilai dari benchmark yang diusulkan ini.
Dengan demikian, TrajPrism tidak sekadar menambahkan satu lagi dataset, melainkan memaksa komunitas riset untuk meninjau kembali kemampuan apa saja yang sebenarnya dibutuhkan oleh model agar dapat berinteraksi secara andal dengan lingkungan perkotaan melalui bahasa.



