Decart ra mắt Oasis 3: Mô hình thế giới cho phép mô phỏng lái xe chân thực
Startup AI Decart vừa giới thiệu Oasis 3, một mô hình thế giới tương tác có khả năng tạo ra môi trường lái xe chân thực theo thời gian thực, mở ra tiềm năng mới cho lĩnh vực xe tự lái và AI vật...
Startup AI Decart vừa chính thức công bố Oasis 3, mô hình thế giới (world model) tương tác mới nhất của hãng, cho phép tạo ra các môi trường lái xe chân thực với độ chi tiết cao theo thời gian thực. Hiện tại, mô hình này đã sẵn sàng thông qua API.
Mục tiêu ban đầu của Decart là các công ty phát triển xe tự lái, những đơn vị cần mô phỏng các tình huống giao thông phức tạp ở quy mô lớn. Xa hơn, công ty dự định mở rộng sang lĩnh vực robot và các ứng dụng AI vật lý khác. Với chiến lược cung cấp quyền truy cập API ngay từ ngày đầu, Decart kỳ vọng sẽ xây dựng được một hệ sinh thái nhà phát triển tương tự như cách OpenAI đã làm với các mô hình ngôn ngữ lớn.
Dean Leitersdorf, đồng sáng lập kiêm CEO của Decart, cho biết: “Đây sẽ là mô hình thế giới đầu tiên mà người dùng có thể thực sự lập trình trên đó. Chúng tôi tin rằng một cộng đồng nhà phát triển sẽ sớm hình thành xung quanh công nghệ này.”
Oasis 3 được xây dựng dựa trên nền tảng của Lucy, mô hình video thời gian thực vốn đã thu hút hơn 100.000 nhà phát triển trong lĩnh vực thương mại điện tử và livestream. Về chi phí, dịch vụ này được định giá 0,02 USD mỗi giây, với các gói doanh nghiệp tùy chỉnh theo nhu cầu sử dụng.
Điểm mạnh của Oasis 3 nằm ở khả năng tạo hình ảnh chân thực và tính năng tạo môi trường vô hạn. Điều này đạt được nhờ bộ công cụ tối ưu hóa DOS (Decart Optimization Stack), giúp mô hình vận hành hiệu quả trên phần cứng từ Nvidia, Amazon và Google với chi phí thấp hơn đáng kể so với các đối thủ cạnh tranh.
Tuy nhiên, công nghệ này vẫn còn những hạn chế nhất định. Trong quá trình thử nghiệm, dù Oasis 3 có thể tạo ra các khung cảnh ban đầu rất ấn tượng, nhưng độ nhất quán về mặt ngữ cảnh sẽ giảm dần theo thời gian. Khi người dùng di chuyển xa khỏi điểm xuất phát, môi trường có thể thay đổi hoàn toàn hoặc mất đi tính logic ban đầu. Ngoài ra, khả năng mô phỏng vật lý vẫn là một thách thức; ví dụ, các phương tiện đôi khi có thể xuyên qua nhau do mô hình chưa xử lý tốt các va chạm.
Leitersdorf giải thích rằng do Oasis 3 hoạt động theo cơ chế tự hồi quy (auto-regressive) — tạo từng khung hình một dựa trên dữ liệu trước đó — nên việc duy trì bộ nhớ dài hạn là một bài toán khó. Mỗi khung hình tiêu tốn khoảng 8.000 token, khiến cửa sổ ngữ cảnh (context window) nhanh chóng bị lấp đầy. Đội ngũ kỹ thuật của Decart hiện đang nghiên cứu các phương pháp nén bộ nhớ và mở rộng ngữ cảnh để khắc phục vấn đề này trong các phiên bản tương lai.
Dù vẫn đang trong giai đoạn đầu phát triển, Decart tin rằng việc để cộng đồng nhà phát triển tiếp cận sớm với công nghệ sẽ là chìa khóa để khám phá những ứng dụng đột phá, tương tự như giai đoạn sơ khai của các mô hình LLM.
Nguồn tham khảo: TechCrunch


No Comment! Be the first one.