小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线
摘要
快科技5月13日消息,今日,小米正式发布并开源XiaomiOneVL自动驾驶模型。该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线......
快科技5月13日消息,今日,小米正式发布并开源XiaomiOneVL自动驾驶模型。
该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。
其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。
XiaomiOneVL通过潜空间推理,
在涵盖感知、推理与规划的多个主流基准上,XiaomiOneVL全面刷新潜在推理方法的性能上限:
在ROADWork、Impromptu、Alpamayo-R1三项基准上均达到SOTA,并在NAVSIM上取得优越性能,PDM-score达到88.84,
目前
挂载MLP回归头变体,延迟进一步压到0.24s(4.16Hz),仅为VLA自回归推理的5.4%,为量产车端实时部署提供了可行路径。
消融实验进一步验证,压缩物理世界的动态信息能带来显著的性能提升。
同时,XiaomiOneVL能为模型决策提供语言和视觉双维度的可解释性既能用文字说明为什么这样开”,也能用预测画面展示接下来会发生什么”
