首页 > 单位招聘考试 > 单位招聘考试 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

单位招聘考试更多>>

不习惯“Brake To Start”方式启动引擎,马自达遭用户起诉! 电动车销量暴跌,欧洲汽车制造商协会呼吁重新检讨减排政策! 丰田Harrier推出小改款车型:外观设计偏向皇冠Sport,续航提升 销量受SUV与电动车影响,大众Polo退出欧洲市场! 泰国规定电动车企需从2026年起在该国组装或生产三大主要零件! smart精灵#5开启预购,10月发布,分后驱、四驱与Brabus性能版本 比亚迪纯电动客货车E-Vali欧洲首发,车长近7米,续航250公里! 日产汽车新一代插电式混合动力车型正在开发中! 奇瑞瑞虎9小改款首发,旗舰七人座SUV,两种动力版本! Mansory爆改法拉利Purosangue,外形夸张,内饰独特,马力755匹! 又一英伦旗舰级跑车,搭载5.2升V12发动机,835匹马力、3.3s破百 城市“小精灵”,方盒子车身造型,搭灵眸智驾2.0 Max,续航401km 奇瑞轿跑,车长4790mm,搭载1.5T插混动力,油耗1.01L、纯电106km 魔鬼四连环硬核挑战,红旗天工08突围,无惧挑战,勇攀高峰! 低调的德系豪华轿车,车长5175mm,智能、豪华、操控并驾齐驱 比亚迪全新MPV,车长5145mm,内饰更加惊艳,预售价格30万元 未来照进现实,车长4688mm,侧滑对开门+旋转主副座,配置还丰富 奥迪的“爆款”来了,PPE电动平台打造,三块液晶大屏,续航750km 美式奢华SUV,车长5657mm,配前后排液晶大屏,V6双涡轮+超级四驱 英伦经典“小车”,车长4035mm,204匹马力、加速6.8s,油耗6.4L 今下午5点30,一位神秘嘉宾将现身宝骏直播间,会是谁? 依维柯欧胜4x4最新官图,侧滑门,全时四驱+三把锁,3.0T柴油动力 新款劳斯莱斯古思特发布,换装新前脸,外观更年轻运动,V12动力 B级空间、续航破千,亏电油耗成本不到3毛,五菱星光有多实用? 红魔10 Pro再预热:全面屏史上最高分辨率 苹果不再“偏心”,iPhone 17全系支持120Hz可变刷新率 努比亚 Z70 Ultra通过认证,新机本月见 本月见!努比亚Z70 Ultra样张公布 2024年红河州个旧市人民医院党委办公室、运营管理科需招聘干事公告 2024年云南中医药大学第二附属医院招聘劳务派遣工作人员公告