• 评论
毫末智行: DriveGPT驱动自动标注,降本效果高达98%

自动驾驶技术的发展正在为汽车行业带来新的变革。7月6日至7月8日,上海举行了世界人工智能大会(WAIC 2023)。与会者中,毫末智行COO侯军发表了关于自动驾驶生成式大模型DriveGPT以及相关研发进展的主题演讲。

侯军指出,经过多年的发展,自动驾驶正逐渐进入由数据驱动的3.0时代。毫末智行通过打造数据智能体系MANA,已经学习了超过67万小时,相当于人类司机的8.2万年的经验。这使得毫末能够充分利用成本和规模的优势,不断推出自动驾驶产品。

其中,由毫末于2023年4月11日推出的DriveGPT是行业首个自动驾驶生成式大模型,中文名为“雪湖·海若”。该模型的训练使用了5500万公里的驾驶数据,参数规模达到1200亿。DriveGPT采用了GPT(Generative Pre-trained Transformer)生成式预训练大模型,并且与ChatGPT不同,它的输入是感知融合后的文本序列,输出则是自动驾驶场景文本序列,以形成“Drive Language”。该模型可以完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。

与此同时,毫末还逐步建立了一套基于4D Clips驾驶场景识别方案,其中自动驾驶数据包括Frame(单视角单帧数据)、Bundle(环视单组数据)和4D Clips(环视连续数据Clips)三种形态。使用DriveGPT雪湖·海若的场景识别服务后,一张图片的价格将从5元降低到0.5元,单帧图片整体标注成本降低了90%。侯军表示,目前任何公司都无法承担数百亿4D Clips的标注成本,而利用DriveGPT的自动化标注能力,成本可以降低98%。

值得一提的是,毫末还于2023年1月发布了MANA OASIS(雪湖·绿洲),这是中国自动驾驶领域规模最大的智算中心。该中心每秒浮点运算能力达到67亿亿次,全面保障了毫末大模型训练的稳定性、效率和速度提升。

演讲最后,侯军表示,自动驾驶技术已经进入了规模商用的阶段。毫末希望以客户为中心,通过全栈共创开放合作,为客户提供全面解决方案、云端服务、硬件、软件、模块和原型代码等6个产品层面的合作方式,帮助客户更好地发展。

这次演讲充分展示了毫末智行在自动驾驶技术领域的研发实力和创新成果,也为行业的发展注入了新动力。随着技术的不断突破和应用的推广,自动驾驶有望为交通安全和出行方式带来革命性的变化。

发表评论
加载中...
  • pix2pix 1个月前

    SAM模型已经取代了所有的语义分割和目标检测模型。

相关文章