文章编号:2725时间:2024-07-26人气:
昨天凌晨4点20分,马斯克发布推文宣称,他刚刚启动了世界上最强大的AI训练集群。这个超算中心位于美国田纳西州孟菲斯,采用了100,000个英伟达H100液冷GPU,并通过单一RDMA网络连接进行高效通信。RDMA(远程直接内存访问)技术允许计算机之间直接传输数据,无需操作系统干预,非常适合大规模并行计算。
从规模上看,xAI孟菲斯超算中心已经超越了OpenAI用于GPT-4训练的2.5万块A100GPU,以及Aurora(60,000个IntelGPU)和MicrosoftEagle(14,400个NvidiaH100GPU),甚至超过了前世界第一超算Frontier(37,888个AMDGPU)。H100芯片专为处理大型语言模型数据而设计,每块约价值3万美元,使得xAI这次超算中心的硬件总价值高达30亿美元。
虽然xAI此前推出的人工智能Grok饱受诟病,但当前大模型训练的关键在于算力和能源供应。马斯克表示,他将推出改进后的大模型(预计为Grok3),预计将在今年年底完成,成为全球最强大的AI。
英伟达已经推出了H200芯片和基于Blackwell架构的B100和B200GPU,但这些更先进的硬件要到今年年底才能正式交付。马斯克此次的大规模部署或许是为了在ChatGPT5发布之前夺得AI领域的头把交椅。
据福布斯报道,孟菲斯的电力、天然气和水务公司预计,xAI孟菲斯超算集群的峰值电力消耗可达每小时150兆瓦,相当于10万户家庭的电力需求。目前,孟菲斯工厂已有3.2万块GPU在线,预计今年第四季度将完成电力基础设施建设。
xAI超算集群每天至少需要100万加仑(约379万升)的水来进行散热。孟菲斯市议会议员PearlWalker表达了民众的担忧,特别是对水资源和能源供应的担忧。
除了马斯克的xAI,OpenAI和微软也在部署更大规模的超算。OpenAI的“星际之门”计划预计将拥有百万级芯片,预算高达1150亿美元,计划在2028年推出。
马斯克在xAI孟菲斯超算中心的大规模投资和部署,展示了在AI领域竞争的激烈程度和技术进步的快速推动。
如果要评选2023年最大的风口,AI大模型一定位列其中。
风起自ChatGPT的现象级爆火,英伟达创始人黄仁勋激动地喊出了“AI的iPhone时刻正在到来“。
整个科技圈似乎达成了一种共识:所有产品都值得用大模型重做一遍,当然也包括正处于寒冬之中的自动驾驶。
然后,几乎是一夜之间,整个汽车圈都是GPT上车的消息,长安、集度、吉利、岚图、红旗、长城、东风日产、零跑等搭上了网络的文心一言。
“蔚、小、理“先后申请了GPT的相关商标。 其中,理想自研的Mind GPT已经正式发布。 另外,毫末智行也在不久前发布了自动驾驶生成式大模型drive GPT。
可以说AI大模型的火热,给正在冷却中的自动驾驶又画了一张新的大饼。
有人表示从中看到了自动驾驶的未来。 比如集度汽车创始人夏一平,小鹏汽车董事长何小鹏等,当然也有很多人觉得,GPT上车目前就是个PR行为。
所以,今天来尝试探讨一个问题,大模型之于自动驾驶,到底有什么作用?它能给这个已经烧掉无数金钱但依然成效寥寥的赛道,带来一个相对确定的未来么?
先明确一个定义,大模型是指具有超大参数规模(通常在十亿个以上)和复杂程度的机器学习模型。 通常来说,参数量越大,模型就越容易拟合海量数据的规律。
而ChatGPT的出现,让人们有一个非常惊喜的发现。 那就是当模型参数量达到了一定程度,超过某个临界值之后,它的性能会大大超越预期。
很多科学家惊叹于这一现象,并将其称之为“涌现“。 但遗憾的是到目前为止还没有一套系统、公认的理论来解释为什么会出现这个现象。
所以我们姑且相对简单地把这种“涌现“理解为一个从量变到质变的过程。 在跨过临界点之后,模型精度呈指数型增加,甚至产生了类似于人类的逻辑思考能力。
而这种能力很可能是自动驾驶算法攻克最后1%长尾场景的关键所在。 在数据标注、虚拟仿真环境以及决策规划上,大模型都有可能改变甚至重写过去的算法。
举个例子,低频率但又几乎不可穷尽的Corner Case,正是从高阶辅助驾驶迈向自动驾驶最大的一块绊脚石。
而Corner Case的出现带有极强的不可预知性,毫末智行数据智能科学家贺翔举了一个例子,一辆卡车转运一颗大树,算法看到的可能只有车,而没有伸出车外的树枝。
类似的状况有很多,比如说很特别的大件运输车辆,甚至是违规拉着很长一根管子的三轮车。
面对这些场景,算法只识别的车辆是不够的,但按照现在基于标签的方式来挖掘长尾场景,只能给系统看大量的标注图片,教它学会识别。
不过问题在于,这些车辆出现的频率太低,数据采集的难度大、成本高、周期长,真正碰到这种场景的概率又小,成本上是算不过来的。
但AI大模型具备举一反三的能力,我们可以通过文字的描述来使其检索并对图像进行分类,检索甚至是自主创造我们需要的长尾场景,例如拖着大树的卡车,拉着长水管的三轮车等。
除此之外,大模型也可以更好的从数据中提取特征,进行数据标注。
比如,先用海量未标注数据通过自监督的方式预训练一个大模型,然后用少量已经人工标注好的数据对模型做微调,使得模型具备检测能力,这样模型就可以自动标注需要的数据。
目前,很多公司都在研究如何提高大模型自动标注的精度,希望实现自动标注的完全无人化。
在Mind GPT发布之后,理想汽车董事长李想就表示:“我们一年要做大概1000万帧的自动驾驶图像的人工标定,外包公司价格大概6元到8元钱一张,一年成本接近一亿元。 当我们使用大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情基本上3个小时就能完成,效率是人的1000倍。 ”
总之,自动驾驶的感知也好,规划决策也好,目前基本上是基于经验和规则的,缺少场景泛化的能力。
但就像夏一平所言,大模型解决的正是泛化的问题,是举一反三的问题,这可能让自动驾驶在未来3-5年内又重大的突破。
因为从根本上来说,生成式AI在语言模型上的应用思路是可以平移到自动驾驶上的。
虽然计算机不懂自然语言,但它通过数学建模,把语言问题变成了数学问题。 通过给定文本的历史,预测下一个词出现的概率,间接地理解了自然语言。
换到驾驶场景,如果给定当前的交通环境,给定一个导航地图,以及一个驾驶员驾驶行为的历史,那么,大模型是不是可以预测下一个驾驶动作?
理论上,这是可行的。 地平线的创始人余凯认为以AI现在所展现的学习能力,学习司机的驾驶习惯并不难。
“接下来要继续用更大的数据、更大的模型,无监督地去学习人类驾驶的尝试,就像我们从大量无监督的、没有标注的自然文本里去学习一样,构建一个回归自动驾驶的大语言模型。”
大模型为自动驾驶画出来的这张饼,很诱人。 但能不能消化其实是另外一回事儿。
“现在说GPT上车都是噱头,车端还没有运转大模型的硬件条件。 ”贺翔说道。
理论上,大模型需要高规格的硬件配置,包含高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的计算资源支撑大模型运行。
举个例子,在自然语言处理领域的 GPT-3 模型就需要数万亿Tops的计算能力。 这要求芯片的算力至少要在万级Tops以上才能够胜任大型模型的计算任务。
但是,在车载部署场景下,芯片的算力往往只有数百Tops,远远达不到大型模型的要求。
所以,目前自动驾驶大模型也只能暂时运转在云端,例如毫末智行的Drive GPT。
但即便如此,它依然可以对车端产生影响。 比如通过用知识蒸馏的方式“教”车端的小模型。
最简单的方式就是把需要打标签的图片给大模型学习,大模型可以给这些图片打好标签,标注好的图片就可以用于小模型的训练。
所以,大模型对算力的消耗让云计算厂商成为了第一批被风吹起来的玩家。
2023年以来 阿里、美团、腾讯等互联网大厂也都纷纷收缩或者调整了自动驾驶相关的投入,将更多的精力放到了云计算和AI大模型上。
而主机厂这边,自建超算中心也逐渐成为了基本操作。
当然如果大模型只能运转在云端,它对于自动驾驶的影响会小很多。 因为从云端到车端,哪怕只是一点点的时延也可能会在公路上造成悲剧。
所以目前地平线、英伟达等芯片企业都在积极研发适应大模型上车需求的新一代高算力AI芯片。
地平线CTO黄畅认为,按照发展进程来看,在自动驾驶场景中,大模型在车端会优先从环境模型的预测和交互式规控和规划开始应用。
“这个场景不需要特别的大规模参数模型,在百Tops级别的算力平台上就能应用, 3~5年内就可以初步上线。”
“但如果从感知到定位地图到规控,整个端到端的闭环做出来,则需要一个更大规模的参数模型,大概需要5~10年的时间。 ”黄畅补充到。
严格来说,一夜火遍全球的ChatGPT只是AI大模型中的一种。 自动驾驶行业对于大模型的运用比ChatGPT的爆火要早很多。
2017年,马斯克从Open AI挖来了了一位计算机视觉领域的顶级研究院Andrej Karpathy。
他在特斯拉工作了五年,最高做到了AI高级总监兼自动驾驶负责人,而这五年也被绝大多数人认为是特斯拉自动驾驶成长最快的五年。
入职后不久,Andrej Karpathy就重写了特斯拉自动驾驶算法,以BEV纯视觉感知+Transformer为基础,将特斯拉的智能驾驶带入了新的阶段。
当下小鹏、华为、毫末智行、理想等企业正在纷纷跟进这一路线。
而所谓Transformer是一种由谷歌8为AI科学家提出的一种深度学习神经网络,GPT中的T正是指代Transformer。
Open AI将Transformer运用于自然语义理解,诞生了ChatGPT;特斯拉将其应用于计算机视觉,成功开创了BEV技术,让纯视觉感知成为了潮流。
接下来,Transformer还将被自动驾驶玩家们逐步运用到决策规划等各个环节,改变现有模块化的部署方式,迈向端到端的自动驾驶。
我们现在还无法预知这一切会擦出怎么样的火花,但可以肯定大模型在智能驾驶上还未达到自然语义一般“涌现”的程度。
但至少,改变已经在发生,也许这一次自动驾驶这条路也许就真的通了呢?
2023伊始,先是开年毫末智行举办HAOMOAIDAY,放出自动驾驶行业最大智算中心,再有小鹏、理想新春全员信剑指城市导航辅助驾驶,随后是对话式AI大模型ChatGPT火遍全网,自动驾驶AI技术再次成为顶流。
无论是自动驾驶的“进城”,还是ChatGPT的“进化”,其背后都是对数据、算力需求指数级增长的态势以及对大模型的训练。 当需求上来了,智算中心作为自动驾驶的“新基建”也就被业界越来越多的提及。
智算中心即智能计算中心,是基于人工智能理论,采用领先的AI计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,换句话说,智算中心其实是一个算力的供应和生产平台。那为什么有了它“自动辅助驾驶”就可以变为“自动驾驶”了?
“降服”自动驾驶边际成本 自动驾驶智算中心“专云专用”
有人说,智算中心是自动驾驶发展的助推器,因为自动驾驶算法模型训练是机器学习的典型场景之一,其视觉检测、轨迹预测与行车规划等算法模型需要同时完成高并发的并行计算,对算力有着极高的需求,而智算为提高算法模型的成熟度提供了巨大的算力。
在自动驾驶领域,说起智算中心,还得先提特斯拉。 2017年,Transformer网络出现后,奠定了当前大模型领域主流的算法架构基础,随后,2020年,特斯拉将Transformer大模型引入自动驾驶领域中,是AI大模型应用于自动驾驶的开端。 在这之后,特斯拉开始着手打造属于自己的AI计算中心——Dojo,总计使用了1.4万个英伟达的GPU来训练AI模型。 为了进一步提升效率,特斯拉在2021年发布了自研的AI加速芯片D1,并计划将25个D1封装在一起组成一个训练模块(Training tile),然后再将训练模块组成一个机柜(Dojo ExaPOD)。 最近一期的特斯拉AI DAY上,马斯克称将于2023年一季度部署完成特斯拉超级计算机群组ExaPOD。
国内方面,2022年8月,小鹏汽车和阿里云合建了当时国内最大的自动驾驶智算中心“扶摇”,专门用于自动驾驶模型训练,算力规模达600PFLOPS,相当于每秒可以完成60亿亿次浮点运算。 不过这个记录仅仅维持了4个多月。
今年1月,毫末智行联合火山引擎,共同推出自动驾驶行业最大的智算中心MANA OASIS(雪湖·绿洲),每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。 吉利也在1月28日上线了吉利星睿智算中心,目前已接入智能驾驶和车联网实验数据近百PB,在线车辆的并发计算支持达百万辆。
从现有情形来看,成本和需求两重因素,是智算中心的诱人之处。
成本层面,算力作为自动驾驶的基本要素,需要更高性能的智算中心来完成训练、标注等工作。 以毫末的MANA OASIS为例,通过部署Lego高性能算子库、ByteCCL通信优化能力,以及大模型训练框架,软硬一体,毫末把算力优化到极致。 在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本降低100倍。
搭建高效、低成本的数据智能体系是自动驾驶技术健康发展的基础,也是自动驾驶系统能够不断迭代前行的重要环节,更是自动驾驶商业化闭环的关键所在。
小鹏汽车董事长何小鹏曾表态,“如果现在不以这样的方式(智算中心)提前储备算力,那么今后5年内,企业算力成本会从亿级,加到数十亿级。”
如果持续使用公有云服务,边际成本不断上涨只是一方面,更重要的是,智算中心可以让自动驾驶企业实现“专云专用”。 自动驾驶的开发包括从数据采集到数据筛选、打标、模型训练、回放性验证、仿真测试等等环节。 而云计算的本质是租赁计算设备,云服务商的设备都是统一采购,为了获得更多客户,这些设备都具备很大的通用性,设备内部使用的CPU、GPU/AI加速器、内存的型号与规格都相对固定,很难与车企和自动驾驶公司的算法形成最佳匹配。 并且,云服务厂商对自动驾驶算法的了解程度不高,不可避免的会在调度算力时出现损耗和效率不高的问题。 所以,从需求的角度来看,智算中心似乎可以成为自动驾驶和车企的托底神器。
同样以毫末为例,有了MANA OASIS的加持,毫末MANA五大模型全新亮相升级,车端感知架构实现跨代升级,毫末的技术栈布局继续保持完整领先的态势,尤其在感知、认知等层面领跑行业,引领大模型、大算力、大数据发展方向,冲刺进入自动驾驶3.0时代。
拿数据采集、筛选和标注来说,自动驾驶系统在前期开发阶段,需要采集大量的道路环境数据,以此让车辆像人类驾驶员一样快速准确地识别车道、行人、障碍物等驾驶环境中的关键信息。 唯一的办法是,通过在海量数据基础上不断的重复训练与验证,车辆对道路环境的认知水平逐渐趋近于真实情景,判断的准确性在这一过程中不断提升。
不仅如此,车企收集到的数据还需要进行模型训练,算法通过在数据上进行运算产生模型,而智算中心将是驱动大模型和海量数据训练的加速器。 基于Sparse MoE,毫末根据计算特点,进行稀疏激活,提高计算效率,实现单机8卡就能训练百亿参数大模型的效果,实现跨机共享exper的方法,完成千亿参数规模大模型的训练,训练成本降低到百卡周级别;毫末设计并实现了业界领先的多任务并行训练系统,能同时处理图片、点云、结构化文本等多种模态的信息,既保证了模型的稀疏性、又提升了计算效率;MANA OASIS训练效率提升了100倍。
毫末智行CEO顾维灏也在详细阐释了建设智算中心的底层逻辑:“自动驾驶对智算中心的第一要求肯定是算力。 智算中心的超大算力代表了有多少的AI工程师在这个练武场中能够做出什么大模型,能训练多少大模型。 ”
智能辅助驾驶“进城” MANA OASIS帮助毫末解决了哪些难题?
现在很多车企和自动驾驶技术企业已经开始把打造智算中心当成下一阶段竞争重点。 今年1月的HAOMO AI DAY上,毫末智行董事长张凯给出了2023年自动驾驶行业趋势的十大新预测,超算中心赫然位列其中,“超算中心会成为自动驾驶企业的入门配置。 ”
事实上,当下,随着新能源汽车品牌普遍已经把高速公路场景下的辅助驾驶列为标配,赛场已经悄然从高速路转向城市。 与高速导航辅助驾驶相比,城市行车涉及了红绿灯、十字路口、行人电动车、遮挡、固定障碍物、频繁刹停起步等一系列难题,复杂度又提升了好几个数量级。
如果仅用实测车辆去挑战这些城市场景无法穷尽的Corner Case,成本、安全性、时间都将成为企业发展的壁垒。 由此,虚拟仿真就成为了解决部分成本及场景多样性的关键,其中,大规模的长尾场景需要数据中心提供充足的算力支持。 同时,仿真场景对现实的回归过程,同样需要巨大的算力提供支持。
在MANA OASIS的加持下,毫末的数据智能体系MANA五大模型全新亮相升级。 而在五大模型助力下,MANA最新的车端感知架构,从过去分散的多个下游任务集成到了一起,形成一个更加端到端的架构,包括通用障碍物识别、局部路网、行为预测等任务,毫末车端感知架构实现了跨代升级。 这也意味着毫末的感知能力更强,产品力更强,向全无人驾驶加速迈进。
首先是视觉自监督大模型,让毫末在中国首个实现4D Clip的自动标注。 毫末利用海量videoclip,通过视频自监督方式,预训练出一个大模型,用少量人工标注好的clip数据进行Finetune(微调),训练检测跟踪模型,使得模型具备自动标注的能力;然后,将已经标注好的千万级单帧数据所对应的原始视频提取出来组织成clip,其中10%是标注帧,90%是未标注帧,再将这些clip输入到模型,完成对90%未标注帧的自动标注,进而实现所有单帧标注向clip标注的100%的自动转化,同时降低98%的clip标注成本。 毫末视频自监督大模型的泛化性效果极佳,即使是在一些非常困难的场景,例如严重遮挡的骑行者,远处的小目标,恶劣的天气和光照,都能准确地完成自动标注。
其次是3D重建大模型,助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果。 面对“完全从真实数据中积累corner case困难且昂贵”的行业难题,毫末将NeRF技术应用在自动驾驶场景重建和数据生成中,它通过改变视角、光照、纹理材质的方法,生成高真实感数据,实现以低成本获取normal case,生成各种高成本corner case。 3D重建大模型生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低。 增加NeRF生成的数据后,还可将感知的错误率降低30%以上,且数据生成可实现全程自动化,无需任何人工参与。
多模态互监督大模型则可以完成通用障碍物的识别。 毫末在成功实现车道线和常见障碍物的精准检测后,针对城市多种异形障碍物的稳定检测问题,毫末正在思考和探索更加通用的解决方案。 目前,毫末的多模态互监督大模型,引入了激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达。 该通用结构的检测,可以很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。
动态环境大模型,可以精准预测道路的拓扑关系,让车辆始终行驶在正确的车道中。 在重感知技术路线下,毫末为了将对高精地图的依赖度降到最低,面临着“道路拓扑结构实时推断”的挑战。 为此,毫末在BEV的feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将BEV特征,解码为结构化的拓扑点序列,实现车道拓扑预测。 让毫末的感知能力,能像人类一样在标准地图的导航提示下,就可以实现对道路拓扑结构的实时推断。
毫末认为,解决了路口问题实际就解决了大部分城市NOH问题。 目前在保定、北京,毫末对于85%的路口的拓扑推断准确率高达95%。 即便是非常复杂、非常不规则的路口,毫末也能准确预测,比老司机还老司机。
人驾自监督认知大模型在今年2月已经被正式升级为DriveGPT,这也是全球首个自动驾驶认知大模型。 它能让毫末的驾驶策略更加拟人化,安全及顺畅。 目前,毫末DriveGPT已完成模型搭建和第一阶段数据的跑通,参数规模可对标GPT-2的水平。 接下来,DriveGPT将持续引入大规模真实接管数据,通过人驾数据反馈的强化学习,来不断提升测评效果,同时也将DriveGPT作为云端测评模型,用来评估车端小模型的驾驶效果。
仿真测试能有效缩短技术和产品开发周期,降低研发成本。 业内典型的长尾场景问题不够丰富,现实中可遇而不可求的极端场景,利用仿真平台可以便捷生成。 由于仿真测试中的模拟环境需要实现多模态融合,以支持传感器模组的复杂性,因而也需要大算力的支持。
除了毫末,特斯拉超算中心拥有近2万张GPU,对自动驾驶训练效率产生立竿见影的效果,最大限度地提升了自动驾驶系统的开发效率;大陆集团的高算力集群,将开发周期从几周缩短至几个小时,使自动驾驶得以在中短期商业计划中落实;机器学习时间的缩短加快了新科技进入市场的速度;“扶摇”支持小鹏自动驾驶核心模型的训练时长从7天缩短至1小时内,大幅提速近170倍……
当前,一个不争的事实就是,在自动驾驶领域具有长期规划的车企,无论是造车新势力还是传统品牌,或者技术供应商,都在搭建自己的超算中心,以掌握稳定的算力资源,缩短开发周期,加快自动驾驶产品的上市。 相反,如果没有超算中心,那么自动驾驶训练速度将明显放缓,自动驾驶企业间的差距也将愈发明显。
用智算中心打造数据护城河 数字新基建逐步成为发展“标配”
自动驾驶发展至今,业界发现乘用车智能辅助驾驶是最有可能大规模铺开的商业场景。 据高工智能汽车研究院数据显示,2022年中国市场(不含进出口)乘用车前装标配搭载L2级辅助驾驶的搭载率,已经连续第二个月超过30%。 智研咨询数据显示,预计到2025年,全球新车L2自动驾驶的渗透率可达53.99%。
今年,城市导航辅助驾驶也开启了量产的征程。 西部证券预测,2023~2025年,国内市场上搭载城市导航辅助驾驶的车型将分别达到70万、169万和348万辆,占比将分别达到17%、40%和70%。
在城市导航辅助驾驶落地加速的背景下,更容易复制、拓展的重感知的方案,受到了更多关注。 在重感知技术路线下,面对“道路拓扑结构实时推断”的挑战,毫末的选择是在特征图基础上,以标精地图作为引导信息,使用自回归编解码网络,通过结构化的拓扑点序列解码,实现车道拓扑预测。 由此不难看出,业界逐渐达成共识的重感知路线,相比高精地图方案,更依赖算力加持。
人工智能是创新的加速器,智算中心则可以为各类技术创新提供支撑。 一方面,智算中心可以为构建安全可信、可复用的技术研发环境提供算力设施支撑,为各领域科技研发提供智能计算服务,加速科技研发的进程;另一方面,智算中心是新一代信息技术的集成应用载体,智算中心的快速建设推广与规模化应用将推动通信服务网络、大数据、人工智能等技术的快速迭代,从而促进技术创新。 自动驾驶数据是片段式的,特点是小文件多,达到百亿个,而且训练需要交换的数据多,智算中心可以提供充足的带宽,并且可以让自动驾驶模型拥有更好的并行计算框架,在训练的时候把硬件资源都利用起来。
2020年4月20日,国家发展改革委首次明确新型基础设施的范围,其中就包括以智能计算中心为代表的算力基础设施。 2023年1月10日,国家工业信息安全发展研究中心推出《智能计算中心2.0时代展望报告》,指出经过5年多发展,智算中心正由1.0粗放扩张阶段走向2.0精细规划阶段。
根据相关统计和测算,目前全国超过30个城市在建或筹建智算中心,未来5年我国智能算力规模年复合增长率将达52.3%。 智算中心的创新发展,将进一步为人工智能夯实“算力底座”,成为带动人工智能及相关产业快速发展的新引擎。
“我们测算,智算中心带来的成本优化是惊人的,将达到亿元级别。 ”这是今年1月,张凯提出的预测。 从目前及未来的规划量产规模来看,毫末自建智算中心可节约巨额成本;同时,其带来的效率提升也非常明显。
人工智能发展很快,新的算法层出不穷,需尽快引入新的技术和模型,与此同时,数据是智能化发展最大的驱动力,也占据了大量成本构成。 用自建智算中心来打造数据护城河,不仅能够完善产业智能生态,更能让企业在智能化方面占据先发优势,智算中心作为数字新基建,未来势必将引领自动驾驶技术持续迭代升级。
开年以来 ChatGPT、GPT-4 的相继面世再度掀起计算机科学领域通用人工智能(AGI)研究热潮,也不断刷新我们对 AI 的认知。
作为具有人类水平表现的大型多模态模型,GPT-4 被视为迈向 AGI 的重要一步,标志着创新范式的深度变革和生产力的重新定义,也必将带来更多元的产品迁移。
截至目前,全球已经有超百万家初创公司声称使用这一秘密武器来创造新产品,而这些产品将彻底改变从法律到股票交易,从游戏到医疗诊断的近乎一切领域。
尽管其中很多是营销泡沫,但与所有技术突破一样,总会存在炒作周期和意想不到的远期效果。
事实上在另一边,进入 2023 年智能汽车领域同样十分热闹。
智能化已然成为上海车展全场关注的最大焦点,除了激光雷达等关键传感器的单点式突破,各大巨头也纷纷展示智能驾驶全产品矩阵,城市场景辅助驾驶量产落地加速推进。
更加值得注意的是,BEV、大模型、超算中心等计算机热词正在与自动驾驶、行泊一体、城市 NOA 等智驾焦点火速排列组合,颇有相互交融、双向奔赴的味道。
在这背后,一方面是近年来智驾、智舱持续升级对 AI 在汽车场景落地的数据、算法、算力不断提出更高要求,另一方面,AGI 的重大突破也已将触角伸向智能汽车,将其视为实现闭环应用的重要场景,很多企业布局已经相当高调。
日前,商汤科技 SenseTime 举办技术交流日活动,分享了以「大模型+大算力」推进 AGI 发展的战略布局,并公布该战略下的「日日新 Sensenova」大模型体系。
在「大模型+大算力」加持下,本次上海车展商汤绝影驾、舱、云一体产品体系已全栈亮相,近 30 款合作量产车型集中展出,商汤也再度分享了智能汽车时代的 AGI 落地新思考。
本次上海车展亮相的部分绝影合作车型展示
算法:AI 正式步入大模型时代
如商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚所言,「AGI 催生了新的研究范式,即基于一个强大的多模态基模型,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。」
通用大模型并非为自动驾驶而生,或为满足自动驾驶的特定任务需求而设计。 但智能驾驶开发的诸多新需求已在推动算法从专用小模型向通用大模型快速演进。
首先是应对海量数据处理和 Corner Case 问题的迫切需求。
对于感知系统低频出现但至关重要的小目标及带来的潜在安全隐患,算法开发需要面对海量数据,传统的 AI 小模型将难以同时处理大数据量和高复杂度的任务。 通用大模型则可用在长尾目标的初筛过程,并叠加语料文字处理得到很好的效果。
再比如智驾算法开发对自动化数据标注、降低人工成本的诉求。 相比于人工标注,通用大模型将自动化对海量数据完成标注任务,大幅降低标注数据获取的时间成本和本身的金钱成本,从而缩短研发周期、提升成本效益。
处于类似的考量,近年来国内外巨头企业已围绕大模型纷纷展开各自智驾布局。
继 Google 于 2017 年提出将 Transformer 结构应用在 CV 领域图像分类,大模型已在 GPT-2、GPT-3、BERT 等当中不断证明实力,特斯拉率先站台 Transformer 大模型征战图像视觉。
国内企业也紧随其后:
毫末智行已宣布自动驾驶认知大模型正式升级为 DriveGPT,网络表示利用大模型来提升自动驾驶感知能力并将大模型运用到数据挖掘,华为也已宣布加入大模型争霸赛,自研「盘古」即将对外上线。
作为行业领先的人工智能公司,商汤在大模型领域可谓乘风破浪,过去一两年则全面将大模型能力在各业务线 20 多个场景落地,包括智能驾驶。
商汤「日日新 SenseNova」大模型体系背后是大模型研发中深厚的积累。 商汤有自己的全栈大模型研发体系,其中就包括针对大模型的底层训练及实施过程中的各种系统性优化。
例如,商汤近期向社区发布的用于真实感知、重建和生成的多模态的数据集 OmniObject3D 中包含 190 类 6000 个物体,数据质量非常高。
再比如,商汤在 2019 年就已首次发布 10 亿参数的视觉大模型,到 2022 年参数规模已达到 320 亿,这也是世界上迄今为止最大的视觉模型。
此外,商汤也在智驾领域持续展示大模型能力。 2021 年开发的 BEV 感知算法在 Waymo 挑战赛以绝对优势取得冠军,2021 年 BEV Former 的 Transformer 结构至今仍是行业最有影响力的 BEV 工作,今年开发的 UniAD 是业内首个感知决策一体化的端到端自动驾驶解决方案。
在技术实力的另一端是量产进度。商汤也给出了自己的智能驾驶量产公式:
自动驾驶技术能力=场景数据 x 数据获取效率 x 数据利用效率² =场景数据 x 数据获取效率 x 先进算法 x 先进算力。
而先进的算法大模型不仅将通过跨行业数据汇聚提升驾驶场景数据资源,通过数据闭环开发模式和自动数据标注提升数据获取效率,更将大幅提升感知精度和感知丰富度进而成倍提升数据利用效率。
依托原创 AI 算法和模型积累,商汤领先的 BEV 感知算法推进国内首批量产应用,并采用 Domain Adaption 算法有效解决跨域泛化问题。 商汤首创的自动驾驶 GOP 感知体系将目标数据获取的人力成本降低 94%,实现低成本的车端模型开发,目前也已投入量产应用。
算力:智能汽车时代的重要基础设施
随电子电气架构技术由分布式不断向集中式演进,大算力芯片成为新型电子电气架构实现的物理基础。
近年来车端芯片算力发展突飞猛进,如英伟达规划中的 Atlan 单颗芯片算力超 1000TOPS,THOR 单颗算力超 2000TOPS,将大幅提升单车感知决策能力。
而在云端,AGI 在自动驾驶、网联等场景的泛化应用将提出比车端指数级更高的算力要求——从数据标注到模型训练,从场景仿真到算法迭代。
算力将是智能汽车时代的新型基础设施。
在此背景下,近年来主流企业纷纷开启双线并行探索,车端自研算力平台,云端建立超算中心。 而进入大模型时代后,数据量随着多模态的引入也将大规模增长,因此必然也会导致 AGI 对算力需求的剧增。
可以看到,英伟达车端云端同步布局并将提供端到端的全栈式 AI 加速计算解决方案,特斯拉也早在 2021 年 8 月发布自研云端超算中心 Dojo。
据近期报道,埃隆·马斯克也将成立一家人工智能公司来与 OpenAI 竞争,已购买数千个英伟达 GPU 并一直招募 AI 研究人员和工程师。
国内方面,吉利、蔚来、特斯拉、毫末智行、小鹏等企业也已跟进布局云端算力集群,投入巨大以提升智驾开发算力储备。
对于商汤来说,如果说大模型将是支撑智能驾驶的上层建筑,那么大算力就是数字基座。
商汤科技董事长兼 CEO 徐立表示,目前大模型对基础算力、基础设施的需求非常旺盛,基础算力对并行效率的要求也非常高,但真正好用的基础设施其实十分稀缺。
出于这一原因,商汤历时五年自建了业界领先的 AI 大装置 SenseCore,完成 2.7 万块 GPU 的部署并实现 5.0 exa FLOPS 的算力输出能力,是亚洲目前最大的智能计算平台之一,可同步支持 20 个千亿规模参数量的超大模型同时训练。
位于上海临港的 AIDC 人工智能计算中心将为智能汽车的数据存储、标注、脱敏、仿真训练、算法迭代到部署的闭环提供算力支持,打通基于数据驱动的算法生产全流程,加速高级别智能驾驶技术的 AI 模型生产和持续迭代,推动实现规模化量产。
在 AIDC 的基础上,AI 大装置也将提供支持大模型生产的一系列服务:
如此规模的算力设施即使特斯拉同期也尚难以望其项背,也必将推动大模型的高效闭环。
「大模型+大算力」推动智能汽车行业整体进程
汽车行业正在面临百年未有之大变革。 尽管此次以「大模型+大算力」推进 AGI 发展是商汤提出的战略布局,但事实上,这一理念早已在行业层面达成共识。
基于感知、决策规控和 AI 云三大核心能力,商汤「大模型+大算力」已赋能绝影驾、舱、云三位一体产品体系量产落地:
除智能驾驶领域的全栈能力和行泊一体量产解决方案外,「大模型+大算力」也正在助力商汤打造智能座舱跨场景生态。
车展期间,与商汤「日日新 SenseNova」大模型体系深度融合的绝影未来展示舱升级亮相,语言大模型「商汤商量 SenseChat」以及 AIGC 文生图平台「商汤秒画 SenseMirage」也已上车,多点融合重构人车交互方式,打造第三空间。
以「商量」为例,作为千亿级参数的自然语言处理模型,其使用大量数据训练并充分考虑中文语境,展示出出色的多轮对话和超长文本的理解能力。
商汤也展示了语言大模型支持的诸多汽车场景创新应用,如在行车过程中化身「邮件助手」自动提炼关键信息,作为「会议助理」自动生成会议纪要,大大节省用户行车时处理工作的时间和精力,为未来出行的应用场景拓展带来丰富的想象空间。
此外,以人工智能大模型开发、生产、应用为核心,一站式
上一篇:向左还是向右直播电商
内容声明:
1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违法信息,如您发现违法内容,请联系我们进行举报处理!
4、本文地址:https://nav.52hwl.com/article/d9f582343fa6a89008b0.html,复制请保留版权链接!
阿至在深圳横岗眼镜产业带的本文分析充分揭示了这一区域眼镜制造业的独特发展现状和挑战,横岗眼镜产业以其高效的生产能力和灵活的供应链管理而闻名,例如,面对零件短缺的情况,企业可以在短时间内通过周边配件厂快速补齐,展示了其敏捷应对市场需求的能力,龙岗区以横岗街道及园山街道为核心,聚集了约1200家眼镜生产企业,年产量超过1.25亿副眼镜,出...。
2024-07-26 12:04:39
游戏厂商直播带货正成为当今互联网营销的热点,最近的一些例子显示,这种方式不仅仅是提高销售额,还能极大地增加品牌曝光和用户参与度,我们来看6月23日晚上的例子,当LOL明星选手FAKER在英雄联盟官方直播间以中文进行带货直播时,观看人数迅速攀升至14.8万人,尽管语言障碍存在,但FAKER的努力和互动精彩程度不仅包括直播整活,还涉及复刻...。
2024-07-26 07:22:10
赛力斯集团宣布以250亿元人民币的代价,收购华为旗下包括919项商标和44项外观设计专利在内的AITO问界品牌资产,引发了广泛的讨论和分析,此次收购消息在华为粉丝和问界车主中引起了极大的反响,赛力斯股价的持续下跌反映出市场对此交易的看法,同时也反映了不同声音在股市和社交媒体上的对决,对于华为来说,这次交易是否意味着他们真正放弃了问界品...。
2024-07-26 06:20:35
张峻回归富德系掌门人身份已有20个月,期间富德系旗下公司高管屡次调整,最近,富德生命人寿宣布徐文渊自2024年7月10日起正式接任总经理一职,此举得到监管部门批复和公司内部任命的支持,根据早前的公告,方力因个人原因辞去了董事、董事长及法定代表人的职务,随后徐文渊代行富德生命人寿董事长职责,徐文渊作为张峻回归后重点培养的80后高管,承担...。
2024-07-26 01:41:22
最近的36氪出海网站报道了几个引人注目的新闻,首先是关于2025年首届电竞奥运会将在沙特举办的消息,这一决定是在国际奥委会第142次全会上通过的,引起了广泛关注和讨论,另一个重要新闻是特斯拉CEO埃隆·马斯克在财报电话会议上的发言,马斯克透露,特斯拉正计划在年底前在中国和欧盟获得全自动驾驶系统的监管批准,特斯拉的第二季度财报显示,尽管...。
2024-07-26 00:09:40
最近半夜在被窝里刷短视频,笑着笑着就哭了,真不是夸张,是被AI给搞哭了,你最近有没有被#AI修复老照片的这个爷爷刷屏啊,最开始一位博主分享自己制作的AI视频,让老照片重新活了过来,在温暖的音乐里,好像一下子回到了童真快乐的小时候,看到这个效果,网友们纷纷拿着自己珍藏的照片求生成,有的是希望再见到自己已故的妈妈;有的是拿出和奶奶的唯一一...。
2024-07-25 23:40:59
本文分析了英伟达在2025财年第一季度业绩超预期的原因,主要集中在AI加速扩张推动数据中心业务表现亮眼,报告显示,英伟达本季度营收达260.4亿美元,同比增长262%,其中数据中心业务占比87%,同比增长427%,净利润更是同比增长628%,创下惊人增长,在市场预期业绩飙升的情况下,英伟达股价盘前仅微涨0.02%,但在业绩公布后,股价...。
2024-05-29 09:44:54
回复,文章详细介绍了农夫山泉在饮用水市场的新举措,特别是重新推出绿瓶纯净水产品,文章指出,农夫山泉绿瓶纯净水的第一批货源已售罄,显示了消费者对这一新品的热情,回顾到2000年的水市场竞争,农夫山泉曾率先转向生产天然水而放弃纯净水,但如今却意外地重新引入绿瓶纯净水,引发了市场和消费者的关注,文章还提到了一些水站和超市的反馈,显示了消费者...。
2024-05-29 08:50:49
在很多消费电子产品,屏幕都是决定产品体验的关键要素,不难理解,毕竟绝大部分产品的体验都建立在用户和产品的交互上,而通过屏幕进行的交互无疑是目前最直接、高效,也最主流的方式,这也是为什么每年CES消费电子展等活动上,经常能看到消费电子厂商经常,卷,屏幕技术和形态,有时候,甚至是物理意义上的,卷,2019年的CES上,LG就发布了全球首...。
2024-05-29 07:52:15
从8848到8849,三防手机市场新生曾经以高端奢华定位引领风潮的8848手机,在短短几年间由风靡一时转变为黯然失色,即使如此,其品牌残留的价值仍吸引了目光,最近,国内电商平台上出现了一款名为8849的三防手机,与8848手机毫无关系,品牌和定位完全不同,命名或许只是为了吸引流量,随着2024年手机市场的洗牌接近尾声,8849尝试以三...。
2024-05-29 05:25:18
引言,最近,OpenAI在人工智能领域备受瞩目,无论是其产品发布还是公司内部动态,5月14日,OpenAI发布了全新的GPT,4o全能模型,预示着人工智能全感知时代的到来,令人意外的是,次日,OpenAI联合创始人兼首席科学家IlyaSutskever宣布离开公司,这一消息引起了人们的广泛关注,OpenAI的另一位重要人物JanLei...。
2024-05-29 04:09:02
5月16日,京东,JD.O、9618.HK,发布了2024年一季度财报,报告显示,京东一季度收入同比增长7.0%,达到2600亿元;净利润同比增长13.9%,达到71亿元;每股收益为5.65元,这一成绩超出了FactSet调查的分析师之前的预期,他们预计该季度京东的收入为2581亿元,每股收益为4.67元,具体来看,包括电子、家用电器...。
2024-05-29 03:23:44
本文详细分析了过去七年间朋友圈在图像编辑领域的发展变化,探讨了AI时代带来的新趋势和影响,从最初的帅气军装照H5活动到如今粘土特效照片的流行,文章呈现了不同时期朋友圈内容的演变,其中,强调了AI写真照在过去几个月内的盛行,以及粘土特效照片的出现带来的新潮流,文章提到了妙鸭相机和Remini的粘土特效在社交圈中引起的热度,以及不同平台上...。
2024-05-29 01:45:09
凯雷接盘日本1200家肯德基前脚卖掉麦当劳中国,凯雷后脚就买入了肯德基日本,凯雷个人宣布,方案经过地下要约收买的模式收买日本肯德基公司,并将其私有化退市,本次买卖总价约1300亿日元,约合人民币60亿元,此前,三菱商事是肯德基日本最大股东,过去五十多年,三菱商事不时介入日本肯德基的治理,直到往年选择发售其持有的一切股份,目前,肯德基...。
2024-05-28 21:11:50
根据最新的财务报告,哔哩哔哩,简称B站,2024年Q1取得了一些积极的进展和一些挑战,其中,两个好消息是经调整净亏损同比减少56%,营业额同比增长12%,毛利润同比增长45%,显示出B站不仅成功降低成本,还提升了盈利能力;两个坏消息是游戏业务再次出现双位数亏损和收入分成成本同比增长13%,值得注意的是,与去年同期相比,2023年Q1的...。
2024-05-28 21:01:54
就在上周,中国三家互联网传统豪强——腾讯、阿里巴巴和百度曾经颁布终了各自的一季报,无论是从字里行间的叙说、数据出现的趋向、还是业绩会上的表态,反求诸己曾经成为这三家大厂分歧的关键词,梳理外部体系,从自身登程去寻觅业务的增量,往往会被解读为增长到头、或是外部压力过大之下的受迫性手腕,无论如何,都不太会被市场解读为太侧面的信息;而在这次三...。
2024-05-28 20:02:20
根据5月17日的消息,AI教父GeoffreyHinton参加了一次访谈,提到了他对大型神经网络、多模态学习、模拟计算、AI安全等技术发展的看法,以及他与人工智能的接触经历和与Ilya初次相识的回忆,访谈的提问者是一位才华横溢的创业者JoelHellermark,他是SanaAI的创始人兼首席执行官,Sana是一家领先的人工智能公司,...。
2024-05-28 19:48:29
本文详细介绍了天津大学牵头设立的脑机交互与人机共融海河实验室及相关合作项目,特别突出了设立规模为10亿元的脑机海河实验室基金,文章指出,高校如天津大学、复旦大学、清华大学等逐渐进入创投圈,成为科技成果转化的新力量,脑机海河实验室致力于在脑机交互与人机共融领域开展工程应用,并已成为我国脑机交互领域的重要创新源头,合作项目中包括成立京津冀...。
2024-05-28 17:00:49
SEOSEOO,袋鼠皮具,SEOSEOO,袋鼠皮具,皮具品牌,皮具箱包SEOSEOO是一家澳大利亚享有国际知名度的时尚品牌,由著名的澳洲时尚设计大师兼动物保护活动家Seoseooo,苏索,创立,Seoseoo袋鼠皮具作为该品牌的代表产品,定位为低端档次,是澳大利亚著名的皮具品牌之一,在国际市场上享有极高声誉,设计师为动物保护家Seo...。
2024-04-14 00:52:27
本文主要讨论了网站的分类和不同类型的搜索引擎,以及相关建站类型的特点和优点,在引言中提到了网站被划分为几种类型,包括品牌型网站、展示型网站、营销型网站、电商型网站和门户型网站,品牌型网站注重展示企业牌形象,展示型网站主要展示企业产品,营销型网站则注重营销和获取销售线索,电商型网站提供在线购物功能,门户型网站则以资讯为重点,接着,本文列...。
2024-04-13 19:17:19
提交网站到搜索引擎的方法有多种途径,首先可以通过站长工具平台,这些搜索引擎都提供了官方的站长工具,如网络、360、谷歌等,通过这些平台可以提交网站链接,可以通过发布博文、软文、帖子等外链形式来吸引搜索引擎蜘蛛抓取,从而提高网站收录的效果,总体来说,不同搜索引擎对新网站的收录速度有所差异,例如网络和360可能在3天内就能完成收录,视频到...。
2024-04-11 19:22:16
根据网络收录算法,以下是关于如何让网络快速收录新站的一些建议,1.网站域名选择,网站的域名应与网站主题相关,并利用301重定向到PR值高于4的站点,有助于网络对站点的信誉评价,2.提交网站,完成网站建设后,及时提交给各大搜索引擎和目录,以加速收录,3.内容原创性,建设网站时应尽量创作原创文章,而不是复制互联网上的内容,因为搜索引擎更青...。
2024-04-11 18:46:51
原题目,盘前涨超1%!英伟达能撕掉第二个思科的标签吗英伟达视觉中国资料图AI,人工默认,芯片龙头英伟达股价在一轮大幅下跌后出现降温势头,一些人开局担忧AI泡沫的来到,外地时期3月8日,在公司股价屡翻新高、市值逐渐迫近苹果后,英伟达,Nasdaq,NVDA,的股价却出现了大幅动摇,当日跌5.55%收于每股875.28美元,总市值2.19...。
2024-03-11 22:00:08
被收录的网站怎样没了被收录的网站怎样没了呢我的网站收藏突然不见了,我想知道为什么,收录在网站首页,然而不收录内页的要素有以下几点,1,首页由于权重高收录很快,内页曾经被索引但没有颁布,属于和网络建设信赖的期间,2.网站结构不友好,过多的js代码,flash和iframe框架会造成收录艰巨,规定是不是写错了,比如,User,agent,...。
2024-02-27 10:38:05
新建的网站如何可以让网络极速收录呢?网站收录关于那些新入门的站长来说就有些艰巨了,没有有阅历的网站晚辈来带,没有足够微弱的链接,想让各大搜索引擎立刻收录你的小站谈何容易呀!呵呵,万事扫尾难,世事仿佛并非如此,然而想让网络收录你的新站却是相当容易的,上方的我来谈一些阅历可以让你的网站迅速被网络收录,一、网站域名,网站的域名必定要和网站主...。
2024-02-27 03:06:47
罕用的SEO工具备哪些作为团体站长来说,在给网站SEO优化的时刻,把握一些罕用的seo工具是十分必要的,可以给上班带来事倍功半的成果,即可以提高上班效率,同时有些工具还是比拟准确的,和手工查问的数据基本上分歧,我罕用的一些seo工具如下,1、网络指数,1,可以很好的知道一个关键词一天的搜查量,开掘新的关键词可以参考这个数据,2,可以...。
2024-02-26 22:58:30
根据最新曝光的消息,王栎鑫的新恋情引起了媒体和粉丝的广泛关注,他被拍到与一位神秘女子牵手回到住处,引发了人们对他们关系的猜测,在这次曝光中,王栎鑫身穿深色休闲装,戴着鸭舌帽和口罩,几乎将自己完全包裹起来,难以被一般人认出,而陪伴他回家的女子也穿着休闲装,两人手牵着手走在一起,看起来非常般配,虽然女方的正面照没有被曝光,但从描述中可以猜...。
2024-02-11 22:45:28
马克龙39岁当总统,创下法国最年轻总统的纪录,现在,法国总理也创了纪录,新总理阿塔尔,只有34岁,很多人34岁,可能还在读书,可能还未结婚,可能还在努力挣钱还房贷,但1989年出生的阿塔尔,已经当上了一个大国的总理,当然,一方面,阿塔尔很有能力,尤其是政治能力,另一方面,或许也是最重要的方面,他跟对了人,被认为是马克龙的最佳化身,也是...。
2024-01-13 19:44:57
家里面最牛逼的还得是爸爸,就凭这么一道简简单单的菜,就把老妈拿捏的ss的!爸妈又闹了点小别扭,今天必须得是我爸爸下厨!不然他今天一天都不能出门去钓鱼!哈哈哈!有没有人跟我一样,特别喜欢看爸妈笑话!,感觉我好不孝顺呀,但是我爸今天做的这个线椒蛋,好好吃!蛋香味十足,椒香酥脆,香辣香辣的,好吃还不腻!最主要关键的是,制作方法超级简单!线椒...。
2024-01-13 18:48:54
这个冬天最火的城市就是哈尔滨了,真是火出天际,火向全世界了,提到哈尔滨就会想到广西的,小沙糖桔,,11个小朋友最小的只有3岁半,却能离开父母,跟着老师勇闯哈尔滨、漠河,可以说是收获满满,一生获益,但是要说起尔滨的恋爱脑,就不得不提冰封玫瑰,美的令人震撼!无法用言语来形容,不多说,继续上图,连远处的天际都被染红了,有网友问,这些都是真花...。
2024-01-13 18:46:54