定制报告-个性化定制-按需专项定制研究报告
行业报告、薪酬报告
联系:400-6363-638
《佐思汽研:2024汽车AI大模型TOP10分析报告(59页).pdf》由会员分享,可在线阅读,更多相关《佐思汽研:2024汽车AI大模型TOP10分析报告(59页).pdf(59页珍藏版)》请在本站上搜索。
1、产业研究 战略规划 技术咨询2预训练语言模型预 训 练微 调将模型在大规模无标注数据上进行自监督训练得到预训练模型将模型在下游各种自然语言处理任务上的小规模有标注数据进行微调得到适配模型AI大模型就是预训练语言模型通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型预训练语模型“预训练+微调”技术范式规模标注本数据模型预训练不同特定任务有标注训练数据模型微调测试数据最终模型从海量数据中自动学习知识Big-data Driven,模型基于大规模语料训练而成;Multi-tasks Adaptive,支持多种任务,包括自然语言生成NLG和自然语言理解NLU类的任务;Few-shot(Zer
2、o-shot),在少甚至无标注样本的条件下支持推理(自监督学习)。产业研究 战略规划 技术咨询3大模型发展历程众多预训练模型相继涌现,OpenAI 以 GPT2、GPT-3、ChatGPT 等系列模型为代表,持续引领大模型时代的浪潮2017 年,Google提出Transformer 框架在机器翻译中取得显著进步,其分布式学习和强大编码能力受到广泛关注。2018 年 Google 和 OpenAI 基于Transformer 提出了预训练语言模型 BERT 和 GPT,显著提高了NLP 任务的性能,并展示出广泛的通用性。AlexNet(图灵奖得主Hinton)CAN(Gioodfellow.图
3、灵奖得主Bengio)Word2Vec(Google.引用78550)Attention(图灵奖得主Bengio)ResNet(MSR.引用183222)Transformer(Google.引用91332)BERT(Google)GPT(OpenAI)GPT-2(OpenAI)GPT-3(OpenAI)FoundationModel(Stanford)PaLM(Google)ChatGPT(OpenAI)ViT(Google)DALL E2(OpenAI)GPT-4V(OpenAI)ERNIE(百度)CPM(智源)GLM(洁华)20122013201420152016201720182019
4、2020202220222023跨模态模型预训练模型大模型计算机视觉自然语言处理认知感知来源:大模型驱动的群体智能行业白皮书产业研究 战略规划 技术咨询4大模型参数规模不断增长,推动 AIGC技术升级。AIGC技术发展的背后是大模型(Foundation Models)技术的持续迭代。从 2017 年 Transformer 结构的提出,加速了深度学习模型的参数学习能力。另一方面,GPU算力也在指数级增长。图1:2018-2023 年模型参数规模变化图 来源:中国人工智能系列白皮书图2:CPU与GPU算力演进比较 来源:techovedas,国元证券产业研究 战略规划 技术咨询5英伟达每2年推
5、出一个微架构,对产品线进行升级,6 月 2 日,英伟达在 Computex 2024大会上发布了至2027年的芯片路线图,GPU迭代周期由 2年缩短到1年,走类似英特尔的Tick-Tock 模式(一年工艺一年架构)。同时,英伟达践行“Buy More Save More”让算力成本指数级下降。图3:英伟达GPU架构演进图图4:训练芯片算力成本呈下降趋势 我国高端GPU芯片进口从2019年以来就一直有被限制,只是之前主要针对的厂商是AMD,在应用场景上又以超算中心为主;2023年10月17日,美国加强了面向中国市场的AI芯片禁令。其中明确将性能、密度作为出口管制标准,将单芯片超过300teraf
6、lops算力,以及性能密度超过每平方毫米370 gigaflops的芯片都纳入了禁止出口行列。禁令涉及A100、H100等主流AI训练用英伟达GPU。来源:浙商证券研究所、华泰证券研究所产业研究 战略规划 技术咨询6中国科技企业的市场导向和商业化压力常使得大厂技术部门在追求KPI的同时,难以专注于前言技术的研发中国科技企业较少开展全球化经营,导致在营收、人才获取、全球化商业场景方面制约明显发展AI大模型相关的软硬件技术需要大量人才,大量的优秀本科生选择出国深造,而其中超过60%的毕业生选择在海外工作,导致长期的优秀人才流失。另外在中西方脱钩的背景下,美西方限制了对中国高科技人才的培养与学术合作
7、交流行业高精数据短缺中国在高质量数据获取方面面临挑战,主要由于缺乏完善的数据法规、行业内固有的竞争性保密性,对开源合作文化的不足相较于英文、中文高质量开源数据非常少,特别是在构建通用领域大模型的百科类、问答类、图书贡献、学术论文、报告杂志等高质量内容由于各类政策管制和商业模式复制壁垒低,导致的基础数据和语言语料同质化数据人才中文语料短缺数据和语料的同质化商业化压力大全球化经营人才流失与人才短缺产业研究 战略规划 技术咨询7科技大厂创业新势力产业研究 战略规划 技术咨询8综合各测评平台的方法论来看,在基础能力的测评维度基本相同,仅测评数据集和评估权重占比不同;而在基础能力之外,各测评平台侧重点不
8、同?OpenCompass 2.0?AgentIDCTo C通用场景类To B特定行业类Agent特定行业类超长文本道德责任Language?Knowledge?Reason?Math?Code?Other?产业研究 战略规划 技术咨询9?问答理解类推理类数学类创作表达类代码类?问答理解类常识、专业知识、多语言、多模态、角色扮演+多轮对话、安全陷阱推理类情感推理、演绎推理、逻辑推理、归纳推理、类比推理创作表达类文字创作&创意、内容改写/续写、修改/润色、文字处理、编辑/语义匹配、摘要提取、关键、字提炼、标题生成、文本风格迁移、图像创作、短视频创作(文生视频)、其他创作(文学艺术、商业通用)数学
9、类小学数学、初中数学高中数学、高等数学推理类代码生成、编程翻译代码解释、代码纠错代码自动补全生成代码文档单元测试toC通用场景类生活助手办公工具toB特定行业类工业:产品设计辅助&生产规划教育:智能问答、试题生成法律:智能法律助手,法律咨询医疗:问诊,用药咨询科研金融:推荐场景金融/咨询服务:财报/市场分析互联网/媒体:文案/海报设计、广告词创作、视频生成场景零售/电商:客服问答IDC测试题目分为基础能力和应用能力两个大类共7个维度IDC 采取实测的方式,成立产品测试团队,通过多个维度对基础大模型及相关产品进行评测,并邀请外部专家团队深入分析各个产品答案准确性、合理性等,在审核委员会的监督下,
10、最终得出各厂商的评估结果,供用户选型参考。产业研究 战略规划 技术咨询10我们跟踪研究了多个通用大模型,其中包括:Qwen-Max-0428SenseChat V5Ernie-4.0Tencent HunyuanSpark 4.0 UltraYi-Large GLM-4 Pangu 5.0Baichuan4CongRong 2.0 产业研究 战略规划 技术咨询11在2024年,大模型的技术发展将趋向多功能与小型化,同时产业端将强调自主研发和行业标准化?模型整合统一未来的技术演进方向是实现大模型底层框架的整合与标准化,从多样的架构(如双编码器、单边解码等)转向统的、效率最优化的开源底层框架,提升
11、模型的通性和可维护性。参数规模扩展为确保模型质量和性能,未来的大模型将采更深层的络结构和更庞的数据集进预训练,尤其在数据量和参数量上将迎来显著跃升。多模态融合大模型将逐渐融入图、频、视频等多种模态信息,实现跨模态的交互与理解,从拓宽其应场景和实价值。大模型小模型化在产业应层,结合底层基础大模型和针对特定业的精简数据微调,将训练出更为实用、更易于产业落地的小型化大模型。?国产AI芯片自主研发为确保中国大模型的长远发展和避免外部制裁风险,国内AI计算芯片的自主研发将成为关键战略方向。数据产权标准深化优化和完善现有数据标准和规范,是 推动大模型“燃料”质量提升和数量增长的重要驱动力,在2024年将作
12、为产业发展的首要任务。“套壳”微调策略为满足产业实际需求并适应中小企业的发展特点,“套壳”微调(即在现有大模型基础上进针对性调整)将成为除行业巨头外企业的主要发展策略。人工智能伦理责任随着大模型性能的飞速提升和实性的增强,确保AI技术与社会伦理道德标准相致将成为模型持续发展的关键考量因素。来源:沙利文中国大模型测评报告产业研究 战略规划 技术咨询12来源:面壁智能公众号?MMLU?大模型的知识密度每8个月左右会翻一倍,同等知识量的模型参数量会减半右图显示了过去四年大语言模型在 MMLU 榜单(评估大模型知识能力)上的性能表现,红色曲线表明,大模型的知识密度平均每8个月左右会翻一倍,同等知识量的
13、模型其参数量会减半知识密度=知识量/参数量产业研究 战略规划 技术咨询13来源:面壁智能公众号?GPT-4V?在 2 0 2 4 年 5 月 发 布 的 多 模 态 大 模 型 MiniCPM-Llama3-V 2.5 仅凭 8B 参数,实现了“以最小参数,撬动最强性能”的最佳平衡点。面壁智能迭代的最新版本MiniCPM-S 1.2B采用了高度稀疏架构,通过将激活函数替换为 ReLU及通过带渐进约束的稀疏感知训练,巧妙地解决了此前主流大模型在稀疏激活上面临的困境。在通用大模型越来越卷参数规模和算力的情况下,如何通过架构和算法创新去规避算力和成本的短板,我们认为小参数、高性能模型是一个重要的趋势
14、,特别对于手机、车载终端而言,这样的端侧模型具有现实的需求。产业研究 战略规划 技术咨询14来源:文心一言官网与百度的方案类似,各科技大厂基于云平台、算力基础设施和大模型技术相结合,推动行业应用落地,汽车产业链当然也是最重要的落地场景之一。?文心一言沿袭了 ERNIE 3.0 的海量无监督文本与大规模知识图谱的平行预训练算法,模型结构上使用兼顾语言理解与语言生成的统一预训练框架。为提升模型语言理解与生成能力,研究团队进一步设计了可控和可信学习算法。?结合百度飞桨自适应大规模分布式训练技术和“鹏城云脑”领先算力集群,解决了超大模型训练中的多个公认技术难题。在应用上,首创大模型在线蒸馏框架,大幅降
15、低了大模型落地成本产业研究 战略规划 技术咨询15?规模法则驱动下,海量的算力成为开发优秀AI算法的基础目前海外特斯拉、Wayve、Comma.ai,国内包括小鹏、理想、华为、蔚来汽车、元戎启行、商汤、地平线等诸多玩家都提出自己的端到端自动驾驶方案,在算法上端到端已经成为大势所趋。但在发展路径上,行业预计也会经历渐进的过程。早期玩家致力于将算法从模块化架构平稳过渡到端到端,远期大语言模型和端到端基础模型有望结合形成“系统一”和“系统二”共同赋能自动驾驶,最终强大的通用人工智能(AGI)或许可覆盖所有驾驶能力。对自动驾驶而言,与所有AI应用类似,算力、算法、和数据三要素都必不可少?数据的体量、质
16、量、以及收集方式、处理方式、以及模型的训练和验证体系都考验着开发者的技术和工程能力?如何构建一个性能优异且稳定可靠的算法来支撑功能落地,亦尤为关键端 到 端 模 型多模态大语言模型AGI通用世界模型产业研究 战略规划 技术咨询16?竞争因素评选原则 四种竞争要素缺一不可;持续的产品迭代能力;逐步建立于自研芯片或者国产芯片的算力建设;汽车行业的合作与量产应用;多场景的覆盖能力与量产应用;持续的产品迭代能力;走向通用世界模型的潜力;单一场景的技术积累;广泛的汽车行业客户与量产应用;可以允许“套壳”与API调用;单场景技术方向的领先发展潜力;数据服务场景场景数据算法算力算法数据框架产业研究 战略规划
17、 技术咨询17?Tier1?产业研究 战略规划 技术咨询181?供应商1供应商3供应商22?主机厂1主机厂23?主机厂N公司2公司1?产业研究 战略规划 技术咨询19Ernie-4.0SenseChat V5Tencent HunyuanSpark 4.0 UltraPangu 5.0FSD V12.3XGPTDrive GPT2.0DFM-2MiniCPM百度BAIDU?产业研究 战略规划 技术咨询212024年6月28日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAVE SUMMIT深度学习开发者大会2024上宣布了文心一言的最新数据,并正式发布文心大模型4.0 Tu
18、rbo、飞桨框架3.0等最新技术2019.03中国首个正式开放的预训练模型Ernie1.02019.07全球首个大规模隐变量对话模型Plato2021.07全球首个知识增强百亿大模型Ernie3.02021.09全球首个百亿中英对话生成模型Plato-XL2021.12全球最大中文跨模态生成模型Ernie-viLG2021.12全球首个知识增强千亿大模型鹏程百度文心2023.03.16文心一言大模型3.02023.10文心一言大模型4.02024.06.28文心一言大模型4.0 Turbo“文心一言”发展历程产业研究 战略规划 技术咨询22?&?航空航天气象&海洋能源动力材料研发新药研发疫苗设
19、计飞行器&汽车风阻预测座舱散热天气预报凸包能预测蛋白质结构预测?数据驱动机理驱动数理融合?PaddleScience PaddleHelix DeepXDENvidia ModulusNvidia ModulusDeePMD-kit算力中心智算中心?算子库高阶自动微分 原生复数机制 线性代数运算 计算库概率统计 方程符号化定义神经算子学习 大范围分布式并行计算编译器硬件算子适配飞桨深度学习框架?百度自研昆仑芯,同时也与国内外机构合作,搭建算力中心和异构计算平台?其飞桨框架已经更新到3.0版本。实现大模型混合并行训练策略、编译器自动优化、大模型多硬件适配和推训一体?开发飞桨的各类组建?文心一言推
20、出多种功能各有侧重的文心大模型,包括文心轻量级、文心3.5、文心4.0、文心4.0工具版。其中,文心轻量级模型适合解决确定场景的问题;文心3.5适用于日常信息处理和文本生成任务;文心4.0模型参数更大、具备更强的理解能力、逻辑推理能力与更丰富的知识,提供专业且深入的帮助;文心4.0工具版则基于智能体技术,善于综合运用多种工具和数据,按要求完成非常复杂的任务。最新发布的文心4.0 Turbo则是文心4.0的升级版。产业研究 战略规划 技术咨询23IntelNVIDIAArmCPU:飞腾、海光、鲲鹏、龙芯、申威操作系统:麒麟、统信、普华AI芯片:昆仑芯、海光、寒武纪、瑞芯微、算能、高通、Graph
21、core、Ambarella与浪潮、中科曙光等服务器厂商合作形成软硬一体的全栈AI基础设施工具与组建端到端开发套件基础模型库核心框架动化深度学习强化学习联邦学习图学习科学计算量机器学习物计算可视化分析具云上部署编排具安全与隐私具低代码开发具预训练模型应具资源管理与调度具语音理解文字识别图像分类目标检测图像生成大模型推训一体图像分割自然语言处理计算机视觉语音时间序列文心大模型推荐动态图大规模分布式训练产业级数据处理静态图模型压缩边缘与移动端推理引擎前端推理引擎服务器推理引擎服务化部署全场景统一部署学习与实训社区开发训练推理部署?产业研究 战略规划 技术咨询24?能源金融航天制造传媒城市社科影视自
22、然语言处理视觉跨模态生物计算ERNIE 3.0 Zeus|鹏城-百度文心ERNIE 3.5|ERNIE 4.0文心一言 ERNIE Bot对话 PLATO-XL|搜索 ERNIE-Search跨语言 ERNIE-M|代码 ERNIE-Code语言理解与生成 ERNIEOCR图像表征学习VIMER-StrucTexT多任务视觉表征学习VIMER-UFO视觉处理多任务学习VIMER-TCIR自监督视觉表征学习VIMER-CAE文档智能ERNIE-Layout文图生成ERNIE-ViLG视觉-语言ERNIE-ViL语言-语言ERNIE-SAT化合物表征学习HelixGEM蛋白质结构预测HelixFo
23、ld单序列蛋白质结构预测HelixFoldSingle产业研究 战略规划 技术咨询25名称:知识增强的汽车行业大模型吉利-百度文心与主机厂合作落地使用了百度文心ERNIE 3.0大模型,在智能客服知识库扩充、车载语音系统短答案生成、汽车领域知识库构建三个任务上进行了微调与验证。该大模型在2300万条吉利汽车专业领域无标注数据上进行模型预训练,并联合双方的人工智能专家和汽车行业专家一起研发。百度使用半监督、自训练方案对大模型进行训练应用于提升百度自动驾驶感知算法 先用有标签数据对模型进行初始启动训练,后将模型在无标签数据上进行推理得到伪标签,最后合并有标签数据和伪标签数据对模型进行进一步训练。如
24、此往复。训练完感知大模型后,百度利用知识蒸馏的方法将伪标签用于车载小模型的学习,从而增强车载小模型的远距离感知能力。文心大模型在百度感知2.0中发挥了重要作用,主要提升3D感知能力,解决远距离检测和长尾物体识别两大难题。华为HUAWEI?产业研究 战略规划 技术咨询272024?华为常务董事、华为云CEO张平安指出,华为正在通过“云网端芯”架构上的协同创新,来构建可持续发展的AI算力基础,包括云基础设施系统架构创新、芯端算力上云、面向AI的网络架构升级三大方面。切?切?切?华为云推出了全新的CloudMatrix架构,以“一切可池化”“一切皆对等”“一切可组合”三大创新设计,从算力规模、扩展模
25、式和使用模式上,匹配超大规模的算力诉求,通过技术创新来解决行业难题。透过CloudMatrix架构创新展现华为云全栈的AI能力,包含盘古大模型、昇腾AI云服务、分布式QingTian架构、AI-Native Storage和全球存算网等。产业研究 战略规划 技术咨询282024?6?22?2024?HDC 2024?华为常务董事、华为云CEO张平安正式发布盘古大模型5.0,在全系列、多模态、强思维三个方面全新升级;还分享了盘古大模型在自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践,持续深入行业解难题。盘古大模型5.0包含不同参数规格的模型
26、,以适配不同的业务场景。十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用;百亿级参数的Pangu P系列,适用于低时延、高效率的推理场景;千亿级参数的Pangu U系列适用于处理复杂任务;万亿级参数的Pangu S系列超级大模型能够帮助企业处理更为复杂的跨领域多任务。盘古大模型5.0能够更好更精准地理解物理世界,包括文本、图片、视频、雷达、红外、遥感等更多模态。在图片和视频识别方面,可支持10K超高分辨率;在内容生成方面,采用业界首创的STCG(Spatio Temporal Controllable Generation,可控时空生成)技术,聚焦自动驾驶、工业制造、建筑等多个行
27、业场景,可生成更加符合物理规律的多模态内容。复杂逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索深度结合,极大地提升了数学能力、复杂任务规划能力以及工具调用能力。产业研究 战略规划 技术咨询29该平台基于盘古大模型和ModelArtsAI开发生产线,已经在多个车企和商用车场景中成功运用。该平台基于盘古大模型和ModelArts AI开发生产线,提供了数据生成、自动标注、模型训练、云端仿真、虚实结合仿真、数据闭环等一系列能力。该平台预集成了超过25万个场景库,包括500多类功能场景和200多项测评指标体系,将传统纯实车测试时的场景搭建工作从数天降低到分钟级,车企还可以基
28、于盘古训练出自己需要的模型。2024年6月22日,盘古大模型5.0通过创新的可控时空生成技术,结合场景视频生成、4D BEV视频生成、自动驾驶仿真库及路网信息,能更好地理解物理规律,大规模生成和实际场景相一致的驾驶视频数据,还可以灵活增加控制条件,生成不同路况、不同光照、不同天气的训练视频数据,加速自动驾驶技术的快速成熟。?EI?通过数智融合架构打破数据、AI资源管理边界,在一个平台即可完成开发、测试、交付上线工作,让业务创新提效2倍,实现数据加速;借助盘古大模型在认知、感知、决策、优化等全领域的能力,车企可以快速基于盘古训练出自己需要的模型,实现算法加速;基于昇腾AI云服务,可针对自动驾驶3
29、00+算法进行优化,60+实现精度性能提升,可以做到千卡训练数月不中断,实现算力加速。目前上述三种华为自动驾驶相关大模型中,只有场景理解大模型已有客户(比亚迪)合作落地(工程师仅需调用华为云提供的API就可以用场景理解大模型来完成给视频数据分类的工作)。但是大模型的训练成本高昂。GPT-3训练一次的成本可能在1200万人民币。而华为方面,在训练千亿参数的盘古大模型时,也调用了超过2000块的昇腾910,进行了超过2个月的训练,成本极高。一方面选择小样本训练,通过自监督的方法,以更少的标注数据来做训练,以降低成本;另一方面盘古大模型的三层架构能在结构上实现降本。L0层是通识性的大模型,具备鲁棒性
30、和泛化性;大模型训练好了之后不用再重复训练,只需在L1和L2层做适应性训练,成本关系是上一层的5-10%。产业研究 战略规划 技术咨询30华为云是具备自动驾驶数据闭环工具链全栈自研能力的云厂商之一。除了给用户提供大模型的能力外,华为云也可以提供数智融合架构、ModelArtsAI开发生产线、昇腾AI云服务等一系列配套设施,用户可以在华为云的自动驾驶开发平台上同时实现数据加速、算法加速和算力加速。ModelArts AI开发生产线包含DataTurbo、TrainTurbo、InferTurbo 三部分,分别提供数据加载、模型训练、模型推理的加速工具,倍速提升模型训练效率。为了应对模型训练的算力
31、需求,各家科技公司、主机厂等纷纷开始自建/合建算力中心,打造算力集群。华为云在乌兰察布和贵安数据中心同时上线了昇腾AI云服务,为模型训练提供澎湃算力,单集群性能可达2000P Flops。华为自动驾驶研发平台解决方案架构图大规模的算力集群通常会面临业务连续性的问题,因为单点故障就可能导致整个大规模分布式任务失败。为保证训练任务不中断,华为云开发了断点续训的方法,假如在训练过程中出现了单点故障,系统会将这个点排除掉,用新的节点替换掉故障节点,并且原地重启。据悉,昇腾AI云服务可以实现千卡训练一个月以上不中断,断点恢复时长不超过10分钟。科大讯飞KEDAXUNFEI?产业研究 战略规划 技术咨询3