要闻

中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o

新智元 2024-05-27 14:57:47
科技

在通用大模型的时代浪潮中,中国移动,勇立潮头,不落人后!

5月24日,在第七届数字中国建设峰会中国移动人工智能生态大会「AI赋能,智筑国基」主旨论坛上,中国移动发布了最新自研的「九天」千亿多模态基座大模型。

凭借自主研发与行业积累,「九天」基座大模型堪称「国内最值得信赖、最懂行业」的全栈大模型。

和其他企业不同,央企做大模型,是面向国民经济骨干行业,目的是给国家基建转型赋能,「为产业注智,为国家筑基」。

中国移动,当得起一句「央企人工智能领头羊」。

AI电聊对接会议,遇难题自主寻求人类帮助

GPT-4o发布当天,向所有人展示了强大的AI语音助手能力,将电影「Her」中的Samantha带入现实。

而中国移动现场的直播演示,一点也不输OpenAI。

九天·九九

首先上场的「九天·九九」,是一个定制化的个人助理。

两位童鞋向在场所有人展示了,真正的AI助理,如何让主人们效率倍升。

一边是小天,一边是九九。

小哥向自己的助手「小天」提问:「我有点紧张,怎么办」?

暖心的小天开始为小哥出招,并为他加油打气。

旁边女生的助手「九九」则帮她生成了「3道关于二次函数的初中数学题」,并且在后续的追问下给出了详细的解题步骤,分分钟搞定初中生的指导。

接下来,九九还生成了一张六一儿童节的图片,以「九天蓝」为背景。

最后,九九还完成了一个非常实用的功能:告诉它自己的时间计划,它就可以帮忙安排日程了,比如把后天上午9点的一个会议加入议程。

更厉害的是,小天和九九这两个AI助手,直接在现场互通电话对接起了开会需求,完全没有主人们的事儿了。

九天·善学

另一个在演示中登场的,是「九天·善学」。

作为一个基于知识数据和专家指导的产品,它可以协助我们进行专业的行业分析或产业洞察。

而且,如果我们有一个待完善的工作,也可以驱动模型与专家对话来进行修正。

比如它在撰写方案时遇到了一个网络运维方面的问题,会主动开始询问人类专家。

在两位专家给出建议后,它就可以自动进行相关的更新和修改。

九天·网络

「九天·网络」则向我们展示了复杂系统如何完成全局的智能感知。

演示过程中,杭州亚运会场馆以及周边区域被3D复刻到了孪生数字世界,而且对通信网络的信号覆盖范围进行了可视化的渲染

基于此,「九天·网络」可以感知网络状态、设备状态以及用户体验。

全局的监测和感知结果也可以用可视化的方式呈现出来,信号的光圈使各处的网络状态清晰可见,在下面的图片中,黄色区域表示信号比较好、红色是信号比较拥堵的地方,甚至可以追踪路上的某一个人,从用户个体的角度出发进行分析。

运维人员在检查设备时可以戴着AR眼镜,视觉监测能力可以协助分析设备情况,并直接将分析结果叠加在运维人员的视觉范围中。

此外,也可以让远程专家参与进来,对设备的检修、维护进行指导。

千亿参数+多专家架构

以上所展现的产品和能力,全部来自中国移动「九天」千亿多模态基座大模型的加持。

而要实现如此复杂且智能的基座大模型,就需要在模型架构和参数规模上不断进行技术突破。

中国移动从2013年起就已经开展人工智能的自主研发,在同一领域深耕十年、持续积累,让「九天」大模型取得了技术领先的地位。

「九天」基座大模型采用纯解码与多专家相结合的架构,创新了模型的学习方式——通过结构化数据建模,进行渐进式学习。

模型的参数量,从曾经的十亿、百亿不断攀升至最新千亿级别。

为适应不同的应用场景,「九天」提供1.5B、3B、7B、13.9B、100+B等不同参数量的模型版本,可灵活部署于各种设备和平台

不仅如此,中国移动还在酝酿下一步更大的训练计划,将数据集规模从5万亿提升至20万亿token,进一步提升模型能力。

有如此前沿的架构和庞大的参数量,「九天」在国际竞赛中的表现可谓是十分突出:

在语音合成领域,在2024年INTERSPEECH语音合成声码器赛道中获得国际第一名。

视觉评测方面也同样出色,获得2023年CVPR VSS(视觉语义分割)赛道中视觉理解方面的第一名。

对照MME-P榜单,「九天」基座大模型的生成能力相当于全球第9名的水准。

除了竞赛成绩喜人,各类测试中的评测结果也十分优异。

我们熟知的多语言理解MMLU、编码HumanEval、数学GSM8K基准中,「九天」基座大模型都取得了不俗的表现。

还有在中文C-Eval、MBPP、BBH基准上,基座大模型取得了领先的优势。

此外,在11个行业领域,中国移动对基座模型展开了124个细类,多达8万多道大学考试或职业资格考试题的测试,结果如下图所示。

「九天」基座大模型在11个领域均拿下了最高成绩。

这些发布会上的「智能」表现,以及竞赛和测评中令人印象深刻的成果,完全配得上它「最懂行业」的定位。

复杂系统智能化

作为全栈大模型,「九天」让自己的能力面向各种复杂行业需求,提出了「复杂系统智能化」的理念,旨在为产业「注智」。

大模型的「智能」说起来容易,但实现起来却很困难,需要攻克许多的难题和壁垒。

为了实现面向复杂系统智能化,中国移动集团首席科学家冯俊兰等专家,做了大量的工作。

如果说AI是一个大海,现在的智能还仅仅停留在表面。想要走向深水区,除了推理、生成、推理这些通用能力,还需要对复杂系统进行感知、预测、诊断、控制和决策。

大部分复杂系统,都是一个混沌的系统。怎样才能从微观走向宏观,从混沌走向清晰?

这就需要结构化的数据。因为在复杂系统中,会有大量的设备,大量的数据。

此外,还有多信源的数据,让AI可以看我所看,为我所为,听我所听。

怎么去表征好这些信号,和通用的模态数据进行融合,就是复杂系统实现真正AI的关键。

总的来说,复杂系统智能化需要解决两大问题:一是大而不稳,二是多而不合。

为此,中国移动在「九天」基座大模型的研发过程中使用了多种策略和技术,包括多层信息加固、溯源信息场一致性校验、大小模型协同等。

这几种技术的结合使用,将「九天」模型打造成为面向「原子化任务」的智能体。

不仅有当下前沿大模型的理解、生成、推理能力,还以此为基础,进一步延展出感知、预测、诊断、控制、决策等更加「类人」的能力。

从每个行业的微观数据到泛行业模型的宏观生态,从混沌、复杂的问题中提取清晰、简单的解决路径,这就是「复杂系统智能化」想要实现的目标。

打通模态信源

「九天」之所以将自己定位为通用的「全栈」大模型,原因之一是打通了各个模态之间的隔阂,实现复杂的大模型系统在「全模态」之间的智能化推理。

不仅包含语音、语言、视觉这些常见的模态,而且囊括了结构化数据,让模态的设计都更加匹配各行各业中的落地场景。

另一个原因在于,中国移动发挥自己在通信领域的龙头地位,让大模型可以在各种信源和设备上灵活部署。

当前的大模型由于参数过大、设备兼容性低等原因,一般只能在服务器或PC端进行推理,但能够提供云边端全面服务的中国移动表示不服。

「九天」大模型不仅可以部署在常见的移动电子设备和物联网传感设备上,比如智能手机、平板、汽车和穿戴设备,还能应用于各种复杂信源,包括雷达、红外、声波、无线射频等等。

这些复杂信源虽然人类难以感知,但对工业生产、通信、服务领域的一些支柱性行业至关重要。

对多种信源的强大适配能力,让「九天」轻松走入各行各业的场景,快速落地应用。

聚焦骨干行业

国内外市场上大模型层出不穷,为什么只有「九天」敢宣称自己「最懂行业」?

从模型定位、训练数据到AI生态、应用场景,「九天」的研发团队始终没有忘记自己「聚焦行业」的初衷——

让最前沿的AI模型服务于骨干行业的技术革新,服务于国家基础设施的智能转型。

因此,「九天」定位为面向复杂行业系统,要在政府治理、工业生产、民生服务、通信特色这四大领域发挥重要作用,提供基座模型。

从训练开始,「九天」基座模型就与行业紧密相连——不仅集成通信、能源、建筑、交通等八大行业的专业知识,而且行业数据在所有预训练数据中的占比达到10%,超过了所有国内和国际的同行。

另外,对于结构化数据的处理,就着重考虑了营销、出行等行业应用,增强了模型的网络智能化实战经验,较传统手段有10%-15%的提升,解决了大模型无法准确处理结构化数据的难题。

在视觉理解领域,训练数据就包含了7000万路视联网,以及200亿+咪咕图、文、视频等行业特色数据,让模型不仅「看得清」、「看得懂」,而且「看得准」。

在「九天」基座模型的基础上,中国移动已经建立了一整套面向全行业的大模型体系和AI生态,共开发出15款行业大模型。

全面支持自主生态

作为AI行业的「国家队」选手,中国移动站在AI技术的浪潮之巅,用实际行动表明了独立自主研发的决心,显示了央企应有的担当。

在研发「九天」大模型体系的过程中,研发团队同时致力于在算力、芯片、框架、算法等领域实现AI生态的「国产化」。

在芯片层面,「九天」系列大模型解决了一大训练难题——在异构芯片之间转换。

在11个厂家生产的17款不同芯片上,团队完成了适配、迁移、测试和标准拉齐等一系列工作,从而支持模型在异构芯片间平滑转化和继续训练。

为了助推国内AI产业加速发展,中国移动还提出了「万千百」智能基座计划,打造「万卡大算力、千亿大模型、百汇大平台」。

在算力层面,中国移动将建成3个两万卡智算中心和12个区域智算中心。

目前,已经在呼和浩特建成的超大单体智算中心,规模超越了全球范围内所有运营商,成为央企「十大超级工程」之一。

随着AI大规模落地,对推理算力需求激增,中国移动还将全面升级已经部署的1500个边缘计算节点,提升训推算力资源配比达到1:10,即1卡训,10卡推。

年底,全网大模型训练卡达到10万卡+,规模将会超过30 EFLOPS。

其次,中国移动还将升级算网大脑新中枢,并构建数联网的新保障。

「百汇大平台」上,还会汇聚丰富的大小模型、数据集及AI原生应用,集模型体验、下载、调优、部署、应用、测评等多种功能为一体,为创业者和开发者提供「一站式」服务平台。

模型安全可信

「九天」系列大模型之所以「值得信赖」,不仅体现在支持国产化的自主研发,还根植于对模型安全性的高标准、严要求。

为了解决大模型在应用中面临的「遗忘」、「幻觉」等共性痛点,团队在训练中应用了知识升维融合、持续动态学习等关键技术。

此外,模型还配备了完善的数据安全、系统安全等保障机制,真正达到安全、可信、可控。

这种对于安全性的执着追求,最终得到了官方的认可。

「九天」自然语言交互大模型同时通过了「生成式人工智能服务备案」与「境内深度合成服务算法备案」,成为首个央企研发的完成双备案的大模型。

在中国软件测评中心开展的测试中,「九天」大模型也获得了最高等级(A级)的安全性认证。

十年磨剑,跨越式发展

在一系列卓越的成就背后,是整个集团创「世界一流信息服务科技创新公司」和勇担国家科创重任的雄心,以及研发团队十年如一日地努力前进、力争上游的决心。

IEEE Fellow、中国移动集团首席科学家冯俊兰博士是整个AI领域的领头人。

她在2013年9月加入了中国移动研究院,也就是那个时候,这家运营商已经嗅到AI的未来潜力。

十年间,冯俊兰博士带领团队在AI技术研发上一步步筚路蓝缕、稳扎稳打,亲历了公司在AI领域实现「跨越式」发展的全过程。

如今,中国移动成立了「九天」人工智能研究院,引入2名千人专家、超150个AI 专业博士,形成2000人AI核心团队,开展了人工智能基础技术、算法、平台、应用的全栈研发,具备了大模型数据构建、预训练、微调、推理等全链路技术的自主创新能力。

在去年,中国移动相继发布了「九天·客服」、「九天·海算政务」、「九天·网络」等垂直行业大模型,以及面向骨干行业开放共建的「九天·众擎基座大模型」,在大模型赛场上发出了响亮的央企声音。

除了发布的产品和模型,中国移动还取得了丰硕的科研成果——原创性提出了体系化人工智能(Holistic AI)技术,受到产学研各界的广泛认可和支持。

荣获中国通信学会科技进步奖一等奖,申请超过930项专利,发表160余篇顶会顶刊论文 ,并在约20个大型国际竞赛中取得TOP 5的成绩。

展望未来,正如这次大会的主题「AI赋能,智筑国基」,中国移动将肩负AI「国家队」的使命继续前行,把AI领域最前沿的进展带入千家万户、千行百业。

本文来源:新智元

点击展开全文
打开APP,阅读体验更佳

网友评论

聚超值推荐

更多优惠

相关推荐

这样的波音,你还敢坐吗? 科技要闻 新技术
这样的波音,你还敢坐吗?
会员体系无限套娃:WPS向“钱”看,人设崩塌? 科技要闻 新技术
会员体系无限套娃:WPS向“钱”看,人设崩塌?
谁还在“肝”618? 科技要闻 新技术
谁还在“肝”618?
5年了,折叠屏为什么还是没能普及? 科技要闻 新技术
5年了,折叠屏为什么还是没能普及?
AI滤镜破圈不断,“美图秀秀们”坐不住了 科技要闻 新技术
AI滤镜破圈不断,“美图秀秀们”坐不住了
微软深夜发布 50+ 重磅更新!Copilot 重新定义生产力,ChatGPT 之父压轴登场 科技要闻 新技术
微软深夜发布 50+ 重磅更新!Copilot 重新定义生产力,ChatGPT 之父压轴登场
OpenAI又上演“权力的游戏” 科技要闻 新技术
OpenAI又上演“权力的游戏”
Google 史上最失败的产品,要借 AI 「复活」了 科技要闻 新技术
Google 史上最失败的产品,要借 AI 「复活」了
小品类,在B站撬动大商机 科技要闻 新技术
小品类,在B站撬动大商机
体验完 Apple Pencil Pro,我发现它才是新 iPad 的灵魂 科技要闻 新技术
体验完 Apple Pencil Pro,我发现它才是新 iPad 的灵魂
相关产品
取消