上海油压工作室

华为宣布开源盘古7B稠密和72B混合专家模型

2025-07-01 11:33  浏览:  

华为加入开源大军,开源了首个大模型。

6月30日,华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B)。此外,基于昇腾的模型推理技术也同步开源。华为表示,此举是华为践行昇腾生态战略的又一关键举措,将推动大模型技术的研究与创新发展,加速推进人工智能在千行百业的应用与价值创造。

据了解,华为最新开源的Pro MoE 72B大模型,在参数量仅为720亿,激活160亿参数量的情况下,通过动态激活专家网络的创新设计,实现了以小打大的优异性能,甚至可以媲美千亿级模型的性能表现。在业界权威大模型榜单Super CLUE最新公布的2025年5月排行榜上,位居千亿参数量以内大模型排行并列国内第一。

上海油压工作室最近一段时间以来,华为公开了一系列基于昇腾的大模型技术,让国内AI开发者备感期待。

今年6月20日举办的华为开发者大会2025上,华为重磅发布了盘古大模型5.5。全新升级的盘古大模型5.5包含了五大基础模型,分别面向NLP(自然语言处理)、多模态、预测、科学计算、计算机视觉领域,推动大模型成为行业数智化转型的核心动力。会上,华为还发布了基于Cloud Matrix384超节点的新一代昇腾AI云服务,将384颗昇腾NPU和192颗鲲鹏CPU通过高速网络Matrix Link全对等互联,形成一台超级“AI服务器”,单卡推理吞吐量跃升到2300Tokens/s,可为大模型应用提供“澎湃算力”。

值得注意的是,今年5月30日,华为还重磅推出参数规模高达7180亿的全新模型——盘古Ultra MoE。这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。同时,华为发布盘古Ultra MoE模型架构和训练方法的技术报告,披露众多技术细节,充分体现了昇腾在超大规模MoE训练性能上的跨越。

这一系列突破,更为关键的意义在于,华为盘古大模型是基于昇腾云的全栈软硬件训练而成的,这标志着基于昇腾架构可以打造出世界一流大模型。华为不仅完成了国产算力+国产模型的全流程自主可控的训练实践,同时在集群训练系统的性能上也实现了业界领先,这意味着实现了从硬件到软件、从训练到优化、从基础研究到工程落地的“全栈国产化”和“全流程自主可控”的闭环,国产AI基础设施的自主创新能力得到了进一步验证。

此外,与其他大模型厂商相比,华为在大模型战略上一直独树一帜,强调“不作诗,只做事”,坚持为千行万业“解难题,做难事”,加速千行万业智能化升级。在盘古大模型5.5发布的同时,华为五大盘古行业思考大模型(盘古医学、盘古金融、盘古政务、盘古工业、盘古汽车)也同步上线。

上海油压工作室华为常务董事、华为云计算CEO张平安介绍,在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、500多个场景中落地,在政务、金融、制造、医疗、煤矿、钢铁、铁路、自动驾驶、气象等领域发挥巨大价值,重塑千行万业。

因此,此次华为宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型,一方面有助于更多开发者基于国产算力平台开发大模型技术,进一步扩展昇腾生态;另一方面在开源的带动下,有助于吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型更广泛更深入地赋能千行百业。

免责声明:本网转载自合作媒体、机构或其他网站的信息,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。本网所有信息仅供参考,不做交易和服务的根据。本网内容如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。
相关推荐
富士通启动超导量子计算机研发 目标突破万量子比特

富士通启动超导量子计算机研发 目标突破万量子比特

日本富士通公司近日宣布启动超导量子计算机研发项目,目标在2030财年实现超过10,000个量子比特的运算能力。该项目采用创新的"STAR架构"设计,将实现250个逻辑量子比特的运算能力,属于早期容错量子计算(early-FTQC)技术路线。富士通首席技术官Vivek Mahajan表示:"该项目将推动日本国产容错量子计算机的发展。"公司计划将超导量子计算与金刚石自旋技术结合,并设定了2035财年实现1000个逻辑量子比特的长期目标。该项目已获得日本新能源及产业...
特朗普:美国将对芯片和半导体征收约100%的关税

特朗普:美国将对芯片和半导体征收约100%的关税

当地时间8月6日,美国总统特朗普表示,美国将对芯片和半导体征收约100%的关税。特朗普称,如果在美国制造,将不收取任何费用。
中国成功将卫星互联网低轨07组卫星发射升空

中国成功将卫星互联网低轨07组卫星发射升空

8月4日18时21分,我国在海南商业航天发射场使用长征十二号运载火箭,成功将卫星互联网低轨07组卫星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。长征十二号运载火箭是由中国航天科技集团八院抓总研制的两级构型运载火箭,也是我国首款4米级单芯级运载火箭。其近地轨道运载能力不小于12吨,700公里太阳同步轨道运载能力不小于6吨。卫星互联网低轨07组卫星由银河航天(北京)网络技术有限公司研制。这是民营商业航天公司首次批量研制此...
京东宣布收购德国零售商Ceconomy、估值22亿欧元

京东宣布收购德国零售商Ceconomy、估值22亿欧元

京东周三宣布,决定通过其全资间接子公司向德国电子零售商Ceconomy的全体股东发起一项自愿性公开收购要约。京东周三称,已提出以每股4.60欧元的现金对价收购Ceconomy所有已发行和流通股票。此次收购要约对Ceconomy的估值为22.3亿欧元(约合26.3亿美元)。京东表示,其子公司已就此次收购要约与Ceconomy签署投资协议。交易完成后,Ceconomy最大股东集团的持股比例将从29%降至25%。京东CEO许冉表示,公司希望运用自身的技术能力,加快Ceconomy当前...
最高奖项!国家电网为能源领域唯一入选

最高奖项!国家电网为能源领域唯一入选

2025世界人工智能大会暨人工智能全球治理高级别会议(简称WAIC 2025)于7月26日在上海开幕。大会的最高奖项——卓越人工智能引领者奖(以下简称SAIL奖)评选结果在当天揭晓。国家电网有限公司‘AI+光明大模型’打造超大城市智慧能源管理大师项目,在223个参赛项目中脱颖而出,荣获SAIL之星,是能源领域唯一入选SAIL之星的项目。当前,新型电力系统正在加速构建,电力生产结构加快调整,电力技术正经历百年来最为重大的变革。随着新能源装...

推荐阅读

热文

Copyright © 上海油压工作室