分享好友 最新资讯首页 最新资讯分类 切换频道
GLM-4.5大模型杀出重围,“领跑者”智谱走上台前
2025-08-06 09:15

当业界探讨智能体功能、开发环境时,近日北京智谱华章科技股份有限公司(以下简称“智谱”)低调发布新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破。OpenAI“跳票”多次的GPT-5也强调融合,并在6月底将智谱列入全球竞争对手,没想到智谱率先登场,GLM-4.5的综合得分位列全球第三、国产第一。

在资本市场,智谱也是“沉默的领跑者”,4月已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的“大模型六小虎”。根据辅导备案报告,8月智谱将进入正式辅导期第二阶段,在这期间,这家脱胎于清华的大模型公司还密集收获多地国资的战略投资。从实验室到产业,智谱走出了中国通向(通用人工智能)的另一条路径。

图片

全球第三,国产第一

最近的开源浪潮中,智谱的GLM-4.5发布仅2小时,就被X平台推荐上了首页,发布12小时后,它已经位列国际开源社区Hugging-Face榜单全球第二,创增速纪录。

在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。

GLM-4.5采用混合专家(MoE)架构,GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿,有用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式。在包含推理、代码、智能体的综合能力测评中,GLM-4.5达到开源SOTA(即“当前最佳技术”或“最前沿水平”),在真实代码智能体的人工对比评测中,实测国内最佳。

真实场景表现比榜单更重要。在真实场景Agentic Coding(Agentic Coding)中,52个编程开发任务,涵盖六大开发领域的测试中,GLM-4.5与Claude Code、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行对比测试,结果显示,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,在大部分场景中可以实现平替的效果。

在成本角度,GLM-4.5的API调用价格输入0.8元/百万tokens、输出2元/百万tokens;高速版最高100tokens/秒。综合成本和、参数和表现,外界给GLM-4.5以“成本更低、性能更优”的评价。

专为智能体

“效果确实不错的”,体验GLM-4.5后,某大模型六小虎的一位技术专家向北京商报记者反馈,他特别提到效果是指“使用这个模型开发Agent(智能体)”。这也是GLM-4.5的特点。

据了解,GLM-4.5模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。

简单来说,GLM-4.5的最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。

巧合的一点是,6月智谱曾被OpenAI“点名”,将其定义为全球竞争对手。对于类似GLM-4.5的融合式模型,OpenAI也早有提及。

2024年1月,OpenAI CEO山姆·奥特曼曾在接受媒体采访时提到,他现在的首要任务是推出可能被称为GPT-5的新模型,并称GPT-5将能够比现有模型做更多的事情。2025年2月13日,他宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。此后,OpenAI高管曾透露7月是GPT-5目标推出时间,后来山姆·奥特曼将这个时间推迟到8月初。

成为“全优生”

这一切让外界不禁好奇,智谱与OpenAI有哪些异同?针对这个问题,智谱CEO张鹏在接受媒体采访时表示,相似之处在于双方都在各自国家较早地开始训练大模型。双方都努力探索不同方向的能力边界。

“大家都不知道人工智能的边界到底在哪里。OpenAI在2023年后探索了很多方向,比如o系列模型。我们也在探索各种各样的模型,例如我们此次发布的首个原生融合模型,就代表行业一个新的发展方向。”他进一步说,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”,就像人一样,拥有越来越通用的能力。

抛开技术,在外界眼中智谱的学术背景在一众同行中更突出。“智谱作为脱胎于清华的大模型公司,其核心优势主要体现在技术积累和产学研结合方面。”科方得智库研究负责人张新原向北京商报记者表示,“获得多地国资战略投资也显示出智谱在资源整合和政策支持方面的优势。”

北京社科院副研究员王鹏也提到了智谱的股东,“它的股东背景多元,这样可以让智谱同时获得应用场景、政务资源、国际市场等支持”。

作为正在上市路上的大模型创业公司,恰逢风头正盛的也正奔赴资本市场,会否受到影响?王鹏告诉北京商报记者,“具身智能聚焦机器人、物理世界交互,智谱专注通用大模型与智能体,两者在应用场景、技术栈、客户群体差异显著,直接竞争较少。具身智能目前处于概念验证阶段,商业化路径尚不清晰,而智谱商业模式相对成熟”。

北京商报记者 魏蔚

最新文章
2025中国房企综合实力TOP100研究成果发布!
2025年3月14日,亿翰智库重磅发布《2025中国房企综合实力TOP100》。2024年行业仍旧是在深度调整中,可以说已经是超调,原先政策
格力电器:从未委托或授权任何第三方机构受理消费者的售后服务
7月25日,通过官方平台发布声明,明确否认委托任何第三方机构开展售后服务业务。格力电器声明强调:“格力电器从未委托或授权任
央八即将开播!又来16集反特大剧!廖凡、朱珠领衔,要熬夜狂追了
沉寂许久,必将迎来爆发!我敢说,这部剧一播,将要成为“收视率吸取器”,完全榨干当下国产剧收视率大盘。也许有朋友会问,什么
电话营销机器人电话软件
电话营销机器人系统自从进入电销行业,已经成为电销企业必不可少的辅助工具,机器人替代人工筛选客户,每天最少可以拨打3000通电
供应 HC300BF PP 北欧化工
PP HC300BF特性:1.冲击强度:悬壁梁缺口冲击强度:588J/m2.良好的熔体强度,熔流率:05g/10min3.清晰度高,良好的表面光洁度.用途:1
云南省昆明市回收烟酒礼品茅台酒
昆明金尊烟酒回收公司,欢迎来到高价回收烟酒网站,我们位于美丽的春城昆明市。 具体地址是云南省昆明市西山区陆家路怡康温泉新
中秋国庆境内游前瞻:北京仍是最火目的地,热门航线机票价格涨幅环比超4倍
距离中秋国庆假期已不足月,境内游的预订显著增长。9月8日,北京商报记者从多家在线旅游及出行平台、旅行社获悉,中秋国庆假期北
泰康人寿“瘦身”,13家分支机构密集关停
合规问题频发之下,裁撤风波又将如何平息?来源 | 中国保险家杂志泰康人寿的日子越来越不好过了。近期,泰康人寿迎来了机构撤销
上半年保险业保费收入3.7万亿元 6月寿险保费大增21.05%
央广网北京7月29日消息(记者冯方)近日,国家金融监管总局公布6月保险业经营情况。数据显示,上半年保险业实现原保险保费收入(
丁云鹏字画的近期成交价格
  此图所绘的列位尊者到底是谁?显着的是降龙罗汉和伏虎罗汉。其他的十六尊者,我们可从宋代苏轼所作的《十八大阿罗汉颂》与《