分享好友 最新资讯首页 最新资讯分类 切换频道
GLM-4.5大模型杀出重围,“领跑者”智谱走上台前
2025-08-06 09:15

当业界探讨智能体功能、开发环境时,近日北京智谱华章科技股份有限公司(以下简称“智谱”)低调发布新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破。OpenAI“跳票”多次的GPT-5也强调融合,并在6月底将智谱列入全球竞争对手,没想到智谱率先登场,GLM-4.5的综合得分位列全球第三、国产第一。

在资本市场,智谱也是“沉默的领跑者”,4月已在北京证监局办理上市辅导备案,由中金公司担任辅导机构,成为第一家启动IPO上市的“大模型六小虎”。根据辅导备案报告,8月智谱将进入正式辅导期第二阶段,在这期间,这家脱胎于清华的大模型公司还密集收获多地国资的战略投资。从实验室到产业,智谱走出了中国通向(通用人工智能)的另一条路径。

图片

全球第三,国产第一

最近的开源浪潮中,智谱的GLM-4.5发布仅2小时,就被X平台推荐上了首页,发布12小时后,它已经位列国际开源社区Hugging-Face榜单全球第二,创增速纪录。

在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,GLM-4.5的综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。

GLM-4.5采用混合专家(MoE)架构,GLM-4.5总参数量3550亿,激活参数320亿;GLM-4.5-Air总参数1060亿,激活参数120亿,有用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式。在包含推理、代码、智能体的综合能力测评中,GLM-4.5达到开源SOTA(即“当前最佳技术”或“最前沿水平”),在真实代码智能体的人工对比评测中,实测国内最佳。

真实场景表现比榜单更重要。在真实场景Agentic Coding(Agentic Coding)中,52个编程开发任务,涵盖六大开发领域的测试中,GLM-4.5与Claude Code、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder进行对比测试,结果显示,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,在大部分场景中可以实现平替的效果。

在成本角度,GLM-4.5的API调用价格输入0.8元/百万tokens、输出2元/百万tokens;高速版最高100tokens/秒。综合成本和、参数和表现,外界给GLM-4.5以“成本更低、性能更优”的评价。

专为智能体

“效果确实不错的”,体验GLM-4.5后,某大模型六小虎的一位技术专家向北京商报记者反馈,他特别提到效果是指“使用这个模型开发Agent(智能体)”。这也是GLM-4.5的特点。

据了解,GLM-4.5模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。

简单来说,GLM-4.5的最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。

巧合的一点是,6月智谱曾被OpenAI“点名”,将其定义为全球竞争对手。对于类似GLM-4.5的融合式模型,OpenAI也早有提及。

2024年1月,OpenAI CEO山姆·奥特曼曾在接受媒体采访时提到,他现在的首要任务是推出可能被称为GPT-5的新模型,并称GPT-5将能够比现有模型做更多的事情。2025年2月13日,他宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。此后,OpenAI高管曾透露7月是GPT-5目标推出时间,后来山姆·奥特曼将这个时间推迟到8月初。

成为“全优生”

这一切让外界不禁好奇,智谱与OpenAI有哪些异同?针对这个问题,智谱CEO张鹏在接受媒体采访时表示,相似之处在于双方都在各自国家较早地开始训练大模型。双方都努力探索不同方向的能力边界。

“大家都不知道人工智能的边界到底在哪里。OpenAI在2023年后探索了很多方向,比如o系列模型。我们也在探索各种各样的模型,例如我们此次发布的首个原生融合模型,就代表行业一个新的发展方向。”他进一步说,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”,就像人一样,拥有越来越通用的能力。

抛开技术,在外界眼中智谱的学术背景在一众同行中更突出。“智谱作为脱胎于清华的大模型公司,其核心优势主要体现在技术积累和产学研结合方面。”科方得智库研究负责人张新原向北京商报记者表示,“获得多地国资战略投资也显示出智谱在资源整合和政策支持方面的优势。”

北京社科院副研究员王鹏也提到了智谱的股东,“它的股东背景多元,这样可以让智谱同时获得应用场景、政务资源、国际市场等支持”。

作为正在上市路上的大模型创业公司,恰逢风头正盛的也正奔赴资本市场,会否受到影响?王鹏告诉北京商报记者,“具身智能聚焦机器人、物理世界交互,智谱专注通用大模型与智能体,两者在应用场景、技术栈、客户群体差异显著,直接竞争较少。具身智能目前处于概念验证阶段,商业化路径尚不清晰,而智谱商业模式相对成熟”。

北京商报记者 魏蔚

最新文章
TCL携“屏宇宙+AI生活”前沿创新成果亮相CES
1月6日,北美“科技春晚”国际消费类电子产品展览会(CES 2026)在美国拉斯维加斯启幕。TCL通过TCL实业与TCL科技两个产业集团,
女性戴佛公和叶子哪个好,女性适合佩戴佛公还是叶子?一文告诉你答案!-翡翠原石
女性戴佛公和叶子这两种首饰都是比较受欢迎的选择每种都有自身的特点和魅力。以下是关于女性戴佛公和叶子的部分比较和个人见解期
冷空气即将抵达申城!上海人提前准备_腾讯新闻
本周,申城天气主打晴或多云。其中周一夜间至周二、周四前后申城各有一次冷空气过程,并伴有大风和降温天气。周二全天气温在9~13
六部电影定档大年初一_腾讯新闻
春节快要到了,电影市场也已经有六部影片定档春节档,一起看看都有哪些精彩影片。截至目前,已有《》《》《》《》《》《熊出没重
唐家巷社区联合周峰宠物医院开展爱宠狂犬疫苗免费接种活动|狂犬病_网易新闻
为筑牢社区公共卫生安全防线,提升居民文明养宠意识,2025年10月17日,唐家巷社区联合周峰宠物医院开展“科学防疫·文明养宠”主
深圳办理报关单认证机构_聚荣网
上海办理报关单认证机构,上海怎么办理报关单认证价格深圳市壹昌达贸易公司,源头效率办理:一般原产地证CO、普惠制产地证FormA
游泳馆收银软件游泳馆会员一卡通财务软件_聚荣网
游泳馆一卡通流程一、软件流程介绍功能模式。快捷录入,功能自带快捷键操作。1.接待、登记刷手牌自动登记,自动登记押金,冻结手
童话成真!滨城这场美人鱼公开赛太精彩|哪吒_网易新闻
今天,2025爱海博美人鱼公开赛在国家海洋博物馆海底世界海博潜水中心开赛。作为华北地区美人鱼赛事,本次大赛不仅汇聚了众多专业
聚焦中医非药物疗法,新阶层人士探索健康管理新路径|慢性病|医疗_网易新闻
6月22日,市新联会携手成员所在单位墨门科技,在墨门书院举办“中医非药物疗法如何重塑健康新范式”主题新力沙龙,搭建文化交流
保定理工学院与阜平店房国防军事小镇战略合作启动仪式圆满举行|国防教育_网易新闻
树立国防意识,强化国防观念。3月20日,保定理工学院与阜平店房国防军事小镇战略合作启动仪式在该校举行。仪式上,臧卫东总监致