分享好友 最新资讯首页 最新资讯分类 切换频道
昆仑万维「Skywork UniPic 2.0」开源,统一多模态模型再迎新突破
2025-08-17 12:50

8月11日,昆仑万维SkyWork AI技术发布周正式启动。8月11日至8月15日,我们每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。截至目前,我们已经发布SkyReels-A3、Matrix-Game 2.0、Matrix-3D模型。

8月13日,昆仑万维正式开源「Skywork UniPic 2.0」模型——面向统一多模态建模的高效训练和推理框架,围绕生成和编辑模块轻量化、连接多模态理解模型进行联合训练,构建了理解、生图、编辑一体化的核心能力,旨在实现“高效、高质、统一”的多模态生成模型。

当前,「Skywork UniPic 2.0」及其系列模型已全面开源,涵盖模型权重、推理代码、强化策略等,助力开发者与研究者快速上手并构建多模态应用。

「Skywork UniPic 2.0」由三个核心模块组成:

生图编辑(下图中):基于 SD3.5-Medium 架构将原本只支持文本输入的模型改进成也接受文本图像同时输入,然后通过高质量图像生成和编辑数据的训练将原本生图能力扩展成生图、编辑双能力。

统一模型能力(下图左侧与中间):通过冻结生图编辑模块,多模态模型(Qwen2.5-VL-7B),Pre-Train连接器来构建出理解生成编辑一体化能力,再通过连接器和生图编辑模块一起联合微调,实现最终的一体化理解、生图、编辑模型。

生图编辑后训练(下图右):为提升生图编辑整体性能,设计了基于Flow-GRPO的渐进式双任务强化策略,实现了生成与编辑任务在不互相干扰下的协同优化,在预训练的基础上进一步提升了模型性能。

图丨昆仑万维Skywork UniPic 2.0核心组成模块

升级后的「Skywork UniPic 2.0」具备以下核心优势:

生成模块轻量高效,性能拉满

生成模块基于2B参数的SD3.5-Medium 架构训练,生图和编辑指标超越生成模块具有7B参数的bagel,4B参数的OmniGen2,12B参数的UniWorld-V1和Flux-kontext模型。

引入强化学习,效果显著

基于Flow-GRPO首创渐进式双任务强化策略,有效提升模型对复杂指令的理解能力与图像生成和编辑的一致性,两大任务协同优化、互不干扰。

一体化灵活切换,拓展能力强

将生图编辑的Kontext模型与多模态模型端到端整合,微调轻量连接器,即可快速构建统一理解-生成-编辑模型,并且生图和编辑的性能进一步提升。

UniPic2-SD3.5M-Kontext作为单一模型,虽然只有2B的参数量,但生图指标超越了具有12B参数量的Flux.dev、编辑效果超越了同样具有12B参数量的Flux-Kontext。同样超越了几乎所有统一模型的生图和编辑效果,包括19B的UniWorld-V1和14B的Bagel。

此外,将UniPic2-SD3.5M-Kontext拓展成统一模型UniPic2-Metaquery后,效果得到了进一步的提升。

图丨昆仑万维Skywork UniPic 2.0系列模型评测结果

在优秀的理解、生成和编辑能力背后,昆仑万维Skywork团队在预训练、联合训练和后训练阶段均作出创新性优化。

最新文章
“超充一张网”,赋“能”一座城- DoNews专栏
文|刘俊宏 2024年,中国新能源汽车产业链迎来了一个重要转折点。在这一年里,中国新能源汽车零售渗透率飙升至47.6%,下半年更
跑赢县城的“电驴”闯港,能跑赢巨头吗?
《投资者网》引力丨张静懿县城街头,一台明黄色电单车停在街角——这不是哈啰,也不是美团单车,而是松果出行。2026年1月2日,这
PA12 L20 L 瑞士EMS_志趣网
东莞市万基塑胶原料有限公司专业代理PA12 瑞士EMS.销售电话:朱小姐PA12 瑞士EMS L20HFRPA12 瑞士EMS L20HL Sz9563 PA12 瑞士EMS
2026年杭州全屋定制服务商TOP5榜单最终揭晓:聚焦大宅与顶奢住区的成熟度分析_腾讯新闻
2026年,全屋定制已成为杭州高端住宅空间实现个性化与品质生活的核心环节。随着消费者对居住美学、功能集成与工艺细节的要求持续
激扬青春豪情 争做时代先锋|志愿服务|团市委|青少年|团委|团组织_网易新闻
薪火相传锻初心,挺膺担当绽青春。近年来,市委、市政府坚决贯彻落实习近平总书记关于青年工作的重要思想,把青年发展摆在更加突
@太原人 家电以旧换新+数码智能购新 新一轮补贴今起10时发放_腾讯新闻
  1月8日晚上,省商务厅发布的《山西省2026年家电以旧换新、数码和智能产品购新补贴通告》显示,自1月9日起,每周五上午10时至
原创印度部长:当前全球贸易危机的根源,在于让中国入世,不欢迎中资
印度商工部长皮尤什·戈亚尔在2025年4月7日的一次国际论坛上发言,直接将全球贸易乱象的责任归咎于中国加入世界贸易组织,同时明
北京市政府工作报告:2025年将重点培育20个未来产业
1月14日,北京市第十六届人民代表大会第三次会议开幕,北京市市长殷勇作政府工作报告。殷勇的报告分两个部分:一、2024年工作回
智能科技驱动——AI新闻内容即时生成器-2024ai通
随着互联网的快速发展新闻传播速度越来越快,人们对新闻的需求也日益增长。传统的新闻采编、撰写、发布流程耗时较长,难以满足即
两会速递丨国家卫生健康委主任:持续推进“体重管理年”行动_腾讯新闻
  3月9日,十四届全国人大三次会议在梅地亚中心新闻发布厅举行记者会,就民政、就业和社会保障、住房、卫生健康等相关问题回答