昆仑万维:“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测
4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测!一年前的今天,第一版天工大模型正式对外发布上线,一年来昆仑万维不断迭代模型,迭代应用产品,模型和应用都越做越好,以此回报广大用户的支持。
“天工3.0”拥有4000亿参数,超越了3140亿参数的Grok-1。“天工3.0”在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%。
强大的模型技术实力赋予“天工3.0”超强的性能表现。在MMBench等多项权威多模态测评结果中,“天工3.0”超越GPT-4V。
同时,“天工3.0”旗下的“天工SkyMusic”音乐大模型也在今日面向全社会开放公测。
天工SkyMusic:成为全球AI音乐SOTA模型
此前,大模型已经在文本、图像等多个技术领域取得突破,带来产业全面变革。然而,在AI音乐生成领域,全球迟迟等不到一款产品,开启“音乐ChatGPT时刻”。
这是因为一直以来,AI音乐行业大量研究都集中在符号音乐生成技术路线上,并且大多只能实现无人声背景音乐(Background Music,BGM)的生成,音乐的质量、效果、审美都远远达不到可用水平,产业迟迟未能爆发。
与行业主流路径不同,“天工SkyMusic”采用自研大模型音乐音频生成技术路线。这一路线直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技术难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与。
在与海外顶尖的AI音乐大模型Suno V3的横向测评中,“天工SkyMusic”在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。
此外,“天工SkyMusic”还拥有独创的参考音乐生成与方言歌曲生成能力。
参考音乐生成:用户可上传自有参考音乐,或选择“天工SkyMusic”资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。
方言歌曲生成:“天工SkyMusic”生成的音乐不仅在人声自然度、发声可懂度等领域表现优秀,更能够支持粤语、成都话、北京话等众多方言,让用户能够更自由地实现音乐表达,传播方言文化。
同时,“天工SkyMusic”是首个公开可用的AI音乐生成模型。
当前,在文本大模型领域,OpenAI吸引了全球的注意力;但是在AI搜索、AI音乐生成等细分领域,中国玩家们正在奋勇前行,不断通过自研技术取得细分领域顶尖的SOTA表现,共同建设中国大模型产业,打造自主可控的大模型产业生态。
天工3.0:采用4000亿级参数MoE混合专家模型架构
在上一代“天工2.0”MoE大模型的领先基础上,“天工3.0”实现了全面的性能升级,采用了4000亿级参数MoE混合专家模型架构。
“天工3.0”的逻辑推理能力、语义理解能力、应对复杂需求能力、内容创作能力全面升级,并新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力,为用户带来全新AI体验。
多轮搜索与综合工具调用:“天工3.0”针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。
同时,“天工3.0”能够通过强大的语义理解能力将用户任务拆解成细分环节,实时判断是否需要联网或调用工具,进行单轮或多轮的联网搜索、工具调用,完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。
图表绘制:“天工3.0”全面提高了逻辑推理能力与用户自然语言Query的理解能力,使其能够更精准地判断用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比结果。
多轮搜索、综合工具调用、图表绘制等都是“天工3.0”所独有的大模型综合能力,其从底层打通了“天工3.0”的AI搜索、AI对话、AI代码生成、AI图片识别、AI图像生成等底层能力,通过语义识别能力直接触发,为用户带来更加便捷、高效的AI体验,成为真正的AI生产力工具。
此外,“天工3.0”中还增加了研究模式、增强模式、改图扩图等多项AI能力。
研究模式:在研究模式中,“天工3.0”能够围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的研究需求。
增强模式:在增强模式中,“天工3.0”能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。
改图扩图:“天工3.0”多模态性能取得全面突破,超越GPT-4V。在强大的技术底座支持下,“天工3.0”的AI绘图能力新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功能。
-
上一篇
-
下一篇
- 最近发表
-
- 随机阅读
-
- 110姐姐帮忙充话费 感动深夜无助女孩
- 加勒比海上空 51岁男星与两女儿坠机身亡
- 甘肃天水同心浇灌民族教育“幸福花儿” 互帮互助互学增友谊
- 何以中国 运载千秋|19年前,三位老人写了一封信,把大运河申遗推上“高速路”
- 俄媒:俄军击退乌军对塞瓦斯托波尔的大规模袭击
- 广东银行业资产总额近40万亿元
- 展现女性的力量 《十二美人国》新书发布
- 安徽新能源和节能环保产业2023年营收超6120亿元 实现两年翻番
- 哮喘是由过敏引起的吗?这些诱发因素要知道
- 新漫评:冲闯黄岩岛?小心变“炮灰”
- 我国经济发展态势将持续向好
- 湖南沅陵五强溪镇山洪已致4人死亡 1人失联
- 【世界说】高达87%的纽约人认为当地犯罪严重!美媒:“这里什么都有可能发生!”
- 读懂中国·新青年看中国之“新疆行·走进阿克苏”2024短视频创作系列活动作品展播丨《乌希买里斯的古丽》
- 中国西北丝路游渐复苏:与敦煌相约冬日暖阳
- 福建东山:渔船回港避风 人员撤离上岸
- 固原携农文旅资源“奔赴”福州 再续浓浓“山海情”
- 加强交流对话对美中两国未来十分重要
- 湖北新发现北宋纪年墓 出土珍贵梅瓶等瓷器
- 浙江宁波举办亚美尼亚文化瑰宝展 近百件历史文化遗珍亮相
- 热门推荐
-
- 《长江经济带区域协调与高质量发展研究》近日出版
- 约旦外交与侨务部:以色列在加沙拉法市开展军事行动将导致严重后果
- 代表委员热议“好产品才能留住八方游客” 3.33亿人次去年玩转武汉
- 铁路杭州站年旅客发送量首次突破1亿人次
- 青海民和:灾后治理加速推进 “以工代赈”重建家园
- 院士专家在京探讨生态环保产业服务“双碳”战略
- 一站一景、站城融合 集大原高铁三座车站落成
- 中国文旅部:前三季度国内旅游人次和花费接近2019年峰值水平
- 世界遗产引领福建做热文旅消费
- 为群众幸福“加码” 为百姓生活“加温”
- 森林消防的“炊事能手”:队友离不开的人
- 年轻人已成养猫主体人群:“看见它,再疲惫的心也被治愈了”
- 国家发改委:携手东盟共建富有韧性的区域产业链供应链体系
- 或被禁止竞选总统?特朗普因这事起诉密歇根州州务卿
- 瑞信银行将向瑞士央行借款500亿瑞郎以增强流动性
- 定制化家庭医生渐入中国普通民众家
- 合肥轨道交通4号线南延线正式开通运营
- 今年前10个月上海口岸对共建“一带一路”国家出口电动载人汽车金额同比增逾五成
- 智库报告:俄乌冲突升级两周年,给世界带来十大影响
- 翻山越岭的“山岳侠客”:希望每一次出警,都能救下求助者