谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 选芝麻油也有诀窍?请看“打香油”的正确方法
- 北京海关出台优化营商环境27项措施 助推外贸高质量发展
- 精准打击癌细胞,核药研发备受关注
- 青海省8月16日15时发布强对流黄色预警
- 春节期间厦门空港出入境9.6万余人次 同比增180%
- 大咖话川酒丨杨柳:“大国浓香”有底气,发声扬正气,整个川酒才有生气
- 越南留学生黄秋姮:在旅途中感受中国服饰的魅力
- 《青春几回合》聚焦90后创业生活
- 中欧班列上的“青春力量”
- 2024全球工业互联网大会在沈阳开幕
- 菲律宾6月外国直接投资流入量降至四年来最低水平
- 山西手艺人“化腐朽为神奇” 巧手将“金属废物”变“艺术品”
- 世界目光聚焦杭州亚运会:促进文化交流 彰显亚洲团结|世界观
- 外国游客打卡山西高平 领略古建文化和非遗魅力
- (新春走基层)山西老民警的坚守:站好最后一班岗 守护春运返乡路
- 多年冻土融化对北极有何影响?国际最新研究称或致当地野火增加
- 摄影作品看浙江义乌:从“鸡毛换糖”到“买卖全球”
- 邮储银行为小微企业蓄力赋能:普惠型小微企业贷款余额达1.41万亿元
- 山村飘来咖啡香 浙江小村缘何吸引年轻人奔涌而来?
- 荧屏刮起“土系狠劲儿”风 非偶像系男演员频出圈
- 热门推荐
-
- 骑手抢单靠“开挂”?“抢单外挂”黑灰产业链扰乱市场秩序
- 国家统计局:2023年12月份规模以上工业增加值增长6.8%
- 蛋白质形状有助检测帕金森病
- 假退费,真诈骗!警惕培训班退费骗局
- 乌官员:乌克兰自去年8月以来已通过敖德萨地区港口出口2000多万吨货物
- 七省市实施碳排放权交易试点 近十年累计成交额152.63亿元
- 柳州市文旅局长喊话北京市民:欢迎大家坐着动车来嗦粉!
- 中外文旅达人“萌趣”新体验:高原“撸猫”“吸熊”
- 春意盎然,中国经济展示新活力(望海楼)
- 新航季澳门航空福州-澳门航班时刻优化 便利转接
- 云南发现兰科植物新种——盈江虾脊兰
- 1针完成!机器人辅助高效穿刺活检
- “苏拉”将严重影响福建南部
- 两岸专家学者共话中华文化传承发展
- 优化消费环境三年行动将启动:破解消费痛点问题 扶持良心商家
- 外媒:芬兰将关闭与俄罗斯所有边境口岸
- 外贸“新三样”持续火热 产业升级夯牢发展基石
- 预付式消费卡退款难 检察机关公益诉讼解消费者后顾之忧
- “太保蓝之队”精彩赛程抢先看
- 江山如画丨海南兴隆:浓浓咖啡香 深深侨乡情