谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 外媒:伊拉克民兵武装称袭击以色列海法港
- 暑假期间多地丰富文旅产品、培育融合业态
- 天津相声会馆涉嫌违规经营 南开文旅局发布情况通报
- 98岁华裔作家聂华苓:我还住在爱荷华,我很好
- 6月百城新建住宅价格环比微降,部分城市二手房挂牌规模持续创新高
- 中新健康|助力科研成果转化 多机构设生物医药产业基金
- 北美龙虾金枪鱼每周飞来长沙
- 杭州十年递出“数字”新名片
- 广东已成立深圳深江铁路重大坍塌事故省政府调查组
- 第55个世界地球日暨第5届亚太地质公园周活动在粤启动
- 春季花粉过敏怎么办?
- 广州启动防暴雨内涝应急响应
- 老街区里潮流新 | 安庆:“街”续文脉,焕新活力
- 《长安三万里》出圈,64.3%受访者感觉古诗文让人“涨知识”
- 特写:浙江建德暴雨红色预警的12小时
- 哈铁全力迎战暴雪保障铁路安全畅通
- (乡村行·看振兴)湖羊变身“致富羊”:山西柳林打造乡村振兴“领头羊”
- 湖北神农架赴广州推介文旅 送上三重优惠大礼包
- 郑州通报“河道贴瓷砖”事件:贴花岗岩石材河道造价约650万元
- 加入北约以来首次 芬兰举行大规模炮兵演习
- 热门推荐
-
- 湖南首条“跨城地铁”开通运营
- 今年春运中国铁路共发送旅客4.84亿人次 同比增39%
- (新春走基层)千年游灯闹元宵 侨乡古镇民俗传
- 浙江省杭州市滨江区基层应急消防站念好“三字经” 全力筑牢防汛一线堡垒
- 联合国报告称哥伦比亚一机库存放失踪人员遗体 哥方否认
- 以数字引领乡村 浙江将建1000家数字工厂、100家未来农场
- 泰国宋干节期间旅游业收入超1400亿泰铢
- 日常烹调中的几个实用“减油”妙招
- 打通金融服务农村“最后一公里”
- “虚假凶铃”频现,美国校园成惊弓之鸟
- 国货美妆小镇崛起 何以“内外兼修”再辟新局?
- 印尼马鲁古群岛附近海域发生6.3级地震 震源深度157公里
- (经济观察)法治保障“加码”,中国再释支持民营经济信号
- 25个大项目进驻沈阳航空航天城 助力沈阳打造世界级航空产业集群
- 山东“扩容”创新发展联合基金 吸引优势力量共促基础研究
- 武警宁夏总队某部下士苗鉴被批准为烈士 追记服务保障一等功
- 临近年终 有企业设置与岗位无关项测试员工忠诚度
- (新春走基层)西藏山南扎西曲登社区:尽展“藏戏第一村”的“入戏”风貌
- 印尼万隆东南发生5.0级地震 有民众受伤房屋受损
- “寒露吃豆” 吃豆制品真的会长结石吗?