谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 万盏河灯点亮吉林松花江
- 烧穿金属:以色列使用的白磷弹有多可怕?
- 新疆巴楚县举办首届核桃采摘节 逾21万亩核桃全面采摘
- 英国今年上半年诈骗案增长迅速
- 中企承建的孟加拉国首个新能源项目投产
- 金融监管总局:将出台商业健康保险配套政策文件
- 来新疆博斯腾湖 一起解锁池沼公鱼冰湖捕捞
- 中国165支研究生队伍武汉比拼创“芯”力
- 我们是谁?我们将去往何方? 《中国考古》正式上线
- 第四届海峡两岸暨港澳地区汽车场地越野挑战赛决出61个奖项
- 文化中国行丨首次发现黑脸琵鹭!“候鸟国际机场”还有更多新发现
- 美国宣布向乌克兰再提供2亿美元军事援助
- 特朗普或与泽连斯基在巴黎圣母院重新开放仪式期间会面
- 海口特色火山荔枝预计月底上市 一半产量已被订购
- 中方呼吁安理会为妇女、女童免于战火与恐惧创造有利条件
- 台风“泰利”或将袭粤 广东消防派逾440人赴粤西做救援准备
- 专家热议:探索智能时代下面向应用的服务器算力算效评估标准
- 宁夏出台多方面举措促进高校毕业生等青年高质量充分就业
- 广西西林县村民家门口可扫码反映问题 政府后台接单办理
- 北京入汛后最强降雨无人员伤亡
- 热门推荐
-
- 顺义稻田伴鸭鸣
- 中国严打外汇违法犯罪 2020年以来罚没款超17亿元
- 报告:未来“一带一路”地区洪水事件强度将逐渐增强
- 韩最大在野党党首李在明术后在重症监护室恢复中
- 韩国总统警卫处次长第三次拒绝到案接受调查
- 中国人民大学成立全球领导力学院
- (第六届进博会)进博会论“智”:AI的“现在”与“未来”如何赋能产业?
- 儿童感染呼吸道疾病,家长如何用对药?| 科普时间
- 云南楚雄欢庆火把节 热情“火城”点燃游客激情
- “五彩神箭之乡”青海尖扎:传统锅庄舞展现藏文化魅力
- 音乐会“水团”频现怎么管
- 湖北—俄罗斯高等教育交流合作对话会武汉举行
- 记者调查多家青少年培训机构发现 地下二层办班的多问题也多
- “链氪”探链丨一分钟拆解汽车链 看看造一辆车到底有多复杂?
- 《故宫之声》音乐专辑将在年内推出 用音乐传递中华文化之美
- 池黄高铁九华山站钢结构天桥吊装完成
- 江西在建最大直径盾构管片完成 助力昌九高铁建设
- 交通运输部:春运首日全社会跨区域人员流动量预计超1.7亿人次
- 2024年国庆档总票房破20亿
- 青海各医疗机构累计收治震区伤亡人员226人