谷歌发布最新人工智能模型Gemini 声称性能超越GPT-4和人类专家
科技日报北京12月7日电 (记者张梦然)谷歌公司6日宣布推出一种名为Gemini的新人工智能模型,声称该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。
Gemini已针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra。谷歌拒绝回答有关Pro和Ultra的规模、它们包含的参数数量、训练数据的规模或来源等问题。
其最小版本Nano旨在在智能手机上运行,实际上有两种模型:一种用于速度较慢的手机,拥有18亿个参数;另一种用于功能更强大的手机,拥有32.5亿个参数。
谷歌声称,Gemini的中档Pro版本击败了其他一些模型,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。
这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,包括逻辑谬误、日常道德问题、医疗问题、经济和地理。
在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。
去年,谷歌“深度思维”发布的AlphaCode可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。
谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。
【总编辑圈点】
Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着其可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。
-
上一篇
-
下一篇
相关推荐
- 最近发表
-
- 随机阅读
-
- 国内高铁隧道最大直径盾构机在江西南昌始发掘进
- 安徽7市启动防汛四级应急响应
- 辽宁建昌全力加快房屋建设进度 确保受灾群众温暖过冬
- 广州老糖厂变身“热辣滚烫”的湾区影视基地
- 上海博物馆举办“寰宇东西:马可·波罗眼中的中国和世界”特展
- 山西运城33年塑造 关公文旅“形神兼备”
- 中期协:4月全国期货交易市场成交额同比增逾28%
- 2024中德(欧)隐形冠军论坛将于本月在京举办 探讨产业新机遇
- “文根”何以“深种”?看文博会如何寻找岭南新坐标
- 云南德宏州芒市发生5.0级地震,震源深度10千米
- 特朗普公布国安团队拟任人选
- 人民财评:坚定不移走好中国特色金融发展之路
- “百年老店”的定力
- 新疆莎车县“海鲜”上市 销往全国
- 高庙遗址保护与利用研讨会长沙举行:系中华文明起源时期重要遗址之一
- 2025萝岗香雪文化季启幕
- 女子频繁头痛 竟与饲养鹦鹉有关
- 应急管理部公布一批粉尘涉爆企业行政处罚典型案例
- 古丝路“西引”人潮甘肃游:前三季度揽客3亿人次
- 平陆运河企石枢纽泄水闸首个闸墩封顶
- 热门推荐
-
- 人民艺起评:刷新历史最好成绩,2024春节档的变化值得关注
- 一个人的史志——《江汉春风起》序
- “中国蒸菜之乡”湖南浏阳打造预制菜产业新高地
- 市场监管总局发布电热毯等5类产品消费提示
- 【高质量发展调研行】上海“一网通办”:做好政务便捷服务“大文章”
- 浙江七旬老人南宁苦寻好心人:只为当面跟她说一句“谢谢”
- 前8月雄安新区教育业投资同比增长11.2倍
- 美防长:撤销“9·11”恐袭3名嫌疑人的认罪协议
- 深圳打造“食安快线”专业培训平台 提升食品安全专业能力
- 网络评分9.3分,国产纪录片《众神之地》为何惊艳观众
- 日本失踪直升机调查进展:发现疑似机载人员遗体
- 清华大学迎3800余名“三字班”新同学
- 数字化的浙江宁波乡村掠影:智治赋能“三农”
- 东盟“Z世代”留学生沉浸式体验壮乡民俗
- 特朗普再度登场!TA们如何影响世界政坛?
- IMF警告美国债务违约将拖累全球经济:连续加息已伤害多国
- 看待英语学习不能走极端
- 2024年我国造船三大指标全面增长
- 乘警党海华的 “家乡守护之旅”
- 上海警方今年以来侦破涉烟犯罪案件40余起 涉案金额1.5亿余元