您所在的位置:首页 - 文化 - 正文文化
今日,OpenAI杀死ChatGPT-3.5
哲翌
2024-07-20
【文化】
394人已围观
摘要智东西(公众号:zhidxcom)编译|李水青编辑|心缘GPT-4o新版本降到1块钱/百万tokens了,打败OpenAI的还是OpenAI!智东西7月19日报道,7月18日晚间,OpenAI推出最便宜模型GPT-4omini,我们第一时间将包括OpenAI在内的10家国内外厂商的大模型API最新定价进行了对比,发现这次其他同行压力不小了。GPT-4ominiAPI输入定价为15美分(约合1.09元人民币)/百万tokens,输出价格为60美分(约合4.36元人民币)/百万tokens,相比GP
智东西(公众号:zhidxcom)
编译|李水青
编辑|心缘
GPT-4o新版本降到1块钱/百万tokens了,打败OpenAI的还是OpenAI!
智东西7月19日报道,7月18日晚间,OpenAI推出最便宜模型GPT-4omini,我们第一时间将包括OpenAI在内的10家国内外厂商的大模型API最新定价进行了对比,发现这次其他同行压力不小了。
GPT-4ominiAPI输入定价为15美分(约合1.09元人民币)/百万tokens,输出价格为60美分(约合4.36元人民币)/百万tokens,相比GPT-3.5Turbo便宜了超60%;但其能力大幅赶超GPT-3.5Turbo,在MMLU测试中取得了82%的好成绩,并在LMSYS排行榜的聊天偏好方面超越了GPT-4。
此前,许多开发者因大模型价格昂贵,转向谷歌的Gemini1.5Flash、Anthropic的Claude3Haiku等小模型。现在,这些模型都被GPT-4omini“狙击”了。
▲GPT-4omini性价比远高于一众小模型(图源:ArtificialAnalysis)
如下表所示,据智东西统计,GPT-4omini目前定价明显低于Gemini1.5Flash的2.5元/百万tokens的输入价格、7.6元/百万tokens的输出价格,也低于Claude3Haiku的1.8元/百万tokens输入价格、9元/百万tokens的输出价格,且性能全方位碾压它们。
同时,从上表可知,国内厂商如深度求索、智谱AI、字节跳动、阿里云、百度、字节跳动、腾讯云、科大讯飞等在6月陆续将模型大幅降价,但现在价格优势也被削弱。
比如阿里云Qwen-Turbo输入价格2元/百万tokens、输出价格6元/百万tokens,百度ERNIE3.5系列输入价格12元/百万tokens、输出价格12元/百万tokens,字节Doubao-pro-128k输入价格5元/百万tokens、输出价格9月/百万tokens……在GPT-4omini面前,性价比都要打一个大大的问号。
OpenAICEOSamAltman称,GPT-4omini“走向廉价到无法计量的智能”。
▲OpenAICEOSamAltman在社交平台X发文
根据OpenAI公告,GPT-4omini对比2022年功能相对初级的GPT-3的text-davinci-003模型,tokens成本已锐减99%。
目前,GPT-4omini已免费上线ChatGPT,预计逐步替代GPT-3.5。
一、赶超GPT-3.5Turbo,问鼎小模型GPT-4omini具备低成本和低时延特征,能胜任多种任务,如:链接或并行模型调用、处理大量上下文、快速实时文本交互等。
它拥有128ktokens的上下文处理能力,在API中已支持文本和视觉输入,且支持16k输出tokens,未来还将扩展到视频和音频的输入/输出。
在多个全球权威基准测试中,GPT-4omini成绩超越了自家的GPT-3.5Turbo以及一众小模型。
在MMLU文本智能与推理基准测试中,GPT-4omini以82.0%的得分领先,而GeminiFlash和ClaudeHaiku分别为77.9%和73.8%。
在MGSM数学推理测试中,GPT-4omini获得87.0%的高分,远超GeminiFlash的75.5%和ClaudeHaiku的71.7%。
在HumanEval编码性能测试中,GPT-4omini也以87.2%的优异成绩领先,GeminiFlash和ClaudeHaiku则分别为71.5%和75.9%。
多模态推理领域,GPT-4omini在MMMU评估中得分59.4%,同样领先于GeminiFlash的56.1%和ClaudeHaiku的50.2%。
在执行任务时,如从收据中提取结构化数据或基于对话历史生成高质量电子邮件回复等,GPT-4omini的表现显著优于GPT-3.5Turbo。
GPT-4omini昨夜刚刚发布,AI大牛AndrejKarpathy在社交平台X上称:“大语言模型的尺寸竞争正在加剧……倒退!我敢打赌,我们会看到非常小的模型,甚至是GPT-2参数级别的模型,已经非常擅长‘思考’”且可靠。”

▲AI大牛AndrejKarpathy在社交平台X发文
二、API输入价格低至1元,已免费上线ChatGPTGPT-4omini现已正式上线,集成于AssistantsAPI、ChatCompletionsAPI及BatchAPI中,今日,杀死供开发人员使用。
费用方面,GPT-4omini输入价格为15美分(约合1.09元人民币)/百万tokens,输出价格为60美分(约合4.36元人民币)/百万tokens,这大致相当于处理约2500页标准书籍内容的成本。
OpenAI计划在接下来几天内推出GPT-4omini的微调功能。
对于ChatGPT用户,无论是免费版、Plus版还是团队版,从今天起他们都将能够体验到GPT-4omini,它将逐步替代GPT-3.5。企业用户也将在下周起接入这一升级。
OpenAI称,GPT-4omini继承了GPT-4o同等严格的安全防护机制。其在预训练阶段过滤掉不良信息,进入训练后采用强化学习与人工反馈(RLHF)等技术,使模型行为更加符合安全策略。
作为首个应用OpenAI指令层次结构方法的模型,GPT-4omini在API中展现出更强的防御能力,有效抵御越狱攻击、即时注入及系统即时提取等风险。
OpenAI将持续监控GPT-4omini的使用情况,一旦发现新风险,立即采取措施提升模型安全性。
OpenAI在公告文末附上了9位团队负责人的名字,其中ShengjiaZhao、HongyuRen、HaitangHu、MiannaChen、KevinLu五位都是华人面孔,毕业学校涉及到了清华大学、北京大学、同济大学等国内知名高校。
结语:模型尺寸竞赛逆转,价格战加剧大模型价格战加剧。OpenAI的GPT-4omini对比2022年功能相对初级的GPT-3的text-davinci-003模型,tokens成本已锐减99%,这是此前6月份产业价格战的高潮延续。
OpenAI的每一次发新都把压力给到同行。而就在同日,英伟达和法国明星AI独角兽Mistral也联合发布了名为MistralNeMo的小杯模型,性能超过Llama38B。更低成本、更高性能的小模型出现,将推动AI无缝融入更多日常场景,也让产业换一个角度思考AI落地。
Tags: 今日杀死
版权声明: 感谢您对【奚诗百科网】网站平台的认可,无特别说明,本站所有文章均归【奚诗百科网】平台所有,转载请说明文章出处“来源【奚诗百科网】”。 https://www.sptgyg.com/post/9008.html
上一篇: 纽曼品牌手机质量怎么样
下一篇: 全球宕机引发暴跌之际,木头姐大手笔抄底!
最近发表
- 艺术设计专业,描绘未来的色彩
- 华为MatePad Pro,重新定义生产力工具的智能平板
- 三星W系列手机,奢华与科技的完美融合
- 探索北京,十大免费景点排名及深度体验指南
- 探索知识宝库,小学四书的奥秘
- 时光的旋律,探索一百首经典老歌曲的魅力
- 艺术设计专业,创意与薪酬的完美融合
- 探索北京,30个免费景点全攻略
- 开启你的学术之旅,研究生择校咨询的艺术与科学
- 探索北京,免费景点的宝藏之旅
- 华为云账号登录官网,一站式指南
- 三星Galaxy S7 Edge,2016年的旗舰手机及其历史价值
- 985工程大学排名名单,中国顶尖学府的荣耀与挑战
- 华为荣耀10青春版,青春的风采,一图尽览
- 考研路上的钱包指南,预算大揭秘
- 华为MatePad Pro,您的智能生活新伙伴
- 时光回响,一千首经典老歌曲大全
- 考研路上的灯塔,揭秘考研辅导机构的神奇力量
- 穿越时空的旋律,一千首经典老歌曲的不朽魅力
- 旋律中的世界,全球著名音乐剧的魅力与影响
- 三星手机图片大全,视觉盛宴,科技与美学的结晶
- 旋律中的世界,探索全球著名音乐剧的魅力
- 三星W系列手机,高端奢华与卓越性能的完美结合
- 函授硕士研究生报考条件,开启你的远程学习之旅
- 英文经典音乐剧,穿越时空的旋律与故事
- 福建省美术学院排名大揭秘,艺术殿堂的十座灯塔
- 探索京城,北京免费景点全攻略
- 四书五经,古典智慧的宝库
- 索尼摄像机使用指南,轻松掌握拍摄技巧
- 考研路上的灯塔,为何选择多样的考研课程至关重要
- 旋律与梦想,探索著名英语音乐剧的魅力与影响
- 电影中的音乐之旅,西方音乐电影的魅力与启示
- 深入了解考研课程班的费用,一个全面的指南
- 探索北京,揭秘免门票的宝藏景区
- 考研课程费用解析,如何判断合适的投资
- 艺术之门,揭秘美术公办二本最低分数线的秘密
- 探索北京,十大必去景点深度游
- 舞动经典,探索歌舞剧电影的魅力
- 戴尔最新款笔记本型号,性能、特点与购买指南
- 深入解析,考研课程费用大揭秘
- 揭秘考研课程费用,如何辨别正规课程,避免经济与时间的双重损失
- 荣耀Magic系统,智能生活的新篇章
- 电影之旅,探索英美经典电影的魅力
- 考研路上的金钥匙,揭秘考研课程的价值与成本
- 探索北京,十大免费景点排名及深度体验指南
- 探索云端世界,华为云账号登录官网的便捷之旅
- 舞动梦想,歌唱生活,美国歌舞剧电影的魅力与影响
- 2023年十大名牌手机,科技与设计的巅峰对决
- 苹果与富士康的舞步,全球供应链中的合作与挑战
- 三星GTS3850,智能生活,触手可及