OpenAI发布GPT-4o mini,API降价60%!智能领域的“经济适用男”

chatgpt下载2025-01-16 03:55:25244
OpenAI又放大招了!他们最新推出的GPT-4o mini,号称是“最经济适用”的小型模型。这不仅仅是一个模型的升级,更像是一场智能革命的开始。今天,就让我们一起来揭开GPT-4o mini的神秘面纱,看看它如何让智能更“接地气”。

惊人性能,亲民价格

GPT-4o mini一经推出就展现出令人瞩目的性能。在MMLU基准测试上,它的得分高达82%,超越了其前身GPT-4。在数学和编码方面,MGSM测试中GPT-4o mini得分为87.0%,多模态MMMU上得分为59.4%,均超过了Gemini Flash和Anthropic的Claude Haiku等竞品。

更令人惊叹的是其极具竞争力的定价策略:

- 每百万输入token仅需15美分

- 每百万输出token仅需60美分

这一定价比之前的顶级模型便宜了整整一个数量级。OpenAI CEO山姆·奥特曼形容这一突破性进展为"通往智能的成本已经低廉到无需计量"。

多模态支持,未来可期

GPT-4o mini不仅支持文本和视觉输入,未来还将扩展到视频和音频领域。它拥有128K token的上下文窗口,知识截至2023年10月。这些特性使得GPT-4o mini在多项任务中表现出色,包括:

- 处理大量上下文

- 与客户快速实时交互

- 推理任务

- 数学和编码能力

- 多模态推理

在关键基准测试中,GPT-4o mini的表现如下:

推理任务:在涉及文本和视觉的推理任务中,GPT-4o mini得分82.0%,而Gemini Flash为77.9%,Claude Haiku为73.8%。

数学和编码能力:在数学推理和编码任务中,GPT-4o mini同样表现出色。在MGSM(数学推理)测试中,得分87.0%,而Gemini Flash为75.5%,Claude Haiku为71.7%。在HumanEval(编码性能)测试中,得分87.2%,而Gemini Flash为71.5%,Claude Haiku为75.9%。

多模态推理:在MMMU(多模态推理评估)中,GPT-4o mini得分59.4%,而Gemini Flash为56.1%,Claude Haiku为50.2%。

安全性不容忽视

在追求性能的同时,OpenAI也高度重视安全性。GPT-4o mini不仅继承了GPT-4o的安全措施,还经过了严格的专家评估和测试。值得一提的是,它是第一个应用指令分层方法的API模型,这显著提高了模型抵御越狱和提示注入的能力。

市场影响与未来展望

市场分析师普遍认为,GPT-4o mini很可能取代GPT-3.5 Turbo,直接与Claude 3 Haiku和Gemini 1.5 Flash展开竞争。这不仅反映了AI技术供应商之间日益激烈的竞争态势,也彰显了OpenAI在AI普及化道路上的坚定决心。

OpenAI的产品经理Olivier Godement表示,公司的使命是安全地构建和分发AI,使其广泛普及。通过不断降低成本同时提升模型能力,OpenAI正在为未来AI无缝集成到每个应用程序和网站铺平道路。

结语

GPT-4o mini的问世无疑为整个AI行业注入了新的活力。它不仅代表了技术的进步,更预示着AI将以更亲民的姿态融入我们的日常生活。随着成本的持续下降和性能的不断提升,我们或许正站在AI大规模应用的风口浪尖,见证着一个更智能、更普惠的数字未来的到来。

地址:https://openai.com/index/gpt-4o-mini-advancing-cost-efficient-intelligence/


本文链接:https://zkka.vip/ChatGPT/67.html

chatgpt苹果app下载如何下载chatgpt苹果版中文版chatgpt下载后怎么使用chatgpt中文下载手机免费版怎样下载chatgpt 人工智能工具正版chatgpt4.0下载教程chatgpt怎么去下载安卓怎么下载官方chatgptchatgpt在哪里下载chatgpt 知乎 下载

相关文章

网友评论