OpenAI发布GPT-4o mini，API降价60%！智能领域的“经济适用男”

chatgpt下载2025-01-16 03:55:25244

OpenAI又放大招了!他们最新推出的GPT-4o mini，号称是“最经济适用”的小型模型。这不仅仅是一个模型的升级，更像是一场智能革命的开始。今天，就让我们一起来揭开GPT-4o mini的神秘面纱，看看它如何让智能更“接地气”。

惊人性能，亲民价格

GPT-4o mini一经推出就展现出令人瞩目的性能。在MMLU基准测试上，它的得分高达82%，超越了其前身GPT-4。在数学和编码方面，MGSM测试中GPT-4o mini得分为87.0%，多模态MMMU上得分为59.4%，均超过了Gemini Flash和Anthropic的Claude Haiku等竞品。

更令人惊叹的是其极具竞争力的定价策略：

- 每百万输入token仅需15美分

- 每百万输出token仅需60美分

这一定价比之前的顶级模型便宜了整整一个数量级。OpenAI CEO山姆·奥特曼形容这一突破性进展为"通往智能的成本已经低廉到无需计量"。

多模态支持，未来可期

GPT-4o mini不仅支持文本和视觉输入，未来还将扩展到视频和音频领域。它拥有128K token的上下文窗口，知识截至2023年10月。这些特性使得GPT-4o mini在多项任务中表现出色，包括：

- 处理大量上下文

- 与客户快速实时交互

- 推理任务

- 数学和编码能力

- 多模态推理

在关键基准测试中，GPT-4o mini的表现如下:

推理任务:在涉及文本和视觉的推理任务中，GPT-4o mini得分82.0%，而Gemini Flash为77.9%，Claude Haiku为73.8%。

数学和编码能力:在数学推理和编码任务中，GPT-4o mini同样表现出色。在MGSM（数学推理）测试中，得分87.0%，而Gemini Flash为75.5%，Claude Haiku为71.7%。在HumanEval(编码性能)测试中，得分87.2%，而Gemini Flash为71.5%，Claude Haiku为75.9%。

多模态推理:在MMMU（多模态推理评估）中，GPT-4o mini得分59.4%，而Gemini Flash为56.1%，Claude Haiku为50.2%。