就在刚刚,OpenAI再次突破界限,推出了全新的o1系列模型,也就是传了很久的Strawberry大模型,他终于来了!
最强推理模型o1
o1系列模型标志着OpenAI在AI推理领域的最新突破。该系列包括o1(完全体,暂未公开)、o1-preview(早期版本)和o1-mini(性价比更高)三个版本,分别针对不同的应用场景和需求进行了优化。
o1系列标志着OpenAI在人工智能领域的新篇章,作为公司首个采用强化学习方法的模型,它在提供答案前会展开深入的思维链,这一过程显著提升了其解决问题的能力。
简言之,o1的思维链越详尽,其思考过程越周密,它在逻辑推理任务上的表现也就越出色。
那么,o1的性能究竟如何呢?
OpenAI放出信息,o1在竞争性编程问题(Codeforces)上排在前89%,在USA数学奥林匹克竞赛(AIME)的资格赛中位列美国学生的前500名,并且在物理、生物和化学问题的基准测试(GPQA)上超过了人类博士学位级别的准确度。
OpenAI的首席执行官Sam Altman也给出了明确的答案:
在最近举行的2024年国际信息学奥林匹克竞赛(IOI)上,o1的微调版本在每道题目有50次尝试机会的情况下,得分为213分,这一成绩足以让它在人类参赛者中排名前49%。
而如果放宽限制,允许每题尝试10000次,o1的得分将高达362.14分,这一成绩能够赢得金牌。很强
和GPT-4o相比,o1在数理化生、英语法律经济等各种科目都有不同成绩改进。
o1的思维链
OpenAI官网给出了o1-preview面对编程、数学、英语、科学等各个领域回答问题的完整思维链,并和GPT-4o做了对比。
4、按照步骤完成任务,并回复提问者。
这个流程就让o1比之前的模型都更聪明了。
思维链非常长,感兴趣可以自行去官网查阅详细内容,模拟自己解决对应问题去看,挺有意思。
使用权限
ChatGPT Plus和Team用户可以立即访问o1-preview和o1-mini。
Enterprise和Edu用户将在下周获得访问权。
API使用等级5(已消费1,000 美元且自首次付款以来已超过30天)的开发者,今日起可使用这两款模型,速率限制为20RPM。
ChatGPT免费用户未来可能获得o1-mini的使用权。
API价格
o1-preview的定价是1M输入token15美元,1M输出token60 美元,与GPT-4o的定价相比,输入是其3倍,输出是其4倍。使用成本并不便宜。
最适合哪些领域
o1系列模型的推理技能为各行业专家提供了更强力的支持,特别是在那些需要解决科研、编程和数学等复杂问题的领域,比如:
医疗研究:生物信息学专家能够使用o1辅助细胞序列数据的注释,从而显著提升基因组学研究的效率。
物理学研究:物理学家可以利用o1在量子光学等先进领域构建复杂的数学模型,推动理论探索和实验设计的发展。
软件开发:跨行业的开发人员可以借助o1来设计和实施多步骤的程序流程,简化编程工作的复杂性。
总体而言,o1模型会成为了那些需要深入分析、解决复杂问题或进行创新性研究的专业人士的智能助手。
十分期待未来完全体o1模型的发布。
本文链接:https://zkka.vip/ChatGPT/76.html
OpenAI-o1ChatGPTPlusOpenAI o1chatgpt 中文OpenAIo1OpenAI01chatgpt o1o1-minio1-preview??OpenAI o1-miniOpenAI o1-preview
网友评论