近日,OpenAI 正式发布了 o3 和 o4-mini 模型,代表着 ChatGPT 能力的重大飞跃。
o3 堪称最强大的推理模型,o4 - mini 则针对快速且具成本效益的推理进行了优化。这两款模型均展现出卓越的推理能力,能智能调用 ChatGPT 中的各类工具,像搜索网络、运用 Python 分析数据、深入推理视觉输入以及生成图像等。面对复杂问题,它们可通过推理决定何时、如何运用工具,在通常不到一分钟的时间内生成详尽且经过深思熟虑的答案,极大提升了处理多方面复杂问题的效率。
性能表现上,o3 在编码、数学、科学、视觉感知等领域成绩突出,在 Codeforces 等基准测试中达到新的最先进水平(SOTA),在解决现实难题时比 o1 少犯 20% 的重大错误。o4 - mini 在数学、编码和视觉任务方面性能出色,在 AIME 2025 中得分高达 99.5%,在非 STEM 任务以及数据科学等领域也优于 o3 - mini。而且相较于前代模型,它们支持更为自然的对话,能够参考记忆和过往对话,让回应更具个性化。
在视觉推理方面,这两款模型独具特色,可将图像融入思维链,解读模糊、颠倒或低质量的图像,甚至能实时对图像进行旋转、缩放等操作。成本层面,在 2025 AIME 数学竞赛中,o3 性价比超越 o1,o4 - mini 胜过 o3 - mini。安全上,重建了安全训练数据,增添新拒绝提示,成绩优异,还开发了系统级缓解措施,训练推理 LLM 监控器,能有效标记约 99% 的生物风险对话。
使用方式上,ChatGPT Plus、Pro 和 Team 用户已能在模型选择器中看到 o3、o4 - mini 和 o4 - mini - high,取代了之前的 o1、o3 - mini 和 o3 - mini - high;Enterprise 和 Edu 用户一周后可获取访问权限;免费用户提交查询前选择 “思考” 即可尝试 o4 - mini。OpenAI 预计几周内还将发布 o3 - pro,并提供全部工具支持 。
这推理模型的技术竞赛已进入白热化阶段,现在正是学习AI,加入AI行业的好时机。近屿智能精心策划并推出了《AIGC大模型应用工程师》、《AIGC多模态大模型应用工程师》及《AIGC多模态大模型产品经理》三大AIGC大模型课程,结合实战项目演练,帮助学员快速掌握前沿AI技术和大模型应用,课程还提供求职辅导、面试机会和就业推荐,三大AI培训课程助力学员在AI时代脱颖而出。
OpenAI 最强推理模型o3 和 o4-mini 正式发布,近屿智能带你入局AI
点赞
收藏