OpenAI发布GPT-4.1系列,开启AI新纪元
OpenAI近日正式推出GPT-4.1系列人工智能模型,包含GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个版本,现已通过API接口开放使用。这一系列模型取代了之前的GPT-4.5预览版,在代码生成、指令遵循和长上下文处理等方面实现了显著提升,其中上下文窗口高达100万个tokens。这一突破性进展使得开发者能够在单个API调用中处理完整的代码库、长篇文档以及复杂的代理工作流。
性能全面提升
在编码任务方面,GPT-4.1展现出卓越的性能。它在SWE-bench Verified基准测试中获得54.6%的分数,远超GPT-4o的33.2%和GPT-4.5的38%。在Aider的多语言编程基准测试中,GPT-4.1的代码差异准确率达到了53%,是GPT-4o(18%)的两倍多。指令遵循能力也得到优化,在Scale的MultiChallenge测试中,GPT-4.1的准确率达到38.3%,相比GPT-4o的27.8%有显著提升。
轻量级版本优化
GPT-4.1 mini模型在保持相近性能的同时,将推理延迟降低了近50%,成本减少了83%。而GPT-4.1 nano则针对低延迟任务进行了优化,在MMLU测试中获得80.1%的分数,在GPQA测试中达到50.3%,在Aider的多语言编程测试中取得9.8%的成绩。
长上下文支持
GPT-4.1系列支持长上下文处理,且无需额外费用,完全遵循标准API的token使用定价。这一特性使其非常适合需要处理大型文档检索、代码库理解或完整项目编辑的应用场景,而无需支付额外费用。
版本更新与迁移
GPT-4.5预览版将于7月14日停止服务。OpenAI建议正在使用GPT-4.5或GPT-4o mini的开发者评估迁移至GPT-4.1的方案。ChatGPT用户将继续使用GPT-4o,同时会逐步整合指令遵循方面的改进。值得注意的是,GPT-4.1系列模型仅通过API提供。
未来发展展望
OpenAI预计将实现显著的收入增长,今年收入预计达到127亿美元,到2026年可能增至294亿美元,这主要得益于ChatGPT Pro等AI订阅服务的成功。尽管面临来自DeepSeek、百度和阿里巴巴等新兴AI公司的激烈竞争,特别是在中国市场,OpenAI仍保持乐观态度。公司正在考虑转向盈利模式,并即将完成一轮重要融资。