谷歌首推Gemini 2.5 Flash：成本爆降600%

访客 2025-04-18 15:57:55 15286 抢沙发

默认

4月18日消息，据报道，谷歌发布了突破性混合推理模型Gemini 2.5 Flash，该模型创新性地引入可调节"思考预算"功能，在保持高性能的同时显著降低使用成本。

在闭源思考模式下，其成本仅为0.6美元/百万tokens，相比全功能思考模式（3.5美元/百万tokens）大幅降低600%。值得注意的是，即便在基础模式下运行，其性能依然超越前代Gemini 2.0 Flash。

性能表现方面，Gemini 2.5 Flash在大模型排行榜中以1392分ELO评分高居第二，仅次于GPT-4.5-preview，与Grok-3表现相当。

具体任务测试中，该模型展现出显著优势：在GPQA知识问答中，24K思考预算可带来6%的性能提升；在LiveCodeBench代码基准测试中，16K思考预算时达到最佳表现。

对比测试结果显示，Gemini 2.5 Flash在多模态推理和数学任务上明显优于Claude 3.7 Sonnet，综合性能与OpenAI最新o4-mini模型不相上下。在模拟人类综合能力的"人类最后一次考试"基准测试中，该模型以12.1%的高分位列第二，再次印证其强大实力。

此次发布的Gemini 2.5 Flash通过创新的"思考预算"机制，在性能与成本之间实现了突破性平衡，为AI应用开发提供了更灵活、更经济的选择。

标签：模型预算

分享

发表评论取消回复

评论列表（暂无评论，15286人围观）参与讨论

还没有评论，来说两句吧...