Gemini_墨语云笺

"Gemini"搜索结果 2 条

如何评价谷歌最新发布的Gemini 2.5 pro模型？

似乎没人说啥呀，那就只能一个评价了：差强人意，勉勉强强吧。不是它不行，是市场已经麻木了，实现不了对前三的超越，就只能是这个情况。 GPQA（Graduate-Level Google-Proof Q&A Benchmark）是一个用于评估高级问答系统的基准数据集。该项目旨在提供一个具有挑战性的问答数据集，以测试和提升AI模型的问答能力。GPQA数据集包含复杂的问题和答案，适合研究生级别的学术研究和工业应用。不过也有对它表扬的，它确实做智力测验比较…

谷歌发布 Gemini 2.5 Pro 模型，称其是一个「思考」模型专为复杂任务打造，它有多强大？

Gemini 2.5 Pro Experimental 03-25一句话总结： Google也要给OpenAI上强度了24号DeepSeekV3教育OpenAI什么是好用又便宜的基础模型，25号Google也来给OpenAI上强度，什么是免费又好用的推理模型。 2.5Pro作为一个推理模型，速度还是挺快，测试的平均耗时控制在50秒。这速度虽然比不上自家flash thinking，但在一众推理模型里算快的。在这个速度上，2.5Pro的成绩达到了85分的极限分，并且其稳定性相当好，中位分仅低1分(2%)。绝…