美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭。
这说明,之前大模型数学得分高,都是hacking的结果,知道题目训练凑答案。这美国奥数2025年的是新题,就不会了。
做数学题很多毛病,有意思。“通用计数”能力都没有的大模型,怎么做奥数,是很好玩的事。
就这还AGI,玩去吧。
美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭。
这说明,之前大模型数学得分高,都是hacking的结果,知道题目训练凑答案。这美国奥数2025年的是新题,就不会了。
做数学题很多毛病,有意思。“通用计数”能力都没有的大模型,怎么做奥数,是很好玩的事。
就这还AGI,玩去吧。