美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%

美国奥数题撕碎AI数学神话,顶级模型现场翻车!最高得分5%,DeepSeek唯一逆袭。

这说明,之前大模型数学得分高,都是hacking的结果,知道题目训练凑答案。这美国奥数2025年的是新题,就不会了。

做数学题很多毛病,有意思。“通用计数”能力都没有的大模型,怎么做奥数,是很好玩的事。

就这还AGI,玩去吧。

500

500

500

500

站务

全部专栏