换汤不换药!openAI的o1依然认为9.11比9.9更大!

500

如提问 "9.11 和 9.9 哪个大 ",GPT-4o 回答错误,o1-preview 同样回答错误,一本正经地表示 "9.11 确实大于 9.9. 因为 9.11(即 9.11)比 9.9(9.90)要大 "。啰唆中带着一丝滑稽,更别提思考还花费了 15 秒。

500

换句话说,o1-preview回答问题,比GPT-4o更贵,也更慢。所以炒作了草莓Q计算,史诗级的进步在哪里?

全部专栏