+1

收藏
0

评论
+1

点赞

分享

Claude 3反超GPT-4竞技场登顶！小杯Haiku成开发者新宠：性价比无敌

量子位
量子位官方账号

03-27 16:45

鱼羊发自凹非寺

量子位 | 公众号 QbitAI

GPT-4真的被反超了！

大模型竞技场上，Claude 3大杯Opus新王登基，Elo分数来到榜首。

500

连小杯Haiku也跻身第二梯队，超过了GPT-4-0613这个型号，把GPT-3.5-turbo远远甩在身后。

500

Haiku的输入token价格，可是比GPT-3.5-turbo还便宜了一半，输出方面，每100万token也比GPT-3.5-turbo便宜近2块钱。

500

跟GPT-4相比，价格更是只有1/20。并且Haiku同样支持200k上下文。

500

难怪有开发者直言：

GPT-3.5在Claude Haiku面前不堪一击。
不仅仅是价格更便宜，Haiku还更上一层楼了。

500

而在Claude 3加入竞技之前，GPT-4家族已经霸榜快一年了。

500

给新来的朋友补充一下背景知识：大模型竞技场榜单（LMSYS Chatbot Arena Leaderboard）的评分标准是人类打分，同一个问题同时抛给A、B两个模型，人类裁判觉得哪个回答得好就给哪个投票。

小杯Haiku成开发者新宠

值得一提的是，在竞技场官方贺电中，Haiku这个型号也被专门高亮了出来：

根据我们的用户偏好，Claude 3 Haiku达到了GPT-4级别。
其速度、功能和上下文长度在目前的市场上是独一份的。

500

具体有多快，已经有网友做了个直观的对比：

博尔特还没跑完100米，Haiku已经读完100k token的文档了……

500 500

事实上，凭借其超高的性价比，在开发者社群中，Claude 3小杯Haiku确已成新宠。

已经有人第一时间大开脑洞，搞出了能让Haiku效果“超频”到大杯Opus水准的开源项目，吸引不少关注。

500

简单来说，就是让Opus给Haiku当老师：

先用Opus生成执行任务的范例，再用这些教学案例来提高Haiku的姿势水平。

划重点：Haiku的价格仅为Opus的1/60，而响应速度则是Opus的10倍。

这个名为gpt-prompt-engineer的项目目前在GitHub上累计揽下7.3k标星。

500

还是这位马特老哥，还用Opus和Haiku搞了个“AI股票分析师”，直接火上了GitHub热榜。

500

不少应用产品也在第一时间接入了Haiku。比如能依据Prompt自动生成网站UI的Vercel。

△就说快不快吧

不过，就在一片给Claude 3新王点赞的声音中，也有网友认为：

GPT-3.5作为一个“老”模型，至今仍在与最新的模型竞争，这件事本身就很疯狂了。

500

但最让开发者们期待的当然还是：

500

OpenAI，快起来卷（doge）。

500

科技举报

量子位

1735篇文章 | 61189人关注

+关注

观察者网用户社区

作者文章查看全部>>

余华建议女学生结婚要找江浙男，大家怎么看？

阅读 24080

等31人已参与问答

如何评价多益网络规定员工娶妻彩礼不得超10万？

最新提问

等10人已参与问答

雷军建议王传福牵头，联合蔚小理搞统一生态，如何看待这一建议的前景？

阅读 99911

等445人已参与问答

热点

最近更新的专栏

郭松民

昆仑策研究院高级研究员
- 郭松民 | 请向他们投去敬佩与羡慕的目光！
余亮

复旦大学中国研究院门卫大爷
- 《巨流河》：一部“民国范尔赛”作品
我想逗乐这个闷闷的世界

愿世界更欢乐
- 爆文《我妻之死》的情况，换到中国已经投诉一百次了。
晨枫

古今多少事，都付笑谈中
- 别的茶我不知道，但龙井水配龙井茶，那真是此味只应天上有
李建秋
- 为什么一定要说清“慈禧是否向列强宣战”？
持续低熵

五百年的因，五千年的果。最后的斗争，最初的承诺。
- 对所谓“旧社会残余”的若干认知阶段
最华人

有华人的地方，就有最华人
- 涂山，是一座什么山？
脑极体

从技术协同到产业革命，从智能密钥到已知尽头
- 为“风”转“液”加速，一台宁畅服务器的“全液冷”突围
差评
- 我去了趟北京车展，结果大家都在看雷军。
钧正平工作室
- 校园抗议的浪潮，靠“甩锅”能捂得住吗？

风闻最热

全部专栏