返回大模型技术资讯

AI服务大比拼:ChatGPT、Claude、Perplexity等的优缺点分析

2024-04-25AI服务ChatGPTClaudePerplexityGPT-4对比评测

ChatGPT和GPT-4的进化之路

很多人最早接触AI服务都是从OpenAI的ChatGPT开始的。GPT-4发布后,订阅了ChatGPT Plus的用户都惊叹于它的能力。但随后ChatGPT的质量开始下降,比如会出现”/ Your code goes here /“这样的懒惰回复。与此同时,Google推出了Gemini Advanced,与Google办公套件紧密集成,但在编程、数学等逻辑任务上还是要避免使用。

Copilot Pro的不足之处

Copilot Pro使用了与ChatGPT Plus相同的GPT-4模型,同样存在懒惰回复的问题,上下文窗口也更小,限制更多。它与Microsoft办公套件的集成对个人用户来说也不太理想。

Claude的起起落落

Claude一度成为最好的AI助手,每8小时可以发送100条消息。但随着用户的增多,现在每5小时只能发送45条消息,而且上下文越多,消息数量上限越低。200k的上下文优势几乎被抵消,每5小时只能发5条消息,Claude的优势荡然无存。

Perplexity和Phind的搜索能力

Perplexity提供了3个模型,每天可发600条消息,可以突破知识截止日期进行互联网搜索。但最近将Claude消息上限降至30条。它在编程方面表现一般。Phind是一个类似的AI搜索引擎,提供了更透明的使用量显示,但与Claude一起使用时bug较多,而且会随机切换到自家的70B模型。

You.com和Omni GPT的优缺点

You.com提供了无限的使用量,但GPT-4 Turbo模型感觉被过度简化了,怀疑其检索增强系统还需完善。它适合经常使用AI的学生用户。Omni GPT让人感觉像是一个骗局,客服回复速度慢,限制和隐私政策定义不清,价格最便宜但可疑。它还有很多技术问题和延迟。

Poe的没落

Poe曾经是性价比最高的选择,提供多种AI模型和上下文长度。但后来用点数取代了消息上限,点数会通胀,使用Claude一次要1万点,100万点根本不够用。这个定价机制彻底毁掉了Poe。

重回ChatGPT Plus怀抱

ChatGPT推出新的GPT-4 Turbo模型后,又重新成为了最佳选择。提供40条保证消息,支持自定义指令、文件上传、视觉、图像生成等,还能在后台浏览网页获取最新信息。如果Poe恢复消息上限机制可能还有的一拼。普通用户如果也能获得128k上下文就更完美了。

对第三方AI服务的思考

除了Phind、Perplexity、You.com,其他第三方服务大多是以更低的质量来高价倒卖。它们没有足够的资源来兑现承诺,可能是检索增强系统实现较差,也可能是在撒谎。使用这些服务要格外小心,尤其是Vello和Omni GPT,前者非常可疑,后者还有待时间检验。