2023年4月25日的AI技术新进展快报:Chatbot Arena、Track Anything、600+AI工具、RedPajama 7B进展、科大讯飞大模型内测等
最近两天,关于AI技术和产品的进展依然很快。所以,我们本次直接给出一个AI技术进展快报。与大家分享一下最新的AI技术情况。

LMSys发布新的大模型对比工具Chatbot Arena
LMSys全称是Systems for Large Models,是前段时间发布Vicuna模型的组织。Vicuna模型信息:https://www.datalearner.com/ai-models/pretrained-models/Vicuna-13B
LMSys在今天发布了一个新的AI模型对比工具Chatbot Arena,集成了目前比较流行的8个开源大模型,包括:Vicuna、Koala、OpenAssistant、Dolly、ChatGLM、StableLM、Alpaca和LLaMA。
Chatbot Arena提供了一个对比页面,大家可以输入一个问题,会有2个匿名的模型返回结果,你可以对结果进行投票。投票完成之后会出现具体什么模型输出的结果。下图就是我测试的一个问题:tell me the concept of perplexity measurement in a few sentences

可以看到,效果其实差不多。但是我认为Model A的结果似乎更加好一点,所以投票给了A。我也测试了一个中文问题,差距更加明显:

注意,目前官方提供了8个模型,你可以使用单一模型对话,也可以使用匿名的2个模型对话,还可以指定两个模型回答你的内容,很方便。官方说的是为了对比测试,但我觉得这个如果持续下去,未来也许可能是一个集合工具~~~
Chatbot Arena地址:https://chat.lmsys.org/?arena
Track Anything
Track Anything是University of Warwick的博士生Mingqi Gao开源的一个视频对象追踪工具,利用前段时间MetaAI开源的SAM模型(SAM模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/SAM )完成的。
Track Anything可以在视频中追踪某个对象,即先根据你的需要获得分割的对象结果,然后随着视频追踪这个对象,下图是利用这个工具追踪复联角色的例子(这是一个动图,不过太大了,可能加载比较慢):

这个工具其实是上周发布的,之前我也没怎么留意,但是效果很不错。官方还提供了对清明上河图的一个人物分割案例。
Track Anything开源地址:https://github.com/gaomingqi/Track-Anything
RedPajama 7B进展
RedPajama是TOGETHER发起的一项开源模型项目。它的目的是为了复现MetaAI的LLaMA论文。在4月17日,他们已经公布了按照LLaMA论文收集的数据,共1.2万亿个tokens,共5TB数据。
而在今天,他们在官方博客宣布,基于上述数据训练的RedPajama-7B的模型已经有了新的进展。目前,他们使用与EleutherAI的Pythia-7B,相同的模型架构和分词器,并在Pile上进行训练。目前看,RedPajama-7B的性能已经超过了Pythia-7B,但是,它们的模型训练还没有完成。因此,可以期待后续RedPajama-7B的训练结果。根据之前的信息,该模型应该会完全开源!

AI研习社公布收集的600+AI工具
AI研习社的童鞋收集了600多个AI工具,包括编程助手、文案撰写、客服助手、设计助手等。非常丰富!尽管某些工具看起来很智障,但是好好挑选,还是有很多有价值的工具的。

600+AI工具地址:https://zl49so8lbq.feishu.cn/wiki/wikcn6YTN3CrZTS8RhrEca8c8Eg
MetaAI新教程:自监督学习的Cookbook发布
与有标签数据的监督学习相反,自监督方法(Self-supervised learning,SSL)可以从大量的无标签数据中学习。自监督学习是深度学习在自然语言处理方面取得成功的基础。使用大量无标签数据进行训练的能力带来了许多好处。虽然自监督学习的许多组件对研究人员来说都很熟悉,但成功地训练自监督学习方法需要从预训练任务到训练超参数的一系列令人眼花缭乱的选择。

Yann LeCun在推特上亲自宣布,MetaAI发布新的关于自监督学习的教程《A Cookbook of Self-Supervised Learning》。该教程由MetaAI出品,联合纽约大学、马里兰大学等专家学者发布,共70页。包含了各种不同的自监督学习技术和方法介绍、自监督学习模型的部署与训练技巧、NLP和CV之外的领域如何使用自监督学习方法。
这个教程真的十分值得大家下载学习,我看了,写得很细致~~
论文地址:https://arxiv.org/abs/2304.12210
科大讯飞的ChatGPT——星火认知大模型开始内测
前段时间,科大讯飞前段时间宣布自己即将在5月6日官宣自己的大模型。科大讯飞一直是AI领域的明星企业,很有名,但是真说到技术很多人都不是那么了解。但是,今天科大讯飞突然开始邀请开发者来对星火认知大模型内测。


根据目前部分网友的反馈,科大讯飞星火认知大模型效果很不错,而且可以联网使用。
大家可以自己去申请测试~~~
科大讯飞星火认知大模型申请地址:https://xinghuo.xfyun.cn/
欢迎大家关注DataLearner官方微信,接受最新的AI技术推送
