DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Home/
  2. Blog List/
  3. Blog Detail

强大的对象分割开源算法!Meta AI开源Segment Anything: Working(SAM)预训练大模型!

2023/04/24 22:43:01
2,030 views
MetaAI图像分割预训练模型

SAM全称是Segment Anything Model,由MetaAI最新发布的一个图像分割领域的预训练模型。该模型十分强大,并且有类似GPT那种基于Prompt的工作能力,在图像分割任务上展示了强大的能力!此外,该模型从数据集到训练代码和预训练结果完全开源!真Open的AI!

Segment Anything Model的模型卡信息:https://www.datalearner.com/ai-models/pretrained-models/SAM

下图就是在线演示系统中,从草丛中分割出小狗的效果

可以看到效果十分逼真。我自己也上传了一张图片,把黑色眼镜完整从黑色键盘背景中分割出来了!

效果太惊艳了!

在自然语言处理和最近的计算机视觉领域,基础模型是一个有前途的发展方向,它通常可以通过使用“提示”技术对新的数据集和任务进行零-shot和少量样本学习。但是,这样的工作方式目前很少运用在CV领域。而MetaAI试图提出可提升的分割任务( promptable segmentation)。SAM就是这样的产物。

最重要的是SAM完全开源!这也是继MetaAI贡献的LLaMA之后又一个十分卓越的开源贡献!很快,各种新的分割应用应该就会出现了!

目前,SAM开源了3个模型,即 vit_h、vit_l和vit_b,最后一个是最大的结果!

SAM官方博客地址: https://ai.facebook.com/blog/segment-anything-foundation-model-image-segmentation/ SAMGitHub项目开源地址: https://github.com/facebookresearch/segment-anything SAM在线演示地址: https://segment-anything.com/demo# SAM数据集地址: https://segment-anything.com/dataset/index.html SAM论文地址: https://scontent-sjc3-1.xx.fbcdn.net/v/t39.2365-6/10000000_900554171201033_1602411987825904100_n.pdf

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

DataLearner 官方微信二维码
Back to Blog List

Related Blogs

  • 重磅!MetaAI开源4050亿参数的大语言模型Llama3.1-405B模型!多项评测结果超越GPT-4o,与Claude-3.5 Sonnet平分秋色!
  • Llama3相比较前两代的模型(Llama1和Llama2)有哪些升级?几张图简单总结Llama3的训练成本、训练时间、模型架构升级等情况
  • 开源王者!全球最强的开源大模型Llama3发布!15万亿数据集训练,最高4000亿参数,数学评测超过GPT-4,全球第二!
  • Meta上线了一个基于Emu文本生成图像大模型的图像生成系统Imagine:图像细节丰富、色彩鲜明、想象力很棒,而且免费使用!
  • MetaAI发布语音识别错误率是OpenAI的Whisper模型的一半且支持1107种语言的ASR模型:MMS
  • 重磅!学术论文处理预训练大模型GALACTICA发布!
  • 6张示意图解释6种语言模型(Language Transformer)使用方式
  • 简单几步教你如何在搭建并使用DALL·E开源版本来基于文字生成图片

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署