DataLearner logoDataLearnerAI
Latest AI Insights
Model Evaluations
Model Directory
Model Comparison
Resource Center
Tool Directory

加载中...

DataLearner logoDataLearner AI

A knowledge platform focused on LLM benchmarking, datasets, and practical instruction with continuously updated capability maps.

产品

  • Leaderboards
  • 模型对比
  • Datasets

资源

  • Tutorials
  • Editorial
  • Tool directory

关于

  • 关于我们
  • 隐私政策
  • 数据收集方法
  • 联系我们

© 2026 DataLearner AI. DataLearner curates industry data and case studies so researchers, enterprises, and developers can rely on trustworthy intelligence.

隐私政策服务条款
  1. Home/
  2. Blog List/
  3. Blog Detail

深度学习9个小时内教会机器人拿起和剥开香蕉

2022/03/28 09:10:39
1,104 views
论文快讯

仅仅使用来自人类数据集的机器学习,在短短9个小时内,日本研究人员让一个机器人学会了如何拿起和剥开香蕉。

对机器人来说,操纵可变形的物体,如柔软的水果,是有问题的,因为物体建模有困难,而且对所需的力的类型和灵活性缺乏了解。

东京大学智能系统和信息学实验室的研究员Heecheol Kim与同事合作,开发了一个基于 "目标条件双行动深度模仿学习(DIL)"的系统。这可以利用人类的示范数据学习灵巧的操纵技能。

这项任务涉及九个阶段--从抓取香蕉到用一只手把它从桌子上拿起来,用另一只手抓住香蕉的尖端,剥皮,然后移动香蕉,这样就可以把剩下的皮去掉。整个过程需要不到三分钟。

据Kim说,该系统的数据效率很高,因为它只使用了13个小时的训练数据,而不是数百或数千小时。"他说:"它仍然需要相当多昂贵的GPU[图形处理单元],但通过使用我们的结构,我们可以减少[所需]的大量计算量。

该团队解释说,除了香蕉之外,该系统还可以更普遍地用于机器人处理需要精细运动技能的任务。Kim和他的团队的一篇论文本月发表在预印本服务器arXiv上。

arxiv地址:https://arxiv.org/abs/2203.09749

DataLearner WeChat

Follow DataLearner WeChat for the latest AI updates

DataLearner 官方微信二维码
Back to Blog List

Related Blogs

  • 如何构建下一代机器翻译系统——Building Machine Translation Systems for the Next Thousand Languages
  • XLNet基本思想简介以及为什么它优于BERT
  • Unifying Language Learning Paradigms——谷歌的一个模型打天下
  • 正则化和数据增强对模型的影响并不总是好的:The Effects of Regularization and Data Augmentation are Class Dependent
  • 最近一段时间深度学习大模型的重要进展(2022年4月初)
  • Google最新超大模型Pathways:一个会讲笑话的6400亿参数的语言模型
  • 大型语言模型的新扩展规律(DeepMind新论文)——Training Compute-Optimal Large Language Models
  • 新的对话式语言模型可以将自然语言转换成可执行代码!

Hot Blogs

  • 1Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
  • 2回归模型中的交互项简介(Interactions in Regression)
  • 3贝塔分布(Beta Distribution)简介及其应用
  • 4矩母函数简介(Moment-generating function)
  • 5普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
  • 6使用R语言进行K-means聚类并分析结果
  • 7深度学习技巧之Early Stopping(早停法)
  • 8手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署