基于人类反馈的强化学习:一种新的学习范式

标签:机器学习,强化学习,人类反馈 时间:2023-10-18T21:34:34

欢迎大家关注DataLearner官方微信,接受最新的AI技术推送