标签:人工智能,GPT-4,情绪感知,大模型 时间:2023-11-04T18:48:07
在人工智能的发展史上,最新的一章可能是最具人性的一章。
最新的一篇论文指出,当用户表达出紧迫感或压力等情绪时,像GPT-4这样的人工智能模型可以表现得更好。这一发现对于开发者和企业家来说具有重要意义,它揭示了一种新的引导方式,即将情绪语境融入到引导中。
问题的关键在于交流的本质。当人们交谈时,他们不仅仅是在交换信息,他们还在分享感情、意图和紧迫感。这是一场由情绪线索引导的语境和潜文本的舞蹈。这项研究要解决的问题是,尽管人工智能本身没有情绪,但它是否能够对我们在言语中赋予的情绪重量做出反应,如果可以,这是否会改变它的表现?
在深入了解人工智能的人性反应之前,让我们先来解析一下技术层面。像GPT-4这样的大模型(LLMs)是建立在复杂的神经网络上的,它们通过分析大量的文本数据来识别单词、句子和整体语境之间的模式和关系,以生成连贯和符合语境的回应。
这项研究的核心创新在于引入了”情绪引导”(EmotionPrompts)。这种方法涉及将情绪意义融入到提供给大模型的引导中。与标准引导(直接请求信息或行动)不同,情绪引导带有额外的情绪相关层次,比如强调任务对个人职业的重要性或暗示紧迫感。
将情绪线索融入语言模型引入了一个有趣的动态:当输入引导暗示情绪重要性时,大模型可以产生更优的输出。最近的研究在各种模型和任务上严格测试了这一现象,提供了大量的数据,这些数据可能会改变我们对人工智能的理解和使用。
研究人员设定了45个不同的任务,覆盖了广泛的人工智能应用,以评估大模型在接收到情绪引导时的表现。
确定性任务:这些任务有明确的正确或错误答案,比如语法纠正、事实核查或数学问题求解。模型在这些任务上的表现可以根据明确的基准进行衡量,提供关于其准确性的客观数据。
生成性任务:与此相反,生成性任务要求人工智能生成可能没有单一正确答案的内容。这包括创意写作、生成解释或提供建议。这些任务对于人工智能来说特别具有挑战性,因为它们不仅要正确,而且要连贯、相关且引人入胜。
在确定性任务中,研究人员观察到使用情绪引导时,性能明显提高。例如,在进行指令归纳(测试人工智能根据给定输入跟随并生成指令的能力的过程)时,模型在相对性能上显示出8.00%的改善。
更令人惊讶的是,在BIG-Bench任务中的性能飞跃,这些任务作为评估语言模型能力的广泛基准。在这里,使用情绪引导产生了惊人的115%的改善。这表明模型不仅更好地理解了任务,而且在呈现的风险更高时,产生了更准确或更适当的回应。
为了补充客观指标,研究还纳入了人的元素。106名参与者评估了生成性任务的输出,评估人工智能生成的回应的质量。这种主观分析涵盖了性能、真实性和责任感等方面,反映了人们对人工智能输出的微妙判断。
当评估从普通引导和增强情绪线索的引导中得到的回应的质量时,参与者注意到平均改善了10.9%。这种性能的提升突显了情绪引导不仅可以提高人工智能回应的事实准确性,而且可以增强它们与人类期望和价值观的一致性。
这些发现的含义是多方面的。在技术层面,它们支持了大量证据,即大模型对引导工程敏感,这个事实可以被利用来为特定需求微调人工智能输出。从实际角度看,使用情绪引导提高性能可以在准确性和理解感觉至关重要的领域,如教育技术、客户服务和心理健康支持,导致更有效的人工智能应用。
这项研究报告的改进特别重要,因为它们指向了人工智能通信的新前沿。通过有效地模拟加强的情绪语境,我们可以引导人工智能产生不仅在技术上优越,而且被认为更加体贴和关注人类问题的回应。
虽然改进在统计上是显著的,但这并不意味着大模型具有情绪意识。性能的提高是这些模型如何处理和优先处理引导中嵌入的信息的结果。此外,这项研究引发了关于这种技术的伦理使用的讨论,因为在提高人工智能性能和误导用户关于人工智能系统能力和敏感性的认知之间有一条微妙的界线。
总的来说,这项研究的发现为在提高大模型性能方面使用情绪引导提供了有力的证据。在客观和主观评估中观察到的增强效果强调了将情绪细微之处融入人工智能交互以产生更有效、更响应和更符合用户需求的输出的可能性。
当我们告诉人工智能我们非常依赖它的答案时,它会”加倍努力”为我们提供更精确、更深思熟虑和更详尽的回应。人工智能实际上并没有感受到压力,但它似乎能够识别这些情绪信号,并相应地调整其性能。
对于将人工智能融入其业务或产品的人来说,这不仅仅是一个有趣的小知识,这是可以采取行动的情报。通过理解和有效利用情绪触发器,可以使人工智能变得更加响应和有用。
情绪感知的人工智能不仅理解我们的话语,它还理解我们的紧迫感,并据此采取行动。这真是太酷了!
2022年全球最大的10家数据处理相关的创业公司
斯坦福2022年度AI指数报告简介及下载链接
内容生成方向的人工智能企业
吴恩达的LandingAI究竟是一家什么样的创业公司
人工智能初创企业Hugging Face是什么样的企业——HuggingFace简介
构建人工智能应用的开发者指南
工业蒸汽量预测-特征工程
一张图看全深度学习中下层软硬件体系结构
亚马逊最新发布Feature Store简介
Scikit-Learn最新更新简介
重磅!OpenAI发布GPT-4o mini,这是GPT-3.5的替代升级版,价格下降60%,但是更快更强!编程能力甚至超过GPT-4!
重回第一!OpenAI升级GPT-4-Turbo到2024-04-09版本(gpt-4-turbo-2024-04-09),GPT-4推理和数学能力大幅提高,基准测试最高有接近20%的提升!
Google前AI研究人员认为2024年可能不会出现能与GPT-4竞争的开源模型/产品
疑似GPT-4.5的定价截图泄露,但真假未知,不过GPT-4微调的功能已经推出,只能说非常贵!
GPT-4在11月份以来变懒的原因可能已经找到:大模型可能会在节假日期间变得不愿意干活,工作日期间却更加高效
为企业单独定制训练一个GPT-4要多少钱?OpenAI说几个月,200-300万美元起步!
OpenAI再度泄露重磅更新,GPT-4即将发布128K的超长上下文版本以及多模态版本,价格下降一大半!
近期ChatGPT Plus用户发现GPT-4性能大幅下降!GPT-4性能下降的现象和原因总结
可能是史上最强大的AI Agent!OpenAI重磅更新:整合了多模态、外部访问、数据分析后的GPT-4更像是AI Agent了!
AutoGPT是如何让GPT-4自动帮你完成任务的——最火的AutoGPT原理解析!
Dirichlet Distribution(狄利克雷分布)与Dirichlet Process(狄利克雷过程)
回归模型中的交互项简介(Interactions in Regression)
贝塔分布(Beta Distribution)简介及其应用
矩母函数简介(Moment-generating function)
普通最小二乘法(Ordinary Least Squares,OLS)的详细推导过程
使用R语言进行K-means聚类并分析结果
深度学习技巧之Early Stopping(早停法)
H5文件简介和使用
手把手教你本地部署清华大学的ChatGLM-6B模型——Windows+6GB显卡本地部署
Wishart分布简介