AI大模型学习
原创AI博客
大模型技术资讯
大模型评测排行
大模型评测排行榜
大模型数学推理能力排行榜
大模型代码编程能力排行榜
大模型图片编辑能力排行榜
LMSys ChatBot Arena排行榜
Berkeley大模型工具使用能力排行榜
大模型综合能力排行榜(旧)
大模型编程能力排行榜(旧)
OpenLLMLeaderboard中国站
AI大模型大全
最新大模型列表
大模型部署教程
大模型对比工具
大模型评测基准
大模型评测基准
SWE Bench Verified
ARC-AGI-2
AIME 2025
FrontierMath-Tier4
MMMU
AI Agents列表
AI资源仓库
AI领域与任务
AI研究机构
AI数据集
AI开源工具
数据推荐
国产AI大模型生态全览
AI模型概览图
AI模型月报
AI基础大模型
AI工具导航
AI大模型工具导航网站
在线聊天大模型列表
Discovering Coherent Topics Using General Knowledge
小木
CIKM
2013-09
2282
2017/02/06 09:56:15
基于知识的主题模型依赖于领域知识,并假设其依赖的领域知识是正确的。然而,这种方法的一个主要的缺点是它需要用户对领域知识很了解,并能够提供相关的知识经验,这在实际中很难。在这篇文章中,作者提出了一个框架,利用了独立的领域知识。具体来说,作者使用的是一般性的知识,如单词的字典语义关系,如近义词、同义词、反义词和形容词属性等来提升主题的一致性。然而,这项工作一个最主要的困难时单词可能拥有不止一种含义。错误的知识会导致低质量的主题。为了处理这些错误的知识,作者提出了一种GK-LDA的方法,可以利用字典中的关系。GK-LDA是第一种引入独立的领域知识的模型。 基于知识的主题模型已经有很多了。这些模型主要是利用了专家领域知识来提高主题的质量。比如,DF-LDA使用了must-links和cannot-links两种知识。先验知识在这些模型中通常都是领域依赖的。对于不同的应用,需要有不同的领域知识。他们都假设在实际中用户对领域知识了解比较多。然而这显然不实际。这篇文章中,作者主要使用了同义词、反义词和形容词属性来加强模型的效果。这里形容词属性是指一个形容某个名词的形容词,比如expensive通常是形容price的形容词。 首先作者说明了他们是如何表达这些字典关系的。作者是以集合的形式表达如:同义词:{expensive,pricey},反义词:{expensive,cheap},形容词属性:{expensive,price}。在作者的系统中,同义词和反义词是从wordnet中抽取的,形容词属性则是从在线词典中获得的。在此之前,作者提过了一种叫MDK-LDA的模型来处理多领域的知识,然而这种模型却不能处理错误的知识。在这个模型中,作者使用了一个经过人工验证的LR集合(一般知识的集合),作者在LDA中加了一个隐变量s来确保模型可以选择正确的LR集合。作者的这篇文章主要基于MDK-LDA工作的进一步深化。
赏
支付宝扫码打赏
如果文章对您有帮助,欢迎打赏鼓励作者
Back to Top