Key points are not available for this paper at this time.
潜在狄利克雷分配(LDA)及其他相关主题模型正日益成为离散数据摘要和流形发现的热门工具。然而,LDA无法捕捉主题之间的相关性。本文介绍了柏青哥分配模型(PAM),该模型使用有向无环图(DAG)捕捉任意的、嵌套的且可能稀疏的主题相关性。DAG的叶节点代表词汇表中的单个词语,而每个内部节点表示其子节点之间的相关性,子节点可以是词语或其他内部节点(主题)。PAM为Blei和Lafferty(2006)近期工作提供了灵活的替代方案,后者仅捕捉主题对之间的相关性。利用来自新闻组、历史NIPS会议论文集及其他研究论文语料库的文本数据,我们展示了PAM在文档分类、保留数据的似然性、更细粒度主题支持能力以及主题关键词一致性方面的性能提升。
Building similarity graph...
Analyzing shared references across papers
Loading...
Li等人(Sun,)研究了该问题。
www.synapsesocial.com/papers/6a0829739a6c4ba6e6108125 — DOI: https://doi.org/10.1145/1143844.1143917
Wei Li
Andrew McCallum
Building similarity graph...
Analyzing shared references across papers
Loading...