Key points are not available for this paper at this time.
Latent Dirichlet Allocation (LDA) und andere verwandte Topic-Modelle sind zunehmend beliebte Werkzeuge zur Zusammenfassung und Entdeckung von Mannigfaltigkeiten in diskreten Daten. LDA erfasst jedoch keine Korrelationen zwischen Themen. In diesem Papier stellen wir das Pachinko Allocation Model (PAM) vor, das beliebige, verschachtelte und möglicherweise sparsame Korrelationen zwischen Themen mittels eines gerichteten azyklischen Graphen (DAG) erfasst. Die Blätter des DAG repräsentieren einzelne Wörter im Vokabular, während jeder innere Knoten eine Korrelation unter seinen Kindern beschreibt, die Wörter oder andere innere Knoten (Themen) sein können. PAM bietet eine flexible Alternative zur aktuellen Arbeit von Blei und Lafferty (2006), die nur Korrelationen zwischen Themenpaaren erfasst. Anhand von Textdaten aus Newsgroups, historischen NIPS-Proceedings und anderen Forschungspapier-Korpora zeigen wir eine verbesserte Leistung von PAM bei der Dokumentklassifikation, der Wahrscheinlichkeit von Testdaten, der Fähigkeit, feinere Themen zu unterstützen, und der Kohärenz thematischer Schlüsselwörter.
Building similarity graph...
Analyzing shared references across papers
Loading...
Wei Li
Andrew McCallum
Building similarity graph...
Analyzing shared references across papers
Loading...
Li et al. (Sun,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/6a0829739a6c4ba6e6108125 — DOI: https://doi.org/10.1145/1143844.1143917
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: