論文の概要: E-LDA: Toward Interpretable LDA Topic Models with Strong Guarantees in Logarithmic Parallel Time
- arxiv url: http://arxiv.org/abs/2506.07747v1
- Date: Fri, 06 Jun 2025 07:05:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.970482
- Title: E-LDA: Toward Interpretable LDA Topic Models with Strong Guarantees in Logarithmic Parallel Time
- Title(参考訳): E-LDA:対数並列時間における強い保証を持つ解釈可能なLDAトピックモデルを目指して
- Authors: Adam Breuer,
- Abstract要約: LDAトピックモデルにおいて、各文書に割り当てられたトピックを推測する問題に対して、証明可能な保証を備えた最初の実用的なアルゴリズムを提供する。
これは、社会科学、データ探索、因果推論設定におけるトピックモデルの多くの応用における主要な推論問題である。
- 参考スコア(独自算出の注目度): 2.810160553339817
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper, we provide the first practical algorithms with provable guarantees for the problem of inferring the topics assigned to each document in an LDA topic model. This is the primary inference problem for many applications of topic models in social science, data exploration, and causal inference settings. We obtain this result by showing a novel non-gradient-based, combinatorial approach to estimating topic models. This yields algorithms that converge to near-optimal posterior probability in logarithmic parallel computation time (adaptivity) -- exponentially faster than any known LDA algorithm. We also show that our approach can provide interpretability guarantees such that each learned topic is formally associated with a known keyword. Finally, we show that unlike alternatives, our approach can maintain the independence assumptions necessary to use the learned topic model for downstream causal inference methods that allow researchers to study topics as treatments. In terms of practical performance, our approach consistently returns solutions of higher semantic quality than solutions from state-of-the-art LDA algorithms, neural topic models, and LLM-based topic models across a diverse range of text datasets and evaluation parameters.
- Abstract(参考訳): 本稿では、LDAトピックモデルにおいて、各文書に割り当てられたトピックを推測する問題に対して、証明可能な保証を備えた最初の実用的なアルゴリズムを提供する。
これは、社会科学、データ探索、因果推論設定におけるトピックモデルの多くの応用における主要な推論問題である。
この結果は、トピックモデルを推定するための、新しい非漸進的、組合せ的アプローチを示すことによって得られる。
これにより、対数並列計算時間(適応性)において、近似後確率に収束するアルゴリズムが、既知のLDAアルゴリズムよりも指数関数的に高速になる。
また,本手法では,各学習トピックが既知のキーワードに正式に関連付けられているように,解釈可能性を保証することができることを示す。
最後に,提案手法は代替手法と異なり,学習したトピックモデルを下流の因果推論手法に用いて,研究者がトピックを治療として研究するために必要な独立性の仮定を維持できることを示す。
実用性能の面では,本手法は,最先端のLDAアルゴリズム,ニューラルトピックモデル,および多種多様なテキストデータセットおよび評価パラメータを対象としたLLMベースのトピックモデルからの解よりも高いセマンティック品質の解を一貫して返却する。
関連論文リスト
- SEGO: Sequential Subgoal Optimization for Mathematical Problem-Solving [64.38649623473626]
大規模言語モデル(LLM)は人工知能の大幅な進歩を導いた。
数学的問題を解く能力を高めるために,textbfSEquential subtextbfGoal textbfOptimization (SEGO) という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-19T17:56:40Z) - Geometry-Aware Approaches for Balancing Performance and Theoretical Guarantees in Linear Bandits [5.847084649531299]
トンプソンサンプリングとグリーディは有望な経験的性能を示したが、これは悲観的な理論的後悔の境界とは対照的である。
本稿では,問題パラメータの周辺における不確かさ楕円体の幾何学的特性を追従する新しいデータ駆動手法を提案する。
この手法により,Greedy,OFUL,Thompsonサンプルを含む幅広いアルゴリズムに対して,幾何学的情報を含むデータ駆動型頻繁な後悔境界を定式化することができる。
論文 参考訳(メタデータ) (2023-06-26T17:38:45Z) - A Deep Unrolling Model with Hybrid Optimization Structure for Hyperspectral Image Deconvolution [50.13564338607482]
本稿では,DeepMixと呼ばれるハイパースペクトルデコンボリューション問題に対する新しい最適化フレームワークを提案する。
これは3つの異なるモジュール、すなわちデータ一貫性モジュール、手作りの正規化器の効果を強制するモジュール、および装飾モジュールで構成されている。
本研究は,他のモジュールの協調作業によって達成される進歩を維持するために設計された,文脈を考慮した認知型モジュールを提案する。
論文 参考訳(メタデータ) (2023-06-10T08:25:16Z) - Multivariate Systemic Risk Measures and Computation by Deep Learning
Algorithms [63.03966552670014]
本稿では,主観的最適度と関連するリスク割り当ての公平性に着目し,重要な理論的側面について論じる。
私たちが提供しているアルゴリズムは、予備項の学習、二重表現の最適化、およびそれに対応する公正なリスク割り当てを可能にします。
論文 参考訳(メタデータ) (2023-02-02T22:16:49Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Neural Improvement Heuristics for Graph Combinatorial Optimization
Problems [49.85111302670361]
本稿では,ノード,エッジ,あるいはその両方に情報をエンコードするグラフベースの問題を扱う新しいニューラル改善(NI)モデルを提案する。
提案モデルは,各地区の操作の選択を誘導する丘登頂に基づくアルゴリズムの基本的な構成要素として機能する。
論文 参考訳(メタデータ) (2022-06-01T10:35:29Z) - Exploring Viable Algorithmic Options for Learning from Demonstration
(LfD): A Parameterized Complexity Approach [0.0]
本稿では,パラメータ化複雑性解析を用いて,アルゴリズムの選択肢を体系的に探索する方法を示す。
環境、実演、ポリシーに対する多くの(しばしば同時に)制限に対して、我々の問題は、一般的にも、あるいは相対的に、効率的に解決できないことを示す。
論文 参考訳(メタデータ) (2022-05-10T15:54:06Z) - An Information-Theoretic Framework for Unifying Active Learning Problems [44.758281991246825]
本稿では,アクティブラーニング問題を統合するための情報理論的枠組みを提案する。
まず、既存のLSEアルゴリズムを推定する新しいアクティブ学習基準を紹介します。
LSEとBOの関係を利用して、BOのための競合情報理論獲得関数を設計する。
論文 参考訳(メタデータ) (2020-12-19T14:22:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。