論文の概要: MALTopic: Multi-Agent LLM Topic Modeling Framework
- arxiv url: http://arxiv.org/abs/2601.15299v1
- Date: Wed, 07 Jan 2026 06:32:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.839771
- Title: MALTopic: Multi-Agent LLM Topic Modeling Framework
- Title(参考訳): MALTopic:マルチエージェントLLMトピックモデリングフレームワーク
- Authors: Yash Sharma,
- Abstract要約: トピックモデリングを特殊タスクに分解するマルチエージェントLLMトピックモデリングフレームワーク(MALTopic)を提案する。
構造化データの統合とマルチエージェントアプローチを用いることで、MALTopicはコンテキスト関連性を高めた人間可読トピックを生成する。
- 参考スコア(独自算出の注目度): 2.1182259123493243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topic modeling is a crucial technique for extracting latent themes from unstructured text data, particularly valuable in analyzing survey responses. However, traditional methods often only consider free-text responses and do not natively incorporate structured or categorical survey responses for topic modeling. And they produce abstract topics, requiring extensive human interpretation. To address these limitations, we propose the Multi-Agent LLM Topic Modeling Framework (MALTopic). This framework decomposes topic modeling into specialized tasks executed by individual LLM agents: an enrichment agent leverages structured data to enhance textual responses, a topic modeling agent extracts latent themes, and a deduplication agent refines the results. Comparative analysis on a survey dataset demonstrates that MALTopic significantly improves topic coherence, diversity, and interpretability compared to LDA and BERTopic. By integrating structured data and employing a multi-agent approach, MALTopic generates human-readable topics with enhanced contextual relevance, offering a more effective solution for analyzing complex survey data.
- Abstract(参考訳): トピックモデリングは、非構造化テキストデータから潜在テーマを抽出する重要な手法であり、特に調査回答の分析に有用である。
しかし、従来の手法では、自由テキスト応答のみを考慮し、トピックモデリングのための構造化された、または分類されたサーベイ応答をネイティブに含まないことが多い。
そして、それらは抽象的なトピックを生成し、人間の解釈を広範囲に必要とします。
これらの制約に対処するため,Multi-Agent LLM Topic Modeling Framework (MALTopic)を提案する。
このフレームワークは、トピックモデリングを個別のLLMエージェントによって実行される特殊タスクに分解する:エンリッチメントエージェントは構造化データを利用してテキスト応答を増強し、トピックモデリングエージェントは潜在テーマを抽出し、重複エージェントは結果を洗練する。
調査データセットの比較分析により、MALTopicはLDAやBERTopicと比較してトピックコヒーレンス、多様性、解釈可能性を大幅に改善することが示された。
構造化データを統合し、マルチエージェントアプローチを採用することで、MALTopicは、コンテキスト関連性を高めたヒューマン可読なトピックを生成し、複雑なサーベイデータを分析するためのより効果的なソリューションを提供する。
関連論文リスト
- S-DAG: A Subject-Based Directed Acyclic Graph for Multi-Agent Heterogeneous Reasoning [22.610518752034043]
大規模言語モデル(LLM)は複雑な推論問題において顕著な性能を達成した。
本研究では,指定されたマルチエージェント協調戦略を備えた対象レベルできめ細かい分析を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-10T05:40:02Z) - Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - MLego: Interactive and Scalable Topic Exploration Through Model Reuse [12.133380833451573]
本稿では,リアルタイムトピックモデリング分析を支援する対話型クエリフレームワークであるMLegoを紹介する。
MLegoは、スクラッチからモデルを再訓練する代わりに、物質化されたトピックモデルを効率的にマージして、対話的な速度で近似結果を構築する。
我々はMLegoを視覚分析のプロトタイプシステムに統合し,対話型クエリによる大規模テキストデータセットの探索を可能にする。
論文 参考訳(メタデータ) (2025-08-11T06:06:26Z) - Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration [0.0]
本稿では,LLMを用いたトピックモデリング手法として,エージェント検索拡張生成(Agentic RAG)を提案する。
1) LLM の事前訓練された知識を超えた外部データへの自動アクセスを可能にする検索,(2) LLM の機能を利用してテキスト合成を行う生成,(3) エージェント駆動学習, 反復的に検索とクエリの定式化を行う。
本研究は,本手法がより効率的で解釈可能であり,同時に,従来の機械学習手法と比較して信頼性と妥当性が向上することを示した。
論文 参考訳(メタデータ) (2025-02-28T11:25:11Z) - A Survey of Model Architectures in Information Retrieval [59.61734783818073]
2019年から現在までの期間は、情報検索(IR)と自然言語処理(NLP)における最大のパラダイムシフトの1つとなっている。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
今後の課題と今後の方向性について、先見的な議論で締めくくります。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - Personalized Multimodal Large Language Models: A Survey [127.9521218125761]
マルチモーダル大言語モデル(MLLM)は、最先端の性能と複数のデータモダリティを統合する能力により、ますます重要になっている。
本稿では,パーソナライズされたマルチモーダルな大規模言語モデルに関する包括的調査を行い,そのアーキテクチャ,トレーニング方法,アプリケーションに焦点をあてる。
論文 参考訳(メタデータ) (2024-12-03T03:59:03Z) - Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。