論文の概要: LLM-XTM: Enhancing Cross-Lingual Topic Models with Large Language Models
- arxiv url: http://arxiv.org/abs/2605.03299v1
- Date: Tue, 05 May 2026 02:40:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.731826
- Title: LLM-XTM: Enhancing Cross-Lingual Topic Models with Large Language Models
- Title(参考訳): LLM-XTM:大規模言語モデルによる言語横断トピックモデルの強化
- Authors: Minh Chu Xuan, Tien-Phat Nguyen, Linh Ngo Van, Dinh Viet Sang, Nguyen Thi Ngoc Diep, Trung Le,
- Abstract要約: 言語間トピックモデリングは、言語間の共有意味構造を発見することを目的としている。
近年のLCMによる改良は解釈性を改善しているが, コストが高く, 文書レベルが高く, 幻覚の傾向が強い。
LLM-XTM は,自己整合性不確実性定量化と LLM-Guided topic refinement を統合したフレームワークである。
- 参考スコア(独自算出の注目度): 12.710857972236303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cross-lingual topic modeling aims to discover shared semantic structures across languages, yet existing models depend on sparse bilingual resources and often yield incoherent or weakly aligned topics. Recent LLM-based refinements improve interpretability but are costly, document-level, and prone to hallucination, with prior white-box approaches requiring inaccessible token probabilities. We propose LLM-XTM, a framework that integrates LLM-guided topic refinement with self-consistency uncertainty quantification, enabling black-box, stable, and scalable enhancement of cross-lingual topic models. Experiments on multilingual corpora show that LLM-XTM achieves superior topic coherence and alignment while reducing reliance on bilingual dictionaries and expensive LLM calls.
- Abstract(参考訳): 言語間のトピックモデリングは、言語間の共有意味構造を見つけることを目的としているが、既存のモデルは疎いバイリンガルリソースに依存し、しばしば一貫性のない、あるいは弱い整合性のあるトピックをもたらす。
LLMベースの最近の改良は解釈可能性を改善するが、コストが高く、文書レベルが高く、幻覚を起こす傾向があり、以前のホワイトボックスアプローチではアクセス不能なトークン確率を必要としていた。
LLM-XTM は,自己整合性不確実性定量化と LLM-Guided topic refinement を統合し,ブラックボックス,安定,拡張可能な言語間トピックモデルの拡張を可能にするフレームワークである。
多言語コーパスの実験により、LLM-XTMは、二言語辞書や高価なLCM呼び出しへの依存を低減しつつ、優れたトピックコヒーレンスとアライメントを実現することが示された。
関連論文リスト
- Language on Demand, Knowledge at Core: Composing LLMs with Encoder-Decoder Translation Models for Extensible Multilinguality [15.547613042199167]
大規模言語モデル(LLM)は、強い汎用性を示すが、多言語性能は相変わらず高い不均衡を保っている。
合成エンコーダ-LLMデコーダアーキテクチャであるXBridgeを提案する。
論文 参考訳(メタデータ) (2026-03-18T09:19:08Z) - Probing LLMs for Multilingual Discourse Generalization Through a Unified Label Set [28.592959007943538]
本研究では,大規模言語モデル (LLM) が言語やフレームワークにまたがって一般化する談話知識を捉えているかどうかを検討する。
テストベッドとして多言語対話関係分類を用いて, 様々なサイズと多言語機能を持つ23個のLLMの包括的集合について検討した。
以上の結果から,LLM,特に多言語学習コーパスでは,言語やフレームワーク間での会話情報を一般化することが可能であることが示唆された。
論文 参考訳(メタデータ) (2025-03-13T16:20:25Z) - Neural Topic Modeling with Large Language Models in the Loop [12.142323482188056]
大規模言語モデル(LLM)とニューラルトピックモデル(NTM)を統合する新しいフレームワークを提案する。
既存の多くのNTMに組み込む柔軟性により,学習トピックや文書表現におけるNTMの効率を保ちながら,トピックの解釈可能性を高めることができる。
論文 参考訳(メタデータ) (2024-11-13T11:31:02Z) - Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models [62.91524967852552]
大規模言語モデル(LLM)は、多言語コーパスの事前訓練のため、一般的に多言語である。
しかし、これらのモデルは言語間の対応する概念、すなわち言語を横断的に関連付けることができるだろうか?
本研究は,言語横断的タスクにおける最先端LLMの評価である。
論文 参考訳(メタデータ) (2024-06-23T15:15:17Z) - Getting More from Less: Large Language Models are Good Spontaneous Multilingual Learners [67.85635044939836]
大きな言語モデル(LLM)は印象的な言語機能を示している。
本研究では,LLMの自然多言語アライメント改善について検討する。
質問翻訳データ(すなわち注釈付き回答なし)に基づいて学習したLLMは、英語と幅広い言語との整合を促進できることがわかった。
論文 参考訳(メタデータ) (2024-05-22T16:46:19Z) - Supervised Knowledge Makes Large Language Models Better In-context Learners [94.89301696512776]
大規模言語モデル(LLM)は、素早い工学を通して、文脈内学習能力の出現を示す。
自然言語理解と質問応答におけるLLMの一般化性と事実性の向上という課題は、まだ未解決のままである。
本研究では, LLM の信頼性を高める枠組みを提案する。1) 分布外データの一般化,2) 差別モデルによる LLM のメリットの解明,3) 生成タスクにおける幻覚の最小化。
論文 参考訳(メタデータ) (2023-12-26T07:24:46Z) - Let Models Speak Ciphers: Multiagent Debate through Embeddings [84.20336971784495]
この問題を解決するためにCIPHER(Communicative Inter-Model Protocol Through Embedding Representation)を導入する。
自然言語から逸脱することで、CIPHERはモデルの重みを変更することなく、より広い範囲の情報を符号化する利点を提供する。
このことは、LLM間の通信における代替の"言語"としての埋め込みの優越性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-10-10T03:06:38Z) - Simultaneous Machine Translation with Large Language Models [51.470478122113356]
我々は,SimulMTタスクに大規模言語モデルを適用する可能性を検討する。
MUST-Cデータセットと異なる9言語でtextttLlama2-7b-chatモデルを用いて実験を行った。
その結果,LLM は BLEU と LAAL の指標で専用MT モデルよりも優れていた。
論文 参考訳(メタデータ) (2023-09-13T04:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。