論文の概要: BoostTaxo: Zero-Shot Taxonomy Induction via Boosting-Style Agentic Reasoning and Constraint-Aware Calibration
- arxiv url: http://arxiv.org/abs/2605.12520v1
- Date: Fri, 03 Apr 2026 15:48:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.779126
- Title: BoostTaxo: Zero-Shot Taxonomy Induction via Boosting-Style Agentic Reasoning and Constraint-Aware Calibration
- Title(参考訳): BoostTaxo:Boosting-Style Agentic ReasoningとConstraint-Aware Calibrationによるゼロショット分類誘導
- Authors: Yancheng Ling, Zhenlin Qin, Leizhen Wang, Zhenliang Ma,
- Abstract要約: BoostTaxoはゼロショット分類誘導のためのブースティングスタイルのLLMフレームワークである。
一連のドメイン用語を入力として取り、粗い方法で親識別を行う。
検索強化された定義修正、ハイブリッドな親候補選択、候補評価、構造対応スコアキャリブレーションを採用している。
ゼロショット分類誘導における最先端の手法よりも優れた、あるいは同等のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 6.719751155411076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Taxonomy induction is crucial for organizing concepts into explicit and interpretable semantic hierarchies. While existing methods have achieved promising results, their generalization, structural reliability, and efficiency remain limited, hindering their performance in zero-shot and large-scale scenarios. To overcome these limitations, we introduce BoostTaxo, a boosting-style LLM framework for zero-shot taxonomy induction. It takes a set of domain terms as inputs and performs parent identification in a coarse-to-fine manner, employing retrieval-augmented definition refinement, hybrid parent candidate selection, candidate rating, and structure-aware score calibration to improve taxonomy construction. Specifically, a lightweight LLM is used to efficiently filter candidate parents, while a large-scale LLM is employed to rank and score candidate parents for fine-grained parent selection. Structural features are further incorporated to calibrate candidate edge weights and enhance the reliability of the induced taxonomy. The unified BoostTaxo is evaluated on three public benchmark datasets, namely WordNet, DBLP, and SemEval-Sci, and achieves superior or comparable performance to state-of-the-art methods in zero-shot taxonomy induction. The ablation study validates the contribution of the hybrid parent candidate selection and the structure-aware score calibration to the overall performance. Further analysis investigates the impact of candidate selection size on taxonomy quality and presents representative case and failure studies, providing deeper insights into the effectiveness and limitations of the proposed framework.
- Abstract(参考訳): 分類誘導は、概念を明示的で解釈可能な意味的階層にまとめるのに不可欠である。
既存の手法は有望な結果を得たが、その一般化、構造的信頼性、効率性は限定的であり、ゼロショットや大規模シナリオのパフォーマンスを妨げている。
これらの制限を克服するため、ゼロショット分類誘導のためのブースティングスタイルのLLMフレームワークBoostTaxoを紹介した。
ドメイン用語のセットを入力として取り、検索強化定義修正、ハイブリッド親候補選択、候補格付け、構造認識スコアキャリブレーションを活用して、粗大な方法で親識別を行う。
具体的には、軽量LLMを用いて候補親を効率よくフィルタリングし、大規模LLMを用いて候補親のランク付けとスコア付けを行い、きめ細かい親選択を行う。
構造的特徴は、候補のエッジウェイトを校正し、誘導された分類の信頼性を高めるためにさらに組み込まれている。
統合BoostTaxoは、WordNet、DBLP、SemEval-Sciという3つの公開ベンチマークデータセットで評価され、ゼロショット分類誘導における最先端の手法よりも優れた、あるいは同等のパフォーマンスを達成する。
Ablation study is confirmed the contribute of the hybrid parent candidate selection and the structure-aware score calibration to the overall performance。
さらに, 候補選択サイズが分類品質に及ぼす影響について検討し, 代表的な事例と失敗事例を提示し, 提案フレームワークの有効性と限界についてより深い知見を提供する。
関連論文リスト
- Automating Categorization of Scientific Texts with In-Context Learning and Prompt-Chaining in Large Language Models [4.1824815480811806]
本研究は,科学的テキストの分析において,既成の大規模言語モデル(LLM)の性能を体系的に評価する。
In-Context Learning (ICL) と Prompt Chaining の先進的なエンジニアリング戦略の有効性を検討した。
実験の結果, プロンプト連鎖は純粋なICLに比べ, 分類精度が優れていることがわかった。
論文 参考訳(メタデータ) (2026-04-25T19:52:21Z) - Evaluating LLM-Based Grant Proposal Review via Structured Perturbations [18.689211845609623]
我々は、6つの品質軸にまたがるLLM感度を探索する摂動型フレームワークを開発した。
我々は, 単一パスレビュー, セクション・バイ・セクション分析, 専門家パネルをエミュレートした「ペルソナのカウンシル」という3つのレビューアーキテクチャを比較した。
論文 参考訳(メタデータ) (2026-03-09T11:53:50Z) - MAESTRO: Meta-learning Adaptive Estimation of Scalarization Trade-offs for Reward Optimization [56.074760766965085]
大規模言語モデル(LLM)の整合性のための効率的なパラダイムとしてグループ相対政策最適化が登場している。
我々は,報酬スカラー化を動的潜在ポリシーとして扱い,モデルの終端隠蔽状態を意味的ボトルネックとして活用するMAESTROを提案する。
本稿では,軽量コンダクタネットワークがメタリワード信号としてグループ相対的優位性を生かしてポリシと共進化する,双方向最適化フレームワークにおけるコンテキスト的帯域幅問題としてこれを定式化する。
論文 参考訳(メタデータ) (2026-01-12T05:02:48Z) - Supervised Optimism Correction: Be Confident When LLMs Are Sure [91.7459076316849]
教師付き微調整とオフライン強化学習の間には,新たな理論的関係が確立されている。
広く使われているビームサーチ法は、許容できない過度な最適化に悩まされていることを示す。
本稿では,トークンレベル$Q$-value推定のための簡易かつ効果的な補助的損失を導入したSupervised Optimism Correctionを提案する。
論文 参考訳(メタデータ) (2025-04-10T07:50:03Z) - LITE: LLM-Impelled efficient Taxonomy Evaluation [32.8374687916129]
LITEは階層的な分類評価戦略であり、分類を管理可能なサブ構造に分解する。
これは、定量的なパフォーマンス分析と質的な洞察の両方を提供する。
論文 参考訳(メタデータ) (2025-04-02T05:33:05Z) - A Multi-Stage Framework with Taxonomy-Guided Reasoning for Occupation Classification Using Large Language Models [17.953087038185778]
大規模な言語モデル(LLM)は、その豊富な世界知識とコンテキスト内学習能力によって約束される。
本フレームワークは,分類学の知識とアウトプットを整合させることにより性能を向上させるために,分類学指導による推論例を統合した。
大規模データセットの評価から,我々のフレームワークは職業と技能の分類タスクを向上するだけでなく,フロンティアモデルに代わる費用対効果も提供することが示された。
論文 参考訳(メタデータ) (2025-03-17T09:44:50Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。