論文の概要: SC-Taxo: Hierarchical Taxonomy Generation under Semantic Consistency Constraints using Large Language Models
- arxiv url: http://arxiv.org/abs/2605.00620v1
- Date: Fri, 01 May 2026 12:42:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.950511
- Title: SC-Taxo: Hierarchical Taxonomy Generation under Semantic Consistency Constraints using Large Language Models
- Title(参考訳): SC-タキソ:大規模言語モデルを用いた意味的一貫性制約の下での階層的分類
- Authors: Shiqiang Cai, Nianhong Niu, Shizhu He, Kang Liu, Jun Zhao,
- Abstract要約: 高品質の科学的分類法は、研究分野の構造的かつ階層的な表現を提供する。
既存の分類学のアプローチは、しばしば階層的なレベルの構造上の矛盾と意味的なミスアライメントに悩まされる。
- 参考スコア(独自算出の注目度): 24.295783768613344
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific literature is expanding at an unprecedented pace, making it increasingly challenging to efficiently organize and access domain knowledge. A high-quality scientific taxonomy offers a structured and hierarchical representation of a research field, facilitating literature exploration and topic navigation, as well as enabling downstream applications such as trend analysis, idea generation, and information retrieval. However, existing taxonomy generation approaches often suffer from structural inconsistencies and semantic misalignment across hierarchical levels. Through empirical analysis, we find that these issues largely stem from inadequate modeling of hierarchical semantic consistency. To address this limitation, we propose a semantic-consistent taxonomy generation (SC-Taxo) framework that leverages large language models (LLMs) with hierarchy-aware refinement stages to ensure semantic consistency. Specifically, SC-Taxo introduces a bidirectional heading generation mechanism that jointly performs bottom-up abstraction and top-down semantic constraint, while further capturing peer-level semantic dependencies to enhance horizontal consistency. Experiments on multiple benchmark datasets demonstrate consistent improvements in hierarchy alignment and heading quality, and additional evaluation on Chinese scientific literature validates its robust cross-lingual generalization.
- Abstract(参考訳): 科学文献は前例のないペースで拡大しており、ドメイン知識を効率的に組織化し、アクセスすることはますます困難になっている。
高品質な科学的分類法は、研究分野の構造的で階層的な表現を提供し、文献探索やトピックナビゲーションを容易にし、トレンド分析、アイデア生成、情報検索といった下流のアプリケーションを可能にする。
しかし、既存の分類学のアプローチは、しばしば階層的なレベルの構造上の矛盾と意味的なミスアライメントに悩まされる。
経験的分析により、これらの問題は階層的セマンティック一貫性の不十分なモデリングに起因することが判明した。
この制限に対処するために,大規模言語モデル (LLM) と階層対応の洗練段階を併用し,意味整合性を確保する意味整合型分類生成(SC-Taxo)フレームワークを提案する。
具体的には、SC-Taxoは双方向の方向生成機構を導入し、ボトムアップの抽象化とトップダウンのセマンティック制約を共同で実行し、さらにピアレベルのセマンティック依存関係をキャプチャして水平整合性を高める。
複数のベンチマークデータセットの実験では、階層的アライメントと方向品質が一貫した改善を示し、中国科学文献のさらなる評価は、その頑健な言語間一般化を検証している。
関連論文リスト
- Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning [16.211492894357473]
本稿では,まず暗黙的な階層型分類を構築し,それを学習ノード表現に統合するTIERを提案する。
細粒度と粗粒度のセマンティクスをエンコードする表現を学習することにより、TIERは現実世界のテキストリッチネットワーク(TRN)のより解釈可能で構造化されたモデリングを可能にする。
提案手法は, 多様な領域にまたがる複数のデータセットにおいて, 既存の手法を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-09T09:40:18Z) - Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering [59.54662810933882]
既存の分類体系の構築手法は、教師なしクラスタリングや大きな言語モデルの直接的プロンプトを利用しており、コヒーレンスと粒度の欠如が多かった。
LLM誘導型マルチアスペクト符号化と動的クラスタリングを統合したコンテキスト対応階層型階層型分類生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-23T15:12:58Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Hierarchical Lexical Manifold Projection in Large Language Models: A Novel Mechanism for Multi-Scale Semantic Representation [0.0]
構造的階層的埋め込みをトランスフォーマーベースのアーキテクチャに統合することで、語彙表現に対する洗練されたアプローチが導入された。
トークンを構造化多様体にマッピングする射影機構は、改善された語彙アライメントを提供する。
埋め込みの洗練された階層構造は、語彙モデリングにおいてより大きな解釈可能性をもたらす。
論文 参考訳(メタデータ) (2025-02-08T00:49:32Z) - Taxonomy Tree Generation from Citation Graph [15.188580557890942]
HiGTLは、人為的な指示や好みのトピックによってガイドされる、新しいエンドツーエンドフレームワークである。
我々は,各クラスタに中心的な概念を反復的に生成する,新しい分類ノード言語化戦略を開発した。
実験により、HiGTLはコヒーレントで高品質な概念を効果的に生成することが示された。
論文 参考訳(メタデータ) (2024-10-02T13:02:03Z) - HyperMiner: Topic Taxonomy Mining with Hyperbolic Embedding [54.52651110749165]
本稿では,単語や話題を表現するために,メタボリック埋め込みを導入した新しいフレームワークを提案する。
双曲空間のツリー様性により、下層のセマンティック階層はより解釈可能なトピックをマイニングするためによりうまく利用することができる。
論文 参考訳(メタデータ) (2022-10-16T02:54:17Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Provable Hierarchy-Based Meta-Reinforcement Learning [50.17896588738377]
HRLをメタRL設定で解析し、下流タスクで使用するメタトレーニング中に学習者が潜在階層構造を学習する。
我々は、この自然階層の標本効率の回復を保証し、抽出可能な楽観主義に基づくアルゴリズムとともに「多様性条件」を提供する。
我々の境界は、時間的・状態的・行動的抽象化などのHRL文献に共通する概念を取り入れており、我々の設定と分析が実際にHRLの重要な特徴を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-10-18T17:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。