論文の概要: Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning
- arxiv url: http://arxiv.org/abs/2603.08159v1
- Date: Mon, 09 Mar 2026 09:40:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.741725
- Title: Learning Hierarchical Knowledge in Text-Rich Networks with Taxonomy-Informed Representation Learning
- Title(参考訳): 分類型表現学習を用いたテキストリッチネットワークにおける階層的知識の学習
- Authors: Yunhui Liu, Yongchao Liu, Yinfeng Chen, Chuntao Hong, Tao Zheng, Tieke He,
- Abstract要約: 本稿では,まず暗黙的な階層型分類を構築し,それを学習ノード表現に統合するTIERを提案する。
細粒度と粗粒度のセマンティクスをエンコードする表現を学習することにより、TIERは現実世界のテキストリッチネットワーク(TRN)のより解釈可能で構造化されたモデリングを可能にする。
提案手法は, 多様な領域にまたがる複数のデータセットにおいて, 既存の手法を著しく上回っていることを示す。
- 参考スコア(独自算出の注目度): 16.211492894357473
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hierarchical knowledge structures are ubiquitous across real-world domains and play a vital role in organizing information from coarse to fine semantic levels. While such structures have been widely used in taxonomy systems, biomedical ontologies, and retrieval-augmented generation, their potential remains underexplored in the context of Text-Rich Networks (TRNs), where each node contains rich textual content and edges encode semantic relationships. Existing methods for learning on TRNs often focus on flat semantic modeling, overlooking the inherent hierarchical semantics embedded in textual documents. To this end, we propose TIER (Hierarchical \textbf{T}axonomy-\textbf{I}nformed R\textbf{E}presentation Learning on Text-\textbf{R}ich Networks), which first constructs an implicit hierarchical taxonomy and then integrates it into the learned node representations. Specifically, TIER employs similarity-guided contrastive learning to build a clustering-friendly embedding space, upon which it performs hierarchical K-Means followed by LLM-powered clustering refinement to enable semantically coherent taxonomy construction. Leveraging the resulting taxonomy, TIER introduces a cophenetic correlation coefficient-based regularization loss to align the learned embeddings with the hierarchical structure. By learning representations that respect both fine-grained and coarse-grained semantics, TIER enables more interpretable and structured modeling of real-world TRNs. We demonstrate that our approach significantly outperforms existing methods on multiple datasets across diverse domains, highlighting the importance of hierarchical knowledge learning for TRNs.
- Abstract(参考訳): 階層的な知識構造は現実世界の領域にまたがって至るところに存在し、粗い情報から細かい意味レベルまで情報を整理する上で重要な役割を担っている。
このような構造は分類学システム、生物医学的オントロジー、検索・拡張世代で広く用いられているが、それらのポテンシャルはテキスト・リッチ・ネットワーク(TRN)の文脈では未解明のままであり、各ノードには豊富なテキストコンテンツと、意味的関係をコードするエッジが含まれている。
TRNで学習する既存の方法は、しばしば平らなセマンティックモデリングに焦点を当て、テキスト文書に埋め込まれた本質的に階層的なセマンティックスを見下ろしている。
この目的のために、TIER (Hierarchical \textbf{T}axonomy-\textbf{I}nformed R\textbf{E}presentation Learning on Text-\textbf{R}ich Networks) を提案する。
具体的には、TIERは類似性誘導型コントラスト学習を用いてクラスタリングに親しみやすい埋め込み空間を構築する。
結果の分類を利用して、TIERは、学習された埋め込みを階層構造に合わせるために、コヒーネティックな相関係数に基づく正規化損失を導入する。
細粒度と粗粒度のセマンティクスの両方を尊重する表現を学習することにより、TIERは現実世界のTRNのより解釈可能で構造化されたモデリングを可能にする。
提案手法は,TRNにおける階層的知識学習の重要性を浮き彫りにして,多様な領域にわたる複数のデータセットの既存手法を著しく上回ることを示す。
関連論文リスト
- Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering [59.54662810933882]
既存の分類体系の構築手法は、教師なしクラスタリングや大きな言語モデルの直接的プロンプトを利用しており、コヒーレンスと粒度の欠如が多かった。
LLM誘導型マルチアスペクト符号化と動的クラスタリングを統合したコンテキスト対応階層型階層型分類生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-23T15:12:58Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models [25.780463407652295]
時間グラフニューラルネットワーク(TGNN)は時間グラフモデリングにおいて顕著な性能を示した。
TTAGモデリングのための既存のTGNNをシームレスに拡張するフレキシブルなフレームワークである textbfCROSS を提案する。
論文 参考訳(メタデータ) (2025-03-18T16:50:10Z) - Learning Hierarchical Prompt with Structured Linguistic Knowledge for
Vision-Language Models [43.56153167864033]
大規模言語モデル(LLM)における構造化知識を活用する新しい手法を提案する。
低レベルの即時学習のためのエンティティと属性間のペアワイズ関連をキャプチャする、関係誘導型アテンションモジュールを導入する。
さらに、高レベルのプロンプトとグローバルレベルのプロンプトを組み込むことで、提案された階層構造は、クロスレベルのインターリンクを偽造し、より複雑で長期的な関係を扱うようにモデルに権限を与える。
論文 参考訳(メタデータ) (2023-12-11T12:14:06Z) - Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation [72.19108372163868]
セグメンテーションのための構造的・統計的テクスチャ知識蒸留(SSTKD)フレームワークを提案する。
構造的テクスチャ知識のために,低レベルの特徴を分解するContourlet Decomposition Module (CDM)を導入する。
本稿では, 統計的テクスチャ知識を適応的に抽出し, 強化するDenoized Texture Intensity Equalization Module (DTIEM)を提案する。
論文 参考訳(メタデータ) (2023-05-06T06:01:11Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - Recurrent Neural Networks with Mixed Hierarchical Structures for Natural
Language Processing [13.960152426268767]
階層構造は言語処理と自然言語処理の両方に存在している。
自然言語の階層的表現を学習するためにRNNを設計する方法は、長年にわたる課題である。
本稿では,静的境界と動的境界という2種類の境界を定義し,文書分類タスクのための多層階層構造を構築する。
論文 参考訳(メタデータ) (2021-06-04T15:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。