論文の概要: Dual Refinement Cycle Learning: Unsupervised Text Classification of Mamba and Community Detection on Text Attributed Graph
- arxiv url: http://arxiv.org/abs/2512.07100v1
- Date: Mon, 08 Dec 2025 02:31:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.680526
- Title: Dual Refinement Cycle Learning: Unsupervised Text Classification of Mamba and Community Detection on Text Attributed Graph
- Title(参考訳): Dual Refinement Cycle Learning: Unsupervised Text Classification of Mamba and Community Detection on Text Attributed Graph
- Authors: Hong Wang, Yinglong Zhang, Hanhan Guo, Xuewen Xia, Xing Xu,
- Abstract要約: Dual Refinement Cycle Learning (DRCL) は、ラベルやカテゴリ定義がない実用的なシナリオ向けに設計された、完全に教師なしのフレームワークである。
DRCLは、発見されたコミュニティの構造的および意味的な品質を一貫して改善する。
DRCLのコミュニティ信号からのみ訓練されたマンバベースの分類器は、教師付きモデルに匹敵する精度を達成する。
- 参考スコア(独自算出の注目度): 11.193145644747426
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Pretrained language models offer strong text understanding capabilities but remain difficult to deploy in real-world text-attributed networks due to their heavy dependence on labeled data. Meanwhile, community detection methods typically ignore textual semantics, limiting their usefulness in downstream applications such as content organization, recommendation, and risk monitoring. To overcome these limitations, we present Dual Refinement Cycle Learning (DRCL), a fully unsupervised framework designed for practical scenarios where no labels or category definitions are available. DRCL integrates structural and semantic information through a warm-start initialization and a bidirectional refinement cycle between a GCN-based Community Detection Module (GCN-CDM) and a Text Semantic Modeling Module (TSMM). The two modules iteratively exchange pseudo-labels, allowing semantic cues to enhance structural clustering and structural patterns to guide text representation learning without manual supervision. Across several text-attributed graph datasets, DRCL consistently improves the structural and semantic quality of discovered communities. Moreover, a Mamba-based classifier trained solely from DRCL's community signals achieves accuracy comparable to supervised models, demonstrating its potential for deployment in large-scale systems where labeled data are scarce or costly.
- Abstract(参考訳): 事前訓練された言語モデルは、強力なテキスト理解機能を提供するが、ラベル付きデータに強く依存するため、現実世界のテキスト配信ネットワークにデプロイすることは困難である。
一方、コミュニティ検出手法は典型的にはテキストのセマンティクスを無視し、コンテンツ組織やレコメンデーション、リスクモニタリングといった下流アプリケーションでの有用性を制限する。
これらの制限を克服するために、ラベルやカテゴリ定義が存在しない実用的なシナリオ向けに設計された、完全に教師なしのフレームワークであるDual Refinement Cycle Learning (DRCL)を提案する。
DRCLは、GCNベースのコミュニティ検出モジュール(GCN-CDM)とテキストセマンティックモデリングモジュール(TSMM)の間で、ウォームスタート初期化と双方向の洗練サイクルを通じて構造情報と意味情報を統合する。
2つのモジュールは擬似ラベルを反復的に交換し、セマンティックキューは構造的クラスタリングと構造的パターンを強化し、手動による指導なしにテキスト表現学習をガイドする。
いくつかのテキスト分散グラフデータセットの中で、DRCLは発見されたコミュニティの構造的および意味的な品質を一貫して改善する。
さらに、DRCLのコミュニティ信号からのみ訓練されたMambaベースの分類器は、教師付きモデルに匹敵する精度を実現し、ラベル付きデータが不足またはコストがかかる大規模システムへの展開の可能性を示す。
関連論文リスト
- SLiNT: Structure-aware Language Model with Injection and Contrastive Training for Knowledge Graph Completion [11.686307370683922]
知識グラフにおけるリンク予測は、欠落したエンティティを推測するために構造情報と意味コンテキストを統合する必要がある。
SLiNTは,知識グラフに基づく構造的コンテキストを,ロラをベースとした軽量な適応型フリーズバックボーンに注入し,堅牢なリンク予測を行うモジュールフレームワークである。
WN18RRとFB15k-237の実験により、SLiNTは埋め込みベースとジェネレーションベースの両方と比較して優れた性能または競争性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-09-08T10:36:49Z) - Integrated Structural Prompt Learning for Vision-Language Models [15.002501540565781]
本稿では、視覚言語モデル(VLM)のための統合構造プロンプト(ISP)を提案する。
ISPは、学習可能なプロンプトと凍結トークンの間の構造関係をモデル化するために、自己構造的および相互構造的プロンプトモジュールを導入している。
ISPは最先端の手法に対して競争力を発揮する。
論文 参考訳(メタデータ) (2025-07-08T04:59:58Z) - EMK-KEN: A High-Performance Approach for Assessing Knowledge Value in Citation Network [0.0]
EMK-KENと呼ばれる新しい知識評価手法を提案する。
モデルは2つのモジュールから構成される。具体的には、まずMetaFPとMambaを使用して、ノードメタデータとテキスト埋め込みのセマンティックな特徴をキャプチャする。
第2のモジュールはkanを利用して、異なる分野のネットワークの違いを学習するために、引用ネットワークの構造情報をさらにキャプチャする。
論文 参考訳(メタデータ) (2025-01-19T06:27:46Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Sequential Visual and Semantic Consistency for Semi-supervised Text
Recognition [56.968108142307976]
Scene Text Recognition (STR) は、大規模なアノテートデータを必要とする課題である。
既存のSTR法の多くは、STRモデルの性能を低下させ、ドメイン差を生じさせる合成データに頼っている。
本稿では,視覚的・意味的両面から単語レベルの整合性正則化を取り入れたSTRの半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-24T13:00:54Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Bidirectional Trained Tree-Structured Decoder for Handwritten
Mathematical Expression Recognition [51.66383337087724]
Handwriting Mathematical Expression Recognition (HMER) タスクは、OCRの分野における重要な分岐である。
近年の研究では、双方向コンテキスト情報の導入により、HMERモデルの性能が大幅に向上することが示されている。
本稿では,MF-SLT と双方向非同期トレーニング (BAT) 構造を提案する。
論文 参考訳(メタデータ) (2023-12-31T09:24:21Z) - Unifying Structure and Language Semantic for Efficient Contrastive
Knowledge Graph Completion with Structured Entity Anchors [0.3913403111891026]
知識グラフ補完(KGC)の目標は、すでに知られている訓練された事実を用いて、KGの欠落したリンクを予測することである。
本稿では,帰納的推論の力を失うことなく,構造情報と言語意味を効果的に統一する手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T11:17:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。