論文の概要: TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2602.05818v1
- Date: Thu, 05 Feb 2026 16:08:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:09.029478
- Title: TKG-Thinker: Towards Dynamic Reasoning over Temporal Knowledge Graphs via Agentic Reinforcement Learning
- Title(参考訳): TKG-Thinker:エージェント強化学習による時間的知識グラフの動的推論を目指して
- Authors: Zihao Jiang, Miao Peng, Zhenyan Shan, Wenjie Xu, Ben Liu, Gong Chen, Ziqi Gao, Min Peng,
- Abstract要約: 時間的知識グラフ質問応答(TKGQA)は、時間的知識ベースを活用することで、時間に敏感な質問に答えることを目的としている。
現在のプロンプト戦略は、その効果を2つの主要な方法で制限している。
自律型計画と適応型検索機能を備えた新しいエージェントである textbfTKG-Thinker を提案する。
- 参考スコア(独自算出の注目度): 22.089705008812217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Temporal knowledge graph question answering (TKGQA) aims to answer time-sensitive questions by leveraging temporal knowledge bases. While Large Language Models (LLMs) demonstrate significant potential in TKGQA, current prompting strategies constrain their efficacy in two primary ways. First, they are prone to reasoning hallucinations under complex temporal constraints. Second, static prompting limits model autonomy and generalization, as it lack optimization through dynamic interaction with temporal knowledge graphs (TKGs) environments. To address these limitations, we propose \textbf{TKG-Thinker}, a novel agent equipped with autonomous planning and adaptive retrieval capabilities for reasoning over TKGs. Specifically, TKG-Thinker performs in-depth temporal reasoning through dynamic multi-turn interactions with TKGs via a dual-training strategy. We first apply Supervised Fine-Tuning (SFT) with chain-of thought data to instill core planning capabilities, followed by a Reinforcement Learning (RL) stage that leverages multi-dimensional rewards to refine reasoning policies under intricate temporal constraints. Experimental results on benchmark datasets with three open-source LLMs show that TKG-Thinker achieves state-of-the-art performance and exhibits strong generalization across complex TKGQA settings.
- Abstract(参考訳): 時間的知識グラフ質問応答(TKGQA)は、時間的知識ベースを活用することで、時間に敏感な質問に答えることを目的としている。
大規模言語モデル(LLM)はTKGQAにおいて大きな可能性を示すが、現在のプロンプト戦略は2つの主要な方法で有効性を制限している。
まず、複雑な時間的制約の下で幻覚を推論する傾向がある。
第二に、静的なプロンプトは時間知識グラフ(TKG)環境との動的相互作用による最適化を欠いているため、モデルの自律性と一般化を制限している。
これらの制約に対処するために,TKGの推論に自律的な計画と適応型検索機能を備えた新しいエージェントである‘textbf{TKG-Thinker} を提案する。
具体的には、TKG-Thinkerは、TKGとの動的マルチターン相互作用を通じて、双対学習戦略を介して、詳細な時間的推論を行う。
次に,多次元報酬を利用した強化学習(Reinforcement Learning, RL)ステージで, 複雑な時間的制約下での推論ポリシーの洗練を図る。
3つのオープンソースのLCMによるベンチマークデータセットの実験結果から、TKG-Thinkerは最先端のパフォーマンスを達成し、複雑なTKGQA設定に対して強力な一般化を示すことが示された。
関連論文リスト
- Temp-R1: A Unified Autonomous Agent for Complex Temporal KGQA via Reverse Curriculum Reinforcement Learning [51.79753403262177]
時間的知識グラフ質問回答(TKGQA)は、マルチホップ依存と複雑な時間的制約を持つ動的事実に対する洗練された推論を必要とするため、本質的に困難である。
我々は、強化学習を通じて訓練されたTKGQAのための、最初の自律的エンドツーエンドエージェントであるTemp-R1を提案する。
8BパラメータであるTemp-R1はMultiTQとTimelineKGQAの最先端性能を実現し、複雑な問題に対する強いベースラインよりも19.8%向上した。
論文 参考訳(メタデータ) (2026-01-26T09:23:53Z) - Toward Better Temporal Structures for Geopolitical Events Forecasting [13.690434458053765]
我々は、HTKGs, Hyper-lational Temporal Knowledge Generalized Hypergraphs(HTKGHs)の一般化について研究する。
我々はまず,HTKGHsの形式化を導き,その後方互換性を実証するとともに,地政学的事件でよく見られる2つの複雑な事実を支持した。
次に、グローバルイベントデータベースPOLECAT上に構築されたhtkgh-polecatデータセットを紹介します。
論文 参考訳(メタデータ) (2026-01-01T18:45:07Z) - Plan of Knowledge: Retrieval-Augmented Large Language Models for Temporal Knowledge Graph Question Answering [23.330273675675897]
時間的知識グラフ質問回答(TKGQA)は、時間的知識グラフ(TKGs)からの事実情報を活用することで、時間に敏感な質問に答えることを目的としている。
論文 参考訳(メタデータ) (2025-11-06T05:24:14Z) - Plan Then Retrieve: Reinforcement Learning-Guided Complex Reasoning over Knowledge Graphs [52.16166558205338]
Graph-RFTは、"plan-KGsearch-and-Websearch-during-think"パラダイムを備えた、2段階強化KGQAフレームワークである。
これにより、LLMは、不完全な知識条件下で、KGやWebソース間で自律的な計画と適応的なスケジューリングを行うことができる。
論文 参考訳(メタデータ) (2025-10-23T16:04:13Z) - Large Language Models-guided Dynamic Adaptation for Temporal Knowledge Graph Reasoning [87.10396098919013]
大規模言語モデル (LLM) は、時間的推論において広範な知識と卓越した能力を示した。
本稿では,時間的知識グラフに基づく推論のためのLarge Language Models-Guided Dynamic Adaptation (LLM-DA)法を提案する。
LLM-DAは、歴史的データを解析し、時間的論理規則を抽出するLLMの機能を利用する。
論文 参考訳(メタデータ) (2024-05-23T04:54:37Z) - GenTKG: Generative Forecasting on Temporal Knowledge Graph with Large Language Models [35.594662986581746]
大規模言語モデル (LLM) は、従来の埋め込みベースおよびルールベースの手法が支配する時間的知識グラフ (tKG) 領域に関心を抱いている。
本稿では、時間的論理ルールに基づく検索戦略と、パラメータ効率の少ない命令チューニングを組み合わせた、GenTKGという新しい検索拡張生成フレームワークを提案する。
実験により、GenTKGは計算資源の少ない時間的関係予測法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-11T18:27:12Z) - T-GAP: Learning to Walk across Time for Temporal Knowledge Graph
Completion [13.209193437124881]
時間的知識グラフ(TKG)は、静的知識グラフとは対照的に、本質的に現実世界の知識の過渡的な性質を反映している。
エンコーダとデコーダにおける時間情報とグラフ構造の両方を最大限に活用するTKG補完の新しいモデルであるT-GAPを提案する。
本実験は、T-GAPが最先端のベースラインに対する優れた性能を達成し、目に見えないタイムスタンプによるクエリに有能に一般化することを示す。
論文 参考訳(メタデータ) (2020-12-19T04:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。