論文の概要: Feedback Control for Multi-Objective Graph Self-Supervision
- arxiv url: http://arxiv.org/abs/2602.05036v1
- Date: Wed, 04 Feb 2026 20:42:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.609945
- Title: Feedback Control for Multi-Objective Graph Self-Supervision
- Title(参考訳): 多目的グラフセルフスーパービジョンのためのフィードバック制御
- Authors: Karish Grover, Theodore Vasiloudis, Han Xie, Sixing Lu, Xiang Song, Christos Faloutsos,
- Abstract要約: グラフ自己教師型学習(SSL)は、プリテキスト目的のツールボックスの増大を提供する。
しかし、それらを確実に組み合わせることは、客観的な干渉とトレーニングの不安定さのために課題である。
我々は、グラフSSLをフィードバック制御の時間割当として再キャストするフレームワークであるControlGを紹介した。
- 参考スコア(独自算出の注目度): 17.221283574024053
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Can multi-task self-supervised learning on graphs be coordinated without the usual tug-of-war between objectives? Graph self-supervised learning (SSL) offers a growing toolbox of pretext objectives: mutual information, reconstruction, contrastive learning; yet combining them reliably remains a challenge due to objective interference and training instability. Most multi-pretext pipelines use per-update mixing, forcing every parameter update to be a compromise, leading to three failure modes: Disagreement (conflict-induced negative transfer), Drift (nonstationary objective utility), and Drought (hidden starvation of underserved objectives). We argue that coordination is fundamentally a temporal allocation problem: deciding when each objective receives optimization budget, not merely how to weigh them. We introduce ControlG, a control-theoretic framework that recasts multi-objective graph SSL as feedback-controlled temporal allocation by estimating per-objective difficulty and pairwise antagonism, planning target budgets via a Pareto-aware log-hypervolume planner, and scheduling with a Proportional-Integral-Derivative (PID) controller. Across 9 datasets, ControlG consistently outperforms state-of-the-art baselines, while producing an auditable schedule that reveals which objectives drove learning.
- Abstract(参考訳): グラフ上のマルチタスク自己教師型学習は、目標間の通常の綱引きなしでコーディネートできるのか?
グラフ自己教師型学習(SSL)は、相互情報、再構成、コントラスト学習といったプレテキスト目的のツールボックスを増大させています。
たいていのマルチプレテキストパイプラインは更新毎のミキシングを使用しており、すべてのパラメータ更新を妥協させ、診断(衝突による負の転送)、ドリフト(非定常的目的ユーティリティ)、ドリュート(隠された目的の飢餓)という3つの障害モードを生み出している。
コーディネーションは、基本的に時間割当の問題であり、それぞれの目的が最適化予算をいつ受け取るかを決めるものであり、その重み付けの仕方ではない、と我々は主張する。
我々は,多目的グラフSSLをフィードバック制御時間割当として再キャストする制御理論フレームワークであるControlGを導入し,目的ごとの難易度と対角的敵意を推定し,パレート対応ログハイパボリュームプランナを用いて目標予算を計画し,PIDコントローラでスケジューリングする。
9つのデータセットにまたがって、ControlGは、最先端のベースラインを一貫して上回り、監査可能なスケジュールを生成し、どの目的が学習を推進したかを明らかにする。
関連論文リスト
- daVinci-Agency: Unlocking Long-Horizon Agency Data-Efficiently [35.39097522391409]
大規模言語モデル(LLM)は短期的なタスクで優れており、それらを長期のエージェント合成に拡張することは依然として困難である。
本稿では,PRチェーンから構造化監視を体系的にマイニングするdaVinci-Agencyを提案する。
DaVinci-AgencyのPR基底構造は、本質的には、永続的なゴールサイクルの振る舞いを教えるのに不可欠な因果依存性と反復的な洗練を保っている。
論文 参考訳(メタデータ) (2026-02-02T13:23:39Z) - Neural Predictive Control to Coordinate Discrete- and Continuous-Time Models for Time-Series Analysis with Control-Theoretical Improvements [46.19047880604178]
時系列問題を連続ODEに基づく最適制御問題として再放送する。
データからのみダイナミックスを学ぶのではなく、タスクの目的に向かってODE軌道を操縦する制御アクションを最適化する。
軽度の仮定では、この多重水平最適化は無限水平解への指数収束をもたらす。
論文 参考訳(メタデータ) (2025-08-03T16:41:00Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Towards Unified Token Learning for Vision-Language Tracking [65.96561538356315]
本稿では,VL追跡をトークン生成タスクとして用いた「textbfMMTrack」という,視覚言語(VL)追跡パイプラインを提案する。
提案フレームワークは,言語記述と境界ボックスを離散トークン列にシリアライズする。
この新しい設計パラダイムでは、全てのトークンクエリが望ましいターゲットを認識し、ターゲットの空間座標を直接予測するために必要となる。
論文 参考訳(メタデータ) (2023-08-27T13:17:34Z) - Self-Supervised Multi-Object Tracking For Autonomous Driving From
Consistency Across Timescales [53.55369862746357]
自己管理型マルチオブジェクトトラッカーは、生のドメイン固有データから学習できるという大きな可能性を秘めている。
しかし、その再識別精度は、監督対象よりも低い。
本稿では,複数の連続フレームから再同定特徴を自己教師付きで学習できる学習目標を提案する。
論文 参考訳(メタデータ) (2023-04-25T20:47:29Z) - SMART: Self-supervised Multi-task pretrAining with contRol Transformers [34.604339091596884]
自己指導型事前訓練は言語と視覚領域で広く研究されている。
シーケンシャルな意思決定タスクのための事前学習アプローチを適切に設計することは困難である。
逐次意思決定のための一般的な事前学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-24T05:01:23Z) - Control-Aware Prediction Objectives for Autonomous Driving [78.19515972466063]
本研究では,制御に対する予測の下流効果を評価するための制御認識予測目標(CAPOs)を提案する。
本稿では,エージェント間の注意モデルを用いた重み付けと,予測軌跡を接地真実軌跡に交換する際の制御変動に基づく重み付けの2つの方法を提案する。
論文 参考訳(メタデータ) (2022-04-28T07:37:21Z) - Conflict-Averse Gradient Descent for Multi-task Learning [56.379937772617]
マルチタスクモデルを最適化する際の大きな課題は、矛盾する勾配である。
本稿では、平均損失関数を最小化する衝突-逆勾配降下(CAGrad)を導入する。
CAGradは目標を自動的にバランスし、平均損失よりも最小限に確実に収束する。
論文 参考訳(メタデータ) (2021-10-26T22:03:51Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Robust Learning Through Cross-Task Consistency [92.42534246652062]
クロスタスク整合性を用いた学習向上のための,広く適用可能な完全計算手法を提案する。
クロスタスク一貫性による学習は,より正確な予測と,アウト・オブ・ディストリビューション・インプットの一般化につながることを観察する。
論文 参考訳(メタデータ) (2020-06-07T09:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。