論文の概要: TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2509.21526v1
- Date: Thu, 25 Sep 2025 20:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:53.977365
- Title: TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning
- Title(参考訳): TRiCo:ロバストな半教師付き学習のためのトライadic Game-theoretic Co-Training
- Authors: Hongyang He, Xinyuan Song, Yangfan He, Zeyu Zhang, Yanshu Li, Haochen You, Lifan Sun, Wenqiao Zhang,
- Abstract要約: TRiCoは、半教師付き学習の構造を再考する、三進的ゲーム理論の共同学習フレームワークである。
既存のSSLフレームワークにおける重要な制限に対処することによって、TRiCoは原則付き、一般化可能なソリューションを提供する。
- 参考スコア(独自算出の注目度): 15.638836465479619
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce TRiCo, a novel triadic game-theoretic co-training framework that rethinks the structure of semi-supervised learning by incorporating a teacher, two students, and an adversarial generator into a unified training paradigm. Unlike existing co-training or teacher-student approaches, TRiCo formulates SSL as a structured interaction among three roles: (i) two student classifiers trained on frozen, complementary representations, (ii) a meta-learned teacher that adaptively regulates pseudo-label selection and loss balancing via validation-based feedback, and (iii) a non-parametric generator that perturbs embeddings to uncover decision boundary weaknesses. Pseudo-labels are selected based on mutual information rather than confidence, providing a more robust measure of epistemic uncertainty. This triadic interaction is formalized as a Stackelberg game, where the teacher leads strategy optimization and students follow under adversarial perturbations. By addressing key limitations in existing SSL frameworks, such as static view interactions, unreliable pseudo-labels, and lack of hard sample modeling, TRiCo provides a principled and generalizable solution. Extensive experiments on CIFAR-10, SVHN, STL-10, and ImageNet demonstrate that TRiCo consistently achieves state-of-the-art performance in low-label regimes, while remaining architecture-agnostic and compatible with frozen vision backbones.
- Abstract(参考訳): TRiCoは,教師,2人の生徒,および対向生成器を統一的な学習パラダイムに組み込むことで,半教師付き学習の構造を再考する,新しい三進的ゲーム理論協調学習フレームワークである。
既存のコトレーニングや教師/学生のアプローチとは異なり、TRiCoはSSLを3つの役割間の構造化された相互作用として定式化している。
一 凍結相補表現の訓練を受けた二人の学生分類者
(二)検証に基づくフィードバックにより擬似ラベルの選択と損失分散を適応的に規制するメタ学習教師
三 決定境界の弱点を明らかにするために埋め込みを摂動する非パラメトリックジェネレータ。
疑似ラベルは、信頼よりも相互情報に基づいて選択され、より堅牢なてんかんの不確実性の尺度を提供する。
この三進的相互作用は、教師が戦略最適化を導い、生徒が反対の摂動に追従するスタックルバーグゲームとして形式化されている。
静的ビューインタラクション、信頼できない擬似ラベル、ハードサンプルモデリングの欠如など、既存のSSLフレームワークにおける重要な制限に対処することによって、TRiCoは原則的で一般化可能なソリューションを提供する。
CIFAR-10、SVHN、STL-10、ImageNetの大規模な実験では、TRiCoは低ラベルのレシエーションにおいて一貫して最先端のパフォーマンスを実現し、アーキテクチャに依存しない、凍結したビジョンバックボーンとの互換性を維持している。
関連論文リスト
- "The Whole Is Greater Than the Sum of Its Parts": A Compatibility-Aware Multi-Teacher CoT Distillation Framework [16.96094045628127]
CoT(Chain-of-Thought)推論は、大きな言語モデル(LLM)に優れた能力を与えるが、通常は禁止的なパラメータスケールを必要とする。
CoT蒸留は、推論技術をコンパクトな学生モデル(SLM)に伝達するための有望なパラダイムとして登場した。
我々は,教師の勾配を動的に重み付けすることで,教師の指導を適応的に融合させるフレームワークCompactを紹介する。
論文 参考訳(メタデータ) (2026-01-20T14:05:19Z) - Joint Discriminative-Generative Modeling via Dual Adversarial Training [4.884832758265374]
本稿では,差別的堅牢性と安定な生成学習の両面において,敵対的学習原則を取り入れた新しい学習枠組みを提案する。
CIFAR-10, CIFAR-100, ImageNetによる実験により, 競合生成性能を維持しつつ, 既存のハイブリッドモデルに対する対角的ロバスト性を大幅に向上することを示した。
論文 参考訳(メタデータ) (2025-10-13T13:07:22Z) - AdaSwitch: Adaptive Switching Generation for Knowledge Distillation [58.647880811071495]
スモール言語モデル(SLM)は、厳密な待ち時間と計算制約のあるアプリケーションには不可欠である。
トークンレベルでのオン・ポリティクスとオフ・ポリティクス・ジェネレーションを組み合わせた新しいアプローチであるAdaSwitchを提案する。
AdaSwitchは一貫して精度を向上し、SLMを蒸留するための実用的で効果的な方法を提供し、追加のオーバーヘッドを許容する。
論文 参考訳(メタデータ) (2025-10-09T06:38:37Z) - Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification [24.24793934981947]
擬似ラベルノイズ(PLN)を考慮した新しい学習パラダイムを提案する。
PLNはノイズオーバーフィット、エラー蓄積、ノイズの多いクラスタ対応の3つの主要な課題によって特徴づけられる。
UVI-ReIDのためのロバスト・デュナリティ学習フレームワーク(RoDE)を提案する。
論文 参考訳(メタデータ) (2025-05-05T10:36:52Z) - 3C: Confidence-Guided Clustering and Contrastive Learning for Unsupervised Person Re-Identification [10.173539278449262]
教師なし人物再識別(Re-ID)は、非ラベルデータセットでクロスカメラ検索機能を備えた機能ネットワークを学習することを目的としている。
教師なしのRe-IDに対して,信頼誘導型クラスタリングとコントラスト学習(3C)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-18T13:14:20Z) - Fairness-Aware Meta-Learning via Nash Bargaining [63.44846095241147]
本稿では,機械学習におけるグループレベルの公平性の問題に対処する2段階のメタ学習フレームワークを提案する。
第1段階では、過度な競合を解決するためにNash Bargaining Solution(NBS)を使用して、モデルをステアリングする。
6つのキーフェアネスデータセットと2つの画像分類タスクにおいて、様々なフェアネス目標に対して経験的効果を示す。
論文 参考訳(メタデータ) (2024-06-11T07:34:15Z) - Robust Training of Federated Models with Extremely Label Deficiency [84.00832527512148]
フェデレーション半教師付き学習(FSSL)は、ラベル不足を伴う分散データを用いて機械学習モデルを協調訓練するための強力なパラダイムとして登場した。
我々は,ラベル付きおよびラベルなしデータの異なる視点から洞察を提供することにより相互指導を強化するために,ツインサイトと呼ばれる新しいツインモデルパラダイムを提案する。
4つのベンチマークデータセットに関する包括的な実験は、Twin-sightが様々な実験環境において最先端の手法を著しく上回っていることを示す重要な証拠となる。
論文 参考訳(メタデータ) (2024-02-22T10:19:34Z) - Cross-Stream Contrastive Learning for Self-Supervised Skeleton-Based
Action Recognition [22.067143671631303]
自己教師型骨格に基づく行動認識は、対照的な学習の発展とともに急速に成長する。
骨格に基づく行動表現学習(CSCLR)のためのクロスストリームコントラスト学習フレームワークを提案する。
具体的には、CSCLRはストリーム内コントラストペアを利用するだけでなく、ストリーム間コントラストペアをハードサンプルとして導入し、より良い表現学習を定式化する。
論文 参考訳(メタデータ) (2023-05-03T10:31:35Z) - Distantly-Supervised Named Entity Recognition with Adaptive Teacher
Learning and Fine-grained Student Ensemble [56.705249154629264]
NERモデルの堅牢性を改善するために,自己学習型教員学生フレームワークを提案する。
本稿では,2つの教員ネットワークからなる適応型教員学習を提案する。
微粒な学生アンサンブルは、教師モデルの各フラグメントを、生徒の対応するフラグメントの時間移動平均で更新し、各モデルフラグメントのノイズに対する一貫した予測を強化する。
論文 参考訳(メタデータ) (2022-12-13T12:14:09Z) - Exploration and Exploitation: Two Ways to Improve Chinese Spelling
Correction Models [51.744357472072416]
本稿では,モデルの弱点を継続的に識別し,より価値の高いトレーニングインスタンスを生成する手法を提案する。
実験結果から, 事前学習戦略と組み合わさって, 複数のCSCモデルの一般化とロバスト性を改善することができることがわかった。
論文 参考訳(メタデータ) (2021-05-31T09:17:33Z) - 3D Human Action Representation Learning via Cross-View Consistency
Pursuit [52.19199260960558]
教師なし3次元骨格に基づく行動表現(CrosSCLR)のためのクロスビューコントラスト学習フレームワークを提案する。
CrosSCLRは、シングルビューのコントラスト学習(SkeletonCLR)とクロスビューの一貫した知識マイニング(CVC-KM)モジュールの両方で構成されています。
論文 参考訳(メタデータ) (2021-04-29T16:29:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。