論文の概要: Is Backpropagation Optimal? When Synthetic Gradients Improve Sample Efficiency
- arxiv url: http://arxiv.org/abs/2605.27946v1
- Date: Wed, 27 May 2026 04:37:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.745074
- Title: Is Backpropagation Optimal? When Synthetic Gradients Improve Sample Efficiency
- Title(参考訳): バックプロパゲーションは最適か? 合成グラディエントがサンプル効率を改善する
- Authors: Yibo Jacky Zhang, Zeyu Tang, Sanmi Koyejo,
- Abstract要約: 計算グラフ上での損失ベースおよび報酬ベース学習のための統合ベクトル化フィードバックフレームワークを提案する。
合成勾配がバックプロパゲーションよりも低い勾配推定平均二乗誤差が得られる条件を特徴付ける。
- 参考スコア(独自算出の注目度): 24.618777617083385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Backpropagation is the default learning rule for artificial neural networks and is often treated as the settled approach whenever differentiability is available. In this work, we revisit this convention through a theoretical lens of sample efficiency. We introduce a unified vectorized feedback framework for loss-based and reward-based learning on computational graphs, in which synthetic gradients emerge as a natural alternative to backpropagation. We characterize the conditions under which synthetic gradients can achieve a lower gradient-estimation mean squared error than backpropagation. We construct examples illustrating that this sample efficiency advantage can be arbitrarily large. Experiments on contextual bandits and reinforcement learning tasks demonstrate the potential of our theoretical findings.
- Abstract(参考訳): バックプロパゲーション(backpropagation)は、人工知能ニューラルネットワークのデフォルトの学習ルールである。
本研究では, サンプル効率の理論的レンズを用いて, この規則を再検討する。
計算グラフ上での損失に基づく学習と報酬に基づく学習のための統一されたベクトル化フィードバックフレームワークを導入し、そこでは合成勾配がバックプロパゲーションの自然な代替手段として現れる。
合成勾配がバックプロパゲーションよりも低い勾配推定平均二乗誤差が得られる条件を特徴付ける。
我々はこのサンプル効率の利点が任意に大きいことを示す例を構築した。
文脈的帯域幅と強化学習タスクの実験は、我々の理論的な発見の可能性を実証している。
関連論文リスト
- Recovering Hidden Reward in Diffusion-Based Policies [20.31180123599115]
EnergyFlowは、逆強化学習を備えた生成アクションモデリングを統合するフレームワークである。
最大エントロピー最適性の下で、スコアマッチングによって学習されたスコア関数は、専門家のソフトQ関数の勾配を回復する。
学習分野を保守的に制限することは仮説の複雑さを減らし、分布外一般化境界を締め付けることを示す。
論文 参考訳(メタデータ) (2026-05-01T12:52:56Z) - Provably Improving Generalization of Few-Shot Models with Synthetic Data [15.33628135372502]
本研究では,分散の相違が教師あり学習に与える影響を定量化する理論的枠組みを開発する。
本稿では,データ分割とモデルトレーニングの両方を最適化するために,プロトタイプ学習を統合した理論に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-30T03:59:45Z) - A New Formulation of Lipschitz Constrained With Functional Gradient Learning for GANs [52.55025869932486]
本稿では,大規模データセット上でGAN(Generative Adversarial Networks)のトレーニングを行うための有望な代替手法を提案する。
本稿では,GANの学習を安定させるために,Lipschitz-Constrained Functional Gradient GANs Learning (Li-CFG)法を提案する。
判別器勾配のノルムを増大させることにより、潜在ベクトルの近傍サイズを小さくすることができることを示す。
論文 参考訳(メタデータ) (2025-01-20T02:48:07Z) - Learning on Transformers is Provable Low-Rank and Sparse: A One-layer Analysis [63.66763657191476]
低ランク計算としての効率的な数値学習と推論アルゴリズムはトランスフォーマーに基づく適応学習に優れた性能を持つことを示す。
我々は、等級モデルが適応性を改善しながら一般化にどのように影響するかを分析する。
適切なマグニチュードベースのテストは,テストパフォーマンスに多少依存している,と結論付けています。
論文 参考訳(メタデータ) (2024-06-24T23:00:58Z) - On the Dynamics Under the Unhinged Loss and Beyond [104.49565602940699]
我々は、閉形式力学を解析するための数学的機会を提供する、簡潔な損失関数であるアンヒンジド・ロスを導入する。
アンヒンジされた損失は、時間変化学習率や特徴正規化など、より実践的なテクニックを検討することができる。
論文 参考訳(メタデータ) (2023-12-13T02:11:07Z) - Theoretical Characterization of How Neural Network Pruning Affects its
Generalization [131.1347309639727]
この研究は、異なるプルーニング率がモデルの勾配降下ダイナミクスと一般化にどのように影響するかを研究する最初の試みである。
プルーニング率が一定の閾値以下である限り、勾配降下はトレーニング損失をゼロに導くことができる。
より驚くべきことに、プルーニング分数が大きくなるにつれて、一般化境界はより良くなる。
論文 参考訳(メタデータ) (2023-01-01T03:10:45Z) - A Fair Loss Function for Network Pruning [70.35230425589592]
本稿では, 刈り込み時のバイアスの抑制に使用できる簡易な改良型クロスエントロピー損失関数である, 性能重み付き損失関数を提案する。
CelebA、Fitzpatrick17k、CIFAR-10データセットを用いた実験は、提案手法が単純で効果的なツールであることを実証している。
論文 参考訳(メタデータ) (2022-11-18T15:17:28Z) - Regression as Classification: Influence of Task Formulation on Neural
Network Features [16.239708754973865]
ニューラルネットワークは、勾配に基づく手法を用いて2乗損失を最小限に抑えることにより、回帰問題を解決するために訓練することができる。
実践者は、しばしば回帰を分類問題として再編成し、クロスエントロピー損失のトレーニングがより良いパフォーマンスをもたらすことを観察する。
2層ReLUネットワークに着目して、勾配に基づく最適化によって引き起こされる暗黙のバイアスが、この現象を部分的に説明できるかを検討する。
論文 参考訳(メタデータ) (2022-11-10T15:13:23Z) - Unleashing the Power of Contrastive Self-Supervised Visual Models via
Contrast-Regularized Fine-Tuning [94.35586521144117]
コントラスト学習を微調整に適用することでさらにメリットが得られるか検討する。
本研究では,コントラスト正規化調律(core-tuning)を提案する。
論文 参考訳(メタデータ) (2021-02-12T16:31:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。