Fugu-MT 論文翻訳(概要): Learning to Learn Weight Generation via Trajectory Diffusion

論文の概要: Learning to Learn Weight Generation via Trajectory Diffusion

arxiv url: http://arxiv.org/abs/2502.01117v1
Date: Mon, 03 Feb 2025 07:13:59 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-05 15:21:54.434121
Title: Learning to Learn Weight Generation via Trajectory Diffusion
Title（参考訳）: 軌道拡散による重み生成の学習
Authors: Yunchuan Guan, Yu Liu, Ke Zhou, Zhiqi Shen, Serge Belongie, Jenq-Neng Hwang, Lei Li,
Abstract要約: メタ学習と拡散アルゴリズムを統合したLt-Diを提案する。我々は、バニラ拡散アルゴリズムを軌道拡散アルゴリズムに拡張し、最適化軌道に沿って他の重みを利用する。実験では、Lt-Diの精度を実証し、様々なタスクにおける計算オーバーヘッドを低減した。
参考スコア（独自算出の注目度）: 33.016891623084426
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion-based algorithms have emerged as promising techniques for weight generation, particularly in scenarios like multi-task learning that require frequent weight updates. However, existing solutions suffer from limited cross-task transferability. In addition, they only utilize optimal weights as training samples, ignoring the value of other weights in the optimization process. To address these issues, we propose Lt-Di, which integrates the diffusion algorithm with meta-learning to generate weights for unseen tasks. Furthermore, we extend the vanilla diffusion algorithm into a trajectory diffusion algorithm to utilize other weights along the optimization trajectory. Trajectory diffusion decomposes the entire diffusion chain into multiple shorter ones, improving training and inference efficiency. We analyze the convergence properties of the weight generation paradigm and improve convergence efficiency without additional time overhead. Our experiments demonstrate Lt-Di's higher accuracy while reducing computational overhead across various tasks, including zero-shot and few-shot learning, multi-domain generalization, and large-scale language model fine-tuning.Our code is released at https://github.com/tuantuange/Lt-Di.
Abstract（参考訳）: 拡散に基づくアルゴリズムは、特に頻繁な重み更新を必要とするマルチタスク学習のようなシナリオにおいて、重み生成のための有望なテクニックとして登場した。しかし、既存のソリューションはクロスタスク転送可能性の制限に悩まされている。さらに、最適化プロセスにおける他の重みの値を無視して、最適な重みのみをトレーニングサンプルとして利用する。これらの課題に対処するため,メタラーニングと拡散アルゴリズムを統合したLt-Diを提案する。さらに,バニラ拡散アルゴリズムを軌道拡散アルゴリズムに拡張し,最適化軌道に沿った他の重みを利用する。軌道拡散は拡散鎖全体を複数の短い鎖に分解し、訓練と推論効率を向上させる。重み生成パラダイムの収束特性を解析し,余分な時間オーバーヘッドを伴わずに収束効率を向上させる。実験では,Lt-Diの精度が向上し,ゼロショットや少数ショットの学習,マルチドメインの一般化,大規模言語モデルの微調整など,様々なタスクにおける計算オーバーヘッドの低減が図られている。

関連論文リスト

Morphology-optimized Multi-Scale Fusion: Combining Local Artifacts and Mesoscopic Semantics for Deepfake Detection and Localization [30.871239863769404]
一般的な戦略は、操作されたイメージとともに、モデルトレーニング中に偽のリージョンアノテーションを組み込むことである。本研究では,局所的視点と大域的視点の両方を用いて操作された領域を独立に予測する手法を提案する。
論文参考訳（メタデータ） (2025-09-17T07:46:07Z)
A Novel Local Focusing Mechanism for Deepfake Detection Generalization [10.223643897131192]
ディープフェイク生成技術は、堅牢で一般化可能な検出方法の必要性を強めている。本研究では,実画像と偽画像を識別するための識別的局所特徴に明示的に対応する新しいローカルフォーカス機構(LFM)を提案する。 LFMは3.7の精度向上と2.8の精度向上を実現している。
論文参考訳（メタデータ） (2025-08-23T14:06:30Z)
DiP-GO: A Diffusion Pruner via Few-step Gradient Optimization [22.546989373687655]
本稿では,よりインテリジェントで微分可能なプルーナーを用いて,効率的な拡散モデルを導出する新しいプルーニング法を提案する。提案手法はSD-1.5の4.4倍の高速化を実現し,従来の最先端手法よりも優れていた。
論文参考訳（メタデータ） (2024-10-22T12:18:24Z)
Interactive incremental learning of generalizable skills with local trajectory modulation [14.416251854298409]
軌道分布の局所的および大域的変調を同時に活用するインタラクティブな模倣学習フレームワークを提案する。提案手法では, インクリメンタルかつインタラクティブに, 1) モデル精度の向上, 2) 実行中のタスクに新しいオブジェクトの追加,3) デモが提供されていない領域にスキルを拡大する。
論文参考訳（メタデータ） (2024-09-09T14:22:19Z)
DiffSG: A Generative Solver for Network Optimization with Diffusion Model [75.27274046562806]
生成拡散モデルは、様々なクロスドメインアプリケーションで人気がある。これらのモデルは複雑なネットワーク最適化問題に対処する上で有望である。本稿では拡散モデルに基づく解生成という,拡散モデル生成のための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2024-08-13T07:56:21Z)
Understanding Reinforcement Learning-Based Fine-Tuning of Diffusion Models: A Tutorial and Review [63.31328039424469]
このチュートリアルは、下流の報酬関数を最適化するための微調整拡散モデルのための方法を網羅的に調査する。 PPO,微分可能最適化,報酬重み付きMLE,値重み付きサンプリング,経路整合性学習など,様々なRLアルゴリズムの適用について説明する。
論文参考訳（メタデータ） (2024-07-18T17:35:32Z)
Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文参考訳（メタデータ） (2024-02-28T08:34:23Z)
Training Artificial Neural Networks by Coordinate Search Algorithm [0.20971479389679332]
本稿では、ニューラルネットワークのトレーニングのための勾配自由座標探索(CS)アルゴリズムの効率的なバージョンを提案する。提案アルゴリズムは、微分不可能なアクティベーション関数で使用することができ、多目的/マルチロス問題に適合する。 ANNの重みに対する最適値を求めることは、大規模な最適化問題である。
論文参考訳（メタデータ） (2024-02-20T01:47:25Z)
Universal Neural Functionals [67.80283995795985]
多くの現代の機械学習タスクでは、ウェイトスペース機能を処理することが難しい問題である。最近の研究は、単純なフィードフォワードネットワークの置換対称性に同値な有望な重み空間モデルを開発した。本研究は,任意の重み空間に対する置換同変モデルを自動的に構築するアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-02-07T20:12:27Z)
Post-Training Quantization for Re-parameterization via Coarse & Fine Weight Splitting [13.270381125055275]
本稿では,重みの量子化誤差を低減するために,粗大かつ微細な重み分割法(CFWS)を提案する。我々は、活性化のための最適な量子化尺度を決定するために改良されたKLメトリックを開発した。例えば、量子化されたRepVGG-A1モデルは、わずか0.3%の精度損失を示す。
論文参考訳（メタデータ） (2023-12-17T02:31:20Z)
NUPES : Non-Uniform Post-Training Quantization via Power Exponent Search [7.971065005161565]
量子化は浮動小数点表現を低ビット幅の固定点表現に変換する技術である。量子化空間全体にわたって新しい量子化重みを学習する方法を示す。本研究では,データフリーとデータ駆動の両構成において,最先端の圧縮率を実現する手法の有効性を示す。
論文参考訳（メタデータ） (2023-08-10T14:19:58Z)
Recursive Euclidean Distance Based Robust Aggregation Technique For Federated Learning [4.848016645393023]
フェデレーション学習は、機械学習におけるデータ可用性とプライバシの課題に対するソリューションである。悪意のあるユーザは、ローカルモデルを悪意のあるデータでトレーニングすることで、協調学習プロセスを妨害することを目指している。ユークリッド距離計算に基づく新しいロバストアグリゲーション手法を提案する。
論文参考訳（メタデータ） (2023-03-20T06:48:43Z)
Learning to Optimize Permutation Flow Shop Scheduling via Graph-based Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文参考訳（メタデータ） (2022-10-31T09:46:26Z)
Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文参考訳（メタデータ） (2022-05-27T12:29:11Z)
Global-Local Regularization Via Distributional Robustness [26.983769514262736]
ディープニューラルネットワークは、しばしば敵の例や分布シフトに弱い。最近のアプローチでは、分散ロバストネス最適化(DRO)を利用して、最も難しい分布を見つける。本稿では,Wasserstein をベースとした DRO フレームワークの後継として,新たな正規化手法を提案する。
論文参考訳（メタデータ） (2022-03-01T15:36:12Z)
Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文参考訳（メタデータ） (2022-02-19T17:46:02Z)
HarmoFL: Harmonizing Local and Global Drifts in Federated Learning on Heterogeneous Medical Images [19.62267284815759]
我々は、ローカルドリフトとグローバルドリフトの両方を扱う、HarmoFLと呼ばれる新しいフレームワークを紹介した。 HarmoFLは、周波数領域に変換された画像の振幅を正規化することにより、ローカル更新ドリフトを緩和する。我々はHarmoFLが、期待できる収束挙動を持つ最新の最先端手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-12-20T13:25:48Z)
Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。 SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文参考訳（メタデータ） (2021-12-12T06:11:16Z)
Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。 3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文参考訳（メタデータ） (2021-07-27T14:47:24Z)
Effective Model Sparsification by Scheduled Grow-and-Prune Methods [73.03533268740605]
本稿では,高密度モデルの事前学習を伴わない新規なGrow-and-prune(GaP)手法を提案する。実験により、そのようなモデルは様々なタスクにおいて80%の間隔で高度に最適化された高密度モデルの品質に適合または打ち勝つことができることが示された。
論文参考訳（メタデータ） (2021-06-18T01:03:13Z)
Towards Accurate Knowledge Transfer via Target-awareness Representation Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。 TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文参考訳（メタデータ） (2020-10-16T17:45:08Z)
Communication-Efficient Distributed Stochastic AUC Maximization with Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文参考訳（メタデータ） (2020-05-05T18:08:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。