Fugu-MT 論文翻訳(概要): FORML: A Riemannian Hessian-free Method for Meta-learning with Orthogonality Constraint

論文の概要: FORML: A Riemannian Hessian-free Method for Meta-learning with Orthogonality Constraint

arxiv url: http://arxiv.org/abs/2402.18605v1
Date: Wed, 28 Feb 2024 10:57:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-01 17:13:34.441840
Title: FORML: A Riemannian Hessian-free Method for Meta-learning with Orthogonality Constraint
Title（参考訳）: FORML:直交制約を伴うメタラーニングのためのリーマン的ヘッセンフリー手法
Authors: Hadi Tabealhojeh, Soumava Kumar Roy, Peyman Adibi and Hossein Karshenas
Abstract要約: 本稿では、スティーフェル多様体上の微分の1次近似を用いたヘッセンフリーアプローチを提案する。本手法は計算負荷とメモリフットプリントを大幅に削減する。
参考スコア（独自算出の注目度）: 5.197619725604242
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Meta-learning problem is usually formulated as a bi-level optimization in which the task-specific and the meta-parameters are updated in the inner and outer loops of optimization, respectively. However, performing the optimization in the Riemannian space, where the parameters and meta-parameters are located on Riemannian manifolds is computationally intensive. Unlike the Euclidean methods, the Riemannian backpropagation needs computing the second-order derivatives that include backward computations through the Riemannian operators such as retraction and orthogonal projection. This paper introduces a Hessian-free approach that uses a first-order approximation of derivatives on the Stiefel manifold. Our method significantly reduces the computational load and memory footprint. We show how using a Stiefel fully-connected layer that enforces orthogonality constraint on the parameters of the last classification layer as the head of the backbone network, strengthens the representation reuse of the gradient-based meta-learning methods. Our experimental results across various few-shot learning datasets, demonstrate the superiority of our proposed method compared to the state-of-the-art methods, especially MAML, its Euclidean counterpart.
Abstract（参考訳）: メタラーニング問題は、通常、内部および外部の最適化ループでタスク固有とメタパラメータを更新する二段階最適化として定式化される。しかし、リーマン多様体上のパラメータとメタパラメータが位置するリーマン空間における最適化の実行は計算集約的である。ユークリッド法とは異なり、リーマンのバックプロパゲーションは、引き算や直交射影のようなリーマン作用素を通しての逆計算を含む二階微分を計算する必要がある。本稿では、スティーフェル多様体上の微分の1次近似を用いたヘッセンフリーアプローチを提案する。本手法は計算負荷とメモリフットプリントを大幅に削減する。本稿では,最後の分類層のパラメータの直交制約をバックボーンネットワークのヘッダとして適用したStiefel完全連結層を用いて,勾配に基づくメタ学習手法の表現再利用を強化する方法を示す。実験の結果,提案手法が最先端の手法,特にユークリッドの手法であるMAMLと比較して優れていることを示す。

関連論文リスト

Generalized Tensor-based Parameter-Efficient Fine-Tuning via Lie Group Transformations [50.010924231754856]
さまざまな下流タスクに事前訓練された基礎モデルを適用することは、人工知能のコアプラクティスである。これを解決するために、LoRAのようなパラメータ効率細調整(PEFT)手法が登場し、研究の焦点となっている。本稿では,行列型PEFT法を高次元パラメータ空間に拡張する一般化法を提案する。
論文参考訳（メタデータ） (2025-04-01T14:36:45Z)
Riemannian Optimization on Relaxed Indicator Matrix Manifold [83.13494760649874]
インジケータ行列は機械学習において重要な役割を果たすが、最適化はNPハード問題である。我々は、指標行列の新たな緩和を提案し、この緩和が多様体を形成することを証明し、それをRelaxed Indicator Matrix Manifold (RIM manifold) と呼ぶ。測地学を得るための高速な測地法を含む,いくつかのリトラクション法を提案する。
論文参考訳（メタデータ） (2025-03-26T12:45:52Z)
Riemannian Geometric-based Meta Learning [8.365106891566725]
「学習への学習」は、最小限のデータでモデルが新しいタスクに迅速に適応できるようにすることを目的としている。 Model-Agnostic Meta-Learning (MAML)のような従来の手法は、複雑な学習力学を捉えるのに苦労することが多い。シュティーフェル多様体内を最適化することによりリーマン幾何学を統合するシュティーフェル-MAMLを提案する。
論文参考訳（メタデータ） (2025-03-14T01:34:55Z)
Large-Scale Riemannian Meta-Optimization via Subspace Adaptation [39.75524650528829]
本稿では,大規模最適化におけるメモリ負荷を大幅に削減する効率的な手法を提案する。本手法は,主流のディープニューラルネットワークを最適化する場合,モデルメモリ消費量を6桁に削減する。
論文参考訳（メタデータ） (2025-01-25T14:49:35Z)
A Stochastic Approach to Bi-Level Optimization for Hyperparameter Optimization and Meta Learning [74.80956524812714]
我々は,現代のディープラーニングにおいて広く普及している一般的なメタ学習問題に対処する。これらの問題は、しばしばBi-Level Optimizations (BLO)として定式化される。我々は,与えられたBLO問題を,内部損失関数が滑らかな分布となり,外損失が内部分布に対する期待損失となるようなii最適化に変換することにより,新たな視点を導入する。
論文参考訳（メタデータ） (2024-10-14T12:10:06Z)
Riemannian Bilevel Optimization [35.42472057648458]
特に,2次情報を回避することを目的とした,バッチおよび勾配に基づく手法に着目する。本稿では,一階勾配情報を活用する手法である$mathrmRF2SA$を提案し,分析する。様々な設定の下で、$epsilon$-stationary 点に達するための明示的な収束率を提供する。
論文参考訳（メタデータ） (2024-05-22T20:49:01Z)
Streamlining in the Riemannian Realm: Efficient Riemannian Optimization with Loopless Variance Reduction [4.578425862931332]
本研究はユークリッドとリーマンの設定の両方で用いられる決定的な還元機構に焦点を当てる。ユークリッド法により動機付け, コインフリップによって引き起こされる計算で外ループを置換するR法を導入する。フレームワークとしてR-を用いることで、様々な重要な設定に適用可能であることを示す。
論文参考訳（メタデータ） (2024-03-11T12:49:37Z)
Decentralized Riemannian Conjugate Gradient Method on the Stiefel Manifold [59.73080197971106]
本稿では,最急降下法よりも高速に収束する一階共役最適化法を提案する。これはスティーフェル多様体上の大域収束を達成することを目的としている。
論文参考訳（メタデータ） (2023-08-21T08:02:16Z)
Decentralized Riemannian natural gradient methods with Kronecker-product approximations [11.263837420265594]
本稿では,分散化多様体最適化問題の解法として,効率的な分散化自然勾配降下法(DRNGD)を提案する。クロネッカー因子を介して通信を行うことにより、RFIMの高品質な近似を低コストで得ることができる。
論文参考訳（メタデータ） (2023-03-16T19:36:31Z)
Gaussian Processes and Statistical Decision-making in Non-Euclidean Spaces [96.53463532832939]
我々はガウス過程の適用性を高める技術を開発した。この観点から構築した効率的な近似を幅広く導入する。非ユークリッド空間上のガウス過程モデルの集合を開発する。
論文参考訳（メタデータ） (2022-02-22T01:42:57Z)
Automatic differentiation for Riemannian optimization on low-rank matrix and tensor-train manifolds [71.94111815357064]
科学計算および機械学習アプリケーションでは、行列およびより一般的な多次元配列(テンソル)は、しばしば低ランク分解の助けを借りて近似することができる。低ランク近似を見つけるための一般的なツールの1つはリーマン最適化を使うことである。
論文参考訳（メタデータ） (2021-03-27T19:56:00Z)
Bayesian Quadrature on Riemannian Data Manifolds [79.71142807798284]
データに固有の非線形幾何学構造をモデル化する原則的な方法が提供される。しかし、これらの演算は通常計算的に要求される。特に、正規法則上の積分を数値計算するためにベイズ二次(bq)に焦点を当てる。先行知識と活発な探索手法を両立させることで,BQは必要な評価回数を大幅に削減できることを示す。
論文参考訳（メタデータ） (2021-02-12T17:38:04Z)
Mat\'ern Gaussian processes on Riemannian manifolds [81.15349473870816]
ガウス過程の広く用いられるマタン類を一般化する方法を示す。また、Mat'ern から広く用いられる2乗指数過程への一般化も拡張する。
論文参考訳（メタデータ） (2020-06-17T21:05:42Z)
Riemannian Stochastic Proximal Gradient Methods for Nonsmooth Optimization over the Stiefel Manifold [7.257751371276488]
R-ProxSGDとR-ProxSPBは、近位SGDと近位SpiderBoostの一般化である。 R-ProxSPBアルゴリズムは、オンラインの場合で$O(epsilon-3)$ IFOs、有限サムの場合は$O(n+sqrtnepsilon-3)$ IFOsである。
論文参考訳（メタデータ） (2020-05-03T23:41:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。