論文の概要: MC-RFM: Geometry-Aware Few-Shot Adaptation via Mixed-Curvature Riemannian Flow Matching
- arxiv url: http://arxiv.org/abs/2605.08557v1
- Date: Fri, 08 May 2026 23:36:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.73391
- Title: MC-RFM: Geometry-Aware Few-Shot Adaptation via Mixed-Curvature Riemannian Flow Matching
- Title(参考訳): MC-RFM:混合曲率リーマン流マッチングによる幾何認識Few-Shot適応
- Authors: Salim Khazem, Ibrahim Mohamed Serouis, Zakaria Ezzahed,
- Abstract要約: textscMC-RFMは、凍結した視覚バックボーンの少数ショット適応のための混合曲率フローマッチングフレームワークである。
適応は、凍結した特徴からサポートセットプロトタイプへのタスク条件付き連続輸送として定式化されている。
その結果, 混合曲率ヘッド, タスク条件付け, 適応分岐ゲーティング, プロトタイプ縮小, 識別的監督がそれぞれ性能に寄与していることが示唆された。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parameter-efficient adaptation of pretrained vision models is commonly performed through linear probes, prompts, low-rank updates, or lightweight residual modules. While effective, these methods usually treat adaptation as a discrete Euclidean perturbation of frozen representations, without explicitly modeling the geometry of the task-induced feature displacement. We propose \textsc{MC-RFM}, a mixed-curvature Riemannian flow-matching framework for few-shot adaptation of frozen visual backbones. The key idea is to represent adapted features on a product manifold combining a hyperbolic factor, which captures hierarchy-sensitive semantic structure, and a Euclidean factor, which preserves locally discriminative visual variation. Adaptation is formulated as a task-conditioned continuous transport from frozen features to support-set prototypes, trained with a flow-matching objective and coupled to a hybrid prototype-linear classifier. The method is lightweight, backbone-agnostic, and operates entirely on cached frozen features. Across seven visual recognition benchmarks, five frozen backbones, and 1/4/16-shot regimes, \textsc{MC-RFM} is the best-performing method in a majority of evaluated settings, with the strongest gains on Transformer backbones and fine-grained datasets. Ablations show that the mixed-curvature head, task conditioning, adaptive branch gating, prototype shrinkage, and discriminative supervision each contribute to performance. These results suggest that few-shot adaptation benefits not only from deciding which parameters to update, but also from modeling how representations should move through a geometry matched to the structure of the downstream task.
- Abstract(参考訳): 事前学習された視覚モデルのパラメータ効率の適応は、線形プローブ、プロンプト、低ランク更新、軽量残余モジュールによって一般的に行われる。
有効ではあるが、これらの手法は通常、タスクによって引き起こされる特徴変位の幾何学を明示的にモデル化することなく、凍結表現の離散ユークリッド摂動として適応を扱う。
凍結した視覚バックボーンの少数ショット適応のための混合曲率リーマン流マッチングフレームワークである \textsc{MC-RFM} を提案する。
鍵となる考え方は、階層性に敏感な意味構造を捉えた双曲的因子と、局所的な識別的視覚的変動を保存するユークリッド因子を組み合わせた積多様体上の適応的特徴を表現することである。
適応は、凍結した特徴からサポートセットのプロトタイプへのタスク条件付き連続輸送として定式化され、フローマッチングの目的で訓練され、ハイブリッドプロトタイプ-線形分類器に結合される。
このメソッドは軽量でバックボーンに依存しず、完全にキャッシュされた凍結機能で動作する。
7つの視覚的認識ベンチマーク、5つの凍結したバックボーン、1/4/16ショットのレシエーション、 \textsc{MC-RFM} は、ほとんどの評価済み設定において最高のパフォーマンスの方法であり、Transformerのバックボーンときめ細かいデータセットで最大の利益を得ている。
その結果, 混合曲率ヘッド, タスク条件付け, 適応分岐ゲーティング, プロトタイプ縮小, 識別的監督がそれぞれ性能に寄与していることが示唆された。
これらの結果は,どのパラメータを更新するかを判断するだけでなく,下流タスクの構造と一致した形状を表現がどのように移動すべきかをモデル化することによる利点を示唆している。
関連論文リスト
- MoRE: Batch-Robust Multi-Omics Representations from Frozen Pre-trained Transformers [0.0]
本稿では, 凍結事前学習型トランスフォーマーを応用し, 不均一なアッセイを共有潜在空間に整列させるフレームワークであるMoRE(Multi-Omics Representation Embedding)を提案する。
特に、MoREは軽量でモジュラリティ固有のアダプタとタスク適応型融合層を冷凍バックボーンに取り付ける。
我々は、Scrublet を用いた scGPT, scVI, Harmony など、確立されたベースラインに対して MoRE をベンチマークし、統合忠実度、希少な人口検出、モダリティ伝達を評価した。
論文 参考訳(メタデータ) (2025-11-25T15:04:06Z) - UniMRSeg: Unified Modality-Relax Segmentation via Hierarchical Self-Supervised Compensation [104.59740403500132]
マルチモーダルイメージセグメンテーションは、不完全/破損したモダリティの劣化による実際のデプロイメント課題に直面している。
階層型自己教師型補償(HSSC)による統一Modality-relaxセグメンテーションネットワーク(UniMRSeg)を提案する。
我々のアプローチは、入力レベル、特徴レベル、出力レベルをまたいだ完全なモダリティと不完全なモダリティの間の表現ギャップを階層的に橋渡しします。
論文 参考訳(メタデータ) (2025-09-19T17:29:25Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - CHASE: Learning Convex Hull Adaptive Shift for Skeleton-based Multi-Entity Action Recognition [10.045163723630159]
CHASEはサンプル適応正規化法として機能し、濃度間分布の相違を緩和する。
このアプローチはシングルエンタリティのバックボーンにシームレスに適応し、マルチエンタリティシナリオにおけるパフォーマンスを向上します。
論文 参考訳(メタデータ) (2024-10-09T17:55:43Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Fine-grained Retrieval Prompt Tuning [149.9071858259279]
微粒な検索プロンプトチューニングは, サンプルプロンプトと特徴適応の観点から, きめの細かい検索タスクを実行するために, 凍結した事前学習モデルを操る。
学習可能なパラメータが少ないFRPTは、広く使われている3つの細粒度データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-07-29T04:10:04Z) - Adaptive Correlated Monte Carlo for Contextual Categorical Sequence
Generation [77.7420231319632]
我々は,モンテカルロ (MC) ロールアウトの集合を分散制御のために評価する政策勾配推定器に,カテゴリー列の文脈的生成を適用する。
また,二分木ソフトマックスモデルに相関したMCロールアウトを用いることで,大語彙シナリオにおける高生成コストを低減できることを示す。
論文 参考訳(メタデータ) (2019-12-31T03:01:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。