論文の概要: Cross-Domain Few-Shot Learning for Hyperspectral Image Classification Based on Mixup Foundation Model
- arxiv url: http://arxiv.org/abs/2601.22581v1
- Date: Fri, 30 Jan 2026 05:24:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:15.244633
- Title: Cross-Domain Few-Shot Learning for Hyperspectral Image Classification Based on Mixup Foundation Model
- Title(参考訳): 混合基礎モデルに基づくハイパースペクトル画像分類のためのクロスドメインFew-Shot学習
- Authors: Naeem Paeedeh, Mahardhika Pratama, Ary Shiddiqi, Zehong Cao, Mukesh Prasad, Wisnu Jatmiko,
- Abstract要約: ハイパースペクトル画像(HSI)分類のためのクロスドメイン少ショット学習は、大きな研究関心を集めている。
本稿では,CDFSL HSI分類のためのMIFOMOを提案する。
MIFOMOは、リモートセンシング(RS)基礎モデルの概念に基づいて構築されており、大規模なRS問題に対して事前訓練されている。
- 参考スコア(独自算出の注目度): 16.673928004190273
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Although cross-domain few-shot learning (CDFSL) for hyper-spectral image (HSI) classification has attracted significant research interest, existing works often rely on an unrealistic data augmentation procedure in the form of external noise to enlarge the sample size, thus greatly simplifying the issue of data scarcity. They involve a large number of parameters for model updates, being prone to the overfitting problem. To the best of our knowledge, none has explored the strength of the foundation model, having strong generalization power to be quickly adapted to downstream tasks. This paper proposes the MIxup FOundation MOdel (MIFOMO) for CDFSL of HSI classifications. MIFOMO is built upon the concept of a remote sensing (RS) foundation model, pre-trained across a large scale of RS problems, thus featuring generalizable features. The notion of coalescent projection (CP) is introduced to quickly adapt the foundation model to downstream tasks while freezing the backbone network. The concept of mixup domain adaptation (MDM) is proposed to address the extreme domain discrepancy problem. Last but not least, the label smoothing concept is implemented to cope with noisy pseudo-label problems. Our rigorous experiments demonstrate the advantage of MIFOMO, where it beats prior arts with up to 14% margin. The source code of MIFOMO is open-sourced in https://github.com/Naeem- Paeedeh/MIFOMO for reproducibility and convenient further study.
- Abstract(参考訳): ハイパースペクトル画像(HSI)分類のためのクロスドメイン・ショットラーニング(CDFSL)は大きな研究関心を集めているが、既存の研究はサンプルサイズを拡大するために外部ノイズの形で非現実的なデータ拡張手法に依存しており、データ不足の問題を大幅に単純化している。
モデル更新には多数のパラメータが伴い、オーバーフィッティングの問題が発生しやすい。
我々の知る限りでは、下流タスクに迅速に適応する強力な一般化力を持つ基礎モデルの強みを探求する者はいない。
本稿では,HSI分類のCDFSLのためのMIFOMOを提案する。
MIFOMOは、リモートセンシング(RS)ファンデーションモデルの概念に基づいて構築されており、多数のRS問題を事前訓練し、一般化可能な特徴を特徴としている。
バックボーンネットワークを凍結しながら, 基礎モデルを下流のタスクに迅速に適応させるために, CPの概念を導入している。
ミキサアップドメイン適応(MDM)の概念は、極端領域の不一致問題に対処するために提案されている。
最後に、ラベルスムーシングの概念は、ノイズの多い擬似ラベル問題に対処するために実装されている。
われわれの厳格な実験はMIFOMOの利点を実証している。
MIFOMOのソースコードは、再現性と便利なさらなる研究のためにhttps://github.com/Naeem-Paeedeh/MIFOMOでオープンソース化されている。
関連論文リスト
- Score-based Membership Inference on Diffusion Models [3.742113529511043]
拡散モデルに対するメンバーシップ推論攻撃(MIA)は、プライバシーの懸念が強まっている。
本稿では,拡散モデルが近似することを学習する予測ノイズベクトルに着目し,スコアベースMIAの理論的,実証的研究を行う。
提案手法は, トレーニングセットに近づき, メンバシップが明らかになるような, 近隣のトレーニングサンプルのカーネル重み付き局所平均に対して, 期待されたデノイザ出力が向けられることを示す。
論文 参考訳(メタデータ) (2025-09-29T16:28:55Z) - MExD: An Expert-Infused Diffusion Model for Whole-Slide Image Classification [46.89908887119571]
Whole Slide Image (WSI) の分類は、画像サイズと多数の非表現領域が原因で、ユニークな課題を生んでいる。
本稿では,Mixture-of-Experts(MoE)機構の強度と拡張分類のための拡散モデルを組み合わせたエキスパート拡散モデルMExDを提案する。
論文 参考訳(メタデータ) (2025-03-16T08:04:17Z) - Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling [47.82616476928464]
仮面拡散モデル (MDM) は離散データの生成モデルとして人気がある。
我々はMDMのトレーニングとサンプリングの両方が理論的に時間変数から解放されていることを示す。
一般に使用されている32ビット浮動小数点精度においても,まず基礎となる数値問題を同定した。
論文 参考訳(メタデータ) (2024-09-04T17:48:19Z) - DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception [66.88792390480343]
本稿では,拡散モデルの生成的フィードバックを利用して画像エンコーダのセマンティックな分布を整合させる,シンプルだが効果的なアプローチであるDEEMを提案する。
DEEMは、トレーニング可能なパラメータが少なく、事前学習データが少なく、ベースモデルのサイズが小さいことを利用して、モデル幻覚を軽減するために、強化された堅牢性と優れた能力を示す。
論文 参考訳(メタデータ) (2024-05-24T05:46:04Z) - TC-DiffRecon: Texture coordination MRI reconstruction method based on
diffusion model and modified MF-UNet method [2.626378252978696]
本稿では,T-DiffReconという名前の拡散モデルに基づくMRI再構成法を提案する。
また、モデルにより生成されたMRI画像の品質を高めるために、MF-UNetモジュールを組み込むことを提案する。
論文 参考訳(メタデータ) (2024-02-17T13:09:00Z) - One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion
Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。
OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。
トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文 参考訳(メタデータ) (2023-11-27T12:02:42Z) - Reconstructing Graph Diffusion History from a Single Snapshot [87.20550495678907]
A single SnapsHot (DASH) から拡散履歴を再構築するための新しいバリセンターの定式化を提案する。
本研究では,拡散パラメータ推定のNP硬度により,拡散パラメータの推定誤差が避けられないことを証明する。
また、DITTO(Diffusion hitting Times with Optimal proposal)という効果的な解法も開発している。
論文 参考訳(メタデータ) (2023-06-01T09:39:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。