論文の概要: Trust-SSL: Additive-Residual Selective Invariance for Robust Aerial Self-Supervised Learning
- arxiv url: http://arxiv.org/abs/2604.21349v1
- Date: Thu, 23 Apr 2026 07:07:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.347622
- Title: Trust-SSL: Additive-Residual Selective Invariance for Robust Aerial Self-Supervised Learning
- Title(参考訳): Trust-SSL:ロバストな航空自制学習のための付加的残差選択不変性
- Authors: Wadii Boulila, Adel Ammar, Bilel Benjdira, Maha Driss,
- Abstract要約: 自己教師付き学習 (SSL) は、航空画像における表現学習の標準的手法である。
本研究では,このような汚職に対するSSLを強化するためのトレーニング戦略とアーキテクチャ修正を提案する。
この方法は、EuroSAT、AID、NWPU-RESISC45の6つのバックボーンの中で、最も高い平均線形プローブ精度を実現する。
- 参考スコア(独自算出の注目度): 6.479513353756828
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-supervised learning (SSL) is a standard approach for representation learning in aerial imagery. Existing methods enforce invariance between augmented views, which works well when augmentations preserve semantic content. However, aerial images are frequently degraded by haze, motion blur, rain, and occlusion that remove critical evidence. Enforcing alignment between a clean and a severely degraded view can introduce spurious structure into the latent space. This study proposes a training strategy and architectural modification to enhance SSL robustness to such corruptions. It introduces a per-sample, per-factor trust weight into the alignment objective, combined with the base contrastive loss as an additive residual. A stop-gradient is applied to the trust weight instead of a multiplicative gate. While a multiplicative gate is a natural choice, experiments show it impairs the backbone, whereas our additive-residual approach improves it. Using a 200-epoch protocol on a 210,000-image corpus, the method achieves the highest mean linear-probe accuracy among six backbones on EuroSAT, AID, and NWPU-RESISC45 (90.20% compared to 88.46% for SimCLR and 89.82% for VICReg). It yields the largest improvements under severe information-erasing corruptions on EuroSAT (+19.9 points on haze at s=5 over SimCLR). The method also demonstrates consistent gains of +1 to +3 points in Mahalanobis AUROC on a zero-shot cross-domain stress test using BDD100K weather splits. Two ablations (scalar uncertainty and cosine gate) indicate the additive-residual formulation is the primary source of these improvements. An evidential variant using Dempster-Shafer fusion introduces interpretable signals of conflict and ignorance. These findings offer a concrete design principle for uncertainty-aware SSL. Code is publicly available at https://github.com/WadiiBoulila/trust-ssl.
- Abstract(参考訳): 自己教師付き学習 (SSL) は、航空画像における表現学習の標準的手法である。
既存の方法は、拡張ビュー間の不変性を強制する。
しかし、空中画像は、しばしば、重大な証拠を除去するヘイズ、動きのぼかし、雨、閉塞によって劣化する。
クリーニングと高度に劣化したビューのアライメントを強制することは、潜在空間に急激な構造をもたらす可能性がある。
本研究では,このような汚職に対するSSLの堅牢性を高めるためのトレーニング戦略とアーキテクチャ修正を提案する。
要素ごとの信頼度をアライメント目標に導入し、ベースコントラスト損失を付加残差として組み合わせる。
乗算ゲートの代わりに信頼重みに停止勾配が適用される。
乗法ゲートは自然な選択であるが、実験では背骨を損なうが、加法・残留アプローチはそれを改善する。
210,000イメージのコーパス上で200エポックプロトコルを使用することで、EuroSAT、AID、NWPU-RESISC45の6つのバックボーンのうち、平均線形プローブの精度が最も高い(SimCLRは88.46%、VICRegは89.82%)。
これは、EuroSAT(SimCLRよりs=5でのヘイズで+19.9ポイント)の深刻な情報消去による最大の改善をもたらす。
この手法はまた、BDD100K気象分割を用いたゼロショットクロスドメインストレステストにおいて、マハラノビスAUROCの+1点から+3点の連続的な利得を示す。
2つのアブレーション(スカラー不確実性とコサインゲート)は、これらの改善の主な原因は加法-残留の定式化であることを示している。
Dempster-Shafer融合を用いた明らかな変種は、矛盾と無知の解釈可能なシグナルをもたらす。
これらの発見は、不確実性を認識したSSLに具体的な設計原則を提供する。
コードはhttps://github.com/WadiiBoulila/trust-ssl.comで公開されている。
関連論文リスト
- Severe Domain Shift in Skeleton-Based Action Recognition:A Study of Uncertainty Failure in Real-World Gym Environments [0.0]
本稿では,新しいGym2DデータセットとUCF101データセットを用いて,厳しい領域シフトの体系的研究を行う。
我々の研究は、標準的なデプロイメント仮定に挑戦し、セマンティックスケルトン認識と幾何学的スケルトン認識の両方のデプロイの安全性を原則として分析する。
論文 参考訳(メタデータ) (2026-03-16T17:37:17Z) - BadCLIP++: Stealthy and Persistent Backdoors in Multimodal Contrastive Learning [73.46118996284888]
マルチモーダル・コントラスト学習モデルに対するバックドア攻撃の研究は、ステルスネスと永続性という2つの大きな課題に直面している。
両課題に対処する統合フレームワークであるBadCLIP++を提案する。
ステルスネスのために,タスク関連領域付近に知覚不可能なパターンを埋め込むセマンティックフュージョンQRマイクロトリガーを導入する。
持続性については、半径縮小とセントロイドアライメントによるトリガ埋め込みを安定化する。
論文 参考訳(メタデータ) (2026-02-19T08:31:16Z) - Le Cam Distortion: A Decision-Theoretic Framework for Robust Transfer Learning [0.0]
模擬性に基づく移動リスク条件の厳密な上限としてLe Cam Distortionを導入する。
我々のフレームワークは、ソースからターゲットをシミュレートするカーネルを学習することで、ソースの劣化なしに転送を可能にする。
Le Cam Distortionは、負の転送が受け入れられないドメインにおいて、リスク制御された転送学習のための最初の原則化されたフレームワークを提供する。
論文 参考訳(メタデータ) (2025-12-29T17:21:44Z) - CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification [65.46685389276443]
画像とテキストプロンプトをマッチングすることでゼロショット分類を行うことができる、視覚言語で事前訓練されたエンコーダモデルであるCLIPについて検討する。
次に, 共分散精製プロセス間のKL分散として精製リスクを定式化する。
画像の潜伏ベクトルの確率をモデル化するCLI-Diffと、画像の埋め込みとaの写真とのコサイン類似度をモデル化するCLI-Cosの2つのバリエーションを提案する。
論文 参考訳(メタデータ) (2025-02-25T13:09:34Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - Certified PEFTSmoothing: Parameter-Efficient Fine-Tuning with Randomized Smoothing [6.86204821852287]
ランダム化平滑化は,l2-ノルムの対向摂動に対して,ディープラーニングモデルの頑健性にアクセスするための主要な確証付き頑健性手法である。
広く採用されることを制限する顕著な制約は、ベースモデルをスクラッチからリトレーニングし、堅牢なバージョンを得る必要があることである。
これは、ベースモデルがノイズの増大したデータ分布を学習し、正確な投票を行うのに失敗するためである。
近年の大規模モデルトレーニングに触発されて,ベースモデルに適応して雑音付加データを学ぶために,PEFTSmoothingという別の手法を提案する。
論文 参考訳(メタデータ) (2024-04-08T09:38:22Z) - (Certified!!) Adversarial Robustness for Free! [116.6052628829344]
逆方向の摂動が0.5の2ノルム以内であることに制約された場合,ImageNetでは71%の精度が証明された。
これらの結果は,モデルパラメータの微調整や再学習を必要とせず,事前学習した拡散モデルと画像分類器のみを用いて得られる。
論文 参考訳(メタデータ) (2022-06-21T17:27:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。