論文の概要: Investigating Location-Regularised Self-Supervised Feature Learning for Seafloor Visual Imagery
- arxiv url: http://arxiv.org/abs/2509.06660v1
- Date: Mon, 08 Sep 2025 13:19:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.148358
- Title: Investigating Location-Regularised Self-Supervised Feature Learning for Seafloor Visual Imagery
- Title(参考訳): 海底画像のための位置調整型自己監督型特徴学習の検討
- Authors: Cailei Liang, Adrian Bodenmann, Emma J Curtis, Samuel Simmons, Kazunori Nagano, Stan Brown, Adam Riese, Blair Thornton,
- Abstract要約: 本研究では、位置ベース正規化が6つの最先端特徴学習フレームワークに与える影響を評価する。
ロケーションレギュラー化は標準SSLよりもダウンストリームの分類性能を一貫して向上させる。
この発見はSSL正規化のための位置情報メタデータの価値を強調している。
- 参考スコア(独自算出の注目度): 0.374750127323442
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-throughput interpretation of robotically gathered seafloor visual imagery can increase the efficiency of marine monitoring and exploration. Although recent research has suggested that location metadata can enhance self-supervised feature learning (SSL), its benefits across different SSL strategies, models and seafloor image datasets are underexplored. This study evaluates the impact of location-based regularisation on six state-of-the-art SSL frameworks, which include Convolutional Neural Network (CNN) and Vision Transformer (ViT) models with varying latent-space dimensionality. Evaluation across three diverse seafloor image datasets finds that location-regularisation consistently improves downstream classification performance over standard SSL, with average F1-score gains of $4.9 \pm 4.0%$ for CNNs and $6.3 \pm 8.9%$ for ViTs, respectively. While CNNs pretrained on generic datasets benefit from high-dimensional latent representations, dataset-optimised SSL achieves similar performance across the high (512) and low (128) dimensional latent representations. Location-regularised SSL improves CNN performance over pre-trained models by $2.7 \pm 2.7%$ and $10.1 \pm 9.4%$ for high and low-dimensional latent representations, respectively. For ViTs, high-dimensionality benefits both pre-trained and dataset-optimised SSL. Although location-regularisation improves SSL performance compared to standard SSL methods, pre-trained ViTs show strong generalisation, matching the best-performing location-regularised SSL with F1-scores of $0.795 \pm 0.075$ and $0.795 \pm 0.077$, respectively. The findings highlight the value of location metadata for SSL regularisation, particularly when using low-dimensional latent representations, and demonstrate strong generalisation of high-dimensional ViTs for seafloor image analysis.
- Abstract(参考訳): ロボットが収集した海底画像の高スループット解釈は、海洋モニタリングと探査の効率を高めることができる。
近年の研究では、ロケーションメタデータが自己教師付き機能学習(SSL)を強化することが示唆されているが、SSL戦略やモデル、海底画像データセットなど、さまざまなSSL戦略のメリットが過小評価されている。
本研究では,CNN(Convolutional Neural Network)とViT(Vision Transformer)モデルを含む6つの最先端SSLフレームワークに対する位置ベース正規化の影響を評価する。
3つの多様な海底画像データセットによる評価によると、位置規則化は標準SSLよりも下流の分類性能を一貫して改善し、平均的なF1スコアはCNNでは4.9 \pm 4.0%、ViTでは6.3 \pm 8.9%である。
汎用データセットで事前トレーニングされたCNNは高次元潜在表現の恩恵を受けるが、データセット最適化SSLは高(512)および低(128)次元潜在表現にまたがる同様のパフォーマンスを実現する。
位置調整されたSSLは、それぞれ高次元および低次元の潜在表現に対して2.7 pm 2.7%$と10.1 pm 9.4%$のCNN性能を改善する。
ViTにとって、高次元性はトレーニング済みとデータセット最適化SSLの両方にメリットがある。
ロケーションレギュラー化はSSLのパフォーマンスを標準のSSLメソッドと比べて改善するが、事前訓練されたViTは、最高のパフォーマンスのロケーションレギュラー化SSLと、それぞれ0.795 \pm 0.075$と0.795 \pm 0.077$のF1スコアをマッチングして、強力な一般化を示す。
その結果,低次元の潜伏表現を用いた場合,SSL正則化における位置メタデータの価値が強調され,海底画像解析のための高次元ViTの強力な一般化が示されている。
関連論文リスト
- Interpretable Zero-Shot Learning with Locally-Aligned Vision-Language Model [56.573203512455706]
大規模視覚言語モデル(VLM)は、大規模視覚テキストペアデータセットを活用することでゼロショット学習(ZSL)において顕著な成功を収めた。
この問題に対処する1つのアプローチは、言語を統合することで解釈可能なモデルを開発することである。
本稿では,ZSLを解釈可能な言語モデルであるLaZSLを提案する。
論文 参考訳(メタデータ) (2025-06-30T13:14:46Z) - A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.35500308126506]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文 参考訳(メタデータ) (2024-07-16T23:17:36Z) - FLSL: Feature-level Self-supervised Learning [11.072406865310365]
FLSL(Feature-Level Self-supervised Learning)と呼ばれる2段階の特徴クラスタリングSSL法を提案する。
FLSLは目覚しいセマンティッククラスタ表現を促進し,ビュー内およびビュー間特徴クラスタリングに適した埋め込みスキームを学習する。
実験により、FLSLは密度予測タスクにおいて大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-06-09T19:10:51Z) - Leveraging the Third Dimension in Contrastive Learning [88.17394309208925]
SSL(Self-Supervised Learning)メソッドは、ラベルのないデータでダウンストリームタスクに有用な堅牢な表現を学習する。
これらの拡張は、生物学的ビジョンが没入的な3次元、時間的に連続した環境で起こるという事実を無視している。
SSLフレームワークにディープシグナルを組み込むための2つの異なるアプローチについて検討する。
論文 参考訳(メタデータ) (2023-01-27T15:45:03Z) - Elastic Weight Consolidation Improves the Robustness of Self-Supervised
Learning Methods under Transfer [4.2141621237414615]
自己教師付き表現学習(SSL)手法は、下流タスクの微調整に有効なラベルなし初期条件を提供する。
我々はベイジアン連続学習のレンズの下でSSLの微調整を再解釈し、Elastic Weight Consolidation (EWC)フレームワークによる正規化を検討する。
初期SSLバックボーンに対する自己正規化は、ウォーターバードの最低サブグループ性能を5%改善し、Celeb-Aを2%向上させることを示した。
論文 参考訳(メタデータ) (2022-10-28T19:00:25Z) - Measuring Self-Supervised Representation Quality for Downstream
Classification using Discriminative Features [56.89813105411331]
我々は,SimCLR,SwaV,MoCo,BYOL,DINO,SimSiam,VICReg,Barlow Twinsといった最先端の自己教師型モデルの表現空間について検討した。
本稿では,標本が誤分類される可能性を確実に予測できる教師なしスコアである自己監督表現品質スコア(Qスコア)を提案する。
Q-Score正規化による微調整により、SSLモデルの線形探索精度はImageNet-100で5.8%、ImageNet-1Kで3.7%向上する。
論文 参考訳(メタデータ) (2022-03-03T17:48:23Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。