論文の概要: Enhancing kelp forest detection in remote sensing images using crowdsourced labels with Mixed Vision Transformers and ConvNeXt segmentation models
- arxiv url: http://arxiv.org/abs/2501.14001v1
- Date: Thu, 23 Jan 2025 12:12:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-27 14:58:49.204449
- Title: Enhancing kelp forest detection in remote sensing images using crowdsourced labels with Mixed Vision Transformers and ConvNeXt segmentation models
- Title(参考訳): Mixed Vision TransformersとConvNeXtセグメンテーションモデルを用いたクラウドソースラベルを用いたリモートセンシング画像におけるケルプ森林検出の促進
- Authors: Ioannis Nasios,
- Abstract要約: 本研究では,クラウドソースラベルと高度な人工知能モデルを統合することにより,高速かつ高精度なケルプキャノピー検出パイプラインを開発する。
この手法は高い検出率を達成し、ケルプキャノピーを含む4ピクセル中3ピクセルを正確に同定した。
この研究は、機械学習モデルとクラウドソーシングデータを組み合わせることで、効果的でスケーラブルな環境モニタリングを可能にする可能性をも示している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Kelp forests, as foundation species, are vital to marine ecosystems, providing essential food and habitat for numerous organisms. This study explores the integration of crowdsourced labels with advanced artificial intelligence models to develop a fast and accurate kelp canopy detection pipeline using Landsat images. Building on the success of a machine learning competition, where this approach ranked third and performed consistently well on both local validation and public and private leaderboards, the research highlights the effectiveness of combining Mixed Vision Transformers (MIT) with ConvNeXt models. Training these models on various image sizes significantly enhanced the accuracy of the ensemble results. U-Net emerged as the best segmentation architecture, with UpperNet also contributing to the final ensemble. Key Landsat bands, such as ShortWave InfraRed (SWIR1) and Near-InfraRed (NIR), were crucial while altitude data was used in postprocessing to eliminate false positives on land. The methodology achieved a high detection rate, accurately identifying about three out of four pixels containing kelp canopy while keeping false positives low. Despite the medium resolution of Landsat satellites, their extensive historical coverage makes them effective for studying kelp forests. This work also underscores the potential of combining machine learning models with crowdsourced data for effective and scalable environmental monitoring. All running code for training all models and inference can be found at https://github.com/IoannisNasios/Kelp_Forests.
- Abstract(参考訳): ケルプ林は海洋生態系にとって不可欠であり、多くの生物にとって必須の食料と生息地となっている。
本研究では,クラウドソースラベルと高度な人工知能モデルを統合することにより,ランドサット画像を用いた高速かつ正確なケルプキャノピー検出パイプラインを開発する。
機械学習コンペの成功に基づいて、このアプローチは3位にランクされ、ローカルバリデーションとパブリックとプライベートの両方のリーダボードで一貫して順調に機能する。この研究は、Mixed Vision Transformer(MIT)とConvNeXtモデルを組み合わせる効果を強調している。
これらのモデルを様々な画像サイズで訓練することで、アンサンブル結果の精度が大幅に向上した。
U-Netは最高のセグメンテーションアーキテクチャとして登場し、アッパーネットは最終的なアンサンブルにも貢献した。
ShortWave Infra Red (SWIR1) や Near-Infra Red (NIR) といったランドサットの重要なバンドは、陸上での偽陽性を除去するために、後処理に高度データを使用した。
この手法は高い検出率を達成し、偽陽性率を低く保ちながら、ケルプ天蓋を含む4画素中3ピクセルを正確に同定した。
ランドサット衛星の中程度の解像度にもかかわらず、その広範な歴史的範囲はケルプ林の研究に有効である。
この研究は、機械学習モデルとクラウドソーシングデータを組み合わせることで、効果的でスケーラブルな環境モニタリングを可能にする可能性をも示している。
すべてのモデルと推論をトレーニングするためのすべての実行コードは、https://github.com/IoannisNasios/Kelp_Forestsで見ることができる。
関連論文リスト
- Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。
CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文 参考訳(メタデータ) (2024-07-29T18:00:10Z) - Evaluation of Deep Learning Semantic Segmentation for Land Cover Mapping on Multispectral, Hyperspectral and High Spatial Aerial Imagery [0.0]
気候変動の台頭で、土地被覆マッピングは環境モニタリングにおいて緊急に必要となってきた。
本研究では,Unet,Linknet,FPN,PSPnetなどのセマンティックセグメンテーション手法を用いて植生や水などの分類を行った。
LinkNetモデルは、すべてのデータセットで0.92の精度でIoUで取得した。
論文 参考訳(メタデータ) (2024-06-20T11:40:12Z) - Deep-Learning Framework for Optimal Selection of Soil Sampling Sites [0.0]
この研究は、画像処理におけるディープラーニングの最近の進歩を活用して、フィールドの重要な特性を示す最適な位置を見つける。
本フレームワークは,自己保持機構をバックボーンとするエンコーダデコーダアーキテクチャで構築されている。
このモデルはテストデータセットにおいて、平均精度99.52%、IoU平均インターセクション57.35%、Dice Coefficient平均71.47%という驚くべき結果を得た。
論文 参考訳(メタデータ) (2023-09-02T16:19:21Z) - SepHRNet: Generating High-Resolution Crop Maps from Remote Sensing
imagery using HRNet with Separable Convolution [3.717258819781834]
本稿では、HRNetと分離可能な畳み込み層を統合し、空間的パターンをキャプチャし、データの時間的パターンをキャプチャする、新たなDeep Learningアプローチを提案する。
提案アルゴリズムは、作物マップの生成において、97.5%の分類精度と55.2%のIoUを高い分類精度で達成する。
論文 参考訳(メタデータ) (2023-07-11T18:07:25Z) - Classification of Single Tree Decay Stages from Combined Airborne LiDAR
Data and CIR Imagery [1.4589991363650008]
この研究は、初めて、個々の木(ノルウェー・スプルース)を5つの崩壊段階に自動的に分類した。
3つの異なる機械学習手法 - 3Dポイントクラウドベースのディープラーニング(KPConv)、畳み込みニューラルネットワーク(CNN)、ランダムフォレスト(RF)。
KPConv、CNN、RFの合計精度は88.8%、88.4%、85.9%に達した。
論文 参考訳(メタデータ) (2023-01-04T22:20:16Z) - Triggering Failures: Out-Of-Distribution detection by learning from
local adversarial attacks in Semantic Segmentation [76.2621758731288]
セグメンテーションにおけるアウト・オブ・ディストリビューション(OOD)オブジェクトの検出に取り組む。
私たちの主な貢献は、ObsNetと呼ばれる新しいOOD検出アーキテクチャであり、ローカル・アタック(LAA)に基づく専用トレーニングスキームと関連付けられています。
3つの異なるデータセットの文献の最近の10つの手法と比較して,速度と精度の両面で最高の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-08-03T17:09:56Z) - Efficient Self-supervised Vision Transformers for Representation
Learning [86.57557009109411]
疎密な自己意識を持つマルチステージアーキテクチャは、モデリングの複雑さを著しく低減できることを示す。
そこで本研究では,モデルがよりきめ細かな領域依存を捕捉できるような,領域マッチングの事前学習タスクを提案する。
この2つの手法を組み合わせることで,ImageNet線形プローブ評価において,EsViTは81.3%のトップ1を達成した。
論文 参考訳(メタデータ) (2021-06-17T19:57:33Z) - Instance segmentation of fallen trees in aerial color infrared imagery
using active multi-contour evolution with fully convolutional network-based
intensity priors [0.5276232626689566]
画像のセグメンテーションマップ上での複数のアクティブな輪郭進化により、共通オブジェクトクラスのインスタンスをセグメンテーションするフレームワークを導入する。
高分解能空中多スペクトル画像から個々の落下茎を分割する文脈で提案されたフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2021-05-05T11:54:05Z) - GANav: Group-wise Attention Network for Classifying Navigable Regions in
Unstructured Outdoor Environments [54.21959527308051]
本稿では,RGB画像から,オフロード地形および非構造環境における安全かつ航行可能な領域を識別する新しい学習手法を提案する。
本手法は,粒度の粗いセマンティックセグメンテーションを用いて,そのナビビリティレベルに基づいて地形分類群を分類する。
RUGD と RELLIS-3D のデータセットを広範囲に評価することにより,我々の学習アルゴリズムがナビゲーションのためのオフロード地形における視覚知覚の精度を向上させることを示す。
論文 参考訳(メタデータ) (2021-03-07T02:16:24Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。