論文の概要: Slender Object Scene Segmentation in Remote Sensing Image Based on Learnable Morphological Skeleton with Segment Anything Model
- arxiv url: http://arxiv.org/abs/2411.08592v1
- Date: Wed, 13 Nov 2024 13:19:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-14 16:11:07.778312
- Title: Slender Object Scene Segmentation in Remote Sensing Image Based on Learnable Morphological Skeleton with Segment Anything Model
- Title(参考訳): セグメンテーションモデルを用いた学習可能な形態素骨格に基づくリモートセンシング画像中の細い物体シーンセグメンテーション
- Authors: Jun Xie, Wenxiao Li, Faqiang Wang, Liqiang Zhang, Zhengyang Hou, Jun Liu,
- Abstract要約: 本稿では,学習可能な形態学スケルトンを深層ニューラルネットワークに組み込む新しい手法を提案する。
建物や道路を含むリモートセンシングデータセットの実験結果から,本手法が元のセグメンテーションモデルより優れていることが示された。
- 参考スコア(独自算出の注目度): 23.419029471215325
- License:
- Abstract: Morphological methods play a crucial role in remote sensing image processing, due to their ability to capture and preserve small structural details. However, most of the existing deep learning models for semantic segmentation are based on the encoder-decoder architecture including U-net and Segment Anything Model (SAM), where the downsampling process tends to discard fine details. In this paper, we propose a new approach that integrates learnable morphological skeleton prior into deep neural networks using the variational method. To address the difficulty in backpropagation in neural networks caused by the non-differentiability presented in classical morphological operations, we provide a smooth representation of the morphological skeleton and design a variational segmentation model integrating morphological skeleton prior by employing operator splitting and dual methods. Then, we integrate this model into the network architecture of SAM, which is achieved by adding a token to mask decoder and modifying the final sigmoid layer, ensuring the final segmentation results preserve the skeleton structure as much as possible. Experimental results on remote sensing datasets, including buildings and roads, demonstrate that our method outperforms the original SAM on slender object segmentation and exhibits better generalization capability.
- Abstract(参考訳): 形態学的手法は、小さな構造的詳細を捉え保存する能力のために、リモートセンシング画像処理において重要な役割を担っている。
しかし、セマンティックセグメンテーションのための既存のディープラーニングモデルは、U-netやSegment Anything Model (SAM)を含むエンコーダ・デコーダアーキテクチャに基づいている。
本稿では,学習可能な形態的骨格を,変分法を用いて深部ニューラルネットワークに組み込む新しい手法を提案する。
古典的な形態的操作で提示される非微分可能性に起因するニューラルネットワークのバックプロパゲーションの難しさを解決するために,形態的スケルトンを円滑に表現し,演算子分割と2重法を用いる前に形態的スケルトンを統合する変分モデルの設計を行う。
そして、このモデルをSAMのネットワークアーキテクチャに統合し、マスクデコーダにトークンを追加し、最終的なシグモイド層を修正し、最終的なセグメンテーション結果が可能な限り骨格構造を保存できるようにする。
建物や道路を含むリモートセンシングデータセットの実験結果から,本手法は細い物体のセグメンテーションにおいて元のSAMよりも優れ,より優れた一般化能力を示すことが示された。
関連論文リスト
- Fitting Skeletal Models via Graph-based Learning [3.059114987144684]
本稿では,グラフ畳み込みネットワークを活用して,高密度セグメンテーションマスクから骨格表現(s-reps)を生成する新しいスケルトン化手法を提案する。
本手法は, 人工海馬と実際の海馬のセグメンテーションの両方で評価され, 有望な結果と高速な推測が得られた。
論文 参考訳(メタデータ) (2024-09-09T03:50:41Z) - SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence
Pre-training [110.55093254677638]
我々はSkeleton Sequence Learning(SSL)という,効率的なスケルトンシーケンス学習フレームワークを提案する。
本論文では,SkeletonMAEという非対称なグラフベースのエンコーダデコーダ事前学習アーキテクチャを構築する。
我々のSSLは、さまざまなデータセットにまたがってうまく一般化し、最先端の自己教師型スケルトンベースのアクション認識手法よりも優れています。
論文 参考訳(メタデータ) (2023-07-17T13:33:11Z) - Interpretable Small Training Set Image Segmentation Network Originated
from Multi-Grid Variational Model [5.283735137946097]
深層学習法 (DL) が提案され, 画像分割に広く利用されている。
DLメソッドは通常、トレーニングデータとして大量の手動セグメントデータを必要とし、解釈性に乏しい。
本稿では,MSモデルにおける手作り正則項をデータ適応型一般化可学習正則項に置き換える。
論文 参考訳(メタデータ) (2023-06-25T02:34:34Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Adaptive Convolutional Dictionary Network for CT Metal Artifact
Reduction [62.691996239590125]
本稿では,金属人工物削減のための適応畳み込み辞書ネットワーク(ACDNet)を提案する。
我々のACDNetは、トレーニングデータを介して、アーティファクトフリーCT画像の事前を自動で学習し、入力されたCT画像ごとに表現カーネルを適応的に調整することができる。
本手法は,モデルに基づく手法の明確な解釈可能性を継承し,学習に基づく手法の強力な表現能力を維持する。
論文 参考訳(メタデータ) (2022-05-16T06:49:36Z) - End-to-end Neuron Instance Segmentation based on Weakly Supervised
Efficient UNet and Morphological Post-processing [0.0]
組織像からNeuN染色神経細胞を自動的に検出し,分画するエンド・ツー・エンド・エンド・エンド型のフレームワークを提案する。
私たちは最先端のネットワークであるEfficientNetをU-Netのようなアーキテクチャに統合します。
論文 参考訳(メタデータ) (2022-02-17T14:35:45Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - Unsupervised Learning Consensus Model for Dynamic Texture Videos
Segmentation [12.462608802359936]
動的テクスチャのセグメンテーションのための効果的な教師なし学習コンセンサスモデルを提案する。
提案モデルでは,分類対象画素の周辺部における再量子化局所2値パターン(LBP)ヒストグラムの値の集合を特徴として用いた。
挑戦的なSynthDBデータセットで実施された実験は、ULCMが大幅に高速で、コーディングが簡単で、単純で、パラメータが限られていることを示している。
論文 参考訳(メタデータ) (2020-06-29T16:40:59Z) - Skeleton-Aware Networks for Deep Motion Retargeting [83.65593033474384]
骨格間のデータ駆動動作のための新しいディープラーニングフレームワークを提案する。
我々の手法は、トレーニングセットの運動間の明確なペアリングを必要とせずに、再ターゲティングの仕方を学ぶ。
論文 参考訳(メタデータ) (2020-05-12T12:51:40Z) - Monocular Human Pose and Shape Reconstruction using Part Differentiable
Rendering [53.16864661460889]
近年の研究では、3次元基底真理によって教師されるディープニューラルネットワークを介してパラメトリックモデルを直接推定する回帰に基づく手法が成功している。
本稿では,ボディセグメンテーションを重要な監視対象として紹介する。
部分分割による再構成を改善するために,部分分割により部分ベースモデルを制御可能な部分レベル微分可能部を提案する。
論文 参考訳(メタデータ) (2020-03-24T14:25:46Z) - Segmentation and Recovery of Superquadric Models using Convolutional
Neural Networks [2.454342521577328]
畳み込みニューラルネットワーク(CNN)を中心に構築された(二段階)アプローチを提案する。
第1段階では,提案手法はMask RCNNモデルを用いて,深度シーンにおける超クワッドリックな構造を同定する。
我々は、少数の解釈可能なパラメータを持つ複雑な構造を記述することができる。
論文 参考訳(メタデータ) (2020-01-28T18:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。