論文の概要: EDMB: Edge Detector with Mamba
- arxiv url: http://arxiv.org/abs/2501.04846v1
- Date: Wed, 08 Jan 2025 21:15:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-10 13:59:20.073884
- Title: EDMB: Edge Detector with Mamba
- Title(参考訳): EDMB:Mambaを使ったエッジ検出器
- Authors: Yachuan Li, Xavier Soria Poma, Yun Bai, Qian Xiao, Chaozhi Yang, Guanlin Li, Zongmin Li,
- Abstract要約: Vision Mambaは、長距離依存関係を効率的にキャプチャする優れた能力を示している。
EDMBと呼ばれる新しいエッジ検出器を提案し,高品質な多粒度エッジを効率よく生成する。
- 参考スコア(独自算出の注目度): 3.4599809312684684
- License:
- Abstract: Transformer-based models have made significant progress in edge detection, but their high computational cost is prohibitive. Recently, vision Mamba have shown excellent ability in efficiently capturing long-range dependencies. Drawing inspiration from this, we propose a novel edge detector with Mamba, termed EDMB, to efficiently generate high-quality multi-granularity edges. In EDMB, Mamba is combined with a global-local architecture, therefore it can focus on both global information and fine-grained cues. The fine-grained cues play a crucial role in edge detection, but are usually ignored by ordinary Mamba. We design a novel decoder to construct learnable Gaussian distributions by fusing global features and fine-grained features. And the multi-grained edges are generated by sampling from the distributions. In order to make multi-granularity edges applicable to single-label data, we introduce Evidence Lower Bound loss to supervise the learning of the distributions. On the multi-label dataset BSDS500, our proposed EDMB achieves competitive single-granularity ODS 0.837 and multi-granularity ODS 0.851 without multi-scale test or extra PASCAL-VOC data. Remarkably, EDMB can be extended to single-label datasets such as NYUDv2 and BIPED. The source code is available at https://github.com/Li-yachuan/EDMB.
- Abstract(参考訳): トランスフォーマーベースのモデルではエッジ検出が大幅に進歩しているが、高い計算コストは禁じられている。
近年、ビジョン・マンバは長距離依存関係を効率的にキャプチャする優れた能力を示している。
そこで我々は, EDMBと呼ばれる新しいエッジ検出器を提案し, 高品質な多粒性エッジを効率よく生成する。
EDMBでは、Mambaはグローバルなローカルアーキテクチャと組み合わせて、グローバルな情報ときめ細かいキューの両方にフォーカスすることができる。
きめ細かいキューはエッジ検出において重要な役割を果たすが、通常、通常のマンバでは無視される。
グローバルな特徴ときめ細かい特徴を融合させて学習可能なガウス分布を構築するための新しいデコーダを設計する。
そして、分布からサンプリングすることで、多粒度エッジを生成する。
単一ラベルデータに適用可能な多粒度エッジを実現するために,分布の学習を監督するために,エビデンス・ロー・バウンド・ロスを導入する。
マルチラベルデータセットBSDS500では,マルチスケールテストや余分なPASCAL-VOCデータなしで,競合する単一粒度 ODS 0.837 と多粒度 ODS 0.851 を実現する。
注目すべきは、EDMBをNYUDv2やBIPEDのようなシングルラベルのデータセットに拡張できることだ。
ソースコードはhttps://github.com/Li-yachuan/EDMBで入手できる。
関連論文リスト
- MINIMA: Modality Invariant Image Matching [52.505282811925454]
複数のクロスモーダルケースを対象とした統合画像マッチングフレームワークであるMINIMAを提案する。
生成モデルを用いて、安価だがリッチなRGBのみのマッチングデータからモダリティをスケールアップする。
MD-synでは、任意の高度なマッチングパイプラインをランダムに選択したモダリティペアで直接訓練して、クロスモーダル能力を得ることができる。
論文 参考訳(メタデータ) (2024-12-27T02:39:50Z) - SAUGE: Taming SAM for Uncertainty-Aligned Multi-Granularity Edge Detection [8.651908243317301]
我々は,セグメンテーションモデル(SAM)が,エッジラベルの不確実性をモデル化するための事前知識を提供することを明らかにした。
本モデルは,クロスデータセットエッジ検出のための強力な一般化性を示す。
論文 参考訳(メタデータ) (2024-12-17T13:18:41Z) - DBA-Fusion: Tightly Integrating Deep Dense Visual Bundle Adjustment with Multiple Sensors for Large-Scale Localization and Mapping [3.5047603107971397]
トレーニング可能な高密度バンドル調整(DBA)を因子グラフを通じて多センサ情報と密に統合する。
視覚-慣性統合のためのパイプラインが最初に開発され、メカニカルスケールのローカライゼーションとマッピングの最小限の能力を提供する。
その結果,大規模環境におけるリアルタイム高密度マッピングを実現する手法として,より優れたローカライゼーション性能が得られた。
論文 参考訳(メタデータ) (2024-03-20T16:20:54Z) - SuperEdge: Towards a Generalization Model for Self-Supervised Edge
Detection [2.912976132828368]
最先端のピクセルワイドアノテーションは労働集約的であり、手作業で取得すると矛盾する。
本稿では, マルチレベルのマルチホログラフィー技術を用いて, 合成データセットから実世界のデータセットへアノテーションを転送する, エッジ検出のための新しい自己教師型アプローチを提案する。
提案手法は,手動の注釈付きエッジラベルへの依存性を排除し,多様なデータセット間の一般化性を向上させる。
論文 参考訳(メタデータ) (2024-01-04T15:21:53Z) - Towards Automatic Power Battery Detection: New Challenge, Benchmark
Dataset and Baseline [70.30473488226093]
PBD(パワーバッテリ検出)と呼ばれる新しいタスクに関する総合的研究を行う。
X線画像から高密度陰極と陽極板のエンドポイントをローカライズし、電池の品質を評価することを目的としている。
我々は,多次元協調ネットワーク(MDCNet)と呼ばれるPBDのための新しいセグメンテーションベースソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-05T06:18:38Z) - KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection [48.66703222700795]
我々は、ラベルの取得に最も有用なポイントクラウドを特定するために、新しいカーネル戦略を利用する。
1段目(SECOND)と2段目(SECOND)の両方に対応するため、アノテーションに選択した境界ボックスの総数と検出性能のトレードオフをよく組み込んだ分類エントロピー接点を組み込んだ。
その結果,ボックスレベルのアノテーションのコストは約44%,計算時間は26%削減された。
論文 参考訳(メタデータ) (2023-07-16T04:27:03Z) - Shared Manifold Learning Using a Triplet Network for Multiple Sensor
Translation and Fusion with Missing Data [2.452410403088629]
コントラスト学習に基づくマルチモーダルアライメントネットワーク(CoMMANet)を提案する。
提案アーキテクチャでは,マルチモーダルな三重項オートエンコーダを用いて,各不均一なモジュラリティの同一クラスのサンプルが互いに近接してマッピングされるように潜在空間をクラスタリングする。
論文 参考訳(メタデータ) (2022-10-25T20:22:09Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - MGAE: Masked Autoencoders for Self-Supervised Learning on Graphs [55.66953093401889]
Masked Graph Autoencoder (MGAE) フレームワークは、グラフ構造データの効果的な学習を行う。
自己指導型学習から洞察を得て、私たちはランダムに大量のエッジを隠蔽し、トレーニング中に欠落したエッジを再構築しようとします。
論文 参考訳(メタデータ) (2022-01-07T16:48:07Z) - DRBANET: A Lightweight Dual-Resolution Network for Semantic Segmentation
with Boundary Auxiliary [15.729067807920236]
本稿では,境界情報を用いてセマンティックセグメンテーション結果を洗練することを目的とした,DRBANetと呼ばれる軽量なデュアルレゾリューションネットワークを提案する。
DRBANetは、高分解能分岐(HRB)と低分解能分岐(LRB)を含むデュアル並列アーキテクチャを採用している。
CityscapesとCamVidデータセットの実験により,セグメント化精度と実行効率との有望なトレードオフを実現することができた。
論文 参考訳(メタデータ) (2021-10-31T14:20:02Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。