論文の概要: Mamba Capsule Routing Towards Part-Whole Relational Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2410.03987v1
- Date: Sat, 5 Oct 2024 00:20:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-02 14:50:11.571563
- Title: Mamba Capsule Routing Towards Part-Whole Relational Camouflaged Object Detection
- Title(参考訳): 部分ホールリレーショナルカモフラージュ物体検出に向けたマンバカプセルルーティング
- Authors: Dingwen Zhang, Liangbo Cheng, Yi Liu, Xinggang Wang, Junwei Han,
- Abstract要約: タイプレベルでの新しいマンバカプセルルーティングを提案する。
これらのタイプのマンバカプセルは、高層マンバカプセルを得るためにEMルーティングアルゴリズムに供給される。
さらに, 画素レベルのカプセルの特徴を回収し, さらなるキャモフラージュ予測を行うために, 低層レベルのカプセルを用いてこれを実現する。
- 参考スコア(独自算出の注目度): 98.6460229237143
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The part-whole relational property endowed by Capsule Networks (CapsNets) has been known successful for camouflaged object detection due to its segmentation integrity. However, the previous Expectation Maximization (EM) capsule routing algorithm with heavy computation and large parameters obstructs this trend. The primary attribution behind lies in the pixel-level capsule routing. Alternatively, in this paper, we propose a novel mamba capsule routing at the type level. Specifically, we first extract the implicit latent state in mamba as capsule vectors, which abstract type-level capsules from pixel-level versions. These type-level mamba capsules are fed into the EM routing algorithm to get the high-layer mamba capsules, which greatly reduce the computation and parameters caused by the pixel-level capsule routing for part-whole relationships exploration. On top of that, to retrieve the pixel-level capsule features for further camouflaged prediction, we achieve this on the basis of the low-layer pixel-level capsules with the guidance of the correlations from adjacent-layer type-level mamba capsules. Extensive experiments on three widely used COD benchmark datasets demonstrate that our method significantly outperforms state-of-the-arts. Code has been available on https://github.com/Liangbo-Cheng/mamba\_capsule.
- Abstract(参考訳): Capsule Networks (CapsNets) によって与えられる部分完全リレーショナル特性は、セグメンテーションの整合性のため、擬似オブジェクト検出に成功している。
しかし、重い計算と大きなパラメータを持つ以前の期待最大化(EM)カプセルルーティングアルゴリズムは、この傾向を妨げている。
主な属性は、ピクセルレベルのカプセルルーティングにある。
また,本論文では,タイプレベルでの新しいマンバカプセルルーティングを提案する。
具体的には,まず,マンバの暗黙の潜伏状態をカプセルベクターとして抽出する。
これらのタイプのマンバカプセルはEMルーティングアルゴリズムに供給され、高層マンバカプセルを得る。
さらに, 隣接層型マンバカプセルから相関関係を導出して, 低層型カプセルを用いて, さらなるキャモフラージュ予測のために, 画素レベルのカプセルの特徴を回収する。
広く使われている3つのCODベンチマークデータセットに対する大規模な実験により、我々の手法は最先端の手法よりも大幅に優れていることが示された。
コードはhttps://github.com/Liangbo-Cheng/mamba\_capsuleで公開されている。
関連論文リスト
- Hierarchical Object-Centric Learning with Capsule Networks [0.0]
畳み込みニューラルネットワークの制限に対処するために、カプセルネットワーク(CapsNets)が導入された。
この論文はCapsNetsの興味深い側面を調査し、その潜在能力を解き放つための3つの重要な疑問に焦点を当てている。
論文 参考訳(メタデータ) (2024-05-30T09:10:33Z) - Deep multi-prototype capsule networks [0.3823356975862005]
カプセルネットワーク(Capsule Network)は、画像の部分を特定し、階層的に全体のインスタンス化パラメータを形成するニューラルネットワークの一種である。
本稿では,画像部品のバリエーションを表現するためにカプセルネットワークを誘導するマルチプロトタイプアーキテクチャを提案する。
MNIST, SVHN, C-Cube, CEDAR, MCYT, UTSigのデータセットに対する実験結果から, 提案したモデルが画像分類精度で他のモデルよりも優れていることが明らかになった。
論文 参考訳(メタデータ) (2024-04-23T18:37:37Z) - HP-Capsule: Unsupervised Face Part Discovery by Hierarchical Parsing
Capsule Network [76.92310948325847]
教師なしの顔部分発見のための階層型パーシングカプセルネットワーク(HP-Capsule Network)を提案する。
HP-Capsuleは、数字から人間の顔へのカプセルネットワークの適用を拡張し、ニューラルネットワークが人間の介入なしにオブジェクトを理解する方法を示す。
論文 参考訳(メタデータ) (2022-03-21T01:39:41Z) - Capsule networks with non-iterative cluster routing [2.8935588665357077]
既存の手順では、カプセルは次の層のカプセルの予測(最終投票)を生成する。
提案したクラスタルーティングでは、カプセルは次の層カプセルの個々の投票ではなく、投票クラスタを生成する。
提案したカプセルネットワークは、より少ないパラメータでFashion-MNISTとSVHNデータセット上で最高の精度を達成する。
論文 参考訳(メタデータ) (2021-09-19T20:14:22Z) - ASPCNet: A Deep Adaptive Spatial Pattern Capsule Network for
Hyperspectral Image Classification [47.541691093680406]
本稿では,適応型空間パターンカプセルネットワーク(ASPCNet)アーキテクチャを提案する。
拡大された受容体に基づいて畳み込み核のサンプリング位置を回転させることができる。
3つの公開データセットの実験は、ASPCNetが最先端の方法よりも高い精度で競争力を発揮することを示しています。
論文 参考訳(メタデータ) (2021-04-25T07:10:55Z) - Deformable Capsules for Object Detection [3.702343116848637]
我々は,コンピュータビジョンにおいて重要な問題である物体検出に対処するために,新しいカプセルネットワーク,変形可能なカプセル(textitDeformCaps)を導入した。
提案手法は,本論文において,オブジェクト検出のためのカプセルネットワークを構築するために,効率よくスケールアップできることを実証する。
論文 参考訳(メタデータ) (2021-04-11T15:36:30Z) - Layer-adaptive sparsity for the Magnitude-based Pruning [88.37510230946478]
本稿では,LAMP(Layer-Adaptive magnitude-based pruning)スコアを用いたグローバルプルーニングの新たな重要点を提案する。
LAMPは、階層的な空間選択のための一般的なスキームを一貫して上回っている。
論文 参考訳(メタデータ) (2020-10-15T09:14:02Z) - Capsule-Transformer for Neural Machine Translation [73.84254045203222]
トランスフォーマーはマルチヘッド自己注意ネットワーク(SAN)の鍵設計から大きな恩恵を受ける
より一般的なカプセルルーティングアルゴリズムに線形変換を拡張するカプセル変換器を提案する。
広く使われている機械翻訳データセットの実験結果から,提案したカプセルトランスフォーマーは強力なトランスフォーマーベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2020-04-30T09:11:38Z) - Subspace Capsule Network [85.69796543499021]
SubSpace Capsule Network (SCN) はカプセルネットワークのアイデアを利用して、エンティティの外観や暗黙的に定義された特性のバリエーションをモデル化する。
SCNは、テスト期間中にCNNと比較して計算オーバーヘッドを発生させることなく、識別モデルと生成モデルの両方に適用することができる。
論文 参考訳(メタデータ) (2020-02-07T17:51:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。