論文の概要: Deformable Capsules for Object Detection
- arxiv url: http://arxiv.org/abs/2104.05031v1
- Date: Sun, 11 Apr 2021 15:36:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-14 08:20:49.107517
- Title: Deformable Capsules for Object Detection
- Title(参考訳): 物体検出用変形可能なカプセル
- Authors: Rodney Lalonde, Naji Khosravan, Ulas Bagci
- Abstract要約: 変形可能なカプセル(DeformCaps)、新しいカプセル構造(SplitCaps)、および計算効率と多数のオブジェクトやクラスのモデリングの必要性のバランスをとるための新しい動的ルーティングアルゴリズム(SE-Routing)を紹介します。
提案アーキテクチャは1段階検出フレームワークであり,最先端の1段階CNN手法と同等のMS COCOについて結果を得る。
- 参考スコア(独自算出の注目度): 5.819237403145079
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Capsule networks promise significant benefits over convolutional networks by
storing stronger internal representations, and routing information based on the
agreement between intermediate representations' projections. Despite this,
their success has been mostly limited to small-scale classification datasets
due to their computationally expensive nature. Recent studies have partially
overcome this burden by locally-constraining the dynamic routing of features
with convolutional capsules. Though memory efficient, convolutional capsules
impose geometric constraints which fundamentally limit the ability of capsules
to model the pose/deformation of objects. Further, they do not address the
bigger memory concern of class-capsules scaling-up to bigger tasks such as
detection or large-scale classification. In this study, we introduce deformable
capsules (DeformCaps), a new capsule structure (SplitCaps), and a novel dynamic
routing algorithm (SE-Routing) to balance computational efficiency with the
need for modeling a large number of objects and classes. We demonstrate that
the proposed methods allow capsules to efficiently scale-up to large-scale
computer vision tasks for the first time, and create the first-ever capsule
network for object detection in the literature. Our proposed architecture is a
one-stage detection framework and obtains results on MS COCO which are on-par
with state-of-the-art one-stage CNN-based methods, while producing fewer false
positive detections.
- Abstract(参考訳): カプセルネットワークは、より強固な内部表現を格納し、中間表現の射影間の合意に基づくルーティング情報を格納することで、畳み込みネットワークよりも大きな利点を約束する。
しかし、その成功は計算的に高価な性質のため、小規模の分類データセットに限られている。
近年の研究では、畳み込みカプセルによる特徴の動的ルーティングを局所的に制限することで、この負担を部分的に克服している。
記憶効率は良いが、畳み込みカプセルは幾何学的な制約を課し、カプセルが物体のポーズや変形をモデル化する能力を制限する。
さらに、検出や大規模分類のようなより大きなタスクにスケールアップするクラスカプセルのより大きなメモリ上の懸念にも対処しない。
本研究では,変形可能なカプセル (deformcaps) と新しいカプセル構造 (splitcaps) と新しい動的ルーティングアルゴリズム (se-routing) を導入した。
提案手法により、カプセルを大規模コンピュータビジョンタスクに効率よくスケールアップし、文献におけるオブジェクト検出のための初のカプセルネットワークを構築することができる。
提案アーキテクチャは1段階検出フレームワークであり,最先端の1段階CNN手法と同等であり,偽陽性検出の少ないMS COCOで結果を得る。
関連論文リスト
- A Fresh Take on Stale Embeddings: Improving Dense Retriever Training with Corrector Networks [81.2624272756733]
密集検索では、ディープエンコーダは入力とターゲットの両方に埋め込みを提供する。
我々は、古いキャッシュされたターゲット埋め込みを調整できる小さなパラメトリック補正ネットワークを訓練する。
私たちのアプローチは、トレーニング中にターゲット埋め込み更新が行われなくても、最先端の結果と一致します。
論文 参考訳(メタデータ) (2024-09-03T13:29:13Z) - Hierarchical Object-Centric Learning with Capsule Networks [0.0]
畳み込みニューラルネットワークの制限に対処するために、カプセルネットワーク(CapsNets)が導入された。
この論文はCapsNetsの興味深い側面を調査し、その潜在能力を解き放つための3つの重要な疑問に焦点を当てている。
論文 参考訳(メタデータ) (2024-05-30T09:10:33Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Affordance detection with Dynamic-Tree Capsule Networks [5.847547503155588]
視覚入力からの精度検出は、自律的なロボット操作の基本的なステップである。
疎3次元点雲のための動的木構造カプセルをベースとした第1次空隙検出ネットワークを提案する。
このアルゴリズムは、未確認物体の把握に直面する場合、現在の空き検出方法よりも優れている。
論文 参考訳(メタデータ) (2022-11-09T21:14:08Z) - Hybrid Gromov-Wasserstein Embedding for Capsule Learning [24.520120182880333]
Capsule Network (CapsNets) は、オブジェクト、部品、およびそれらの関係を2段階のプロセスで解析することを目的としている。
階層的関係モデリングは計算コストが高く、潜在的な利点にもかかわらずCapsNetの利用が制限されている。
本稿では,標準ベースラインモデルを超え,高性能な畳み込みモデルよりも優れた性能を示すカプセルの学習手法を提案する。
論文 参考訳(メタデータ) (2022-09-01T05:26:32Z) - Towards Efficient Capsule Networks [7.1577508803778045]
カプセルネットワークはモデルの説明可能性を高めるために導入され、各カプセルはオブジェクトまたはその部分の明示的な表現である。
本稿では,Capsule Network を用いたプルーニングが,メモリ要件の低減,計算作業,推論とトレーニング時間といった高度な一般化を実現する方法を示す。
論文 参考訳(メタデータ) (2022-08-19T08:03:25Z) - Learning with Capsules: A Survey [73.31150426300198]
カプセルネットワークは、オブジェクト中心の表現を学習するための畳み込みニューラルネットワーク(CNN)に代わるアプローチとして提案された。
CNNとは異なり、カプセルネットワークは部分的に階層的な関係を明示的にモデル化するように設計されている。
論文 参考訳(メタデータ) (2022-06-06T15:05:36Z) - Efficient-CapsNet: Capsule Network with Self-Attention Routing [0.0]
深層畳み込みニューラルネットワークは、オブジェクト変換を埋め込むために、多数の機能マップを持つデータ拡張技術とレイヤを広範囲に活用する。
カプセルネットワークは、現在の畳み込みネットワークを拡張し、より効率的に全てのアフィン変換をエンコードするプロセスで人工的な視覚知覚を実現する、有望なソリューションである。
本稿では,カプセルネットワークの効率について検討し,その容量を160Kのパラメータをほとんど持たない極端なアーキテクチャで限界まで押し上げることにより,提案アーキテクチャがまだ最先端の結果が得られることを実証する。
論文 参考訳(メタデータ) (2021-01-29T09:56:44Z) - Wasserstein Routed Capsule Networks [90.16542156512405]
複雑なタスクに対処できる新しいパラメータ効率の良いカプセルアーキテクチャを提案する。
我々のネットワークはCIFAR-10で他のカプセルのアプローチを1.2%以上上回ります。
論文 参考訳(メタデータ) (2020-07-22T14:38:05Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Subspace Capsule Network [85.69796543499021]
SubSpace Capsule Network (SCN) はカプセルネットワークのアイデアを利用して、エンティティの外観や暗黙的に定義された特性のバリエーションをモデル化する。
SCNは、テスト期間中にCNNと比較して計算オーバーヘッドを発生させることなく、識別モデルと生成モデルの両方に適用することができる。
論文 参考訳(メタデータ) (2020-02-07T17:51:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。