論文の概要: Deformable Capsules for Object Detection
- arxiv url: http://arxiv.org/abs/2104.05031v3
- Date: Sun, 28 Jul 2024 00:22:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-31 23:24:35.027197
- Title: Deformable Capsules for Object Detection
- Title(参考訳): オブジェクト検出のための変形可能なカプセル
- Authors: Rodney Lalonde, Naji Khosravan, Ulas Bagci,
- Abstract要約: 我々は,コンピュータビジョンにおいて重要な問題である物体検出に対処するために,新しいカプセルネットワーク,変形可能なカプセル(textitDeformCaps)を導入した。
提案手法は,本論文において,オブジェクト検出のためのカプセルネットワークを構築するために,効率よくスケールアップできることを実証する。
- 参考スコア(独自算出の注目度): 3.702343116848637
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Capsule networks promise significant benefits over convolutional networks by storing stronger internal representations, and routing information based on the agreement between intermediate representations' projections. Despite this, their success has been limited to small-scale classification datasets due to their computationally expensive nature. Though memory efficient, convolutional capsules impose geometric constraints that fundamentally limit the ability of capsules to model the pose/deformation of objects. Further, they do not address the bigger memory concern of class-capsules scaling up to bigger tasks such as detection or large-scale classification. In this study, we introduce a new family of capsule networks, deformable capsules (\textit{DeformCaps}), to address a very important problem in computer vision: object detection. We propose two new algorithms associated with our \textit{DeformCaps}: a novel capsule structure (\textit{SplitCaps}), and a novel dynamic routing algorithm (\textit{SE-Routing}), which balance computational efficiency with the need for modeling a large number of objects and classes, which have never been achieved with capsule networks before. We demonstrate that the proposed methods efficiently scale up to create the first-ever capsule network for object detection in the literature. Our proposed architecture is a one-stage detection framework and it obtains results on MS COCO which are on par with state-of-the-art one-stage CNN-based methods, while producing fewer false positive detection, generalizing to unusual poses/viewpoints of objects.
- Abstract(参考訳): カプセルネットワークは、より強力な内部表現を格納し、中間表現のプロジェクション間の合意に基づいてルーティング情報をルーティングすることで、畳み込みネットワークよりも大きな利益を約束する。
それにもかかわらず、彼らの成功は計算的に高価な性質のため、小規模の分類データセットに限られている。
記憶効率は良いが、畳み込みカプセルは、物体のポーズ/変形をモデル化するカプセルの能力を根本的に制限する幾何学的な制約を課す。
さらに、検出や大規模分類といった大きなタスクにスケールアップするクラスカプセルのメモリ上の問題にも対処していない。
本研究では、コンピュータビジョンにおいて重要な問題である物体検出に対処するために、新しいカプセルネットワーク、変形可能なカプセル(\textit{DeformCaps})を導入する。
本稿では,新しいカプセル構造 (\textit{SplitCaps}) と新しい動的ルーティングアルゴリズム (\textit{SE-Routing}) の2つの新しいアルゴリズムを提案する。
提案手法は,本論文において,オブジェクト検出のためのカプセルネットワークを構築するために,効率よくスケールアップできることを実証する。
提案アーキテクチャは1段階検出フレームワークであり,MS COCOは最先端の1段階CNN手法と同等であり,偽陽性検出は少なく,オブジェクトの異常なポーズ・ビューポイントに一般化する。
関連論文リスト
- A Fresh Take on Stale Embeddings: Improving Dense Retriever Training with Corrector Networks [81.2624272756733]
密集検索では、ディープエンコーダは入力とターゲットの両方に埋め込みを提供する。
我々は、古いキャッシュされたターゲット埋め込みを調整できる小さなパラメトリック補正ネットワークを訓練する。
私たちのアプローチは、トレーニング中にターゲット埋め込み更新が行われなくても、最先端の結果と一致します。
論文 参考訳(メタデータ) (2024-09-03T13:29:13Z) - Hierarchical Object-Centric Learning with Capsule Networks [0.0]
畳み込みニューラルネットワークの制限に対処するために、カプセルネットワーク(CapsNets)が導入された。
この論文はCapsNetsの興味深い側面を調査し、その潜在能力を解き放つための3つの重要な疑問に焦点を当てている。
論文 参考訳(メタデータ) (2024-05-30T09:10:33Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Affordance detection with Dynamic-Tree Capsule Networks [5.847547503155588]
視覚入力からの精度検出は、自律的なロボット操作の基本的なステップである。
疎3次元点雲のための動的木構造カプセルをベースとした第1次空隙検出ネットワークを提案する。
このアルゴリズムは、未確認物体の把握に直面する場合、現在の空き検出方法よりも優れている。
論文 参考訳(メタデータ) (2022-11-09T21:14:08Z) - Hybrid Gromov-Wasserstein Embedding for Capsule Learning [24.520120182880333]
Capsule Network (CapsNets) は、オブジェクト、部品、およびそれらの関係を2段階のプロセスで解析することを目的としている。
階層的関係モデリングは計算コストが高く、潜在的な利点にもかかわらずCapsNetの利用が制限されている。
本稿では,標準ベースラインモデルを超え,高性能な畳み込みモデルよりも優れた性能を示すカプセルの学習手法を提案する。
論文 参考訳(メタデータ) (2022-09-01T05:26:32Z) - Towards Efficient Capsule Networks [7.1577508803778045]
カプセルネットワークはモデルの説明可能性を高めるために導入され、各カプセルはオブジェクトまたはその部分の明示的な表現である。
本稿では,Capsule Network を用いたプルーニングが,メモリ要件の低減,計算作業,推論とトレーニング時間といった高度な一般化を実現する方法を示す。
論文 参考訳(メタデータ) (2022-08-19T08:03:25Z) - Learning with Capsules: A Survey [73.31150426300198]
カプセルネットワークは、オブジェクト中心の表現を学習するための畳み込みニューラルネットワーク(CNN)に代わるアプローチとして提案された。
CNNとは異なり、カプセルネットワークは部分的に階層的な関係を明示的にモデル化するように設計されている。
論文 参考訳(メタデータ) (2022-06-06T15:05:36Z) - Efficient-CapsNet: Capsule Network with Self-Attention Routing [0.0]
深層畳み込みニューラルネットワークは、オブジェクト変換を埋め込むために、多数の機能マップを持つデータ拡張技術とレイヤを広範囲に活用する。
カプセルネットワークは、現在の畳み込みネットワークを拡張し、より効率的に全てのアフィン変換をエンコードするプロセスで人工的な視覚知覚を実現する、有望なソリューションである。
本稿では,カプセルネットワークの効率について検討し,その容量を160Kのパラメータをほとんど持たない極端なアーキテクチャで限界まで押し上げることにより,提案アーキテクチャがまだ最先端の結果が得られることを実証する。
論文 参考訳(メタデータ) (2021-01-29T09:56:44Z) - Wasserstein Routed Capsule Networks [90.16542156512405]
複雑なタスクに対処できる新しいパラメータ効率の良いカプセルアーキテクチャを提案する。
我々のネットワークはCIFAR-10で他のカプセルのアプローチを1.2%以上上回ります。
論文 参考訳(メタデータ) (2020-07-22T14:38:05Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Subspace Capsule Network [85.69796543499021]
SubSpace Capsule Network (SCN) はカプセルネットワークのアイデアを利用して、エンティティの外観や暗黙的に定義された特性のバリエーションをモデル化する。
SCNは、テスト期間中にCNNと比較して計算オーバーヘッドを発生させることなく、識別モデルと生成モデルの両方に適用することができる。
論文 参考訳(メタデータ) (2020-02-07T17:51:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。