論文の概要: Selective Segmentation Networks Using Top-Down Attention
- arxiv url: http://arxiv.org/abs/2002.01125v1
- Date: Tue, 4 Feb 2020 04:47:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 03:18:58.414704
- Title: Selective Segmentation Networks Using Top-Down Attention
- Title(参考訳): トップダウンアテンションを用いた選択的セグメンテーションネットワーク
- Authors: Mahdi Biparva, John Tsotsos
- Abstract要約: 畳み込みニューラルネットワークは、入力された知覚データのネットワーク階層の下部から視覚階層の上部のセマンティック情報への変換をモデル化する。
本稿では,Top-Down 選択ネットワークで Bottom-Up convnets を拡張可能な,オブジェクトセグメンテーションのための統合された2パスフレームワークを提案する。
セマンティックセグメンテーションのためのベンチマークデータセット上で提案したネットワークを評価し,トップダウン選択機能を持つネットワークがベースラインモデルより優れていることを示す。
- 参考スコア(独自算出の注目度): 1.0152838128195465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional neural networks model the transformation of the input sensory
data at the bottom of a network hierarchy to the semantic information at the
top of the visual hierarchy. Feedforward processing is sufficient for some
object recognition tasks. Top-Down selection is potentially required in
addition to the Bottom-Up feedforward pass. It can, in part, address the
shortcoming of the loss of location information imposed by the hierarchical
feature pyramids. We propose a unified 2-pass framework for object segmentation
that augments Bottom-Up \convnets with a Top-Down selection network. We utilize
the top-down selection gating activities to modulate the bottom-up hidden
activities for segmentation predictions. We develop an end-to-end multi-task
framework with loss terms satisfying task requirements at the two ends of the
network. We evaluate the proposed network on benchmark datasets for semantic
segmentation, and show that networks with the Top-Down selection capability
outperform the baseline model. Additionally, we shed light on the superior
aspects of the new segmentation paradigm and qualitatively and quantitatively
support the efficiency of the novel framework over the baseline model that
relies purely on parametric skip connections.
- Abstract(参考訳): 畳み込みニューラルネットワーク(convolutional neural networks)は、ネットワーク階層の底にある入力感覚データの、視覚階層の上部にある意味情報への変換をモデル化する。
フィードフォワード処理は、いくつかのオブジェクト認識タスクに十分である。
トップダウンの選択はボトムアップのfeedforwardパスに加えて必要となる。
部分的には、階層的特徴ピラミッドによって課される位置情報の喪失の欠点に対処することができる。
本稿では,Top-Down選択ネットワークでBottom-Up \convnetsを拡張可能な,オブジェクトセグメンテーションのための統合2パスフレームワークを提案する。
我々は,トップダウン選択ゲーティング活動を利用してボトムアップ隠れ動作のセグメンテーション予測を行う。
ネットワークの両端におけるタスク要求を満たす損失項を持つエンドツーエンドのマルチタスクフレームワークを開発する。
提案するベンチマークデータセットのネットワークをセマンティクスセグメンテーションのために評価し,トップダウン選択能力を有するネットワークがベースラインモデルを上回ることを示す。
さらに、我々は新しいセグメンテーションパラダイムの優れた側面に光を当て、パラメトリックスキップ接続に純粋に依存するベースラインモデルよりも、新しいフレームワークの効率を質的かつ定量的に支援した。
関連論文リスト
- Lidar Panoptic Segmentation and Tracking without Bells and Whistles [48.078270195629415]
ライダーセグメンテーションと追跡のための検出中心ネットワークを提案する。
私たちのネットワークのコアコンポーネントの1つは、オブジェクトインスタンス検出ブランチです。
提案手法を複数の3D/4D LPSベンチマークで評価し,我々のモデルがオープンソースモデル間で新たな最先端性を確立することを確認した。
論文 参考訳(メタデータ) (2023-10-19T04:44:43Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Learning Target-aware Representation for Visual Tracking via Informative
Interactions [49.552877881662475]
トラッキングのための特徴表現のターゲット認識能力を改善するために,新しいバックボーンアーキテクチャを提案する。
提案したGIMモジュールとInBN機構は、CNNやTransformerなど、さまざまなバックボーンタイプに適用可能である。
論文 参考訳(メタデータ) (2022-01-07T16:22:27Z) - Quality-Aware Memory Network for Interactive Volumetric Image
Segmentation [15.504425842953676]
医用画像の対話的セグメンテーションのための品質認識型メモリネットワークを提案する。
各スライスの現在のセグメンテーション品質に基づいて、次のスライスをセグメントに提案するために品質評価モジュールが導入された。
提案するネットワークは,様々な種類のユーザアノテーションを適切に一般化可能な,堅牢な対話型セグメンテーションエンジンを実現する。
論文 参考訳(メタデータ) (2021-06-20T12:34:19Z) - A Novel Adaptive Deep Network for Building Footprint Segmentation [0.0]
衛星画像から地図へ変換することで得られる不正確な境界の問題を解くために,Pix2Pixを用いた新しいネットワーク手法を提案する。
本フレームワークは,第1発生器が局所化特徴を抽出し,第2発生器から抽出した境界特徴とマージし,すべての詳細構造エッジを分割する2つの生成器を含む。
提案したネットワークの結果の質を高めるために異なる戦略が実装され、提案ネットワークはセグメント化精度において最先端ネットワークよりも高い性能を示し、全ての評価指標に対する大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-02-27T18:13:48Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - DINE: A Framework for Deep Incomplete Network Embedding [33.97952453310253]
本稿では,ディープ不完全ネットワーク埋め込み,すなわちDINEを提案する。
まず、期待最大化フレームワークを用いて、部分的に観測可能なネットワーク内のノードとエッジの両方を含む欠落部分を完成させる。
マルチラベル分類およびリンク予測タスクにおいて,DINEを3つのネットワーク上で評価する。
論文 参考訳(メタデータ) (2020-08-09T04:59:35Z) - Hierarchical Bi-Directional Feature Perception Network for Person
Re-Identification [12.259747100939078]
過去の人物再同定(Re-ID)モデルは、画像の最も識別性の高い領域に焦点を当てることを目的としている。
本稿では,階層型双方向特徴知覚ネットワーク (HBFP-Net) という新しいモデルを提案する。
Market-1501, CUHK03, DukeMTMC-ReIDデータセットなどの主要な評価実験により, 提案手法が最近のSOTA Re-IDモデルより優れていることが示された。
論文 参考訳(メタデータ) (2020-08-08T12:33:32Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z) - Gated Path Selection Network for Semantic Segmentation [72.44994579325822]
我々は,適応的な受容場を学習することを目的とした,GPSNetという新しいネットワークを開発した。
GPSNetにおいて、我々はまず2次元のマルチスケールネットワーク、SuperNetを設計する。
望ましいセマンティックコンテキストを動的に選択するために、ゲート予測モジュールがさらに導入される。
論文 参考訳(メタデータ) (2020-01-19T12:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。