論文の概要: Fast and Precise Binary Instance Segmentation of 2D Objects for
Automotive Applications
- arxiv url: http://arxiv.org/abs/2208.11527v1
- Date: Wed, 24 Aug 2022 13:19:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-25 12:51:22.175166
- Title: Fast and Precise Binary Instance Segmentation of 2D Objects for
Automotive Applications
- Title(参考訳): 自動車用2dオブジェクトの高速高精度バイナリインスタンスセグメンテーション
- Authors: Darshan Ganganna Ravindra, Laslo Dinges, Al-Hamadi Ayoub, and Vasili
Baranau
- Abstract要約: 本報告では,最先端のエンコーダデコーダネットワークを評価し,これらのネットワークを用いたインスタンスセグメンテーションの品質向上手法を提案する。
提案手法は、ネットワーク入力に余分な情報を提供することに依存しており、いわゆる極端点である。
この方法は、他の最先端のエンコーダデコーダネットワークよりも優れたIoUを生成し、CPU上にデプロイされたときに十分に高速に動作させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we focus on improving binary 2D instance segmentation to
assist humans in labeling ground truth datasets with polygons. Humans labeler
just have to draw boxes around objects, and polygons are generated
automatically. To be useful, our system has to run on CPUs in real-time. The
most usual approach for binary instance segmentation involves encoder-decoder
networks. This report evaluates state-of-the-art encoder-decoder networks and
proposes a method for improving instance segmentation quality using these
networks. Alongside network architecture improvements, our proposed method
relies upon providing extra information to the network input, so-called extreme
points, i.e. the outermost points on the object silhouette. The user can label
them instead of a bounding box almost as quickly. The bounding box can be
deduced from the extreme points as well. This method produces better IoU
compared to other state-of-the-art encoder-decoder networks and also runs fast
enough when it is deployed on a CPU.
- Abstract(参考訳): 本稿では,多角形による基底真理データセットのラベル付けを支援するため,バイナリ2dインスタンスセグメンテーションの改善に注目する。
human labelerは、オブジェクトの周りにボックスを描画するだけで、ポリゴンが自動的に生成される。
有効にするためには、我々のシステムはCPU上でリアルタイムで実行する必要がある。
バイナリインスタンスセグメンテーションの最も一般的なアプローチはエンコーダ-デコーダネットワークである。
本報告では,最先端のエンコーダデコーダネットワークを評価し,これらのネットワークを用いたインスタンスセグメンテーションの品質向上手法を提案する。
提案手法は,ネットワークアーキテクチャの改善とともに,オブジェクトシルエットの最外点である極端点と呼ばれる,ネットワーク入力に余分な情報を提供することに依存する。
ユーザーはバウンディングボックスの代わりにラベルを付けることができる。
境界ボックスは極端点からも導出することができる。
この方法は、他の最先端のエンコーダデコーダネットワークよりも優れたIoUを生成し、CPU上にデプロイされたときに十分に高速に動作させる。
関連論文リスト
- Camouflaged Object Detection with Feature Grafting and Distractor Aware [9.791590363932519]
そこで我々は,Camouflaged Object Detectionタスクを処理するために,FDNet(Feature Grafting and Distractor Aware Network)を提案する。
具体的には、CNNとTransformerを使ってマルチスケール画像を並列にエンコードする。
Distractor Aware Moduleは、CODタスクで考えられる2つの障害を明示的にモデル化して、粗いカモフラージュマップを洗練させるように設計されている。
論文 参考訳(メタデータ) (2023-07-08T09:37:08Z) - Towards Diverse Binary Segmentation via A Simple yet General Gated Network [71.19503376629083]
本稿では,バイナリセグメンテーションタスクに対処するシンプルな汎用ネットワーク(GateNet)を提案する。
多段ゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに選択的に送信することができる。
我々は,アトーラスの畳み込みを改善し,新規な折り畳み畳み畳み畳み畳み込みを形成する「Fold」操作を導入した。
論文 参考訳(メタデータ) (2023-03-18T11:26:36Z) - CenterPoly: real-time instance segmentation using bounding polygons [11.365829102707014]
有界多角形を用いたリアルタイムインスタンスセグメンテーションのための新しい手法であるCenterPolyを提案する。
都市部密集環境における道路利用者の検出に応用し,自動走行車などのインテリジェント交通システムへの適用に適している。
ネットワークパラメータのほとんどはネットワークヘッドによって共有され、高速かつ軽量でリアルタイムに実行することができる。
論文 参考訳(メタデータ) (2021-08-19T21:31:30Z) - Joint Inductive and Transductive Learning for Video Object Segmentation [107.32760625159301]
半教師付きオブジェクトセグメンテーションは、第1フレームのマスクだけを与えられたビデオシーケンスで対象オブジェクトをセグメンテーションするタスクである。
過去の最も優れた手法は、マッチングベースの帰納的推論やオンライン帰納的学習を採用していた。
本稿では,トランスダクティブ学習とインダクティブ学習を統合したフレームワークに統合し,それら間の補完を利用して,高精度かつ堅牢なビデオオブジェクトセグメンテーションを提案する。
論文 参考訳(メタデータ) (2021-08-08T16:25:48Z) - Crosslink-Net: Double-branch Encoder Segmentation Network via Fusing
Vertical and Horizontal Convolutions [58.71117402626524]
医用画像分割のための新しいダブルブランチエンコーダアーキテクチャを提案する。
1)正方形畳み込みカーネルによる特徴の識別をさらに改善する必要があるため,非正方形および水平畳み込みカーネルの利用を提案する。
実験では,4つのデータセット上でのモデルの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-24T02:58:32Z) - Learning point embedding for 3D data processing [2.12121796606941]
現在の点ベース法は本質的に空間関係処理ネットワークである。
PE-Netは高次元空間における点雲の表現を学習する。
実験によると、PE-Netは複数の挑戦的なデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-07-19T00:25:28Z) - Learning Spatio-Temporal Transformer for Visual Tracking [108.11680070733598]
本稿では,エンコーダ・デコーダ変換器をキーコンポーネントとする新しいトラッキングアーキテクチャを提案する。
メソッド全体がエンドツーエンドであり、コサインウィンドウやバウンディングボックススムーシングのような後処理ステップは不要である。
提案されたトラッカーは、Siam R-CNNよりも6倍速いリアルタイム速度を実行しながら、5つのチャレンジングな短期および長期ベンチマークで最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-03-31T15:19:19Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - Making a Case for 3D Convolutions for Object Segmentation in Videos [16.167397418720483]
本研究では,3次元畳み込みネットワークが高精細な物体分割などの高密度映像予測タスクに効果的に適用可能であることを示す。
本稿では,新しい3Dグローバル・コンボリューション・レイヤと3Dリファインメント・モジュールからなる3Dデコーダアーキテクチャを提案する。
提案手法は,DAVIS'16 Unsupervised, FBMS, ViSalベンチマークにおいて,既存の最先端技術よりもはるかに優れている。
論文 参考訳(メタデータ) (2020-08-26T12:24:23Z) - Interactive Video Object Segmentation Using Global and Local Transfer
Modules [51.93009196085043]
我々はアノテーションネットワーク(A-Net)と転送ネットワーク(T-Net)からなるディープニューラルネットワークを開発する。
A-Netは、フレーム上のユーザ記述を前提として、エンコーダ-デコーダアーキテクチャに基づいたセグメンテーション結果を生成する。
ユーザスクリブルをエミュレートし,補助的な損失を生かして,ネットワーク全体を2段階に分けてトレーニングする。
論文 参考訳(メタデータ) (2020-07-16T06:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。