論文の概要: Semi Supervised Deep Quick Instance Detection and Segmentation
- arxiv url: http://arxiv.org/abs/2101.06405v1
- Date: Sat, 16 Jan 2021 08:50:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-28 04:29:11.361077
- Title: Semi Supervised Deep Quick Instance Detection and Segmentation
- Title(参考訳): 半監督型深部クイック検出とセグメンテーション
- Authors: Ashish Kumar, L. Behera
- Abstract要約: 本稿では,画像の画素単位のセマンティックセマンティックセグメンテーションとインスタンス検出のための半教師付き深層学習フレームワークを提案する。
このフレームワークは、リアルタイムのデータ取得によって、オンラインで新しいアイテムを迅速かつインクリメンタルに学習できます。
当社のシステムは、ピック、ストウピック、ストウタスクで世界第3位、第4位、第5位にランクされました。
- 参考スコア(独自算出の注目度): 9.543667840503739
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we present a semi supervised deep quick learning framework for
instance detection and pixel-wise semantic segmentation of images in a dense
clutter of items. The framework can quickly and incrementally learn novel items
in an online manner by real-time data acquisition and generating corresponding
ground truths on its own. To learn various combinations of items, it can
synthesize cluttered scenes, in real time. The overall approach is based on the
tutor-child analogy in which a deep network (tutor) is pretrained for
class-agnostic object detection which generates labeled data for another deep
network (child). The child utilizes a customized convolutional neural network
head for the purpose of quick learning. There are broadly four key components
of the proposed framework semi supervised labeling, occlusion aware clutter
synthesis, a customized convolutional neural network head, and instance
detection. The initial version of this framework was implemented during our
participation in Amazon Robotics Challenge (ARC), 2017. Our system was ranked
3rd, 4th and 5th worldwide in pick, stow-pick and stow task respectively. The
proposed framework is an improved version over ARC17 where novel features such
as instance detection and online learning has been added.
- Abstract(参考訳): 本稿では,画像の画素単位のセマンティックセマンティックセマンティックセグメンテーションを,密集したアイテム群に配置する半教師付き深層学習フレームワークを提案する。
このフレームワークは、リアルタイムなデータ取得とそれに対応する土台真理を単独で生成することにより、オンラインで新規項目を迅速かつ漸進的に学習することができる。
様々な組み合わせを学ぶために、乱雑なシーンをリアルタイムで合成することができる。
全体的なアプローチは、別のディープネットワーク(child)のラベル付きデータを生成するクラス非依存オブジェクト検出のために、ディープネットワーク(tutor)を事前トレーニングするチューター=チャイルドアナロジーに基づいている。
子供は、迅速な学習のためにカスタマイズされた畳み込みニューラルネットワークヘッドを使用する。
提案するフレームワークには、半教師付きラベル付け、クラッタ合成、カスタマイズされた畳み込みニューラルネットワークヘッド、インスタンス検出の4つの重要なコンポーネントがある。
このフレームワークの初期バージョンは、Amazon Robotics Challenge(ARC)への参加中に実装されました。
第3位、第4位、第5位がピック、ストーピック、ストータスクでそれぞれランク付けされた。
提案されたフレームワークはarc17の改良版で、インスタンス検出やオンライン学習などの新機能が追加されている。
関連論文リスト
- ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Deepfake Detection via Joint Unsupervised Reconstruction and Supervised
Classification [25.84902508816679]
本稿では,再建作業と分類作業を同時に行うディープフェイク検出手法を提案する。
この方法は、あるタスクによって学習された情報を他のタスクと共有する。
提案手法は,一般的に使用されている3つのデータセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-11-24T05:44:26Z) - ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。
自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文 参考訳(メタデータ) (2022-07-27T07:46:23Z) - A Novel Incremental Learning Driven Instance Segmentation Framework to
Recognize Highly Cluttered Instances of the Contraband Items [45.39173572825739]
本稿では,従来のエンコーダ・デコーダアーキテクチャを拡張して,インスタンス認識セグメンテーションを実現する手法を提案する。
新たな客観的関数は、以前取得した知識を保持することにより、各イテレーションにおけるネットワーク損失を最小限にする。
公開されている2つのX線データセット上での我々のフレームワークの徹底的な評価は、最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2022-01-07T17:40:37Z) - Video-Text Pre-training with Learned Regions [59.30893505895156]
Video-Textプレトレーニングは、大規模なビデオテキストペアから転送可能な表現を学ぶことを目的としている。
本研究では,大規模ビデオテキストペアの事前学習において,対象物の構造を考慮に入れたビデオテキスト学習用モジュール「RereaLearner」を提案する。
論文 参考訳(メタデータ) (2021-12-02T13:06:53Z) - Experience feedback using Representation Learning for Few-Shot Object
Detection on Aerial Images [2.8560476609689185]
大規模なリモートセンシング画像データセットであるDOTAを用いて,本手法の性能評価を行った。
特に、数発のオブジェクト検出タスクの固有の弱点を強調します。
論文 参考訳(メタデータ) (2021-09-27T13:04:53Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Analyzing Representations inside Convolutional Neural Networks [8.803054559188048]
本稿では,ネットワークが学習する概念を,一連の入力例をクラスタリングする方法に基づいて分類するフレームワークを提案する。
このフレームワークは教師なしで、入力機能のためのラベルなしで機能する。
提案手法を広範に評価し,人間の理解しやすさとコヒーレントな概念を創出することを示す。
論文 参考訳(メタデータ) (2020-12-23T07:10:17Z) - Fast Few-Shot Classification by Few-Iteration Meta-Learning [173.32497326674775]
数ショット分類のための高速な最適化に基づくメタラーニング手法を提案する。
我々の戦略はメタ学習において学習すべき基礎学習者の目的の重要な側面を可能にする。
我々は、我々のアプローチの速度と効果を実証し、総合的な実験分析を行う。
論文 参考訳(メタデータ) (2020-10-01T15:59:31Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。