論文の概要: Gram-SLD: Automatic Self-labeling and Detection for Instance Objects
- arxiv url: http://arxiv.org/abs/2112.03641v1
- Date: Tue, 7 Dec 2021 11:34:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 14:44:10.047004
- Title: Gram-SLD: Automatic Self-labeling and Detection for Instance Objects
- Title(参考訳): Gram-SLD: インスタンスオブジェクトの自動自己ラベルと検出
- Authors: Rui Wang, Chengtun Wu, Jiawen Xin, and Liang Zhang
- Abstract要約: 我々はGram-SLD(Gram Self-Labeling and Detection)と呼ばれる協調学習に基づく新しいフレームワークを提案する。
Gram-SLDは、手動でラベル付けされたキーデータで大量のデータを自動アノテートし、競争性能を達成する。
- 参考スコア(独自算出の注目度): 6.512856940779818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instance object detection plays an important role in intelligent monitoring,
visual navigation, human-computer interaction, intelligent services and other
fields. Inspired by the great success of Deep Convolutional Neural Network
(DCNN), DCNN-based instance object detection has become a promising research
topic. To address the problem that DCNN always requires a large-scale annotated
dataset to supervise its training while manual annotation is exhausting and
time-consuming, we propose a new framework based on co-training called Gram
Self-Labeling and Detection (Gram-SLD). The proposed Gram-SLD can automatically
annotate a large amount of data with very limited manually labeled key data and
achieve competitive performance. In our framework, gram loss is defined and
used to construct two fully redundant and independent views and a key sample
selection strategy along with an automatic annotating strategy that
comprehensively consider precision and recall are proposed to generate high
quality pseudo-labels. Experiments on the public GMU Kitchen Dataset , Active
Vision Dataset and the self-made BHID-ITEM Datasetdemonstrate that, with only
5% labeled training data, our Gram-SLD achieves competitive performance in
object detection (less than 2% mAP loss), compared with the fully supervised
methods. In practical applications with complex and changing environments, the
proposed method can satisfy the real-time and accuracy requirements on instance
object detection.
- Abstract(参考訳): インスタンスオブジェクト検出は、インテリジェントな監視、ビジュアルナビゲーション、人間とコンピュータのインタラクション、インテリジェントなサービス、その他の分野において重要な役割を果たす。
ディープ畳み込みニューラルネットワーク(DCNN)の成功に触発されたDCNNベースのインスタンスオブジェクト検出は、有望な研究トピックとなっている。
本報告では,手動のアノテーションが枯渇し,時間を要する間にトレーニングを監督するために,DCNNが常に大規模なアノテートデータセットを必要とする問題に対処するため,Gram-SLD(Gram Self-Labeling and Detection)と呼ばれる協調学習に基づく新しいフレームワークを提案する。
提案したGram-SLDは、手動でラベル付けされたキーデータで大量のデータを自動アノテートし、競合性能を実現する。
本フレームワークでは,2つの完全冗長かつ独立なビューとキーサンプル選択戦略を構築するためにグラム損失を定義し,精度とリコールを包括的に考慮した自動アノテート戦略を提案し,高品質な擬似ラベルを生成する。
公開gmukitchen dataset , active vision dataset, and self-made bhid-item datasetdemonstrateにおける実験では, 5%のラベル付きトレーニングデータしか持たず, 完全な教師付き手法と比較して,gram-sldはオブジェクト検出における競合性能(2%のマップロス未満)を達成している。
複雑で変化する環境を持つ実用的なアプリケーションでは、提案手法はインスタンスオブジェクト検出のリアルタイムおよび精度要件を満たすことができる。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer [12.042768320132694]
本稿では,物体検出のための半教師付き学習における27の最先端開発について概説する。
データ拡張テクニック、擬似ラベル戦略、一貫性の正則化、敵の訓練方法などをカバーする。
我々は,既存の課題を克服し,物体検出のための半教師あり学習における新たな方向性を探るため,さらなる研究の関心を喚起することを目的としている。
論文 参考訳(メタデータ) (2024-07-11T12:58:13Z) - Self-Supervised Learning for User Localization [8.529237718266042]
機械学習技術は、ローカライゼーションタスクにおいて顕著な精度を示している。
大量のラベル付きデータ、特にChannel State Information(CSI)およびそれに対応する座標への依存は、依然としてボトルネックである。
CSIに基づくユーザローカライゼーションのための教師付き学習性能を高めるために,ラベルなしデータによる自己教師付き事前学習を活用する先駆的手法を提案する。
論文 参考訳(メタデータ) (2024-04-19T21:49:10Z) - Run-time Introspection of 2D Object Detection in Automated Driving
Systems Using Learning Representations [13.529124221397822]
ディープニューラルネットワーク(DNN)に基づく2次元物体検出のための新しいイントロスペクションソリューションを提案する。
KITTIとBDDのデータセットで評価された1段階および2段階のオブジェクト検出器を用いて,2次元オブジェクト検出におけるエラー検出のためのSOTAイントロスペクション機構を実装した。
性能評価の結果,提案手法はSOTA法より優れており,BDDデータセットのエラー率を9%から17%まで絶対的に削減できることがわかった。
論文 参考訳(メタデータ) (2024-03-02T10:56:14Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Self-Supervised Object Detection via Generative Image Synthesis [106.65384648377349]
本稿では,自己教師対象検出のための制御可能なGANを用いたエンドツーエンド分析合成フレームワークを提案する。
オブジェクトの合成と検出を学習するために、ボックスアノテーションを使用せずに、実世界のイメージのコレクションを使用します。
我々の研究は、制御可能なGAN画像合成という新しいパラダイムを導入することで、自己教師対象検出の分野を前進させる。
論文 参考訳(メタデータ) (2021-10-19T11:04:05Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - On the Use of Interpretable Machine Learning for the Management of Data
Quality [13.075880857448059]
我々は、解釈可能な機械学習を用いて、あらゆるデータ処理アクティビティをベースとした重要な機能を提供する。
私たちの目標は、少なくとも、収集されたデータセットで重要なものとして検出される機能に対して、データ品質を確保することです。
論文 参考訳(メタデータ) (2020-07-29T08:49:32Z) - Federated Self-Supervised Learning of Multi-Sensor Representations for
Embedded Intelligence [8.110949636804772]
スマートフォン、ウェアラブル、IoT(Internet of Things)デバイスは、教師付きモデルを学習するための集中リポジトリに蓄積できない豊富なデータを生成する。
本稿では,ウェーブレット変換に基づくテキストカルグラム・信号対応学習という自己教師付きアプローチを提案し,ラベルなしセンサ入力から有用な表現を学習する。
さまざまなパブリックデータセットのマルチビュー戦略を用いて,学習機能の品質を広範囲に評価し,すべての領域で高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-07-25T21:59:17Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。