論文の概要: Toward unlabeled multi-view 3D pedestrian detection by generalizable AI:
techniques and performance analysis
- arxiv url: http://arxiv.org/abs/2308.04515v1
- Date: Tue, 8 Aug 2023 18:24:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 16:19:22.919176
- Title: Toward unlabeled multi-view 3D pedestrian detection by generalizable AI:
techniques and performance analysis
- Title(参考訳): 汎用AIによるラベルなし多視点3次元歩行者検出に向けて:技術と性能解析
- Authors: Jo\~ao Paulo Lima, Diego Thomas, Hideaki Uchiyama, Veronica Teichrieb
- Abstract要約: 汎用AIは、ラベルのないターゲットシーンにおける多視点3D歩行者検出を改善するために使用できる。
対象データの自動ラベル付けには,教師付き検出器を用いた擬似ラベル付けと教師なし検出器を用いた自動ラベル付けの2つの手法を検討する。
トレーニングされていない検出器をベースとした自動ラベリング手法を用いることで、トレーニングされていない検出器や既存のラベル付きソースデータセットでトレーニングした検出器を直接使用するよりも優れた結果が得られることを示す。
- 参考スコア(独自算出の注目度): 7.414308466976969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We unveil how generalizable AI can be used to improve multi-view 3D
pedestrian detection in unlabeled target scenes. One way to increase
generalization to new scenes is to automatically label target data, which can
then be used for training a detector model. In this context, we investigate two
approaches for automatically labeling target data: pseudo-labeling using a
supervised detector and automatic labeling using an untrained detector (that
can be applied out of the box without any training). We adopt a training
framework for optimizing detector models using automatic labeling procedures.
This framework encompasses different training sets/modes and multi-round
automatic labeling strategies. We conduct our analyses on the
publicly-available WILDTRACK and MultiviewX datasets. We show that, by using
the automatic labeling approach based on an untrained detector, we can obtain
superior results than directly using the untrained detector or a detector
trained with an existing labeled source dataset. It achieved a MODA about 4%
and 1% better than the best existing unlabeled method when using WILDTRACK and
MultiviewX as target datasets, respectively.
- Abstract(参考訳): 我々は、ラベルのないターゲットシーンにおける多視点3D歩行者検出を改善するために、一般化可能なAIをいかに活用できるかを明らかにした。
新しいシーンへの一般化を促進する方法の1つは、ターゲットデータを自動的にラベル付けすることで、検出器モデルのトレーニングに使用できる。
本研究では,教師付き検出器を用いた擬似ラベル付けと,未学習検出器を用いた自動ラベル付けの2つの手法について検討した。
自動ラベリング手法を用いて検出器モデルを最適化するためのトレーニングフレームワークを採用する。
このフレームワークは、異なるトレーニングセット/モードとマルチラウンドの自動ラベリング戦略を含んでいる。
WILDTRACKおよびMultiviewXデータセットについて解析を行った。
学習されていない検出器に基づく自動ラベル付け手法を用いることで、学習されていない検出器や既存のラベル付きソースデータセットでトレーニングされた検出器を直接使用するよりも優れた結果が得られることを示す。
ターゲットデータセットとしてwildtrackとmultiviewxを使用する場合、既存の未ラベルメソッドよりも4%と1%のモーダが達成された。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Vision-Language Guidance for LiDAR-based Unsupervised 3D Object Detection [16.09503890891102]
我々は,LiDAR点雲のみで動作する教師なし3次元検出手法を提案する。
我々は、クラスタリング、トラッキング、ボックステキスト、ラベルリファインメントなど、LiDARポイントクラウドの固有のCLI時間知識を活用している。
提案手法はオープンデータセット上での最先端の非教師なし3Dオブジェクト検出器よりも優れている。
論文 参考訳(メタデータ) (2024-08-07T14:14:53Z) - Multi-Class 3D Object Detection with Single-Class Supervision [34.216636233945856]
完全なラベル付きデータセットによるマルチクラスの3D検出器のトレーニングは費用がかかる。
別のアプローチとして、解離したデータサンプルに単一クラスラベルをターゲットとする方法がある。
本稿では,単一クラスラベル付きデータを用いて,マルチクラス3次元オブジェクト検出モデルの学習に関心がある。
論文 参考訳(メタデータ) (2022-05-11T18:00:05Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - Move to See Better: Self-Improving Embodied Object Detection [35.461141354989714]
本研究では,テスト環境における物体検出の改善手法を提案する。
エージェントは、多視点データを収集し、2Dおよび3D擬似ラベルを生成し、その検出器を自己監督的に微調整する。
論文 参考訳(メタデータ) (2020-11-30T19:16:51Z) - Manual-Label Free 3D Detection via An Open-Source Simulator [50.74299948748722]
我々は、CARLAシミュレータを利用して、大量の自己ラベル付きトレーニングサンプルを生成する手動ラベルフリーな3D検出アルゴリズムを提案する。
ドメイン適応型VoxelNet(DA-VoxelNet)は、合成データから実際のシナリオへの分散ギャップを横断することができる。
実験の結果、提案されたDA 3D検出器は、KITTI評価セット上で76.66%と56.64%のmAPを達成することができた。
論文 参考訳(メタデータ) (2020-11-16T08:29:01Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。