論文の概要: Supervision by Registration and Triangulation for Landmark Detection
- arxiv url: http://arxiv.org/abs/2101.09866v1
- Date: Mon, 25 Jan 2021 02:48:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 19:01:25.780000
- Title: Supervision by Registration and Triangulation for Landmark Detection
- Title(参考訳): ランドマーク検出のための登録と三角測量による監督
- Authors: Xuanyi Dong, Yi Yang, Shih-En Wei, Xinshuo Weng, Yaser Sheikh, Shoou-I
Yu
- Abstract要約: 本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。
ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学べる。
- 参考スコア(独自算出の注目度): 70.13440728689231
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Supervision by Registration and Triangulation (SRT), an
unsupervised approach that utilizes unlabeled multi-view video to improve the
accuracy and precision of landmark detectors. Being able to utilize unlabeled
data enables our detectors to learn from massive amounts of unlabeled data
freely available and not be limited by the quality and quantity of manual human
annotations. To utilize unlabeled data, there are two key observations: (1) the
detections of the same landmark in adjacent frames should be coherent with
registration, i.e., optical flow. (2) the detections of the same landmark in
multiple synchronized and geometrically calibrated views should correspond to a
single 3D point, i.e., multi-view consistency. Registration and multi-view
consistency are sources of supervision that do not require manual labeling,
thus it can be leveraged to augment existing training data during detector
training. End-to-end training is made possible by differentiable registration
and 3D triangulation modules. Experiments with 11 datasets and a newly proposed
metric to measure precision demonstrate accuracy and precision improvements in
landmark detection on both images and video. Code is available at
https://github.com/D-X-Y/landm ark-detection.
- Abstract(参考訳): 本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。
ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学び、手動のアノテーションの品質や量によって制限されない。
ラベルのないデータを利用するには,(1)隣接するフレームにおける同一のランドマークの検出は,登録,すなわち光学フローと一貫性を持つべきである。
2) 多重同期および幾何的校正ビューにおける同一のランドマークの検出は,単一の3次元点,すなわち複数視点の整合性に対応すべきである。
登録と多視点整合性は手動ラベリングを必要としない監督の源であり、検出器トレーニング中に既存のトレーニングデータを増やすために利用することができる。
識別可能な登録と3D三角モジュールにより、エンドツーエンドのトレーニングが可能です。
画像と映像のランドマーク検出における精度と精度の向上について,11のデータセットと新たに提案されたメトリクスを用いた実験を行った。
コードはhttps://github.com/D-X-Y/landm ark-detectionで入手できる。
関連論文リスト
- DetMatch: Two Teachers are Better Than One for Joint 2D and 3D
Semi-Supervised Object Detection [29.722784254501768]
DetMatchは、2Dおよび3Dモダリティに関する共同半教師付き学習のための柔軟なフレームワークである。
両方のセンサーで検出された物体を識別することで、パイプラインはよりクリーンで堅牢な擬似ラベルを生成する。
我々はRGB画像のよりリッチなセマンティクスを活用して、誤った3Dクラスの予測を修正し、3Dボックスのローカライズを改善する。
論文 参考訳(メタデータ) (2022-03-17T17:58:00Z) - Latent Outlier Exposure for Anomaly Detection with Contaminated Data [31.446666264334528]
異常検出は、ラベルなしデータセットの大多数のデータから体系的なずれを示すデータポイントを特定することを目的としている。
本稿では,広範囲のモデルと互換性のあるラベルのない異常が存在する場合に,異常検知器を訓練するための戦略を提案する。
論文 参考訳(メタデータ) (2022-02-16T14:21:28Z) - Semi-supervised 3D Object Detection via Temporal Graph Neural Networks [17.90796183565084]
3Dオブジェクト検出は、自動運転やその他のロボット工学応用において重要な役割を果たす。
本研究では,3次元物体検出器の半教師付き学習により,大量の未ラベルのクラウドビデオを活用することを提案する。
本手法は,難解な nuScenes と H3D ベンチマーク上での最先端検出性能を実現する。
論文 参考訳(メタデータ) (2022-02-01T02:06:54Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Unsupervised Person Re-Identification with Wireless Positioning under
Weak Scene Labeling [104.80432023897289]
本稿では、弱いシーンラベリングの下で、視覚データと無線位置決めトラジェクトリの両方を用いて、教師なしの人物再識別を探索することを提案する。
具体的には、視覚データと無線情報の相補性をモデル化した、新しい教師なしマルチモーダルトレーニングフレームワーク(UMTF)を提案する。
我々のUMTFには、MMDA(Multimodal Data Association Strategy)とMMGN(Multimodal Graph Neural Network)が含まれている。
論文 参考訳(メタデータ) (2021-10-29T08:25:44Z) - ST3D++: Denoised Self-training for Unsupervised Domain Adaptation on 3D
Object Detection [78.71826145162092]
本稿では,ST3D++という名前の自己学習手法を提案する。
擬似ラベル生成プロセスにハイブリット品質を意識した三重項メモリを組み込むことにより、生成された擬似ラベルの品質と安定性を向上させる。
モデルトレーニングの段階では、ソースデータ支援トレーニング戦略とカリキュラムデータ拡張ポリシーを提案する。
論文 参考訳(メタデータ) (2021-08-15T07:49:06Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - Move to See Better: Self-Improving Embodied Object Detection [35.461141354989714]
本研究では,テスト環境における物体検出の改善手法を提案する。
エージェントは、多視点データを収集し、2Dおよび3D擬似ラベルを生成し、その検出器を自己監督的に微調整する。
論文 参考訳(メタデータ) (2020-11-30T19:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。