論文の概要: ReBound: An Open-Source 3D Bounding Box Annotation Tool for Active
Learning
- arxiv url: http://arxiv.org/abs/2303.06250v1
- Date: Sat, 11 Mar 2023 00:11:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 20:16:02.072949
- Title: ReBound: An Open-Source 3D Bounding Box Annotation Tool for Active
Learning
- Title(参考訳): ReBound: アクティブラーニングのためのオープンソースの3Dバウンディングボックスアノテーションツール
- Authors: Wesley Chen, Andrew Edgley, Raunak Hota, Joshua Liu, Ezra Schwartz,
Aminah Yizar, Neehar Peri, James Purtilo
- Abstract要約: ReBoundはオープンソースの3Dビジュアライゼーションとデータセットの再アノテーションツールである。
ReBoundは探索データ解析に有効であり,能動的学習を促進することができることを示す。
- 参考スコア(独自算出の注目度): 3.1997195262707536
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, supervised learning has become the dominant paradigm for
training deep-learning based methods for 3D object detection. Lately, the
academic community has studied 3D object detection in the context of autonomous
vehicles (AVs) using publicly available datasets such as nuScenes and Argoverse
2.0. However, these datasets may have incomplete annotations, often only
labeling a small subset of objects in a scene. Although commercial services
exists for 3D bounding box annotation, these are often prohibitively expensive.
To address these limitations, we propose ReBound, an open-source 3D
visualization and dataset re-annotation tool that works across different
datasets. In this paper, we detail the design of our tool and present survey
results that highlight the usability of our software. Further, we show that
ReBound is effective for exploratory data analysis and can facilitate
active-learning. Our code and documentation is available at
https://github.com/ajedgley/ReBound
- Abstract(参考訳): 近年,3次元物体検出のための深層学習手法の訓練において,教師あり学習が主流となっている。
最近、学術コミュニティは、nuScenesやArgoverse 2.0といった公開データセットを使用して、自動運転車(AV)の文脈で3Dオブジェクト検出を研究している。
しかし、これらのデータセットは不完全なアノテーションを持ち、多くの場合シーン内のオブジェクトの小さなサブセットのみをラベル付けする。
3Dバウンディングボックスアノテーションの商用サービスは存在するが、これらはしばしば高額である。
これらの制限に対処するために、オープンソースの3Dビジュアライゼーションとデータセットの再アノテーションツールであるReBoundを提案する。
本稿では,ツールの設計について詳述するとともに,ソフトウェアの利用性を明らかにする調査結果について述べる。
さらに,リバウンドは探索的データ解析に有効であり,アクティブラーニングが容易であることを示す。
コードとドキュメントはhttps://github.com/ajedgley/reboundで閲覧できます。
関連論文リスト
- Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance [72.6809373191638]
本稿では,3次元ラベルを必要とせずに2次元ドメインと3次元ドメイン間の制約を活用できるフレームワークを提案する。
具体的には、LiDARと画像特徴をオブジェクト認識領域に基づいて整列する特徴レベルの制約を設計する。
第二に、出力レベルの制約は、2Dと投影された3Dボックスの推定の重なりを強制するために開発される。
第3に、トレーニングレベルの制約は、視覚データと整合した正確で一貫した3D擬似ラベルを生成することによって利用される。
論文 参考訳(メタデータ) (2023-12-12T18:57:25Z) - MDT3D: Multi-Dataset Training for LiDAR 3D Object Detection
Generalization [3.8243923744440926]
特定の点分布を持つソースデータセットでトレーニングされた3Dオブジェクト検出モデルは、目に見えないデータセットに一般化する上で困難であることが示されている。
我々は、アノテーション付きソースデータセットから利用可能な情報を、MDT3D(Multi-Dataset Training for 3D Object Detection)メソッドで活用する。
トレーニング中にデータセットの混合をどのように管理し、最後にクロスデータセット拡張メソッド、すなわちクロスデータセットオブジェクトインジェクションを導入するかを示します。
論文 参考訳(メタデータ) (2023-08-02T08:20:00Z) - 4D Unsupervised Object Discovery [53.561750858325915]
本研究では,3次元点雲と2次元RGB画像の時間的情報を用いた4次元データからオブジェクトを共同で検出する4次元非教師対象探索を提案する。
本稿では,2次元ローカライゼーションネットワークで協調的に最適化された3次元点雲上にClusterNetを提案することで,この課題に対する最初の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-10-10T16:05:53Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - S$^2$Contact: Graph-based Network for 3D Hand-Object Contact Estimation
with Semi-Supervised Learning [70.72037296392642]
モノクロ画像から接触を学習できる新しい半教師付きフレームワークを提案する。
具体的には、大規模データセットにおける視覚的および幾何学的整合性制約を利用して擬似ラベルを生成する。
より正確な再構築を行うために手動インタラクションを規定するコンタクトマップを使用することの利点を示す。
論文 参考訳(メタデータ) (2022-08-01T14:05:23Z) - Exploring Diversity-based Active Learning for 3D Object Detection in Autonomous Driving [45.405303803618]
多様性に基づくアクティブラーニング(AL)を,アノテーションの負担を軽減するための潜在的解決策として検討する。
選択したサンプルの空間的・時間的多様性を強制する新しい取得関数を提案する。
提案手法がnuScenesデータセットに与える影響を実証し,既存のAL戦略を著しく上回ることを示す。
論文 参考訳(メタデータ) (2022-05-16T14:21:30Z) - 3D Annotation Of Arbitrary Objects In The Wild [0.0]
SLAM, 3D再構成, 3D-to-2D幾何に基づくデータアノテーションパイプラインを提案する。
このパイプラインは、任意のオブジェクトのピクセル単位のアノテーションとともに、3Dおよび2Dバウンディングボックスを作成することができる。
以上の結果から, セマンティックセグメンテーションと2次元バウンディングボックス検出において, 約90%のインターセクション・オーバー・ユニオン(IoU)が一致していることがわかった。
論文 参考訳(メタデータ) (2021-09-15T09:00:56Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Objectron: A Large Scale Dataset of Object-Centric Videos in the Wild
with Pose Annotations [0.0]
3Dオブジェクト検出の最先端を前進させるために、Objectronデータセットを紹介します。
データセットには、9つのカテゴリのポーズアノテーションを備えたオブジェクト中心の短いビデオが含まれ、14,819の注釈付きビデオに400万の注釈付き画像が含まれています。
論文 参考訳(メタデータ) (2020-12-18T00:34:18Z) - Weakly Supervised 3D Object Detection from Point Clouds [27.70180601788613]
3Dオブジェクト検出は、特定のクラスに属するオブジェクトの3D境界ボックスを検出し、ローカライズすることを目的としている。
既存の3Dオブジェクト検出器は、トレーニング中にアノテーション付き3Dバウンディングボックスに依存している。
基礎となる真理3D境界ボックスを使わずに点雲からの3Dオブジェクト検出を弱教師付きで行うためのフレームワークであるVS3Dを提案する。
論文 参考訳(メタデータ) (2020-07-28T03:30:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。