論文の概要: 3D Labeling Tool
- arxiv url: http://arxiv.org/abs/2207.11479v1
- Date: Sat, 23 Jul 2022 09:53:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 13:49:07.728262
- Title: 3D Labeling Tool
- Title(参考訳): 3Dラベリングツール
- Authors: John Rachwan, Charbel Zalaket
- Abstract要約: 教師付き物体検出モデルの訓練と試験には、地上の真理ラベルを持つ大量の画像の収集が必要である。
3次元ラベリングツール(3DLT)による2次元画像と3次元三角形メッシュの新しいラベリングツールについて紹介する。
これはスタンドアローンで、多機能でクロスプラットフォームなソフトウェアで、インストールを必要とせず、Windows、Linuxベースのディストリビューションで実行できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training and testing supervised object detection models require a large
collection of images with ground truth labels. Labels define object classes in
the image, as well as their locations, shape, and possibly other information
such as pose. The labeling process has proven extremely time consuming, even
with the presence of manpower. We introduce a novel labeling tool for 2D images
as well as 3D triangular meshes: 3D Labeling Tool (3DLT). This is a standalone,
feature-heavy and cross-platform software that does not require installation
and can run on Windows, macOS and Linux-based distributions. Instead of
labeling the same object on every image separately like current tools, we use
depth information to reconstruct a triangular mesh from said images and label
the object only once on the aforementioned mesh. We use registration to
simplify 3D labeling, outlier detection to improve 2D bounding box calculation
and surface reconstruction to expand labeling possibility to large point
clouds. Our tool is tested against state of the art methods and it greatly
surpasses them in terms of speed while preserving accuracy and ease of use.
- Abstract(参考訳): 教師付き物体検出モデルの訓練と試験には、地上の真理ラベルを持つ大量の画像の収集が必要である。
ラベルは画像内のオブジェクトクラスとそれらの位置、形状、そしておそらくはポーズのような他の情報を定義する。
ラベル付けプロセスは、人力の存在にもかかわらず非常に時間がかかることが証明されている。
2d画像用の新しいラベリングツールと3d三角メッシュを紹介し、3dラベリングツール(3dlt)を提案する。
これはスタンドアロンで多機能でクロスプラットフォームなソフトウェアで、インストールを必要とせず、Windows、macOS、Linuxベースのディストリビューションで実行できる。
現在のツールのように、すべてのイメージに同じオブジェクトをラベル付けするのではなく、深度情報を使用して、そのイメージから三角形のメッシュを再構築し、前述のメッシュに一度だけオブジェクトをラベル付けします。
3次元ラベリングの簡略化,異常検出,2次元バウンディングボックス計算の改善,表面再構成,大点雲へのラベリング可能性の拡張にレジストレーションを使用する。
我々のツールは最先端の技術手法に対してテストされ、精度と使いやすさを保ちながら、その速度を大幅に上回っています。
関連論文リスト
- Weakly-Supervised 3D Scene Graph Generation via Visual-Linguistic Assisted Pseudo-labeling [9.440800948514449]
視覚言語支援擬似ラベルを用いた弱教師付き3次元シーングラフ生成法を提案する。
我々の3D-VLAPは、テキストと2D画像のセマンティクスを調整するために、現在の大規模視覚言語モデルの優れた能力を利用する。
エッジ自己アテンションに基づくグラフニューラルネットワークを設計し、3Dポイントクラウドシーンのシーングラフを生成する。
論文 参考訳(メタデータ) (2024-04-03T07:30:09Z) - Weakly Supervised 3D Object Detection via Multi-Level Visual Guidance [72.6809373191638]
本稿では,3次元ラベルを必要とせずに2次元ドメインと3次元ドメイン間の制約を活用できるフレームワークを提案する。
具体的には、LiDARと画像特徴をオブジェクト認識領域に基づいて整列する特徴レベルの制約を設計する。
第二に、出力レベルの制約は、2Dと投影された3Dボックスの推定の重なりを強制するために開発される。
第3に、トレーニングレベルの制約は、視覚データと整合した正確で一貫した3D擬似ラベルを生成することによって利用される。
論文 参考訳(メタデータ) (2023-12-12T18:57:25Z) - DatasetNeRF: Efficient 3D-aware Data Factory with Generative Radiance Fields [68.94868475824575]
本稿では,無限で高品質な3Dアノテーションを3Dポイントクラウドセグメンテーションとともに生成できる新しいアプローチを提案する。
我々は3次元生成モデルに先立って強力なセマンティクスを活用してセマンティクスデコーダを訓練する。
トレーニングが完了すると、デコーダは遅延空間を効率よく一般化し、無限のデータの生成を可能にする。
論文 参考訳(メタデータ) (2023-11-18T21:58:28Z) - Towards Learning Monocular 3D Object Localization From 2D Labels using
the Physical Laws of Motion [15.15687944002438]
本稿では,1枚のキャリブレーションカメラからの1枚の画像における2次元ラベルのみを用いた高精度な3次元物体位置決め手法を提案する。
3Dラベルを使う代わりに、我々のモデルは、物体の動きの物理的知識とともに、容易に注釈付けできる2Dラベルで訓練される。
論文 参考訳(メタデータ) (2023-10-26T15:10:10Z) - Tracking Objects with 3D Representation from Videos [57.641129788552675]
P3DTrackと呼ばれる新しい2次元多目的追跡パラダイムを提案する。
モノクロビデオにおける擬似3Dオブジェクトラベルからの3次元オブジェクト表現学習により,P3DTrackと呼ばれる新しい2次元MOTパラダイムを提案する。
論文 参考訳(メタデータ) (2023-06-08T17:58:45Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - Back to Reality: Weakly-supervised 3D Object Detection with Shape-guided
Label Enhancement [93.77156425817178]
本研究では,3次元物体検出のための弱教師付きアプローチを提案する。
我々の手法、すなわちBack to Reality (BR)は、弱いラベルを完全な注釈付き仮想シーンに変換するために合成された3D形状を利用する。
ラベル付け作業の5%未満で、広く使用されているScanNetデータセットに対して、一般的なフル教師付きアプローチを用いて、同等な検出性能を達成する。
論文 参考訳(メタデータ) (2022-03-10T08:51:32Z) - Learning 3D Semantic Segmentation with only 2D Image Supervision [18.785840615548473]
多視点融合を用いた2次元意味画像分割から派生した擬似ラベルから3次元モデルを訓練する。
提案するネットワークアーキテクチャである2D3DNetは,5大陸20都市で撮影されたライダーと画像を備えた新しい都市データセットの実験において,ベースラインよりもはるかに優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2021-10-21T17:56:28Z) - Learning Monocular 3D Vehicle Detection without 3D Bounding Box Labels [0.09558392439655011]
3Dオブジェクト検出器のトレーニングには、3Dバウンディングボックスラベルを持つデータセットが必要である。
本稿では,3次元境界ボックスラベルを使わずにモノラルな3次元物体検出を学習するためのネットワークアーキテクチャとトレーニング手順を提案する。
提案アルゴリズムを実世界のKITTIデータセット上で評価し,トレーニングに3Dバウンディングボックスラベルを必要とする最先端の手法と比較して有望な性能を実現する。
論文 参考訳(メタデータ) (2020-10-07T16:24:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。