論文の概要: Box Pose and Shape Estimation and Domain Adaptation for Large-Scale Warehouse Automation
- arxiv url: http://arxiv.org/abs/2507.00984v1
- Date: Tue, 01 Jul 2025 17:36:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.758901
- Title: Box Pose and Shape Estimation and Domain Adaptation for Large-Scale Warehouse Automation
- Title(参考訳): 大規模倉庫自動化のためのボックスポースと形状推定と領域適応
- Authors: Xihang Yu, Rajat Talak, Jingnan Shi, Ulrich Viereck, Igor Gilitschenski, Luca Carlone,
- Abstract要約: 本稿では,手動のアノテーションを必要とせずに知覚モデルを改善するために,自己教師付きドメイン適応パイプラインを開発する。
我々は,5万枚の画像からなる大規模実世界のデータセットへの適応を含む,シミュレーションおよび実産業環境の範囲で,我々のアプローチを広範囲に評価した。
自己教師型モデルは,シミュレーションでのみ訓練されたモデルよりも有意に優れており,ゼロショット3次元境界ボックス推定ベースラインよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 23.91093031135749
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern warehouse automation systems rely on fleets of intelligent robots that generate vast amounts of data -- most of which remains unannotated. This paper develops a self-supervised domain adaptation pipeline that leverages real-world, unlabeled data to improve perception models without requiring manual annotations. Our work focuses specifically on estimating the pose and shape of boxes and presents a correct-and-certify pipeline for self-supervised box pose and shape estimation. We extensively evaluate our approach across a range of simulated and real industrial settings, including adaptation to a large-scale real-world dataset of 50,000 images. The self-supervised model significantly outperforms models trained solely in simulation and shows substantial improvements over a zero-shot 3D bounding box estimation baseline.
- Abstract(参考訳): 現代の倉庫自動化システムは、大量のデータを生成するインテリジェントなロボット群に頼っている。
本稿では,手動のアノテーションを必要とせずに,実世界のラベルなしデータを利用して知覚モデルを改善する自己教師付きドメイン適応パイプラインを開発する。
本研究は, 箱のポーズと形状を推定することに焦点を当て, 自己監督型箱のポーズと形状推定のための正当性パイプラインを提示する。
我々は,5万枚の画像からなる大規模実世界のデータセットへの適応を含む,シミュレーションおよび実産業環境の範囲で,我々のアプローチを広範囲に評価した。
自己教師型モデルは,シミュレーションでのみ訓練されたモデルよりも有意に優れており,ゼロショット3次元境界ボックス推定ベースラインよりも大幅に改善されている。
関連論文リスト
- A General Approach for Determining Applicability Domain of Machine Learning Models [1.8551396341435895]
機械学習モデルの適用可能性のドメインに関する知識は、正確で信頼性の高いモデル予測を保証するために不可欠である。
我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。
化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
論文 参考訳(メタデータ) (2024-05-28T15:41:16Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。
このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。
我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文 参考訳(メタデータ) (2024-02-07T13:41:53Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - A Correct-and-Certify Approach to Self-Supervise Object Pose Estimators
via Ensemble Self-Training [26.47895284071508]
現実世界のロボティクスアプリケーションは、さまざまなシナリオで確実に動作するオブジェクトのポーズ推定方法を要求する。
最初のコントリビューションは、深度情報を用いたポーズ推定を補正する堅牢な修正モジュールの開発です。
第2の貢献は、複数のポーズ推定器を自己教師型で同時に訓練するアンサンブル自己学習アプローチである。
論文 参考訳(メタデータ) (2023-02-12T23:02:03Z) - Autoregressive Uncertainty Modeling for 3D Bounding Box Prediction [63.3021778885906]
3Dバウンディングボックスは、多くのコンピュータビジョンアプリケーションで広く使われている中間表現である。
本稿では,自己回帰モデルを利用して高い信頼度予測と意味のある不確実性対策を行う手法を提案する。
我々はシミュレーションデータセットであるCOB-3Dをリリースし、現実世界のロボティクスアプリケーションで発生する新しいタイプのあいまいさを強調します。
論文 参考訳(メタデータ) (2022-10-13T23:57:40Z) - From a Point Cloud to a Simulation Model: Bayesian Segmentation and
Entropy based Uncertainty Estimation for 3D Modelling [0.6882042556551611]
ブラウンフィールド計画の場合、既存のデータは時代遅れで、特に2Dで計画されていた古い植物には不完全であることが多い。
現在の環境モデルは、既存のデータに基づいて直接生成することはできないし、そのような工場モデルを構築する方法に関する全体論的なアプローチはほとんど存在しない。
本研究では,大規模屋内環境のデジタル化から始まり,静的環境やシミュレーションモデルの生成で終わる方法論的ワークフローを詳述する。
論文 参考訳(メタデータ) (2021-02-04T08:59:49Z) - Deformation-aware Unpaired Image Translation for Pose Estimation on
Laboratory Animals [56.65062746564091]
我々は,神経回路が行動をどのようにオーケストレーションするかを研究するために,手動による監督を使わずに,神経科学モデル生物のポーズを捉えることを目的としている。
我々の重要な貢献は、未完成の画像翻訳フレームワークにおける外観、形状、ポーズの明示的で独立したモデリングである。
ショウジョウバエ(ハエ)、線虫(線虫)、ダニオ・レリオ(ゼブラフィッシュ)のポーズ推定精度の向上を実証した。
論文 参考訳(メタデータ) (2020-01-23T15:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。