論文の概要: A Synthetic Dataset for Manometry Recognition in Robotic Applications
- arxiv url: http://arxiv.org/abs/2508.17468v1
- Date: Sun, 24 Aug 2025 17:52:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.542179
- Title: A Synthetic Dataset for Manometry Recognition in Robotic Applications
- Title(参考訳): ロボット応用におけるマントメトリー認識のための合成データセット
- Authors: Pedro Antonio Rabelo Saraiva, Enzo Ferreira de Souza, Joao Manoel Herrera Pinheiro, Thiago H. Segreto, Ricardo V. Godoy, Marcelo Becker,
- Abstract要約: 本研究は,複雑な産業環境下でのロバストな物体検出モデルをトレーニングするためのデータ不足と高い取得コストの課題に対処する。
我々は、手続き的レンダリングとAI駆動のビデオ生成を組み合わせたハイブリッドデータ合成パイプラインを提案し、検証する。
複合データセット上でトレーニングされたYOLOベースの検出ネットワークが,実画像と合成データとをブレンドすることで,実世界のデータにのみトレーニングされたモデルと比較して,優れた性能を実現することを実証した。
- 参考スコア(独自算出の注目度): 0.686108371431346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work addresses the challenges of data scarcity and high acquisition costs for training robust object detection models in complex industrial environments, such as offshore oil platforms. The practical and economic barriers to collecting real-world data in these hazardous settings often hamper the development of autonomous inspection systems. To overcome this, in this work we propose and validate a hybrid data synthesis pipeline that combines procedural rendering with AI-driven video generation. Our methodology leverages BlenderProc to create photorealistic images with precise annotations and controlled domain randomization, and integrates NVIDIA's Cosmos-Predict2 world-foundation model to synthesize physically plausible video sequences with temporal diversity, capturing rare viewpoints and adverse conditions. We demonstrate that a YOLO-based detection network trained on a composite dataset, blending real images with our synthetic data, achieves superior performance compared to models trained exclusively on real-world data. Notably, a 1:1 mixture of real and synthetic data yielded the highest accuracy, surpassing the real-only baseline. These findings highlight the viability of a synthetic-first approach as an efficient, cost-effective, and safe alternative for developing reliable perception systems in safety-critical and resource-constrained industrial applications.
- Abstract(参考訳): この研究は、オフショア石油プラットフォームのような複雑な産業環境において、堅牢な物体検出モデルを訓練するためのデータ不足と高い取得コストの課題に対処する。
これらの危険な環境で現実世界のデータを集めるための実践的および経済的障壁は、しばしば自律的な検査システムの開発を妨げる。
これを解決するために、手続き的レンダリングとAI駆動のビデオ生成を組み合わせたハイブリッドデータ合成パイプラインを提案し、検証する。
我々の手法はBlenderProcを利用して正確なアノテーションと制御されたドメインランダム化を持つフォトリアリスティック画像を作成し、NVIDIAのCosmos-Predict2ワールド境界モデルを統合して、物理的に可視なビデオシーケンスを時間的多様性で合成し、稀な視点と悪条件をキャプチャする。
複合データセット上でトレーニングされたYOLOベースの検出ネットワークが,実画像と合成データとをブレンドすることで,実世界のデータにのみトレーニングされたモデルと比較して,優れた性能を実現することを実証した。
特に、実データと合成データの1:1の混合は、実データよりも高い精度で得られた。
これらの知見は、安全クリティカルで資源に制約のある産業アプリケーションにおいて、信頼性の高い認識システムを開発するための、効率的で費用効率のよい安全な代替手段として、合成第一のアプローチが実現可能であることを明らかにする。
関連論文リスト
- Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training [0.708987965338602]
本論文では,Unreal Engineにおける注釈付き合成データの自動生成手法を提案する。
合成データセットが実世界のデータセットに匹敵する性能を達成できることを実証する。
これは、ロボットサッカーにおけるオブジェクト検出アルゴリズムのトレーニングのための合成データの最初の応用である。
論文 参考訳(メタデータ) (2025-06-05T14:37:40Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - Evaluating the Impact of Synthetic Data on Object Detection Tasks in Autonomous Driving [0.0]
実・合成・混合データセットに基づいて訓練された2次元・3次元オブジェクト検出タスクを比較した。
その結果,実データと合成データを組み合わせることで,物体検出モデルのロバスト性や一般化が向上することが示唆された。
論文 参考訳(メタデータ) (2025-03-12T20:13:33Z) - Self-Supervised Data Generation for Precision Agriculture: Blending Simulated Environments with Real Imagery [3.9845810840390734]
精密農業において、ラベル付きデータの不足は、機械学習モデルのトレーニングにユニークな課題をもたらす。
本稿では,これらの課題に対処するために,現実的な合成データを生成する新しいシステムを提案する。
本研究では, テーブルブドウ栽培に本法を適用して, 最先端検出器の訓練において, 大幅な性能向上を図った。
論文 参考訳(メタデータ) (2025-02-25T16:13:49Z) - Synthetica: Large Scale Synthetic Data for Robot Perception [21.415878105900187]
本稿では,ロバストな状態推定器を訓練するための大規模合成データ生成手法であるSyntheticaを提案する。
本稿では,ほとんどの状態推定問題のフロントエンドとして機能する重要な問題であるオブジェクト検出の課題に焦点を当てる。
レイトレーシングのデータを利用して270万の画像を生成し、高精度なリアルタイム検出変換器を訓練する。
我々は,従来のSOTAの9倍の50-100Hzの検出器を動作させながら,物体検出タスクにおける最先端性能を示す。
論文 参考訳(メタデータ) (2024-10-28T15:50:56Z) - Towards Realistic Data Generation for Real-World Super-Resolution [58.99206459754721]
RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文 参考訳(メタデータ) (2024-06-11T13:34:57Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Instance-Level Safety-Aware Fidelity of Synthetic Data and Its Calibration [5.089356301032639]
4種類のインスタンスレベルの忠実さを導入し、安全クリティカルなアプリケーションにおけるその役割に焦点を当てる。
目的は、合成データにテストを適用することによって、現実世界の安全性の問題を明らかにすることだ。
論文 参考訳(メタデータ) (2024-02-10T19:45:40Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。