論文の概要: A Synthetic Dataset for Manometry Recognition in Robotic Applications
- arxiv url: http://arxiv.org/abs/2508.17468v2
- Date: Sat, 11 Oct 2025 16:18:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 15:48:09.229832
- Title: A Synthetic Dataset for Manometry Recognition in Robotic Applications
- Title(参考訳): ロボット応用におけるマントメトリー認識のための合成データセット
- Authors: Pedro Antonio Rabelo Saraiva, Enzo Ferreira de Souza, Joao Manoel Herrera Pinheiro, Thiago H. Segreto, Ricardo V. Godoy, Marcelo Becker,
- Abstract要約: 手続き的レンダリングとAI駆動のビデオ生成を統合したハイブリッドデータ合成パイプラインを提案する。
YOLOベースの検出器は、合成データセットに基づいて訓練され、実際のデータと合成データを組み合わせた。
- 参考スコア(独自算出の注目度): 0.686108371431346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper addresses the challenges of data scarcity and high acquisition costs in training robust object detection models for complex industrial environments, such as offshore oil platforms. Data collection in these hazardous settings often limits the development of autonomous inspection systems. To mitigate this issue, we propose a hybrid data synthesis pipeline that integrates procedural rendering and AI-driven video generation. The approach uses BlenderProc to produce photorealistic images with domain randomization and NVIDIA's Cosmos-Predict2 to generate physically consistent video sequences with temporal variation. A YOLO-based detector trained on a composite dataset, combining real and synthetic data, outperformed models trained solely on real images. A 1:1 ratio between real and synthetic samples achieved the highest accuracy. The results demonstrate that synthetic data generation is a viable, cost-effective, and safe strategy for developing reliable perception systems in safety-critical and resource-constrained industrial applications.
- Abstract(参考訳): 本稿では、オフショア石油プラットフォームのような複雑な産業環境において、ロバストな物体検出モデルを訓練する際のデータ不足と高い取得コストの課題に対処する。
これらの危険な環境でのデータ収集は、しばしば自律的な検査システムの開発を制限する。
この問題を軽減するために、手続き的レンダリングとAI駆動のビデオ生成を統合したハイブリッドデータ合成パイプラインを提案する。
このアプローチでは、BlenderProcを使用してドメインランダム化を備えたフォトリアリスティックイメージとNVIDIAのCosmos-Predict2を生成し、時間変動を伴う物理的に一貫したビデオシーケンスを生成する。
YOLOベースの検出器は、合成データセットに基づいて訓練され、実際のデータと合成データを組み合わせた。
実検体と合成試料の1:1比が最も精度が高かった。
その結果, 合成データ生成は, 安全クリティカルかつ資源制約のある産業アプリケーションにおいて, 信頼性の高い認識システムを開発するための, 実用的で, 費用効率が高く, 安全な戦略であることを実証した。
関連論文リスト
- Synthetic Dataset Generation for Autonomous Mobile Robots Using 3D Gaussian Splatting for Vision Training [0.708987965338602]
本論文では,Unreal Engineにおける注釈付き合成データの自動生成手法を提案する。
合成データセットが実世界のデータセットに匹敵する性能を達成できることを実証する。
これは、ロボットサッカーにおけるオブジェクト検出アルゴリズムのトレーニングのための合成データの最初の応用である。
論文 参考訳(メタデータ) (2025-06-05T14:37:40Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - Evaluating the Impact of Synthetic Data on Object Detection Tasks in Autonomous Driving [0.0]
実・合成・混合データセットに基づいて訓練された2次元・3次元オブジェクト検出タスクを比較した。
その結果,実データと合成データを組み合わせることで,物体検出モデルのロバスト性や一般化が向上することが示唆された。
論文 参考訳(メタデータ) (2025-03-12T20:13:33Z) - Self-Supervised Data Generation for Precision Agriculture: Blending Simulated Environments with Real Imagery [3.9845810840390734]
精密農業において、ラベル付きデータの不足は、機械学習モデルのトレーニングにユニークな課題をもたらす。
本稿では,これらの課題に対処するために,現実的な合成データを生成する新しいシステムを提案する。
本研究では, テーブルブドウ栽培に本法を適用して, 最先端検出器の訓練において, 大幅な性能向上を図った。
論文 参考訳(メタデータ) (2025-02-25T16:13:49Z) - Synthetica: Large Scale Synthetic Data for Robot Perception [21.415878105900187]
本稿では,ロバストな状態推定器を訓練するための大規模合成データ生成手法であるSyntheticaを提案する。
本稿では,ほとんどの状態推定問題のフロントエンドとして機能する重要な問題であるオブジェクト検出の課題に焦点を当てる。
レイトレーシングのデータを利用して270万の画像を生成し、高精度なリアルタイム検出変換器を訓練する。
我々は,従来のSOTAの9倍の50-100Hzの検出器を動作させながら,物体検出タスクにおける最先端性能を示す。
論文 参考訳(メタデータ) (2024-10-28T15:50:56Z) - Towards Realistic Data Generation for Real-World Super-Resolution [58.99206459754721]
RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文 参考訳(メタデータ) (2024-06-11T13:34:57Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Instance-Level Safety-Aware Fidelity of Synthetic Data and Its Calibration [5.089356301032639]
4種類のインスタンスレベルの忠実さを導入し、安全クリティカルなアプリケーションにおけるその役割に焦点を当てる。
目的は、合成データにテストを適用することによって、現実世界の安全性の問題を明らかにすることだ。
論文 参考訳(メタデータ) (2024-02-10T19:45:40Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。