論文の概要: SynSpill: Improved Industrial Spill Detection With Synthetic Data
- arxiv url: http://arxiv.org/abs/2508.10171v1
- Date: Wed, 13 Aug 2025 20:09:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.107053
- Title: SynSpill: Improved Industrial Spill Detection With Synthetic Data
- Title(参考訳): SynSpill: 合成データによる産業スパイル検出の改善
- Authors: Aaditya Baranwal, Abdul Mueez, Jason Voelker, Guneet Bhatia, Shruti Vyas,
- Abstract要約: 大規模ビジョンランゲージモデル(VLM)は、強力なゼロショット機能を通じて汎用的な視覚認識を変換している。
その性能は、産業の流出検知のようなニッチで安全に重要な領域で著しく低下する。
高品質な合成データ生成パイプラインを中心としたスケーラブルなフレームワークを導入する。
- 参考スコア(独自算出の注目度): 3.297182592932918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale Vision-Language Models (VLMs) have transformed general-purpose visual recognition through strong zero-shot capabilities. However, their performance degrades significantly in niche, safety-critical domains such as industrial spill detection, where hazardous events are rare, sensitive, and difficult to annotate. This scarcity -- driven by privacy concerns, data sensitivity, and the infrequency of real incidents -- renders conventional fine-tuning of detectors infeasible for most industrial settings. We address this challenge by introducing a scalable framework centered on a high-quality synthetic data generation pipeline. We demonstrate that this synthetic corpus enables effective Parameter-Efficient Fine-Tuning (PEFT) of VLMs and substantially boosts the performance of state-of-the-art object detectors such as YOLO and DETR. Notably, in the absence of synthetic data (SynSpill dataset), VLMs still generalize better to unseen spill scenarios than these detectors. When SynSpill is used, both VLMs and detectors achieve marked improvements, with their performance becoming comparable. Our results underscore that high-fidelity synthetic data is a powerful means to bridge the domain gap in safety-critical applications. The combination of synthetic generation and lightweight adaptation offers a cost-effective, scalable pathway for deploying vision systems in industrial environments where real data is scarce/impractical to obtain. Project Page: https://synspill.vercel.app
- Abstract(参考訳): 大規模ビジョンランゲージモデル(VLM)は、強力なゼロショット機能を通じて汎用的な視覚認識を変換している。
しかし、その性能は、危険事象が稀で、敏感であり、注釈を付けるのが困難である産業的流出検知のようなニッチで安全に重要な領域において著しく低下する。
プライバシーの懸念やデータ感度、実際のインシデントの発生頻度などによって引き起こされるこの不足は、ほとんどの産業環境では従来型の微調整を不可能にしている。
高品質な合成データ生成パイプラインを中心としたスケーラブルなフレームワークを導入することで、この問題に対処する。
この合成コーパスは, VLMの有効パラメータ効率向上(PEFT)を可能にし, YOLOやDETRなどの最先端物体検出器の性能を大幅に向上させることを示す。
特に、合成データ(SynSpillデータセット)がない場合、VLMはこれらの検出器よりも見つからない流出シナリオをより一般化する。
SynSpillを使用すると、VLMと検出器の両方が大幅に改善され、性能は同等になる。
我々の結果は、高忠実性合成データが、安全クリティカルなアプリケーションにおける領域ギャップを埋める強力な手段であることを示す。
合成生成と軽量適応の組み合わせは、実際のデータが得られない産業環境において、視覚システムを展開するための費用効率が高くスケーラブルな経路を提供する。
Project Page: https://synspill.vercel.app
関連論文リスト
- AI-Generated Fall Data: Assessing LLMs and Diffusion Model for Wearable Fall Detection [3.5912245880418125]
転倒検知システムの訓練は、特に高齢者の実際の転倒データの不足により困難である。
本研究では,現実的な転倒シナリオのシミュレーションにおいて,テキスト・ツー・モーションモデルとテキスト・ツー・テキストモデルを評価する。
合成データセットを生成し、4つの実世界のベースラインデータセットと統合し、秋検出性能への影響を評価する。
論文 参考訳(メタデータ) (2025-05-07T02:30:33Z) - Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.21082069320818]
最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文 参考訳(メタデータ) (2025-05-06T15:21:36Z) - Evaluating the Impact of Synthetic Data on Object Detection Tasks in Autonomous Driving [0.0]
実・合成・混合データセットに基づいて訓練された2次元・3次元オブジェクト検出タスクを比較した。
その結果,実データと合成データを組み合わせることで,物体検出モデルのロバスト性や一般化が向上することが示唆された。
論文 参考訳(メタデータ) (2025-03-12T20:13:33Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - Instance-Level Safety-Aware Fidelity of Synthetic Data and Its Calibration [5.089356301032639]
4種類のインスタンスレベルの忠実さを導入し、安全クリティカルなアプリケーションにおけるその役割に焦点を当てる。
目的は、合成データにテストを適用することによって、現実世界の安全性の問題を明らかにすることだ。
論文 参考訳(メタデータ) (2024-02-10T19:45:40Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception [62.71374902455154]
ニューラルレンダリングの最近の進歩を利用して、静的および動的ノベルビューUAVベースの画像レンダリングを改善する。
本研究では,主に実データと合成データのハイブリッドセットに基づいて最先端検出モデルが最適化された場合,性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-10-25T00:20:37Z) - PLASTIC: Improving Input and Label Plasticity for Sample Efficient
Reinforcement Learning [54.409634256153154]
強化学習(RL)では, サンプル効率の向上が重要である。
原則として、非政治的なRLアルゴリズムは、環境相互作用毎に複数の更新を可能にすることで、サンプル効率を向上させることができる。
本研究は, この現象の原因を, 塑性を2つの側面に分けて検討した。
論文 参考訳(メタデータ) (2023-06-19T06:14:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。