論文の概要: LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset
- arxiv url: http://arxiv.org/abs/2503.02910v3
- Date: Tue, 15 Apr 2025 01:35:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:07:45.200598
- Title: LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset
- Title(参考訳): LangGas:新しいデータセットを用いた半透明ガス漏れ検出のための選択ゼロショットバックグラウンドサブトラクション言語の導入
- Authors: Wenqi Guo, Yiyang Du, Shan Du,
- Abstract要約: ガス漏れは予防を必要とする重大な危険をもたらす。
近年の研究では、この問題に機械学習技術を適用しているが、高品質でパブリックなデータセットが不足している。
本稿では,背景の多様さ,前景オブジェクトの干渉,漏洩箇所の多様さ,正確なセグメンテーションの真理を特徴とする合成データセットSimGasを紹介する。
- 参考スコア(独自算出の注目度): 7.457821910654639
- License:
- Abstract: Gas leakage poses a significant hazard that requires prevention. Traditionally, human inspection has been used for detection, a slow and labour-intensive process. Recent research has applied machine learning techniques to this problem, yet there remains a shortage of high-quality, publicly available datasets. This paper introduces a synthetic dataset, SimGas, featuring diverse backgrounds, interfering foreground objects, diverse leak locations, and precise segmentation ground truth. We propose a zero-shot method that combines background subtraction, zero-shot object detection, filtering, and segmentation to leverage this dataset. Experimental results indicate that our approach significantly outperforms baseline methods based solely on background subtraction and zero-shot object detection with segmentation, reaching an IoU of 69%. We also present an analysis of various prompt configurations and threshold settings to provide deeper insights into the performance of our method. Finally, we qualitatively (because of the lack of ground truth) tested our performance on GasVid and reached decent results on the real-world dataset. The dataset, code, and full qualitative results are available at https://github.com/weathon/Lang-Gas.
- Abstract(参考訳): ガス漏れは予防を必要とする重大な危険をもたらす。
伝統的に、人間の検査は、遅くて労働集約的なプロセスである検出に使われてきた。
近年の研究では、この問題に機械学習技術を適用しているが、高品質でパブリックなデータセットが不足している。
本稿では,背景の多様さ,前景オブジェクトの干渉,漏洩箇所の多様さ,正確なセグメンテーションの真理を特徴とする合成データセットSimGasを紹介する。
本稿では,背景部分抽出,ゼロショットオブジェクト検出,フィルタリング,セグメンテーションを組み合わせたゼロショット手法を提案する。
実験結果から,本手法はバックグラウンドサブトラクションとセグメンテーションによるゼロショット物体検出のみに基づくベースライン法よりも優れた性能を示し,IoUは69%に達した。
また,提案手法の性能についてより深い知見を提供するために,様々なプロンプト設定としきい値設定の分析を行う。
最後に、(基礎的な真実の欠如のために)定性的にGasVidのパフォーマンスをテストし、実世界のデータセットで十分な結果を得たのです。
データセット、コード、完全な定性的な結果はhttps://github.com/weathon/Lang-Gas.comで公開されている。
関連論文リスト
- Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。
ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。
BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文 参考訳(メタデータ) (2024-07-10T18:00:54Z) - CLIPping the Deception: Adapting Vision-Language Models for Universal
Deepfake Detection [3.849401956130233]
広汎な深度検出のための最近の適応手法と組み合わせた事前学習型視覚言語モデル(VLM)の有効性について検討する。
ディープフェイク検出にCLIPを適用するために、単一のデータセット(ProGAN)のみを使用します。
シンプルで軽量なPrompt Tuningベースの適応戦略は、以前のSOTAアプローチよりも5.01% mAPと6.61%の精度で優れている。
論文 参考訳(メタデータ) (2024-02-20T11:26:42Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Proposal-Contrastive Pretraining for Object Detection from Fewer Data [11.416621957617334]
本稿では,新しい教師なし総合事前学習手法ProSeCoを提案する。
ProSeCoは、コントラスト学習のために検出器によって生成される多数のオブジェクト提案を使用する。
本手法は,標準および新しいベンチマークにおいて,対象検出のための教師なし事前学習において,最先端の手法であることを示す。
論文 参考訳(メタデータ) (2023-10-25T17:59:26Z) - Robust Region Feature Synthesizer for Zero-Shot Object Detection [87.79902339984142]
我々は,クラス内セマンティック・ディバージングコンポーネントとクラス間構造保存コンポーネントを含む,新しいゼロショットオブジェクト検出フレームワークを構築した。
リモートセンシング画像においてゼロショット物体検出を行う最初の研究である。
論文 参考訳(メタデータ) (2022-01-01T03:09:15Z) - Reducing Information Bottleneck for Weakly Supervised Semantic
Segmentation [17.979336178991083]
弱教師付きセマンティックセグメンテーションは、クラスラベルからピクセルレベルのローカライゼーションを生成する。
このようなラベルで訓練された分類器は、ターゲットオブジェクトの小さな識別領域に焦点を当てる可能性が高い。
本稿では,最後のアクティベーション関数を除去することで,情報のボトルネックを低減する手法を提案する。
さらに,非識別領域から分類への情報伝達をさらに促進する新たなプーリング手法を提案する。
論文 参考訳(メタデータ) (2021-10-13T06:49:45Z) - Boosting Weakly Supervised Object Detection with Progressive Knowledge
Transfer [40.23657486941391]
弱教師付き物体検出精度を高めるための効果的な知識伝達フレームワークを提案する。
情報源領域からの知識を一級普遍検出器で反復的に伝達し,対象領域検出器を学習する。
我々は、VOCテストセットで59.7%のmAPと、完全に教師されたFaster RCNNを再トレーニングした後で60.2%のmAPを達成した。
論文 参考訳(メタデータ) (2020-07-15T20:38:25Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。