論文の概要: General Hazard Detection
- arxiv url: http://arxiv.org/abs/2605.23304v1
- Date: Fri, 22 May 2026 07:24:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.235839
- Title: General Hazard Detection
- Title(参考訳): 一般的なハザード検出
- Authors: Stephanie Ng, CP Lim, SueJen Looi, Hendrik Zurlinden, David Nguyen, Lei Wei, Saeid Nahavandi, Hailing Zhou,
- Abstract要約: ルールベースのコンプライアンスアセスメントのために設計された,最初の汎用ハザードデータセットを提案する。
私たちの重要なイノベーションは、言語ベースのルールを通じて安全要件を表現することによって、画像ベースの例からハザード概念を分離することです。
CompliVisionデータセットは、トラフィック、建設、倉庫環境にまたがる3,006のイメージで構成されている。
- 参考スコア(独自算出の注目度): 5.74822847046482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hazard, as an abstract concept, is typically defined through cognitive-level logical reasoning rather than concrete examples. In contrast, existing hazard detection systems rely on predefined hazard categories and require intensive collection of labelled examples within detection or classification architectures. This approach faces three fundamental challenges when addressing abstract safety concepts: (1) noisy and sparse training data, (2) dynamically evolving definitions that change across contexts and time, and (3) limited generalisation to unseen or novel scenarios. To address these limitations, we present the CompliVision dataset, the first general-purpose hazard dataset designed for rule-based compliance assessment, along with a baseline framework for hazard evaluation. Our key innovation is decoupling the hazard concept from image-based examples by expressing safety requirements through language-based rules. We ground our approach in authoritative domain regulations and ISO standards to define diverse hazard concepts across multiple domains. The CompliVision dataset comprises 3,006 images spanning traffic, construction, and warehouse environments, with each image annotated for compliance against specific safety rules, accompanied by natural language explanations highlighting the supporting visual evidence. To achieve robust generalisation, we develop an active learning framework to more effectively guide and refine vision-language models in assessing hazard compliance. While state-of-the-art VLMs demonstrate strong capabilities, they struggle with the fine-grained, context-dependent interpretation required for accurate safety assessment. We proposed a general hazard detection framework to address this limitation which combines LLaVA-based visual reasoning with with human-in-the-loop feedback.
- Abstract(参考訳): 抽象概念としてのハザードは、具体例ではなく認知レベルの論理的推論によって定義されるのが一般的である。
対照的に、既存のハザード検出システムは事前に定義されたハザードカテゴリに依存しており、検出や分類アーキテクチャにおいてラベル付きサンプルの集中的な収集が必要である。
本手法は,(1)ノイズとスパースなトレーニングデータ,(2)文脈や時間にまたがる動的に変化する定義,(3)目に見えない,あるいは新しいシナリオに限定した一般化,の3つの基本的課題に対処する。
これらの制約に対処するために、ルールベースのコンプライアンスアセスメントのために設計された最初の汎用ハザードデータセットであるCompliVisionデータセットと、ハザード評価のためのベースラインフレームワークを提案する。
私たちの重要なイノベーションは、言語ベースのルールを通じて安全要件を表現することによって、画像ベースの例からハザード概念を分離することです。
我々は、複数のドメインにまたがる多様な危険概念を定義するために、権威のあるドメイン規則とISO標準にアプローチを定めています。
CompliVisionデータセットは、トラフィック、建設、倉庫環境にまたがる3,006のイメージで構成され、それぞれのイメージは特定の安全規則に準拠するように注釈付けされ、サポート対象の視覚的証拠を強調する自然言語の説明が添えられている。
堅牢な一般化を実現するために,リスクコンプライアンスを評価する上で,視覚言語モデルをより効果的にガイドし,洗練するための能動的学習フレームワークを開発した。
最先端のVLMは強力な能力を示すが、正確な安全性評価に必要な微細で文脈に依存した解釈に苦慮している。
我々は、LLaVAに基づく視覚的推論とループ内フィードバックを組み合わせた、この制限に対処する一般的なハザード検出フレームワークを提案する。
関連論文リスト
- ContextLens: Modeling Imperfect Privacy and Safety Context for Legal Compliance [49.524070843587594]
本研究では,大規模言語モデル(LLM)を活用し,法的領域における入力コンテキストを基盤とするセミルールベースのフレームワークであるContextLensを提案する。
我々は、General Data Protection Regulation()とEU AI Actをカバーする既存のコンプライアンスベンチマークの実験を行います。
その結果、ContextLensはLLMのコンプライアンス評価を大幅に改善し、トレーニングなしで既存のベースラインを越えられることが示唆された。
論文 参考訳(メタデータ) (2026-04-14T05:35:38Z) - HomeGuard: VLM-based Embodied Safeguard for Identifying Contextual Risk in Household Task [42.665798473119516]
CG-CoT(Context-Guided Chain-of-Thought)を特徴とするアーキテクチャ非依存型セーフガードを提案する。
CG-CoTは、リスクアセスメントをアクティブな知覚に分解し、相互作用対象や関連する空間近傍への注意を順次固定する。
実験により、我々のモデルであるHomeGuardは安全性を大幅に向上し、ベースモデルと比較してリスクマッチ率を30%以上改善することが示された。
論文 参考訳(メタデータ) (2026-03-15T13:09:43Z) - Contextual Safety Reasoning and Grounding for Open-World Robots [79.98924225712668]
COREは、環境に関する事前の知識なしに、オンラインのコンテキスト推論、接地、執行を可能にする安全フレームワークである。
知覚の不確実性を考慮したCOREの確率論的安全性保証を提供する。
シミュレーションと実世界の実験を通じて、COREは目に見えない環境において、文脈的に適切な振る舞いを強制することを示した。
論文 参考訳(メタデータ) (2026-02-23T15:51:23Z) - Vision and language: Novel Representations and Artificial intelligence for Driving Scene Safety Assessment and Autonomous Vehicle Planning [2.1379801460200416]
視覚言語モデル(VLM)は、視覚観察を自然言語の概念と整合させる強力な表現学習システムとして登場した。
本稿では、視覚言語表現が、認識、予測、計画パイプラインに統合された場合、シーンの安全性評価と意思決定をどのようにサポートするかを検討する。
論文 参考訳(メタデータ) (2026-02-07T20:04:21Z) - GuardTrace-VL: Detecting Unsafe Multimodel Reasoning via Iterative Safety Supervision [47.99880677909197]
GuardTrace-VLは、共同画像テキスト分析を通じてQTAパイプライン全体を監視する、視覚対応の安全監査ツールである。
本研究では,データ修正プロセスと組み合わさった3段階のプログレッシブトレーニング手法を提案する。
提案したテストセットでは、ドメイン内シナリオとドメイン外シナリオの両方を対象として、安全でない推論検出タスクにおいて、GuardTrace-VLモデルがF1スコア93.1%を達成した。
論文 参考訳(メタデータ) (2025-11-26T02:49:51Z) - SafeRBench: A Comprehensive Benchmark for Safety Assessment in Large Reasoning Models [60.8821834954637]
LRMの安全性をエンドツーエンドに評価する最初のベンチマークであるSafeRBenchを紹介する。
私たちは、リスクカテゴリとレベルを入力設計に組み込んだ先駆者です。
我々は,長い推論トレースを意味的に一貫性のある単位にセグメント化するためのマイクロシンクのチャンキング機構を導入する。
論文 参考訳(メタデータ) (2025-11-19T06:46:33Z) - Advancing Neural Network Verification through Hierarchical Safety Abstract Interpretation [52.626086874715284]
我々は、安全でない出力の階層構造を検証する抽象的DNN検証と呼ばれる新しい問題定式化を導入する。
出力到達可能な集合に関する抽象的解釈と推論を活用することにより,形式的検証プロセスにおいて,複数の安全性レベルを評価することができる。
我々の貢献には、新しい抽象的安全性の定式化と既存のアプローチとの関係を理論的に探求することが含まれる。
論文 参考訳(メタデータ) (2025-05-08T13:29:46Z) - Using Vision Language Models for Safety Hazard Identification in Construction [1.2343292905447238]
本稿では,建設リスクの同定のための視覚言語モデル(VLM)に基づくフレームワークを提案し,実験的に検証した。
GPT-4o, Gemini, Llama 3.2, InternVL2を含む最先端のVLMを1100の建設現場画像のカスタムデータセットを用いて評価した。
論文 参考訳(メタデータ) (2025-04-12T05:11:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。