論文の概要: InspecSafe-V1: A Multimodal Benchmark for Safety Assessment in Industrial Inspection Scenarios
- arxiv url: http://arxiv.org/abs/2601.21173v1
- Date: Thu, 29 Jan 2026 02:18:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.515901
- Title: InspecSafe-V1: A Multimodal Benchmark for Safety Assessment in Industrial Inspection Scenarios
- Title(参考訳): InspecSafe-V1:産業検査シナリオにおける安全性評価のためのマルチモーダルベンチマーク
- Authors: Zeyi Liu, Shuang Liu, Jihai Min, Zhaoheng Zhang, Jun Cen, Pengyu Han, Songqiao Hu, Zihan Meng, Xiao He, Donghua Zhou,
- Abstract要約: InspecSafe-V1は、産業検査安全評価のための最初のマルチモーダルベンチマークデータセットとしてリリースされた。
このデータセットは、41台の車輪付きおよびレール搭載の検査ロボットで作られ、2,239台の有効な検査現場で動作している。
可視光画像のキーオブジェクトに対してピクセルレベルのセグメンテーションアノテーションが提供される。
実用検査タスクに応じて、セマンティックシーン記述と対応する安全レベルラベルが提供される。
- 参考スコア(独自算出の注目度): 13.487324283362566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapid development of industrial intelligence and unmanned inspection, reliable perception and safety assessment for AI systems in complex and dynamic industrial sites has become a key bottleneck for deploying predictive maintenance and autonomous inspection. Most public datasets remain limited by simulated data sources, single-modality sensing, or the absence of fine-grained object-level annotations, which prevents robust scene understanding and multimodal safety reasoning for industrial foundation models. To address these limitations, InspecSafe-V1 is released as the first multimodal benchmark dataset for industrial inspection safety assessment that is collected from routine operations of real inspection robots in real-world environments. InspecSafe-V1 covers five representative industrial scenarios, including tunnels, power facilities, sintering equipment, oil and gas petrochemical plants, and coal conveyor trestles. The dataset is constructed from 41 wheeled and rail-mounted inspection robots operating at 2,239 valid inspection sites, yielding 5,013 inspection instances. For each instance, pixel-level segmentation annotations are provided for key objects in visible-spectrum images. In addition, a semantic scene description and a corresponding safety level label are provided according to practical inspection tasks. Seven synchronized sensing modalities are further included, including infrared video, audio, depth point clouds, radar point clouds, gas measurements, temperature, and humidity, to support multimodal anomaly recognition, cross-modal fusion, and comprehensive safety assessment in industrial environments.
- Abstract(参考訳): 産業インテリジェンスと無人検査の急速な発展により、複雑でダイナミックな産業施設におけるAIシステムの信頼性の高い認識と安全性評価が、予測的保守と自律的検査の展開において重要なボトルネックとなっている。
ほとんどの公開データセットは、シミュレートされたデータソース、単一モダリティのセンシング、あるいはきめ細かいオブジェクトレベルのアノテーションの欠如によって制限されている。
これらの制限に対処するため、InspecSafe-V1は産業検査安全評価のための最初のマルチモーダルベンチマークデータセットとしてリリースされ、実環境における実際の検査ロボットのルーチン操作から収集される。
InspecSafe-V1は、トンネル、発電所、焼結設備、石油・ガス石油化学プラント、石炭コンベアトレストを含む5つの産業シナリオをカバーしている。
このデータセットは、41台の車輪付きおよびレール搭載の検査ロボットで構築され、2,239台の有効な検査現場で動作し、5,013台の検査インスタンスを生成する。
各インスタンスに対して、可視スペクトル画像のキーオブジェクトに対してピクセルレベルのセグメンテーションアノテーションが提供される。
また、実際の検査作業に応じて、セマンティックシーン記述と対応する安全レベルラベルが提供される。
さらに、赤外線ビデオ、オーディオ、深度点雲、レーダー点雲、ガス測定、温度、湿度の7つの同期センシングモードが含まれ、マルチモーダル異常認識、クロスモーダル融合、産業環境における包括的安全評価をサポートする。
関連論文リスト
- Zero-Shot Multi-Criteria Visual Quality Inspection for Semi-Controlled Industrial Environments via Real-Time 3D Digital Twin Simulation [5.0268543063681195]
RGB-D空間における実シーンとリアルタイムデジタル双対(DT)を比較したポーズに依存しないゼロショット品質検査フレームワークを提案する。
提案手法は,オブジェクト検出とポーズ推定により,産業シーンを意味的に記述することで,効率的なリアルタイムDTレンダリングを実現する。
軸流モータの品質検査を特徴とする自動車用ユースケースに基づいて,本フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-11-28T14:19:31Z) - IndustryNav: Exploring Spatial Reasoning of Embodied Agents in Dynamic Industrial Navigation [56.43007596544299]
IndustryNavは、アクティブな空間推論のための最初の動的産業用ナビゲーションベンチマークである。
9つの最先端のVisual Large Language Modelsの研究によると、クローズドソースモデルは一貫した優位性を維持している。
論文 参考訳(メタデータ) (2025-11-21T16:48:49Z) - OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [77.95511352806261]
VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文 参考訳(メタデータ) (2025-10-28T13:22:39Z) - iSafetyBench: A video-language benchmark for safety in industrial environment [6.697702130929693]
iSafetyBenchは、産業環境でのモデルパフォーマンスを評価するために設計された新しいビデオ言語ベンチマークである。
iSafetyBenchは、現実世界の産業環境から得られた1100本のビデオクリップで構成されている。
ゼロショット条件下で8つの最先端ビデオ言語モデルを評価する。
論文 参考訳(メタデータ) (2025-08-01T07:55:53Z) - IndustryEQA: Pushing the Frontiers of Embodied Question Answering in Industrial Scenarios [46.421243185923814]
既存のEmbodied Question Answering (EQA)ベンチマークは主に家庭環境に焦点を当てている。
安全クリティカルな倉庫シナリオにおけるエンボディエージェント能力を評価するための最初のベンチマークであるIndustrialEQAを紹介する。
このベンチマークには、機器の安全性、人間の安全性、オブジェクト認識、属性認識、時間的理解、空間的理解の6つのカテゴリをカバーする豊富なアノテーションが含まれている。
論文 参考訳(メタデータ) (2025-05-27T02:36:17Z) - Safe-Construct: Redefining Construction Safety Violation Recognition as 3D Multi-View Engagement Task [2.0811729303868005]
違反認識を3次元多視点エンゲージメントタスクとして再構成するフレームワークであるSafe-Constructを紹介する。
Safe-Constructは、4つの違反タイプにわたる最先端メソッドよりも7.6%改善されている。
論文 参考訳(メタデータ) (2025-04-15T05:21:09Z) - IPAD: Industrial Process Anomaly Detection Dataset [71.39058003212614]
ビデオ異常検出(VAD)は,ビデオフレーム内の異常を認識することを目的とした課題である。
本稿では,産業シナリオにおけるVADに特化して設計された新しいデータセットIPADを提案する。
このデータセットは16の異なる産業用デバイスをカバーし、合成ビデオと実世界のビデオの両方を6時間以上保存している。
論文 参考訳(メタデータ) (2024-04-23T13:38:01Z) - Toward an AI-enabled Connected Industry: AGV Communication and Sensor Measurement Datasets [33.89321466798318]
産業用テストベッドにおける2つの無線計測キャンペーン:産業用車車間(iV2V)と産業用車間(iV2I+)について述べる。
iV2Vは、自動誘導車両(AGV)間のサイドリンク通信シナリオをカバーし、iV2I+は、自律的なクリーニングロボットがプライベートなセルネットワークに接続されている産業環境で実行される。
共通計測手法における異なるコミュニケーション技術の組み合わせは、指紋認証、視線検出、サービス品質の予測、といったタスクに機械学習(ML)が活用できる洞察を提供する。
論文 参考訳(メタデータ) (2022-12-20T15:04:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。