Fugu-MT 論文翻訳(概要): Generative AI for Visualizing Highway Construction Hazards Through Synthetic Images and Temporal Sequences

論文の概要: Generative AI for Visualizing Highway Construction Hazards Through Synthetic Images and Temporal Sequences

arxiv url: http://arxiv.org/abs/2605.11276v1
Date: Mon, 11 May 2026 21:59:36 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-13 21:48:56.44921
Title: Generative AI for Visualizing Highway Construction Hazards Through Synthetic Images and Temporal Sequences
Title（参考訳）: 合成画像と時間シーケンスによるハイウェイ建設ハザードの可視化のための生成AI
Authors: Trevor Neece, Mason Smetana, Lev Khazanovich,
Abstract要約: 本研究は,高速道路建設のハザードを合成可視化する生成的AI手法を開発し,評価する。この作業により、安全トレーナーは、現実の危険を撮影することなく、ストーリーテリングとビジュアルラーニング素材を組み合わせられる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Highway construction workers face a high risk of serious injury or death. Image-based training materials depicting hazardous scenarios are essential for engaging safety instruction but remain scarce due to ethical and logistical barriers. This study develops and evaluates a generative AI methodology for producing synthetic visualizations of highway construction hazards from OSHA Severe Injury Report narratives. Two modes were developed: a single-pass approach yielding one image per incident, and a temporal approach producing a four-stage sequence. A sample of 75 incident records yielded 750 images, evaluated using CLIP-based semantic retrieval and expert assessment across dimensions such as educational utility, fidelity, and alignment. Single-pass images achieved 81.1% educational acceptability with fidelity and alignment scores of 4.14/5 and 4.07/5, respectively, while temporal sequences achieved 60.9% acceptability with comparable alignment (3.94/5) but lower fidelity (3.51/5). CLIP-based retrieval revealed that both modes produce images with statistically significant retrieval capabilities. This is among the first studies to leverage modern autoregressive image generation models for visualizing construction hazards from reported severe injuries and to generate temporally sequenced hazard imagery, and a new multi-dimensional evaluation framework was developed to support future research in this domain. The work enables safety trainers to pair narrative storytelling with visual learning material without photographing real-world hazards, and the framework could be applied to datasets across diverse domains, enabling synthetic image generation tailored to new application areas.
Abstract（参考訳）: 高速道路の建設作業員は、重傷や死亡のリスクが高い。危険シナリオを描写したイメージベーストレーニング教材は、安全指導を行う上では不可欠であるが、倫理的・論理的障壁のため不足している。本研究は,OSHA重傷報告の物語からハイウェイ建設ハザードの合成可視化を作成するための生成的AI手法を開発し,評価する。 2つのモードが開発された: シングルパスアプローチはインシデント毎に1つのイメージを出力し、時間的アプローチは4段階のシーケンスを生成する。 75件のインシデント記録のサンプルは750枚の画像を取得し,CLIPに基づくセマンティック検索と,教育的有用性,忠実性,アライメントといった分野の専門的評価を行った。シングルパス画像は、それぞれ4.14/5と4.07/5のアライメントスコアで81.1%の教育受理性を達成し、テンポラルシーケンスは60.9%のアライメント(3.94/5)と低いアライメント(3.51/5)を達成した。 CLIPに基づく検索では、どちらのモードも統計的に有意な検索能力を持つ画像を生成することがわかった。これは、現代の自己回帰画像生成モデルを利用して、報告された重傷から建設の危険を可視化し、時間的にシーケンスされた危険画像を生成する最初の研究であり、この領域における将来の研究を支援するために、新しい多次元評価フレームワークを開発した。この作業により、現実のハザードを撮影することなく、ストーリーテリングとビジュアルラーニング素材を組み合わせられるようになり、フレームワークはさまざまな領域にわたるデータセットに適用でき、新しい応用領域に合わせた合成画像生成が可能になる。

関連論文リスト

Intermediate Representations are Strong AI-Generated Image Detectors [51.7378156094049]
中間層にデータ感度を埋め込んでAI生成画像を検出する検索手法を提案する。提案手法は, 実画像とAI生成画像の集合を考慮し, 原画像の埋め込みと摂動画像の埋め込みの類似性を調べ, 類似性に基づいてAI生成画像を検出する。本手法は,Forensics Smallベンチマークにおいて,AUROCスコアの最良のトレーニングベース手法と比較して39.61%向上し,5.14%向上した。
論文参考訳（メタデータ） (2026-05-05T23:26:02Z)
Supervised Contrastive Learning for Few-Shot AI-Generated Image Detection and Attribution [3.103291412074661]
本研究では,合成画像検出に固有の一般化問題に対処する新しい2段階検出フレームワークを提案する。提案手法は,既存手法よりも5.2ポイント向上した平均検出精度91.3%を実現する。
論文参考訳（メタデータ） (2025-11-20T16:53:24Z)
Scene Graph-Guided Generative AI Framework for Synthesizing and Evaluating Industrial Hazard Scenarios [0.0]
職場の危険を正確に検出するための視覚モデルの訓練には、事故につながる危険条件のリアルなイメージが必要である。本研究では,OSHA(Occupational Safety and Health Administration)の事故報告に基づく危険シナリオのフォトリアリスティックなイメージを合成する,新しいシーングラフ誘導型生成AIフレームワークを提案する。
論文参考訳（メタデータ） (2025-11-17T22:58:27Z)
Bridging the Gap Between Ideal and Real-world Evaluation: Benchmarking AI-Generated Image Detection in Challenging Scenarios [54.07895223545793]
本稿では,実世界ロバストネスデータセット(RRDataset)を導入し,3次元にわたる検出モデルの包括的評価を行う。 RRDatasetには7つの主要なシナリオの高品質なイメージが含まれている。我々はRRDataset上で17の検出器と10の視覚言語モデル(VLM)をベンチマークし、大規模な人間実験を行った。
論文参考訳（メタデータ） (2025-09-11T06:15:52Z)
Low Resource Reconstruction Attacks Through Benign Prompts [12.077836270816622]
我々は、低リソースを必要とする新たな攻撃を考案し、実際のトレーニングセットへのアクセスをほとんど、あるいは全く想定しない。これは、画像がインフォームされたユーザによって、意図せずに再構築されるリスクを強調します。
論文参考訳（メタデータ） (2025-07-10T17:32:26Z)
RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors [57.81012948133832]
本稿では,72kの多種多様かつ高い変換可能な対向例からなるRAID(Robust Evaluation of AI- generated Image Detectors)を提案する。提案手法は,未知の検出器に高い成功率で転送する逆画像を生成する。以上の結果から,現在最先端のAI生成画像検出器は,敵の例によって容易に認識できることが示唆された。
論文参考訳（メタデータ） (2025-06-04T14:16:00Z)
Epistemic Uncertainty for Generated Image Detection [107.62647907393377]
本稿では,創成モデルの時代において重要なセキュリティ問題に対処することを目的とした,てんかん不確実性によるAI生成画像検出のための新しいフレームワークを提案する。我々の重要な洞察は、トレーニングとテストデータの分布の相違が、機械学習モデルのエピステマティック不確実性空間に顕著に現れていることに起因している。
論文参考訳（メタデータ） (2024-12-08T11:32:25Z)
Information Theoretic Text-to-Image Alignment [49.396917351264655]
相互情報(MI)は、モデルアライメントのガイドに使用される。本手法は,自己教師型微調整を用いて,プロンプトと画像間のポイントワイド(MI)推定に依存する。解析の結果,本手法は最先端の手法よりも優れているが,MIを推定するにはT2Iモデル自体の事前学習されたデノナイジングネットワークが必要であることが示唆された。
論文参考訳（メタデータ） (2024-05-31T12:20:02Z)
RIGID: A Training-free and Model-Agnostic Framework for Robust AI-Generated Image Detection [60.960988614701414]
RIGIDは、堅牢なAI生成画像検出のためのトレーニング不要でモデルに依存しない方法である。 RIGIDは、既存のトレーニングベースおよびトレーニング不要な検出器を著しく上回っている。
論文参考訳（メタデータ） (2024-05-30T14:49:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。