論文の概要: TrajGATFormer: A Graph-Based Transformer Approach for Worker and Obstacle Trajectory Prediction in Off-site Construction Environments
- arxiv url: http://arxiv.org/abs/2510.22205v1
- Date: Sat, 25 Oct 2025 08:08:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.911224
- Title: TrajGATFormer: A Graph-Based Transformer Approach for Worker and Obstacle Trajectory Prediction in Off-site Construction Environments
- Title(参考訳): TrajGATFormer:オフサイト建設環境における作業者・障害物軌道予測のためのグラフベースのトランスフォーマーアプローチ
- Authors: Mohammed Alduais, Xinming Li, Qipei Mei,
- Abstract要約: 本稿では, YOLOv10nとDeepSORTを統合した2つの新しい軌道予測モデルを提案する。
TrajGATFormerは4.8秒の地平線上でのADE 1.25 mとFDE 2.3 mで作業者の軌道を予測し、TrajGATFormer-Obstacleは作業者と障害物の両方に予測を拡張し、精度を向上する(ADE 1.15 m, FDE 2.2 m)。
比較分析では、どちらのモデルも従来の手法より優れており、ADEとFDEはそれぞれ最大35%、FDEは38%削減されている。
- 参考スコア(独自算出の注目度): 2.364109063408007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the demand grows within the construction industry for processes that are not only faster but also safer and more efficient, offsite construction has emerged as a solution, though it brings new safety risks due to the close interaction between workers, machinery, and moving obstacles. Predicting the future trajectories of workers and taking into account social and environmental factors is a crucial step for developing collision-avoidance systems to mitigate such risks. Traditional methods often struggle to adapt to the dynamic and unpredictable nature of construction environments. Many rely on simplified assumptions or require hand-crafted features, limiting their ability to respond to complex, real-time interactions between workers and moving obstacles. While recent data-driven methods have improved the modeling of temporal patterns, they still face challenges in capturing long-term behavior and accounting for the spatial and social context crucial to collision risk assessment. To address these limitations, this paper proposes a framework integrating YOLOv10n and DeepSORT for precise detection and tracking, along with two novel trajectory prediction models: TrajGATFormer and TrajGATFormer-Obstacle. YOLOv10n serves as the backbone for object detection, accurately identifying workers and obstacles in diverse scenes, while DeepSORT efficiently tracks them over time with unique IDs for continuity. Both models employ a transformer encoder-decoder with Graph Attention Networks (GAT) to capture temporal and spatial interactions. TrajGATFormer predicts worker trajectories with an ADE of 1.25 m and FDE of 2.3 m over a 4.8 s horizon, while TrajGATFormer-Obstacle extends prediction to both workers and obstacles, achieving higher accuracy (ADE 1.15 m, FDE 2.2 m). Comparative analysis shows both models outperform traditional methods, reducing ADE and FDE by up to 35% and 38%, respectively.
- Abstract(参考訳): 建設業界において、より速く、より安全かつ効率の良いプロセスに対する需要が増大するにつれて、オフサイト建設はソリューションとして現れてきたが、労働者、機械、移動障害の密接な相互作用により、新たな安全リスクがもたらされた。
労働者の将来の軌道を予測し、社会的・環境的要因を考慮に入れることは、そのようなリスクを軽減する衝突回避システムを開発するための重要なステップである。
伝統的な手法は、しばしば建設環境の動的で予測不可能な性質に適応するのに苦労する。
多くの人は、単純化された仮定や手作りのフィーチャに頼り、労働者と動く障害物の間の複雑なリアルタイムの相互作用に反応する能力を制限する。
近年のデータ駆動型手法は時間的パターンのモデル化を改善しているが、長期的な行動の捉え方や、衝突リスク評価に不可欠な空間的・社会的文脈を考慮に入れた上での課題に直面している。
これらの制約に対処するため,TrajGATFormerとTrajGATFormer-Obstacleという2つの新しい軌道予測モデルとともに,YOLOv10nとDeepSORTを統合するフレームワークを提案する。
YOLOv10nはオブジェクト検出のバックボーンとして機能し、さまざまなシーンの作業者や障害を正確に識別します。
どちらのモデルも、時間的および空間的相互作用をキャプチャするために、グラフアテンションネットワーク(GAT)を備えたトランスフォーマーエンコーダデコーダを使用している。
TrajGATFormerは1.25mとFDEのADEを4.8s水平線上で予測し、TrajGATFormer-Obstacleはワーカーと障害物の両方に予測を拡張して精度を向上する(ADE 1.15m、FDE 2.2m)。
比較分析では、どちらのモデルも従来の手法より優れており、ADEとFDEはそれぞれ最大35%、FDEは38%削減されている。
関連論文リスト
- Multi-Agent Path Finding in Continuous Spaces with Projected Diffusion Models [57.45019514036948]
MAPF(Multi-Agent Path Finding)は、ロボット工学における基本的な問題である。
連続空間におけるMAPFの拡散モデルと制約付き最適化を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-23T21:27:19Z) - Outlier-Robust Long-Term Robotic Mapping Leveraging Ground Segmentation [1.7948767405202701]
箱から出られる堅牢な長期ロボットマッピングシステムを提案する。
i) 外れ値の存在を否定する高速で頑健な接地分割を提案する。
粗悪なアウトリールの存在を包含する地盤セグメンテーションによるロバストな登録を提案する。
論文 参考訳(メタデータ) (2024-05-18T04:56:15Z) - SEPT: Towards Efficient Scene Representation Learning for Motion
Prediction [19.111948522155004]
本稿では,自己教師付き学習を活用し,複雑な交通シーンのための強力なモデルを開発するためのモデリングフレームワークSEPTを提案する。
実験により、SEPTはアーキテクチャ設計や機能エンジニアリングを伴わず、Argoverse 1 と Argoverse 2 のモーション予測ベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-09-26T21:56:03Z) - Traj-MAE: Masked Autoencoders for Trajectory Prediction [69.7885837428344]
軌道予測は、危険を予測して信頼性の高い自動運転システムを構築する上で重要な課題である。
本稿では,運転環境におけるエージェントの複雑な動作をよりよく表現する,軌道予測のための効率的なマスク付きオートエンコーダを提案する。
複数エージェント設定と単一エージェント設定の両方の実験結果から,Traj-MAEが最先端手法と競合する結果が得られることが示された。
論文 参考訳(メタデータ) (2023-03-12T16:23:27Z) - Safety-compliant Generative Adversarial Networks for Human Trajectory
Forecasting [95.82600221180415]
群衆における人間予測は、社会的相互作用をモデル化し、衝突のないマルチモーダル分布を出力するという課題を提示する。
SGANv2は、動き時間相互作用モデリングと変圧器に基づく識別器設計を備えた安全に配慮したSGANアーキテクチャである。
論文 参考訳(メタデータ) (2022-09-25T15:18:56Z) - Domain Adaptation for Outdoor Robot Traversability Estimation from RGB
data with Safety-Preserving Loss [12.697106921197701]
本稿では,車載RGBカメラの視野内で異なる経路のトラバーススコアを推定し,予測する深層学習に基づくアプローチを提案する。
次に、勾配反転非教師付き適応によるドメインシフトに対処することで、モデルの能力を向上する。
実験結果から,本手法は移動可能領域を良好に同定し,目に見えない場所に一般化できることが示唆された。
論文 参考訳(メタデータ) (2020-09-16T09:19:33Z) - End-to-end Contextual Perception and Prediction with Interaction
Transformer [79.14001602890417]
我々は3次元物体の検出と将来の動きを自動運転の文脈で予測する問題に取り組む。
空間的・時間的依存関係を捉えるために,新しいトランスフォーマーアーキテクチャを用いたリカレントニューラルネットワークを提案する。
私たちのモデルはエンドツーエンドでトレーニングでき、リアルタイムで実行されます。
論文 参考訳(メタデータ) (2020-08-13T14:30:12Z) - SSP: Single Shot Future Trajectory Prediction [26.18589883075203]
我々は,高度に混雑した環境下で自律的なエージェントに適用可能な,将来の軌道予測に対する堅牢な解を提案する。
まず, 複合場を用いて, 全道路エージェントの位置を単発で予測し, 一定の時間で予測する。
第二に、エージェント間の相互作用は非局所的な応答としてモデル化され、異なる場所間の空間的関係を時間的に捉えることができる。
第3に、シーンの意味的コンテキストをモデル化し、将来の動きに影響を与える可能性のある環境制約を考慮に入れます。
論文 参考訳(メタデータ) (2020-04-13T09:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。