論文の概要: GAZELOAD A Multimodal Eye-Tracking Dataset for Mental Workload in Industrial Human-Robot Collaboration
- arxiv url: http://arxiv.org/abs/2601.21829v1
- Date: Thu, 29 Jan 2026 15:12:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.013663
- Title: GAZELOAD A Multimodal Eye-Tracking Dataset for Mental Workload in Industrial Human-Robot Collaboration
- Title(参考訳): GAZELOAD : 産業ロボット協調作業におけるメンタルワークロードのためのマルチモーダルアイトラックデータセット
- Authors: Bsher Karbouj, Baha Eddin Gaaloul, Jorg Kruger,
- Abstract要約: データは、26人の参加者が2つのロボットと対話する実験室の組み立てテストベッドで収集された。
データセットは、視線追跡信号を環境リアルタイムかつ連続的な測定で同期する。
これらのデータは、メンタルワークロード推定のためのアルゴリズムの開発とベンチマークに使用することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This article describes GAZELOAD, a multimodal dataset for mental workload estimation in industrial human-robot collaboration. The data were collected in a laboratory assembly testbed where 26 participants interacted with two collaborative robots (UR5 and Franka Emika Panda) while wearing Meta ARIA smart glasses. The dataset time-synchronizes eye-tracking signals (pupil diameter, fixations, saccades, eye gaze, gaze transition entropy, fixation dispersion index) with environmental real-time and continuous measurements (illuminance) and task and robot context (bench, task block, induced faults), under controlled manipulations of task difficulty and ambient conditions. For each participant and workload-graded task block, we provide CSV files with ocular metrics aggregated into 250 ms windows, environmental logs, and self-reported mental workload ratings on a 1-10 Likert scale, organized in participant-specific folders alongside documentation. These data can be used to develop and benchmark algorithms for mental workload estimation, feature extraction, and temporal modeling in realistic industrial HRC scenarios, and to investigate the influence of environmental factors such as lighting on eye-based workload markers.
- Abstract(参考訳): 本稿では,産業用ロボットコラボレーションにおけるメンタルワークロード推定のためのマルチモーダルデータセットであるGAZELOADについて述べる。
このデータは、26人の被験者がMeta ARIAスマートグラスを着用しながら、2つのロボット(UR5とFranka Emika Panda)と対話する実験室で収集された。
データセットは、タスク困難と環境条件の制御された操作の下で、環境リアルタイムかつ連続的な計測(照度)とタスクとロボットコンテキスト(ベンチ、タスクブロック、誘導障害)とで、アイトラッキング信号(瞳径、固定、サケード、視線、視線遷移エントロピー、固定分散指数)を同期する。
CSVファイルには250msの窓, 環境ログ, 1-10 Likertスケールの自己報告型メンタルワークロード評価が集約され, 参加者固有のフォルダーで構成されている。
これらのデータは、現実的な工業的HRCシナリオにおけるメンタルワークロード推定、特徴抽出、時間的モデリングのためのアルゴリズムの開発とベンチマークに利用することができ、また、照明などの環境要因が目ベースのワークロードマーカーに与える影響を調べることができる。
関連論文リスト
- IndEgo: A Dataset of Industrial Scenarios and Collaborative Work for Egocentric Assistants [7.869752673792282]
IndEgoは、一般的な産業タスクに対処するマルチモーダルなエゴセントリックでエクソセントリックなデータセットである。
データセットには3,460件のエゴセントリックな記録(約197時間)と1,092件のエゴセントリックな記録が含まれている。
データセットの重要な焦点は、協調作業であり、2人の労働者が共同で認知的および身体的に集中的なタスクを行う。
論文 参考訳(メタデータ) (2025-11-24T20:45:17Z) - MM-OR: A Large Multimodal Operating Room Dataset for Semantic Understanding of High-Intensity Surgical Environments [49.45034796115852]
手術室(オペレーティングルーム、英: Operating room, OR)は、医療スタッフ、工具、機器間の相互作用を正確に理解する必要がある複雑な高所環境である。
現在のデータセットは、スケール、リアリズムにおいて不足しており、ORシーンの性質を捉えておらず、ORモデリングにおけるマルチモーダルを制限する。
本稿では,現実的で大規模なマルチモーダルORデータセットであるMM-ORと,マルチモーダルなシーングラフ生成を実現するための最初のデータセットを紹介する。
論文 参考訳(メタデータ) (2025-03-04T13:00:52Z) - A Multimodal Dataset for Enhancing Industrial Task Monitoring and Engagement Prediction [5.73110247142357]
現実的なアセンブリと分解タスクをキャプチャする新しいデータセットを提案する。
データセットは、22セッションから収集されたマルチビューRGB、深さ、慣性測定ユニット(IMU)データを含み、未トリミングビデオの290分に相当する。
提案手法は, 動的産業環境におけるオペレータのパフォーマンス監視のための堅牢なソリューションとして, エンゲージメント状態の認識精度を向上させる。
論文 参考訳(メタデータ) (2025-01-10T12:57:33Z) - A vision-based framework for human behavior understanding in industrial assembly lines [0.7037008937757392]
本稿では,産業用組立ラインにおける人間の行動の把握と理解のためのビジョンベースフレームワークを提案する。
このフレームワークは高度なコンピュータビジョン技術を活用し、労働者の位置と3Dポーズを推定し、作業姿勢、行動、タスク進捗を分析する。
重要なコントリビューションは、現実的な環境でキャプチャされたドメイン関連アセンブリアクションを含む、CarDAデータセットの導入である。
論文 参考訳(メタデータ) (2024-09-25T21:03:13Z) - Computer-Vision-Enabled Worker Video Analysis for Motion Amount Quantification [2.7523980737007414]
本稿では,上肢動作の追跡と定量化のための新しい枠組みを提案する。
姿勢推定による関節位置データを用いて、このフレームワークは、運動量の定量化と監視にHotellingの$T2$統計を使用する。
収集した動きデータに基づいてトレーニングされたランダムフォレストモデルを、UCFスポーツアクションやUCF50を含む複数のデータセットに対してベンチマークした。
論文 参考訳(メタデータ) (2024-05-22T21:15:03Z) - BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - A Video-Based Activity Classification of Human Pickers in Agriculture [0.4915744683251149]
ビデオベースのヒューマンピッカー検出のためのベンチマークモデルを作成する。
提案手法では,Mask領域をベースとした畳み込みニューラルネットワーク(Mask R-CNN)をオブジェクト検出に用いた。
カーネル密度推定(KDE)分析とK平均クラスタリングアルゴリズムに基づいて分類基準を定義する。
論文 参考訳(メタデータ) (2023-11-17T22:02:42Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。