論文の概要: TATIC: Task-Aware Temporal Learning for Human Intent Inference from Physical Corrections in Human-Robot Collaboration
- arxiv url: http://arxiv.org/abs/2603.11077v1
- Date: Tue, 10 Mar 2026 21:19:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.188674
- Title: TATIC: Task-Aware Temporal Learning for Human Intent Inference from Physical Corrections in Human-Robot Collaboration
- Title(参考訳): TATIC:人間-ロボット共同作業における身体的補正からの人間意図推論のためのタスク認識型時間学習
- Authors: Jiurun Song, Xiao Liang, Minghui Zheng,
- Abstract要約: ヒューマンロボットコラボレーション(HRC)では、ロボットは動的タスクの制約にオンラインで適応し、人間の意図を進化させなければならない。
本稿では,トルクベース接触力推定とタスク対応時間畳み込みネットワーク(TCN)を利用した個別タスクレベルの意図を推定する統合フレームワークTATICを提案する。
実験は意図認識において0.904 Macro-F1のスコアを獲得し、ハードウェアの検証に成功した。
- 参考スコア(独自算出の注目度): 3.4672098154671995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In human-robot collaboration (HRC), robots must adapt online to dynamic task constraints and evolving human intent. While physical corrections provide a natural, low-latency channel for operators to convey motion-level adjustments, extracting task-level semantic intent from such brief interactions remains challenging. Existing foundation-model-based approaches primarily rely on vision and language inputs and lack mechanisms to interpret physical feedback. Meanwhile, traditional physical human-robot interaction (pHRI) methods leverage physical corrections for trajectory guidance but struggle to infer task-level semantics. To bridge this gap, we propose TATIC, a unified framework that utilizes torque-based contact force estimation and a task-aware Temporal Convolutional Network (TCN) to jointly infer discrete task-level intent and estimate continuous motion-level parameters from brief physical corrections. Task-aligned feature canonicalization ensures robust generalization across diverse layouts, while an intent-driven adaptation scheme translates inferred human intent into robot motion adaptations. Experiments achieve a 0.904 Macro-F1 score in intent recognition and demonstrate successful hardware validation in collaborative disassembly (see experimental video at https://youtu.be/xF8A52qwEc8).
- Abstract(参考訳): ヒューマンロボットコラボレーション(HRC)では、ロボットは動的タスクの制約にオンラインで適応し、人間の意図を進化させなければならない。
物理補正は、操作者が動作レベルの調整を行うための自然な低遅延チャネルを提供するが、このような短い相互作用からタスクレベルの意味的意図を抽出することは依然として困難である。
既存の基礎モデルに基づくアプローチは、主に視覚と言語入力に依存し、物理的フィードバックを解釈するメカニズムが欠如している。
一方、従来の物理的人間-ロボット相互作用 (pHRI) 法は、軌道誘導のための物理的補正を利用するが、タスクレベルの意味論を推測するのに苦労する。
このギャップを埋めるために,トルクベース接触力推定とタスク対応時間畳み込みネットワーク(TCN)を併用し,離散的なタスクレベルの意図を推定し,簡単な物理補正から連続的な動きレベルパラメータを推定する統合フレームワークTATICを提案する。
タスク整列型特徴正規化は多様なレイアウトをまたいだ堅牢な一般化を保証する一方、意図駆動型適応スキームは推論された人間の意図をロボットの動き適応に変換する。
実験は意図認識における0.904 Macro-F1スコアを達成し、協調的な分解でハードウェア検証を成功させた(https://youtu.be/xF8A52qwEc8の実験的ビデオを参照)。
関連論文リスト
- Language-Grounded Decoupled Action Representation for Robotic Manipulation [78.42228162226839]
認識と制御を結びつけるために,Language-Grounded Decoupled Action Representation (LaDA) フレームワークを提案する。
LaDAは3つの解釈可能なアクションプリミティブ(翻訳、回転、グリップ制御)の微細な中間層を導入し、低レベルのアクションに対して明示的な意味構造を提供する。
さらに、セマンティックガイダンスによるソフトラベルのコントラスト学習の目的を用いて、類似のアクションプリミティブをタスク間で整列させ、一般化と動きの整合性を高める。
論文 参考訳(メタデータ) (2026-03-13T13:08:26Z) - InterPrior: Scaling Generative Control for Physics-Based Human-Object Interactions [58.329946838699044]
人間は、明示的な全身運動のレベルで、物体と全身の相互作用を計画することは滅多にない。
このような事前のスケーリングは、ヒューマノイドがロコ操作スキルの構築と一般化を可能にする鍵となる。
我々は,強化学習による大規模模倣事前学習とポストトレーニングを通じて,統合生成コントローラを学習するフレームワークであるInterPriorを紹介する。
論文 参考訳(メタデータ) (2026-02-05T18:59:27Z) - ConceptACT: Episode-Level Concepts for Sample-Efficient Robotic Imitation Learning [2.9277370836568264]
ConceptACTはAction Chunking with Transformersの拡張で、トレーニング中にエピソードレベルのセマンティックな概念アノテーションを活用して学習効率を向上させる。
我々は、最終エンコーダ層が人間のアノテーションと整合するように調整された、概念認識のクロスアテンションを実装するトランスフォーマーアーキテクチャを用いて概念を統合する。
論文 参考訳(メタデータ) (2026-01-23T19:24:00Z) - Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8381970762877]
VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-09T09:08:33Z) - HHI-Assist: A Dataset and Benchmark of Human-Human Interaction in Physical Assistance Scenario [63.77482302352545]
HHI-Assist(ヒヒ・アシスト)は、人間の介助作業における人間のインタラクションのモーションキャプチャークリップからなるデータセットである。
私たちの研究は、ロボット支援ポリシーを大幅に強化する可能性がある。
論文 参考訳(メタデータ) (2025-09-12T09:38:17Z) - Towards Immersive Human-X Interaction: A Real-Time Framework for Physically Plausible Motion Synthesis [51.95817740348585]
Human-Xは、様々な実体をまたいだ没入的で物理的に妥当なヒューマンインタラクションを可能にするために設計された、新しいフレームワークである。
本手法は, 自己回帰型反応拡散プランナを用いて, リアルタイムに反応と反応を同時予測する。
我々のフレームワークは、人間とロボットのインタラクションのための仮想現実インターフェースを含む、現実世界のアプリケーションで検証されている。
論文 参考訳(メタデータ) (2025-08-04T06:35:48Z) - DTRT: Enhancing Human Intent Estimation and Role Allocation for Physical Human-Robot Collaboration [8.019409744686877]
人間の意図推定と合理的な人間ロボットの役割割り当ては、安全かつ効率的な援助に不可欠である。
人間の誘導運動と強制データを利用する階層型アーキテクチャを備えたDual Transformer-based Robot Trajectron (DTRT)を提案する。
DTRTの正確な意図推定とコラボレーションのパフォーマンスを示す実験。
論文 参考訳(メタデータ) (2025-05-23T05:33:59Z) - Hierarchical Procedural Framework for Low-latency Robot-Assisted Hand-Object Interaction [45.256762954338704]
ロボット支援ハンドオブジェクトインタラクション(HOI)を実現するための階層型手続きフレームワークを提案する。
オープンループ階層は、手の動きをロボットの動きに変換するように設計されたモーションプリミティブに基づいて、RGBベースの人間の手の3D再構成を利用する。
リングウェアリングタスクのケーススタディは、医療や製造業などの補助技術への本研究の適用の可能性を示している。
論文 参考訳(メタデータ) (2024-05-29T21:20:16Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。