論文の概要: Task-Oriented Human Grasp Synthesis via Context- and Task-Aware Diffusers
- arxiv url: http://arxiv.org/abs/2507.11287v1
- Date: Tue, 15 Jul 2025 13:11:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.119455
- Title: Task-Oriented Human Grasp Synthesis via Context- and Task-Aware Diffusers
- Title(参考訳): コンテキスト・タスク認識ディフューザによるタスク指向型ヒトグラフ合成
- Authors: An-Lun Liu, Yu-Wei Chao, Yi-Ting Chen,
- Abstract要約: タスク指向のヒューマン・グリップ・シンセサイザーは,タスクとコンテキストの両方の認識を必要とする新しいグリップ・シンセサイザー・タスクである。
本手法のコアとなるのは,シーンやタスク情報を考慮に入れたタスク対応コンタクトマップである。
本実験は,シーンとタスクの両方をモデル化することの重要性を検証し,把握品質とタスク性能の両面で有意な改善を示した。
- 参考スコア(独自算出の注目度): 10.774404324000349
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study task-oriented human grasp synthesis, a new grasp synthesis task that demands both task and context awareness. At the core of our method is the task-aware contact maps. Unlike traditional contact maps that only reason about the manipulated object and its relation with the hand, our enhanced maps take into account scene and task information. This comprehensive map is critical for hand-object interaction, enabling accurate grasping poses that align with the task. We propose a two-stage pipeline that first constructs a task-aware contact map informed by the scene and task. In the subsequent stage, we use this contact map to synthesize task-oriented human grasps. We introduce a new dataset and a metric for the proposed task to evaluate our approach. Our experiments validate the importance of modeling both scene and task, demonstrating significant improvements over existing methods in both grasp quality and task performance. See our project page for more details: https://hcis-lab.github.io/TOHGS/
- Abstract(参考訳): 本稿では,タスク指向のヒューマン・グリップ・シンセサイザー,タスク指向のヒューマン・グリップ・シンセサイザー,タスク指向のヒューマン・グリップ・シンセサイザーについて検討する。
我々の手法の核心は、タスク対応コンタクトマップである。
操作対象とその手との関係についてのみ推論する従来のコンタクトマップとは異なり、拡張されたマップはシーンやタスク情報を考慮に入れている。
この包括的なマップは、手動とオブジェクトの相互作用に重要であり、タスクと整合した正確な把握ポーズを可能にする。
本稿では,まず,シーンとタスクによって通知されるタスク対応コンタクトマップを構築するための2段階パイプラインを提案する。
その後の段階では、このコンタクトマップを使用してタスク指向の人間のグリップを合成する。
提案手法を評価するために,提案課題のための新しいデータセットとメトリクスを導入する。
本実験は,シーンとタスクの両方をモデル化することの重要性を検証し,品質とタスク性能の両面において,既存の手法よりも大幅に改善されていることを示す。
詳細はプロジェクトページを参照してください。
関連論文リスト
- Is Visual in-Context Learning for Compositional Medical Tasks within Reach? [68.56630652862293]
本稿では、1つのモデルで複数のタスクを処理できるビジュアル・イン・コンテキスト・ラーニングの可能性について検討する。
本稿では,合成合成タスク生成エンジンを用いたコンテキスト内学習者の学習方法を提案する。
論文 参考訳(メタデータ) (2025-07-01T15:32:23Z) - Leverage Task Context for Object Affordance Ranking [57.59106517732223]
25の共通タスク、50k以上の画像、661k以上のオブジェクトからなる、最初の大規模タスク指向のアベイランスランキングデータセットを構築しました。
その結果,タスクコンテキストに基づくアベイランス学習のパラダイムの実現可能性と,サリエンシランキングやマルチモーダルオブジェクト検出の分野における最先端モデルよりも,我々のモデルの方が優れていることが示された。
論文 参考訳(メタデータ) (2024-11-25T04:22:33Z) - Task-Driven Exploration: Decoupling and Inter-Task Feedback for Joint Moment Retrieval and Highlight Detection [7.864892339833315]
本稿では,共同モーメント検索とハイライト検出のためのタスク駆動型トップダウンフレームワークを提案する。
このフレームワークはタスク固有の共通表現をキャプチャするタスク分離ユニットを導入している。
QVHighlights、TVSum、Charades-STAデータセットに関する総合的な実験と詳細なアブレーション研究は、提案フレームワークの有効性と柔軟性を裏付けるものである。
論文 参考訳(メタデータ) (2024-04-14T14:06:42Z) - MTLSegFormer: Multi-task Learning with Transformers for Semantic
Segmentation in Precision Agriculture [16.817025300716796]
マルチタスク学習とアテンション機構を組み合わせたセマンティックセグメンテーション手法MTLSegFormerを提案する。
相関したタスクで2つの困難な問題で性能を検証し、精度を大幅に改善した。
論文 参考訳(メタデータ) (2023-05-04T13:19:43Z) - Relational Multi-Task Learning: Modeling Relations between Data and
Tasks [84.41620970886483]
マルチタスク学習における主要な前提は、推論時にモデルが与えられたデータポイントにのみアクセスできるが、他のタスクからのデータポイントのラベルにはアクセスできないことである。
ここでは、補助的なタスクからデータポイントラベルを活用してより正確な予測を行う、新しいリレーショナルマルチタスク学習環境を提案する。
私たちはMetaLinkを開発し、そこではデータポイントとタスクを接続するナレッジグラフを構築します。
論文 参考訳(メタデータ) (2023-03-14T07:15:41Z) - Unsupervised Task Graph Generation from Instructional Video Transcripts [53.54435048879365]
本研究では,実世界の活動を行う指導ビデオのテキスト書き起こしを提供する環境について考察する。
目標は、これらの重要なステップ間の依存関係関係と同様に、タスクに関連する重要なステップを特定することです。
本稿では,命令調整言語モデルの推論能力とクラスタリングとランキングコンポーネントを組み合わせたタスクグラフ生成手法を提案する。
論文 参考訳(メタデータ) (2023-02-17T22:50:08Z) - Task Compass: Scaling Multi-task Pre-training with Task Prefix [122.49242976184617]
既存の研究では、大規模教師付きタスクによるマルチタスク学習がタスク間の負の効果に悩まされていることが示されている。
タスク間の関係を探索するために,タスクプレフィックスガイド付きマルチタスク事前学習フレームワークを提案する。
我々のモデルは、幅広いタスクの強力な基盤バックボーンとして機能するだけでなく、タスク関係を分析するための探索ツールとしても実現可能である。
論文 参考訳(メタデータ) (2022-10-12T15:02:04Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Towards All-around Knowledge Transferring: Learning From Task-irrelevant
Labels [44.036667329736225]
既存の取り組みは、この問題に取り組むために、タスク関連知識を他の類似データから移すことに重点を置いている。
これまでタスク非関連の特徴の影響を調査する大規模な研究は行われていない。
本稿では,タスク非関連ラベルから主に抽出されるタスク非関連特徴を利用するタスク非関連変換学習を提案する。
論文 参考訳(メタデータ) (2020-11-17T06:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。