論文の概要: Leveraging Synthetic Data for Enhancing Egocentric Hand-Object Interaction Detection
- arxiv url: http://arxiv.org/abs/2603.29733v1
- Date: Tue, 31 Mar 2026 13:32:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.682241
- Title: Leveraging Synthetic Data for Enhancing Egocentric Hand-Object Interaction Detection
- Title(参考訳): Egocentric Hand-Object Interaction Detection のための合成データの活用
- Authors: Rosario Leonardi, Antonino Furnari, Francesco Ragusa, Giovanni Maria Farinella,
- Abstract要約: 本研究は,エゴセントリック画像から手動物体のインタラクションを検出することにおける合成データの役割について考察する。
合成データと実際のラベル付きデータの10%しか使用せず、実データのみにトレーニングされたモデルよりも総合的なAPの改善を実現している。
- 参考スコア(独自算出の注目度): 23.019466723490297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we explore the role of synthetic data in improving the detection of Hand-Object Interactions from egocentric images. Through extensive experimentation and comparative analysis on VISOR, EgoHOS, and ENIGMA-51 datasets, our findings demonstrate the potential of synthetic data to significantly improve HOI detection, particularly when real labeled data are scarce or unavailable. By using synthetic data and only 10% of the real labeled data, we achieve improvements in Overall AP over models trained exclusively on real data, with gains of +5.67% on VISOR, +8.24% on EgoHOS, and +11.69% on ENIGMA-51. Furthermore, we systematically study how aligning synthetic data to specific real-world benchmarks with respect to objects, grasps, and environments, showing that the effectiveness of synthetic data consistently improves with better synthetic-real alignment. As a result of this work, we release a new data generation pipeline and the new HOI-Synth benchmark, which augments existing datasets with synthetic images of hand-object interaction. These data are automatically annotated with hand-object contact states, bounding boxes, and pixel-wise segmentation masks. All data, code, and tools for synthetic data generation are available at: https://fpv-iplab.github.io/HOI-Synth/.
- Abstract(参考訳): 本研究では,エゴセントリック画像から手動物体のインタラクションを検出することにおける合成データの役割について検討する。
VISOR, EgoHOS, ENIGMA-51データセットの広範囲な実験および比較分析により, 実ラベル付きデータが不足あるいは利用できない場合に, HOI検出を大幅に改善する合成データの可能性を示した。
合成データと実際のラベル付きデータの10%しか使用せず、実際のデータにのみ訓練されたモデルよりもAP全体の改善を実現しており、VISORでは+5.67%、EgoHOSでは+8.24%、ENIGMA-51では+11.69%である。
さらに, 対象, 把握, 環境に対して, 特定の実世界のベンチマークと合成データの整合性について系統的に検討し, 合成データの有効性は, より優れた合成リアルアライメントによって一貫して改善されることを示した。
この研究の結果、我々は新しいデータ生成パイプラインとHOI-Synthベンチマークをリリースし、既存のデータセットを手動オブジェクト間相互作用の合成画像で拡張した。
これらのデータは、手動の接触状態、バウンディングボックス、ピクセルワイドセグメンテーションマスクで自動的に注釈付けされる。
合成データ生成のためのデータ、コード、ツールはすべて、https://fpv-iplab.github.io/HOI-Synth/で利用可能である。
関連論文リスト
- Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。
合成データがモデル一般化をどのように改善するかを批判的に検討する。
本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文 参考訳(メタデータ) (2025-09-07T19:28:52Z) - SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data [78.70620682374624]
ハイレベルなテキスト記述に基づく表情画像データの合成のための新しいフレームワークであるSynFERを紹介する。
合成データの質と信頼性を確保するため,セマンティックガイダンス手法と擬似ラベル生成手法を提案する。
その結果, 提案手法の有効性と合成データの有効性が検証された。
論文 参考訳(メタデータ) (2024-10-13T14:58:21Z) - On the Equivalency, Substitutability, and Flexibility of Synthetic Data [9.459709213597707]
本研究では,合成データと実世界のデータとの等価性,実データに対する合成データの置換可能性,合成データ生成装置の柔軟性について検討する。
以上の結果から, 合成データによりモデル性能が向上するだけでなく, 実データへの置換性も向上し, 性能損失の60%から80%が置換可能であることが示唆された。
論文 参考訳(メタデータ) (2024-03-24T17:21:32Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - Are Synthetic Data Useful for Egocentric Hand-Object Interaction Detection? [12.987587227876565]
本研究では,エゴセントリックな手・物体間相互作用検出における合成データの有効性について検討した。
実際のラベル付きデータの10%しか利用できないため、実際のデータにのみ訓練されたベースラインと比較して、全体的なAPの改善を実現しています。
論文 参考訳(メタデータ) (2023-12-05T11:29:00Z) - TarGEN: Targeted Data Generation with Large Language Models [51.87504111286201]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。
我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。
合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文 参考訳(メタデータ) (2023-10-27T03:32:17Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。