Fugu-MT 論文翻訳(概要): Exocentric To Egocentric Transfer For Action Recognition: A Short Survey

論文の概要: Exocentric To Egocentric Transfer For Action Recognition: A Short Survey

arxiv url: http://arxiv.org/abs/2410.20621v1
Date: Sun, 27 Oct 2024 22:38:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:41.071709
Title: Exocentric To Egocentric Transfer For Action Recognition: A Short Survey
Title（参考訳）: Exocentric to Egocentric Transfer for Action Recognition: 短期調査
Authors: Anirudh Thatipelli, Shao-Yuan Lo, Amit K. Roy-Chowdhury,
Abstract要約: エゴセントリックな視覚は、カメラ装着者の視点からシーンを捉えます。外見中心の視覚はシーン全体のコンテキストを捉えます。エゴとエクソビューの併用モデリングは、次世代AIエージェントの開発に不可欠である。
参考スコア（独自算出の注目度）: 25.41820386246096
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Egocentric vision captures the scene from the point of view of the camera wearer while exocentric vision captures the overall scene context. Jointly modeling ego and exo views is crucial to developing next-generation AI agents. The community has regained interest in the field of egocentric vision. While the third-person view and first-person have been thoroughly investigated, very few works aim to study both synchronously. Exocentric videos contain many relevant signals that are transferrable to egocentric videos. In this paper, we provide a broad overview of works combining egocentric and exocentric visions.
Abstract（参考訳）: エゴセントリック・ビジョンはカメラ装着者の視点からシーンを捉え、エゴセントリック・ビジョンはシーン全体のコンテキストを捉えます。エゴとエクソビューの併用モデリングは、次世代AIエージェントの開発に不可欠である。コミュニティは自我中心のビジョンの分野への関心を取り戻した。 3人称視点と1人称視点は徹底的に研究されているが,両者を同期的に研究することを目的とした作品はほとんどない。エキゾセントリックなビデオには、エゴセントリックなビデオに転送可能な多くの関連信号が含まれている。本稿では,エゴセントリックなビジョンとエゴセントリックなビジョンを組み合わせた作品の概要について述べる。

関連論文リスト

From My View to Yours: Ego-Augmented Learning in Large Vision Language Models for Understanding Exocentric Daily Living Activities [7.952665773362793]
我々は,エゴセントリックな視点の相補的な性質を活用し,LVLMのエゴセントリックなADLビデオに対する理解を高めることを目的としている。このアプローチは効果的だが、大規模な収集には実用的ではないペア付きエゴエクソビデオが必要である。合成データに基づいて訓練されたLVLMのエゴ表現を強化するため,我々はドメイン・ア・ブートストラップ付きego2exogstic戦略を開発した。
論文参考訳（メタデータ） (2025-01-10T05:01:58Z)
Ego3DT: Tracking Every 3D Object in Ego-centric Videos [20.96550148331019]
本稿では,エゴ中心映像からの物体の3次元再構成と追跡のための新しいゼロショット手法を提案する。 Ego3DTは,エゴ環境内のオブジェクトの検出とセグメンテーション情報を最初に識別し,抽出する新しいフレームワークである。また,エゴ中心ビデオにおける物体の3次元追跡軌道を安定的に作成するための動的階層化機構を革新した。
論文参考訳（メタデータ） (2024-10-11T05:02:31Z)
Unlocking Exocentric Video-Language Data for Egocentric Video Representation Learning [80.37314291927889]
EMBEDは、エゴセントリックなビデオ表現学習のための、エゴセントリックなビデオ言語データを変換するために設計された手法である。エゴセントリックなビデオは、主にクローズアップなハンドオブジェクトのインタラクションを特徴としているのに対し、エゴセントリックなビデオは、人間の活動に対してより広い視点を提供する。視覚と言語スタイルの転送の両方を適用することで、私たちのフレームワークは新しいエゴセントリックなデータセットを作成します。
論文参考訳（メタデータ） (2024-08-07T06:10:45Z)
EgoChoir: Capturing 3D Human-Object Interaction Regions from Egocentric Views [51.53089073920215]
エゴセントリックな人間と物体の相互作用(HOI)を理解することは、人間中心の知覚の基本的な側面である。既存の手法は主にHOIの観測を利用して、外心的な視点から相互作用領域を捉えている。 EgoChoirは、オブジェクト構造と、外見と頭部運動に固有の相互作用コンテキストを結びつけて、オブジェクトの余裕を明らかにする。
論文参考訳（メタデータ） (2024-05-22T14:03:48Z)
Put Myself in Your Shoes: Lifting the Egocentric Perspective from Exocentric Videos [66.46812056962567]
Exocentric-to-egocentric cross-view translationは、第三者(exocentric)の観点からアクターをキャプチャするビデオ録画に基づいて、アクターの1人(egocentric)ビューを生成することを目的としている。そこで我々は,Exo2Egoという,翻訳過程を高次構造変換と画素レベルの幻覚の2段階に分解する生成フレームワークを提案する。
論文参考訳（メタデータ） (2024-03-11T01:00:00Z)
EgoGen: An Egocentric Synthetic Data Generator [53.32942235801499]
EgoGenは新しい合成データジェネレータで、エゴセントリックな知覚タスクのための正確でリッチな地上訓練データを生成することができる。 EgoGenの中心となるのは、仮想人間の自我中心の視覚入力を直接利用して3D環境を感知する、新しい人間のモーション合成モデルである。我々は、ヘッドマウントカメラのマッピングとローカライゼーション、エゴセントリックカメラトラッキング、エゴセントリックビューからのヒューマンメッシュリカバリの3つのタスクで、EgoGenの有効性を実証する。
論文参考訳（メタデータ） (2024-01-16T18:55:22Z)
Retrieval-Augmented Egocentric Video Captioning [53.2951243928289]
EgoInstructor(エゴインストラクタ)は、意味的に関連する第三者の指導ビデオを自動的に検索する、検索拡張マルチモーダルキャプションモデルである。我々は、エゴセントリックでエゴセントリックなビデオ機能を引き出す新しいEgoExoNCE損失でクロスビュー検索モジュールをトレーニングし、同様のアクションを記述した共有テキスト機能にアライメントすることで、より近づいた。
論文参考訳（メタデータ） (2024-01-01T15:31:06Z)
Ego-Only: Egocentric Action Detection without Exocentric Transferring [37.89647493482049]
Ego-Onlyは,エゴセントリックな(ファーストパーソナリティー)ビデオに対して,最先端のアクション検出を可能にする最初のアプローチである。
論文参考訳（メタデータ） (2023-01-03T22:22:34Z)
Ego-Exo: Transferring Visual Representations from Third-person to First-person Videos [92.38049744463149]
大規模第3者映像データセットを用いた自己中心型映像モデルの事前訓練手法について紹介する。私たちのアイデアは、重要なエゴセントリック特性を予測する第三者ビデオから潜在信号を見つけることです。実験の結果,Ego-Exoフレームワークは標準ビデオモデルにシームレスに統合可能であることがわかった。
論文参考訳（メタデータ） (2021-04-16T06:10:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。