論文の概要: EgoKit: Towards Unified Low-Cost Egocentric Data Collection with Heterogeneous Devices
- arxiv url: http://arxiv.org/abs/2605.16797v1
- Date: Sat, 16 May 2026 03:59:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.088037
- Title: EgoKit: Towards Unified Low-Cost Egocentric Data Collection with Heterogeneous Devices
- Title(参考訳): EgoKit: 異種デバイスによる低コストエゴセントリックデータコレクションの統一を目指す
- Authors: Liuchuan Yu, Erdem Murat, Beichen Wang, Yan Zeng, Tingting Luo, Huizhen Zhou, Shanghao Li, Huining Feng, Zhigen Zhao, Ning Yang, Ke Jing, Yunhao Liu, Ruoya Sheng,
- Abstract要約: EgoKitは、6つの異種ホストデバイスで同じエゴセントリックな記録ワークフローを公開するツールキットである。
付属のアクセサリーは、マウント付きの2台の手首カメラ、ヘッドストラップ、USB-Cハブなど、サポート対象のホストに手首ビューキャプチャを追加する。
- 参考スコア(独自算出の注目度): 7.682719474986683
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Egocentric video is increasingly used as a data source for robot learning, activity understanding, and embodied AI research, but collecting it at scale remains fragmented in practice: each candidate host device, such as an Android phone, iPhone, iPad, smart glasses, or extended reality (XR) headset, exposes a different SDK, a different policy on raw camera access, and different limitations on external USB cameras and on-device tracking. Synchronized ego-view and wrist-view capture is therefore typically obtained by either committing to a single proprietary platform or building one-off rigs that do not transfer across devices. To address this gap, we present EgoKit, a toolkit that exposes the same egocentric recording workflow across six heterogeneous host devices. Across all supported devices, EgoKit presents the same recording interaction and produces locally stored video with a uniform log format; on XR headsets, it additionally logs head pose and OpenXR-standard 26-joint hand tracking aligned to the video streams. The companion accessories, including two wrist cameras with mounts, a head strap, and a USB-C hub, add wrist-view capture to any supported host without custom hardware fabrication. EgoKit is available at \url{https://egokit.chuange.org/}.
- Abstract(参考訳): Androidスマートフォン、iPhone、iPad、スマートグラス、拡張現実(XR)ヘッドセットといった各候補ホストデバイスは、異なるSDK、生のカメラアクセスに関する異なるポリシー、外部USBカメラとデバイス上のトラッキングに関する異なる制限を公開しています。
したがって、シンクロナイズドエゴビューと手首ビューキャプチャは通常、単一のプロプライエタリなプラットフォームにコミットするか、デバイス間で転送しないワンオフリグを構築することで得られる。
このギャップに対処するため、EgoKitは、6つの異種ホストデバイスで同じエゴセントリックな記録ワークフローを公開するツールキットである。
すべてのサポート対象デバイスで、EgoKitは同じ記録インタラクションを示し、均一なログフォーマットでローカルに保存されたビデオを生成する。
付属のアクセサリーには、マウント付きの2台の手首カメラ、ヘッドストラップ、USB-Cハブなどがあり、カスタムハードウェアを作らずに、サポート対象のホストに手首ビューキャプチャーを追加する。
EgoKit は \url{https://egokit.chuange.org/} で入手できる。
関連論文リスト
- Ego-1K -- A Large-Scale Multiview Video Dataset for Egocentric Vision [7.318705822469006]
Egohugging-1Kは、時間同期型エゴセントリックなマルチビュービデオの大規模なコレクションである。
このデータセットには、ユーザーが装着する4カメラVRヘッドセットを取り囲む12台の同期カメラを備えたカスタムリグで撮影した1000本近い短い自撮りビデオが含まれている。
論文 参考訳(メタデータ) (2026-03-14T04:00:26Z) - EgoM2P: Egocentric Multimodal Multitask Pretraining [55.259234688003545]
大規模なエゴセントリックなマルチモーダルモデルとマルチタスクモデルの構築は、ユニークな課題を示している。
EgoM2Pは、時間的に認識されたマルチモーダルトークンから学習し、エゴセントリックな4D理解のための大規模な汎用モデルをトレーニングするマスク付きモデリングフレームワークである。
私たちはEgoM2Pを完全にオープンソース化し、コミュニティを支援し、エゴセントリックなビジョン研究を前進させます。
論文 参考訳(メタデータ) (2025-06-09T15:59:25Z) - x-RAGE: eXtended Reality -- Action & Gesture Events Dataset [5.068559907583171]
我々は、XR中心のジェスチャー認識のためのニューロモルフィックで低消費電力のソリューションを実現するための、最初のイベントカメラベースのエゴセントリックジェスチャーデータセットを提案する。
データセットは、https://gitlab.com/NVM_IITD_Research/xrage.com/で公開されています。
論文 参考訳(メタデータ) (2024-10-25T11:44:06Z) - Real-Time Simulated Avatar from Head-Mounted Sensors [70.41580295721525]
我々はAR/VRヘッドセットから得られた情報(ヘッドセットポーズとカメラ)からシミュレーションアバターを制御するSimXRを提案する。
カメラでヘッドセットのポーズを合成するために、人型ロボットを制御してヘッドセットの動きをトラッキングし、入力画像を分析して身体の動きを決定する。
体の一部が見えると、手足の動きは画像によって案内され、見えない場合は物理法則が制御器を誘導して可塑性運動を発生させる。
論文 参考訳(メタデータ) (2024-03-11T16:15:51Z) - AI-Assisted Verification of Biometric Data Collection [0.0]
本稿では,デバイス間でのYOLOアーキテクチャの性能を,専用GPUを用いて比較する。
また、限られたハードウェア上でビデオから顔や行動を認識する際の制限についても論じる。
論文 参考訳(メタデータ) (2021-12-17T18:06:44Z) - EgoBody: Human Body Shape, Motion and Social Interactions from
Head-Mounted Devices [76.50816193153098]
EgoBodyは複雑な3Dシーンにおけるソーシャルインタラクションのための新しい大規模データセットである。
私たちはMicrosoft HoloLens2ヘッドセットを使って、RGB、奥行き、視線、頭と手のトラッキングなど、リッチなエゴセントリックなデータストリームを記録しています。
正確な3Dグラウンドトルースを得るため、マルチKinectリグでヘッドセットを校正し、多視点RGB-Dフレームに表現力のあるSMPL-Xボディーメッシュを適合させる。
論文 参考訳(メタデータ) (2021-12-14T18:41:28Z) - Ego4D: Around the World in 3,000 Hours of Egocentric Video [276.1326075259486]
Ego4Dは大規模なビデオデータセットとベンチマークスイートである。
世界中の74か国と9か国から、855人のユニークなカメラ着用者が捉えた数百のシナリオを、毎日3,025時間の動画で見ることができる。
ビデオにはオーディオ、環境の3Dメッシュ、視線、ステレオ、および/または複数のエゴセントリックカメラからの同期ビデオが添付されている。
論文 参考訳(メタデータ) (2021-10-13T22:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。