論文の概要: Aria Gen 2 Pilot Dataset
- arxiv url: http://arxiv.org/abs/2510.16134v1
- Date: Fri, 17 Oct 2025 18:21:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.861902
- Title: Aria Gen 2 Pilot Dataset
- Title(参考訳): Aria Gen 2のパイロットデータセット
- Authors: Chen Kong, James Fort, Aria Kang, Jonathan Wittmer, Simon Green, Tianwei Shen, Yipu Zhao, Cheng Peng, Gustavo Solaira, Andrew Berkovich, Nikhil Raina, Vijay Baiyya, Evgeniy Oleinik, Eric Huang, Fan Zhang, Julian Straub, Mark Schwesinger, Luis Pesqueira, Xiaqing Pan, Jakob Julian Engel, Carl Ren, Mingfei Yan, Richard Newcombe,
- Abstract要約: Aria Gen 2 Pilotデータセットは、最先端のAria Gen 2メガネを使用してキャプチャされた、エゴセントリックなマルチモーダルオープンデータセットである。
最初のリリースでは、Aria Gen 2メガネを装着した友人と一緒に日々の活動を記録するDia'aneがメインのテーマだ。
それぞれのシナリオにおいて、様々なマシン認識アルゴリズムから総合的な生センサデータと出力データを提供する。
これらのデータは、デバイスが着用者、周囲の環境、および着用者と環境の間の相互作用を知覚する能力を示しながら、多様なユーザや状況における堅牢なパフォーマンスを維持している。
- 参考スコア(独自算出の注目度): 9.785079054502377
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The Aria Gen 2 Pilot Dataset (A2PD) is an egocentric multimodal open dataset captured using the state-of-the-art Aria Gen 2 glasses. To facilitate timely access, A2PD is released incrementally with ongoing dataset enhancements. The initial release features Dia'ane, our primary subject, who records her daily activities alongside friends, each equipped with Aria Gen 2 glasses. It encompasses five primary scenarios: cleaning, cooking, eating, playing, and outdoor walking. In each of the scenarios, we provide comprehensive raw sensor data and output data from various machine perception algorithms. These data illustrate the device's ability to perceive the wearer, the surrounding environment, and interactions between the wearer and the environment, while maintaining robust performance across diverse users and conditions. The A2PD is publicly available at projectaria.com, with open-source tools and usage examples provided in Project Aria Tools.
- Abstract(参考訳): Aria Gen 2 Pilot Dataset (A2PD) は、最先端のAria Gen 2メガネを用いて撮影された、エゴセントリックなマルチモーダルなオープンデータセットである。
タイムリーなアクセスを容易にするため、A2PDは進行中のデータセット拡張とともに徐々にリリースされている。
最初のリリースでは、Aria Gen 2メガネを装着した友人と一緒に日々の活動を記録するDia'aneがメインのテーマだ。
クリーニング、料理、食事、遊び、屋外ウォーキングの5つの主要なシナリオを含んでいる。
それぞれのシナリオにおいて、様々なマシン認識アルゴリズムから総合的な生センサデータと出力データを提供する。
これらのデータは、デバイスが着用者、周囲の環境、および着用者と環境の間の相互作用を知覚する能力を示している。
A2PDはProjectaria.comで公開されており、オープンソースのツールとProject Aria Toolsで提供されている使用例がある。
関連論文リスト
- FlyAwareV2: A Multimodal Cross-Domain UAV Dataset for Urban Scene Understanding [14.353064152003867]
FlyAwareV2は、都市景観理解タスクに適した、実際のUAV画像と合成UAV画像の両方を含む、新しいデータセットである。
最近導入されたSynDroneとFlyAwareデータセットに基づいて、FlyAwareV2はいくつかの重要なコントリビューションを導入した。
アノテーションの豊富なセットと環境多様性により、FlyAwareV2はUAVベースの都市景観理解の研究に貴重な資源を提供する。
論文 参考訳(メタデータ) (2025-10-15T07:44:31Z) - LookOut: Real-World Humanoid Egocentric Navigation [61.14016011125957]
本稿では,エゴセントリックな映像から将来の6Dヘッドポーズの列を予測するという課題を紹介する。
この課題を解決するために,時間的に集約された3次元潜伏特徴を考慮に入れた枠組みを提案する。
この分野のトレーニングデータが不足していることから,このアプローチを通じて収集されたデータセットを提示する。
論文 参考訳(メタデータ) (2025-08-20T06:43:36Z) - AGC-Drive: A Large-Scale Dataset for Real-World Aerial-Ground Collaboration in Driving Scenarios [68.84774511206797]
AGC-DriveはAerial-Ground Cooperativeの3D知覚のための最初の大規模実世界のデータセットである。
AGC-Driveには350のシーンがあり、それぞれ約100のフレームと13のオブジェクトカテゴリをカバーする完全な注釈付き3Dバウンディングボックスがある。
車両間協調認識と車両間協調認識の2つの3次元タスクのベンチマークを提供する。
論文 参考訳(メタデータ) (2025-06-19T14:48:43Z) - OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation [49.697035403548966]
Vision-Language Navigation (VLN)は、言語命令と視覚的手がかりを活用してエージェントを誘導することを目的としており、AIの具体化において重要な役割を果たす。
各種レンダリングエンジン,多用途ツールチェーン,航空VLNの大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
論文 参考訳(メタデータ) (2025-02-25T09:57:18Z) - Aria Everyday Activities Dataset [36.11937079760597]
Aria Everyday Activity (AEA)データセットは、Project Ariaメガネを使用して記録されたエゴセントリックなマルチモーダルオープンデータセットである。
AEAには、地理的に多様な屋内5箇所で、複数の着用者が記録した143の日々の活動シーケンスが含まれている。
論文 参考訳(メタデータ) (2024-02-20T19:53:15Z) - Project Aria: A New Tool for Egocentric Multi-Modal AI Research [44.91047009314488]
将来の拡張現実(AR)デバイスで利用可能な、エゴセントリックでマルチモーダルなデータは、マシン知覚に固有の課題と機会を提供する。
Meta Reality Labs ResearchのチームがAriaデバイスを作った。Ariaは、エゴセントリックでマルチモーダルなデータ記録とストリーミングデバイスで、この分野の研究の促進と加速をねらっている。
論文 参考訳(メタデータ) (2023-08-24T20:42:21Z) - Ground-to-Aerial Person Search: Benchmark Dataset and Approach [42.54151390290665]
我々はG2APSという,地上から航空への人物探索のための大規模データセットを構築した。
G2APSには、UAVと地上監視カメラの両方に2,644個のアイデンティティを持つ260,559個の注釈付きバウンディングボックスの31,770枚の画像が含まれている。
論文 参考訳(メタデータ) (2023-08-24T11:11:26Z) - Aria Digital Twin: A New Benchmark Dataset for Egocentric 3D Machine
Perception [5.952224408665015]
Aria Digital Twin (ADT) は、Aria メガネを用いてキャプチャしたエゴセントリックなデータセットである。
ADTには、アリアの着用者が屋内の2つのシーンで行う200の実際の活動が含まれている。
論文 参考訳(メタデータ) (2023-06-10T06:46:32Z) - Learning Fine-grained View-Invariant Representations from Unpaired
Ego-Exo Videos via Temporal Alignment [71.16699226211504]
我々は,エゴセントリックな映像とエゴセントリックな映像を時間内に整列させることにより,視点に不変なきめ細かいアクション特徴を学習することを提案する。
そこで本研究では,2つの鍵設計を持つ自己教師型埋め込み手法であるAE2を提案する。
評価のために,エゴ・エクソ・コンテキストにおけるきめ細かい映像理解のためのベンチマークを構築した。
論文 参考訳(メタデータ) (2023-06-08T19:54:08Z) - Argoverse 2: Next Generation Datasets for Self-Driving Perception and
Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。
Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。
Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文 参考訳(メタデータ) (2023-01-02T00:36:22Z) - DA$^2$ Dataset: Toward Dexterity-Aware Dual-Arm Grasping [58.48762955493929]
DA$2$は、任意の大物体に対して最適な2次元グリップペアを生成するための、最初の大規模デュアルアームデキスタリティ対応データセットである。
データセットには、6000以上のオブジェクトから生成される約9万組のパラレルジャウグリップが含まれている。
論文 参考訳(メタデータ) (2022-07-31T10:02:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。