Fugu-MT 論文翻訳(概要): Aria Everyday Activities Dataset

論文の概要: Aria Everyday Activities Dataset

arxiv url: http://arxiv.org/abs/2402.13349v2
Date: Thu, 22 Feb 2024 03:37:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-23 11:56:02.880273
Title: Aria Everyday Activities Dataset
Title（参考訳）: ariaの日次活動データセット
Authors: Zhaoyang Lv, Nicholas Charron, Pierre Moulon, Alexander Gamino, Cheng Peng, Chris Sweeney, Edward Miller, Huixuan Tang, Jeff Meissner, Jing Dong, Kiran Somasundaram, Luis Pesqueira, Mark Schwesinger, Omkar Parkhi, Qiao Gu, Renzo De Nardi, Shangyi Cheng, Steve Saarinen, Vijay Baiyya, Yuyang Zou, Richard Newcombe, Jakob Julian Engel, Xiaqing Pan, Carl Ren
Abstract要約: Aria Everyday Activity (AEA)データセットは、Project Ariaメガネを使用して記録されたエゴセントリックなマルチモーダルオープンデータセットである。 AEAには、地理的に多様な屋内5箇所で、複数の着用者が記録した143の日々の活動シーケンスが含まれている。
参考スコア（独自算出の注目度）: 36.11937079760597
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present Aria Everyday Activities (AEA) Dataset, an egocentric multimodal open dataset recorded using Project Aria glasses. AEA contains 143 daily activity sequences recorded by multiple wearers in five geographically diverse indoor locations. Each of the recording contains multimodal sensor data recorded through the Project Aria glasses. In addition, AEA provides machine perception data including high frequency globally aligned 3D trajectories, scene point cloud, per-frame 3D eye gaze vector and time aligned speech transcription. In this paper, we demonstrate a few exemplar research applications enabled by this dataset, including neural scene reconstruction and prompted segmentation. AEA is an open source dataset that can be downloaded from https://www.projectaria.com/datasets/aea/. We are also providing open-source implementations and examples of how to use the dataset in Project Aria Tools https://github.com/facebookresearch/projectaria_tools.
Abstract（参考訳）: Aria Everyday Activity (AEA) Datasetは、Project Aria メガネを用いて記録されたエゴセントリックなマルチモーダルオープンデータセットである。 aeaは、地理的に多様な5つの場所で複数の着用者が記録した143の日常活動シーケンスを含んでいる。各記録は、project ariaメガネを介して記録されたマルチモーダルセンサデータを含む。さらに、AEAは、高周波のグローバルな3D軌跡、シーンポイント雲、フレームごとの3D視線ベクトル、時間順の音声書き起こしを含む機械知覚データを提供する。本稿では,ニューラルシーン再構成やセグメンテーションの促進など,このデータセットで実現可能ないくつかの模範的な研究応用を実証する。 AEAはオープンソースのデータセットで、https://www.projectaria.com/datasets/aea/からダウンロードできる。オープンソースの実装や、project aria tools https://github.com/facebookresearch/projectaria_toolsでデータセットを使用する方法の例も提供しています。

関連論文リスト

Aria Gen 2 Pilot Dataset [9.785079054502377]
Aria Gen 2 Pilotデータセットは、最先端のAria Gen 2メガネを使用してキャプチャされた、エゴセントリックなマルチモーダルオープンデータセットである。最初のリリースでは、Aria Gen 2メガネを装着した友人と一緒に日々の活動を記録するDia'aneがメインのテーマだ。それぞれのシナリオにおいて、様々なマシン認識アルゴリズムから総合的な生センサデータと出力データを提供する。これらのデータは、デバイスが着用者、周囲の環境、および着用者と環境の間の相互作用を知覚する能力を示しながら、多様なユーザや状況における堅牢なパフォーマンスを維持している。
論文参考訳（メタデータ） (2025-10-17T18:21:11Z)
Investigating Domain Gaps for Indoor 3D Object Detection [60.55242233729081]
本研究では,屋内3次元物体検出器を1つのデータセットから別のデータセットに適応させる作業について考察する。本稿では, ScanNet, SUN RGB-D, 3D Frontのデータセットと, 新たに提案した大規模データセット ProcTHOR-OD と ProcFront を用いたベンチマークを提案する。本研究は,3次元物体検出器におけるドメインギャップの違いが,合成から現実への適応,点雲品質適応,レイアウト適応,インスタンス特徴適応など,さまざまな適応シナリオについて実験を行った。
論文参考訳（メタデータ） (2025-08-24T16:34:19Z)
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation [49.697035403548966]
Vision-Language Navigation (VLN) は、言語命令と視覚的手がかりの両方を活用することで、エージェントを環境に誘導することを目的としている。航空VLNのための多目的ツールチェーンと大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。対応する視覚データは、Unreal, GTA V, Google Earth, 3D Splatting (3D GS)など、様々なレンダリングエンジンと高度な技術を用いて生成される。
論文参考訳（メタデータ） (2025-02-25T09:57:18Z)
Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文参考訳（メタデータ） (2024-08-29T03:58:21Z)
Nymeria: A Massive Collection of Multimodal Egocentric Daily Motion in the Wild [66.34146236875822]
ニメリアデータセット(Nymeria dataset)は、複数のマルチモーダル・エゴセントリックなデバイスで野生で収集された、大規模で多様な、多彩な注釈付けされた人間のモーションデータセットである。合計で399Kmを走行し、50か所にわたる264人の参加者から毎日300時間の録音を1200件記録している。動作言語記述は、語彙サイズ6545の8.64万語で310.5K文を提供する。
論文参考訳（メタデータ） (2024-06-14T10:23:53Z)
Introducing HOT3D: An Egocentric Dataset for 3D Hand and Object Tracking [7.443420525809604]
我々は,自我中心手と物体追跡のためのデータセットであるHOT3Dを3Dで導入する。データセットはマルチビューのRGB/モノクロ画像ストリームを833分以上提供し、19人の被験者が33の多様な剛体オブジェクトと対話していることを示している。単純なピックアップ/オブザーバ/プットダウンアクションに加えて、HOT3Dはキッチン、オフィス、リビングルーム環境における典型的なアクションに似たシナリオを含んでいる。
論文参考訳（メタデータ） (2024-06-13T21:38:17Z)
UEMM-Air: Make Unmanned Aerial Vehicles Perform More Multi-modal Tasks [19.81981468705478]
合成マルチモーダルUAVベースのマルチタスクデータセットUEMM-Airを提案する。具体的には、Unreal Engine (UE) を用いて、様々なUAV飛行シナリオとオブジェクトタイプをシミュレートする。 UEMM-Airは合計120k対の画像を6つのモダリティと正確なアノテーションで構成しています。
論文参考訳（メタデータ） (2024-06-10T13:00:22Z)
Den-SOFT: Dense Space-Oriented Light Field DataseT for 6-DOF Immersive Experience [28.651514326042648]
我々は,移動式マルチカメラ大空間高密度光場キャプチャシステムを構築した。本研究の目的は,一般的な3次元シーン再構築アルゴリズムの開発に貢献することである。収集されたデータセットは、既存のデータセットよりもはるかに密度が高い。
論文参考訳（メタデータ） (2024-03-15T02:39:44Z)
TartanAviation: Image, Speech, and ADS-B Trajectory Datasets for Terminal Airspace Operations [2.738514570149472]
TartanAviationは、画像、音声、およびADS-B軌道データを同時に収集することで、空港環境の全体像を提供する。タルタンアビエーションは合計で3.1M画像、3374時間の航空交通管制音声データ、661日のADS-B軌道データを提供している。
論文参考訳（メタデータ） (2024-03-05T23:37:43Z)
Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文参考訳（メタデータ） (2023-02-16T13:41:19Z)
Argoverse 2: Next Generation Datasets for Self-Driving Perception and Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。 Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。 Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文参考訳（メタデータ） (2023-01-02T00:36:22Z)
Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文参考訳（メタデータ） (2020-08-11T19:10:32Z)
AU-AIR: A Multi-modal Unmanned Aerial Vehicle Dataset for Low Altitude Traffic Surveillance [20.318367304051176]
カメラを搭載した無人航空機(UAV)は、空中(バードビュー)画像を撮影する利点がある。オブジェクトアノテーションによる視覚データを含む、いくつかの空中データセットが導入されている。本研究では,実環境下で収集されたマルチモーダルセンサデータを有する多目的航空データセット(AU-AIR)を提案する。
論文参考訳（メタデータ） (2020-01-31T09:45:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。