論文の概要: PANORAMA: The Rise of Omnidirectional Vision in the Embodied AI Era
- arxiv url: http://arxiv.org/abs/2509.12989v1
- Date: Tue, 16 Sep 2025 11:54:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.065656
- Title: PANORAMA: The Rise of Omnidirectional Vision in the Embodied AI Era
- Title(参考訳): PANORAMA: 身体的AI時代における全方位視覚の台頭
- Authors: Xu Zheng, Chenfei Liao, Ziqiao Weng, Kaiyu Lei, Zihao Dongfang, Haocong He, Yuanhuiyi Lyu, Lutao Jiang, Lu Qi, Li Chen, Danda Pani Paudel, Kailun Yang, Linfeng Zhang, Luc Van Gool, Xuming Hu,
- Abstract要約: この講演は、具体化されたAI時代、すなわち全方位視覚の急速な発展の新たなトレンドを示す。
我々は、全方向生成、全方向知覚、全方向理解、および関連するデータセットの最近のブレークスルーを強調した。
本稿では,4つの重要なサブシステムから構成されるAI時代における理想的なパノラマシステムアーキテクチャPANORAMAを提案する。
- 参考スコア(独自算出の注目度): 92.63017552735103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Omnidirectional vision, using 360-degree vision to understand the environment, has become increasingly critical across domains like robotics, industrial inspection, and environmental monitoring. Compared to traditional pinhole vision, omnidirectional vision provides holistic environmental awareness, significantly enhancing the completeness of scene perception and the reliability of decision-making. However, foundational research in this area has historically lagged behind traditional pinhole vision. This talk presents an emerging trend in the embodied AI era: the rapid development of omnidirectional vision, driven by growing industrial demand and academic interest. We highlight recent breakthroughs in omnidirectional generation, omnidirectional perception, omnidirectional understanding, and related datasets. Drawing on insights from both academia and industry, we propose an ideal panoramic system architecture in the embodied AI era, PANORAMA, which consists of four key subsystems. Moreover, we offer in-depth opinions related to emerging trends and cross-community impacts at the intersection of panoramic vision and embodied AI, along with the future roadmap and open challenges. This overview synthesizes state-of-the-art advancements and outlines challenges and opportunities for future research in building robust, general-purpose omnidirectional AI systems in the embodied AI era.
- Abstract(参考訳): 環境を理解するために360度視覚を使用する全方位視覚は、ロボット工学、産業検査、環境モニタリングといった分野においてますます重要になっている。
従来のピンホール視覚と比較して、全方位視覚は全体的環境意識を与え、シーン知覚の完全性と意思決定の信頼性を著しく向上させる。
しかし、この地域の基礎研究は歴史的に伝統的なピンホール・ビジョンに遅れを取ってきた。
この講演は、産業需要の増加と学術的関心の高まりによって引き起こされる全方位ビジョンの急速な発展という、具現化されたAI時代における新たなトレンドを示す。
我々は、全方向生成、全方向知覚、全方向理解、および関連するデータセットの最近のブレークスルーを強調した。
学術と産業の両方の知見に基づいて,4つの重要なサブシステムから構成されるエンボディAI時代において,理想的なパノラマシステムアーキテクチャPANORAMAを提案する。
さらに、パノラマビジョンと具現化されたAIの交差点における、新たなトレンドやコミュニティ間の影響に関する詳細な意見や、今後のロードマップやオープンな課題も提供します。
この概要は、最先端の進歩を要約し、具現化されたAI時代において、堅牢で汎用的な全方位AIシステムを構築するための今後の研究の課題と機会を概説する。
関連論文リスト
- One Flight Over the Gap: A Survey from Perspective to Panoramic Vision [117.80970697177025]
本研究は,最近のパノラマ視覚技術,特にパノラマ・パノラマ・パノラマ適応についてレビューする。
最初にパノラマ画像パイプラインと投影法を再検討し、構造的格差を分析するのに必要な事前知識を構築した。
これに基づいて、300以上の研究論文から得られた20以上の代表的タスクを2次元でカバーする。
論文 参考訳(メタデータ) (2025-09-04T17:59:10Z) - Edge General Intelligence Through World Models and Agentic AI: Fundamentals, Solutions, and Challenges [87.02855999212817]
エッジ・ジェネラル・インテリジェンス(エッジ・ジェネラル・インテリジェンス、Edge General Intelligence、EGI)は、分散エージェントが自律的に知覚、理性、行動する能力を持つエッジ・コンピューティングの変革的進化を表す。
世界モデルは、将来の軌跡を予測するだけでなく、積極的に想像するプロアクティブな内部シミュレーターとして機能し、不確実性の理由を定め、予見で多段階のアクションを計画する。
この調査は、世界モデルがどのようにエージェント人工知能(AI)システムをエッジで強化できるかを包括的に分析することで、ギャップを埋める。
論文 参考訳(メタデータ) (2025-08-13T07:29:40Z) - Toward Embodied AGI: A Review of Embodied AI and the Road Ahead [49.10409405708527]
エンボディード・ジェネラル・インテリジェンス(英語: Embodied Artificial General Intelligence, AGI)は、しばしば本質的にエンボディードとして考えられている。
本稿では,5つのレベル(L1-L5)にまたがる身体的AGIの系統分類について紹介する。
本稿では,L3+ロボット脳の概念的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-20T11:42:26Z) - Challenges and Trends in Egocentric Vision: A Survey [11.593894126370724]
エゴセントリックな視覚は、人間の体に装着されたカメラやセンサーを通して、視覚的およびマルチモーダルなデータをキャプチャする。
本稿では,自我中心の視覚理解に関する研究を包括的に調査する。
最新の進歩を要約することで、拡張現実、バーチャルリアリティ、エンボディドインテリジェンスといった分野において、エゴセントリックなビジョン技術の幅広い応用が期待できる。
論文 参考訳(メタデータ) (2025-03-19T14:51:27Z) - Diffusion-Based Visual Art Creation: A Survey and New Perspectives [51.522935314070416]
本調査は,拡散に基づく視覚芸術創造の新たな領域を探求し,その発展を芸術的,技術的両面から検討する。
本研究は,芸術的要件が技術的課題にどのように変換されるかを明らかにし,視覚芸術創造における拡散法の設計と応用を強調した。
我々は、AIシステムが芸術的知覚と創造性において人間の能力をエミュレートし、潜在的に増強するメカニズムに光を当てることを目指している。
論文 参考訳(メタデータ) (2024-08-22T04:49:50Z) - Vision-based Learning for Drones: A Survey [1.280979348722635]
先進的なサイバー物理システムとしてのドローンは、視覚ベースの学習の出現とともに、変貌を遂げている。
このレビューでは、ドローンにおける視覚に基づく学習の包括的概要を提供し、その運用能力の向上における重要な役割を強調している。
我々は、単一エージェントシステムからより複雑なマルチエージェントおよび異種システムシナリオまで、学習機能を備えた視覚ベースのドローンの様々な応用について検討する。
論文 参考訳(メタデータ) (2023-12-08T12:57:13Z) - Edge AI for Internet of Energy: Challenges and Perspectives [5.267662071764103]
The Digital landscape of the Internet of Energy (IoE) is on thebrink of a revolution transformation with the integration of edge Artificial Intelligence (AI)
この包括的なレビューは、エッジAIがIoEエコシステムを再構築する可能性と可能性を解明するものだ。
論文 参考訳(メタデータ) (2023-11-28T15:01:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。