論文の概要: Can Foundation Models Revolutionize Mobile AR Sparse Sensing?
- arxiv url: http://arxiv.org/abs/2511.02215v1
- Date: Tue, 04 Nov 2025 03:06:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.791772
- Title: Can Foundation Models Revolutionize Mobile AR Sparse Sensing?
- Title(参考訳): ファンデーションモデルはモバイルARスパースセンシングに革命をもたらすか?
- Authors: Yiqin Zhao, Tian Guo,
- Abstract要約: 基礎モデルがモバイルスパースセンシングの環境を変えることができるかどうかを考察する。
実世界のモバイルARデータを用いて,基礎モデルが幾何認識画像のワープに大きな改善をもたらすことを示す。
本研究では,基礎モデルに基づくスパースセンシングのスケーラビリティを実証し,その3次元シーン再構成における主要な性能を示す。
- 参考スコア(独自算出の注目度): 2.984076446975729
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile sensing systems have long faced a fundamental trade-off between sensing quality and efficiency due to constraints in computation, power, and other limitations. Sparse sensing, which aims to acquire and process only a subset of sensor data, has been a key strategy for maintaining performance under such constraints. However, existing sparse sensing methods often suffer from reduced accuracy, as missing information across space and time introduces uncertainty into many sensing systems. In this work, we investigate whether foundation models can change the landscape of mobile sparse sensing. Using real-world mobile AR data, our evaluations demonstrate that foundation models offer significant improvements in geometry-aware image warping, a central technique for enabling accurate reuse of cross-frame information. Furthermore, our study demonstrates the scalability of foundation model-based sparse sensing and shows its leading performance in 3D scene reconstruction. Collectively, our study reveals critical aspects of the promises and the open challenges of integrating foundation models into mobile sparse sensing systems.
- Abstract(参考訳): モバイルセンシングシステムは、計算、電力、その他の制限により、センシング品質と効率の基本的なトレードオフに直面してきた。
センサデータのサブセットのみを取得し,処理することを目的としたスパースセンシングは,そのような制約下での性能を維持する上で重要な戦略である。
しかし、空間や時間にまたがる情報の欠如が多くのセンシングシステムに不確実性をもたらすため、既存のスパースセンシング手法は精度の低下に悩まされることが多い。
本研究では,基礎モデルが移動スパークセンシングの景観を変えることができるかどうかを考察する。
実世界のモバイルARデータを用いて、我々の評価は、基盤モデルが、クロスフレーム情報の正確な再利用を可能にする中心的な技術である幾何認識画像ワープを大幅に改善することを示した。
さらに,基礎モデルに基づくスパースセンシングのスケーラビリティを実証し,その3次元シーン再構成における顕著な性能を示す。
本研究は,モバイル・スパース・センシングシステムに基礎モデルを統合することの公約とオープンな課題を総合的に明らかにした。
関連論文リスト
- MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.158063913401575]
フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。
実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。
我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2025-09-25T05:26:28Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - InfRS: Incremental Few-Shot Object Detection in Remote Sensing Images [11.916941756499435]
本稿では,リモートセンシング画像におけるインクリメンタルな数ショット物体検出の複雑な課題について検討する。
本稿では,新しい授業の漸進的な学習を促進するために,InfRSと呼ばれる先駆的な微調整技術を導入する。
我々はワッサーシュタイン距離に基づく原型校正戦略を開発し、破滅的な忘れ問題を軽減する。
論文 参考訳(メタデータ) (2024-05-18T13:39:50Z) - DynST: Dynamic Sparse Training for Resource-Constrained Spatio-Temporal Forecasting [31.398965880415492]
地球科学システムは、センサーの広範な展開に大きく依存している。
従来のセンサー配置アプローチでは、特定のアルゴリズムを使用してセンサーを設計および展開する。
本稿では,スパース時間データダイナミックスパーストレーニングの概念を初めて紹介し,適応的かつ動的に重要な分布センサをフィルタリングすることにコミットする。
論文 参考訳(メタデータ) (2024-03-05T12:31:24Z) - Open World Object Detection in the Era of Foundation Models [53.683963161370585]
5つの実世界のアプリケーション駆動データセットを含む新しいベンチマークを導入する。
本稿では,オープンワールドのための新しいオブジェクト検出モデル(FOMO)を提案する。
論文 参考訳(メタデータ) (2023-12-10T03:56:06Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks [61.74608497496841]
不正確または破損したデータのトレーニングは、モデルバイアスとハマーズ一般化能力を誘導する。
本稿では,深度推定と再構成における高密度3次元視覚課題に対するセンサ誤差の影響について検討する。
論文 参考訳(メタデータ) (2023-03-26T22:32:44Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Improving Perception via Sensor Placement: Designing Multi-LiDAR Systems
for Autonomous Vehicles [16.45799795374353]
確率的占有グリッド(POG)に基づく計算が容易な情報理論的サーロゲートコストメトリックを提案し、最大センシングのためのLiDAR配置を最適化する。
以上の結果から,センサ配置は3Dポイントクラウドによる物体検出において重要な要素であり,最先端の認識アルゴリズムでは10%の精度で性能が変動する可能性が示唆された。
論文 参考訳(メタデータ) (2021-05-02T01:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。