論文の概要: SARA: Scene-Aware Reconstruction Accelerator
- arxiv url: http://arxiv.org/abs/2601.06831v1
- Date: Sun, 11 Jan 2026 09:45:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.016755
- Title: SARA: Scene-Aware Reconstruction Accelerator
- Title(参考訳): SARA:Scene-Aware Restruction Accelerator
- Authors: Jee Won Lee, Hansol Lim, Minhyeok Im, Dohyeon Lee, Jongseong Brad Choi,
- Abstract要約: SARAは、SfM(Structure-from-Motion)のための幾何学駆動のペア選択モジュールである。
視覚的類似性のみに基づいてペアを選択する従来のパイプラインとは異なり、SARAは幾何学第一対選択を導入する。
軽量のプレマッチングステージは、互いに近接する隣人とRANSACを使用して、再建情報度を推定する。
- 参考スコア(独自算出の注目度): 8.403194119298622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present SARA (Scene-Aware Reconstruction Accelerator), a geometry-driven pair selection module for Structure-from-Motion (SfM). Unlike conventional pipelines that select pairs based on visual similarity alone, SARA introduces geometry-first pair selection by scoring reconstruction informativeness - the product of overlap and parallax - before expensive matching. A lightweight pre-matching stage uses mutual nearest neighbors and RANSAC to estimate these cues, then constructs an Information-Weighted Spanning Tree (IWST) augmented with targeted edges for loop closure, long-baseline anchors, and weak-view reinforcement. Compared to exhaustive matching, SARA reduces rotation errors by 46.5+-5.5% and translation errors by 12.5+-6.5% across modern learned detectors, while achieving at most 50x speedup through 98% pair reduction (from 30,848 to 580 pairs). This reduces matching complexity from quadratic to quasi-linear, maintaining within +-3% of baseline reconstruction metrics for 3D Gaussian Splatting and SVRaster.
- Abstract(参考訳): SARA(Scene-Aware Reconstruction Accelerator)は、SfM(Structure-from-Motion)のための幾何駆動のペア選択モジュールである。
視覚的類似性のみに基づいてペアを選択する従来のパイプラインとは異なり、SARAは、高価なマッチングの前に再構成情報(重複とパララックスの積)を評価することにより、ジオメトリファーストのペア選択を導入する。
軽量のプレマッチングステージでは、近接する隣人とRANSACを用いてこれらのキューを推定し、ループ閉鎖、長いベースラインアンカー、弱いビュー強化のためのターゲットエッジを備えた情報重み付きスパンニングツリー(IWST)を構築する。
徹底的なマッチングと比較すると、SARAは回転誤差を46.5+-5.5%、翻訳誤差を12.5+-6.5%削減し、50倍のスピードアップを98%(30,848対から580対)で達成している。
これにより、マッチングの複雑さを2次から準線形に減らし、3Dガウス・スプラッティングとSVRasterのベースライン再構築指標の+-3%以内に維持する。
関連論文リスト
- MapReduce LoRA: Advancing the Pareto Front in Multi-Preference Optimization for Generative Models [52.32146943039743]
人間のフィードバックからの強化学習は、生成モデルと人間の美学と知覚的嗜好を高度に一致させる。
MapReduce LoRA と Reward-aware Token Embedding (RaTE) の2つの補完手法を紹介する。
我々のフレームワークは、モダリティにまたがる新しい最先端のマルチ参照アライメントのレシピを定めている。
論文 参考訳(メタデータ) (2025-11-25T18:49:21Z) - A Stable Whitening Optimizer for Efficient Neural Network Training [99.7641280234926]
アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。
まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。
第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。
第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文 参考訳(メタデータ) (2025-06-08T18:43:31Z) - 3D Face Reconstruction Error Decomposed: A Modular Benchmark for Fair and Fast Method Evaluation [30.625439879741847]
M3DFB (Modularized 3D Face Restruction Benchmark) のためのツールキットを提案する。
エラーの基本成分は分離され交換可能であり、それぞれの効果を定量化することができる。
そこで本研究では,メッシュトポロジの不整合性に対して計算効率の良い手法を提案する。
論文 参考訳(メタデータ) (2025-05-23T15:28:43Z) - Speedy MASt3R [68.47052557089631]
MASt3Rは、DUSt3Rを活用して高速な相互マッチング方式を導入することで、画像マッチングを3Dタスクとして再定義する。
高速MASt3Rは、精度を犠牲にすることなく、推論時間(画像ペアあたり198msから91ms)を54%削減する。
この進歩により、リアルタイムな3D理解が可能になり、複合現実ナビゲーションや大規模3Dシーン再構築といったアプリケーションに恩恵をもたらす。
論文 参考訳(メタデータ) (2025-03-13T03:56:22Z) - Analyzing And Improving Neural Speaker Embeddings for ASR [54.30093015525726]
本稿では,コンバータをベースとしたハイブリッドHMM ASRシステムに,ニューラルスピーカーの埋め込みを統合するための取り組みについて述べる。
話者埋め込みを用いたコンフォーマーベースハイブリッドASRシステムは, SWB 300hでのトレーニングにより, Hub5'00 と Hub5'01 で 9.0% WER を達成する。
論文 参考訳(メタデータ) (2023-01-11T16:56:03Z) - A Densely Interconnected Network for Deep Learning Accelerated MRI [0.0]
カスケードなディープラーニング再構築フレームワーク(ベースラインモデル)を3つのアーキテクチャ修正を適用して修正した。
提案した密結合残留カスケードネットワーク (DIRCN) は, 4倍および8倍加速に対して8%と11%のSSIM改善を実現した。
論文 参考訳(メタデータ) (2022-07-05T14:24:05Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - Rethinking Dilated Convolution for Real-time Semantic Segmentation [0.0]
背骨全体に大きな拡張率を持つ拡張畳み込みを用いて異なるアプローチをとる。
我々のモデルであるRegSegは、リアルタイムのCityscapesとCamVidデータセットの競合的な結果を達成する。
論文 参考訳(メタデータ) (2021-11-18T22:08:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。