論文の概要: MACE: Mixture-of-Experts Accelerated Coordinate Encoding for Large-Scale Scene Localization and Rendering
- arxiv url: http://arxiv.org/abs/2510.14251v1
- Date: Thu, 16 Oct 2025 03:08:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.693503
- Title: MACE: Mixture-of-Experts Accelerated Coordinate Encoding for Large-Scale Scene Localization and Rendering
- Title(参考訳): MACE: 大規模シーンのローカライゼーションとレンダリングのための高速化されたコーディネートエンコーディング
- Authors: Mingkai Liu, Dikai Fan, Haohua Que, Haojia Gao, Xiao Liu, Shuxue Peng, Meixia Lin, Shengyu Gu, Ruicong Ye, Wanli Qiu, Handong Yao, Ruopeng Zhang, Xianliang Huang,
- Abstract要約: Mixed Expert-based Accelerated Coordinate Method (MACE)
我々は、暗黙的にサブネットワークを分類し、選択するためのゲーティングネットワークを導入し、各推論中に1つのサブネットワークのみが活性化されることを保証する。
さらに,大規模シーンにおける局所化精度を高めるため,ALF-LB(Auxiliary-Loss-Free Load Balancing)戦略を提案する。
- 参考スコア(独自算出の注目度): 5.145641413868417
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Efficient localization and high-quality rendering in large-scale scenes remain a significant challenge due to the computational cost involved. While Scene Coordinate Regression (SCR) methods perform well in small-scale localization, they are limited by the capacity of a single network when extended to large-scale scenes. To address these challenges, we propose the Mixed Expert-based Accelerated Coordinate Encoding method (MACE), which enables efficient localization and high-quality rendering in large-scale scenes. Inspired by the remarkable capabilities of MOE in large model domains, we introduce a gating network to implicitly classify and select sub-networks, ensuring that only a single sub-network is activated during each inference. Furtheremore, we present Auxiliary-Loss-Free Load Balancing(ALF-LB) strategy to enhance the localization accuracy on large-scale scene. Our framework provides a significant reduction in costs while maintaining higher precision, offering an efficient solution for large-scale scene applications. Additional experiments on the Cambridge test set demonstrate that our method achieves high-quality rendering results with merely 10 minutes of training.
- Abstract(参考訳): 大規模シーンにおける効率的なローカライゼーションと高品質レンダリングは、計算コストが伴うため、依然として大きな課題である。
SCR(Scene Coordinate Regression)法は小規模なローカライゼーションでは良好に機能するが,大規模なシーンに拡張する場合は単一ネットワークの容量に制限される。
これらの課題に対処するために,大規模シーンにおける効率的なローカライズと高品質なレンダリングを可能にするMACE(Mixed Expert-based Accelerated Coordinate Encoding)を提案する。
大規模モデルドメインにおけるMOEの顕著な機能に触発されて、暗黙的にサブネットワークを分類し、選択するためのゲーティングネットワークを導入し、各推論中に1つのサブネットワークのみが活性化されることを保証する。
さらに,大規模シーンにおける局所化精度を高めるため,ALF-LB(Auxiliary-Loss-Free Load Balancing)戦略を提案する。
我々のフレームワークは、高精度を維持しながらコストを大幅に削減し、大規模シーンアプリケーションに効率的なソリューションを提供する。
ケンブリッジテストセットのさらなる実験により,本手法は10分間のトレーニングで高品質なレンダリング結果が得られることを示した。
関連論文リスト
- EfficientIML: Efficient High-Resolution Image Manipulation Localization [38.432078329653926]
1200以上の拡散生成操作を意味的に抽出したマスクを用いた新しい高分解能SIFデータセットを提案する。
本稿では,軽量で3段階のRWKVバックボーンを有する新しいEfficientIMLモデルを提案する。
提案手法は, ローカライズ性能, FLOP, 推論速度において, ViT ベースや他の SOTA 軽量ベースラインよりも優れている。
論文 参考訳(メタデータ) (2025-09-10T13:32:02Z) - Breaking Complexity Barriers: High-Resolution Image Restoration with Rank Enhanced Linear Attention [54.42902794496325]
ソフトマックスアテンションの変種である線形アテンションは、グローバルコンテキストモデリングにおける約束を示す。
軽量な奥行き畳み込みを統合することで特徴表現を充実させる簡易かつ効果的な方法であるRランク拡張線形アテンション(RELA)を提案する。
本稿では,RELA をベースとした画像復元変換器 LAformer を提案する。
論文 参考訳(メタデータ) (2025-05-22T02:57:23Z) - MaskAttn-UNet: A Mask Attention-Driven Framework for Universal Low-Resolution Image Segmentation [5.130440339897479]
MaskAttn-UNetはマスクアテンション機構を通じて従来のU-Netアーキテクチャを強化する新しいセグメンテーションフレームワークである。
本モデルでは,無関係な背景を抑えながら重要な領域を選択的に強調し,乱れや複雑なシーンのセグメンテーション精度を向上させる。
以上の結果から,MaskAttn-UNetは変圧器モデルよりも計算コストが大幅に低く,最先端の手法に匹敵する精度を達成できた。
論文 参考訳(メタデータ) (2025-03-11T22:43:26Z) - Rethinking the Upsampling Layer in Hyperspectral Image Super Resolution [51.98465973507002]
ハイパースペクトル画像のマルチスケールチャネル特性のキャリブレーションにチャネルアテンションを組み込んだ,新しい軽量SHSRネットワーク LKCA-Net を提案する。
我々は、学習可能なアップサンプリング層の低ランク特性が軽量なSHSR手法における重要なボトルネックであることを初めて証明した。
論文 参考訳(メタデータ) (2025-01-30T15:43:34Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - Cascaded Local Implicit Transformer for Arbitrary-Scale Super-Resolution [15.631101125268172]
暗黙の神経表現は、任意の解像度で画像を表現できる有望な能力を示している。
本稿では、アテンション機構と周波数符号化技術を局所暗黙画像関数に統合したローカルインプリシット変換器(LIT)を提案する。
論文 参考訳(メタデータ) (2023-03-29T07:41:56Z) - Grid-guided Neural Radiance Fields for Large Urban Scenes [146.06368329445857]
近年のアプローチでは、シーンを地理的に分割し、複数のサブNeRFを採用して各領域を個別にモデル化する手法が提案されている。
もう一つの解決策は、計算効率が良く、大きなシーンに自然にスケールできる機能グリッド表現を使用することである。
本稿では,大規模都市における高忠実度レンダリングを実現し,計算効率を向上する枠組みを提案する。
論文 参考訳(メタデータ) (2023-03-24T13:56:45Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。