論文の概要: FRAM: Frobenius-Regularized Assignment Matching with Mixed-Precision Computing
- arxiv url: http://arxiv.org/abs/2508.00887v1
- Date: Sat, 26 Jul 2025 07:35:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 20:32:48.66065
- Title: FRAM: Frobenius-Regularized Assignment Matching with Mixed-Precision Computing
- Title(参考訳): FRAM:Frobenius-regularized Assignment Matching with Mixed-Precision Computing
- Authors: Binrui Shen, Yuan Liang, Shengxin Zhu,
- Abstract要約: 二次割当て問題(QAP)は、2つのグラフ間のノード対応を確立することを目的としている。
我々は,理論上基礎を成す混合精度アーキテクチャを開発し,精度の高い加速を実現する。
FRAMはCPU-FP64に比べて最大370倍のスピードアップを実現しており、解の精度は無視できない。
- 参考スコア(独自算出の注目度): 6.987672546471471
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Graph matching, typically formulated as a Quadratic Assignment Problem (QAP), seeks to establish node correspondences between two graphs. To address the NP-hardness of QAP, some existing methods adopt projection-based relaxations that embed the problem into the convex hull of the discrete domain. However, these relaxations inevitably enlarge the feasible set, introducing two sources of error: numerical scale sensitivity and geometric misalignment between the relaxed and original domains. To alleviate these errors, we propose a novel relaxation framework by reformulating the projection step as a Frobenius-regularized Linear Assignment (FRA) problem, where a tunable regularization term mitigates feasible region inflation. This formulation enables normalization-based operations to preserve numerical scale invariance without compromising accuracy. To efficiently solve FRA, we propose the Scaling Doubly Stochastic Normalization (SDSN) algorithm. Building on its favorable computational properties, we develop a theoretically grounded mixed-precision architecture to achieve substantial acceleration. Comprehensive CPU-based benchmarks demonstrate that FRAM consistently outperforms all baseline methods under identical precision settings. When combined with a GPU-based mixed-precision architecture, FRAM achieves up to 370X speedup over its CPU-FP64 counterpart, with negligible loss in solution accuracy.
- Abstract(参考訳): グラフマッチングは、通常、二次割り当て問題(QAP)として定式化され、2つのグラフ間のノード対応を確立する。
QAPのNP硬度に対処するため、既存の手法では離散領域の凸殻に問題を埋め込む射影的緩和を採用している。
しかし、これらの緩和は必然的に実現可能な集合を拡大し、数値的なスケールの感度と、緩和された領域と元の領域の間の幾何学的ミスアライメントという2つの誤りの原因を導入した。
これらの誤りを軽減するために,FRA(Frobenius-regularized Linear Assignment)問題としてプロジェクションステップを再構成して,調整可能な正規化項が実現可能な領域インフレーションを緩和する,新たな緩和フレームワークを提案する。
この定式化により、正規化に基づく演算は、精度を損なうことなく数値スケールの不変性を維持できる。
FRAを効率的に解くために,Scaling Doubly Stochastic Normalization (SDSN)アルゴリズムを提案する。
計算特性を良好に構築し、理論上基礎を成す混合精度アーキテクチャを開発し、精度の高い加速を実現する。
総合的なCPUベースのベンチマークでは、FRAMは同一の精度設定で全てのベースラインメソッドを一貫して上回っている。
GPUベースの混合精度アーキテクチャと組み合わせると、FRAMはCPU-FP64に比べて最大370倍のスピードアップを達成する。
関連論文リスト
- Data-Driven Adaptive Gradient Recovery for Unstructured Finite Volume Computations [0.0]
双曲的保存則に対する非構造有限体積法における勾配再構成の強化のための新しいデータ駆動手法を提案する。
提案手法は,DeepONetアーキテクチャを改良して,従来の構造化グリッド手法を非構造化メッシュに拡張する。
提案アルゴリズムは従来の2階有限体積解法よりも高速かつ高精度である。
論文 参考訳(メタデータ) (2025-07-22T13:23:57Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - Federated Smoothing ADMM for Localization [9.25126455172971]
フェデレートされたシステムは、分散データ、非滑らか性、非滑らか性によって特徴づけられる。
このような環境に固有のスケーラビリティと外乱問題に対処する頑健なアルゴリズムを提案する。
提案アルゴリズムの信頼性を検証するため,定常点に収束することを示す。
数値シミュレーションは、既存の最先端ローカライゼーション法と比較して収束レジリエンスの優れた性能を強調している。
論文 参考訳(メタデータ) (2025-03-12T16:01:34Z) - Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Federated Smoothing Proximal Gradient for Quantile Regression with Non-Convex Penalties [3.269165283595478]
IoT(Internet-of-Things)の分散センサーは、大量のスパースデータを生成する。
本稿では, 滑らか化機構をそのビューに統合し, 精度と計算速度を両立させる, 結合型滑らか化近位勾配(G)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-10T21:50:19Z) - Constrained Optimization via Exact Augmented Lagrangian and Randomized
Iterative Sketching [55.28394191394675]
等式制約付き非線形非IBS最適化問題に対する適応的不正確なニュートン法を開発した。
ベンチマーク非線形問題,LVMのデータによる制約付きロジスティック回帰,PDE制約問題において,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-28T06:33:37Z) - Fast and Robust Non-Rigid Registration Using Accelerated
Majorization-Minimization [35.66014845211251]
非剛性登録は、ターゲット形状と整合する非剛性な方法でソース形状を変形させるが、コンピュータビジョンにおける古典的な問題である。
既存のメソッドは通常$ell_p$型ロバストノルムを使用してアライメントエラーを測定し、変形の滑らかさを規則化する。
本稿では、アライメントと正規化のためのグローバルなスムーズなロバストノルムに基づく、ロバストな非剛体登録のための定式化を提案する。
論文 参考訳(メタデータ) (2022-06-07T16:00:33Z) - Distributed Sketching for Randomized Optimization: Exact
Characterization, Concentration and Lower Bounds [54.51566432934556]
我々はヘシアンの形成が困難である問題に対する分散最適化法を検討する。
ランダム化されたスケッチを利用して、問題の次元を減らし、プライバシを保ち、非同期分散システムにおけるストラグラーレジリエンスを改善します。
論文 参考訳(メタデータ) (2022-03-18T05:49:13Z) - Efficient semidefinite bounds for multi-label discrete graphical models [6.226454551201676]
このようなモデルにおける主要なクエリの1つは、Posteri(MAP)ネットワークのコストに関するSDPWCSP関数を特定することである。
従来の二重化制約手法と,行ごとの更新に基づく専用SDP/Monteiroスタイルの手法を検討する。
論文 参考訳(メタデータ) (2021-11-24T13:38:34Z) - Square Root Bundle Adjustment for Large-Scale Reconstruction [56.44094187152862]
QR分解によるランドマーク変数のnullspace marginalizationに依存するバンドル調整問題の新たな定式化を提案する。
平方根束調整と呼ばれる私たちのアプローチは、一般的に使用されるSchur補完トリックと代数的に等価です。
BALデータセットを用いた実世界での実験では、提案されたソルバが単一の精度でも平均的等しく正確なソリューションで達成できることを示す。
論文 参考訳(メタデータ) (2021-03-02T16:26:20Z) - Efficient semidefinite-programming-based inference for binary and
multi-class MRFs [83.09715052229782]
分割関数やMAP推定をペアワイズMRFで効率的に計算する手法を提案する。
一般のバイナリMRFから完全多クラス設定への半定緩和を拡張し、解法を用いて再び効率的に解けるようなコンパクトな半定緩和を開発する。
論文 参考訳(メタデータ) (2020-12-04T15:36:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。