論文の概要: SRRM: Improving Recursive Transport Surrogates in the Small-Discrepancy Regime
- arxiv url: http://arxiv.org/abs/2603.18781v1
- Date: Thu, 19 Mar 2026 11:32:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.118751
- Title: SRRM: Improving Recursive Transport Surrogates in the Small-Discrepancy Regime
- Title(参考訳): SRRM:小分散レジームにおける再帰輸送サロゲートの改善
- Authors: Yufei Zhang, Tao Wang, Jingyi Zhang,
- Abstract要約: 本稿では,このクラスの代表例として再帰的ランクマッチング(RRM)について,人口順に検討する。
そして, 分解能の低下の原因となるミスマッチ機構を同定した。
- 参考スコア(独自算出の注目度): 6.003063788876664
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recursive partitioning methods provide computationally efficient surrogates for the Wasserstein distance, yet their statistical behavior and their resolution in the small-discrepancy regime remain insufficiently understood. We study Recursive Rank Matching (RRM) as a representative instance of this class under a population-anchored reference. In this setting, we establish consistency and an explicit convergence rate for the anchored empirical RRM under the quadratic cost. We then identify a dominant mismatch mechanism responsible for the loss of resolution in the small-discrepancy regime. Based on this analysis, we introduce Selective Recursive Rank Matching (SRRM), which suppresses the resulting dominant mismatches and yields a higher-fidelity practical surrogate for the Wasserstein distance at moderate additional computational cost.
- Abstract(参考訳): 再帰的分割法はワッサーシュタイン距離に対する計算効率のよいサロゲートを提供するが、その統計的挙動と小さな分散状態における分解能は未だ十分に理解されていない。
本稿では,このクラスの代表例として再帰的ランクマッチング(RRM)について,人口順に検討する。
この設定では、2次コストで固定された経験的 RRM の整合性と明示的な収束率を確立する。
そして, 分解能の低下の原因となるミスマッチ機構を同定した。
この分析に基づいて、選択帰納的ランクマッチング(SRRM)を導入し、結果の優位なミスマッチを抑え、ある程度の計算コストでワッサーシュタイン距離の精度の高い実用的なサロゲートを得る。
関連論文リスト
- DARC: Disagreement-Aware Alignment via Risk-Constrained Decoding [59.16244104797919]
本稿では,リスク制約付き復号法(DARC)*による分散アライメント(Disagreement-Aware Alignment)を提案する。
DARCは応答選択を、分布的に堅牢で、リスクに敏感な意思決定として捉えている。
アライメントベンチマークの実験では、DARCは競合平均品質を維持しながら、不一致と尾のリスクを低減する。
論文 参考訳(メタデータ) (2026-03-09T09:21:29Z) - A Researcher's Guide to Empirical Risk Minimization [3.891921282474929]
このガイドは、経験的リスク最小化における高い確率的後悔境界の参照を提供する。
直観と一般的な証明戦略から始まり、ハイレベルな条件下で広く適用可能な保証を行う。
論文 参考訳(メタデータ) (2026-02-25T02:26:23Z) - APR: Penalizing Structural Redundancy in Large Reasoning Models via Anchor-based Process Rewards [61.52322047892064]
テスト時間スケーリング(TTS)は、Large Reasoning Models(LRM)の機能を大幅に強化した。
我々は, LRM が推論過程において最終回答を得た後も, 再検討なしに反復的自己検証を頻繁に行うことを観察した。
本稿では,Anchor-based Process Reward (APR)を提案する。
論文 参考訳(メタデータ) (2026-01-31T14:53:20Z) - Robust low-rank estimation with multiple binary responses using pairwise AUC loss [0.0]
複数のバイナリ応答は、多くの現代のデータ分析問題に現れる。
低ランクモデルはタスク間の遅延依存をエンコードする自然な方法を提供する。
既存のバイナリデータの方法は概ね可能性ベースであり、ポイントワイズ分類に重点を置いている。
論文 参考訳(メタデータ) (2026-01-13T15:00:10Z) - Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。
単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。
LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文 参考訳(メタデータ) (2025-11-20T04:11:44Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Off-Policy Evaluation in Markov Decision Processes under Weak Distributional Overlap [3.351714665243138]
我々は,マルコフ決定過程(MDP)における非政治的評価の課題を再考し,分布重なりというより弱い概念の下で検討する。
本稿では,この環境での良好な性能を期待できる2重頑健性(TDR)推定器のクラスを紹介する。
我々の実験では、強い分布重なりが保たない場合、適切な乱れが、政治外の正確な評価を可能にする上で重要な役割を担っていることがわかった。
論文 参考訳(メタデータ) (2024-02-13T03:55:56Z) - Doubly Robust Off-Policy Actor-Critic: Convergence and Optimality [131.45028999325797]
ディスカウント型MDPのための2倍堅牢なオフポリチックAC(DR-Off-PAC)を開発した。
DR-Off-PACは、俳優と批評家の両方が一定のステップで同時に更新される単一のタイムスケール構造を採用しています。
有限時間収束速度を研究し, dr-off-pac のサンプル複雑性を特徴とし, $epsilon$-accurate optimal policy を得る。
論文 参考訳(メタデータ) (2021-02-23T18:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。