論文の概要: From Recency Bias to Stable Convergence Block Kaczmarz Methods for Online Preference Learning in Matchmaking Applications
- arxiv url: http://arxiv.org/abs/2604.09964v1
- Date: Sat, 11 Apr 2026 00:18:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.76916
- Title: From Recency Bias to Stable Convergence Block Kaczmarz Methods for Online Preference Learning in Matchmaking Applications
- Title(参考訳): 適合性バイアスから安定収束ブロック Kaczmarz 法によるマッチング学習への応用
- Authors: James Nguyen,
- Abstract要約: 本稿では,コメンテータシステムにおけるリアルタイムの個人化マッチングのための,Kaczmarzに基づく選好学習アルゴリズムのファミリーを提案する。
BlockNKは、バッチGram解決とセッション後L2正規化を組み合わせることで、最も優先度の高いアライメントを実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We present a family of Kaczmarz-based preference learning algorithms for real-time personalized matchmaking in reciprocal recommender systems. Post-step L2 normalization, common in Kaczmarz-inspired online learners, induces exponential recency bias: the influence of the t-th interaction decays as eta^(n - t), reaching approximately 1e-6 after just 20 swipes at eta = 0.5. We resolve this by replacing the normalization step with a Tikhonov-regularized projection denominator that bounds step size analytically without erasing interaction history. When candidate tag vectors are not pre-normalized, as in realistic deployments where candidates vary in tag density, the Tikhonov denominator ||a||^2 + alpha produces genuinely per-candidate adaptive step sizes, making it structurally distinct from online gradient descent with any fixed learning rate. We further derive a block variant that processes full swipe sessions as a single Gram matrix solve. Population-scale simulation over 6,400 swipes reveals that Block Normalized Kaczmarz (BlockNK), which combines the batch Gram solve with post-session L2 normalization, achieves the highest preference alignment (Align@20 = 0.698), the strongest inter-session direction stability (delta = 0.994), and the flattest degradation profile under label noise across flip ratios p_flip in [0.10, 0.35]. Experiments under cosine similarity subsampling further show that adaptively filtering the candidate pool toward the current preference direction substantially improves asymptotic alignment, at the cost of introducing a feedback loop that may slow recovery from miscalibration. The sequential Tikhonov-Kaczmarz method performs comparably to K-NoNorm under our simulation conditions, suggesting the dominant practical gain over normalized Kaczmarz is the removal of per-step normalization rather than the Tikhonov constant alpha itself.
- Abstract(参考訳): 本稿では, 相互推薦システムにおいて, リアルタイムにパーソナライズされたマッチングのための選好学習アルゴリズムのファミリーを提示する。
Kaczmarzにインスパイアされたオンライン学習者に共通するステップ後L2正規化は指数的回帰バイアスを誘導する: t-th相互作用の影響はeta^(n - t)として崩壊し、eta = 0.5で20回のスワイプで約1e-6に達する。
我々は、通常の化ステップを、相互作用履歴を消去することなくステップサイズを解析的に束縛するTikhonov-regularized projection denominatorに置き換えることで、これを解決する。
タグ密度の異なる現実的な配置のように、候補タグベクトルが事前正規化されない場合、Tikhonov denominator ||a||^2 + α は真に候補ごとの適応的なステップサイズを生成し、一定の学習速度でオンライン勾配勾配から構造的に区別する。
さらに、1つのGram行列が解けるように、完全なスワイプセッションを処理するブロックバリアントを導出します。
6,400回以上の集団規模のシュミレーションにより、Block Normalized Kaczmarz (BlockNK) は、Gram のバッチ解と後次 L2 の正規化を組み合わせた最高優先度アライメント(Align@20 = 0.698)、最強のセッション間方向安定性(delta = 0.994)、および[0.10, 0.35] のフリップ比 p_flip のラベルノイズ下での最も平坦な劣化プロファイルが得られることが明らかになった。
さらに、コサイン類似性のサブサンプリングによる実験では、誤校正から回復を遅らせるフィードバックループを導入するコストで、候補プールを現在の選好方向に向けて適応的にフィルタリングすることで、漸近的なアライメントが大幅に向上することが示された。
逐次的Tikhonov-Kaczmarz法は、我々のシミュレーション条件下でK-Normと相補的に実行し、正規化Kaczmarzよりも支配的な実践的利得は、Tikhonov定数α自身よりもステップごとの正規化を除去することであることを示唆している。
関連論文リスト
- FAST-DIPS: Adjoint-Free Analytic Steps and Hard-Constrained Likelihood Correction for Diffusion-Prior Inverse Problems [2.9506605740700107]
トレーニングなし拡散の先行は、しばしば、繰り返し導関数や、保守的なステップサイズを持つ内部最適化/MCMCループに依存する。
本研究では、これらの内部ループをハードな測定空間実現可能性制約で置き換える訓練不要な解法を提案する。
実験はPSNR/SSIM/LPIPSと最大19.5$times$のスピードアップで、手書きのアジョイントや内部MCMCを使わずに、競争力のあるPSNR/SSIM/LPIPSを実現する。
論文 参考訳(メタデータ) (2026-03-02T08:17:26Z) - CAO: Curvature-Adaptive Optimization via Periodic Low-Rank Hessian Sketching [0.0]
一階の曲率は信頼性が高いが、鋭く異方性のある領域では遅い。
我々は、ヘッセン積を介してヘッセン部分空間をスケッチする曲率宣言法を用いる。
ResNet-18/34 の CIFAR/100 では、この手法は低損失閾値 (0.75x) をかなり早く入力する。
論文 参考訳(メタデータ) (2025-11-16T10:57:33Z) - The Implicit Bias of Batch Normalization in Linear Models and Two-layer
Linear Convolutional Neural Networks [117.93273337740442]
勾配勾配勾配は、exp(-Omega(log2 t))$収束率でトレーニングデータ上の一様マージン分類器に収束することを示す。
また、バッチ正規化はパッチワイドの均一なマージンに対して暗黙の偏りを持つことを示す。
論文 参考訳(メタデータ) (2023-06-20T16:58:00Z) - Variance-Dependent Regret Bounds for Linear Bandits and Reinforcement
Learning: Adaptivity and Computational Efficiency [90.40062452292091]
本稿では,不整合雑音を持つ線形帯域に対する計算効率のよい最初のアルゴリズムを提案する。
我々のアルゴリズムは未知のノイズの分散に適応し、$tildeO(d sqrtsum_k = 1K sigma_k2 + d)$ regretを達成する。
また、強化学習において、線形混合マルコフ決定過程(MDP)に対する分散適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-21T00:17:24Z) - A Stochastic Proximal Method for Nonsmooth Regularized Finite Sum
Optimization [7.014966911550542]
スパースサブ構造を検索するために,非滑らかな正規化を伴うディープニューラルネットワークをトレーニングする問題を考察する。
我々は、収束と最悪のケースの複雑さが勾配のリプシッツ定数の知識や近似なしで確立されるSR2と呼ばれる新しい解法を導出する。
CIFAR-10とCIFAR-100で訓練されたネットワークインスタンスの実験により、SR2はProxGENやProxSGDのような関連する手法よりも常に高い空間性と精度を達成することが示された。
論文 参考訳(メタデータ) (2022-06-14T00:28:44Z) - Differentiable Annealed Importance Sampling and the Perils of Gradient
Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。
差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。
我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文 参考訳(メタデータ) (2021-07-21T17:10:14Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z) - Balancing Rates and Variance via Adaptive Batch-Size for Stochastic
Optimization Problems [120.21685755278509]
本研究は,ステップサイズの減衰が正確な収束に必要であるという事実と,一定のステップサイズがエラーまでの時間でより速く学習するという事実のバランスをとることを目的とする。
ステップサイズのミニバッチを最初から修正するのではなく,パラメータを適応的に進化させることを提案する。
論文 参考訳(メタデータ) (2020-07-02T16:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。