論文の概要: When Determinants Are Not Enough: Private Rare Switching
- arxiv url: http://arxiv.org/abs/2605.23131v1
- Date: Fri, 22 May 2026 01:09:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.146106
- Title: When Determinants Are Not Enough: Private Rare Switching
- Title(参考訳): 決定要因が不十分な場合:プライベートなレアスイッチング
- Authors: Xingyu Zhou,
- Abstract要約: Codexは、稀にプライベートな設定に切り替える正しい方法を見つけるのに役立ちました。
線形包帯およびRLにおける標準決定式に基づく更新規則は、設計行列が単調に成長するため、美しく機能する。
コーデックスは、一般化されたレイリー商に基づいて異なるレアスイッチング則を導出する。
- 参考スコア(独自算出の注目度): 6.73122907495375
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this note, I would like to share a small research moment where Codex helped me find the right way to adapt rare switching to the private setting. The standard determinant-based update rule in linear bandits and RL works beautifully because the design matrix grows monotonically. But once Gaussian noise is added for privacy, this monotonicity can fail, and the usual analysis no longer goes through. The key reason is that determinant growth controls volume, while regret analysis needs control of the worst direction. To address this, Codex comes up with a different rare-switching rule based on the generalized Rayleigh quotient, which restores logarithmic policy updates and the desired confidence-width comparison up to a constant factor. I present my manually clean-up version of the proof here as well as some personal reflection on this example.
- Abstract(参考訳): ここでは、Codexがレアなスイッチをプライベートな設定に適応するための正しい方法を見つけるのに役立った小さな研究瞬間を紹介したいと思います。
線形包帯およびRLにおける標準決定式に基づく更新規則は、設計行列が単調に成長するため、美しく機能する。
しかし、プライバシーのためにガウスノイズを追加すると、このモノトニック性は失敗し、通常の分析はもはや通らない。
主な理由は、決定的成長が体積を制御するのに対して、後悔の分析は最悪の方向を制御する必要があることである。
これを解決するために、コーデックスは一般化されたレイリー商法に基づいて異なるレアスイッチングルールを考案し、対数的ポリシー更新と所望の信頼幅比較を一定要素まで復元する。
私の手作業による証明のクリーンアップ版と,この例に関する個人的なリフレクションを紹介します。
関連論文リスト
- A single algorithm for both restless and rested rotting bandits [65.63283411693489]
本稿では,ロッティング・アダプティブ・ウインドウUCBというアルゴリズムを導入し,ロッティング・レストとレスト・バンディットの両面において,ほぼ最適の後悔を実現する。
これは、報酬が増加するとアルゴリズムが同様の結果を得ることができないことを示す以前の否定的な結果とは対照的である。
論文 参考訳(メタデータ) (2026-04-23T08:48:52Z) - Regularized Online RLHF with Generalized Bilinear Preferences [68.44113000390544]
一般的な嗜好を伴う文脈的オンラインRLHFの問題を考える。
一般化された双線形選好モデルを用いて、低ランクなスキュー対称行列による選好を捉える。
グリーディポリシーの双対ギャップは推定誤差の正方形によって有界であることを示す。
論文 参考訳(メタデータ) (2026-02-26T15:27:53Z) - VL Norm: Rethink Loss Aggregation in RLVR [23.196933474967224]
RLVR(Reinforcement Learning with Verifiable Rewards)における動的生成長の特性に合わせた損失集約手法を提案する。
理論的にも経験的にも,様々な長さが政策損失に与える影響を解析することにより,最小分散非バイアス推定器として問題を再検討する。
我々の提案したVLノルムは、真の政策損失の偏りのない見積もりを提供するだけでなく、理論の勾配分散を最小化する。
論文 参考訳(メタデータ) (2025-09-09T09:52:34Z) - Differentially Private Iterative Screening Rules for Linear Regression [45.50668718813776]
本稿では,線形回帰のための最初のプライベートスクリーニングルールを開発する。
このスクリーニングルールは、プライベートなスクリーニングステップの結果、あまりにも多くの係数をスクリーニングする。
しかし、プライベートスクリーニングの実装が弱まり、オーバースクリーンが減少し、性能が向上する。
論文 参考訳(メタデータ) (2025-02-25T19:06:19Z) - PENDANTSS: PEnalized Norm-ratios Disentangling Additive Noise, Trend and
Sparse Spikes [1.9766522384767222]
PENDANTSSは,スパースピーク様信号の連立トレンド除去とブラインドデコンボリューションのために提案される。
これは、スムーズな傾向とノイズがローパスフィルタリングによって幾らか分離されるという仮説と相似する。
論文 参考訳(メタデータ) (2023-01-04T10:11:21Z) - Brownian Noise Reduction: Maximizing Privacy Subject to Accuracy
Constraints [53.01656650117495]
研究者と実践者の間には、プライバシとユーティリティのトレードオフの扱い方の違いがある。
ブラウン機構は、まず擬ブラウン運動の最終点に対応する高分散のガウス雑音を加えることで機能する。
我々は、古典的AboveThresholdアルゴリズムの一般化であるReduceedAboveThresholdでブラウン機構を補完する。
論文 参考訳(メタデータ) (2022-06-15T01:43:37Z) - Privacy of Noisy Stochastic Gradient Descent: More Iterations without
More Privacy Loss [34.66940399825547]
業界は単純なアルゴリズムを広く採用している:騒音を伴うグラディエントDescent(グラディエントLangevin Dynamics)
このアルゴリズムのプライバシ損失に関する疑問は、バウンドドメイン上の滑らかな凸損失の一見単純な設定であっても、まだオープンである。
我々は、差分プライバシーを一定の要因まで特徴づけ、小さなバーンイン期間の後、SGDの実行がこれ以上のプライバシーを漏らさないことを示す。
論文 参考訳(メタデータ) (2022-05-27T02:09:55Z) - Optimal Online Generalized Linear Regression with Stochastic Noise and
Its Application to Heteroscedastic Bandits [88.6139446295537]
一般化線形モデルの設定におけるオンライン一般化線形回帰の問題について検討する。
ラベルノイズに対処するため、古典的追従正規化リーダ(FTRL)アルゴリズムを鋭く解析する。
本稿では,FTRLに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-28T08:25:26Z) - A Central Limit Theorem for Differentially Private Query Answering [23.015107368002884]
プライバシパラメータの積を示し、そのメカニズムの$ell$-lossは次元によって境界が低くなることを示す。
私たちの発見は数値実験によって裏付けられる。
論文 参考訳(メタデータ) (2021-03-15T21:06:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。