論文の概要: A Correction of Pseudo Log-Likelihood Method
- arxiv url: http://arxiv.org/abs/2403.18127v1
- Date: Tue, 26 Mar 2024 22:15:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 20:55:22.659252
- Title: A Correction of Pseudo Log-Likelihood Method
- Title(参考訳): Pseudo Log-Likelihood 法の補正
- Authors: Shi Feng, Nuoya Xiong, Zhijie Zhang, Wei Chen,
- Abstract要約: Pseudo log-likelihood は、コンテキストブレイト、ソーシャルネットワークの影響、因果ブレイトなど様々な分野で使用される可能性推定 (MLE) の一種である。
本稿では,最大擬似対数類似度推定が失敗する反例を示し,このアルゴリズムを citepli 2017, zhang2022online, xiong2022binacomtorial, feng2023combinatorial1, feng2023combinatorial2 で正解する。
- 参考スコア(独自算出の注目度): 19.655767512462226
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pseudo log-likelihood is a type of maximum likelihood estimation (MLE) method used in various fields including contextual bandits, influence maximization of social networks, and causal bandits. However, in previous literature \citep{li2017provably, zhang2022online, xiong2022combinatorial, feng2023combinatorial1, feng2023combinatorial2}, the log-likelihood function may not be bounded, which may result in the algorithm they proposed not well-defined. In this paper, we give a counterexample that the maximum pseudo log-likelihood estimation fails and then provide a solution to correct the algorithms in \citep{li2017provably, zhang2022online, xiong2022combinatorial, feng2023combinatorial1, feng2023combinatorial2}.
- Abstract(参考訳): Pseudo log-likelihood (Pseudo log-likelihood) は、コンテキストブレイト、ソーシャルネットワークの最大化、因果ブレイトなど様々な分野で使用される最大推定(MLE)手法の一種である。
しかし、以前の文献 \citep{li2017provably, zhang2022online, xiong2022combinatorial, feng2023combinatorial1, feng2023combinatorial2} では、対数様の関数は有界でないかもしれない。
本稿では、最大擬似対数類似度推定が失敗し、次に、アルゴリズムを正すための解を \citep{li2017, zhang2022online, xiong2022combinatorial, feng2023combinatorial1, feng2023combinatorial2} で示す。
関連論文リスト
- Best-of-Both-Worlds Policy Optimization for CMDPs with Bandit Feedback [34.7178680288326]
Stradi et al.(2024) は、マルコフ決定過程に制約のある最初のベスト・オブ・ボス・ワールドズ・アルゴリズムを提案した。
本稿では,CMDPにおける帯域幅フィードバックを用いたベスト・オブ・ワールドズ・アルゴリズムを提案する。
本アルゴリズムは政策最適化手法に基づいており, 占有率に基づく手法よりも効率的である。
論文 参考訳(メタデータ) (2024-10-03T07:44:40Z) - Individualized Privacy Accounting via Subsampling with Applications in Combinatorial Optimization [55.81991984375959]
本研究では、以下の簡単な観察を通して、個別化されたプライバシ会計を解析する新しい手法を提案する。
我々は、分解可能な部分モジュラーおよびセットアルゴリズム被覆を含む、プライベート最適化問題に対するいくつかの改良されたアルゴリズムを得る。
論文 参考訳(メタデータ) (2024-05-28T19:02:30Z) - Inference for an Algorithmic Fairness-Accuracy Frontier [0.9147443443422864]
We provide a consistent estimator for a theoretical fairness-accuracy frontier forward by Liang, Lu and Mu (2023)
フェアネス文学で注目されている仮説を検証するための推論手法を提案する。
サンプルサイズが大きくなるにつれて, 推定された支持関数が密なプロセスに収束することを示す。
論文 参考訳(メタデータ) (2024-02-14T00:56:09Z) - Distribution-Free Inference for the Regression Function of Binary
Classification [0.0]
本稿では,ユーザの信頼度レベルに対する真の回帰関数に対して,正確に,分布自由で,漸近的に保証されていない信頼領域を構築するための再サンプリングフレームワークを提案する。
構築された信頼領域は強い整合性、すなわち、任意の偽モデルが確率 1 で長期にわたって除外されることが証明された。
論文 参考訳(メタデータ) (2023-08-03T15:52:27Z) - A Framework for Adapting Offline Algorithms to Solve Combinatorial
Multi-Armed Bandit Problems with Bandit Feedback [27.192028744078282]
離散オフライン近似アルゴリズムをサブ線形$alpha$-regretに適応するためのフレームワークを提供する。
提案手法は準モジュラー地平線における多種多様な応用に適用できる。
論文 参考訳(メタデータ) (2023-01-30T23:18:06Z) - Optimal variance-reduced stochastic approximation in Banach spaces [114.8734960258221]
可分バナッハ空間上で定義された収縮作用素の定点を推定する問題について検討する。
演算子欠陥と推定誤差の両方に対して漸近的でない境界を確立する。
論文 参考訳(メタデータ) (2022-01-21T02:46:57Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Provable Benefits of Actor-Critic Methods for Offline Reinforcement
Learning [85.50033812217254]
アクター批判法はオフラインの強化学習に広く用いられているが、理論的にはそれほどよく理解されていない。
ペシミズムの原理を自然に取り入れた新しいオフラインアクター批判アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-08-19T17:27:29Z) - High Probability Complexity Bounds for Non-Smooth Stochastic Optimization with Heavy-Tailed Noise [51.31435087414348]
アルゴリズムが高い確率で小さな客観的残差を与えることを理論的に保証することが不可欠である。
非滑らか凸最適化の既存の方法は、信頼度に依存した複雑性境界を持つ。
そこで我々は,勾配クリッピングを伴う2つの手法に対して,新たなステップサイズルールを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:54:21Z) - Asymptotic Randomised Control with applications to bandits [0.0]
相関要素を持つ一般的なマルチアームバンディット問題を緩和制御問題として考察する。
エントロピー正規化を導入することにより、値関数への滑らかな近似が得られる。
これにより、最適決定過程の新たな半指数近似が得られる。
論文 参考訳(メタデータ) (2020-10-14T17:17:48Z) - Revisiting Modified Greedy Algorithm for Monotone Submodular
Maximization with a Knapsack Constraint [75.85952446237599]
修正されたグリードアルゴリズムは、近似係数が0.305$であることを示す。
最適なデータ依存上界を導出する。
また、分岐やバウンドといったアルゴリズムの効率を大幅に改善するためにも使うことができる。
論文 参考訳(メタデータ) (2020-08-12T15:40:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。