論文の概要: Learning Peer Influence Probabilities with Linear Contextual Bandits
- arxiv url: http://arxiv.org/abs/2510.19119v1
- Date: Tue, 21 Oct 2025 22:38:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:14.822293
- Title: Learning Peer Influence Probabilities with Linear Contextual Bandits
- Title(参考訳): 線形文脈帯域を用いたピア影響確率の学習
- Authors: Ahmed Sayeed Faruk, Mohammad Shahverdikondori, Elena Zheleva,
- Abstract要約: 文脈的線形バンディットの枠組みに基づく学習ピアインフルエンス確率について検討する。
本稿では,不確かさ最小化と推定誤差の間に根本的なトレードオフが生じ,達成可能な全てのレートペアを特徴付けるとともに,不確実性誘導探索アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 5.887969742827489
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In networked environments, users frequently share recommendations about content, products, services, and courses of action with others. The extent to which such recommendations are successful and adopted is highly contextual, dependent on the characteristics of the sender, recipient, their relationship, the recommended item, and the medium, which makes peer influence probabilities highly heterogeneous. Accurate estimation of these probabilities is key to understanding information diffusion processes and to improving the effectiveness of viral marketing strategies. However, learning these probabilities from data is challenging; static data may capture correlations between peer recommendations and peer actions but fails to reveal influence relationships. Online learning algorithms can learn these probabilities from interventions but either waste resources by learning from random exploration or optimize for rewards, thus favoring exploration of the space with higher influence probabilities. In this work, we study learning peer influence probabilities under a contextual linear bandit framework. We show that a fundamental trade-off can arise between regret minimization and estimation error, characterize all achievable rate pairs, and propose an uncertainty-guided exploration algorithm that, by tuning a parameter, attains any pair within this trade-off. Our experiments on semi-synthetic network datasets show the advantages of our method over static methods and contextual bandits that ignore this trade-off.
- Abstract(参考訳): ネットワーク化された環境では、ユーザーはコンテンツ、製品、サービス、および行動コースに関するレコメンデーションを他の人と共有することが多い。
このようなレコメンデーションが成功し採用される程度は、送信者、受信者、その関係、推奨項目、および媒体の特性に大きく依存する。
これらの確率の正確な推定は、情報拡散過程を理解し、バイラルマーケティング戦略の有効性を向上させるための鍵となる。
しかし、これらの確率をデータから学ぶことは難しい。静的データは、ピアレコメンデーションとピアアクションの相関をキャプチャするが、影響関係を明らかにすることができない。
オンライン学習アルゴリズムは、介入からこれらの確率を学ぶことができるが、ランダムな探索から学習することで資源を無駄にするか、報酬のために最適化する。
本研究では,文脈的線形バンディットの枠組みを用いて,ピアインフルエンス確率の学習について検討する。
また,パラメータをチューニングすることにより,このトレードオフ内で任意のペアを達成できる不確実性誘導探索アルゴリズムを提案する。
半合成ネットワークデータセットに対する実験により,このトレードオフを無視した静的手法や文脈的帯域幅よりも,我々の手法の利点が示された。
関連論文リスト
- Adaptive Bounded Exploration and Intermediate Actions for Data Debiasing [18.87576995391638]
適応的および有界探索によりトレーニングデータセットを逐次劣化させるアルゴリズムを提案する。
提案したアルゴリズムは、データバイアスの影響を緩和するという究極の目標との間にバランスを取ります。
論文 参考訳(メタデータ) (2025-04-10T22:22:23Z) - Efficient Transfer Learning via Causal Bounds [8.981637739384674]
我々は、因果側情報がどのようにオンライン学習を加速するかを分析し、データ削減の実験を行う。
我々の分析は、因果側情報がどのようにオンライン学習を加速させるか、およびデータ削減の実験を正確に特徴付ける。
論文 参考訳(メタデータ) (2023-08-07T13:24:50Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Learning from Similarity-Confidence Data [94.94650350944377]
類似度信頼性(Sconf)データから学習する新しい弱監督学習問題について検討する。
本研究では,Sconfデータのみから計算可能な分類リスクの非バイアス推定器を提案し,推定誤差境界が最適収束率を達成することを示す。
論文 参考訳(メタデータ) (2021-02-13T07:31:16Z) - Controllable Guarantees for Fair Outcomes via Contrastive Information
Estimation [32.37031528767224]
トレーニングデータセットにおけるバイアスの制御は、下流のアプリケーションで異なるグループ間で平等に扱われることを保証するために不可欠である。
対比情報推定器に基づく相互情報によるパリティ制御の効果的な方法を示す。
uci成人および遺産健康データセットに対する我々のアプローチをテストし、このアプローチが所望のパリティ閾値にまたがってより有益な表現を提供することを実証する。
論文 参考訳(メタデータ) (2021-01-11T18:57:33Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。