論文の概要: Doubly Adaptive Social Learning
- arxiv url: http://arxiv.org/abs/2504.17370v1
- Date: Thu, 24 Apr 2025 08:43:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.301169
- Title: Doubly Adaptive Social Learning
- Title(参考訳): 二重適応型社会学習
- Authors: Marco Carpentiero, Virginia Bordignon, Vincenzo Matta, Ali H. Sayed,
- Abstract要約: ソーシャルラーニングにおいて、エージェントのネットワークは、確率スコア(信念)をいくつかの仮説に割り当て、ローカルなストリーミングデータを生成する。
ここでは、真の仮説と可能性モデルの両方が時間とともに変化する可能性のある、完全なオンライン設定に焦点を当てる。
本稿では,2つの適応型社会学習(textA2textSL$)戦略を提案する。
- 参考スコア(独自算出の注目度): 46.77451785465734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In social learning, a network of agents assigns probability scores (beliefs) to some hypotheses of interest, which rule the generation of local streaming data observed by each agent. Belief formation takes place by means of an iterative two-step procedure where: i) the agents update locally their beliefs by using some likelihood model; and ii) the updated beliefs are combined with the beliefs of the neighboring agents, using a pooling rule. This procedure can fail to perform well in the presence of dynamic drifts, leading the agents to incorrect decision making. Here, we focus on the fully online setting where both the true hypothesis and the likelihood models can change over time. We propose the doubly adaptive social learning ($\text{A}^2\text{SL}$) strategy, which infuses social learning with the necessary adaptation capabilities. This goal is achieved by exploiting two adaptation stages: i) a stochastic gradient descent update to learn and track the drifts in the decision model; ii) and an adaptive belief update to track the true hypothesis changing over time. These stages are controlled by two adaptation parameters that govern the evolution of the error probability for each agent. We show that all agents learn consistently for sufficiently small adaptation parameters, in the sense that they ultimately place all their belief mass on the true hypothesis. In particular, the probability of choosing the wrong hypothesis converges to values on the order of the adaptation parameters. The theoretical analysis is illustrated both on synthetic data and by applying the $\text{A}^2\text{SL}$ strategy to a social learning problem in the online setting using real data.
- Abstract(参考訳): ソーシャルラーニングにおいて、エージェントのネットワークは、各エージェントが観測するローカルストリーミングデータの生成を制御するいくつかの仮説に確率スコア(信念)を割り当てる。
信仰の形成は,次の2段階の反復的手順によって行われる。
一 エージェントは、何らかの可能性モデルを用いて、その信念を局所的に更新する。
二 更新された信条が、プール規則を用いて隣人の信条と組み合わされていること。
この手順は動的ドリフトの存在下ではうまく機能せず、エージェントは誤った判断を下す。
ここでは、真の仮説と可能性モデルの両方が時間とともに変化する可能性のある、完全なオンライン設定に焦点を当てる。
本稿では,社会学習に必要な適応能力と社会学習を融合させる,二重適応型ソーシャルラーニング("\text{A}^2\text{SL}$")戦略を提案する。
この目標は2つの適応段階を活用することで達成される。
一 決定モデルにおけるドリフトの学習及び追跡のための確率勾配降下更新
二 時とともに変化する真の仮説を追跡するための適応的信条の更新
これらの段階は、各エージェントのエラー確率の進化を管理する2つの適応パラメータによって制御される。
すべてのエージェントが、最終的にすべての信念質量を真の仮説の上に配置するという意味で、十分に小さな適応パラメータに対して一貫して学習することを示します。
特に、間違った仮説を選択する確率は、適応パラメータの順序の値に収束する。
この理論解析は、合成データと、実データを用いたオンライン環境におけるソーシャルラーニング問題に$\text{A}^2\text{SL}$戦略を適用することにより、双方で説明される。
関連論文リスト
- Towards Understanding Extrapolation: a Causal Lens [53.15488984371969]
我々は、外挿がいつ可能かを理論的に理解し、それを実現するための原則的な方法を提供する。
この定式化の下では、外挿問題を潜在変数識別問題にキャストする。
この理論は、基礎となる多様体の滑らかさとシフト特性の間の複雑な相互作用を明らかにする。
論文 参考訳(メタデータ) (2025-01-15T21:29:29Z) - Learning When the Concept Shifts: Confounding, Invariance, and Dimension Reduction [5.38274042816001]
観測データでは、分布シフトは観測されていない共起因子によって駆動されることが多い。
このことは、観測データを用いた領域適応問題の研究を動機付けます。
学習した低次元部分空間を用いて、ターゲットとソースのリスクの間にほぼ理想的なギャップを生じさせるモデルを示す。
論文 参考訳(メタデータ) (2024-06-22T17:43:08Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Towards Fair Disentangled Online Learning for Changing Environments [28.207499975916324]
オンライン学習における環境変化は、学習パラメータが環境に固有の部分的変化に起因していると論じる。
本稿では,各時点に収集したデータを2つの表現で切り離すことができるという仮定の下で,新しいアルゴリズムを提案する。
新たな後悔は、動的および静的な後悔の指標の混合形式と、公平性に配慮した長期的制約を伴って提案される。
論文 参考訳(メタデータ) (2023-05-31T19:04:16Z) - Conformal Inference for Online Prediction with Arbitrary Distribution
Shifts [1.2277343096128712]
我々は、データを生成する分布が時間とともに変化するオンライン環境において、予測セットを形成するという問題を考察する。
与えられた幅のすべての局所時間間隔に対して,確実に小さな後悔を伴う新規な手順を開発する。
我々は、株式市場のボラティリティと新型コロナウイルス(COVID-19)のケース数を予測するために、2つの実世界のデータセットで、我々の技術を試した。
論文 参考訳(メタデータ) (2022-08-17T16:51:12Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。
我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文 参考訳(メタデータ) (2020-11-20T22:17:12Z) - What can I do here? A Theory of Affordances in Reinforcement Learning [65.70524105802156]
我々はマルコフ決定過程の学習と計画を行うエージェントのための余裕の理論を開発する。
このケースでは、任意の状況で利用可能なアクションの数を減らすことで、アフォーダンスが二重の役割を担います。
本稿では,よりシンプルで一般化された遷移モデルを推定するために,余裕を学習し,それを利用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-26T16:34:53Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。