論文の概要: Role of collective information in networks of quantum operating agents
- arxiv url: http://arxiv.org/abs/2201.11008v2
- Date: Mon, 25 Apr 2022 15:03:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 20:25:35.252491
- Title: Role of collective information in networks of quantum operating agents
- Title(参考訳): 量子演算エージェントのネットワークにおける集団情報の役割
- Authors: V.I. Yukalov, E.P. Yukalova, and D. Sornette
- Abstract要約: エージェントのネットワークは、決定過程が量子決定理論によって記述されると考えられる。
これら3つのコントリビューション間の相互作用の結果、いくつかの選択肢の選択プロセスはマルチモーダルである。
すべてのエージェントに共通する情報領域は、確率の時間的振る舞いの急激な変動を滑らかにする傾向がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A network of agents is considered whose decision processes are described by
the quantum decision theory previously advanced by the authors. Decision making
is done by evaluating the utility of alternatives, their attractiveness, and
the available information, whose combinations form the probabilities to choose
a given alternative. As a result of the interplay between these three
contributions, the process of choice between several alternatives is
multimodal. The agents interact by exchanging information, which can take two
forms: (i) information that an agent can directly receive from another agent
and (ii) information collectively created by the members of the society. The
information field common to all agents tends to smooth out sharp variations in
the temporal behaviour of the probabilities and can even remove them. For
agents with short-term memory, the probabilities often tend to their limiting
values through strong oscillations and, for a range of parameters, these
oscillations last for ever, representing an ever lasting hesitation of the
decision makers. Switching on the information field makes the amplitude of the
oscillations smaller and even can halt the everlasting oscillations forcing the
probabilities to converge to fixed limits. The dynamic disjunction effect is
described.
- Abstract(参考訳): エージェントのネットワークは、前述した量子決定理論によって決定過程が記述されると考えられる。
決定は、選択肢の効用、魅力、利用可能な情報を評価して行われ、その組み合わせが与えられた選択肢を選択する確率を形成する。
これら3つのコントリビューション間の相互作用の結果、いくつかの選択肢の選択プロセスはマルチモーダルである。
エージェントは情報交換によって対話し、2つの形式をとることができる。
(i)エージェントが他のエージェントから直接受け取ることができる情報
(ii)協会員が総合的に作成した情報
すべてのエージェントに共通する情報領域は、確率の時間的振る舞いの急激な変動を滑らかにし、それらを取り除くことができる。
短期記憶を持つエージェントの場合、確率は強い振動を通じて限界値になりがちであり、様々なパラメータのためにこれらの振動は永遠に持続し、意思決定者の絶え間ない迷いを表す。
情報フィールドを切り替えることで、振動の振幅が小さくなり、確率を一定の限界に収束させる永遠の振動さえ停止できる。
動的解離効果について述べる。
関連論文リスト
- Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent [50.508669199496474]
外部知識に基づいて推論と行動を行うReAct-style LLMエージェントを開発した。
エージェントをReSTライクな手法で改良し,従来の軌道上で反復的に訓練する。
引き起こされた大きなモデルから始まり、アルゴリズムのたった2イテレーションの後に、微調整された小さなモデルを生成することができる。
論文 参考訳(メタデータ) (2023-12-15T18:20:15Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Bounding probabilities of causation through the causal marginal problem [12.542533707005092]
因果関係の確率は、法律、医療、公共政策における意思決定において基本的な役割を担っている。
多くの臨床試験や公共政策評価ケースでは、異なる治療が同じ結果変数に与える影響を調べる独立したデータセットが存在する。
本稿では、このような独立したデータセットから構築されたSCM間の対実的整合性を示すことにより、因果関係の確率に対する既存の限界を著しく厳格化する方法について概説する。
論文 参考訳(メタデータ) (2023-04-04T12:16:38Z) - Exploring the Trade-off between Plausibility, Change Intensity and
Adversarial Power in Counterfactual Explanations using Multi-objective
Optimization [73.89239820192894]
自動対物生成は、生成した対物インスタンスのいくつかの側面を考慮すべきである。
本稿では, 対実例生成のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-20T15:02:53Z) - Robust Event-Driven Interactions in Cooperative Multi-Agent Learning [0.0]
本稿では,マルチエージェント学習システムにおけるエージェント間の通信を,基礎となるマルコフ決定プロセスの本質的ロバスト性を利用して削減する手法を提案する。
いわゆるロバストネス代理関数(オフライン)を計算し、エージェントがシステム内の他のエージェントを更新する前に、その状態の測定値がどれくらい逸脱するかを保守的に示す。
これにより、完全に分散された決定関数が実現され、エージェントが他を更新する必要があるかどうかを判断できるようになる。
論文 参考訳(メタデータ) (2022-04-07T11:00:39Z) - SMEMO: Social Memory for Trajectory Forecasting [34.542209630734234]
本稿では、外部記憶装置として機能するエンドツーエンドのトレーニング可能なワーキングメモリに基づくニューラルネットワークを提案する。
提案手法は,異なるエージェントの動き間の説明可能な因果関係を学習し,軌跡予測データセットの最先端結果を得ることができることを示す。
論文 参考訳(メタデータ) (2022-03-23T14:40:20Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - A New Bandit Setting Balancing Information from State Evolution and
Corrupted Context [52.67844649650687]
本稿では,2つの確立されたオンライン学習問題と包括的フィードバックを組み合わせた,逐次的意思決定方式を提案する。
任意の瞬間にプレーする最適なアクションは、エージェントによって直接観察できない基礎となる変化状態に付随する。
本稿では,レフェリーを用いて,コンテキストブレイジットとマルチアームブレイジットのポリシーを動的に組み合わせるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-16T14:35:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。