論文の概要: Social-Inverse: Inverse Decision-making of Social Contagion Management
with Task Migrations
- arxiv url: http://arxiv.org/abs/2209.10493v1
- Date: Wed, 21 Sep 2022 16:50:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 17:28:13.243474
- Title: Social-Inverse: Inverse Decision-making of Social Contagion Management
with Task Migrations
- Title(参考訳): 社会逆:タスク移行による社会感染管理の逆決定-
- Authors: Guangmo Tong
- Abstract要約: 本稿では,社会感染管理における意思決定課題に対処するための一般的な枠組みを提案する。
我々は有望な実験結果を取得し、ある意思決定課題を他の課題に関連する解を用いて解決できることを初めて確認した。
- 参考スコア(独自算出の注目度): 6.457205049532316
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Considering two decision-making tasks $A$ and $B$, each of which wishes to
compute an effective \textit{decision} $Y$ for a given \textit{query} $X$, {can
we solve task $B$ by using query-decision pairs $(X, Y)$ of $A$ without knowing
the latent decision-making model?} Such problems, called \textit{inverse
decision-making with task migrations}, are of interest in that the complex and
stochastic nature of real-world applications often prevents the agent from
completely knowing the underlying system. In this paper, we introduce such a
new problem with formal formulations and present a generic framework for
addressing decision-making tasks in social contagion management. On the theory
side, we present a generalization analysis for justifying the learning
performance of our framework. In empirical studies, we perform a sanity check
and compare the presented method with other possible learning-based and
graph-based methods. We have acquired promising experimental results,
confirming for the first time that it is possible to solve one decision-making
task by using the solutions associated with another one.
- Abstract(参考訳): a$ と $b$ の2つの意思決定タスクを考えると、それぞれが所定の \textit{query} $x$ に対して効果的な \textit{decision} $y$ を計算したいと考えています。
} このような問題は \textit{inverse decision-making with task migrations} と呼ばれ、現実のアプリケーションの複雑で確率的な性質がエージェントが基盤となるシステムを完全に把握することを妨げることに関心を持っている。
本稿では,形式的定式化に関する新たな問題を紹介し,社会的伝染管理における意思決定タスクに対処するための汎用的な枠組みを提案する。
理論面では,フレームワークの学習性能を正当化するための一般化分析を提案する。
実験的な研究において,提案手法を他の学習ベースおよびグラフベース手法と比較し,正当性チェックを行う。
我々は有望な実験結果を取得し、ある意思決定課題を他の課題に関連する解を用いて解決できることを初めて確認した。
関連論文リスト
- Metareasoning in uncertain environments: a meta-BAMDP framework [1.0923877073891441]
本稿では,未知の報酬/遷移分布を持つ環境におけるメタ推論を扱うメタベイズ適応型MDPフレームワークを提案する。
最初のステップとして、人間の意思決定によく使われる2本腕のBernoulli bandit(TABB)タスクにこのフレームワークを適用します。
論文 参考訳(メタデータ) (2024-08-02T13:15:01Z) - Contractual Reinforcement Learning: Pulling Arms with Invisible Hands [68.77645200579181]
本稿では,契約設計によるオンライン学習問題において,利害関係者の経済的利益を整合させる理論的枠組みを提案する。
計画問題に対して、遠目エージェントに対する最適契約を決定するための効率的な動的プログラミングアルゴリズムを設計する。
学習問題に対して,契約の堅牢な設計から探索と搾取のバランスに至るまでの課題を解き放つために,非回帰学習アルゴリズムの汎用設計を導入する。
論文 参考訳(メタデータ) (2024-07-01T16:53:00Z) - Divide-or-Conquer? Which Part Should You Distill Your LLM? [38.62667131299918]
我々は、推論タスクを問題解決フェーズと問題解決フェーズに分解する同様の戦略を考案する。
戦略が単一ステージソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2024-02-22T22:28:46Z) - Plan, Verify and Switch: Integrated Reasoning with Diverse X-of-Thoughts [65.15322403136238]
我々は,多種多様な推論の思考をLCMに促すことにより,総合的な問題解決フレームワーク XoT を提案する。
各質問に対して、XoTは常に最も適切なメソッドを選択して始まり、各メソッドを反復的に実行する。
各イテレーション内で、XoTは生成された回答の有効性を積極的にチェックし、外部エグゼクタからのフィードバックを取り入れます。
論文 参考訳(メタデータ) (2023-10-23T07:02:20Z) - A machine learning framework for neighbor generation in metaheuristic
search [4.521119623956821]
メタヒューリスティック検索における近隣世代のための汎用機械学習フレームワークを提案する。
メタヒューリスティックな2つの応用法について検証する。
論文 参考訳(メタデータ) (2022-12-22T01:58:04Z) - Direct Heterogeneous Causal Learning for Resource Allocation Problems in
Marketing [20.9377115817821]
マーケティングは、ユーザのエンゲージメントを高め、プラットフォーム収益を改善するための重要なメカニズムである。
マーケティングにおける意思決定問題は資源配分問題として定式化され、数十年にわたって研究されてきた。
既存の作業は通常、解法を2つの完全に分離された段階、すなわち機械学習(ML)と操作研究(OR)に分割する。
論文 参考訳(メタデータ) (2022-11-28T19:27:34Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - AR-LSAT: Investigating Analytical Reasoning of Text [57.1542673852013]
テキストの分析的推論の課題を研究し、1991年から2016年までのロースクール入学試験からの質問からなる新しいデータセットを紹介します。
我々は,この課題をうまくこなすために必要な知識理解と推論能力を分析する。
論文 参考訳(メタデータ) (2021-04-14T02:53:32Z) - Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。
本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。
本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文 参考訳(メタデータ) (2021-01-24T05:40:29Z) - On Exploiting Hitting Sets for Model Reconciliation [53.81101846598925]
ヒューマン・アウェア・プランニングにおいて、プランニング・エージェントは、その計画がなぜ最適なのかを人間に説明する必要があるかもしれない。
この手法はモデル和解と呼ばれ、エージェントはモデルと人間のモデルの違いを調和させようとする。
我々は,計画の領域を超えて拡張されたモデル和解のための論理ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-16T21:25:53Z) - Adaptive Submodular Meta-Learning [28.24164217929491]
適応的なサブモジュラーメタラーニング問題を紹介し,研究する。
私たちの問題の入力は、各アイテムが最初に不明なランダムな状態を持つアイテムのセットです。
本研究の目的は,タスクセット上で最高のパフォーマンスを達成する項目群を適応的に選択することである。
論文 参考訳(メタデータ) (2020-12-11T01:28:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。