論文の概要: Information Avoidance and Overvaluation in Sequential Decision Making
under Epistemic Constraints
- arxiv url: http://arxiv.org/abs/2106.04984v1
- Date: Wed, 9 Jun 2021 11:05:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 14:53:01.446044
- Title: Information Avoidance and Overvaluation in Sequential Decision Making
under Epistemic Constraints
- Title(参考訳): 疫学制約下におけるシークエンシャル意思決定における情報回避と過大評価
- Authors: Shuo Li, Matteo Pozzi
- Abstract要約: 民間資産・制度の管理に関わる意思決定者は、社会規制によって課せられる制約の下で行動する。
これらの制約のいくつかは、障害発生の確率とそれに対応するリスクとして、てんかん量と関連している。
社会的規制が意思決定者と一致しない経済的な視点を符号化する場合、情報の価値(VoI)は否定的である。
我々はこれらの現象を、情報回避(IA)と情報過度(IOV)と呼ぶ。
- 参考スコア(独自算出の注目度): 6.0288766970390455
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Decision makers involved in the management of civil assets and systems
usually take actions under constraints imposed by societal regulations. Some of
these constraints are related to epistemic quantities, as the probability of
failure events and the corresponding risks. Sensors and inspectors can provide
useful information supporting the control process (e.g. the maintenance process
of an asset), and decisions about collecting this information should rely on an
analysis of its cost and value. When societal regulations encode an economic
perspective that is not aligned with that of the decision makers, the Value of
Information (VoI) can be negative (i.e., information sometimes hurts), and
almost irrelevant information can even have a significant value (either
positive or negative), for agents acting under these epistemic constraints. We
refer to these phenomena as Information Avoidance (IA) and Information
OverValuation (IOV). In this paper, we illustrate how to assess VoI in
sequential decision making under epistemic constraints (as those imposed by
societal regulations), by modeling a Partially Observable Markov Decision
Processes (POMDP) and evaluating non optimal policies via Finite State
Controllers (FSCs). We focus on the value of collecting information at current
time, and on that of collecting sequential information, we illustrate how these
values are related and we discuss how IA and IOV can occur in those settings.
- Abstract(参考訳): 民事資産や制度の管理に関わる意思決定者は、通常、社会規則によって課される制約の下で行動する。
これらの制約の一部は、障害発生の確率とそれに対応するリスクとして、てんかん量と関連している。
センサーとインスペクタは制御プロセスをサポートする有用な情報を提供することができる(例)。
資産の維持プロセス)と、この情報の収集に関する決定は、そのコストと価値の分析に依存するべきである。
社会的規制が意思決定者と一致しない経済的な視点を符号化する場合、情報の価値(VoI)は否定的になりうるし、ほぼ無関係な情報は、これらの疫学的な制約の下で行動するエージェントに対して、重要な価値(肯定的または否定的)を持つこともある。
本稿では,これらの現象をIA(Information Avoidance)とIOV(Information OverValuation)と呼ぶ。
本稿では,部分可観測マルコフ決定過程 (pomdp) をモデル化し,有限状態制御 (fscs) による非最適政策を評価することにより,認識的制約の下での逐次的意思決定におけるvoiの評価方法を示す。
我々は,現在における情報収集の価値に着目し,シーケンシャルな情報収集の意義について述べるとともに,ia と iov がどのように関連しているかを考察する。
関連論文リスト
- Data-Centric AI Governance: Addressing the Limitations of Model-Focused Policies [40.92400015183777]
強力なAI能力に関する現在の規制は、"境界"または"フロンティア"モデルに絞られている。
これらの用語は曖昧で一貫性のない定義であり、ガバナンス活動の不安定な基盤につながります。
本稿では,モデルがもたらすリスクを評価する上で,データセットのサイズや内容が重要な要因であることを示す。
論文 参考訳(メタデータ) (2024-09-25T17:59:01Z) - Aiding Humans in Financial Fraud Decision Making: Toward an XAI-Visualization Framework [6.040452803295326]
金融詐欺捜査員は、大量の構造化されていない情報を手動で合成するという課題に直面している。
現在のVisual Analyticsシステムは、主にこのプロセスの独立した側面をサポートしている。
本稿では,金融不正調査のあらゆる段階において,VAシステムが意思決定者を支援する枠組みを提案する。
論文 参考訳(メタデータ) (2024-08-26T18:10:07Z) - Language Models Can Reduce Asymmetry in Information Markets [100.38786498942702]
我々は、言語モデルを利用した知的エージェントが外部参加者に代わって情報を売買する、オープンソースのシミュレートされたデジタルマーケットプレースを紹介した。
このマーケットプレースを実現する中心的なメカニズムはエージェントの二重機能であり、特権情報の品質を評価する能力を持つと同時に、忘れる能力も備えている。
適切に行動するためには、エージェントは合理的な判断をし、生成されたサブクエリを通じて市場を戦略的に探索し、購入した情報から回答を合成する必要がある。
論文 参考訳(メタデータ) (2024-03-21T14:48:37Z) - QuantTM: Business-Centric Threat Quantification for Risk Management and Cyber Resilience [0.259990372084357]
QuantTMは、脅威情報収集のための運用および戦略的ビジネス代表者の見解を取り入れたアプローチである。
脅威の影響の分析とセキュリティ制御の適用性を高める。
論文 参考訳(メタデータ) (2024-02-21T21:34:06Z) - Accountability in Offline Reinforcement Learning: Explaining Decisions
with a Corpus of Examples [70.84093873437425]
本稿では、オフラインデータセットを決定コーパスとして利用するAOC(Accountable Offline Controller)を紹介する。
AOCはローデータシナリオで効果的に動作し、厳密なオフラインの模倣設定まで拡張でき、保存性と適応性の両方の品質を示す。
シミュレーションおよび実世界の医療シナリオにおいて、AOCのパフォーマンスを評価し、説明責任を維持しながら高いレベルのパフォーマンスでオフライン制御タスクを管理する能力を強調した。
論文 参考訳(メタデータ) (2023-10-11T17:20:32Z) - Towards a multi-stakeholder value-based assessment framework for
algorithmic systems [76.79703106646967]
我々は、価値間の近さと緊張を可視化する価値に基づくアセスメントフレームワークを開発する。
我々は、幅広い利害関係者に評価と検討のプロセスを開放しつつ、それらの運用方法に関するガイドラインを提示する。
論文 参考訳(メタデータ) (2022-05-09T19:28:32Z) - Inverse Online Learning: Understanding Non-Stationary and Reactionary
Policies [79.60322329952453]
エージェントが意思決定を行う方法の解釈可能な表現を開発する方法を示す。
一連の軌跡に基づく意思決定プロセスを理解することにより,このオンライン学習問題に対して,政策推論問題を逆問題とみなした。
本稿では、エージェントがそれらを更新するプロセスと並行して、その影響を遡及的に推定する実用的なアルゴリズムを提案する。
UNOSの臓器提供受諾決定の分析に応用することで、我々のアプローチは意思決定プロセスを管理する要因や時間とともにどのように変化するかに、貴重な洞察をもたらすことができることを実証する。
論文 参考訳(メタデータ) (2022-03-14T17:40:42Z) - Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in
Partially Observed Markov Decision Processes [65.91730154730905]
医療や教育などの観察データへのオフライン強化学習の適用においては、観察された行動は観測されていない要因に影響される可能性があるという一般的な懸念がある。
ここでは、部分的に観察されたマルコフ決定過程(POMDP)における非政治評価を考慮し、この問題に取り組む。
我々は、近位因果推論の枠組みをPOMDP設定に拡張し、識別が可能となる様々な設定を提供する。
論文 参考訳(メタデータ) (2021-10-28T17:46:14Z) - Inverse Active Sensing: Modeling and Understanding Timely
Decision-Making [111.07204912245841]
我々は,内因性,文脈依存型時間圧下でのエビデンスに基づく意思決定の一般的な設定のための枠組みを開発する。
意思決定戦略において、サプライズ、サスペンス、最適性の直感的な概念をモデル化する方法を実証する。
論文 参考訳(メタデータ) (2020-06-25T02:30:45Z) - Value of structural health information in partially observable
stochastic environments [0.0]
情報の価値(VoI)と構造健康モニタリング(VoSHM)の理論的・計算的基礎を紹介し,研究する。
この結果から,POMDP政策はVoIの概念を本質的に活用し,各決定ステップにおいて最適な方法で観測行動の導出を行うことが示唆された。
論文 参考訳(メタデータ) (2019-12-28T22:18:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。