論文の概要: Boltzmann State-Dependent Rationality
- arxiv url: http://arxiv.org/abs/2404.17725v1
- Date: Fri, 26 Apr 2024 23:15:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 19:40:37.894617
- Title: Boltzmann State-Dependent Rationality
- Title(参考訳): ボルツマン状態依存的合理性
- Authors: Osher Lerner,
- Abstract要約: 本稿では、構造的不合理性の測定段階を通じて、人間の行動の既存の学習モデルを拡張する。
ボルツマン合理性モデルにおける準最適定数 $beta$ を状態 $beta(s)$ 上の関数に置き換えることにより、計算的に抽出可能な自然な表現性が得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper expands on existing learned models of human behavior via a measured step in structured irrationality. Specifically, by replacing the suboptimality constant $\beta$ in a Boltzmann rationality model with a function over states $\beta(s)$, we gain natural expressivity in a computationally tractable manner. This paper discusses relevant mathematical theory, sets up several experimental designs, presents limited preliminary results, and proposes future investigations.
- Abstract(参考訳): 本稿では、構造的不合理性の測定段階を通じて、人間の行動の既存の学習モデルを拡張する。
具体的には、ボルツマンの有理性モデルにおける準最適定数 $\beta$ を状態 $\beta(s)$ 上の関数に置き換えることで、計算的に抽出可能な自然な表現性が得られる。
本稿では, 関連する数学的理論を論じ, いくつかの実験設計を立案し, 限定的な予備結果を示し, 今後の研究を提案する。
関連論文リスト
- Representation Surgery: Theory and Practice of Affine Steering [72.61363182652853]
言語モデルは、しばしば好ましくない振る舞いを示す。
モデルが望ましくない振る舞いを示すのを防ぐための自然な(そして一般的な)アプローチの1つは、モデルの表現を操ることである。
本稿では, ステアリング機能の形式的および経験的特性について検討する。
論文 参考訳(メタデータ) (2024-02-15T00:20:30Z) - On Least Square Estimation in Softmax Gating Mixture of Experts [78.3687645289918]
決定論的MoEモデルに基づく最小二乗推定器(LSE)の性能について検討する。
我々は,多種多様な専門家関数の収束挙動を特徴付けるために,強い識別可能性という条件を確立する。
本研究は,専門家の選択に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-02-05T12:31:18Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Algebraic Models for Qualified Aggregation in General Rough Sets, and
Reasoning Bias Discovery [0.0]
この研究は、懐疑的、悲観的、楽観的、あるいは懐疑的な人間の推論の集約をモデル化したいという欲求に動機づけられている。
このモデルは、人間の推論における差別的・有害な行動の研究や、そのような行動を学ぶ機械学習アルゴリズムに適している。
論文 参考訳(メタデータ) (2023-08-30T17:07:54Z) - The unstable formula theorem revisited via algorithms [17.736645608595758]
我々は、シェラの有名な不安定なフォーミュラ定理の完全なアルゴリズム的類似体を開発する。
モデル理論における型の定義可能性に類似して、近似を用いてLittlestoneクラスを記述する。
論文 参考訳(メタデータ) (2022-12-09T18:53:34Z) - Misspecification in Inverse Reinforcement Learning [80.91536434292328]
逆強化学習(IRL)の目的は、ポリシー$pi$から報酬関数$R$を推論することである。
IRLの背後にある主要な動機の1つは、人間の行動から人間の嗜好を推測することである。
これは、それらが誤って特定され、現実世界のデータに適用された場合、不適切な推測につながる恐れが生じることを意味する。
論文 参考訳(メタデータ) (2022-12-06T18:21:47Z) - Neural Implicit Manifold Learning for Topology-Aware Density Estimation [15.878635603835063]
現在の生成モデルは、ニューラルネットワークを介して$m$次元の潜在変数をマッピングすることで、$mathcalM$を学ぶ。
我々のモデルは、プッシュフォワードモデルよりも複雑なトポロジーを持つ多様体支持分布を正確に学習できることが示される。
論文 参考訳(メタデータ) (2022-06-22T18:00:00Z) - Bayesian Quadrature on Riemannian Data Manifolds [79.71142807798284]
データに固有の非線形幾何学構造をモデル化する原則的な方法が提供される。
しかし、これらの演算は通常計算的に要求される。
特に、正規法則上の積分を数値計算するためにベイズ二次(bq)に焦点を当てる。
先行知識と活発な探索手法を両立させることで,BQは必要な評価回数を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2021-02-12T17:38:04Z) - Generative Temporal Difference Learning for Infinite-Horizon Prediction [101.59882753763888]
我々は、無限確率的地平線を持つ環境力学の予測モデルである$gamma$-modelを導入する。
トレーニングタイムとテストタイムの複合的なエラーの間には、そのトレーニングが避けられないトレードオフを反映しているかについて議論する。
論文 参考訳(メタデータ) (2020-10-27T17:54:12Z) - High Dimensional Model Explanations: an Axiomatic Approach [14.908684655206494]
複雑なブラックボックス機械学習モデルは、重要な意思決定領域で頻繁に使用される。
特徴部分集合の結合効果をキャプチャする新しい高次元モデル説明法を提案する。
論文 参考訳(メタデータ) (2020-06-16T07:48:52Z) - Mathematical Reasoning via Self-supervised Skip-tree Training [17.48858100144651]
数学的公式に適用された自己教師型言語モデリングが論理的推論を可能にするかどうかを検討する。
フォーマルな数学的ステートメントに基づいて訓練された言語モデルを評価するために,いくつかの論理的推論タスクを提案する。
スキップツリータスクで訓練されたモデルは驚くほど強力な数学的推論能力を示す。
論文 参考訳(メタデータ) (2020-06-08T17:12:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。