Fugu-MT 論文翻訳(概要): Let's Think Var-by-Var: Large Language Models Enable Ad Hoc Probabilistic Reasoning

論文の概要: Let's Think Var-by-Var: Large Language Models Enable Ad Hoc Probabilistic Reasoning

arxiv url: http://arxiv.org/abs/2412.02081v1
Date: Tue, 03 Dec 2024 01:53:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:22.83417
Title: Let's Think Var-by-Var: Large Language Models Enable Ad Hoc Probabilistic Reasoning
Title（参考訳）: Var-by-Var:大規模言語モデルはアドホック確率的推論を可能にする
Authors: Shepard Xia, Brian Lu, Jason Eisner,
Abstract要約: 大規模言語モデル(LLM)から共通感覚を抽出することを提案する。私たちは、$textitguesstimation$の質問に焦点を合わせています。我々のフレームワークは、そのような疑問に$textitad hoc$probabilistic modelで答える。
参考スコア（独自算出の注目度）: 15.568698101627088
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A hallmark of intelligence is the ability to flesh out underspecified situations using "common sense." We propose to extract that common sense from large language models (LLMs), in a form that can feed into probabilistic inference. We focus our investigation on $\textit{guesstimation}$ questions such as "How much are Airbnb listings in Newark, NJ?" Formulating a sensible answer without access to data requires drawing on, and integrating, bits of common knowledge about how $\texttt{Price}$ and $\texttt{Location}$ may relate to other variables, such as $\texttt{Property Type}$. Our framework answers such a question by synthesizing an $\textit{ad hoc}$ probabilistic model. First we prompt an LLM to propose a set of random variables relevant to the question, followed by moment constraints on their joint distribution. We then optimize the joint distribution $p$ within a log-linear family to maximize the overall constraint satisfaction. Our experiments show that LLMs can successfully be prompted to propose reasonable variables, and while the proposed numerical constraints can be noisy, jointly optimizing for their satisfaction reconciles them. When evaluated on probabilistic questions derived from three real-world tabular datasets, we find that our framework performs comparably to a direct prompting baseline in terms of total variation distance from the dataset distribution, and is similarly robust to noise.
Abstract（参考訳）: 知能の目印は「常識」を用いて不明瞭な状況を具体化する能力である。本稿では,その共通感覚を大規模言語モデル (LLM) から抽出し,確率的推論に導出できる形式を提案する。調査は、$\textit{guesstimation}$の質問に重点を置いている。データにアクセスせずに意味のある回答を定式化するには、$\texttt{Price}$と$\texttt{Location}$が、$\texttt{Property Type}$のような他の変数とどのように関係するかについての共通知識の描画と統合が必要である。我々のフレームワークは、$\textit{ad hoc}$probabilistic modelを合成することで、そのような質問に答える。まず LLM に質問に関連する確率変数の集合を提案し,続いてその連関分布に対するモーメント制約を提案する。次に、ログリニアファミリー内の結合分布$p$を最適化して、全体的な制約満足度を最大化する。実験の結果, LLMは妥当な変数の提案に成功し, 提案した数値制約はノイズを伴いうるが, 満足度を両立させることが可能であることがわかった。実世界の3つの表型データセットから導かれる確率的質問に対して評価すると,本フレームワークは,データセット分布からの全変動距離において,直接的プロンプトベースラインと同等に動作し,同様にノイズに対して頑健であることがわかった。

関連論文リスト

Regression-Based Estimation of Causal Effects in the Presence of Selection Bias and Confounding [52.1068936424622]
治療が介入によって設定された場合、対象変数$Y$に対して、予測因果効果$E[Y|do(X)]$を推定する問題を考える。選択バイアスや欠点のない設定では、$E[Y|do(X)] = E[Y|X]$ となる。選択バイアスとコンバウンディングの両方を組み込んだフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-26T13:43:37Z)
Identifying General Mechanism Shifts in Linear Causal Representations [58.6238439611389]
我々は,未知の潜在因子の線形混合を観測する線形因果表現学習環境について考察する。近年の研究では、潜伏要因の復元や、それに基づく構造因果モデルの構築が可能であることが示されている。非常に穏やかな標準仮定の下では、シフトしたノードの集合を識別することが可能である。
論文参考訳（メタデータ） (2024-10-31T15:56:50Z)
FLARE: Faithful Logic-Aided Reasoning and Exploration [50.9814063216852]
タスク分解を用いて問題空間をトラバースする新しい手法を提案する。我々はLarge Language Modelsを使ってソリューションを計画し、クエリを事実に軟式化し、論理プログラミングコードを使って述語する。提案手法は,生成したコードに対する推論プロセスの忠実度を計算し,外部の解法に頼らずにマルチホップ探索のステップを解析する。
論文参考訳（メタデータ） (2024-10-14T19:39:11Z)
QUITE: Quantifying Uncertainty in Natural Language Text in Bayesian Reasoning Scenarios [15.193544498311603]
本稿では,カテゴリー的確率変数と複雑な関係を持つ実世界のベイズ推論シナリオのデータセットであるQUITEを提案する。我々は幅広い実験を行い、論理ベースのモデルが全ての推論型において、アウト・オブ・ボックスの大規模言語モデルより優れていることを発見した。以上の結果から,ニューロシンボリックモデルが複雑な推論を改善する上で有望な方向であることを示す。
論文参考訳（メタデータ） (2024-10-14T12:44:59Z)
Random pairing MLE for estimation of item parameters in Rasch model [22.32547146723177]
ラッシュモデル(Rasch model)は、個人の潜伏特性と二分反応の関係をモデル化するために心理学において広く用いられている。我々は、ラッシュモデルにおける項目パラメータを忠実に推定する新しい可能性に基づく推定器を導入する。シミュレーションデータと実データを用いた2つの新しい推定器の有効性の実証的証拠を提供する。
論文参考訳（メタデータ） (2024-06-20T04:32:34Z)
Invariant Causal Prediction with Local Models [52.161513027831646]
観測データから対象変数の因果親を特定するタスクについて検討する。 L-ICP(textbfL$ocalized $textbfI$nvariant $textbfCa$usal $textbfP$rediction)と呼ばれる実用的手法を導入する。
論文参考訳（メタデータ） (2024-01-10T15:34:42Z)
Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-12-08T16:06:29Z)
Sparse Gaussian Graphical Models with Discrete Optimization: Computational and Statistical Perspectives [8.403841349300103]
本研究では,無向ガウス図形モデルに基づくスパースグラフの学習問題を考察する。擬似微分関数の $ell_0$-penalized バージョンに基づく新しい推定器 GraphL0BnB を提案する。実/合成データセットに関する数値実験により,本手法がほぼ最適に,p = 104$の問題を解けることが示唆された。
論文参考訳（メタデータ） (2023-07-18T15:49:02Z)
A Scale-Invariant Sorting Criterion to Find a Causal Order in Additive Noise Models [49.038420266408586]
分散の増加による変数のソートは、しばしば因果順序に近い順序になることを示す。本稿ではR2$-SortnRegressと呼ばれる,高いR2$-sortabilityを利用する効率的なベースラインアルゴリズムを提案する。その結果,因果発見に関連するデータ生成プロセスの仮定として,R2$-sortabilityが高額であることが判明した。
論文参考訳（メタデータ） (2023-03-31T17:05:46Z)
Estimating Optimal Policy Value in General Linear Contextual Bandits [50.008542459050155]
多くのバンドイット問題において、政策によって達成可能な最大報酬は、前もって不明であることが多い。我々は,最適政策が学習される前に,サブ線形データ構造における最適政策値を推定する問題を考察する。 V*$で問題依存上界を推定する,より実用的で効率的なアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-02-19T01:09:24Z)
Uncertainty Quantification of MLE for Entity Ranking with Covariates [3.2839905453386162]
本稿では,ペア比較に基づくランキング問題の統計的推定と推定について検討する。我々は、有名なBradley-Terry-Luceモデルを拡張した新しいモデルCAREモデルを提案する。我々は、スパース比較グラフの下で、$alpha_i*_i=1n$と$beta*$の最大確率推定器を導出する。大規模数値研究による理論結果の検証と相互資金保有データセットへの適用について検討する。
論文参考訳（メタデータ） (2022-12-20T02:28:27Z)
You can't pick your neighbors, or can you? When and how to rely on retrieval in the $k$NN-LM [65.74934004876914]
Retrieval-enhanced Language Model (LM) は、大規模な外部データストアから取得したテキストにそれらの予測を条件付ける。そのようなアプローチの1つ、$k$NN-LMは、既存のLMの予測を$k$-nearest近くのモデルの出力と補間する。本研究では,2つの英語モデルデータセットに対するアプローチの有効性を実証的に測定する。
論文参考訳（メタデータ） (2022-10-28T02:57:40Z)
Causal Order Identification to Address Confounding: Binary Variables [4.56877715768796]
本稿では,線形非ガウス非巡回モデル(LiNGAM)の拡張について考察する。 LiNGAMは、変数が雑音を含む一連の線形方程式で表されるとき、データセットから変数間の因果順序を決定する。
論文参考訳（メタデータ） (2021-08-10T22:09:43Z)
Iterative Feature Matching: Toward Provable Domain Generalization with Logarithmic Environments [55.24895403089543]
ドメインの一般化は、限られた数のトレーニング環境からのデータで、目に見えないテスト環境でうまく機能することを目的としています。我々は,O(logd_s)$環境のみを見た後に一般化する予測器を高確率で生成することを保証する反復的特徴マッチングに基づく新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-06-18T04:39:19Z)
Neural Bayes: A Generic Parameterization Method for Unsupervised Representation Learning [175.34232468746245]
本稿ではニューラルベイズと呼ばれるパラメータ化手法を提案する。これは一般に計算が難しい統計量の計算を可能にする。このパラメータ化のための2つの独立したユースケースを示す。
論文参考訳（メタデータ） (2020-02-20T22:28:53Z)
Parameter Space Factorization for Zero-Shot Learning across Tasks and Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文参考訳（メタデータ） (2020-01-30T16:58:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。