論文の概要: Recovering Mental Representations from Large Language Models with Markov
Chain Monte Carlo
- arxiv url: http://arxiv.org/abs/2401.16657v1
- Date: Tue, 30 Jan 2024 01:22:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 16:45:39.096248
- Title: Recovering Mental Representations from Large Language Models with Markov
Chain Monte Carlo
- Title(参考訳): Markov Chain Monte Carloによる大規模言語モデルからのメンタル表現の復元
- Authors: Jian-Qiao Zhu and Haijiang Yan and Thomas L. Griffiths
- Abstract要約: 人によるサンプリングアルゴリズムのシミュレーションは, 心的表現を効率的に探索し, 理解する上で有用な方法であることが証明されている。
本研究では,Large Language Models (LLMs) をサンプリングアルゴリズムの要素として利用することにより,効率の向上が可能であることを示す。
- 参考スコア(独自算出の注目度): 4.528476077180119
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulating sampling algorithms with people has proven a useful method for
efficiently probing and understanding their mental representations. We propose
that the same methods can be used to study the representations of Large
Language Models (LLMs). While one can always directly prompt either humans or
LLMs to disclose their mental representations introspectively, we show that
increased efficiency can be achieved by using LLMs as elements of a sampling
algorithm. We explore the extent to which we recover human-like representations
when LLMs are interrogated with Direct Sampling and Markov chain Monte Carlo
(MCMC). We found a significant increase in efficiency and performance using
adaptive sampling algorithms based on MCMC. We also highlight the potential of
our method to yield a more general method of conducting Bayesian inference
\textit{with} LLMs.
- Abstract(参考訳): 人によるサンプリングアルゴリズムのシミュレーションは、心的表現を効率的に探索し理解するために有用な方法であることが証明されている。
そこで本稿では,Large Language Models (LLM) の表現について,同じ手法を用いて検討する。
人間の心的表現を内省的に開示することは常に直接的に行うことができるが,LLMをサンプリングアルゴリズムの要素として用いることで,効率の向上が可能であることを示す。
LLMが直接サンプリングとマルコフ連鎖モンテカルロ (MCMC) に尋問されるとき、どのように人間のような表現が復元されるかを探る。
MCMCに基づく適応サンプリングアルゴリズムを用いて,効率と性能を著しく向上させた。
また、ベイズ推論のより一般的な方法である「textit{with} LLM」を導出する手法の可能性も強調する。
関連論文リスト
- EVOLvE: Evaluating and Optimizing LLMs For Exploration [76.66831821738927]
大規模言語モデル(LLM)は、不確実性の下で最適な意思決定を必要とするシナリオにおいて、未調査のままである。
多くのアプリケーションに関係のあるステートレス強化学習環境である,帯域幅を最適に決定できる LLM の (in) 能力の測定を行う。
最適な探索アルゴリズムの存在を動機として,このアルゴリズム知識をLLMに統合する効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-08T17:54:03Z) - On the Design and Analysis of LLM-Based Algorithms [74.7126776018275]
大規模言語モデル(LLM)はアルゴリズムのサブルーチンとして使用される。
LLMは素晴らしい経験的成功を収めた。
提案フレームワークは,LLMアルゴリズムの進歩を約束する。
論文 参考訳(メタデータ) (2024-07-20T07:39:07Z) - Through the Thicket: A Study of Number-Oriented LLMs derived from Random Forest Models [0.0]
大規模言語モデル (LLM) はテキスト処理において例外的な性能を示した。
本稿では,ランダムフォレスト(RF)アンサンブルからの知識伝達を用いたLLMの学習手法を提案する。
我々は、細調整のためのアウトプットを生成し、その決定を分類し、説明するモデルの能力を高めます。
論文 参考訳(メタデータ) (2024-06-07T13:31:51Z) - One Token Can Help! Learning Scalable and Pluggable Virtual Tokens for Retrieval-Augmented Large Language Models [67.49462724595445]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を改善するための有望な方法である。
本稿では,RAGのためのスケーラブルでプラガブルな仮想トークンを学習する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-30T03:44:54Z) - Improve Temporal Awareness of LLMs for Sequential Recommendation [61.723928508200196]
大規模言語モデル(LLM)は、幅広い汎用タスクを解く際、印象的なゼロショット能力を示した。
LLMは時間的情報の認識と利用に不足しており、シーケンシャルなデータの理解を必要とするタスクではパフォーマンスが悪い。
LLMに基づくシーケンシャルレコメンデーションのために、歴史的相互作用の中で時間情報を利用する3つのプロンプト戦略を提案する。
論文 参考訳(メタデータ) (2024-05-05T00:21:26Z) - Rephrase and Respond: Let Large Language Models Ask Better Questions for Themselves [57.974103113675795]
本稿では,Rephrase and Respond'(RaR)という手法を提案する。
RaRは、パフォーマンスを改善するためのシンプルだが効果的なプロンプト方法として機能する。
また,RaRは理論的にも経験的にも,一般的なChain-of-Thought(CoT)法と相補的であることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:43:34Z) - Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models [17.059322033670124]
本稿では,アルゴリズム的推論経路を通じて大規模言語モデルを促進する新しい手法を提案する。
この結果から,LLMをアルゴリズムを用いて指導すると,アルゴリズム自体よりも性能が向上する可能性が示唆された。
論文 参考訳(メタデータ) (2023-08-20T22:36:23Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Response Length Perception and Sequence Scheduling: An LLM-Empowered LLM
Inference Pipeline [22.08897444328099]
大規模言語モデル(LLM)はAIの分野に革命をもたらし、様々なタスクで前例のない能力を示している。
本稿では,LLMのパワーを利用する効率的なLLM推論パイプラインを提案する。
論文 参考訳(メタデータ) (2023-05-22T15:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。