論文の概要: SMoT: Think in State Machine
- arxiv url: http://arxiv.org/abs/2312.17445v1
- Date: Fri, 29 Dec 2023 03:00:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-02 14:06:59.328495
- Title: SMoT: Think in State Machine
- Title(参考訳): SMoT: ステートマシンについて考える
- Authors: Jia Liu, Jie Shuai
- Abstract要約: 我々は、言語モデルに効率的な推論経路を与えるために、事前定義された状態マシンを利用する新しいパラダイム、State Machine of Thought (SMoT)を導入する。
アレイ推論タスクから得られた実験結果から,SMoTが95%の異常精度を実現し,最先端のベースラインの性能を上回ったことが明らかとなった。
- 参考スコア(独自算出の注目度): 7.3229515717551985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current prompting approach for language model inference mainly rely on
Language Model's (LLM) autonomous exploration of reasoning paths, confronts an
inevitable retracing operation when erroneous routes are encountered. This is
followed by the pursuit of alternative reasoning paths. However, humans are
adept at abstracting optimal solutions from problems, thereby facilitating
swift and precise reasoning for similar problems resolution. In light of this,
we delves into the potential of harnessing expert knowledge to enhance
problem-solving within LLMs. We introduce a novel paradigm, the State Machine
of Thought (SMoT), which employs predefined state machines to furnish LLMs with
efficient reasoning paths, thereby eliminating fruitless exploration.
Furthermore, we propose a multi-agent mechanism that assigns different
objectives to agents, aiming to enhance the accuracy of SMoT reasoning. The
experimental results, derived from an array reasoning task, reveal that SMoT
realizes an extraordinary accuracy of 95\%, surpassing the performance of the
state-of-the-art baselines.
- Abstract(参考訳): 言語モデル推論の現在の推進的アプローチは、主に言語モデル(LLM)による推論経路の自律的な探索に依存しており、誤った経路に遭遇した場合、避けられない追跡操作に直面している。
これに続いて、代替の推論経路が追求される。
しかしながら、人間は問題から最適解を抽象化することに長けており、同様の問題解決のための迅速かつ正確な推論を容易にする。
これを踏まえ、私たちは専門家の知識を活用してLLM内の問題解決を強化する可能性について検討する。
我々は,LLMを効率的な推論経路で表現し,無作為な探索をなくすために,事前定義された状態マシンを利用する新しいパラダイムであるState Machine of Thought(SMoT)を導入する。
さらに,エージェントに異なる目的を割り当てるマルチエージェント機構を提案し,SMoT推論の精度を高めることを目的とした。
アレイ推論タスクから導かれた実験結果から,SMoTが95%の異常精度を実現し,最先端のベースラインの性能を上回ることがわかった。
関連論文リスト
- Learning Agents With Prioritization and Parameter Noise in Continuous State and Action Space [0.0]
本稿では,従来の連続状態問題と行動空間問題において,先行した結果よりも高い性能を示すために,最先端手法の組み合わせを優先的に導入する。
実験では、トレーニング中にパラメータノイズを用いることで、より堅牢なRLモデルも実現した。
論文 参考訳(メタデータ) (2024-10-15T04:12:12Z) - Generalizing Multi-Step Inverse Models for Representation Learning to Finite-Memory POMDPs [23.584313644411967]
本研究では,関連する情報のみを符号化し,無関係な情報を破棄する情報的,あるいはエージェント中心の状態表現の発見問題について検討する。
我々の結果は、決定論的力学設定の理論と、代替直観的アルゴリズムの反例を含む。
アルゴリズムを正しく使用した場合に成功させ、正しく使用した場合に劇的な失敗を引き起こす。
論文 参考訳(メタデータ) (2024-04-22T19:46:16Z) - An Online Approach to Solving Public Transit Stationing and Dispatch
Problem [7.948662269574215]
交通機関は限られた数の車両を予備に保管し、破壊時に被害経路を緩和するために派遣する。
本稿では、この問題を解決するために、非ミオピックシーケンシャルな決定手順を用いた原則的アプローチについて述べる。
実験の結果、提案手法は乗客を2%増やし、デッドヘッドマイルを40%削減することがわかった。
論文 参考訳(メタデータ) (2024-03-05T21:48:29Z) - OTClean: Data Cleaning for Conditional Independence Violations using
Optimal Transport [51.6416022358349]
sysは、条件付き独立性(CI)制約下でのデータ修復に最適な輸送理論を利用するフレームワークである。
我々はSinkhornの行列スケーリングアルゴリズムにインスパイアされた反復アルゴリズムを開発し、高次元および大規模データを効率的に処理する。
論文 参考訳(メタデータ) (2024-03-04T18:23:55Z) - Reinforcement Learning in System Identification [0.0]
システム識別は、学習前方モデル、伝達関数、システムダイナミクスなどとも呼ばれるが、科学と工学の両方において長い伝統がある。
ここでは、この問題における強化学習の利用について考察する。
本稿では,この問題が強化学習問題として自然と音にどのように適合するかを詳述し,RLがこのような問題を解決する上で有望な手法であることを実証する実験結果を示す。
論文 参考訳(メタデータ) (2022-12-14T09:20:42Z) - An Online Approach to Solve the Dynamic Vehicle Routing Problem with
Stochastic Trip Requests for Paratransit Services [5.649212162857776]
動的車両ルーティング問題(DVRP)を解決するための完全オンライン手法を提案する。
時間的に疎いため、パラトランジットリクエストのバッチ化は困難である。
我々はモンテカルロ木探索を用いて任意の状態に対する行動を評価する。
論文 参考訳(メタデータ) (2022-03-28T22:15:52Z) - Smoothing Dialogue States for Open Conversational Machine Reading [70.83783364292438]
本稿では,2つの対話状態を1つのデコーダとブリッジ決定と質問生成でスムーズにすることで,効果的なゲーティング戦略を提案する。
OR-ShARCデータセットを用いた実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-08-28T08:04:28Z) - Do Neural Optimal Transport Solvers Work? A Continuous Wasserstein-2
Benchmark [133.46066694893318]
最適輸送のためのニューラルネットワークに基づく解法の性能を評価する。
既存の解法では,下流タスクでは良好に機能するにもかかわらず,最適な輸送マップを復元できないことがわかった。
論文 参考訳(メタデータ) (2021-06-03T15:59:28Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Deep Multi-Task Learning for Joint Localization, Perception, and
Prediction [68.50217234419922]
本稿では,ローカライズエラー下の最先端の自律性スタックで発生する問題について検討する。
我々は,認識,予測,局所化を共同で行うシステムの設計を行う。
本アーキテクチャでは,両タスク間の計算を再利用し,効率よくローカライズエラーを修正できる。
論文 参考訳(メタデータ) (2021-01-17T17:20:31Z) - Deep Learning Techniques for Inverse Problems in Imaging [102.30524824234264]
機械学習における最近の研究は、ディープニューラルネットワークが様々な逆問題の解決に利用できることを示している。
異なる問題や再構築方法の分類に使用できる分類法を提案する。
論文 参考訳(メタデータ) (2020-05-12T18:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。