Fugu-MT 論文翻訳(概要): Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback

論文の概要: Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback

arxiv url: http://arxiv.org/abs/2406.17873v1
Date: Tue, 25 Jun 2024 18:21:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-27 15:37:10.247498
Title: Improving Arithmetic Reasoning Ability of Large Language Models through Relation Tuples, Verification and Dynamic Feedback
Title（参考訳）: 関係タプル,検証,動的フィードバックによる大規模言語モデルの算術的推論能力の向上
Authors: Zhongtao Miao, Kaiyan Zhao, Yoshimasa Tsuruoka,
Abstract要約: 本稿では,大規模言語モデルの推論ステップを表現するために,半構造化形式を提案する。具体的には、人間だけでなく、マシンフレンドリで、自然言語よりも容易に検証できる関係を使います。
参考スコア（独自算出の注目度）: 14.938401898546553
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current representations used in reasoning steps of large language models can mostly be categorized into two main types: (1) natural language, which is difficult to verify; and (2) non-natural language, usually programming code, which is difficult for people who are unfamiliar with coding to read. In this paper, we propose to use a semi-structured form to represent reasoning steps of large language models. Specifically, we use relation tuples, which are not only human-readable but also machine-friendly and easier to verify than natural language. We implement a framework that includes three main components: (1) introducing relation tuples into the reasoning steps of large language models; (2) implementing an automatic verification process of reasoning steps with a local code interpreter based on relation tuples; and (3) integrating a simple and effective dynamic feedback mechanism, which we found helpful for self-improvement of large language models. The experimental results on various arithmetic datasets demonstrate the effectiveness of our method in improving the arithmetic reasoning ability of large language models. The source code is available at https://github.com/gpgg/art.
Abstract（参考訳）: 大規模言語モデルの推論ステップで使用される現在の表現は、(1)検証が難しい自然言語、(2)非自然言語、通常プログラミングコード、という2つの主な型に分類される。本稿では,大規模言語モデルの推論ステップを表現するために,半構造化形式を提案する。具体的には、人間可読性だけでなく、マシンフレンドリで、自然言語よりも検証が容易な関係タプルを使用する。 1)大規模言語モデルの推論ステップに関係タプルを導入すること,(2)関係タプルに基づくローカルコードインタプリタによる推論ステップの自動検証プロセスを実装すること,(3)大規模言語モデルの自己改善に役立つシンプルで効果的な動的フィードバック機構を統合すること,の3つの主要なコンポーネントを含むフレームワークを実装した。各種演算データセットに対する実験結果から,大規模言語モデルの算術的推論能力の向上に本手法の有効性が示された。ソースコードはhttps://github.com/gpgg/art.comで入手できる。

関連論文リスト

Selecting Language Models for Social Science: Start Small, Start Open, and Validate [0.3823356975862005]
我々は、社会科学者が計算方法(ポスト)の検証を完全に避けることはできないと論じる。言語モデルの使用を必要とする特定の発見を確実に再現できるためには、タスクを確実に再現する必要がある。より小型でオープンなモデルから始め、計算パイプライン全体の妥当性を示すベンチマークを構築することを提案する。
論文参考訳（メタデータ） (2026-01-16T01:01:47Z)
Empower Nested Boolean Logic via Self-Supervised Curriculum Learning [67.46052028752327]
大規模言語モデルを含む事前学習された言語モデルは、多言語論理に直面するランダムセレクタのように振る舞う。この基本的能力で言語モデルを強化するために,本稿では,新たな自己教師付き学習手法であるtextitCurriculum Logical Reasoning (textscClr) を提案する。
論文参考訳（メタデータ） (2023-10-09T06:54:02Z)
Coupling Large Language Models with Logic Programming for Robust and General Reasoning from Text [5.532477732693001]
大規模言語モデルは, 意味論的に非常に効果的な数ショットとして機能することを示す。自然言語文を論理形式に変換し、応答集合プログラムの入力として機能する。本手法は,bAbI, StepGame, CLUTRR, gSCAN など,いくつかのベンチマークにおいて最先端性能を実現する。
論文参考訳（メタデータ） (2023-07-15T03:29:59Z)
On Robustness of Prompt-based Semantic Parsing with Large Pre-trained Language Model: An Empirical Study on Codex [48.588772371355816]
本稿では,大規模なプロンプトベース言語モデルであるコーデックスの対角的ロバスト性に関する最初の実証的研究について述べる。この結果から, 最先端の言語モデル(SOTA)は, 慎重に構築された敵の例に対して脆弱であることが示された。
論文参考訳（メタデータ） (2023-01-30T13:21:00Z)
Benchmarking Language Models for Code Syntax Understanding [79.11525961219591]
事前学習された言語モデルは、自然言語処理とプログラム理解の両方において素晴らしい性能を示している。本研究では,プログラムの構文構造を特定するための,最先端の事前訓練モデルの最初の徹底的なベンチマークを行う。この結果から,既存のプログラミング言語の事前学習手法の限界が指摘され,構文構造をモデル化することの重要性が示唆された。
論文参考訳（メタデータ） (2022-10-26T04:47:18Z)
Pre-Trained Language Models for Interactive Decision-Making [72.77825666035203]
目的と観測を埋め込みのシーケンスとして表現する模倣学習の枠組みを述べる。このフレームワークは様々な環境にまたがって効果的な一般化を可能にすることを実証する。新たなゴールや新しいシーンを含むテストタスクでは、言語モデルによる初期化ポリシーはタスク完了率を43.6%改善する。
論文参考訳（メタデータ） (2022-02-03T18:55:52Z)
Language Models are not Models of Language [0.0]
トランスファーラーニングにより、言語モデリングタスクでトレーニングされた大規模なディープラーニングニューラルネットワークにより、パフォーマンスが大幅に向上した。深層学習モデルは言語の理論的モデルではないので、言語モデルという用語は誤解を招く。
論文参考訳（メタデータ） (2021-12-13T22:39:46Z)
Constrained Language Models Yield Few-Shot Semantic Parsers [73.50960967598654]
我々は,事前学習された大規模言語モデルの利用を,少ない意味論として検討する。意味構文解析の目標は、自然言語入力によって構造化された意味表現を生成することである。言語モデルを用いて、入力を英語に似た制御されたサブ言語にパラフレーズし、対象の意味表現に自動的にマッピングする。
論文参考訳（メタデータ） (2021-04-18T08:13:06Z)
Comparison of Interactive Knowledge Base Spelling Correction Models for Low-Resource Languages [81.90356787324481]
低リソース言語に対する正規化の推進は、パターンの予測が難しいため、難しい作業である。この研究は、ターゲット言語データに様々な量を持つニューラルモデルとキャラクタ言語モデルの比較を示す。我々の利用シナリオは、ほぼゼロのトレーニング例によるインタラクティブな修正であり、より多くのデータが収集されるにつれてモデルを改善する。
論文参考訳（メタデータ） (2020-10-20T17:31:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。