Fugu-MT 論文翻訳(概要): Logic-LM: Empowering Large Language Models with Symbolic Solvers for Faithful Logical Reasoning

論文の概要: Logic-LM: Empowering Large Language Models with Symbolic Solvers for Faithful Logical Reasoning

arxiv url: http://arxiv.org/abs/2305.12295v2
Date: Thu, 19 Oct 2023 01:54:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-20 20:19:27.657279
Title: Logic-LM: Empowering Large Language Models with Symbolic Solvers for Faithful Logical Reasoning
Title（参考訳）: logic-lm: 忠実な論理推論のためのシンボリックソルバによる大規模言語モデルの実現
Authors: Liangming Pan, Alon Albalak, Xinyi Wang, William Yang Wang
Abstract要約: 大規模言語モデル(LLM)は人間のような推論能力を示しているが、それでも複雑な論理的問題に悩まされている。本稿では,論理問題の解法を改善するために,LLMとシンボリックソルバを統合した新しいフレームワークであるLogic-LMを紹介する。
参考スコア（独自算出の注目度）: 101.26814728062065
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) have shown human-like reasoning abilities but still struggle with complex logical problems. This paper introduces a novel framework, Logic-LM, which integrates LLMs with symbolic solvers to improve logical problem-solving. Our method first utilizes LLMs to translate a natural language problem into a symbolic formulation. Afterward, a deterministic symbolic solver performs inference on the formulated problem. We also introduce a self-refinement module, which utilizes the symbolic solver's error messages to revise symbolic formalizations. We demonstrate Logic-LM's effectiveness on five logical reasoning datasets: ProofWriter, PrOntoQA, FOLIO, LogicalDeduction, and AR-LSAT. On average, Logic-LM achieves a significant performance boost of 39.2% over using LLM alone with standard prompting and 18.4% over LLM with chain-of-thought prompting. Our findings suggest that Logic-LM, by combining LLMs with symbolic logic, offers a promising avenue for faithful logical reasoning. Code and data are publicly available at https://github.com/teacherpeterpan/Logic-LLM.
Abstract（参考訳）: 大規模言語モデル(llm)は人間に似た推論能力を示しているが、それでも複雑な論理的な問題に苦しんでいる。本稿では,llms とシンボリックソルバを統合し,論理的な問題解決を改善する新しいフレームワーク logic-lm を提案する。本手法は,まずllmを用いて自然言語問題を記号的定式化する。その後、決定論的記号解法が定式化問題を推論する。また,シンボリックソルバのエラーメッセージを利用してシンボリック形式を書き換える自己定義モジュールも導入する。 ProofWriter,PrOntoQA,FOLIO,LogicalDeduction,AR-LSATの5つの論理推論データセット上でLogic-LMの有効性を示す。 Logic-LM は標準のプロンプトで LLM のみを使用すれば 39.2% の大幅な性能向上を達成した。以上の結果から,LLMと記号論理を組み合わせた論理-LMが,忠実な論理的推論の道筋となることが示唆された。コードとデータはhttps://github.com/teacherpeterpan/logic-llmで公開されている。

関連論文リスト

Are LLMs Reliable Translators of Logical Reasoning Across Lexically Diversified Contexts? [17.12735924809949]
論理翻訳者は語彙の多様化に苦慮している。既存の論理的推論ベンチマークには語彙的多様性がない。この大きなギャップに対処するために設計されたベンチマークを提案する。
論文参考訳（メタデータ） (2025-06-05T02:49:36Z)
Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文参考訳（メタデータ） (2025-05-22T01:37:40Z)
Logical Consistency of Large Language Models in Fact-checking [6.286017217366497]
大規模言語モデル(LLM)は、様々な自然言語タスクを実行する上で大きな成功を収めている。人間のようなテキストを生成する素晴らしい能力にもかかわらず、LLMは一貫性のない反応で悪名高い。
論文参考訳（メタデータ） (2024-12-20T17:42:25Z)
LOGIC-LM++: Multi-Step Refinement for Symbolic Formulations [1.024113475677323]
本稿では Logic-LM++ を改良した Logic-LM++ を提案する。 LLMの機能をペアで比較し、LLMが提案する改善点の評価を可能にする。
論文参考訳（メタデータ） (2024-06-22T12:50:41Z)
LogicBench: Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Models [52.03659714625452]
最近開発された大規模言語モデル (LLM) は、幅広い言語理解タスクにおいて非常によく機能することが示されている。しかし、それらは自然言語に対して本当に「理性」があるのだろうか? この疑問は研究の注目を集めており、コモンセンス、数値、定性的など多くの推論技術が研究されている。
論文参考訳（メタデータ） (2024-04-23T21:08:49Z)
Can Language Models Pretend Solvers? Logic Code Simulation with LLMs [3.802945676202634]
トランスフォーマーベースの大規模言語モデル(LLM)は、論理問題に対処する上で大きな可能性を示している。この研究は、論理コードシミュレーションという新しい側面に発展し、論理プログラムの結果を予測するために論理解法をエミュレートするよう LLM に強制する。
論文参考訳（メタデータ） (2024-03-24T11:27:16Z)
Do Large Language Models Understand Logic or Just Mimick Context? [14.081178100662163]
本稿では,2つの論理的推論データセット上での大規模言語モデル(LLM)の推論能力について検討する。 LLMは論理規則を真に理解していないことが判明した。むしろ、文脈内学習は、これらのモデルが正しい解に到達する可能性を高めている。
論文参考訳（メタデータ） (2024-02-19T12:12:35Z)
LogicAsker: Evaluating and Improving the Logical Reasoning Ability of Large Language Models [63.14196038655506]
大規模言語モデル(LLM)の論理的推論能力を評価・拡張するための新しいアプローチであるLogicAskerを紹介する。提案手法は, LLMが論理規則を学習する際の大きなギャップを明らかにし, 異なるモデル間で29%から90%の推論失敗を識別する。 GPT-4oのようなモデルにおける論理的推論を最大5%向上させることで、これらの知見を活用して、ターゲットとなる実演例と微調整データを構築した。
論文参考訳（メタデータ） (2024-01-01T13:53:53Z)
Language Models can be Logical Solvers [99.40649402395725]
論理解法の推論過程を直接エミュレートする新しい言語モデルであるLoGiPTを導入する。 LoGiPTは、導出的ソルバの見えない推論過程を明らかにして精錬することから導かれる、新しく構築された命令チューニングデータセットに基づいて微調整される。
論文参考訳（メタデータ） (2023-11-10T16:23:50Z)
LINC: A Neurosymbolic Approach for Logical Reasoning by Combining Language Models with First-Order Logic Provers [60.009969929857704]
論理的推論は、科学、数学、社会に潜在的影響を与える可能性のある人工知能にとって重要なタスクである。本研究では、LINCと呼ばれるモジュール型ニューロシンボリックプログラミングのようなタスクを再構成する。我々は,FOLIOとProofWriterのバランスの取れたサブセットに対して,ほぼすべての実験条件下で,3つの異なるモデルに対して顕著な性能向上を観察した。
論文参考訳（メタデータ） (2023-10-23T17:58:40Z)
Exploring Self-supervised Logic-enhanced Training for Large Language Models [59.227222647741094]
本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。 2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文参考訳（メタデータ） (2023-05-23T06:13:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。