Fugu-MT 論文翻訳(概要): Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks

論文の概要: Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks

arxiv url: http://arxiv.org/abs/2304.01665v3
Date: Sat, 9 Mar 2024 15:27:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-13 17:38:56.007770
Title: Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks
Title（参考訳）: マスタリング記号演算: コンパイルされたニューラルネットワークによる言語モデルの拡張
Authors: Yixuan Weng, Minjun Zhu, Fei Xia, Bin Li, Shizhu He, Kang Liu, Jun Zhao
Abstract要約: ニューラルアーキテクチャ」は、コンパイルされたニューラルネットワーク(CoNN)を標準変換器に統合する。 CoNNは、人工的に生成された注意重みを通してルールを明示的にエンコードするように設計されたニューラルネットワークモジュールである。実験は,シンボル操作における長さ一般化,効率,解釈可能性の観点から,既存の手法よりも優れていることを示す。
参考スコア（独自算出の注目度）: 48.14324895100478
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Language models' (LMs) proficiency in handling deterministic symbolic reasoning and rule-based tasks remains limited due to their dependency implicit learning on textual data. To endow LMs with genuine rule comprehension abilities, we propose "Neural Comprehension" - a framework that synergistically integrates compiled neural networks (CoNNs) into the standard transformer architecture. CoNNs are neural modules designed to explicitly encode rules through artificially generated attention weights. By incorporating CoNN modules, the Neural Comprehension framework enables LMs to accurately and robustly execute rule-intensive symbolic tasks. Extensive experiments demonstrate the superiority of our approach over existing techniques in terms of length generalization, efficiency, and interpretability for symbolic operations. Furthermore, it can be applied to LMs across different model scales, outperforming tool-calling methods in arithmetic reasoning tasks while maintaining superior inference efficiency. Our work highlights the potential of seamlessly unifying explicit rule learning via CoNNs and implicit pattern learning in LMs, paving the way for true symbolic comprehension capabilities.
Abstract（参考訳）: 言語モデル(lms) 決定論的シンボリック推論と規則に基づくタスクを扱う能力は、テキストデータに暗黙的な学習に依存するため、まだ限られている。我々は,lmsに真のルール理解能力を与えるために,コンパイルされたニューラルネットワーク(conns)を標準のトランスフォーマーアーキテクチャに統合するフレームワーク「neural comprehension」を提案する。 CoNNは、人工的に生成された注意重みを通してルールを明示的にエンコードするように設計されたニューラルネットワークモジュールである。 CoNNモジュールを組み込むことで、Neural Comprehensionフレームワークは、LMがルール集約的なシンボリックタスクを正確かつ堅牢に実行できるようにする。拡張実験は, シンボル操作における長さ一般化, 効率, 解釈可能性の観点から, 既存の手法よりも優れていることを示す。さらに、様々なモデルスケールのlmsに適用でき、優れた推論効率を維持しつつ、算術推論タスクにおけるツール呼び出しメソッドを上回っている。我々の研究は、CNNによる明示的なルール学習とLMにおける暗黙的なパターン学習をシームレスに統一する可能性を強調し、真の象徴的理解能力の道を開いた。

関連論文リスト

Do We Really Need GNNs with Explicit Structural Modeling? MLPs Suffice for Language Model Representations [50.45261187796993]
グラフニューラルネットワーク(GNN)は構造情報を十分に活用できないが、MLP(Multi-Layer Perceptrons)は構造認識タスクにおいて驚くべき能力を示す。本稿では,情報理論の観点から総合的な探索フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-26T18:10:28Z)
Symbolic Representation for Any-to-Any Generative Tasks [25.808462395329194]
本稿では,任意のマルチモーダルタスクを構造化されたシンボルフローとして表現できる記号生成タスク記述言語と推論エンジンを提案する。本フレームワークは,タスク固有のチューニングを必要とせずに,強力なパフォーマンスと柔軟性を示すため,12以上の多様なマルチモーダル生成タスクを成功裏に実行した。実験により,本手法はコンテンツ品質において,既存の最先端統一モデルに適合あるいは優れるだけでなく,効率,編集性,中断性も向上することが示された。
論文参考訳（メタデータ） (2025-04-24T05:35:47Z)
Enhancing Large Language Models through Neuro-Symbolic Integration and Ontological Reasoning [0.0]
大規模言語モデル(LLM)は自然言語処理において顕著な能力を示すが、幻覚として知られる不正確さと論理的不整合に悩まされている。本稿では,LLM出力の一貫性と信頼性を高めるために,記号的存在論的推論と機械学習を融合したニューロシンボリックアプローチを提案する。
論文参考訳（メタデータ） (2025-04-10T10:39:24Z)
Large Language Models are Interpretable Learners [53.56735770834617]
本稿では,Large Language Models(LLM)とシンボルプログラムの組み合わせによって,表現性と解釈可能性のギャップを埋めることができることを示す。自然言語プロンプトを持つ事前訓練されたLLMは、生の入力を自然言語の概念に変換することができる解釈可能な膨大なモジュールセットを提供する。 LSPが学んだ知識は自然言語の記述と記号規則の組み合わせであり、人間(解釈可能)や他のLLMに容易に転送できる。
論文参考訳（メタデータ） (2024-06-25T02:18:15Z)
Deep Inductive Logic Programming meets Reinforcement Learning [0.0]
微分可能なニューラルロジック(dNL)ネットワークは、そのニューラルアーキテクチャがシンボリック推論を含むため、関数を学習することができる。動的連続環境に対処するための強化学習(RRL)分野におけるdNLの適用を提案する。
論文参考訳（メタデータ） (2023-08-30T09:08:46Z)
State space models can express n-gram languages [51.823427608117626]
我々は、n-gramルールから生成された言語に対して、次の単語予測タスクを解くことのできる状態空間言語モデルを構築している。我々の証明は、SSMがn-gramルールをその能力に関する新たな理論的結果を用いてエンコードする方法を示している。 n-gramルールから生成された小さなデータセットを用いて実験を行い、勾配に基づく最適化によって得られたSSMやRNNにフレームワークをどのように適用できるかを示す。
論文参考訳（メタデータ） (2023-06-20T10:41:23Z)
Emergent Linguistic Structures in Neural Networks are Fragile [20.692540987792732]
大規模言語モデル (LLM) は自然言語処理タスクにおいて高い性能を示すと報告されている。言語表現の一貫性と堅牢性を評価するための枠組みを提案する。
論文参考訳（メタデータ） (2022-10-31T15:43:57Z)
Neural-Symbolic Recursive Machine for Systematic Generalization [113.22455566135757]
我々は、基底記号システム(GSS)のコアとなるニューラル・シンボリック再帰機械(NSR)を紹介する。 NSRは神経知覚、構文解析、意味推論を統合している。我々はNSRの有効性を,系統的一般化能力の探索を目的とした4つの挑戦的ベンチマークで評価した。
論文参考訳（メタデータ） (2022-10-04T13:27:38Z)
Neuro-Symbolic Inductive Logic Programming with Logical Neural Networks [65.23508422635862]
我々は最近提案された論理ニューラルネットワーク(LNN)を用いた学習規則を提案する。他のものと比較して、LNNは古典的なブール論理と強く結びついている。標準ベンチマークタスクの実験では、LNNルールが極めて解釈可能であることを確認した。
論文参考訳（メタデータ） (2021-12-06T19:38:30Z)
Reinforcement Learning with External Knowledge by using Logical Neural Networks [67.46162586940905]
論理ニューラルネットワーク(LNN)と呼ばれる最近のニューラルシンボリックフレームワークは、ニューラルネットワークとシンボリックロジックの両方のキープロパティを同時に提供することができる。外部知識ソースからのモデルフリー強化学習を可能にする統合手法を提案する。
論文参考訳（メタデータ） (2021-03-03T12:34:59Z)
NSL: Hybrid Interpretable Learning From Noisy Raw Data [66.15862011405882]
本稿では,ラベル付き非構造データから解釈可能なルールを学習するニューラルシンボリック学習フレームワークNSLを提案する。 NSLは、機能抽出のためのトレーニング済みニューラルネットワークと、解集合セマンティクスに基づくルール学習のための最先端のILPシステムであるFastLASを組み合わせる。 NSLは、MNISTデータから堅牢なルールを学び、ニューラルネットワークやランダムフォレストベースラインと比較して、比較または優れた精度を達成できることを実証します。
論文参考訳（メタデータ） (2020-12-09T13:02:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。