論文の概要: OPERA:Operation-Pivoted Discrete Reasoning over Text
- arxiv url: http://arxiv.org/abs/2204.14166v1
- Date: Fri, 29 Apr 2022 15:41:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-02 13:50:31.521784
- Title: OPERA:Operation-Pivoted Discrete Reasoning over Text
- Title(参考訳): OPERA:テキスト上での操作駆動離散推論
- Authors: Yongwei Zhou, Junwei Bao, Chaoqun Duan, Haipeng Sun, Jiahui Liang,
Yifan Wang, Jing Zhao, Youzheng Wu, Xiaodong He, Tiejun Zhao
- Abstract要約: OPERA(オペラ)は、機械読解のための操作駆動型離散推論フレームワークである。
推論能力と解釈可能性を促進するために、軽量なシンボル操作をニューラルモジュールとして使用する。
DROPとRACENumのデータセットの実験は、OPERAの推論能力を示している。
- 参考スコア(独自算出の注目度): 33.36388276371693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine reading comprehension (MRC) that requires discrete reasoning
involving symbolic operations, e.g., addition, sorting, and counting, is a
challenging task. According to this nature, semantic parsing-based methods
predict interpretable but complex logical forms. However, logical form
generation is nontrivial and even a little perturbation in a logical form will
lead to wrong answers. To alleviate this issue, multi-predictor -based methods
are proposed to directly predict different types of answers and achieve
improvements. However, they ignore the utilization of symbolic operations and
encounter a lack of reasoning ability and interpretability. To inherit the
advantages of these two types of methods, we propose OPERA, an
operation-pivoted discrete reasoning framework, where lightweight symbolic
operations (compared with logical forms) as neural modules are utilized to
facilitate the reasoning ability and interpretability. Specifically, operations
are first selected and then softly executed to simulate the answer reasoning
procedure. Extensive experiments on both DROP and RACENum datasets show the
reasoning ability of OPERA. Moreover, further analysis verifies its
interpretability.
- Abstract(参考訳): 記号演算、例えば加算、ソート、計数を含む離散的推論を必要とする機械読解(mrc)は難しい課題である。
この性質により、意味解析に基づく手法は解釈可能だが複雑な論理形式を予測する。
しかし、論理形式の生成は非自明であり、論理形式における少しの摂動さえも間違った答えにつながる。
この問題を軽減するために,様々なタイプの回答を直接予測し,改善を実現するマルチ予測手法を提案する。
しかし、シンボリック操作の利用を無視し、推論能力と解釈能力の欠如に遭遇する。
これらの2種類の手法の利点を継承するため,我々は,ニューラルモジュールとしての軽量なシンボリック演算(論理形式との比較)を用いて推論能力と解釈性を向上させる,操作駆動型離散推論フレームワークOPERAを提案する。
具体的には、まず操作を選択し、それからソフトに実行し、回答推論手順をシミュレートする。
DROPとRACENumのデータセットに関する大規模な実験は、OPERAの推論能力を示している。
さらに、さらなる分析によってその解釈性が検証される。
関連論文リスト
- H-STAR: LLM-driven Hybrid SQL-Text Adaptive Reasoning on Tables [56.73919743039263]
本稿では,2段階のプロセスにシンボル的アプローチと意味的アプローチ(テキスト的アプローチ)を統合し,制約に対処する新しいアルゴリズムを提案する。
実験の結果,H-STARは3つの質問応答(QA)と事実検証データセットにおいて,最先端の手法を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2024-06-29T21:24:19Z) - Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models [17.76252625790628]
本稿では,言語モデルの推論過程を2段階に分解するフレームワークであるThink-and-Executeについて述べる。
7つのアルゴリズム的推論タスクについて広範な実験を行い、思考と実行の有効性を実証する。
論文 参考訳(メタデータ) (2024-04-03T08:49:11Z) - LaRS: Latent Reasoning Skills for Chain-of-Thought Reasoning [61.7853049843921]
Chain-of-Thoughting(CoT)プロンプトは、大規模言語モデル(LLM)のための一般的なコンテキスト内学習手法である。
本稿では、教師なし学習を用いて有理数の潜在空間表現を生成するLaRS(Lalatnt Reasoning Skills)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-07T20:36:10Z) - Neuro-Symbolic Integration Brings Causal and Reliable Reasoning Proofs [95.07757789781213]
LLMの複雑な推論には2行のアプローチが採用されている。
1行の作業は様々な推論構造を持つLLMを誘導し、構造出力は自然に中間推論ステップと見なすことができる。
他方の行では、LCMのない宣言的解法を用いて推論処理を行い、推論精度は向上するが、解法のブラックボックスの性質により解釈性に欠ける。
具体的には,Prologインタプリタが生成した中間検索ログにアクセスし,人間可読推論に解釈可能であることを示す。
論文 参考訳(メタデータ) (2023-11-16T11:26:21Z) - Language Models can be Logical Solvers [99.40649402395725]
論理解法の推論過程を直接エミュレートする新しい言語モデルであるLoGiPTを導入する。
LoGiPTは、導出的ソルバの見えない推論過程を明らかにして精錬することから導かれる、新しく構築された命令チューニングデータセットに基づいて微調整される。
論文 参考訳(メタデータ) (2023-11-10T16:23:50Z) - Representation Synthesis by Probabilistic Many-Valued Logic Operation in Self-Supervised Learning [9.339914898177186]
本稿では,論理操作が可能な表現のための自己教師付き学習(SSL)手法を提案する。
本手法では,両表現の特徴を持つ表現や,両表現に共通する特徴のみを生成できる。
MNIST と PascalVOC を用いた画像検索実験により,本手法の表現をOR と操作で操作できることが判明した。
論文 参考訳(メタデータ) (2023-09-08T06:24:44Z) - Prediction or Comparison: Toward Interpretable Qualitative Reasoning [16.02199526395448]
現在のアプローチでは、セマンティクスを使用して自然言語入力を論理式に変換するか、あるいは1ステップで解決する"ブラックボックス"モデルを使用する。
本研究では,定性的推論タスクを,予測と比較という2つのタイプに分類する。
特に、2つの推論プロセスをシミュレートするために、エンドツーエンドでトレーニングされたニューラルネットワークモジュールを採用しています。
論文 参考訳(メタデータ) (2021-06-04T10:27:55Z) - Logic-Driven Context Extension and Data Augmentation for Logical
Reasoning of Text [65.24325614642223]
論理的な記号や表現をテキストで理解し、答えにたどり着くよう提案します。
このような論理的情報に基づいて,文脈拡張フレームワークとデータ拡張アルゴリズムを提案する。
本手法は最先端の性能を実現し,論理駆動コンテキスト拡張フレームワークとデータ拡張アルゴリズムの両方が精度向上に寄与する。
論文 参考訳(メタデータ) (2021-05-08T10:09:36Z) - AR-LSAT: Investigating Analytical Reasoning of Text [57.1542673852013]
テキストの分析的推論の課題を研究し、1991年から2016年までのロースクール入学試験からの質問からなる新しいデータセットを紹介します。
我々は,この課題をうまくこなすために必要な知識理解と推論能力を分析する。
論文 参考訳(メタデータ) (2021-04-14T02:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。