論文の概要: Improving Compositional Generalization in Math Word Problem Solving
- arxiv url: http://arxiv.org/abs/2209.01352v1
- Date: Sat, 3 Sep 2022 07:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 13:34:00.962666
- Title: Improving Compositional Generalization in Math Word Problem Solving
- Title(参考訳): 数学語問題解決における合成一般化の改善
- Authors: Yunshi Lan, Lei Wang, Jing Jiang, Ee-Peng Lim
- Abstract要約: 数学語問題(MWP)における合成一般化の研究
本稿では,学習データに多様な構成変化を含む反復的データ拡張手法を提案する。
また,データ拡張法により,一般的なMWP法の構成一般化が大幅に向上することが確認できた。
- 参考スコア(独自算出の注目度): 29.547586634016472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compositional generalization refers to a model's capability to generalize to
newly composed input data based on the data components observed during
training. It has triggered a series of compositional generalization analysis on
different tasks as generalization is an important aspect of language and
problem solving skills. However, the similar discussion on math word problems
(MWPs) is limited. In this manuscript, we study compositional generalization in
MWP solving. Specifically, we first introduce a data splitting method to create
compositional splits from existing MWP datasets. Meanwhile, we synthesize data
to isolate the effect of compositions. To improve the compositional
generalization in MWP solving, we propose an iterative data augmentation method
that includes diverse compositional variation into training data and could
collaborate with MWP methods. During the evaluation, we examine a set of
methods and find all of them encounter severe performance loss on the evaluated
datasets. We also find our data augmentation method could significantly improve
the compositional generalization of general MWP methods. Code is available at
https://github.com/demoleiwang/CGMWP.
- Abstract(参考訳): 合成一般化とは、トレーニング中に観測されたデータコンポーネントに基づいて、新しく構成された入力データに一般化するモデルの能力を指す。
言語と問題解決のスキルにおいて、一般化が重要な側面であるため、異なるタスクに関する一連の構成的一般化分析をトリガーしている。
しかし、同様の数学用語問題(MWP)に関する議論は限られている。
本稿では,MWP問題解決における構成一般化について検討する。
具体的には,既存のMWPデータセットから合成分割を生成するデータ分割手法を提案する。
一方,構成の影響を分離するためにデータを合成する。
MWP問題解決における構成一般化を改善するために,訓練データに多様な構成変化を含む反復的データ拡張手法を提案し,MWP法と協調する。
評価中、一連の手法を検証し、評価されたデータセット上でそれらすべてが深刻な性能損失に遭遇することを確認する。
また,データ拡張法は一般的なMWP法の構成一般化を著しく改善する可能性がある。
コードはhttps://github.com/demoleiwang/CGMWPで入手できる。
関連論文リスト
- Compositional Generalization for Data-to-Text Generation [86.79706513098104]
本稿では,群に述語をクラスタ化することで構成一般化に対処する新しいモデルを提案する。
本モデルでは,1つの述語を1度に1つのクラスタに依存して文単位でテキストを生成する。
すべての評価指標でT5ベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2023-12-05T13:23:15Z) - Data Factors for Better Compositional Generalization [60.698130703909804]
我々は、異なるデータ要素を持つ様々なトレーニングセット上で、Transformerモデルをトレーニングすることで、経験的分析を行う。
データセットの複雑さが増大すると、複数の異なる一般化課題におけるより優れた一般化行動がもたらされることを示す。
難易度の異なるトレーニング例が一般化にどう影響するかを考察する。
論文 参考訳(メタデータ) (2023-11-08T01:27:34Z) - Math Word Problem Solving by Generating Linguistic Variants of Problem
Statements [1.742186232261139]
本稿では,問題テキストの言語的変種生成に基づくMWP問題解決のためのフレームワークを提案する。
このアプローチでは、各変種問題を解決し、予測された表現を過半数の票で選択する。
本稿では,問題文の言語的変種に関するトレーニングと候補予測による投票により,モデルの数学的推論やロバスト性が改善されることを示す。
論文 参考訳(メタデータ) (2023-06-24T08:27:39Z) - On Evaluating Multilingual Compositional Generalization with Translated
Datasets [34.51457321680049]
構成一般化能力は言語によって異なることを示す。
我々は、MCWQデータセットを英語から中国語、日本語に忠実に翻訳する。
MCWQ-Rとよばれるロバストなベンチマークが得られたとしても、構成の分布は言語的な相違によって依然として苦しんでいることが示される。
論文 参考訳(メタデータ) (2023-06-20T10:03:57Z) - Categorizing Semantic Representations for Neural Machine Translation [53.88794787958174]
ソースの文脈化表現に分類を導入する。
主な考え方は、スパーシリティとオーバーフィッティングを減らして一般化を強化することである。
MTデータセットを用いた実験により,提案手法は構成一般化誤差率を24%削減することを示した。
論文 参考訳(メタデータ) (2022-10-13T04:07:08Z) - Measuring and Improving Compositional Generalization in Text-to-SQL via
Component Alignment [23.43452719573272]
合成一般化を生成するための節レベルの合成例生成法を提案する。
そこで本研究では,Spider-SSとSpider-CGのデータセットを構築し,構成を一般化するモデルの有効性を検証した。
実験の結果,既存のモデルではスパイダーCGで評価した場合,大幅な性能劣化がみられた。
我々は,Spider-SSのセグメント化データをトレーニングするために,多数の最先端モデルを修正し,この手法が一般化性能を向上させることを示す。
論文 参考訳(メタデータ) (2022-05-04T13:29:17Z) - Grounded Graph Decoding Improves Compositional Generalization in
Question Answering [68.72605660152101]
質問応答モデルは、長いシーケンスやより複雑なテスト構造のようなトレーニングパターンの新しい構成に一般化するのに苦労する。
構造化された予測をアテンション機構でグラウンド化することで,言語表現の合成一般化を改善する手法であるグラウンドドグラフデコーディングを提案する。
本モデルは,質問応答における合成一般化の挑戦的ベンチマークである構成自由ベース質問(CFQ)データセットにおいて,最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2021-11-05T17:50:14Z) - Improving Compositional Generalization in Classification Tasks via
Structure Annotations [33.90268697120572]
人間は構成を一般化する能力は大きいが、最先端のニューラルモデルはそれを行うのに苦労している。
まず、自然言語のシーケンス・ツー・シーケンス・データセットを、合成の一般化も必要とする分類データセットに変換する方法について検討する。
第二に、構造的ヒントを提供すること(特にトランスフォーマーモデルの注意マスクとしてパースツリーとエンティティリンクを提供すること)は、構成の一般化に役立つことを示す。
論文 参考訳(メタデータ) (2021-06-19T06:07:27Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Improving Generalization in Meta-learning via Task Augmentation [69.83677015207527]
本稿ではMetaMixとChannel Shuffleの2つのタスク拡張手法を提案する。
MetaMixとChannel Shuffleはどちらも、多くのデータセットにまたがる大きなマージンによって、最先端の結果を上回っている。
論文 参考訳(メタデータ) (2020-07-26T01:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。