Fugu-MT 論文翻訳(概要): Improving Compositional Generalization in Math Word Problem Solving

論文の概要: Improving Compositional Generalization in Math Word Problem Solving

arxiv url: http://arxiv.org/abs/2209.01352v1
Date: Sat, 3 Sep 2022 07:54:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-07 13:34:00.962666
Title: Improving Compositional Generalization in Math Word Problem Solving
Title（参考訳）: 数学語問題解決における合成一般化の改善
Authors: Yunshi Lan, Lei Wang, Jing Jiang, Ee-Peng Lim
Abstract要約: 数学語問題(MWP)における合成一般化の研究本稿では,学習データに多様な構成変化を含む反復的データ拡張手法を提案する。また,データ拡張法により,一般的なMWP法の構成一般化が大幅に向上することが確認できた。
参考スコア（独自算出の注目度）: 29.547586634016472
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Compositional generalization refers to a model's capability to generalize to newly composed input data based on the data components observed during training. It has triggered a series of compositional generalization analysis on different tasks as generalization is an important aspect of language and problem solving skills. However, the similar discussion on math word problems (MWPs) is limited. In this manuscript, we study compositional generalization in MWP solving. Specifically, we first introduce a data splitting method to create compositional splits from existing MWP datasets. Meanwhile, we synthesize data to isolate the effect of compositions. To improve the compositional generalization in MWP solving, we propose an iterative data augmentation method that includes diverse compositional variation into training data and could collaborate with MWP methods. During the evaluation, we examine a set of methods and find all of them encounter severe performance loss on the evaluated datasets. We also find our data augmentation method could significantly improve the compositional generalization of general MWP methods. Code is available at https://github.com/demoleiwang/CGMWP.
Abstract（参考訳）: 合成一般化とは、トレーニング中に観測されたデータコンポーネントに基づいて、新しく構成された入力データに一般化するモデルの能力を指す。言語と問題解決のスキルにおいて、一般化が重要な側面であるため、異なるタスクに関する一連の構成的一般化分析をトリガーしている。しかし、同様の数学用語問題(MWP)に関する議論は限られている。本稿では,MWP問題解決における構成一般化について検討する。具体的には,既存のMWPデータセットから合成分割を生成するデータ分割手法を提案する。一方,構成の影響を分離するためにデータを合成する。 MWP問題解決における構成一般化を改善するために,訓練データに多様な構成変化を含む反復的データ拡張手法を提案し,MWP法と協調する。評価中、一連の手法を検証し、評価されたデータセット上でそれらすべてが深刻な性能損失に遭遇することを確認する。また,データ拡張法は一般的なMWP法の構成一般化を著しく改善する可能性がある。コードはhttps://github.com/demoleiwang/CGMWPで入手できる。

関連論文リスト

Learning Composable Chains-of-Thought [57.73731224510169]
我々は大規模言語モデル (LLM) を訓練し, 帰属的推論問題のチェーン・オブ・シント (CoT) トレースを推論する。我々はCoTデータをラベル付けしていない対象構成課題に対処する際の推論スキルの合成一般化に向けて一歩踏み出した。アトミックタスク上の"アトミックCoT"モデルをComposable CoTデータでトレーニングし、マルチタスク学習やモデルマージと組み合わせて、ターゲットのコンポジションタスク上でのゼロショットパフォーマンスを改善することができる。
論文参考訳（メタデータ） (2025-05-28T17:51:10Z)
Topic Over Source: The Key to Effective Data Mixing for Language Models Pre-training [10.769503491579666]
マルチステージプロセスで生成された詳細なトピックラベルを利用するトピックベースのデータミキシング戦略を提案する。我々は、トピックによって混合されたデータに基づいて事前訓練された言語モデルは、ソースによって混合されたデータで訓練された言語よりも一貫して優れていることを示した。理論的解析により,トピックベースのデータは,ソースベースのアプローチに比べて検証損失が著しく低いことがわかった。
論文参考訳（メタデータ） (2025-02-24T03:25:56Z)
Consistency of Compositional Generalization across Multiple Levels [31.77432446850103]
複数のレベルにまたがる一貫した構成一般化を実現するためのメタラーニングベースのフレームワークを提案する。一貫性を定量的に評価するGQA-CCGデータセットを構築した。
論文参考訳（メタデータ） (2024-12-18T09:09:41Z)
CorDA: Context-Oriented Decomposition Adaptation of Large Language Models for Task-Aware Parameter-Efficient Fine-tuning [101.81127587760831]
現在の微調整手法は、学習すべき下流タスクのコンテキストや、維持すべき重要な知識のコンテキストに広く適用できるアダプタを構築している。学習可能なタスク対応アダプタを構築するコンテキスト指向の分解適応手法であるCorDAを提案する。本手法は,知識保存型適応と指導レビュー型適応の2つの選択肢を実現する。
論文参考訳（メタデータ） (2024-06-07T19:10:35Z)
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation [21.68354181391989]
本研究では,データ・テキスト生成における合成一般化のための総合的・実践的な評価手法であるSPORを提案する。 2つの異なるデータセット上でSPORを実証し、LLMを含む既存の言語モデルを評価する。
論文参考訳（メタデータ） (2024-05-17T09:25:30Z)
Benchmarking and Improving Compositional Generalization of Multi-aspect Controllable Text Generation [56.854968623992214]
CompMCTGは多様なマルチアスペクトラベル付きデータセットを含むベンチマークである。本稿ではメタラーニングを取り入れたトレーニングフレームワークであるMeta-MCTGを紹介する。 94.4%の症例において,Meta-MCTGの有効性を示す。
論文参考訳（メタデータ） (2024-04-05T17:26:22Z)
Data Augmentation with In-Context Learning and Comparative Evaluation in Math Word Problem Solving [0.0]
本研究の目的は,MWPソルバにより多様なトレーニングセットを提供することであり,最終的には様々な数学問題を解く能力を向上させることである。本稿では,同義語置換法,ルールベース:質問置換法,ルールベース:質問方法論を逆転させるような問題テキストや方程式を変更することで,データ拡張のためのいくつかの手法を提案する。本研究は,Llama-7b言語モデルを用いて,新しい文脈内学習拡張手法を導入することで拡張する。
論文参考訳（メタデータ） (2024-04-05T07:57:03Z)
Towards Understanding the Relationship between In-context Learning and Compositional Generalization [7.843029855730508]
私たちは、通常の学習を非常に難しい設定で因果変換器を訓練します。しかし、このモデルは、初期の例を利用して、後の例に一般化することで、タスクを解くことができる。データセット、SCAN、COGS、GeoQueryの評価では、この方法でトレーニングされたモデルは、実際に合成の一般化の改善を示している。
論文参考訳（メタデータ） (2024-03-18T14:45:52Z)
Compositional Generalization for Data-to-Text Generation [86.79706513098104]
本稿では,群に述語をクラスタ化することで構成一般化に対処する新しいモデルを提案する。本モデルでは,1つの述語を1度に1つのクラスタに依存して文単位でテキストを生成する。すべての評価指標でT5ベースラインをはるかに上回る。
論文参考訳（メタデータ） (2023-12-05T13:23:15Z)
On Evaluating Multilingual Compositional Generalization with Translated Datasets [34.51457321680049]
構成一般化能力は言語によって異なることを示す。我々は、MCWQデータセットを英語から中国語、日本語に忠実に翻訳する。 MCWQ-Rとよばれるロバストなベンチマークが得られたとしても、構成の分布は言語的な相違によって依然として苦しんでいることが示される。
論文参考訳（メタデータ） (2023-06-20T10:03:57Z)
Categorizing Semantic Representations for Neural Machine Translation [53.88794787958174]
ソースの文脈化表現に分類を導入する。主な考え方は、スパーシリティとオーバーフィッティングを減らして一般化を強化することである。 MTデータセットを用いた実験により,提案手法は構成一般化誤差率を24%削減することを示した。
論文参考訳（メタデータ） (2022-10-13T04:07:08Z)
Grounded Graph Decoding Improves Compositional Generalization in Question Answering [68.72605660152101]
質問応答モデルは、長いシーケンスやより複雑なテスト構造のようなトレーニングパターンの新しい構成に一般化するのに苦労する。構造化された予測をアテンション機構でグラウンド化することで,言語表現の合成一般化を改善する手法であるグラウンドドグラフデコーディングを提案する。本モデルは,質問応答における合成一般化の挑戦的ベンチマークである構成自由ベース質問(CFQ)データセットにおいて,最先端のベースラインを著しく上回っている。
論文参考訳（メタデータ） (2021-11-05T17:50:14Z)
Improving Generalization in Meta-learning via Task Augmentation [69.83677015207527]
本稿ではMetaMixとChannel Shuffleの2つのタスク拡張手法を提案する。 MetaMixとChannel Shuffleはどちらも、多くのデータセットにまたがる大きなマージンによって、最先端の結果を上回っている。
論文参考訳（メタデータ） (2020-07-26T01:50:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。