論文の概要: Learning to Solve Complex Problems via Dataset Decomposition
- arxiv url: http://arxiv.org/abs/2602.20296v1
- Date: Mon, 23 Feb 2026 19:25:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.49964
- Title: Learning to Solve Complex Problems via Dataset Decomposition
- Title(参考訳): データセット分解による複雑な問題を解決するための学習
- Authors: Wanru Zhao, Lucas Caccia, Zhengyan Shi, Minseon Kim, Weijia Xu, Alessandro Sordoni,
- Abstract要約: 本研究では、複雑なデータセットをよりシンプルで学習しやすいコンポーネントに分解する逆カリキュラム生成アプローチについて検討する。
そこで本研究では,教師が段階的に推論する能力を備えた教師学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 53.1641602054716
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Curriculum learning is a class of training strategies that organizes the data being exposed to a model by difficulty, gradually from simpler to more complex examples. This research explores a reverse curriculum generation approach that recursively decomposes complex datasets into simpler, more learnable components. We propose a teacher-student framework where the teacher is equipped with the ability to reason step-by-step, which is used to recursively generate easier versions of examples, enabling the student model to progressively master difficult tasks. We propose a novel scoring system to measure data difficulty based on its structural complexity and conceptual depth, allowing curriculum construction over decomposed data. Experiments on math datasets (MATH and AIME) and code generation datasets demonstrate that models trained with curricula generated by our approach exhibit superior performance compared to standard training on original datasets.
- Abstract(参考訳): カリキュラム学習(英: Curriculum learning)は、より単純なものからより複雑なものへと徐々に、困難によってモデルに露出するデータを整理する訓練戦略のクラスである。
本研究では、複雑なデータセットをシンプルで学習しやすいコンポーネントに再帰的に分解する逆カリキュラム生成手法について検討する。
そこで本研究では,教師が段階的に推論する能力を備えた授業学習フレームワークを提案し,より簡単な例を再現し,より困難な課題を段階的に習得することを可能にする。
本稿では,その構造的複雑さと概念的深さに基づいて,データの難易度を測定する新しいスコアリングシステムを提案する。
算数データセット (MATH, AIME) とコード生成データセット (コード生成データセット) の実験により, 提案手法により生成したカリキュラムで訓練されたモデルは, 元のデータセットの標準トレーニングに比べ, 優れた性能を示した。
関連論文リスト
- C2-Evo: Co-Evolving Multimodal Data and Model for Self-Improving Reasoning [78.36259648527401]
C2-Evoは、トレーニングデータとモデル機能の両方を共同で進化させる、自動クローズドループ自己改善フレームワークである。
C2-Evoは、複数の数学的推論ベンチマークにおいて、一定の性能向上が得られることを示す。
論文 参考訳(メタデータ) (2025-07-22T12:27:08Z) - Divide, Specialize, and Route: A New Approach to Efficient Ensemble Learning [0.0]
バイナリ分類のための新しいアンサンブルフレームワーク Hellsemble を提案する。
Hellsembleはデータセットを難易度の円に段階的に分割する。
計算効率と解釈可能性を維持しながら、強力な分類精度を達成する。
論文 参考訳(メタデータ) (2025-06-25T20:26:04Z) - Constraint Back-translation Improves Complex Instruction Following of Large Language Models [55.60192044049083]
大きな言語モデル(LLM)は、フォーマットや長さなどの複雑な制約のある命令に従うのに苦労しています。
従来の研究は、高度なLCMに複雑な命令を供給し、複雑な命令応答対を後処理する。
本稿では,新しいデータ生成手法である制約バックトランスレーションを提案する。
論文 参考訳(メタデータ) (2024-10-31T17:42:26Z) - RiTeK: A Dataset for Large Language Models Complex Reasoning over Textual Knowledge Graphs [12.846097618151951]
我々は,テキスト知識グラフ(RiTeK)を用いたLLMの複雑な推論のためのデータセットを開発し,広範なトポロジ的構造を網羅する。
多様なトポロジ構造、注釈付き情報、複雑なテキスト記述を統合した現実的なユーザクエリを合成する。
そこで我々はモンテカルロ木探索法 (CTS) を導入し, 特定のクエリに対してテキストグラフから関係経路情報を自動的に抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-10-17T19:33:37Z) - Complexity-Guided Curriculum Learning for Text Graphs [18.746490400989487]
本稿では,テキストとグラフの複雑性形式に関する既存の知識に基づくカリキュラム学習手法を提案する。
新たなデータスケジューラでは、トレーニングプロセスのガイドとして、"空間的反復"と複雑性形式が採用されている。
いくつかのテキストグラフタスクとグラフニューラルネットワークアーキテクチャにおける提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-11-22T15:40:57Z) - Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Curriculum Learning with Diversity for Supervised Computer Vision Tasks [1.5229257192293197]
本稿では,学習データの多様性と入力の難しさを考慮に入れた,新たなカリキュラムサンプリング戦略を提案する。
我々は、我々の戦略が不均衡なデータセットに対して非常に効率的であることを証明し、より高速な収束とより正確な結果をもたらす。
論文 参考訳(メタデータ) (2020-09-22T15:32:49Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。