論文の概要: CRAFTQA: A Code-Driven Adaptive Framework for Complex Structured Data Reasoning
- arxiv url: http://arxiv.org/abs/2606.02170v1
- Date: Mon, 01 Jun 2026 12:29:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.001421
- Title: CRAFTQA: A Code-Driven Adaptive Framework for Complex Structured Data Reasoning
- Title(参考訳): CRAFTQA: 複雑な構造化データ推論のためのコード駆動適応フレームワーク
- Authors: Chengtao Gan, Zhiqiang Liu, Long Jin, Yushan Zhu, Lei Liang, Wen Zhang,
- Abstract要約: 現実世界のシナリオは、巨大な異質な構造化データ(例えば、表、知識グラフ)を伴い、このような多様なデータに対する効果的な推論がますます重要になる。
CRAFTQAは,CodeSTEPとCRAFTの2つのコアモジュールからなる適応型コード駆動フレームワークである。
CodeSTEPモジュールは、質問に基づいてステップバイステップのコードベースの推論操作を含む、完全な実行可能なPythonコードシーケンスを生成する。
CRAFTモジュールは事前に定義された関数セットを超えて操作用のカスタムコード関数を動的に生成し、CodeSTEPとシームレスに統合することで複雑な推論処理の柔軟性を著しく向上する。
- 参考スコア(独自算出の注目度): 17.012985962958194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world scenarios involve massive heterogeneous structured data (e.g., tables, knowledge graphs), making effective reasoning over such diverse data increasingly important. Unified structured data question answering has emerged as a prominent research trend, aiming to answer natural language questions across different structured data types within a single framework. However, existing unified methods share a common limitation: they rely on a set of predefined functions, which restricts their ability to perform complex reasoning beyond these predefined operations. To overcome this fundamental limitation, we propose CRAFTQA, a novel adaptive code-driven framework comprising two core modules, CodeSTEP and CRAFT. The CodeSTEP module is a paradigm that generates a complete executable Python code sequence, which contains step-by-step code-based reasoning operations based on the question. The CRAFT module dynamically generates custom code functions for operations beyond the predefined function set, and seamlessly integrates with CodeSTEP to significantly enhance flexibility in handling complex reasoning. Comprehensive experiments on multiple structured datasets demonstrate that CRAFTQA achieves remarkable improvements in complex reasoning scenarios compared to existing unified methods.
- Abstract(参考訳): 現実世界のシナリオでは、巨大な異質な構造化データ(例えば、テーブル、知識グラフ)が伴い、このような多様なデータに対する効果的な推論がますます重要になる。
統一構造化データ質問応答は、単一のフレームワーク内でさまざまな構造化データ型にまたがる自然言語質問に答えることを目的として、顕著な研究トレンドとして浮上している。
しかし、既存の統一メソッドは共通の制限を共有しており、それらは事前定義された関数のセットに依存しており、これらの事前定義された操作を超えて複雑な推論を行う能力を制限する。
この基本的な制限を克服するために、CodeSTEPとCRAFTの2つのコアモジュールからなる新しい適応型コード駆動フレームワークであるCRAFTQAを提案する。
CodeSTEPモジュールは、完全な実行可能なPythonコードシーケンスを生成するパラダイムである。
CRAFTモジュールは事前に定義された関数セットを超えて操作用のカスタムコード関数を動的に生成し、CodeSTEPとシームレスに統合することで複雑な推論処理の柔軟性を著しく向上する。
複数の構造化データセットに関する総合的な実験により、CRAFTQAは既存の統一手法と比較して複雑な推論シナリオにおいて顕著に改善されていることが示された。
関連論文リスト
- DataFactory: Collaborative Multi-Agent Framework for Advanced Table Question Answering [18.66810094244931]
Table Question Answering (TableQA)は、構造化データとの自然言語インタラクションを可能にする。
既存の大規模言語モデル(LLM)アプローチには、限界がある。
本稿では,これらの制約に対処するマルチエージェントフレームワークであるDataFactoryを紹介する。
論文 参考訳(メタデータ) (2026-03-10T03:44:52Z) - Not All Code Is Equal: A Data-Centric Study of Code Complexity and LLM Reasoning [16.919028520729793]
大きな言語モデル(LLM)は強い推論能力を持つようになり、しばしばチェーン・オブ・オブ・シンクスタイルの中間推論を生成する能力に起因している。
最近の研究は、コードへの露出がこれらのスキルをさらに強化することを示しているが、既存の研究は、コードを一般的なトレーニング信号として扱うことが多い。
本研究では、制御フローと構成構造をキャプチャーし、微調整中にモデルがマルチステップ推論を内部化する方法をモデル化するコードの構造的複雑さについて検討する。
論文 参考訳(メタデータ) (2026-01-29T15:54:40Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - EpiCoder: Encompassing Diversity and Complexity in Code Generation [66.43738008739555]
既存のコード生成方法はシードデータとしてコードスニペットを使用する。
階層的なコード機能を中心に展開する,新しい機能ツリーベースの合成フレームワークを提案する。
我々のフレームワークは、生成されたコードの複雑さを正確に制御し、関数レベルの操作からマルチファイルのシナリオまで幅広い機能を実現する。
論文 参考訳(メタデータ) (2025-01-08T18:58:15Z) - TARGA: Targeted Synthetic Data Generation for Practical Reasoning over Structured Data [9.390415313514762]
TARGAは、手動のアノテーションなしで高関連性合成データを生成するフレームワークである。
これは、クローズソースモデルを使用する既存の非微調整手法よりも大幅に優れている。
非I.I.D.設定下では、優れたサンプル効率、堅牢性、一般化能力を示す。
論文 参考訳(メタデータ) (2024-12-27T09:16:39Z) - Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z) - Query Structure Modeling for Inductive Logical Reasoning Over Knowledge
Graphs [67.043747188954]
KGに対する帰納的論理的推論のための構造モデル付きテキスト符号化フレームワークを提案する。
線形化されたクエリ構造とエンティティを、事前訓練された言語モデルを使ってエンコードして、回答を見つける。
2つの帰納的論理推論データセットと3つの帰納的推論データセットについて実験を行った。
論文 参考訳(メタデータ) (2023-05-23T01:25:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。