論文の概要: ReSS: Learning Reasoning Models for Tabular Data Prediction via Symbolic Scaffold
- arxiv url: http://arxiv.org/abs/2604.13392v1
- Date: Wed, 15 Apr 2026 01:43:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.346516
- Title: ReSS: Learning Reasoning Models for Tabular Data Prediction via Symbolic Scaffold
- Title(参考訳): ReSS:シンボリック・スキャフォールドを用いた語彙データ予測のための推論モデル学習
- Authors: Chenlang Yi, Gang Li, Zizhan Xiong, Tue Minh Cao, Yanmin Gong, My T. Thai, Tianbao Yang,
- Abstract要約: タブラルデータは医療や金融といった高度な領域で広く使われている。
記号モデルは検証可能な論理を提供するが、意味表現性は欠如している。
シンボリックおよびニューラル推論モデルをブリッジする体系的フレームワークであるReSSを提案する。
- 参考スコア(独自算出の注目度): 38.12595356036359
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tabular data remains prevalent in high-stakes domains such as healthcare and finance, where predictive models are expected to provide both high accuracy and faithful, human-understandable reasoning. While symbolic models offer verifiable logic, they lack semantic expressiveness. Meanwhile, general-purpose LLMs often require specialized fine-tuning to master domain-specific tabular reasoning. To address the dual challenges of scalable data curation and reasoning consistency, we propose ReSS, a systematic framework that bridges symbolic and neural reasoning models. ReSS leverages a decision-tree model to extract instance-level decision paths as symbolic scaffolds. These scaffolds, alongside input features and labels, guide an LLM to generate grounded natural-language reasoning that strictly adheres to the underlying decision logic. The resulting high-quality dataset is used to fine-tune a pretrained LLM into a specialized tabular reasoning model, further enhanced by a scaffold-invariant data augmentation strategy to improve generalization and explainability. To rigorously assess faithfulness, we introduce quantitative metrics including hallucination rate, explanation necessity, and explanation sufficiency. Experimental results on medical and financial benchmarks demonstrate that ReSS-trained models improve traditional decision trees and standard fine-tuning approaches up to $10\%$ while producing faithful and consistent reasoning
- Abstract(参考訳): タブラルデータは医療や金融といった高度な領域で広く使われており、予測モデルは高い正確性と忠実で人間に理解可能な推論を提供すると期待されている。
記号モデルは検証可能な論理を提供するが、意味表現性は欠如している。
一方、汎用LLMはドメイン固有の表の推論をマスターするために特別な微調整を必要とすることが多い。
スケーラブルなデータキュレーションと推論一貫性という2つの課題に対処するために、シンボル的および神経的推論モデルをブリッジする体系的なフレームワークであるReSSを提案する。
ReSSは、決定ツリーモデルを利用して、シンボリックな足場としてインスタンスレベルの決定パスを抽出する。
これらの足場は入力機能やラベルとともに、LLMを誘導し、基盤となる決定ロジックに厳密に準拠する基盤となる自然言語推論を生成する。
得られた高品質なデータセットは、事前学習されたLCMを特殊な表付き推論モデルに微調整するために使用され、さらに一般化と説明可能性を改善するために足場不変のデータ拡張戦略によって強化される。
忠実度を厳格に評価するために,幻覚率,説明の必要性,説明満足度などの定量的指標を導入する。
医学および金融ベンチマークによる実験結果から、ReSS訓練モデルが従来の決定木と標準微調整アプローチを最大10\%まで改善し、忠実で一貫した推論を生み出すことが示された。
関連論文リスト
- Enhancing LIME using Neural Decision Trees [0.906681787649105]
LIME(Local Interpretable Model-Agnostic Explanations)は、機械学習において非常に人気のあるフレームワークである。
代用モデルとしてニューラル決定木(NDT)を統合したNDT-LIME変種を提案する。
NDTの構造的,階層的な性質を活用することにより,より正確で意味のある局所的な説明を提供することが目的である。
論文 参考訳(メタデータ) (2026-03-21T19:24:06Z) - Unlocking Reasoning Capability on Machine Translation in Large Language Models [57.60641851466707]
推論指向の大規模言語モデル(RLM)は、明示的な中間推論を生成することにより、数学やコーディングといったタスクに強い利益をもたらす。
WMT24++ベンチマークを用いて,オープンおよびクローズドヘビー級のRCMを系統的に評価した。
明示的な推論を可能にすることは、言語やモデル間の翻訳品質を一貫して低下させる。
論文 参考訳(メタデータ) (2026-02-16T14:05:59Z) - FORESTLLM: Large Language Models Make Random Forest Great on Few-shot Tabular Learning [20.27406245916013]
本稿では,大規模言語モデル(LLM)の意味的推論能力を用いて,決定林の構造的帰納バイアスを統一する枠組みを提案する。
まずLLMがラベル付きデータとラベルなしデータの両方の一貫性に基づいて候補分割を評価するセマンティックスプリッティング基準を導入し、より堅牢で一般化可能な木構造を数発の監視下で実現する。
第2に,LLMが決定経路とその支持例を簡潔で決定論的な予測に蒸留し,雑音の多い経験的推定を意味的インフォームドアウトプットに置き換える,葉ノード安定化のためのワンタイムインコンテキスト推論機構を提案する。
論文 参考訳(メタデータ) (2026-01-16T14:08:51Z) - How and Why LLMs Generalize: A Fine-Grained Analysis of LLM Reasoning from Cognitive Behaviors to Low-Level Patterns [51.02752099869218]
大きな言語モデル(LLM)は、非常に異なる一般化の振る舞いを示す。
推論を原子核スキルに分解する新しいベンチマークを導入する。
SFTモデルはよりシャープなドリフトと表面パターンへの過度な適合を示すのに対し、RL型モデルはより安定した行動プロファイルを維持し、推論スキルの崩壊に抵抗することを示す。
論文 参考訳(メタデータ) (2025-12-30T08:16:20Z) - Enhancing Logical Reasoning in Language Models via Symbolically-Guided Monte Carlo Process Supervision [43.05159920832912]
大規模言語モデル(LLM)は多くの推論ベンチマークで高いパフォーマンスを示している。
LLMはコンテンツのバリエーションに影響を受けやすく、堅牢な計画や象徴的な抽象化の欠如を示している。
そこで我々は,段階的に擬似ラベルで高品質な記号推論軌道を合成することで,そのような制限を克服することを提案する。
論文 参考訳(メタデータ) (2025-05-26T18:06:39Z) - Learning Decision Trees as Amortized Structure Inference [59.65621207449269]
本稿では,予測決定木アンサンブルを学習するためのハイブリッドアモータイズされた構造推論手法を提案する。
提案手法であるDT-GFNは,標準分類ベンチマークにおける最先端決定木やディープラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-03-10T07:05:07Z) - Efficient or Powerful? Trade-offs Between Machine Learning and Deep Learning for Mental Illness Detection on Social Media [0.036136619420474754]
ソーシャルメディアプラットフォームは、うつ病、不安、自殺などの状況に関するユーザー生成の議論を捉え、メンタルヘルスのトレンドに関する貴重な洞察を提供する。
機械学習(ML)とディープラーニング(DL)モデルは、テキストデータからメンタルヘルス状態を分類するためにますます応用されている。
本研究では、ALBERTやGated Recurrent Units(GRU)といったディープラーニングアーキテクチャとともに、ロジスティック回帰、ランダムフォレスト、LightGBMを含む複数のMLモデルを評価する。
その結果,MLモデルとDLモデルでは,中規模データセットの分類性能が同等であることが示唆された。
論文 参考訳(メタデータ) (2025-03-03T00:51:41Z) - Enhancing Logical Reasoning in Large Language Models through Graph-based Synthetic Data [53.433309883370974]
本研究では,大規模言語モデルの推論能力を高めるための学習信号としてグラフベースの合成推論データを使用することの可能性と限界について検討する。
2つの確立された自然言語推論タスクにおいて,合成グラフに基づく推論データによる教師付き微調整が,他の標準評価ベンチマークでの有効性を損なうことなく,LLMの推論性能を効果的に向上することを示した。
論文 参考訳(メタデータ) (2024-09-19T03:39:09Z) - Neuro-symbolic Natural Logic with Introspective Revision for Natural
Language Inference [17.636872632724582]
イントロスペクティブ・リビジョンを用いた強化学習に基づくニューロシンボリック・ナチュラル・ロジック・フレームワークを提案する。
提案モデルには解釈可能性があり, 単調性推論, 体系的一般化, 解釈可能性に優れた能力を示す。
論文 参考訳(メタデータ) (2022-03-09T16:31:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。