論文の概要: KAHAN: Knowledge-Augmented Hierarchical Analysis and Narration for Financial Data Narration
- arxiv url: http://arxiv.org/abs/2509.17037v1
- Date: Sun, 21 Sep 2025 11:15:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.082301
- Title: KAHAN: Knowledge-Augmented Hierarchical Analysis and Narration for Financial Data Narration
- Title(参考訳): KAHAN:財務データナレーションのための知識強化階層分析とナレーション
- Authors: Yajing Yang, Tony Deng, Min-Yen Kan,
- Abstract要約: KAHANは知識を付加した階層的なフレームワークで、エンティティ、ペア、グループ、システムレベルの生データから洞察を抽出する。
DataTalesの財務報告ベンチマークでは、KAHANは既存のアプローチよりも20%以上優れた物語品質(GPT-4o)を実現している。
以上の結果から, 蒸留によるモデル性能の向上, 階層分析のメリットは市場の複雑さによって異なり, フレームワークは医療領域に効果的に移行することが明らかとなった。
- 参考スコア(独自算出の注目度): 21.210770737963085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose KAHAN, a knowledge-augmented hierarchical framework that systematically extracts insights from raw tabular data at entity, pairwise, group, and system levels. KAHAN uniquely leverages LLMs as domain experts to drive the analysis. On DataTales financial reporting benchmark, KAHAN outperforms existing approaches by over 20% on narrative quality (GPT-4o), maintains 98.2% factuality, and demonstrates practical utility in human evaluation. Our results reveal that knowledge quality drives model performance through distillation, hierarchical analysis benefits vary with market complexity, and the framework transfers effectively to healthcare domains. The data and code are available at https://github.com/yajingyang/kahan.
- Abstract(参考訳): 本稿では,知識を付加した階層型フレームワークであるKAHANを提案する。
KAHANはLLMをドメインエキスパートとして独自に活用して分析を推進している。
DataTalesの財務報告ベンチマークでは、KAHANは物語品質(GPT-4o)を20%以上向上させ、98.2%の事実性を維持し、人間の評価において実用性を実証している。
以上の結果から, 蒸留によるモデル性能の向上, 階層分析のメリットは市場の複雑さによって異なり, フレームワークは医療領域に効果的に移行することが明らかとなった。
データとコードはhttps://github.com/yajingyang/kahan.comで公開されている。
関連論文リスト
- Data-to-Dashboard: Multi-Agent LLM Framework for Insightful Visualization in Enterprise Analytics [2.7933239275667545]
モジュール型LCMエージェントによるデータ・ダッシュボード・パイプラインの自動化を行うエージェントシステムを提案する。
既存のグラフシステムとは異なり、我々のフレームワークはビジネスアナリストの分析的推論プロセスをシミュレートする。
提案手法は, 評価指標の調整により, 洞察力, ドメイン関連性, 分析深度が向上したことを示す。
論文 参考訳(メタデータ) (2025-05-29T17:32:15Z) - AssistedDS: Benchmarking How External Domain Knowledge Assists LLMs in Automated Data Science [44.18533574465929]
AssistedDSは、大規模言語モデルがドメイン知識をどのように扱うかを評価するために設計されたベンチマークである。
我々は、最先端のLLMを、有害なドメイン知識を識別し、有効に適用する能力に基づいて評価する。
我々の結果は、専門家の知識を批判的に評価し活用する現在のモデルの能力に、かなりのギャップがあることを示します。
論文 参考訳(メタデータ) (2025-05-25T05:50:21Z) - Enhancing Machine Learning Performance through Intelligent Data Quality Assessment: An Unsupervised Data-centric Framework [0.0]
不適切なデータ品質は機械学習(ML)の有利なパワーを制限する
本稿では,高品質なデータを特定し,MLシステムの性能を向上させるインテリジェントなデータ中心評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-18T18:01:36Z) - OmniEval: An Omnidirectional and Automatic RAG Evaluation Benchmark in Financial Domain [62.89809156574998]
金融分野において全方向自動RAGベンチマークであるOmniEvalを導入する。
我々のベンチマークは多次元評価フレームワークによって特徴づけられる。
実験では、広範囲なテストデータセットを含むOmniEvalの包括性を実証した。
論文 参考訳(メタデータ) (2024-12-17T15:38:42Z) - Analysis of Multidomain Abstractive Summarization Using Salience
Allocation [2.6880540371111445]
季節は、塩分割り当て技術を活用して要約を強化するために設計されたモデルである。
本稿では、ROUGE、METEOR、BERTScore、MoverScoreなどの様々な評価指標を用いて、抽象的な要約を生成するために微調整されたモデルの性能を評価する。
論文 参考訳(メタデータ) (2024-02-19T08:52:12Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - Making Machine Learning Datasets and Models FAIR for HPC: A Methodology
and Case Study [0.0]
FAIR Guiding Principlesは、デジタルコンテンツの発見可能性、アクセシビリティ、相互運用性、再利用性を改善することを目的としている。
これらの原則は、ハイパフォーマンスコンピューティングのための機械学習ベースのプログラム分析と最適化の分野において、まだ広く採用されていない。
我々は、既存のFAIRness評価と改善技術を調査した後、HPCデータセットと機械学習モデルFAIRを作成する手法を設計する。
論文 参考訳(メタデータ) (2022-11-03T18:45:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。