論文の概要: AraFinNews: Arabic Financial Summarisation with Domain-Adapted LLMs
- arxiv url: http://arxiv.org/abs/2511.01265v1
- Date: Mon, 03 Nov 2025 06:30:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.138872
- Title: AraFinNews: Arabic Financial Summarisation with Domain-Adapted LLMs
- Title(参考訳): AraFinNews: アラビアの金融要約とドメイン適応LLM
- Authors: Mo El-Haj, Paul Rayson,
- Abstract要約: AraFinNewsは、現在までのアラビア語の金融ニュースデータセットとしては最大である。
AraFinNewsは、財務状況におけるドメイン固有の言語理解と生成を評価するためのベンチマークを提供する。
本研究では,金融分野の事前訓練が事実の正確性,数値的信頼性,職業報告との整合性にどのように影響するかを評価する。
- 参考スコア(独自算出の注目度): 3.770849517052643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper investigates the impact of domain specificity on abstractive summarisation of Arabic financial texts using large language models (LLMs). We introduce AraFinNews, the largest publicly available Arabic financial news dataset to date, comprising 212,500 article-headline pairs spanning nearly a decade of reporting from October 2015 to July 2025. Designed as the Arabic equivalent of major English summarisation corpora such as CNN/DailyMail, AraFinNews provides a robust benchmark for evaluating domain-specific language understanding and generation in financial contexts. Using this resource, we evaluate transformer-based models -- including mT5, AraT5, and the domain-adapted FinAraT5 -- to examine how financial-domain pretraining influences factual accuracy, numerical reliability, and stylistic alignment with professional reporting. Experimental results show that domain-adapted models generate more faithful and coherent summaries, particularly in handling quantitative and entity-centric information. The findings highlight the importance of domain-specific adaptation for improving factual consistency and narrative fluency in Arabic financial summarisation. The dataset is freely available for non-commercial research at https://github.com/ArabicNLP-UK/AraFinNews.
- Abstract(参考訳): 本稿では,大規模言語モデル(LLM)を用いたアラビア語財務文書の抽象要約におけるドメイン特異性の影響について検討する。
AraFinNewsは、2015年10月から2025年7月までの10年近くにわたって、212,500の記事と見出しのペアで構成されています。
CNN/DailyMailのような主要な英語要約コーパスのアラビア語版として設計されたAraFinNewsは、財務状況におけるドメイン固有の言語理解と生成を評価するための堅牢なベンチマークを提供する。
このリソースを用いて、mT5、AraT5、ドメイン適応型FinAraT5を含むトランスフォーマーモデルを評価し、金融ドメイン事前学習がプロのレポートと実際の正確性、数値的信頼性、スタイリスティックアライメントにどのように影響するかを検討する。
実験結果から、ドメイン適応モデルは、特に量的およびエンティティ中心の情報を扱う際に、より忠実で一貫性のある要約を生成することが示された。
この知見は、アラビア語の金融要約における事実整合性や物語の流布性を改善するためのドメイン固有の適応の重要性を強調した。
このデータセットはhttps://github.com/ArabicNLP-UK/AraFinNews.comで非商用研究のために無料で利用できる。
関連論文リスト
- FinSight: Towards Real-World Financial Deep Research [68.31086471310773]
FinSightは、高品質でマルチモーダルな財務報告を作成するための新しいフレームワークである。
プロフェッショナルグレードの可視化を確保するため,反復視覚強調機構を提案する。
2段階のBinging Frameworkは、簡潔な分析セグメントをコヒーレント、引用認識、マルチモーダルレポートに拡張する。
論文 参考訳(メタデータ) (2025-10-19T14:05:35Z) - MultiFinBen: Benchmarking Large Language Models for Multilingual and Multimodal Financial Application [118.63802040274999]
MultiFinBen は、現実的な財務状況下で LLM を評価するための、最初のエキスパートアノテーション付き多言語(5言語)およびマルチモーダルベンチマークである。
財務理由付けテストは、書類やニュースと統合された言語間のエビデンスと、スキャンされた文書から構造化されたテキストを抽出する財務OCRである。
21個のLLMを評価したところ、GPT-4oのようなフロンティアのマルチモーダルモデルでさえ、視力とオーディオが強く、多言語設定では急激に低下するが、全体の46.01%しか達成していないことが示されている。
論文 参考訳(メタデータ) (2025-06-16T22:01:49Z) - SNFinLLM: Systematic and Nuanced Financial Domain Adaptation of Chinese Large Language Models [6.639972934967109]
大規模言語モデル (LLM) は、金融業界において自然言語処理を推進するための強力なツールとなっている。
SNFinLLMという中国の金融ドメイン向けに設計された新しい大規模言語モデルを提案する。
SNFinLLMは、質問への回答、財務調査レポートの要約、感情の分析、財務計算の実行など、ドメイン固有のタスクに優れています。
論文 参考訳(メタデータ) (2024-08-05T08:24:24Z) - Chinese Fine-Grained Financial Sentiment Analysis with Large Language
Models [4.993565079216378]
そこで我々は,企業早期警戒のための,中国の財務感情分析データセットFinChina SAを提案する。
われわれのデータセットは、現実の財務感情分析タスクの探索を進めるための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2023-06-25T02:24:30Z) - PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark
for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。
我々はLLaMAを細調整してFinMAを提案する。
我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文 参考訳(メタデータ) (2023-06-08T14:20:29Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。