論文の概要: Enhancing Business Analytics through Hybrid Summarization of Financial Reports
- arxiv url: http://arxiv.org/abs/2601.09729v1
- Date: Sun, 28 Dec 2025 16:25:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-25 16:54:51.711043
- Title: Enhancing Business Analytics through Hybrid Summarization of Financial Reports
- Title(参考訳): 財務報告のハイブリッド要約によるビジネス分析の強化
- Authors: Tohida Rehman,
- Abstract要約: 財務報告と決算報告には大量の構造化情報と半構造化情報が含まれている。
本稿では,抽出的および抽象的手法を組み合わせて,簡潔かつ現実的に信頼性の高い要約を生成するハイブリッド要約フレームワークを提案する。
これらの知見は、長い財務文書を有効活用できるビジネスインテリジェンスに蒸留する実用的な要約システムの開発を支援するものである。
- 参考スコア(独自算出の注目度): 0.152292571922932
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Financial reports and earnings communications contain large volumes of structured and semi structured information, making detailed manual analysis inefficient. Earnings conference calls provide valuable evidence about a firm's performance, outlook, and strategic priorities. The manual analysis of lengthy call transcripts requires substantial effort and is susceptible to interpretive bias and unintentional error. In this work, we present a hybrid summarization framework that combines extractive and abstractive techniques to produce concise and factually reliable Reuters-style summaries from the ECTSum dataset. The proposed two stage pipeline first applies the LexRank algorithm to identify salient sentences, which are subsequently summarized using fine-tuned variants of BART and PEGASUS designed for resource constrained settings. In parallel, we fine-tune a Longformer Encoder-Decoder (LED) model to directly capture long-range contextual dependencies in financial documents. Model performance is evaluated using standard automatic metrics, including ROUGE, METEOR, MoverScore, and BERTScore, along with domain-specific variants such as SciBERTScore and FinBERTScore. To assess factual accuracy, we further employ entity-level measures based on source-precision and F1-target. The results highlight complementary trade offs between approaches, long context models yield the strongest overall performance, while the hybrid framework achieves competitive results with improved factual consistency under computational constraints. These findings support the development of practical summarization systems for efficiently distilling lengthy financial texts into usable business insights.
- Abstract(参考訳): 財務報告や決算報告には大量の構造化情報や半構造化情報が含まれており、詳細な手作業による分析は効率的ではない。
Earningsカンファレンスは、企業のパフォーマンス、見通し、戦略的優先順位に関する貴重な証拠を提供する。
長い呼び出し書き起こしを手動で解析するにはかなりの努力が必要であり、解釈バイアスや意図しない誤りの影響を受けやすい。
本研究では,抽出手法と抽象手法を組み合わせて,ECTSumデータセットから簡潔かつ現実的に信頼性の高いReutersスタイルの要約を生成するハイブリッド要約フレームワークを提案する。
提案した2つのステージパイプラインは、まずLexRankアルゴリズムを用いて、リソース制約設定用に設計されたBARTとPEGASUSの微調整された変種を用いて要約された有能な文を識別する。
並行して、Longformer Encoder-Decoder(LED)モデルを微調整して、ファイナンシャルドキュメントの長距離コンテキスト依存性を直接キャプチャする。
モデルパフォーマンスは、ROUGE、METEOR、MoverScore、BERTScoreなどの標準的な自動メトリクスと、SciBERTScoreやFinBERTScoreといったドメイン固有の変種を使用して評価される。
実測精度を評価するために,情報源精度とF1目標に基づく実体レベル尺度を更に導入する。
その結果、アプローチ間の相補的なトレードオフが強調され、長いコンテキストモデルが最も高い全体的なパフォーマンスが得られ、一方、ハイブリッドフレームワークは、計算制約下での事実整合性を改善して、競合する結果を達成する。
これらの知見は、長期の財務文書を有効利用可能なビジネスインテリジェンスに効率よく蒸留する実用的な要約システムの開発を支援する。
関連論文リスト
- DeepSynth-Eval: Objectively Evaluating Information Consolidation in Deep Survey Writing [53.85037373860246]
本稿では,情報統合能力を客観的に評価するためのベンチマークであるDeep Synth-Evalを紹介する。
一般チェックリスト(実例)と制約チェックリスト(構造体)を用いたきめ細かい評価プロトコルを提案する。
その結果,エージェント型プラン・アンド・ライトは単ターン生成よりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-01-07T03:07:52Z) - Harnessing Generative LLMs for Enhanced Financial Event Entity Extraction Performance [0.0]
金融イベントエンティティ抽出は、財務知識グラフを構築する上で重要なタスクである。
従来のアプローチでは、しばしばシーケンスラベリングモデルに依存しており、長距離依存に苦しむことがある。
本稿では,財務イベントエンティティ抽出をテキストから構造化した生成タスクとして再編成する手法を提案する。
論文 参考訳(メタデータ) (2025-04-20T14:23:31Z) - TWSSenti: A Novel Hybrid Framework for Topic-Wise Sentiment Analysis on Social Media Using Transformer Models [0.0]
本研究では,感情分類の精度と頑健性を改善するために,トランスフォーマーモデルを組み合わせたハイブリッドフレームワークについて検討する。
このフレームワークは、ノイズの多いデータ、コンテキストのあいまいさ、さまざまなデータセット間の一般化といった課題に対処する。
この研究は、ソーシャルメディアのモニタリング、顧客感情分析、世論の追跡など、現実世界のタスクへの適用性を強調している。
論文 参考訳(メタデータ) (2025-04-14T05:44:11Z) - COMM:Concentrated Margin Maximization for Robust Document-Level Relation Extraction [5.291403671224172]
文書レベルの関係抽出(DocRE)は、文書内の複数の文にまたがるエンティティ間の関係を識別し、抽出するプロセスである。
DocREに固有の複雑さにより、ラベル付けプロセスはエラーを起こしやすくなり、正の関係サンプルの極端に親和性がある。
DocREをよりよく解くために,textittextbfCOMMという堅牢なフレームワークを開発した。
論文 参考訳(メタデータ) (2025-03-18T04:31:57Z) - Instruction-Guided Bullet Point Summarization of Long Financial Earnings Call Transcripts [25.4439290862464]
本稿では,最近リリースされたデータセットを用いて,Earning Callum Transcripts (ECT) の弾丸点要約問題について検討する。
この課題を解決するために,教師なし質問ベース抽出モジュールとパラメータ効率のよい命令調整抽象モジュールを併用する。
提案したモデルFLAN-FinBPSは,14.88%の平均ROUGEスコアゲインで最強のベースラインを上回り,最先端の新たなパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-05-03T16:33:16Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Evaluating and Improving Factuality in Multimodal Abstractive
Summarization [91.46015013816083]
そこで我々は,CLIPBERTScoreを提案する。
ゼロショットにおけるこの2つの指標の単純な組み合わせは、文書要約のための既存の事実度指標よりも高い相関性が得られることを示す。
本分析は,CLIPBERTScoreとそのコンポーネントの信頼性と高い相関性を示す。
論文 参考訳(メタデータ) (2022-11-04T16:50:40Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。