論文の概要: SILC-EFSA: Self-aware In-context Learning Correction for Entity-level Financial Sentiment Analysis
- arxiv url: http://arxiv.org/abs/2412.19140v1
- Date: Thu, 26 Dec 2024 09:53:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:28:43.238549
- Title: SILC-EFSA: Self-aware In-context Learning Correction for Entity-level Financial Sentiment Analysis
- Title(参考訳): SILC-EFSA:エンティティレベルの財務感覚分析のための自己認識型インコンテキスト学習補正
- Authors: Senbin Zhu, Chenyuan He, Hongde Liu, Pengcheng Dong, Hanjie Zhao, Yuchen Yan, Yuxiang Jia, Hongying Zan, Min Peng,
- Abstract要約: 我々は、SILC(Self-Aware In-Aware Learning Correction)と呼ばれる2段階の感情分析手法を提案する。
第1段階では,タスク固有の擬似ラベル付きデータを生成するために,ベースとなる大規模言語モデルを微調整する。
第2段階では、擬似ラベル付きデータから情報を得るGNNベースのサンプルレトリバーを用いて補正モデルを訓練する。
- 参考スコア(独自算出の注目度): 9.48177379759274
- License:
- Abstract: In recent years, fine-grained sentiment analysis in finance has gained significant attention, but the scarcity of entity-level datasets remains a key challenge. To address this, we have constructed the largest English and Chinese financial entity-level sentiment analysis datasets to date. Building on this foundation, we propose a novel two-stage sentiment analysis approach called Self-aware In-context Learning Correction (SILC). The first stage involves fine-tuning a base large language model to generate pseudo-labeled data specific to our task. In the second stage, we train a correction model using a GNN-based example retriever, which is informed by the pseudo-labeled data. This two-stage strategy has allowed us to achieve state-of-the-art performance on the newly constructed datasets, advancing the field of financial sentiment analysis. In a case study, we demonstrate the enhanced practical utility of our data and methods in monitoring the cryptocurrency market. Our datasets and code are available at https://github.com/NLP-Bin/SILC-EFSA.
- Abstract(参考訳): 近年、財務における微粒な感情分析が注目されているが、エンティティレベルのデータセットの不足は依然として重要な課題である。
この問題に対処するため、我々はこれまでで最大規模の英語および中国の金融エンティティレベルの感情分析データセットを構築してきた。
本稿では,この基盤を基盤として,SILC(Self-Aware In-Context Learning Correction)と呼ばれる2段階の感情分析手法を提案する。
第1段階では,タスク固有の擬似ラベル付きデータを生成するために,ベースとなる大規模言語モデルを微調整する。
第2段階では、擬似ラベル付きデータから情報を得るGNNベースのサンプルレトリバーを用いて補正モデルを訓練する。
この2段階戦略により、新たに構築されたデータセット上での最先端のパフォーマンスが達成され、金融感情分析の分野が前進した。
ケーススタディでは、暗号通貨市場を監視するためのデータと手法の強化された実用性を実証する。
データセットとコードはhttps://github.com/NLP-Bin/SILC-EFSA.comで公開されています。
関連論文リスト
- Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Numerical Claim Detection in Finance: A New Financial Dataset, Weak-Supervision Model, and Market Analysis [4.575870619860645]
ファイナンシャルドメインにおけるクレーム検出タスクのための新たな財務データセットを構築した。
本稿では,対象物の専門家(SME)の知識を集約関数に組み込んだ,新たな弱スーパービジョンモデルを提案する。
ここでは、利益の急落と楽観的な指標への回帰の依存を観察する。
論文 参考訳(メタデータ) (2024-02-18T22:55:26Z) - GPT-FinRE: In-context Learning for Financial Relation Extraction using
Large Language Models [1.9559144041082446]
本稿では,そのようなデータセットREFinDにおける関係抽出のソリューションについて述べる。
本稿では,文脈内学習(ICL)の枠組みとしてOpenAIモデルを用いた。
総合で3位になった。最高のF1スコアは0.718だ。
論文 参考訳(メタデータ) (2023-06-30T10:12:30Z) - Chinese Fine-Grained Financial Sentiment Analysis with Large Language
Models [4.993565079216378]
そこで我々は,企業早期警戒のための,中国の財務感情分析データセットFinChina SAを提案する。
われわれのデータセットは、現実の財務感情分析タスクの探索を進めるための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2023-06-25T02:24:30Z) - FinEAS: Financial Embedding Analysis of Sentiment [0.0]
FinEAS(Financial Embedding Analysis of Sentiment)と呼ばれる新しい言語表現モデルを導入する。
本研究では,標準的なBERTモデルからの教師付き微調整文の埋め込みに基づく財務感情分析の新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-10-31T15:41:56Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。