論文の概要: BASIR: Budget-Assisted Sectoral Impact Ranking -- A Dataset for Sector Identification and Performance Prediction Using Language Models
- arxiv url: http://arxiv.org/abs/2504.13189v1
- Date: Wed, 02 Apr 2025 13:10:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.588106
- Title: BASIR: Budget-Assisted Sectoral Impact Ranking -- A Dataset for Sector Identification and Performance Prediction Using Language Models
- Title(参考訳): BASIR:予算支援型セクタインパクトランキング-言語モデルを用いたセクタ識別とパフォーマンス予測のためのデータセット
- Authors: Sohom Ghosh, Sudip Kumar Naskar,
- Abstract要約: 本研究は、インドの統一予算発表の恩恵を受ける可能性のあるセクターを体系的に識別し、ランク付けする枠組みを提案する。
BASIR(Budget-Assisted Sectoral Impact Ranking)は,予算記述からセクター影響への注釈付きデータセットマッピングである。
以上の結果から,セクター分類では0.605F1スコア,予算後の業績では0.997NDCGスコアが得られた。
- 参考スコア(独自算出の注目度): 0.23940819037450983
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Government fiscal policies, particularly annual union budgets, exert significant influence on financial markets. However, real-time analysis of budgetary impacts on sector-specific equity performance remains methodologically challenging and largely unexplored. This study proposes a framework to systematically identify and rank sectors poised to benefit from India's Union Budget announcements. The framework addresses two core tasks: (1) multi-label classification of excerpts from budget transcripts into 81 predefined economic sectors, and (2) performance ranking of these sectors. Leveraging a comprehensive corpus of Indian Union Budget transcripts from 1947 to 2025, we introduce BASIR (Budget-Assisted Sectoral Impact Ranking), an annotated dataset mapping excerpts from budgetary transcripts to sectoral impacts. Our architecture incorporates fine-tuned embeddings for sector identification, coupled with language models that rank sectors based on their predicted performances. Our results demonstrate 0.605 F1-score in sector classification, and 0.997 NDCG score in predicting ranks of sectors based on post-budget performances. The methodology enables investors and policymakers to quantify fiscal policy impacts through structured, data-driven insights, addressing critical gaps in manual analysis. The annotated dataset has been released under CC-BY-NC-SA-4.0 license to advance computational economics research.
- Abstract(参考訳): 政府の財政政策、特に年次組合予算は金融市場に大きな影響を与えている。
しかしながら、セクター固有のエクイティパフォーマンスに対する予算的影響のリアルタイム分析は、方法論的に困難であり、ほとんど調査されていない。
本研究は、インドの統一予算発表の恩恵を受ける可能性のあるセクターを体系的に識別し、ランク付けする枠組みを提案する。
本枠組みは,(1)予算書からの抜粋の多ラベル分類を81分野に,(2)これらの分野のパフォーマンスランキングに対処する。
1947年から2025年にかけて、インド連邦予算文書の包括的コーパスを活用し、予算文書からセクター的影響への注釈付きデータセットマッピングであるBASIR(Budget-Assisted Sectoral Impact Ranking)を導入する。
我々のアーキテクチャは、セクター識別のための微調整された埋め込みと、予測されたパフォーマンスに基づいてセクターをランク付けする言語モデルを備えている。
以上の結果から,セクター分類では0.605F1スコア,予算後の業績では0.997NDCGスコアが得られた。
この手法により、投資家や政策立案者は、構造化されたデータ駆動の洞察を通じて財政政策への影響を定量化し、手動分析における重要なギャップに対処することができる。
この注釈付きデータセットはCC-BY-NC-SA-4.0ライセンスの下でリリースされ、計算経済学の研究が進められた。
関連論文リスト
- A Comprehensive Study on GDPR-Oriented Analysis of Privacy Policies: Taxonomy, Corpus and GDPR Concept Classifiers [18.770985160731122]
我々は、より完全な分類法を開発し、階層的な情報を持つラベル付きプライバシポリシーの最初のコーパスを作成し、プライバシポリシーのための概念分類器の最も包括的なパフォーマンス評価を行った。
本研究は, セグメントレベルでのトレーニングとテストセットの分割が適切でないこと, 階層的情報を考慮したことのメリット, 「一つのサイズがすべてに適合する」アプローチの限界, クロスコーパスの汎用性をテストすることの意義など, 新たな発見を導く。
論文 参考訳(メタデータ) (2024-10-07T05:19:12Z) - Evaluating the performance of state-of-the-art esg domain-specific pre-trained large language models in text classification against existing models and traditional machine learning techniques [0.0]
本研究では,テキスト開示における環境・社会・ガバナンス情報(ESG)の分類について検討する。
本研究の目的は,E,S,G関連コンテンツをそれぞれ正確に識別・分類できるバイナリ分類モデルを開発し,評価することである。
この研究の動機は、投資決定におけるESGの考慮と企業説明責任の増大に起因している。
論文 参考訳(メタデータ) (2024-09-30T20:08:32Z) - Automatic detection of relevant information, predictions and forecasts in financial news through topic modelling with Latent Dirichlet Allocation [9.059679096341474]
我々は、関連するテキストを特定するための財務ニュースの分析と、そのテキストの中で予測と予測に焦点を当てる。
本稿では、投資家が関連する金融事象を検出するのを支援するために、新たな自然言語処理(NLP)システムを提案する。
論文 参考訳(メタデータ) (2024-03-30T17:49:34Z) - A Big Data Approach to Understand Sub-national Determinants of FDI in Africa [0.0]
本稿では,アフリカ企業におけるFDIの所有に影響を与える地域レベル(サブ国家)特性を定量化するための,テキストマイニングとソーシャルネットワーク分析に基づく新しい手法を提案する。
地域的(準国家的な)構造的特徴と制度的特徴が、外国の所有権を決定する上で重要な役割を担っていることが示唆されている。
論文 参考訳(メタデータ) (2024-03-15T12:12:54Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - When is Off-Policy Evaluation (Reward Modeling) Useful in Contextual Bandits? A Data-Centric Perspective [64.73162159837956]
ログ化されたデータセットだけで仮説的ターゲットポリシーの価値を評価することは重要だが、難しい。
データ中心のフレームワークであるDataCOPEを提案する。
医療データセットを用いたログ化された文脈的帯域設定におけるDataCOPEの実証分析により、機械学習と人間の専門家ポリシーの両方を評価する能力が確認された。
論文 参考訳(メタデータ) (2023-11-23T17:13:37Z) - Beyond Sentiment: Leveraging Topic Metrics for Political Stance
Classification [1.0878040851638]
本研究では,抽出されたトピックから変換されたダミー変数であるトピックメトリクスを,スタンス分類における感情指標の代替と補完の両方として紹介する。
実験の結果、BERTopicは従来のアプローチと比較してコヒーレンススコアを17.07%から54.20%改善していることがわかった。
本研究は, 文脈に富むテキストやコーパスにおいて, 姿勢と感情の相関が弱いトピックメトリクスが特に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-24T00:50:33Z) - CSPRD: A Financial Policy Retrieval Dataset for Chinese Stock Market [61.59326951366202]
我々は、中国株式政策検索データセット(CSPRD)を導入して、新たな課題である政策検索を提案する。
CSPRDは、中国の政策コーパスの10k以上の項目から、経験豊富な専門家によってラベル付けされた700以上のパスを提供する。
我々の最高のパフォーマンスベースラインは56.1% MRR@10、28.5% NDCG@10、37.5% Recall@10、80.6% Precision@10である。
論文 参考訳(メタデータ) (2023-09-08T15:40:54Z) - Flexible categorization for auditing using formal concept analysis and
Dempster-Shafer theory [55.878249096379804]
我々は、異なる金融口座に対する異なる利息の程度に応じて分類する様々な方法を研究する。
本稿で開発したフレームワークは,説明可能な分類の獲得と研究のための公式な基盤を提供する。
論文 参考訳(メタデータ) (2022-10-31T13:49:16Z) - Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification [75.49600684537117]
データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
論文 参考訳(メタデータ) (2021-01-18T22:55:40Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。