論文の概要: Multimodal Generative Models for Bankruptcy Prediction Using Textual
Data
- arxiv url: http://arxiv.org/abs/2211.08405v5
- Date: Sat, 24 Feb 2024 11:08:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-27 19:47:12.572374
- Title: Multimodal Generative Models for Bankruptcy Prediction Using Textual
Data
- Title(参考訳): テキストデータを用いた倒産予測のためのマルチモーダル生成モデル
- Authors: Rogelio A. Mancisidor and Kjersti Aas
- Abstract要約: 本研究では、会計、市場、テキストデータモダリティから情報を埋め込んだマルチモーダル表現を学習するマルチモーダル識別条件(CMMD)モデルを提案する。
この新たな手法では、会計と市場データは、テキストデータとは異なり、すべての企業で利用可能であるため、破産予測モデルでテキストデータを使用することが現実的である。
- 参考スコア(独自算出の注目度): 2.1756081703276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Textual data from financial filings, e.g., the Management's Discussion &
Analysis (MDA) section in Form 10-K, has been used to improve the prediction
accuracy of bankruptcy models. In practice, however, we cannot obtain the MDA
section for all public companies, which limits the use of MDA data in
traditional bankruptcy models, as they need complete data to make predictions.
The two main reasons for the lack of MDA are: (i) not all companies are obliged
to submit the MDA and (ii) technical problems arise when crawling and scrapping
the MDA section. To solve this limitation, this research introduces the
Conditional Multimodal Discriminative (CMMD) model that learns multimodal
representations that embed information from accounting, market, and textual
data modalities. The CMMD model needs a sample with all data modalities for
model training. At test time, the CMMD model only needs access to accounting
and market modalities to generate multimodal representations, which are further
used to make bankruptcy predictions and to generate words from the missing MDA
modality. With this novel methodology, it is realistic to use textual data in
bankruptcy prediction models, since accounting and market data are available
for all companies, unlike textual data. The empirical results of this research
show that if financial regulators, or investors, were to use traditional models
using MDA data, they would only be able to make predictions for 60% of the
companies. Furthermore, the classification performance of our proposed
methodology is superior to that of a large number of traditional classifier
models, taking into account all the companies in our sample.
- Abstract(参考訳): 10-KのMDA(Management's Discussion & Analysis)セクションなどの財務書類からのテキストデータは、倒産モデルの予測精度を改善するために使われてきた。
しかし、実際には、従来の倒産モデルにおけるMDAデータの使用を制限するために、予測を行うのに完全なデータが必要であるため、すべての公開企業に対してMDAセクションを取得することはできない。
mdaの欠如の主な理由は次の2つです。
一 すべての企業がMDAを提出しなければならないわけではない。
(II)MDA部のクロール・スクラップ時に技術的問題が発生する。
この制限を解決するために、会計、市場、テキストデータモダリティから情報を埋め込んだマルチモーダル表現を学習する条件付きマルチモーダル識別(CMMD)モデルを導入する。
cmmdモデルは、モデルトレーニングのためにすべてのデータモダリティを持つサンプルを必要とする。
テスト時には、CMMDモデルは、マルチモーダル表現を生成するために、会計と市場モダリティへのアクセスしか必要とせず、さらに倒産予測やMDAモダリティの欠如から単語を生成するために使われる。
この新手法では,テキストデータとは異なり,すべての企業において会計や市場データを利用できるため,倒産予測モデルにおいてテキストデータを使用することが現実的である。
この調査の実証的な結果は、金融規制当局や投資家がMDAデータを使用して従来のモデルを使用する場合、企業の60%しか予測できないことを示している。
さらに,提案手法の分類性能は,従来の多くの分類モデルよりも優れており,サンプル中の全企業を考慮に入れている。
関連論文リスト
- AMA-LSTM: Pioneering Robust and Fair Financial Audio Analysis for Stock Volatility Prediction [25.711345527738068]
マルチモーダル法は 2つの欠点に直面しています
彼らはしばしば、信頼できるモデルを得るのに失敗し、株式市場からの情報の吸収のためにデータを過大評価する。
株のボラティリティを予測するためにマルチモーダルモデルを使用することは、性別バイアスに悩まされ、そのようなバイアスを取り除く効率的な方法が欠如している。
我々は,ロバストネス・ワールド・ファイナンシャル・オーディオ・データセットに関する包括的な実験を行い,この手法が現在の最先端ソリューションの性能を上回ることを示した。
論文 参考訳(メタデータ) (2024-07-03T18:40:53Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Incorporating Pre-trained Model Prompting in Multimodal Stock Volume
Movement Prediction [22.949484374773967]
本稿では,PromptをベースとしたMUltimodal Stock volumE予測モデル(ProMUSE)を提案する。
金融ニュースの理解を深めるために、事前訓練された言語モデルを使用します。
また, この問題を緩和するため, 核融合ヘッドの横にある一方向の頭部を保ちながら, 新たな異方性コントラストアライメントを提案する。
論文 参考訳(メタデータ) (2023-09-11T16:47:01Z) - MMG-Ego4D: Multi-Modal Generalization in Egocentric Action Recognition [73.80088682784587]
MMG(Multimodal Generalization)は,特定のモダリティのデータに制限がある場合,あるいは完全に欠落する場合に,システムがどのように一般化できるかを研究することを目的としている。
MMGは2つの新しいシナリオで構成され、現実のアプリケーションにおけるセキュリティと効率の考慮をサポートするように設計されている。
新しい融合モジュールは、モダリティのドロップアウトトレーニング、コントラストベースのアライメントトレーニング、そして新しいクロスモーダル損失により、より優れた数ショット性能を実現した。
論文 参考訳(メタデータ) (2023-05-12T03:05:40Z) - VERITE: A Robust Benchmark for Multimodal Misinformation Detection
Accounting for Unimodal Bias [17.107961913114778]
マルチモーダルの誤報は ソーシャルメディアのプラットフォームで 増え続けている問題です
本研究では,広範に使用されているMDDベンチマークにおいて,一様偏差の存在を調査・同定する。
リアルな合成学習データを生成するための新しい手法であるCrossmodal HArd Synthetic MisAlignment (CHASMA)を導入する。
論文 参考訳(メタデータ) (2023-04-27T12:28:29Z) - Non-Invasive Fairness in Learning through the Lens of Data Drift [88.37640805363317]
データや学習アルゴリズムを変更することなく、機械学習モデルの公平性を向上する方法を示す。
異なる集団間の傾向のばらつきと、学習モデルと少数民族間の連続的な傾向は、データドリフトと類似している。
このドリフトを解決するための2つの戦略(モデル分割とリウィーディング)を探索し、基礎となるデータに対するモデル全体の適合性を改善することを目的としている。
論文 参考訳(メタデータ) (2023-03-30T17:30:42Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - A transformer-based model for default prediction in mid-cap corporate
markets [13.535770763481905]
時価総額が100億ドル未満の中堅企業について調査する。
中間項の既定確率項構造を予測することを目的とする。
私たちは、どのデータソースがデフォルトのリスクに最も貢献しているかを理解しています。
論文 参考訳(メタデータ) (2021-11-18T19:01:00Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - Families In Wild Multimedia: A Multimodal Database for Recognizing
Kinship [63.27052967981546]
マルチタスク MM キンシップデータセットを初めて公開する。
FIW MMを構築するために,データを自動収集,注釈付け,作成する機構を開発した。
結果は、改善の異なる領域で将来の研究を刺激するエッジケースを強調します。
論文 参考訳(メタデータ) (2020-07-28T22:36:57Z) - Industry Adoption Scenarios for Authoritative Data Stores using the ISDA
Common Domain Model [0.0]
我々は、効率を大幅に向上し、コストを削減するために、ポストトレーダ業界が標準化し、単純化する機会を探る。
この中には、貿易のライフサイクルを通じて、ビジネスイベントやプロセスのデジタル表現の標準セットとして、国際スワップ・デリバティブズ・アソシエーション・コモン・ドメイン・モデル(CDM)への移行も含まれる。
論文 参考訳(メタデータ) (2020-07-13T16:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。