論文の概要: The geometry of financial institutions -- Wasserstein clustering of
financial data
- arxiv url: http://arxiv.org/abs/2305.03565v1
- Date: Fri, 5 May 2023 14:16:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 13:43:45.640553
- Title: The geometry of financial institutions -- Wasserstein clustering of
financial data
- Title(参考訳): 金融機関の幾何学 ---wasserstein clustering of financial data
- Authors: Lorenz Riess, Mathias Beiglb\"ock, Johannes Temme, Andreas Wolf, Julio
Backhoff
- Abstract要約: 我々は,粒状およびビッグデータを代表的で分かりやすい地図に凝縮する方法を開発した。
金融規制は、このニーズを実証する分野であり、規制当局はその活動を監視し評価するために、多種多様でしばしば非常に粒度の細かいデータを金融機関から要求する。
確率分布に適用可能なロイドのアルゴリズムの変種を提案し、一般化されたワッサーシュタイン・バリセンタを用いて、与えられたデータを凝縮した形で表現する計量空間を構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing availability of granular and big data on various objects of
interest has made it necessary to develop methods for condensing this
information into a representative and intelligible map. Financial regulation is
a field that exemplifies this need, as regulators require diverse and often
highly granular data from financial institutions to monitor and assess their
activities. However, processing and analyzing such data can be a daunting task,
especially given the challenges of dealing with missing values and identifying
clusters based on specific features.
To address these challenges, we propose a variant of Lloyd's algorithm that
applies to probability distributions and uses generalized Wasserstein
barycenters to construct a metric space which represents given data on various
objects in condensed form. By applying our method to the financial regulation
context, we demonstrate its usefulness in dealing with the specific challenges
faced by regulators in this domain. We believe that our approach can also be
applied more generally to other fields where large and complex data sets need
to be represented in concise form.
- Abstract(参考訳): 様々な関心対象の粒度やビッグデータの利用可能化が進み、この情報を代表的で分かりやすい地図に凝縮する手法を開発する必要がある。
金融規制は、このニーズを実証する分野であり、規制当局はその活動を監視し評価するために、金融機関から多様かつしばしば非常に細かいデータを必要とする。
しかしながら、これらのデータの処理と分析は、特に値の欠如や、特定の特徴に基づいたクラスタの識別といった課題を考えると、大変な作業になり得る。
これらの課題に対処するために、ロイドのアルゴリズムの変種を確率分布に適用し、一般化されたwaserstein barycentersを用いて、様々な対象の与えられたデータを凝縮形式で表現する計量空間を構築する。
本手法を金融規制の文脈に適用することにより,規制当局が直面する課題に対処する上での有用性を示す。
我々は、より一般的に、大規模で複雑なデータセットを簡潔な形式で表現する必要がある他の分野にも適用できると考えている。
関連論文リスト
- GEMS: Generative Expert Metric System through Iterative Prompt Priming [18.0413505095456]
非専門家は、効果的な測度を作成したり、理論を文脈特異的なメトリクスに変換するのが直感的ではないと考えることができる。
この技術的レポートは、大規模ソフトウェア企業内のソフトウェアコミュニティを調べることで、この問題に対処する。
本稿では,ニューラルアクティビティにインスパイアされたプロンプトエンジニアリングフレームワークを提案し,生成モデルが理論を抽出し,要約できることを実証する。
論文 参考訳(メタデータ) (2024-10-01T17:14:54Z) - Multi-agent Planning using Visual Language Models [2.2369578015657954]
大規模言語モデル(LLM)とビジュアル言語モデル(VLM)は、様々なドメインやタスクにわたるパフォーマンスとアプリケーションの改善により、関心を集めている。
LLMとVLMは、特に問題領域の深い理解が必要な場合、誤った結果をもたらす。
本稿では,特定のデータ構造を入力として必要とせずに動作可能なマルチエージェント型タスクプランニングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-08-10T08:10:17Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - Universal representations for financial transactional data: embracing local, global, and external contexts [95.7760348824795]
多様なビジネス課題に対処する表現学習フレームワークを提案する。
また、データ固有性を考慮した新しい生成モデルを提案し、外部情報をクライアントの表現に統合する方法を提案する。
論文 参考訳(メタデータ) (2024-04-02T15:39:14Z) - REFinD: Relation Extraction Financial Dataset [7.207699035400335]
提案するREFinDは,$sim$29Kのインスタンスと8種類のエンティティペア間の22のリレーションを持つ,最初の大規模アノテートされた関係データセットである。
様々な最先端ディープラーニングモデルが,数値推論,関係性,方向性のあいまいさに悩まされていることを観察した。
論文 参考訳(メタデータ) (2023-05-22T22:40:11Z) - Flexible categorization for auditing using formal concept analysis and
Dempster-Shafer theory [55.878249096379804]
我々は、異なる金融口座に対する異なる利息の程度に応じて分類する様々な方法を研究する。
本稿で開発したフレームワークは,説明可能な分類の獲得と研究のための公式な基盤を提供する。
論文 参考訳(メタデータ) (2022-10-31T13:49:16Z) - How Much More Data Do I Need? Estimating Requirements for Downstream
Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か?
データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。
本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文 参考訳(メタデータ) (2022-07-04T21:16:05Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。