論文の概要: FinSurvival: A Suite of Large Scale Survival Modeling Tasks from Finance
- arxiv url: http://arxiv.org/abs/2507.14160v1
- Date: Mon, 07 Jul 2025 12:48:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-27 08:26:15.92837
- Title: FinSurvival: A Suite of Large Scale Survival Modeling Tasks from Finance
- Title(参考訳): FinSurvival:ファイナンスによる大規模生存モデリングタスクスイート
- Authors: Aaron Green, Zihan Nie, Hanzhen Qin, Oshani Seneviratne, Kristin P. Bennett,
- Abstract要約: 人工知能(AI)サバイバルモデルをベンチマークするために、大規模で現実的で自由に利用できるデータセットが必要である。
分散ファイナンス(DeFi)における暗号通貨の貸与によって生成された公開取引データから16の生存モデリングタスクスイートを導出する。
我々は16の生存時間予測タスクからなる生存ベンチマークを定式化する(FinSurvival)。
- 参考スコア(独自算出の注目度): 2.9241898523593357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Survival modeling predicts the time until an event occurs and is widely used in risk analysis; for example, it's used in medicine to predict the survival of a patient based on censored data. There is a need for large-scale, realistic, and freely available datasets for benchmarking artificial intelligence (AI) survival models. In this paper, we derive a suite of 16 survival modeling tasks from publicly available transaction data generated by lending of cryptocurrencies in Decentralized Finance (DeFi). Each task was constructed using an automated pipeline based on choices of index and outcome events. For example, the model predicts the time from when a user borrows cryptocurrency coins (index event) until their first repayment (outcome event). We formulate a survival benchmark consisting of a suite of 16 survival-time prediction tasks (FinSurvival). We also automatically create 16 corresponding classification problems for each task by thresholding the survival time using the restricted mean survival time. With over 7.5 million records, FinSurvival provides a suite of realistic financial modeling tasks that will spur future AI survival modeling research. Our evaluation indicated that these are challenging tasks that are not well addressed by existing methods. FinSurvival enables the evaluation of AI survival models applicable to traditional finance, industry, medicine, and commerce, which is currently hindered by the lack of large public datasets. Our benchmark demonstrates how AI models could assess opportunities and risks in DeFi. In the future, the FinSurvival benchmark pipeline can be used to create new benchmarks by incorporating more DeFi transactions and protocols as the use of cryptocurrency grows.
- Abstract(参考訳): サバイバル・モデリング(Survival Modeling)は、ある事象が起こるまでの時間を予測し、リスク分析で広く使用される。
人工知能(AI)サバイバルモデルをベンチマークするために、大規模で現実的で自由に利用できるデータセットが必要である。
本稿では,分散ファイナンス(DeFi)における暗号通貨の貸与によって生成される公開取引データから,16のサバイバルモデリングタスクのスイートを導出する。
各タスクは、インデックスと結果イベントの選択に基づいて、自動パイプラインを使用して構築された。
例えば、ユーザがコイン(インデックスイベント)を借りて最初の返済(アウトカムイベント)するまでの時間を予測する。
我々は16の生存時間予測タスク(FinSurvival)からなる生存率ベンチマークを定式化する。
また,制限された平均生存時間を用いて生存時間をしきい値にすることで,各タスクに対応する16の分類問題を自動生成する。
750万以上の記録を持つFinSurvivalは、将来のAIサバイバルモデリング研究を促進するための、現実的な財務モデリングタスクスイートを提供している。
評価の結果,これらは既存の手法ではうまく対応できない課題であることがわかった。
FinSurvivalは、従来の金融、産業、医療、商業に適用可能なAIサバイバルモデルの評価を可能にする。
我々のベンチマークは、AIモデルがDeFiの機会とリスクを評価する方法を示している。
将来的には、FinSurvivalベンチマークパイプラインを使用して、暗号通貨の利用が拡大するにつれて、より多くのDeFiトランザクションとプロトコルを導入することで、新たなベンチマークを作成することが可能になる。
関連論文リスト
- Intention-Conditioned Flow Occupancy Models [69.79049994662591]
大規模な事前学習は、今日の機械学習研究のやり方を根本的に変えた。
同じフレームワークを強化学習に適用することは、RLの中核的な課題に対処するための魅力的な方法を提供するので、魅力的です。
生成AIの最近の進歩は、高度に複雑な分布をモデリングするための新しいツールを提供している。
論文 参考訳(メタデータ) (2025-06-10T15:27:46Z) - AutoElicit: Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.54623137152208]
我々はAutoElicitを導入し、大規模言語モデルから知識を抽出し、予測モデルのための事前構築を行う。
これらの先行情報は情報的であり、自然言語を用いて洗練できることを示す。
AutoElicitは、非形式的な事前よりもエラーを大幅に減らし、ラベルを減らし、コンテクスト内学習を一貫して上回ります。
論文 参考訳(メタデータ) (2024-11-26T10:13:39Z) - SurvRNC: Learning Ordered Representations for Survival Prediction using Rank-N-Contrast [4.5445892770974154]
Survival Rank-N Contrast (SurvRNC) は、生存時間に基づいて順序付けられた表現を得るための正規化器としての損失関数である。
訓練にSurvRNC法を用いることで,異なる深層生存モデルにおいて高い性能が得られることを示す。
論文 参考訳(メタデータ) (2024-03-15T18:00:11Z) - TripleSurv: Triplet Time-adaptive Coordinate Loss for Survival Analysis [15.496918127515665]
本稿では,学習過程の複雑さを扱える時間適応座標損失関数TripleSurvを提案する。
我々のTripleSurvは3つの実世界の生存データセットと公開合成データセットで評価されている。
論文 参考訳(メタデータ) (2024-01-05T08:37:57Z) - CenTime: Event-Conditional Modelling of Censoring in Survival Analysis [49.44664144472712]
CenTimeは、イベントへの時間を直接見積もる、サバイバル分析の新しいアプローチである。
本手法は,非検閲データが少ない場合でも,堅牢なイベント条件検閲機構を特徴とする。
以上の結果から,CenTimeは同等の性能を維持しつつ,死までの時間を予測する上で,最先端のパフォーマンスを提供することがわかった。
論文 参考訳(メタデータ) (2023-09-07T17:07:33Z) - Scaling Survival Analysis in Healthcare with Federated Survival Forests:
A Comparative Study on Heart Failure and Breast Cancer Genomics [7.967995669387532]
現実世界のアプリケーションでは、生存データは不完全、検閲、分散、機密であることが多い。
我々はFedSurF++と呼ばれるFederated Survival Forestアルゴリズムの拡張を提案する。
論文 参考訳(メタデータ) (2023-08-04T15:25:56Z) - SurvivalGAN: Generating Time-to-Event Data for Survival Analysis [121.84429525403694]
検閲と時間的地平線の不均衡は、生成モデルに生存分析に特有の3つの新しい障害モードを経験させる。
本稿では,検閲やイベントの地平線における不均衡に対処し,生存データを扱う生成モデルであるSurvivalGANを提案する。
医療データセットに関する広範な実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-02-24T17:03:51Z) - Two-stage Modeling for Prediction with Confidence [0.0]
分布シフト条件下でニューラルネットワークの性能を一般化することは困難である。
本稿では,分散シフト問題に対する新しい2段階モデルを提案する。
我々のモデルは、ほとんどのデータセットに対して信頼性の高い予測を提供することを示す。
論文 参考訳(メタデータ) (2022-09-19T08:48:07Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - Clinical Risk Prediction with Temporal Probabilistic Asymmetric
Multi-Task Learning [80.66108902283388]
マルチタスク学習手法は、臨床リスク予測などの安全クリティカルな応用に注意を払って使用すべきである。
既存の非対称なマルチタスク学習手法は、低損失のタスクから高損失のタスクへの知識伝達を行うことにより、この負の伝達問題に対処する。
特徴レベルの不確実性に基づいて,特定のタスク/タイムステップから関連する不確実なタスクへの知識伝達を行う,新しい時間的非対称型マルチタスク学習モデルを提案する。
論文 参考訳(メタデータ) (2020-06-23T06:01:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。