Fugu-MT 論文翻訳(概要): Empowering Many, Biasing a Few: Generalist Credit Scoring through Large Language Models

論文の概要: Empowering Many, Biasing a Few: Generalist Credit Scoring through Large Language Models

arxiv url: http://arxiv.org/abs/2310.00566v1
Date: Sun, 1 Oct 2023 03:50:34 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-05 03:29:40.210204
Title: Empowering Many, Biasing a Few: Generalist Credit Scoring through Large Language Models
Title（参考訳）: 多数の権限を与え、バイアスを負う: 大規模言語モデルによるジェネラリストクレジットスコアリング
Authors: Duanyu Feng, Yongfu Dai, Jimin Huang, Yifang Zhang, Qianqian Xie, Weiguang Han, Alejandro Lopez-Lira, Hao Wang
Abstract要約: 既存のクレジットスコアリングモデルでは、知識ミオピアとタスク分離に起因する制限がしばしば示される。クレジットアセスメントの目的でキュレートされた新しいベンチマークを導入し、特別な信用・リスクアセスメント大言語モデル(CALM)を微調整し、LCMが持つ可能性のあるバイアスを厳格に検証する。本研究は, LLMが信用評価に革命をもたらす可能性, 多様な財務評価に適応性を示し, 公平な意思決定の重要性を強調した。
参考スコア（独自算出の注目度）: 53.742730527280486
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Credit and risk assessments are cornerstones of the financial landscape, impacting both individual futures and broader societal constructs. Existing credit scoring models often exhibit limitations stemming from knowledge myopia and task isolation. In response, we formulate three hypotheses and undertake an extensive case study to investigate LLMs' viability in credit assessment. Our empirical investigations unveil LLMs' ability to overcome the limitations inherent in conventional models. We introduce a novel benchmark curated for credit assessment purposes, fine-tune a specialized Credit and Risk Assessment Large Language Model (CALM), and rigorously examine the biases that LLMs may harbor. Our findings underscore LLMs' potential in revolutionizing credit assessment, showcasing their adaptability across diverse financial evaluations, and emphasizing the critical importance of impartial decision-making in the financial sector. Our datasets, models, and benchmarks are open-sourced for other researchers.
Abstract（参考訳）: 信用とリスクアセスメントは金融の基盤であり、個々の未来とより広い社会構造の両方に影響を及ぼす。既存のクレジットスコアリングモデルでは、知識ミオピアとタスク分離に起因する制限がしばしば示される。そこで本研究では,3つの仮説を定式化し,LLMの信用評価における生存可能性について検討した。我々の実証研究は、従来のモデルに固有の制限を克服するLLMの能力を明らかにする。クレジットアセスメントの目的でキュレートされた新しいベンチマークを導入し、特別な信用・リスクアセスメント大言語モデル(CALM)を微調整し、LCMが持つ可能性のあるバイアスを精査する。本研究は, LLMが信用評価に革命をもたらす可能性を明らかにし, 多様な財務評価に適応可能性を示し, 金融セクターにおける公平な意思決定の重要性を強調した。私たちのデータセット、モデル、ベンチマークは、他の研究者のためにオープンソース化されています。

関連論文リスト

MASCA: LLM based-Multi Agents System for Credit Assessment [0.3277163122167434]
実世界の意思決定プロセスのミラー化による信用評価向上を目的とした,LLM駆動型マルチエージェントシステムMASCAを紹介する。また,階層型マルチエージェントシステムにおけるシグナリングゲーム理論の視点を示し,その構造と相互作用に関する理論的洞察を提供する。
論文参考訳（メタデータ） (2025-07-30T15:19:38Z)
Interpretable LLMs for Credit Risk: A Systematic Review and Taxonomy [0.0]
大規模言語モデル(LLM)は、財務文書の分析を通じて信用リスクの評価を可能にする。本稿では、信用リスク推定におけるLSMに基づくアプローチに着目した、最初の体系的レビューと分類について述べる。
論文参考訳（メタデータ） (2025-06-04T10:24:40Z)
Evaluating Large Language Models on Financial Report Summarization: An Empirical Study [9.28042182186057]
我々は3つの最先端大言語モデル(LLM)の比較研究を行っている。我々の主な動機は、これらのモデルがどのように金融の中で活用できるかを探求することであり、正確さ、文脈的関連性、誤った情報や誤解を招く情報に対する堅牢性を要求する分野である。本稿では,定量的メトリクス(精度,リコールなど)と質的分析(コンテキスト適合性,一貫性など)を統合し,各モデルの出力品質の全体像を提供する,革新的な評価フレームワークを提案する。
論文参考訳（メタデータ） (2024-11-11T10:36:04Z)
Justice or Prejudice? Quantifying Biases in LLM-as-a-Judge [84.34545223897578]
多くの領域で優れているにもかかわらず、潜在的な問題は未解決のままであり、その信頼性と実用性の範囲を損なう。提案手法は, LLM-as-a-Judgeにおける各種類のバイアスを定量化し, 解析する自動バイアス定量化フレームワークである。当社の作業は、これらの問題に対処するステークホルダの必要性を強調し、LLM-as-a-Judgeアプリケーションで注意を喚起します。
論文参考訳（メタデータ） (2024-10-03T17:53:30Z)
Forecasting Credit Ratings: A Case Study where Traditional Methods Outperform Generative LLMs [17.109522466982476]
大規模言語モデル(LLM)は多くの下流タスクでうまく機能することが示されている。本稿では,企業信用格付け予測におけるLCMの業績について検討する。
論文参考訳（メタデータ） (2024-07-24T20:30:55Z)
CLAMBER: A Benchmark of Identifying and Clarifying Ambiguous Information Needs in Large Language Models [60.59638232596912]
大規模言語モデル(LLM)を評価するベンチマークであるCLAMBERを紹介する。分類を基盤として12Kの高品質なデータを構築し, 市販のLCMの強度, 弱点, 潜在的なリスクを評価する。本研究は, あいまいなユーザクエリの特定と明確化において, 現在のLCMの実用性に限界があることを示唆する。
論文参考訳（メタデータ） (2024-05-20T14:34:01Z)
Credit Risk Meets Large Language Models: Building a Risk Indicator from Loan Descriptions in P2P Lending [1.1970409518725493]
ピアツーピア(P2P)融資は、借り手と貸し手とをオンラインプラットフォームを通じて結びつける独特の融資メカニズムとして登場した。しかしながら、P2P貸与は情報非対称性の課題に直面している。本稿では,ローン申請プロセスにおいて,借主が提供したテキスト記述を活用することで,この問題に対処する新たなアプローチを提案する。
論文参考訳（メタデータ） (2024-01-29T10:11:05Z)
Exploring the Reliability of Large Language Models as Customized Evaluators for Diverse NLP Tasks [65.69651759036535]
大規模言語モデル(LLM)が人間にとって信頼できる代替手段であるかどうかを解析する。本稿では、従来のタスク(例えば、ストーリー生成)とアライメントタスク(例えば、数学推論)の両方について検討する。 LLM評価器は不要な基準を生成したり、重要な基準を省略することができる。
論文参考訳（メタデータ） (2023-10-30T17:04:35Z)
Survey on Factuality in Large Language Models: Knowledge, Retrieval and Domain-Specificity [61.54815512469125]
本調査は,大規模言語モデル(LLM)における事実性の重要課題に対処する。 LLMが様々な領域にまたがる応用を見出すにつれ、その出力の信頼性と正確性は重要となる。
論文参考訳（メタデータ） (2023-10-11T14:18:03Z)
Through the Lens of Core Competency: Survey on Evaluation of Large Language Models [27.271533306818732]
大規模言語モデル(LLM)は優れた性能と幅広い実用性を持っている。既存の評価タスクは、現実世界のシナリオにおける幅広いアプリケーションに追いつくのは難しい。 LLMの4つのコア能力は、推論、知識、信頼性、安全性などである。この能力アーキテクチャの下では、類似したタスクを組み合わせて対応する能力を反映し、新しいタスクをシステムに簡単に追加することができる。
論文参考訳（メタデータ） (2023-08-15T17:40:34Z)
A Survey on Evaluation of Large Language Models [87.60417393701331]
大規模言語モデル(LLM)は、学術と産業の両方で人気が高まっている。本稿では,評価方法,評価方法,評価方法の3つの重要な側面に焦点をあてる。
論文参考訳（メタデータ） (2023-07-06T16:28:35Z)
KoLA: Carefully Benchmarking World Knowledge of Large Language Models [87.96683299084788]
我々は知識指向LLMアセスメントベンチマーク(KoLA)を構築した。人間の認知を模倣して、知識関連能力の4段階の分類を形成し、19ドルのタスクをカバーします。私たちは、LLMによって事前訓練されたコーパスであるウィキペディアと、継続的に収集された新興コーパスを使用して、目に見えないデータや進化する知識を扱う能力を評価します。
論文参考訳（メタデータ） (2023-06-15T17:20:46Z)
Bagging Supervised Autoencoder Classifier for Credit Scoring [3.5977219275318166]
クレジットスコアリングデータセットの不均衡の性質と、クレジットスコアリングデータセットの特徴の不均一性は、効果的なクレジットスコアリングモデルの開発と実装に困難をもたらす。本稿では,主にスーパービジョンオートエンコーダの性能を活かしたBaging Supervised Autoencoder (BSAC)を提案する。 BSACはまた、過半数クラスのアンサンプに基づいて、Bagingプロセスの変種を採用することで、データ不均衡の問題にも対処する。
論文参考訳（メタデータ） (2021-08-12T17:49:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。