論文の概要: CrunchLLM: Multitask LLMs for Structured Business Reasoning and Outcome Prediction
- arxiv url: http://arxiv.org/abs/2509.10698v1
- Date: Fri, 12 Sep 2025 21:26:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.737837
- Title: CrunchLLM: Multitask LLMs for Structured Business Reasoning and Outcome Prediction
- Title(参考訳): CrunchLLM:構造化ビジネス推論とアウトカム予測のためのマルチタスクLLM
- Authors: Rabeya Tus Sadia, Qiang Cheng,
- Abstract要約: 本稿では,スタートアップ成功予測のためのドメイン適応LLMフレームワークであるbfCrunchLLMを紹介する。
本手法は,Crunchbaseスタートアップの成功予測の精度を80%以上向上させる。
この研究は、LLMをドメイン対応の微調整と構造化された非構造化データ融合に適合させることが、起業家的成果の予測モデリングをどのように進めるかを示す。
- 参考スコア(独自算出の注目度): 2.124023760378586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting the success of start-up companies, defined as achieving an exit through acquisition or IPO, is a critical problem in entrepreneurship and innovation research. Datasets such as Crunchbase provide both structured information (e.g., funding rounds, industries, investor networks) and unstructured text (e.g., company descriptions), but effectively leveraging this heterogeneous data for prediction remains challenging. Traditional machine learning approaches often rely only on structured features and achieve moderate accuracy, while large language models (LLMs) offer rich reasoning abilities but struggle to adapt directly to domain-specific business data. We present \textbf{CrunchLLM}, a domain-adapted LLM framework for startup success prediction. CrunchLLM integrates structured company attributes with unstructured textual narratives and applies parameter-efficient fine-tuning strategies alongside prompt optimization to specialize foundation models for entrepreneurship data. Our approach achieves accuracy exceeding 80\% on Crunchbase startup success prediction, significantly outperforming traditional classifiers and baseline LLMs. Beyond predictive performance, CrunchLLM provides interpretable reasoning traces that justify its predictions, enhancing transparency and trustworthiness for financial and policy decision makers. This work demonstrates how adapting LLMs with domain-aware fine-tuning and structured--unstructured data fusion can advance predictive modeling of entrepreneurial outcomes. CrunchLLM contributes a methodological framework and a practical tool for data-driven decision making in venture capital and innovation policy.
- Abstract(参考訳): スタートアップ企業の成功を予測し、買収やIPOを通じてエグジットを達成することが定義されていることは、起業家精神とイノベーション研究において重要な問題である。
Crunchbaseのようなデータセットは構造化情報(例:資金調達ラウンド、業界、投資家ネットワーク)と非構造化テキスト(例:企業説明)の両方を提供するが、この異種データを効果的に活用して予測するのは難しい。
従来の機械学習アプローチは、構造化機能のみに依存して適度な精度を達成するのに対して、大きな言語モデル(LLM)は豊富な推論能力を提供するが、ドメイン固有のビジネスデータに直接適応するのに苦労する。
本稿では,スタートアップ成功予測のためのドメイン適応型LLMフレームワークである \textbf{CrunchLLM} を提案する。
CrunchLLMは構造化企業属性と非構造化テキスト物語を統合し、パラメータ効率の良い微調整戦略と、起業家データの基礎モデルを専門化するための迅速な最適化を適用している。
本手法は,Crunchbase スタートアップの成功予測において80%を超える精度を達成し,従来の分類器やベースライン LLM を著しく上回っている。
CrunchLLMは予測性能の他に、予測を正当化し、財務および政策決定決定者に対する透明性と信頼性を高める解釈可能な推論トレースを提供する。
この研究は、LLMをドメイン対応の微調整と構造化された非構造化データ融合に適合させることが、起業家的成果の予測モデリングをどのように進めるかを示す。
CrunchLLMは、ベンチャーキャピタルとイノベーション政策におけるデータ駆動意思決定のための方法論的枠組みと実践的ツールを提供する。
関連論文リスト
- A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Demystifying Domain-adaptive Post-training for Financial LLMs [79.581577578952]
FINDAPは、大規模言語モデル(LLM)のドメイン適応後学習に関する体系的できめ細かな研究である
このアプローチは、FinCap、FinRec、FinTrain、FinEvalの4つの重要なコンポーネントで構成されています。
結果として得られるモデルであるLlama-Finは、幅広い財務タスクで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-01-09T04:26:15Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Automating Venture Capital: Founder assessment using LLM-powered segmentation, feature engineering and automated labeling techniques [0.0]
本研究では、ベンチャーキャピタル(VC)意思決定における大規模言語モデル(LLM)の適用について検討する。
我々はLLMプロンプト技術を利用して、限られたデータから特徴を生成し、統計と機械学習を通して洞察を抽出する。
この結果から,特定の創始者特性と成功との関係が明らかとなり,予測におけるこれらの特性の有効性が示された。
論文 参考訳(メタデータ) (2024-07-05T22:54:13Z) - Hybrid LLM/Rule-based Approaches to Business Insights Generation from Structured Data [0.0]
広範囲で多様なデータセットから実行可能な洞察を抽出する能力は、情報的な意思決定と競合するエッジの維持に不可欠である。
従来のルールベースのシステムは信頼できるが、現代のビジネスデータの複雑さとダイナミズムに直面したとき、しばしば不足する。
本稿では,ルールベースシステムのロバスト性と大規模言語モデルの適応力を統合するハイブリッドアプローチの有効性について検討する。
論文 参考訳(メタデータ) (2024-04-24T02:42:24Z) - FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - Startup success prediction and VC portfolio simulation using CrunchBase
data [1.7897779505837144]
本稿では、主要な成功のマイルストーンを予測することを目的とした、シリーズBおよびシリーズCの投資ステージにおけるスタートアップに焦点を当てる。
スタートアップの成功を予測するための新しいディープラーニングモデルを導入し、資金調達指標、創業者の特徴、業界カテゴリなど、さまざまな要素を統合する。
私たちの研究は、スタートアップの成功を予測する上で、ディープラーニングモデルと代替の非構造化データによるかなりの可能性を実証しています。
論文 参考訳(メタデータ) (2023-09-27T10:22:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。