論文の概要: Redeeming Data Science by Decision Modelling
- arxiv url: http://arxiv.org/abs/2307.00088v1
- Date: Fri, 30 Jun 2023 19:00:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 18:12:51.626852
- Title: Redeeming Data Science by Decision Modelling
- Title(参考訳): 決定モデルによるデータサイエンスの再検討
- Authors: John Mark Agosta and Robert Horton
- Abstract要約: 本稿では,従来の機械学習モデルと明示的な値モデルを組み合わせる方法を説明する。
具体的な例を示すために、モデルのROC曲線とユーティリティモデルを統合することで、これをどのように行うかを示します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: With the explosion of applications of Data Science, the field is has come
loose from its foundations. This article argues for a new program of applied
research in areas familiar to researchers in Bayesian methods in AI that are
needed to ground the practice of Data Science by borrowing from AI techniques
for model formulation that we term ``Decision Modelling.'' This article briefly
reviews the formulation process as building a causal graphical model, then
discusses the process in terms of six principles that comprise \emph{Decision
Quality}, a framework from the popular business literature. We claim that any
successful applied ML modelling effort must include these six principles.
We explain how Decision Modelling combines a conventional machine learning
model with an explicit value model. To give a specific example we show how this
is done by integrating a model's ROC curve with a utility model.
- Abstract(参考訳): データサイエンスの応用が爆発的に増えたことで、この分野は基礎から緩やかになった。
本稿では,「決定モデリング」と呼ぶモデル定式化のためのAI技術から借用することで,データサイエンスの実践を基礎にする必要がある,ベイズ的手法の研究者に親しむ領域における応用研究の新たなプログラムを提案する。
本稿は、図式化の過程を因果的グラフィカルモデルの構築として概観し、一般的なビジネス文献の枠組みである「emph{Decision Quality}」からなる6つの原則の観点で論じる。
適用可能なMLモデリングの取り組みには,これら6つの原則を含める必要がある,と私たちは主張する。
本稿では,従来の機械学習モデルと明示的な値モデルを組み合わせる方法を説明する。
具体的な例を示すために、モデルのROC曲線とユーティリティモデルを統合することで、これをどのように行うかを示す。
関連論文リスト
- Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities [89.40778301238642]
モデルマージは、機械学習コミュニティにおける効率的なエンパワーメント技術である。
これらの手法の体系的かつ徹底的なレビューに関する文献には大きなギャップがある。
論文 参考訳(メタデータ) (2024-08-14T16:58:48Z) - Learning-based Models for Vulnerability Detection: An Extensive Study [3.1317409221921144]
我々は、最先端の学習ベースアプローチの2つのタイプを広範かつ包括的に調査する。
本稿では,シーケンスベースモデルの優先度と,グラフベースモデルの限定能力について実験的に検証する。
論文 参考訳(メタデータ) (2024-08-14T13:01:30Z) - FIARSE: Model-Heterogeneous Federated Learning via Importance-Aware Submodel Extraction [26.26211464623954]
Federated Importance-Aware Submodel extract (FIARSE)は、モデルパラメータの重要性に基づいて、サブモデルを動的に調整する新しいアプローチである。
既存の研究と比較して,提案手法はサブモデル抽出の理論的基礎を提供する。
提案したFIARSEの優れた性能を示すため,様々なデータセットで大規模な実験を行った。
論文 参考訳(メタデータ) (2024-07-28T04:10:11Z) - A novel data generation scheme for surrogate modelling with deep
operator networks [0.0]
本稿では,DeepONetsのトレーニングデータ生成に伴う計算負担を軽減するための新しい手法を提案する。
既存の文献とは異なり、データ生成のためのフレームワークは偏微分方程式の統合戦略を一切用いない。
提案手法は、他の演算子学習手法にも拡張可能であり、そのアプローチを広く適用することができる。
論文 参考訳(メタデータ) (2024-02-24T14:42:42Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Model Provenance via Model DNA [23.885185988451667]
本稿では,機械学習モデルの特徴を表現した新しいモデルDNAについて紹介する。
本研究では,対象モデルの事前学習モデルであるかどうかを識別できるモデル証明同定のための効率的なフレームワークを開発する。
論文 参考訳(メタデータ) (2023-08-04T03:46:41Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.268245109828]
視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。
リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。
モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文 参考訳(メタデータ) (2022-02-22T02:33:54Z) - Kernel-Based Models for Influence Maximization on Graphs based on
Gaussian Process Variance Minimization [9.357483974291899]
グラフ上の新しい影響モデル(IM)の導入と検討を行う。
データ駆動アプローチは、このIMモデルの適切なカーネルを決定するために適用することができる。
この分野でコストのかかるモンテカルロシミュレーションに依存するモデルと比較して、我々のモデルはシンプルでコスト効率のよい更新戦略を可能にする。
論文 参考訳(メタデータ) (2021-03-02T08:55:34Z) - Model Reuse with Reduced Kernel Mean Embedding Specification [70.044322798187]
現在のアプリケーションで有用なモデルを見つけるための2段階のフレームワークを提案する。
アップロードフェーズでは、モデルがプールにアップロードされている場合、モデルの仕様としてカーネル平均埋め込み(RKME)を縮小する。
デプロイフェーズでは、RKME仕様の値に基づいて、現在のタスクと事前訓練されたモデルの関連性を測定する。
論文 参考訳(メタデータ) (2020-01-20T15:15:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。