論文の概要: Debugging Machine Learning Pipelines
- arxiv url: http://arxiv.org/abs/2002.04640v1
- Date: Tue, 11 Feb 2020 19:13:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 01:53:48.947551
- Title: Debugging Machine Learning Pipelines
- Title(参考訳): 機械学習パイプラインのデバッグ
- Authors: Raoni Louren\c{c}o and Juliana Freire and Dennis Shasha
- Abstract要約: 失敗と予期せぬ行動の根本原因を推測することは難しい。
そこで本研究では,失敗の原因を自動的に推測し,失敗の簡潔な説明を導き出すために,反復と証明を利用した新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 11.696401543261892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning tasks entail the use of complex computational pipelines to
reach quantitative and qualitative conclusions. If some of the activities in a
pipeline produce erroneous or uninformative outputs, the pipeline may fail or
produce incorrect results. Inferring the root cause of failures and unexpected
behavior is challenging, usually requiring much human thought, and is both
time-consuming and error-prone. We propose a new approach that makes use of
iteration and provenance to automatically infer the root causes and derive
succinct explanations of failures. Through a detailed experimental evaluation,
we assess the cost, precision, and recall of our approach compared to the state
of the art. Our source code and experimental data will be available for
reproducibility and enhancement.
- Abstract(参考訳): 機械学習タスクは、量的および質的な結論に達するために複雑な計算パイプラインを使用する。
パイプライン内のアクティビティのいくつかが誤ったアウトプットを生成する場合、パイプラインは失敗するか、誤った結果を生み出す可能性がある。
失敗と予期せぬ行動の根本原因を推測することは困難であり、通常は多くの人間の思考を必要とする。
そこで本研究では,失敗の原因を自動的に推測し,失敗の簡潔な説明を導出する手法を提案する。
詳細な実験評価を通じて,我々のアプローチのコスト,精度,リコールを,最先端技術と比較して評価した。
ソースコードと実験データは再現性と拡張のために利用できます。
関連論文リスト
- Generalization Error in Quantum Machine Learning in the Presence of Sampling Noise [0.8532753451809455]
Eigentask Learningは、出力サンプリングノイズの存在下で無限入力トレーニングデータで学習するフレームワークである。
入力トレーニングデータセットと出力計測サンプリングショットの両方が有限である場合、汎用量子機械学習システムのトレーニングおよび一般化誤差を算出する。
論文 参考訳(メタデータ) (2024-10-18T17:48:24Z) - Quantum Internet: Resource Estimation for Entanglement Routing [0.0]
量子ネットワークにおける絡み合いのルーティングに必要な物理資源を推定する問題を考察する。
精製プロセスにおける実験誤差を考慮に入れた新しい方法を提案する。
この近似は広い範囲の誤差に対して合理的に有効であることを示す。
論文 参考訳(メタデータ) (2024-10-14T13:50:39Z) - When in Doubt, Cascade: Towards Building Efficient and Capable Guardrails [19.80434777786657]
ターゲットデータとラベルデータを生成する合成パイプラインを開発した。
提案手法は,計算コストのごく一部で競争性能を達成できることを示す。
論文 参考訳(メタデータ) (2024-07-08T18:39:06Z) - Predicting Probabilities of Error to Combine Quantization and Early Exiting: QuEE [68.6018458996143]
本稿では,量子化と早期出口動的ネットワークを組み合わせたより一般的な動的ネットワークQuEEを提案する。
我々のアルゴリズムは、ソフトアーリーエグジットや入力依存圧縮の一形態と見なすことができる。
提案手法の重要な要素は、さらなる計算によって実現可能な潜在的な精度向上の正確な予測である。
論文 参考訳(メタデータ) (2024-06-20T15:25:13Z) - DeepFunction: Deep Metric Learning-based Imbalanced Classification for Diagnosing Threaded Pipe Connection Defects using Functional Data [6.688305507010403]
現代の製造業では、ほとんどの製品ラインが適合しており、非コンフォーミングであるが欠陥タイプが異なる製品はほとんどない。
欠陥型の同定は、生産ラインのさらなる根本原因診断に役立つ。
関数型データを用いたディープメトリック学習に基づく革新的な分類フレームワークを提案する(DeepFunction)。
論文 参考訳(メタデータ) (2024-04-04T09:55:11Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - R-Tuning: Instructing Large Language Models to Say `I Don't Know' [66.11375475253007]
大きな言語モデル(LLM)は、優れたパフォーマンスで多くのドメインに革命をもたらしたが、それでもその課題に直面している。
事前の指導チューニング方法は、モデルが知識を知っているかどうかに関わらず、モデルに文章を完成させるよう強制する。
我々はRefusal-Aware Instruction Tuning (R-Tuning)と呼ばれる新しいアプローチを提案する。
実験の結果、R-Tuningは、既知の質問に答えたり、未知の質問に答えるのを控えるモデルの能力を効果的に改善することを示した。
論文 参考訳(メタデータ) (2023-11-16T08:45:44Z) - Doubly Robust Proximal Causal Learning for Continuous Treatments [56.05592840537398]
本稿では,カーネルベースの2倍頑健な因果学習推定器を提案する。
オラクル形式は影響関数の一貫した近似であることを示す。
次に、平均二乗誤差の観点から総合収束解析を行う。
論文 参考訳(メタデータ) (2023-09-22T12:18:53Z) - Task-specific experimental design for treatment effect estimation [59.879567967089145]
因果推論の標準は大規模ランダム化試験(RCT)である。
近年の研究では、RCTのよりサンプル効率の良い代替案が提案されているが、これらは因果効果を求める下流の応用には適用できない。
実験的な設計のためのタスク固有のアプローチを開発し、特定の下流アプリケーションにカスタマイズされたサンプリング戦略を導出する。
論文 参考訳(メタデータ) (2023-06-08T18:10:37Z) - Deep Learning based pipeline for anomaly detection and quality
enhancement in industrial binder jetting processes [68.8204255655161]
異常検出は、通常の値空間とは異なる異常状態、インスタンス、あるいはデータポイントを検出する方法を記述する。
本稿では,産業生産における人工知能へのデータ中心のアプローチに寄与する。
論文 参考訳(メタデータ) (2022-09-21T08:14:34Z) - A Survey on Extraction of Causal Relations from Natural Language Text [9.317718453037667]
因果関係はテキストに頻繁に現れ、テキストから因果関係を計算することで、予測タスクのための因果関係を構築するのに役立つ。
既存の因果抽出技術には、知識ベース、統計機械学習(ML)ベース、深層学習ベースアプローチなどがある。
論文 参考訳(メタデータ) (2021-01-16T10:49:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。