論文の概要: Managing Data Lineage of O&G Machine Learning Models: The Sweet Spot for
Shale Use Case
- arxiv url: http://arxiv.org/abs/2003.04915v1
- Date: Tue, 10 Mar 2020 18:10:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 21:56:05.233425
- Title: Managing Data Lineage of O&G Machine Learning Models: The Sweet Spot for
Shale Use Case
- Title(参考訳): O&G機械学習モデルのデータリニアジ管理:シェールユースケースのためのスイートスポット
- Authors: Raphael Thiago, Renan Souza, L. Azevedo, E. Soares, Rodrigo Santos,
Wallas Santos, Max De Bayser, M. Cardoso, M. Moreno, and Renato Cerqueira
- Abstract要約: 機械学習のライフサイクルに利益をもたらすために、データの系統をどのように活用できるかについて議論する。
これは石油・ガス産業における主要な応用である。
- 参考スコア(独自算出の注目度): 1.366942647553326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine Learning (ML) has increased its role, becoming essential in several
industries. However, questions around training data lineage, such as "where has
the dataset used to train this model come from?"; the introduction of several
new data protection legislation; and, the need for data governance
requirements, have hindered the adoption of ML models in the real world. In
this paper, we discuss how data lineage can be leveraged to benefit the ML
lifecycle to build ML models to discover sweet-spots for shale oil and gas
production, a major application in the Oil and Gas O&G Industry.
- Abstract(参考訳): 機械学習(ML)は、いくつかの業界で欠かせない役割を担っている。
しかしながら、"このモデルをトレーニングするために使用されるデータセットはどこから来たのか?"、いくつかの新しいデータ保護法の導入、データガバナンス要件の必要性など、データ系統のトレーニングに関する疑問は、現実の世界におけるMLモデルの採用を妨げている。
本稿では,シェールオイルとガス生産のためのスイートスポットを発見するためのMLモデルを構築するために,MLライフサイクルの恩恵を受けるために,データ系統をどのように活用できるかを論じる。
関連論文リスト
- Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and
Challenges [49.039080454730566]
データ拡張(DA)は、モデルパフォーマンスを向上させるための重要なテクニックとして現れている。
本稿では,大規模言語モデル(LLM)がDAに与える影響について検討する。
論文 参考訳(メタデータ) (2024-03-05T14:11:54Z) - Large Language Models for Data Annotation: A Survey [58.454724454158814]
LLM(Advanced Large Language Models)の出現は、データアノテーションのプロセスに革命を起こし、自動化する前例のない機会を提供する。
この調査は、LLMベースのデータ、LLM生成アノテーションの評価、LLM生成アノテーションによる学習の3つの中核的な側面に貢献する。
重要なガイドとして、この調査は、研究者や実践者がデータアノテーションのための最新のLCMの可能性を探究することを目的としている。
論文 参考訳(メタデータ) (2024-02-21T00:44:04Z) - Curated LLM: Synergy of LLMs and Data Curation for tabular augmentation
in ultra low-data regimes [62.94611066903098]
本稿では,Large Language Models (LLMs) の知識を低データ構造におけるデータ拡張に活用したCLLMを紹介する。
従来のジェネレータと比較して,低データ方式におけるCLLMの優れた性能を示す。
論文 参考訳(メタデータ) (2023-12-19T12:34:46Z) - A Data-Centric Online Market for Machine Learning: From Discovery to
Pricing [36.01287194385664]
本稿では,機械学習のためのデータ中心市場を設計する上での2つの課題に対処する新しい手法を提案する。
数千のデータセットのプールから任意のMLタスクの有用なデータを自動的に検出するアルゴリズムを設計する。
また、データ拡張MLモデルを販売するための新しい価格体系を設計する。
論文 参考訳(メタデータ) (2023-10-27T01:49:13Z) - Learn to Unlearn: A Survey on Machine Unlearning [29.077334665555316]
本稿では,最近の機械学習技術,検証機構,潜在的攻撃について概説する。
新たな課題と今後の研究方向性を強調します。
本稿では、プライバシ、エクイティ、レジリエンスをMLシステムに統合するための貴重なリソースの提供を目的としている。
論文 参考訳(メタデータ) (2023-05-12T14:28:02Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - SimbaML: Connecting Mechanistic Models and Machine Learning with
Augmented Data [0.0]
SimbaMLは、通常の微分方程式に基づくモデルからリアルな合成データセットを生成するオープンソースツールである。
SimbaMLは、合成データから実世界のデータへの変換学習を便利に調査することができる。
論文 参考訳(メタデータ) (2023-04-08T12:50:50Z) - AI Model Disgorgement: Methods and Choices [127.54319351058167]
本稿では,現代の機械学習システムに適用可能な分類法を紹介する。
学習モデルにおけるデータ「効果の除去」の意味を,スクラッチからリトレーニングする必要のない方法で検討する。
論文 参考訳(メタデータ) (2023-04-07T08:50:18Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。