Fugu-MT 論文翻訳(概要): Ridge Regularizaton: an Essential Concept in Data Science

論文の概要: Ridge Regularizaton: an Essential Concept in Data Science

arxiv url: http://arxiv.org/abs/2006.00371v1
Date: Sat, 30 May 2020 21:36:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-26 17:52:25.701006
Title: Ridge Regularizaton: an Essential Concept in Data Science
Title（参考訳）: ridge regularizaton: データサイエンスにおける必須概念
Authors: Trevor Hastie
Abstract要約: Ridgeまたはもっと正式に$ell$ regularizationは、統計学と機械学習の多くの分野に現れる。この短い尾根祭では、私の同僚と私が過去40年間、応用統計で遭遇したリッジの魔法と美しさをまとめました。
参考スコア（独自算出の注目度）: 91.3755431537592
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Ridge or more formally $\ell_2$ regularization shows up in many areas of statistics and machine learning. It is one of those essential devices that any good data scientist needs to master for their craft. In this brief ridge fest I have collected together some of the magic and beauty of ridge that my colleagues and I have encountered over the past 40 years in applied statistics.
Abstract（参考訳）: リッジまたは正式に$\ell_2$正規化は、統計学と機械学習の多くの分野に現れる。優れたデータサイエンティストが自分の技術のためにマスターする必要がある重要なデバイスのひとつです。この短いリッジフェストで、私は過去40年間にわたる応用統計で同僚と遭遇したリッジの魔法と美しさをいくつか集めました。

関連論文リスト

Extracting alignment data in open models [50.81383232591576]
訓練後モデルから大量のアライメントトレーニングデータを抽出できることが示唆された。このデータは、長期コンテキスト推論、安全性、命令追従、数学などの特定の機能を改善するためにモデルを操縦するのに有用である。 SFT や RL のような後トレーニングフェーズで使用されたトレーニングデータを,モデルが容易に再学習できることが判明した。
論文参考訳（メタデータ） (2025-10-21T12:06:00Z)
Kick Back & Relax++: Scaling Beyond Ground-Truth Depth with SlowTV & CribsTV [50.616892315086574]
本稿では,SlowTV と CribsTV の2つの新しいデータセットを提案する。これらは、一般公開されているYouTubeビデオから収集された大規模なデータセットで、合計200万のトレーニングフレームが含まれている。我々はこれらのデータセットを活用し、ゼロショット一般化の難しい課題に取り組む。
論文参考訳（メタデータ） (2024-03-03T17:29:03Z)
BridgeData V2: A Dataset for Robot Learning at Scale [73.86688388408021]
BridgeData V2は、ロボット操作行動の大規模で多様なデータセットである。対象は、24の環境にまたがる60,096個のトラジェクトリだ。
論文参考訳（メタデータ） (2023-08-24T17:41:20Z)
Generalization of Quantum Machine Learning Models Using Quantum Fisher Information Metric [0.0]
データ量子フィッシャー情報メートル法(DQFIM)を導入する。変分量子アルゴリズムのキャパシティは、変分アンサッツ、トレーニングデータ、およびそれらの対称性に依存する。リー代数を用いて、低数の訓練状態を用いて一般化する方法を説明する。最後に、異なるデータ分布からトレーニングデータとテストデータを描画するアウト・オブ・ディストリビューションの一般化が、同じ分布を使用するよりも優れていることを発見した。
論文参考訳（メタデータ） (2023-03-23T17:32:20Z)
Synthetic data enable experiments in atomistic machine learning [0.0]
既存のMLポテンシャルモデルから,原子単位のエネルギーをラベル付けした大規模データセットの使用を実演する。このプロセスの安価さは、量子力学の土台真実に比べれば、数百万のデータポイントを生成できる。合成データラベルの学習は、後続の小さなデータセットの微調整に有用な事前学習タスクであることを示す。
論文参考訳（メタデータ） (2022-11-29T18:17:24Z)
Constructing Effective Machine Learning Models for the Sciences: A Multidisciplinary Perspective [77.53142165205281]
線形回帰モデルに変数間の変換や相互作用を手動で追加することで、非線形解が必ずしも改善されないことを示す。データ駆動モデルを構築する前にこれを認識する方法や、そのような分析が本質的に解釈可能な回帰モデルへの移行にどのように役立つかについて議論する。
論文参考訳（メタデータ） (2022-11-21T17:48:44Z)
MRCLens: an MRC Dataset Bias Detection Toolkit [82.44296974850639]
MRCLensは,ユーザがフルモデルをトレーニングする前に,バイアスが存在するかどうかを検出するツールキットである。ツールキットの導入の便宜のために,MDCにおける共通バイアスの分類も提供する。
論文参考訳（メタデータ） (2022-07-18T21:05:39Z)
Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文参考訳（メタデータ） (2021-10-24T22:33:52Z)
A Reflection on Learning from Data: Epistemology Issues and Limitations [1.8047694351309205]
本稿では,データから得られた知識の問題点と限界について考察する。この論文は、一般的な数学的理論を用いてプロセスを記述する際の欠点について、いくつかの光を当てている。さらに、データから学ぶことに特化した理論の必要性を強調している。
論文参考訳（メタデータ） (2021-07-28T11:05:34Z)
Benign overfitting in ridge regression [0.0]
過度にパラメータ化されたリッジ回帰に対する漸近的でない一般化境界を提供する。最小あるいは負の正則化が小さい一般化誤差を得るのに十分であるかどうかを同定する。
論文参考訳（メタデータ） (2020-09-29T20:00:31Z)
Data science on industrial data -- Today's challenges in brown field applications [0.0]
本論文は,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。機械学習アプリケーションのデータ品質は、実験室を去ると問題になる。
論文参考訳（メタデータ） (2020-06-10T10:05:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。