Fugu-MT 論文翻訳(概要): Calibrating dimension reduction hyperparameters in the presence of noise

論文の概要: Calibrating dimension reduction hyperparameters in the presence of noise

arxiv url: http://arxiv.org/abs/2312.02946v3
Date: Tue, 30 Jan 2024 20:50:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-01 17:17:12.099288
Title: Calibrating dimension reduction hyperparameters in the presence of noise
Title（参考訳）: 騒音下における次元低減ハイパーパラメータの校正
Authors: Justin Lin and Julia Fukuyama
Abstract要約: 本稿では,ノイズの存在下での次元減少問題をモデル化する枠組みを提案する。難易度に対する事前の推奨値を示し、隣人の数は小さすぎ、騒音が過度に収まる傾向にある。
参考スコア（独自算出の注目度）: 0.4895118383237099
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The goal of dimension reduction tools is to construct a low-dimensional representation of high-dimensional data. These tools are employed for a variety of reasons such as noise reduction, visualization, and to lower computational costs. However, there is a fundamental issue that is highly discussed in other modeling problems, but almost entirely ignored in the dimension reduction literature: overfitting. If we interpret data as a combination of signal and noise, prior works judge dimension reduction techniques on their ability to capture the entirety of the data, i.e. both the signal and the noise. In the context of other modeling problems, techniques such as feature-selection, cross-validation, and regularization are employed to combat overfitting, but no such precautions are taken when performing dimension reduction. In this paper, we present a framework that models dimension reduction problems in the presence of noise and use this framework to explore the role perplexity and number of neighbors play in overfitting data when applying t-SNE and UMAP. More specifically, we show previously recommended values for perplexity and number of neighbors are too small and tend to overfit the noise. We also present a workflow others may use to calibrate hyperparameters in the presence of noise.
Abstract（参考訳）: 次元削減ツールの目的は、高次元データの低次元表現を構築することである。これらのツールは、ノイズ低減、可視化、計算コストの削減など、様々な理由で使用されている。しかし、他のモデリング問題でよく議論されている基本的な問題があるが、次元減少の文献ではほとんど完全に無視されている。信号とノイズの組み合わせとしてデータを解釈する場合、先行研究は、データ全体、すなわち信号とノイズの両方をキャプチャする能力について、次元の縮小テクニックを判断する。他のモデリング問題の文脈では、オーバーフィッティングと戦うために特徴選択、クロスバリデーション、正規化といった手法が用いられるが、次元縮小を行う際にはそのような予防措置は取らない。本稿では,ノイズの存在下での次元減少問題をモデル化し,t-SNE と UMAP を適用した場合,近隣住民の役割の複雑度と多様さを探索する枠組みを提案する。より具体的には、以前推奨されたパープレキシティの値を示し、隣人の数は小さすぎ、ノイズに過度に適合する傾向がある。また、ノイズの存在下でハイパーパラメータを校正するワークフローも提示する。

関連論文リスト

Enhancing Post-Training Quantization via Future Activation Awareness [84.76726857601753]
ポストトレーニング量子化(PTQ)は、大規模言語モデル(LLM)を微調整なしで圧縮する方法として広く用いられている。本稿では、将来の層活性化を利用して量子化を導出するFuture-Aware Quantization (FAQ)を提案する。 FAQは、後方パス、データ再構成、チューニングを必要とせず、無視できる余分なコストで、従来手法よりも一貫してパフォーマンスを向上する。
論文参考訳（メタデータ） (2026-01-28T12:03:30Z)
Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文参考訳（メタデータ） (2026-01-02T09:16:55Z)
Addressing prior dependence in hierarchical Bayesian modeling for PTA data analysis II: Noise and SGWB inference through parameter decorrelation [0.0]
PTA解析は、各パルサーに固定された均一ノイズを割り当てる。ノイズ先行を高次ハイパーパラメータでパラメータ化する階層的ベイズモデリング戦略を採用する。階層的処理によりノイズパラメータがより厳密に制約され,レッドノイズSGWB縮退が部分的に緩和されることが示唆された。
論文参考訳（メタデータ） (2025-11-03T17:54:55Z)
One-step Noisy Label Mitigation [86.57572253460125]
ノイズラベルのトレーニング過程に対する有害な影響の軽減がますます重要になっている。モデルに依存しないノイズラベル緩和パラダイムである1ステップアンチノイズ(OSA)を提案する。我々はOSAの優位性を実証的に実証し、トレーニングの堅牢性の向上、タスク転送性の向上、デプロイメントの容易性、計算コストの削減を強調した。
論文参考訳（メタデータ） (2024-10-02T18:42:56Z)
SMILE: Zero-Shot Sparse Mixture of Low-Rank Experts Construction From Pre-Trained Foundation Models [85.67096251281191]
我々は、ゼロショットスパースミクチャー(SMILE)と呼ばれるモデル融合に対する革新的なアプローチを提案する。 SMILEは、余分なデータやさらなるトレーニングなしに、ソースモデルをMoEモデルにアップスケーリングできる。画像分類やテキスト生成タスクなど,さまざまなシナリオに対して,フル微調整とLoRA微調整を用いて広範な実験を行う。
論文参考訳（メタデータ） (2024-08-19T17:32:15Z)
Robust shallow shadows [0.251657752676152]
浅層計測回路の幅広いクラスを対象としたロバストなシャドウ推定プロトコルを提案する。テンソルネットワークツールを用いて実験データから直接推定する方法を示す。提案手法は,現在および近時雑音量子デバイスの実用的制約の下で,大域回転による影推定の可能性の最大化を実現する。
論文参考訳（メタデータ） (2024-05-09T18:00:09Z)
Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文参考訳（メタデータ） (2024-03-11T16:22:41Z)
A Metaheuristic for Amortized Search in High-Dimensional Parameter Spaces [0.0]
本稿では,特徴インフォームド変換から次元還元を実現するメタヒューリスティックを提案する。 DR-FFITは、高次元空間における勾配自由パラメータ探索を容易にする効率的なサンプリング戦略を実装している。実験データから,DR-FFITは,確立したメタヒューリスティックスに対するランダム検索とシミュレート・アニーリングの性能を向上させることが示された。
論文参考訳（メタデータ） (2023-09-28T14:25:14Z)
Label Noise: Correcting the Forward-Correction [0.0]
ラベルノイズのあるデータセット上でニューラルネットワーク分類器を訓練することは、ノイズのあるラベルに過度に適合するリスクをもたらす。ラベルノイズによる過度適合に対処する手法を提案する。本研究は, オーバーフィッティングを緩和するために, トレーニング損失に低い限界を課すことを提案する。
論文参考訳（メタデータ） (2023-07-24T19:41:19Z)
Improve Noise Tolerance of Robust Loss via Noise-Awareness [60.34670515595074]
本稿では,NARL-Adjuster(NARL-Adjuster for brevity)と呼ばれる,ハイパーパラメータ予測関数を適応的に学習するメタラーニング手法を提案する。 4つのSOTAロバストな損失関数を我々のアルゴリズムに統合し,提案手法の一般性および性能をノイズ耐性と性能の両面で検証した。
論文参考訳（メタデータ） (2023-01-18T04:54:58Z)
Improving the Robustness of Summarization Models by Detecting and Removing Input Noise [50.27105057899601]
本研究では,様々な種類の入力ノイズから,様々なデータセットやモデルサイズに対する性能損失を定量化する大規模な実験的検討を行った。本稿では,モデル推論中の入力中のそのようなノイズを検出し,除去するための軽量な手法を提案する。
論文参考訳（メタデータ） (2022-12-20T00:33:11Z)
Bayesian NVH metamodels to assess interior cabin noise using measurement databases [0.0]
本研究では,空力やローリングノイズなどのブロードバンドノイズに対するグローバルなNVHメタモデリング手法を提案する。ブートストラップとガウス基底関数を持つ一般化加法モデル(GAM)を用いて、予測変数に対する音圧レベル(SPL)の依存性をモデル化する。確率モデリングは、オープンソースのライブラリPyMC3を用いて行われる。
論文参考訳（メタデータ） (2022-06-12T19:48:24Z)
Hierarchical model reduction driven by machine learning for parametric advection-diffusion-reaction problems in the presence of noisy data [0.0]
本稿では,雑音データの存在下でのパラメトリック楕円問題に対する信頼度低減モデルを生成するための新しい手法を提案する。ノイズの影響を受ければ,方向方向のHiPODの精度が低下することを示す。我々は、無関係なノイズからデータ中の関連する物理的特徴をよりよく識別する機械学習フィッティングモデルに取って代わる。
論文参考訳（メタデータ） (2022-04-01T16:02:05Z)
Shape Matters: Understanding the Implicit Bias of the Noise Covariance [76.54300276636982]
勾配降下のノイズはパラメータ化モデルに対するトレーニングにおいて重要な暗黙の正則化効果をもたらす。ミニバッチやラベルの摂動によって引き起こされるパラメータ依存ノイズはガウスノイズよりもはるかに効果的であることを示す。分析の結果,パラメータ依存ノイズは局所最小値に偏りを生じさせるが,球状ガウス雑音は生じないことがわかった。
論文参考訳（メタデータ） (2020-06-15T18:31:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。