論文の概要: We need to talk about random seeds
- arxiv url: http://arxiv.org/abs/2210.13393v1
- Date: Mon, 24 Oct 2022 16:48:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 14:11:26.133461
- Title: We need to talk about random seeds
- Title(参考訳): ランダムな種について話す必要があります
- Authors: Steven Bethard
- Abstract要約: この意見は、ランダムな種子には安全な用途があると主張している。
ACLアンソロジーの85の最近の論文の分析によると、50%以上はランダム種子の危険な使用を含んでいる。
- 参考スコア(独自算出の注目度): 16.33770822558325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern neural network libraries all take as a hyperparameter a random seed,
typically used to determine the initial state of the model parameters. This
opinion piece argues that there are some safe uses for random seeds: as part of
the hyperparameter search to select a good model, creating an ensemble of
several models, or measuring the sensitivity of the training algorithm to the
random seed hyperparameter. It argues that some uses for random seeds are
risky: using a fixed random seed for "replicability" and varying only the
random seed to create score distributions for performance comparison. An
analysis of 85 recent publications from the ACL Anthology finds that more than
50% contain risky uses of random seeds.
- Abstract(参考訳): 現代のニューラルネットワークライブラリはすべて、モデルパラメータの初期状態を決定するために一般的に使用される、ランダムシードのハイパーパラメータである。
優れたモデルを選択するためのハイパーパラメータ探索の一部として、いくつかのモデルのアンサンブルを作成したり、ランダムなシードハイパーパラメータに対するトレーニングアルゴリズムの感度を測定したりする。
ランダムシードは「再現性」のために固定ランダムシードを使用し、パフォーマンス比較のためのスコア分布を作成するためにランダムシードのみを変化させる。
ACLアンソロジーの85の最近の論文の分析によると、50%以上がランダム種子の危険利用を含んでいる。
関連論文リスト
- Randomness control and reproducibility study of random forest algorithm in R and Python [0.0]
毒性学者に対する無作為林の眼耐性評価への統合戦略について論じる。
randomForestとRanger(Rパッケージ)の4つのパッケージを比較し、SKRangerパッケージを介してPythonで適応し、広く使われているScikit-LearnとRandomForestClassifier()関数を比較します。
論文 参考訳(メタデータ) (2024-08-22T07:59:49Z) - Measuring model variability using robust non-parametric testing [5.519968037738177]
この研究は、異なるランダムシードで訓練されたディープネットモデルと、予測されたモデルの振る舞いとの関係を記述しようとするものである。
本稿では,$alpha$-trimming($alpha$-trimming)レベルと呼ばれる,ネットワーク類似性に関する新しい要約統計法を提案する。
我々は、$alpha$-trimmingレベルが、バリデーションの正確性、チャーン、または単独でのキャリブレーションエラーなど、さまざまなパフォーマンス指標よりも表現力が高いことを示した。
論文 参考訳(メタデータ) (2024-06-12T15:08:15Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Randomness: what is it and why does it matter? [0.0]
広く受け入れられているランダム性の定義は科学的厳密さに欠けており、その結果は疑わしい。
本稿では,乱数生成自体の物理過程に着目した情報理論に基づくランダム性の定義を提案する。
ランダム性偏差」と呼ばれる新しい量により、乱数生成プロセスや装置の品質の実用的な測定が可能となる。
論文 参考訳(メタデータ) (2023-03-14T16:38:16Z) - Shortcomings of Top-Down Randomization-Based Sanity Checks for
Evaluations of Deep Neural Network Explanations [67.40641255908443]
モデルランダム化に基づく正当性チェックの限界を,説明書の評価のために同定する。
トップダウンモデルランダム化は、フォワードパスアクティベーションのスケールを高い確率で保存する。
論文 参考訳(メタデータ) (2022-11-22T18:52:38Z) - Testing randomness of series generated in Bell's experiment [62.997667081978825]
おもちゃの光ファイバーをベースとしたセットアップを用いてバイナリシリーズを生成し、そのランダム度をVilleの原理に従って評価する。
標準統計指標の電池、ハースト、コルモゴロフ複雑性、最小エントロピー、埋め込みのTakensarity次元、および拡張ディッキー・フラーとクワイアトコフスキー・フィリップス・シュミット・シン(英語版)でテストされ、ステーション指数をチェックする。
Toeplitz 抽出器を不規則級数に適用することにより得られる系列のランダム性のレベルは、非還元原料のレベルと区別できない。
論文 参考訳(メタデータ) (2022-08-31T17:39:29Z) - Algorithms for Adaptive Experiments that Trade-off Statistical Analysis
with Reward: Combining Uniform Random Assignment and Reward Maximization [50.725191156128645]
トンプソンサンプリングのようなマルチアームバンディットアルゴリズムは適応的な実験を行うのに利用できる。
統計的解析のための一様ランダム化の利点を組み合わせた2つのアルゴリズムを探索する2つのアーム実験のシミュレーションを提案する。
論文 参考訳(メタデータ) (2021-12-15T22:11:58Z) - Generation of 1 Gb full entropy random numbers with the enhanced-NRBG
method [0.13124513975412253]
量子エントロピー源と決定論的ランダムビット生成機構を用いた非決定論的ランダムビット生成の実験的検討
抽出した生乱数はさらに後処理され、ハッシュベースの決定論的乱数生成用高エントロピーシードを生成する。
論文 参考訳(メタデータ) (2021-08-09T20:06:43Z) - Modeling Sequences as Distributions with Uncertainty for Sequential
Recommendation [63.77513071533095]
既存のシーケンシャルメソッドの多くは、ユーザが決定論的であると仮定する。
項目-項目遷移は、いくつかの項目において著しく変動し、ユーザの興味のランダム性を示す。
本稿では,不確実性を逐次モデルに注入する分散型トランスフォーマーシークエンシャルレコメンデーション(DT4SR)を提案する。
論文 参考訳(メタデータ) (2021-06-11T04:35:21Z) - Improved device-independent randomness expansion rates using two sided
randomness [3.4376560669160394]
デバイスに依存しないランダム性拡張プロトコルは、初期乱数列を取り、より長い乱数列を生成することを目的としている。
両面のランダム性によって得られる改善の可能性を検討する。
また、入力ランダム性を再利用する修正プロトコルについても検討する。
論文 参考訳(メタデータ) (2021-03-12T19:49:17Z) - Generative Semantic Hashing Enhanced via Boltzmann Machines [61.688380278649056]
既存の生成ハッシュ法は、主に後部分布の分解形式を仮定する。
本稿では,ボルツマンマシンの分布を検索後部として利用することを提案する。
ハッシュコード内の異なるビット間の相関関係を効果的にモデル化することにより、我々のモデルは大幅な性能向上を達成できることを示す。
論文 参考訳(メタデータ) (2020-06-16T01:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。