論文の概要: A Guide to Reproducible Research in Signal Processing and Machine
Learning
- arxiv url: http://arxiv.org/abs/2108.12383v1
- Date: Fri, 27 Aug 2021 16:42:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-30 14:02:56.960198
- Title: A Guide to Reproducible Research in Signal Processing and Machine
Learning
- Title(参考訳): 信号処理と機械学習における再現可能な研究ガイド
- Authors: Joseph Shenouda and Waheed U. Bajwa
- Abstract要約: 2016年にNature誌が行った調査によると、研究者の50%が自身の実験を再現できなかった。
我々は,再現可能な計算実験を生成する上での障害の多くを軽減するための,実用的なツールと戦略のセットを,信号処理研究者に提供することを目的とする。
- 参考スコア(独自算出の注目度): 9.69596041242667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reproducibility is a growing problem that has been extensively studied among
computational researchers and within the signal processing and machine learning
research community. However, with the changing landscape of signal processing
and machine learning research come new obstacles and unseen challenges in
creating reproducible experiments. Due to these new challenges most experiments
have become difficult, if not impossible, to be reproduced by an independent
researcher. In 2016 a survey conducted by the journal Nature found that 50% of
researchers were unable to reproduce their own experiments. While the issue of
reproducibility has been discussed in the literature and specifically within
the signal processing community, it is still unclear to most researchers what
are the best practices to ensure reproducibility without impinging on their
primary responsibility of conducting research. We feel that although
researchers understand the importance of making experiments reproducible, the
lack of a clear set of standards and tools makes it difficult to incorporate
good reproducibility practices in most labs. It is in this regard that we aim
to present signal processing researchers with a set of practical tools and
strategies that can help mitigate many of the obstacles to producing
reproducible computational experiments.
- Abstract(参考訳): 再現性は、計算研究者と信号処理と機械学習研究コミュニティの間で広く研究されている、増大する問題である。
しかし、信号処理と機械学習の研究の状況が変化し、再現可能な実験を作成する上で新たな障害と目に見えない課題が生まれる。
これらの新たな課題により、ほとんどの実験は、不可能ではないにせよ、独立した研究者によって再現されることが困難になっている。
2016年にNature誌が行った調査によると、研究者の50%が自身の実験を再現できなかった。
再現性に関する問題は文献、特にシグナル処理コミュニティ内で議論されているが、ほとんどの研究者にとって、研究の第一の責任を伴わずに再現性を確保するためのベストプラクティスは、いまだに不明である。
研究者は実験を再現可能であることの重要性を理解しているが、明確な標準とツールが欠如しているため、ほとんどの研究室で優れた再現性プラクティスを組み込むことは困難であると感じている。
我々は,信号処理研究者に対して,再現可能な計算実験を行う上で,多くの障害を軽減するための実用的なツールと戦略を提示することを目的としている。
関連論文リスト
- DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents [49.74065769505137]
本研究では,新しい科学的発見の完全なサイクルを実行するエージェントの能力を開発し,ベンチマークする最初の仮想環境であるDiscoVERYWORLDを紹介する。
8つのトピックにまたがる120の異なる課題タスクが含まれており、3レベルの難易度といくつかのパラメトリックなバリエーションがある。
従来の環境においてよく機能する強力なベースラインエージェントが、ほとんどのdiscoVERYWORLDタスクに苦労していることがわかった。
論文 参考訳(メタデータ) (2024-06-10T20:08:44Z) - Design Principles for Falsifiable, Replicable and Reproducible Empirical ML Research [2.3265565167163906]
実証的研究は、機械学習領域において基本的な役割を担っている。
本稿では,実証研究の妥当性を維持するためのガイドラインを伴って,実証研究プロセスのモデルを提案する。
論文 参考訳(メタデータ) (2024-05-28T11:37:59Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Reproducibility and Geometric Intrinsic Dimensionality: An Investigation on Graph Neural Network Research [0.0]
これらの努力に基づいて構築することは、マシンラーニングにおけるもうひとつの重要な課題、すなわち次元の呪いに向かっています。
本研究は,機械学習モデルが学習対象のデータセットの拡張次元にどのような影響を受けているのかを,本質的な次元の密接な関連概念を用いて検討する。
論文 参考訳(メタデータ) (2024-03-13T11:44:30Z) - MLXP: A Framework for Conducting Replicable Experiments in Python [63.37350735954699]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文 参考訳(メタデータ) (2024-02-21T14:22:20Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - PyExperimenter: Easily distribute experiments and track results [63.871474825689134]
PyExperimenterは、アルゴリズムの実験的な研究結果のセットアップ、ドキュメンテーション、実行、およびその後の評価を容易にするツールである。
人工知能の分野で研究者が使用することを意図しているが、それらに限定されていない。
論文 参考訳(メタデータ) (2023-01-16T10:43:02Z) - Sources of Irreproducibility in Machine Learning: A Review [3.905855359082687]
実験設計の選択と結論に対する潜在的な影響を関連付ける理論的枠組みは存在しない。
本研究の目的は、応用データサイエンスの実践者や研究者が、どのような設計選択が誤った発見につながるかを理解するためのフレームワークを開発することである。
論文 参考訳(メタデータ) (2022-04-15T18:26:03Z) - A user-centered approach to designing an experimental laboratory data
platform [0.0]
実験的なデータプラットフォームにおいて、設計と機能の本質的な要素が何を求めているのかを理解するために、ユーザ中心のアプローチを採用しています。
リッチで複雑な実験データセットをコンテキスト化できる能力を持つことが、ユーザの主な要件であることに気付きました。
論文 参考訳(メタデータ) (2020-07-28T19:26:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。