論文の概要: Rethinking Symbolic Regression Datasets and Benchmarks for Scientific
Discovery
- arxiv url: http://arxiv.org/abs/2206.10540v1
- Date: Tue, 21 Jun 2022 17:15:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 15:24:55.843167
- Title: Rethinking Symbolic Regression Datasets and Benchmarks for Scientific
Discovery
- Title(参考訳): 記号回帰データセットの再考と科学的発見のためのベンチマーク
- Authors: Yoshitomo Matsubara, Naoya Chiba, Ryo Igarashi, Tatsunori Taniai,
Yoshitaka Ushiku
- Abstract要約: 本稿では,シンボリック回帰のデータセットと評価基準を再検討する。
我々は120個のデータセットを再生し、科学的な発見のための象徴的回帰のパフォーマンスについて議論する。
以上の結果から,我々はより現実的なパフォーマンス評価を行い,科学的発見のための新しい機械学習ベースのアプローチを開拓した。
- 参考スコア(独自算出の注目度): 20.635235839741508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper revisits datasets and evaluation criteria for Symbolic Regression,
a task of expressing given data using mathematical equations, specifically
focused on its potential for scientific discovery. Focused on a set of formulas
used in the existing datasets based on Feynman Lectures on Physics, we recreate
120 datasets to discuss the performance of symbolic regression for scientific
discovery (SRSD). For each of the 120 SRSD datasets, we carefully review the
properties of the formula and its variables to design reasonably realistic
sampling range of values so that our new SRSD datasets can be used for
evaluating the potential of SRSD such as whether or not an SR method con
(re)discover physical laws from such datasets. As an evaluation metric, we also
propose to use normalized edit distances between a predicted equation and the
ground-truth equation trees. While existing metrics are either binary or errors
between the target values and an SR model's predicted values for a given input,
normalized edit distances evaluate a sort of similarity between the
ground-truth and predicted equation trees. We have conducted experiments on our
new SRSD datasets using five state-of-the-art SR methods in SRBench and a
simple baseline based on a recent Transformer architecture. The results show
that we provide a more realistic performance evaluation and open up a new
machine learning-based approach for scientific discovery. Our datasets and code
repository are publicly available.
- Abstract(参考訳): 本稿では,数式を用いて与えられたデータを表現するための課題である記号回帰のデータセットと評価基準を再検討する。
feynman lectures on physicsに基づく既存のデータセットで使われる式セットに着目し,120のデータセットを再現し,srsd(symbolive regression for scientific discovery)の性能について検討した。
120個のSRSDデータセットのそれぞれに対して、この公式とその変数の特性を慎重にレビューし、合理的に現実的なサンプリング範囲を設計し、新しいSRSDデータセットを使用して、これらのデータセットからSRSD法が物理法則を(再)発見するか否か等、SRSDの可能性を評価する。
評価指標として,予測方程式と接地トラス方程式木の間の正規化編集距離を用いることを提案する。
既存のメトリクスは、与えられた入力に対する目標値とsrモデルの予測値の間の2値または誤差であるが、正規化された編集距離は、接地木と予測式木との類似性を評価する。
SRBenchにおける5つの最先端SR手法と,最近のTransformerアーキテクチャに基づくシンプルなベースラインを用いて,新しいSRSDデータセットの実験を行った。
その結果、我々はより現実的なパフォーマンス評価を提供し、科学的発見のための新しい機械学習ベースのアプローチを開拓した。
データセットとコードリポジトリは公開されています。
関連論文リスト
- Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model [66.91323540178739]
シークエンシャルレコメンデーション(SR)は、ユーザーが過去の行動に基づいて興味を持つかもしれない項目を予測することを目的としている。
我々はSRを新しい情報理論の観点から再検討し、逐次モデリング手法がユーザの行動のランダム性と予測不可能性を適切に把握できないことを発見した。
ファジィ情報処理理論に触発された本論文では,制限を克服し,ユーザの関心事の進化をよりよく捉えるために,ファジィなインタラクションシーケンスの組を導入する。
論文 参考訳(メタデータ) (2024-10-31T14:52:01Z) - Rethinking Image Super-Resolution from Training Data Perspectives [54.28824316574355]
画像超解像(SR)におけるトレーニングデータの効果について検討する。
そこで我々は,自動画像評価パイプラインを提案する。
その結果, (i) 圧縮アーチファクトの少ないデータセット, (ii) 被写体数によって判断される画像内多様性の高いデータセット, (iii) ImageNet や PASS からの大量の画像がSR性能に肯定的な影響を与えることがわかった。
論文 参考訳(メタデータ) (2024-09-01T16:25:04Z) - A Reproducible Analysis of Sequential Recommender Systems [13.987953631479662]
SequentialEnsurer Systems (SRS) はレコメンデーションシステムに対する高度に効率的なアプローチとして登場した。
既存の作品では、結果の複製性の欠点が示されており、論文間の矛盾した記述につながっている。
当社の作業は、データ前処理とモデル実装の標準化によって、これらのギャップを埋めます。
論文 参考訳(メタデータ) (2024-08-07T16:23:29Z) - Systematic Evaluation of Neural Retrieval Models on the Touché 2020 Argument Retrieval Subset of BEIR [99.13855300096925]
我々は、ニューラル検索モデルの潜在的な限界を探るため、Touch'e 2020データの研究を行っている。
私たちのブラックボックス評価は、短いパスを取得するためのニューラルネットワークの固有のバイアスを明らかにします。
Touch'eの短いパスの多くは議論の余地がなく、したがって関連性がないので、非常に短いパスを除外してTouch'e 2020のデータに注目する。
論文 参考訳(メタデータ) (2024-07-10T16:07:51Z) - Multi-View Symbolic Regression [1.2334534968968969]
複数のデータセットを同時に考慮したMvSR(Multi-View Symbolic Regression)を提案する。
MvSRは評価された式を各独立したデータセットに適合させ、パラメトリック関数のファミリーを返す。
我々は、既知の表現から生成されたデータと、天文学、化学、経済から得られた実世界のデータを用いて、MvSRの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-06T15:53:49Z) - A Transformer Model for Symbolic Regression towards Scientific Discovery [11.827358526480323]
記号回帰(SR)は、数値データセットを最もよく記述する数学的表現を探索する。
本稿では, シンボリック回帰に着目した新しいトランスフォーマーモデルを提案する。
我々は、正規化ツリーベース編集距離を用いて、最先端の結果を出力するSRSDデータセットにベストモデルを適用した。
論文 参考訳(メタデータ) (2023-12-07T06:27:48Z) - Soft Random Sampling: A Theoretical and Empirical Analysis [59.719035355483875]
ソフトランダムサンプリング(SRS)は、大量のデータを扱う際に、効率的なディープニューラルネットワークに対して単純だが効果的なアプローチである。
それは、各エポックに設定された各データセットから、ランダムに置換された均一な速度を選択する。
実世界の産業規模で重要な競争力を持つ、強力で競争力のある戦略であることが示されている。
論文 参考訳(メタデータ) (2023-11-21T17:03:21Z) - Active Learning in Symbolic Regression with Physical Constraints [0.4037357056611557]
進化的記号回帰(SR)は記号方程式をデータに適合させ、簡潔な解釈可能なモデルを与える。
本研究では,身体的制約のあるアクティブな学習環境において,どのデータを収集すべきかをSRを用いて提案する。
論文 参考訳(メタデータ) (2023-05-17T17:07:25Z) - GSR: A Generalized Symbolic Regression Approach [13.606672419862047]
本論文では, 一般化記号回帰について述べる。
GSR法は、よく知られたシンボリック回帰ベンチマーク問題セットにおいて、最先端のいくつかの手法よりも優れていることを示す。
既存のベンチマークと比較して、より困難な新しいSRベンチマークセットであるSymSetを導入することで、GSRの強みを強調します。
論文 参考訳(メタデータ) (2022-05-31T07:20:17Z) - Self-Supervised Neural Architecture Search for Imbalanced Datasets [129.3987858787811]
ニューラルアーキテクチャサーチ(NAS)は、アノテートラベル付きよく計算されたデータセットでトレーニングされた場合、最先端の結果を提供する。
a) アーキテクチャを決定するためにラベルを必要とせず、(b) データセットが不均衡であると仮定する自己管理シナリオに焦点を当てたNASベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-17T14:56:36Z) - Dynamic Refinement Network for Oriented and Densely Packed Object
Detection [75.29088991850958]
本稿では,機能選択モジュール (FSM) と動的改善ヘッド (DRH) の2つの新しいコンポーネントからなる動的精細化ネットワークを提案する。
我々のFSMは、ニューロンがターゲットオブジェクトの形状や向きに応じて受容野を調整できるのに対して、DRHはオブジェクト認識の方法で動的に予測を洗練させる。
我々は、DOTA、HRSC2016、SKU110K、および我々のSKU110K-Rデータセットを含むいくつかの公開ベンチマークで定量的評価を行う。
論文 参考訳(メタデータ) (2020-05-20T11:35:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。