論文の概要: Active Learning in Genetic Programming: Guiding Efficient Data
Collection for Symbolic Regression
- arxiv url: http://arxiv.org/abs/2308.00672v1
- Date: Mon, 31 Jul 2023 14:37:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 13:35:08.029783
- Title: Active Learning in Genetic Programming: Guiding Efficient Data
Collection for Symbolic Regression
- Title(参考訳): 遺伝的プログラミングにおけるアクティブラーニング:シンボリック回帰のための効率的なデータ収集
- Authors: Nathan Haut, Wolfgang Banzhaf, and Bill Punch
- Abstract要約: 本稿では,遺伝的プログラミングにおける能動的学習のための不確実性と多様性の計算方法について検討する。
遺伝的プログラミングにおけるモデル個体群は、不確実性指標と組み合わせたモデルアンサンブルを用いて、情報的訓練データポイントを選択するために利用することができることがわかった。
- 参考スコア(独自算出の注目度): 2.4633342801625213
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper examines various methods of computing uncertainty and diversity
for active learning in genetic programming. We found that the model population
in genetic programming can be exploited to select informative training data
points by using a model ensemble combined with an uncertainty metric. We
explored several uncertainty metrics and found that differential entropy
performed the best. We also compared two data diversity metrics and found that
correlation as a diversity metric performs better than minimum Euclidean
distance, although there are some drawbacks that prevent correlation from being
used on all problems. Finally, we combined uncertainty and diversity using a
Pareto optimization approach to allow both to be considered in a balanced way
to guide the selection of informative and unique data points for training.
- Abstract(参考訳): 本稿では,遺伝的プログラミングにおけるアクティブラーニングのための不確実性と多様性の計算手法について検討する。
遺伝的プログラミングにおけるモデル集団は,不確実性メトリクスと組み合わされたモデルアンサンブルを用いて,有益なトレーニングデータポイントを選択できることがわかった。
我々はいくつかの不確かさの指標を調査し、微分エントロピーが最良の結果を示した。
また, 2 つのデータ多様性指標を比較し, 多様性指標としての相関関係は, 極小ユークリッド距離よりも優れていることを見出した。
最後に、Pareto最適化アプローチを用いて不確実性と多様性を組み合わせ、両者をバランスの取れた方法で考慮し、トレーニングのための情報およびユニークなデータポイントの選択を導く。
関連論文リスト
- Collaborative Heterogeneous Causal Inference Beyond Meta-analysis [68.4474531911361]
異種データを用いた因果推論のための協調的逆確率スコア推定器を提案する。
異質性の増加に伴うメタアナリシスに基づく手法に対して,本手法は有意な改善を示した。
論文 参考訳(メタデータ) (2024-04-24T09:04:36Z) - Globally-Optimal Greedy Experiment Selection for Active Sequential
Estimation [1.1530723302736279]
逐次的に収集したデータの実験を適応的に選択するアクティブシーケンシャル推定の問題について検討する。
目標は、より正確なモデル推定のための実験選択ルールを設計することである。
そこで本稿では,グリーディ実験の選択手法のクラスを提案し,最大可能性の統計的解析を行う。
論文 参考訳(メタデータ) (2024-02-13T17:09:29Z) - Deep Negative Correlation Classification [82.45045814842595]
既存のディープアンサンブル手法は、多くの異なるモデルをナビゲートし、予測を集約する。
深部負相関分類(DNCC)を提案する。
DNCCは、個々の推定器が正確かつ負の相関を持つ深い分類アンサンブルを生成する。
論文 参考訳(メタデータ) (2022-12-14T07:35:20Z) - Selective Inference for Sparse Multitask Regression with Applications in
Neuroimaging [2.611153304251067]
本稿では、ニューロイメージングにおける一般的なマルチタスク問題に対処するための選択推論フレームワークを提案する。
我々のフレームワークは、選択イベントの洗練に基づいて、新しい推論条件を提供する。
我々は,選択推論を用いたマルチタスク学習により,単一タスク法よりも真の信号をより正確に復元できることをシミュレーションにより示す。
論文 参考訳(メタデータ) (2022-05-27T20:21:20Z) - Fair Feature Subset Selection using Multiobjective Genetic Algorithm [0.0]
フェアネスと精度を両立させる特徴部分選択手法を提案する。
モデル性能の指標としてF1-Scoreを用いる。
最も一般的なフェアネスベンチマークデータセットの実験では、進化的アルゴリズムを用いることで、フェアネスと精度のトレードオフを効果的に探索できることが示されている。
論文 参考訳(メタデータ) (2022-04-30T22:51:19Z) - Data-heterogeneity-aware Mixing for Decentralized Learning [63.83913592085953]
グラフの混合重みとノード間のデータ不均一性の関係に収束の依存性を特徴付ける。
グラフが現在の勾配を混合する能力を定量化する計量法を提案する。
そこで本研究では,パラメータを周期的かつ効率的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T15:54:35Z) - Non-IID data and Continual Learning processes in Federated Learning: A
long road ahead [58.720142291102135]
フェデレートラーニング(Federated Learning)は、複数のデバイスや機関が、データをプライベートに保存しながら、機械学習モデルを協調的にトレーニングすることを可能にする、新しいフレームワークである。
本研究では,データの統計的不均一性を正式に分類し,それに直面することのできる最も顕著な学習戦略をレビューする。
同時に、継続学習のような他の機械学習フレームワークからのアプローチを導入し、データの不均一性にも対処し、フェデレートラーニング設定に容易に適応できるようにします。
論文 参考訳(メタデータ) (2021-11-26T09:57:11Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Latent Network Estimation and Variable Selection for Compositional Data
via Variational EM [0.0]
ネットワークの相互作用と関連性を同時に推定する新しい手法を開発した。
マイクロバイオームデータへの応用を通して,本モデルの実用性を示す。
論文 参考訳(メタデータ) (2020-10-25T21:52:39Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。