論文の概要: Sym-Q: Adaptive Symbolic Regression via Sequential Decision-Making
- arxiv url: http://arxiv.org/abs/2402.05306v1
- Date: Wed, 7 Feb 2024 22:53:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 17:12:44.474620
- Title: Sym-Q: Adaptive Symbolic Regression via Sequential Decision-Making
- Title(参考訳): Sym-Q: 逐次決定処理による適応的シンボリック回帰
- Authors: Yuan Tian, Wenqi Zhou, Hao Dong, David S. Kammer, Olga Fink
- Abstract要約: 記号回帰は、経験的データから基礎となる数学的および物理的関係を明らかにする大きな可能性を秘めている。
既存のトランスモデルでは、一般化性と適応性の点で課題に直面している。
本稿では,記号回帰を逐次意思決定タスクとして再定義する新しい強化学習ベースモデルであるSym-Qを紹介する。
- 参考スコア(独自算出の注目度): 13.419259918160321
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Symbolic regression holds great potential for uncovering underlying
mathematical and physical relationships from empirical data. While existing
transformer-based models have recently achieved significant success in this
domain, they face challenges in terms of generalizability and adaptability.
Typically, in cases where the output expressions do not adequately fit
experimental data, the models lack efficient mechanisms to adapt or modify the
expression. This inflexibility hinders their application in real-world
scenarios, particularly in discovering unknown physical or biological
relationships. Inspired by how human experts refine and adapt expressions, we
introduce Symbolic Q-network (Sym-Q), a novel reinforcement learning-based
model that redefines symbolic regression as a sequential decision-making task.
Sym-Q leverages supervised demonstrations and refines expressions based on
reward signals indicating the quality of fitting precision. Its distinctive
ability to manage the complexity of expression trees and perform precise
step-wise updates significantly enhances flexibility and efficiency. Our
results demonstrate that Sym-Q excels not only in recovering underlying
mathematical structures but also uniquely learns to efficiently refine the
output expression based on reward signals, thereby discovering underlying
expressions. Sym-Q paves the way for more intuitive and impactful discoveries
in physical science, marking a substantial advancement in the field of symbolic
regression.
- Abstract(参考訳): 記号回帰は、経験的データから基礎となる数学的および物理的関係を明らかにする大きな可能性を秘めている。
既存のトランスフォーマーベースのモデルは、最近この領域で大きな成功を収めたが、一般化可能性と適応性の観点からは課題に直面している。
通常、出力式が実験データに適切に適合しない場合、モデルは表現を適応または修正するための効率的なメカニズムを欠いている。
この非フレキシビリティは、現実世界のシナリオ、特に未知の物理的・生物学的関係の発見における応用を妨げる。
人間の専門家による表現の洗練と適応の仕方から着想を得て,記号回帰を逐次意思決定タスクとして再定義する新しい強化学習ベースモデルであるSym-Qを紹介した。
sym-qは教師付きデモンストレーションを利用し、適合精度の質を示す報酬信号に基づいて表現を洗練する。
表現木の複雑さを管理し、正確なステップワイズ更新を行う特徴的な能力は、柔軟性と効率を大幅に向上させる。
以上の結果から,Sym-Qは,基礎となる数学的構造を復元するだけでなく,報酬信号に基づいて効率よく出力表現を洗練し,基礎となる表現を発見できることが示唆された。
sym-qは、より直感的で影響力のある物理科学の発見への道を開き、象徴的回帰の分野における著しい進歩を示している。
関連論文リスト
- Interactive Symbolic Regression through Offline Reinforcement Learning: A Co-Design Framework [11.804368618793273]
シンボリック回帰は、観測データから基礎となる数学的および物理的関係を明らかにする大きな可能性を秘めている。
現在の最先端のアプローチは、通常、ドメインエキスパートの事前知識の統合を考慮していない。
本稿では,大規模な記号回帰のための高度な対話型フレームワークであるSym-Qを提案する。
論文 参考訳(メタデータ) (2025-02-05T06:26:49Z) - Test-time regression: a unifying framework for designing sequence models with associative memory [24.915262407519876]
実効的なシーケンスモデルでは連想的リコールを実行できなければならないことを示す。
私たちのキーとなる洞察は、連想メモリを通じて入力トークンを記憶することは、テスト時に回帰を実行することと等価であるということです。
線形アテンションモデル、ゲート変数、状態空間モデル、オンライン学習者、ソフトマックスアテンションなどを含む最近のアーキテクチャは、テスト時間回帰に対する特定のアプローチとして自然に現れています。
論文 参考訳(メタデータ) (2025-01-21T18:32:31Z) - Representation Learning with Parameterised Quantum Circuits for Advancing Speech Emotion Recognition [37.98283871637917]
音声感情認識(SER)は、特徴の複雑な依存性と、音声を通して伝達される感情表現の重なり合う性質により、人間とコンピュータの相互作用において複雑なタスクである。
本稿では、畳み込み量子回路と従来のコナールニューラルネットワーク(CNN)アーキテクチャを統合するハイブリッド古典量子フレームワークを提案する。
重ね合わせや絡み合わせなどの量子特性を活用することにより、提案モデルは特徴表現を強化し、古典的手法よりも複雑な依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2025-01-21T11:23:38Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z) - Deep Generative Symbolic Regression [83.04219479605801]
記号回帰は、データから簡潔な閉形式数学的方程式を発見することを目的としている。
既存の手法は、探索から強化学習まで、入力変数の数に応じてスケールできない。
本稿では,我々のフレームワークであるDeep Generative Symbolic Regressionのインスタンス化を提案する。
論文 参考訳(メタデータ) (2023-12-30T17:05:31Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Understanding Augmentation-based Self-Supervised Representation Learning
via RKHS Approximation and Regression [53.15502562048627]
最近の研究は、自己教師付き学習とグラフラプラシアン作用素のトップ固有空間の近似との関係を構築している。
この研究は、増強に基づく事前訓練の統計的分析に発展する。
論文 参考訳(メタデータ) (2023-06-01T15:18:55Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Transformer-based Planning for Symbolic Regression [18.90700817248397]
シンボリック・レグレッションのためのトランスフォーマーに基づく計画戦略であるTPSRを提案する。
従来の復号法とは異なり、TPSRは精度や複雑さなど、微分不可能なフィードバックの統合を可能にする。
我々の手法は最先端の手法より優れており、モデルの適合・複雑性トレードオフ、象徴的能力、騒音に対する堅牢性を高めている。
論文 参考訳(メタデータ) (2023-03-13T03:29:58Z) - IQ-Learn: Inverse soft-Q Learning for Imitation [95.06031307730245]
少数の専門家データからの模倣学習は、複雑な力学を持つ高次元環境では困難である。
行動クローニングは、実装の単純さと安定した収束性のために広く使われている単純な方法である。
本稿では,1つのQ-関数を学習することで,対向学習を回避する動的適応型ILを提案する。
論文 参考訳(メタデータ) (2021-06-23T03:43:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。