論文の概要: Self-Evolving Scientific Agent Discovers Generalizable Physically-Reasoned Fluid Control
- arxiv url: http://arxiv.org/abs/2606.08405v1
- Date: Sun, 07 Jun 2026 01:59:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.088021
- Title: Self-Evolving Scientific Agent Discovers Generalizable Physically-Reasoned Fluid Control
- Title(参考訳): 物理的に反応する流体制御を解明する自己進化型科学エージェント
- Authors: Boai Sun, Wenjin Guo, Zongmin Yu, Liu Yang,
- Abstract要約: 本稿では、厳密な解釈可能性と厳密な物理的推論を維持しつつ、コントローラ構築を自動化する自己進化型科学エージェントワークフローを提案する。
自律的な科学エージェントは、蓄積された物理的証拠を堅牢で数学的に可読な制御ポリシーに変換することに成功した。
- 参考スコア(独自算出の注目度): 6.923599492589765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While data-intensive deep reinforcement learning can optimize complex control policies, scientific discovery in physical systems fundamentally requires an interpretable chain of reasoning that connects physical evidence to structured control architectures. Here, we present a self-evolving scientific-agent workflow, driven by large language models and iterative code generation, that automates controller construction while preserving strict interpretability and rigorous physical reasoning. Instead of adjusting weights, the agent deploys candidate strategies into physical simulations, actively diagnoses dynamic behaviors from multimodal evidence, and translates these observations into progressive source-code refinements. We demonstrate this framework on a highly non-linear fluid-structure interaction problem: an underactuated, two-joint dogfish swimmer tasked with spatial target reaching using only joint angular accelerations. Starting from a propulsive seed policy that exhibits a one-sided steering bias, the agent autonomously discovers and refines a unified controller that robustly captures all canonical targets. Remarkably, without any retraining or target-specific branching, the synthesized control policy generalizes to unseen static targets and dynamically curved pursuit trajectories. The auditable evolve log reveals an emergent control architecture built upon traveling-wave propulsion, body-frame target guidance, yaw-rate feedback, signed mean-tail curvature, and adaptive cadence relief. Our results show that an autonomous scientific agent can successfully transform accumulated physical evidence into robust, mathematically readable control policy, while maintaining a fully traceable process of scientific discovery.
- Abstract(参考訳): データ集約的な深層強化学習は複雑な制御ポリシーを最適化することができるが、物理的システムの科学的発見には、物理的証拠と構造的制御アーキテクチャを結びつける解釈可能な推論の連鎖が必要である。
本稿では,大規模言語モデルと反復コード生成を駆使した自己進化型科学エージェントワークフローを提案する。
重みを調整する代わりに、エージェントは物理シミュレーションに候補戦略を配置し、マルチモーダルなエビデンスから動的挙動を積極的に診断し、これらの観察結果をプログレッシブ・ソース・コード・リファインメントに変換する。
この枠組みは,非線型流体構造相互作用問題において,関節角加速度のみを用いて,空間目標到達を任務とする不活性化二関節潜水艇について実証する。
片面の操舵バイアスを示す推進的シードポリシーから始まり、エージェントは自律的に全ての標準目標をしっかりと捕捉する統一されたコントローラを発見し、洗練する。
注目すべきは、リトレーニングやターゲット固有の分岐なしに、合成制御ポリシは、目に見えない静的なターゲットと、動的に湾曲した追尾軌道に一般化されることである。
監査可能な進化ログは、走行波推進、体枠目標誘導、ヨーレートフィードバック、符号付き平均テール曲率、適応的ケイデンス救済に基づいて構築された創発的制御アーキテクチャを明らかにする。
以上の結果から, 自律的な科学的エージェントは, 蓄積した物理的証拠を, 完全に追跡可能な科学的発見プロセスを維持しつつ, 頑健で数学的に可読な制御ポリシーに変換することに成功した。
関連論文リスト
- Towards a Virtual Neuroscientist: Autonomous Neuroimaging Analysis via Multi-Agent Collaboration [53.772014300855375]
我々は,自律型エンドツーエンド神経画像解析のためのマルチエージェントシステムであるNIAgentを紹介する。
従来のフラットなツール呼び出しエージェントとは異なり、NIAgentはコード中心の実行パラダイムを採用している。
本稿では,コホートレベルの検定とエージェント視覚検査を組み合わせた,自律的品質管理のための階層的検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-10T06:30:19Z) - Learning Reactive Dexterous Grasping via Hierarchical Task-Space RL Planning and Joint-Space QP Control [50.28263951510334]
本稿では,リアクティブなデクスタリーグルーピングのためのハイブリッド階層型制御フレームワークを提案する。
提案手法は,低レベル共同実行から高レベル空間意図を明示的に分離する。
我々は厳密なシミュレーションと現実のパイプラインを通して提案したフレームワークを広範囲に検証する。
論文 参考訳(メタデータ) (2026-05-05T04:49:38Z) - Autonomous Agents Coordinating Distributed Discovery Through Emergent Artifact Exchange [3.923443951480117]
ScienceClaw + Infiniteは、独立したエージェントが中央調整なしで研究を行う自律的な科学調査の枠組みである。
システムは3つのコンポーネントで構成されている:300以上の科学スキルの相互運用可能なレジストリ、完全な計算系を保存するアーティファクト層、エージェントベースの科学談話のための構造化プラットフォーム。
論文 参考訳(メタデータ) (2026-03-15T10:06:57Z) - Data-Driven Control of a Magnetically Actuated Fish-Like Robot [2.5782420501870296]
磁力で動く魚のようなロボットは、小型化と機敏さのために水中探査に有望なソリューションを提供する。
本稿では、解析モデルに頼ることなく、これらの複雑さに対処するデータ駆動制御フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-05T04:08:08Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - OR-Agent: Bridging Evolutionary Search and Structured Research for Automated Algorithm Discovery [10.217363774023033]
OR-Agentは、リッチな実験環境における自動探査のために設計されたマルチエージェントの研究フレームワークである。
本稿では,研究開始点の進化的選択,総合的な研究計画生成,研究ツリー内の協調探索を統一する進化的システム機構を提案する。
我々は古典的最適化ベンチマーク(走行セールスマン、静電容量化車両ルーティング、ビンパッキング、オリエンテーリング、および複数のクナップサック問題を含む)およびシミュレーションに基づく協調運転シナリオを含む実験を行う。
論文 参考訳(メタデータ) (2026-02-14T13:32:03Z) - Self-supervised Physics-Informed Manipulation of Deformable Linear Objects with Non-negligible Dynamics [14.801939035043352]
SPiDは、変形可能な線形オブジェクトの動的操作のための物理インフォーム付き自己教師付き学習フレームワークである。
タスク指向コストを用いてニューラルコントローラをトレーニングし、微分可能なオブジェクトモデルとの相互作用を通じてエンドツーエンドの最適化を可能にする。
我々は、手頃なマーカーレスロープ認識法を開発し、ノイズや低周波状態の更新を伴って、制御が性能を維持することを示す。
論文 参考訳(メタデータ) (2026-02-03T15:14:09Z) - EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.03672166010434]
我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文 参考訳(メタデータ) (2025-10-20T11:56:35Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - CARL: Controllable Agent with Reinforcement Learning for Quadruped
Locomotion [0.0]
CARLは、高レベルの指示で制御でき、動的環境に自然に反応できる4重結合剤である。
我々は、ジェネレーティブ・アドリラル・ネットワークを使用して、速度や方向などのハイレベルな制御を、オリジナルのアニメーションに対応するアクション・ディストリビューションに適応させる。
深部強化学習によるさらなる微調整により、エージェントは、スムーズな遷移を発生させながら、目に見えない外部摂動から回復することができる。
論文 参考訳(メタデータ) (2020-05-07T07:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。