論文の概要: Conservative Continuous-Time Treatment Optimization
- arxiv url: http://arxiv.org/abs/2603.16789v1
- Date: Tue, 17 Mar 2026 17:01:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.435813
- Title: Conservative Continuous-Time Treatment Optimization
- Title(参考訳): 保守的連続時間処理最適化
- Authors: Nora Schneider, Georg Manten, Niki Kilbertus,
- Abstract要約: 不規則な患者軌道から治療を最適化するための保守的連続時間制御フレームワークを開発した。
ベンチマークデータセットの実験では、非保守的なベースラインに比べて堅牢性とパフォーマンスが向上した。
- 参考スコア(独自算出の注目度): 9.553261527696067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a conservative continuous-time stochastic control framework for treatment optimization from irregularly sampled patient trajectories. The unknown patient dynamics are modeled as a controlled stochastic differential equation with treatment as a continuous-time control. Naive model-based optimization can exploit model errors and propose out-of-support controls, so optimizing the estimated dynamics may not optimize the true dynamics. To limit extrapolation, we add a consistent signature-based MMD regularizer on path space that penalizes treatment plans whose induced trajectory distribution deviates from observed trajectories. The resulting objective minimizes a computable upper bound on the true cost. Experiments on benchmark datasets show improved robustness and performance compared to non-conservative baselines.
- Abstract(参考訳): 不規則な患者軌跡からの治療最適化のための保守的連続時間確率制御フレームワークを開発した。
未知の患者力学は、連続時間制御としての処理を伴う制御確率微分方程式としてモデル化される。
Naive Model-based Optimization(英語版)はモデルエラーを利用してサポート外制御を提案するので、推定されたダイナミクスを最適化することは真のダイナミクスを最適化しないかもしれない。
補間を制限するために、経路空間に一貫したシグネチャベースのMDD正規化器を加え、誘導軌道分布が観測軌道から逸脱する治療計画をペナルティ化する。
結果として得られる目的は、真のコストに対する計算可能な上限を最小化する。
ベンチマークデータセットの実験では、非保守的なベースラインに比べて堅牢性とパフォーマンスが向上した。
関連論文リスト
- Dynamic Momentum Recalibration in Online Gradient Learning [6.6375578955686345]
Gradient Descent(SGD)とその運動量変化は、ディープラーニング最適化のバックボーンを形成する。
本研究では信号処理のレンズを通して勾配の更新を再解釈し、固定運動量係数が本質的にバイアスと分散のバランスを歪め、歪んだあるいは最適以下のパラメータの更新をもたらすことを明らかにする。
SGDF(SGD with Filter)を提案する。
論文 参考訳(メタデータ) (2026-03-06T10:23:40Z) - JAWS: Enhancing Long-term Rollout of Neural Operators via Spatially-Adaptive Jacobian Regularization [0.0]
Jacobian-Adaptive Weighting for Stability (JAWS)は、これらの制限を軽減するために設計された確率的正規化戦略である。
空間的不確実性を伴う最大Aポストエリオーリ(MAP)推定として演算子学習をフレーミングすることにより、JAWSは局所的な物理的複雑さに基づいて正規化強度を動的に変調する。
実験により、この空間適応型プリコンディショナーが有効スペクトルプレコンディショナーとして機能し、高周波不安定性を扱う際のベースオペレータの負担を軽減することが示されている。
論文 参考訳(メタデータ) (2026-03-04T06:15:09Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - LatentTrack: Sequential Weight Generation via Latent Filtering [0.0]
LatentTrack(LT)は、非定常力学の下でのオンライン確率予測のためのシーケンシャルニューラルネットワークである。
LTは低次元潜在空間で因果ベイズフィルタを行い、軽量なハイパーネットワークを用いて各時間ステップで予測モデルパラメータを生成する。
LTは、ステートフルなシーケンシャルおよび静的不確実性認識ベースラインよりも低い負の対数や平均二乗誤差を一貫して校正した。
論文 参考訳(メタデータ) (2026-01-31T02:22:59Z) - Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。
i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T06:26:02Z) - On the Optimal Construction of Unbiased Gradient Estimators for Zeroth-Order Optimization [57.179679246370114]
既存の手法の潜在的な制限は、ステップサイズが提案されない限り、ほとんどの摂動推定器に固有のバイアスである。
本稿では, 良好な構成を維持しつつ, バイアスを排除した非バイアス勾配スケーリング推定器のファミリーを提案する。
論文 参考訳(メタデータ) (2025-10-22T18:25:43Z) - Control-Augmented Autoregressive Diffusion for Data Assimilation [17.305296093966803]
本稿では,ARDMを軽量コントローラで拡張するアモールト化フレームワークを提案する。
我々はこの枠組みをカオス偏微分方程式(PDE)に対するデータ同化(DA)の文脈で評価する。
提案手法は,DA推論をオンザフライ修正による単一前方ロールアウトに還元し,推論中に高価な随伴計算や最適化を回避する。
論文 参考訳(メタデータ) (2025-10-08T04:37:32Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Guaranteed Trajectory Tracking under Learned Dynamics with Contraction Metrics and Disturbance Estimation [5.147919654191323]
本稿では,制約指標と外乱推定に基づく軌道中心学習制御へのアプローチを提案する。
提案するフレームワークは、平面四重項の例で検証される。
論文 参考訳(メタデータ) (2021-12-15T15:57:33Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。