論文の概要: Large Language Models as Optimization Controllers: Adaptive Continuation for SIMP Topology Optimization
- arxiv url: http://arxiv.org/abs/2603.25099v1
- Date: Thu, 26 Mar 2026 07:14:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.147904
- Title: Large Language Models as Optimization Controllers: Adaptive Continuation for SIMP Topology Optimization
- Title(参考訳): 最適化コントローラとしての大規模言語モデル:SIMPトポロジ最適化のための適応的継続
- Authors: Shaoliang Yang, Jun Wang, Yunsheng Wang,
- Abstract要約: 本稿では,SIMP最適化のためのオンラインコントローラとして,大規模言語モデルが機能するフレームワークを提案する。
ハードグレーネスゲートは未熟なバイナライゼーションを防止し、メタ最適化ループは第2パスを使用してエージェントの呼び出し周波数を調整する。
エージェントはすべてのベンチマークの最終的なコンプライアンスを達成する:$5.7%$から$-1%、すべてのソリューションが完全にバイナリである。
- 参考スコア(独自算出の注目度): 4.365822392824561
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a framework in which a large language model (LLM) acts as an online adaptive controller for SIMP topology optimization, replacing conventional fixed-schedule continuation with real-time, state-conditioned parameter decisions. At every $k$-th iteration, the LLM receives a structured observation$-$current compliance, grayness index, stagnation counter, checkerboard measure, volume fraction, and budget consumption$-$and outputs numerical values for the penalization exponent $p$, projection sharpness $β$, filter radius $r_{\min}$, and move limit $δ$ via a Direct Numeric Control interface. A hard grayness gate prevents premature binarization, and a meta-optimization loop uses a second LLM pass to tune the agent's call frequency and gate threshold across runs. We benchmark the agent against four baselines$-$fixed (no-continuation), standard three-field continuation, an expert heuristic, and a schedule-only ablation$-$on three 2-D problems (cantilever, MBB beam, L-bracket) at $120\!\times\!60$ resolution and two 3-D problems (cantilever, MBB beam) at $40\!\times\!20\!\times\!10$ resolution, all run for 300 iterations. A standardized 40-iteration sharpening tail is applied from the best valid snapshot so that compliance differences reflect only the exploration phase. The LLM agent achieves the lowest final compliance on every benchmark: $-5.7\%$ to $-18.1\%$ relative to the fixed baseline, with all solutions fully binary. The schedule-only ablation underperforms the fixed baseline on two of three problems, confirming that the LLM's real-time intervention$-$not the schedule geometry$-$drives the gain. Code and reproduction scripts will be released upon publication.
- Abstract(参考訳): 本稿では,大規模言語モデル(LLM)がSIMPトポロジ最適化のためのオンライン適応コントローラとして機能し,従来の固定スケジュール継続をリアルタイムな状態条件パラメータ決定に置き換えるフレームワークを提案する。
k$-thイテレーション毎に、LLMは構造化された観察$-$currentコンプライアンス、グレーネスインデックス、ステージングカウンタ、チェッカーボード測度、ボリューム分数、予算消費$-$andは、ペナライゼーション指数$p$、プロジェクションシャープネス$β$、フィルタ半径$r_{\min}$、ダイレクト数値制御インターフェースを介して制限$δ$の数値を出力する。
ハードグレーネスゲートは初期バイナライゼーションを防止し、メタ最適化ループは第2のLSMパスを使用してエージェントのコール周波数とゲート閾値をランにわたって調整する。
エージェントを4つのベースライン$-$fixed (no-continuation)、標準3フィールド継続、エキスパートヒューリスティック、スケジュールのみのアブレーション$-$on3D問題(カンチレバー、MBBビーム、Lブラケット)に対して120ドル!
タイムズ!
60ドルの解像度と2つの3D問題(カンチレバー、MBBビーム)は40ドル!
タイムズ!
20!
タイムズ!
10ドルの解像度で、すべて300回のイテレーションで実行されます。
最適なスナップショットから標準化された40項目シャープニングテールを適用し、コンプライアンスの相違が探索フェーズのみを反映するようにする。
LLMエージェントは全てのベンチマークで最低のコンプライアンスを達成している:$-5.7\%$から$-18.1\%$は固定ベースラインに対して、すべてのソリューションが完全にバイナリである。
スケジュールのみのアブレーションは、LLMのリアルタイム介入$-$=スケジュール幾何学$-$$drivesの利得を裏付ける3つの問題のうちの2つの問題に対して、固定ベースラインを過小評価する。
コードと再生スクリプトは公開時にリリースされる。
関連論文リスト
- The $\mathbf{Y}$-Combinator for LLMs: Solving Long-Context Rot with $λ$-Calculus [13.924906970455302]
$$-RLMは、$$-calculusの型付き関数型ランタイムを持つ、長期コンテキスト推論のためのフレームワークである。
モデルタスク比較を36のモデルタスク比較のうち29の標準RLMよりも高い性能を示し、モデル階層間の平均精度を+21.9ポイント改善し、レイテンシを最大4.1倍改善した。
論文 参考訳(メタデータ) (2026-03-20T16:29:51Z) - $\nabla$-Reasoner: LLM Reasoning via Test-Time Gradient Descent in Latent Space [71.23672814629448]
$nabla$-Reasonerは、トークンログに対する差別化可能な最適化をデコードループに統合する反復生成フレームワークである。
$nabla$-Reasonerは、挑戦的な数学的推論ベンチマークで20%以上の精度の向上を実現している。
論文 参考訳(メタデータ) (2026-03-05T08:42:54Z) - Trust Region Masking for Long-Horizon LLM Reinforcement Learning [20.589897184824878]
大規模言語モデルのポリシー勾配法は、ロールアウトポリシーのサンプルから計算された代理目的を最適化する。
$_textroll ne _$ の場合、サロゲートと真の目的の間に近似誤差がある。
本稿では,トークンが信頼領域に違反した場合に,全シーケンスを勾配計算から除外するトラスト領域マスキング(TRM)を提案する。
論文 参考訳(メタデータ) (2025-12-28T20:41:59Z) - Reinforcement Learning from Adversarial Preferences in Tabular MDPs [62.73758165845971]
我々は,敵対的嗜好を持つエピソードマルコフ決定プロセス(MDP)の新たな枠組みを導入する。
PbMDP では、標準的なエピソード MDP とは異なり、学習者は2つの候補アーム間の好みを観察する。
我々は、既知遷移の下で、T2/3$という残差境界を達成するアルゴリズムを開発する。
論文 参考訳(メタデータ) (2025-07-15T20:19:32Z) - Scaling Up Liquid-Resistance Liquid-Capacitance Networks for Efficient Sequence Modeling [50.994194925685434]
LrcSSMは$textitnon-linear$リカレントモデルで、現在の線形状態空間層と同じくらい高速に長いシーケンスを処理する。
ヤコビ行列を対角線に強制することにより、全列を並列に解くことができる。
LrcSSMは、Liquid-S4のような他の入力変化系が提供しないことを保証する形式的な勾配安定性を提供する。
論文 参考訳(メタデータ) (2025-05-27T20:02:59Z) - FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA [68.44043212834204]
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
Low-Rank Adaptation (LoRA) は、学習における言語モデルの効率的な微調整に広く用いられている。
論文 参考訳(メタデータ) (2025-05-19T07:32:56Z) - Position-Aware Depth Decay Decoding ($D^3$): Boosting Large Language Model Inference Efficiency [26.173523821684306]
トークン配置対応層スキップフレームワークを提案し,性能を維持しつつ1.5倍の演算を効率よく節約する。
7 sim 70$のパラメータを持つ大規模言語モデルの実験では、D3$は完全な推論パイプラインと比較して平均1.5倍のスピードアップを達成することができる。
論文 参考訳(メタデータ) (2025-03-11T15:15:54Z) - Transfer Q Star: Principled Decoding for LLM Alignment [105.89114186982972]
Transfer $Q*$は、ベースラインモデルを通してターゲット報酬$r$の最適値関数を推定する。
提案手法は, 従来のSoTA法で観測された準最適差を著しく低減する。
論文 参考訳(メタデータ) (2024-05-30T21:36:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。