論文の概要: PRISM: Position-encoded Regressive Inverse Spectral Model for Multilayer Thin-Film Design
- arxiv url: http://arxiv.org/abs/2605.26502v1
- Date: Tue, 26 May 2026 03:30:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.604373
- Title: PRISM: Position-encoded Regressive Inverse Spectral Model for Multilayer Thin-Film Design
- Title(参考訳): PRISM:多層薄膜設計のための位置符号化逆スペクトルモデル
- Authors: Runtian Wang, Renhao Xue, Baige Chen, Hao Wu,
- Abstract要約: 本稿では,デコーダのみの自己回帰変換器であるPRISMを提案する。
PRISMは、個々の材料選択と単一のバックボーン内の連続的な厚さ回帰を予測する。
ベンチマークの結果,PRISM-13Mモデルでは,他の変圧器ベースラインと比較してMAEが50%以上減少することがわかった。
- 参考スコア(独自算出の注目度): 2.432257332677549
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The inverse problem of multilayer thin-film optical coatings design represents a complex combinatorial-continuous optimization challenge. We present PRISM (Position-encoded Regressive Inverse Spectral Model), a unified decoder-only autoregressive transformer that streamlines this process by jointly predicting discrete material selection and continuous thickness regression within a single backbone. PRISM introduces two primary architectural innovations: (1) spectrum prefix conditioning, which utilizes standard prefix tokens for in-context target injection, and (2) cumulative-depth Rotary Position Embeddings, which encode continuous thickness directly into the positional representation to preserve the physical spatial relationships of the stack. Our benchmarks demonstrate that a PRISM-13M model reduces MAE by over 50\% compared to other transformer baselines while utilizing only one-fifth of the parameters. Furthermore, a 44M-parameter variant achieves state-of-the-art performance (MAE = 0.010) on our in-distribution validation benchmark and operates significantly faster than simulated annealing, offering a highly efficient alternative to classical optimization methods.
- Abstract(参考訳): 多層薄膜光コーティング設計の逆問題は、複雑な組合せ連続最適化課題を表している。
PRISM(Position-encoded Regressive Inverse Spectral Model)は、離散材料選択と単一のバックボーン内での連続的な厚さ回帰を共同で予測することにより、このプロセスを合理化するデコーダのみの自己回帰変換器である。
PRISMは,(1)標準の接頭辞トークンをインコンテキストターゲットインジェクションに利用するスペクトルプレフィックス条件付け,(2)連続的な厚さを位置表現に直接エンコードしてスタックの物理的空間的関係を保存する累積深度回転位置埋め込みという2つのアーキテクチャ革新を導入している。
PRISM-13Mモデルでは,パラメータの5分の1しか利用せず,他の変圧器ベースラインに比べてMAEを50%以上削減できることを示した。
さらに、44Mパラメータの変種は、我々の分散検証ベンチマークで最先端性能(MAE = 0.010)を達成し、シミュレーションアニールよりもはるかに高速に動作し、古典的な最適化手法に代わる高い効率の代替手段を提供する。
関連論文リスト
- VLM2Rec: Resolving Modality Collapse in Vision-Language Model Embedders for Multimodal Sequential Recommendation [15.053120780189461]
逐次レコメンデーションのためのマルチモーダルエンコーダとしての視覚言語モデル(VLM)について検討する。
標準コントラスト制御微調整(SFT)は、その固有のモダリティ崩壊を増幅する。
本稿では,VLMの組込み型フレームワークであるVLM2Recを提案する。
論文 参考訳(メタデータ) (2026-03-18T07:46:30Z) - Advancing accelerator virtual beam diagnostics through latent evolution modeling: an integrated solution to forward, inverse, tuning, and UQ problems [46.568487965999225]
我々は,高次元位相空間を低次元表現に投影するオートエンコーダと,潜時空間における時間ダイナミクスを学習するための変換器を備えたハイブリッド機械学習フレームワークであるLatent Evolution Model (LEM)を提案する。
テキストフォワードモデリングでは、CVAEは6次元位相空間の15のユニークな射影を潜在表現に符号化し、トランスフォーマーは上流からの入力から下流の潜在状態を予測する。
テキスト逆問題では、(a)下流観測から上流位相空間を予測すること、(b)潜時空間からRF設定を推定することの2つの異なる課題に対処する。
論文 参考訳(メタデータ) (2026-02-26T04:46:26Z) - PRISM: Performer RS-IMLE for Single-pass Multisensory Imitation Learning [51.24484551729328]
PRISMは,IMLEのバッチ・グロバル・リジェクション・サンプリングに基づく単一パスポリシーである。
PRISMは、Performerアーキテクチャを用いた線形アテンション発生器と時間的マルチセンサエンコーダを結合する。
7-DoFアームD1を搭載したUnitree Go2を用いたロコマニピュレーションやUR5マニピュレータを用いたテーブルトップ操作など,PRISMの有効性を実証する。
論文 参考訳(メタデータ) (2026-02-02T17:57:37Z) - A Constrained Optimization Perspective of Unrolled Transformers [77.12297732942095]
我々は、最適化降下アルゴリズムのように振る舞う変圧器の訓練のための制約付き最適化フレームワークを導入する。
拘束型変圧器は摂動の強靭性を実現し,より高い分布分布一般化を維持する。
論文 参考訳(メタデータ) (2026-01-24T02:12:39Z) - Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。
本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文 参考訳(メタデータ) (2025-12-28T05:48:55Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - Transferable Sequential Recommendation with Vanilla Cross-Entropy Loss [2.0048375809706274]
Sequential Recommendation (SR)システムでは、インタラクション履歴を分析してユーザの好みをモデル化する。
現在の手法は、新しいドメインに適応する際にかなりの微調整コストを発生させる。
MMM4Recは、効率的な伝達学習のための専用代数的制約機構を組み込んだ、新しいマルチモーダルSRフレームワークである。
論文 参考訳(メタデータ) (2025-06-03T14:18:19Z) - HiLAB: A Hybrid Inverse-Design Framework [0.0]
HiLABはナノフォトニック構造の逆設計のための新しいパラダイムである。
シミュレーションコストを削減した多様なフリーフォーム構成を生成することで、多機能デバイス設計に対処する。
論文 参考訳(メタデータ) (2025-05-23T05:34:56Z) - PearSAN: A Machine Learning Method for Inverse Design using Pearson Correlated Surrogate Annealing [66.27103948750306]
PearSANは、大きな設計空間を持つ逆設計問題に適用可能な機械学習支援最適化アルゴリズムである。
ピアソン相関代理モデルを用いて、真の設計計量のメリットの図形を予測する。
最先端の最大設計効率は97%で、少なくとも以前の方法よりも桁違いに高速である。
論文 参考訳(メタデータ) (2024-12-26T17:02:19Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。