論文の概要: Optimizing Discrete Spaces via Expensive Evaluations: A Learning to
Search Framework
- arxiv url: http://arxiv.org/abs/2012.07320v1
- Date: Mon, 14 Dec 2020 08:04:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 06:24:37.844545
- Title: Optimizing Discrete Spaces via Expensive Evaluations: A Learning to
Search Framework
- Title(参考訳): 高価な評価による離散空間の最適化:探索学習フレームワーク
- Authors: Aryan Deshwal, Syrine Belakaria, Janardhan Rao Doppa, Alan Fern
- Abstract要約: L2S-DISCOという新しい学習と研究の枠組みを導入し、評価します。
鍵となる洞察は、各ステップで制御知識によって導かれる探索手順を用いて次の構造を選択し、新しい機能評価が観察されるにつれて制御知識を改善することである。
- 参考スコア(独自算出の注目度): 45.0915797856091
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of optimizing expensive black-box functions over
discrete spaces (e.g., sets, sequences, graphs). The key challenge is to select
a sequence of combinatorial structures to evaluate, in order to identify
high-performing structures as quickly as possible. Our main contribution is to
introduce and evaluate a new learning-to-search framework for this problem
called L2S-DISCO. The key insight is to employ search procedures guided by
control knowledge at each step to select the next structure and to improve the
control knowledge as new function evaluations are observed. We provide a
concrete instantiation of L2S-DISCO for local search procedure and empirically
evaluate it on diverse real-world benchmarks. Results show the efficacy of
L2S-DISCO over state-of-the-art algorithms in solving complex optimization
problems.
- Abstract(参考訳): 離散空間(例えば集合、列、グラフ)上で高価なブラックボックス関数を最適化する問題を考える。
鍵となる課題は、高い性能構造をできるだけ早く識別するために、評価する組合せ構造の列を選択することである。
我々の主な貢献は、L2S-DISCOと呼ばれる新しい学習学習フレームワークの導入と評価である。
重要な洞察は、各ステップで制御知識によって導かれる探索手順を用いて次の構造を選択し、新しい機能評価が観察されるにつれて制御知識を改善することである。
局所探索のためのL2S-DISCOの具体的インスタンス化を行い,実世界の様々なベンチマークで実証的に評価する。
その結果,複雑な最適化問題に対するl2s-discoの有効性が示された。
関連論文リスト
- Boost, Disentangle, and Customize: A Robust System2-to-System1 Pipeline for Code Generation [58.799397354312596]
大規模言語モデル(LLM)は、様々な領域、特にシステム1タスクにおいて顕著な機能を示した。
System2-to-System1法に関する最近の研究が急増し、推論時間計算によるシステム2の推論知識が探索された。
本稿では,システム2タスクの代表的タスクであるコード生成に注目し,主な課題を2つ挙げる。
論文 参考訳(メタデータ) (2025-02-18T03:20:50Z) - What Matters in Hierarchical Search for Combinatorial Reasoning Problems? [0.5007502976837217]
近年の取り組みでは,階層的な高次探索戦略を取り入れたサブゴアル手法による計画の強化が試みられている。
有望ではあるが、従来の低レベルのプランナに対する彼らのパフォーマンスは一貫性がなく、アプリケーションコンテキストに関する疑問を提起している。
難解な値関数、複雑なアクション空間、環境におけるデッドエンドの存在、あるいは多様な専門家から収集されたデータなど、ハイレベル検索の利点を活用する上で重要な属性を同定する。
論文 参考訳(メタデータ) (2024-06-05T15:14:58Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Efficient Joint-Dimensional Search with Solution Space Regularization
for Real-Time Semantic Segmentation [27.94898516315886]
この問題に対して,リアルタイムに実行可能な最適ネットワーク構造を探索する。
新たな解空間規則化(SSR)損失は、スーパーネットが離散的に収束することを効果的に促すために最初に提案される。
より高効率な探索を実現するために,新しい階層的・プログレッシブ・ソリューション・スペース・スライキング法を提案する。
論文 参考訳(メタデータ) (2022-08-10T11:07:33Z) - Sublinear Least-Squares Value Iteration via Locality Sensitive Hashing [49.73889315176884]
本稿では、実行時の複雑さをアクション数にサブリニアに持つ最初の証明可能なLeast-Squares Value Iteration(LSVI)アルゴリズムを提示する。
我々は, 近似最大内積探索理論と強化学習の後悔分析との関係を構築する。
論文 参考訳(メタデータ) (2021-05-18T05:23:53Z) - Learning to Optimize: A Primer and A Benchmark [94.29436694770953]
最適化への学習(L2O)は、機械学習を活用して最適化方法を開発する新しいアプローチです。
この記事では、継続的最適化のためのL2Oの総合的な調査とベンチマークを行う。
論文 参考訳(メタデータ) (2021-03-23T20:46:20Z) - Towards Minimax Optimal Reinforcement Learning in Factored Markov
Decision Processes [53.72166325215299]
エピソード因子化マルコフ決定過程(FMDP)における最小強化学習について検討する。
第一に、分解された構造のリッチなクラスに対する最小限の後悔の保証を達成する。
2つ目は、少し悪い後悔をしながら、より良い計算複雑性を楽しみます。
論文 参考訳(メタデータ) (2020-06-24T00:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。