論文の概要: Enhancing Loop-Invariant Synthesis via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2107.09766v1
- Date: Fri, 16 Jul 2021 11:17:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-25 11:59:33.993956
- Title: Enhancing Loop-Invariant Synthesis via Reinforcement Learning
- Title(参考訳): 強化学習によるループ不変合成の促進
- Authors: Takeshi Tsukada and Hiroshi Unno and Taro Sekiyama and Kohei Suenaga
- Abstract要約: 本研究は,PCSatの強化学習により,優れたシンセサイザーを効果的かつ自動的に学習できることを実証する。
実験の結果,PCSatと強化学習の学習の併用により,この課題に対する最先端の問題解決者よりも優れた結果が得られた。
- 参考スコア(独自算出の注目度): 3.7755650136637304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Loop-invariant synthesis is the basis of every program verification
procedure. Due to its undecidability in general, a tool for invariant synthesis
necessarily uses heuristics. Despite the common belief that the design of
heuristics is vital for the effective performance of a verifier, little work
has been performed toward obtaining the optimal heuristics for each
invariant-synthesis tool. Instead, developers have hand-tuned the heuristics of
tools. This study demonstrates that we can effectively and automatically learn
a good heuristic via reinforcement learning for an invariant synthesizer PCSat.
Our experiment shows that PCSat combined with the heuristic learned by
reinforcement learning outperforms the state-of-the-art solvers for this task.
To the best of our knowledge, this is the first work that investigates learning
the heuristics of an invariant synthesis tool.
- Abstract(参考訳): ループ不変合成は、全てのプログラム検証手順の基礎となる。
一般に決定不能であるため、不変合成のツールは必然的にヒューリスティックスを用いる。
検証器の効果的な性能にはヒューリスティックの設計が不可欠であるという共通の信念にもかかわらず、各不変合成ツールの最適なヒューリスティックを得るための研究はほとんど行われていない。
その代わり、開発者はツールのヒューリスティックを手動で調整した。
本研究は, 不変合成器PCSatの強化学習により, 優れたヒューリスティックを効果的かつ自動的に学習できることを実証する。
実験の結果,PCSatと強化学習によるヒューリスティック学習が組み合わさって,この課題に対する最先端の解法よりも優れていることがわかった。
我々の知る限りでは、これは不変合成ツールのヒューリスティックスを学ぶための最初の研究である。
関連論文リスト
- Robust AI-Synthesized Speech Detection Using Feature Decomposition Learning and Synthesizer Feature Augmentation [52.0893266767733]
本稿では,特徴分解を利用して合成者非依存のコンテンツ特徴を学習する頑健なディープフェイク音声検出手法を提案する。
異なる合成器特性に対するモデルのロバスト性を高めるために,合成器の特徴増強戦略を提案する。
論文 参考訳(メタデータ) (2024-11-14T03:57:21Z) - ToolFlow: Boosting LLM Tool-Calling Through Natural and Coherent Dialogue Synthesis [80.34000499166648]
より関連性の高いツールの組み合わせをサンプリングするためのグラフベースのサンプリング戦略と、コヒーレントな対話の合成を導く計画を作成するための計画生成戦略を提案する。
ツールフローで生成した8000の合成対話を用いてLLaMA-3.1-8BにSFTを適用した。
その結果,GPT-4に匹敵するツールコール性能が得られた。
論文 参考訳(メタデータ) (2024-10-24T05:45:04Z) - Efficient Task Transfer for HLS DSE [39.03556214534823]
高レベル合成(HLS)設計空間探索に関わる課題に対処する。
これらのツールが発達するにつれて、合成結果の質(QoR)は著しく変化する。
ツールチェーンの変更に対して効率的に適応するように設計されたモデルベースのエクスプローラーを活用するタスク転送学習スキームであるActive-CEMを紹介する。
論文 参考訳(メタデータ) (2024-08-16T19:54:41Z) - Retrieval-Guided Reinforcement Learning for Boolean Circuit Minimization [23.075466444266528]
本研究は論理合成のための学習と探索技術について徹底的に検討する。
ABC-RLは、検索プロセス中に事前学習したエージェントからのレコメンデーションを順応的に調整する、巧妙に調整された$alpha$パラメータである。
その結果, 合成回路のQoR(Quality-of-result)は, 最先端技術と比較して最大24.8%向上した。
論文 参考訳(メタデータ) (2024-01-22T18:46:30Z) - ExeDec: Execution Decomposition for Compositional Generalization in Neural Program Synthesis [54.18659323181771]
プログラム合成において望ましいいくつかの異なる構成一般化形式を特徴付ける。
本稿では,ExeDecを提案する。ExeDecは,実行サブゴールを予測し,各ステップでプログラム実行によって段階的に通知される問題を解くための,新しい分解ベースの戦略である。
論文 参考訳(メタデータ) (2023-07-26T01:07:52Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Synthetic Sample Selection for Generalized Zero-Shot Learning [4.264192013842096]
Generalized Zero-Shot Learning (GZSL) はコンピュータビジョンにおいて重要な研究領域となっている。
本稿では,強化学習を用いた合成特徴選択のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-06T03:22:43Z) - Compositional Generalization and Decomposition in Neural Program
Synthesis [59.356261137313275]
本稿では,学習プログラムシンセサイザーの合成一般化能力の測定に焦点をあてる。
まず、プログラム合成法が一般化されるであろういくつかの異なる軸を特徴付ける。
2つの一般的な既存のデータセットに基づいて、これらの能力を評価するためのタスクのベンチマークスイートを導入する。
論文 参考訳(メタデータ) (2022-04-07T22:16:05Z) - BUSTLE: Bottom-Up Program Synthesis Through Learning-Guided Exploration [72.88493072196094]
プログラムのボトムアップ検索に学習を活用する新しい合成手法を提案する。
特に、入力出力例のセットに基づいて、探索条件中の中間値の合成を優先順位付けするようにモデルを訓練する。
単純な教師付き学習アプローチであっても,学習とボトムアップ検索の組み合わせは極めて効果的であることを示す。
論文 参考訳(メタデータ) (2020-07-28T17:46:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。