論文の概要: Searching for Programmatic Policies in Semantic Spaces
- arxiv url: http://arxiv.org/abs/2405.05431v2
- Date: Wed, 12 Jun 2024 18:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-14 23:06:20.305124
- Title: Searching for Programmatic Policies in Semantic Spaces
- Title(参考訳): 意味空間におけるプログラムポリシーの探索
- Authors: Rubens O. Moraes, Levi H. S. Lelis,
- Abstract要約: 本稿では,言語の意味空間の近似内を探索するプログラムポリシーを合成する代替手法を提案する。
我々の理論的根拠は、アルゴリズムが空間を探索する際に異なるエージェントの挙動を評価する場合、探索がより効率的であるということである。
- 参考スコア(独自算出の注目度): 13.466710708566177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Syntax-guided synthesis is commonly used to generate programs encoding policies. In this approach, the set of programs, that can be written in a domain-specific language defines the search space, and an algorithm searches within this space for programs that encode strong policies. In this paper, we propose an alternative method for synthesizing programmatic policies, where we search within an approximation of the language's semantic space. We hypothesized that searching in semantic spaces is more sample-efficient compared to syntax-based spaces. Our rationale is that the search is more efficient if the algorithm evaluates different agent behaviors as it searches through the space, a feature often missing in syntax-based spaces. This is because small changes in the syntax of a program often do not result in different agent behaviors. We define semantic spaces by learning a library of programs that present different agent behaviors. Then, we approximate the semantic space by defining a neighborhood function for local search algorithms, where we replace parts of the current candidate program with programs from the library. We evaluated our hypothesis in a real-time strategy game called MicroRTS. Empirical results support our hypothesis that searching in semantic spaces can be more sample-efficient than searching in syntax-based spaces.
- Abstract(参考訳): 構文誘導合成は、一般的にポリシーを符号化するプログラムを生成するために用いられる。
このアプローチでは、ドメイン固有言語で記述可能なプログラムの集合が検索空間を定義し、強力なポリシーを符号化するプログラムをアルゴリズムが検索する。
本稿では,言語の意味空間の近似内を探索するプログラムポリシーを合成する代替手法を提案する。
セマンティック空間における探索は、構文に基づく空間に比べてよりサンプリング効率が高いと仮定した。
我々の理論的根拠は、アルゴリズムが空間を探索する際に異なるエージェントの振る舞いを評価すると、より効率的に検索できるということだ。
これは、プログラムの構文の小さな変更が、しばしば異なるエージェントの振る舞いをもたらしないためである。
我々は、異なるエージェントの振る舞いを示すプログラムのライブラリを学習することで意味空間を定義する。
次に、局所探索アルゴリズムの近傍関数を定義して意味空間を近似し、現在の候補プログラムの一部をライブラリのプログラムに置き換える。
我々はMicroRTSと呼ばれるリアルタイム戦略ゲームで仮説を評価した。
経験的結果は,構文に基づく空間の探索よりも意味空間の探索の方がサンプリング効率が高いという仮説を支持している。
関連論文リスト
- Reclaiming the Source of Programmatic Policies: Programmatic versus Latent Spaces [10.654876600946865]
プログラム空間は、潜在空間で観測されたような行動損失の値を示す。
プログラム空間で探索するアルゴリズムは、LEAPSやHPRLよりも大幅に優れている。
論文 参考訳(メタデータ) (2024-10-16T02:10:04Z) - Efficient Bottom-Up Synthesis for Programs with Local Variables [7.387053183440393]
我々のアルゴリズムは,プログラムをローカル変数で効率的に探索することができる。
Lifted interpretationは、ローカル変数のすべてのバインディングコンテキストを列挙するメカニズムを提供する。
私たちのアイデアは、Webオートメーションの領域でインスタンス化されています。
論文 参考訳(メタデータ) (2023-11-07T04:02:52Z) - Weakly Supervised Semantic Parsing with Execution-based Spurious Program
Filtering [19.96076749160955]
本稿では,プログラムの実行結果に基づくドメインに依存しないフィルタリング機構を提案する。
私たちはこれらの表現に対して多数決を行い、他のプログラムと大きく異なる意味を持つプログラムを特定し、フィルタリングします。
論文 参考訳(メタデータ) (2023-11-02T11:45:40Z) - Tensor Program Optimization with Probabilistic Programs [16.303739951257814]
本稿では,テンソルプログラムのリッチな検索空間を構築するために,ドメイン固有の確率型プログラミング言語であるMetaScheduleを紹介する。
我々の抽象化により、ドメインの専門家はプログラムを分析し、プログラム変換を構成するモジュール化された方法で選択を簡単に提案できる。
また、与えられた検索空間に最適化されたプログラムを見つけるために、エンドツーエンドの学習駆動フレームワークを構築します。
論文 参考訳(メタデータ) (2022-05-26T20:20:02Z) - CrossBeam: Learning to Search in Bottom-Up Program Synthesis [51.37514793318815]
ボトムアップ合成のためのハンズオン検索ポリシーを学習するためのニューラルネットワークのトレーニングを提案する。
私たちのアプローチは、CrossBeamと呼ばれ、ニューラルモデルを使用して、以前に探索されたプログラムを新しいプログラムに組み合わせる方法を選択します。
我々はCrossBeamが効率的に検索することを学び、最先端技術と比較してプログラム空間のより小さな部分を探索する。
論文 参考訳(メタデータ) (2022-03-20T04:41:05Z) - Searching for More Efficient Dynamic Programs [61.79535031840558]
本稿では,プログラム変換の集合,変換プログラムの効率を評価するための単純な指標,およびこの指標を改善するための探索手順について述べる。
実際に、自動検索は初期プログラムの大幅な改善を見出すことができることを示す。
論文 参考訳(メタデータ) (2021-09-14T20:52:55Z) - Leveraging Language to Learn Program Abstractions and Search Heuristics [66.28391181268645]
LAPS(Language for Abstraction and Program Search)は、自然言語アノテーションを用いて、ライブラリとニューラルネットワークによる合成のための検索モデルの共同学習をガイドする手法である。
最先端のライブラリ学習システム(DreamCoder)に統合されると、LAPSは高品質なライブラリを生成し、検索効率と一般化を改善する。
論文 参考訳(メタデータ) (2021-06-18T15:08:47Z) - Selection-Expansion: A Unifying Framework for Motion-Planning and
Diversity Search Algorithms [69.87173070473717]
本稿では,2つの多様性探索アルゴリズム,ノベルティ探索アルゴリズムとゴール探索処理アルゴリズムの特性について検討する。
mpアルゴリズムとの関係は、ポリシーパラメータ空間と結果空間の間のマッピングの滑らかさ、あるいは滑らかさの欠如が検索効率において重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2021-04-10T13:52:27Z) - CNN-based Spoken Term Detection and Localization without Dynamic
Programming [16.322420712725716]
提案アルゴリズムは、音声信号の様々な部分の単語埋め込みを予測することにより、ある単語が所定の音声信号内で発話されたかどうかを推定する。
アルゴリズムは、ターゲット項のすべての可能な位置を同時に予測し、最適な検索のために動的プログラミングを必要としません。
論文 参考訳(メタデータ) (2021-03-07T14:50:58Z) - Representing Partial Programs with Blended Abstract Semantics [62.20775388513027]
プログラム合成エンジンにおける部分的なプログラム表現手法について紹介する。
モジュラーニューラルネットワークとして実装された近似実行モデルを学ぶ。
これらのハイブリッドニューロシンボリック表現は、実行誘導型シンセサイザーがより強力な言語構成を使うことができることを示す。
論文 参考訳(メタデータ) (2020-12-23T20:40:18Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。