論文の概要: An Example of the SAM+ Algorithm for Learning Action Models for
Stochastic Worlds
- arxiv url: http://arxiv.org/abs/2203.12499v1
- Date: Wed, 23 Mar 2022 15:51:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-24 14:55:50.868251
- Title: An Example of the SAM+ Algorithm for Learning Action Models for
Stochastic Worlds
- Title(参考訳): 確率的世界のための行動モデル学習のためのSAM+アルゴリズムの例
- Authors: Brendan Juba, Roni Stern
- Abstract要約: コーヒー問題のPDDL版において,計画行動モデルを学習するアルゴリズムであるSAM+アルゴリズムの完全な例を示す。
SAM+アルゴリズムの簡単な説明と単純化されたコーヒードメインの詳細な説明を行い、単純化されたコーヒードメイン上でそれを実行する結果について説明する。
- 参考スコア(独自算出の注目度): 41.688641158455745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this technical report, we provide a complete example of running the SAM+
algorithm, an algorithm for learning stochastic planning action models, on a
simplified PPDDL version of the Coffee problem. We provide a very brief
description of the SAM+ algorithm and detailed description of our simplified
version of the Coffee domain, and then describe the results of running it on
the simplified Coffee domain.
- Abstract(参考訳): 本報告では,コーヒー問題の簡便なppddl版上で,確率的計画行動モデル学習のためのアルゴリズムであるsam+アルゴリズムの完全な例を示す。
SAM+アルゴリズムの簡単な説明と単純化されたコーヒードメインの詳細な説明を行い、単純化されたコーヒードメイン上でそれを実行する結果について説明する。
関連論文リスト
- Reverse That Number! Decoding Order Matters in Arithmetic Learning [49.5504492920404]
本研究は,最少の桁から出力を優先順位付けすることで,桁順を再評価する新たな戦略を導入する。
従来のSOTA法と比較すると,通常のトレーニングで使用するトークンの3分の1しか必要とせず,精度の全体的な改善が見られた。
論文 参考訳(メタデータ) (2024-03-09T09:04:53Z) - TinySAM: Pushing the Envelope for Efficient Segment Anything Model [76.21007576954035]
我々は,強力なゼロショット性能を維持しつつ,小さなセグメントの任意のモデル(TinySAM)を得るためのフレームワークを提案する。
本研究は,まず,軽量学生モデルを蒸留するためのハードプロンプトサンプリングとハードマスク重み付け戦略を用いた,フルステージの知識蒸留法を提案する。
また、学習後の量子化を高速化可能なセグメンテーションタスクに適用し、計算コストをさらに削減する。
論文 参考訳(メタデータ) (2023-12-21T12:26:11Z) - PBES: PCA Based Exemplar Sampling Algorithm for Continual Learning [0.0]
本稿では、主成分分析(PCA)と中央値サンプリングに基づく新しい模範選択手法と、クラス増分学習の設定におけるニューラルネットワークトレーニング方式を提案する。
このアプローチは、データの異常値による落とし穴を回避し、さまざまなインクリメンタル機械学習モデルの実装と使用の両方が容易である。
論文 参考訳(メタデータ) (2023-12-14T21:27:38Z) - Self-guided Few-shot Semantic Segmentation for Remote Sensing Imagery
Based on Large Vision Models [14.292149307183967]
本研究は,少数ショットセマンティックセグメンテーションの自動化を目的とした構造化フレームワークを提案する。
SAMモデルを利用して、意味的に識別可能なセグメンテーションの結果をより効率的に生成する。
提案手法の中心は,従来のガイドマスクを利用してSAMの粗い画素単位のプロンプトを生成する,新しい自動プロンプト学習手法である。
論文 参考訳(メタデータ) (2023-11-22T07:07:55Z) - Let's reward step by step: Step-Level reward model as the Navigators for
Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。
LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。
提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文 参考訳(メタデータ) (2023-10-16T05:21:50Z) - RSPrompter: Learning to Prompt for Remote Sensing Instance Segmentation
based on Visual Foundation Model [29.42043345787285]
本稿では,Segment Anything Model (SAM) のための適切なプロンプトの生成を学習する手法を提案する。
これによりSAMはリモートセンシング画像に対して意味的に識別可能なセグメンテーション結果を生成することができる。
また,SAMコミュニティ内での最近の進歩を図り,その性能をRSPrompterと比較する。
論文 参考訳(メタデータ) (2023-06-28T14:51:34Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - PDPP:Projected Diffusion for Procedure Planning in Instructional Videos [30.637651835289635]
授業ビデオにおけるプロシージャプランニングの問題について検討する。
この問題は、非構造化の実生活ビデオの現在の視覚的観察から、ゴール指向のプランを作成することを目的としている。
論文 参考訳(メタデータ) (2023-03-26T10:50:16Z) - Model-free Representation Learning and Exploration in Low-rank MDPs [64.72023662543363]
低位mdpに対して,最初のモデルフリー表現学習アルゴリズムを提案する。
主要なアルゴリズムの貢献は新しいミニマックス表現の学習の目的です。
結果は複雑な環境にスケールする一般的な関数近似を収容できます。
論文 参考訳(メタデータ) (2021-02-14T00:06:54Z) - Model-Agnostic Explanations using Minimal Forcing Subsets [11.420687735660097]
そこで本研究では,モデル決定に欠かせない最小限のトレーニングサンプルを同定する,モデルに依存しない新しいアルゴリズムを提案する。
本アルゴリズムは,制約付き最適化問題を解くことにより,このような「欠かせない」サンプルの集合を反復的に同定する。
結果から,本アルゴリズムは局所モデルの振る舞いをよりよく理解する上で,効率的かつ容易に記述できるツールであることがわかった。
論文 参考訳(メタデータ) (2020-11-01T22:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。