論文の概要: Playing Games with your PET: Extending the Partial Exploration Tool to Stochastic Games
- arxiv url: http://arxiv.org/abs/2405.03885v1
- Date: Mon, 6 May 2024 22:07:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 16:14:28.507383
- Title: Playing Games with your PET: Extending the Partial Exploration Tool to Stochastic Games
- Title(参考訳): PETでゲームをする: 部分探索ツールを確率ゲームに拡張
- Authors: Tobias Meggendorfer, Maximilian Weininger,
- Abstract要約: 本稿では,確率システムの検証ツールである部分探索ツール(PET)のバージョン2.0を提案する。
我々は,最近,音価アルゴリズムの統一化フレームワークに基づいて,ゲームのサポートを追加することで,前バージョンを拡張した。
PET2は、タイプリーチビリティ/安全性と平均ペイオフの目標によって、ゲームを解決するための健全で効率的なアプローチを実装した最初のツールである。
- 参考スコア(独自算出の注目度): 4.258703386469646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present version 2.0 of the Partial Exploration Tool (PET), a tool for verification of probabilistic systems. We extend the previous version by adding support for stochastic games, based on a recent unified framework for sound value iteration algorithms. Thereby, PET2 is the first tool implementing a sound and efficient approach for solving stochastic games with objectives of the type reachability/safety and mean payoff. We complement this approach by developing and implementing a partial-exploration based variant for all three objectives. Our experimental evaluation shows that PET2 offers the most efficient partial-exploration based algorithm and is the most viable tool on SGs, even outperforming unsound tools.
- Abstract(参考訳): 本稿では,確率システムの検証ツールである部分探索ツール(PET)のバージョン2.0を提案する。
我々は,最近,音価反復アルゴリズムの統一化フレームワークに基づいて,確率ゲームのサポートを追加することで,前バージョンを拡張した。
これにより、PET2は、型到達性と安全性、平均ペイオフを目標とした確率ゲームを解決するための、音質と効率のよいアプローチを最初に実装したツールである。
我々は,3つの目的すべてに対して部分探索に基づく変種を開発し,実装することで,このアプローチを補完する。
実験の結果,PET2は最も効率的な部分探索に基づくアルゴリズムであり,SG上では最も有効なツールであり,非音響ツールよりも優れていた。
関連論文リスト
- ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models [51.35570730554632]
ESPnet-SPKは、話者埋め込み抽出器を訓練するためのツールキットである。
我々は、x-vectorから最近のSKA-TDNNまで、いくつかのモデルを提供している。
開発モデルと他のドメインとの橋渡しも目指しています。
論文 参考訳(メタデータ) (2024-01-30T18:18:27Z) - Back to 3D: Few-Shot 3D Keypoint Detection with Back-Projected 2D Features [64.39691149255717]
3次元形状のキーポイント検出には意味的および幾何学的認識が必要である。
我々はキーポイント候補最適化モジュールを用いて,その形状上のキーポイントの平均分布を一致させる。
結果として得られたアプローチは、KeyPointNetデータセットで数ショットのキーポイント検出のための新しい状態を実現する。
論文 参考訳(メタデータ) (2023-11-29T21:58:41Z) - SPRINT: A Unified Toolkit for Evaluating and Demystifying Zero-shot
Neural Sparse Retrieval [92.27387459751309]
ニューラルスパース検索を評価するための統一PythonツールキットであるSPRINTを提供する。
我々は、よく認識されているベンチマークBEIRにおいて、強く再現可能なゼロショットスパース検索ベースラインを確立する。
SPLADEv2は、元のクエリとドキュメントの外で、ほとんどのトークンでスパース表現を生成する。
論文 参考訳(メタデータ) (2023-07-19T22:48:02Z) - Exploring the Impact of Model Scaling on Parameter-Efficient Tuning [100.61202305296275]
大規模事前学習言語モデル(PLM)を効果的に駆動できるスケーリング効率チューニング(PET)法
小型PLMでは、PET法には通常顕著な性能差がある。
本稿では,Arbitrary PET (APET) 法という,より柔軟なPET法を提案する。
論文 参考訳(メタデータ) (2023-06-04T10:10:54Z) - GOOD: General Optimization-based Fusion for 3D Object Detection via
LiDAR-Camera Object Candidates [10.534984939225014]
3次元物体検出は、自律運転における知覚タスクの中核となる基礎となる。
Goodは汎用的な最適化ベースの融合フレームワークで、追加のモデルをトレーニングすることなく、満足度の高い検出を実現できる。
nuScenesとKITTIデータセットの両方の実験を行い、その結果、GOODはPointPillarsと比較してmAPスコアで9.1%上回っていることが示された。
論文 参考訳(メタデータ) (2023-03-17T07:05:04Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - SELTO: Sample-Efficient Learned Topology Optimization [2.2366638308792735]
そこで我々は,TO DLパイプラインのためのサンプル効率の高いコンポーネントを作成するために,物理に基づく前処理と同変ネットワークについて検討する。
エンド・ツー・エンドの教師付きトレーニングを用いて,大規模なアブレーション評価を行った。
その結果, 試料効率と予測値の物理的正確性が大きく向上した。
問題とそれに対応する真理解を含む2つの最初のTOデータセットを公表する。
論文 参考訳(メタデータ) (2022-09-12T09:02:00Z) - PyEPO: A PyTorch-based End-to-End Predict-then-Optimize Library for
Linear and Integer Programming [9.764407462807588]
我々はPythonのPyTorchベースのエンドツーエンド予測最適化ライブラリであるPyEPOパッケージを提示する。
PyEPOは、予測対象関数係数を持つ線形および整数プログラミングのための最初の汎用ツールである。
論文 参考訳(メタデータ) (2022-06-28T18:33:55Z) - Towards Learning Universal Hyperparameter Optimizers with Transformers [57.35920571605559]
我々は,テキストベースのトランスフォーマーHPOフレームワークであるOptFormerを紹介した。
実験の結果,OptFormerは少なくとも7種類のHPOアルゴリズムを模倣できることがわかった。
論文 参考訳(メタデータ) (2022-05-26T12:51:32Z) - Robust and Decomposable Average Precision for Image Retrieval [0.0]
画像検索において、標準的な評価基準はスコアランキング(例えば平均精度(AP))に依存している。
本稿では,ロバストで分解可能な平均精度(ROADMAP)を提案する。
我々は、APを用いたディープニューラルネットワークのエンドツーエンドトレーニングにおいて、非微分可能性と非分解性という2つの大きな課題に対処する。
論文 参考訳(メタデータ) (2021-10-01T12:00:43Z) - SPLADE v2: Sparse Lexical and Expansion Model for Information Retrieval [11.38022203865326]
SPLADEモデルは、最先端の高密度かつスパースなアプローチに関して、高度にスパースな表現と競争結果を提供する。
我々は、プール機構を変更し、文書拡張のみに基づいてモデルをベンチマークし、蒸留で訓練されたモデルを導入する。
全体として、SPLADEはTREC DL 2019のNDCG@10で9ドル以上のゲインで大幅に改善され、BEIRベンチマークで最先端の結果が得られた。
論文 参考訳(メタデータ) (2021-09-21T10:43:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。