論文の概要: Sim-to-Real Betting on the E-Process: Bringing "simulators" to anytime-valid confidence sequences
- arxiv url: http://arxiv.org/abs/2606.24038v1
- Date: Tue, 23 Jun 2026 00:38:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.716893
- Title: Sim-to-Real Betting on the E-Process: Bringing "simulators" to anytime-valid confidence sequences
- Title(参考訳): E-Process上でのSim-to-Real Betting:"simulator"を任意の有意な信頼シーケンスにもたらす
- Authors: Yujia Chen, Bowen Weng,
- Abstract要約: このノートでは、sim-to-realパフォーマンスの見積もりとベッティング、そして安全で有意な推論の統合について記述する。
本手法は,ロボットの性能試験において特に有用である平均推定のための,効率的で信頼性の高い証明書を生成する。
- 参考スコア(独自算出の注目度): 6.3716852889096325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This note describes an integration of the sim-to-real performance estimate with betting (from Chen et al.) and the safe anytime-valid inference (from Ramdas et al.). Using the scaled simulators. The method produces efficient, reliable certificates for the mean estimate, an approach that is especially valuable in robot performance testing. This note gives a primary, self-contained account of the construction; preliminaries of the respective methods are kept at a minimum, and one shall refer to the original works for full detail. Some synthetic examples demonstrating the proposed algorithm can be found at https://github.com/ISUSAIL/Bet4Sim2Real-EProcess.
- Abstract(参考訳): このノートでは、sim-to-realパフォーマンス見積とbetting(Chenらによる)とSafe Anytime-valid推論(Ramdasらによる)の統合について説明している。
スケールしたシミュレータを使用する。
本手法は,ロボットの性能試験において特に有用である平均推定のための,効率的で信頼性の高い証明書を生成する。
本覚書は,構成の一次的かつ自己完結的な説明を与え,各方法の予備規定は,最小限に維持され,かつ,原本について,完全な詳細について言及する。
提案されたアルゴリズムを示すいくつかの合成例は、https://github.com/ISUSAIL/Bet4Sim2Real-EProcessにある。
関連論文リスト
- SimEval-IR: A Unified Toolkit and Benchmark Suite for Evaluating User Simulators and Search Sessions [1.1105673928718571]
オープンソースのツールキットとベンチマークスイートであるSimEval-IRについて述べる。
SimEval-IR は,(1) セッション検索と対話を統一する標準セッションスキーマ,(2) 行動リアリズム,RATE スタイルの推定によるテスタの信頼性,および2つの言語と4つのシミュレーターファミリーの4つの実データセットのベースライン結果に関する3つのベンチマークを提供する。
論文 参考訳(メタデータ) (2026-04-30T13:56:18Z) - Betting for Sim-to-Real Performance Evaluation [5.669264620577287]
我々は、ベッティング機構が正確かつ効率的に推定できる理論条件を開発する。
これらの近似ベッティング戦略が意図通りに機能している場合に診断する具体的な決定ルールを提供する。
また,ロボットマニピュレータの実際のピック・アンド・プレイス精度を推定するために,合成分布群を用いた実例を示した。
論文 参考訳(メタデータ) (2026-04-27T03:58:50Z) - ConvApparel: A Benchmark Dataset and Validation Framework for User Simulators in Conversational Recommenders [48.83868690303791]
このギャップに対処するために設計された、人間とAIの会話の新しいデータセットであるConvApparelを紹介します。
そのユニークなデュアルエージェントデータ収集プロトコル -- "よい" と "悪い" のレコメンデータを使用する -- は、偽物検証を可能にする。
本稿では,統計的アライメント,人間的類似度スコア,および対実的検証を組み合わせた総合的検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-18T23:00:21Z) - Pseudo-Simulation for Autonomous Driving [66.1981253104508]
既存の自動運転車(AV)の評価パラダイムは、重大な制限に直面している。
現実世界の評価は、安全上の懸念と現実主義の欠如のためにしばしば困難である。
オープンループ評価は、一般的に複合的なエラーを見落としているメトリクスに依存する。
論文 参考訳(メタデータ) (2025-06-04T17:57:53Z) - Correlation of Software-in-the-Loop Simulation with Physical Testing for Autonomous Driving [0.0]
本稿では,社内で開発されたSILシミュレーションツールチェーンの検証事例について述べる。
テストトラックをSILシミュレーションと整合させるため,同期手法を提案する。
提案手法の有効性を示すための予備的な結果を示す。
論文 参考訳(メタデータ) (2024-06-05T08:11:10Z) - Exploring validation metrics for offline model-based optimisation with
diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。
モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。
本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文 参考訳(メタデータ) (2022-11-19T16:57:37Z) - Falsification of Cyber-Physical Systems using Bayesian Optimization [4.164131508933521]
サイバー物理システム(CPS)は、しばしば複雑で安全に重要であり、システムの仕様が満たされることを確実にすることが困難かつ決定的に重要である。
シミュレーションベースのファルシフィケーションは、CPSの正確性に対する信頼性を高めるための実践的なテスト手法である。
本研究では,サロゲートモデルを学習し,入力信号のパラメータ化と仕様評価の関係を捉える。
論文 参考訳(メタデータ) (2022-09-14T15:52:19Z) - A User's Guide to Calibrating Robotics Simulators [54.85241102329546]
本稿では,シミュレーションで学習したモデルやポリシーを現実世界に伝達することを目的とした,様々なアルゴリズムの研究のためのベンチマークとフレームワークを提案する。
我々は、様々なアルゴリズムの性能に関する洞察を特徴付け、提供するために、広く知られたシミュレーション環境の実験を行う。
我々の分析は、この分野の実践者にとって有用であり、sim-to-realアルゴリズムの動作と主特性について、より深い選択をすることができる。
論文 参考訳(メタデータ) (2020-11-17T22:24:26Z) - AutoSimulate: (Quickly) Learning Synthetic Data Generation [70.82315853981838]
目的の新たな微分可能近似に基づく最適な合成データ生成法を提案する。
提案手法は,学習データ生成の高速化(最大50Times$)と,実世界のテストデータセットの精度向上(+8.7%$)を実現している。
論文 参考訳(メタデータ) (2020-08-16T11:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。