論文の概要: parallelcbf: A composable safety-filter and auditability framework for tensor-parallel reinforcement learning
- arxiv url: http://arxiv.org/abs/2605.15509v1
- Date: Fri, 15 May 2026 01:06:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 17:44:16.290889
- Title: parallelcbf: A composable safety-filter and auditability framework for tensor-parallel reinforcement learning
- Title(参考訳): parallelcbf: テンソル並列強化学習のための構成可能な安全フィルタと監査性フレームワーク
- Authors: Yijun Lu, Zilei Yang, Yuyin Ma,
- Abstract要約: 我々はParallelCBF v0.1.0をApache2.0でリリースし、4層構成可能なAPI、デュアルバリア(二乗/線形予測)CBFのCPUPyTorch参照実装を組み込んだ。
我々は,フレームワークの監査性層が,事前登録された収束基準を満たしない下流トレーニング段階を停止する,代表的なエンドツーエンドパイプライン実行を報告した。
- 参考スコア(独自算出の注目度): 0.45470638320073126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Isaac Lab provides massive parallel UAV simulation, OmniSafe and safe-control-gym provide constrained-RL benchmarks, and CBFKit provides control-barrier-function synthesis tooling, no existing framework unifies these capabilities for end-to-end safety-constrained training. ParallelCBF is the first framework to unify (i)~tensor-parallel UAV environments, (ii)~hard-gate CBF safety filters, (iii)~sharded BC-to-RL pipelines, and (iv)~first-class operational auditability -- pre-registration, watchdog registries, failure forensics, and dataset audits as composable APIs rather than user-implemented scripts. We release ParallelCBF v0.1.0 under Apache~2.0 with a four-layer composable API, a CPU PyTorch reference implementation of a dual-barrier (squared / linear-predictive) CBF, property-based safety invariance tests across vectorized batch sizes that complete in 1.67~s for the full 39-test suite, and a 31{,}415-episode behavior-cloning collection campaign whose curriculum mix, per-bucket yields, and dataset SHA-256 are auditable through the framework's own \texttt{ops} primitives. We report a representative end-to-end pipeline execution in which the framework's auditability layer halted a downstream training stage that did not meet pre-registered convergence criteria, preventing silent propagation of a degraded checkpoint -- an architectural property we argue is necessary, not merely useful, for reproducible empirical robotics research. The framework is installable via \texttt{pip install parallelcbf}; source and release artifacts are available at https://github.com/xiaoyang-123-cell/ParallelCBF.
- Abstract(参考訳): Isaac Labは大規模なUAVシミュレーションを提供し、OmniSafeとSafe-control-gymは制約付きRLベンチマークを提供し、CBFKitは制御バリア機能合成ツールを提供するが、既存のフレームワークはこれらの機能をエンドツーエンドの安全制約付きトレーニングに統一していない。
ParallelCBFが最初の統合フレームワーク
(i)-テンソルパラレルUAV環境
(ii)〜ハードゲートCBF安全フィルタ
(iii)-sharded BC-to-RL Pipelines, and
(iv)~ ファーストクラスの運用監査 -- 事前登録、ウォッチドッグ登録、障害調査、データセット監査を、ユーザ実装スクリプトではなく、構成可能なAPIとして提供する。
4層構成可能なAPI、CPU PyTorchによるデュアルバリア(二乗/線形予測型)CBFのリファレンス実装、39テストスイートの1.67〜sで完了したベクトル化されたバッチサイズにわたるプロパティベースの安全性の不変性テスト、カリキュラムとバケット単位の収率とデータセットを混合した31{,}415-episodeビヘイビアクローニングコレクションキャンペーン、SHA-256は、フレームワーク自身の \textt{ops} プリミティブを通じて監査可能である。
我々は,フレームワークの監査層が,事前登録された収束基準を満たしていない下流トレーニング段階を停止し,劣化したチェックポイントの静かな伝播を防止した,代表的なエンドツーエンドパイプライン実行について報告する。
ソースとリリースアーティファクトはhttps://github.com/xiaoyang-123-cell/ParallelCBF.comで入手できる。
関連論文リスト
- CHAINTRIX: A multi-pipeline LLM-augmented framework for automated smart-contract security auditing [3.8615905456206256]
Chaintrixは、スマートコントラクトエクスプロイトのためのエンドツーエンドの監査フレームワークである。
120の脆弱性のうち86が検出され、25の監査が100%リコールされた。
論文 参考訳(メタデータ) (2026-05-10T06:02:22Z) - Enforcing Attestable Workflows across Untrusted Networks [0.0]
我々は,信頼された実行環境を分割したTrusted Computing Base設計により統合したアーキテクチャであるcodenameを提案する。
codenameはカーネルに暗号化処理をアンカーすることで、ネイティブ速度の暗号化ルーティングを実現する。
分散パイプラインでは、コードネームはプレーンテキストのベースラインに対してわずか6.1%のペナルティしか発生せず、ユーザ空間のペナルティの62%をバイパスしている。
論文 参考訳(メタデータ) (2026-05-10T03:45:22Z) - ClawGym: A Scalable Framework for Building Effective Claw Agents [47.47444724291439]
ClawGymは、Clawスタイルのパーソナルエージェント開発の全ライフサイクルをサポートするスケーラブルなフレームワークである。
ClawGym-SynDataは、ペルソナ駆動のインテントとスキル接地操作から合成された13.5Kのフィルタリングタスクのデータセットである。
次に、ブラックボックスのロールアウト軌跡の教師付き微調整を通じて、ClawGym-Agentsと呼ばれる有能なClawスタイルのモデルのファミリーを訓練する。
さらに、自動フィルタリングとヒューマンLLMレビューを通じて200インスタンスのベンチマークであるClawGym-Benchを構築します。
論文 参考訳(メタデータ) (2026-04-29T17:12:22Z) - LIDARLearn: A Unified Deep Learning Library for 3D Point Cloud Classification, Segmentation, and Self-Supervised Representation Learning [1.2599533416395765]
3次元の3次元クラウド解析は、自律運転やロボット工学から林業や生態モニタリングまで幅広い応用の中心となっている。
libは統合されたPyTorchライブラリで、29の教師付きアーキテクチャ、7つのSSL事前トレーニングメソッド、5つのPEFT戦略を含む55以上のモデル構成を統合している。
libは、標準化されたトレーニングランナー、階層化された$K$-fold分割によるクロスバリデーション、自動化/CSVテーブル生成、厳密なマルチモデル比較のための臨界差図を用いたFriedman/Nemenyi統計テスト、200以上の自動テストを備えた総合的なテストスイートを提供する。
論文 参考訳(メタデータ) (2026-04-12T19:10:12Z) - RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文 参考訳(メタデータ) (2026-01-30T08:29:01Z) - Plug-and-Play Benchmarking of Reinforcement Learning Algorithms for Large-Scale Flow Control [61.155940786140455]
強化学習(RL)は,アクティブフロー制御(AFC)において有望な結果を示した。
現在のAFCベンチマークは、外部計算流体力学(CFD)の解法に依存しており、完全には微分不可能であり、3Dとマルチエージェントのサポートが限られている。
AFCにおけるRLのための最初のスタンドアロンで完全に差別化可能なベンチマークスイートであるFluidGymを紹介する。
論文 参考訳(メタデータ) (2026-01-21T14:13:44Z) - Exposing Hidden Interfaces: LLM-Guided Type Inference for Reverse Engineering macOS Private Frameworks [7.370020034607549]
MOTIFは、ツール拡張分析とObjective-C型推論に特化した大きな言語モデルを統合するエージェントフレームワークである。
バイナリを解析可能なインターフェースに変換することで、MOTIFはランタイム内部の体系的な監査のためのスケーラブルな基盤を確立する。
論文 参考訳(メタデータ) (2026-01-04T21:44:55Z) - Boundary-to-Region Supervision for Offline Safe Reinforcement Learning [56.150983204962735]
バウンダリ・トゥ・レギオン(Bundary-to-Region, B2R)は、コスト信号による非対称な条件付けを可能にするフレームワークである。
B2Rは、CTGを固定された安全予算の下で境界制約として再定義し、すべての実行可能な軌道のコスト分布を統一する。
実験の結果,B2Rは38項目中35項目の安全制約を満たすことがわかった。
論文 参考訳(メタデータ) (2025-09-30T03:38:20Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - B-Side: Binary-Level Static System Call Identification [1.6050948947693462]
B-Sideはシステムコールのスーパーセットを識別できる静的バイナリ解析ツールで、x86-64の静的/動的実行実行が実行時に呼び出すことができる。
B-Sideは、プログラム/ライブラリソースへのアクセスを前提とせず、シンボリックな実行を活用することで、適切な精度を示す。
論文 参考訳(メタデータ) (2024-10-23T17:26:52Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。