Fugu-MT 論文翻訳(概要): Runtime Monitoring of Perception-Based Autonomous Systems via Embedding Temporal Logic

論文の概要: Runtime Monitoring of Perception-Based Autonomous Systems via Embedding Temporal Logic

arxiv url: http://arxiv.org/abs/2605.12651v2
Date: Thu, 14 May 2026 01:44:18 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-15 15:19:49.90337
Title: Runtime Monitoring of Perception-Based Autonomous Systems via Embedding Temporal Logic
Title（参考訳）: 時間論理の埋め込みによる知覚に基づく自律システムの実行時モニタリング
Authors: Parv Kapoor, Abigail Hammer, Ashish Kapoor, Karen Leung, Eunsuk Kang,
Abstract要約: 自律システムの監視は伝統的に、低次元状態変数上で定義された離散論理命題に連続的なセンサ観測をマッピングすることに依存している。本研究では,学習した埋め込み空間で直接監視を行う時間論理であるEmbedding Temporal Logic (ETL)を提案する。提案手法は複数の操作環境にまたがって評価され,ETLが基幹構造セマンティクスと強い経験的一致を達成できることを示す。
参考スコア（独自算出の注目度）: 16.340546556245528
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Runtime monitoring of autonomous systems traditionally relies on mapping continuous sensor observations to discrete logical propositions defined over low-dimensional state variables. This abstraction breaks down in perception-driven settings, where such mappings require additional learned modules that are often computationally expensive, brittle, and semantically misaligned. In this work, we propose Embedding Temporal Logic (ETL), a temporal logic that performs monitoring directly in learned embedding spaces. ETL defines predicates through distances between observed embeddings and target embeddings derived from reference observations. This formulation allows specifications to capture high-level perceptual concepts, such as similarity to visual goals or avoidance of semantic regions, that are difficult or impossible to express using traditional predicates. By composing these predicates with temporal operators, ETL naturally expresses temporally extended and sequential perceptual behaviors. We introduce ETL monitors for evaluating specifications over bounded embedding traces, along with a conformal calibration procedure that provides reliable and safety-oriented predicate evaluation. We evaluate our approach across multiple manipulation environments to show that ETL achieves strong empirical agreement with ground-truth semantics, including accurate monitoring of temporally composed behaviors.
Abstract（参考訳）: 自律システムの実行時の監視は、伝統的に、低次元状態変数上で定義された離散論理命題に連続的なセンサ観測をマッピングすることに依存している。この抽象化は、知覚駆動的な設定に分解され、そのようなマッピングでは、しばしば計算コストが高く、不安定で、意味的に不一致な、追加の学習モジュールが必要になります。本研究では,学習した埋め込み空間で直接監視を行う時間論理であるEmbedding Temporal Logic (ETL)を提案する。 ETLは、観測された埋め込みと基準観測から導かれたターゲット埋め込みの間の距離を通して述語を定義する。この定式化により、視覚的目標との類似性や意味領域の回避など、従来の述語を用いた表現が困難または不可能な高レベルの知覚概念を捉えることができる。これらの述語を時間演算子と合成することにより、ETLは時間的に拡張され、シーケンシャルな知覚行動を表現する。本研究では,有界な埋め込みトレースに対する仕様評価のためのETLモニタと,信頼性と安全性を指向した述語評価を行うコンフォーマルキャリブレーション手法を提案する。提案手法は複数の操作環境にまたがって評価され,ETLが時間的構成行動の正確なモニタリングを含む,基幹構造セマンティクスとの強い経験的合意を達成できることを示す。

関連論文リスト

Tracking the Truth: Object-Centric Spatio-Temporal Monitoring for Video Large Language Models [154.39583176906893]
大規模言語モデル(ML)は高度な理解を持ち、シーンにおける幻覚の傾向が高い。これは、時間的モニタリングの失敗、オブジェクトの動的アイデンティティ、状態、そして時間とともに関係を永続的に追跡する能力に起因している、と我々は主張する。既存のベンチマークでは、局所的な視覚的手がかりや統計的先行によってしばしば解決される1つの最終回答クエリに頼って、この欠陥を曖昧にしている。
論文参考訳（メタデータ） (2026-05-09T14:32:36Z)
Temporal Structure Matters for Efficient Test-Time Adaptation in Wearable Human Activity Recognition [0.20391237204597365]
テスト時間適応(TTA)は、実世界のクロスユーザー分散シフト下での性能低下を緩和する。既存の手法は主に視覚タスクから仮定を継承し、WHARストリームに固有のウィンドウ間時間構造を過小評価する。本稿では,WHARのための軽量かつバックプロパゲーションフリーなTTAフレームワークであるSIGHTを提案する。
論文参考訳（メタデータ） (2026-05-06T08:06:27Z)
OFlow: Injecting Object-Aware Temporal Flow Matching for Robust Robotic Manipulation [55.56490813640669]
VLAモデルは典型的には現在のフレームにのみ作用するが、将来の予測とオブジェクト認識推論は別々の潜在空間でしばしば学習される。本稿では,時間的フォアシークエンスとオブジェクト認識推論を共通化することで,制約に対処するフレームワークOFlowを提案する。提案手法は, 時間的フローマッチングを用いて将来の潜伏者を予測し, 物理的に関係のある手がかりを強調するオブジェクト認識表現に分解する。
論文参考訳（メタデータ） (2026-04-20T06:38:01Z)
Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文参考訳（メタデータ） (2026-02-10T10:16:27Z)
1 + 1 > 2: Detector-Empowered Video Large Language Model for Spatio-Temporal Grounding and Reasoning [53.28271278708241]
本稿では,DEViL の略である Detector-Empowered Video LLM を提案する。 DEViLはオープンボキャブラリ検出器(OVD)とビデオLLMを結合する単に空間的なプロンプトやセグメンタスイッチとして機能するトークンとは異なり、RTTは制御信号とOVDのテキスト埋め込みの置き換えの両方として機能する。
論文参考訳（メタデータ） (2025-12-07T06:11:15Z)
Context-Aware Zero-Shot Anomaly Detection in Surveillance Using Contrastive and Predictive Spatiotemporal Modeling [0.0]
この研究は、トレーニング中に異常な例に晒されることなく異常事象を識別する、文脈対応のゼロショット異常検出フレームワークを導入する。提案したハイブリッドアーキテクチャは、TimeSformer、DPC、CLIPを組み合わせて、豊富な時空間特徴を抽出する。コンテキストゲーティング機構は、シーン対応キューやグローバルビデオ機能による予測を調整することにより、意思決定をさらに強化する。
論文参考訳（メタデータ） (2025-08-25T20:22:35Z)
Uncovering the Missing Pattern: Unified Framework Towards Trajectory Imputation and Prediction [60.60223171143206]
軌道予測は、観測されたシーケンスから実体運動や人間の行動を理解する上で重要な作業である。現在の方法では、観測されたシーケンスが完了したと仮定し、欠落した値の可能性を無視する。本稿では,グラフに基づく条件変動リカレントニューラルネットワーク (GC-VRNN) の統一フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-28T14:27:27Z)
Formalizing and Evaluating Requirements of Perception Systems for Automated Vehicles using Spatio-Temporal Perception Logic [25.070876549371693]
本研究では,空間的および時間的演算子を用いた知覚データに対する推論を可能にするロジックを提案する。 STPLの大きな利点の1つは、知覚システムの機能性能の基本的な正当性チェックを容易にすることである。
論文参考訳（メタデータ） (2022-06-29T02:36:53Z)
Supporting Optimal Phase Space Reconstructions Using Neural Network Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文参考訳（メタデータ） (2020-06-19T21:04:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。