論文の概要: Predictive Spatio-Temporal Scene Graphs for Semi-Static Scenes
- arxiv url: http://arxiv.org/abs/2605.00121v1
- Date: Thu, 30 Apr 2026 18:21:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.7063
- Title: Predictive Spatio-Temporal Scene Graphs for Semi-Static Scenes
- Title(参考訳): 半静的シーンのための予測時空間グラフ
- Authors: Miguel Saavedra-Ruiz, Charlie Gauthier, Kumaraditya Gupta, Shima Shahfar, Kirsty Ellis, Steven Parkison, Liam Paull,
- Abstract要約: 我々は,ロボットが幾何学的・意味論的に複雑な推論を行うことのできる「比意味表現」を構築した。
そこで本研究では,このようなテンポ・スパオ・セマンティック推論を行える手法を提案する。
この手法の根底にはPerpetua$*$というフィルターがあり、時間とともに観測される環境の状態についてベイズ的推論を行う。
- 参考スコア(独自算出の注目度): 7.5837599215194915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We have seen tremendous recent progress in our ability to build "spatio-semantic" representations that enable robots to perform complex reasoning across geometry and semantics. However, the vast majority of these methods lack any ability to perform reasoning across time. This is a desirable property in situations where a robot repeatedly observes an environment where instances may change in between observations, but in a structured way. Consider as an example a home environment where the location of a mug typically moves from the cupboard to a countertop to the sink and then back to the cupboard on a daily basis. We should be able to learn this cyclic behavior and use it to predict the state of the mug in the future. In this work, we propose a method that is able to perform this type of tempo-spatio-semantic reasoning. Underpinning the method is a filter, Perpetua$^*$, that performs Bayesian reasoning on the states of the environment that are observed over time. This filter is integrated within a 3D scene graph structure that we call PredictiveGraphs, where nodes represent objects and edges function as Perpetua$^*$ filters encoding spatio-semantic relationships. We validate the method in both simulation and real-world dynamic navigation tasks, where our real world experiments consist of an environment that is undergoing semi-static changes at a bi-hourly frequency over a period of three weeks. In both settings, we demonstrate that our method outperforms baselines in predicting future environment states, even in the presence of distributional shifts.
- Abstract(参考訳): ロボットが幾何学や意味論にまたがって複雑な推論を行えるような「比例意味表現」を構築する能力は、近年著しく進歩しています。
しかし、これらの手法の大部分は、時間にわたって推論を行う能力が欠如している。
これは、ロボットが観察間でインスタンスが変化しうる環境を、構造化された方法で繰り返し観察する状況において望ましい特性である。
マグカップの位置が通常、カップボードからカウンタートップからシンクに移動し、毎日カップボードに戻る家庭環境の例として考えてみましょう。
この循環的な振る舞いを学習し、将来、マグカップの状態を予測するためにそれを使うべきです。
そこで本研究では,このようなテンポ・スパオ・セマンティック推論を行える手法を提案する。
この手法の根底にはPerpetua$^*$というフィルターがあり、時間とともに観測される環境の状態についてベイズ的推論を行う。
このフィルタはPredictiveGraphsと呼ばれる3Dシーングラフ構造に統合されており、ノードはオブジェクトを表現し、エッジはPerpetua$^*$フィルタとして機能する。
本手法をシミュレーションと実世界の動的ナビゲーションタスクの両方で検証し,実世界の実験は3週間にわたってバイ時間周波数で半静的な変化を経験する環境から成っている。
いずれの設定においても,分布シフトがあっても,将来の環境状態を予測する上で,本手法がベースラインより優れていることを示す。
関連論文リスト
- Perpetua: Multi-Hypothesis Persistence Modeling for Semi-Static Environments [14.727014155729826]
本稿では,半静的特徴の力学をモデル化するPerpetuaを紹介する。
我々は「パーシステンス」と「エマージェンス」のフィルターの混合物をチェーンし、特徴が消失または再出現する確率をモデル化する。
Perpetuaは、類似のアプローチよりも正確でありながら、オンライン適応性があり、観察の欠如に対して堅牢であることに気付きました。
論文 参考訳(メタデータ) (2025-07-24T21:11:23Z) - Modeling Dynamic Environments with Scene Graph Memory [46.587536843634055]
本稿では,部分的に観測可能な動的グラフ上でのリンク予測という,新しいタイプのリンク予測問題を提案する。
私たちのグラフは、部屋とオブジェクトがノードであり、それらの関係がエッジにエンコードされるシーンの表現です。
エージェントの蓄積した観測結果をキャプチャする新しい状態表現 -- SGM (Scene Graph Memory) を提案する。
家庭で一般的に見られるセマンティックなパターンに従って,多様な動的グラフを生成する新しいベンチマークであるDynamic House Simulatorで,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-05-27T17:39:38Z) - Inverse Dynamics Pretraining Learns Good Representations for Multitask
Imitation [66.86987509942607]
このようなパラダイムを模倣学習でどのように行うべきかを評価する。
本稿では,事前学習コーパスがマルチタスクのデモンストレーションから成り立つ環境について考察する。
逆動力学モデリングはこの設定に適していると主張する。
論文 参考訳(メタデータ) (2023-05-26T14:40:46Z) - PRISM: Probabilistic Real-Time Inference in Spatial World Models [52.878769723544615]
PRISMはエージェントの動きと視覚知覚の確率的生成モデルにおけるリアルタイムフィルタリングの手法である。
提案手法は10Hzでリアルタイムに動作し,小型・中型屋内環境における最先端SLAMと同等に精度が高い。
論文 参考訳(メタデータ) (2022-12-06T13:59:06Z) - Temporal Alignment for History Representation in Reinforcement Learning [134.73528189399497]
環境に重要な変化のみを伴って歴史を表現することを提案する。
我々の手法(TempAl)は時間的に閉じたフレームを整列させ、環境の全般的かつゆっくりと変化する状態を明らかにする。
アーケード学習環境から利用可能なすべてのAtariゲーム上でTempAlを評価する。
論文 参考訳(メタデータ) (2022-04-07T15:52:40Z) - Averaging Spatio-temporal Signals using Optimal Transport and Soft
Alignments [110.79706180350507]
Fr'teche は双対性を意味し, 時間的バレシェセンタを定義するために提案した損失が有効であることを示す。
手書き文字と脳画像データによる実験は、我々の理論的発見を裏付けるものである。
論文 参考訳(メタデータ) (2022-03-11T09:46:22Z) - Learning to track environment state via predictive autoencoding [0.0]
この研究は、環境の前方モデルを学ぶためのニューラルネットワークを導入している。
この課題は、画像の形で時間的非構造的な観察から学ぶことによってのみ達成される。
ネットワークは、将来の観測と、信念分布からのサンプルの両方を出力することができる。
論文 参考訳(メタデータ) (2021-12-14T21:07:21Z) - Latent World Models For Intrinsically Motivated Exploration [140.21871701134626]
画像に基づく観察のための自己教師付き表現学習法を提案する。
我々は、部分的に観測可能な環境の探索を導くために、エピソードおよび寿命の不確実性を考慮する。
論文 参考訳(メタデータ) (2020-10-05T19:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。