論文の概要: Contrastive Representations for Temporal Reasoning
- arxiv url: http://arxiv.org/abs/2508.13113v1
- Date: Mon, 18 Aug 2025 17:20:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:11.509912
- Title: Contrastive Representations for Temporal Reasoning
- Title(参考訳): 時間的推論のためのコントラスト表現
- Authors: Alicja Ziarko, Michal Bortkiewicz, Michal Zawalski, Benjamin Eysenbach, Piotr Milos,
- Abstract要約: 標準的な時間的コントラスト学習は、その人気にもかかわらず、しばしば、刺激的な特徴に依存しているため、時間的構造を捉えることに失敗する。
本稿では,これらの突発的特徴を正に除去する負のサンプリング手法である,時間的推論のための Combinatorial Representations(CRTR)を紹介する。
CRTRはソコバンやルービックキューブのような複雑な時間構造を持つ領域に対して強い結果をもたらす。
- 参考スコア(独自算出の注目度): 22.44246878529232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In classical AI, perception relies on learning state-based representations, while planning, which can be thought of as temporal reasoning over action sequences, is typically achieved through search. We study whether such reasoning can instead emerge from representations that capture both perceptual and temporal structure. We show that standard temporal contrastive learning, despite its popularity, often fails to capture temporal structure due to its reliance on spurious features. To address this, we introduce Combinatorial Representations for Temporal Reasoning (CRTR), a method that uses a negative sampling scheme to provably remove these spurious features and facilitate temporal reasoning. CRTR achieves strong results on domains with complex temporal structure, such as Sokoban and Rubik's Cube. In particular, for the Rubik's Cube, CRTR learns representations that generalize across all initial states and allow it to solve the puzzle using fewer search steps than BestFS, though with longer solutions. To our knowledge, this is the first method that efficiently solves arbitrary Cube states using only learned representations, without relying on an external search algorithm.
- Abstract(参考訳): 古典的なAIでは、知覚は状態に基づく表現の学習に依存し、計画は行動列に対する時間的推論と見なされるが、通常、探索によって達成される。
このような推論が、知覚構造と時間構造の両方を捉える表現から生まれるかどうかを考察する。
標準的な時間的コントラスト学習は、その人気にもかかわらず、しばしば、刺激的な特徴に依存しているため、時間的構造を捉えることに失敗する。
そこで我々は,これらの突発的特徴を確実に除去し,時間的推論を容易にするために,負のサンプリングスキームを用いた,時間的推論のためのコンビネーショナル表現(CRTR)を導入する。
CRTRはソコバンやルービックキューブのような複雑な時間構造を持つ領域に対して強い結果をもたらす。
特にルービックキューブの場合、CRTRは全ての初期状態を一般化する表現を学び、BestFSよりも少ない探索ステップでパズルを解くことができる。
我々の知る限り、これは外部探索アルゴリズムに頼ることなく、学習した表現のみを用いて任意のキューブ状態を効率的に解く最初の方法である。
関連論文リスト
- 'Memory States' from Almost Nothing: Representing and Computing in a Non-associative Algebra [0.0]
本稿では,高次元空間における情報項目の表現と計算のための非連想的フレームワークを提案する。
これは空間コンピューティングの原理と、記憶に関する認知科学の実証的な発見と一致している。
論文 参考訳(メタデータ) (2025-05-13T08:43:02Z) - T-Rep: Representation Learning for Time Series using Time-Embeddings [5.885238773559017]
本稿では,時系列表現を時間ステップの粒度で学習する自己教師型T-Repを提案する。
T-Repはその特徴抽出器と共に時間のベクトル埋め込みを学び、時間的特徴を抽出する。
下流分類,予測,異常検出タスクにおけるT-Repの評価を行った。
論文 参考訳(メタデータ) (2023-10-06T15:45:28Z) - Unlocking Temporal Question Answering for Large Language Models with Tailor-Made Reasoning Logic [84.59255070520673]
大きな言語モデル(LLM)は、時間的推論に関わる際に課題に直面します。
本研究では,時間的質問応答タスクに特化して設計された新しいフレームワークであるTempLogicを提案する。
論文 参考訳(メタデータ) (2023-05-24T10:57:53Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw
Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。
近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。
提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文 参考訳(メタデータ) (2022-07-20T19:49:32Z) - Temporal Latent Bottleneck: Synthesis of Fast and Slow Processing
Mechanisms in Sequence Learning [85.95599675484341]
リカレントニューラルネットワークは、時間的に圧縮された表現の学習に対して強い誘導バイアスを持つ。
変換器は時間的に圧縮された表現を学習する際の帰納的バイアスがほとんどない。
論文 参考訳(メタデータ) (2022-05-30T00:12:33Z) - Self-Supervised Time Series Representation Learning via Cross
Reconstruction Transformer [11.908755624411707]
既存のアプローチは主に対照的な学習フレームワークを活用し、類似したデータペアと異なるデータペアを理解するために自動的に学習する。
本稿では、上記の問題を統一的に解くために、CRT(Cross Reconstruction Transformer)を提案する。
CRTはクロスドメインドロップ・リコンストラクションタスクを通じて時系列表現学習を実現する。
論文 参考訳(メタデータ) (2022-05-20T02:15:14Z) - Multi-scale temporal network for continuous sign language recognition [10.920363368754721]
連続手話認識は,手話データの時間的順序に関する正確なアノテーションがないため,困難な研究課題である。
本稿では,より正確な時間的特徴を抽出するマルチスケール時間的ネットワーク(MSTNet)を提案する。
2つの公開データセットによる実験結果から,従来の知識を使わずに手話の特徴をエンドツーエンドで効果的に抽出できることが示されている。
論文 参考訳(メタデータ) (2022-04-08T06:14:22Z) - Temporal Abstraction in Reinforcement Learning with the Successor
Representation [65.69658154078007]
我々は、後継表現(SR)が時間的抽象化の発見と利用の自然な基盤とみなすことができると論じる。
我々は、SRが時間的に延長された探索や計画を容易にする選択肢を見つけるためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2021-10-12T05:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。