Fugu-MT 論文翻訳(概要): Understanding Identity Continuity in Thermal Video through Scene-Level Consistency

論文の概要: Understanding Identity Continuity in Thermal Video through Scene-Level Consistency

arxiv url: http://arxiv.org/abs/2606.01694v1
Date: Mon, 01 Jun 2026 04:59:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-02 21:34:31.377005
Title: Understanding Identity Continuity in Thermal Video through Scene-Level Consistency
Title（参考訳）: Scene-Level Consistencyによる熱ビデオのアイデンティティ連続性の理解
Authors: Wei-Chieh Sun, Gyungmin Ko, Heejae Kwon, Hsiang-Wei Huang, Jenq-Neng Hwang,
Abstract要約: 重度再識別モデルや複雑なオンラインアソシエーションに頼ることなく、軽量なポストプロセッシングがアイデンティティの連続性を回復できるかどうかを検討する。オンラインのショートギャップリマッピングとオフラインのトラックレットリリンクで構成されるモジュラーID-リペアバックエンドを追加します。その結果,シーンレベルの空間的・時間的整合性は,局所的なフレーム・フレーム・アソシエーションに比べてアイデンティティの連続性において支配的な役割を担っていることがわかった。
参考スコア（独自算出の注目度）: 23.71302562556758
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Thermal pedestrian MOT remains challenging because weak appearance cues and frequent detection interruptions cause severe trajectory fragmentation. We study whether lightweight post-processing can recover identity continuity without relying on heavy re-identification models or complex online association. Starting from a YOLOv8 and SORT baseline, we add a modular identity-repair backend consisting of online short-gap remapping and offline tracklet relinking based on temporal, spatial, motion, and border cues. Controlled ablations on a fixed validation split and evaluation on the official PBVS Thermal Pedestrian MOT benchmark show that the main identity gains arise from conservative relinking, improving IDF1 from 82.25 to 84.93 while preserving MOTA, whereas many heuristic thresholds remain stable across broad operating ranges. These results suggest that, in low-information thermal imagery, robust identity recovery can be achieved more effectively through high-precision trajectory relinking than through increasing tracker complexity. These results provide a controlled analysis of identity recovery in thermal video, showing that scene-level spatial-temporal consistency plays a dominant role in identity continuity compared to local frame-to-frame association.
Abstract（参考訳）: 熱歩行者MOTは、外観の弱さと頻繁な検出中断が重度の軌跡の断片化を引き起こすため、依然として困難である。重度再識別モデルや複雑なオンラインアソシエーションに頼ることなく、軽量なポストプロセッシングがアイデンティティの連続性を回復できるかどうかを検討する。 YOLOv8とSORTベースラインから始めて、オンラインのショートギャップリマッピングと、時間、空間、動き、バウンダリのキューに基づくオフラインのトラックレットリリンクからなるモジュラーIDリペアバックエンドを追加します。 PBVS Thermal Pedestrian MOTベンチマークでは、修正された検証の分割と評価に関する制限により、主要なアイデンティティは保守的なリリンクによって発生し、MOTAを維持しながらIDF1を82.25から84.93に改善する一方で、多くのヒューリスティックしきい値が幅広い運用範囲にわたって安定している。これらの結果は、低情報熱画像においては、トラッカーの複雑さの増加よりも高精度な軌道リリンクにより、堅牢なアイデンティティ回復がより効果的に達成できることを示唆している。これらの結果は、シーンレベルの空間的時間的一貫性が、局所的なフレーム・フレーム間の関係と比較して、アイデンティティの連続性において支配的な役割を担っていることを示す。

関連論文リスト

Where to Refine, When to Stop: Rethinking Redundancy via Latent Discrepancy for Efficient Visual Autoregressive Generation [50.139984798361375]
遅延不一致による冗長性を除去する学習自由フレームワークを提案する。 LD-Pruningは、Infinity-8Bの最大2.35倍のスピードアップを実現し、高い生成品質を維持しながら推論を大幅に削減する。
論文参考訳（メタデータ） (2026-05-29T19:34:39Z)
Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0127582612634]
Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。 NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文参考訳（メタデータ） (2026-05-21T16:45:31Z)
Improving Spatio-Temporal Residual Error Propagation by Mitigating Over-Squashing [4.62541204592513]
本稿では,エラー関連自己回帰予測の時間的制限を克服する構造的不確実性モジュールであるTegerを紹介する。 Tegerはバックボーンに依存しないため、自己回帰エンコーダによって生成される潜伏状態のみを必要とする。
論文参考訳（メタデータ） (2026-05-18T08:51:33Z)
Causal Bootstrapped Alignment for Unsupervised Video-Based Visible-Infrared Person Re-Identification [52.784239635604735]
VVI-ReIDは、静止画像以外にも時間情報が付加的な手がかりを提供する、全日監視のための重要な技術である。既存のアプローチは、高価なクロスモダリティアノテーションによる完全な教師付き学習に大きく依存しており、スケーラビリティが制限されています。そこで,本研究では,ビデオの先行を明示的に活用するCausal Bootstrapped Alignmentフレームワークを提案する。
論文参考訳（メタデータ） (2026-04-17T02:15:59Z)
Gait Recognition with Temporal Kolmogorov-Arnold Networks [24.11167872887211]
歩行認識は、個人をその特徴的な歩行パターンから識別する生体計測モダリティである。これらの課題に対処するために、歩行認識のための時間的コルモゴロフ・アルノルドネットワーク(TKAN)を導入する。提案モデルでは,固定エッジ重みを学習可能な1次元関数に置き換え,2レベルメモリ機構を組み込んだ。
論文参考訳（メタデータ） (2026-04-11T02:28:26Z)
Long-Term Multi-Session 3D Reconstruction Under Substantial Appearance Change [52.46888249268445]
長期の環境モニタリングには、数ヶ月または数年ごとに分割された繰り返しサイト訪問で3Dモデルを再構築し調整する機能が必要である。既存のアプローチは、独立して再構築されたセッションのポストホックアライメントに依存している。我々は,共同SfM再建において,クロスセッション対応を直接実施することを提案する。
論文参考訳（メタデータ） (2026-02-24T06:12:51Z)
FeedbackSTS-Det: Sparse Frames-Based Spatio-Temporal Semantic Feedback Network for Infrared Small Target Detection [7.648318265124807]
複雑な背景下での赤外線小検出目標(ISTD)は依然として困難な課題である。既存の手法はまだ非効率な長距離依存性モデリングに苦慮している。本稿では,スパースなセマンティック・テンポラル・フィードバック・ネットワークによるISTD検出手法を提案する。
論文参考訳（メタデータ） (2026-01-21T06:06:36Z)
ST-DETrack: Identity-Preserving Branch Tracking in Entangled Plant Canopies via Dual Spatiotemporal Evidence [0.7448758790630549]
出芽から開花までの分岐アイデンティティを保護するために設計された2重デコーダネットワークST-DETrackを提案する。我々のアーキテクチャは、空間的一貫性と、動きのあいまいさを生かした時間デコーダを統合している。 ST-DETrackは93.6%の分岐マッチング精度(BMA)を達成し、それぞれ28.9ポイントと3.3ポイントで空間的ベースラインと時間的ベースラインを大きく上回っている。
論文参考訳（メタデータ） (2025-12-17T13:42:34Z)
Delving into Cascaded Instability: A Lipschitz Continuity View on Image Restoration and Object Detection Synergy [95.93943805282868]
リプシッツ規則化物体検出(LROD) 本稿では,リプシッツ規則化YOLO(LR-YOLO)を提案する。ヘイズと低照度ベンチマークの実験では、LR-YOLOは検出安定性、最適化のスムーズさ、全体的な精度を一貫して改善している。
論文参考訳（メタデータ） (2025-10-28T09:41:42Z)
Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文参考訳（メタデータ） (2024-05-24T15:56:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。