論文の概要: S3-CLIP: Video Super Resolution for Person-ReID
- arxiv url: http://arxiv.org/abs/2601.08807v1
- Date: Tue, 13 Jan 2026 18:46:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.330837
- Title: S3-CLIP: Video Super Resolution for Person-ReID
- Title(参考訳): S3-CLIP: Person-ReIDのためのビデオスーパーレゾリューション
- Authors: Tamas Endrei, Gyorgy Cserey,
- Abstract要約: WACV 2026におけるVReID-XFDチャレンジのために開発された超高解像度CLIP-ReIDフレームワークであるS3-CLIPを紹介する。
S3-CLIPはランク1、ランク5、ランク10のパフォーマンスをそれぞれ11.24%、13.48%、17.98%向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tracklet quality is often treated as an afterthought in most person re-identification (ReID) methods, with the majority of research presenting architectural modifications to foundational models. Such approaches neglect an important limitation, posing challenges when deploying ReID systems in real-world, difficult scenarios. In this paper, we introduce S3-CLIP, a video super-resolution-based CLIP-ReID framework developed for the VReID-XFD challenge at WACV 2026. The proposed method integrates recent advances in super-resolution networks with task-driven super-resolution pipelines, adapting them to the video-based person re-identification setting. To the best of our knowledge, this work represents the first systematic investigation of video super-resolution as a means of enhancing tracklet quality for person ReID, particularly under challenging cross-view conditions. Experimental results demonstrate performance competitive with the baseline, achieving 37.52% mAP in aerial-to-ground and 29.16% mAP in ground-to-aerial scenarios. In the ground-to-aerial setting, S3-CLIP achieves substantial gains in ranking accuracy, improving Rank-1, Rank-5, and Rank-10 performance by 11.24%, 13.48%, and 17.98%, respectively.
- Abstract(参考訳): トラックレットの品質は、ほとんどの人物の再識別(ReID)手法において、後から考えるものとして扱われることが多い。
このようなアプローチは重要な制限を無視し、現実の難しいシナリオにReIDシステムをデプロイする際の課題を提起する。
本稿では,WACV 2026におけるVReID-XFDチャレンジのために開発された超高解像度CLIP-ReIDフレームワークであるS3-CLIPを紹介する。
提案手法は,タスク駆動型超解像パイプラインによる超解像ネットワークの最近の進歩を統合し,映像に基づく人物識別に適応させる。
我々の知る限り、この研究は、特に難易度の高いクロスビュー条件下で、人為的ReIDのトラックレット品質を向上させる手段として、ビデオ超解像に関する最初の体系的な研究である。
実験の結果、地上と地上で37.52% mAP、地上と地上のシナリオで29.16% mAPを達成した。
S3-CLIPは地上から地上までの環境で、ランク1、ランク5、ランク10のパフォーマンスをそれぞれ11.24%、13.48%、17.98%向上させる。
関連論文リスト
- Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR [110.90317717368264]
RLVRトレーニングのためのオンライン変分問題合成(SvS)戦略を提案する。
この戦略は、トレーニング中のポリシーのエントロピーを効果的に維持し、標準のRLVRと比較してPass@kを大幅に改善する。
論文 参考訳(メタデータ) (2025-08-19T17:42:45Z) - RealisVSR: Detail-enhanced Diffusion for Real-World 4K Video Super-Resolution [42.96414692062782]
RealisVSRは3つの中心となるイノベーションを持つ高頻度詳細拡張ビデオ拡散モデルである。
本手法では,既存の手法に比べてトレーニングデータ量の5~25%しか必要としない。
論文 参考訳(メタデータ) (2025-07-25T10:18:33Z) - AG-VPReID 2025: Aerial-Ground Video-based Person Re-identification Challenge Results [64.38412449125872]
本稿では,高高度(80-120m)の地上ReIDに焦点を当てた初の大規模ビデオベースコンペであるAG-VPReID 2025 Challengeを紹介する。
この課題は、3,027個のID、13,500個のトラックレット、UAV、CCTV、ウェアラブルカメラから取得された約370万フレームからなるAG-VPReIDデータセット上に構築された。
UAMのX-TFCLIPによる空中対地ReID設定では72.28%、地上対地ReID設定では70.77%の精度を達成した
論文 参考訳(メタデータ) (2025-06-28T10:45:30Z) - Toward Advancing License Plate Super-Resolution in Real-World Scenarios: A Dataset and Benchmark [2.7961815663180425]
LPR(Super- resolution for License Plate Recognition)は、監視、交通監視、法医学的応用において、低解像度(LR)および劣化した画像によって引き起こされる課題に対処することを目的としている。
UFPR-SR-Platesは、10万のトラックと10万のペアの低解像度と高解像度のプレート画像を含む新しいデータセットである。
ライセンスプレートの超解像のための2つの最先端モデルと、車両毎の複数の逐次LRと高分解能(HR)画像を用いたベンチマークを構築した。
論文 参考訳(メタデータ) (2025-05-09T19:37:57Z) - Person Recognition at Altitude and Range: Fusion of Face, Body Shape and Gait [70.00430652562012]
FarSightは、顔認識のためのエンドツーエンドシステムで、顔、歩行、体形を横断する生体計測の手がかりを統合する。
FarSightは、4つのコアモジュールにまたがる新しいアルゴリズムを組み込んでいる。
論文 参考訳(メタデータ) (2025-05-07T17:58:25Z) - AG-VPReID: A Challenging Large-Scale Benchmark for Aerial-Ground Video-based Person Re-Identification [39.350429734981184]
我々は,地上ビデオに基づく人物識別(ReID)のための大規模データセット AG-VPReID を紹介する。
このデータセットは6,632人の被験者、32,321のトラックレット、960万フレーム以上をドローン(高度15-120m)、CCTV、ウェアラブルカメラで捉えている。
本稿では,3つの補完ストリームからなるエンドツーエンドフレームワーク AG-VPReID-Net を提案する。
論文 参考訳(メタデータ) (2025-03-11T07:38:01Z) - Sebica: Lightweight Spatial and Efficient Bidirectional Channel Attention Super Resolution Network [0.0]
SISR(Single Image Super-Resolution)は,低解像度画像の画質向上のための重要な技術である。
本稿では,空間的および効率的な双方向チャネルアテンション機構を組み込んだ軽量ネットワークSebicaを提案する。
セビカは高い復元品質を維持しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2024-10-27T18:27:07Z) - Transferable, Controllable, and Inconspicuous Adversarial Attacks on
Person Re-identification With Deep Mis-Ranking [83.48804199140758]
システム出力のランキングを乱す学習とミスランクの定式化を提案する。
また,新たなマルチステージネットワークアーキテクチャを開発することで,バックボックス攻撃を行う。
そこで本手法では, 異なるマルチショットサンプリングにより, 悪意のある画素数を制御することができる。
論文 参考訳(メタデータ) (2020-04-08T18:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。