論文の概要: DATA: Domain-And-Time Alignment for High-Quality Feature Fusion in Collaborative Perception
- arxiv url: http://arxiv.org/abs/2507.18237v1
- Date: Thu, 24 Jul 2025 09:24:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.328904
- Title: DATA: Domain-And-Time Alignment for High-Quality Feature Fusion in Collaborative Perception
- Title(参考訳): データ:協調知覚における高品質特徴融合のためのドメイン・アンド・タイムアライメント
- Authors: Chengchang Tian, Jianwei Ma, Yan Huang, Zhanye Chen, Honghao Wei, Hui Zhang, Wei Hong,
- Abstract要約: 特徴レベルの融合は、バランスの取れた性能と通信帯域のトレードオフを通じて協調知覚(CP)を約束する。
高品質な機能の獲得は、ハードウェアの多様性とデプロイメント条件からドメインギャップに直面し、送信遅延からの時間的ミスアライメントが伴う。
本稿では,統合のための意味表現を最大化しながら,特徴を体系的にアライメントするDomain-And-Timeアライメントネットワークを提案する。
- 参考スコア(独自算出の注目度): 10.91039672865197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature-level fusion shows promise in collaborative perception (CP) through balanced performance and communication bandwidth trade-off. However, its effectiveness critically relies on input feature quality. The acquisition of high-quality features faces domain gaps from hardware diversity and deployment conditions, alongside temporal misalignment from transmission delays. These challenges degrade feature quality with cumulative effects throughout the collaborative network. In this paper, we present the Domain-And-Time Alignment (DATA) network, designed to systematically align features while maximizing their semantic representations for fusion. Specifically, we propose a Consistency-preserving Domain Alignment Module (CDAM) that reduces domain gaps through proximal-region hierarchical downsampling and observability-constrained discriminator. We further propose a Progressive Temporal Alignment Module (PTAM) to handle transmission delays via multi-scale motion modeling and two-stage compensation. Building upon the aligned features, an Instance-focused Feature Aggregation Module (IFAM) is developed to enhance semantic representations. Extensive experiments demonstrate that DATA achieves state-of-the-art performance on three typical datasets, maintaining robustness with severe communication delays and pose errors. The code will be released at https://github.com/ChengchangTian/DATA.
- Abstract(参考訳): 特徴レベルの融合は、バランスの取れた性能と通信帯域のトレードオフを通じて協調知覚(CP)を約束する。
しかし、その効果は入力特徴量に大きく依存している。
高品質な機能の獲得は、ハードウェアの多様性とデプロイメント条件からドメインギャップに直面し、送信遅延からの時間的ミスアライメントが伴う。
これらの課題は、コラボレーティブネットワーク全体の累積効果によって、機能品質を低下させる。
本稿では,ドメイン・アンド・タイム・アライメント(Domain-And-Time Alignment, DATA)ネットワークについて述べる。
具体的には、近領域階層的なダウンサンプリングと可観測性に制約のある識別器により、ドメインギャップを低減する一貫性保存ドメインアライメントモジュール(CDAM)を提案する。
さらに,マルチスケールモーションモデリングと2段階補償により送信遅延を処理するためのPTAM(Progressive Temporal Alignment Module)を提案する。
整列した機能に基づいて、セマンティック表現を強化するために、インスタンス中心のFeature Aggregation Module (IFAM)が開発されている。
大規模な実験により、Data dataは3つの典型的なデータセットで最先端のパフォーマンスを達成し、通信遅延を厳しく抑え、エラーを発生させる。
コードはhttps://github.com/ChengchangTian/DATA.comでリリースされる。
関連論文リスト
- Learning Unified System Representations for Microservice Tail Latency Prediction [8.532290784939967]
マイクロサービスアーキテクチャは、スケーラブルなクラウドネイティブアプリケーションを構築するためのデファクトスタンダードになっています。
従来のアプローチでは、要求毎のレイテンシメトリクスに依存しており、過渡的なノイズに非常に敏感です。
我々は,トラフィック側とリソース側の機能を明確に分離し,モデル化するディープラーニングネットワークであるUSRFNetを提案する。
論文 参考訳(メタデータ) (2025-08-03T07:46:23Z) - Residual Prior-driven Frequency-aware Network for Image Fusion [6.90874640835234]
画像融合は、高品質な融合画像を生成するために、モダリティにまたがる相補的な情報を統合することを目的としている。
本稿ではRPFNetと呼ばれる残差優先周波数対応ネットワークを提案する。
論文 参考訳(メタデータ) (2025-07-09T10:48:00Z) - TraF-Align: Trajectory-aware Feature Alignment for Asynchronous Multi-agent Perception [7.382491303268417]
TraF-Alignは、過去の観測からエゴ車両の現在までの物体の特徴レベル軌道を予測することによって、特徴のフローパスを学習する。
このアプローチは空間的不整合を補正し、エージェント間のセマンティックな一貫性を確保し、効果的に動きを補償する。
2つの実世界のデータセットであるV2V4RealとDAIR-V2X-Seqの実験は、TraF-Alignが非同期協調知覚のための新しいベンチマークを設定していることを示している。
論文 参考訳(メタデータ) (2025-03-25T06:56:35Z) - Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - Exploiting Aggregation and Segregation of Representations for Domain Adaptive Human Pose Estimation [50.31351006532924]
人間のポーズ推定(HPE)は最近、モーション分析、バーチャルリアリティー、ヘルスケア等に広く応用されているため、注目を集めている。
時間と労働集約的なアノテーションのために、ラベル付き現実世界のデータセットが不足している。
本稿では,ドメイン適応型人間のポーズ推定のための表現集約と分離を両立させる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-29T17:59:45Z) - Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。
Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。
nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-12-28T14:23:58Z) - Collaborative Feedback Discriminative Propagation for Video Super-Resolution [66.61201445650323]
ビデオ超解像法(VSR)の主な成功は、主に空間情報と時間情報を探索することに由来する。
不正確なアライメントは通常、重要なアーティファクトを備えたアライメント機能につながる。
伝搬モジュールは同じタイムステップ機能のみを前方または後方に伝播する。
論文 参考訳(メタデータ) (2024-04-06T22:08:20Z) - UniTime: A Language-Empowered Unified Model for Cross-Domain Time Series
Forecasting [59.11817101030137]
この研究はドメイン境界を超越する統一モデルパラダイムを提唱する。
効果的なクロスドメインモデルを学ぶことは、以下の課題を提示します。
効果的なドメイン間時系列学習のためのUniTimeを提案する。
論文 参考訳(メタデータ) (2023-10-15T06:30:22Z) - Improving Anomaly Segmentation with Multi-Granularity Cross-Domain
Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。
既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。
シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文 参考訳(メタデータ) (2023-08-16T22:54:49Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。