論文の概要: RICO: Two Realistic Benchmarks and an In-Depth Analysis for Incremental Learning in Object Detection
- arxiv url: http://arxiv.org/abs/2508.13878v2
- Date: Tue, 07 Oct 2025 11:56:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 15:38:21.18241
- Title: RICO: Two Realistic Benchmarks and an In-Depth Analysis for Incremental Learning in Object Detection
- Title(参考訳): RICO:オブジェクト検出における2つの現実的ベンチマークとインディーズ分析
- Authors: Matthias Neuwirth-Trapp, Maarten Bieshaar, Danda Pani Paudel, Luc Van Gool,
- Abstract要約: インクリメンタルラーニング(IL)は、完全なリトレーニングなしで、プライバシ、効率、スケーラビリティを提供する新しいデータ上で、逐次モデルをトレーニングする。
ドメイン RICO (D-RICO) は固定クラスセットでドメインシフトを特徴とし、拡張クラス RICO (EC-RICO) はILステップ毎に新しいドメインとクラスを統合する。
実験の結果,全てのILメソッドは適応性や保持性に劣るものの,前回の少量のデータ再生は全メソッドを上回っていることがわかった。
- 参考スコア(独自算出の注目度): 54.194199777900934
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Incremental Learning (IL) trains models sequentially on new data without full retraining, offering privacy, efficiency, and scalability. IL must balance adaptability to new data with retention of old knowledge. However, evaluations often rely on synthetic, simplified benchmarks, obscuring real-world IL performance. To address this, we introduce two Realistic Incremental Object Detection Benchmarks (RICO): Domain RICO (D-RICO) features domain shifts with a fixed class set, and Expanding-Classes RICO (EC-RICO) integrates new domains and classes per IL step. Built from 14 diverse datasets covering real and synthetic domains, varying conditions (e.g., weather, time of day), camera sensors, perspectives, and labeling policies, both benchmarks capture challenges absent in existing evaluations. Our experiments show that all IL methods underperform in adaptability and retention, while replaying a small amount of previous data already outperforms all methods. However, individual training on the data remains superior. We heuristically attribute this gap to weak teachers in distillation, single models' inability to manage diverse tasks, and insufficient plasticity. Our code will be made publicly available.
- Abstract(参考訳): インクリメンタルラーニング(IL)は、完全なリトレーニングなしで、プライバシ、効率、スケーラビリティを提供する新しいデータ上で、逐次モデルをトレーニングする。
ILは新しいデータへの適応性と古い知識の保持のバランスをとる必要がある。
しかし、評価はしばしば、実世界のIL性能を無視する、合成的で単純化されたベンチマークに依存している。
ドメイン RICO (D-RICO) は固定クラスセットでドメインシフトを特徴とし、拡張クラス RICO (EC-RICO) はILステップ毎に新しいドメインとクラスを統合する。
実際のドメインと合成ドメイン、さまざまな条件(例えば、天気、日時)、カメラセンサー、視点、ラベルポリシーを含む14の多様なデータセットから構築されたベンチマークは、既存の評価に欠けている課題を捉えている。
実験の結果,全てのILメソッドは適応性や保持性に劣るものの,前回の少量のデータ再生は全メソッドを上回っていることがわかった。
しかし、データに関する個々のトレーニングは依然として優れている。
我々は,このギャップを蒸留の弱い教師,単一モデルの多様なタスク管理能力の欠如,可塑性の欠如などに帰着する。
私たちのコードは公開されます。
関連論文リスト
- Resilient Class-Incremental Learning: on the Interplay of Drifting, Unlabelled and Imbalanced Data Streams [3.3977968101293956]
本稿では,これらの課題に対処するためのSCIL(Streaming Class-Incremental Learning)を提案する。
このフレームワークは、マルチクラスの予測のための多層パーセプトロンと自動エンコーダ(AE)を統合し、予測と新しいクラス検出にデュアルロス戦略(分類と再構築)を使用し、オンライントレーニングに修正済みの擬似ラベルを採用し、キューでクラスを管理し、不均衡を処理するためにオーバーサンプリングを適用する。
以上の結果から,SCILは強いベースラインや最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2026-02-10T11:37:39Z) - Synthetic-to-Real Camouflaged Object Detection [17.56053859347725]
我々はS2R-COD(Syn-to-Real Camouflaged Object Detection)という新しいタスクを提案する。
実世界のシナリオにおけるモデル性能を改善するためには,注釈付き合成カモフラージュ画像の集合と,注釈なしの実画像の限られた数を利用する必要がある。
論文 参考訳(メタデータ) (2025-07-25T03:06:06Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [78.18946529195254]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models [81.27391252152199]
大規模言語モデル(LLM)は、さまざまな自然言語ベンチマークで素晴らしいパフォーマンスを実現している。
本稿では、データセットの自動更新と、その有効性に関する体系的な分析を提案する。
1) 類似したサンプルを生成するための戦略を模倣すること,2) 既存のサンプルをさらに拡張する戦略を拡張すること,である。
論文 参考訳(メタデータ) (2024-02-19T07:15:59Z) - Alice Benchmarks: Connecting Real World Re-Identification with the
Synthetic [92.02220105679713]
我々は、Aliceベンチマーク、大規模データセット、ベンチマークおよび評価プロトコルを研究コミュニティに導入する。
Aliceベンチマークでは、人と車の2つのre-IDタスクが提供されている。
実際のターゲットの重要な特徴として、トレーニングセットのクラスタビリティは、実際のドメイン適応テストシナリオに近づくように手動で保証されない。
論文 参考訳(メタデータ) (2023-10-06T17:58:26Z) - Re-Evaluating LiDAR Scene Flow for Autonomous Driving [80.37947791534985]
自己教師型LiDARシーンフローの一般的なベンチマークは、動的動き、非現実的な対応、非現実的なサンプリングパターンの非現実的な速度を持つ。
実世界のデータセットのスイート上で,トップメソッドのスイートを評価する。
学習に重点を置いているにもかかわらず、ほとんどのパフォーマンス向上は前処理と後処理のステップによって引き起こされる。
論文 参考訳(メタデータ) (2023-04-04T22:45:50Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Learning from Mistakes: Self-Regularizing Hierarchical Representations
in Point Cloud Semantic Segmentation [15.353256018248103]
LiDARセマンティックセマンティックセマンティクスは、きめ細かいシーン理解を実現するために注目を集めている。
本稿では、標準モデルから派生した分類ミスタケス(LEAK)からLEArnを分離する粗大な設定を提案する。
我々のLEAKアプローチは非常に一般的で、どんなセグメンテーションアーキテクチャにもシームレスに適用できます。
論文 参考訳(メタデータ) (2023-01-26T14:52:30Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Towards Lifelong Learning of End-to-end ASR [81.15661413476221]
lifelong learningは、マシンが新しいデータセットから新しいタスクをシーケンシャルに学習できるようにすることを目的としている。
WERの28.7%の相対的な減少は、3つの非常に異なるベンチマークコーポラを順次学習する場合の微調整ベースラインと比較して達成された。
論文 参考訳(メタデータ) (2021-04-04T13:48:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。