論文の概要: Reimagine BiSeNet for Real-Time Domain Adaptation in Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2110.11662v1
- Date: Fri, 22 Oct 2021 08:39:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 14:28:59.021425
- Title: Reimagine BiSeNet for Real-Time Domain Adaptation in Semantic
Segmentation
- Title(参考訳): 意味セグメンテーションにおけるリアルタイム領域適応のための再想像ビセネット
- Authors: Antonio Tavera, Carlo Masone, Barbara Caputo
- Abstract要約: ドメイン間のリアルタイムセマンティックセグメンテーションの課題について考察する。
我々は、合成領域で訓練されたとしても、実世界のデータに対して適切に行動するようにモデルを訓練する。
私たちは、この目的のために特別に作られた新しい軽量で浅い識別器を採用しています。
- 参考スコア(独自算出の注目度): 17.761939190746812
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation models have reached remarkable performance across
various tasks. However, this performance is achieved with extremely large
models, using powerful computational resources and without considering training
and inference time. Real-world applications, on the other hand, necessitate
models with minimal memory demands, efficient inference speed, and executable
with low-resources embedded devices, such as self-driving vehicles. In this
paper, we look at the challenge of real-time semantic segmentation across
domains, and we train a model to act appropriately on real-world data even
though it was trained on a synthetic realm. We employ a new lightweight and
shallow discriminator that was specifically created for this purpose. To the
best of our knowledge, we are the first to present a real-time adversarial
approach for assessing the domain adaption problem in semantic segmentation. We
tested our framework in the two standard protocol: GTA5 to Cityscapes and
SYNTHIA to Cityscapes. Code is available at:
https://github.com/taveraantonio/RTDA.
- Abstract(参考訳): セマンティックセグメンテーションモデルは様々なタスクで顕著なパフォーマンスを達成した。
しかし、この性能は、強力な計算資源を使用し、トレーニングや推論時間を考慮せずに非常に大きなモデルで達成される。
一方、現実世界のアプリケーションは、最小限のメモリ要求、効率的な推論速度、自動運転車のような低リソースの組み込みデバイスで実行可能なモデルを必要とする。
本稿では,ドメイン間のリアルタイムセマンティクスセグメンテーションの課題を考察し,合成領域で訓練されたにもかかわらず,実世界データに対して適切に動作するようにモデルを訓練する。
私たちは、この目的のために特別に作られた新しい軽量で浅い識別器を採用しています。
我々の知る限りでは、セマンティックセグメンテーションにおけるドメイン適応問題を評価するために、我々は初めてリアルタイムの敵対的アプローチを提示する。
私たちは、GTA5からCityscapes、SynTHIAからCityscapesの2つの標準プロトコルでフレームワークをテストしました。
コードはhttps://github.com/taveraantonio/rtda.com/。
関連論文リスト
- Alice Benchmarks: Connecting Real World Re-Identification with the
Synthetic [92.02220105679713]
我々は、Aliceベンチマーク、大規模データセット、ベンチマークおよび評価プロトコルを研究コミュニティに導入する。
Aliceベンチマークでは、人と車の2つのre-IDタスクが提供されている。
実際のターゲットの重要な特徴として、トレーニングセットのクラスタビリティは、実際のドメイン適応テストシナリオに近づくように手動で保証されない。
論文 参考訳(メタデータ) (2023-10-06T17:58:26Z) - You Only Look at Once for Real-time and Generic Multi-Task [20.61477620156465]
A-YOLOMは適応的でリアルタイムで軽量なマルチタスクモデルである。
我々は,統一的で合理化されたセグメンテーション構造を持つエンドツーエンドのマルチタスクモデルを開発した。
BDD100kデータセットで競合的な結果が得られます。
論文 参考訳(メタデータ) (2023-10-02T21:09:43Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - RTFormer: Efficient Design for Real-Time Semantic Segmentation with
Transformer [63.25665813125223]
本稿では,リアルタイムセマンティックセグメンテーションのための効率的なデュアルレゾリューション変換器RTFormerを提案する。
CNNベースのモデルよりもパフォーマンスと効率のトレードオフが優れている。
主要なベンチマーク実験では,提案したRTFormerの有効性を示す。
論文 参考訳(メタデータ) (2022-10-13T16:03:53Z) - On Efficient Real-Time Semantic Segmentation: A Survey [12.404169549562523]
我々は、低メモリの組み込みシステムにデプロイ可能な、よりコンパクトで効率的なモデルで、このミスアライメントに対処することを目的とした作業について検討する。
我々は,一貫したハードウェアおよびソフトウェア構成下で,議論されたモデルの推論速度を評価する。
実験結果から,リソース制約のあるハードウェア上でのリアルタイム性能を実証し,レイテンシと精度の相反するトレードオフを考察した。
論文 参考訳(メタデータ) (2022-06-17T08:00:27Z) - Unseen Object Instance Segmentation with Fully Test-time RGB-D
Embeddings Adaptation [14.258456366985444]
最近では、大規模な合成データのRGB-D機能を活用し、実世界のシナリオにモデルを適用するのが一般的である。
本稿では,Sim2Realドメイン間の適応プロセスを再強調する。
本稿では,BatchNorm層のパラメータに基づいて,完全テスト時間RGB-D埋め込み適応(FTEA)を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:20Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - PixMatch: Unsupervised Domain Adaptation via Pixelwise Consistency
Training [4.336877104987131]
教師なしドメイン適応はセマンティックセグメンテーションの有望なテクニックである。
対象領域整合性訓練の概念に基づく非監視領域適応のための新しいフレームワークを提案する。
私たちのアプローチはシンプルで、実装が簡単で、トレーニング時にメモリ効率が向上します。
論文 参考訳(メタデータ) (2021-05-17T19:36:28Z) - LevelSet R-CNN: A Deep Variational Method for Instance Segmentation [79.20048372891935]
現在、多くのアートモデルはMask R-CNNフレームワークに基づいている。
本稿では,両世界の長所を結合したR-CNNを提案する。
我々はCOCOおよびCityscapesデータセットに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2020-07-30T17:52:18Z) - Learning Fast and Robust Target Models for Video Object Segmentation [83.3382606349118]
ビデオオブジェクトセグメンテーション(VOS)は、ターゲットオブジェクトを定義する初期マスクがテスト時にのみ与えられるため、非常に難しい問題である。
それまでのほとんどの場合、第1フレーム上のファイン・チューン・セグメンテーション・ネットワークにアプローチし、非現実的なフレームレートとオーバーフィッティングのリスクをもたらす。
本稿では,2つのネットワークコンポーネントからなる新しいVOSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T21:58:06Z) - Unsupervised Domain Adaptation for Mobile Semantic Segmentation based on
Cycle Consistency and Feature Alignment [28.61782696432711]
実世界と合成表現のドメインシフト問題に対処する新しいUnsupervised Domain Adaptation (UDA)戦略を提案する。
提案手法は,合成データに基づいて訓練されたセグメンテーションネットワークを実世界のシナリオに適用することで,優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-14T10:12:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。