論文の概要: Self-adversarial Multi-scale Contrastive Learning for Semantic
Segmentation of Thermal Facial Images
- arxiv url: http://arxiv.org/abs/2209.10700v1
- Date: Wed, 21 Sep 2022 22:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 13:35:02.004976
- Title: Self-adversarial Multi-scale Contrastive Learning for Semantic
Segmentation of Thermal Facial Images
- Title(参考訳): 熱画像のセマンティックセグメンテーションのための自己反転型マルチスケールコントラスト学習
- Authors: Jitesh Joshi, Nadia Bianchi-Berthouze, Youngjun Cho
- Abstract要約: 本稿では,セグメンテーションネットワークを学習するための汎用学習フレームワークとして,自己適応型マルチスケールコントラスト学習(SAM-CL)を提案する。
SAM-CLフレームワークはSAM-CL損失関数と熱画像拡張(TiAug)をドメイン固有の拡張技術として構成し、制約のない設定をシミュレートする。
- 参考スコア(独自算出の注目度): 11.68189195596647
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reliable segmentation of thermal facial images in unconstrained settings such
as thermal ambience and occlusions is challenging as facial features lack
salience. Limited availability of datasets from such settings further makes it
difficult to train segmentation networks. To address the challenge, we propose
Self-Adversarial Multi-scale Contrastive Learning (SAM-CL) as a generic
learning framework to train segmentation networks. SAM-CL framework constitutes
SAM-CL loss function and a thermal image augmentation (TiAug) as a
domain-specific augmentation technique to simulate unconstrained settings based
upon existing datasets collected from controlled settings. We use the
Thermal-Face-Database to demonstrate effectiveness of our approach. Experiments
conducted on the existing segmentation networks- UNET, Attention-UNET,
DeepLabV3 and HRNetv2 evidence the consistent performance gain from the SAM-CL
framework. Further, we present a qualitative analysis with UBComfort and
DeepBreath datasets to discuss how our proposed methods perform in handling
unconstrained situations.
- Abstract(参考訳): サーマルアンビエンスやオクルージョンなどの無拘束環境におけるサーマルフェイスイメージの信頼性の高いセグメンテーションは、顔の特徴が塩分を欠くため困難である。
このような設定によるデータセットの可用性の制限により、セグメンテーションネットワークのトレーニングがさらに困難になる。
そこで本研究では,セグメンテーションネットワークを学習するための汎用学習フレームワークとして,自己逆マルチスケールコントラスト学習(SAM-CL)を提案する。
SAM-CLフレームワークはSAM-CL損失関数と熱画像拡張(TiAug)をドメイン固有の拡張技術として構成し、制御された設定から収集された既存のデータセットに基づいて制約のない設定をシミュレートする。
Thermal-Face-Databaseを使って、アプローチの有効性を実証します。
既存のセグメンテーションネットワーク-unet, attention-unet, deeplabv3, hrnetv2における実験は、sam-clフレームワークによる一貫したパフォーマンス向上を示している。
さらに,ubcomfortとdeepbreathデータセットを用いた定性解析を行い,制約のない状況の処理において提案手法がどのように機能するかを考察する。
関連論文リスト
- Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。
MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。
MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文 参考訳(メタデータ) (2025-01-18T11:57:20Z) - Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
異常セグメンテーションのための textbfSelf-textbfPerceptinon textbfTuning (textbfSPT) 法を提案する。
SPT法は, 自己描画型チューニング戦略を取り入れ, 異常マスクの初期粗いドラフトを生成し, 精製処理を行う。
論文 参考訳(メタデータ) (2024-11-26T08:33:25Z) - Distribution-aware Noisy-label Crack Segmentation [4.224255134206838]
本稿では,Segment Anything Model(SAM)の一般的な知識をひび割れセグメンテーションに取り入れたSAM-Adapterを紹介する。
SAM-Adapterの有効性は、小さなトレーニングセット内のノイズラベルによって制約される。
本稿では,SAM-Adapterの識別学習プロセスを導くために,分布認識ドメイン固有の意味知識を活用する,革新的な共同学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-12T07:29:47Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - BLO-SAM: Bi-level Optimization Based Overfitting-Preventing Finetuning
of SAM [37.1263294647351]
BLO-SAMを導入し、二段階最適化(BLO)に基づいてSAM(Segment Anything Model)を微調整する。
BLO-SAMは、モデルの重みパラメータのトレーニングと、トレーニングデータセットの2つの別々のサブセットへの迅速な埋め込みによって、過適合のリスクを低減する。
その結果、BLO-SAMは様々な最先端画像セマンティックセグメンテーション法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-02-26T06:36:32Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Segment Anything Model-guided Collaborative Learning Network for
Scribble-supervised Polyp Segmentation [45.15517909664628]
ポリープのセグメンテーションは、初期におけるポリープの正確な位置決定に重要な役割を担っている。
診断中の医師によるポリープ画像に対するピクセルワイドアノテーションは、時間と費用の両方がかかる。
本稿では,スクリブル制御ポリプセグメンテーションのためのSAM誘導協調学習ネットワーク(SAM-CLNet)を提案する。
論文 参考訳(メタデータ) (2023-12-01T03:07:13Z) - SAMIHS: Adaptation of Segment Anything Model for Intracranial Hemorrhage
Segmentation [18.867207134086193]
脳梗塞診断と手術計画において,頭蓋内出血分節は重要かつ困難なステップである。
そこで我々は,脳内出血セグメンテーションのためのSAM-based parameter- efficient fine-tuning法(SAMIHS)を提案する。
2つの公開データセットに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-11-14T14:23:09Z) - RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4319652364256]
本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。
提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。
我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文 参考訳(メタデータ) (2023-07-03T13:21:58Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。