Fugu-MT 論文翻訳(概要): Self-adversarial Multi-scale Contrastive Learning for Semantic Segmentation of Thermal Facial Images

論文の概要: Self-adversarial Multi-scale Contrastive Learning for Semantic Segmentation of Thermal Facial Images

arxiv url: http://arxiv.org/abs/2209.10700v1
Date: Wed, 21 Sep 2022 22:58:47 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-23 13:35:02.004976
Title: Self-adversarial Multi-scale Contrastive Learning for Semantic Segmentation of Thermal Facial Images
Title（参考訳）: 熱画像のセマンティックセグメンテーションのための自己反転型マルチスケールコントラスト学習
Authors: Jitesh Joshi, Nadia Bianchi-Berthouze, Youngjun Cho
Abstract要約: 本稿では,セグメンテーションネットワークを学習するための汎用学習フレームワークとして,自己適応型マルチスケールコントラスト学習(SAM-CL)を提案する。 SAM-CLフレームワークはSAM-CL損失関数と熱画像拡張(TiAug)をドメイン固有の拡張技術として構成し、制約のない設定をシミュレートする。
参考スコア（独自算出の注目度）: 11.68189195596647
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Reliable segmentation of thermal facial images in unconstrained settings such as thermal ambience and occlusions is challenging as facial features lack salience. Limited availability of datasets from such settings further makes it difficult to train segmentation networks. To address the challenge, we propose Self-Adversarial Multi-scale Contrastive Learning (SAM-CL) as a generic learning framework to train segmentation networks. SAM-CL framework constitutes SAM-CL loss function and a thermal image augmentation (TiAug) as a domain-specific augmentation technique to simulate unconstrained settings based upon existing datasets collected from controlled settings. We use the Thermal-Face-Database to demonstrate effectiveness of our approach. Experiments conducted on the existing segmentation networks- UNET, Attention-UNET, DeepLabV3 and HRNetv2 evidence the consistent performance gain from the SAM-CL framework. Further, we present a qualitative analysis with UBComfort and DeepBreath datasets to discuss how our proposed methods perform in handling unconstrained situations.
Abstract（参考訳）: サーマルアンビエンスやオクルージョンなどの無拘束環境におけるサーマルフェイスイメージの信頼性の高いセグメンテーションは、顔の特徴が塩分を欠くため困難である。このような設定によるデータセットの可用性の制限により、セグメンテーションネットワークのトレーニングがさらに困難になる。そこで本研究では,セグメンテーションネットワークを学習するための汎用学習フレームワークとして,自己逆マルチスケールコントラスト学習(SAM-CL)を提案する。 SAM-CLフレームワークはSAM-CL損失関数と熱画像拡張(TiAug)をドメイン固有の拡張技術として構成し、制御された設定から収集された既存のデータセットに基づいて制約のない設定をシミュレートする。 Thermal-Face-Databaseを使って、アプローチの有効性を実証します。既存のセグメンテーションネットワーク-unet, attention-unet, deeplabv3, hrnetv2における実験は、sam-clフレームワークによる一貫したパフォーマンス向上を示している。さらに,ubcomfortとdeepbreathデータセットを用いた定性解析を行い,制約のない状況の処理において提案手法がどのように機能するかを考察する。

関連論文リスト

Boosting SAM for Cross-Domain Few-Shot Segmentation via Conditional Point Sparsification [116.2386061247855]
我々は、参照例に基づいて、ドメイン間画像のSAMインタラクションを適応的にガイドする訓練不要なアプローチであるPoint Sparsification (CPS)を提案する。 CPSは、様々なCD-FSSデータセットで既存のトレーニング不要SAMベースのメソッドより優れている。
論文参考訳（メタデータ） (2026-02-05T02:17:38Z)
Boundary-Aware Test-Time Adaptation for Zero-Shot Medical Image Segmentation [12.159529070716824]
BA-TTA-SAMはテスト時間適応によるSAMのゼロショットセグメンテーション性能を向上させるテスト時間適応フレームワークである。我々のフレームワークは、医用画像分割における最先端モデルよりも一貫して優れています。
論文参考訳（メタデータ） (2025-12-04T07:08:21Z)
Segment Concealed Objects with Incomplete Supervision [63.637733655439334]
不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文参考訳（メタデータ） (2025-06-10T16:25:15Z)
Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。 MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。 MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文参考訳（メタデータ） (2025-01-18T11:57:20Z)
Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.55145330447408]
Segment Anything Model (SAM) は、その顕著な一般化能力により、異常セグメンテーションタスクにおいて大きな進歩を遂げている。 SAMを直接適用する既存のメソッドは、しばしばドメインシフトの問題を見落としている。本稿では, SAMの異常セグメンテーションに対する知覚能力を高めることを目的とした, 自己パーセプティノンチューニング(SPT)手法を提案する。
論文参考訳（メタデータ） (2024-11-26T08:33:25Z)
Distribution-aware Noisy-label Crack Segmentation [4.224255134206838]
本稿では,Segment Anything Model(SAM)の一般的な知識をひび割れセグメンテーションに取り入れたSAM-Adapterを紹介する。 SAM-Adapterの有効性は、小さなトレーニングセット内のノイズラベルによって制約される。本稿では,SAM-Adapterの識別学習プロセスを導くために,分布認識ドメイン固有の意味知識を活用する,革新的な共同学習フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-12T07:29:47Z)
Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。 UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。 UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文参考訳（メタデータ） (2024-09-23T19:05:50Z)
BLO-SAM: Bi-level Optimization Based Overfitting-Preventing Finetuning of SAM [37.1263294647351]
BLO-SAMを導入し、二段階最適化(BLO)に基づいてSAM(Segment Anything Model)を微調整する。 BLO-SAMは、モデルの重みパラメータのトレーニングと、トレーニングデータセットの2つの別々のサブセットへの迅速な埋め込みによって、過適合のリスクを低減する。その結果、BLO-SAMは様々な最先端画像セマンティックセグメンテーション法よりも優れた性能を示した。
論文参考訳（メタデータ） (2024-02-26T06:36:32Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
Segment Anything Model-guided Collaborative Learning Network for Scribble-supervised Polyp Segmentation [45.15517909664628]
ポリープのセグメンテーションは、初期におけるポリープの正確な位置決定に重要な役割を担っている。診断中の医師によるポリープ画像に対するピクセルワイドアノテーションは、時間と費用の両方がかかる。本稿では,スクリブル制御ポリプセグメンテーションのためのSAM誘導協調学習ネットワーク(SAM-CLNet)を提案する。
論文参考訳（メタデータ） (2023-12-01T03:07:13Z)
SAMIHS: Adaptation of Segment Anything Model for Intracranial Hemorrhage Segmentation [18.867207134086193]
脳梗塞診断と手術計画において,頭蓋内出血分節は重要かつ困難なステップである。そこで我々は,脳内出血セグメンテーションのためのSAM-based parameter- efficient fine-tuning法(SAMIHS)を提案する。 2つの公開データセットに対する実験結果から,提案手法の有効性が示された。
論文参考訳（メタデータ） (2023-11-14T14:23:09Z)
RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4319652364256]
本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文参考訳（メタデータ） (2023-07-03T13:21:58Z)
Semantic Attention and Scale Complementary Network for Instance Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。 SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。 SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文参考訳（メタデータ） (2021-07-25T08:53:59Z)
Differentially private federated deep learning for multi-site medical image segmentation [56.30543374146002]
フェデレートラーニング(FL)のような協調機械学習技術は、データ転送なしで効果的に大規模なデータセット上でモデルのトレーニングを可能にする。近年のイニシアチブでは、FLで訓練されたセグメンテーションモデルが、局所的に訓練されたモデルと同様のパフォーマンスを達成できることが示されている。しかし、FLは完全なプライバシ保護技術ではなく、プライバシ中心の攻撃は秘密の患者データを開示することができる。
論文参考訳（メタデータ） (2021-07-06T12:57:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。