論文の概要: Identity-Aware U-Net: Fine-grained Cell Segmentation via Identity-Aware Representation Learning
- arxiv url: http://arxiv.org/abs/2604.09702v1
- Date: Tue, 07 Apr 2026 08:43:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.612891
- Title: Identity-Aware U-Net: Fine-grained Cell Segmentation via Identity-Aware Representation Learning
- Title(参考訳): アイデンティティを意識したU-Net:アイデンティティを意識した表現学習による微細なセルセグメンテーション
- Authors: Rui Xiao,
- Abstract要約: 識別・認識の観点から,細粒度物体のセグメンテーションについて検討する。
本稿では,空間的ローカライゼーションとインスタンス識別を共同でモデル化する統合フレームワークIAU-Netを提案する。
- 参考スコア(独自算出の注目度): 1.8412359961003368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise segmentation of objects with highly similar shapes remains a challenging problem in dense prediction, especially in scenarios with ambiguous boundaries, overlapping instances, and weak inter-instance visual differences. While conventional segmentation models are effective at localizing object regions, they often lack the discriminative capacity required to reliably distinguish a target object from morphologically similar distractors. In this work, we study fine-grained object segmentation from an identity-aware perspective and propose Identity-Aware U-Net (IAU-Net), a unified framework that jointly models spatial localization and instance discrimination. Built upon a U-Net-style encoder-decoder architecture, our method augments the segmentation backbone with an auxiliary embedding branch that learns discriminative identity representations from high-level features, while the main branch predicts pixel-accurate masks. To enhance robustness in distinguishing objects with near-identical contours or textures, we further incorporate triplet-based metric learning, which pulls target-consistent embeddings together and separates them from hard negatives with similar morphology. This design enables the model to move beyond category-level segmentation and acquire a stronger capability for precise discrimination among visually similar objects. Experiments on benchmarks including cell segmentation demonstrate promising results, particularly in challenging cases involving similar contours, dense layouts, and ambiguous boundaries.
- Abstract(参考訳): 非常に類似した形状の物体の精密なセグメンテーションは、特に曖昧な境界、重複するインスタンス、弱いインスタンス間視覚差のシナリオにおいて、密接な予測において難しい問題である。
従来のセグメンテーションモデルは対象領域のローカライズに有効であるが、対象物体と形態的に類似した散逸物とを確実に区別するために必要な識別能力に欠けることが多い。
本研究では,個人認識の観点から細粒度オブジェクトのセグメンテーションについて検討し,空間的ローカライゼーションとインスタンス識別を協調的にモデル化する統合フレームワークであるID-Aware U-Net(IAU-Net)を提案する。
U-Net方式のエンコーダデコーダアーキテクチャを基盤として,本手法では,高次特徴から識別的アイデンティティ表現を学習する補助埋め込み分岐を用いてセグメント化バックボーンを拡張し,メインブランチは画素精度のマスクを予測する。
ほぼ同一の輪郭やテクスチャで物体を識別する際の堅牢性を高めるため,三重項に基づくメートル法学習を取り入れた。
この設計により、モデルがカテゴリレベルのセグメンテーションを超えて移動し、視覚的に類似したオブジェクト間の正確な識別のためのより強力な能力を得ることができる。
セルセグメンテーションを含むベンチマークの実験は、特に同様の輪郭、密なレイアウト、曖昧な境界を含む挑戦的なケースにおいて、有望な結果を示している。
関連論文リスト
- Segment Concealed Objects with Incomplete Supervision [63.637733655439334]
不完全なスーパービジョン・コンセサイテッド・オブジェクト(ISCOS)は、周囲の環境にシームレスにブレンドするオブジェクトを分割する。
このタスクは、不完全な注釈付きトレーニングデータによって提供される限られた監督のため、非常に難しいままである。
本稿では,これらの課題に対処するためのISCOSの統一手法について紹介する。
論文 参考訳(メタデータ) (2025-06-10T16:25:15Z) - EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation [5.476136494434766]
意味的類似性行列から派生した固有ベイズを通して意味的および構造的手がかりを提供する手法であるEiCueを紹介する。
オブジェクトレベルの表現を画像内および画像間の整合性で学習する。
COCO-Stuff、Cityscapes、Potsdam-3データセットの実験では、最先端のUSSの結果が示されている。
論文 参考訳(メタデータ) (2024-03-03T11:24:16Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.11264880907652]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。
本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。
我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - Framework-agnostic Semantically-aware Global Reasoning for Segmentation [29.69187816377079]
本稿では,画像特徴を潜在表現に投影し,それら間の関係を推論するコンポーネントを提案する。
我々の設計では、活性化領域が空間的に不整合であることを保証することにより、潜在領域が意味概念を表現することを奨励している。
潜在トークンはセマンティックに解釈可能で多様性があり、下流タスクに転送可能な豊富な機能セットを提供します。
論文 参考訳(メタデータ) (2022-12-06T21:42:05Z) - SegmentMeIfYouCan: A Benchmark for Anomaly Segmentation [111.61261419566908]
ディープニューラルネットワーク(DNN)は通常、閉集合のセマンティッククラスで訓練される。
未発見のオブジェクトを扱うには不備だ。
このような物体の検出と局在化は、自動運転の認識などの安全クリティカルなアプリケーションに不可欠です。
論文 参考訳(メタデータ) (2021-04-30T07:58:19Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。