論文の概要: Are We Recognizing the Jaguar or Its Background? A Diagnostic Framework for Jaguar Re-Identification
- arxiv url: http://arxiv.org/abs/2604.09690v1
- Date: Mon, 06 Apr 2026 13:17:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.595561
- Title: Are We Recognizing the Jaguar or Its Background? A Diagnostic Framework for Jaguar Re-Identification
- Title(参考訳): ジャガーの認識と背景 : ジャガー再同定のための診断枠組み
- Authors: Antonio Rueda-Toicen, Abigail Allen Martin, Daniil Morozov, Matin Mahmood, Alexandra Schild, Shahabeddin Dayani, Davide Panza, Gerard de Melo,
- Abstract要約: 本稿では,2つの軸を持つ野生生物再IDの診断フレームワークについて紹介する: 漏洩制御された文脈比,背景/背景,および横フランク検索とミラー自己相似性に基づく横方向診断である。
これらの診断を計測するために、画素ごとのセグメンテーションマスクとアイデンティティバランス評価プロトコルを用いて、パンタナルジャガーベンチマークをキュレートする。
次に、同じ評価レンズのケーススタディとして、代表緩和族、ArcFaceファインチューニング、反対称性正規化、ローレンツ双曲埋め込みを用いる。
- 参考スコア(独自算出の注目度): 44.9049336083726
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Jaguar re-identification (re-ID) from citizen-science imagery can look strong on standard retrieval metrics while still relying on the wrong evidence, such as background context or silhouette shape, instead of the coat pattern that defines identity. We introduce a diagnostic framework for wildlife re-ID with two axes: a leakage-controlled context ratio, background/foreground, computed from inpainted background-only versus foreground-only images, and a laterality diagnostic based on cross-flank retrieval and mirror self-similarity. To make these diagnostics measurable, we curate a Pantanal jaguar benchmark with per-pixel segmentation masks and an identity-balanced evaluation protocol. We then use representative mitigation families, ArcFace fine-tuning, anti-symmetry regularization, and Lorentz hyperbolic embeddings, as case studies under the same evaluation lens. The goal is not only to ask which model ranks best, but also what visual evidence it uses to do so.
- Abstract(参考訳): 市民科学画像からのジャガー再識別(re-ID)は、アイデンティティを定義するコートパターンの代わりに、背景の文脈やシルエットの形状といった間違った証拠に依存しながら、標準的な検索指標に強く見える。
本稿では,背景画像と前景画像から算出した漏洩制御コンテキスト比,背景/背景画像,および横フランク検索とミラー自己相似性に基づく側方性診断の2つの軸を用いた野生生物再ID診断フレームワークを提案する。
これらの診断を計測するために、画素ごとのセグメンテーションマスクとアイデンティティバランス評価プロトコルを用いて、パンタナルジャガーベンチマークをキュレートする。
次に、同じ評価レンズのケーススタディとして、代表緩和族、ArcFaceファインチューニング、反対称性正規化、ローレンツ双曲埋め込みを用いる。
目標は、どのモデルがベストかを尋ねるだけでなく、どんな視覚的証拠を提示するかを尋ねることだ。
関連論文リスト
- NearID: Identity Representation Learning via Near-identity Distractors [116.71529576796605]
既存のビジョンエンコーダは、オブジェクトのアイデンティティを背景コンテキストと絡み合わせることで、信頼性の低い表現やメトリクスを生み出します。
我々は、この脆弱性に対処するための最初の原則付きフレームワークをNear-identity distractorsを使って紹介する。
我々は、厳密なマージンベースの評価プロトコルとともに、NearIDデータセット(19KのID、316Kの一致したコンテキストインタプリタ)を提示する。
論文 参考訳(メタデータ) (2026-04-02T12:33:14Z) - RealBirdID: Benchmarking Bird Species Identification in the Era of MLLMs [21.24879709845471]
野生の鳥の微細な種は、単一の画像からしばしば発見できない。
我々はRealBirdIDベンチマークを提案する: 鳥の画像を考えると、システムは種で答えるか、具体的、エビデンスに基づく理論的根拠で答えるべきである。
各属について、データセットは、ラベル付き有理数を持つ計算不可能な例からなる検証スプリットを含み、明確な答え可能なインスタンスのコンパニオンセットと組み合わせられる。
論文 参考訳(メタデータ) (2026-03-27T22:58:31Z) - Assessing Identity Leakage in Talking Face Generation: Metrics and Evaluation Framework [56.30142869506262]
塗り絵ベースの話し顔生成は、唇の動きだけを変更しながらポーズ、照明、ジェスチャーなどの映像の詳細を保存することを目的としている。
この機構は、生成した唇が、駆動オーディオのみの影響ではなく、参照画像の影響を受けるリップリークを導入することができる。
そこで本研究では,唇の漏れを分析し定量化するためのシステム評価手法を提案する。
論文 参考訳(メタデータ) (2025-11-05T17:11:53Z) - Image-level Regression for Uncertainty-aware Retinal Image Segmentation [3.7141182051230914]
我々は,新たな不確実性認識変換(SAUNA)を導入する。
以上の結果から,SAUNA変換の統合とセグメント化損失は,異なるセグメンテーションモデルにおいて大きな性能向上をもたらすことが示唆された。
論文 参考訳(メタデータ) (2024-05-27T04:17:10Z) - Privacy Assessment on Reconstructed Images: Are Existing Evaluation
Metrics Faithful to Human Perception? [86.58989831070426]
本研究では,手作りのメトリクスの忠実さを,再構成画像からの人間のプライバシー情報の認識に適用する。
本稿では,SemSimと呼ばれる学習に基づく尺度を提案し,オリジナル画像と再構成画像のセマンティック類似性を評価する。
論文 参考訳(メタデータ) (2023-09-22T17:58:04Z) - Diff-ID: An Explainable Identity Difference Quantification Framework for
DeepFake Detection [41.03606237571299]
Diff-IDは、顔の操作によって引き起こされるアイデンティティ損失を説明・測定する、簡潔で効果的なアプローチである。
特定の人物の画像をテストする際、Diff-IDはその人物の真正像を参照として利用し、同一のアイデンティティ非感受性特性特徴空間にアライメントする。
次に、一致したペアのイメージ差から、テストと参照イメージ間のアイデンティティ損失を可視化し、そのID損失を定量化するためのカスタムメトリックを設計する。
論文 参考訳(メタデータ) (2023-03-30T10:10:20Z) - Mask and Restore: Blind Backdoor Defense at Test Time with Masked Autoencoder [50.1394620328318]
既存のバックドア防御手法では、いくつかのバリデーションデータとモデルパラメータにアクセスする必要があることが多い。
Masked AutoEncoder (BDMAE) を用いたブラインドバックドアディフェンスの提案
BDMAEは、画像の構造的類似性と、テスト画像とMAE復元の間のラベルの整合性を用いて、可能な局所的なトリガを検出する。
論文 参考訳(メタデータ) (2023-03-27T19:23:33Z) - Fused Deep Neural Network based Transfer Learning in Occluded Face
Classification and Person re-Identification [0.0]
本論文は,顔画像中の4種類のうちの1種類を認識することを目的としている。
その結果, Gated Recurrent Unit (GRU) を用いた MobileNet V2 は, 他の移動学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-05-15T07:13:33Z) - Development of a face mask detection pipeline for mask-wearing
monitoring in the era of the COVID-19 pandemic: A modular approach [0.0]
SARS-Cov-2パンデミックの間、マスク着用はウイルスの拡散や収縮を防ぐための効果的な手段となった。
人口のマスク着用率を監視する能力は、ウイルスに対する公衆衛生戦略を決定するのに役立つだろう。
1)顔検出とアライメント,2)顔マスク分類の2つのモジュールからなる2段階の顔マスク検出手法を提案する。
論文 参考訳(メタデータ) (2021-12-30T12:32:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。