論文の概要: TagFog: Textual Anchor Guidance and Fake Outlier Generation for Visual Out-of-Distribution Detection
- arxiv url: http://arxiv.org/abs/2412.05292v1
- Date: Fri, 22 Nov 2024 14:40:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-15 08:28:45.030221
- Title: TagFog: Textual Anchor Guidance and Fake Outlier Generation for Visual Out-of-Distribution Detection
- Title(参考訳): TagFog:ビジュアルアウトオブディストリビューション検出のためのテキストアンカー誘導とフェイクアウトリア生成
- Authors: Jiankang Chen, Tong Zhang, Wei-Shi Zheng, Ruixuan Wang,
- Abstract要約: オフ・オブ・ディストリビューション(OOD)検出は多くの現実世界のアプリケーションにおいて重要である。
本稿では,画像エンコーダのトレーニングを支援するために,単純なJigsawベースの偽OODデータと,ChatGPTによるID知識の記述からリッチセマンティック埋め込み(アンカー)を利用する新たな学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 34.31570050254269
- License:
- Abstract: Out-of-distribution (OOD) detection is crucial in many real-world applications. However, intelligent models are often trained solely on in-distribution (ID) data, leading to overconfidence when misclassifying OOD data as ID classes. In this study, we propose a new learning framework which leverage simple Jigsaw-based fake OOD data and rich semantic embeddings (`anchors') from the ChatGPT description of ID knowledge to help guide the training of the image encoder. The learning framework can be flexibly combined with existing post-hoc approaches to OOD detection, and extensive empirical evaluations on multiple OOD detection benchmarks demonstrate that rich textual representation of ID knowledge and fake OOD knowledge can well help train a visual encoder for OOD detection. With the learning framework, new state-of-the-art performance was achieved on all the benchmarks. The code is available at \url{https://github.com/Cverchen/TagFog}.
- Abstract(参考訳): オフ・オブ・ディストリビューション(OOD)検出は多くの現実世界のアプリケーションにおいて重要である。
しかし、インテリジェントモデルはIDデータのみに基づいて訓練されることが多く、OODデータをIDクラスと誤分類する場合、自信過剰につながる。
本研究では,画像エンコーダのトレーニングを支援するために,単純なJigsawベースの偽OODデータと,ChatGPTによる画像エンコーダの知識記述からリッチセマンティック埋め込み("anchors")を活用する新たな学習フレームワークを提案する。
学習フレームワークは、既存のOOD検出に対するポストホックなアプローチと柔軟に組み合わせることができ、複数のOOD検出ベンチマークにおいて、豊富なテキストによるID知識と偽OOD知識の表現が、OOD検出のためのビジュアルエンコーダの訓練に役立つことを示す。
学習フレームワークでは、すべてのベンチマークで新しい最先端のパフォーマンスが達成された。
コードは \url{https://github.com/Cverchen/TagFog} で公開されている。
関連論文リスト
- SimLabel: Consistency-Guided OOD Detection with Pretrained Vision-Language Models [7.90233294809002]
視覚言語モデル(VLM)における意味関連IDラベル間の画像テキスト理解能力について検討する。
我々は,IDとアウト・オブ・ディストリビューション(OOD)の分離性を高めるために,SimLabelと呼ばれる新しいポストホック戦略を提案する。
本実験は,様々なゼロショットOOD検出ベンチマークにおいて,SimLabelの優れた性能を示す。
論文 参考訳(メタデータ) (2025-01-20T13:36:30Z) - FodFoM: Fake Outlier Data by Foundation Models Creates Stronger Visual Out-of-Distribution Detector [25.224930928724326]
オープンソースのアプリケーションに機械学習モデルをデプロイする際には、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
本稿では,新しいOOD検出フレームワークFodFoMを提案する。
最新のOOD検出性能は、複数のベンチマークで実現されている。
論文 参考訳(メタデータ) (2024-11-22T17:29:52Z) - Envisioning Outlier Exposure by Large Language Models for Out-of-Distribution Detection [71.93411099797308]
オープンワールドシナリオに機械学習モデルをデプロイする場合、アウト・オブ・ディストリビューション(OOD)サンプルは不可欠である。
本稿では,大規模言語モデル(LLM)の専門知識と推論能力を活用して,この制約に対処することを提案する。
EOEは、遠、近、きめ細かいOOD検出など、さまざまなタスクに一般化することができる。
EOEは様々なOODタスクで最先端のパフォーマンスを実現し、ImageNet-1Kデータセットに効果的にスケールできる。
論文 参考訳(メタデータ) (2024-06-02T17:09:48Z) - Negative Label Guided OOD Detection with Pretrained Vision-Language Models [96.67087734472912]
Out-of-distriion (OOD) は未知のクラスからサンプルを識別することを目的としている。
我々は,大規模なコーパスデータベースから大量の負のラベルを抽出する,NegLabelと呼ばれる新しいポストホックOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T09:19:52Z) - EAT: Towards Long-Tailed Out-of-Distribution Detection [55.380390767978554]
本稿では,長い尾を持つOOD検出の課題に対処する。
主な困難は、尾クラスに属するサンプルとOODデータを区別することである。
本稿では,(1)複数の禁制クラスを導入して分布内クラス空間を拡大すること,(2)コンテキストリッチなOODデータに画像をオーバーレイすることでコンテキスト限定のテールクラスを拡大すること,の2つの簡単な考え方を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:47:13Z) - Exploring Large Language Models for Multi-Modal Out-of-Distribution
Detection [67.68030805755679]
大きな言語モデル(LLM)は豊富な世界の知識をエンコードし、クラスごとに記述的な特徴を生成するよう促すことができる。
本稿では,LLMの選択的生成によるOOD検出性能向上のための世界知識の適用を提案する。
論文 参考訳(メタデータ) (2023-10-12T04:14:28Z) - Class Relevance Learning For Out-of-distribution Detection [16.029229052068]
本稿では,OOD検出に適したクラス関連学習手法を提案する。
本手法は,OODパイプライン内のクラス間関係を戦略的に活用し,総合的なクラス関連学習フレームワークを確立する。
論文 参考訳(メタデータ) (2023-09-21T08:38:21Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - LoCoOp: Few-Shot Out-of-Distribution Detection via Prompt Learning [37.36999826208225]
本稿では,数発のアウト・オブ・ディストリビューション(OOD)検出のための新しい視覚言語プロンプト学習手法を提案する。
LoCoOpは、トレーニング中にCLIPローカル機能の一部をOOD機能として利用するOOD正規化を実行する。
LoCoOpは、既存のゼロショットと完全に教師付き検出方法より優れている。
論文 参考訳(メタデータ) (2023-06-02T06:33:08Z) - Rethinking Out-of-distribution (OOD) Detection: Masked Image Modeling is
All You Need [52.88953913542445]
簡単な再構築手法を用いることで,OOD検出の性能が大幅に向上する可能性が示唆された。
我々は、OOD検出フレームワーク(MOOD)のプリテキストタスクとして、マスケ画像モデリング(Masked Image Modeling)を採用する。
論文 参考訳(メタデータ) (2023-02-06T08:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。