論文の概要: Beyond One-Hot-Encoding: Injecting Semantics to Drive Image Classifiers
- arxiv url: http://arxiv.org/abs/2308.00607v1
- Date: Tue, 1 Aug 2023 15:34:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 13:41:57.160665
- Title: Beyond One-Hot-Encoding: Injecting Semantics to Drive Image Classifiers
- Title(参考訳): ワンホットエンコーディングを超えて:イメージ分類器を駆動するセマンティックスを注入する
- Authors: Alan Perotti, Simone Bertolotto, Eliana Pastor, Andr\'e Panisson
- Abstract要約: 画像分類のための機械学習モデルをトレーニングするために、セマンティック・エンリッチ・ロスを利用する方法を示す。
正確さ、不確実性、内部表現の学習の間のトレードオフを分析します。
このアプローチは、説明可能性と敵対的堅牢性の観点からさらに活用することができる。
- 参考スコア(独自算出の注目度): 3.0969191504482247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Images are loaded with semantic information that pertains to real-world
ontologies: dog breeds share mammalian similarities, food pictures are often
depicted in domestic environments, and so on. However, when training machine
learning models for image classification, the relative similarities amongst
object classes are commonly paired with one-hot-encoded labels. According to
this logic, if an image is labelled as 'spoon', then 'tea-spoon' and 'shark'
are equally wrong in terms of training loss. To overcome this limitation, we
explore the integration of additional goals that reflect ontological and
semantic knowledge, improving model interpretability and trustworthiness. We
suggest a generic approach that allows to derive an additional loss term
starting from any kind of semantic information about the classification label.
First, we show how to apply our approach to ontologies and word embeddings, and
discuss how the resulting information can drive a supervised learning process.
Second, we use our semantically enriched loss to train image classifiers, and
analyse the trade-offs between accuracy, mistake severity, and learned internal
representations. Finally, we discuss how this approach can be further exploited
in terms of explainability and adversarial robustness. Code repository:
https://github.com/S1M0N38/semantic-encodings
- Abstract(参考訳): 画像には現実世界のオントロジーに関連する意味情報が含まれている:犬種は哺乳類の類似性を共有し、食べ物の写真は家庭の環境によく描かれる。
しかし、画像分類のための機械学習モデルを訓練する場合、オブジェクトクラス間の相対的類似性は通常、1ホットコードラベルとペアリングされる。
この論理によれば、イメージを「スプーン」とラベル付けすると、「ティースプーン」と「シャーク」はトレーニング損失の点で等しく間違っている。
この限界を克服するために、オントロジとセマンティックな知識を反映した追加の目標の統合を検討し、モデルの解釈性と信頼性を改善する。
分類ラベルに関するあらゆる種類の意味情報から、追加の損失項を導出できる汎用的アプローチを提案する。
まず,このアプローチをオントロジーや単語埋め込みに適用する方法を示し,得られた情報がどのように教師あり学習プロセスを促進するかについて議論する。
第2に、画像分類器の訓練に意味豊かな損失を使用し、精度、誤り重大度、内部表現の学習のトレードオフを分析する。
最後に,このアプローチを,説明可能性と敵対的ロバスト性の観点からさらに活用する方法について論じる。
コードリポジトリ: https://github.com/s1m0n38/semantic-encodings
関連論文リスト
- Natural Language Induced Adversarial Images [14.415478695871604]
本稿では,自然言語による逆画像攻撃手法を提案する。
中心となる考え方は、入力プロンプトが与えられた逆画像を生成するために、テキスト・ツー・イメージモデルを活用することである。
実験の結果,"foggy","humid","stretching"などの高周波意味情報が誤りを生じやすいことがわかった。
論文 参考訳(メタデータ) (2024-10-11T08:36:07Z) - Towards Image Semantics and Syntax Sequence Learning [8.033697392628424]
画像意味論」と「画像構文」からなる「画像文法」の概念を導入する。
視覚オブジェクト/シーンのクラスに対して画像文法を学習するための弱教師付き2段階アプローチを提案する。
私たちのフレームワークは、パッチセマンティクスを推論し、欠陥のある構文を検出するように訓練されています。
論文 参考訳(メタデータ) (2024-01-31T00:16:02Z) - Few-shot Class-Incremental Semantic Segmentation via Pseudo-Labeling and
Knowledge Distillation [3.4436201325139737]
セマンティックセグメンテーションモデルのための新しいクラスをいくつかの例から学習する問題に対処する。
限られたデータから学習するために、数発のトレーニングアノテーションを増強する擬似ラベル方式を提案する。
上記のステップを、統一的な学習目標を持つ単一の畳み込みニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2023-08-05T05:05:37Z) - HIRL: A General Framework for Hierarchical Image Representation Learning [54.12773508883117]
階層型画像表現学習(HIRL)のための一般的なフレームワークを提案する。
このフレームワークは、各画像の複数の意味表現を学習することを目的としており、これらの表現は、細粒度から粗粒度まで画像意味をエンコードするように構成されている。
確率的因子化に基づいて、HIRLはオフザシェルフ画像SSLアプローチにより最もきめ細かいセマンティクスを学習し、新しいセマンティクスパス識別方式により複数の粗いセマンティクスを学習する。
論文 参考訳(メタデータ) (2022-05-26T05:13:26Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - An Empirical Study of the Collapsing Problem in Semi-Supervised 2D Human
Pose Estimation [80.02124918255059]
半教師付き学習は、ラベルなし画像の探索によってモデルの精度を高めることを目的としている。
私たちは相互に教え合うために2つのネットワークを学びます。
各ネットワーク内の容易なイメージに関するより信頼性の高い予測は、他のネットワークに対応するハードイメージについて学ぶように教えるために使用される。
論文 参考訳(メタデータ) (2020-11-25T03:29:52Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Rethinking Class Relations: Absolute-relative Supervised and
Unsupervised Few-shot Learning [157.62595449130973]
本稿では,現在の数ショット学習法における単純化型クラスモデリングの基本的問題について検討する。
本稿では,ラベル情報をフル活用して画像表現を洗練するための,絶対相対学習パラダイムを提案する。
論文 参考訳(メタデータ) (2020-01-12T12:25:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。