論文の概要: Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning
- arxiv url: http://arxiv.org/abs/2308.11452v1
- Date: Tue, 22 Aug 2023 13:59:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-23 17:47:39.902302
- Title: Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning
- Title(参考訳): 注意に基づく複数インスタンス学習による食品画像の分類とセグメンテーション
- Authors: Valasia Vlachopoulou, Ioannis Sarafis, Alexandros Papadopoulos
- Abstract要約: 本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
- 参考スコア(独自算出の注目度): 51.279800092581844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The demand for accurate food quantification has increased in the recent
years, driven by the needs of applications in dietary monitoring. At the same
time, computer vision approaches have exhibited great potential in automating
tasks within the food domain. Traditionally, the development of machine
learning models for these problems relies on training data sets with
pixel-level class annotations. However, this approach introduces challenges
arising from data collection and ground truth generation that quickly become
costly and error-prone since they must be performed in multiple settings and
for thousands of classes. To overcome these challenges, the paper presents a
weakly supervised methodology for training food image classification and
semantic segmentation models without relying on pixel-level annotations. The
proposed methodology is based on a multiple instance learning approach in
combination with an attention-based mechanism. At test time, the models are
used for classification and, concurrently, the attention mechanism generates
semantic heat maps which are used for food class segmentation. In the paper, we
conduct experiments on two meta-classes within the FoodSeg103 data set to
verify the feasibility of the proposed approach and we explore the functioning
properties of the attention mechanism.
- Abstract(参考訳): 食品の正確な定量化の需要は近年増加しており、食品モニタリングの応用が求められている。
同時に、コンピュータビジョンのアプローチは、食品領域内でのタスクの自動化に大きな可能性を示した。
従来、これらの問題に対する機械学習モデルの開発は、ピクセルレベルのクラスアノテーションによるデータセットのトレーニングに依存している。
しかし、このアプローチでは、複数の設定や数千のクラスで実行する必要があるため、データ収集や地底真理生成による課題が急速にコストがかかり、エラーが発生しやすい。
これらの課題を克服するため,本稿では,食品画像分類と意味セグメンテーションモデルをピクセルレベルのアノテーションに頼らずに学習するための弱い教師付き手法を提案する。
提案手法は,マルチインスタンス学習手法と注意に基づくメカニズムを組み合わせたものである。
テスト時に、モデルは分類に使用され、同時に、注意機構は食品分類のセグメンテーションに使用されるセマンティックヒートマップを生成する。
本稿では,FoodSeg103データセット内の2つのメタクラスについて実験を行い,提案手法の有効性を検証するとともに,注意機構の機能的特性について検討する。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Mitigating Bias: Enhancing Image Classification by Improving Model
Explanations [9.791305104409057]
ディープラーニングモデルは、画像の背景にあるシンプルで容易に識別できる特徴に大きく依存する傾向がある。
モデルに十分な注意を前景に割り当てるよう促すメカニズムを導入する。
本研究は,画像内の主概念の理解と表現を高める上で,前景の注意が重要であることを明らかにする。
論文 参考訳(メタデータ) (2023-07-04T04:46:44Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Online Class-Incremental Learning For Real-World Food Image
Classification [8.438092346233054]
文化的、経済的、個人的影響によって形成された実世界の食品消費パターンは、動的かつ進化的なデータを含んでいる。
Online Class Incremental Learning (OCIL)は、シングルパスのデータストリームから継続的に学習するという課題に対処する。
本稿では,既存のER法用に設計された動的モデル更新モジュールについて述べる。
論文 参考訳(メタデータ) (2023-01-12T19:00:27Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Simulating Personal Food Consumption Patterns using a Modified Markov
Chain [5.874935571318868]
本稿では,マルコフ連鎖モデルの改良と自己指導型学習を活用することにより,個人用食品消費データパターンをシミュレートする新しい枠組みを提案する。
実験の結果,ランダムシミュレーションやマルコフ連鎖法と比較して有望な性能を示した。
論文 参考訳(メタデータ) (2022-08-13T18:50:23Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - Move-to-Data: A new Continual Learning approach with Deep CNNs,
Application for image-class recognition [0.0]
トレーニング記録フェーズ」でモデルを事前トレーニングし、新しいデータに調整する必要がある。
本稿では,ニューラルネットワークの終端における高速連続学習層を提案する。
論文 参考訳(メタデータ) (2020-06-12T13:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。