論文の概要: Long-Tailed Continual Learning For Visual Food Recognition
- arxiv url: http://arxiv.org/abs/2307.00183v1
- Date: Sat, 1 Jul 2023 00:55:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 17:32:50.830717
- Title: Long-Tailed Continual Learning For Visual Food Recognition
- Title(参考訳): 視覚的食品認識のための長期学習
- Authors: Jiangpeng He and Luotao Lin and Jack Ma and Heather A. Eicher-Miller
and Fengqing Zhu
- Abstract要約: 実生活における食品イメージの分布は通常、少数の人気食品が他のものよりも頻繁に消費されるため、長い目で見るのが一般的である。
本稿では,長期連続学習のための新しいエンドツーエンドフレームワークを提案し,破滅的な忘れを効果的に解決する。
また,クラスアクティベーションマップ(CAM)とCutMixを統合した新しいデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 5.377869029561348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning based food recognition has achieved remarkable progress in
predicting food types given an eating occasion image. However, there are two
major obstacles that hinder deployment in real world scenario. First, as new
foods appear sequentially overtime, a trained model needs to learn the new
classes continuously without causing catastrophic forgetting for already
learned knowledge of existing food types. Second, the distribution of food
images in real life is usually long-tailed as a small number of popular food
types are consumed more frequently than others, which can vary in different
populations. This requires the food recognition method to learn from
class-imbalanced data by improving the generalization ability on instance-rare
food classes. In this work, we focus on long-tailed continual learning and aim
to address both aforementioned challenges. As existing long-tailed food image
datasets only consider healthy people population, we introduce two new
benchmark food image datasets, VFN-INSULIN and VFN-T2D, which exhibits on the
real world food consumption for insulin takers and individuals with type 2
diabetes without taking insulin, respectively. We propose a novel end-to-end
framework for long-tailed continual learning, which effectively addresses the
catastrophic forgetting by applying an additional predictor for knowledge
distillation to avoid misalignment of representation during continual learning.
We also introduce a novel data augmentation technique by integrating
class-activation-map (CAM) and CutMix, which significantly improves the
generalization ability for instance-rare food classes to address the
class-imbalance issue. The proposed method show promising performance with
large margin improvements compared with existing methods.
- Abstract(参考訳): 深層学習に基づく食品認識は,食時画像による食種予測において顕著な進歩を遂げている。
しかし、現実のシナリオでのデプロイメントを妨げる大きな障害が2つあります。
第一に、新しい食品が順次残業するにつれて、訓練されたモデルは、既存の食品の知識を忘れることなく、新しいクラスを継続的に学習する必要がある。
第二に、実生活における食品イメージの分布は、少数の人気食品種が他よりも頻繁に消費されるため、個体数によって異なる。
これにより, 食品等級の一般化能力を向上させることにより, クラス不均衡データから食品認識法を学ぶ必要がある。
本研究は,長期にわたる連続学習に焦点を当て,上記の課題に対処することを目的とする。
既存のロングテールフード画像データセットは健常者のみを対象とし,インスリンを摂取しないインスリン摂取者と2型糖尿病者を対象に,vfn-insulin と vfn-t2d という2つのベンチマーク食品画像データセットを導入した。
本稿では,長期連続学習における表現の不適応を回避するために,知識蒸留に新たな予測器を適用することで,破滅的な忘れを効果的に解決する,新たなエンドツーエンドフレームワークを提案する。
また,CAM(class-activation-map)とCutMixを統合した新しいデータ拡張手法を導入する。
提案手法は,既存手法と比較して大きなマージン改善を施した有望な性能を示す。
関連論文リスト
- NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。
近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。
本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-05-13T14:56:55Z) - Learning to Classify New Foods Incrementally Via Compressed Exemplars [8.277136664415513]
食品画像分類システムは、画像に基づく食事評価技術を通じて、健康モニタリングと食事追跡において重要な役割を担っている。
既存の食品認識システムは、予め定義された一定数の食品クラスによって特徴づけられる静的なデータセットに依存している。
我々は、圧縮されたデータの品質を適応的に改善するために、ニューラル圧縮モデルを継続的に学習するという概念を紹介した。
論文 参考訳(メタデータ) (2024-04-11T06:55:44Z) - From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation
Approaches [60.97896788599621]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Single-Stage Heavy-Tailed Food Classification [7.800379384628357]
そこで本研究では,新しい一段階のヘビーテール食品分類フレームワークを提案する。
本手法は,フード101-LTとVFN-LTの2つの重み付き食品ベンチマークデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-07-01T00:45:35Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Long-tailed Food Classification [5.874935571318868]
本稿では,フード101-LTとVFN-LTを含む長期食品分類のための2つの新しいベンチマークデータセットを提案する。
本稿では,(1)本級における授業不均衡問題に対処する新しい2相枠組みを提案し,知識蒸留による学習情報の保持とともに冗長なサンプルを除去する。
本手法の有効性は,既存の最先端のロングテール分類法と比較し,Food101-LTとVFN-LTのベンチマークにおいて改善された性能を示す。
論文 参考訳(メタデータ) (2022-10-26T14:29:30Z) - Online Continual Learning For Visual Food Classification [7.704949298975352]
既存の方法はトレーニングのために静的なデータセットを必要としており、シーケンシャルに利用可能な新しい食品画像から学ぶことができない。
本稿では,各学習食品に含まれる最も代表的なデータを格納するための,クラスタリングに基づく模範選択アルゴリズムを提案する。
その結果,既存のオンライン連続学習手法と比較して,大幅な改善が見られた。
論文 参考訳(メタデータ) (2021-08-15T17:48:03Z) - Vision-Based Food Analysis for Automatic Dietary Assessment [49.32348549508578]
本総説では, 食品画像分析, 容積推定, 栄養素抽出の3段階からなる, 統合型ビジョンベース食事評価(VBDA)の枠組みを概説する。
深層学習により、VBDAは徐々にエンドツーエンドの実装へと移行し、単一のネットワークに食品画像を適用して栄養を直接見積もる。
論文 参考訳(メタデータ) (2021-08-06T05:46:01Z) - Large Scale Visual Food Recognition [43.43598316339732]
これは2000のカテゴリと100万以上のイメージを持つ、最大規模の食品認識データセットです。
food2kはそれらをカテゴリとイメージの両方で1桁ずつバイパスする。
食品認識のためのディーププログレッシブ領域強化ネットワークを提案します。
論文 参考訳(メタデータ) (2021-03-30T06:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。