論文の概要: Learning to Classify New Foods Incrementally Via Compressed Exemplars
- arxiv url: http://arxiv.org/abs/2404.07507v1
- Date: Thu, 11 Apr 2024 06:55:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 14:49:00.591115
- Title: Learning to Classify New Foods Incrementally Via Compressed Exemplars
- Title(参考訳): コンプレッションドエグゼクティブな新食品の分類を学習する
- Authors: Justin Yang, Zhihao Duan, Jiangpeng He, Fengqing Zhu,
- Abstract要約: 食品画像分類システムは、画像に基づく食事評価技術を通じて、健康モニタリングと食事追跡において重要な役割を担っている。
既存の食品認識システムは、予め定義された一定数の食品クラスによって特徴づけられる静的なデータセットに依存している。
我々は、圧縮されたデータの品質を適応的に改善するために、ニューラル圧縮モデルを継続的に学習するという概念を紹介した。
- 参考スコア(独自算出の注目度): 8.277136664415513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Food image classification systems play a crucial role in health monitoring and diet tracking through image-based dietary assessment techniques. However, existing food recognition systems rely on static datasets characterized by a pre-defined fixed number of food classes. This contrasts drastically with the reality of food consumption, which features constantly changing data. Therefore, food image classification systems should adapt to and manage data that continuously evolves. This is where continual learning plays an important role. A challenge in continual learning is catastrophic forgetting, where ML models tend to discard old knowledge upon learning new information. While memory-replay algorithms have shown promise in mitigating this problem by storing old data as exemplars, they are hampered by the limited capacity of memory buffers, leading to an imbalance between new and previously learned data. To address this, our work explores the use of neural image compression to extend buffer size and enhance data diversity. We introduced the concept of continuously learning a neural compression model to adaptively improve the quality of compressed data and optimize the bitrates per pixel (bpp) to store more exemplars. Our extensive experiments, including evaluations on food-specific datasets including Food-101 and VFN-74, as well as the general dataset ImageNet-100, demonstrate improvements in classification accuracy. This progress is pivotal in advancing more realistic food recognition systems that are capable of adapting to continually evolving data. Moreover, the principles and methodologies we've developed hold promise for broader applications, extending their benefits to other domains of continual machine learning systems.
- Abstract(参考訳): 食品画像分類システムは、画像に基づく食事評価技術を通じて、健康モニタリングと食事追跡において重要な役割を担っている。
しかし、既存の食品認識システムは、予め定義された一定数の食品クラスによって特徴づけられる静的なデータセットに依存している。
これは、常に変化するデータを特徴とする食品消費の現実とは大きく対照的である。
したがって、食品画像分類システムは、継続的に進化するデータに適応し、管理する必要がある。
ここでは継続的学習が重要な役割を担います。
継続的な学習の課題は破滅的な忘れことであり、MLモデルは新しい情報を学ぶ際に古い知識を捨てる傾向がある。
メモリ再生アルゴリズムは、古いデータを例示として保存することでこの問題を軽減することを約束しているが、メモリバッファの容量の制限によって妨げられ、新しいデータと以前に学習したデータの不均衡につながる。
そこで本研究では,バッファサイズを拡大し,データの多様性を高めるために,ニューラルイメージ圧縮を用いることについて検討する。
我々は、圧縮されたデータの品質を適応的に改善し、ピクセル当たりのビットレートを最適化し、より優れたデータを保存するために、ニューラル圧縮モデルを継続的に学習するという概念を紹介した。
食品101およびVFN-74を含む食品固有のデータセットと一般データセットであるImageNet-100の評価を含む広範な実験は、分類精度の向上を実証している。
この進歩は、絶え間なく進化するデータに適応できる、より現実的な食品認識システムを進める上で重要である。
さらに、私たちが開発した原則と方法論は、より広範なアプリケーションに対する約束を守り、そのメリットを継続的機械学習システムの他の領域に拡張します。
関連論文リスト
- Deep Image-to-Recipe Translation [0.0]
Deep Image-to-Recipe Translation(ディープ・イメージ・ツー・レシピ・トランスレーション)は、鮮やかな食品記憶と料理作りの技法のギャップを埋めることを目的としている。
我々の主な目的は、所定の食品画像から成分を予測することである。
我々のアプローチは、正確性だけで誤解を招く可能性のあるシナリオにおいて、IoU(Intersection over Union)やF1スコアのようなメトリクスの重要性を強調します。
論文 参考訳(メタデータ) (2024-07-01T02:33:07Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - Diffusion Model with Clustering-based Conditioning for Food Image
Generation [22.154182296023404]
深層学習に基づく手法は、食品分類、セグメンテーション、部分サイズ推定などの画像解析に一般的に用いられている。
潜在的な解決策の1つは、データ拡張に合成食品画像を使用することである。
本稿では,高品質で代表的な食品画像を生成するための効果的なクラスタリングベースのトレーニングフレームワークであるClusDiffを提案する。
論文 参考訳(メタデータ) (2023-09-01T01:40:39Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Long-Tailed Continual Learning For Visual Food Recognition [5.377869029561348]
実生活における食品イメージの分布は通常、少数の人気食品が他のものよりも頻繁に消費されるため、長い目で見るのが一般的である。
本稿では,長期連続学習のための新しいエンドツーエンドフレームワークを提案し,破滅的な忘れを効果的に解決する。
また,クラスアクティベーションマップ(CAM)とCutMixを統合した新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2023-07-01T00:55:05Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Online Class-Incremental Learning For Real-World Food Image
Classification [8.438092346233054]
文化的、経済的、個人的影響によって形成された実世界の食品消費パターンは、動的かつ進化的なデータを含んでいる。
Online Class Incremental Learning (OCIL)は、シングルパスのデータストリームから継続的に学習するという課題に対処する。
本稿では,既存のER法用に設計された動的モデル更新モジュールについて述べる。
論文 参考訳(メタデータ) (2023-01-12T19:00:27Z) - A Memory Transformer Network for Incremental Learning [64.0410375349852]
本研究では,モデルが学習する時間とともに,新しいデータクラスが観察される学習環境であるクラスインクリメンタルラーニングについて検討する。
素直な問題定式化にもかかわらず、クラス増分学習への分類モデルの素直な適用は、これまで見られたクラスの「破滅的な忘れ込み」をもたらす。
これは、過去のデータのサブセットをメモリバンクに保存し、将来のタスクをトレーニングする際の忘れの防止にそれを活用することで、破滅的な忘れの問題を克服するものだ。
論文 参考訳(メタデータ) (2022-10-10T08:27:28Z) - Online Continual Learning For Visual Food Classification [7.704949298975352]
既存の方法はトレーニングのために静的なデータセットを必要としており、シーケンシャルに利用可能な新しい食品画像から学ぶことができない。
本稿では,各学習食品に含まれる最も代表的なデータを格納するための,クラスタリングに基づく模範選択アルゴリズムを提案する。
その結果,既存のオンライン連続学習手法と比較して,大幅な改善が見られた。
論文 参考訳(メタデータ) (2021-08-15T17:48:03Z) - Learning Representational Invariances for Data-Efficient Action
Recognition [52.23716087656834]
我々は,データ拡張戦略により,Kinetics-100,UCF-101,HMDB-51データセットのパフォーマンスが期待できることを示す。
また,完全な教師付き設定でデータ拡張戦略を検証し,性能向上を実証した。
論文 参考訳(メタデータ) (2021-03-30T17:59:49Z) - Continual Learning for Blind Image Quality Assessment [80.55119990128419]
ブラインド画像品質評価(BIQA)モデルは、サブポピュレーションシフトに継続的に適応できない。
最近の研究では、利用可能なすべての人間評価のIQAデータセットの組み合わせに関するBIQAメソッドのトレーニングが推奨されている。
モデルがIQAデータセットのストリームから継続的に学習するBIQAの継続的学習を策定する。
論文 参考訳(メタデータ) (2021-02-19T03:07:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。