論文の概要: Long-tailed Food Classification
- arxiv url: http://arxiv.org/abs/2210.14748v1
- Date: Wed, 26 Oct 2022 14:29:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 15:09:06.470747
- Title: Long-tailed Food Classification
- Title(参考訳): ロングテール食品分類
- Authors: Jiangpeng He, Luotao Lin, Heather Eicher-Miller, Fengqing Zhu
- Abstract要約: 本稿では,フード101-LTとVFN-LTを含む長期食品分類のための2つの新しいベンチマークデータセットを提案する。
本稿では,(1)本級における授業不均衡問題に対処する新しい2相枠組みを提案し,知識蒸留による学習情報の保持とともに冗長なサンプルを除去する。
本手法の有効性は,既存の最先端のロングテール分類法と比較し,Food101-LTとVFN-LTのベンチマークにおいて改善された性能を示す。
- 参考スコア(独自算出の注目度): 5.874935571318868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Food classification serves as the basic step of image-based dietary
assessment to predict the types of foods in each input image. However, food
image predictions in a real world scenario are usually long-tail distributed
among different food classes, which cause heavy class-imbalance problems and a
restricted performance. In addition, none of the existing long-tailed
classification methods focus on food data, which can be more challenging due to
the lower inter-class and higher intra-class similarity among foods. In this
work, we first introduce two new benchmark datasets for long-tailed food
classification including Food101-LT and VFN-LT where the number of samples in
VFN-LT exhibits the real world long-tailed food distribution. Then we propose a
novel 2-Phase framework to address the problem of class-imbalance by (1)
undersampling the head classes to remove redundant samples along with
maintaining the learned information through knowledge distillation, and (2)
oversampling the tail classes by performing visual-aware data augmentation. We
show the effectiveness of our method by comparing with existing
state-of-the-art long-tailed classification methods and show improved
performance on both Food101-LT and VFN-LT benchmarks. The results demonstrate
the potential to apply our method to related real life applications.
- Abstract(参考訳): 食品分類は、画像に基づく食品評価の基本的なステップであり、入力画像ごとに食品の種類を予測する。
しかし、現実のシナリオにおける食品イメージの予測は、通常、異なる食品クラスに分散するロングテールであり、重いクラス不均衡と性能の制限を引き起こす。
さらに、既存のロングテールの分類法はいずれも食品データに焦点を当てていないため、クラス間差が低く、クラス内類似度が高いため、より困難である。
本研究は,VFN-LTのサンプル数が実世界の長期食品分布を示すフード101-LTとVFN-LTを含む,長期食品分類のための2つの新しいベンチマークデータセットを最初に導入する。
そこで本研究では,(1)知識蒸留による学習情報の保持とともに冗長なサンプルを除去するヘッドクラスをアンサンプリングし,(2)視覚情報拡張を行うことでテールクラスをオーバーサンプリングすることで,クラス不均衡の問題に対処する新しい2相フレームワークを提案する。
本手法は,既存の最先端のロングテール分類法と比較し,food101-ltとvfn-ltのベンチマークで性能が向上した。
その結果,本手法を実生活応用に適用する可能性が示された。
関連論文リスト
- From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Long-Tailed Continual Learning For Visual Food Recognition [5.377869029561348]
実生活における食品イメージの分布は通常、少数の人気食品が他のものよりも頻繁に消費されるため、長い目で見るのが一般的である。
本稿では,長期連続学習のための新しいエンドツーエンドフレームワークを提案し,破滅的な忘れを効果的に解決する。
また,クラスアクティベーションマップ(CAM)とCutMixを統合した新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2023-07-01T00:55:05Z) - Single-Stage Heavy-Tailed Food Classification [7.800379384628357]
そこで本研究では,新しい一段階のヘビーテール食品分類フレームワークを提案する。
本手法は,フード101-LTとVFN-LTの2つの重み付き食品ベンチマークデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-07-01T00:45:35Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Online Class-Incremental Learning For Real-World Food Image
Classification [8.438092346233054]
文化的、経済的、個人的影響によって形成された実世界の食品消費パターンは、動的かつ進化的なデータを含んでいる。
Online Class Incremental Learning (OCIL)は、シングルパスのデータストリームから継続的に学習するという課題に対処する。
本稿では,既存のER法用に設計された動的モデル更新モジュールについて述べる。
論文 参考訳(メタデータ) (2023-01-12T19:00:27Z) - Online Continual Learning For Visual Food Classification [7.704949298975352]
既存の方法はトレーニングのために静的なデータセットを必要としており、シーケンシャルに利用可能な新しい食品画像から学ぶことができない。
本稿では,各学習食品に含まれる最も代表的なデータを格納するための,クラスタリングに基づく模範選択アルゴリズムを提案する。
その結果,既存のオンライン連続学習手法と比較して,大幅な改善が見られた。
論文 参考訳(メタデータ) (2021-08-15T17:48:03Z) - Class-Balanced Distillation for Long-Tailed Visual Recognition [100.10293372607222]
実世界のイメージはしばしばクラスごとの画像数の著しい不均衡によって特徴づけられ、ロングテール分布に繋がる。
本研究では、インスタンスサンプリングで学習した特徴表現が長尾設定では最適とは程遠いという重要な観察を行うことで、新しいフレームワークを提案する。
我々の主な貢献は、知識蒸留を利用して特徴表現を強化する新しい訓練方法である。
論文 参考訳(メタデータ) (2021-04-12T08:21:03Z) - ISIA Food-500: A Dataset for Large-Scale Food Recognition via Stacked
Global-Local Attention Network [50.7720194859196]
ウィキペディアのリストから500のカテゴリと399,726の画像を含むデータセットISIA Food-500を紹介する。
このデータセットは、既存の一般的なベンチマークデータセットをカテゴリカバレッジとデータボリュームで上回る。
食品認識のための2つのサブネットワークからなるグローバルローカルアテンションネットワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T02:48:27Z) - Multi-Task Image-Based Dietary Assessment for Food Recognition and
Portion Size Estimation [6.603050343996914]
本稿では,食品分類と食品部分サイズ推定の両立が可能なエンドツーエンドマルチタスクフレームワークを提案する。
本結果は,分類精度と部分推定の平均絶対誤差の両方において,ベースライン法より優れる。
論文 参考訳(メタデータ) (2020-04-27T21:35:07Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。