論文の概要: From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios
- arxiv url: http://arxiv.org/abs/2403.07403v1
- Date: Tue, 12 Mar 2024 08:32:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 22:35:50.881130
- Title: From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios
- Title(参考訳): 缶詰から日常食へ:食品認識の一般化からより実践的なシナリオへ
- Authors: Guoshan Liu, Yang Jiao, Jingjing Chen, Bin Zhu, Yu-Gang Jiang
- Abstract要約: DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
- 参考スコア(独自算出の注目度): 92.58097090916166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The precise recognition of food categories plays a pivotal role for
intelligent health management, attracting significant research attention in
recent years. Prominent benchmarks, such as Food-101 and VIREO Food-172,
provide abundant food image resources that catalyze the prosperity of research
in this field. Nevertheless, these datasets are well-curated from canteen
scenarios and thus deviate from food appearances in daily life. This
discrepancy poses great challenges in effectively transferring classifiers
trained on these canteen datasets to broader daily-life scenarios encountered
by humans. Toward this end, we present two new benchmarks, namely DailyFood-172
and DailyFood-16, specifically designed to curate food images from everyday
meals. These two datasets are used to evaluate the transferability of
approaches from the well-curated food image domain to the everyday-life food
image domain. In addition, we also propose a simple yet effective baseline
method named Multi-Cluster Reference Learning (MCRL) to tackle the
aforementioned domain gap. MCRL is motivated by the observation that food
images in daily-life scenarios exhibit greater intra-class appearance variance
compared with those in well-curated benchmarks. Notably, MCRL can be seamlessly
coupled with existing approaches, yielding non-trivial performance
enhancements. We hope our new benchmarks can inspire the community to explore
the transferability of food recognition models trained on well-curated datasets
toward practical real-life applications.
- Abstract(参考訳): 食品カテゴリーの正確な認識は、知的健康管理において重要な役割を担い、近年は重要な研究の注目を集めている。
Food-101やVIREO Food-172のような著名なベンチマークは、この分野の研究の繁栄を触媒する豊富な食品画像資源を提供する。
しかしながら、これらのデータセットは缶詰のシナリオからよく計算されており、日常生活における食品の出現から逸脱している。
この相違は、これらのカンティーンデータセットで訓練された分類器を、人間が遭遇するより広い日々のシナリオに効果的に転送する上で大きな課題をもたらす。
そこで本研究では,毎日の食事のイメージをキュレートするための指標として,dailyfood-172とdailyfood-16を提案する。
これらの2つのデータセットは、精巧な食品画像ドメインから日常食品画像ドメインへのアプローチの転送可能性を評価するために使用される。
さらに,上述した領域ギャップに対処するため,MCRL(Multi-Cluster Reference Learning)というシンプルなベースライン手法を提案する。
MCRLは、日常のシナリオにおける食品画像は、よく計算されたベンチマークと比較すると、クラス内外見のばらつきが大きいという観察に動機付けられている。
特に、MCRLは既存のアプローチとシームレスに結合することができ、非自明なパフォーマンス向上をもたらす。
われわれの新しいベンチマークがコミュニティに刺激を与え、精度の高いデータセットで訓練された食品認識モデルの現実的な実生活アプリケーションへの転送可能性を探ることを期待している。
関連論文リスト
- Personalized Food Image Classification: Benchmark Datasets and New
Baseline [8.019925729254178]
本稿では、自己教師付き学習と時間的特徴情報を活用することにより、個人化された食品画像分類のための新しい枠組みを提案する。
提案手法は両方のベンチマークデータセットで評価され,既存手法と比較して性能が向上した。
論文 参考訳(メタデータ) (2023-09-15T20:11:07Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - Food Image Classification and Segmentation with Attention-based Multiple
Instance Learning [51.279800092581844]
本稿では,食品画像分類とセマンティックセグメンテーションモデルを訓練するための弱教師付き方法論を提案する。
提案手法は、注意に基づくメカニズムと組み合わせて、複数のインスタンス学習アプローチに基づいている。
提案手法の有効性を検証するため,FoodSeg103データセット内の2つのメタクラスについて実験を行った。
論文 参考訳(メタデータ) (2023-08-22T13:59:47Z) - Single-Stage Heavy-Tailed Food Classification [7.800379384628357]
そこで本研究では,新しい一段階のヘビーテール食品分類フレームワークを提案する。
本手法は,フード101-LTとVFN-LTの2つの重み付き食品ベンチマークデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-07-01T00:45:35Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Long-tailed Food Classification [5.874935571318868]
本稿では,フード101-LTとVFN-LTを含む長期食品分類のための2つの新しいベンチマークデータセットを提案する。
本稿では,(1)本級における授業不均衡問題に対処する新しい2相枠組みを提案し,知識蒸留による学習情報の保持とともに冗長なサンプルを除去する。
本手法の有効性は,既存の最先端のロングテール分類法と比較し,Food101-LTとVFN-LTのベンチマークにおいて改善された性能を示す。
論文 参考訳(メタデータ) (2022-10-26T14:29:30Z) - Towards the Creation of a Nutrition and Food Group Based Image Database [58.429385707376554]
栄養・食品群に基づく画像データベースを構築するための枠組みを提案する。
米国農務省食品栄養データベース(FNDDS)における食品群に基づく食品コードリンクプロトコルを設計する。
提案手法は16,114個の食品データセットを含む栄養・食品群に基づく画像データベースを構築するために用いられる。
論文 参考訳(メタデータ) (2022-06-05T02:41:44Z) - Large Scale Visual Food Recognition [43.43598316339732]
これは2000のカテゴリと100万以上のイメージを持つ、最大規模の食品認識データセットです。
food2kはそれらをカテゴリとイメージの両方で1桁ずつバイパスする。
食品認識のためのディーププログレッシブ領域強化ネットワークを提案します。
論文 参考訳(メタデータ) (2021-03-30T06:41:42Z) - MCEN: Bridging Cross-Modal Gap between Cooking Recipes and Dish Images
with Latent Variable Model [28.649961369386148]
我々は、画像やテキストを同じ埋め込み空間に投影することで、モダリティ不変表現を学習するModality-Consistent Embedding Network(MCEN)を提案する。
本手法は, 学習中のモーダル間のアライメントを学習するが, 効率を考慮に入れた推定時間において, 異なるモーダルの埋め込みを独立に計算する。
論文 参考訳(メタデータ) (2020-04-02T16:00:10Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。