論文の概要: Multi-Task Image-Based Dietary Assessment for Food Recognition and
Portion Size Estimation
- arxiv url: http://arxiv.org/abs/2004.13188v1
- Date: Mon, 27 Apr 2020 21:35:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:38:25.778671
- Title: Multi-Task Image-Based Dietary Assessment for Food Recognition and
Portion Size Estimation
- Title(参考訳): マルチタスク画像に基づく食品認識と口径推定のための食事評価
- Authors: Jiangpeng He, Zeman Shao, Janine Wright, Deborah Kerr, Carol Boushey
and Fengqing Zhu
- Abstract要約: 本稿では,食品分類と食品部分サイズ推定の両立が可能なエンドツーエンドマルチタスクフレームワークを提案する。
本結果は,分類精度と部分推定の平均絶対誤差の両方において,ベースライン法より優れる。
- 参考スコア(独自算出の注目度): 6.603050343996914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning based methods have achieved impressive results in many
applications for image-based diet assessment such as food classification and
food portion size estimation. However, existing methods only focus on one task
at a time, making it difficult to apply in real life when multiple tasks need
to be processed together. In this work, we propose an end-to-end multi-task
framework that can achieve both food classification and food portion size
estimation. We introduce a food image dataset collected from a nutrition study
where the groundtruth food portion is provided by registered dietitians. The
multi-task learning uses L2-norm based soft parameter sharing to train the
classification and regression tasks simultaneously. We also propose the use of
cross-domain feature adaptation together with normalization to further improve
the performance of food portion size estimation. Our results outperforms the
baseline methods for both classification accuracy and mean absolute error for
portion estimation, which shows great potential for advancing the field of
image-based dietary assessment.
- Abstract(参考訳): ディープラーニングに基づく手法は、食品分類や食品部分サイズ推定など、画像に基づく食事評価に多くの応用で顕著な成果を上げている。
しかし、既存の手法は一度に1つのタスクにのみフォーカスするので、複数のタスクを一緒に処理する必要がある場合、現実に適用することは困難である。
そこで本研究では,食品分類と食品分量推定の両立が可能なエンドツーエンドマルチタスクフレームワークを提案する。
そこで本研究では, 栄養学から収集した食品画像データセットについて紹介する。
マルチタスク学習では、L2ノルムに基づくソフトパラメータ共有を使用して、分類タスクと回帰タスクを同時にトレーニングする。
また,食品部分サイズ推定の性能向上のために,領域間特徴適応と正規化を併用することを提案する。
以上の結果から, 分類精度と平均絶対誤差の両基準法を上回り, 画像に基づく食事評価の分野を前進させる可能性が示唆された。
関連論文リスト
- From Canteen Food to Daily Meals: Generalizing Food Recognition to More
Practical Scenarios [92.58097090916166]
DailyFood-172とDailyFood-16という2つの新しいベンチマークを、毎日の食事から食のイメージをキュレートする。
これらの2つのデータセットは、よく計算された食品画像領域から日常的な食品画像領域へのアプローチの伝達性を評価するために使用される。
論文 参考訳(メタデータ) (2024-03-12T08:32:23Z) - FoodLMM: A Versatile Food Assistant using Large Multi-modal Model [96.76271649854542]
大規模マルチモーダルモデル(LMM)は多くの視覚言語タスクにおいて顕著な進歩を遂げている。
本稿では,多機能なLMMに基づく多目的食品アシスタントであるFoodLMMを提案する。
本稿では,食品の栄養価と複数のセグメンテーションマスクを予測するために,一連の新しいタスク固有のトークンとヘッドを導入する。
論文 参考訳(メタデータ) (2023-12-22T11:56:22Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - Single-Stage Heavy-Tailed Food Classification [7.800379384628357]
そこで本研究では,新しい一段階のヘビーテール食品分類フレームワークを提案する。
本手法は,フード101-LTとVFN-LTの2つの重み付き食品ベンチマークデータセットを用いて評価した。
論文 参考訳(メタデータ) (2023-07-01T00:45:35Z) - Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.50975507723827]
食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2023-06-15T15:38:10Z) - Long-tailed Food Classification [5.874935571318868]
本稿では,フード101-LTとVFN-LTを含む長期食品分類のための2つの新しいベンチマークデータセットを提案する。
本稿では,(1)本級における授業不均衡問題に対処する新しい2相枠組みを提案し,知識蒸留による学習情報の保持とともに冗長なサンプルを除去する。
本手法の有効性は,既存の最先端のロングテール分類法と比較し,Food101-LTとVFN-LTのベンチマークにおいて改善された性能を示す。
論文 参考訳(メタデータ) (2022-10-26T14:29:30Z) - Towards the Creation of a Nutrition and Food Group Based Image Database [58.429385707376554]
栄養・食品群に基づく画像データベースを構築するための枠組みを提案する。
米国農務省食品栄養データベース(FNDDS)における食品群に基づく食品コードリンクプロトコルを設計する。
提案手法は16,114個の食品データセットを含む栄養・食品群に基づく画像データベースを構築するために用いられる。
論文 参考訳(メタデータ) (2022-06-05T02:41:44Z) - Improving Dietary Assessment Via Integrated Hierarchy Food
Classification [7.398060062678395]
本稿では,複数のドメインからの情報を統合することにより,予測の質を向上させるための新しい食品分類フレームワークを提案する。
本手法は, 改良VIPER-FoodNet (VFN) 食品画像データセットに対して, 関連するエネルギーと栄養情報を含むことにより検証した。
論文 参考訳(メタデータ) (2021-09-06T20:59:58Z) - Saliency-Aware Class-Agnostic Food Image Segmentation [10.664526852464812]
クラス別食品画像分割法を提案する。
画像の前後の情報を利用すれば、目立たないオブジェクトを見つけることで、食べ物のイメージをセグメンテーションすることができる。
本手法は,食餌研究から収集した食品画像を用いて検証する。
論文 参考訳(メタデータ) (2021-02-13T08:05:19Z) - An End-to-End Food Image Analysis System [8.622335099019214]
食品の局所化, 分類, 部分サイズ推定を統合した画像に基づく食品分析フレームワークを提案する。
提案するフレームワークはエンドツーエンドであり,複数の食品を含む任意の食品画像として入力することができる。
本研究の枠組みは,栄養摂食調査から収集した実生活食品画像データセットを用いて評価する。
論文 参考訳(メタデータ) (2021-02-01T05:36:20Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。