Fugu-MT 論文翻訳(概要): Picture-to-Amount (PITA): Predicting Relative Ingredient Amounts from Food Images

論文の概要: Picture-to-Amount (PITA): Predicting Relative Ingredient Amounts from Food Images

arxiv url: http://arxiv.org/abs/2010.08727v1
Date: Sat, 17 Oct 2020 06:43:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-06 11:56:24.776419
Title: Picture-to-Amount (PITA): Predicting Relative Ingredient Amounts from Food Images
Title（参考訳）: pic-to-amount(pita):食品画像からの相対成分量予測
Authors: Jiatong Li, Fangda Han, Ricardo Guerrero, Vladimir Pavlovic
Abstract要約: 食品画像から各成分の相対的な量を予測するという,新しい課題と課題について考察する。本稿では,この問題を解決するために,Picture-to-AmountディープラーニングアーキテクチャであるPITAを提案する。インターネットから収集されたレシピのデータセットの実験は、モデルが有望な結果を生成することを示す。
参考スコア（独自算出の注目度）: 24.26111169033236
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Increased awareness of the impact of food consumption on health and lifestyle today has given rise to novel data-driven food analysis systems. Although these systems may recognize the ingredients, a detailed analysis of their amounts in the meal, which is paramount for estimating the correct nutrition, is usually ignored. In this paper, we study the novel and challenging problem of predicting the relative amount of each ingredient from a food image. We propose PITA, the Picture-to-Amount deep learning architecture to solve the problem. More specifically, we predict the ingredient amounts using a domain-driven Wasserstein loss from image-to-recipe cross-modal embeddings learned to align the two views of food data. Experiments on a dataset of recipes collected from the Internet show the model generates promising results and improves the baselines on this challenging task. A demo of our system and our data is availableat: foodai.cs.rutgers.edu.
Abstract（参考訳）: 食品消費が健康やライフスタイルに与える影響に対する意識の向上は、新しいデータ駆動型食品分析システムを生み出している。これらのシステムはこれらの成分を認識できるが、正しい栄養を推定するのに最重要となる食事中の量の詳細な分析は通常無視される。本稿では,食品画像から各成分の相対的な量を予測するという,新しい課題と課題について考察する。本稿では,この問題を解決するためのPicture-to-AmountディープラーニングアーキテクチャであるPITAを提案する。具体的には、食品データの2つの視点を整合させるために学習した画像とレシピ間の埋め込みから、ドメイン駆動のワッサースタイン損失を用いて、成分量を予測する。インターネットから収集されたレシピのデータセットの実験では、モデルが有望な結果を生成し、この課題のベースラインを改善する。私たちのシステムと私たちのデータのデモは foodai.cs.rutgers.edu で利用可能です。

関連論文リスト

Advancing Food Nutrition Estimation via Visual-Ingredient Feature Fusion [69.84988999191343]
我々はファストフード(FastFood)について紹介する。ファストフード(FastFood)は、908のファストフードカテゴリーに84,446のイメージを持つデータセットで、成分や栄養のアノテーションが特徴である。栄養推定の精度を高めるために,新しいモデル非依存型ビジュアル・イングレディエント・フィーチャー・フュージョン (VIF$2$) 法を提案する。
論文参考訳（メタデータ） (2025-05-13T17:01:21Z)
How Much You Ate? Food Portion Estimation on Spoons [63.611551981684244]
現在の画像に基づく食品部分推定アルゴリズムは、ユーザが食事の画像を1、2回取ることを前提としている。本稿では,静止型ユーザ向けカメラを用いて,機器上の食品の追跡を行う革新的なソリューションを提案する。本システムは,スープやシチューなどの液状固形不均一混合物の栄養含量の推定に信頼性が高い。
論文参考訳（メタデータ） (2024-05-12T00:16:02Z)
NutritionVerse-Real: An Open Access Manually Collected 2D Food Scene Dataset for Dietary Intake Estimation [68.49526750115429]
食事摂取推定のための2D食品シーンデータセットであるNutritionVerse-Realを導入する。 NutritionVerse-Realデータセットは、実生活における食品シーンのイメージを手作業で収集し、各成分の重量を測定し、各料理の食生活内容を計算することによって作成されました。
論文参考訳（メタデータ） (2023-11-20T11:05:20Z)
Personalized Food Image Classification: Benchmark Datasets and New Baseline [8.019925729254178]
本稿では、自己教師付き学習と時間的特徴情報を活用することにより、個人化された食品画像分類のための新しい枠組みを提案する。提案手法は両方のベンチマークデータセットで評価され,既存手法と比較して性能が向上した。
論文参考訳（メタデータ） (2023-09-15T20:11:07Z)
NutritionVerse: Empirical Study of Various Dietary Intake Estimation Approaches [59.38343165508926]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文参考訳（メタデータ） (2023-09-14T13:29:41Z)
Towards the Creation of a Nutrition and Food Group Based Image Database [58.429385707376554]
栄養・食品群に基づく画像データベースを構築するための枠組みを提案する。米国農務省食品栄養データベース(FNDDS)における食品群に基づく食品コードリンクプロトコルを設計する。提案手法は16,114個の食品データセットを含む栄養・食品群に基づく画像データベースを構築するために用いられる。
論文参考訳（メタデータ） (2022-06-05T02:41:44Z)
Towards Building a Food Knowledge Graph for Internet of Food [66.57235827087092]
食品分類から食品分類、食品知識グラフまで、食品知識組織の進化を概観する。食品知識グラフは、食品検索と質問回答(QA)、パーソナライズされた食事レコメンデーション、食品分析、可視化において重要な役割を果たす。食品知識グラフの今後の方向性は、マルチモーダル食品知識グラフや食品インテリジェンスなど、いくつかの分野をカバーする。
論文参考訳（メタデータ） (2021-07-13T06:26:53Z)
Saliency-Aware Class-Agnostic Food Image Segmentation [10.664526852464812]
クラス別食品画像分割法を提案する。画像の前後の情報を利用すれば、目立たないオブジェクトを見つけることで、食べ物のイメージをセグメンテーションすることができる。本手法は,食餌研究から収集した食品画像を用いて検証する。
論文参考訳（メタデータ） (2021-02-13T08:05:19Z)
An End-to-End Food Image Analysis System [8.622335099019214]
食品の局所化, 分類, 部分サイズ推定を統合した画像に基づく食品分析フレームワークを提案する。提案するフレームワークはエンドツーエンドであり,複数の食品を含む任意の食品画像として入力することができる。本研究の枠組みは,栄養摂食調査から収集した実生活食品画像データセットを用いて評価する。
論文参考訳（メタデータ） (2021-02-01T05:36:20Z)
Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文参考訳（メタデータ） (2020-03-09T07:41:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。