Fugu-MT 論文翻訳(概要): Cook-Gen: Robust Generative Modeling of Cooking Actions from Recipes

論文の概要: Cook-Gen: Robust Generative Modeling of Cooking Actions from Recipes

arxiv url: http://arxiv.org/abs/2306.01805v1
Date: Thu, 1 Jun 2023 18:49:47 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-07 00:10:24.222421
Title: Cook-Gen: Robust Generative Modeling of Cooking Actions from Recipes
Title（参考訳）: Cook-Gen: レシピからの調理行動のロバストな生成モデル
Authors: Revathy Venkataramanan, Kaushik Roy, Kanak Raj, Renjith Prasad, Yuxin Zi, Vignesh Narayanan, Amit Sheth
Abstract要約: 食品計算モデルは、健康的な食事習慣を維持するのを助けることで、ますます人気が高まっている。本研究では,調理行動を含む現在の食品計算モデルを拡張するための生成AI手法について検討する。本稿では,レシピから調理動作を確実に生成する新しいアグリゲーションベースの生成AI手法であるCook-Genを提案する。
参考スコア（独自算出の注目度）: 6.666528076345153
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As people become more aware of their food choices, food computation models have become increasingly popular in assisting people in maintaining healthy eating habits. For example, food recommendation systems analyze recipe instructions to assess nutritional contents and provide recipe recommendations. The recent and remarkable successes of generative AI methods, such as auto-regressive large language models, can lead to robust methods for a more comprehensive understanding of recipes for healthy food recommendations beyond surface-level nutrition content assessments. In this study, we explore the use of generative AI methods to extend current food computation models, primarily involving the analysis of nutrition and ingredients, to also incorporate cooking actions (e.g., add salt, fry the meat, boil the vegetables, etc.). Cooking actions are notoriously hard to model using statistical learning methods due to irregular data patterns - significantly varying natural language descriptions for the same action (e.g., marinate the meat vs. marinate the meat and leave overnight) and infrequently occurring patterns (e.g., add salt occurs far more frequently than marinating the meat). The prototypical approach to handling irregular data patterns is to increase the volume of data that the model ingests by orders of magnitude. Unfortunately, in the cooking domain, these problems are further compounded with larger data volumes presenting a unique challenge that is not easily handled by simply scaling up. In this work, we propose novel aggregation-based generative AI methods, Cook-Gen, that reliably generate cooking actions from recipes, despite difficulties with irregular data patterns, while also outperforming Large Language Models and other strong baselines.
Abstract（参考訳）: 人々が食べ物の選択に気付くにつれて、健康的な食事習慣を維持するために食品計算モデルがますます人気を集めている。例えば、食品レコメンデーションシステムは、栄養内容の評価とレシピレコメンデーションを提供するためのレシピの指示を分析する。近年、自動回帰型大規模言語モデルのような生成的ai手法の成功は、表面レベルの栄養内容評価以上の健康的な食品推奨のレシピをより包括的に理解するためのロバストな方法につながる可能性がある。本研究では,食材や食材の分析を主体とした,現在の食品計算モデルを拡張するための生成的AI手法の利用について検討し,調理行為(塩を加え,肉を揚げる,野菜を煮るなど)を取り入れた。料理のアクションは、不規則なデータパターンのために統計的学習方法を使ってモデル化することが難しいことで悪名高く、同じ行動(例えば、肉をマリネートし、一夜にして出発する)に対する自然言語記述が著しく変化し、しばしば発生するパターン(例えば、塩を加えることは、肉をマリネートするよりもはるかに頻繁に起こる)である。不規則なデータパターンを扱うための原型的アプローチは、モデルを桁違いに吸収するデータの量を増やすことである。残念なことに、調理領域では、これらの問題は、単にスケールアップすることで簡単には処理できない、ユニークなチャレンジを示す大きなデータボリュームとさらに複雑になる。本研究では,不規則なデータパターンが困難であるにも関わらず,レシピからの調理動作を確実に生成する,集約型生成型ai手法であるcook-genを提案する。

関連論文リスト

Personalized Class Incremental Context-Aware Food Classification for Food Intake Monitoring Systems [3.8767314375943918]
既存の食品分類モデルでは、新しい分類の精度は低く、パーソナライゼーションの欠如がある。本稿では,これらの課題を克服するために,個人別・クラス別食品分類モデルを提案する。本手法は, 個人化により, 新クラスと既存クラスの両方に適用可能性と精度を維持しながら, 新たな食品クラスに適応する。
論文参考訳（メタデータ） (2025-03-09T14:50:56Z)
CookingDiffusion: Cooking Procedural Image Generation with Stable Diffusion [58.92430755180394]
textbfCookingDiffusionは,調理工程のリアルな画像を生成する新しい手法である。これらのプロンプトは、テキストプロンプト、画像プロンプト、マルチモーダルプロンプトを含み、一貫したプロシージャ画像の生成を保証する。実験結果から, 高品質な調理用プロシージャ画像の生成に優れたモデルが得られた。
論文参考訳（メタデータ） (2025-01-15T06:58:53Z)
Retrieval Augmented Recipe Generation [96.43285670458803]
本稿では,レシピ生成のための拡張型大規模マルチモーダルモデルを提案する。既存のデータストアからサプリメントとして、イメージにセマンティックに関連付けられたレシピを検索する。生成したレシピ候補間の一貫性を計算し、異なる検索レシピを生成のコンテキストとして使用する。
論文参考訳（メタデータ） (2024-11-13T15:58:50Z)
NutritionVerse-Direct: Exploring Deep Neural Networks for Multitask Nutrition Prediction from Food Images [63.314702537010355]
自己申告法はしばしば不正確であり、重大な偏見に悩まされる。近年、食品画像から栄養情報を予測するためにコンピュータビジョン予測システムを用いた研究が進められている。本稿では,様々なニューラルネットワークアーキテクチャを活用することにより,食事摂取量推定の有効性を高めることを目的とする。
論文参考訳（メタデータ） (2024-05-13T14:56:55Z)
FIRE: Food Image to REcipe generation [10.45344523054623]
フードコンピューティングは、食品画像のレシピ情報を自律的に生成できるエンドツーエンドのインテリジェントシステムを開発することを目的としている。本稿では,食品コンピューティング分野におけるレシピ生成に適した新しい手法であるFIREを提案する。本稿では、FIREと大規模言語モデルのプロンプトを統合することの恩恵を享受できる2つの実用的なアプリケーションを紹介する。
論文参考訳（メタデータ） (2023-08-28T08:14:20Z)
Large Language Models as Sous Chefs: Revising Recipes with GPT-3 [56.7155146252028]
我々は、複雑で多様で広く使われている指示の例としてレシピに焦点を当てている。我々は、レシピと材料リストに基づいたプロンプトを開発し、レシピをより単純なステップに分解する。また,レシピリビジョンの品質の人的判断を収集しながら,疲労軽減を念頭に設計したAmazon Mechanical Turkタスクにも貢献する。
論文参考訳（メタデータ） (2023-06-24T14:42:43Z)
Counterfactual Recipe Generation: Exploring Compositional Generalization in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文参考訳（メタデータ） (2022-10-20T17:21:46Z)
Simulating Personal Food Consumption Patterns using a Modified Markov Chain [5.874935571318868]
本稿では,マルコフ連鎖モデルの改良と自己指導型学習を活用することにより,個人用食品消費データパターンをシミュレートする新しい枠組みを提案する。実験の結果,ランダムシミュレーションやマルコフ連鎖法と比較して有望な性能を示した。
論文参考訳（メタデータ） (2022-08-13T18:50:23Z)
Assistive Recipe Editing through Critiquing [34.1050269670062]
RecipeCritは階層的な自動エンコーダで、材料レベルの批判をレシピで編集する。私たちの研究の主な革新は、ユーザーが予測された材料と対話することでレシピを編集できる教師なしのクオリティリングモジュールです。
論文参考訳（メタデータ） (2022-05-05T05:52:27Z)
Revamping Cross-Modal Recipe Retrieval with Hierarchical Transformers and Self-supervised Learning [17.42688184238741]
近年, 生活における食品の重要性から, クロスモーダルなレシピ検索が注目されている。本稿では,テキストおよび画像のエンコーダの確立と高性能化に基づく,簡易なエンド・ツー・エンドモデルを提案する。提案手法は,Recipe1Mデータセットのクロスモーダルレシピ検索タスクにおける最新性能を実現する。
論文参考訳（メタデータ） (2021-03-24T10:17:09Z)
Picture-to-Amount (PITA): Predicting Relative Ingredient Amounts from Food Images [24.26111169033236]
食品画像から各成分の相対的な量を予測するという,新しい課題と課題について考察する。本稿では,この問題を解決するために,Picture-to-AmountディープラーニングアーキテクチャであるPITAを提案する。インターネットから収集されたレシピのデータセットの実験は、モデルが有望な結果を生成することを示す。
論文参考訳（メタデータ） (2020-10-17T06:43:18Z)
Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文参考訳（メタデータ） (2020-08-20T18:31:25Z)
Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文参考訳（メタデータ） (2020-03-09T07:41:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。