論文の概要: Cook-Gen: Robust Generative Modeling of Cooking Actions from Recipes
- arxiv url: http://arxiv.org/abs/2306.01805v1
- Date: Thu, 1 Jun 2023 18:49:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 00:10:24.222421
- Title: Cook-Gen: Robust Generative Modeling of Cooking Actions from Recipes
- Title(参考訳): Cook-Gen: レシピからの調理行動のロバストな生成モデル
- Authors: Revathy Venkataramanan, Kaushik Roy, Kanak Raj, Renjith Prasad, Yuxin
Zi, Vignesh Narayanan, Amit Sheth
- Abstract要約: 食品計算モデルは、健康的な食事習慣を維持するのを助けることで、ますます人気が高まっている。
本研究では,調理行動を含む現在の食品計算モデルを拡張するための生成AI手法について検討する。
本稿では,レシピから調理動作を確実に生成する新しいアグリゲーションベースの生成AI手法であるCook-Genを提案する。
- 参考スコア(独自算出の注目度): 6.666528076345153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As people become more aware of their food choices, food computation models
have become increasingly popular in assisting people in maintaining healthy
eating habits. For example, food recommendation systems analyze recipe
instructions to assess nutritional contents and provide recipe recommendations.
The recent and remarkable successes of generative AI methods, such as
auto-regressive large language models, can lead to robust methods for a more
comprehensive understanding of recipes for healthy food recommendations beyond
surface-level nutrition content assessments. In this study, we explore the use
of generative AI methods to extend current food computation models, primarily
involving the analysis of nutrition and ingredients, to also incorporate
cooking actions (e.g., add salt, fry the meat, boil the vegetables, etc.).
Cooking actions are notoriously hard to model using statistical learning
methods due to irregular data patterns - significantly varying natural language
descriptions for the same action (e.g., marinate the meat vs. marinate the meat
and leave overnight) and infrequently occurring patterns (e.g., add salt occurs
far more frequently than marinating the meat). The prototypical approach to
handling irregular data patterns is to increase the volume of data that the
model ingests by orders of magnitude. Unfortunately, in the cooking domain,
these problems are further compounded with larger data volumes presenting a
unique challenge that is not easily handled by simply scaling up. In this work,
we propose novel aggregation-based generative AI methods, Cook-Gen, that
reliably generate cooking actions from recipes, despite difficulties with
irregular data patterns, while also outperforming Large Language Models and
other strong baselines.
- Abstract(参考訳): 人々が食べ物の選択に気付くにつれて、健康的な食事習慣を維持するために食品計算モデルがますます人気を集めている。
例えば、食品レコメンデーションシステムは、栄養内容の評価とレシピレコメンデーションを提供するためのレシピの指示を分析する。
近年、自動回帰型大規模言語モデルのような生成的ai手法の成功は、表面レベルの栄養内容評価以上の健康的な食品推奨のレシピをより包括的に理解するためのロバストな方法につながる可能性がある。
本研究では,食材や食材の分析を主体とした,現在の食品計算モデルを拡張するための生成的AI手法の利用について検討し,調理行為(塩を加え,肉を揚げる,野菜を煮るなど)を取り入れた。
料理のアクションは、不規則なデータパターンのために統計的学習方法を使ってモデル化することが難しいことで悪名高く、同じ行動(例えば、肉をマリネートし、一夜にして出発する)に対する自然言語記述が著しく変化し、しばしば発生するパターン(例えば、塩を加えることは、肉をマリネートするよりもはるかに頻繁に起こる)である。
不規則なデータパターンを扱うための原型的アプローチは、モデルを桁違いに吸収するデータの量を増やすことである。
残念なことに、調理領域では、これらの問題は、単にスケールアップすることで簡単には処理できない、ユニークなチャレンジを示す大きなデータボリュームとさらに複雑になる。
本研究では,不規則なデータパターンが困難であるにも関わらず,レシピからの調理動作を確実に生成する,集約型生成型ai手法であるcook-genを提案する。
関連論文リスト
- PizzaCommonSense: Learning to Model Commonsense Reasoning about
Intermediate Steps in Cooking Recipes [8.410402833223364]
本稿では,レシピの中間段階を記述した料理レシピのコーパスについて述べる。
この研究は、常識的推論と手続き的テキスト生成に関する挑戦的な課題と洞察を提示する。
論文 参考訳(メタデータ) (2024-01-12T23:33:01Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation
Approaches [60.97896788599621]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - FIRE: Food Image to REcipe generation [11.214936422138742]
フードコンピューティングは、食品画像のレシピ情報を自律的に生成できるエンドツーエンドのインテリジェントシステムを開発することを目的としている。
本稿では,食品コンピューティング分野におけるレシピ生成に適した新しい手法であるFIREを提案する。
本稿では、FIREと大規模言語モデルのプロンプトを統合することの恩恵を享受できる2つの実用的なアプリケーションを紹介する。
論文 参考訳(メタデータ) (2023-08-28T08:14:20Z) - Large Language Models as Sous Chefs: Revising Recipes with GPT-3 [56.7155146252028]
我々は、複雑で多様で広く使われている指示の例としてレシピに焦点を当てている。
我々は、レシピと材料リストに基づいたプロンプトを開発し、レシピをより単純なステップに分解する。
また,レシピリビジョンの品質の人的判断を収集しながら,疲労軽減を念頭に設計したAmazon Mechanical Turkタスクにも貢献する。
論文 参考訳(メタデータ) (2023-06-24T14:42:43Z) - Counterfactual Recipe Generation: Exploring Compositional Generalization
in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。
料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。
その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文 参考訳(メタデータ) (2022-10-20T17:21:46Z) - Assistive Recipe Editing through Critiquing [34.1050269670062]
RecipeCritは階層的な自動エンコーダで、材料レベルの批判をレシピで編集する。
私たちの研究の主な革新は、ユーザーが予測された材料と対話することでレシピを編集できる教師なしのクオリティリングモジュールです。
論文 参考訳(メタデータ) (2022-05-05T05:52:27Z) - Towards Building a Food Knowledge Graph for Internet of Food [66.57235827087092]
食品分類から食品分類、食品知識グラフまで、食品知識組織の進化を概観する。
食品知識グラフは、食品検索と質問回答(QA)、パーソナライズされた食事レコメンデーション、食品分析、可視化において重要な役割を果たす。
食品知識グラフの今後の方向性は、マルチモーダル食品知識グラフや食品インテリジェンスなど、いくつかの分野をカバーする。
論文 参考訳(メタデータ) (2021-07-13T06:26:53Z) - Revamping Cross-Modal Recipe Retrieval with Hierarchical Transformers
and Self-supervised Learning [17.42688184238741]
近年, 生活における食品の重要性から, クロスモーダルなレシピ検索が注目されている。
本稿では,テキストおよび画像のエンコーダの確立と高性能化に基づく,簡易なエンド・ツー・エンドモデルを提案する。
提案手法は,Recipe1Mデータセットのクロスモーダルレシピ検索タスクにおける最新性能を実現する。
論文 参考訳(メタデータ) (2021-03-24T10:17:09Z) - Picture-to-Amount (PITA): Predicting Relative Ingredient Amounts from
Food Images [24.26111169033236]
食品画像から各成分の相対的な量を予測するという,新しい課題と課題について考察する。
本稿では,この問題を解決するために,Picture-to-AmountディープラーニングアーキテクチャであるPITAを提案する。
インターネットから収集されたレシピのデータセットの実験は、モデルが有望な結果を生成することを示す。
論文 参考訳(メタデータ) (2020-10-17T06:43:18Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images
and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。
本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。
食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文 参考訳(メタデータ) (2020-03-09T07:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。