論文の概要: PizzaCommonSense: Learning to Model Commonsense Reasoning about
Intermediate Steps in Cooking Recipes
- arxiv url: http://arxiv.org/abs/2401.06930v1
- Date: Fri, 12 Jan 2024 23:33:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 20:44:24.183890
- Title: PizzaCommonSense: Learning to Model Commonsense Reasoning about
Intermediate Steps in Cooking Recipes
- Title(参考訳): PizzaCommonSense:調理レシピにおける中間ステップに関するコモンセンス推論のモデル化
- Authors: Aissatou Diallo, Antonis Bikakis, Luke Dickens, Anthony Hunter, Rob
Miller
- Abstract要約: 本稿では,レシピの中間段階を記述した料理レシピのコーパスについて述べる。
この研究は、常識的推論と手続き的テキスト生成に関する挑戦的な課題と洞察を提示する。
- 参考スコア(独自算出の注目度): 8.410402833223364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Decoding the core of procedural texts, exemplified by cooking recipes, is
crucial for intelligent reasoning and instruction automation. Procedural texts
can be comprehensively defined as a sequential chain of steps to accomplish a
task employing resources. From a cooking perspective, these instructions can be
interpreted as a series of modifications to a food preparation, which initially
comprises a set of ingredients. These changes involve transformations of
comestible resources. For a model to effectively reason about cooking recipes,
it must accurately discern and understand the inputs and outputs of
intermediate steps within the recipe. Aiming to address this, we present a new
corpus of cooking recipes enriched with descriptions of intermediate steps of
the recipes that explicate the input and output for each step. We discuss the
data collection process, investigate and provide baseline models based on T5
and GPT-3.5. This work presents a challenging task and insight into commonsense
reasoning and procedural text generation.
- Abstract(参考訳): 調理レシピで例示される手続き的テキストのコアをデコードすることは、インテリジェントな推論と指導自動化に不可欠である。
手続きテキストは、リソースを使用するタスクを達成するためのステップのシーケンシャルチェーンとして、包括的に定義することができる。
調理の観点からは、これらの指示は、当初は一組の材料からなる食品準備への一連の修正と解釈できる。
これらの変更は、キャメティブルリソースの変換を伴う。
モデルが料理レシピを効果的に推論するためには、レシピ内の中間ステップの入力と出力を正確に認識し、理解する必要がある。
そこで本研究では,レシピの中間段階を記述した料理レシピのコーパスを新たに提示し,各ステップの入力と出力を詳述する。
本稿では,t5 と gpt-3.5 に基づくベースラインモデルの検討と提供について述べる。
本研究は,コモンセンス推論と手続きテキスト生成に関する課題と洞察を提示する。
関連論文リスト
- Large Language Models as Sous Chefs: Revising Recipes with GPT-3 [56.7155146252028]
我々は、複雑で多様で広く使われている指示の例としてレシピに焦点を当てている。
我々は、レシピと材料リストに基づいたプロンプトを開発し、レシピをより単純なステップに分解する。
また,レシピリビジョンの品質の人的判断を収集しながら,疲労軽減を念頭に設計したAmazon Mechanical Turkタスクにも貢献する。
論文 参考訳(メタデータ) (2023-06-24T14:42:43Z) - Counterfactual Recipe Generation: Exploring Compositional Generalization
in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。
料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。
その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文 参考訳(メタデータ) (2022-10-20T17:21:46Z) - A Rich Recipe Representation as Plan to Support Expressive Multi Modal
Queries on Recipe Content and Preparation Process [24.94173789568803]
機械理解可能なリッチレシピ表現(R3)の構築について論じる。
R3には、アレルゲンに関する情報や成分のイメージなどの追加の知識が注がれている。
また,レシピ検索ツールであるTREATをR3を用いて,レシピの内容に対するマルチモーダル推論を行う。
論文 参考訳(メタデータ) (2022-03-31T15:29:38Z) - Revamping Cross-Modal Recipe Retrieval with Hierarchical Transformers
and Self-supervised Learning [17.42688184238741]
近年, 生活における食品の重要性から, クロスモーダルなレシピ検索が注目されている。
本稿では,テキストおよび画像のエンコーダの確立と高性能化に基づく,簡易なエンド・ツー・エンドモデルを提案する。
提案手法は,Recipe1Mデータセットのクロスモーダルレシピ検索タスクにおける最新性能を実現する。
論文 参考訳(メタデータ) (2021-03-24T10:17:09Z) - Structure-Aware Generation Network for Recipe Generation from Images [142.047662926209]
食品画像と材料のみに基づいて調理指導を行うオープン・リサーチ・タスクについて検討する。
ターゲットレシピは長い段落であり、構造情報に関する注釈を持たない。
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-02T10:54:25Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - Decomposing Generation Networks with Structure Prediction for Recipe
Generation [142.047662926209]
本稿では,構造予測を伴うDGN(Decomposing Generation Networks)を提案する。
具体的には,調理指導を複数のフェーズに分割し,各フェーズに異なるサブジェネレータを割り当てる。
提案手法は, (i) 大域的構造予測成分を用いてレシピ構造を学習し, (ii) 予測された構造に基づいてサブジェネレータ出力成分でレシピ相を生成するという2つの新しいアイデアを含む。
論文 参考訳(メタデータ) (2020-07-27T08:47:50Z) - A Recipe for Creating Multimodal Aligned Datasets for Sequential Tasks [48.39191088844315]
調理領域では、ウェブは、同じ料理を作る方法を記述したテキストとビデオのレシピを多数提供している。
我々は、同じ料理の異なるレシピの指示間のペアワイズアライメントを学習する教師なしアライメントアルゴリズムを使用する。
次に、グラフアルゴリズムを用いて、同じ料理のための複数のテキストと複数のビデオレシピの協調的なアライメントを導出する。
論文 参考訳(メタデータ) (2020-05-19T17:27:00Z) - Classification of Cuisines from Sequentially Structured Recipes [8.696042114987966]
料理の特徴に基づく料理の分類は 際立った問題です。
我々は、RecipeDBデータセット上のこれらの情報を考慮し、様々な分類手法を実装した。
最先端のRoBERTaモデルは、様々な分類モデルの中で73.30%の精度を示した。
論文 参考訳(メタデータ) (2020-04-26T05:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。