Fugu-MT 論文翻訳(概要): PizzaCommonSense: Learning to Model Commonsense Reasoning about Intermediate Steps in Cooking Recipes

論文の概要: PizzaCommonSense: Learning to Model Commonsense Reasoning about Intermediate Steps in Cooking Recipes

arxiv url: http://arxiv.org/abs/2401.06930v1
Date: Fri, 12 Jan 2024 23:33:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-17 20:44:24.183890
Title: PizzaCommonSense: Learning to Model Commonsense Reasoning about Intermediate Steps in Cooking Recipes
Title（参考訳）: PizzaCommonSense:調理レシピにおける中間ステップに関するコモンセンス推論のモデル化
Authors: Aissatou Diallo, Antonis Bikakis, Luke Dickens, Anthony Hunter, Rob Miller
Abstract要約: 本稿では,レシピの中間段階を記述した料理レシピのコーパスについて述べる。この研究は、常識的推論と手続き的テキスト生成に関する挑戦的な課題と洞察を提示する。
参考スコア（独自算出の注目度）: 8.410402833223364
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Decoding the core of procedural texts, exemplified by cooking recipes, is crucial for intelligent reasoning and instruction automation. Procedural texts can be comprehensively defined as a sequential chain of steps to accomplish a task employing resources. From a cooking perspective, these instructions can be interpreted as a series of modifications to a food preparation, which initially comprises a set of ingredients. These changes involve transformations of comestible resources. For a model to effectively reason about cooking recipes, it must accurately discern and understand the inputs and outputs of intermediate steps within the recipe. Aiming to address this, we present a new corpus of cooking recipes enriched with descriptions of intermediate steps of the recipes that explicate the input and output for each step. We discuss the data collection process, investigate and provide baseline models based on T5 and GPT-3.5. This work presents a challenging task and insight into commonsense reasoning and procedural text generation.
Abstract（参考訳）: 調理レシピで例示される手続き的テキストのコアをデコードすることは、インテリジェントな推論と指導自動化に不可欠である。手続きテキストは、リソースを使用するタスクを達成するためのステップのシーケンシャルチェーンとして、包括的に定義することができる。調理の観点からは、これらの指示は、当初は一組の材料からなる食品準備への一連の修正と解釈できる。これらの変更は、キャメティブルリソースの変換を伴う。モデルが料理レシピを効果的に推論するためには、レシピ内の中間ステップの入力と出力を正確に認識し、理解する必要がある。そこで本研究では,レシピの中間段階を記述した料理レシピのコーパスを新たに提示し,各ステップの入力と出力を詳述する。本稿では,t5 と gpt-3.5 に基づくベースラインモデルの検討と提供について述べる。本研究は,コモンセンス推論と手続きテキスト生成に関する課題と洞察を提示する。

関連論文リスト

A Highly Clean Recipe Dataset with Ingredient States Annotation for State Probing Task [30.349846688239293]
本稿では,調理過程における中間成分状態の認識方法を評価するための新しいタスクとデータセットを提案する。まず, 成分状態変化の明確かつ正確なアノテーションを用いた新しいレシピデータセットを構築した。このデータセットを用いて,LLMが成分状態遷移を追跡し,中間段階に存在する成分を識別できるかどうかを評価する3つの新しいタスクを設計する。
論文参考訳（メタデータ） (2025-07-23T05:56:20Z)
CookingDiffusion: Cooking Procedural Image Generation with Stable Diffusion [58.92430755180394]
textbfCookingDiffusionは,調理工程のリアルな画像を生成する新しい手法である。これらのプロンプトは、テキストプロンプト、画像プロンプト、マルチモーダルプロンプトを含み、一貫したプロシージャ画像の生成を保証する。実験結果から, 高品質な調理用プロシージャ画像の生成に優れたモデルが得られた。
論文参考訳（メタデータ） (2025-01-15T06:58:53Z)
The Proof is in the Almond Cookies [7.534061469399505]
本稿では、ロボットや人工調理アシスタントがキッチンのシェフを支援できるように、調理レシピ(およびより一般的にはハウツー指導)の処理方法に関するケーススタディを提案する。本稿では,ナラティブに基づく人間の感覚形成過程を模倣する,計算レシピ理解のための新しい手法を提案する。
論文参考訳（メタデータ） (2025-01-03T14:25:35Z)
Large Language Models as Sous Chefs: Revising Recipes with GPT-3 [56.7155146252028]
我々は、複雑で多様で広く使われている指示の例としてレシピに焦点を当てている。我々は、レシピと材料リストに基づいたプロンプトを開発し、レシピをより単純なステップに分解する。また,レシピリビジョンの品質の人的判断を収集しながら,疲労軽減を念頭に設計したAmazon Mechanical Turkタスクにも貢献する。
論文参考訳（メタデータ） (2023-06-24T14:42:43Z)
A Graphical Formalism for Commonsense Reasoning with Recipes [3.271550784789976]
コンベチブル(インディエント、中間食品、最終製品)をキャプチャするグラフィカルな形式化を提案する。次に,レシピの比較,レシピのサブレシピからの合成,レシピをサブレシピに分解するための公式な定義を提案する。また, 食材が不足している場合, あるいはいくつかの動作が不可能であったり, 最終製品を変更する必要があるため, レシピに置き換える公式な定義を2つ導入し比較する。
論文参考訳（メタデータ） (2023-06-15T11:04:30Z)
KitchenScale: Learning to predict ingredient quantities from recipe contexts [13.001618172288198]
KitchenScaleは、レシピのコンテキストからターゲットの材料量と測定単位を予測するモデルである。本稿では,成分測定型分類,単位分類,量回帰タスクの3つのサブタスクからなる成分量予測タスクを定式化する。新たに構築したデータセットとレコメンデーションの例での実験では、さまざまなレシピコンテキストに対するKitchenScaleの理解が示されています。
論文参考訳（メタデータ） (2023-04-21T04:28:16Z)
Counterfactual Recipe Generation: Exploring Compositional Generalization in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文参考訳（メタデータ） (2022-10-20T17:21:46Z)
A Rich Recipe Representation as Plan to Support Expressive Multi Modal Queries on Recipe Content and Preparation Process [24.94173789568803]
機械理解可能なリッチレシピ表現(R3)の構築について論じる。 R3には、アレルゲンに関する情報や成分のイメージなどの追加の知識が注がれている。また,レシピ検索ツールであるTREATをR3を用いて,レシピの内容に対するマルチモーダル推論を行う。
論文参考訳（メタデータ） (2022-03-31T15:29:38Z)
Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文参考訳（メタデータ） (2020-08-20T18:31:25Z)
A Recipe for Creating Multimodal Aligned Datasets for Sequential Tasks [48.39191088844315]
調理領域では、ウェブは、同じ料理を作る方法を記述したテキストとビデオのレシピを多数提供している。我々は、同じ料理の異なるレシピの指示間のペアワイズアライメントを学習する教師なしアライメントアルゴリズムを使用する。次に、グラフアルゴリズムを用いて、同じ料理のための複数のテキストと複数のビデオレシピの協調的なアライメントを導出する。
論文参考訳（メタデータ） (2020-05-19T17:27:00Z)
A Benchmark for Structured Procedural Knowledge Extraction from Cooking Videos [126.66212285239624]
本稿では,調理ビデオから抽出した構造化手続き的知識のベンチマークを提案する。手動で注釈付けしたオープン語彙リソースには、356の指導的調理ビデオと15,523のビデオクリップ/文レベルのアノテーションが含まれています。
論文参考訳（メタデータ） (2020-05-02T05:15:20Z)
Cross-Modal Food Retrieval: Learning a Joint Embedding of Food Images and Recipes with Semantic Consistency and Attention Mechanism [70.85894675131624]
画像とレシピを共通の特徴空間に埋め込み、対応する画像とレシピの埋め込みが互いに近接するように学習する。本稿では,2つのモダリティの埋め込みを正規化するためのセマンティック・一貫性とアテンション・ベース・ネットワーク(SCAN)を提案する。食品画像や調理レシピの最先端のクロスモーダル検索戦略を,かなりの差で達成できることが示される。
論文参考訳（メタデータ） (2020-03-09T07:41:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。