論文の概要: The Proof is in the Almond Cookies
- arxiv url: http://arxiv.org/abs/2501.01827v1
- Date: Fri, 03 Jan 2025 14:25:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-06 15:12:29.339970
- Title: The Proof is in the Almond Cookies
- Title(参考訳): プロフはアーモンドクッキーにあります
- Authors: Remi van Trijp, Katrien Beuls, Paul Van Eecke,
- Abstract要約: 本稿では、ロボットや人工調理アシスタントがキッチンのシェフを支援できるように、調理レシピ(およびより一般的にはハウツー指導)の処理方法に関するケーススタディを提案する。
本稿では,ナラティブに基づく人間の感覚形成過程を模倣する,計算レシピ理解のための新しい手法を提案する。
- 参考スコア(独自算出の注目度): 7.534061469399505
- License:
- Abstract: This paper presents a case study on how to process cooking recipes (and more generally, how-to instructions) in a way that makes it possible for a robot or artificial cooking assistant to support human chefs in the kitchen. Such AI assistants would be of great benefit to society, as they can help to sustain the autonomy of aging adults or people with a physical impairment, or they may reduce the stress in a professional kitchen. We propose a novel approach to computational recipe understanding that mimics the human sense-making process, which is narrative-based. Using an English recipe for almond crescent cookies as illustration, we show how recipes can be modelled as rich narrative structures by integrating various knowledge sources such as language processing, ontologies, and mental simulation. We show how such narrative structures can be used for (a) dealing with the challenges of recipe language, such as zero anaphora, (b) optimizing a robot's planning process, (c) measuring how well an AI system understands its current tasks, and (d) allowing recipe annotations to become language-independent.
- Abstract(参考訳): 本稿では、ロボットや人工調理アシスタントがキッチンのシェフを支援できるように、調理レシピ(およびより一般的にはハウツー指導)の処理方法に関するケーススタディを提案する。
こうしたAIアシスタントは、高齢の成人や身体障害のある人々の自律性を維持するのに役立つか、あるいはプロのキッチンでのストレスを減らすことができるため、社会にとって大きな利益となるだろう。
本稿では,ナラティブに基づく人間の感覚形成過程を模倣する,計算レシピ理解のための新しい手法を提案する。
アーモンド三日月クッキーの英語レシピを図示として,言語処理やオントロジー,メンタルシミュレーションなど,さまざまな知識ソースを統合することで,レシピをリッチな物語構造としてモデル化する方法を示す。
このような物語構造がどのように使われるかを示す。
(a)ゼロアナフォラのようなレシピ言語の課題を扱う。
b)ロボットの計画プロセスの最適化
(c)AIシステムが現在のタスクをどのように理解しているか、そして
(d) レシピアノテーションを言語に依存しないものにすること。
関連論文リスト
- CookingDiffusion: Cooking Procedural Image Generation with Stable Diffusion [58.92430755180394]
textbfCookingDiffusionは,調理工程のリアルな画像を生成する新しい手法である。
これらのプロンプトは、テキストプロンプト、画像プロンプト、マルチモーダルプロンプトを含み、一貫したプロシージャ画像の生成を保証する。
実験結果から, 高品質な調理用プロシージャ画像の生成に優れたモデルが得られた。
論文 参考訳(メタデータ) (2025-01-15T06:58:53Z) - PizzaCommonSense: Learning to Model Commonsense Reasoning about Intermediate Steps in Cooking Recipes [7.839338724237275]
レシピを効果的に推論するモデルは、レシピ内の中間ステップの入力と出力を正確に識別し、理解する必要がある。
そこで本研究では,各工程の入力と出力を記述した中間ステップを記述した料理レシピの新たなコーパスを提案する。
論文 参考訳(メタデータ) (2024-01-12T23:33:01Z) - Towards End-User Development for IoT: A Case Study on Semantic Parsing
of Cooking Recipes for Programming Kitchen Devices [4.863892359772122]
キッチン内のIoTデバイスに対して,調理レシピの指示から機械的に理解可能なコマンドへの変換を支援することを目的とした,ユニークなコーパスを提供する。
このコーパスに基づいて、条件付きランダムフィールド(CRF)とニューラルネットワークモデルを用いた機械学習に基づくシーケンスラベリング手法を開発した。
その結果、アノテーションに基づいて意味論を訓練することは可能であるが、ほとんどの自然言語命令は不完全であり、形式的な意味表現に変換することは簡単ではないことがわかった。
論文 参考訳(メタデータ) (2023-09-25T14:21:24Z) - Large Language Models as Sous Chefs: Revising Recipes with GPT-3 [56.7155146252028]
我々は、複雑で多様で広く使われている指示の例としてレシピに焦点を当てている。
我々は、レシピと材料リストに基づいたプロンプトを開発し、レシピをより単純なステップに分解する。
また,レシピリビジョンの品質の人的判断を収集しながら,疲労軽減を念頭に設計したAmazon Mechanical Turkタスクにも貢献する。
論文 参考訳(メタデータ) (2023-06-24T14:42:43Z) - Task Tree Retrieval for Robotic Cooking [0.0]
このエッセイでは、人間の操作からの洞察に基づいて構築された構造的知識表現であるFOONのアイデアを紹介した。
故障率を低減し、タスクが効果的に完了することを保証するため、3つの異なるアルゴリズムが実装されている。
この知識表現は、オープンソースのレシピのビデオを使って作成された。
論文 参考訳(メタデータ) (2022-11-03T12:18:31Z) - Counterfactual Recipe Generation: Exploring Compositional Generalization
in a Realistic Scenario [60.20197771545983]
本研究では,材料の変化に応じて基本レシピを変更するようモデルに依頼する,反現実的なレシピ生成タスクを設計する。
料理の知識を学習するモデルのために、中国語で大規模なレシピデータセットを収集する。
その結果、既存のモデルでは原文のスタイルを保ちながら素材の変更が困難であり、調整が必要なアクションを見逃すことがしばしばあった。
論文 参考訳(メタデータ) (2022-10-20T17:21:46Z) - Assistive Recipe Editing through Critiquing [34.1050269670062]
RecipeCritは階層的な自動エンコーダで、材料レベルの批判をレシピで編集する。
私たちの研究の主な革新は、ユーザーが予測された材料と対話することでレシピを編集できる教師なしのクオリティリングモジュールです。
論文 参考訳(メタデータ) (2022-05-05T05:52:27Z) - A Rich Recipe Representation as Plan to Support Expressive Multi Modal
Queries on Recipe Content and Preparation Process [24.94173789568803]
機械理解可能なリッチレシピ表現(R3)の構築について論じる。
R3には、アレルゲンに関する情報や成分のイメージなどの追加の知識が注がれている。
また,レシピ検索ツールであるTREATをR3を用いて,レシピの内容に対するマルチモーダル推論を行う。
論文 参考訳(メタデータ) (2022-03-31T15:29:38Z) - Structure-Aware Generation Network for Recipe Generation from Images [142.047662926209]
食品画像と材料のみに基づいて調理指導を行うオープン・リサーチ・タスクについて検討する。
ターゲットレシピは長い段落であり、構造情報に関する注釈を持たない。
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-02T10:54:25Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - A Benchmark for Structured Procedural Knowledge Extraction from Cooking
Videos [126.66212285239624]
本稿では,調理ビデオから抽出した構造化手続き的知識のベンチマークを提案する。
手動で注釈付けしたオープン語彙リソースには、356の指導的調理ビデオと15,523のビデオクリップ/文レベルのアノテーションが含まれています。
論文 参考訳(メタデータ) (2020-05-02T05:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。