論文の概要: Towards an Action-Centric Ontology for Cooking Procedures Using Temporal Graphs
- arxiv url: http://arxiv.org/abs/2509.04159v1
- Date: Thu, 04 Sep 2025 12:34:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.158577
- Title: Towards an Action-Centric Ontology for Cooking Procedures Using Temporal Graphs
- Title(参考訳): 時間グラフを用いた調理手順のアクション中心オントロジーに向けて
- Authors: Aarush Kumbhakern, Saransh Kumar Gupta, Lipika Dey, Partha Pratim Das,
- Abstract要約: 本稿では、レシピを指示されたアクションプロセス、転送、環境、キャプチャ、構成構造として表現するためのドメイン固有言語を紹介します。
この作業は、構造化されたマシン理解、正確な解釈、料理プロセスのスケーラブルな自動化を可能にするために、時間グラフを使用して、調理のためのアクション中心に向けた最初のステップを表す。
- 参考スコア(独自算出の注目度): 2.504740578240899
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Formalizing cooking procedures remains a challenging task due to their inherent complexity and ambiguity. We introduce an extensible domain-specific language for representing recipes as directed action graphs, capturing processes, transfers, environments, concurrency, and compositional structure. Our approach enables precise, modular modeling of complex culinary workflows. Initial manual evaluation on a full English breakfast recipe demonstrates the DSL's expressiveness and suitability for future automated recipe analysis and execution. This work represents initial steps towards an action-centric ontology for cooking, using temporal graphs to enable structured machine understanding, precise interpretation, and scalable automation of culinary processes - both in home kitchens and professional culinary settings.
- Abstract(参考訳): 調理手順の形式化は、その複雑さとあいまいさのため、依然として困難な課題である。
我々は、レシピを指示されたアクショングラフとして表現し、プロセス、転送、環境、並行処理、構成構造をキャプチャする拡張可能なドメイン固有言語を導入します。
我々のアプローチは複雑な料理ワークフローの正確なモジュラーモデリングを可能にする。
完全な英語の朝食レシピの初期手動評価は、将来の自動レシピ分析と実行にDSLの表現力と適合性を実証している。
この作業は、時間グラフを使用して、ホームキッチンとプロの料理設定の両方において、構造化されたマシン理解、正確な解釈、および拡張可能な料理プロセスの自動化を可能にする、料理のためのアクション中心のオントロジーへの最初のステップを表す。
関連論文リスト
- Chain-of-Cooking:Cooking Process Visualization via Bidirectional Chain-of-Thought Guidance [6.4337734580551365]
調理過程の可視化モデルであるChain-of-Cookingを提案する。
素材の正確な外観を生成するために,予め生成した画像パッチを参照として検索する。
生成した画像のコヒーレンスを高め、合理的な順序を保つために、セマンティック進化モジュールと双方向連鎖(CoT)ガイダンスを提案する。
論文 参考訳(メタデータ) (2025-07-29T06:34:59Z) - VisualChef: Generating Visual Aids in Cooking via Mask Inpainting [50.84305074983752]
我々は,調理シナリオに適したコンテキスト視覚支援を生成するVisualChefを紹介する。
初期フレームと指定されたアクションが与えられた後、VisualChefはアクションの実行と結果のオブジェクトの外観の両方を描写した画像を生成する。
3つのエゴセントリックなビデオデータセット上でVisualChefを定量的に定性的に評価し、最先端の手法による改善を示す。
論文 参考訳(メタデータ) (2025-06-23T12:23:21Z) - CookingDiffusion: Cooking Procedural Image Generation with Stable Diffusion [58.92430755180394]
textbfCookingDiffusionは,調理工程のリアルな画像を生成する新しい手法である。
これらのプロンプトは、テキストプロンプト、画像プロンプト、マルチモーダルプロンプトを含み、一貫したプロシージャ画像の生成を保証する。
実験結果から, 高品質な調理用プロシージャ画像の生成に優れたモデルが得られた。
論文 参考訳(メタデータ) (2025-01-15T06:58:53Z) - PizzaCommonSense: Learning to Model Commonsense Reasoning about Intermediate Steps in Cooking Recipes [7.839338724237275]
レシピを効果的に推論するモデルは、レシピ内の中間ステップの入力と出力を正確に識別し、理解する必要がある。
そこで本研究では,各工程の入力と出力を記述した中間ステップを記述した料理レシピの新たなコーパスを提案する。
論文 参考訳(メタデータ) (2024-01-12T23:33:01Z) - Structured Vision-Language Pretraining for Computational Cooking [54.0571416522547]
Vision-Language PretrainingとFoundationモデルは、一般的なベンチマークでSoTAのパフォーマンスを達成するためのゴーツーレシピです。
本稿では,これらの手法を構造化テキストベースの計算料理タスクに活用することを提案する。
論文 参考訳(メタデータ) (2022-12-08T13:37:17Z) - Classifying States of Cooking Objects Using Convolutional Neural Network [6.127963013089406]
主な目的は、調理プロセスをより簡単で安全にし、人間の福祉を創ることである。
ロボットは調理環境を理解し,特に調理対象の状態を正確に認識することが重要である。
このプロジェクトでは、料理物の状態をスクラッチから分類するための堅牢な深層畳み込みニューラルネットワークを設計するために、実験の一部が実施された。
論文 参考訳(メタデータ) (2021-04-30T22:26:40Z) - CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval [20.292467149387594]
本稿では,食品画像検索と検索タスクにおける画像とテキストの潜伏表現を協調的にモデル化する,新たなクロスモーダル学習フレームワークを提案する。
本研究では,効率的な木構造長短期記憶を計算クロスモーダル検索フレームワークのテキストエンコーダとして利用することにより,レシピ記述の主成分や調理動作を明示的な監督なしに識別できることを実証した。
論文 参考訳(メタデータ) (2021-02-04T11:24:34Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - Decomposing Generation Networks with Structure Prediction for Recipe
Generation [142.047662926209]
本稿では,構造予測を伴うDGN(Decomposing Generation Networks)を提案する。
具体的には,調理指導を複数のフェーズに分割し,各フェーズに異なるサブジェネレータを割り当てる。
提案手法は, (i) 大域的構造予測成分を用いてレシピ構造を学習し, (ii) 予測された構造に基づいてサブジェネレータ出力成分でレシピ相を生成するという2つの新しいアイデアを含む。
論文 参考訳(メタデータ) (2020-07-27T08:47:50Z) - A Benchmark for Structured Procedural Knowledge Extraction from Cooking
Videos [126.66212285239624]
本稿では,調理ビデオから抽出した構造化手続き的知識のベンチマークを提案する。
手動で注釈付けしたオープン語彙リソースには、356の指導的調理ビデオと15,523のビデオクリップ/文レベルのアノテーションが含まれています。
論文 参考訳(メタデータ) (2020-05-02T05:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。