論文の概要: 50 Ways to Bake a Cookie: Mapping the Landscape of Procedural Texts
- arxiv url: http://arxiv.org/abs/2210.17235v1
- Date: Mon, 31 Oct 2022 11:41:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 15:12:14.124199
- Title: 50 Ways to Bake a Cookie: Mapping the Landscape of Procedural Texts
- Title(参考訳): クッキーを焼く50の方法: 手続きテキストのランドスケープをマッピングする
- Authors: Moran Mizrahi, Dafna Shahaf
- Abstract要約: 本稿では,複数の手続きテキストを直感的なグラフ表現に要約するための教師なし学習手法を提案する。
我々は、手続き的テキストの顕著な例であるレシピについて、我々のアプローチを実証する。
- 参考スコア(独自算出の注目度): 15.185745028886648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The web is full of guidance on a wide variety of tasks, from changing the oil
in your car to baking an apple pie. However, as content is created
independently, a single task could have thousands of corresponding procedural
texts. This makes it difficult for users to view the bigger picture and
understand the multiple ways the task could be accomplished. In this work we
propose an unsupervised learning approach for summarizing multiple procedural
texts into an intuitive graph representation, allowing users to easily explore
commonalities and differences. We demonstrate our approach on recipes, a
prominent example of procedural texts. User studies show that our
representation is intuitive and coherent and that it has the potential to help
users with several sensemaking tasks, including adapting recipes for a novice
cook and finding creative ways to spice up a dish.
- Abstract(参考訳): ウェブには、車のオイル交換からアップルパイを焼くことまで、さまざまなタスクについてのガイダンスが満載です。
しかし、コンテンツは独立して作成されるため、単一のタスクは何千もの手続きテキストを持つことができる。
これにより、ユーザーは大きな図を見て、そのタスクが達成できる複数の方法を理解するのが難しくなる。
本研究では,複数の手続きテキストを直感的なグラフ表現に要約する教師なし学習手法を提案する。
手順テキストの顕著な例であるレシピに対する我々のアプローチを実証する。
ユーザスタディによると、私たちの表現は直感的で一貫性があり、初心者の料理人のためのレシピの適応や、料理をスパイスする創造的な方法の発見など、いくつかの意味のあるタスクをユーザを助ける可能性がある。
関連論文リスト
- Large Language Models as Sous Chefs: Revising Recipes with GPT-3 [56.7155146252028]
我々は、複雑で多様で広く使われている指示の例としてレシピに焦点を当てている。
我々は、レシピと材料リストに基づいたプロンプトを開発し、レシピをより単純なステップに分解する。
また,レシピリビジョンの品質の人的判断を収集しながら,疲労軽減を念頭に設計したAmazon Mechanical Turkタスクにも貢献する。
論文 参考訳(メタデータ) (2023-06-24T14:42:43Z) - Learning Program Representations for Food Images and Cooking Recipes [26.054436410924737]
料理のレシピや料理のイメージを料理プログラムとして表現することを提案する。
モデルは、自己監督を通じてレシピと食品画像の結合埋め込みを学ぶために訓練される。
プログラムへのイメージ・レシピの埋め込みを投影すると、モーダル横断検索結果がより良くなることを示す。
論文 参考訳(メタデータ) (2022-03-30T05:52:41Z) - Reciprocal Feature Learning via Explicit and Implicit Tasks in Scene
Text Recognition [60.36540008537054]
本研究では,従来のテキスト認識における文字数カウントという暗黙のタスクを,追加的な注釈コストなしで発掘する。
両タスクの機能を適切に活用するために,2分岐の相反的特徴学習フレームワークを設計する。
7つのベンチマークの実験では、テキスト認識と新しい文字カウントタスクの両方において提案手法の利点が示されている。
論文 参考訳(メタデータ) (2021-05-13T12:27:35Z) - Revamping Cross-Modal Recipe Retrieval with Hierarchical Transformers
and Self-supervised Learning [17.42688184238741]
近年, 生活における食品の重要性から, クロスモーダルなレシピ検索が注目されている。
本稿では,テキストおよび画像のエンコーダの確立と高性能化に基づく,簡易なエンド・ツー・エンドモデルを提案する。
提案手法は,Recipe1Mデータセットのクロスモーダルレシピ検索タスクにおける最新性能を実現する。
論文 参考訳(メタデータ) (2021-03-24T10:17:09Z) - CHEF: Cross-modal Hierarchical Embeddings for Food Domain Retrieval [20.292467149387594]
本稿では,食品画像検索と検索タスクにおける画像とテキストの潜伏表現を協調的にモデル化する,新たなクロスモーダル学習フレームワークを提案する。
本研究では,効率的な木構造長短期記憶を計算クロスモーダル検索フレームワークのテキストエンコーダとして利用することにより,レシピ記述の主成分や調理動作を明示的な監督なしに識別できることを実証した。
論文 参考訳(メタデータ) (2021-02-04T11:24:34Z) - Structure-Aware Generation Network for Recipe Generation from Images [142.047662926209]
食品画像と材料のみに基づいて調理指導を行うオープン・リサーチ・タスクについて検討する。
ターゲットレシピは長い段落であり、構造情報に関する注釈を持たない。
本稿では,食品レシピ生成課題に取り組むために,構造認識ネットワーク(SGN)の新たな枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-02T10:54:25Z) - Multi-modal Cooking Workflow Construction for Food Recipes [147.4435186953995]
ワークフロー構築のための最初の大規模データセットであるMM-ReSを構築した。
本稿では、視覚情報とテキスト情報の両方を利用して調理ワークフローを構築するニューラルエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-08-20T18:31:25Z) - A Recipe for Creating Multimodal Aligned Datasets for Sequential Tasks [48.39191088844315]
調理領域では、ウェブは、同じ料理を作る方法を記述したテキストとビデオのレシピを多数提供している。
我々は、同じ料理の異なるレシピの指示間のペアワイズアライメントを学習する教師なしアライメントアルゴリズムを使用する。
次に、グラフアルゴリズムを用いて、同じ料理のための複数のテキストと複数のビデオレシピの協調的なアライメントを導出する。
論文 参考訳(メタデータ) (2020-05-19T17:27:00Z) - A Benchmark for Structured Procedural Knowledge Extraction from Cooking
Videos [126.66212285239624]
本稿では,調理ビデオから抽出した構造化手続き的知識のベンチマークを提案する。
手動で注釈付けしたオープン語彙リソースには、356の指導的調理ビデオと15,523のビデオクリップ/文レベルのアノテーションが含まれています。
論文 参考訳(メタデータ) (2020-05-02T05:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。