論文の概要: Show Me More Details: Discovering Hierarchies of Procedures from
Semi-structured Web Data
- arxiv url: http://arxiv.org/abs/2203.07264v1
- Date: Mon, 14 Mar 2022 16:42:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 14:10:59.274499
- Title: Show Me More Details: Discovering Hierarchies of Procedures from
Semi-structured Web Data
- Title(参考訳): 半構造化されたWebデータから手続きの階層を明らかにする
- Authors: Shuyan Zhou and Li Zhang and Yue Yang and Qing Lyu and Pengcheng Yin
and Chris Callison-Burch and Graham Neubig
- Abstract要約: ウィキハウに基づく手続きのオープンドメイン階層的知識ベース(KB)を構築する。
論文のステップを他の記事と類似した目標に結びつける,シンプルで効率的な手法を開発した。
提案手法は, 自動評価, 人的判断, 下流タスクへの適用などにより, 高いベースラインを著しく上回っている。
- 参考スコア(独自算出の注目度): 92.54560457202531
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Procedures are inherently hierarchical. To "make videos", one may need to
"purchase a camera", which in turn may require one to "set a budget". While
such hierarchical knowledge is critical for reasoning about complex procedures,
most existing work has treated procedures as shallow structures without
modeling the parent-child relation.In this work, we attempt to construct an
open-domain hierarchical knowledge-base (KB) of procedures based on wikiHow, a
website containing more than 110k instructional articles, each documenting the
steps to carry out a complex procedure. To this end, we develop a simple and
efficient method that links steps (e.g., "purchase a camera") in an article to
other articles with similar goals (e.g., "how to choose a camera"), recursively
constructing the KB. Our method significantly outperforms several strong
baselines according to automatic evaluation, human judgment, and application to
downstream tasks such as instructional video retrieval.
A demo with partial data can be found at https://wikihow-hierarchy.github.io.
The code and the data are at https://github.com/shuyanzhou/wikihow_hierarchy.
- Abstract(参考訳): 手順は本質的に階層的です。
ビデオを作る」には、「カメラを購入する」必要があり、「予算を設定する」必要がある。
このような階層的知識は複雑な手続きを推論するために重要であるが、既存の作品の多くは親子関係をモデル化することなく浅い構造として手続きを扱っており、ウィキハウに基づく手続きのオープンドメイン階層的知識ベース(kb)を構築しようとしている。
この目的のために,論文中のステップ(例えば「カメラの購入」など)と他の記事(例えば「カメラの選択方法」など)を関連付けてKBを再帰的に構築する,シンプルで効率的な方法を開発した。
提案手法は, 自動評価, 人的判断, 教育ビデオ検索などの下流業務への応用などにより, 強靭なベースラインを著しく上回っている。
部分的なデータのデモはhttps://wikihow-hierarchy.github.ioで見ることができる。
コードとデータはhttps://github.com/shuyanzhou/wikihow_hierarchyにある。
関連論文リスト
- Structural Concept Learning via Graph Attention for Multi-Level
Rearrangement Planning [2.7195102129095003]
本稿では,階層構造を持つシーンに対して,複数レベルのオブジェクトアレンジメント計画を実行するためのディープラーニング手法を提案する。
直感的な構造を持つ自己生成シミュレーションデータセットでトレーニングされ、任意の数のオブジェクトで見えないシーンで動作する。
提案手法を古典的およびモデルベースラインの範囲と比較し,そのシーン理解を活用して性能,柔軟性,効率性を向上することを示す。
論文 参考訳(メタデータ) (2023-09-05T19:35:44Z) - Learning to Ground Instructional Articles in Videos through Narrations [50.3463147014498]
ナレーションされたハウツービデオにおける手続き的活動の段階をローカライズするためのアプローチを提案する。
本稿では,教科記事を含む言語知識ベース(wikiHow)からステップ記述を抽出する。
本モデルは,3つのモダリティをマッチングすることにより,プロシージャ記事のステップをハウツービデオに時間的に基礎付けることを学習する。
論文 参考訳(メタデータ) (2023-06-06T15:45:53Z) - Procedure-Aware Pretraining for Instructional Video Understanding [58.214549181779006]
手続き理解の鍵となる課題は、未ラベルのビデオから手続き的知識を抽出できることである。
私たちの主な洞察は、命令ビデオが同じまたは異なるタスクのインスタンス間で繰り返されるステップのシーケンスを描いていることです。
このグラフを使用して擬似ラベルを生成し、よりアクセスしやすい形式で手続き的知識を符号化するビデオ表現を訓練することができる。
論文 参考訳(メタデータ) (2023-03-31T17:41:31Z) - HIBRIDS: Attention with Hierarchical Biases for Structure-aware Long
Document Summarization [17.58231642569116]
注意点の計算に文書構造を取り入れた階層的バイアスフォアを注入するHIBRIDSを提案する。
また、ソース文書中の有能な内容を質問階層と要約階層に要約するための新しいタスクである階層的質問要約生成を提案する。
論文 参考訳(メタデータ) (2022-03-21T05:27:35Z) - Procedures as Programs: Hierarchical Control of Situated Agents through
Natural Language [81.73820295186727]
エージェント命令と制御のための階層的な手続き的知識を表現する強力な手法である,プログラムとしての手続きの形式化を提案する。
NL命令に対するIQAおよびALFREDデータセット上で、このフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2021-09-16T20:36:21Z) - Learning Task Decomposition with Ordered Memory Policy Network [73.3813423684999]
OMPN(Ordered Memory Policy Network)を提案し、デモから学習することでサブタスク階層を発見する。
ompnは部分的に観測可能な環境に適用でき、高いタスク分解性能を達成できる。
私たちの視覚化は、サブタスク階層がモデルに出現できることを確認します。
論文 参考訳(メタデータ) (2021-03-19T18:13:35Z) - Discovering Hierarchical Processes Using Flexible Activity Trees for
Event Abstraction [7.754062965937491]
我々はFlexHMinerを提案する。FlexHMinerは、マルチレベルのインターリーブサブプロセスを持つプロセスを見つけるための3段階のアプローチである。
ドメイン知識,ランダムクラスタリング,フラットアプローチを用いて,階層モデルの品質を比較した。
以上の結果から,FlexHMinerが生成する階層型プロセスモデルは,階層性を利用していないアプローチと良好に比較できることが示唆された。
論文 参考訳(メタデータ) (2020-10-16T10:50:41Z) - A Benchmark for Structured Procedural Knowledge Extraction from Cooking
Videos [126.66212285239624]
本稿では,調理ビデオから抽出した構造化手続き的知識のベンチマークを提案する。
手動で注釈付けしたオープン語彙リソースには、356の指導的調理ビデオと15,523のビデオクリップ/文レベルのアノテーションが含まれています。
論文 参考訳(メタデータ) (2020-05-02T05:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。