論文の概要: Procedural Text Understanding via Scene-Wise Evolution
- arxiv url: http://arxiv.org/abs/2203.07600v1
- Date: Tue, 15 Mar 2022 02:17:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-17 09:22:27.289865
- Title: Procedural Text Understanding via Scene-Wise Evolution
- Title(参考訳): シーンワイズ進化による手続き的テキスト理解
- Authors: Jialong Tang, Hongyu Lin, Meng Liao, Yaojie Lu, Xianpei Han, Le Sun,
Weijian Xie, Jin Xu
- Abstract要約: 手続き的テキスト理解では、機械は動的物語の中の実体状態について推論する必要がある。
本稿では,すべてのエンティティの状態をシーンごとに共同で追跡する,手続き的テキスト理解のための新しいテキストbfscene-wiseパラダイムを提案する。
実験の結果,SGRは新たな最先端性能を実現し,推理速度を著しく向上させることがわかった。
- 参考スコア(独自算出の注目度): 40.73877649689562
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Procedural text understanding requires machines to reason about entity states
within the dynamical narratives. Current procedural text understanding
approaches are commonly \textbf{entity-wise}, which separately track each
entity and independently predict different states of each entity. Such an
entity-wise paradigm does not consider the interaction between entities and
their states. In this paper, we propose a new \textbf{scene-wise} paradigm for
procedural text understanding, which jointly tracks states of all entities in a
scene-by-scene manner. Based on this paradigm, we propose \textbf{S}cene
\textbf{G}raph \textbf{R}easoner (\textbf{SGR}), which introduces a series of
dynamically evolving scene graphs to jointly formulate the evolution of
entities, states and their associations throughout the narrative. In this way,
the deep interactions between all entities and states can be jointly captured
and simultaneously derived from scene graphs. Experiments show that SGR not
only achieves the new state-of-the-art performance but also significantly
accelerates the speed of reasoning.
- Abstract(参考訳): 手続き的テキスト理解は機械が動的物語の中の実体状態について推論する必要がある。
現在の手続き的テキスト理解アプローチは、通常、各エンティティを個別に追跡し、各エンティティの異なる状態を独立に予測するtextbf{entity-wise} である。
このようなエンティティ指向のパラダイムは、エンティティとその状態間の相互作用を考慮しない。
本稿では,すべてのエンティティの状態を逐次追跡する手続き的テキスト理解のための新しい \textbf{scene-wise}パラダイムを提案する。
このパラダイムに基づき、我々は、物語全体を通してエンティティ、状態、それらの関係の進化を共同で定式化するために、一連の動的に進化するシーングラフを導入する \textbf{s}cene \textbf{g}raph \textbf{r}easoner (\textbf{sgr})を提案する。
このようにして、すべての実体と状態の間の深い相互作用は、シーングラフから同時にキャプチャできる。
実験により、SGRは新たな最先端性能を達成するだけでなく、推論の速度を著しく加速することが示された。
関連論文リスト
- Relation-aware Hierarchical Prompt for Open-vocabulary Scene Graph Generation [14.82606425343802]
Open-vocabulary Scene Graph Generation (OV-SGG)は、視覚的関係表現とオープンな語彙的テキスト表現を整合させることにより、クローズドセットの仮定の限界を克服する。
既存のOV-SGG法は、固定されたテキスト表現によって制約され、画像テキストアライメントの多様性と精度が制限される。
本稿では,対象物と地域固有の関係情報を統合することでテキスト表現を向上させるRAHP(Relation-Aware Hierarchical Prompting)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-26T02:12:37Z) - Contextualized Diffusion Models for Text-Guided Image and Video Generation [67.69171154637172]
条件拡散モデルは高忠実度テキスト誘導視覚生成および編集において優れた性能を示した。
本研究では,テキスト条件と視覚的サンプル間の相互作用とアライメントを包含するクロスモーダルコンテキストを組み込むことにより,コンテキスト拡散モデル(ContextDiff)を提案する。
理論的導出を伴うDDPMとDDIMの両方にモデルを一般化し、テキスト・ツー・イメージ生成とテキスト・ツー・ビデオ編集という2つの課題を伴う評価において、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T15:01:16Z) - Progressive Text-to-Image Diffusion with Soft Latent Direction [17.120153452025995]
本稿では,対象画像にエンティティを体系的に組み込んだ革新的なプログレッシブな合成・編集操作を提案する。
提案手法は,特に複雑なテキスト入力に直面する場合に,オブジェクト合成の顕著な進歩をもたらす。
論文 参考訳(メタデータ) (2023-09-18T04:01:25Z) - LAW-Diffusion: Complex Scene Generation by Diffusion with Layouts [107.11267074981905]
LAW拡散(LAW-Diffusion)と呼ばれる意味制御可能なレイアウト・AWare拡散モデルを提案する。
LAW拡散は、特にコヒーレントな対象関係を持つ最先端の生成性能をもたらすことを示す。
論文 参考訳(メタデータ) (2023-08-13T08:06:18Z) - Coalescing Global and Local Information for Procedural Text
Understanding [70.10291759879887]
完全な手続き的理解ソリューションは、入力のローカル・グローバル・ビューとアウトプットのグローバル・ビューの3つの中核的な側面を組み合わせるべきである。
本稿では,エンティティと時間表現を構築する新しいモデルであるCoalescing Global and Local InformationCGを提案する。
一般的な手続き的テキスト理解データセットの実験は、我々のモデルが最先端の結果を得ることを示す。
論文 参考訳(メタデータ) (2022-08-26T19:16:32Z) - Generating Coherent Narratives by Learning Dynamic and Discrete Entity
States with a Contrastive Framework [68.1678127433077]
我々はトランスフォーマーモデルを拡張して,物語生成のためのエンティティ状態更新と文実現を動的に行う。
2つのナラティブデータセットの実験により、我々のモデルは強いベースラインよりも一貫性があり多様なナラティブを生成できることが示された。
論文 参考訳(メタデータ) (2022-08-08T09:02:19Z) - Procedural Reading Comprehension with Attribute-Aware Context Flow [85.34405161075276]
手続き的なテキストは、しばしばエンティティの上で起こるプロセスを記述する。
本稿では,テキストを一般的な形式に翻訳することで,手続き的読解のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-31T00:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。