論文の概要: Towards Flow Graph Prediction of Open-Domain Procedural Texts
- arxiv url: http://arxiv.org/abs/2305.19497v1
- Date: Wed, 31 May 2023 02:15:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 18:58:37.678321
- Title: Towards Flow Graph Prediction of Open-Domain Procedural Texts
- Title(参考訳): オープンドメイン手続きテキストのフローグラフ予測に向けて
- Authors: Keisuke Shirai, Hirotaka Kameko, Shinsuke Mori
- Abstract要約: オープンドメインプロシージャテキストのフローグラフ予測のためのレシピFGに基づくフレームワークを提案する。
非調理領域におけるフローグラフ予測性能を調べるため,wikiHowの記事からwikiHow-FGコーパスを紹介する。
実験により、ドメイン適応モデルは、調理や対象のドメインデータにのみトレーニングされたモデルよりも高いパフォーマンスが得られることが示された。
- 参考スコア(独自算出の注目度): 2.2881898195409884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine comprehension of procedural texts is essential for reasoning about
the steps and automating the procedures. However, this requires identifying
entities within a text and resolving the relationships between the entities.
Previous work focused on the cooking domain and proposed a framework to convert
a recipe text into a flow graph (FG) representation. In this work, we propose a
framework based on the recipe FG for flow graph prediction of open-domain
procedural texts. To investigate flow graph prediction performance in
non-cooking domains, we introduce the wikiHow-FG corpus from articles on
wikiHow, a website of how-to instruction articles. In experiments, we consider
using the existing recipe corpus and performing domain adaptation from the
cooking to the target domain. Experimental results show that the domain
adaptation models achieve higher performance than those trained only on the
cooking or target domain data.
- Abstract(参考訳): 手続き文の機械的理解は、手順の推論と手順の自動化に不可欠である。
しかし、これはテキスト内のエンティティを識別し、エンティティ間の関係を解決する必要がある。
これまでの作業は調理領域に焦点を当て、レシピテキストをフローグラフ(FG)表現に変換するためのフレームワークを提案した。
本研究では,オープンドメインの手続きテキストのフローグラフ予測のためのレシピFGに基づくフレームワークを提案する。
非調理領域におけるフローグラフ予測性能を調べるために,ハウツー指導記事のwebサイトwikihowの記事からwikihow-fgコーパスを紹介する。
実験では,既存のレシピコーパスを使用し,調理から対象領域へのドメイン適応を行う。
実験結果から, ドメイン適応モデルでは, 調理データや対象ドメインデータにのみ訓練されたモデルよりも高い性能が得られた。
関連論文リスト
- Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - Phrase Grounding-based Style Transfer for Single-Domain Generalized
Object Detection [109.58348694132091]
単一ドメインの一般化オブジェクト検出は、複数の未確認対象ドメインに対するモデルの一般化性を高めることを目的としている。
これは、ターゲットのドメインデータをトレーニングに組み込むことなく、ドメインシフトに対処するモデルを必要とするため、実用的だが難しいタスクである。
そこで我々は,課題に対する新しい文節接頭辞に基づくスタイル伝達手法を提案する。
論文 参考訳(メタデータ) (2024-02-02T10:48:43Z) - Unsupervised Learning of Graph from Recipes [8.410402833223364]
本稿では,レシピから関連する情報を識別し,レシピ中のアクションのシーケンスを表すグラフを生成するモデルを提案する。
テキストを1つのシーケンスで符号化する$mathsfGNN$のグラフ構造とパラメータを反復的に学習する。
同定されたエンティティを注釈付きデータセットと比較し、入力テキストと出力テキストの差を比較し、生成したグラフとアートメソッドの状態から生成されたグラフを比較して、アプローチを評価する。
論文 参考訳(メタデータ) (2024-01-22T16:25:47Z) - Improving Domain Adaptation through Extended-Text Reading Comprehension [108.24709810480654]
最近の研究は、適応型パターンによってフォーマットされた理解データを読み取るモデルが、ドメイン固有のタスクのパフォーマンスを大幅に改善できることを実証している。
しかし、これらのパターンはドメイン固有の知識を用いて生のコーパスを解析することができない。
AdaptLLMと比較して、ドメイン固有のタスクで5%以上の改善を実現している。
論文 参考訳(メタデータ) (2024-01-14T13:11:31Z) - Harnessing the Power of Multi-Lingual Datasets for Pre-training: Towards
Enhancing Text Spotting Performance [15.513912470752041]
様々な領域への適応能力は、実環境にデプロイする際のシーンテキストスポッティングモデルに不可欠である。
本稿では,ドメイン適応型シーンテキストスポッティングの問題,すなわちマルチドメインソースデータを用いたモデルトレーニングについて検討する。
その結果,複数の領域にまたがるテキストスポッティングベンチマークにおいて,中間表現が有意な性能を発揮する可能性が明らかとなった。
論文 参考訳(メタデータ) (2023-10-02T06:08:01Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Regex-augmented Domain Transfer Topic Classification based on a
Pre-trained Language Model: An application in Financial Domain [42.5087655999509]
本稿では,微調整過程におけるドメイン知識の特徴として,正規表現パターンの利用について論じる。
実シナリオ生成データを用いた実験により,本手法が下流のテキスト分類タスクを改善することを示す。
論文 参考訳(メタデータ) (2023-05-23T03:26:32Z) - Structured Vision-Language Pretraining for Computational Cooking [54.0571416522547]
Vision-Language PretrainingとFoundationモデルは、一般的なベンチマークでSoTAのパフォーマンスを達成するためのゴーツーレシピです。
本稿では,これらの手法を構造化テキストベースの計算料理タスクに活用することを提案する。
論文 参考訳(メタデータ) (2022-12-08T13:37:17Z) - Understood in Translation, Transformers for Domain Understanding [2.379911867541422]
本稿では,コーパスの領域定義のためのトランスフォーマーに基づく教師あり機械学習手法を提案する。
このようなドメイン構造の自動定義が、生成したグラフの構成時間と品質の両方において有益である理由を論じる。
PubMedから抽出した出版物に基づく新しい健康領域データセットを提案する。
論文 参考訳(メタデータ) (2020-12-18T14:47:47Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。