論文の概要: The Devil is in the Details: Evaluating Limitations of Transformer-based
Methods for Granular Tasks
- arxiv url: http://arxiv.org/abs/2011.01196v1
- Date: Mon, 2 Nov 2020 18:41:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 12:06:37.672608
- Title: The Devil is in the Details: Evaluating Limitations of Transformer-based
Methods for Granular Tasks
- Title(参考訳): The Devil is in the details: Evaluations of Transformer-based Methods for Granular Tasks
- Authors: Brihi Joshi, Neil Shah, Francesco Barbieri, Leonardo Neves
- Abstract要約: トランスフォーマーベースのニューラルネットワークモデルから派生したコンテキスト埋め込みは、様々なタスクに対して最先端のパフォーマンスを示している。
本稿では,文書の粒度の一致と抽象レベルという2つの観点から,テキストの類似性の問題に焦点をあてる。
異なるドメインからの2つのデータセットに対して、期待されるように抽象的なドキュメントマッチングのパフォーマンスが高いにもかかわらず、コンテキスト埋め込みは、よりきめ細かいタスクのためにTF-IDFのような単純なベースラインによって一貫して(そして非常に)パフォーマンスが向上していることを実証的に実証した。
- 参考スコア(独自算出の注目度): 19.099852869845495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contextual embeddings derived from transformer-based neural language models
have shown state-of-the-art performance for various tasks such as question
answering, sentiment analysis, and textual similarity in recent years.
Extensive work shows how accurately such models can represent abstract,
semantic information present in text. In this expository work, we explore a
tangent direction and analyze such models' performance on tasks that require a
more granular level of representation. We focus on the problem of textual
similarity from two perspectives: matching documents on a granular level
(requiring embeddings to capture fine-grained attributes in the text), and an
abstract level (requiring embeddings to capture overall textual semantics). We
empirically demonstrate, across two datasets from different domains, that
despite high performance in abstract document matching as expected, contextual
embeddings are consistently (and at times, vastly) outperformed by simple
baselines like TF-IDF for more granular tasks. We then propose a simple but
effective method to incorporate TF-IDF into models that use contextual
embeddings, achieving relative improvements of up to 36% on granular tasks.
- Abstract(参考訳): トランスフォーマティブベースのニューラルネットワークモデルから派生した文脈埋め込みは、近年、質問応答、感情分析、テキストの類似性など、さまざまなタスクにおいて最先端のパフォーマンスを示している。
広範な研究は、そのようなモデルがテキストに存在する抽象的で意味的な情報をいかに正確に表現できるかを示している。
本研究では,より粒度の高い表現を必要とするタスクに対して,接する方向を探索し,それらのモデルの性能を解析する。
本稿では,文書の粒度レベルでのマッチング(テキスト中の微細な属性をキャプチャする埋め込みの要求)と抽象的なレベル(全体のテキスト意味をキャプチャする埋め込みの要求)という2つの視点からテキスト類似性の問題に焦点を当てる。
異なるドメインの2つのデータセットにまたがって、予想したように抽象的なドキュメントマッチングのパフォーマンスは高いが、コンテキスト埋め込みはtf-idfのような単純なベースラインによって、より細かいタスクに対して一貫して(そして、そのほとんどを)上回っていることを実証する。
次に、文脈埋め込みを用いたモデルにTF-IDFを組み込むことにより、粒度のタスクに対して最大36%の相対的な改善を達成できる簡易かつ効果的な手法を提案する。
関連論文リスト
- Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - Deep Content Understanding Toward Entity and Aspect Target Sentiment Analysis on Foundation Models [0.8602553195689513]
Entity-Aspect Sentiment Triplet extract (EASTE)は、Aspect-Based Sentiment Analysisタスクである。
本研究は,EASTEタスクにおける高性能化を目標とし,モデルサイズ,タイプ,適応技術がタスクパフォーマンスに与える影響について検討する。
最終的には、複雑な感情分析における詳細な洞察と最先端の成果を提供する。
論文 参考訳(メタデータ) (2024-07-04T16:48:14Z) - Contextualized Diffusion Models for Text-Guided Image and Video Generation [67.69171154637172]
条件拡散モデルは高忠実度テキスト誘導視覚生成および編集において優れた性能を示した。
本研究では,テキスト条件と視覚的サンプル間の相互作用とアライメントを包含するクロスモーダルコンテキストを組み込むことにより,コンテキスト拡散モデル(ContextDiff)を提案する。
理論的導出を伴うDDPMとDDIMの両方にモデルを一般化し、テキスト・ツー・イメージ生成とテキスト・ツー・ビデオ編集という2つの課題を伴う評価において、モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-02-26T15:01:16Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Revisiting text decomposition methods for NLI-based factuality scoring
of summaries [9.044665059626958]
細粒度分解が必ずしも事実性スコアの勝利戦略であるとは限らないことを示す。
また,従来提案されていたエンテーメントに基づくスコアリング手法の小さな変更により,性能が向上することを示した。
論文 参考訳(メタデータ) (2022-11-30T09:54:37Z) - TRIE++: Towards End-to-End Information Extraction from Visually Rich
Documents [51.744527199305445]
本稿では,視覚的にリッチな文書からエンド・ツー・エンドの情報抽出フレームワークを提案する。
テキスト読み出しと情報抽出は、よく設計されたマルチモーダルコンテキストブロックを介して互いに強化することができる。
フレームワークはエンドツーエンドのトレーニング可能な方法でトレーニングでき、グローバルな最適化が達成できる。
論文 参考訳(メタデータ) (2022-07-14T08:52:07Z) - Transformer Models for Text Coherence Assessment [14.132559978971377]
コヒーレンス(coherence)は、テキストの品質の重要な側面であり、その可読性を保証するために不可欠である。
これまでの研究は、エンティティベースの手法、構文パターン、談話関係、最近ではテキストコヒーレンスアセスメントのための従来のディープラーニングアーキテクチャを活用してきた。
バニラ変換器,階層変換器,マルチタスク学習モデル,ファクトベース入力表現モデルという4つの異なるトランスフォーマーアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-05T22:27:17Z) - Neural Deepfake Detection with Factual Structure of Text [78.30080218908849]
テキストのディープフェイク検出のためのグラフベースモデルを提案する。
我々のアプローチは、ある文書の事実構造をエンティティグラフとして表現する。
本モデルでは,機械生成テキストと人文テキストの事実構造の違いを識別することができる。
論文 参考訳(メタデータ) (2020-10-15T02:35:31Z) - Document-Level Event Role Filler Extraction using Multi-Granularity
Contextualized Encoding [40.13163091122463]
イベントロールフィラーに対応するテキストの幅を決定するために、より大きなコンテキストのビューを必要とするため、イベント抽出は難しいタスクである。
まず、文書レベルのロールフィラー抽出において、エンドツーエンドのニューラルシーケンスモデルがどのように機能するかを検討する。
私たちの最高のシステムは、以前の作業よりもかなり優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2020-05-13T20:42:17Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。