論文の概要: Crisis Domain Adaptation Using Sequence-to-sequence Transformers
- arxiv url: http://arxiv.org/abs/2110.08015v1
- Date: Fri, 15 Oct 2021 11:19:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 13:25:35.837385
- Title: Crisis Domain Adaptation Using Sequence-to-sequence Transformers
- Title(参考訳): シーケンス・ツー・シーケンス変換器を用いた危機領域適応
- Authors: Congcong Wang, Paul Nulty, David Lillis
- Abstract要約: CAST:Sequence-to-Sequence Transformerを利用した危機領域適応手法を提案する。
実験の結果,対象データを使用しなくてもCASTベースのベストランが達成できることが判明した。
ソースドメインとして複数のクレームを併用する多対一適応では、CASTはそのパフォーマンスをさらに向上する。
- 参考スコア(独自算出の注目度): 2.9112649816695204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: User-generated content (UGC) on social media can act as a key source of
information for emergency responders in crisis situations. However, due to the
volume concerned, computational techniques are needed to effectively filter and
prioritise this content as it arises during emerging events. In the literature,
these techniques are trained using annotated content from previous crises. In
this paper, we investigate how this prior knowledge can be best leveraged for
new crises by examining the extent to which crisis events of a similar type are
more suitable for adaptation to new events (cross-domain adaptation). Given the
recent successes of transformers in various language processing tasks, we
propose CAST: an approach for Crisis domain Adaptation leveraging
Sequence-to-sequence Transformers. We evaluate CAST using two major
crisis-related message classification datasets. Our experiments show that our
CAST-based best run without using any target data achieves the state of the art
performance in both in-domain and cross-domain contexts. Moreover, CAST is
particularly effective in one-to-one cross-domain adaptation when trained with
a larger language model. In many-to-one adaptation where multiple crises are
jointly used as the source domain, CAST further improves its performance. In
addition, we find that more similar events are more likely to bring better
adaptation performance whereas fine-tuning using dissimilar events does not
help for adaptation. To aid reproducibility, we open source our code to the
community.
- Abstract(参考訳): ソーシャルメディア上のユーザ生成コンテンツ(ugc)は,危機時の緊急対応者にとって重要な情報源として機能する。
しかし、ボリュームのため、計算技術は、新興のイベント中に発生するこのコンテンツを効果的にフィルタリングし、優先順位付けするために必要である。
文献では、これらの技法は以前の危機からの注釈付きコンテンツを用いて訓練される。
本稿では,この先行知識を新たな危機にどのように活用するかを,類似型の危機事象が新たな出来事への適応(クロスドメイン適応)にどの程度適しているかを検討することによって検討する。
近年の言語処理タスクにおけるトランスフォーマーの成功を踏まえ,CAST:Crysis Domain Adaptation Using Sequence-to-Sequence Transformerを提案する。
CASTを2つの主要な危機関連メッセージ分類データセットを用いて評価する。
我々のCASTベースのベストランは、ドメイン内およびドメイン間両方のコンテキストにおいて、ターゲットデータを使用しなくても、アートパフォーマンスの状態を達成できることを示す。
さらに、CASTはより大きな言語モデルで訓練された場合、特に1対1のクロスドメイン適応に有効である。
ソースドメインとして複数のクレームを併用する多対一適応では、CASTはそのパフォーマンスをさらに向上する。
さらに、類似イベントの方が適応性能が向上する傾向にあるのに対して、異種イベントを用いた微調整は適応に役立ちません。
再現性を支援するために、コードをコミュニティにオープンソースにします。
関連論文リスト
- Progressive Conservative Adaptation for Evolving Target Domains [76.9274842289221]
従来のドメイン適応は、典型的には、ソースドメインから定常ターゲットドメインに知識を転送する。
このような対象データに対する復元と適応は、時間とともに計算とリソース消費をエスカレートする。
我々は、進歩的保守的適応(PCAda)と呼ばれる、単純で効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-02-07T04:11:25Z) - Better Practices for Domain Adaptation [62.70267990659201]
ドメイン適応(DA)は、ラベルを使わずに、モデルを配置データに適用するためのフレームワークを提供することを目的としている。
DAの明確な検証プロトコルは、文献の悪い実践につながっている。
ドメイン適応手法の3つの分野にまたがる課題を示す。
論文 参考訳(メタデータ) (2023-09-07T17:44:18Z) - Coping with low data availability for social media crisis message
categorisation [3.0255457622022495]
この論文は、緊急対応のための危機メッセージの分類において、データ可用性の低い課題に対処することに焦点を当てている。
これはまず、過去の危機イベントから注釈付きデータから分類モデルを学ぶことを含む、この問題の解決策としてドメイン適応を提示する。
モデルが過去の複数のイベントに対してトレーニングされ、進行中の複数のイベントに適応する多対多適応では、マルチタスク学習アプローチが提案される。
論文 参考訳(メタデータ) (2023-05-26T19:08:24Z) - CrisisLTLSum: A Benchmark for Local Crisis Event Timeline Extraction and
Summarization [62.77066949111921]
本稿では,現在までに利用可能な地域危機イベントタイムラインの最大のデータセットであるCrisisLTLSumについて述べる。
CrisisLTLSumには、山火事、地元の火災、交通、嵐の4つの領域にわたる1000の危機イベントタイムラインが含まれている。
最初の実験では, 両タスクの人的性能と比較して, 強いベースライン性能の間に有意な差があることが示唆された。
論文 参考訳(メタデータ) (2022-10-25T17:32:40Z) - Lifelong Unsupervised Domain Adaptive Person Re-identification with
Coordinated Anti-forgetting and Adaptation [127.6168183074427]
本稿では,LUDA (Lifelong Unsupervised Domain Adaptive) という新たなタスクを提案する。
これは、モデルがターゲット環境のラベル付けされていないデータに継続的に適応する必要があるため、難しい。
我々は、CLUDA-ReIDと呼ばれるこのタスクのための効果的なスキームを設計し、そこでは、アンチフォージェッティングが適応と調和して調整される。
論文 参考訳(メタデータ) (2021-12-13T13:19:45Z) - The Norm Must Go On: Dynamic Unsupervised Domain Adaptation by
Normalization [10.274423413222763]
ドメイン適応は、学習したモデルを、ドメインシフトやデータ分散の変更など、新しいシナリオに適応するために不可欠である。
現在のアプローチは通常、シフトしたドメインから大量のラベル付きまたはラベルなしのデータを必要とする。
本稿では,この問題を解決するために動的教師なし適応(DUA)を提案する。
論文 参考訳(メタデータ) (2021-12-01T12:43:41Z) - Transformer-Based Source-Free Domain Adaptation [134.67078085569017]
本研究では,ソースフリードメイン適応(SFDA)の課題について検討する。
我々は、FDAの一般化モデルを学ぶためのTransformer(TransDA)という、汎用的で効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T23:06:26Z) - Combating Temporal Drift in Crisis with Adapted Embeddings [58.4558720264897]
言語の使用は時間とともに変化し、NLPシステムの有効性に影響を与える可能性がある。
本研究は,危機時の言論変化に対応する方法を検討する。
論文 参考訳(メタデータ) (2021-04-17T13:11:41Z) - Unsupervised and Interpretable Domain Adaptation to Rapidly Filter
Tweets for Emergency Services [18.57009530004948]
本稿では,TRECインシデントストリームの公開データセットを用いて,危機時に関連するツイートを分類する新しい手法を提案する。
私たちは各タスクに専用の注意層を使用して、モデル解釈可能性を提供しています。
新型コロナウイルスのパンデミックに対するユースケースを提供することで、我々の仕事の実践的な意味を示す。
論文 参考訳(メタデータ) (2020-03-04T06:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。