論文の概要: Cross-Lingual Query-Based Summarization of Crisis-Related Social Media:
An Abstractive Approach Using Transformers
- arxiv url: http://arxiv.org/abs/2204.10230v1
- Date: Thu, 21 Apr 2022 16:07:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-22 15:40:08.694297
- Title: Cross-Lingual Query-Based Summarization of Crisis-Related Social Media:
An Abstractive Approach Using Transformers
- Title(参考訳): 危機関連ソーシャルメディアの言語間問合せに基づく要約:トランスフォーマーを用いた抽象的アプローチ
- Authors: Fedor Vitiugin and Carlos Castillo
- Abstract要約: 本研究では,ソーシャルメディア投稿から危機関連情報を検索・要約するための言語横断手法を提案する。
本稿では、構造化されたクエリと要約を作成する方法を通じて、さまざまな情報要求を統一的に表現する方法について述べる。
- 参考スコア(独自算出の注目度): 3.042890194004583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Relevant and timely information collected from social media during crises can
be an invaluable resource for emergency management. However, extracting this
information remains a challenging task, particularly when dealing with social
media postings in multiple languages. This work proposes a cross-lingual method
for retrieving and summarizing crisis-relevant information from social media
postings. We describe a uniform way of expressing various information needs
through structured queries and a way of creating summaries answering those
information needs. The method is based on multilingual transformers embeddings.
Queries are written in one of the languages supported by the embeddings, and
the extracted sentences can be in any of the other languages supported.
Abstractive summaries are created by transformers. The evaluation, done by
crowdsourcing evaluators and emergency management experts, and carried out on
collections extracted from Twitter during five large-scale disasters spanning
ten languages, shows the flexibility of our approach. The generated summaries
are regarded as more focused, structured, and coherent than existing
state-of-the-art methods, and experts compare them favorably against summaries
created by existing, state-of-the-art methods.
- Abstract(参考訳): 危機時にソーシャルメディアから収集された適切でタイムリーな情報は、緊急管理のための貴重なリソースとなる。
しかし、特に複数の言語でのソーシャルメディア投稿を扱う場合、この情報を抽出することは難しい課題である。
本研究では,ソーシャルメディア投稿から危機関連情報を検索・要約するための言語横断手法を提案する。
本稿では,構造化クエリによる多様な情報要求を統一的に表現する方法と,それらの情報ニーズに対応する要約を作成する方法について述べる。
この方法は多言語トランスフォーマー埋め込みに基づいている。
クエリは組込み言語でサポートされている言語のひとつで書かれており、抽出された文は他の言語でサポートされている。
抽象要約はトランスフォーマーによって作成される。
クラウドソーシング評価者や緊急管理専門家が実施した評価は,10言語にわたる大規模災害5件において,Twitterから抽出したコレクションに対して実施したものであり,我々のアプローチの柔軟性を示している。
生成された要約は、既存の最先端の手法よりも集中的、構造化され、一貫性があると見なされ、専門家は、既存の最先端の手法によって作成された要約と比較する。
関連論文リスト
- Converging Dimensions: Information Extraction and Summarization through Multisource, Multimodal, and Multilingual Fusion [0.0]
本稿では,複数の情報源の強みを生かして,このような課題に対処する新たな要約手法を提案する。
この研究は、テキストドキュメントのような従来型にない情報源を超えて進展し、YouTubeのプレイリスト、プレプリント、ウィキペディアページなど、より多様なデータを統合している。
論文 参考訳(メタデータ) (2024-06-19T17:15:47Z) - CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media [5.384787836425144]
危機の時代には、ソーシャルメディアプラットフォームはコミュニケーションの促進と資源の調整において重要な役割を担っている。
本稿では,CReMa(Crisis Response Matcher)を提案する。
16言語でヘルプ検索をシミュレートし,ソーシャルメディアに支援を提供する新しい多言語データセットを提案する。
論文 参考訳(メタデータ) (2024-05-20T09:30:03Z) - Multi-Query Focused Disaster Summarization via Instruction-Based
Prompting [3.6199702611839792]
CrisisFACTSは,マルチストリームファクトフィンディングに基づく災害要約の推進を目的としている。
ここでは、いくつかの災害関連事象から重要な事実を抽出できるシステムを開発するよう、参加者に依頼する。
本稿では,この課題に対処する方法について述べる。
論文 参考訳(メタデータ) (2024-02-14T08:22:58Z) - $\mu$PLAN: Summarizing using a Content Plan as Cross-Lingual Bridge [72.64847925450368]
言語間の要約は、異なる言語で入力文書が与えられた1つの言語で要約を生成することで構成される。
この研究は、中間計画段階を言語横断橋として利用する言語横断要約へのアプローチである$mu$PLANを提示する。
論文 参考訳(メタデータ) (2023-05-23T16:25:21Z) - Automated Audio Captioning: an Overview of Recent Progress and New
Challenges [56.98522404673527]
自動音声キャプションは、与えられた音声クリップの自然言語記述を生成することを目的とした、モーダル横断翻訳タスクである。
本稿では、既存の様々なアプローチから評価指標やデータセットまで、自動音声キャプションにおけるコントリビューションの総合的なレビューを行う。
論文 参考訳(メタデータ) (2022-05-12T08:36:35Z) - BERTuit: Understanding Spanish language in Twitter through a native
transformer [70.77033762320572]
bfBERTuitは、これまでスペイン語のために提案された大きなトランスフォーマーで、2億3000万のスペイン語ツイートの膨大なデータセットで事前トレーニングされている。
私たちのモチベーションは、スペイン語のTwitterをよりよく理解し、このソーシャルネットワークにフォーカスしたアプリケーションに利用するための強力なリソースを提供することです。
論文 参考訳(メタデータ) (2022-04-07T14:28:51Z) - Evaluation of Abstractive Summarisation Models with Machine Translation
in Deliberative Processes [23.249742737907905]
このデータセットは、主に文法的品質の低い複数の物語を単一のテキストで組み合わせることの難しさを反映している。
本稿では,市販機械翻訳モデルと組み合わせて,多種多様な抽象的要約モデルを広範囲に評価する。
生成した要約の流布,一貫性,関連性について有望な結果を得た。
論文 参考訳(メタデータ) (2021-10-12T09:23:57Z) - Text Summarization with Latent Queries [60.468323530248945]
本稿では,LaQSumについて紹介する。LaQSumは,既存の問合せ形式と抽象的な要約のための文書から遅延クエリを学習する,最初の統一テキスト要約システムである。
本システムでは, 潜伏クエリモデルと条件付き言語モデルとを協調的に最適化し, ユーザがテスト時に任意のタイプのクエリをプラグイン・アンド・プレイできるようにする。
本システムでは,クエリタイプ,文書設定,ターゲットドメインの異なる要約ベンチマークにおいて,強力な比較システムの性能を強く向上させる。
論文 参考訳(メタデータ) (2021-05-31T21:14:58Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - WikiLingua: A New Benchmark Dataset for Cross-Lingual Abstractive
Summarization [41.578594261746055]
ウィキリンガ(WikiLingua)は,言語間抽象要約システムの評価のための大規模多言語データセットである。
ウィキハウ(WikiHow)は,人文者によって書かれた多種多様なトピックに関するハウツーガイドの高品質で協調的な資料である。
我々は、各記事のハウツーステップを記述するために使用されるイメージをアライメントすることで、言語間でのゴールドスタンダードな記事要約アライメントを作成する。
論文 参考訳(メタデータ) (2020-10-07T00:28:05Z) - Language Guided Networks for Cross-modal Moment Retrieval [66.49445903955777]
モーダルモーダルモーメント検索は、自然言語クエリによって記述された未編集ビデオから時間セグメントをローカライズすることを目的としている。
既存の手法は、ビデオや文の特徴を独立して抽出する。
本稿では,言語ガイドネットワーク(LGN, Language Guided Networks)について紹介する。
論文 参考訳(メタデータ) (2020-06-18T12:08:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。