論文の概要: "TL;DR:" Out-of-Context Adversarial Text Summarization and Hashtag
Recommendation
- arxiv url: http://arxiv.org/abs/2104.00782v1
- Date: Thu, 1 Apr 2021 22:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 00:32:28.663746
- Title: "TL;DR:" Out-of-Context Adversarial Text Summarization and Hashtag
Recommendation
- Title(参考訳): 文脈外敵文要約とハッシュタグ推薦「tl;dr:」
- Authors: Peter Jachim, Filipo Sharevski, Emma Pieroni
- Abstract要約: Out-of-Context Summarizerは、任意のパブリックニュース記事をコンテキストから取り出し、リベラルまたは保守的なリーンアジェンダに一貫性のある適合するように要約するツールです。
このツールは、新型コロナウイルス(covid-19)の記事の要約時に79%の精度と99%のリコールを達成し、政治的中心の記事の要約時に93%の精度と93%のリコールを達成し、87%の精度と88%のリコールを行った。
- 参考スコア(独自算出の注目度): 1.5469452301122175
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents Out-of-Context Summarizer, a tool that takes arbitrary
public news articles out of context by summarizing them to coherently fit
either a liberal- or conservative-leaning agenda. The Out-of-Context Summarizer
also suggests hashtag keywords to bolster the polarization of the summary, in
case one is inclined to take it to Twitter, Parler or other platforms for
trolling. Out-of-Context Summarizer achieved 79% precision and 99% recall when
summarizing COVID-19 articles, 93% precision and 93% recall when summarizing
politically-centered articles, and 87% precision and 88% recall when taking
liberally-biased articles out of context. Summarizing valid sources instead of
synthesizing fake text, the Out-of-Context Summarizer could fairly pass the
"adversarial disclosure" test, but we didn't take this easy route in our paper.
Instead, we used the Out-of-Context Summarizer to push the debate of potential
misuse of automated text generation beyond the boilerplate text of responsible
disclosure of adversarial language models.
- Abstract(参考訳): 本稿では,自由主義的・保守主義的な議題に適合するように要約することで,任意の公開ニュース記事を取り出すツールであるOut-of-Context Summarizerを提案する。
Out-of-Context Summarizerはまた、TwitterやParlerなどのプラットフォームでトロルを行う場合に備えて、要約の分極を強化するハッシュタグキーワードも提案している。
アウト・オブ・コンテキスト・サマリーサーは79%の精度と99%のリコールを達成し、93%の精度と93%のリコールを政治的中心の記事を要約すると達成し、87%の精度と88%のリコールをリコールした。
偽のテキストを合成する代わりに有効な情報源を要約すると、Out-of-Context Summarizerは「逆の開示」テストにかなり合格することが出来ました。
代わりに、Out-of-Context Summarizerを使って、反対側の言語モデルを公開する責任のあるボイラープレートテキスト以外の、自動化されたテキスト生成の潜在的な誤用に関する議論を進めました。
関連論文リスト
- Evaluating D-MERIT of Partial-annotation on Information Retrieval [77.44452769932676]
検索モデルは、部分的に注釈付けされたデータセットでしばしば評価される。
部分的に注釈付けされたデータセットを評価に用いると歪んだ絵が描けることを示す。
論文 参考訳(メタデータ) (2024-06-23T08:24:08Z) - Silencing the Risk, Not the Whistle: A Semi-automated Text Sanitization Tool for Mitigating the Risk of Whistleblower Re-Identification [4.082799056366928]
ホイッスルブローイングは、公共部門と民間部門の両方で透明性と説明責任を確保するために不可欠である。
EUのWBDのような法的措置は、その範囲と有効性に制限されている。
現在のテキストのサニタイズツールは、一大のアプローチを踏襲し、匿名性を極端に限定している。
論文 参考訳(メタデータ) (2024-05-02T08:52:29Z) - On Context Utilization in Summarization with Large Language Models [83.84459732796302]
大きな言語モデル(LLM)は抽象的な要約タスクに優れ、流動的で関連する要約を提供する。
最近の進歩は、100kトークンを超える長期入力コンテキストを扱う能力を拡張している。
要約における文脈利用と位置バイアスに関する最初の総合的研究を行う。
論文 参考訳(メタデータ) (2023-10-16T16:45:12Z) - Unsupervised Bias Detection in College Student Newspapers [0.0]
本稿では,複雑なアーカイブサイトをスクレイピングするフレームワークを導入し,23,154項目からなる14の学生論文のデータセットを生成する。
このアプローチの利点は、リコンストラクションバイアスよりも比較が低く、キーワードの感情を生成するよりもラベル付きデータが少ないことである。
結果は、政治的に課金された単語と制御された単語に基づいて計算され、どのように結論が導き出されるかを示す。
論文 参考訳(メタデータ) (2023-09-11T06:51:09Z) - Self-contradictory Hallucinations of Large Language Models: Evaluation, Detection and Mitigation [5.043563227694139]
大規模な言語モデル(より大きなLM)は、幻覚的内容を含むテキストを生成できる。
各種の命令調整型LMの自己コントラクションに関する包括的調査を行う。
本稿では,自己矛盾を効果的に検出・緩和する新しいプロンプトベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-25T08:43:46Z) - Entity-Based Evaluation of Political Bias in Automatic Summarization [27.68439481274954]
本稿では,ニュース記事の自動要約における政治家の描写を,エンティティ代替手法を用いて調査する。
我々は、ドナルド・トランプやジョー・バイデンといった政治家に対して、抽出的かつ抽象的な要約者の感性を評価するためのエンティティベースの計算フレームワークを開発する。
論文 参考訳(メタデータ) (2023-05-03T17:59:59Z) - Lay Text Summarisation Using Natural Language Processing: A Narrative
Literature Review [1.8899300124593648]
本研究の目的は, テキスト要約の手法を記述し, 比較することである。
私たちは82の記事をスクリーニングし、同じデータセットを使用して2020年から2021年の間に8つの関連論文を公開しました。
ハイブリッドアプローチにおける抽出的および抽象的要約法の組み合わせが最も有効であることが判明した。
論文 参考訳(メタデータ) (2023-03-24T18:30:50Z) - A Condense-then-Select Strategy for Text Summarization [53.10242552203694]
テキスト要約のための新しいcondense-then-selectフレームワークを提案する。
我々のフレームワークは、文レベルの圧縮の効率を高く保ちながら、有能な情報の損失を避けるのに役立ちます。
論文 参考訳(メタデータ) (2021-06-19T10:33:10Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - NewsCLIPpings: Automatic Generation of Out-of-Context Multimodal Media [93.51739200834837]
画像とテキストの両方を操作できないが一致しないデータセットを提案する。
本稿では,字幕に適した画像の自動検索手法をいくつか紹介する。
当社の大規模自動生成NewsCLIPpingsデータセットは、両方のモダリティを共同分析するモデルを必要とします。
論文 参考訳(メタデータ) (2021-04-13T01:53:26Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。