論文の概要: Catchphrase: Automatic Detection of Cultural References
- arxiv url: http://arxiv.org/abs/2106.04830v1
- Date: Wed, 9 Jun 2021 06:31:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 15:14:06.953778
- Title: Catchphrase: Automatic Detection of Cultural References
- Title(参考訳): キャッチフレーズ:文化参照の自動検出
- Authors: Nir Sweed, Dafna Shahaf
- Abstract要約: スノークロン(Snowclone)は、複数の、即時に認識される変種で実現可能なカスタマイズ可能なフレーズテンプレートである。
ポップカルチャーの引用文とそれに対応するスノークロンの使用状況とトレーニングモデルを新たに公開して紹介する。
我々は、リアルタイムで参照を自動的に検出しマークするブラウザプラグインであるCatchphraseのコードを公開している。
- 参考スコア(独自算出の注目度): 9.019708872816508
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A snowclone is a customizable phrasal template that can be realized in
multiple, instantly recognized variants. For example, ``* is the new *" (Orange
is the new black, 40 is the new 30). Snowclones are extensively used in social
media. In this paper, we study snowclones originating from pop-culture quotes;
our goal is to automatically detect cultural references in text. We introduce a
new, publicly available data set of pop-culture quotes and their corresponding
snowclone usages and train models on them. We publish code for Catchphrase, an
internet browser plugin to automatically detect and mark references in
real-time, and examine its performance via a user study. Aside from assisting
people to better comprehend cultural references, we hope that detecting
snowclones can complement work on paraphrasing and help to tackle long-standing
questions in social science about the dynamics of information propagation.
- Abstract(参考訳): snowcloneはカスタマイズ可能なphrasalテンプレートで、複数の認識されたバリエーションで実現することができる。
例えば ``* is the new *" (Orange is the new black, 40 is the new 30)。
スノークロスはソーシャルメディアで広く使われている。
本稿では,pop-culture quotesを起源とするスノークローネについて検討し,テキスト中の文化参照を自動的に検出することを目的としている。
我々は,ポップカルチャーの引用文とそれに対応するスノークローンの使用状況とトレーニングモデルの新しい公開データセットを紹介する。
リアルタイムに参照を自動的に検出してマークするインターネットブラウザプラグインであるcatchphraseのコードを公開し,そのパフォーマンスをユーザスタディで検証する。
文化的な参照をよりよく理解できるように支援する以外に、雪だるまの検出はパラフレーズ化の仕事を補完し、情報伝達のダイナミクスに関する社会科学における長年の課題に取り組むのに役立つことを願っている。
関連論文リスト
- Neural paraphrasing by automatically crawled and aligned sentence pairs [11.95795974003684]
ニューラルネットワークベースのパラフレーズ化に対する主な障害は、一致した文とパラフレーズのペアを持つ大きなデータセットの欠如である。
本稿では,ニュースサイトやブログサイトが,異なる物語スタイルを用いて同じ出来事を語るという仮定に基づいて,大規模コーパスの自動生成手法を提案する。
本稿では,言語制約のある類似性探索手法を提案する。これは,参照文が与えられた場合,数百万のインデックス付き文から最も類似した候補パラフレーズを見つけることができる。
論文 参考訳(メタデータ) (2024-02-16T10:40:38Z) - Learning to Generate Text in Arbitrary Writing Styles [6.7308816341849695]
言語モデルは、潜在的に小さな文章サンプルに基づいて、著者固有のスタイルでテキストを作成することが望ましい。
本稿では,テクスチャ的特徴を捉えた対照的に訓練された表現を用いて,ターゲットスタイルのテキストを生成するための言語モデルを提案する。
論文 参考訳(メタデータ) (2023-12-28T18:58:52Z) - Verifying the Robustness of Automatic Credibility Assessment [79.08422736721764]
テキスト分類法は信頼性の低い内容を検出する手段として広く研究されている。
入力テキストの無意味な変更は、モデルを誤解させることがある。
偽情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAを紹介する。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - Weakly Supervised Text Classification using Supervision Signals from a
Language Model [33.5830441120473]
我々は文書自体と「この記事は[MASK]について話している」ことを組み合わせたプロンプトを設計する。
マスク付き言語モデルは[MASK]トークンの単語を生成することができる。
文書の内容を要約した生成された単語を監視信号として利用することができる。
論文 参考訳(メタデータ) (2022-05-13T12:57:15Z) - What is wrong with you?: Leveraging User Sentiment for Automatic Dialog
Evaluation [73.03318027164605]
本稿では,次のユーザの発話から自動的に抽出できる情報をプロキシとして利用して,前のシステム応答の質を測定することを提案する。
本モデルは,実際のユーザおよび有償ユーザから収集した音声と書面の両方のオープンドメインダイアログコーパスを一般化する。
論文 参考訳(メタデータ) (2022-03-25T22:09:52Z) - Towards Open-Set Text Recognition via Label-to-Prototype Learning [18.06730376866086]
モデルを再学習することなく,新しい文字を扱えるラベルとプロトタイプの学習フレームワークを提案する。
多くの実験により,提案手法は様々なゼロショット,クローズセット,オープンセットのテキスト認識データセット上で有望な性能を達成できることが示されている。
論文 参考訳(メタデータ) (2022-03-10T06:22:51Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - A Token-level Reference-free Hallucination Detection Benchmark for
Free-form Text Generation [50.55448707570669]
本稿ではトークンレベルの参照なし幻覚検出タスクとHaDesというアノテーション付きデータセットを提案する。
このデータセットを作成するために、まず英語のウィキペディアから抽出された大量のテキストセグメントを摂り込み、それからクラウドソースアノテーションで検証する。
論文 参考訳(メタデータ) (2021-04-18T04:09:48Z) - Sentiment Analysis of Persian-English Code-mixed Texts [0.0]
ソーシャルメディアデータの構造化されていない性質から,多言語テキストやコード混合テキストの例が増えている。
本研究では,ペルシャ語と英語の混成ツイートのデータセットを収集,ラベル付けし,作成する。
本稿では,BERTプレトレーニング済み埋め込みと翻訳モデルを用いて,これらのツイートの極性スコアを自動的に学習するモデルを提案する。
論文 参考訳(メタデータ) (2021-02-25T06:05:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。