論文の概要: Detecting Contextomized Quotes in News Headlines by Contrastive Learning
- arxiv url: http://arxiv.org/abs/2302.04465v1
- Date: Thu, 9 Feb 2023 07:04:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-10 16:39:39.870588
- Title: Detecting Contextomized Quotes in News Headlines by Contrastive Learning
- Title(参考訳): コントラスト学習によるニュース見出しの文脈化引用の検出
- Authors: Seonyeong Song, Hyeonho Song, Kunwoo Park, Jiyoung Han, Meeyoung Cha
- Abstract要約: 引用マークに囲われた直接的な引用は、強い視覚的魅力を持ち、信頼できる引用の兆候である。
残念なことに、このジャーナリズムの実践は厳密には続かず、見出しの引用は「文脈化」されることが多い。
このような引用は、話者の意図を変える方法で文脈から単語を使い、ボディテキストに意味的に一致する引用がないようにする。
ドメイン駆動の正と負のサンプルに基づいて、ニュース引用の埋め込みを表現する、対照的な学習フレームワークQuoteCSEを提案する。
- 参考スコア(独自算出の注目度): 9.90130000354593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quotes are critical for establishing credibility in news articles. A direct
quote enclosed in quotation marks has a strong visual appeal and is a sign of a
reliable citation. Unfortunately, this journalistic practice is not strictly
followed, and a quote in the headline is often "contextomized." Such a quote
uses words out of context in a way that alters the speaker's intention so that
there is no semantically matching quote in the body text. We present QuoteCSE,
a contrastive learning framework that represents the embedding of news quotes
based on domain-driven positive and negative samples to identify such an
editorial strategy. The dataset and code are available at
https://github.com/ssu-humane/contextomized-quote-contrastive.
- Abstract(参考訳): 記事はニュース記事の信頼性を確立するために重要である。
引用符で囲まれた直接引用は、強い視覚的魅力を持ち、信頼できる引用のサインである。
残念なことに、この報道の実践は厳密には守られておらず、見出しの引用はしばしば「文脈化」される。
このような引用は、話者の意図を変える方法で文脈から単語を使い、ボディテキストに意味的に一致する引用がないようにする。
本稿では,ドメイン駆動型肯定的,否定的なサンプルに基づく引用文の埋め込みを表現し,そのような編集戦略を識別する対照的な学習フレームワークQuoteCSEを提案する。
データセットとコードはhttps://github.com/ssu-humane/contextomized-quote-contrastiveで入手できる。
関連論文リスト
- Visually-Aware Context Modeling for News Image Captioning [54.31708859631821]
News Image Captioningは、ニュース記事や画像からキャプションを作成することを目的としている。
より優れた名前埋め込みを学習するための顔命名モジュールを提案する。
私たちはCLIPを使用して、画像にセマンティックに近い文を検索します。
論文 参考訳(メタデータ) (2023-08-16T12:39:39Z) - Addressing Biases in the Texts using an End-to-End Pipeline Approach [0.0]
本稿では,テキストを入力とし,バイアスや有害な内容を含むか否かを判定する,公正なMLパイプラインを提案する。
両用した単語を置換することで、新しい単語の集合が提案されるが、その考え方は、それらのバイアスの効果を代替語に置き換えることによって軽減することである。
その結果,提案したパイプラインはソーシャルメディアデータのバイアスを検出・識別・緩和できることがわかった。
論文 参考訳(メタデータ) (2023-03-13T11:41:28Z) - Quote Erat Demonstrandum: A Web Interface for Exploring the Quotebank
Corpus [11.863216366085105]
本稿では,ニュースから引用した膨大なコレクションであるQuotebankを検索するための適応Webインターフェースを提案する。
記事はニュース記事の概念、受容、分析において中心的な役割を果たす。
論文 参考訳(メタデータ) (2022-07-07T21:41:03Z) - QuoteR: A Benchmark of Quote Recommendation for Writing [80.83859760380616]
QuoteRと呼ばれる大規模かつ完全にオープンな引用レコメンデーションデータセットを構築します。
我々はQuoteR上で既存の引用レコメンデーション手法を広範囲に評価する。
提案手法は,QuoteRの3つの部分すべてにおいて,従来の手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2022-02-26T14:01:44Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - DirectQuote: A Dataset for Direct Quotation Extraction and Attribution
in News Articles [6.006936459950188]
本稿では,オンラインメディアから手動で注釈付けされた19,760段落と10,279の直接引用を含むコーパスであるDirectQuoteを紹介する。
提案手法は,複数のシーケンスラベリングモデルをベースラインとして提案し,提案手法をエンド・ツー・エンドで同時抽出・属性付けする手法である。
論文 参考訳(メタデータ) (2021-10-15T02:50:09Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - Citations are not opinions: a corpus linguistics approach to
understanding how citations are made [0.0]
引用内容分析の重要な問題は、引用の異なるクラスを特徴付ける言語構造を見つけることである。
本研究では,分類済みの引用コーパスの大規模なサンプルから始めて,発声スマート引用データセットの各クラスから200万の引用を行う。
各引用型の比較表を生成することにより,引用型を特徴付ける興味深い言語特徴を多数提示する。
論文 参考訳(メタデータ) (2021-04-16T12:52:27Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。