論文の概要: Characterizing Latent Perspectives of Media Houses Towards Public
Figures
- arxiv url: http://arxiv.org/abs/2309.06112v1
- Date: Tue, 12 Sep 2023 10:27:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:30:21.541101
- Title: Characterizing Latent Perspectives of Media Houses Towards Public
Figures
- Title(参考訳): メディアハウスの潜在視点を公人に向けて特徴づける
- Authors: Sharath Srivatsa, Srinath Srinivasa
- Abstract要約: 本研究は,GPT-2を用いたコーパスからの人物の非抽出的・生成的特徴評価のためのゼロショットアプローチを提案する。
我々は、このアプローチの健全な議論を構築するためのコーパスとして、いくつかの有名なニュースメディアハウスから、よく認識された記事を使用します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Media houses reporting on public figures, often come with their own biases
stemming from their respective worldviews. A characterization of these
underlying patterns helps us in better understanding and interpreting news
stories. For this, we need diverse or subjective summarizations, which may not
be amenable for classifying into predefined class labels. This work proposes a
zero-shot approach for non-extractive or generative characterizations of person
entities from a corpus using GPT-2. We use well-articulated articles from
several well-known news media houses as a corpus to build a sound argument for
this approach. First, we fine-tune a GPT-2 pre-trained language model with a
corpus where specific person entities are characterized. Second, we further
fine-tune this with demonstrations of person entity characterizations, created
from a corpus of programmatically constructed characterizations. This twice
fine-tuned model is primed with manual prompts consisting of entity names that
were not previously encountered in the second fine-tuning, to generate a simple
sentence about the entity. The results were encouraging, when compared against
actual characterizations from the corpus.
- Abstract(参考訳): メディアハウスは公共の人物を報告しており、しばしばそれぞれの世界観から生じる独自の偏見を伴っている。
これらの基礎となるパターンの特徴づけは、ニュースストーリーをよりよく理解し解釈するのに役立ちます。
そのためには多様あるいは主観的な要約が必要であり、事前に定義されたクラスラベルの分類には適さないかもしれない。
本研究は,GPT-2を用いたコーパスからの人物の非抽出的・生成的特徴評価のためのゼロショットアプローチを提案する。
私たちは、このアプローチの健全な議論を構築するために、いくつかの有名なニュースメディアハウスからのよく知られた記事をコーパスとして使用します。
まず、GPT-2事前学習言語モデルに、特定の人物を特徴付けるコーパスを付与する。
第二に、プログラムで構築された特徴のコーパスから作成された人物エンティティ特性のデモンストレーションにより、さらにこれを微調整する。
この2つの微調整されたモデルは、第2の微調整で以前に遭遇しなかったエンティティ名からなる手動のプロンプトでプライミングされ、エンティティに関する簡単な文を生成する。
結果は、コーパスの実際の特徴と比較すると、励まされた。
関連論文リスト
- PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Reweighting Strategy based on Synthetic Data Identification for Sentence
Similarity [30.647497555295974]
機械で書かれた文章を識別する分類器を訓練し、機械で書かれた文章の言語的特徴が人間の文章と大きく異なることを観察する。
次に、分類器からの蒸留情報を用いて、信頼性のある文埋め込みモデルを訓練する。
合成データに基づいてトレーニングしたモデルでは,既存のベースラインよりも良く一般化し,性能が向上する。
論文 参考訳(メタデータ) (2022-08-29T05:42:22Z) - Zero-shot Entity and Tweet Characterization with Designed Conditional
Prompts and Contexts [6.38674533060275]
我々は,生成事前学習型トランスフォーマー2(GPT-2)のゼロショット言語モデル機能を評価し,主観的な特徴付けとつぶやきを行う。
我々は、いくつかの人気のあるハッシュタグからツイートコーパスを付したGPT-2を微調整し、プレフィックス、質問、文脈合成プロンプトで言語モデルをプリミレーションすることで、ツイートを特徴付ける。
論文 参考訳(メタデータ) (2022-04-18T17:01:49Z) - Explaining Latent Representations with a Corpus of Examples [72.50996504722293]
本稿では,サンプルベースの説明を自由に選択されたサンプル集合を参照して提供するユーザ中心の手法であるSimplExを提案する。
SimplExは、ポストホックな説明で潜伏空間に対するユーザの理解を改善するためにコーパスを使用する。
SimplExは,モデル表現を説明するコーパス内の関連パターンを強調表示することで,ユーザを力づけることを示す。
論文 参考訳(メタデータ) (2021-10-28T17:59:06Z) - On The Ingredients of an Effective Zero-shot Semantic Parser [95.01623036661468]
我々は、標準発話とプログラムの訓練例を文法から言い換えて、ゼロショット学習を分析する。
改良された文法,より強力なパラフレーズ,効率的な学習手法を用いて,これらのギャップを埋めることを提案する。
我々のモデルはラベル付きデータゼロの2つの意味解析ベンチマーク(Scholar, Geo)で高い性能を達成する。
論文 参考訳(メタデータ) (2021-10-15T21:41:16Z) - Cross-linguistically Consistent Semantic and Syntactic Annotation of Child-directed Speech [27.657676278734534]
本稿では,子指向音声のこのようなコーパスを,感性論理形式と組み合わせて構築する手法を提案する。
このアプローチは言語間一貫した表現を強制し、依存関係表現とセマンティック解析の最近の進歩に基づいている。
論文 参考訳(メタデータ) (2021-09-22T18:17:06Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Zero-shot topic generation [10.609815608017065]
本稿では,文書タイトル生成にのみ訓練されたモデルを用いてトピックを生成する手法を提案する。
私たちは、そのドキュメントのタイトルを生成するために、ドキュメント内の候補の関連性をキャプチャする機能を活用します。
アウトプットは、文書を記述し、コーパス内でそれを区別するのに最も関係のあるフレーズの重み付けされたコレクションである。
論文 参考訳(メタデータ) (2020-04-29T04:39:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。