論文の概要: Evaluating Computational Representations of Character: An Austen Character Similarity Benchmark
- arxiv url: http://arxiv.org/abs/2408.16131v1
- Date: Wed, 28 Aug 2024 20:36:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-30 15:44:44.834215
- Title: Evaluating Computational Representations of Character: An Austen Character Similarity Benchmark
- Title(参考訳): 文字の計算的表現の評価:オーステン文字類似性ベンチマーク
- Authors: Funing Yang, Carolyn Jane Anderson,
- Abstract要約: 本稿では,ジェーン・オーステンの小説におけるキャラクター類似性のベンチマークスイートであるAustinAlikeを紹介する。
我々のベンチマークは、構造的に定義された類似性の概念、社会的に定義された類似性の概念、文学的批判から抽出された専門家定義セットの3つの概念に基づく。
我々は、4種類の特徴から文字表現を構築し、3つのAustinAlikeベンチマークとGPT-4類似度ランキングと比較する。
- 参考スコア(独自算出の注目度): 6.298609827855792
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Several systems have been developed to extract information about characters to aid computational analysis of English literature. We propose character similarity grouping as a holistic evaluation task for these pipelines. We present AustenAlike, a benchmark suite of character similarities in Jane Austen's novels. Our benchmark draws on three notions of character similarity: a structurally defined notion of similarity; a socially defined notion of similarity; and an expert defined set extracted from literary criticism. We use AustenAlike to evaluate character features extracted using two pipelines, BookNLP and FanfictionNLP. We build character representations from four kinds of features and compare them to the three AustenAlike benchmarks and to GPT-4 similarity rankings. We find that though computational representations capture some broad similarities based on shared social and narrative roles, the expert pairings in our third benchmark are challenging for all systems, highlighting the subtler aspects of similarity noted by human readers.
- Abstract(参考訳): 英文学の計算解析を支援するために,文字に関する情報を抽出するシステムが開発されている。
本稿では,これらのパイプラインの全体的評価課題として,文字類似性グループ化を提案する。
本稿では,ジェーン・オーステンの小説におけるキャラクター類似性のベンチマークスイートであるAustinAlikeを紹介する。
我々のベンチマークは、構造的に定義された類似性の概念、社会的に定義された類似性の概念、文学的批判から抽出された専門家定義セットの3つの概念に基づく。
我々はAustinAlikeを用いて、BookNLPとFanfictionNLPの2つのパイプラインを用いて抽出した文字の特徴を評価する。
我々は、4種類の特徴から文字表現を構築し、3つのAustinAlikeベンチマークとGPT-4類似度ランキングと比較する。
計算表現は、共有された社会的役割と物語的役割に基づいて、幅広い類似点を捉えるが、第3のベンチマークにおける専門家のペアリングは、すべてのシステムにおいて困難であり、人間の読者による類似点の微妙な側面を強調している。
関連論文リスト
- BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。
本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。
その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-10-14T10:55:58Z) - Rematch: Robust and Efficient Matching of Local Knowledge Graphs to Improve Structural and Semantic Similarity [6.1980259703476674]
我々は,新しいAMR類似度指標であるrematchを導入し,RAREと呼ばれる構造類似度の評価を行った。
Rematchは構造的類似度で2位、第1位はSTS-BとSICK-Rのベンチマークで1~5ポイントのセマンティック類似度で2位である。
論文 参考訳(メタデータ) (2024-04-02T17:33:00Z) - GNAT: A General Narrative Alignment Tool [12.100007440638667]
バイオインフォマティクスと現代のテキスト類似度指標を結合したSmith-Watermanアルゴリズムのナラティブアライメントに対する一般的なアプローチを開発する。
文書の相対長と絶対長の両方で大きく異なる4つの異なる問題領域に対して、一般的な物語アライメントツール(GNAT)を適用し、評価する。
論文 参考訳(メタデータ) (2023-11-07T00:24:14Z) - StoryAnalogy: Deriving Story-level Analogies from Large Language Models
to Unlock Analogical Understanding [72.38872974837462]
大規模ストーリーレベルの類似語コーパスを構築することにより,類似語を識別・生成する能力を評価する。
textscStory Analogyには、さまざまなドメインから24Kストーリーペアが含まれており、拡張された構造マッピング理論の2つの類似点に人間のアノテーションがある。
我々は、textscStory Analogyのデータは、大言語モデルにおけるアナログ生成の品質を向上させることができることを観察した。
論文 参考訳(メタデータ) (2023-10-19T16:29:23Z) - DeltaScore: Fine-Grained Story Evaluation with Perturbations [69.33536214124878]
DELTASCOREは,ニュアンスストーリーの側面の評価に摂動技術を用いた新しい手法である。
私たちの中心的な命題は、物語が特定の側面(例えば、流感)で興奮する程度は、特定の摂動に対するその感受性の大きさと相関している、と仮定している。
事前学習言語モデルを用いて,前摂動状態と後摂動状態の確率差を計算することにより,アスペクトの品質を測定する。
論文 参考訳(メタデータ) (2023-03-15T23:45:54Z) - Tragic and Comical Networks. Clustering Dramatic Genres According to
Structural Properties [0.0]
ネットワーク研究とドラマ史の合同分野における伝統は、劇のキャラクターネットワークからの解釈を生み出している。
我々の目的は、プレイのよく解釈可能なシンプルな特性に基づいて、類似した構造を持つテキストをクラスタリングできる方法を作ることである。
これらの特徴の発見は,本研究の最も重要な部分であるとともに,テキスト間の類似性を計算するための適切な統計的手順を確立する。
論文 参考訳(メタデータ) (2023-02-16T12:36:16Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Syllabic Quantity Patterns as Rhythmic Features for Latin Authorship
Attribution [74.27826764855911]
我々は、ラテン散文の計算的オーサシップ属性のタスクにおいて、リズミカルな特徴を導出する基盤として、音節量を用いる。
2つの異なる機械学習手法を用いて3つの異なるデータセットを用いて実験を行い、音節量に基づくリズム特徴がラテン散文の著者の識別に有用であることを示した。
論文 参考訳(メタデータ) (2021-10-27T06:25:31Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Comparative Computational Analysis of Global Structure in Canonical,
Non-Canonical and Non-Literary Texts [0.0]
3つのテキストタイプ(ノンリテラル、文学/カノニカル、文学/カノニカル)は、読者の美的反応の相関として構造設計の特徴に関して体系的な違いを示す。
大域構造の2つの側面、変動性、およびテキストに沿った長距離相関を反映する自己相似(フラクタル)パターンについて検討した。
その結果,3種類のテキストに対して,テキストの低レベル特性は高レベル特性よりも差別性が高いことがわかった。
論文 参考訳(メタデータ) (2020-08-25T09:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。