論文の概要: Identifying Narrative Patterns and Outliers in Holocaust Testimonies Using Topic Modeling
- arxiv url: http://arxiv.org/abs/2405.02650v1
- Date: Sat, 4 May 2024 12:29:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-07 19:01:15.157018
- Title: Identifying Narrative Patterns and Outliers in Holocaust Testimonies Using Topic Modeling
- Title(参考訳): トピックモデリングを用いたホロコースト証言における物語パターンとアウトリーチの同定
- Authors: Maxim Ifergan, Renana Keydar, Omri Abend, Amit Pinchevski,
- Abstract要約: 本稿では,先進的な自然言語処理技術を用いて,USC Shoah Foundation Holocaust 証言コーパスを探索する。
質問文を構造化された質問文として扱うことにより、主要なテーマを特定するためにトピックモデリングを適用する。
- 参考スコア(独自算出の注目度): 13.639727580099484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The vast collection of Holocaust survivor testimonies presents invaluable historical insights but poses challenges for manual analysis. This paper leverages advanced Natural Language Processing (NLP) techniques to explore the USC Shoah Foundation Holocaust testimony corpus. By treating testimonies as structured question-and-answer sections, we apply topic modeling to identify key themes. We experiment with BERTopic, which leverages recent advances in language modeling technology. We align testimony sections into fixed parts, revealing the evolution of topics across the corpus of testimonies. This highlights both a common narrative schema and divergences between subgroups based on age and gender. We introduce a novel method to identify testimonies within groups that exhibit atypical topic distributions resembling those of other groups. This study offers unique insights into the complex narratives of Holocaust survivors, demonstrating the power of NLP to illuminate historical discourse and identify potential deviations in survivor experiences.
- Abstract(参考訳): ホロコーストの生き残り証言の膨大なコレクションは、貴重な歴史的洞察を提示するが、手動による分析に挑戦する。
本稿では,USC Shoah Foundation Holocaust 証言コーパスを探索するために,高度自然言語処理(NLP)技術を活用する。
質問文を構造化された質問文として扱うことにより、主要なテーマを特定するためにトピックモデリングを適用する。
言語モデリング技術の最近の進歩を生かしたBERTopicを実験する。
証言セクションを固定部分に整列し、証言のコーパスにまたがるトピックの進化を明らかにする。
これは、一般的な物語スキーマと、年齢と性別に基づくサブグループ間の相違の両方を強調している。
本稿では,他のグループに類似した非典型的話題分布を示すグループ内の証言を識別する新しい手法を提案する。
本研究はホロコーストの生存者の複雑な物語に独特な洞察を与え、NLPの歴史的言説を照らし、生き残り体験における潜在的な逸脱を特定する力を示す。
関連論文リスト
- Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。
多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。
これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文 参考訳(メタデータ) (2024-08-14T16:55:06Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Conflicts, Villains, Resolutions: Towards models of Narrative Media
Framing [19.589945994234075]
我々は、物語の要素を明示的に捉えたコミュニケーション科学から、広く使われているフレーミングの概念化を再考する。
我々は、複雑なアノテーションタスクをより単純なバイナリー質問に分解する効果的なアノテーションパラダイムを適用します。
教師付きおよび半教師付きアプローチによるフレームの自動マルチラベル予測について検討する。
論文 参考訳(メタデータ) (2023-06-03T08:50:13Z) - A Group-Specific Approach to NLP for Hate Speech Detection [2.538209532048867]
オンラインヘイトスピーチ検出のためのグループ固有のNLPアプローチを提案する。
我々は、保護されたグループに対する差別に関する歴史的データを分析し、そのグループに対するヘイトスピーチのスパイクを予測する。
我々は,NLPによる反ユダヤ的ヘイトスピーチの検出を事例として,この手法を実証する。
論文 参考訳(メタデータ) (2023-04-21T19:08:49Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Topical Segmentation of Spoken Narratives: A Test Case on Holocaust
Survivor Testimonies [18.80663780272046]
ランニング(スポーク)ナラティブのセグメンテーションの課題に取り組みます。
テストケースとして,ホロコーストの生存者の証言を英語で記述する。
論文 参考訳(メタデータ) (2022-10-25T06:02:28Z) - NECE: Narrative Event Chain Extraction Toolkit [64.89332212585404]
NECEはオープンアクセス型文書レベルのツールキットで,その発生の時間順に物語のイベントを自動的に抽出・アライメントする。
NECEツールキットの高品質さを示し、性別に関するナラティブバイアスを分析するために、その下流の応用を実証する。
また、現状のアプローチの欠点と、今後の研究で生成モデルを活用する可能性についてもオープンに論じる。
論文 参考訳(メタデータ) (2022-08-17T04:30:58Z) - Integrating topic modeling and word embedding to characterize violent
deaths [25.95389494074192]
コーパス内のトピックを識別し,文書をトピックシーケンスとして表現する新しい手法を提案する。
まず、埋め込み空間のスパース表現を提供するベクトル(談話原子)の集合を同定する。
対象者のジェンダーバイアスと,女性被害者と男性被害者の物語の有病率を比較した。
論文 参考訳(メタデータ) (2021-06-28T01:53:20Z) - Improving Faithfulness in Abstractive Summarization with Contrast
Candidate Generation and Selection [54.38512834521367]
モデル非依存後処理技術としてのコントラスト候補生成と選択について検討する。
代替候補要約を生成して判別補正モデルを学習する。
このモデルを使用して、最終的な出力サマリーとして最適な候補を選択する。
論文 参考訳(メタデータ) (2021-04-19T05:39:24Z) - Probing Task-Oriented Dialogue Representation from Language Models [106.02947285212132]
本稿では,タスク指向対話タスクにおいて,どのモデルが本質的に最も有意義な表現を担っているかを明らかにするために,事前学習された言語モデルについて検討する。
我々は、アノテートラベルを教師付き方法で固定された事前学習言語モデルの上に、分類器プローブとしてフィードフォワード層を微調整する。
論文 参考訳(メタデータ) (2020-10-26T21:34:39Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。