論文の概要: The Shape of Testimony: A Scalable Framework for Oral History Archive Comparison
- arxiv url: http://arxiv.org/abs/2605.21623v1
- Date: Wed, 20 May 2026 18:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.47636
- Title: The Shape of Testimony: A Scalable Framework for Oral History Archive Comparison
- Title(参考訳): The Shape of Testimony: 口頭史アーカイブ比較のためのスケーラブルなフレームワーク
- Authors: Itamar Trainin, Renana Keydar, Amit Pinchevski,
- Abstract要約: ホロコースト研究の研究者は、しばしば2種類のオーラルサバイバルの証言を区別している。
USCショア財団のインタヴューは構造化されたインタヴューターによる形式を踏襲する傾向にあり、イェール・フォーチュノフ・ビデオ・アーカイブはより自由でオープンなスタイルを好んでいる。
本研究は,両コレクションから1,600以上の証言を大規模に解析することにより,その主張を批判的に検証する。
- 参考スコア(独自算出の注目度): 2.12833538322985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Researchers in Holocaust studies have often distinguished between two styles of oral survivor testimony: the USC Shoah Foundation's interviews tend to follow a structured, interviewer-guided format, whereas the Yale Fortunoff Video Archive generally favors a more free-form, open-ended style. This distinction has influenced both scholarly research and the development of later archives. In this study, we critically examine that claim by conducting a large-scale computational analysis of more than 1,600 testimonies from both collections. Leveraging discourse segmentation, topic modeling, and large language model (LLM) based analysis, we quantify the "structuredness" level of testimonies through topic coherence, interviewer-survivor dynamics, and the distribution of question types. Our results generally corroborate the structural differences identified in earlier research, while also revealing significant overlaps between the collections, both within individual interviews and across common narrative patterns. This complicates the simple "structured vs. free-form" dichotomy often applied to these oral histories. Beyond revisiting a foundational claim in Holocaust studies, our work provides a scalable, replicable framework for comparative corpus analysis. As a proof of concept, it suggests broader applications for digital oral history, narrative analysis, and the design of citizen-science annotation platforms.
- Abstract(参考訳): ホロコースト研究の研究者は、しばしば2種類のオーラル・サバイバルの証言を区別している: USC Shoah Foundationのインタビューは、構造化されたインタビュアーによる形式に従う傾向があるが、Yale Fortunoff Video Archiveは、一般により自由でオープンなスタイルを好んでいる。
この区別は、学術研究と後世のアーカイブの発展の両方に影響を及ぼした。
本研究では,2つのコレクションから1,600以上の証言を大規模に解析することにより,その主張を批判的に検証する。
談話セグメンテーション,トピックモデリング,大規模言語モデル(LLM)に基づく分析を用いて,トピックコヒーレンス,インタビュアー・サバイバル・ダイナミクス,質問型の分布などを通じて,証言の「構造化」レベルを定量化する。
以上の結果から,先行研究における構造的差異と,個々のインタビューと共通の物語パターンの双方において,コレクション間の顕著な重複が明らかとなった。
これは、これらの口頭史にしばしば適用される単純な「構造化対自由形式」二分法を複雑にしている。
ホロコースト研究の基本的主張を再考する以外に、我々の研究は、比較コーパス分析のためのスケーラブルでレプリケートなフレームワークを提供しています。
概念実証として、デジタルオーラルヒストリー、物語分析、市民科学のアノテーションプラットフォームの設計に対する幅広い応用を提案する。
関連論文リスト
- Floating or Suggesting Ideas? A Large-Scale Contrastive Analysis of Metaphorical and Literal Verb-Object Constructions [53.690096725532726]
本研究では,2Mコーパス文中の297の英語動詞オブジェクト対(例:float idea vs. suggest idea)を分析した。
5つのNLPツールを用いて,感情的,語彙的,統語的,言論的な特徴を捉えた認知的・言語的特徴2,293点を抽出した。
クロスペアの結果は, 語彙頻度, 凝集度, 構造規則性が高く, 比喩的文脈は感情負荷, イメージ性, 語彙多様性, 構造的特異性を示す。
論文 参考訳(メタデータ) (2026-04-09T14:08:57Z) - Listening Between the Lines: Decoding Podcast Narratives with Language Modeling [17.51119928424848]
既存の大規模言語モデルは、一般的にニュース記事のようなより構造化されたテキストで訓練されており、人間のリスナーが物語のフレームを特定するのに頼っている微妙な手がかりを捉えるのに苦労している。
提案手法では,これらの粒度ラベルを用いて,より広範な談話傾向を明らかにする。
論文 参考訳(メタデータ) (2025-11-07T15:12:06Z) - Large Language Models for Oral History Understanding with Text Classification and Sentiment Analysis [0.25165775267615204]
本稿では,日本人投獄口頭史における意味的・感情的アノテーションの自動化を目的とした,スケーラブルなフレームワークを提案する。
LLMを用いて、高品質なデータセットを構築し、複数のモデルを評価し、プロンプトエンジニアリング戦略をテストする。
感情分析では、ラマはQwen(82.66%)とChatGPT(82.29%)をわずかに上回り、全てのモデルで同等の結果を示した。
論文 参考訳(メタデータ) (2025-08-08T22:06:23Z) - Interactive Topic Models with Optimal Transport [75.26555710661908]
ラベル名監視型トピックモデリングのためのアプローチとして,EdTMを提案する。
EdTMは、LM/LLMベースのドキュメントトピック親和性を活用しながら、代入問題としてのトピックモデリングをモデル化する。
論文 参考訳(メタデータ) (2024-06-28T13:57:27Z) - Identifying Narrative Patterns and Outliers in Holocaust Testimonies Using Topic Modeling [13.639727580099484]
本稿では,先進的な自然言語処理技術を用いて,USC Shoah Foundation Holocaust 証言コーパスを探索する。
質問文を構造化された質問文として扱うことにより、主要なテーマを特定するためにトピックモデリングを適用する。
論文 参考訳(メタデータ) (2024-05-04T12:29:00Z) - Towards Debiasing Frame Length Bias in Text-Video Retrieval via Causal
Intervention [72.12974259966592]
トリミングビデオクリップのトレーニングセットとテストセットのフレーム長差による時間偏差について,一意かつ体系的に検討した。
Epic-Kitchens-100, YouCook2, MSR-VTTデータセットについて, 因果脱バイアス法を提案し, 広範な実験およびアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-09-17T15:58:27Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Contrastive Learning for Neural Topic Model [14.65513836956786]
敵対的トピックモデル(ATM)は、文書を別の異なるサンプルと区別することで、文書の意味パターンをうまくキャプチャすることができる。
最適化問題として識別目標を再定式化するための新しい手法を提案し,新しいサンプリング手法を設計する。
実験の結果、我々のフレームワークは3つの一般的なベンチマークデータセットにおいて、他の最先端のニューラルトピックモデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-10-25T09:46:26Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。