論文の概要: Topical Segmentation of Spoken Narratives: A Test Case on Holocaust
Survivor Testimonies
- arxiv url: http://arxiv.org/abs/2210.13783v1
- Date: Tue, 25 Oct 2022 06:02:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 13:28:52.314336
- Title: Topical Segmentation of Spoken Narratives: A Test Case on Holocaust
Survivor Testimonies
- Title(参考訳): 話し言葉の話題セグメンテーション--ホロコースト生存者証言に関するテストケース
- Authors: Eitan Wagner, Renana Keydar, Amit Pinchevski, Omri Abend
- Abstract要約: ランニング(スポーク)ナラティブのセグメンテーションの課題に取り組みます。
テストケースとして,ホロコーストの生存者の証言を英語で記述する。
- 参考スコア(独自算出の注目度): 18.80663780272046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The task of topical segmentation is well studied, but previous work has
mostly addressed it in the context of structured, well-defined segments, such
as segmentation into paragraphs, chapters, or segmenting text that originated
from multiple sources. We tackle the task of segmenting running (spoken)
narratives, which poses hitherto unaddressed challenges. As a test case, we
address Holocaust survivor testimonies, given in English. Other than the
importance of studying these testimonies for Holocaust research, we argue that
they provide an interesting test case for topical segmentation, due to their
unstructured surface level, relative abundance (tens of thousands of such
testimonies were collected), and the relatively confined domain that they
cover. We hypothesize that boundary points between segments correspond to low
mutual information between the sentences proceeding and following the boundary.
Based on this hypothesis, we explore a range of algorithmic approaches to the
task, building on previous work on segmentation that uses generative Bayesian
modeling and state-of-the-art neural machinery. Compared to manually annotated
references, we find that the developed approaches show considerable
improvements over previous work.
- Abstract(参考訳): トピックセグメンテーションのタスクはよく研究されているが、以前の研究では、パラグラフや章、複数のソースから派生したセグメンテーションテキストなど、構造化され、明確に定義されたセグメンテーションの文脈で取り組まれてきた。
我々は,未解決の課題を提起する,実行(spoken)物語のセグメンテーションタスクに取り組む。
テストケースとして,ホロコーストの生存者の証言を英語で記述する。
ホロコースト研究におけるこれらの証言の研究の重要さ以外では、その非構造的表面レベル、相対的存在量(数千の証言が収集された)、比較的限定された領域によって、トピックセグメンテーションの興味深いテストケースを提供していると論じている。
我々は,セグメント間の境界点が,文間の相互情報の低さと境界の追従に対応することを仮定する。
この仮説に基づいて,生成ベイズモデルと最先端ニューラルネットワークを用いたセグメンテーションに関する以前の研究に基づいて,タスクに対するアルゴリズム的アプローチを探究する。
手作業による注釈付き参照と比較すると,開発手法は従来よりも大幅に改善されている。
関連論文リスト
- A Bottom-Up Approach to Class-Agnostic Image Segmentation [4.086366531569003]
本稿では,クラスに依存しないセグメンテーション問題に対処するためのボトムアップの新たな定式化を提案する。
我々は、その特徴空間の射影球に直接ネットワークを監督する。
ボトムアップの定式化は、クラスベースのセグメンテーション用に設計されたデータセットで訓練された場合でも、例外的な一般化能力を示す。
論文 参考訳(メタデータ) (2024-09-20T17:56:02Z) - Image Segmentation in Foundation Model Era: A Survey [99.19456390358211]
イメージセグメンテーションにおける現在の研究は、これらの進歩に関連する特徴、課題、解決策の詳細な分析を欠いている。
本調査は、FM駆動画像セグメンテーションを中心とした最先端の研究を徹底的にレビューすることで、このギャップを埋めようとしている。
現在の研究成果の広さを包括する,300以上のセグメンテーションアプローチの概要を概観する。
論文 参考訳(メタデータ) (2024-08-23T10:07:59Z) - From Text Segmentation to Smart Chaptering: A Novel Benchmark for
Structuring Video Transcriptions [63.11097464396147]
音声コンテンツに焦点をあてた新しいベンチマークYTSegを導入し、その内容は本質的に非構造的であり、トポロジと構造的にも多様である。
また,高効率な階層分割モデルMiniSegを導入する。
論文 参考訳(メタデータ) (2024-02-27T15:59:37Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Betrayed by Captions: Joint Caption Grounding and Generation for Open
Vocabulary Instance Segmentation [80.48979302400868]
オープンな語彙のインスタンスセグメンテーションに注目し、セグメンテーションモデルを拡張して、インスタンスレベルの新しいカテゴリを分類し、セグメンテーションする。
これまでは、画像領域と名詞の字幕間の1対1のマッピングを確立するために、大量の字幕データセットと複雑なパイプラインに頼っていた。
我々は,一致したオブジェクトのみに着目して学習効率を向上させる新しいグラウンドニング損失を取り入れた,共同の textbf Caption Grounding and Generation (CGG) フレームワークを考案した。
論文 参考訳(メタデータ) (2023-01-02T18:52:12Z) - Toward Unifying Text Segmentation and Long Document Summarization [31.084738269628748]
文章・音声文書の抽出要約において,部分分割が果たす役割について検討する。
本手法は,要約とセグメンテーションを同時に行うことによって,頑健な文表現を学習する。
以上の結果から,本モデルは,公開ベンチマーク上での最先端性能を達成できるだけでなく,異種間転送性も向上できることが示唆された。
論文 参考訳(メタデータ) (2022-10-28T22:07:10Z) - A Survey on Label-efficient Deep Segmentation: Bridging the Gap between
Weak Supervision and Dense Prediction [115.9169213834476]
本稿では,ラベル効率の高いセグメンテーション手法について概説する。
まず,様々な種類の弱いラベルによって提供される監督に従って,これらの手法を整理する分類法を開発する。
次に,既存のラベル効率のセグメンテーション手法を統一的な視点から要約する。
論文 参考訳(メタデータ) (2022-07-04T06:21:01Z) - Neural Sequence Segmentation as Determining the Leftmost Segments [25.378188980430256]
自然言語文をセグメントレベルで段階的に分割する新しい枠組みを提案する。
セグメンテーションのすべてのステップにおいて、残りのシーケンスの一番左のセグメントを認識する。
3つのデータセットにまたがる構文的チャンキングと中国語のパート・オブ・スパイチ・タギングに関する広範な実験を行った。
論文 参考訳(メタデータ) (2021-04-15T03:35:03Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。