論文の概要: Unsupervised Topic Segmentation of Meetings with BERT Embeddings
- arxiv url: http://arxiv.org/abs/2106.12978v1
- Date: Thu, 24 Jun 2021 12:54:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 21:30:41.506720
- Title: Unsupervised Topic Segmentation of Meetings with BERT Embeddings
- Title(参考訳): BERT埋め込みを用いた会議の教師なしトピックセグメンテーション
- Authors: Alessandro Solbiati, Kevin Heffernan, Georgios Damaskinos, Shivani
Poddar, Shubham Modi, Jacques Cali
- Abstract要約: 本稿では、事前学習されたニューラルネットワークを用いて、従来の教師なしトピックセグメンテーション手法をどのように改善できるかを示す。
BERT埋め込みに基づく教師なしアプローチを導入し,既存の教師なしアプローチよりも15.5%のエラー率の削減を実現した。
- 参考スコア(独自算出の注目度): 57.91018542715725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topic segmentation of meetings is the task of dividing multi-person meeting
transcripts into topic blocks. Supervised approaches to the problem have proven
intractable due to the difficulties in collecting and accurately annotating
large datasets. In this paper we show how previous unsupervised topic
segmentation methods can be improved using pre-trained neural architectures. We
introduce an unsupervised approach based on BERT embeddings that achieves a
15.5% reduction in error rate over existing unsupervised approaches applied to
two popular datasets for meeting transcripts.
- Abstract(参考訳): 会議のトピックセグメンテーションは、マルチパーソンミーティングの書き起こしをトピックブロックに分割するタスクである。
この問題に対する教師付きアプローチは、大規模なデータセットの収集と正確なアノテートが難しいため、難解であることが証明されている。
本稿では,事前学習されたニューラルネットワークを用いて,従来の教師なしトピックセグメンテーション手法をどのように改善できるかを示す。
2つの人気のあるデータセットに適用される既存の教師なしアプローチよりもエラー率を15.5%削減できるbert埋め込みに基づく教師なしアプローチを導入する。
関連論文リスト
- Embedding And Clustering Your Data Can Improve Contrastive Pretraining [0.0]
我々は、事前訓練されたテキスト埋め込みモデルと古典的なk-meansクラスタリングアルゴリズムを活用することにより、ソースの粒度を超えてトレーニングデータ層を拡大することを検討する。
MSMARCOトランジッション検索データセットからBERTベースのテキスト埋め込みモデルをクエリパスペア上で事前学習する場合,NDCG@10の顕著な増加が観察された。
論文 参考訳(メタデータ) (2024-07-26T17:36:40Z) - Causal Unsupervised Semantic Segmentation [60.178274138753174]
教師なしセマンティックセグメンテーションは、人間のラベル付きアノテーションなしで高品質なセマンティックセマンティックセグメンテーションを実現することを目的としている。
本稿では、因果推論からの洞察を活用する新しいフレームワークCAUSE(CAusal Unsupervised Semantic sEgmentation)を提案する。
論文 参考訳(メタデータ) (2023-10-11T10:54:44Z) - Topic-driven Distant Supervision Framework for Macro-level Discourse
Parsing [72.14449502499535]
テキストの内部修辞構造を解析する作業は、自然言語処理において難しい問題である。
近年のニューラルモデルの発展にもかかわらず、トレーニングのための大規模で高品質なコーパスの欠如は大きな障害となっている。
近年の研究では、遠方の監督を用いてこの制限を克服しようと試みている。
論文 参考訳(メタデータ) (2023-05-23T07:13:51Z) - Reconstruct Before Summarize: An Efficient Two-Step Framework for
Condensing and Summarizing Meeting Transcripts [32.329723001930006]
本稿では,効率的なミーティング要約のための2段階のフレームワークであるReconstruct before Summarize (RbS)を提案する。
RbSは、まず自己管理パラダイムを利用して、ミーティングの書き起こしを再構築することで、本質的な内容に注釈を付ける。
次に,相対的な位置バケット化(RPB)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-13T19:54:46Z) - A Survey on Label-efficient Deep Segmentation: Bridging the Gap between
Weak Supervision and Dense Prediction [115.9169213834476]
本稿では,ラベル効率の高いセグメンテーション手法について概説する。
まず,様々な種類の弱いラベルによって提供される監督に従って,これらの手法を整理する分類法を開発する。
次に,既存のラベル効率のセグメンテーション手法を統一的な視点から要約する。
論文 参考訳(メタデータ) (2022-07-04T06:21:01Z) - Adaptive Affinity Loss and Erroneous Pseudo-Label Refinement for Weakly
Supervised Semantic Segmentation [48.294903659573585]
本稿では,多段階アプローチの親和性学習を単一段階モデルに組み込むことを提案する。
深層ニューラルネットワークは、トレーニングフェーズで包括的なセマンティック情報を提供するために使用される。
提案手法の有効性を評価するため,PASCAL VOC 2012データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-08-03T07:48:33Z) - Bayesian Semi-supervised Crowdsourcing [71.20185379303479]
クラウドソーシングは、大規模なデータセットを効率的にラベル付けし、さまざまな学習タスクを実行するための強力なパラダイムとして登場した。
この研究は、半スーパービジョンの2つの体制の下で、半教師付きクラウドソース分類を扱う。
論文 参考訳(メタデータ) (2020-12-20T23:18:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。