論文の概要: STEM: Unsupervised STructural EMbedding for Stance Detection
- arxiv url: http://arxiv.org/abs/2112.00712v1
- Date: Wed, 1 Dec 2021 18:43:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 13:36:13.024833
- Title: STEM: Unsupervised STructural EMbedding for Stance Detection
- Title(参考訳): STEM:ステンス検出のための教師なし構造EMベディング
- Authors: Ron Korenblum Pick, Vladyslav Kozhukhov, Dan Vilenchik, Oren Tsur
- Abstract要約: スタンス検出は重要なタスクであり、偽ニュース、噂、科学否定の伝播を解析しモデル化するなど、下流の多くのタスクをサポートする。
本稿では,スタンス検出のための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.7646713951724011
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Stance detection is an important task, supporting many downstream tasks such
as discourse parsing and modeling the propagation of fake news, rumors, and
science denial. In this paper, we propose a novel framework for stance
detection. Our framework is unsupervised and domain-independent. Given a claim
and a multi-participant discussion - we construct the interaction network from
which we derive topological embeddings for each speaker. These speaker
embeddings enjoy the following property: speakers with the same stance tend to
be represented by similar vectors, while antipodal vectors represent speakers
with opposing stances. These embeddings are then used to divide the speakers
into stance-partitions. We evaluate our method on three different datasets from
different platforms. Our method outperforms or is comparable with supervised
models while providing confidence levels for its output. Furthermore, we
demonstrate how the structural embeddings relate to the valence expressed by
the speakers. Finally, we discuss some limitations inherent to the framework.
- Abstract(参考訳): スタンス検出は重要なタスクであり、偽ニュース、噂、科学否定の伝播を解析しモデル化するといった下流タスクの多くをサポートする。
本稿では,姿勢検出のための新しい枠組みを提案する。
私たちのフレームワークは教師なしで、ドメイン非依存です。
クレームと多人数ディスカッションが与えられた場合、各話者に対するトポロジカルな埋め込みを導出する相互作用ネットワークを構築します。
これらの話者埋め込みは以下の性質を享受する:同じ姿勢の話者は類似したベクトルで表される傾向があり、反ポッドベクトルは反対の姿勢の話者を表す。
これらの埋め込みは、話者をスタンス分割に分割するために使われる。
提案手法は,異なるプラットフォームから3つの異なるデータセットで評価する。
提案手法は,その出力に対する信頼性レベルを提供しながら,教師付きモデルに匹敵する性能を有する。
さらに,構造埋め込みが話者が表現した価数とどのように関連しているかを示す。
最後に、フレームワーク固有のいくつかの制限について議論する。
関連論文リスト
- Residual Information in Deep Speaker Embedding Architectures [4.619541348328938]
本稿では,最新の高性能DNNアーキテクチャを用いて抽出した6組の話者埋め込みについて解析する。
データセットには46人の話者が同じプロンプトを発信し、プロのスタジオや自宅の環境に記録されている。
その結果、解析された埋め込みの識別力は非常に高いが、分析された全てのアーキテクチャにおいて、残余情報は依然として表現の中に存在することがわかった。
論文 参考訳(メタデータ) (2023-02-06T12:37:57Z) - SepIt: Approaching a Single Channel Speech Separation Bound [99.19786288094596]
我々は、異なる話者の推定を反復的に改善するディープニューラルネットワーク、SepItを導入する。
幅広い実験において、SepItは2, 3, 5, 10人の話者に対して最先端のニューラルネットワークより優れている。
論文 参考訳(メタデータ) (2022-05-24T05:40:36Z) - Self-supervised Speaker Diarization [19.111219197011355]
本研究では、話者ダイアリゼーションのための教師なしディープラーニングモデルを提案する。
話者埋め込みは、同一話者と推定される隣接セグメントのペアを使用して、自己教師付きで訓練されたエンコーダによって表現される。
論文 参考訳(メタデータ) (2022-04-08T16:27:14Z) - Analysis of Joint Speech-Text Embeddings for Semantic Matching [3.6423306784901235]
ペア音声と書き起こし入力の距離を最小化することにより,セマンティックマッチングのために訓練された共同音声テキスト埋め込み空間について検討する。
我々は,事前学習とマルチタスクの両方のシナリオを通じて,音声認識を組み込む方法を拡張した。
論文 参考訳(メタデータ) (2022-04-04T04:50:32Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - Preliminary study on using vector quantization latent spaces for TTS/VC
systems with consistent performance [55.10864476206503]
本稿では,潜在言語埋め込みをモデル化するための量子化ベクトルの利用について検討する。
トレーニングにおいて、潜伏空間上の異なるポリシーを強制することにより、潜伏言語埋め込みを得ることができる。
実験の結果,ベクトル量子化法で構築した音声クローニングシステムは,知覚的評価の点でわずかに劣化していることがわかった。
論文 参考訳(メタデータ) (2021-06-25T07:51:35Z) - U-vectors: Generating clusterable speaker embedding from unlabeled data [0.0]
本稿では,未ラベルデータを扱う話者認識戦略を提案する。
小さな固定サイズの音声フレームからクラスタブルな埋め込みベクトルを生成する。
提案手法はペアワイズアーキテクチャを用いて優れた性能を実現する。
論文 参考訳(メタデータ) (2021-02-07T18:00:09Z) - Self-supervised Text-independent Speaker Verification using Prototypical
Momentum Contrastive Learning [58.14807331265752]
モーメントの対比学習によって話者埋め込みがより良く学習できることを示す。
自己監視フレームワークを、データのごく一部しかラベル付けされない半監視シナリオに一般化します。
論文 参考訳(メタデータ) (2020-12-13T23:23:39Z) - Filling the Gap of Utterance-aware and Speaker-aware Representation for
Multi-turn Dialogue [76.88174667929665]
マルチターン対話は、2つ以上の異なる話者の役割から複数の発話からなる。
既存の検索に基づくマルチターン対話モデルでは、事前訓練された言語モデル(PrLM)をエンコーダとして、対話を粗く表現する。
本稿では,対話履歴に係わる効果的な発話認識表現と話者認識表現をモデル化することにより,そのようなギャップを埋める新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-09-14T15:07:19Z) - Active Speakers in Context [88.22935329360618]
能動話者検出のための現在の手法は、単一話者からの短期音声視覚情報をモデル化することに焦点を当てている。
本稿では,複数話者間の関係を長期にわたってモデル化する新しい表現であるActive Speaker Contextを紹介する。
実験の結果,構造的特徴アンサンブルはすでにアクティブな話者検出性能の恩恵を受けていることがわかった。
論文 参考訳(メタデータ) (2020-05-20T01:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。