論文の概要: Exploring Semi-Supervised Learning for Predicting Listener Backchannels
- arxiv url: http://arxiv.org/abs/2101.01899v1
- Date: Wed, 6 Jan 2021 07:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 07:07:56.068847
- Title: Exploring Semi-Supervised Learning for Predicting Listener Backchannels
- Title(参考訳): 半教師付き学習によるリスナーバックチャネルの予測
- Authors: Vidit Jain, Maitree Leekha, Rajiv Ratn Shah, Jainendra Shukla
- Abstract要約: バックチャネルを同定するプロセスを自動化するために,セミスーパーバイザー技術を用いて提案する。
実験の結果,60%の被験者が,提案モデルが予測したバックチャネル応答をより自然なものであることがわかった。
- 参考スコア(独自算出の注目度): 35.867776597496494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing human-like conversational agents is a prime area in HCI research
and subsumes many tasks. Predicting listener backchannels is one such
actively-researched task. While many studies have used different approaches for
backchannel prediction, they all have depended on manual annotations for a
large dataset. This is a bottleneck impacting the scalability of development.
To this end, we propose using semi-supervised techniques to automate the
process of identifying backchannels, thereby easing the annotation process. To
analyze our identification module's feasibility, we compared the backchannel
prediction models trained on (a) manually-annotated and (b) semi-supervised
labels. Quantitative analysis revealed that the proposed semi-supervised
approach could attain 95% of the former's performance. Our user-study findings
revealed that almost 60% of the participants found the backchannel responses
predicted by the proposed model more natural. Finally, we also analyzed the
impact of personality on the type of backchannel signals and validated our
findings in the user-study.
- Abstract(参考訳): 人間のような会話エージェントの開発は、HCI研究の主要な領域であり、多くのタスクを仮定している。
リスナーのバックチャネルを予測することは、このような活発に調査されたタスクである。
多くの研究はバックチャネル予測に異なるアプローチを用いたが、それらはすべて大規模なデータセットの手動アノテーションに依存している。
これは開発のスケーラビリティに影響を与えるボトルネックです。
そこで本研究では,半教師付き手法を用いてバックチャネルの識別プロセスを自動化することにより,アノテーションプロセスの緩和を提案する。
識別モジュールの実現可能性を分析するために, (a) 手動アノテーションラベルと (b) セミ教師付きラベルでトレーニングされたバックチャネル予測モデルを比較した。
定量的解析により,提案手法は前者のパフォーマンスの95%を達成することができた。
実験の結果,60%の被験者が,提案モデルが予測したバックチャネル応答をより自然なものであることがわかった。
最後に,バックチャネル信号のタイプに対するパーソナリティの影響を分析し,ユーザ調査の結果を検証した。
関連論文リスト
- A Statistical Framework for Data-dependent Retrieval-Augmented Models [46.781026675083254]
最新のMLシステムは、最終的な予測を強化するために、追加の関連情報によって入力インスタンスを増大させる。
本研究では,1)データ依存メトリックを用いて大規模コーパスから関連する情報を識別するエム検索器,2)検索した情報とともに入力インスタンスを消費し最終的な予測を行うエム予測器,の2つのコンポーネントを用いたモデルについて検討する。
論文 参考訳(メタデータ) (2024-08-27T20:51:06Z) - Discussion: Effective and Interpretable Outcome Prediction by Training Sparse Mixtures of Linear Experts [4.178382980763478]
我々は,ゲートと専門家のサブネットの両方がロジスティック回帰器である,スパースミクチャー・オブ・エキスパートを訓練することを提案する。
このアンサンブルのようなモデルは、各サブネット内の入力機能のサブセットを自動的に選択しながら、エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2024-07-18T13:59:10Z) - Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning [50.809769498312434]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文 参考訳(メタデータ) (2023-11-22T03:45:30Z) - Phonetic and Prosody-aware Self-supervised Learning Approach for
Non-native Fluency Scoring [13.817385516193445]
音声と韻律の特徴を解析することにより、音声の流速/拡散を評価することができる。
ディープ・ニューラル・ネットワークは一般に、流感に関連した特徴を人間のスコアにマッピングするように訓練されている。
本稿では,流音評価のための音声と韻律の認識を考慮した自己教師付き学習(SSL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T05:39:41Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Explain, Edit, and Understand: Rethinking User Study Design for
Evaluating Model Explanations [97.91630330328815]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。
単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文 参考訳(メタデータ) (2021-12-17T18:29:56Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Layer-wise Analysis of a Self-supervised Speech Representation Model [26.727775920272205]
自己教師付き学習アプローチは、音声表現モデルの事前学習に成功している。
事前訓練された表現そのものに符号化された情報のタイプや範囲についてはあまり研究されていない。
論文 参考訳(メタデータ) (2021-07-10T02:13:25Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - UmBERTo-MTSA @ AcCompl-It: Improving Complexity and Acceptability
Prediction with Multi-task Learning on Self-Supervised Annotations [0.0]
本研究は,ラベル付きデータの適度な使用量のみの学習モデルの性能向上に使用される,自己教師型データ拡張手法について述べる。
神経言語モデルは、EVALITA 2020におけるAcCompl-it共有タスクのコンテキストにおいて、この手順を用いて微調整される。
論文 参考訳(メタデータ) (2020-11-10T15:50:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。