論文の概要: Using BERT Embeddings to Model Word Importance in Conversational
Transcripts for Deaf and Hard of Hearing Users
- arxiv url: http://arxiv.org/abs/2206.12368v1
- Date: Fri, 24 Jun 2022 16:35:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-27 12:57:22.991033
- Title: Using BERT Embeddings to Model Word Importance in Conversational
Transcripts for Deaf and Hard of Hearing Users
- Title(参考訳): BERT埋め込みを用いた難聴者における会話文における単語の重要性のモデル化
- Authors: Akhter Al Amin, Saad Hassan, Cecilia O. Alm, Matt Huenerfauth
- Abstract要約: 聴覚障害や聴覚障害は、生放送中はキャプションに頼っている。
テレビ放送のキャプションの評価は、様々なキャプション評価指標を用いて規制当局によって評価される。
テキスト中の単語の相対的重要性を考慮に入れたキャプション評価指標を構築する必要がある。
- 参考スコア(独自算出の注目度): 14.45228936875838
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deaf and hard of hearing individuals regularly rely on captioning while
watching live TV. Live TV captioning is evaluated by regulatory agencies using
various caption evaluation metrics. However, caption evaluation metrics are
often not informed by preferences of DHH users or how meaningful the captions
are. There is a need to construct caption evaluation metrics that take the
relative importance of words in a transcript into account. We conducted
correlation analysis between two types of word embeddings and human-annotated
labeled word-importance scores in existing corpus. We found that normalized
contextualized word embeddings generated using BERT correlated better with
manually annotated importance scores than word2vec-based word embeddings. We
make available a pairing of word embeddings and their human-annotated
importance scores. We also provide proof-of-concept utility by training word
importance models, achieving an F1-score of 0.57 in the 6-class word importance
classification task.
- Abstract(参考訳): 聴覚障害者や聴覚障害者は、ライブテレビを見ながらキャプションに頼っている。
各種キャプション評価指標を用いて、規制当局によるライブテレビキャプションの評価を行う。
しかし、キャプション評価の指標は、DHHユーザの好みや、キャプションがどれほど意味のあるものであるかによって通知されないことが多い。
テキスト中の単語の相対的重要性を考慮に入れたキャプション評価指標を構築する必要がある。
既存のコーパスにおける2種類の単語埋め込みとラベル付き単語インポータンススコアの相関分析を行った。
その結果,BERTを用いた正規化単語埋め込みは,ワード2vecに基づく単語埋め込みよりも,手作業による重要度スコアとよく相関していることがわかった。
単語埋め込みのペアリングと,その人による重要度スコアを提供する。
また,単語重要度モデルを訓練し,単語重要度分類タスクで0.57のf1スコアを達成することにより,概念実証の有用性を提供する。
関連論文リスト
- Context Does Matter: Implications for Crowdsourced Evaluation Labels in Task-Oriented Dialogue Systems [57.16442740983528]
クラウドソースラベルは、タスク指向の対話システムを評価する上で重要な役割を果たす。
従来の研究では、アノテーションプロセスで対話コンテキストの一部だけを使用することが提案されている。
本研究では,対話文脈がアノテーション品質に及ぼす影響について検討する。
論文 参考訳(メタデータ) (2024-04-15T17:56:39Z) - ROUGE-K: Do Your Summaries Have Keywords? [11.393728547335217]
要約における内容関連単語は,効率的な情報伝達において重要な役割を担っている。
極端な要約モデルの既存の評価指標は、要約のキーワードに明確な注意を払わない。
変換器モデルに単語の重要度を組み込むための4つの手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:54:56Z) - PWESuite: Phonetic Word Embeddings and Tasks They Facilitate [37.09948594297879]
音声による単語の埋め込みを構築するために,音声特徴を用いた3つの手法を開発した。
また、過去、現在、将来のメソッドを適切に評価するためのタスクスイートも提供します。
論文 参考訳(メタデータ) (2023-04-05T16:03:42Z) - Benchmarking Evaluation Metrics for Code-Switching Automatic Speech
Recognition [19.763431520942028]
本研究では,人間の判断によるコードスイッチング音声認識仮説のベンチマークデータセットを開発する。
自動仮説の最小化のための明確なガイドラインを定義する。
我々は、アラビア語/英語の方言音声におけるコードスイッチング音声認識結果の人間受容のための最初のコーパスをリリースする。
論文 参考訳(メタデータ) (2022-11-22T08:14:07Z) - Transparent Human Evaluation for Image Captioning [70.03979566548823]
画像キャプションモデルのためのルーリックに基づく人間評価プロトコルを開発した。
人為的キャプションは機械的キャプションよりも著しく高品質であることを示す。
この研究は、画像キャプションのためのより透明な評価プロトコルを促進することを願っている。
論文 参考訳(メタデータ) (2021-11-17T07:09:59Z) - EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained
Embedding Matching [90.98122161162644]
現在のビデオキャプションの指標は、主に参照キャプションと候補キャプションのテキストレベルの比較に基づいている。
EMScore(Embedding Matching-based score)を提案する。
我々は、よく訓練された視覚言語モデルを用いて、EMScore 計算のための視覚的および言語的埋め込みを抽出する。
論文 参考訳(メタデータ) (2021-11-17T06:02:43Z) - Contrastive Semantic Similarity Learning for Image Captioning Evaluation
with Intrinsic Auto-encoder [52.42057181754076]
自動エンコーダ機構とコントラスト表現学習の進歩により,画像キャプションのための学習基準を提案する。
文レベルの表現を学習するための3つのプログレッシブモデル構造を開発する。
実験結果から,提案手法は他の指標から得られるスコアとよく一致できることが示唆された。
論文 参考訳(メタデータ) (2021-06-29T12:27:05Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Intrinsic Image Captioning Evaluation [53.51379676690971]
I2CE(Intrinsic Image Captioning Evaluation)と呼ばれる画像キャプションのための学習ベースメトリクスを提案する。
実験の結果,提案手法は頑健な性能を維持し,意味的類似表現やアライメントの少ない意味論に遭遇した場合,候補キャプションに対してより柔軟なスコアを与えることができた。
論文 参考訳(メタデータ) (2020-12-14T08:36:05Z) - Interactive Re-Fitting as a Technique for Improving Word Embeddings [0.0]
我々は,単語の集合を互いに近づけることで,単語の埋め込み空間の一部を調整できるようにする。
提案手法では,単語埋め込みにおける潜在的なバイアスをユーザが操作する際,選択的な後処理をトリガーし,評価することができる。
論文 参考訳(メタデータ) (2020-09-30T21:54:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。