論文の概要: Minuteman: Machine and Human Joining Forces in Meeting Summarization
- arxiv url: http://arxiv.org/abs/2309.05272v1
- Date: Mon, 11 Sep 2023 07:10:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 13:28:00.909173
- Title: Minuteman: Machine and Human Joining Forces in Meeting Summarization
- Title(参考訳): Minuteman: 会議要約における機械と人間の接合力
- Authors: Franti\v{s}ek Kmje\v{c}, Ond\v{r}ej Bojar
- Abstract要約: 本稿では,効率的なセミオートマチックミーティングを実現するための新しいツールを提案する。
このツールは、ユーザーが共同で編集できるライブの書き起こしとライブミーティングの要約を提供する。
結果として得られたアプリケーションは、メモ係の認知的負荷を緩和し、ミーティングの一部が欠席したり、焦点が合わなかったりして、簡単に追いつくことができる。
- 参考スコア(独自算出の注目度): 2.900810893770134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many meetings require creating a meeting summary to keep everyone up to date.
Creating minutes of sufficient quality is however very cognitively demanding.
Although we currently possess capable models for both audio speech recognition
(ASR) and summarization, their fully automatic use is still problematic. ASR
models frequently commit errors when transcribing named entities while the
summarization models tend to hallucinate and misinterpret the transcript. We
propose a novel tool -- Minuteman -- to enable efficient semi-automatic meeting
minuting. The tool provides a live transcript and a live meeting summary to the
users, who can edit them in a collaborative manner, enabling correction of ASR
errors and imperfect summary points in real time. The resulting application
eases the cognitive load of the notetakers and allows them to easily catch up
if they missed a part of the meeting due to absence or a lack of focus. We
conduct several tests of the application in varied settings, exploring the
worthiness of the concept and the possible user strategies.
- Abstract(参考訳): 多くの会議は、全員を最新に保つために会議概要を作成する必要がある。
しかし、十分な品質の分を作ることは非常に認知的に要求される。
現在我々は音声音声認識(ASR)と要約の両方に有能なモデルを持っていますが、その完全自動使用には問題があります。
ASRモデルは名前のエンティティを翻訳する際に頻繁にエラーを犯すが、要約モデルはその転写を幻覚し誤解釈する傾向がある。
我々は,効率的な半自動ミーティングミナットを可能にする新しいツール,Minutemanを提案する。
このツールは、ユーザに対してライブの書き起こしとライブミーティングのサマリーを提供し、共同で編集することができ、asrエラーの修正と不完全なサマリーポイントをリアルタイムで行うことができる。
結果として得られたアプリケーションは、メモ係の認知的負荷を緩和し、ミーティングの一部が欠席したり、焦点が合わなかったりして、簡単に追いつくことができる。
アプリケーションのさまざまな設定でいくつかのテストを実施し、概念の価値とユーザ戦略を探求します。
関連論文リスト
- Predictive Speech Recognition and End-of-Utterance Detection Towards Spoken Dialog Systems [55.99999020778169]
本稿では,次の単語を予測し,発話終了まで残される時間を推定する機能について検討する。
我々は,音響情報と言語情報の両方を組み込んだクロスアテンションに基づくアルゴリズムを開発した。
その結果,提案モデルでは,提案する単語を予測し,将来のEOUイベントを実際のEOUより300ミリ秒前まで推定する能力を示した。
論文 参考訳(メタデータ) (2024-09-30T06:29:58Z) - What's Wrong? Refining Meeting Summaries with LLM Feedback [6.532478490187084]
本稿では,人間レビュープロセスを模倣した2段階プロセスを用いて,会議要約のためのマルチLLM補正手法を提案する。
QMSum Mistakeは、人によって注釈付けされた会議要約を9種類のエラータイプで自動生成する200のデータセットである。
特定ミスを実用的なフィードバックに変換することで,関連性,情報性,簡潔性,一貫性によって測定された要約の質を向上させる。
論文 参考訳(メタデータ) (2024-07-16T17:10:16Z) - PRoDeliberation: Parallel Robust Deliberation for End-to-End Spoken Language Understanding [44.77985942208969]
PRoDeliberationは、コネクショニストの時間分類に基づくデコード戦略を活用する新しい手法であり、堅牢な非自己回帰的デリベレーションモデルをトレーニングするための認知的目標である。
PRoDeliberationは,自動音声認識(ASR)の誤り書き起こしを補正する能力を維持しつつ,並列デコーディングの遅延低減(自己回帰モデルよりも2~10倍改善)を実現していることを示す。
論文 参考訳(メタデータ) (2024-06-12T02:46:17Z) - From Instructions to Constraints: Language Model Alignment with
Automatic Constraint Verification [70.08146540745877]
NLPタスクの共通制約を調査し、それらの引数の型に基づいて、それらを3つのクラスに分類する。
本稿では,ACT(ConsTraintsのアラインメント)という統合フレームワークを提案し,制約に適応したユーザアライメントのための監視信号を自動的に生成する。
論文 参考訳(メタデータ) (2024-03-10T22:14:54Z) - Summaries, Highlights, and Action items: Design, implementation and evaluation of an LLM-powered meeting recap system [30.35387091657807]
対話要約のための大規模言語モデル(LLM)は、ミーティングの体験を改善する可能性がある。
この可能性にもかかわらず、長い書き起こしと、ユーザのコンテキストに基づいて多様なリキャップニーズをキャプチャできないため、技術的な制限に直面している。
本研究では,対話要約による表現をビルディングブロックとして運用するシステムを開発した。
論文 参考訳(メタデータ) (2023-07-28T20:25:11Z) - A Sliding-Window Approach to Automatic Creation of Meeting Minutes [66.39584679676817]
会議の議事録には、議論された問題、決定、会議での行動が記録されている。
会議時間の自動生成のためのスライディングウインドウ手法を提案する。
長い写本や文書構造の欠如など、発話テキストの性質に関連する問題に取り組むことを目指しています。
論文 参考訳(メタデータ) (2021-04-26T02:44:14Z) - Knowledge Distillation for Improved Accuracy in Spoken Question
Answering [63.72278693825945]
我々は,音声文書や書面文書から知識蒸留を行うための訓練戦略を考案した。
我々の研究は、言語モデルから知識の抽出を監督信号として進めている。
実験により,本手法はSpken-SQuADデータセット上で,最先端の言語モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2020-10-21T15:18:01Z) - Improving Readability for Automatic Speech Recognition Transcription [50.86019112545596]
我々は、可読性のためのASRポストプロセッシング(APR)と呼ばれる新しいNLPタスクを提案する。
APRは、ノイズの多いASR出力を、話者の意味を保ちながら、人間や下流タスクのための読みやすいテキストに変換することを目的としている。
我々は,いくつかのオープンソースモデルと適応型事前学習モデルに基づく微調整モデルと,従来のパイプライン手法との比較を行った。
論文 参考訳(メタデータ) (2020-04-09T09:26:42Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。