論文の概要: Learning to Emphasize: Dataset and Shared Task Models for Selecting
Emphasis in Presentation Slides
- arxiv url: http://arxiv.org/abs/2101.03237v1
- Date: Sat, 2 Jan 2021 06:54:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 07:18:02.533715
- Title: Learning to Emphasize: Dataset and Shared Task Models for Selecting
Emphasis in Presentation Slides
- Title(参考訳): 強調する学習:プレゼンテーションスライドにおける強調選択のためのデータセットと共有タスクモデル
- Authors: Amirreza Shirani, Giai Tran, Hieu Trinh, Franck Dernoncourt, Nedim
Lipka, Paul Asente, Jose Echevarria, and Thamar Solorio
- Abstract要約: プレゼンテーションスライドで強力なリードワードを強調することで、聴衆はスライド全体を読むのではなく、特定の焦点に目を向けることができる。
この要求に動機づけられて、プレゼンテーションスライドにおける強調選択(ES)の問題を研究します。
クラウドソーシングされた設定で強調語で注釈付けされた、さまざまなトピックを備えたプレゼンテーションスライドを含む新しいデータセットを紹介します。
- 参考スコア(独自算出の注目度): 31.540208729354354
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Presentation slides have become a common addition to the teaching material.
Emphasizing strong leading words in presentation slides can allow the audience
to direct the eye to certain focal points instead of reading the entire slide,
retaining the attention to the speaker during the presentation. Despite a large
volume of studies on automatic slide generation, few studies have addressed the
automation of design assistance during the creation process. Motivated by this
demand, we study the problem of Emphasis Selection (ES) in presentation slides,
i.e., choosing candidates for emphasis, by introducing a new dataset containing
presentation slides with a wide variety of topics, each is annotated with
emphasis words in a crowdsourced setting. We evaluate a range of
state-of-the-art models on this novel dataset by organizing a shared task and
inviting multiple researchers to model emphasis in this new domain. We present
the main findings and compare the results of these models, and by examining the
challenges of the dataset, we provide different analysis components.
- Abstract(参考訳): プレゼンテーションスライドは教材に共通する付加物となっている。
プレゼンテーションスライドで強力なリードワードを強調することで、聴衆はスライド全体を読むのではなく、特定の焦点に目を向けることができ、プレゼンテーション中にスピーカーに注意を向けることができます。
自動スライド生成に関する多くの研究にもかかわらず、作成過程における設計支援の自動化に関する研究はほとんどない。
この需要に動機づけられ、プレゼンテーションスライドにおける強調選択(es)の問題、すなわち強調する候補を選ぶ問題を、様々なトピックのプレゼンテーションスライドを含む新しいデータセットを導入し、クラウドソースされた設定で強調語をアノテートする。
共有タスクを編成し、複数の研究者にこの新しい領域に重きを置くように促すことにより、この新しいデータセットに関する最先端のモデルの範囲を評価した。
本研究は,これらのモデルの主な知見を提示し,それらの結果を比較し,データセットの課題を調べることにより,異なる分析成分を提供する。
関連論文リスト
- Corpus Considerations for Annotator Modeling and Scaling [9.263562546969695]
一般的に使われているユーザトークンモデルは、より複雑なモデルよりも一貫して優れています。
以上の結果から,コーパス統計とアノテータモデリング性能の関係が明らかになった。
論文 参考訳(メタデータ) (2024-04-02T22:27:24Z) - Prompting Large Language Models for Topic Modeling [10.31712610860913]
大規模言語モデル(LLM)の高度な言語理解を活用する新しいトピックモデリング手法であるPromptTopicを提案する。
個々の文書から文章レベルでトピックを抽出し、これらのトピックを事前定義された量に集約して凝縮し、最終的に様々な長さのテキストに対して一貫性のあるトピックを提供する。
PromptTopicを3つの非常に多様なデータセットの最先端のベースラインに対してベンチマークし、意味のあるトピックを発見する能力を確立しました。
論文 参考訳(メタデータ) (2023-12-15T11:15:05Z) - Visual Analytics for Efficient Image Exploration and User-Guided Image
Captioning [35.47078178526536]
事前訓練された大規模言語画像モデルの最近の進歩は、視覚的理解の新しい時代を後押ししている。
本稿では,視覚分析の領域でよく知られた2つの問題に取り組み,(1)大規模画像データセットの効率的な探索と潜在的なデータバイアスの同定,(2)画像キャプションの評価と生成過程のステアリングを行う。
論文 参考訳(メタデータ) (2023-11-02T06:21:35Z) - SINC: Self-Supervised In-Context Learning for Vision-Language Tasks [64.44336003123102]
大規模言語モデルにおけるコンテキスト内学習を実現するためのフレームワークを提案する。
メタモデルは、カスタマイズされたデモからなる自己教師型プロンプトで学ぶことができる。
実験の結果、SINCは様々な視覚言語タスクにおいて勾配に基づく手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-15T08:33:08Z) - Multi-View Class Incremental Learning [57.14644913531313]
マルチビュー学習(MVL)は、下流タスクのパフォーマンスを改善するためにデータセットの複数の視点から情報を統合することで大きな成功を収めている。
本稿では,複数視点クラスインクリメンタルラーニング(MVCIL)と呼ばれる新しいパラダイムについて考察する。
論文 参考訳(メタデータ) (2023-06-16T08:13:41Z) - Exploring Effective Factors for Improving Visual In-Context Learning [56.14208975380607]
In-Context Learning(ICL)は、いくつかのデモ(別名プロンプト)を通じて新しいタスクを理解し、モデルをチューニングせずに新しい入力を予測することである。
本稿では,視覚的文脈学習の推論性能に直接的な影響を及ぼす要因として,迅速な選択と迅速な融合があげられる。
視覚的インコンテキスト学習のためのシンプルなフレームワークプロンプトSelFを提案する。
論文 参考訳(メタデータ) (2023-04-10T17:59:04Z) - Topic-Selective Graph Network for Topic-Focused Summarization [0.0]
トピック弧認識とトピック選択グラフネットワークを提案する。
第一に、トピック・アーク認識の目的は、モデルのトピックを識別する能力を持つ訓練をモデル化するために使用される。
トピック選択グラフネットワークは、トピックアーク認識の結果に基づいて、文に対してトピック誘導のクロスインタラクションを行うことができる。
論文 参考訳(メタデータ) (2023-02-25T15:56:06Z) - Multimodal Lecture Presentations Dataset: Understanding Multimodality in
Educational Slides [57.86931911522967]
学習内容のマルチモーダル理解における機械学習モデルの能力を検証する。
このデータセットには,180時間以上のビデオと9000時間以上のスライドが,各科目から10人の講師が参加している。
マルチモーダル・トランスフォーマーであるPolyViLTを導入する。
論文 参考訳(メタデータ) (2022-08-17T05:30:18Z) - Topic Discovery via Latent Space Clustering of Pretrained Language Model
Representations [35.74225306947918]
本研究では, PLM 埋め込みを基盤とした空間学習とクラスタリングの連携フレームワークを提案する。
提案モデルでは,トピック発見のためにPLMがもたらす強力な表現力と言語的特徴を効果的に活用する。
論文 参考訳(メタデータ) (2022-02-09T17:26:08Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Let Me Choose: From Verbal Context to Font Selection [50.293897197235296]
フォントの視覚的属性と典型的に適用されるテキストの言語的文脈との関係を学習することを目的としている。
我々は、クラウドソーシングを通じてラベル付けされたソーシャルメディア投稿や広告で、さまざまなトピックの例を含む、新しいデータセットを紹介した。
論文 参考訳(メタデータ) (2020-05-03T17:36:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。