論文の概要: TR-EduVSum: A Turkish-Focused Dataset and Consensus Framework for Educational Video Summarization
- arxiv url: http://arxiv.org/abs/2604.07553v1
- Date: Wed, 08 Apr 2026 19:53:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.534365
- Title: TR-EduVSum: A Turkish-Focused Dataset and Consensus Framework for Educational Video Summarization
- Title(参考訳): TR-EduVSum:教育ビデオ要約のためのトルコ語によるデータセットと合意フレームワーク
- Authors: Figen Eğin, Aytuğ Onan,
- Abstract要約: 本研究では,トルコの教育ビデオの人間の要約に基づいて,ゴールド・スタンダード・サマリーを完全自動かつ再現的に生成する枠組みを提案する。
研究の範囲内では、82のトルコのコースビデオを含むTR-EduVSumと呼ばれる新しいデータセットが作成された。
提案されたアプローチは、低コストで他のテュルク諸語に一般化することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study presents a framework for generating the gold-standard summary fully automatically and reproducibly based on multiple human summaries of Turkish educational videos. Within the scope of the study, a new dataset called TR-EduVSum was created, encompassing 82 Turkish course videos in the field of "Data Structures and Algorithms" and containing a total of 3281 independent human summaries. Inspired by existing pyramid-based evaluation approaches, the AutoMUP (Automatic Meaning Unit Pyramid) method is proposed, which extracts consensus-based content from multiple human summaries. AutoMUP clusters the meaning units extracted from human summaries using embedding, statistically models inter-participant agreement, and generates graded summaries based on consensus weight. In this framework, the gold summary corresponds to the highest-consensus AutoMUP configuration, constructed from the most frequently supported meaning units across human summaries. Experimental results show that AutoMUP summaries exhibit high semantic overlap with robust LLM (Large Language Model) summaries such as Flash 2.5 and GPT-5.1. Furthermore, ablation studies clearly demonstrate the decisive role of consensus weight and clustering in determining summary quality. The proposed approach can be generalized to other Turkic languages at low cost.
- Abstract(参考訳): 本研究では,トルコの教育ビデオの複数の要約に基づいて,ゴールド・スタンダード・サマリーを完全自動かつ再現的に生成する枠組みを提案する。
研究の範囲内では、TR-EduVSumと呼ばれる新しいデータセットが作成され、「データ構造とアルゴリズム」の分野における82のトルコのコースビデオを含み、合計3281の独立した人間の要約を含んでいる。
既存のピラミッドに基づく評価手法から着想を得たAutoMUP法(Automatic Meaning Unit Pyramid)を提案する。
AutoMUPは、埋め込みを用いて人間の要約から抽出された意味単位をクラスタリングし、統計的に参加者間の合意をモデル化し、コンセンサス重みに基づいて段階的な要約を生成する。
この枠組みでは、金の要約は、人間の要約にまたがる最も頻繁に支持される意味単位から構築される、最高合意のAutoMUP構成に対応する。
実験の結果,AutoMUP要約は Flash 2.5 や GPT-5.1 などの堅牢な LLM (Large Language Model) 要約と高いセマンティックオーバーラップを示すことがわかった。
さらに、アブレーション研究は、要約品質の決定におけるコンセンサス重みとクラスタリングの決定的な役割を明らかに示している。
提案されたアプローチは、低コストで他のテュルク諸語に一般化することができる。
関連論文リスト
- Majority Rules: LLM Ensemble is a Winning Approach for Content Categorization [0.0]
本研究では,大規模言語モデル(LLM)を用いた非構造化テキスト分類のためのアンサンブルフレームワークを提案する。
複数のモデルを統合することで、アンサンブル大言語モデル(eLLM)フレームワークは個々のシステムの共通の弱点に対処する。
eLLMは人間の専門レベルに近いパフォーマンスを実現し、分類に基づく分類のためのスケーラブルで信頼性の高いソリューションを提供する。
論文 参考訳(メタデータ) (2025-11-11T05:10:09Z) - A Large-Scale Dataset and Citation Intent Classification in Turkish with LLMs [0.0]
まず、トルコ語による引用意図のデータセットを公開し、目的付けのアノテーションツールで作成する。
次に,Large Language Models (LLMs) を用いた標準インコンテキスト学習の性能評価を行い,手動で設計したプロンプトによる一貫性のない結果によってその効果が制限されることを示した。
最終分類には、複数の最適化されたモデルから出力を集約し、安定かつ信頼性の高い予測を保証するために、重ねられた一般化アンサンブルを用いる。
論文 参考訳(メタデータ) (2025-09-26T05:44:04Z) - Consistency Evaluation of News Article Summaries Generated by Large (and Small) Language Models [0.0]
大言語モデル (LLMs) は、流動的な抽象的な要約を生成することを約束しているが、ソーステキストに基づかない幻覚的な詳細を生成することができる。
本稿では,TextRank,BART,Mistral-7B-Instruct,OpenAI GPT-3.5-Turboなど,さまざまな手法を用いてテキスト要約の探索を行う。
XL-Sumデータセットでテストすると,すべての要約モデルが一貫した要約を生成することがわかった。
論文 参考訳(メタデータ) (2025-02-28T01:58:17Z) - Personalized Video Summarization using Text-Based Queries and Conditional Modeling [3.4447129363520337]
この論文は、テキストベースのクエリと条件付きモデリングを統合することで、ビデオ要約の強化を探求する。
精度やF1スコアなどの評価指標は、生成された要約の品質を評価する。
論文 参考訳(メタデータ) (2024-08-27T02:43:40Z) - Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文 参考訳(メタデータ) (2024-07-05T20:25:04Z) - Information-Theoretic Distillation for Reference-less Summarization [67.51150817011617]
本稿では,要約のための情報理論的目的に基づいて,強力な要約器を蒸留する新しい枠組みを提案する。
我々は,教師モデルとしてPythia-2.8Bから出発する。
我々は,ChatGPTと競合する5億8800万のパラメータしか持たないコンパクトだが強力な要約器に到達した。
論文 参考訳(メタデータ) (2024-03-20T17:42:08Z) - Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - AugSumm: towards generalizable speech summarization using synthetic
labels from large language model [61.73741195292997]
抽象音声要約(SSUM)は、音声から人間に似た要約を生成することを目的としている。
従来のSSUMモデルは、主に、人間による注釈付き決定論的要約(英語版)を用いて訓練され、評価されている。
AugSummは,人間のアノテータが拡張要約を生成するためのプロキシとして,大規模言語モデル(LLM)を利用する手法である。
論文 参考訳(メタデータ) (2024-01-10T18:39:46Z) - SummEval: Re-evaluating Summarization Evaluation [169.622515287256]
総合的かつ一貫した方法で14の自動評価指標を再評価する。
上記の自動評価指標を用いて,最近の要約モデル23をベンチマークした。
我々は、CNN/DailyMailニュースデータセットでトレーニングされたモデルによって生成された最大の要約コレクションを組み立てる。
論文 参考訳(メタデータ) (2020-07-24T16:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。