論文の概要: CitiLink-Summ: Summarization of Discussion Subjects in European Portuguese Municipal Meeting Minutes
- arxiv url: http://arxiv.org/abs/2602.16607v1
- Date: Wed, 18 Feb 2026 17:03:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.657806
- Title: CitiLink-Summ: Summarization of Discussion Subjects in European Portuguese Municipal Meeting Minutes
- Title(参考訳): CitiLink-Summ: 欧州ポルトガル市町村会議議事録における議論題の要約
- Authors: Miguel Marques, Ana Luísa Fernandes, Ana Filipa Pacheco, Rute Rebouças, Inês Cantante, José Isidro, Luís Filipe Cunha, Alípio Jorge, Nuno Guimarães, Sérgio Nunes, António Leal, Purificação Silvano, Ricardo Campos,
- Abstract要約: CitiLink-Summは、欧州ポルトガル市議会の議事録の新たなコーパスである。
このデータセットは100の文書と2,322の手書きの要約からなる。
我々は, ROUGE, BLEU, METEOR, BERTScoreなどの語彙的および意味的指標を用いて, 最先端の生成モデル(BART, PRIMERAなど)と大規模言語モデル(LLM)を用いて評価を行った。
- 参考スコア(独自算出の注目度): 5.13142135666505
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Municipal meeting minutes are formal records documenting the discussions and decisions of local government, yet their content is often lengthy, dense, and difficult for citizens to navigate. Automatic summarization can help address this challenge by producing concise summaries for each discussion subject. Despite its potential, research on summarizing discussion subjects in municipal meeting minutes remains largely unexplored, especially in low-resource languages, where the inherent complexity of these documents adds further challenges. A major bottleneck is the scarcity of datasets containing high-quality, manually crafted summaries, which limits the development and evaluation of effective summarization models for this domain. In this paper, we present CitiLink-Summ, a new corpus of European Portuguese municipal meeting minutes, comprising 100 documents and 2,322 manually hand-written summaries, each corresponding to a distinct discussion subject. Leveraging this dataset, we establish baseline results for automatic summarization in this domain, employing state-of-the-art generative models (e.g., BART, PRIMERA) as well as large language models (LLMs), evaluated with both lexical and semantic metrics such as ROUGE, BLEU, METEOR, and BERTScore. CitiLink-Summ provides the first benchmark for municipal-domain summarization in European Portuguese, offering a valuable resource for advancing NLP research on complex administrative texts.
- Abstract(参考訳): 市議会の議事録は地方自治体の議論や決定を記した公式記録であるが、その内容は長く、密集しており、市民の移動が困難であることが多い。
自動要約は、議論対象ごとに簡潔な要約を作成することで、この問題に対処するのに役立つ。
その可能性にもかかわらず、自治体会議の議題を要約する研究は、特に低リソース言語では、特にこれらの文書の本質的な複雑さがさらなる課題を招いている。
主要なボトルネックは、高品質で手作業による要約を含むデータセットの不足である。
本稿では,100件の文書と2,322件の手書き要約からなる,欧州ポルトガル市議会議事録の新たなコーパスであるCitiLink-Summについて述べる。
このデータセットを利用して、この領域における自動要約のためのベースライン結果を確立し、最先端の生成モデル(例えば、BART、PRIMERA)と大規模言語モデル(LLM)を用い、ROUGE、BLEU、METEOR、BERTScoreといった語彙的および意味的指標を用いて評価する。
CitiLink-Summは、複雑な行政文書に関するNLP研究を進めるための貴重なリソースを提供する、欧州ポルトガル語における都市ドメインの要約のための最初のベンチマークを提供する。
関連論文リスト
- CitiLink-Minutes: A Multilayer Annotated Dataset of Municipal Meeting Minutes [4.992710184213374]
CitiLink-Minutesは6つの自治体から120のポルトガルの自治体会議の注釈付きデータセットである。
データセットには100万以上のトークンが含まれており、すべての個人識別子が識別されていない。
論文 参考訳(メタデータ) (2026-02-12T16:22:55Z) - MiNER: A Two-Stage Pipeline for Metadata Extraction from Municipal Meeting Minutes [5.5200589500916]
効果的な情報検索には、ミーティング番号、日付、場所、参加者、開始/終了時間などのメタデータを識別する必要がある。
既存の名前付きエンティティ認識(NER)モデルは、ドメイン固有のカテゴリに適合しないため、このタスクには不適である。
自治体の議事録からメタデータを抽出するための2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2026-01-30T21:09:13Z) - VotIE: Information Extraction from Meeting Minutes [5.842543771456586]
本稿では,物語の熟考記録における構造化された投票イベントの識別を目的とした新しい情報抽出タスクであるVotIEを紹介する。
我々は,最近導入されたCitiLinkコーパスに基づいて,ポルトガルの自治体時間を用いて,このタスクの最初のベンチマークを構築した。
標準的なドメイン内評価では、微調整エンコーダ(特にXLM-R-CRF)は93.2%のマクロF1に達し、生成的アプローチより優れている。
論文 参考訳(メタデータ) (2026-01-07T15:06:53Z) - Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization [93.56166917491487]
本稿では,オープンドメインニュースタイムライン SummarizatiOn に対するCHRONOS-Causal Headline Retrieval を提案する。
実験の結果,Chronosはオープンドメインのタイムラインの要約に長けているだけでなく,クローズドドメインアプリケーション用に設計された既存の最先端システムの性能に匹敵していることがわかった。
論文 参考訳(メタデータ) (2025-01-01T16:28:21Z) - Write Summary Step-by-Step: A Pilot Study of Stepwise Summarization [48.57273563299046]
本稿では,新たな文書が提案されるたびに追加の要約を生成するステップワイド要約の課題を提案する。
追加された要約は、新たに追加されたコンテンツを要約するだけでなく、以前の要約と一貫性を持たなければならない。
SSGは,自動計測と人的評価の両面から,最先端のパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-06-08T05:37:26Z) - Investigating Consistency in Query-Based Meeting Summarization: A
Comparative Study of Different Embedding Methods [0.0]
テキスト要約は自然言語処理(NLP)分野における有名な応用の1つである。
与えられたコンテキストに基づいて重要な情報による要約を自動的に生成することを目的としている。
本稿では,Microsoft が提案した "QMSum: A New Benchmark for Query-based Multi-domain Meeting Summarization" に着想を得た。
また,提案するLocaterモデルを用いて,与えられたテキストとクエリに基づいて関連するスパンを抽出し,それをSummarizerモデルで要約する。
論文 参考訳(メタデータ) (2024-02-10T08:25:30Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - A Sliding-Window Approach to Automatic Creation of Meeting Minutes [66.39584679676817]
会議の議事録には、議論された問題、決定、会議での行動が記録されている。
会議時間の自動生成のためのスライディングウインドウ手法を提案する。
長い写本や文書構造の欠如など、発話テキストの性質に関連する問題に取り組むことを目指しています。
論文 参考訳(メタデータ) (2021-04-26T02:44:14Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z) - A Hierarchical Network for Abstractive Meeting Summarization with
Cross-Domain Pretraining [52.11221075687124]
本稿では,会議シナリオに適応する抽象的要約ネットワークを提案する。
提案手法は,長時間の会議記録に対応する階層構造と,話者間の差異を表現する役割ベクトルを設計する。
我々のモデルは、自動測定と人的評価の両方において、過去のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-04-04T21:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。