論文の概要: CitiLink-Minutes: A Multilayer Annotated Dataset of Municipal Meeting Minutes
- arxiv url: http://arxiv.org/abs/2602.12137v1
- Date: Thu, 12 Feb 2026 16:22:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.927899
- Title: CitiLink-Minutes: A Multilayer Annotated Dataset of Municipal Meeting Minutes
- Title(参考訳): CitiLink-Minutes: 市町村会議分数の多層アノテートデータセット
- Authors: Ricardo Campos, Ana Filipa Pacheco, Ana Luísa Fernandes, Inês Cantante, Rute Rebouças, Luís Filipe Cunha, José Miguel Isidro, José Pedro Evans, Miguel Marques, Rodrigo Batista, Evelin Amorim, Alípio Jorge, Nuno Guimarães, Sérgio Nunes, António Leal, Purificação Silvano,
- Abstract要約: CitiLink-Minutesは6つの自治体から120のポルトガルの自治体会議の注釈付きデータセットである。
データセットには100万以上のトークンが含まれており、すべての個人識別子が識別されていない。
- 参考スコア(独自算出の注目度): 4.992710184213374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: City councils play a crucial role in local governance, directly influencing citizens' daily lives through decisions made during municipal meetings. These deliberations are formally documented in meeting minutes, which serve as official records of discussions, decisions, and voting outcomes. Despite their importance, municipal meeting records have received little attention in Information Retrieval (IR) and Natural Language Processing (NLP), largely due to the lack of annotated datasets, which ultimately limit the development of computational models. To address this gap, we introduce CitiLink-Minutes, a multilayer dataset of 120 European Portuguese municipal meeting minutes from six municipalities. Unlike prior annotated datasets of parliamentary or video records, CitiLink-Minutes provides multilayer annotations and structured linkage of official written minutes. The dataset contains over one million tokens, with all personal identifiers de-identified. Each minute was manually annotated by two trained annotators and curated by an experienced linguist across three complementary dimensions: (1) metadata, (2) subjects of discussion, and (3) voting outcomes, totaling over 38,000 individual annotations. Released under FAIR principles and accompanied by baseline results on metadata extraction, topic classification, and vote labeling, CitiLink-Minutes demonstrates its potential for downstream NLP and IR tasks, while promoting transparent access to municipal decisions.
- Abstract(参考訳): 市政委員会は地方統治において重要な役割を担っており、市民の日常生活に直接影響を与えている。
これらの審議は議事録で正式に文書化され、議論、決定、投票結果の公式記録として機能する。
その重要性にもかかわらず、自治体の会議記録は情報検索 (IR) や自然言語処理 (NLP) においてほとんど注目されていない。
このギャップに対処するため、6つの自治体から120のポルトガルの市町村会議分からなる多層データセットであるCitiLink-Minutesを紹介した。
議会やビデオ記録の注釈付きデータセットとは異なり、CitiLink-Minutesは多層アノテーションと公式記述された数分の構造化リンクを提供する。
データセットには100万以上のトークンが含まれており、すべての個人識別子が識別されていない。
1) メタデータ, (2) 議論の対象, (3) 投票結果, 合計で38,000以上の注釈が得られた。
FAIR原則の下でリリースされ、メタデータ抽出、トピック分類、投票ラベリングのベースライン結果とともに、CitiLink-Minutesは、下流のNLPおよびIRタスクの可能性を示し、自治体の決定への透過的なアクセスを促進する。
関連論文リスト
- MiNER: A Two-Stage Pipeline for Metadata Extraction from Municipal Meeting Minutes [5.5200589500916]
効果的な情報検索には、ミーティング番号、日付、場所、参加者、開始/終了時間などのメタデータを識別する必要がある。
既存の名前付きエンティティ認識(NER)モデルは、ドメイン固有のカテゴリに適合しないため、このタスクには不適である。
自治体の議事録からメタデータを抽出するための2段階パイプラインを提案する。
論文 参考訳(メタデータ) (2026-01-30T21:09:13Z) - CitiLink: Enhancing Municipal Transparency and Citizen Engagement through Searchable Meeting Minutes [4.531066330197079]
CitiLinkは、未構造化の市町村会の議事録を構造化・検索可能なデータに変換するためのプラットフォームである。
開発システムは、ポルトガルの6つの自治体によって利用可能にされた120分間のコレクションの上に構築された。
論文 参考訳(メタデータ) (2026-01-26T11:26:57Z) - VotIE: Information Extraction from Meeting Minutes [5.842543771456586]
本稿では,物語の熟考記録における構造化された投票イベントの識別を目的とした新しい情報抽出タスクであるVotIEを紹介する。
我々は,最近導入されたCitiLinkコーパスに基づいて,ポルトガルの自治体時間を用いて,このタスクの最初のベンチマークを構築した。
標準的なドメイン内評価では、微調整エンコーダ(特にXLM-R-CRF)は93.2%のマクロF1に達し、生成的アプローチより優れている。
論文 参考訳(メタデータ) (2026-01-07T15:06:53Z) - The NetMob25 Dataset: A High-resolution Multi-layered View of Individual Mobility in Greater Paris Region [64.30214722988666]
本稿では,提案したデータセットのサーベイ設計,収集プロトコル,処理手法,特徴について述べる。
データセットには、人口統計、社会経済、家庭の特徴を記述した個人データベース(i)、タイムスタンプ、輸送モード、旅行目的を含む8,000以上の注釈付き変位を持つトリプスデータベース(ii)、約5億の高周波ポイントからなるRaw GPSトレースデータベース(iii)の3つのコンポーネントが含まれている。
論文 参考訳(メタデータ) (2025-06-06T09:22:21Z) - Uchaguzi-2022: A Dataset of Citizen Reports on the 2022 Kenyan Election [49.35115948941981]
Uchaguzi-2022は、2022年のケニア総選挙に関する14kの分類と地理タグ付き市民報告のデータセットである。
このデータセットを使用して、言語モデルがレポートの分類とジオタグ化に役立てられるかどうかを調査し、AI for Social Goodスペースにおけるその可能性を強調します。
論文 参考訳(メタデータ) (2024-12-17T17:08:35Z) - MeetingBank: A Benchmark Dataset for Meeting Summarization [37.761684754365945]
本稿では,過去10年間の市議会会議のベンチマークデータセットであるMacheeBankを紹介する。
我々は,会議ビデオリンク,テキスト,参照要約,アジェンダ,その他のメタデータなどのコレクションを作成し,より優れた会議要約技術の開発を容易にする。
論文 参考訳(メタデータ) (2023-05-27T17:09:25Z) - MUG: A General Meeting Understanding and Generation Benchmark [60.09540662936726]
我々はAliMeeting4MUG Corpusを構築した。
本稿では,このコーパスの詳細な紹介,SLPタスクと評価方法,ベースラインシステムとその性能について述べる。
論文 参考訳(メタデータ) (2023-03-24T11:52:25Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - A Sliding-Window Approach to Automatic Creation of Meeting Minutes [66.39584679676817]
会議の議事録には、議論された問題、決定、会議での行動が記録されている。
会議時間の自動生成のためのスライディングウインドウ手法を提案する。
長い写本や文書構造の欠如など、発話テキストの性質に関連する問題に取り組むことを目指しています。
論文 参考訳(メタデータ) (2021-04-26T02:44:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。