論文の概要: NLP for Local Governance Meeting Records: A Focus Article on Tasks, Datasets, Metrics and Benchmark
- arxiv url: http://arxiv.org/abs/2602.08162v1
- Date: Sun, 08 Feb 2026 23:45:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.005073
- Title: NLP for Local Governance Meeting Records: A Focus Article on Tasks, Datasets, Metrics and Benchmark
- Title(参考訳): NLP for Local Governance Meeting Record: A Focus Article on Tasks, Datasets, Metrics and Benchmarks
- Authors: Ricardo Campos, José Pedro Evans, José Miguel Isidro, Miguel Marques, Luís Filipe Cunha, Alípio Jorge, Sérgio Nunes, Nuno Guimarães,
- Abstract要約: 地方統治会議の記録(地方統治会議記録)は、制度的な会議において、どのように提案、議論、手続き的行動が展開されるかを文書化した、数分または文書の形で公式文書である。
これらの文書は、しばしば密集し、官僚的であり、自治体全体で非常に異質であり、言語、用語、構造、組織全体に大きな変化が見られる。
これらの課題に対処するために、複雑な文書の構造と解釈に計算手法を用いることができる。
本稿では,地方統治会議文書の構造化を支援する基礎的NLPタスクについて概説する。
- 参考スコア(独自算出の注目度): 4.320509359331248
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Local governance meeting records are official documents, in the form of minutes or transcripts, documenting how proposals, discussions, and procedural actions unfold during institutional meetings. While generally structured, these documents are often dense, bureaucratic, and highly heterogeneous across municipalities, exhibiting significant variation in language, terminology, structure, and overall organization. This heterogeneity makes them difficult for non-experts to interpret and challenging for intelligent automated systems to process, limiting public transparency and civic engagement. To address these challenges, computational methods can be employed to structure and interpret such complex documents. In particular, Natural Language Processing (NLP) offers well-established methods that can enhance the accessibility and interpretability of governmental records. In this focus article, we review foundational NLP tasks that support the structuring of local governance meeting documents. Specifically, we review three core tasks: document segmentation, domain-specific entity extraction and automatic text summarization, which are essential for navigating lengthy deliberations, identifying political actors and personal information, and generating concise representations of complex decision-making processes. In reviewing these tasks, we discuss methodological approaches, evaluation metrics, and publicly available resources, while highlighting domain-specific challenges such as data scarcity, privacy constraints, and source variability. By synthesizing existing work across these foundational tasks, this article provides a structured overview of how NLP can enhance the structuring and accessibility of local governance meeting records.
- Abstract(参考訳): 地方統治会議の記録(地方統治会議記録)は、制度的な会議において、どのように提案、議論、手続き的行動が展開されるかを文書化した、数分または文書の形で公式文書である。
一般的に構成されているが、これらの文書は、しばしば密集し、官僚的であり、自治体全体にわたって非常に異質であり、言語、用語、構造、組織全体の大きな変化を示している。
この異質性は、非専門家がインテリジェントな自動化システムが処理することを解釈し難くし、公共の透明性と市民の関与を制限する。
これらの課題に対処するために、複雑な文書の構造と解釈に計算手法を用いることができる。
特に、NLP(Natural Language Processing)は、政府記録のアクセシビリティと解釈可能性を高めるための、確立された方法を提供している。
本稿では,地方統治会議文書の構造化を支援する基礎的NLPタスクについて概説する。
具体的には、文書セグメンテーション、ドメイン固有のエンティティ抽出、自動テキスト要約の3つの中核課題を概観する。これは、長い議論をナビゲートし、政治的アクターと個人情報を識別し、複雑な意思決定プロセスの簡潔な表現を生成するのに不可欠である。
これらのタスクのレビューでは、方法論的アプローチ、評価指標、公開リソースについて論じ、データの不足、プライバシーの制約、ソースの多様性といったドメイン固有の課題を強調した。
本稿は,これらの基本課題にまたがって既存の業務を合成することによって,NLPがローカルガバナンス会議記録の構造化とアクセシビリティを高める方法について,構造化された概要を提供する。
関連論文リスト
- HiPS: Hierarchical PDF Segmentation of Textbooks [2.2903728931592395]
法律教科書には、法規範の解釈と適用に不可欠な階層的な知識が含まれている。
本稿では,オープンソース構造解析ツールに依存するTable of Contents(TOC)に基づく手法とアプローチについて検討する。
解析精度を向上させるため、OCRベースのタイトル検出、XML由来の機能、コンテキストテキスト機能などの前処理戦略を取り入れた。
論文 参考訳(メタデータ) (2025-08-31T15:40:43Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Beyond Text: Characterizing Domain Expert Needs in Document Research [10.98467955215441]
文書研究のプロセスを理解するために、2つのドメインにまたがる16のドメインエキスパートに頼みます。
参加者のプロセスは、慣用的で反復的で、文書の社会的文脈に大きく依存していることが分かりました。
我々はNLPコミュニティに、有用なツールを構築する上でのドキュメントの役割をより慎重に検討するよう呼びかける。
論文 参考訳(メタデータ) (2025-04-16T21:24:41Z) - Document Structure in Long Document Transformers [64.76981299465885]
長い文書は、しばしばセクションヘッダーや段落のような異なる機能で階層的に整理された要素を持つ構造を示す。
文書構造の不明瞭さにもかかわらず、自然言語処理(NLP)におけるその役割はいまだに不透明である。
長期文書変換モデルは事前学習中に文書構造の内部表現を取得するか?
事前トレーニング後に構造情報をモデルに伝達するにはどうすればよいのか、下流のパフォーマンスにどのように影響するのか?
論文 参考訳(メタデータ) (2024-01-31T08:28:06Z) - Identification of Regulatory Requirements Relevant to Business
Processes: A Comparative Study on Generative AI, Embedding-based Ranking,
Crowd and Expert-driven Methods [10.899912290518648]
この研究は、法的およびドメインの専門家が関連する要件を評価するのにどのように役立つかを調べる。
我々は,組込み型NLPランキング法,GPT-4を用いた生成AI法,クラウドソーシング手法を,専門家によるラベル作成の純粋手作業手法と比較した。
BPMN2.0プロセスの両方に対してゴールドスタンダードが作成され、複数の規制文書から現実の要求にマッチします。
論文 参考訳(メタデータ) (2024-01-02T12:08:31Z) - Leveraging Large Language Models for Topic Classification in the Domain
of Public Affairs [65.9077733300329]
大規模言語モデル (LLM) は公務員文書の分析を大幅に強化する可能性を秘めている。
LLMは、公共の分野など、ドメイン固有のドキュメントを処理するのに非常に役立ちます。
論文 参考訳(メタデータ) (2023-06-05T13:35:01Z) - Advancing Topic Segmentation and Outline Generation in Chinese Texts: The Paragraph-level Topic Representation, Corpus, and Benchmark [44.06803331843307]
段落レベルのトピック構造は、ドキュメント全体のコンテキストをより高いレベルから把握し、理解することができる。
大規模で高品質な中国語段落レベルの話題構造コーパスの欠如は研究や応用を妨げた。
コーパス構築を導くために,3層からなる階層的な段落レベルのトピック構造表現を提案する。
2段階のマンマシン・コラボレーティブ・アノテーションを用いて,中国最大規模のトピック構造コーパスを構築する。
論文 参考訳(メタデータ) (2023-05-24T06:43:23Z) - MUG: A General Meeting Understanding and Generation Benchmark [60.09540662936726]
我々はAliMeeting4MUG Corpusを構築した。
本稿では,このコーパスの詳細な紹介,SLPタスクと評価方法,ベースラインシステムとその性能について述べる。
論文 参考訳(メタデータ) (2023-03-24T11:52:25Z) - Data Readiness for Natural Language Processing [3.6296396308298795]
この文書は、機械学習と自然言語処理の文脈におけるデータの準備性に関するものである。
自動分析手法を促進するために、組織がどのようにしてデータの特定、作成、検証、準備を進めていくかを説明している。
論文 参考訳(メタデータ) (2020-09-04T07:53:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。