論文の概要: Semantic Clustering of Civic Proposals: A Case Study on Brazil's National Participation Platform
- arxiv url: http://arxiv.org/abs/2509.21292v1
- Date: Thu, 25 Sep 2025 15:11:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:13.019976
- Title: Semantic Clustering of Civic Proposals: A Case Study on Brazil's National Participation Platform
- Title(参考訳): 市民提案のセマンティッククラスタリング:ブラジルの国民参加プラットフォームを事例として
- Authors: Ronivaldo Ferreira, Guilherme da Silva, Carla Rocha, Gustavo Pinto,
- Abstract要約: 本稿では,BERとシード語を組み合わせたアプローチと,大規模言語モデルによる自動検証を提案する。
最初の結果は、生成したトピックは、最小限の人的労力で、一貫性があり、制度的に整合していることを示している。
この手法により、政府は大量の市民入力を公共政策のための実行可能なデータに変換することができる。
- 参考スコア(独自算出の注目度): 2.3854672173722844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Promoting participation on digital platforms such as Brasil Participativo has emerged as a top priority for governments worldwide. However, due to the sheer volume of contributions, much of this engagement goes underutilized, as organizing it presents significant challenges: (1) manual classification is unfeasible at scale; (2) expert involvement is required; and (3) alignment with official taxonomies is necessary. In this paper, we introduce an approach that combines BERTopic with seed words and automatic validation by large language models. Initial results indicate that the generated topics are coherent and institutionally aligned, with minimal human effort. This methodology enables governments to transform large volumes of citizen input into actionable data for public policy.
- Abstract(参考訳): Brasil Participativoのようなデジタルプラットフォームへの参加を促進することが、世界中の政府にとって最優先事項となっている。
しかし、この取り組みの多くは、(1)手動分類が大規模では不可能、(2)専門家の関与が必要、(3)公式分類学との整合が必要であるなど、大きな課題を生んでいる。
本稿では,BERTopicとシード語を組み合わせたアプローチと,大規模言語モデルによる自動検証を提案する。
最初の結果は、生成したトピックは、最小限の人的労力で、一貫性があり、制度的に整合していることを示している。
この手法により、政府は大量の市民入力を公共政策のための実行可能なデータに変換することができる。
関連論文リスト
- AgentDAO: Synthesis of Proposal Transactions Via Abstract DAO Semantics [5.72453247290246]
本稿では,大規模言語モデルを用いたマルチエージェントシステムと,ガバナンス提案を生成するラベル中心検索アルゴリズムを提案する。
Langが達成した重要な最適化は、トークン要求の低い提案生成を確実に保証する、ユーザ入力のセマンティックアウェアな抽象化である。
実世界の応用に関する予備的な評価は、既存の基礎モデルによる複雑な提案の可能性を反映している。
論文 参考訳(メタデータ) (2025-03-13T06:52:18Z) - Representation Bias in Political Sample Simulations with Large Language Models [54.48283690603358]
本研究は,大規模言語モデルを用いた政治サンプルのシミュレーションにおけるバイアスの同定と定量化を目的とする。
GPT-3.5-Turboモデルを用いて、米国選挙研究、ドイツ縦割り選挙研究、ズオビアオデータセット、中国家族パネル研究のデータを活用する。
論文 参考訳(メタデータ) (2024-07-16T05:52:26Z) - Algorithmic Transparency and Participation through the Handoff Lens: Lessons Learned from the U.S. Census Bureau's Adoption of Differential Privacy [1.999925939110439]
我々は、2020年国勢調査のための情報開示回避システムにおいて、米国国勢調査局による差分プライバシーの採用について検討する。
このケーススタディは、技術的なシフトが価値をどう意味するかについての理解を深めようとしている。
このケーススタディから,アルゴリズムの透明性と参加に関する理解を深めるための3つの教訓を提示する。
論文 参考訳(メタデータ) (2024-05-29T15:29:16Z) - Leveraging Large Language Models for Topic Classification in the Domain
of Public Affairs [65.9077733300329]
大規模言語モデル (LLM) は公務員文書の分析を大幅に強化する可能性を秘めている。
LLMは、公共の分野など、ドメイン固有のドキュメントを処理するのに非常に役立ちます。
論文 参考訳(メタデータ) (2023-06-05T13:35:01Z) - Advancing Topic Segmentation and Outline Generation in Chinese Texts: The Paragraph-level Topic Representation, Corpus, and Benchmark [44.06803331843307]
段落レベルのトピック構造は、ドキュメント全体のコンテキストをより高いレベルから把握し、理解することができる。
大規模で高品質な中国語段落レベルの話題構造コーパスの欠如は研究や応用を妨げた。
コーパス構築を導くために,3層からなる階層的な段落レベルのトピック構造表現を提案する。
2段階のマンマシン・コラボレーティブ・アノテーションを用いて,中国最大規模のトピック構造コーパスを構築する。
論文 参考訳(メタデータ) (2023-05-24T06:43:23Z) - Advancing Artificial Intelligence and Machine Learning in the U.S.
Government Through Improved Public Competitions [2.741266294612776]
過去2年間、米国政府は人工知能(AI)と機械学習(ML)の加速の重要性を強調してきた。
アメリカ政府は、新しいアルゴリズムの開発と経験訓練への参加を通じて、公的な人工知能と機械学習の課題から恩恵を受けることができる。
ここでは、共通問題を特定し、課題の有効性を高めるためのアプローチを推奨する。
論文 参考訳(メタデータ) (2021-11-29T16:35:38Z) - Empowering Local Communities Using Artificial Intelligence [70.17085406202368]
人中心の観点から、AIが社会に与える影響を探求する上で重要なトピックとなっている。
市民科学におけるこれまでの研究は、AIを使って研究に大衆を巻き込む方法を特定してきた。
本稿では,コミュニティ市民科学にAIを適用する上での課題について論じる。
論文 参考訳(メタデータ) (2021-10-05T12:51:11Z) - An Enhanced Text Classification to Explore Health based Indian
Government Policy Tweets [2.2082422928825136]
そこで本稿では,Twitter のさまざまな保健制度の分類を改良したテキスト分類フレームワークを提案する。
そこで我々は,新しいGloVe単語埋め込みとクラス固有の感情に基づくテキスト拡張手法(Mod-EDA)を提案する。
論文 参考訳(メタデータ) (2020-07-13T17:04:44Z) - Differential Privacy of Hierarchical Census Data: An Optimization
Approach [53.29035917495491]
国勢調査局(Census Bureaus)は、個人に関する機密情報を明らかにすることなく、大人口に関する社会経済的データをまとめて公開することに興味を持っている。
最近の出来事では、これらの組織が直面しているプライバシー上の課題がいくつか特定されている。
本稿では,階層的な個人数を解放する新たな差分プライバシ機構を提案する。
論文 参考訳(メタデータ) (2020-06-28T18:19:55Z) - Predicting Legal Proceedings Status: Approaches Based on Sequential Text
Data [0.0]
本稿では,ブラジルの法的手続を3段階に分類する予測モデルを開発する。
自然言語処理(NLP)と機械学習技術を組み合わせて問題解決を行った。
我々のアプローチは最大精度.93、最高スコアは.89(マクロ)と.93(重み)を達成した。
論文 参考訳(メタデータ) (2020-03-13T19:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。