論文の概要: Classifying Problem and Solution Framing in Congressional Social Media
- arxiv url: http://arxiv.org/abs/2604.03247v1
- Date: Tue, 10 Mar 2026 14:06:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.544235
- Title: Classifying Problem and Solution Framing in Congressional Social Media
- Title(参考訳): 議会ソーシャルメディアにおける問題分類と解フレーム
- Authors: Misha Melnyk, Mitchell Dolny, Joshua D. Elkind, A. Michael Tjhin, Saisha Chebium, Blake VanBerlo, Annelise Russell, Michelle M. Buehlmann, Jesse Hoey,
- Abstract要約: ガーベッジ・カンのモデルによる米国の政策設定は、問題」と「解決」に焦点を当てたプロセスとを区別する。
本研究の目的は,上院議員ポストを問題やソリューションストリームのいずれにおいてもラベル付けする自動手法を開発することである。
- 参考スコア(独自算出の注目度): 1.0925334503233166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Policy setting in the USA according to the ``Garbage Can'' model differentiates between ``problem'' and ``solution'' focused processes. In this paper, we study a large dataset of US Senator postings on Twitter (1.68m tweets in total). Our objective is to develop an automated method to label Senatorial posts as either in the problem or solution streams. Two academic policy experts labeled a subset of 3967 tweets as either problem, solution, or other (anything not problem or solution). We split off a subset of 500 tweets into a test set, with the remaining 3467 used for training. During development, this training set was further split by 60/20/20 proportions for fitting, validation, and development test sets. We investigated supervised learning methods for building problem/solution classifiers directly on the training set, evaluating their performance in terms of F1 score on the validation set, allowing us to rapidly iterate through models and hyperparameters, achieving an average weighted F1 score of above 0.8 on cross validation across the three categories using a BERTweet Base model.
- Abstract(参考訳): ガベージ缶」モデルに基づく米国の政策設定は、「プロブレム」と「ソリューション」に焦点を当てたプロセスとを区別する。
本稿では,Twitter上での米国上院議員投稿の膨大なデータセット(合計1.68万ツイート)について検討する。
本研究の目的は,上院議員ポストを問題やソリューションストリームのいずれにおいてもラベル付けする自動手法を開発することである。
2人の学術政策の専門家は、3967ツイートのサブセットを問題、解決策、あるいは他の問題(問題や解決策ではないもの)としてラベル付けした。
500ツイートのサブセットをテストセットに分割し、残りの3467をトレーニングに使用しました。
開発期間中、このトレーニングセットはさらに60/20/20の割合でフィッティング、バリデーション、開発テストセットに分割された。
トレーニングセット上で問題/解決分類器を直接構築するための教師付き学習手法について検討し、検証セット上でのF1スコアを用いてそれらの性能を評価し、モデルとハイパーパラメータを高速に反復し、BERTweet Baseモデルを用いて3つのカテゴリ間の相互検証において平均F1スコアを0.8以上達成した。
関連論文リスト
- RefGrader: Automated Grading of Mathematical Competition Proofs using Agentic Workflows [8.700422995850152]
State-of-the-art (SOTA) LLMは、証明ベースのOlympiad問題から、IMO 2025問題のほとんどを解決するまで、進歩してきた。
本稿では,90 Gemini 2.5 Pro生成ソリューションのコーパスを用いて,詳細なエラーアノテーションを用いた1-4スケールで評価を行った。
分析の結果、モデルが不正確な解を確実にフラグ付けできるが、部分クレジットの割り当て方法にキャリブレーションのギャップがあることがわかった。
論文 参考訳(メタデータ) (2025-10-10T05:47:40Z) - Train Till You Drop: Towards Stable and Robust Source-free Unsupervised 3D Domain Adaptation [62.889835139583965]
本研究では,3次元セマンティックセグメンテーションのための非教師なし領域適応(SFUDA)の問題に取り組む。
ソースデータにアクセスすることなく、ラベルのないターゲットドメインでドメイン適応を実行する。
既存のSFUDAアプローチの一般的な問題は、あるトレーニング時間後にパフォーマンスが低下することです。
論文 参考訳(メタデータ) (2024-09-06T17:13:14Z) - ThangDLU at #SMM4H 2024: Encoder-decoder models for classifying text data on social disorders in children and adolescents [49.00494558898933]
本稿では,#SMM4H (Social Media Mining for Health) 2024 Workshopのタスク3とタスク5への参加について述べる。
タスク3は、屋外環境が社会不安の症状に与える影響を議論するツイートを中心にした多クラス分類タスクである。
タスク5は、子供の医学的障害を報告しているツイートに焦点を当てたバイナリ分類タスクを含む。
BART-baseやT5-smallのような事前訓練されたエンコーダデコーダモデルからの転送学習を適用し、与えられたツイートの集合のラベルを同定した。
論文 参考訳(メタデータ) (2024-04-30T17:06:20Z) - Clustering MOOC Programming Solutions to Diversify Their Presentation to Students [6.219350126324697]
多くのMOOCは、単に最新のソリューションを示し、その多様性や品質を無視し、生徒の学習機会を妨げる。
JPlagを人気のあるMOOCプラットフォームであるHyperskill上のPythonのサブミッションに適用した。
我々はRhubarbという独自のツールを開発し、アルゴリズム的に同じ解を標準化し、それらの間の構造認識編集距離を計算し、クラスタリングを適用した。
論文 参考訳(メタデータ) (2024-03-28T13:18:49Z) - Unifying Language Learning Paradigms [96.35981503087567]
データセットやセットアップ全体にわたって普遍的に有効である事前学習モデルのための統一的なフレームワークを提案する。
本研究では, 事前学習対象を相互に配置し, 異なる対象間の補間を効果的に行う方法を示す。
また,テキスト内学習において,ゼロショットSuperGLUEで175B GPT-3,ワンショット要約でT5-XXLの性能を3倍に向上させた。
論文 参考訳(メタデータ) (2022-05-10T19:32:20Z) - Learning to Perturb Word Embeddings for Out-of-distribution QA [55.103586220757464]
本論文では,入力問題と文脈の単語埋め込みを意味論を変化させることなく学習するノイズ発生器に基づく簡便かつ効果的なDA法を提案する。
ひとつのソースデータセットに,5つの異なるターゲットドメインに埋め込むことで,トレーニングされたQAモデルのパフォーマンスを検証する。
特に、私たちのトレーニングを受けたモデルは、240K以上の人工的なQAペアでトレーニングされたモデルよりも優れています。
論文 参考訳(メタデータ) (2021-05-06T14:12:26Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z) - Phonemer at WNUT-2020 Task 2: Sequence Classification Using COVID
Twitter BERT and Bagging Ensemble Technique based on Plurality Voting [0.0]
新型コロナウイルス(COVID-19)に関連する英語のつぶやきを自動的に識別するシステムを開発した。
最終アプローチでは0.9037のF1スコアを達成し,F1スコアを評価基準として総合6位にランク付けした。
論文 参考訳(メタデータ) (2020-10-01T10:54:54Z) - TACRED Revisited: A Thorough Evaluation of the TACRED Relation
Extraction Task [80.38130122127882]
TACREDはリレーショナル抽出(RE)において最も大きく、最も広く使われているクラウドソースデータセットの1つである
パフォーマンスの天井に到達したのか、改善の余地はあるのか?
ラベルエラーは絶対F1テストエラーの8%を占めており、例の50%以上を可逆化する必要がある。
論文 参考訳(メタデータ) (2020-04-30T15:07:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。