論文の概要: Predicting Survey Response with Quotation-based Modeling: A Case Study
on Favorability towards the United States
- arxiv url: http://arxiv.org/abs/2305.14086v2
- Date: Sat, 27 May 2023 23:16:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 23:41:09.450497
- Title: Predicting Survey Response with Quotation-based Modeling: A Case Study
on Favorability towards the United States
- Title(参考訳): 引用に基づくモデルによる調査回答の予測:米国に対する好意性に関する事例研究
- Authors: Alireza Amirshahi, Nicolas Kirsch, Jonathan Reymond and Saleh
Baghersalimi
- Abstract要約: そこで我々は,機械学習を用いて探索応答を推定する先駆的手法を提案する。
我々は、さまざまな国籍の個人から引用された膨大なコーパスを活用して、彼らの好意のレベルを抽出する。
自然言語処理技術と機械学習アルゴリズムを組み合わせて,質問応答の予測モデルを構築した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The acquisition of survey responses is a crucial component in conducting
research aimed at comprehending public opinion. However, survey data collection
can be arduous, time-consuming, and expensive, with no assurance of an adequate
response rate. In this paper, we propose a pioneering approach for predicting
survey responses by examining quotations using machine learning. Our
investigation focuses on evaluating the degree of favorability towards the
United States, a topic of interest to many organizations and governments. We
leverage a vast corpus of quotations from individuals across different
nationalities and time periods to extract their level of favorability. We
employ a combination of natural language processing techniques and machine
learning algorithms to construct a predictive model for survey responses. We
investigate two scenarios: first, when no surveys have been conducted in a
country, and second when surveys have been conducted but in specific years and
do not cover all the years. Our experimental results demonstrate that our
proposed approach can predict survey responses with high accuracy. Furthermore,
we provide an exhaustive analysis of the crucial features that contributed to
the model's performance. This study has the potential to impact survey research
in the field of data science by substantially decreasing the cost and time
required to conduct surveys while simultaneously providing accurate predictions
of public opinion.
- Abstract(参考訳): 世論の理解を目的とした調査を行う上で,調査回答の獲得は重要な要素である。
しかし、適切な応答率を保証することなく、調査データ収集は困難であり、時間がかかり、高価である。
本稿では,機械学習を用いた引用を検証し,調査回答を予測する先駆的手法を提案する。
本調査は、多くの組織や政府に対する関心事である米国に対する優遇度を評価することに焦点を当てている。
異なる国籍や期間にまたがる個人からの膨大な引用を活用し、彼らの好意のレベルを抽出する。
自然言語処理技術と機械学習アルゴリズムを組み合わせて,質問応答の予測モデルを構築した。
第一に, 国内調査が行われていない場合, 第二に調査が行われた場合, 特定の年において, 年中調査を行わない場合の2つのシナリオについて検討した。
実験の結果,提案手法は高精度にサーベイ応答を予測できることがわかった。
さらに,モデルの性能に寄与した重要な特徴を徹底的に分析する。
本研究は、世論の正確な予測を同時に提供しつつ、調査に要するコストと時間を大幅に削減し、データサイエンス分野における調査研究に影響を与える可能性がある。
関連論文リスト
- Specializing Large Language Models to Simulate Survey Response Distributions for Global Populations [49.908708778200115]
我々は,調査応答分布をシミュレートする大規模言語モデル (LLM) を最初に開発した。
テストベッドとして、我々は2つの世界文化調査の国レベルの結果を使用します。
予測された応答分布と実際の応答分布のばらつきを最小限に抑えるために, ファースト・ツーケン確率に基づく微調整法を提案する。
論文 参考訳(メタデータ) (2025-02-10T21:59:27Z) - Transforming Social Science Research with Transfer Learning: Social Science Survey Data Integration with AI [0.4944564023471818]
全国的に代表される大規模な調査は、アメリカ政治学界を深く形作っているが、関連性はあるものの異なる領域を代表している。
本研究は,これらのギャップに対処するためのトランスファーラーニング(TL)の新たな応用について紹介する。
協同選挙研究データセットで事前訓練されたモデルは、米国選挙研究データセットでの使用のために微調整されている。
論文 参考訳(メタデータ) (2025-01-11T16:01:44Z) - A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文 参考訳(メタデータ) (2024-02-26T18:54:35Z) - Crowdsourced Adaptive Surveys [0.0]
本稿では,クラウドソーシング型適応調査手法(CSAS)を紹介する。
本手法は,参加者が提供したオープンエンドテキストを調査項目に変換し,マルチアームバンディットアルゴリズムを適用し,調査においてどの質問を優先すべきかを判断する。
CSASが研究者と調査参加者の間に概念的ギャップを埋める可能性を強調した。
論文 参考訳(メタデータ) (2024-01-16T04:05:25Z) - Questioning the Survey Responses of Large Language Models [25.14481433176348]
我々は,米国国勢調査局が確立したアメリカン・コミュニティ・サーベイに基づいて,この方法論を批判的に検討する。
まず、モデルの応答は、例えば"A"という文字でラベル付けされた調査応答に対するバイアスの順序付けとラベル付けによって制御される。
第二に、ランダム化された回答順序付けによってこれらの体系的バイアスを調整するとき、ボード全体のモデルが一様ランダムなアンケート応答に向かう傾向にある。
論文 参考訳(メタデータ) (2023-06-13T17:48:27Z) - Open vs Closed-ended questions in attitudinal surveys -- comparing,
combining, and interpreting using natural language processing [3.867363075280544]
トピックモデリングは、オープンな応答から情報を抽出する時間を著しく短縮する可能性がある。
本研究はトピックモデリングを用いて,オープンエンド質問から情報を抽出し,その性能をクローズドエンド応答と比較する。
論文 参考訳(メタデータ) (2022-05-03T06:01:03Z) - The Impact of Algorithmic Risk Assessments on Human Predictions and its
Analysis via Crowdsourcing Studies [79.66833203975729]
我々は,在職者が将来の再起を予測することを任務とするヴィグネット研究を行う。
参加者は、再逮捕の確率が50%よりかなり低いと判断しても、犯罪者が再逮捕されることをしばしば予測します。
裁判官の判断は、参加者の予測とは異なり、部分的には再逮捕の可能性がある要因に依存する。
論文 参考訳(メタデータ) (2021-09-03T11:09:10Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Electoral Forecasting Using a Novel Temporal Attenuation Model:
Predicting the US Presidential Elections [91.3755431537592]
予備選別世論調査データを用いて予測精度を向上させる新しいマクロスケール時間減衰(TA)モデルを開発した。
我々の仮説は、世論調査を公表するタイミングは、特に選挙直前の世論の変動に重要な役割を果たす、というものである。
我々は,48年間の平均予測誤差2.8-3.28点を蓄積するTAモデルの2つの異なる実装を提案する。
論文 参考訳(メタデータ) (2020-04-30T09:21:52Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。