論文の概要: Mining Reasons For And Against Vaccination From Unstructured Data Using Nichesourcing and AI Data Augmentation
- arxiv url: http://arxiv.org/abs/2406.19951v1
- Date: Fri, 28 Jun 2024 14:36:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-01 16:40:26.066012
- Title: Mining Reasons For And Against Vaccination From Unstructured Data Using Nichesourcing and AI Data Augmentation
- Title(参考訳): NichesourcingとAIデータ拡張を用いた非構造化データからのワクチンのマイニング
- Authors: Damián Ariel Furman, Juan Junqueras, Z. Burçe Gümüslü, Edgar Altszyler, Joaquin Navajas, Ophelia Deroy, Justin Sulik,
- Abstract要約: GPT4 と GPT3.5-Turbo を用いたニッチソーシングと拡張による予防接種理由および予防接種対策のためのデータセットである Reasons For and Against Vaccination (RFAV) を提示する。
主観性が高いにもかかわらず、これらの理由を異なるタスク定義の下で非構造化テキストでどのように掘り下げることができるかを示す。
データセットとトレーニングされたモデルとアノテーションマニュアルを公開し、アノテーションをトレーニングしてタスクを定義します。
- 参考スコア(独自算出の注目度): 0.7067443325368975
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present Reasons For and Against Vaccination (RFAV), a dataset for predicting reasons for and against vaccination, and scientific authorities used to justify them, annotated through nichesourcing and augmented using GPT4 and GPT3.5-Turbo. We show how it is possible to mine these reasons in non-structured text, under different task definitions, despite the high level of subjectivity involved and explore the impact of artificially augmented data using in-context learning with GPT4 and GPT3.5-Turbo. We publish the dataset and the trained models along with the annotation manual used to train annotators and define the task.
- Abstract(参考訳): 本稿では,予防接種理由と予防接種対策のためのデータセットであるReasons For and Against Vaccination(RFAV)について紹介する。
GPT4 と GPT3.5-Turbo を用いたテキスト内学習を用いて、高レベルの主観性が関与するにもかかわらず、これらの理由を異なるタスク定義の下で、非構造化テキストでどのように掘り下げることができるかを示す。
データセットとトレーニングされたモデルとアノテーションマニュアルを公開し、アノテーションをトレーニングしてタスクを定義します。
関連論文リスト
- Cost-effective Instruction Learning for Pathology Vision and Language Analysis [23.330914902014527]
CLOVER という名称の会話病理学のための費用対効果学習フレームワークを提案する。
CLOVERは軽量モジュールのみをトレーニングし、大きな言語モデルのパラメータを凍結しながら命令チューニングを使用する。
そこで我々は,デジタル病理学の文脈において,高品質なテンプレートベースの命令セットを構築する。
論文 参考訳(メタデータ) (2024-07-25T03:12:57Z) - Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with Data [89.2410799619405]
実世界のデータを用いた統計的および因果推論において,大規模言語モデルの能力を評価するために,データベンチマークを用いた定量的推論を導入する。
このベンチマークは、教科書、オンライン学習教材、学術論文のデータシートを伴う411の質問のデータセットで構成されている。
データとテキストに対するモデルの量的推論能力を比較するために、ベンチマークを290のテキストのみの質問、すなわちQRTextで強化する。
論文 参考訳(メタデータ) (2024-02-27T16:15:03Z) - Injecting linguistic knowledge into BERT for Dialogue State Tracking [60.42231674887294]
本稿では,教師なしの枠組みを用いて言語知識を抽出する手法を提案する。
次に、この知識を用いて、対話状態追跡(DST)タスクにおけるBERTの性能と解釈可能性を高める。
このフレームワークを様々なDSTタスクでベンチマークし、精度の顕著な改善を観察する。
論文 参考訳(メタデータ) (2023-11-27T08:38:42Z) - Generative AI for Hate Speech Detection: Evaluation and Findings [11.478263835391436]
生成AIは、大量の合成ヘイトスピーチシーケンスを生成するために利用されてきた。
本章では,本手法の方法論,実験的設定,評価について概説する。
GPT-3.5やそれ以降のモデルの感度は、テキスト生成の類似技術を用いて改善できるのかという疑問が浮かび上がっている。
論文 参考訳(メタデータ) (2023-11-16T16:09:43Z) - Black-Box Analysis: GPTs Across Time in Legal Textual Entailment Task [17.25356594832692]
本稿では,COLIEE Task 4 データセット上での GPT-3.5 (ChatGPT) と GPT-4 の性能解析を行う。
予備的な実験結果から,法的なテキスト・エンタテインメント・タスクの処理におけるモデルの強みや弱点に関する興味深い知見が得られた。
論文 参考訳(メタデータ) (2023-09-11T14:43:54Z) - Is GPT-4 a Good Data Analyst? [67.35956981748699]
我々は、GPT-4を、広範囲のドメインのデータベースでエンドツーエンドのデータ分析を行うためのデータ分析であると考えている。
我々は,複数の専門家データアナリストとGPT-4のパフォーマンスを体系的に比較するために,タスク固有の評価指標を設計する。
実験の結果, GPT-4はヒトに匹敵する性能を示した。
論文 参考訳(メタデータ) (2023-05-24T11:26:59Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z) - Generic Temporal Reasoning with Differential Analysis and Explanation [61.96034987217583]
時間差分解析でギャップを埋めるTODAYという新しいタスクを導入する。
TODAYは、システムがインクリメンタルな変化の効果を正しく理解できるかどうかを評価する。
共同学習においてTODAYの指導スタイルと説明アノテーションが有効であることを示す。
論文 参考訳(メタデータ) (2022-12-20T17:40:03Z) - Is GPT-3 a Good Data Annotator? [30.9559541574174]
GPT-3はOpenAIが開発した大規模言語モデルである。
本稿では,データアノテータとしてのGPT-3の性能を評価する。
論文 参考訳(メタデータ) (2022-12-20T17:28:41Z) - Disentangled Learning of Stance and Aspect Topics for Vaccine Attitude
Detection in Social Media [40.61499595293957]
VADetと呼ばれるワクチンの姿勢検出のための新しい半教師付きアプローチを提案する。
VADetは、歪んだ姿勢とアスペクトトピックを学習することができ、スタンス検出とツイートクラスタリングの両方で、既存のアスペクトベースの感情分析モデルより優れています。
論文 参考訳(メタデータ) (2022-05-06T15:24:33Z) - Natural Language Inference with Self-Attention for Veracity Assessment
of Pandemic Claims [54.93898455714295]
まず、COVID-19に関する異質なクレームからなる新しいPANACEAデータセットの構築について述べる。
そこで我々は,自然言語推論に基づく自動妥当性評価のための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-05T12:11:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。