論文の概要: Artificial Intelligence health advice accuracy varies across languages and contexts
- arxiv url: http://arxiv.org/abs/2504.18310v1
- Date: Fri, 25 Apr 2025 12:37:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.764691
- Title: Artificial Intelligence health advice accuracy varies across languages and contexts
- Title(参考訳): 人工知能の健康アドバイスの精度は言語や文脈によって異なる
- Authors: Prashant Garg, Thiemo Fetzer,
- Abstract要約: 21言語から6つの主要な大規模言語モデルをベンチマークします。
英語中心の教科書の主張に高い精度があるにもかかわらず、性能はヨーロッパ以外の複数の言語で低下している。
我々は、グローバルヘルスコミュニケーションにAIをデプロイする前に、包括的な多言語、ドメイン認識検証の緊急性を強調します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using basic health statements authorized by UK and EU registers and 9,100 journalist-vetted public-health assertions on topics such as abortion, COVID-19 and politics from sources ranging from peer-reviewed journals and government advisories to social media and news across the political spectrum, we benchmark six leading large language models from in 21 languages, finding that, despite high accuracy on English-centric textbook claims, performance falls in multiple non-European languages and fluctuates by topic and source, highlighting the urgency of comprehensive multilingual, domain-aware validation before deploying AI in global health communication.
- Abstract(参考訳): 英国とEUが承認した基本的な健康宣言と9,100人のジャーナリストによる、中絶、COVID-19、政治などのトピックについて、査読されたジャーナルや政府諮問機関から、政治スペクトル全体にわたるソーシャルメディアやニュースまで、さまざまな情報源からの公的な主張を用いて、21言語で主要な6つの言語モデルをベンチマークし、英語中心の教科書の主張に対して高い精度にもかかわらず、パフォーマンスは複数の非ヨーロッパ言語に落ち、トピックやソースによって変動し、グローバルなヘルスコミュニケーションにAIを導入する前に、包括的な多言語、ドメイン認識の検証の緊急性を強調した。
関連論文リスト
- Navigating Text-to-Image Generative Bias across Indic Languages [53.92640848303192]
本研究ではインドで広く話されているIndic言語に対するテキスト・ツー・イメージ(TTI)モデルのバイアスについて検討する。
これらの言語における主要なTTIモデルの生成的パフォーマンスと文化的関連性を評価し,比較する。
論文 参考訳(メタデータ) (2024-08-01T04:56:13Z) - Language Model Alignment in Multilingual Trolley Problems [138.5684081822807]
Moral Machine 実験に基づいて,MultiTP と呼ばれる100以上の言語でモラルジレンマヴィグネットの言語間コーパスを開発する。
分析では、19の異なるLLMと人間の判断を一致させ、6つのモラル次元をまたいだ嗜好を捉えた。
我々は、AIシステムにおける一様道徳的推論の仮定に挑戦し、言語間のアライメントの顕著なばらつきを発見した。
論文 参考訳(メタデータ) (2024-07-02T14:02:53Z) - A Dataset for Pharmacovigilance in German, French, and Japanese: Annotating Adverse Drug Reactions across Languages [17.40961028505384]
本研究は, 患者フォーラム, ソーシャルメディア, 臨床報告, ドイツ語, フランス語, 日本語など, さまざまなソースから収集した副薬物反応に関する多言語コーパスを提示する。
これは、医療のための現実の多言語言語モデルの開発に貢献する。
論文 参考訳(メタデータ) (2024-03-27T08:21:01Z) - Multi-EuP: The Multilingual European Parliament Dataset for Analysis of
Bias in Information Retrieval [62.82448161570428]
このデータセットは、多言語情報検索コンテキストにおける公平性を調べるために設計されている。
真正な多言語コーパスを持ち、24言語すべてに翻訳されたトピックを特徴としている。
文書に関連する豊富な人口統計情報を提供し、人口統計バイアスの研究を容易にする。
論文 参考訳(メタデータ) (2023-11-03T12:29:11Z) - A Commonsense-Infused Language-Agnostic Learning Framework for Enhancing
Prediction of Political Polarity in Multilingual News Headlines [0.0]
対象言語における推論知識を取得するために,翻訳と検索の手法を用いる。
次に、重要な推論を強調するために注意機構を使用します。
我々は、それぞれの政治的極性に注釈を付けた5つのヨーロッパ言語で62.6K以上の多言語ニュースの見出しを提示する。
論文 参考訳(メタデータ) (2022-12-01T06:07:01Z) - Making a MIRACL: Multilingual Information Retrieval Across a Continuum
of Languages [62.730361829175415]
MIRACLは、WSDM 2023 Cupチャレンジのために構築した多言語データセットです。
18の言語にまたがるアドホック検索に焦点を当てている。
我々の目標は、言語連続体における検索を改善する研究を加速させることです。
論文 参考訳(メタデータ) (2022-10-18T16:47:18Z) - COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。
また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。
我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文 参考訳(メタデータ) (2022-01-16T11:47:23Z) - A System for Worldwide COVID-19 Information Aggregation [92.60866520230803]
我々は、トピックによって分類された7言語10の地域から信頼できる記事を含む世界的な新型コロナウイルス情報収集システムを構築した。
ニューラルマシン翻訳モジュールは、他言語の論文を日本語と英語に翻訳する。
記事とトピックのペアデータセットに基づいてトレーニングされたBERTベースのトピック分類器は、ユーザが興味のある情報を効率的に見つけるのに役立つ。
論文 参考訳(メタデータ) (2020-07-28T01:33:54Z) - Fighting the COVID-19 Infodemic: Modeling the Perspective of
Journalists, Fact-Checkers, Social Media Platforms, Policy Makers, and the
Society [37.9389191670008]
新型コロナウイルスは世界保健機関(WHO)にとって最も重要な分野の一つだと宣言されている。
このインフォデミックと戦うことは、世界保健機関(WHO)の最も重要な焦点の1つと宣言されている。
詳細な偽情報分析のために,手動で注釈付きツイート16Kの大規模なデータセットをリリースする。
論文 参考訳(メタデータ) (2020-04-30T18:04:20Z) - A Machine Learning Application for Raising WASH Awareness in the Times
of COVID-19 Pandemic [6.076596440682804]
新型コロナウイルス(COVID-19)のパンデミックは、国の健康を形作るデジタル誤報の可能性を明らかにした。
WashKaroは、会話AI、機械翻訳、自然言語処理による誤情報を緩和するための多言語介入である。
WashKaroは、AIを通じてWHOガイドラインにマッチする適切な情報を提供し、ローカル言語で適切なフォーマットで提供します。
論文 参考訳(メタデータ) (2020-03-16T08:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。