論文の概要: Old Fictions, New Skins: Evaluating the Manipulative Capabilities of LLMs in Healthcare
- arxiv url: http://arxiv.org/abs/2606.21977v1
- Date: Sat, 20 Jun 2026 10:19:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 23:26:25.107771
- Title: Old Fictions, New Skins: Evaluating the Manipulative Capabilities of LLMs in Healthcare
- Title(参考訳): 旧フィクションと新皮膚 : 医療におけるLDMの操作能力の評価
- Authors: Gathoni Ireri, Roger D. Odipo,
- Abstract要約: 大型言語モデル(LLM)は、アフリカの医療分野でますますパイロット化されている。
ケニアの参加者のうち,ChatGPT 5.2とDeepSeek V3.2の2つのモデルの操作能力について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) are increasingly piloted in African healthcare contexts, raising concerns about their potential to manipulate users in high-stakes settings. In a randomised experiment, we examined the manipulative capabilities of two publicly available models, ChatGPT 5.2 and DeepSeek V3.2, among Kenyan participants (N = 303). Participants interacted with either a manipulative variant or a non-manipulative variant before making a treatment decision within a hypothetical clinical scenario. The manipulative variant was prompted to covertly steer participants towards an incorrect treatment option while the non-manipulative variant served as the control condition. Manipulation success rates were higher in the manipulative condition (59.5%) than in the control condition (44.0%), with the effect reaching significance (OR = 2.11, 95% CI [1.12, 4.00], p = .021). These findings highlight the need for improved safety infrastructure specifically targeting manipulation, particularly given the integration of AI into healthcare systems across Africa.
- Abstract(参考訳): 大きな言語モデル(LLM)は、アフリカの医療の文脈でますますパイロット化され、ユーザを高い状況で操作する可能性への懸念が高まっている。
ランダム化実験では,ケニアの参加者(N = 303)のうち,ChatGPT 5.2とDeepSeek V3.2の2つの公用モデルの操作能力について検討した。
被験者は、仮説的臨床シナリオ内で治療決定を行う前に、操作的変種または非操作的変種のいずれかと相互作用した。
操作型は非操作型が制御条件として機能する間、非操作型は非操作型が不正な治療オプションに隠れて参加者を操るよう促された。
マニピュレーション成功率(59.5%)はコントロール条件(44.0%)よりも高い値を示した(OR = 2.11, 95% CI [1.12, 4.00], p = .021)。
これらの発見は、特にアフリカ全域の医療システムにAIが統合されていることを考えると、特に操作を対象とする安全インフラの改善の必要性を強調している。
関連論文リスト
- The Illusion of Intervention: Your LLM-Simulated Experiment is an Observational Study [56.649987197786096]
大規模言語モデル(LLM)は人間の行動のシミュレータとしての可能性を示している。
LLMは潜在ユーザ属性の意図しないシフトを誘発し、ユーザのドリフトを引き起こす。
ユーザのドリフトによって生じる不確実性や選択バイアスを形式化する。
論文 参考訳(メタデータ) (2026-05-20T06:09:41Z) - Do No Harm? Hallucination and Actor-Level Abuse in Web-Deployed Medical Large Language Models [1.2326533234282089]
Web 対応医療用大規模言語モデル (LLM) は幻覚、ポリシー非準拠、安全でない設計のリスクを生じさせる。
我々は,6,233個のMedGPTを大規模に評価し,1500個の成層試料と10個のオープンソースLCMについて評価した。
その結果,25~30%のMedGPTでは,下層モデルと中層モデルが最もリスクが高い事実精度が低いことがわかった。
論文 参考訳(メタデータ) (2026-05-20T00:57:59Z) - Psychological Steering of Large Language Models [28.317905150128595]
セマンティックな非有界単位において、流速に制約されたスイープを実行する心理的ステアリングフレームワークを導入する。
本手法は心理的アーティファクトを用いて残流注入を誘導・校正する。
MDインジェクションはリニア表現仮説と一致し、心理的ステアリングのための信頼性の高いほぼ線形制御ノブを提供する。
論文 参考訳(メタデータ) (2026-04-15T22:45:59Z) - Surg-R1: A Hierarchical Reasoning Foundation Model for Scalable and Interpretable Surgical Decision Support with Multi-Center Clinical Validation [51.897472694590356]
Surg-R1は4段階のパイプラインで訓練された階層的推論によってギャップに対処する手術的視覚言語モデルである。
提案手法では,(1)知覚的根拠,関係理解,文脈的推論に外科的解釈を分解する3段階の推論階層,(2)320,000の推論ペアを持つ最大の外科的チェーン・オブ・シークエンス・データセット,の3つの重要な貢献を紹介する。
論文 参考訳(メタデータ) (2026-03-12T20:26:28Z) - MedOmni-45°: A Safety-Performance Benchmark for Reasoning-Oriented LLMs in Medicine [69.08855631283829]
我々は,操作的ヒント条件下での安全性能トレードオフの定量化を目的としたベンチマークであるMed Omni-45 Degreesを紹介する。
6つの専門分野にまたがる1,804の推論に焦点を当てた医療質問と3つのタスクタイプが含まれており、その中にはMedMCQAの500が含まれる。
結果は、モデルが対角線を超えることなく、一貫した安全性と性能のトレードオフを示す。
論文 参考訳(メタデータ) (2025-08-22T08:38:16Z) - A novel language model for predicting serious adverse event results in clinical trials from their prospective registrations [8.134674449860668]
臨床治験における重症事象 (SAE) の予測法について, 登録情報のみを用いて検討した。
臨床Trials.govの2腕平行介入臨床試験を22,107回行った。
論文 参考訳(メタデータ) (2025-07-21T07:56:06Z) - Clinical knowledge in LLMs does not translate to human interactions [2.523178830945285]
大規模言語モデル (LLMs) が, 基礎疾患を特定し, 10 つの医療シナリオにおいて行動経路を選択する上で, 一般市民を支援することができるかどうかを検証した。
LLMは単独でテストを行い、94.9%のケースの条件を正確に特定し、平均56.3%のケースで配置した。
同じLSMを使用する参加者は34.5%未満のケースで関連する条件を特定し、44.2%未満で配置した。
論文 参考訳(メタデータ) (2025-04-26T13:32:49Z) - Human Decision-making is Susceptible to AI-driven Manipulation [87.24007555151452]
AIシステムは、ユーザの認知バイアスと感情的な脆弱性を利用して、有害な結果に向けてそれらを操縦する。
本研究では、経済的・感情的な意思決定の文脈におけるこのような操作に対する人間の感受性について検討した。
論文 参考訳(メタデータ) (2025-02-11T15:56:22Z) - A Deep Q-learning/genetic Algorithms Based Novel Methodology For
Optimizing Covid-19 Pandemic Government Actions [63.669642197519934]
我々はSEIR疫学モデルを用いて、人口の時間とともにウイルスウイルスの進化を表現している。
報酬システムにより、アクションのシーケンス(統合、自己同化、二メートル距離、制限を取らない)を評価する。
どちらの意味でも、パンデミックの悪影響を抑えるために政府が取るべき行動を発見する上で、我々の方法論が有効な手段であることを実証する。
論文 参考訳(メタデータ) (2020-05-15T17:17:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。