論文の概要: Effects of Generative AI Errors on User Reliance Across Task Difficulty
- arxiv url: http://arxiv.org/abs/2604.04319v1
- Date: Sun, 05 Apr 2026 23:54:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.042165
- Title: Effects of Generative AI Errors on User Reliance Across Task Difficulty
- Title(参考訳): タスク難易度を越えたユーザ信頼度に及ぼす生成AIエラーの影響
- Authors: Jacy Reese Anthis, Hannah Cha, Solon Barocas, Alexandra Chouldechova, Jake Hofman,
- Abstract要約: 生成AI出力の誤差とユーザ依存に対するテスト効果を誘導する。
より簡単あるいは難しい図生成タスクにおいて,10%,30%,50%のエラー率で事前に登録した3x2実験でインターフェースを実証する。
その結果, 簡単なタスクエラーは, ハードタスクエラー以上の使用率を著しく低下させるものではないことが明らかとなり, この実験環境では, 人々がジャグネスに逆らわないことが示唆された。
- 参考スコア(独自算出の注目度): 48.30228856226023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The capabilities of artificial intelligence (AI) lie along a jagged frontier, where AI systems surprisingly fail on tasks that humans find easy and succeed on tasks that humans find hard. To investigate user reactions to this phenomenon, we developed an incentive-compatible experimental methodology based on diagram generation tasks, in which we induce errors in generative AI output and test effects on user reliance. We demonstrate the interface in a preregistered 3x2 experiment (N = 577) with error rates of 10%, 30%, or 50% on easier or harder diagram generation tasks. We confirmed that observing more errors reduces use, but we unexpectedly found that easy-task errors did not significantly reduce use more than hard-task errors, suggesting that people are not averse to jaggedness in this experimental setting. We encourage future work that varies task difficulty at the same time as other features of AI errors, such as whether the jagged error patterns are easily learned.
- Abstract(参考訳): 人工知能(AI)の能力はギザギザのフロンティアに沿ってあり、AIシステムは、人間が簡単に見つけられるタスクで驚くほど失敗し、人間が難しいと思うタスクで成功する。
この現象に対するユーザ反応を調べるために,図生成タスクに基づくインセンティブに適合した実験手法を開発し,生成AI出力のエラーを誘発し,ユーザ依存に対するテスト効果を誘導する。
より容易あるいは難しいダイアグラム生成タスクにおいて,10%,30%,50%のエラー率で,事前に登録した3x2実験(N = 577)でインターフェースを実証した。
我々は、より多くのエラーを観測すると使用が減少することを確認したが、予期せぬことに、簡単なタスクエラーはハードタスクエラー以上の使用を著しく減らすことはなく、この実験環境では人々がジャグネスに逆らわないことを示唆した。
我々は、AIエラーの他の特徴と同時にタスクの難易度を変える将来の作業、例えば、タグ付きエラーパターンを簡単に学習できるかどうかを奨励する。
関連論文リスト
- The Hot Mess of AI: How Does Misalignment Scale With Model Intelligence and Task Complexity? [53.15349353876531]
AIがより有能になるにつれて、より汎用的で簡潔なタスクを委任します。
我々はAIモデルによる誤りのバイアス分散分解を用いてこの問題を運用する。
より有能なAIはより困難なタスクを追求し、よりシーケンシャルな行動と思考を必要とするので、私たちの結果は失敗がより一貫性のない行動を伴うことを予測します。
論文 参考訳(メタデータ) (2026-01-30T14:52:03Z) - AGI Is Coming... Right After AI Learns to Play Wordle [4.2909314120969855]
マルチモーダルエージェント、特にOpenAIのComputer-User Agent (CUA)は、人間のように標準的なコンピュータインターフェースを通じてタスクを制御および完了するよう訓練されている。
The New York Times Wordle game におけるエージェントのパフォーマンスを評価し,モデル行動の抽出と欠点の同定を行った。
論文 参考訳(メタデータ) (2025-04-21T20:58:58Z) - Human-AI Collaborative Game Testing with Vision Language Models [0.0]
本研究では,AI支援ワークフローの開発と実験により,AIがゲームテストを改善する方法について検討する。
我々は、AIサポートの有無、欠陥や設計資料の詳細な知識の有無の4つの条件下で、AIアシストの有効性を評価する。
その結果、特に詳細な知識と組み合わせた場合、AIアシストは欠陥識別性能を著しく改善することが示された。
論文 参考訳(メタデータ) (2025-01-20T23:14:23Z) - Guiding Through Complexity: What Makes Good Supervision for Hard Math Reasoning Tasks? [74.88417042125985]
複雑さの異なるタスクにおいて、様々な品質レベルで監視データを提供する様々なデータ駆動戦略について検討する。
ハードタスクの監視における結果エラー率が高い場合でも、そのようなデータによるトレーニングは、より簡単なサブタスクの監督を完璧に上回ります。
また,本研究の結果から,タスク・インスペクションとサブタスク・インスペクションを補完することで,顕著なパフォーマンス向上が期待できることがわかった。
論文 参考訳(メタデータ) (2024-10-27T17:55:27Z) - Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Assessing Student Errors in Experimentation Using Artificial
Intelligence and Large Language Models: A Comparative Study with Human Raters [9.899633398596672]
学生の誤りを自動的に識別するLarge Language Models (LLMs) の可能性を検討する。
GPT-3.5とGPT-4をベースとしたAIシステムを開発・試験した。
以上の結果から,AIシステムとレーダ間の誤差検出における精度の差が示唆された。
論文 参考訳(メタデータ) (2023-08-11T12:03:12Z) - Human and AI Perceptual Differences in Image Classification Errors [13.045020949359621]
本研究はまず,2つの情報源からの誤りの統計的分布を分析し,課題難易度がこれらの分布に与える影響について検討する。
AIがトレーニングデータから優れたモデルを学び、全体的な精度で人間を上回ったとしても、これらのAIモデルは人間の知覚と有意で一貫した違いを持つ。
論文 参考訳(メタデータ) (2023-04-18T05:09:07Z) - Human Decision Makings on Curriculum Reinforcement Learning with
Difficulty Adjustment [52.07473934146584]
我々は,カリキュラム強化学習結果を,人的意思決定プロセスから学ぶことで,難しすぎず,難しすぎるような望ましいパフォーマンスレベルに導く。
本システムは非常に並列化可能であり,大規模強化学習アプリケーションの訓練が可能となる。
強化学習性能は、人間の所望の難易度と同期してうまく調整できることが示される。
論文 参考訳(メタデータ) (2022-08-04T23:53:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。