論文の概要: The Novelty Bottleneck: A Framework for Understanding Human Effort Scaling in AI-Assisted Work
- arxiv url: http://arxiv.org/abs/2603.27438v1
- Date: Sat, 28 Mar 2026 22:50:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.957183
- Title: The Novelty Bottleneck: A Framework for Understanding Human Effort Scaling in AI-Assisted Work
- Title(参考訳): The Novelty Bottleneck:AI支援作業におけるヒューマンエクササイズ理解のためのフレームワーク
- Authors: Jacky Liang,
- Abstract要約: 新規性ボトルネックと呼ばれるメカニズムを分離した人間とAIのコラボレーションモデルを提案する。
モデルはタスクが原子的な決定に分解されると仮定する。
私たちの貢献は、人間の努力が線形にスケールしなければならないという証拠ではありません。
- 参考スコア(独自算出の注目度): 4.726153739634646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a stylized model of human-AI collaboration that isolates a mechanism we call the novelty bottleneck: the fraction of a task requiring human judgment creates an irreducible serial component analogous to Amdahl's Law in parallel computing. The model assumes that tasks decompose into atomic decisions, a fraction $ν$ of which are "novel" (not covered by the agent's prior), and that specification, verification, and error correction each scale with task size. From these assumptions, we derive several non-obvious consequences: (1) there is no smooth sublinear regime for human effort it transitions sharply from $O(E)$ to $O(1)$ with no intermediate scaling class; (2) better agents improve the coefficient on human effort but not the exponent; (3) for organizations of n humans with AI agents, optimal team size decreases with agent capability; (4) wall-clock time achieves $O(\sqrt{E})$ through team parallelism but total human effort remains $O(E)$; and (5) the resulting AI safety profile is asymmetric -- AI is bottlenecked on frontier research but unbottlenecked on exploiting existing knowledge. We show these predictions are consistent with empirical observations from AI coding benchmarks, scientific productivity data, and practitioner reports. Our contribution is not a proof that human effort must scale linearly, but a framework that identifies the novelty fraction as the key parameter governing AI-assisted productivity, and derives consequences that clarify -- rather than refute -- prevalent narratives about intelligence explosions and the "country of geniuses in a data center."
- Abstract(参考訳): 本稿では,人間の判断を必要とするタスクのごく一部が,並列計算におけるAmdahlの法則に類似した既約シリアル成分を生成する,新規性ボトルネックと呼ばれるメカニズムを分離する,人間とAIの協調のスタイリングモデルを提案する。
モデルでは、タスクはアトミックな決定に分解され、その分数$ν$は"ノーベル"であり(エージェントの以前の定義ではカバーされていない)、その仕様、検証、エラー訂正の各スケールがタスクサイズであると仮定する。
これらの仮定から、(1) 人間の努力にスムーズなサブリニアな体制が存在しない、(2) 中間スケーリングクラスなしで、自動的にO(E) から$O(1) に遷移する、(2) より良いエージェントが人間の努力の係数を向上するが、指数ではない、(3) エージェントエージェントを持つ人間にとって、最適なチームサイズはエージェント能力によって減少する、(4) ウォールクロック時間はチームの並列化を通じて$O(\sqrt{E}) を達成できるが、全体の人間の努力は$O(E) に留まる、(5) 結果として得られるAIの安全プロファイルは対称である。
これらの予測は、AIコーディングベンチマーク、科学的生産性データ、実践者レポートからの経験的な観察と一致していることを示す。
私たちの貢献は、人間の努力が線形にスケールしなければならないという証拠ではなく、AIが支援する生産性を規定する重要なパラメータとして、新規度分を識別するフレームワークであり、人工知能の爆発と“データセンターにおける天才の国”に関する一般的な物語を、否定するよりも、明らかにする結果を引き出すものです。
関連論文リスト
- When AI Levels the Playing Field: Skill Homogenization, Asset Concentration, and Two Regimes of Inequality [0.7016842616745783]
生成AIは、経済価値を集中的な補完資産にシフトしながら、タスク内スキルの違いを圧縮する。
我々は、この緊張関係を内在的教育、雇用主検診、異種企業によるタスクベースモデルで定式化する。
このモデルでは、境界がAIの技術構造に依存する2つのレジームが生成される。
論文 参考訳(メタデータ) (2026-03-05T12:41:08Z) - Human-AI Collaborative Uncertainty Quantification [26.38833436936642]
我々は、AIモデルが人間の専門家の提案する予測セットをいかに洗練するかを形式化するフレームワークであるHuman AI Collaborative Uncertainty Quantificationを紹介する。
最適協調予測セットは1つのスコア関数上の直感的な2つのしきい値構造に従っており、古典的な結果を共形予測で拡張することを示す。
画像分類、回帰、テキストベースの医学的意思決定に関する実験は、協調予測セットがエージェント単独よりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2025-10-27T16:11:23Z) - AI Agents as Universal Task Solvers [94.49762121230042]
我々は,過去のデータを用いて,普遍的な解法が達成できる最適なスピードアップが,アルゴリズム情報と密接な関係があることを示す。
我々は、推論モデルをスケールする際に最適化する重要な量は時間であり、学習における重要な役割は、これまでは間接的にのみ考慮されてきたと論じている。
論文 参考訳(メタデータ) (2025-10-14T02:17:54Z) - Impatient Users Confuse AI Agents: High-fidelity Simulations of Human Traits for Testing Agents [58.00130492861884]
TraitBasisは、AIエージェントを体系的にストレステストするための軽量でモデルに依存しない方法である。
TraitBasisは、ステアブルなユーザ特性に対応するアクティベーション空間で方向を学習する。
We observed on average a 2%-30% performance degradation on $tau$-Trait across frontier model。
論文 参考訳(メタデータ) (2025-10-06T05:03:57Z) - Idempotent Equilibrium Analysis of Hybrid Workflow Allocation: A Mathematical Schema for Future Work [0.0]
大規模なAIシステムは、仕事をどのように人と機械に分割するかを変えようとしている。
我々は、この位置を反復的タスクデリゲーション写像として定式化し、その過程が安定な等等均衡に収束することを示す。
我々は、「センタウル」な人間とAIの連携を促進する政策は、福祉を最大化する固定点に向けて経済を操ることができると論じる。
論文 参考訳(メタデータ) (2025-08-02T11:28:34Z) - Explainable AI for Collaborative Assessment of 2D/3D Registration Quality [50.65650507103078]
本稿では,2D/3D登録品質検証に特化して訓練された最初の人工知能フレームワークを提案する。
我々の説明可能なAI(XAI)アプローチは、人間のオペレーターに対する情報意思決定を強化することを目的としている。
論文 参考訳(メタデータ) (2025-07-23T15:28:57Z) - Scalable, Symbiotic, AI and Non-AI Agent Based Parallel Discrete Event Simulations [0.0]
本稿では,複数のAIエージェントと非AIエージェントを組み合わせた並列離散イベントシミュレーション(PDES)手法を提案する。
我々は、4つの異なるドメインから4つの問題を解き、その結果をAIモデルだけで比較することで、我々のアプローチを評価する。
その結果,バニラモデルの精度が23%未満であるため,アプローチ全体の精度は68%であった。
論文 参考訳(メタデータ) (2025-05-28T17:50:01Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - REBEL: Reward Regularization-Based Approach for Robotic Reinforcement Learning from Human Feedback [61.54791065013767]
報酬関数と人間の嗜好の相違は、現実世界で破滅的な結果をもたらす可能性がある。
近年の手法は、人間の嗜好から報酬関数を学習することで、不適応を緩和することを目的としている。
本稿では,ロボットRLHFフレームワークにおける報酬正規化の新たな概念を提案する。
論文 参考訳(メタデータ) (2023-12-22T04:56:37Z) - Is the Most Accurate AI the Best Teammate? Optimizing AI for Teamwork [54.309495231017344]
AIシステムは人間中心の方法でトレーニングされ、チームのパフォーマンスに直接最適化されるべきである、と私たちは主張する。
我々は,AIレコメンデーションを受け入れるか,あるいはタスク自体を解決するかを選択する,特定のタイプのAIチームを提案する。
実世界の高精度データセット上での線形モデルと非線形モデルによる実験は、AIが最も正確であることは、最高のチームパフォーマンスに繋がらないことを示している。
論文 参考訳(メタデータ) (2020-04-27T19:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。