論文の概要: What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce
- arxiv url: http://arxiv.org/abs/2508.02630v1
- Date: Mon, 04 Aug 2025 17:19:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.452679
- Title: What Is Your AI Agent Buying? Evaluation, Implications and Emerging Questions for Agentic E-Commerce
- Title(参考訳): AIエージェントの購入状況 : エージェントEコマースにおける評価,含意,創発的質問
- Authors: Amine Allouah, Omar Besbes, Josué D Figueroa, Yash Kanoria, Akshit Kumar,
- Abstract要約: 視覚言語モデル(VLM)エージェントは、Webページを解析し、製品を評価し、取引することができる。
これは、AIエージェントが何を買うのか、なぜ何を買うのか、という根本的な疑問を提起する。
プラットフォームに依存しないVLMエージェントと完全にプログラム可能なモックマーケットプレースを組み合わせたサンドボックス環境であるACESを開発した。
- 参考スコア(独自算出の注目度): 2.5547074892882105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Online marketplaces will be transformed by autonomous AI agents acting on behalf of consumers. Rather than humans browsing and clicking, vision-language-model (VLM) agents can parse webpages, evaluate products, and transact. This raises a fundamental question: what do AI agents buy, and why? We develop ACES, a sandbox environment that pairs a platform-agnostic VLM agent with a fully programmable mock marketplace to study this question. We first conduct basic rationality checks in the context of simple tasks, and then, by randomizing product positions, prices, ratings, reviews, sponsored tags, and platform endorsements, we obtain causal estimates of how frontier VLMs actually shop. Models show strong but heterogeneous position effects: all favor the top row, yet different models prefer different columns, undermining the assumption of a universal "top" rank. They penalize sponsored tags and reward endorsements. Sensitivities to price, ratings, and reviews are directionally human-like but vary sharply in magnitude across models. Motivated by scenarios where sellers use AI agents to optimize product listings, we show that a seller-side agent that makes minor tweaks to product descriptions, targeting AI buyer preferences, can deliver substantial market-share gains if AI-mediated shopping dominates. We also find that modal product choices can differ across models and, in some cases, demand may concentrate on a few select products, raising competition questions. Together, our results illuminate how AI agents may behave in e-commerce settings and surface concrete seller strategy, platform design, and regulatory questions in an AI-mediated ecosystem.
- Abstract(参考訳): オンラインマーケットプレイスは、消費者に代わって行動する自律型AIエージェントによって変革される。
人間が閲覧したりクリックしたりするのではなく、視覚言語モデル(VLM)エージェントはWebページを解析したり、製品を評価したり、取引したりすることができる。
これは、AIエージェントが何を買うのか、なぜ何を買うのか、という根本的な疑問を提起する。
プラットフォームに依存しないVLMエージェントと完全にプログラム可能なモックマーケットプレースを組み合わせたサンドボックス環境であるACESを開発した。
まず、簡単なタスクの文脈で基本的な合理性チェックを行い、その後、製品の位置、価格、評価、レビュー、スポンサー付きタグ、プラットフォームの支持をランダムにすることで、フロンティアのVLMが実際にどのように買い物をするかの因果推定を得る。
モデルは強いがヘテロジニアスな位置効果を示す: すべてがトップ行を好むが、異なるモデルは異なる列を好んでおり、普遍的な「トップ」ランクの仮定を損なう。
彼らはスポンサー付タグと報酬の支持を罰する。
価格、評価、レビューに対する感受性は、方向性は人間に似ているが、モデルによって大きく異なる。
売り手がAIエージェントを使用して商品の上場を最適化するシナリオによって動機付けられ、AI購入者の好みをターゲットとした、製品の説明を微調整する売り手側のエージェントが、AIによるショッピングが優位になれば、市場シェアの大幅な増加をもたらす可能性があることを示す。
また、モダル製品の選択はモデルによって異なる可能性があり、場合によっては需要はいくつかの製品に集中し、競争上の疑問を提起することもある。
我々の結果は、AIエージェントがEコマースの設定でどのように振る舞うかを照らし、AIを介するエコシステムにおける具体的な売り手戦略、プラットフォーム設計、規制に関する質問を表面化する。
関連論文リスト
- Agentic AI and Multiagentic: Are We Reinventing the Wheel? [0.0]
AI Agenticという言葉は、基本的にAIエージェントのバズワードとしてよく使われ、AI Multiagenticはマルチエージェントシステムのバズワードとして使われる。
この混乱は、自律エージェントとマルチエージェントシステムの分野における数十年の研究を見落としている。
この論文は、科学と技術に関する厳密さと、AIにおける最先端技術から確立された用語の使用を提唱している。
論文 参考訳(メタデータ) (2025-06-02T09:19:11Z) - The Automated but Risky Game: Modeling Agent-to-Agent Negotiations and Transactions in Consumer Markets [12.107940385598127]
消費者と商店双方がAIエージェントを承認し、交渉と取引を完全に自動化する将来のシナリオについて検討する。
我々の発見によると、AIによる取引は本質的に不均衡なゲームであり、異なるエージェントがユーザーに対して著しく異なる結果をもたらす。
ユーザーはAIエージェントにビジネス上の決定を委譲する際に注意を払わなければならない。
論文 参考訳(メタデータ) (2025-05-29T17:41:39Z) - AGI Is Coming... Right After AI Learns to Play Wordle [4.2909314120969855]
マルチモーダルエージェント、特にOpenAIのComputer-User Agent (CUA)は、人間のように標準的なコンピュータインターフェースを通じてタスクを制御および完了するよう訓練されている。
The New York Times Wordle game におけるエージェントのパフォーマンスを評価し,モデル行動の抽出と欠点の同定を行った。
論文 参考訳(メタデータ) (2025-04-21T20:58:58Z) - Responsible AI Agents [17.712990593093316]
OpenAI、Google、Microsoft、Salesforceといった企業は、AI Agentsが受動的テキストからタスク実行に移行することを約束している。
AIエージェントの潜在的なパワーは、AIエージェントが不正な商取引、人間の操作、爆発的な破壊、知的財産の被害を可能にするという法律学者の恐れを加速させた。
この記事では、AIエージェントの方向性に関する懸念に対処する。
それは、あるソフトウェアが別のソフトウェアとどのように相互作用するかという中核的な側面が、AIエージェントを規律づける方法を生み出し、望ましくない行動が起こりそうにないことを示している。
論文 参考訳(メタデータ) (2025-02-25T16:49:06Z) - Fundamental Risks in the Current Deployment of General-Purpose AI Models: What Have We (Not) Learnt From Cybersecurity? [60.629883024152576]
大規模言語モデル(LLM)は、幅広いユースケースで急速にデプロイされている。
OpenAIs Alteraは、自律性の向上、データアクセス、実行機能の一例に過ぎない。
これらの方法には、さまざまなサイバーセキュリティ上の課題が伴う。
論文 参考訳(メタデータ) (2024-12-19T14:44:41Z) - TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [52.46737975742287]
我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。
最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。
これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文 参考訳(メタデータ) (2024-12-18T18:55:40Z) - Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards
and Ethical Behavior in the MACHIAVELLI Benchmark [61.43264961005614]
我々は、50万以上のリッチで多様なシナリオを含む134個のChoose-Your-Own-Adventureゲームのベンチマークを開発する。
我々は、エージェントの傾向をパワー・シーキングと評価し、不使用を生じさせ、倫理的違反を犯す。
以上の結果から,エージェントは有能かつ道徳的に行動できることが示唆された。
論文 参考訳(メタデータ) (2023-04-06T17:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。