論文の概要: Who Owns the AI Recommendation? A Multi-Industry Empirical Map of Brand Category Ownership Across Large Language Models
- arxiv url: http://arxiv.org/abs/2606.23057v1
- Date: Mon, 22 Jun 2026 09:10:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 00:24:44.906276
- Title: Who Owns the AI Recommendation? A Multi-Industry Empirical Map of Brand Category Ownership Across Large Language Models
- Title(参考訳): AIレコメンデーションを誰が所有するか? 大規模言語モデル全体にわたるブランドカテゴリーオーナーシップのマルチ産業的実証マップ
- Authors: Dmitrij Żatuchin,
- Abstract要約: 50のブランド、5つの業界、250のブランドなしカテゴリークエリにまたがる3,750の回答。
カテゴリー内の言及のシェアであるカテゴリー所有者指数(COI)、競合真空指数(CVI)、単一リーダを持たないカテゴリのフラグ付け、ブランド間の非対称置換の定量化である変位スコア(DS)の3つの探索指標を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models now mediate how buyers discover products and services, making the competitive structure of AI-generated recommendations a strategic concern for brands. A basic question has lacked large-scale empirical answers: in a given category, which brand does a model recommend, and how concentrated is that ownership? Across 3,750 responses spanning 50 brands, five industries, and 250 brand-free category queries on three models (GPT-5.2, Google Gemini 3 Flash, and Perplexity sonar-pro), each query repeated five times under a dice-roll stability protocol, we propose three exploratory metrics: the Category Ownership Index (COI), a brand's share of mentions within a category; the Competitive Vacuum Index (CVI), flagging categories with no single leader; and the Displacement Score (DS), quantifying asymmetric substitution between brand pairs. In this sample, recommendation concentration was moderate: the mean Gini coefficient was 0.28 (95% CI [0.16, 0.41]), below the 0.60 power-law threshold we set. Competitive vacuums were rare, appearing in 8.0% of queries, so the models named at least one sampled brand in most cases. Cross-model agreement on the top-recommended brand was 41.6%: a top position on one model did not reliably hold on another. Displacement was industry-dependent, from co-recommendation in consulting (0.4:1) to one-directional substitution up to 4.3:1, with an unweighted mean of 2.4:1 across the five industries. A BERTopic check placed only 4.2% of discovered topic clusters outside the original categories. Within the scope studied, these results sit in tension with a strong winner-takes-all narrative around AI recommendation, and the three metrics offer a candidate, reproducible procedure for competitive-intelligence analysis that future work can validate.
- Abstract(参考訳): 大規模な言語モデルは、購入者が製品やサービスを発見する方法を仲介し、AI生成レコメンデーションの競争構造をブランドにとって戦略的関心事にする。
与えられたカテゴリでは、どのブランドが推奨するか、そのオーナシップはどの程度集中しているか?
5つのモデル(GPT-5.2、Google Gemini 3 Flash、Perplexity Sonar-pro)で、50のブランド、5つの業界、5つの業界、250のブランドを含まないカテゴリクエリにまたがる3750の回答に対して、各クエリはダイスロール安定プロトコルの下で5回繰り返し、カテゴリ内のブランドの言及のシェアであるカテゴリーオーナシップ指数(COI)、競合真空指数(CVI)、単一リーダを持たないカテゴリのフラグ付け、ブランドペア間の対称置換の定量化という3つの探索的指標を提案する。
この試料では, 推奨濃度は0.28(95% CI [0.16, 0.41])であり, 基準値0.60以下であった。
競合真空はまれであり、クエリの8.0%に現れるため、ほとんどの場合、少なくとも1つのサンプルブランドを名付けている。
トップリコメンデーションブランドのクロスモデル契約は41.6%で、1つのモデルでトップの地位は確実に他のモデルに留まらなかった。
転職は、コンサルティングにおける共同勧告(0.4:1)から、最大4.3:1までの1方向の代替まで、業界に依存していた。
BERTopicのチェックでは、発見されたトピッククラスタのわずか4.2%が、元のカテゴリの外に置かれていた。
調査対象の範囲内では、これらの結果はAIレコメンデーションに関する強力な勝者の物語と緊張関係にあり、3つのメトリクスは、将来の作業が検証可能な、競争的知能分析の候補で再現可能な手順を提供する。
関連論文リスト
- Incumbent Advantage: Brand Bias and Cognitive Manipulation Dynamics in LLM Recommendation Systems [7.25871718341051]
大型言語モデル(LLM)を用いたスキンケア製品検索におけるブランドダイナミクスの研究
有名ブランドが、すべての製品が同じ仕様を持つ時間に100%推奨されることは分かっていますが、この優位性は、競合製品にとって+0.1星以下の評価優位性で消えます。
この結果から, 生産エンジン最適化 (GEO) は, 市場競争を形作る新たなマーケティング手法として研究されるべきであることが示唆された。
論文 参考訳(メタデータ) (2026-06-16T02:54:34Z) - Knowledge Index of Noah's Ark [63.143852586221534]
KINAは,261分野にわたる899項目のベンチマークである。
ボーナス・オン・バートーナメントがFOSDを弱く支配していることを示す。
トップモデルであるGemini-3.1-Pro-Previewは53.17%、Claude-Opus-4.6は49.92%、GPT-5.4は48.55%に達した。
論文 参考訳(メタデータ) (2026-06-03T17:06:49Z) - Persona Conditioning of Brand Recommendations in Retrieval-Augmented Commercial Chat: A Prominence-Stratified Cross-Provider Audit [0.0]
モデルが推奨するブランドの状況変化がどれほど強く影響するかを監査します。
監査サンプル2,000は、10のペルソナ x 8 の設計空間上で実行され、x 3 モデル構成 x N=10 のレポジトリがプロンプトされる。
AIブランドの認識のあらゆる測定は、クエリを提供する購入者ペルソナに条件を定めなければならない。
論文 参考訳(メタデータ) (2026-05-28T16:43:38Z) - Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs [86.49905745865038]
Soohakは64人の数学者によって新たに書かれた439プロブレムのベンチマークである。
データセットは2026年後半に公開され、中間で要求に応じてモデル評価が利用可能になる。
論文 参考訳(メタデータ) (2026-05-09T17:14:22Z) - Benchmark^2: Systematic Evaluation of LLM Benchmarks [66.2731798872668]
3つの相補的なメトリクスからなる包括的なフレームワークであるBenchmark2を提案する。
数学、推論、知識ドメインにまたがる15のベンチマークで実験を行います。
本分析により,既存のベンチマーク間での有意な品質変化が明らかとなり,選択的なベンチマーク構築が同等な評価性能を達成できることが示されている。
論文 参考訳(メタデータ) (2026-01-07T14:59:03Z) - No-Human in the Loop: Agentic Evaluation at Scale for Recommendation [11.764010898952677]
大規模言語モデル(LLM)を判断として評価することは、スケーラブルで信頼性の高い評価パイプラインを構築する上でますます重要になっている。
我々は、GPT、Gemini、Claude、Llamaを含む36のLLMを体系的に比較する大規模なベンチマーク研究であるScalingEvalを紹介する。
当社のマルチエージェントフレームワークは、パターン監査を集約し、スケーラブルな多数決投票を通じて、地味なラベルにコードを発行します。
論文 参考訳(メタデータ) (2025-11-04T22:49:39Z) - Creativity Benchmark: A benchmark for marketing creativity for large language models [0.509780930114934]
Creativity Benchmarkは、マーケティングのクリエイティビティにおける大規模言語モデル(LLM)の評価フレームワークである。
このベンチマークは100のブランド(12のカテゴリ)と3つのプロンプトタイプ(Insights, Ideas, Wild Ideas)をカバーする。
論文 参考訳(メタデータ) (2025-09-05T04:44:29Z) - Advancing LLM Reasoning Generalists with Preference Trees [119.57169648859707]
推論に最適化された大規模言語モデル(LLM)のスイートであるEulusを紹介する。
Eurusモデルは、様々なベンチマークでオープンソースのモデルの間で最先端の結果を得る。
論文 参考訳(メタデータ) (2024-04-02T16:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。