論文の概要: LLMAR: A Tuning-Free Recommendation Framework for Sparse and Text-Rich Industrial Domains
- arxiv url: http://arxiv.org/abs/2604.16379v1
- Date: Wed, 25 Mar 2026 02:49:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.944633
- Title: LLMAR: A Tuning-Free Recommendation Framework for Sparse and Text-Rich Industrial Domains
- Title(参考訳): LLMAR: SparseおよびText-Rich産業ドメインのためのチューニングフリーレコメンデーションフレームワーク
- Authors: Ryogo Hishikawa, Ichiro Kataoka, Shinya Yuda,
- Abstract要約: 産業用B2Bアプリケーションは極端なデータ空間に直面するが、リッチなテキストインタラクションが特徴である。
チューニング不要なフレームワーク LLMAR (LLM-Annotated Recommendation) を提案する。
推論駆動(Inference-Driven)、リフレクションループ(Reflection Loop)、コスト効果アーキテクチャ(Cost-Effective Architecture)の3つのコアコントリビューションを紹介します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial B2B applications (e.g., construction site risk prediction, material procurement) face extreme data sparsity yet feature rich textual interactions. In such environments, traditional ID-based collaborative filtering fails lacking co-occurrence signals, while fine-tuning standard Large Language Models (LLMs) incurs high operational costs and struggles with frequent data drift. We propose LLMAR (LLM-Annotated Recommendation), a tuning-free framework. Moving beyond simple embeddings, LLMAR systematically integrates LLM reasoning to capture user "latent motives" without any training process. We introduce three core contributions: (1) Inference-Driven Annotation: uses LLMs to transform behavioral history into structured semantic motives, enabling reasoning-based matching unattainable by ID-based methods; (2) Reflection Loop: a self-correction mechanism that refines generated queries to mitigate hallucinations and resolve "context competition" between past history and current instructions; and (3) Cost-Effective Architecture: relies on tuning-free components and asynchronous batch processing to minimize maintenance costs. Evaluations on public benchmarks (MovieLens-1M, Amazon Prime Pantry) and a sparse industrial dataset (construction risk prediction) demonstrate that LLMAR outperforms state-of-the-art learning-based models (SASRecF), achieving up to a 54.6% nDCG@10 improvement on the industrial dataset. Inference costs remain highly practical (~$1 per 1,000 users). For B2B domains where strict real-time latency is not critical, combining LLM reasoning with self-verification offers a superior alternative to training-based approaches across accuracy, explainability, and operational cost.
- Abstract(参考訳): 産業用B2Bアプリケーション(例:建設現場のリスク予測、材料調達)は、極端なデータ空間に直面するが、リッチなテキストインタラクションが特徴である。
このような環境では、従来のIDベースの協調フィルタリングは共起シグナルを欠いているが、微調整の標準であるLLM(Large Language Models)は高い運用コストと頻繁なデータドリフトに悩む。
チューニング不要なフレームワーク LLMAR (LLM-Annotated Recommendation) を提案する。
単純な埋め込みを超えて、LLMARはLLM推論を体系的に統合し、トレーニングプロセスなしでユーザ“ラテントモチベーション”をキャプチャする。
Inference-Driven Annotation: LLMを使って行動履歴を構造化された意味的モチベーションに変換し、IDベースの手法で達成不可能な推論ベースのマッチングを可能にする、Reflection Loop: 幻覚を緩和し、過去の履歴と現在の指示の間の"コンテキスト競争"を解決するための自己補正メカニズム、そして、コスト効果アーキテクチャ: チューニング不要コンポーネントと非同期バッチ処理に依存してメンテナンスコストを抑える、3つのコアコントリビューションを紹介します。
パブリックベンチマーク(MovieLens-1M、Amazon Prime Pantry)と、細かな産業データセット(建設リスク予測)による評価では、LLMARは最先端の学習ベースモデル(SASRecF)よりも優れ、工業データセットでは54.6%のnDCG@10の改善を達成している。
推論コストは非常に実用的(1,000人あたり1ドル程度)である。
厳格なリアルタイムレイテンシが重要でないB2Bドメインでは、LSM推論と自己検証を組み合わせることで、正確性、説明可能性、運用コストにまたがるトレーニングベースのアプローチよりも優れた選択肢を提供する。
関連論文リスト
- Federated Reasoning Distillation Framework with Model Learnability-Aware Data Allocation [33.153769672977035]
モデル学習可能性を考慮したデータアロケーションを備えた,連合型推論蒸留フレームワークLaDaを提案する。
LaDaは既存のコラボレーションフレームワーク用のプラグインモジュールとして動作し、モデルの学習可能性ギャップに基づいた知識伝達を適用する。
論文 参考訳(メタデータ) (2026-02-21T08:18:39Z) - DiffuRank: Effective Document Reranking with Diffusion Language Models [71.16830004674513]
拡散言語モデル(dLLM)に基づいて構築されたフレームワークであるDiffuRankを提案する。
dLLMは、左から右への順序に制約されないより柔軟なデコーディングと生成プロセスをサポートする。
モデルサイズが類似した自己回帰LDMに匹敵する性能を示す。
論文 参考訳(メタデータ) (2026-02-13T02:18:14Z) - From Completion to Editing: Unlocking Context-Aware Code Infilling via Search-and-Replace Instruction Tuning [81.97788535387286]
本稿では,エージェントによる検証・編集機構を統一された単一パス推論プロセスに内部化するフレームワークを提案する。
最小限のデータで、SRI-Coderは、ChatモデルがBaseモデルの完了性能を上回ることができる。
FIMスタイルのチューニングとは異なり、SRIは一般的なコーディング能力を保持し、標準のFIMに匹敵する推論遅延を維持する。
論文 参考訳(メタデータ) (2026-01-19T20:33:53Z) - SoliReward: Mitigating Susceptibility to Reward Hacking and Annotation Noise in Video Generation Reward Models [53.19726629537694]
ビデオ生成モデルと人間の好みのトレーニング後のアライメントは、重要な目標である。
現在のデータ収集パラダイムは、プロンプト内のペアワイズアノテーションに依存しており、ノイズのラベル付けに悩まされている。
ビデオRMトレーニングのための体系的フレームワークであるSoliRewardを提案する。
論文 参考訳(メタデータ) (2025-12-17T14:28:23Z) - OR-R1: Automating Modeling and Solving of Operations Research Optimization Problem via Test-Time Reinforcement Learning [44.346973471913856]
本稿では,自動最適化のためのデータ効率トレーニングフレームワークOR-R1を提案する。
実験の結果、OR-R1は平均解法精度が67.7%の最先端性能を達成していることがわかった。
論文 参考訳(メタデータ) (2025-11-12T08:05:31Z) - LMAR: Language Model Augmented Retriever for Domain-specific Knowledge Indexing [42.51773265892766]
Retrieval Augmented Generation (RAG) システムは、事前訓練された埋め込みの性能劣化のためにドメイン固有の知識に苦しむことが多い。
LLM誘導データ合成と対比埋め込み適応と効率的なテキストクラスタリングを組み合わせることで、これらの課題に対処するモデルに依存しないフレームワークであるLMAR(Language Model Augmented Retriever)を提案する。
論文 参考訳(メタデータ) (2025-08-04T16:59:43Z) - Enhancing Temporal Sensitivity of Large Language Model for Recommendation with Counterfactual Tuning [8.798364656768657]
我々は、アンダーライン勧告(CETRec)の枠組みを提案する。
CETRecは因果推論の原則に基づいており、時間情報の特定の影響をレコメンデーション結果に分離し、測定することができる。
私たちのコードはhttps://anonymous.4open.science/r/CETRec-B9CE/で利用可能です。
論文 参考訳(メタデータ) (2025-07-03T10:11:35Z) - Reward-Guided Speculative Decoding for Efficient LLM Reasoning [80.55186052123196]
Reward-Guided Speculative Decoding (RSD)は,大規模言語モデル(LLM)における推論の効率向上を目的とした新しいフレームワークである。
RSDは、厳密な偏りを強制する既存の投機的復号法とは対照的に、制御されたバイアスをハイリワード出力の優先順位付けに取り入れている。
RSDは,対象モデルのみでの復号化に対して,高い効率向上を実現し,並列復号法よりも高い精度を実現している。
論文 参考訳(メタデータ) (2025-01-31T17:19:57Z) - Federated Fine-Tuning of LLMs: Framework Comparison and Research Directions [59.5243730853157]
Federated Learning(FL)は、分散プライベートデータセットを使用して、トレーニング済みの大規模言語モデル(LLM)を微調整するための、プライバシ保護ソリューションを提供する。
本稿では、知識蒸留(KD)とスプリットラーニング(SL)を統合し、これらの問題を緩和する3つの先進的連合LLM(FedLLM)フレームワークの比較分析を行う。
論文 参考訳(メタデータ) (2025-01-08T11:37:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。