Fugu-MT 論文翻訳(概要): Large Language Model Supply Chain: A Research Agenda

論文の概要: Large Language Model Supply Chain: A Research Agenda

arxiv url: http://arxiv.org/abs/2404.12736v2
Date: Sat, 05 Oct 2024 09:07:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-03 17:04:38.004093
Title: Large Language Model Supply Chain: A Research Agenda
Title（参考訳）: 大規模言語モデルサプライチェーンの研究動向
Authors: Shenao Wang, Yanjie Zhao, Xinyi Hou, Haoyu Wang,
Abstract要約: 大規模言語モデル(LLM)は、自然言語処理とマルチモーダルコンテンツ生成において前例のない能力を導入し、人工知能に革命をもたらした。しかし、これらのモデルの複雑さと規模が増大し、インフラ、基礎モデル、下流アプリケーションに固有の課題をもたらす多面的なサプライチェーンが生まれました。本稿では,ソフトウェア工学(SE)とセキュリティとプライバシ(S&P)の両レンズによる重要な課題と機会を特定するための構造化アプローチを提案する。
参考スコア（独自算出の注目度）: 5.1875389249043415
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The rapid advancement of Large Language Models (LLMs) has revolutionized artificial intelligence, introducing unprecedented capabilities in natural language processing and multimodal content generation. However, the increasing complexity and scale of these models have given rise to a multifaceted supply chain that presents unique challenges across infrastructure, foundation models, and downstream applications. This paper provides a comprehensive research agenda of the LLM supply chain, offering a structured approach to identify critical challenges and opportunities through the dual lenses of Software Engineering (SE) and Security & Privacy (S&P). We begin by establishing a clear definition of the LLM supply chain, encompassing its components and dependencies. We then analyze each layer of the supply chain, presenting a vision for robust and secure LLM development, reviewing the current state of practices and technologies, and identifying key challenges and research opportunities. This work aims to bridge the existing research gap in systematically understanding the multifaceted issues within the LLM supply chain, offering valuable insights to guide future efforts in this rapidly evolving domain.
Abstract（参考訳）: 大規模言語モデル(LLM)の急速な進歩は、自然言語処理やマルチモーダルコンテンツ生成における前例のない能力を導入し、人工知能に革命をもたらした。しかし、これらのモデルの複雑さと規模が増大し、インフラ、基礎モデル、下流アプリケーションに固有の課題をもたらす多面的なサプライチェーンが生まれました。本稿では,ソフトウェア工学(SE)とセキュリティとプライバシ(S&P)の二重レンズによる重要な課題と機会を特定するための構造的アプローチとして,LLMサプライチェーンの包括的な研究課題を提供する。まず、LCMサプライチェーンを明確に定義し、そのコンポーネントと依存関係を包含することから始めます。次に、サプライチェーンの各レイヤを分析し、ロバストでセキュアなLCM開発へのビジョンを示し、プラクティスや技術の現状をレビューし、重要な課題と研究機会を特定します。この研究は、LLMサプライチェーン内の多面的問題を体系的に理解する上で、既存の研究ギャップを埋めることを目的としており、この急速に発展する領域における将来の取り組みをガイドするための貴重な洞察を提供する。

関連論文リスト

Discrete Tokenization for Multimodal LLMs: A Comprehensive Survey [69.45421620616486]
本研究は、大規模言語モデル(LLM)用に設計された離散トークン化手法の最初の構造的分類と解析である。古典的および近代的なパラダイムにまたがる8つの代表的なVQ変種を分類し、アルゴリズムの原理を分析し、力学を訓練し、LLMパイプラインとの統合に挑戦する。コードブックの崩壊、不安定な勾配推定、モダリティ固有の符号化制約など、重要な課題を特定する。
論文参考訳（メタデータ） (2025-07-21T10:52:14Z)
Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities [62.05713042908654]
本稿では,逆強化学習(IRL)のレンズによる大規模言語モデル(LLM)のアライメントの進歩について概観する。我々は、人間のデータからニューラル報酬モデルを構築する必要性を強調し、このパラダイムシフトの形式的および実践的意味について議論する。
論文参考訳（メタデータ） (2025-07-17T14:22:24Z)
Software Engineering for Large Language Models: Research Status, Challenges and the Road Ahead [4.835306415626808]
大規模言語モデル(LLM)は人工知能(AI)を再定義している LLMの開発は、ライフサイクルを通してますます複雑な課題に直面している。ソフトウェア工学(SE)アプローチの観点から、これらの課題と解決策を体系的に探求する既存の研究はない。
論文参考訳（メタデータ） (2025-06-30T12:09:29Z)
A Trustworthy Multi-LLM Network: Challenges,Solutions, and A Use Case [59.58213261128626]
複数の大規模言語モデル(LLM)を信頼性のあるマルチLLMネットワーク(MultiLLMN)に接続するブロックチェーン対応協調フレームワークを提案する。このアーキテクチャは、複雑なネットワーク最適化問題に対する最も信頼性が高く高品質な応答の協調評価と選択を可能にする。
論文参考訳（メタデータ） (2025-05-06T05:32:46Z)
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey [124.23247710880008]
マルチモーダルCoT (MCoT) 推論は近年大きな研究の注目を集めている。既存のMCoT研究は、画像、ビデオ、音声、オーディオ、3D、構造化データの課題に対処する様々な手法を設計している。我々はMCoT推論に関する最初の体系的な調査を行い、関連する基礎概念と定義を解明する。
論文参考訳（メタデータ） (2025-03-16T18:39:13Z)
Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models [64.1799100754406]
大きな言語モデル(LLM)は、さらなる推論によって拡張された能力と信頼性を示す。 LLM推論の改善へのさまざまな取り組みにもかかわらず、高品質な長鎖推論データと最適化されたトレーニングパイプラインは、まだビジョン言語タスクでは不十分である。本稿では,1)複雑なマルチモーダルタスクに対する長大かつ堅牢な推論データを生成するための初期の取り組みであるInsight-Vと,2)MLLMの推論能力を高めるための効果的なトレーニングパイプラインを提案する。
論文参考訳（メタデータ） (2024-11-21T18:59:55Z)
Supply Chain Network Extraction and Entity Classification Leveraging Large Language Models [5.205252810216621]
我々は,大規模言語モデル(LLM)を用いた土木分野向けサプライチェーングラフを開発する。 LLMを微調整してサプライチェーングラフ内のエンティティを分類し、それらの役割と関係に関する詳細な洞察を提供する。我々の貢献には、土木分野向けのサプライチェーングラフの開発や、サプライチェーンネットワークのエンティティ分類と理解を強化する微調整LCMモデルなどが含まれます。
論文参考訳（メタデータ） (2024-10-16T21:24:13Z)
From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9134620424985]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。 CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文参考訳（メタデータ） (2024-09-19T02:51:54Z)
Enhancing Supply Chain Visibility with Knowledge Graphs and Large Language Models [49.898152180805454]
本稿では,サプライチェーンの可視性を高めるために,知識グラフ(KG)と大規模言語モデル(LLM)を活用した新しいフレームワークを提案する。我々のゼロショットLPM駆動アプローチは、様々な公共情報源からのサプライチェーン情報の抽出を自動化する。 NERとREタスクの精度が高く、複雑な多層供給ネットワークを理解する効果的なツールを提供する。
論文参考訳（メタデータ） (2024-08-05T17:11:29Z)
A Comprehensive Review of Multimodal Large Language Models: Performance and Challenges Across Different Tasks [74.52259252807191]
MLLM(Multimodal Large Language Models)は、単一のモダリティシステムの能力を超えた現実世界のアプリケーションの複雑さに対処する。本稿では,自然言語,視覚,音声などのマルチモーダルタスクにおけるMLLMの応用を体系的に整理する。
論文参考訳（メタデータ） (2024-08-02T15:14:53Z)
LLMs Meet Multimodal Generation and Editing: A Survey [89.76691959033323]
本調査では,画像,ビデオ,3D,オーディオなど,さまざまな領域にわたるマルチモーダル生成と編集について詳述する。これらの分野でのマイルストーンの成果を要約し、これらの研究をLLM法とCLIP/T5法に分類する。我々は、既存の生成モデルを人間とコンピュータの相互作用に活用できるツール強化マルチモーダルエージェントを掘り下げる。
論文参考訳（メタデータ） (2024-05-29T17:59:20Z)
Exploring the Frontier of Vision-Language Models: A Survey of Current Methodologies and Future Directions [11.786387517781328]
VLM(Vision-Language Models)は、画像キャプションや視覚的質問応答といった複雑なタスクに対処できる高度なモデルである。我々の分類では、VLMを視覚言語理解専用のモデル、マルチモーダル入力を処理するモデル、マルチモーダル入力とアウトプットの両方を受け付け、生成するモデルという3つのカテゴリに分類する。我々は各モデルを慎重に識別し、基礎となるアーキテクチャ、データソースのトレーニング、および可能な限りの強度と限界を広範囲に分析する。
論文参考訳（メタデータ） (2024-02-20T18:57:34Z)
Building Guardrails for Large Language Models [19.96292920696796]
LLMの入力や出力をフィルタリングするガードレールは、コアセーフガード技術として登場した。このポジションペーパーでは、現在のオープンソースソリューション(Llama Guard, Nvidia NeMo, Guardrails AI)を詳しく調べ、より完全なソリューションを構築するための課題と道筋について論じる。
論文参考訳（メタデータ） (2024-02-02T16:35:00Z)
A Survey of Resource-efficient LLM and Multimodal Foundation Models [22.23967603206849]
大規模言語モデル(LLM)、ビジョントランスフォーマー(ViT)、拡散、マルチモーダルモデルを含む大規模な基盤モデルは、機械学習ライフサイクル全体に革命をもたらしている。しかしながら、これらのモデルが提供する汎用性と性能の大幅な進歩は、ハードウェアリソースの面でかなりのコストがかかる。この調査は、アルゴリズム的側面とシステム的側面の両方を調べることで、そのような研究の重要さを掘り下げるものである。
論文参考訳（メタデータ） (2024-01-16T03:35:26Z)
A Comprehensive Overview of Large Language Models [68.22178313875618]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文参考訳（メタデータ） (2023-07-12T20:01:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。