論文の概要: Llamarine: Open-source Maritime Industry-specific Large Language Model
- arxiv url: http://arxiv.org/abs/2503.00203v3
- Date: Fri, 07 Mar 2025 22:12:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:42:16.730965
- Title: Llamarine: Open-source Maritime Industry-specific Large Language Model
- Title(参考訳): Llamarine: オープンソースの海事業界固有の大規模言語モデル
- Authors: William Nguyen, An Phan, Konobu Kimura, Hitoshi Maeno, Mika Tanaka, Quynh Le, William Poucher, Christopher Nguyen,
- Abstract要約: Llamarineは,海洋航法に特化して設計された,最初のオープンソースのLarge Language Model (LLM) である。
Llamarine 1.0は、海事教科書、研究出版物、ウィキペディアのウェブテキストを含む高品質なコーパスの訓練と微調整を継続して開発されている。
主な貢献は、(a)権威源からの総合的な海洋データセットのキュレーション、モデルの知識ベースにおける深度と信頼性を確保すること、(b)汎用LSMよりも高精度で複雑な航法課題を推論できる基礎モデルの開発、(c)ベンチマークの作成である。
- 参考スコア(独自算出の注目度): 0.4215938932388722
- License:
- Abstract: Large Language Models (LLMs) have demonstrated substantial potential in addressing complex reasoning tasks, yet their general-purpose nature often limits their effectiveness in specialized domains such as maritime navigation. To bridge this gap, we introduce Llamarine, the first open-source LLM designed specifically for maritime navigation. Llamarine 1.0 is developed through continued pretraining and fine-tuning on a high-quality corpus comprising maritime textbooks, research publications, and web text from Wikipedia. This domain-specific training enables the model to acquire expert-level knowledge in navigational principles, collision avoidance, route optimization, and regulatory compliance. Our key contributions include (a) the curation of a comprehensive maritime dataset from authoritative sources, ensuring depth and reliability in the model's knowledge base; (b) the development of a foundational model capable of reasoning about complex navigational challenges with greater accuracy than general-purpose LLMs; and (c) the establishment of a benchmark to evaluate performance in maritime-specific decision-making tasks. Experimental results demonstrate that Llamarine outperforms both general-purpose and commercial LLMs in critical navigation-related tasks, such as trajectory planning, risk assessment, and compliance with maritime regulations. By providing an open-source foundation model trained exclusively on high-quality maritime literature, Llamarine paves the way for AI-driven advancements in maritime safety, efficiency, and operational decision-making.
- Abstract(参考訳): 大規模言語モデル (LLM) は複雑な推論タスクに対処する大きな可能性を示しているが、その汎用性は海上航行のような専門分野においてその有効性を制限していることが多い。
このギャップを埋めるために,海洋航法用に設計された初のオープンソースLLMであるLlamarineを紹介した。
Llamarine 1.0は、海事教科書、研究出版物、ウィキペディアのウェブテキストを含む高品質なコーパスの訓練と微調整を継続して開発されている。
このドメイン固有のトレーニングにより、ナビゲーションの原則、衝突回避、経路最適化、規制コンプライアンスに関する専門家レベルの知識を得ることができる。
主な貢献は
(a)モデルの知識基盤の深度及び信頼性を確保するため、権威源からの総合的な海洋データセットのキュレーション
b) 汎用LLMよりも高精度で複雑な航法課題を推論できる基礎モデルの開発
(c)海洋固有の意思決定タスクのパフォーマンスを評価するためのベンチマークの確立。
実験の結果,Llamarineは航法計画やリスクアセスメント,海洋規制の遵守など,航法に関わる重要なタスクにおいて汎用的かつ商業的なLLMよりも優れていた。
高品質な海洋文学に特化して訓練されたオープンソース基盤モデルを提供することで、Llamarineは、海洋安全、効率、運用上の意思決定におけるAI駆動の進歩の道を開く。
関連論文リスト
- KUNPENG: An Embodied Large Model for Intelligent Maritime [16.21066869005095]
KUNPENGは、スマートオーシャン構築において、インテリジェントな海洋のモデルとして初めて具現化された大型モデルである。
総合的な海上作業評価において、KUNPENGは優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-12T07:16:22Z) - From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systems [59.40480894948944]
大規模言語モデル (LLM) は、物理世界の意思決定問題を解くことができる。
このモデルの下で、LLM Plannerは、プロンプトを介して言語ベースのサブゴールを反復的に生成することにより、部分的に観測可能なマルコフ決定プロセス(POMDP)をナビゲートする。
我々は,事前学習したLLMプランナーが,文脈内学習を通じてベイズ的集計模倣学習(BAIL)を効果的に行うことを証明した。
論文 参考訳(メタデータ) (2024-05-30T09:42:54Z) - Unveiling the Misuse Potential of Base Large Language Models via In-Context Learning [61.2224355547598]
大規模言語モデル(LLM)のオープンソース化は、アプリケーション開発、イノベーション、科学的進歩を加速させる。
我々の調査は、この信念に対する重大な監視を露呈している。
我々の研究は、慎重に設計されたデモを配置することにより、ベースLSMが悪意のある命令を効果的に解釈し実行できることを実証する。
論文 参考訳(メタデータ) (2024-04-16T13:22:54Z) - TINA: Think, Interaction, and Action Framework for Zero-Shot Vision Language Navigation [11.591176410027224]
本稿では,Large Language Models(LLM)に基づく視覚言語ナビゲーション(VLN)エージェントを提案する。
環境認識におけるLLMの欠点を補うための思考・相互作用・行動の枠組みを提案する。
また,本手法は教師付き学習手法よりも優れ,ゼロショットナビゲーションの有効性を強調した。
論文 参考訳(メタデータ) (2024-03-13T05:22:39Z) - NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning
Disentangled Reasoning [101.56342075720588]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。
近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。
本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T07:27:02Z) - MarineGPT: Unlocking Secrets of Ocean to the Public [32.17362940242431]
大規模言語モデル(LLM)は、AIアシスタントとしてのユーザエクスペリエンスを促進する強力なツールであることが証明されている。
我々は,海洋ドメイン用に特別に設計された最初の視覚言語モデルである textbfMarineGPT を提案し,海洋の秘密を一般に公開する。
論文 参考訳(メタデータ) (2023-10-20T15:45:39Z) - Improving Open Information Extraction with Large Language Models: A
Study on Demonstration Uncertainty [52.72790059506241]
オープン情報抽出(OIE)タスクは、構造化されていないテキストから構造化された事実を抽出することを目的としている。
一般的なタスク解決手段としてChatGPTのような大きな言語モデル(LLM)の可能性にもかかわらず、OIEタスクの最先端(教師付き)メソッドは遅れている。
論文 参考訳(メタデータ) (2023-09-07T01:35:24Z) - NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large
Language Models [17.495162643127003]
我々は,複雑なエンボディシーンにおけるGPTモデルの推論能力を明らかにするために,NavGPTを導入した。
NavGPTは、視覚的な観察、ナビゲーション履歴、将来の探索可能な方向のテキスト記述を入力として、エージェントの現在の状態を推論する。
本研究では,NavGPTが経路に沿った観察や行動から高品質なナビゲーション命令を生成可能であることを示す。
論文 参考訳(メタデータ) (2023-05-26T14:41:06Z) - Do Embodied Agents Dream of Pixelated Sheep: Embodied Decision Making
using Language Guided World Modelling [101.59430768507997]
強化学習 (Reinforcement Learning, RL) エージェントは通常、世界の事前の知識なしに、タブラララザを学習する。
抽象世界モデル (AWM) を仮定するために, 少数ショット大言語モデル (LLM) を提案する。
LLMを用いてAWMを仮定し, エージェント経験に基づくAWMの検証を行うことで, 従来手法よりもサンプル効率を桁違いに向上させることができる。
論文 参考訳(メタデータ) (2023-01-28T02:04:07Z) - Soft Expert Reward Learning for Vision-and-Language Navigation [94.86954695912125]
VLN(Vision-and-Language Navigation)は、エージェントが自然言語の指示に従うことで、目に見えない環境で特定の場所を見つける必要がある。
本稿では,VLNタスクの工学的設計と一般化問題を克服するために,ソフトエキスパート・リワード・ラーニング(SERL)モデルを導入する。
論文 参考訳(メタデータ) (2020-07-21T14:17:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。