論文の概要: Building a Foundation Model for Trajectory from Scratch
- arxiv url: http://arxiv.org/abs/2511.20610v1
- Date: Tue, 25 Nov 2025 18:37:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.617599
- Title: Building a Foundation Model for Trajectory from Scratch
- Title(参考訳): スクラッチによる軌道モデルの構築
- Authors: Gaspard Merten, Mahmoud Sakr, Gilles Dejaegere,
- Abstract要約: 基礎モデルは人工知能において変革的だが、特に移動軌道のスクラッチから構築することは、まだ明確あるいは文書化されていない。
このチュートリアルは、GPT-2から始まる軌道中心の基盤モデルの最小限の実装のステップとコードを示すことで、このギャップを埋める。
- 参考スコア(独自算出の注目度): 0.764671395172401
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Foundation models are transformative in artificial intelligence, but building them from scratch, especially for mobility trajectories, is not yet clear or documented. This tutorial bridges this gap by demonstrating the steps and code of a minimal implementation of a trajectory-focused foundation model starting from GPT-2. Through a concise, step-by-step, code-driven process, we demonstrate adapting GPT-2 for spatiotemporal data. We then review and compare representative trajectory foundation models, such as TrajFM and TrajGPT, highlighting their architectural innovations and differences. Additionally, we introduce complementary techniques from related domains, like TimesFM's patching approach. Targeted at researchers and practitioners, this tutorial aims to explain the concepts and terminology of foundation models, at the implementation level. We find it timely and indispensable to create this educational material in order to support the SIGSPATIAL community in building and evaluating mobility foundation models, enhancing both research clarity and peer-review effectiveness in mobility AI.
- Abstract(参考訳): 基礎モデルは人工知能において変革的だが、特に移動軌道のスクラッチから構築することは、まだ明確あるいは文書化されていない。
このチュートリアルは、GPT-2から始まる軌道中心の基盤モデルの最小限の実装のステップとコードを示すことで、このギャップを埋める。
簡潔でステップバイステップのコード駆動プロセスを通じて、時空間データに適応したGPT-2を実演する。
次に、TrajFMやTrajGPTといった代表的なトラジェクトリ基盤モデルをレビューし、比較し、アーキテクチャの革新と相違点を強調します。
さらに、TimesFMのパッチングアプローチのような、関連するドメインからの補完技術を紹介します。
本チュートリアルは, 研究者や実践者を対象に, 基礎モデルの概念と用語を, 実装レベルで説明することを目的としている。
我々は、モビリティ基盤モデルの構築と評価において、SIGSPATIALコミュニティを支援し、モビリティAIにおける研究の明確さとピアレビューの有効性を高めるために、この教材を作成するのに、タイムリーかつ欠かせないことを発見した。
関連論文リスト
- A Survey on Efficient Vision-Language-Action Models [153.11669266922993]
VLA(Vision-Language-Action Model)は、物理世界の相互作用によってデジタル知識を橋渡しすることを目的とした、インテリジェンスにおける重要なフロンティアである。
これらの課題に緊急に対応する必要性から、この調査は、効率的なビジョン・ランゲージ・アクションモデルに関する最初の包括的なレビューを提示する。
論文 参考訳(メタデータ) (2025-10-27T17:57:33Z) - Foundation Models and Transformers for Anomaly Detection: A Survey [2.3264194695971656]
調査では、VADメソッドを再構築ベース、機能ベース、ゼロ/フェーショットアプローチに分類した。
トランスフォーマーとファンデーションモデルは、より堅牢で、解釈可能で、スケーラブルな異常検出ソリューションを可能にする。
論文 参考訳(メタデータ) (2025-07-21T12:01:04Z) - A Survey of Model Architectures in Information Retrieval [59.61734783818073]
2019年から現在までの期間は、情報検索(IR)と自然言語処理(NLP)における最大のパラダイムシフトの1つとなっている。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
今後の課題と今後の方向性について、先見的な議論で締めくくります。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - Vision Foundation Models in Remote Sensing: A Survey [6.036426846159163]
ファンデーションモデルは、前例のない精度と効率で幅広いタスクを実行することができる大規模で事前訓練されたAIモデルである。
本調査は, 遠隔センシングにおける基礎モデルの開発と応用を継続するために, 進展のパノラマと将来性のある経路を提供することによって, 研究者や実践者の資源として機能することを目的としている。
論文 参考訳(メタデータ) (2024-08-06T22:39:34Z) - ZhiJian: A Unifying and Rapidly Deployable Toolbox for Pre-trained Model
Reuse [59.500060790983994]
本稿では、PyTorchバックエンドを利用して、モデル再利用のための包括的でユーザフレンドリなツールボックスであるZhiJianを紹介する。
ZhiJianは、PTMによるターゲットアーキテクチャ構築、PTMによるターゲットモデルチューニング、およびPTMに基づく推論を含む、モデル再利用に関するさまざまな視点を統一する新しいパラダイムを提示している。
論文 参考訳(メタデータ) (2023-08-17T19:12:13Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - Assemble Foundation Models for Automatic Code Summarization [9.53949558569201]
ニューラルネットワークに基づく自動コード要約のためのフレキシブルでロバストなアプローチを提案する。
CodeBERT や GPT-2 のような利用可能な基盤モデルを AdaMo という単一のモデルに組み立てる。
本稿では,知識伝達の観点から,連続事前学習と中間微調整という2つの適応型スキームを導入する。
論文 参考訳(メタデータ) (2022-01-13T21:38:33Z) - Understanding the Mechanics of SPIGOT: Surrogate Gradients for Latent
Structure Learning [20.506232306308977]
潜在構造モデルは、言語データをモデリングするための強力なツールである。
これらのモデルのエンドツーエンドトレーニングの課題の1つは、ヌル勾配を持つargmax演算である。
下流学習目標を引き上げる角度から潜在構造学習を探索する。
論文 参考訳(メタデータ) (2020-10-05T21:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。