論文の概要: SST: A Simplified Swin Transformer-based Model for Taxi Destination
Prediction based on Existing Trajectory
- arxiv url: http://arxiv.org/abs/2308.07555v1
- Date: Tue, 15 Aug 2023 03:49:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 13:59:05.220586
- Title: SST: A Simplified Swin Transformer-based Model for Taxi Destination
Prediction based on Existing Trajectory
- Title(参考訳): sst:既存経路に基づくタクシー目的地予測のための簡易スウィントランスモデル
- Authors: Zepu Wang, Yifei Sun, Zhiyu Lei, Xincheng Zhu, Peng Sun
- Abstract要約: 従来のSwin Transformerでは、シフトウインドウのアイデアを使わない簡易なSwin Transformer (SST) 構造を提案する。
本実験は, 実軌道データに基づいて, SSTが最先端の手法よりも高い精度を達成できることを実証した。
- 参考スコア(独自算出の注目度): 4.663494746854853
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately predicting the destination of taxi trajectories can have various
benefits for intelligent location-based services. One potential method to
accomplish this prediction is by converting the taxi trajectory into a
two-dimensional grid and using computer vision techniques. While the Swin
Transformer is an innovative computer vision architecture with demonstrated
success in vision downstream tasks, it is not commonly used to solve real-world
trajectory problems. In this paper, we propose a simplified Swin Transformer
(SST) structure that does not use the shifted window idea in the traditional
Swin Transformer, as trajectory data is consecutive in nature. Our
comprehensive experiments, based on real trajectory data, demonstrate that SST
can achieve higher accuracy compared to state-of-the-art methods.
- Abstract(参考訳): タクシーの目的地を正確に予測することは、インテリジェントな位置情報サービスに様々な利点をもたらす。
この予測の潜在的な方法は、タクシー軌道を二次元グリッドに変換し、コンピュータビジョン技術を使用することである。
Swin Transformer はコンピュータビジョンアーキテクチャであり、下流のタスクの視覚的成功を示すものであるが、現実世界の軌道問題の解決には一般的には使われていない。
本稿では,従来のSwin Transformerではトラジェクトリデータが連続しているため,従来のSwin Transformerではシフトウインドウのアイデアを使用しない簡易Swin Transformer (SST) 構造を提案する。
実軌道データに基づく包括的実験により,SSTが最先端の手法よりも高い精度を達成できることが実証された。
関連論文リスト
- Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - WcDT: World-centric Diffusion Transformer for Traffic Scene Generation [13.616763172038846]
本稿では,拡散確率モデルと変圧器の相補的強度を利用して,自律走行軌道生成のための新しい手法を提案する。
提案するフレームワークは,WcDT(World-Centric Diffusion Transformer)と呼ばれ,軌道生成過程全体を最適化する。
提案手法は,現実的かつ多様な軌道を生成する上で,優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2024-04-02T16:28:41Z) - Inspecting Explainability of Transformer Models with Additional
Statistical Information [27.04589064942369]
Cheferらは、各イメージパッチの重要性を示すために注意層を組み合わせることで、視覚およびマルチモーダルタスク上のトランスフォーマーを効果的に可視化することができる。
しかし、Swin Transformerのような他の変種のTransformerに適用する場合、この方法は予測対象に集中できない。
本手法は,Swin Transformer と ViT が持つ説明可能性の理解に有効であることを示す。
論文 参考訳(メタデータ) (2023-11-19T17:22:50Z) - PriViT: Vision Transformers for Fast Private Inference [55.36478271911595]
Vision Transformer (ViT) アーキテクチャは、コンピュータビジョンアプリケーションのための最先端のディープモデルのバックボーンとして登場した。
ViTは、多くの非ポリノミカル操作のため、セキュアなマルチパーティプロトコルを使用したプライベート推論には適していない。
予測精度を維持しつつ,ViTの非線形性を選択的に"テイラー化"するアルゴリズムであるPriViTを提案する。
論文 参考訳(メタデータ) (2023-10-06T21:45:05Z) - Emergent Agentic Transformer from Chain of Hindsight Experience [96.56164427726203]
簡単なトランスフォーマーベースモデルが時間差と模倣学習に基づくアプローチの両方と競合することを示す。
単純なトランスフォーマーベースのモデルが時間差と模倣学習ベースのアプローチの両方で競合するのはこれが初めてである。
論文 参考訳(メタデータ) (2023-05-26T00:43:02Z) - SSformer: A Lightweight Transformer for Semantic Segmentation [7.787950060560868]
Swin Transformerは階層アーキテクチャとシフトウィンドウを使用して、様々な視覚タスクで新しい記録を樹立した。
我々はSSformerと呼ばれる軽量で効果的なトランスモデルを設計する。
実験の結果,提案したSSformerは最先端モデルと同等のmIoU性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-08-03T12:57:00Z) - Adaptive Trajectory Prediction via Transferable GNN [74.09424229172781]
本稿では,トランジタブルグラフニューラルネットワーク(Transferable Graph Neural Network, T-GNN)フレームワークを提案する。
具体的には、ドメイン固有知識が減少する構造運動知識を探索するために、ドメイン不変GNNを提案する。
さらに,注目に基づく適応的知識学習モジュールを提案し,知識伝達のための詳細な個別レベルの特徴表現について検討した。
論文 参考訳(メタデータ) (2022-03-09T21:08:47Z) - Pedestrian Trajectory Prediction via Spatial Interaction Transformer
Network [7.150832716115448]
交通現場では、来るべき人々と出会うと、歩行者は突然回転したり、すぐに止まることがある。
このような予測不可能な軌道を予測するために、歩行者間の相互作用についての洞察を得ることができる。
本稿では,歩行者軌跡の相関関係を注意機構を用いて学習する空間的相互作用変換器(SIT)を提案する。
論文 参考訳(メタデータ) (2021-12-13T13:08:04Z) - Evo-ViT: Slow-Fast Token Evolution for Dynamic Vision Transformer [63.99222215387881]
本稿では,視覚変換器の自己モチベーションの遅いトークン進化手法であるEvo-ViTを提案する。
本手法は,画像分類において同等の性能を維持しつつ,視覚変換器の計算コストを大幅に削減することができる。
論文 参考訳(メタデータ) (2021-08-03T09:56:07Z) - Transformers Solve the Limited Receptive Field for Monocular Depth
Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。
連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文 参考訳(メタデータ) (2021-03-22T18:00:13Z) - Spatial-Channel Transformer Network for Trajectory Prediction on the
Traffic Scenes [2.7955111755177695]
本稿では,注意機能付き軌道予測のための空間チャネル変換器ネットワークを提案する。
エージェント間の社会的相互作用を測定するために、チャネルワイズモジュールが挿入される。
このネットワークは,交通現場における実世界の軌道予測データセットにおいて,有望な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-01-27T15:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。