Fugu-MT 論文翻訳(概要): SST: A Simplified Swin Transformer-based Model for Taxi Destination Prediction based on Existing Trajectory

論文の概要: SST: A Simplified Swin Transformer-based Model for Taxi Destination Prediction based on Existing Trajectory

arxiv url: http://arxiv.org/abs/2308.07555v1
Date: Tue, 15 Aug 2023 03:49:05 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-16 13:59:05.220586
Title: SST: A Simplified Swin Transformer-based Model for Taxi Destination Prediction based on Existing Trajectory
Title（参考訳）: sst:既存経路に基づくタクシー目的地予測のための簡易スウィントランスモデル
Authors: Zepu Wang, Yifei Sun, Zhiyu Lei, Xincheng Zhu, Peng Sun
Abstract要約: 従来のSwin Transformerでは、シフトウインドウのアイデアを使わない簡易なSwin Transformer (SST) 構造を提案する。本実験は, 実軌道データに基づいて, SSTが最先端の手法よりも高い精度を達成できることを実証した。
参考スコア（独自算出の注目度）: 4.663494746854853
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurately predicting the destination of taxi trajectories can have various benefits for intelligent location-based services. One potential method to accomplish this prediction is by converting the taxi trajectory into a two-dimensional grid and using computer vision techniques. While the Swin Transformer is an innovative computer vision architecture with demonstrated success in vision downstream tasks, it is not commonly used to solve real-world trajectory problems. In this paper, we propose a simplified Swin Transformer (SST) structure that does not use the shifted window idea in the traditional Swin Transformer, as trajectory data is consecutive in nature. Our comprehensive experiments, based on real trajectory data, demonstrate that SST can achieve higher accuracy compared to state-of-the-art methods.
Abstract（参考訳）: タクシーの目的地を正確に予測することは、インテリジェントな位置情報サービスに様々な利点をもたらす。この予測の潜在的な方法は、タクシー軌道を二次元グリッドに変換し、コンピュータビジョン技術を使用することである。 Swin Transformer はコンピュータビジョンアーキテクチャであり、下流のタスクの視覚的成功を示すものであるが、現実世界の軌道問題の解決には一般的には使われていない。本稿では,従来のSwin Transformerではトラジェクトリデータが連続しているため,従来のSwin Transformerではシフトウインドウのアイデアを使用しない簡易Swin Transformer (SST) 構造を提案する。実軌道データに基づく包括的実験により,SSTが最先端の手法よりも高い精度を達成できることが実証された。

関連論文リスト

TrajDiff: End-to-end Autonomous Driving without Perception Annotation [65.49718343700319]
エンドツーエンドの自動運転システムは、生センサ入力から直接駆動ポリシーを生成する。 TrajDiffはTrajectory-oriented BEV Conditioned Diffusionフレームワークであり、エンドツーエンドの自動運転のための知覚アノテーションのない生成方法を確立する。 NAVSIMベンチマークで評価すると、TrajDiffは87.5 PDMSを達成した。
論文参考訳（メタデータ） (2025-11-30T04:34:20Z)
DyTTP: Trajectory Prediction with Normalization-Free Transformers [0.0]
トランスフォーマーベースのアーキテクチャは、複雑な堅牢性依存関係をキャプチャする上で大きな可能性を証明している。これらの課題に対処するための2つのアプローチを提案する。まず、トランスフォーマーを促進する最新の方法であるDynamicTanh(DyT)をバックボーンに統合し、従来のレイヤ正規化を置き換える。 DyTを軌道予測タスクにデプロイする最初の作業です。
論文参考訳（メタデータ） (2025-04-07T09:26:25Z)
Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文参考訳（メタデータ） (2024-06-21T13:48:37Z)
WcDT: World-centric Diffusion Transformer for Traffic Scene Generation [13.616763172038846]
本稿では,拡散確率モデルと変圧器の相補的強度を利用して,自律走行軌道生成のための新しい手法を提案する。提案するフレームワークは,WcDT(World-Centric Diffusion Transformer)と呼ばれ,軌道生成過程全体を最適化する。提案手法は,現実的かつ多様な軌道を生成する上で,優れた性能を示すことを示す。
論文参考訳（メタデータ） (2024-04-02T16:28:41Z)
Inspecting Explainability of Transformer Models with Additional Statistical Information [27.04589064942369]
Cheferらは、各イメージパッチの重要性を示すために注意層を組み合わせることで、視覚およびマルチモーダルタスク上のトランスフォーマーを効果的に可視化することができる。しかし、Swin Transformerのような他の変種のTransformerに適用する場合、この方法は予測対象に集中できない。本手法は,Swin Transformer と ViT が持つ説明可能性の理解に有効であることを示す。
論文参考訳（メタデータ） (2023-11-19T17:22:50Z)
PriViT: Vision Transformers for Fast Private Inference [55.36478271911595]
Vision Transformer (ViT) アーキテクチャは、コンピュータビジョンアプリケーションのための最先端のディープモデルのバックボーンとして登場した。 ViTは、多くの非ポリノミカル操作のため、セキュアなマルチパーティプロトコルを使用したプライベート推論には適していない。予測精度を維持しつつ,ViTの非線形性を選択的に"テイラー化"するアルゴリズムであるPriViTを提案する。
論文参考訳（メタデータ） (2023-10-06T21:45:05Z)
Emergent Agentic Transformer from Chain of Hindsight Experience [96.56164427726203]
簡単なトランスフォーマーベースモデルが時間差と模倣学習に基づくアプローチの両方と競合することを示す。単純なトランスフォーマーベースのモデルが時間差と模倣学習ベースのアプローチの両方で競合するのはこれが初めてである。
論文参考訳（メタデータ） (2023-05-26T00:43:02Z)
SSformer: A Lightweight Transformer for Semantic Segmentation [7.787950060560868]
Swin Transformerは階層アーキテクチャとシフトウィンドウを使用して、様々な視覚タスクで新しい記録を樹立した。我々はSSformerと呼ばれる軽量で効果的なトランスモデルを設計する。実験の結果,提案したSSformerは最先端モデルと同等のmIoU性能が得られることがわかった。
論文参考訳（メタデータ） (2022-08-03T12:57:00Z)
Adaptive Trajectory Prediction via Transferable GNN [74.09424229172781]
本稿では,トランジタブルグラフニューラルネットワーク(Transferable Graph Neural Network, T-GNN)フレームワークを提案する。具体的には、ドメイン固有知識が減少する構造運動知識を探索するために、ドメイン不変GNNを提案する。さらに,注目に基づく適応的知識学習モジュールを提案し,知識伝達のための詳細な個別レベルの特徴表現について検討した。
論文参考訳（メタデータ） (2022-03-09T21:08:47Z)
Pedestrian Trajectory Prediction via Spatial Interaction Transformer Network [7.150832716115448]
交通現場では、来るべき人々と出会うと、歩行者は突然回転したり、すぐに止まることがある。このような予測不可能な軌道を予測するために、歩行者間の相互作用についての洞察を得ることができる。本稿では,歩行者軌跡の相関関係を注意機構を用いて学習する空間的相互作用変換器(SIT)を提案する。
論文参考訳（メタデータ） (2021-12-13T13:08:04Z)
Evo-ViT: Slow-Fast Token Evolution for Dynamic Vision Transformer [63.99222215387881]
本稿では,視覚変換器の自己モチベーションの遅いトークン進化手法であるEvo-ViTを提案する。本手法は,画像分類において同等の性能を維持しつつ,視覚変換器の計算コストを大幅に削減することができる。
論文参考訳（メタデータ） (2021-08-03T09:56:07Z)
Transformers Solve the Limited Receptive Field for Monocular Depth Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文参考訳（メタデータ） (2021-03-22T18:00:13Z)
Spatial-Channel Transformer Network for Trajectory Prediction on the Traffic Scenes [2.7955111755177695]
本稿では,注意機能付き軌道予測のための空間チャネル変換器ネットワークを提案する。エージェント間の社会的相互作用を測定するために、チャネルワイズモジュールが挿入される。このネットワークは,交通現場における実世界の軌道予測データセットにおいて,有望な結果が得られることがわかった。
論文参考訳（メタデータ） (2021-01-27T15:03:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。