論文の概要: Image Segmentation with Large Language Models: A Survey with Perspectives for Intelligent Transportation Systems
- arxiv url: http://arxiv.org/abs/2506.14096v1
- Date: Tue, 17 Jun 2025 01:20:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.282755
- Title: Image Segmentation with Large Language Models: A Survey with Perspectives for Intelligent Transportation Systems
- Title(参考訳): 大規模言語モデルを用いた画像分割:インテリジェント交通システムへの展望
- Authors: Sanjeda Akter, Ibne Farabi Shihab, Anuj Sharma,
- Abstract要約: 本調査は,LLM強調画像セグメンテーションの新たな分野を体系的にレビューする。
これらのイノベーションは、自動運転、交通監視、インフラのメンテナンスのための道路シーン理解をいかに向上させるかを強調します。
リアルタイムのパフォーマンスや安全性クリティカルな信頼性など、重要な課題を特定します。
- 参考スコア(独自算出の注目度): 2.1797343876622097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of Large Language Models (LLMs) with computer vision is profoundly transforming perception tasks like image segmentation. For intelligent transportation systems (ITS), where accurate scene understanding is critical for safety and efficiency, this new paradigm offers unprecedented capabilities. This survey systematically reviews the emerging field of LLM-augmented image segmentation, focusing on its applications, challenges, and future directions within ITS. We provide a taxonomy of current approaches based on their prompting mechanisms and core architectures, and we highlight how these innovations can enhance road scene understanding for autonomous driving, traffic monitoring, and infrastructure maintenance. Finally, we identify key challenges, including real-time performance and safety-critical reliability, and outline a perspective centered on explainable, human-centric AI as a prerequisite for the successful deployment of this technology in next-generation transportation systems.
- Abstract(参考訳): 大規模言語モデル(LLM)とコンピュータビジョンの統合は、イメージセグメンテーションのような認識タスクを根本的に変える。
正確なシーン理解が安全と効率に不可欠であるインテリジェントトランスポートシステム(ITS)にとって、この新しいパラダイムは前例のない能力を提供する。
本調査は,LLM強調画像セグメンテーションの新たな分野を,ITSの応用,課題,今後の方向性に焦点をあてて,体系的にレビューする。
我々は、その推進メカニズムとコアアーキテクチャに基づく現在のアプローチの分類を提供し、これらのイノベーションが、自動運転、交通監視、インフラ整備のための道路シーン理解をいかに向上させるかを強調した。
最後に、我々は、リアルタイムのパフォーマンスと安全性クリティカルな信頼性を含む重要な課題を特定し、この技術を次世代輸送システムに導入するための前提条件として、説明可能な人間中心のAIに焦点を当てた視点を概説する。
関連論文リスト
- Large Language Models and Their Applications in Roadway Safety and Mobility Enhancement: A Comprehensive Review [14.611584622270405]
本稿では,道路の安全性と移動性を高めるため,大規模言語モデル(LLM)の適用とカスタマイズについて概説する。
重要な焦点は、LLMがアーキテクチャ、トレーニング、プロンプト、マルチモーダル戦略を通じて、交通機関のユニークな時間的および物理的データで"モダリティギャップ"を埋める方法である。
潜在的な可能性にもかかわらず、固有のLLM制限(ハロシン化、推論欠陥)、データガバナンス(プライバシ、バイアスの複雑さ)、複雑さ(シモン・トゥ・リアル、レイテンシ)、厳格な安全保証に関する課題が続いている。
論文 参考訳(メタデータ) (2025-05-19T21:51:18Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。
LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。
それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文 参考訳(メタデータ) (2025-03-27T11:56:27Z) - GenAI-powered Multi-Agent Paradigm for Smart Urban Mobility: Opportunities and Challenges for Integrating Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) with Intelligent Transportation Systems [10.310791311301962]
本稿では,大規模言語モデル (LLM) と新生検索・拡張生成技術 (RAG) の変換可能性について検討する。
本稿では,スマートモビリティサービスをインテリジェントかつ対話的に提供可能なマルチエージェントシステムの開発を目的とした概念的フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-31T16:14:42Z) - A Survey of Generative AI for Intelligent Transportation Systems: Road Transportation Perspective [7.770651543578893]
我々は、異なる生成AI技術の原則を紹介する。
我々は,ITSにおけるタスクを,交通認識,交通予測,交通シミュレーション,交通意思決定の4つのタイプに分類する。
これらの4種類のタスクにおいて、生成的AI技術が重要な問題にどのように対処するかを説明する。
論文 参考訳(メタデータ) (2023-12-13T16:13:23Z) - Representation Engineering: A Top-Down Approach to AI Transparency [130.33981757928166]
表現工学の新たな領域(RepE)を特定し,特徴付ける
RepEは、神経細胞や回路ではなく、人口レベルの表現を解析の中心に置く。
これらの手法が、広範囲の安全関連問題に対してどのようにトラクションを提供するかを紹介する。
論文 参考訳(メタデータ) (2023-10-02T17:59:07Z) - Camera-Radar Perception for Autonomous Vehicles and ADAS: Concepts,
Datasets and Metrics [77.34726150561087]
本研究の目的は、ADASおよび自動運転車のカメラおよびレーダーによる認識の現在のシナリオに関する研究を行うことである。
両センサと融合に関する概念と特徴を提示する。
本稿では、ディープラーニングに基づく検出とセグメンテーションタスクの概要と、車両の認識における主要なデータセット、メトリクス、課題、オープンな質問について説明する。
論文 参考訳(メタデータ) (2023-03-08T00:48:32Z) - DEEVA: A Deep Learning and IoT Based Computer Vision System to Address
Safety and Security of Production Sites in Energy Industry [0.0]
本稿では,シーン分類,シーン中のオブジェクト検出,セマンティックセグメンテーション,シーンキャプションなど,さまざまなコンピュータビジョンに関わる問題に取り組む。
我々は、シーン分類、オブジェクト検出、セマンティックセグメンテーション、シーンのキャプションを扱うためのDeep ExxonMobil Eye for Video Analysis (DEEVA)パッケージを開発した。
その結果, RetinaNet物体検出器を用いた伝達学習により, 作業者の存在, 車両・建設機器の種類, 安全関連物体を高い精度(90%以上)で検出できることがわかった。
論文 参考訳(メタデータ) (2020-03-02T21:26:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。