論文の概要: StreetViewAI: Making Street View Accessible Using Context-Aware Multimodal AI
- arxiv url: http://arxiv.org/abs/2508.08524v1
- Date: Mon, 11 Aug 2025 23:30:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.254326
- Title: StreetViewAI: Making Street View Accessible Using Context-Aware Multimodal AI
- Title(参考訳): StreetViewAI: コンテキスト対応マルチモーダルAIによるストリートビューのアクセシビリティ
- Authors: Jon E. Froehlich, Alexander Fiannaca, Nimer Jaber, Victor Tsara, Shaun Kane,
- Abstract要約: 初めてアクセス可能なストリートビューツールであるStreetViewAIを紹介します。
StreetViewAIでは、視覚障害者は目的地を事実上検査したり、オープンワールドで探索したり、200億以上の画像やGSVが配備されている100以上の国を仮想的にツアーすることができる。
- 参考スコア(独自算出の注目度): 44.66365868584316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive streetscape mapping tools such as Google Street View (GSV) and Meta Mapillary enable users to virtually navigate and experience real-world environments via immersive 360{\deg} imagery but remain fundamentally inaccessible to blind users. We introduce StreetViewAI, the first-ever accessible street view tool, which combines context-aware, multimodal AI, accessible navigation controls, and conversational speech. With StreetViewAI, blind users can virtually examine destinations, engage in open-world exploration, or virtually tour any of the over 220 billion images and 100+ countries where GSV is deployed. We iteratively designed StreetViewAI with a mixed-visual ability team and performed an evaluation with eleven blind users. Our findings demonstrate the value of an accessible street view in supporting POI investigations and remote route planning. We close by enumerating key guidelines for future work.
- Abstract(参考訳): Googleストリートビュー(GSV)やMeta Mapillaryのようなインタラクティブなストリートスケープマッピングツールは、没入型360{\deg}イメージを通じて現実世界の環境を仮想的にナビゲートし体験することができるが、視覚障害者には基本的にアクセスできない。
私たちはStreetViewAIを紹介した。StreetViewAIは、コンテキスト認識、マルチモーダルAI、アクセス可能なナビゲーションコントロール、会話音声を組み合わせた、初めてアクセス可能なストリートビューツールである。
StreetViewAIでは、視覚障害者は目的地を事実上検査したり、オープンワールドで探索したり、200億以上の画像やGSVが配備されている100以上の国を仮想的にツアーすることができる。
混合視覚能力チームでStreetViewAIを反復設計し,11名の視覚障害者を対象に評価を行った。
本研究は,POI調査と遠隔経路計画を支援する上で,アクセス可能な街路ビューの有用性を示すものである。
今後の作業の要となるガイドラインを列挙して締めくくります。
関連論文リスト
- OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation [49.697035403548966]
Vision-Language Navigation (VLN)は、言語命令と視覚的手がかりを活用してエージェントを誘導することを目的としており、AIの具体化において重要な役割を果たす。
各種レンダリングエンジン,多用途ツールチェーン,航空VLNの大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
論文 参考訳(メタデータ) (2025-02-25T09:57:18Z) - OpenStreetView-5M: The Many Roads to Global Visual Geolocation [16.468438245804684]
我々は5100万以上のジオレファレンスストリートビュー画像からなる大規模オープンアクセスデータセットOpenStreetView-5Mを紹介した。
既存のベンチマークとは対照的に、厳格な列車/テスト分離を強制し、学習された地理的特徴の関連性を評価する。
データセットの有用性を実証するために,様々な最先端の画像エンコーダ,空間表現,トレーニング戦略の広範なベンチマークを行う。
論文 参考訳(メタデータ) (2024-04-29T17:06:44Z) - Visualizing Routes with AI-Discovered Street-View Patterns [4.153397474276339]
本稿では,視覚的特徴の定量化にセマンティック潜在ベクトルを用いる手法を提案する。
街路ビュー画像の集合間の画像類似度を計算し,空間像パターンの探索を行う。
インタラクティブな可視化プロトタイプであるVivaRoutesを紹介し、これらのパターンで視覚化がどのように活用され、ユーザーが複数のルートを効果的かつインタラクティブに探索するのに役立つかを示す。
論文 参考訳(メタデータ) (2024-03-30T17:32:26Z) - To use or not to use proprietary street view images in (health and place) research? That is the question [0.20999222360659603]
この記事では、ヨーロッパの観点からGoogleストリートビュー画像を使用する際の現在の実践について疑問を呈する。
画像の大量ダウンロードやストリートビュー画像ベースのインデックスの生成を制限するGoogleのサービス規約に懸念があります。
論文 参考訳(メタデータ) (2024-02-18T08:26:22Z) - VELMA: Verbalization Embodiment of LLM Agents for Vision and Language
Navigation in Street View [81.58612867186633]
視覚と言語ナビゲーション(VLN)は、視覚的および自然言語の理解と空間的および時間的推論能力を必要とする。
VELMAは,2つのコンテキスト内例のみを用いて,ストリートビューでのナビゲーション指示に従うことができることを示す。
数千の例でLLMエージェントをさらに微調整し、従来の2つのデータセットのタスク完了に対する25%-30%の相対的な改善を実現した。
論文 参考訳(メタデータ) (2023-07-12T11:08:24Z) - OVIS: Open-Vocabulary Visual Instance Search via Visual-Semantic Aligned
Representation Learning [79.49199857462087]
オープン語彙ビジュアルインスタンス検索(OVIS)の課題について紹介する。
任意のテキスト検索クエリが与えられた場合、OVISは、ランク付けされたビジュアルインスタンスのリストを返すことを目的としている。
ビジュアル・セマンティック・アライメント・表現学習(ViSA)を用いて,このような検索課題に対処することを提案する。
論文 参考訳(メタデータ) (2021-08-08T18:13:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。