論文の概要: Persona-aware and Explainable Bikeability Assessment: A Vision-Language Model Approach
- arxiv url: http://arxiv.org/abs/2601.03534v1
- Date: Wed, 07 Jan 2026 02:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-08 18:12:46.120114
- Title: Persona-aware and Explainable Bikeability Assessment: A Vision-Language Model Approach
- Title(参考訳): ペルソナ認識と説明可能な自転車性評価:視覚・言語モデルによるアプローチ
- Authors: Yilong Dai, Ziyi Wang, Chenguang Wang, Kexin Zhou, Yiheng Qian, Susu Xu, Xiang Yan,
- Abstract要約: 本稿では,自転車走行性評価のための人称認識型視覚言語モデルフレームワークを提案する。
パノラマ画像に基づくクラウドソーシングシステムを開発し、427人のサイクリストから12,400人のペルソナ条件のアセスメントを収集した。
実験の結果,提案フレームワークは競争力のある自転車の信頼性評価を提供することがわかった。
- 参考スコア(独自算出の注目度): 8.652496663871172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bikeability assessment is essential for advancing sustainable urban transportation and creating cyclist-friendly cities, and it requires incorporating users' perceptions of safety and comfort. Yet existing perception-based bikeability assessment approaches face key limitations in capturing the complexity of road environments and adequately accounting for heterogeneity in subjective user perceptions. This paper proposes a persona-aware Vision-Language Model framework for bikeability assessment with three novel contributions: (i) theory-grounded persona conditioning based on established cyclist typology that generates persona-specific explanations via chain-of-thought reasoning; (ii) multi-granularity supervised fine-tuning that combines scarce expert-annotated reasoning with abundant user ratings for joint prediction and explainable assessment; and (iii) AI-enabled data augmentation that creates controlled paired data to isolate infrastructure variable impacts. To test and validate this framework, we developed a panoramic image-based crowdsourcing system and collected 12,400 persona-conditioned assessments from 427 cyclists. Experiment results show that the proposed framework offers competitive bikeability rating prediction while uniquely enabling explainable factor attribution.
- Abstract(参考訳): 自転車の安全性評価は、持続可能な都市交通を推進し、サイクリストに優しい都市を作ることに不可欠であり、安全と快適さに対するユーザの認識を取り入れる必要がある。
しかし、既存の知覚に基づく自転車性評価アプローチは、道路環境の複雑さを捉え、主観的ユーザ知覚における不均一性を適切に考慮する上で、重要な制限に直面している。
本稿では,3つの新しいコントリビューションによる自転車走行性評価のためのパーソナ認識型ビジョンランゲージモデルフレームワークを提案する。
一 チェーンオブソート推論によりペルソナ固有の説明を生成する定型サイクリスト型に基づく理論的人格条件付け
二 未熟な専門家による注釈付き推論と豊富なユーザ評価を併用し、共同予測及び説明可能な評価を施した多粒度微調整
(iii) インフラストラクチャ変数の影響を分離するために、制御されたペアデータを生成するAI対応データ拡張。
本研究では,パノラマ画像を用いたクラウドソーシングシステムを開発した。
実験の結果,提案フレームワークは,一意に説明可能な要因帰属を可能としながら,競争力のある自転車の信頼性評価を提供することがわかった。
関連論文リスト
- From Steering to Pedalling: Do Autonomous Driving VLMs Generalize to Cyclist-Assistive Spatial Perception and Planning? [3.437656066916039]
視覚言語モデル(VLM)は、自律運転ベンチマークで強い性能を示した。
既存の評価は主に車両中心であり、自転車中心の視点から知覚と推論を評価するのに失敗している。
本稿では,サイクリストの視点からの知覚,時間的理解,交通ルールから車線への推論を探索するための診断ベンチマークであるCykingVQAを紹介する。
論文 参考訳(メタデータ) (2026-02-11T12:01:37Z) - URBAN-SPIN: A street-level bikeability index to inform design implementations in historical city centres [2.770226625653906]
本研究は,知覚主導型,タイポロジーベース,およびデータ統合フレームワークを開発する。
街路タイプとそれらのサブ分類を明示的にモデル化し、視覚的および空間的構成がサイクリング体験を形作るかを評価する。
このフレームワークは、遺産都市におけるサイクリング状況の評価と改善のための移行可能なモデルを提供する。
論文 参考訳(メタデータ) (2026-01-30T23:22:11Z) - StreetDesignAI: A Multi-Persona Evaluation System for Inclusive Infrastructure Design [8.314136104243735]
そこで我々は,ストリートデザインAI(StreetDesignAI)について紹介する。
26人の交通専門家による研究は、構造化されたマルチパースペクティブフィードバックが、多様なユーザ視点に対するデザイナーの理解を著しく改善することを示した。
論文 参考訳(メタデータ) (2026-01-22T05:53:05Z) - DriveCritic: Towards Context-Aware, Human-Aligned Evaluation for Autonomous Driving with Vision-Language Models [24.168614747778538]
DriveCriticは、2つの重要なコントリビューションを特徴とする新しいフレームワークです。
データセットは、コンテキストが正しい判断に不可欠である、困難なシナリオのキュレートされたコレクションである。
DriveCriticモデルは、視覚的コンテキストとシンボル的コンテキストを統合することで、軌跡ペア間の調整を学ぶ。
論文 参考訳(メタデータ) (2025-10-15T03:00:38Z) - MetAdv: A Unified and Interactive Adversarial Testing Platform for Autonomous Driving [85.04826012938642]
MetAdvは、現実的でダイナミックでインタラクティブな評価を可能にする、新しい対向テストプラットフォームである。
フレキシブルな3D車両モデリングと、シミュレートされた環境と物理的環境のシームレスな遷移をサポートする。
生理的信号のリアルタイムキャプチャとドライバからの行動フィードバックを可能にする。
論文 参考訳(メタデータ) (2025-08-04T03:07:54Z) - Interpretable Multimodal Framework for Human-Centered Street Assessment: Integrating Visual-Language Models for Perceptual Urban Diagnostics [0.0]
本稿では,新しいマルチモーダルストリート評価フレームワーク(MSEF)を紹介する。
パラメータ効率適応のためにLoRAとP-Tuning v2を用いてフレームワークを微調整する。
このモデルは、客観的特徴に関するF1スコアの0.84と、集約された居住者の知覚との89.3%の一致を達成している。
論文 参考訳(メタデータ) (2025-06-05T14:34:04Z) - Objective Bicycle Occlusion Level Classification using a Deformable Parts-Based Model [1.565361244756411]
道路安全は、特に最も脆弱な道路利用者であるサイクリストにとって重要な課題である。
本研究は,高度なコンピュータビジョン技術を用いた自転車閉塞レベル分類のための新しいベンチマークを提案し,道路安全を向上させることを目的とする。
論文 参考訳(メタデータ) (2025-05-21T10:42:41Z) - Which cycling environment appears safer? Learning cycling safety perceptions from pairwise image comparisons [2.3900828891729784]
都市がより持続可能な交通手段に移行するためには、循環が不可欠だ。しかし、安全上の懸念は、個人が循環する上で重要な抑止力として残されている。
本研究では, 個人がサイクリングリスクをどう認識するかを把握し, 理解する問題に取り組む。
我々は,現実のイメージのペア比較にアプローチを基づき,回答者に2組の道路環境を提示する。
サイクリングにとって、より安全なものを選ぶように求めます。
収集したデータを用いて、個人の反応から学習し、画像から直接好みを学習するマルチロスフレームワークを用いて、シアム・畳み込みニューラルネットワークを訓練する。
論文 参考訳(メタデータ) (2024-12-13T03:56:40Z) - Traffic and Safety Rule Compliance of Humans in Diverse Driving Situations [48.924085579865334]
安全な運転プラクティスを再現する自律システムを開発するためには、人間のデータを分析することが不可欠だ。
本稿では,複数の軌道予測データセットにおける交通・安全規則の適合性の比較評価を行う。
論文 参考訳(メタデータ) (2024-11-04T09:21:00Z) - Evaluating the effects of Data Sparsity on the Link-level Bicycling Volume Estimation: A Graph Convolutional Neural Network Approach [54.84957282120537]
本稿では,リンクレベルの自転車の体積をモデル化するためにGCNアーキテクチャを利用する最初の研究について述べる。
線形回帰、サポートベクターマシン、ランダムフォレストといった従来の機械学習モデルと比較した。
以上の結果から,GCNモデルは,年間平均自転車数(AADB)を予測する上で,従来のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-10-11T04:53:18Z) - Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.93813178692077]
本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。
検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。
また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文 参考訳(メタデータ) (2024-05-27T17:59:39Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - Euro-PVI: Pedestrian Vehicle Interactions in Dense Urban Centers [126.81938540470847]
歩行者と自転車の軌跡のデータセットであるEuro-PVIを提案する。
本研究では,都市環境におけるエージェント間のマルチモーダル共有潜在空間を表現的に学習する共同推論モデルを開発する。
我々は,エゴ車と歩行者(自転車)の相互作用を正確に予測するために捉えることの重要性を示すnuScenesとEuro-PVIデータセット上での成果を達成した。
論文 参考訳(メタデータ) (2021-06-22T15:40:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。