論文の概要: From Pixels to Urban Policy-Intelligence: Recovering Legacy Effects of Redlining with a Multimodal LLM
- arxiv url: http://arxiv.org/abs/2509.15132v1
- Date: Thu, 18 Sep 2025 16:42:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.338523
- Title: From Pixels to Urban Policy-Intelligence: Recovering Legacy Effects of Redlining with a Multimodal LLM
- Title(参考訳): 画素から都市政策-知性:マルチモーダルLLMによるリライニングの正当性回復
- Authors: Anthony Howell, Nancy Wu, Sharmistha Bagchi, Yushim Kim, Chayn Sun,
- Abstract要約: 本稿では,マルチモーダル大規模言語モデル(MLLM)が都市における計測能力を拡大し,場所に基づく政策介入の追跡を支援する方法について述べる。
GPT-4oは、ストリートビュー画像上に構築された、合理的に見積もられたパイプラインを用いて、近隣の貧困と樹冠を推定し、1930年代のリライニングの遺産を評価する準実験的な設計に組み込む。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper shows how a multimodal large language model (MLLM) can expand urban measurement capacity and support tracking of place-based policy interventions. Using a structured, reason-then-estimate pipeline on street-view imagery, GPT-4o infers neighborhood poverty and tree canopy, which we embed in a quasi-experimental design evaluating the legacy of 1930s redlining. GPT-4o recovers the expected adverse socio-environmental legacy effects of redlining, with estimates statistically indistinguishable from authoritative sources, and it outperforms a conventional pixel-based segmentation baseline-consistent with the idea that holistic scene reasoning extracts higher-order information beyond object counts alone. These results position MLLMs as policy-grade instruments for neighborhood measurement and motivate broader validation across policy-evaluation settings.
- Abstract(参考訳): 本稿では,マルチモーダル大規模言語モデル(MLLM)が都市における計測能力を拡大し,場所に基づく政策介入の追跡を支援する方法について述べる。
GPT-4oは、ストリートビュー画像上に構築された、合理的に見積もられたパイプラインを用いて、近隣の貧困と樹冠を推定し、1930年代のリライニングの遺産を評価する準実験的な設計に組み込む。
GPT-4oは、信頼できる情報源と統計的に区別がつかず、リライニングによる社会環境の有害なレガシー効果を回復し、全体論的なシーン推論は、対象数を超える高次情報を抽出するという考えと、従来のピクセルベースのセグメンテーションベースラインよりも優れている。
これらの結果から,MLLMを政策評価尺度として位置づけ,政策評価設定全体にわたって幅広い検証を動機付けている。
関連論文リスト
- Assessing Deanonymization Risks with Stylometry-Assisted LLM Agent [7.598781876494379]
本稿では,非匿名化リスクの評価と軽減を目的としたエージェントを,構造化,解釈可能なパイプラインを通じて導入する。
大規模なニュースデータセットの実験では、$textitSALA$が高い推論精度を実現している。
論文 参考訳(メタデータ) (2026-02-26T15:05:13Z) - Rethinking the Trust Region in LLM Reinforcement Learning [72.25890308541334]
PPO(Proximal Policy Optimization)は、大規模言語モデル(LLM)のデファクト標準アルゴリズムとして機能する。
より原則的な制約でクリッピングを代用する多変量確率ポリシー最適化(DPPO)を提案する。
DPPOは既存の方法よりも優れたトレーニングと効率を実現し、RLベースの微調整のためのより堅牢な基盤を提供する。
論文 参考訳(メタデータ) (2026-02-04T18:59:04Z) - Look-Ahead-Bench: a Standardized Benchmark of Look-ahead Bias in Point-in-Time LLMs for Finance [0.0]
我々はLook-Ahead-Benchについて紹介する。Look-Ahead-Benchは、LLM(Point-in-Time)大言語モデルにおけるルック-アヘッドバイアスを測定する標準ベンチマークである。
我々は、時間的に異なる市場体制におけるパフォーマンス劣化を分析し、パフォーマンス閾値を確立するために、いくつかの定量的ベースラインを取り入れた。
その結果, ピチンフモデルとは異なり, アルファ崩壊で測定された標準LDMの頭頂部偏差が顕著であった。
論文 参考訳(メタデータ) (2026-01-20T09:23:51Z) - Context-measure: Contextualizing Metric for Camouflage [63.31489136704254]
カモフラージュは、主にコンテキストに依存しているが、この重要な要因を見落としているキャモフラージュシナリオの現在のメトリクスである。
本稿では,確率的画素認識相関フレームワーク上に構築されたコンテキスト評価パラダイムであるコンテキスト尺度を提案する。
論文 参考訳(メタデータ) (2025-12-08T01:23:28Z) - Asymmetric Proximal Policy Optimization: mini-critics boost LLM reasoning [49.57517969069136]
Asymmetric Proximal Policy Optimization (AsyPPO) は、大規模なモデル設定で効率を保ちながら、批評家の役割を回復するシンプルでスケーラブルなフレームワークである。
AsyPPOは軽量のミニ批評家を採用しており、それぞれが切り離されたプロンプトシャードで訓練されている。
強力なベースラインを越えて、複数のベンチマークで学習の安定性とパフォーマンスを継続的に改善する。
論文 参考訳(メタデータ) (2025-10-02T04:24:27Z) - Evaluation of Geolocation Capabilities of Multimodal Large Language Models and Analysis of Associated Privacy Risks [9.003350058345442]
MLLMは、視覚コンテンツのみに基づいて画像の位置を推測することができる。
これは、doxx、監視、その他のセキュリティ脅威を含む、プライバシー侵害の深刻なリスクを引き起こす。
最も先進的な視覚モデルは、1kmの範囲内で最大49%の精度でストリートレベルの画像の起源をローカライズすることができる。
論文 参考訳(メタデータ) (2025-06-30T03:05:30Z) - GePBench: Evaluating Fundamental Geometric Perception for Multimodal Large Language Models [34.647839550142834]
本稿では,MLLMの幾何学的知覚能力を評価するための新しいベンチマークであるGePBenchを紹介する。
評価の結果,現在最先端のMLLMは幾何学的知覚タスクに重大な欠陥があることが明らかとなった。
GePBenchデータを用いてトレーニングしたモデルは、幅広いベンチマークタスクにおいて大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2024-12-30T16:01:43Z) - OCEAN: Offline Chain-of-thought Evaluation and Alignment in Large Language Models [68.17018458283651]
本研究は,LLMのチェーン・オブ・思想能力のオフライン評価に焦点をあてる。
我々は知識グラフ(例えばWikidata5m)を使って、生成された思考の連鎖に対するフィードバックを提供する。
提案手法に基づいてLCMを最適化する方法を示す。
論文 参考訳(メタデータ) (2024-10-31T07:48:44Z) - KGPA: Robustness Evaluation for Large Language Models via Cross-Domain Knowledge Graphs [5.798411590796167]
本稿では,敵対的攻撃シナリオ下での大規模言語モデルの堅牢性を体系的に評価する枠組みを提案する。
筆者らの枠組みは知識グラフの三つ子から独自のプロンプトを生成し,毒殺によって敵のプロンプトを生成する。
GPT-4-turbo > GPT-4o > GPT-3.5-turbo としてChatGPTファミリーの対角的ロバスト性が評価された。
論文 参考訳(メタデータ) (2024-06-16T04:48:43Z) - RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation [73.2390735383842]
付加的な構造仮定を伴わずにLMDPのサンプル効率アルゴリズムを初めて導入する。
楽観的な探索アルゴリズムのほぼ最適保証を導出するためにどのように使用できるかを示す。
これらの結果は、LMDP以外の幅広い対話型学習問題、特に部分的に観察された環境において有用である。
論文 参考訳(メタデータ) (2024-06-03T14:51:27Z) - Off-Policy Evaluation for Large Action Spaces via Policy Convolution [60.6953713877886]
ポリシ・コンボリューション(Policy Convolution)のファミリーは、アクション内の潜在構造を使用して、ログとターゲットポリシを戦略的に畳み込みます。
合成およびベンチマークデータセットの実験では、PCを使用する場合の平均二乗誤差(MSE)が顕著に改善されている。
論文 参考訳(メタデータ) (2023-10-24T01:00:01Z) - An Instrumental Variable Approach to Confounded Off-Policy Evaluation [11.785128674216903]
オフ政治評価(Off-policy Evaluation、OPE)は、目標政策の回帰を推定する手法である。
本稿では,マルコフ決定過程における一貫した OPE のインストゥルメンタル変数 (IV) に基づく手法を提案する。
論文 参考訳(メタデータ) (2022-12-29T22:06:51Z) - Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in
Partially Observed Markov Decision Processes [65.91730154730905]
医療や教育などの観察データへのオフライン強化学習の適用においては、観察された行動は観測されていない要因に影響される可能性があるという一般的な懸念がある。
ここでは、部分的に観察されたマルコフ決定過程(POMDP)における非政治評価を考慮し、この問題に取り組む。
我々は、近位因果推論の枠組みをPOMDP設定に拡張し、識別が可能となる様々な設定を提供する。
論文 参考訳(メタデータ) (2021-10-28T17:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。