論文の概要: Autonomous AI Agents for Real-Time Affordable Housing Site Selection: Multi-Objective Reinforcement Learning Under Regulatory Constraints
- arxiv url: http://arxiv.org/abs/2602.03940v1
- Date: Tue, 03 Feb 2026 19:03:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.237029
- Title: Autonomous AI Agents for Real-Time Affordable Housing Site Selection: Multi-Objective Reinforcement Learning Under Regulatory Constraints
- Title(参考訳): リアルタイム住宅選択のための自律型AIエージェント:規制制約下での多目的強化学習
- Authors: Olaf Yunus Laitinen Imanov, Duygu Erisken, Derya Umut Kulali, Taner Yilmaz, Rana Irem Turhan,
- Abstract要約: AURA(Autonomous Urban Resource Allocator)は、規制の厳しい制約下で、リアルタイムに手頃な住宅地選定を行う階層型マルチエージェント強化学習システムである。
本研究は, アクセシビリティ, 環境影響, 建設コスト, ソーシャルエクイティを最適化する多目的マルコフ決定プロセスとして, 実現可能性を重視しながらタスクをモデル化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Affordable housing shortages affect billions, while land scarcity and regulations make site selection slow. We present AURA (Autonomous Urban Resource Allocator), a hierarchical multi-agent reinforcement learning system for real-time affordable housing site selection under hard regulatory constraints (QCT, DDA, LIHTC). We model the task as a constrained multi-objective Markov decision process optimizing accessibility, environmental impact, construction cost, and social equity while enforcing feasibility. AURA uses a regulatory-aware state encoding 127 federal and local constraints, Pareto-constrained policy gradients with feasibility guarantees, and reward decomposition separating immediate costs from long-term social outcomes. On datasets from 8 U.S. metros (47,392 candidate parcels), AURA attains 94.3% regulatory compliance and improves Pareto hypervolume by 37.2% over strong baselines. In a New York City 2026 case study, it reduces selection time from 18 months to 72 hours and identifies 23% more viable sites; chosen sites have 31% better transit access and 19% lower environmental impact than expert picks.
- Abstract(参考訳): 住宅不足が数十億に影響を及ぼし、土地の不足と規制によって場所の選択が遅くなっている。
本稿では, 厳しい規制制約(QCT, DDA, LIHTC)の下で, リアルタイムに手頃な住宅地選定を行う階層型マルチエージェント強化学習システムであるAURAについて述べる。
本研究は, アクセシビリティ, 環境影響, 建設コスト, ソーシャルエクイティを最適化する多目的マルコフ決定プロセスとして, 実現可能性を重視しながらタスクをモデル化する。
AURAは127の連邦的および地方的制約をコードする規制を意識した状態、実現可能性を保証するパレート制約の政策勾配、長期の社会的成果から即時的なコストを分離する報酬の分離を使用している。
8つの米国メロス(47,392の候補パーセル)のデータセットでは、AURAは94.3%の規制コンプライアンスを獲得し、強いベースラインよりもパレートハイパーボリュームを37.2%改善している。
ニューヨーク市の2026年のケーススタディでは、選択時間が18ヶ月から72時間に短縮され、23%以上の生存可能なサイトが特定され、選択されたサイトは、専門家の選抜よりも31%、環境への影響が19%低い。
関連論文リスト
- Multi-Objective Adaptive Rate Limiting in Microservices Using Deep Reinforcement Learning [10.766410192517164]
APIレート制限は、システムの安定性とサービス品質を保証する重要なメカニズムとして現れています。
トークンバケットやスライディングウィンドウといった従来のレート制限アルゴリズムは、動的トラフィックパターンやさまざまなシステム負荷に適応するのに苦労する。
本稿では,システムスループットとサービスレイテンシを動的にバランスする深層強化学習に基づく適応率制限戦略を提案する。
論文 参考訳(メタデータ) (2025-11-05T08:22:42Z) - Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning [52.03884701766989]
オフライン強化学習(RL)アルゴリズムは、通常、アクション選択に制約を課す。
本稿では,Bellmanターゲットにおける行動選択を,データセットアクションの近傍の結合に制限する新しい地区制約を提案する。
我々は,この制約を満たす目標動作を用いてQ学習を行うための,単純で効果的なアルゴリズムであるAdaptive Neighborhood-Constrained Q Learning(ANQ)を開発した。
論文 参考訳(メタデータ) (2025-11-04T13:42:05Z) - ATLAS: Constraints-Aware Multi-Agent Collaboration for Real-World Travel Planning [53.065247112514534]
ATLASは、現実世界の旅行計画タスクにおける制約意識の複雑な性質を扱うために設計された汎用マルチエージェントフレームワークである。
我々はTravelPlannerベンチマークで最先端のパフォーマンスを示し、最終パスレートを23.3%から44.4%に改善した。
論文 参考訳(メタデータ) (2025-09-29T23:23:52Z) - Not in My Backyard! Temporal Voting Over Public Chores [21.36300710262896]
本研究では、有権者が公共の雑用に対して動的に選好する時間的投票モデルについて検討する。
実用的・平等的福祉を最適化する際の計算複雑性について検討する。
論文 参考訳(メタデータ) (2025-08-12T10:06:56Z) - Autonomous Collaborative Scheduling of Time-dependent UAVs, Workers and Vehicles for Crowdsensing in Disaster Response [18.44231237535367]
本稿では、異種多エージェントオンライン協調スケジューリングアルゴリズムHoAs-PALNについて検討する。
HoAs-PALNは、マッチングプロセスと局所ナッシュ平衡ゲームにおける適応次元の減少によって実現される。
ベースラインと比較して、HoAs-PALNはタスク完了率を64.12%、46.48%、16.55%、14.03%改善している。
論文 参考訳(メタデータ) (2025-06-04T01:58:05Z) - Democratizing LLMs: An Exploration of Cost-Performance Trade-offs in
Self-Refined Open-Source Models [53.859446823312126]
SoTAは7Bから65Bまでのさまざまなサイズのオープンソースモデルを平均して、ベースラインのパフォーマンスから8.2%改善している。
厳密に言えば、Vicuna-7Bのような非常に小さなメモリフットプリントを持つモデルでさえ、全体的な11.74%の改善と、高い創造性、オープンエンドタスクの25.39%の改善を示している。
論文 参考訳(メタデータ) (2023-10-11T15:56:00Z) - Estimating Geographic Spillover Effects of COVID-19 Policies From
Large-Scale Mobility Networks [54.90772000796717]
郡レベルの政策は地域間の柔軟性を提供するが、地理的な流出がある場合には効果が低下する可能性がある。
我々は、数十億のタイムスタンプを持つ移動ネットワークを用いて、流出量を推定する。
郡レベルの制限は、モビリティを減らすための州全体の制限と同等に有効である。
論文 参考訳(メタデータ) (2022-12-12T20:16:54Z) - Multi-Agent Distributed Reinforcement Learning for Making Decentralized
Offloading Decisions [7.326507804995567]
自律エージェントによる分散意思決定問題として計算オフロードを定式化する。
我々は、競争と協力のバランスをとることで、エージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
動的環境下では,部分的,遅延的,ノイズの多い状態情報を用いて学習する新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-04-05T15:01:48Z) - Jalisco's multiclass land cover analysis and classification using a
novel lightweight convnet with real-world multispectral and relief data [51.715517570634994]
本稿では、LC分類と解析を行うために、新しい軽量(89kパラメータのみ)畳み込みニューラルネットワーク(ConvNet)を提案する。
本研究では,実世界のオープンデータソースを3つ組み合わせて13のチャネルを得る。
組込み分析は、いくつかのクラスにおいて限られたパフォーマンスを期待し、最も類似したクラスをグループ化する機会を与えてくれます。
論文 参考訳(メタデータ) (2022-01-26T14:58:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。