論文の概要: GeoReg: Weight-Constrained Few-Shot Regression for Socio-Economic Estimation using LLM
- arxiv url: http://arxiv.org/abs/2507.13323v1
- Date: Thu, 17 Jul 2025 17:42:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.602834
- Title: GeoReg: Weight-Constrained Few-Shot Regression for Socio-Economic Estimation using LLM
- Title(参考訳): GeoReg: LLMを用いた社会経済的評価のための重み制約のあるFew-Shot回帰
- Authors: Kyeongjin Ahn, Sungwon Han, Seungeon Lee, Donghyun Ahn, Hyoshin Kim, Jungwon Kim, Jihee Kim, Sangyoon Park, Meeyoung Cha,
- Abstract要約: 本研究は,多様なデータソースを統合し,社会経済指標を推定する回帰モデルであるGeoRegを紹介する。
開発段階の異なる3つの国における実験により、我々のモデルは社会経済指標の推定において基準線を上回っていることが示された。
- 参考スコア(独自算出の注目度): 12.740560201477798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Socio-economic indicators like regional GDP, population, and education levels, are crucial to shaping policy decisions and fostering sustainable development. This research introduces GeoReg a regression model that integrates diverse data sources, including satellite imagery and web-based geospatial information, to estimate these indicators even for data-scarce regions such as developing countries. Our approach leverages the prior knowledge of large language model (LLM) to address the scarcity of labeled data, with the LLM functioning as a data engineer by extracting informative features to enable effective estimation in few-shot settings. Specifically, our model obtains contextual relationships between data features and the target indicator, categorizing their correlations as positive, negative, mixed, or irrelevant. These features are then fed into the linear estimator with tailored weight constraints for each category. To capture nonlinear patterns, the model also identifies meaningful feature interactions and integrates them, along with nonlinear transformations. Experiments across three countries at different stages of development demonstrate that our model outperforms baselines in estimating socio-economic indicators, even for low-income countries with limited data availability.
- Abstract(参考訳): 地域GDP、人口、教育水準といった社会経済指標は、政策決定を形作り、持続可能な発展を促進するために不可欠である。
本研究は, 衛星画像やWebベースの地理空間情報を含む多様なデータソースを統合した回帰モデルであるGeoRegを導入し, 発展途上国などのデータスカース地域においても, これらの指標を推定する。
提案手法では,ラベル付きデータの不足に対処するために,LLMがデータエンジニアとして機能する大規模言語モデル (LLM) の事前知識を活用する。
具体的には,データ特徴と対象指標の文脈的関係を抽出し,その相関関係を正・負・混合・無関係と分類する。
これらの特徴は、各カテゴリの調整された重み制約を持つ線形推定器に供給される。
非線形パターンを捉えるために、モデルは意味のある特徴相互作用を識別し、それらを非線形変換とともに統合する。
開発段階の異なる3つの国での実験では、データ可用性に限界がある低所得国においても、社会経済指標の推定において、モデルがベースラインを上回ることが示されている。
関連論文リスト
- Exploring Scaling Laws for EHR Foundation Models [17.84205864956449]
EHR基礎モデルのスケーリング法則に関する最初の実証的研究について述べる。
パラボリックなIsoFLOP曲線や計算,モデルパラメータ,データサイズ,臨床ユーティリティ間の電力-法則関係など,一貫したスケーリングパターンを同定する。
論文 参考訳(メタデータ) (2025-05-29T01:05:11Z) - Prismatic Synthesis: Gradient-based Data Diversification Boosts Generalization in LLM Reasoning [77.120955854093]
我々は,データ多様性が言語モデルにおける一般化の強力な予測因子であることを示す。
モデル誘起勾配のエントロピーを通して多様性を定量化する計量であるG-Vendiを導入する。
多様な合成データを生成するためのフレームワークであるPrismatic Synthesisを提案する。
論文 参考訳(メタデータ) (2025-05-26T16:05:10Z) - Optimizing Sequential Recommendation Models with Scaling Laws and Approximate Entropy [104.48511402784763]
SRモデルの性能法則は,モデルの性能とデータ品質の関係を理論的に調査し,モデル化することを目的としている。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文 参考訳(メタデータ) (2024-11-30T10:56:30Z) - GeoSEE: Regional Socio-Economic Estimation With a Large Language Model [17.31652821477571]
大規模言語モデル(LLM)を用いた統合パイプラインを用いて,様々な社会経済指標を推定できるGeoSEEを提案する。
システムは、自然言語ベースのテキストフォーマットで選択したモジュールの結果を集約した後、コンテキスト内学習を通じてターゲットインジケータを算出する。
本手法は、教師なしコンテキストとローショットコンテキストの両方において、他の予測モデルよりも優れている。
論文 参考訳(メタデータ) (2024-06-14T07:50:22Z) - TrajPRed: Trajectory Prediction with Region-based Relation Learning [11.714283460714073]
本研究では,交通現場における人的軌跡予測のための地域型関係学習パラダイムを提案する。
社会的相互作用は、グローバルな視点から、局所的な関節情報の時間的変化を関連づけることでモデル化される。
予測枠組みにおいて,マルチゴール推定と地域関係学習を統合し,2つの刺激,社会的相互作用,目標をモデル化する。
論文 参考訳(メタデータ) (2024-04-10T12:31:43Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - Learning Economic Indicators by Aggregating Multi-Level Geospatial
Information [20.0397537179667]
本研究は,複数レベルの地理的単位から観測される特徴を集約することで,経済指標を予測するための深層学習モデルを提案する。
我々の新しいマルチレベル学習モデルは、人口、購買力、エネルギー消費などの重要な指標を予測する上で、強いベースラインを著しく上回ります。
我々は、不平等と貧困に関する政策・社会科学研究において不可欠な第一歩である不平等を測定するためのマルチレベルモデルについて論じる。
論文 参考訳(メタデータ) (2022-05-03T13:05:39Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Predicting Census Survey Response Rates With Parsimonious Additive Models and Structured Interactions [12.818275315985971]
本研究では, フレキシブルで解釈可能な非パラメトリックモデル群を用いて, アンケート応答率を予測することの問題点を考察する。
この研究は、米国国勢調査局(US Census Bureau)の有名なROAMアプリケーションによって動機付けられている。
論文 参考訳(メタデータ) (2021-08-24T17:49:55Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。