論文の概要: How to Build Robust, Scalable Models for GSV-Based Indicators in Neighborhood Research
- arxiv url: http://arxiv.org/abs/2601.06443v1
- Date: Sat, 10 Jan 2026 06:00:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.817938
- Title: How to Build Robust, Scalable Models for GSV-Based Indicators in Neighborhood Research
- Title(参考訳): 周辺研究におけるGSV指標のロバストでスケーラブルなモデル構築法
- Authors: Xiaoya Tang, Xiaohe Yue, Heran Mane, Dapeng Li, Quynh Nguyen, Tolga Tasdizen,
- Abstract要約: 教師なしのトレーニングを通じて、より大きなラベルなしデータセットを活用しながら、限られたサイズとラベルを持つデータセットの基盤モデルの選択と適応方法を示す。
本研究は、教師なし適応前後のモデル性能を比較した総合的定量的および視覚的分析を含む。
- 参考スコア(独自算出の注目度): 5.236003339365069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A substantial body of health research demonstrates a strong link between neighborhood environments and health outcomes. Recently, there has been increasing interest in leveraging advances in computer vision to enable large-scale, systematic characterization of neighborhood built environments. However, the generalizability of vision models across fundamentally different domains remains uncertain, for example, transferring knowledge from ImageNet to the distinct visual characteristics of Google Street View (GSV) imagery. In applied fields such as social health research, several critical questions arise: which models are most appropriate, whether to adopt unsupervised training strategies, what training scale is feasible under computational constraints, and how much such strategies benefit downstream performance. These decisions are often costly and require specialized expertise. In this paper, we answer these questions through empirical analysis and provide practical insights into how to select and adapt foundation models for datasets with limited size and labels, while leveraging larger, unlabeled datasets through unsupervised training. Our study includes comprehensive quantitative and visual analyses comparing model performance before and after unsupervised adaptation.
- Abstract(参考訳): 健康研究のかなりの部分は、近隣環境と健康結果との強い結びつきを示している。
近年,周辺環境の大規模かつ体系的な評価を可能にするために,コンピュータビジョンの進歩を活用することへの関心が高まっている。
しかし、基本的に異なる領域にまたがる視覚モデルの一般化性は、例えば、ImageNetからGoogleストリートビュー(GSV)画像の視覚的特徴に知識を移すなど、依然として不確実である。
社会健康研究などの応用分野において、どのモデルが最も適切か、教師なしのトレーニング戦略を採用するか、どのトレーニングスケールが計算制約下で可能か、そのような戦略が下流のパフォーマンスにどの程度の恩恵をもたらすか、といった重要な問題が発生する。
これらの決定は、しばしば費用がかかり、専門的な専門知識を必要とする。
本稿では,実験的な分析を通じてこれらの疑問に答え,制限されたサイズとラベルを持つデータセットの基盤モデルを選定し,適応するための実践的な洞察を提供するとともに,教師なしのトレーニングを通じて大規模でラベルなしのデータセットを活用する。
本研究は、教師なし適応前後のモデル性能を比較した総合的定量的および視覚的分析を含む。
関連論文リスト
- A Comparative Study of Scanpath Models in Graph-Based Visualization [7.592272924252313]
アイトラッキング(ET)データは、コスト、プライバシ、スケーラビリティに関する課題を提示する。
本研究では,40名の参加者を対象に,グラフ解析を行ったET実験を行った。
我々は,DeepGaze,UMSS,Gazeformerなどのモデルで生成したヒトスキャンパスと合成パスを比較した。
論文 参考訳(メタデータ) (2025-03-31T14:43:42Z) - Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。
提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文 参考訳(メタデータ) (2024-10-08T17:59:03Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - Comprehensive Exploration of Synthetic Data Generation: A Survey [4.485401662312072]
この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。
その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。
コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文 参考訳(メタデータ) (2024-01-04T20:23:51Z) - Fairness meets Cross-Domain Learning: a new perspective on Models and
Metrics [80.07271410743806]
クロスドメイン学習(CD)とモデルフェアネスの関係について検討する。
いくつかの人口集団にまたがる顔画像と医療画像のベンチマークと、分類とローカライゼーションタスクについて紹介する。
本研究は,3つの最先端フェアネスアルゴリズムとともに,14のCDアプローチをカバーし,前者が後者に勝ることを示す。
論文 参考訳(メタデータ) (2023-03-25T09:34:05Z) - Towards Reliable Assessments of Demographic Disparities in Multi-Label
Image Classifiers [11.973749734226852]
マルチラベル画像分類と,特に対象分類タスクについて検討する。
測定のための設計選択とトレードオフは、以前のコンピュータビジョン文学で議論されたよりもニュアンスが高い。
実装の詳細にだけ似ているが、評価の結論に大きな影響を及ぼすいくつかの設計選択を特定します。
論文 参考訳(メタデータ) (2023-02-16T20:34:54Z) - Fine-Grained Image Analysis with Deep Learning: A Survey [146.22351342315233]
きめ細かい画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の根本的な問題である。
本稿では、FGIAの分野を再定義し、FGIAの2つの基礎研究領域、細粒度画像認識と細粒度画像検索を統合することで、FGIAの分野を広げようとしている。
論文 参考訳(メタデータ) (2021-11-11T09:43:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。