論文の概要: Open Source Software and Data for Human Service Development: A Case Study on Predicting Housing Instability
- arxiv url: http://arxiv.org/abs/2512.12919v1
- Date: Mon, 15 Dec 2025 02:08:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.501124
- Title: Open Source Software and Data for Human Service Development: A Case Study on Predicting Housing Instability
- Title(参考訳): オープンソースソフトウェアとヒューマンサービス開発のためのデータ:住宅の不安定性予測を事例として
- Authors: Maria Y. Rodriguez, Ehren Dohler, Jon Phillips, Melissa Villodas, Voltaire Vegara, Kenny Joseph, Amy Wilson,
- Abstract要約: どちらも、ニューヨーク州ブロンクス郡の退去申請書の支払い失敗を予測するために使用しています。
統計計算のためのRプロジェクトを用いて,マルチレベルモデル (MLM) と指数スムージングモデル (ETS) を用いる。
我々は、オープンソースデータとソフトウェアは、公開データの迅速な分析を促進するかもしれないが、公開データが確実に取得される情報によって制限されていることを発見した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Open-source data and tools are lauded as essential for replicable and usable social science, though little is known about their use in resource constrained human service provision. This paper examines the challenges and opportunities of open-source tools and data in human service development by using both to forecast failure to pay eviction filings in Bronx County, NY. We use zip code level data from the Housing Data Coalition, the American Community Survey 5-year estimates, and DeepMaps Model of the Labor Force to forecast rates through July 2021. We employ multilevel (MLM) and exponential smoothing (ETS) models using the R project for Statistical Computing, an oft used open-source statistical software. We compare our results to what happened during the same period, to illustrate the efficacy of the open-source tools and techniques employed. We argue open-source data and software may facilitate rapid analysis of public data - a much-needed ability in human service intervention development under increasingly constrained resources - but find public data are limited by the information they reliably capture, limiting their utility by a non-trivial margin of error. The manuscript concludes by considering lessons for human service organizations with limited analytical resources and a vested interest in low-resourced communities.
- Abstract(参考訳): オープンソースデータとツールは、複製可能で使用可能な社会科学に欠かせないものとして評価されているが、リソースに制約のある人的サービス提供における使用についてはほとんど知られていない。
ニューヨーク州ブロンクス郡における退去申請書の提出失敗を予測するために,人的サービス開発におけるオープンソースツールとデータの課題と機会について検討する。
我々は、2021年7月までの金利予測に、ハウジングデータ連合(英語版)、アメリカン・コミュニティ・サーベイ(英語版)の5年間の推計、およびDeepMaps Model of the Labor Force(英語版)のジップコードレベルデータを使用します。
我々は、オープンソースの統計ソフトウェアである統計コンピューティングのためのRプロジェクトを用いて、マルチレベル(MLM)と指数平滑化(ETS)モデルを採用する。
この結果と,同時期に起こったことを比較して,オープンソースツールとテクニックの有効性を示す。
オープンソースデータとソフトウェアは、公開データの迅速な分析を促進する可能性がある、と我々は主張する - ますます制約されたリソースの下でのヒューマンサービス介入開発において、非常に必要な能力である - しかし、公開データは、確実にキャプチャされる情報によって制限され、その実用性は、非自明なエラーの限界によって制限される。
この原稿は、分析資源が限られ、低リソースのコミュニティへの利益に恵まれている人事組織に対する教訓を考察することで締めくくっている。
関連論文リスト
- Artificial Intelligence for Cost-Aware Resource Prediction in Big Data Pipelines [0.0]
過剰なプロビジョンは不要なコストをもたらし、過剰なプロビジョンはパフォーマンス劣化とSLA違反のリスクを負う。
本研究では,ランダムフォレスト回帰を用いたビッグデータパイプラインの資源利用予測手法を提案する。
論文 参考訳(メタデータ) (2025-09-30T20:01:12Z) - Privacy-Preserving Methods for Bug Severity Prediction [0.0]
ソースコードメトリクスと大規模言語モデルを用いたメソッドレベルのバグ重大度予測について検討する。
集中学習,フェデレート学習,合成データ生成を用いて学習したモデルの性能を比較した。
我々の発見は、産業環境で効果的なバグの深刻度予測を可能にするために、プライバシー保護アプローチの可能性を強調している。
論文 参考訳(メタデータ) (2025-06-28T04:40:51Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Unleashing LLM Reasoning Capability via Scalable Question Synthesis from Scratch [54.12139707822201]
本稿では,新しい,スケーラブルで費用対効果の高いデータ合成手法であるScaleQuestを提案する。
スクラッチから多様な質問を生成することで、100万の問題解決ペアのデータセットを生成します。
私たちの実験では、データに基づいてトレーニングされたモデルが、既存のオープンソースデータセットより優れています。
論文 参考訳(メタデータ) (2024-10-24T12:42:04Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Unearthing Large Scale Domain-Specific Knowledge from Public Corpora [103.0865116794534]
データ収集パイプラインに大規模なモデルを導入し、ドメイン固有の情報の生成をガイドします。
このアプローチをRetrieve-from-CCと呼ぶ。
ドメイン固有の知識に関するデータを収集するだけでなく、パブリックコーパスから潜在的推論手順を含むデータをマイニングする。
論文 参考訳(メタデータ) (2024-01-26T03:38:23Z) - Outsourcing Training without Uploading Data via Efficient Collaborative
Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。
我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。
我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文 参考訳(メタデータ) (2022-10-23T00:12:18Z) - Seeing poverty from space, how much can it be tuned? [0.0]
本研究では, 組織的関係のない個人が, 特定の農業生態環境において, 地域貧困水準の予測の改善に寄与できることを実証した。
このアプローチは、衛星画像と「地上真実」データを現場から処理する深層学習による貧困のマッピングに関するいくつかの先駆的な取り組みに基づいている。
このプロジェクトの主な目的は、市民科学者、学生、組織が他の分野の手法を再現できるように、無償で利用可能なリソースを使用することで、コストを可能な限り低く抑えることであった。
論文 参考訳(メタデータ) (2021-07-30T15:23:54Z) - Leveraging Public Data for Practical Private Query Release [24.615338449313676]
既存のベースラインとは異なり、PMWPubは、関連するディストリビューションから引き出された公開データを事前情報として利用します。
米国コミュニティサーベイ(ACS)およびADULTデータセットに関する理論的分析と実証的評価を提供します。
PMWPubは、多くの既存のメソッドを実行する高次元データドメインによくスケールする。
論文 参考訳(メタデータ) (2021-02-17T06:19:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。