論文の概要: Exploring the Scope of Using News Articles to Understand Development
Patterns of Districts in India
- arxiv url: http://arxiv.org/abs/2107.02765v1
- Date: Sat, 3 Jul 2021 18:39:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-23 16:32:33.645853
- Title: Exploring the Scope of Using News Articles to Understand Development
Patterns of Districts in India
- Title(参考訳): インドにおける地域開発パターン理解のためのニュース記事の利用範囲の検討
- Authors: Mehak Gupta, Shayan Saifi, Konark Verma, Kumari Rekha, Aaditeshwar
Seth
- Abstract要約: 本研究では,インド各地で発生した多種多様な出来事について,ニュース記事の識別とランク付けを行う教師なし学習手法を構築した。
これにより、これらのイベントに関連する変数が実際に利用可能かどうかを判断し、これらの地区の開発をモデル化するのに役立つ。
また,10年ほど前に類似の社会経済指標を持つ地区のペアが,現在開発段階の異なる段階に到達した理由を理解するために,ニュース記事を使用することなど,このアプローチから生じるいくつかの応用についても述べる。
- 参考スコア(独自算出の注目度): 0.21806884759146514
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding what factors bring about socio-economic development may often
suffer from the streetlight effect, of analyzing the effect of only those
variables that have been measured and are therefore available for analysis. How
do we check whether all worthwhile variables have been instrumented and
considered when building an econometric development model? We attempt to
address this question by building unsupervised learning methods to identify and
rank news articles about diverse events occurring in different districts of
India, that can provide insights about what may have transpired in the
districts. This can help determine whether variables related to these events
are indeed available or not to model the development of these districts. We
also describe several other applications that emerge from this approach, such
as to use news articles to understand why pairs of districts that may have had
similar socio-economic indicators approximately ten years back ended up at
different levels of development currently, and another application that
generates a newsfeed of unusual news articles that do not conform to news
articles about typical districts with a similar socio-economic profile. These
applications outline the need for qualitative data to augment models based on
quantitative data, and are meant to open up research on new ways to mine
information from unstructured qualitative data to understand development.
- Abstract(参考訳): 社会経済的発展をもたらす要因を理解することは、しばしば街灯効果に悩まされ、測定され分析に利用できる変数のみの効果を分析する。
計量的開発モデルを構築する際に、すべての価値のある変数が計測され、考慮されたかどうかをどうやって確認すればよいか?
私たちは、インド各地区で発生したさまざまなイベントに関するニュース記事を特定しランク付けするために、教師なしの学習方法を構築してこの問題に対処しようとしている。
これにより、これらのイベントに関連する変数が実際に利用可能かどうかを判断し、これらの地区の開発をモデル化するのに役立つ。
また,10年ほど前に類似の社会経済指標を持つ可能性のある地区のペアが,現在開発段階の異なる段階に成長した理由を理解するために,ニュース記事を利用することや,類似の社会経済プロファイルを持つ典型的な地区のニュース記事に適合しない異例のニュース記事のニューズフィードを作成することなど,このアプローチから生じるいくつかの応用についても述べる。
これらの応用は、定量的データに基づくモデル強化のための定性データの必要性を概説し、非構造化定性データから情報をマイニングして開発を理解する新しい方法の研究を開放することを目的としている。
関連論文リスト
- Using Graph Neural Networks to Predict Local Culture [3.056211477364962]
本研究では, 周辺地域の内部特性に関する複数の情報ソースを結合し, 評価するグラフニューラルネットワーク(GNN)手法を提案する。
Yelpからパブリックな大規模データセットを探索することにより、近隣属性の予測における構造的連結性を考慮したアプローチの可能性を示す。
論文 参考訳(メタデータ) (2024-02-27T21:43:14Z) - Spurious Correlations in Machine Learning: A Survey [69.89249134046086]
機械学習システムは、入力の偏りのある特徴と対応するラベルの間の急激な相関に敏感である。
これらの特徴とそのラベルとの相関は"spurious"として知られている。
我々は、機械学習モデルにおける素早い相関に対処する現在の最先端の手法の分類とともに、この問題を包括的にレビューする。
論文 参考訳(メタデータ) (2024-02-20T04:49:34Z) - A Survey of Imbalanced Learning on Graphs: Problems, Techniques, and
Future Directions [64.84521350148513]
グラフは、現実世界の無数に存在する相互接続構造を表す。
グラフ学習方法のような効果的なグラフ分析により、ユーザはグラフデータから深い洞察を得ることができる。
しかし、これらの手法はデータ不均衡に悩まされることが多く、グラフデータでは、あるセグメントが豊富なデータを持っているのに、他のセグメントが不足しているのが一般的な問題である。
これは、より正確で代表的な学習結果のために、これらのデータ分散スキューを補正することを目的として、グラフ上の不均衡学習の出現する分野を必要とする。
論文 参考訳(メタデータ) (2023-08-26T09:11:44Z) - Data-Centric Epidemic Forecasting: A Survey [56.99209141838794]
この調査は、様々なデータ駆動の方法論および実践的進歩を掘り下げるものである。
疫学的なデータセットと,流行予測に関連する新しいデータストリームを列挙する。
また,これらの予測システムの現実的な展開において生じる経験や課題についても論じる。
論文 参考訳(メタデータ) (2022-07-19T16:15:11Z) - Extracting Large Scale Spatio-Temporal Descriptions from Social Media [1.14219428942199]
大規模イベントの追跡能力は、それらを理解し、適切なタイムリーな方法で反応を調整するために不可欠である。
我々は、ソーシャルメディアのような半構造化データソースを取り込み、このようなデータを拡張できるという仮説を模索している。
ソーシャルメディアは、直接の目撃者や専門家の意見などの貴重な知識を拡散しうるが、その騒々しい性質は、それらを管理しやすくするものではない。
論文 参考訳(メタデータ) (2022-06-27T13:16:43Z) - Learning Economic Indicators by Aggregating Multi-Level Geospatial
Information [20.0397537179667]
本研究は,複数レベルの地理的単位から観測される特徴を集約することで,経済指標を予測するための深層学習モデルを提案する。
我々の新しいマルチレベル学習モデルは、人口、購買力、エネルギー消費などの重要な指標を予測する上で、強いベースラインを著しく上回ります。
我々は、不平等と貧困に関する政策・社会科学研究において不可欠な第一歩である不平等を測定するためのマルチレベルモデルについて論じる。
論文 参考訳(メタデータ) (2022-05-03T13:05:39Z) - Knowledge-driven Data Construction for Zero-shot Evaluation in
Commonsense Question Answering [80.60605604261416]
本稿では,共通認識課題にまたがるゼロショット質問応答のための新しいニューラルシンボリック・フレームワークを提案する。
言語モデル、トレーニング体制、知識ソース、データ生成戦略のセットを変えて、タスク間の影響を測定します。
個別の知識グラフは特定のタスクに適しているが、グローバルな知識グラフはさまざまなタスクに対して一貫した利得をもたらす。
論文 参考訳(メタデータ) (2020-11-07T22:52:21Z) - Principles and Practice of Explainable Machine Learning [12.47276164048813]
本稿では、特に機械学習(ML)とパターン認識モデルに関するデータ駆動手法に焦点を当てる。
メソッドの頻度と複雑さが増すにつれて、少なくともビジネスの利害関係者はモデルの欠点に懸念を抱いている。
我々は、業界実践者が説明可能な機械学習の分野をよりよく理解するための調査を実施した。
論文 参考訳(メタデータ) (2020-09-18T14:50:27Z) - Urban Sensing based on Mobile Phone Data: Approaches, Applications and
Challenges [67.71975391801257]
モバイルデータ分析における多くの関心は、人間とその行動に関連している。
本研究の目的は,携帯電話データから知識を発見するために実装された手法や手法をレビューすることである。
論文 参考訳(メタデータ) (2020-08-29T15:14:03Z) - Ontologies in CLARIAH: Towards Interoperability in History, Language and
Media [0.05277024349608833]
デジタル人文科学の最も重要な目標の1つは、研究者に新しい研究質問のためのデータとツールを提供することである。
FAIRの原則は、データが必要な状態として、これらのフレームワークを提供する。 Findable は、さまざまなソースに散らばっているため、しばしば参照可能 アクセス可能 いくつかはオフラインやペイウォールの後方にあるかもしれない 相互運用可能 標準的な知識表現フォーマットを使用して、共有される。
オランダの国立プロジェクト CLARIAH に開発・統合されたツールについて述べる。
論文 参考訳(メタデータ) (2020-04-06T17:38:47Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。