論文の概要: Text Mining for Processing Interview Data in Computational Social
Science
- arxiv url: http://arxiv.org/abs/2011.14037v1
- Date: Sat, 28 Nov 2020 00:44:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-19 19:29:53.774727
- Title: Text Mining for Processing Interview Data in Computational Social
Science
- Title(参考訳): 計算社会科学におけるインタビューデータ処理のためのテキストマイニング
- Authors: Jussi Karlgren, Renee Li, Eva M Meyersson Milgrom
- Abstract要約: 我々は、市販のテキスト分析技術を用いて、計算社会科学研究からのインタビューテキストデータを処理する。
局所的クラスタリングと用語的エンリッチメントが,応答の探索と定量化に有用であることがわかった。
我々は社会科学の研究にテキスト分析を使うことを奨励し、特に探索的オープンエンドな研究に力を入れている。
- 参考スコア(独自算出の注目度): 0.6820436130599382
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We use commercially available text analysis technology to process interview
text data from a computational social science study. We find that topical
clustering and terminological enrichment provide for convenient exploration and
quantification of the responses. This makes it possible to generate and test
hypotheses and to compare textual and non-textual variables, and saves analyst
effort. We encourage studies in social science to use text analysis, especially
for exploratory open-ended studies. We discuss how replicability requirements
are met by text analysis technology. We note that the most recent learning
models are not designed with transparency in mind, and that research requires a
model to be editable and its decisions to be explainable. The tools available
today, such as the one used in the present study, are not built for processing
interview texts. While many of the variables under consideration are
quantifiable using lexical statistics, we find that some interesting and
potentially valuable features are difficult or impossible to automatise
reliably at present. We note that there are some potentially interesting
applications for traditional natural language processing mechanisms such as
named entity recognition and anaphora resolution in this application area. We
conclude with a suggestion for language technologists to investigate the
challenge of processing interview data comprehensively, especially the
interplay between question and response, and we encourage social science
researchers not to hesitate to use text analysis tools, especially for the
exploratory phase of processing interview data.?
- Abstract(参考訳): 市販のテキスト分析技術を用いて,コンピュータ社会科学研究のインタビューテキストデータを処理している。
トピッククラスタリングと専門用語の豊かさは,応答の簡便な探索と定量化に寄与する。
これにより、仮説の生成とテスト、テキスト変数と非テキスト変数の比較が可能になり、アナリストの努力を節約できる。
社会科学研究は,特に探索的オープンエンド研究において,テキスト分析の利用を奨励する。
本稿では,テキスト解析技術による再現性要件の満たし方について議論する。
最新の学習モデルは透明性を念頭に設計されておらず、その研究には編集可能なモデルと説明可能な決定が必要であることに留意する。
現在利用可能なツール,例えば本研究では,インタビューテキストの処理には使用されていない。
検討中の変数の多くは、語彙統計を用いて定量化できるが、興味深い、潜在的に価値のあるいくつかの機能は、現在確実に自動化することは困難か不可能である。
このアプリケーション領域では、名前付きエンティティ認識やanaphora解決など、従来の自然言語処理メカニズムに潜在的に興味深い応用がいくつかあることに注意する。
最後に, 言語技術者に対して, インタビューデータの包括的処理, 特に質問と回答の相互作用について調査することを提案し, 特に面接データの探索的処理において, テキスト分析ツールの使用をためらわないよう社会科学研究者に促す。
?
関連論文リスト
- Likelihood as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
言語モデルの性能の効果的な指標としての可能性を示す。
提案手法は,より優れた性能をもたらすプロンプトの選択と構築のための尺度として,疑似可能性を利用する2つの手法を提案する。
論文 参考訳(メタデータ) (2024-11-12T13:14:09Z) - A Primer on Word Embeddings: AI Techniques for Text Analysis in Social Work [0.0]
本稿では,ソーシャルワーク研究者に単語埋め込みを紹介する。
基本概念、技術的基礎、実践的応用について議論する。
ソーシャルワークに埋め込み技術をうまく実装するには、ドメイン固有モデルの開発、アクセス可能なツールの作成、ソーシャルワークの倫理的原則に沿ったベストプラクティスの確立が必要であると結論付けている。
論文 参考訳(メタデータ) (2024-11-11T17:33:51Z) - Automating the Information Extraction from Semi-Structured Interview
Transcripts [0.0]
本稿では,半構造化面接書から情報を取り出す自動システムの開発と応用について検討する。
本稿では,研究者がインタビューデータのテーマ構造を効率的に処理し,視覚化できる,ユーザフレンドリーなソフトウェアプロトタイプを提案する。
論文 参考訳(メタデータ) (2024-03-07T13:53:03Z) - Artificial intelligence to automate the systematic review of scientific
literature [0.0]
我々は過去15年間に提案されたAI技術について,研究者が科学的文献の体系的な分析を行うのを助けるために調査を行った。
現在サポートされているタスク、適用されるアルゴリズムの種類、34の初等研究で提案されているツールについて説明する。
論文 参考訳(メタデータ) (2024-01-13T19:12:49Z) - Machine-assisted quantitizing designs: augmenting humanities and social sciences with artificial intelligence [0.0]
大規模言語モデル(LLM)は、人文科学や社会科学におけるデータ分析をスケールアップする前例のない機会であることが示された。
設計原則を定量化し、変換し、言語学から特徴分析し、人間の専門知識と機械のスケーラビリティを透過的に統合する混合手法を構築します。
このアプローチは、1ダース以上のLDM支援ケーススタディで議論され、9つの多様な言語、複数の規律、タスクをカバーしている。
論文 参考訳(メタデータ) (2023-09-24T14:21:50Z) - Chat2Brain: A Method for Mapping Open-Ended Semantic Queries to Brain
Activation Maps [59.648646222905235]
そこで本研究では,テキスト2画像モデルであるText2BrainにLLMを組み合わせ,セマンティッククエリを脳活性化マップにマッピングするChat2Brainを提案する。
テキストクエリのより複雑なタスクに対して、Chat2Brainが可塑性なニューラルアクティベーションパターンを合成できることを実証した。
論文 参考訳(メタデータ) (2023-09-10T13:06:45Z) - Revisiting the Roles of "Text" in Text Games [102.22750109468652]
本稿では,強化学習におけるテキストの役割について検討する。
本稿では,関連するコンテキスト情報を近似状態ハッシュに抽出する簡単な手法を提案する。
このような軽量なプラグインは最先端のテキストエージェントとの競合性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T21:52:39Z) - ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational
Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。
我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文 参考訳(メタデータ) (2022-10-07T23:48:50Z) - Polling Latent Opinions: A Method for Computational Sociolinguistics
Using Transformer Language Models [4.874780144224057]
我々は,Yelp レビューのより大きなコーパス内で,トランスフォーマー言語モデルの記憶と外挿の能力を用いて,サブグループの言語的振る舞いを学習する。
トレーニングコーパスに特定のキーワードが制限されたり、全く存在しない場合においても、GPTは正しい感情を持つ大量のテキストを正確に生成できることを示す。
論文 参考訳(メタデータ) (2022-04-15T14:33:58Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - ORB: An Open Reading Benchmark for Comprehensive Evaluation of Machine
Reading Comprehension [53.037401638264235]
我々は,7種類の読解データセットの性能を報告する評価サーバORBを提案する。
評価サーバは、モデルのトレーニング方法に制限を課さないため、トレーニングパラダイムや表現学習の探索に適したテストベッドである。
論文 参考訳(メタデータ) (2019-12-29T07:27:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。