論文の概要: Datastore Design for Analysis of Police Broadcast Audio at Scale
- arxiv url: http://arxiv.org/abs/2310.16956v1
- Date: Wed, 25 Oct 2023 19:52:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-27 23:35:11.340192
- Title: Datastore Design for Analysis of Police Broadcast Audio at Scale
- Title(参考訳): 大規模警察放送音声分析のためのデータストア設計
- Authors: Ayah Ahmad (1), Christopher Graziul (2), Margaret Beale Spencer (2)
((1) University of California, Berkeley, (2) University of Chicago)
- Abstract要約: シカゴ警察署(CPD)の分析における音声感情認識(SER)の実現に向けた予備研究について述べる。
合成音声ファイルのマルチモーダル解析を可能にするデータストアのパイプライン作成を実演する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With policing coming under greater scrutiny in recent years, researchers have
begun to more thoroughly study the effects of contact between police and
minority communities. Despite data archives of hundreds of thousands of
recorded Broadcast Police Communications (BPC) being openly available to the
public, a closer look at a large-scale analysis of the language of policing has
remained largely unexplored. While this research is critical in understanding a
"pre-reflective" notion of policing, the large quantity of data presents
numerous challenges in its organization and analysis.
In this paper, we describe preliminary work towards enabling Speech Emotion
Recognition (SER) in an analysis of the Chicago Police Department's (CPD) BPC
by demonstrating the pipelined creation of a datastore to enable a multimodal
analysis of composed raw audio files.
- Abstract(参考訳): 近年、警察はより精査されるようになり、警察と少数派の間での接触の影響について研究が進められている。
何十万もの録画された警察通信(bpc)のデータアーカイブが一般に公開されているにもかかわらず、警察の言語に関する大規模な分析は、ほとんど調査されていない。
この研究は、警察の「先取り的」概念を理解する上で重要であるが、大量のデータが組織や分析において多くの課題を呈している。
本稿では,シカゴ警察署(cpd)bpcの分析において,合成生音声ファイルのマルチモーダル解析を可能にするデータストア作成のパイプライン化を実証し,音声感情認識(ser)の実現に向けた予備作業について述べる。
関連論文リスト
- Understanding Audiovisual Deepfake Detection: Techniques, Challenges, Human Factors and Perceptual Insights [49.81915942821647]
ディープラーニングは様々な分野に適用され、ディープフェイク検出への影響は例外ではない。
ディープフェイク(英: Deepfakes)は、政治的偽造、フィッシング、スランダリング、偽情報の拡散に偽装的に使用できる、偽物だが現実的な合成コンテンツである。
本稿では,ディープフェイク検出戦略の有効性を改善し,サイバーセキュリティとメディアの整合性に関する今後の研究を導くことを目的とする。
論文 参考訳(メタデータ) (2024-11-12T09:02:11Z) - Race and Privacy in Broadcast Police Communications [3.034710104407876]
シカゴ市警察(CPD)の放送警察通信(BPC)による法執行官(LEO)の活動の調整について検討する。
2018年8月10日午前9時から午後5時にかけて放送されたラジオ放送の文字起こしを,最近収集した80,775時間のBPCのアーカイブから分析した。
警察がBPCで用いた語彙や言論行為を探索し、地域住民への個人的特徴の言及、BPC上で共有される個人情報、およびそれらと比較する。
論文 参考訳(メタデータ) (2024-07-01T21:34:51Z) - A Multi-Perspective Machine Learning Approach to Evaluate Police-Driver
Interaction in Los Angeles [18.379058918856717]
州内で最も目に見えて接触した警察官は、交通停止中に年間2000万回以上、市民と交流している。
ボディウーンカメラ(BWC)は、警察の説明責任を高め、警察と公共の相互作用を改善する手段として用いられる。
本稿では、このBWC映像から音声、ビデオ、および転写情報を分析するために、新しいマルチパースペクティブ・マルチモーダル機械学習(ML)ツールを開発するためのアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-24T19:56:20Z) - SER_AMPEL: a multi-source dataset for speech emotion recognition of
Italian older adults [58.49386651361823]
SER_AMPELは、音声感情認識のためのマルチソースデータセットである。
イタリア人の高齢者の場合、音声による感情認識の基準を提供する目的で収集される。
このようなデータセットの必要性の証拠は、技術の現状の分析から生まれる。
論文 参考訳(メタデータ) (2023-11-24T13:47:25Z) - Developing Speech Processing Pipelines for Police Accountability [22.711149484932527]
警察のボディウーンのカメラは、警察の責任と透明性を向上する可能性がある。しかし実際には、何億時間もの映像がレビューされることはない。
本稿では,交通停止時の映像におけるASRと役員による音声検出に着目し,事前学習型大規模音声モデルの有効性について検討する。
提案するパイプラインには、トレーニングデータアライメントとフィルタリング、リソース制約による微調整、完全自動化アプローチのための役員音声検出とASRの組み合わせが含まれる。
論文 参考訳(メタデータ) (2023-06-09T17:48:58Z) - Leveraging Large Language Models for Topic Classification in the Domain
of Public Affairs [65.9077733300329]
大規模言語モデル (LLM) は公務員文書の分析を大幅に強化する可能性を秘めている。
LLMは、公共の分野など、ドメイン固有のドキュメントを処理するのに非常に役立ちます。
論文 参考訳(メタデータ) (2023-06-05T13:35:01Z) - Retrieval Enhanced Data Augmentation for Question Answering on Privacy
Policies [74.01792675564218]
本研究では,ラベルのないポリシー文書から関連するテキストセグメントを抽出する検索モデルに基づくデータ拡張フレームワークを開発する。
拡張データの多様性と品質を改善するために,複数の事前学習言語モデル(LM)を活用し,ノイズ低減フィルタモデルでそれらをカスケードする。
PrivacyQAベンチマークの強化データを使用して、既存のベースラインを大きなマージン(10% F1)に高め、新しい最先端のF1スコアを50%達成します。
論文 参考訳(メタデータ) (2022-04-19T15:45:23Z) - Librarian-in-the-Loop: A Natural Language Processing Paradigm for
Detecting Informal Mentions of Research Data in Academic Literature [1.4190701053683017]
本研究では,研究データセットに対する非公式な言及を識別するヒューマンタスクを支援する自然言語処理パラダイムを提案する。
非公式なデータ発見の作業は現在、大学間政治社会研究コンソーシアム (Inter-University Consortium for Political and Social Research) の図書館員とそのスタッフによって行われている。
論文 参考訳(メタデータ) (2022-03-10T02:11:30Z) - APES: Audiovisual Person Search in Untrimmed Video [87.4124877066541]
音声人物探索データセット(APES)について述べる。
APESには36時間のビデオにラベル付けされた1,9K以上のIDが含まれている。
APESの重要な特徴は、顔と同一アイデンティティの音声セグメントをリンクする密集した時間アノテーションを含むことである。
論文 参考訳(メタデータ) (2021-06-03T08:16:42Z) - Multi-Modal Video Forensic Platform for Investigating Post-Terrorist
Attack Scenarios [55.82693757287532]
大規模ビデオ分析プラットフォーム(VAP)は、容疑者を特定し証拠を確保するために法執行機関(LEA)を支援する。
本稿では,視覚・音声分析モジュールを統合し,監視カメラからの情報と目撃者からの映像アップロードを融合するビデオ分析プラットフォームを提案する。
論文 参考訳(メタデータ) (2020-04-02T14:29:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。