論文の概要: OpenFraming: We brought the ML; you bring the data. Interact with your
data and discover its frames
- arxiv url: http://arxiv.org/abs/2008.06974v1
- Date: Sun, 16 Aug 2020 18:59:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 09:05:32.333739
- Title: OpenFraming: We brought the ML; you bring the data. Interact with your
data and discover its frames
- Title(参考訳): openframing: mlを持ち込み、データをもたらします。
データと対話してフレームを発見する
- Authors: Alyssa Smith, David Assefa Tofu, Mona Jalal, Edward Edberg Halim,
Yimeng Sun, Vidya Akavoor, Margrit Betke, Prakash Ishwar, Lei Guo, Derry
Wijaya
- Abstract要約: テキスト文書中のフレームを解析・分類する Web ベースのシステムを提案する。
我々は,様々な問題に関する最先端の事前学習フレーム分類モデルと,新規分類モデルの学習のためのユーザフレンドリなパイプラインを提供する。
私たちのシステムを構成するコードもオープンソースでドキュメント化されています。
- 参考スコア(独自算出の注目度): 13.695739582457872
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When journalists cover a news story, they can cover the story from multiple
angles or perspectives. A news article written about COVID-19 for example,
might focus on personal preventative actions such as mask-wearing, while
another might focus on COVID-19's impact on the economy. These perspectives are
called "frames," which when used may influence public perception and opinion of
the issue. We introduce a Web-based system for analyzing and classifying frames
in text documents. Our goal is to make effective tools for automatic frame
discovery and labeling based on topic modeling and deep learning widely
accessible to researchers from a diverse array of disciplines. To this end, we
provide both state-of-the-art pre-trained frame classification models on
various issues as well as a user-friendly pipeline for training novel
classification models on user-provided corpora. Researchers can submit their
documents and obtain frames of the documents. The degree of user involvement is
flexible: they can run models that have been pre-trained on select issues;
submit labeled documents and train a new model for frame classification; or
submit unlabeled documents and obtain potential frames of the documents. The
code making up our system is also open-sourced and well-documented, making the
system transparent and expandable. The system is available on-line at
http://www.openframing.org and via our GitHub page
https://github.com/davidatbu/openFraming .
- Abstract(参考訳): ジャーナリストがニュース記事をカバーすると、複数の角度や視点から物語をカバーできる。
例えば、新型コロナウイルス(covid-19)に関するニュース記事はマスク着用などの個人的予防活動に焦点が当てられ、別の記事は新型コロナウイルスの経済への影響に焦点が当てられるかもしれない。
これらの視点は「フレーム」と呼ばれ、使用すれば問題に対する大衆の認識や意見に影響を与える可能性がある。
テキスト文書中のフレームを解析・分類する Web ベースのシステムを提案する。
我々のゴールは、トピックモデリングとディープラーニングに基づく自動フレーム発見とラベル付けのための効果的なツールを、様々な分野の研究者が広く利用できるようにすることである。
この目的のために,様々な課題に対する事前学習済みフレーム分類モデルと,新規分類モデルをユーザ提供コーパス上でトレーニングするためのユーザフレンドリなパイプラインを提供する。
研究者は文書を提出し、文書のフレームを取得することができる。
ユーザが関与する度合いは柔軟で、選択した問題で事前トレーニングされたモデルを実行したり、ラベル付きドキュメントを提出したり、フレーム分類のための新しいモデルをトレーニングしたり、ラベル付きドキュメントを提出したり、ドキュメントの潜在的なフレームを取得することができる。
システムを構成するコードもオープンソース化され、十分にドキュメント化されています。
このシステムはGitHubページ https://github.com/davidatbu/openFraming.orgでオンライン公開されている。
関連論文リスト
- SlideSpawn: An Automatic Slides Generation System for Research Publications [0.0]
本稿では,研究資料のPDFを入力とし,質の高いプレゼンテーションを生成する新しいシステムであるSlideSpwanを提案する。
PS5KデータセットとAminer 9.5K Insightsデータセットに基づいてトレーニングされた機械学習モデルを使用して、論文の各文のサリエンスを予測する。
650対の論文とスライドによるテストセットの実験により,本システムがより良い品質のプレゼンテーションを生成することを示す。
論文 参考訳(メタデータ) (2024-11-20T18:16:16Z) - Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - FaKnow: A Unified Library for Fake News Detection [11.119667583594483]
FaKnowは統合的で総合的なフェイクニュース検出アルゴリズムライブラリである。
モデルトレーニングと評価プロセスの全スペクトルをカバーする。
視覚化やロギングなど,一連の補助機能やツールを備えている。
論文 参考訳(メタデータ) (2024-01-27T13:29:17Z) - Follow Anything: Open-set detection, tracking, and following in
real-time [89.83421771766682]
我々は,物体をリアルタイムで検出,追跡,追跡するロボットシステムを提案する。
私たちのアプローチは、何でも従う"(FAn)と呼ばれ、オープンな語彙とマルチモーダルモデルです。
FAnは軽量(6~8GB)グラフィックカードでラップトップにデプロイでき、毎秒6~20フレームのスループットを実現する。
論文 参考訳(メタデータ) (2023-08-10T17:57:06Z) - Towards Open-Domain Topic Classification [69.21234350688098]
ユーザが定義した分類をリアルタイムで受け入れるオープンドメイントピック分類システムを導入する。
ユーザは、任意の候補ラベルに対してテキストスニペットを分類し、Webインターフェースから即座にレスポンスを受け取ることができます。
論文 参考訳(メタデータ) (2023-06-29T20:25:28Z) - SelfDocSeg: A Self-Supervised vision-based Approach towards Document
Segmentation [15.953725529361874]
文書レイアウト分析は文書研究コミュニティにとって既知の問題である。
個人生活へのインターネット接続が拡大するにつれ、パブリックドメインでは膨大な量のドキュメントが利用できるようになった。
我々は,この課題に自己監督型文書セグメンテーションアプローチと異なり,自己監督型文書セグメンテーションアプローチを用いて対処する。
論文 参考訳(メタデータ) (2023-05-01T12:47:55Z) - Unifying Vision, Text, and Layout for Universal Document Processing [105.36490575974028]
本稿では,テキスト,画像,レイアウトのモダリティを文書理解と生成を含むさまざまなタスク形式とともに統合するドキュメントAIモデルを提案する。
我々の手法は、財務報告、学術論文、ウェブサイトなど、さまざまなデータ領域にまたがって、文書理解やQAといった9つのドキュメントAIタスクの最先端を定めている。
論文 参考訳(メタデータ) (2022-12-05T22:14:49Z) - SelfDoc: Self-Supervised Document Representation Learning [46.22910270334824]
SelfDocは、文書イメージ理解のためのタスクに依存しない事前トレーニングフレームワークである。
本フレームワークは,文書中の意味的に意味のあるすべてのコンポーネントの位置情報,テキスト情報,視覚情報を利用する。
複数のダウンストリームタスクにおいて,事前学習段階で使用する文書イメージが従来よりも大幅に少なく,優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2021-06-07T04:19:49Z) - Framing Unpacked: A Semi-Supervised Interpretable Multi-View Model of
Media Frames [32.06056273913706]
ニュースメディアが政治問題をどのように捉えるかを理解するための新しい半監督モデルを開発する。
モデルは、ニュース記事にイベントや関連するアクターに関するローカル情報を自動エンコードフレームワークを通じて埋め込むことを学ぶ。
実験の結果,従来のフレーム予測モデルよりも優れていた。
論文 参考訳(メタデータ) (2021-04-22T13:05:53Z) - DOC2PPT: Automatic Presentation Slides Generation from Scientific
Documents [76.19748112897177]
文書・スライド生成のための新しい課題とアプローチを提案する。
エンドツーエンドでタスクに取り組むための階層的なシーケンス・ツー・シーケンスアプローチを提案する。
提案手法では,文書やスライド内の固有構造を利用して,パラフレーズとレイアウト予測モジュールを組み込んでスライドを生成する。
論文 参考訳(メタデータ) (2021-01-28T03:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。