論文の概要: White Paper: Challenges and Considerations for the Creation of a Large
Labelled Repository of Online Videos with Questionable Content
- arxiv url: http://arxiv.org/abs/2101.10894v1
- Date: Mon, 25 Jan 2021 16:19:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-15 03:36:45.589921
- Title: White Paper: Challenges and Considerations for the Creation of a Large
Labelled Repository of Online Videos with Questionable Content
- Title(参考訳): ホワイトペーパー:疑わしいコンテンツを含むオンラインビデオの大規模ラベル付きリポジトリ作成への挑戦と考察
- Authors: Thamar Solorio, Mahsa Shafaei, Christos Smailis, Mona Diab, Theodore
Giannakopoulos, Heng Ji, Yang Liu, Rada Mihalcea, Smaranda Muresan, Ioannis
Kakadiaris
- Abstract要約: 本稿では,問題のあるコンテンツに注釈付けされたオンラインビデオの広範なリポジトリを構築するための批判的考察について要約する。
主な議論ポイントは、1)AIコミュニティにとって価値のあるリポジトリをもたらす適切なラベルの種類、2)コレクションとアノテーションプロセスの設計方法、およびその潜在的な影響を最大化するためにコーパスの配布方法、3)アノテータに対するトラウマのリスクを低減するために私たちが取るべきアクションである。
- 参考スコア(独自算出の注目度): 49.4838932200676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This white paper presents a summary of the discussions regarding critical
considerations to develop an extensive repository of online videos annotated
with labels indicating questionable content. The main discussion points
include: 1) the type of appropriate labels that will result in a valuable
repository for the larger AI community; 2) how to design the collection and
annotation process, as well as the distribution of the corpus to maximize its
potential impact; and, 3) what actions we can take to reduce risk of trauma to
annotators.
- Abstract(参考訳): 本稿では,疑わしいコンテンツを示すラベルを付記したオンラインビデオの広範なリポジトリを開発するための批判的考察の要点について概説する。
主な議論ポイントは、1)AIコミュニティにとって価値のあるリポジトリをもたらす適切なラベルの種類、2)コレクションとアノテーションプロセスの設計方法、およびその潜在的な影響を最大化するためにコーパスの配布方法、3)アノテータに対するトラウマのリスクを低減するために私たちが取るべきアクションである。
関連論文リスト
- Breaking the Manual Annotation Bottleneck: Creating a Comprehensive Legal Case Criticality Dataset through Semi-Automated Labeling [16.529070321280447]
本稿では,スイス最高裁判所の判決が将来の法制化に与える影響を評価するための新たな資源である臨界度予測データセットを紹介する。
リソース集約的な手動アノテーションに依存する既存のアプローチとは異なり、私たちはラベルを半自動で導き、はるかに大きなデータセットを生み出します。
我々は、微調整された変種や大規模言語モデルを含む複数の多言語モデルを評価し、微調整されたモデルがゼロショットベースラインを一貫して上回っていることを発見した。
論文 参考訳(メタデータ) (2024-10-17T11:43:16Z) - Generative Retrieval Meets Multi-Graded Relevance [104.75244721442756]
GRADed Generative Retrieval (GR$2$)というフレームワークを紹介します。
GR$2$は2つの重要なコンポーネントに焦点を当てている。
マルチグレードとバイナリの関連性を持つデータセットの実験は,GR$2$の有効性を示した。
論文 参考訳(メタデータ) (2024-09-27T02:55:53Z) - RichRAG: Crafting Rich Responses for Multi-faceted Queries in Retrieval-Augmented Generation [35.981443744108255]
本稿ではRichRAGという新しいRAGフレームワークを提案する。
これには、入力された質問の潜在的なサブアスペクトを特定するサブアスペクトエクスプローラー、これらのサブアスペクトに関連する多様な外部文書の候補プールを構築するレトリバー、および生成リストワイズローダが含まれる。
2つの公開データセットの実験結果から,我々のフレームワークがユーザに対して包括的かつ満足な応答を効果的に提供できることが証明された。
論文 参考訳(メタデータ) (2024-06-18T12:52:51Z) - Virtual Category Learning: A Semi-Supervised Learning Method for Dense
Prediction with Extremely Limited Labels [63.16824565919966]
本稿では,ラベルの修正を伴わずに,混乱したサンプルを積極的に使用することを提案する。
仮想カテゴリー(VC)は、モデルの最適化に安全に貢献できるように、各混乱したサンプルに割り当てられる。
私たちの興味深い発見は、密集した視覚タスクにおけるVC学習の利用に注目しています。
論文 参考訳(メタデータ) (2023-12-02T16:23:52Z) - Indicative Summarization of Long Discussions [37.80285705350554]
本稿では,大規模言語モデル (LLM) を用いた非教師なしの手法を提案する。
提案手法では、まず、引数文をクラスタ化し、抽象的な要約としてクラスタラベルを生成し、生成されたクラスタラベルを引数フレームに分類する。
広範に最適化されたプロンプトエンジニアリングアプローチに基づいて、生成クラスタラベリングとフレーム分類のための19LLMを評価する。
論文 参考訳(メタデータ) (2023-11-03T12:44:59Z) - Label-Free Explainability for Unsupervised Models [95.94432031144716]
教師なしのブラックボックスモデルは解釈が難しい。
既存の説明可能性の方法の多くは、ブラックボックスの出力のどのコンポーネントを解釈するかをラベルで選択する必要がある。
本稿では,1)ラベルフリーな特徴重要度と(2)ラベルフリーな例重要度という,ポストホックな説明技法の2つの重要な拡張点を紹介する。
論文 参考訳(メタデータ) (2022-03-03T18:59:03Z) - Unsupervised Summarization with Customized Granularities [76.26899748972423]
本稿では,最初の教師なし多粒度要約フレームワークであるGranuSumを提案する。
異なる数のイベントを入力することで、GranuSumは教師なしの方法で複数の粒度のサマリーを生成することができる。
論文 参考訳(メタデータ) (2022-01-29T05:56:35Z) - Unsupervised Extractive Summarization by Human Memory Simulation [30.053445079089983]
コンテンツユニットの認知表現と、これらが人間の記憶に保持または忘れられている方法を利用する幅広いコンテンツ表現を紹介します。
人間の記憶のこれらの表現の性質は、科学論文のコンテンツ単位の関連性を捉えるために利用することができる。
論文 参考訳(メタデータ) (2021-04-16T22:49:38Z) - White Paper -- Objectionable Online Content: What is harmful, to whom,
and why [6.55104879972868]
このホワイトペーパーは、ヒューストン大学(UH)研究チームにおける不快な内容に関する著者の議論を要約している。
対象コンテンツを検出するための自動マルチモーダルアプローチの研究を支援するために、オンラインビデオの広範なリポジトリを構築するための戦略を概説する。
論文 参考訳(メタデータ) (2021-01-27T02:34:47Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。