論文の概要: TMID: A Comprehensive Real-world Dataset for Trademark Infringement
Detection in E-Commerce
- arxiv url: http://arxiv.org/abs/2312.05103v1
- Date: Fri, 8 Dec 2023 15:31:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 14:48:29.781129
- Title: TMID: A Comprehensive Real-world Dataset for Trademark Infringement
Detection in E-Commerce
- Title(参考訳): TMID:Eコマースにおける商標侵害検出のための総合的現実世界データセット
- Authors: Tongxin Hu, Zhuang Li, Xin Jin, Lizhen Qu, Xin Zhang
- Abstract要約: 毎年、eコマースプラットフォームは、商標侵害によりかなりの損失を被る。
このギャップに対処するため,商店登録における商標侵害を検出する新しいデータセットTMIDを導入した。
- 参考スコア(独自算出の注目度): 31.035507977793046
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Annually, e-commerce platforms incur substantial financial losses due to
trademark infringements, making it crucial to identify and mitigate potential
legal risks tied to merchant information registered to the platforms. However,
the absence of high-quality datasets hampers research in this area. To address
this gap, our study introduces TMID, a novel dataset to detect trademark
infringement in merchant registrations. This is a real-world dataset sourced
directly from Alipay, one of the world's largest e-commerce and digital payment
platforms. As infringement detection is a legal reasoning task requiring an
understanding of the contexts and legal rules, we offer a thorough collection
of legal rules and merchant and trademark-related contextual information with
annotations from legal experts. We ensure the data quality by performing an
extensive statistical analysis. Furthermore, we conduct an empirical study on
this dataset to highlight its value and the key challenges. Through this study,
we aim to contribute valuable resources to advance research into legal
compliance related to trademark infringement within the e-commerce sphere. The
dataset is available at https://github.com/emnlpTMID/emnlpTMID.github.io .
- Abstract(参考訳): 毎年、eコマースプラットフォームは商標侵害による大きな損失を被り、プラットフォームに登録されている商取引情報に関連する潜在的な法的リスクを特定し軽減することが重要である。
しかし、この領域では高品質なデータセットが研究を妨げている。
そこで本研究では,商標登録における商標侵害を検出する新しいデータセットTMIDを提案する。
これは、世界最大のeコマースおよびデジタル決済プラットフォームであるAlipayから直接ソースされた現実世界のデータセットである。
侵害検出は,文脈や法的規則の理解を必要とする法的理由づけのタスクであるため,法律専門家の注釈とともに,商取引及び商標に関するコンテキスト情報の全集を提供する。
広範な統計分析を行うことで、データ品質を確保する。
さらに,このデータセットについて実証研究を行い,その価値と課題を強調する。
本研究は,eコマース分野における商標侵害に関する法的コンプライアンスの研究を進めるために,貴重な資源の提供を目的としている。
データセットはhttps://github.com/emnlpTMID/emnlpTMID.github.ioで公開されている。
関連論文リスト
- Dataset Protection via Watermarked Canaries in Retrieval-Augmented LLMs [67.0310240737424]
本稿では,テキストデータセットの所有権を保護し,RA-LLMによる不正使用を効果的に検出するための新しいアプローチを提案する。
提案手法では,IPデータセットに特別に設計されたカナリア文書を挿入することにより,元のデータを完全に変更することなく保護する。
検出プロセス中、カナリア文書をクエリし、RA-LLMの応答を分析することにより、不正使用を識別する。
論文 参考訳(メタデータ) (2025-02-15T04:56:45Z) - Evaluating Fairness in Transaction Fraud Models: Fairness Metrics, Bias Audits, and Challenges [3.499319293058353]
アルゴリズムの公正性に関する広範な研究にもかかわらず、不正検出モデルにおけるバイアスの研究には顕著なギャップがある。
これらの課題には、不正データの不均衡の性質と不正保護とサービス品質のトレードオフを考慮に入れた公正度メトリクスの必要性が含まれる。
本稿では,公開合成データセットを用いた取引不正モデルの包括的公正性評価を行う。
論文 参考訳(メタデータ) (2024-09-06T16:08:27Z) - Language Models Can Reduce Asymmetry in Information Markets [100.38786498942702]
我々は、言語モデルを利用した知的エージェントが外部参加者に代わって情報を売買する、オープンソースのシミュレートされたデジタルマーケットプレースを紹介した。
このマーケットプレースを実現する中心的なメカニズムはエージェントの二重機能であり、特権情報の品質を評価する能力を持つと同時に、忘れる能力も備えている。
適切に行動するためには、エージェントは合理的な判断をし、生成されたサブクエリを通じて市場を戦略的に探索し、購入した情報から回答を合成する必要がある。
論文 参考訳(メタデータ) (2024-03-21T14:48:37Z) - Seller-side Outcome Fairness in Online Marketplaces [8.29306513718005]
本稿では,売り手側の結果フェアネスの概念を導入し,収集したリコメンデーション報酬とフェアネス指標のバランスをとる最適化モデルを構築した。
実際のeコマースデータセットに関する数値実験では,収集したGross Merchandise Value(GMV)や総購入数といった指標を損なうことなく,販売者の公正度を測ることのできるアルゴリズムが示されている。
論文 参考訳(メタデータ) (2023-12-06T02:58:49Z) - Root causes, ongoing difficulties, proactive prevention techniques, and emerging trends of enterprise data breaches [0.0]
今や企業は、データが重要な資産であると考えており、このデータに侵入しても、ひどい影響が生じる可能性がある。
今や企業は、データ量の増加とデータ漏洩の頻度の増加によるデータ損失の検出と防止に高いプレミアムを課している。
このレビューは、興味深い見通しを強調し、企業がデータ漏洩から直面するリスクについて学ぶことに興味がある人に洞察力のある情報を提供しようとしている。
論文 参考訳(メタデータ) (2023-11-27T20:34:10Z) - The Data Provenance Initiative: A Large Scale Audit of Dataset Licensing
& Attribution in AI [41.32981860191232]
法的および機械学習の専門家は、1800以上のテキストデータセットを体系的に監査し、追跡する。
私たちのランドスケープ分析は、コンポジションの急激な分断と、商業的にオープンなデータセットとクローズドなデータセットの焦点を浮き彫りにしています。
広く使用されているデータセットホスティングサイトでは、ライセンスが70%以上、エラー率が50%以上である。
論文 参考訳(メタデータ) (2023-10-25T17:20:26Z) - IDTraffickers: An Authorship Attribution Dataset to link and connect
Potential Human-Trafficking Operations on Text Escort Advertisements [8.479659578608235]
人身売買(Human trafficking、HT)は、脆弱な個人に影響を及ぼす世界的な問題であり、基本的人権を侵害している。
87,595のテキスト広告と5,244のベンダーラベルからなる広範なデータセットであるIDTraffickersを紹介します。
閉集合分類環境でのマクロF1スコア0.8656のDeCLUTR小モデルを訓練する。
論文 参考訳(メタデータ) (2023-10-09T07:43:57Z) - Did You Train on My Dataset? Towards Public Dataset Protection with
Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。
データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。
この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文 参考訳(メタデータ) (2023-03-20T21:54:30Z) - The Problem of Zombie Datasets:A Framework For Deprecating Datasets [55.878249096379804]
我々は、ImageNet、8000 Million Tiny Images、MS-Celeb-1M、Duke MTMC、Brainwash、HRT Transgenderなど、いくつかの著名なデータセットの公開後処理について検討する。
本稿では,リスクの考慮,影響の緩和,アピール機構,タイムライン,非推奨プロトコル,公開チェックなどを含むデータセットの非推奨化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-18T20:13:51Z) - OSOUM Framework for Trading Data Research [79.0383470835073]
私たちは、私たちの知る限り、最初のオープンソースのシミュレーションプラットフォームであるOpen SOUrce Market Simulator(OSOUM)を提供して、トレーディング市場、特にデータ市場を分析します。
我々は、購入に利用可能なさまざまなデータセットを所有する売り手と、購入に有効な適切なデータセットを検索する買い手という2つのタイプのエージェントからなる、特定のデータ市場モデルを記述し、実装する。
データ市場を扱うための商用フレームワークはすでに存在していますが、購入者および販売者の両方が(データ)市場に参加することの可能な振る舞いをシミュレートするための、自由で広範なエンドツーエンドの研究ツールを提供しています。
論文 参考訳(メタデータ) (2021-02-18T09:20:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。