論文の概要: Data Voids and Warning Banners on Google Search
- arxiv url: http://arxiv.org/abs/2502.17542v1
- Date: Mon, 24 Feb 2025 18:56:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:22:39.762005
- Title: Data Voids and Warning Banners on Google Search
- Title(参考訳): Google検索におけるデータボイドと警告バナー
- Authors: Ronald E. Robertson, Evan M. Williams, Kathleen M. Carley, David Thiel,
- Abstract要約: ソーシャルメディア上で共有された14万のユニークな検索クエリを収集し、Googleの警告バナーをサーフェした。
Googleは検索クエリの約1%に警告バナーを返した。
品質の低いバナーの29倍から58倍のデータを無効にしています。
- 参考スコア(独自算出の注目度): 4.4534065108405665
- License:
- Abstract: The content moderation systems used by social media sites are a topic of widespread interest and research, but less is known about the use of similar systems by web search engines. For example, Google Search attempts to help its users navigate three distinct types of data voids--when the available search results are deemed low-quality, low-relevance, or rapidly-changing--by placing one of three corresponding warning banners at the top of the search page. Here we collected 1.4M unique search queries shared on social media to surface Google's warning banners, examine when and why those banners were applied, and train deep learning models to identify data voids beyond Google's classifications. Across three data collection waves (Oct 2023, Mar 2024, Sept 2024), we found that Google returned a warning banner for about 1% of our search queries, with substantial churn in the set of queries that received a banner across waves. The low-quality banners, which warn users that their results "may not have reliable information on this topic," were especially rare, and their presence was associated with low-quality domains in the search results and conspiracy-related keywords in the search query. Low-quality banner presence was also inconsistent over short time spans, even when returning highly similar search results. In August 2024, low-quality banners stopped appearing on the SERPs we collected, but average search result quality remained largely unchanged, suggesting they may have been discontinued by Google. Using our deep learning models to analyze both queries and search results in context, we identify 29 to 58 times more low-quality data voids than there were low-quality banners, and find a similar number after the banners had disappeared. Our findings point to the need for greater transparency on search engines' content moderation practices, especially around important events like elections.
- Abstract(参考訳): ソーシャルメディアサイトが使用するコンテンツモデレーションシステムは、幅広い関心と研究のトピックであるが、ウェブ検索エンジンによる類似システムの使用についてはあまり知られていない。
例えば、検索結果が低品質、低関連、あるいは急激な変更と見なされるとき、検索ページの上部に3つの対応する警告バナーの1つを配置することで、ユーザーが3つの異なる種類のデータを無効にするのを助けるためにGoogle Searchは試みている。
ここでは、ソーシャルメディア上で共有される14万のユニークな検索クエリを収集して、Googleの警告バナーをサーフェし、そのバナーがいつ、なぜ適用されたかを調べ、ディープラーニングモデルをトレーニングして、Googleの分類以上のデータ空白を識別しました。
3つのデータ収集波(2023年、2024年、2024年9月)で、Googleが検索クエリの約1%の警告バナーを返却していることがわかりました。
検索結果が「この話題について信頼できる情報を持たないかもしれない」とユーザーに警告する低品質バナーは特に稀であり、検索結果の低品質ドメインや、検索クエリの陰謀関連キーワードに関連付けられていた。
低品質のバナーの存在は、非常に類似した検索結果を返す場合でも、短い期間で矛盾していた。
2024年8月、私たちが収集したSERPに低品質のバナーが現れるのをやめた。
ディープラーニングモデルを用いて、クエリと検索結果の両方を文脈で分析し、低品質バナーよりも29~58倍の低品質データ空白を識別し、バナーが消えた後、同様の数を見つける。
我々の発見は、検索エンジンのコンテンツモデレーションの実践、特に選挙のような重要な出来事に対する透明性の向上の必要性を示唆している。
関連論文リスト
- Auditing Google's Search Algorithm: Measuring News Diversity Across Brazil, the UK, and the US [0.0]
本研究では,ブラジル,イギリス,米国における検索結果の分析により,Googleの検索アルゴリズムがニュースの多様性に与える影響について検討した。
Googleのシステムは、限られた数のニュースメディアを優先的に好んでいる。
発見は、検索結果のわずかに左に偏りを示し、人気のある、しばしば全国のメディアを好んでいることを示している。
論文 参考訳(メタデータ) (2024-10-31T11:49:16Z) - Tree Search for Language Model Agents [69.43007235771383]
対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文 参考訳(メタデータ) (2024-07-01T17:07:55Z) - Algorithmically Curated Lies: How Search Engines Handle Misinformation
about US Biolabs in Ukraine [39.58317527488534]
2022年6月、Google、Bing、Yandexの検索出力の仮想エージェントベースのアルゴリズム監査を行う。
検索の言語に基づく誤情報暴露では,すべての検索エンジンがロシア語で偽ニュースを多く提示するなど,大きな相違がみられた。
これらの観察は、AICSが操作に脆弱である可能性、特に展開するプロパガンダキャンペーンの場合を強調している。
論文 参考訳(メタデータ) (2024-01-24T22:15:38Z) - User Attitudes to Content Moderation in Web Search [49.1574468325115]
我々は、Web検索における誤解を招く可能性のあるコンテンツや攻撃的なコンテンツに適用される様々なモデレーションプラクティスに対するサポートレベルについて検討する。
最も支持されている実践は、誤解を招く可能性のあるコンテンツや不快なコンテンツについてユーザーに知らせることであり、最も支持されていないものは、検索結果を完全に削除することである。
より保守的なユーザーやウェブ検索結果に対する信頼度が低いユーザーは、ウェブ検索におけるコンテンツモデレーションに反する傾向にある。
論文 参考訳(メタデータ) (2023-10-05T10:57:15Z) - Novelty in news search: a longitudinal study of the 2020 US elections [62.997667081978825]
我々は、トップニュース検索結果に現れる新しい項目を測定するノベルティを解析する。
トピックや安定したクエリに比べて,選挙関連クエリに新たな項目が出現する傾向にある。
このような不均衡は、選挙期間中のニュース検索における政治候補者の可視性に影響を与えると論じる。
論文 参考訳(メタデータ) (2022-11-09T08:42:37Z) - Tree-based Text-Vision BERT for Video Search in Baidu Video Advertising [58.09698019028931]
ビデオ広告とユーザー検索をどう組み合わせるかがBaiduビデオ広告の中核となる課題だ。
モダリティのギャップのため、従来のクエリ・ツー・ビデオ検索よりも、クエリ・ツー・ビデオ検索の方がはるかに難しい。
我々は最近Baiduのダイナミックビデオ広告プラットフォームで開始されたツリーベースのコンボアテンションネットワーク(TCAN)について紹介する。
論文 参考訳(メタデータ) (2022-09-19T04:49:51Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - The Matter of Chance: Auditing Web Search Results Related to the 2020
U.S. Presidential Primary Elections Across Six Search Engines [68.8204255655161]
私たちは、Google、Baidu、Bing、DuckDuckGo、Yahoo、Yandexの"US Election"、"Donald trump"、"Joe Biden"、"bernie Sanders"の検索結果を調べます。
その結果, 検索エンジン間の検索結果と, エージェント間の検索結果の相違が有意な差があることが示唆された。
論文 参考訳(メタデータ) (2021-05-03T11:18:19Z) - Search Engine Similarity Analysis: A Combined Content and Rankings
Approach [6.69087470775851]
我々は、DuckDuckGoとともに、GoogleとBingという2つの主要な検索エンジンの親和性について分析する。
我々は、検索応答のコンテンツとランキングの両方を活用する新しい類似度指標を開発した。
しかしBingとDuckDuckGoは相違点が多い。
論文 参考訳(メタデータ) (2020-11-01T23:57:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。