論文の概要: Examining bias perpetuation in academic search engines: an algorithm
audit of Google and Semantic Scholar
- arxiv url: http://arxiv.org/abs/2311.09969v1
- Date: Thu, 16 Nov 2023 15:43:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 13:38:28.225655
- Title: Examining bias perpetuation in academic search engines: an algorithm
audit of Google and Semantic Scholar
- Title(参考訳): 学術検索エンジンにおけるバイアス永続性の検討--GoogleとSemantic Scholarのアルゴリズム監査
- Authors: Celina Kacperski, Mona Bielig, Mykola Makorthyk, Maryna Sydorova,
Roberto Ulloa
- Abstract要約: 本研究では,Google Scholar と Semantic Scholar に誘導される確認バイアスクエリが,スキュー結果をもたらすかどうかを検討する。
技術関連のクエリは、より大きな相違を示す。
検証バイアスが永久に続く学術的な検索結果は、研究者と市民の両方が証拠を探していることに強い意味を持つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Researchers rely on academic web search engines to find scientific sources,
but search engine mechanisms may selectively present content that aligns with
biases embedded in the queries. This study examines whether confirmation-biased
queries prompted into Google Scholar and Semantic Scholar will yield skewed
results. Six queries (topics across health and technology domains such as
"vaccines" or "internet use") were analyzed for disparities in search results.
We confirm that biased queries (targeting "benefits" or "risks") affect search
results in line with the bias, with technology-related queries displaying more
significant disparities. Overall, Semantic Scholar exhibited fewer disparities
than Google Scholar. Topics rated as more polarizing did not consistently show
more skewed results. Academic search results that perpetuate confirmation bias
have strong implications for both researchers and citizens searching for
evidence. More research is needed to explore how scientific inquiry and
academic search engines interact.
- Abstract(参考訳): 研究者は学術的なWeb検索エンジンを使って科学的な情報源を見つけるが、検索エンジンのメカニズムはクエリに埋め込まれたバイアスに沿ったコンテンツを選択的に提示する。
本研究では,Google Scholar と Semantic Scholar に誘導される確認バイアスクエリが,スキュー結果をもたらすかどうかを検討する。
6つの問合せ(「ワクチン」や「インターネット利用」など健康・技術分野のトピック)を検索結果の相違点として分析した。
バイアスドクエリ("便益"や"リスク"をターゲットとする)が検索結果にバイアスを伴い,テクノロジ関連のクエリは,より大きな差異を示す。
全体として、Semantic ScholarはGoogle Scholarよりも格差が少ない。
偏極性が増すほど、より歪んだ結果が得られなかった。
検証バイアスが持続する学術的な検索結果は、研究者と市民の両方が証拠を探していることに強い意味を持つ。
科学調査と学術検索エンジンの相互作用を探究するには、さらなる研究が必要である。
関連論文リスト
- Investigating Bias in Political Search Query Suggestions by Relative Comparison with LLMs [1.5356574175312299]
検索クエリの提案のバイアスは、バイアスされた検索結果に露出し、意見の形成に影響を与える可能性がある。
我々は、英語の検索クエリー提案において、バイアスを特定し定量化するために、多段階のアプローチを用いる。
われわれのアプローチを米国の政治ニュース分野に適用し、GoogleとBingの偏見を比較する。
論文 参考訳(メタデータ) (2024-10-31T12:40:38Z) - Taxonomy-guided Semantic Indexing for Academic Paper Search [51.07749719327668]
TaxoIndexは学術論文検索のためのセマンティックインデックスフレームワークである。
学術分類学によって導かれる意味指標として、論文から重要な概念を整理する。
既存の高密度レトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-10-25T00:00:17Z) - What Evidence Do Language Models Find Convincing? [94.90663008214918]
議論の的になっているクエリと、さまざまな事実を含む実世界の証拠文書を組み合わせたデータセットを構築します。
このデータセットを用いて、感度と反ファクト分析を行い、どのテキスト特徴がLLM予測に最も影響するかを探索する。
全体として、現在のモデルは、クエリに対するWebサイトの関連性に大きく依存している一方で、人間が重要と考えるスタイル的特徴をほとんど無視している。
論文 参考訳(メタデータ) (2024-02-19T02:15:34Z) - Navigating the Thin Line: Examining User Behavior in Search to Detect
Engagement and Backfire Effects [0.0]
本研究では,様々なバイアス指標と検索結果の提示が,意見のあるユーザの多様性消費と検索行動に影響を及ぼすかどうかを検討する。
以上の結果から,参加者が(対人偏見の)検索結果に偏りを抱くことで,コンテンツに対する態度が向上することが示唆された。
また, 偏見は, 検索ページ内のインタラクションの全体的な減少傾向と関連していることがわかった。
論文 参考訳(メタデータ) (2024-01-20T10:28:25Z) - Algorithmic amplification of biases on Google Search [0.6167267484484484]
本稿では,個人の既存態度が現代の情報探索プロセスにどのように影響するかを考察する。
中絶に対する反対の態度を持つ個人は、異なる検索結果を受け取る。
Google検索エンジンは、検索結果の既存の信念を強化する。
論文 参考訳(メタデータ) (2024-01-17T08:24:57Z) - User Attitudes to Content Moderation in Web Search [49.1574468325115]
我々は、Web検索における誤解を招く可能性のあるコンテンツや攻撃的なコンテンツに適用される様々なモデレーションプラクティスに対するサポートレベルについて検討する。
最も支持されている実践は、誤解を招く可能性のあるコンテンツや不快なコンテンツについてユーザーに知らせることであり、最も支持されていないものは、検索結果を完全に削除することである。
より保守的なユーザーやウェブ検索結果に対する信頼度が低いユーザーは、ウェブ検索におけるコンテンツモデレーションに反する傾向にある。
論文 参考訳(メタデータ) (2023-10-05T10:57:15Z) - Explaining Search Result Stances to Opinionated People [0.0]
スタンスラベルとその説明が、ユーザーがより多様な検索結果を消費するのに役立つかどうかを検討する。
スタンスラベルや説明が、より多様な検索結果の消費につながることがわかりました。
しかし、この文脈では、ユーザ間で体系的な意見変化の証拠は見つからない。
論文 参考訳(メタデータ) (2023-09-15T15:08:24Z) - Evaluating Verifiability in Generative Search Engines [70.59477647085387]
生成検索エンジンは、インラインの引用とともに、ユーザークエリへの応答を直接生成する。
我々は,一般的な4つの生成検索エンジンの評価を行う。
既存の生成検索エンジンからの応答は流動的であり、情報的に見えるが、しばしばサポートされていない文や不正確な引用を含んでいる。
論文 参考訳(メタデータ) (2023-04-19T17:56:12Z) - A Measure of Research Taste [91.3755431537592]
生産性と味の両方に報いる引用に基づく尺度を提案する。
提示された尺度capは、出版物とその量の影響のバランスをとる。
本研究では, 生物学, 計算機科学, 経済学, 物理分野の研究者を対象に, capの特性を解析した。
論文 参考訳(メタデータ) (2021-05-17T18:01:47Z) - The Matter of Chance: Auditing Web Search Results Related to the 2020
U.S. Presidential Primary Elections Across Six Search Engines [68.8204255655161]
私たちは、Google、Baidu、Bing、DuckDuckGo、Yahoo、Yandexの"US Election"、"Donald trump"、"Joe Biden"、"bernie Sanders"の検索結果を調べます。
その結果, 検索エンジン間の検索結果と, エージェント間の検索結果の相違が有意な差があることが示唆された。
論文 参考訳(メタデータ) (2021-05-03T11:18:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。