論文の概要: Teachers' Perceived Benefits and Risks of AI Across Fifty-Five Countries: An Audit of LLM Alignment and Steerability
- arxiv url: http://arxiv.org/abs/2605.08486v1
- Date: Fri, 08 May 2026 21:03:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 15:16:34.506881
- Title: Teachers' Perceived Benefits and Risks of AI Across Fifty-Five Countries: An Audit of LLM Alignment and Steerability
- Title(参考訳): 50ヶ国にまたがるAIの教師のメリットとリスク:LLMアライメントとステアビリティの検証
- Authors: Yan Tao, Olga Viberg, Deepak Varuvel Dennison, Zhikun Wu, René F. Kizilcec,
- Abstract要約: 大規模な言語モデル (LLM) は、教育における検証が限られているにもかかわらず、研究、政策、教師の専門職でますます使われている。
55か国・地域のOECD TALISデータを用いて,教師の認識するAIのメリットとリスクの国家間変動を測定した。
その結果、LLM出力に確実に反映されない教師の知覚において、実質的なクロスナショナルな変化が明らかとなった。
- 参考スコア(独自算出の注目度): 3.5499018649362015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Teachers' trust in artificial intelligence (AI) in education depends on how they balance its perceived benefits and risks. Yet global discussions about scaling AI in education rely on fragmented evidence, as most studies of teachers' perceptions focus on single countries or small samples. This lack of representative cross-national evidence limits both theory building and policy development. At the same time, large language models (LLMs) are increasingly used in research, policy, and teachers' professional workflows, despite limited validation in education. To address these gaps, we conduct a large-scale audit of LLM alignment with teachers' perceptions of AI by combining representative international survey data with systematic model evaluation. Using OECD TALIS data from 55 countries and territories, we measure cross-national variation in teachers' perceived benefits and risks of AI. We then benchmark responses from eight state-of-the-art LLMs across four providers under both general and country-specific prompting, comparing higher- and lower-reasoning models. Results reveal substantial cross-national variation in teacher perceptions that is not reliably reflected in LLM outputs. Models compress country differences, overestimate both benefits and risks, and show limited gains from identity prompting or enhanced reasoning. This misalignment matters because LLM-generated guidance and professional discourse increasingly shape how teachers learn about and discuss AI, potentially influencing trust and future adoption decisions. Our findings caution against treating LLM outputs as substitutes for direct engagement with teachers when informing global AI-in-education initiatives. At the same time, some models (e.g., Gemini 3 Fast) partially capture cross-national ranking patterns, suggesting a complementary role in hypothesis generation and exploratory comparative analysis.
- Abstract(参考訳): 教育における人工知能(AI)に対する教師の信頼は、その認識される利益とリスクのバランスにかかっている。
しかし、教育におけるAIのスケーリングに関する世界的な議論は、教師の認識の大部分が単一国や小さなサンプルに焦点を当てているため、断片化された証拠に依存している。
この代表的国際的証拠の欠如は、理論構築と政策開発の両方を制限している。
同時に、大きな言語モデル(LLM)は、教育における検証が限られているにもかかわらず、研究、政策、教師の専門的ワークフローにますます使われています。
これらのギャップに対処するために、代表的国際調査データと体系的モデル評価を組み合わせることで、教員のAIに対する認識とLLMの協調を大規模に監査する。
55か国・地域のOECD TALISデータを用いて,教師の認識するAIのメリットとリスクの国家間変動を測定した。
次に、一般および国固有のプロンプトの下で、4つのプロバイダにまたがる8つの最先端のLCMからの応答をベンチマークし、より高いモデルと低いモデルを比較した。
その結果、LLM出力に確実に反映されない教師の知覚において、実質的なクロスナショナルな変化が明らかとなった。
モデルは国差を圧縮し、利益とリスクの両方を過大評価し、アイデンティティーの促進や推論の強化による限られた利益を示す。
教師はAIについて学び、議論し、信頼と将来の採用決定に影響を与える可能性がある。
グローバルなAI教育イニシアチブを指導する際, LLMアウトプットを教師との直接の関わりの代用として扱うことに注意した。
同時に、いくつかのモデル(例:Gemini 3 Fast)は、部分的に国家間のランク付けパターンを捉え、仮説の生成と探索的比較分析における補完的な役割を示唆している。
関連論文リスト
- Sociodemographic Biases in Educational Counselling by Large Language Models [61.30199414932204]
本研究では,Large Language Models(LLMs)における社会デマトグラフィーバイアスについて検討する。
多様な状況下で生徒を記述した900のヴィグネットに関する質問に答える6つのLDMからの回答を評価した。
論文 参考訳(メタデータ) (2026-04-03T14:08:22Z) - Large Language Models in Teaching and Learning: Reflections on Implementing an AI Chatbot in Higher Education [0.0]
大規模言語モデル(LLM)は特に高等教育において大きな機会をもたらす。
幻覚を発生させる確率と限られた専門知識は、重大なリスクをもたらす可能性がある。
本研究は,大学レベルコースにおけるLLM強化アシスタントの実践的実装について検討する。
論文 参考訳(メタデータ) (2026-03-18T14:34:12Z) - Do Large Language Models Understand Morality Across Cultures? [0.5356944479760104]
本研究では,大規模言語モデルが道徳的視点における異文化間差異や類似性をどの程度捉えているかを検討する。
以上の結果から,現在のLLMは多文化的モラル変動の完全なスペクトルを再現できないことが示唆された。
これらの知見は, LLMのバイアス軽減と文化的代表性向上に向けた, より堅牢なアプローチの必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-07-28T20:25:36Z) - Towards New Benchmark for AI Alignment & Sentiment Analysis in Socially Important Issues: A Comparative Study of Human and LLMs in the Context of AGI [0.25489046505746704]
本研究では,大規模言語モデル(LLM)と人間による人工知能(AGI)に対する感情について検討する。
GPT-4はAGIに対して最も肯定的な感情を、Bardは中立的な感情に傾いた。
この分析は、LLMの感情形成における関心と偏見の潜在的な対立を概説している。
論文 参考訳(メタデータ) (2025-01-05T13:18:13Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - The Impossibility of Fair LLMs [17.812295963158714]
さまざまな技術的公正フレームワークを分析し、公正な言語モデルの開発を難易度の高いものにするために、それぞれに固有の課題を見つけます。
それぞれのフレームワークが汎用的なAIコンテキストに拡張されないか、実際には実現不可能であることを示す。
これらの固有の課題は、LLMを含む汎用AIにおいて、限られた参加入力や限られた測定方法といった経験的な課題が克服されたとしても、持続する。
論文 参考訳(メタデータ) (2024-05-28T04:36:15Z) - Exploring the Jungle of Bias: Political Bias Attribution in Language Models via Dependency Analysis [86.49858739347412]
大規模言語モデル(LLM)は、これらのモデルにおけるバイアスの頻度とその緩和に関する激しい議論を引き起こしている。
本稿では,意思決定プロセスに寄与する属性の抽出と仲介を行うためのプロンプトベースの手法を提案する。
観察された異なる治療は、少なくとも部分的には、属性の相違とモデルの相違によるものであることが判明した。
論文 参考訳(メタデータ) (2023-11-15T00:02:25Z) - The Role of Large Language Models in the Recognition of Territorial
Sovereignty: An Analysis of the Construction of Legitimacy [67.44950222243865]
Google MapsやLarge Language Models (LLM)のような技術ツールは、しばしば公平で客観的であると見なされる。
我々は、クリミア、ウェストバンク、トランスニトリアの3つの論争領域の事例を、ウィキペディアの情報と国連の決議に対するChatGPTの反応を比較して強調する。
論文 参考訳(メタデータ) (2023-03-17T08:46:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。