OpenThoughts: Data Recipes for Reasoning Models [215.2] OpenThoughtsプロジェクトは、推論モデルをトレーニングするためのオープンソースのデータセットを作成することだ。
OpenThoughts2-1Mデータセットは、公開推論データに基づいてトレーニングされた最初のモデルであるOpenThinker2-32Bに導かれた。
OpenThinker3-7Bモデル。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:25:39 GMT)
WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct [130.4] 本稿では,大規模言語モデル(LLM)の数学的CoT推論能力を向上させるWizardMathを提案する。
注目すべきは、WizardMath-Mistral 7BがトップクラスのオープンソースLLMをはるかに上回り、データ効率が向上したことだ。
予備的な調査では、卓越した数学性能を達成する上で、命令の進化とプロセスの監督が重要な役割を担っていることを強調した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:58:56 GMT)
UIO-LLMs: Unbiased Incremental Optimization for Long-Context LLMs [111.1] UIO-LLMsは、長いコンテキスト設定下でのメモリ拡張トランスフォーマーの漸進的な最適化手法である。
本稿では,TBPTTアルゴリズムを用いて学習過程を改良する。
UIO-LLMは、Llama2-7b-chatのコンテキストウィンドウを4Kから100Kトークンに、2%の追加パラメータで拡張するなど、長いコンテキストを扱うことに成功した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:42:43 GMT)
On-Policy RL with Optimal Reward Baseline [109.5] On-Policy RL with Optimal reward baseline (OPO) は、新しい簡易強化学習アルゴリズムである。
OPOは、訓練プロセスを実証的に安定化し、探索を強化する、正確なオンライントレーニングの重要性を強調している。
その結果、OPOの優れた性能と訓練安定性を、追加のモデルや正規化条件なしで示すことができた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:41:37 GMT)
DynaSaur: Large Language Agents Beyond Predefined Actions [108.8] 既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作を動的に生成・構成できるLLMエージェントフレームワークを提案する。
このフレームワークでは、汎用プログラミング言語で書かれたプログラムを生成し実行することで、エージェントが環境と対話する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:26:58 GMT)
EasyInv: Toward Fast and Better DDIM Inversion [107.5] 本稿では DDIM インバージョンへの容易かつ斬新なアプローチである EasyInv を紹介する。
EasyInvの中核は、反転雑音を近似するための洗練された戦略である。
我々は、EasyInvが従来のDDIMインバージョン手法と同等かそれ以上の結果を提供できることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:47:48 GMT)
Does Thinking More always Help? Understanding Test-Time Scaling in Reasoning Models [103.0] Wait"や"Let me rethink"といったプロンプトを使って思考トレースを拡張することで、パフォーマンスが向上します。
テスト時にもっと考えることは、本当により良い推論につながるのでしょうか?
過度に考える”という理由から,新たな思考による初期パフォーマンス改善の一貫したパターンと,それに続く低下を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:55:09 GMT)
NTIRE 2025 Challenge on RAW Image Restoration and Super-Resolution [98.3] 本報告では,NTIRE 2025 RAW画像復元と超解法チャレンジについて概説し,提案手法と結果について述べる。
この課題のゴールは、(i)ぼかしとノイズ劣化を伴うRAW画像の復元、(ii)未知のノイズとぼかしを考慮したRAWベイア画像の2倍のスケールアップである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:04:27 GMT)
LARES: Latent Reasoning for Sequential Recommendation [96.3] 本稿では、シークエンシャルレコメンデーションのための新しいスケーラブルなLatent ReasoningフレームワークであるLARESを紹介する。
提案手法では,パラメータの複雑性を増大させることなく推理深度を柔軟に拡張できる再帰的アーキテクチャを用いている。
我々のフレームワークは既存の高度なモデルとのシームレスな互換性を示し、推奨性能をさらに向上させる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:31:59 GMT)
Full-Duplex-Bench: A Benchmark to Evaluate Full-duplex Spoken Dialogue Models on Turn-taking Capabilities [93.1] FullDuplexBenchは、重要なインタラクティブな振る舞いを体系的に評価するベンチマークである。
ベンチマークコードを公開することによって、音声対話モデリングの進歩と、より自然で魅力的なSDMの開発を目指しています。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:11:15 GMT)
Understanding and Meeting Practitioner Needs When Measuring Representational Harms Caused by LLM-Based Systems [88.4] 表象の害を測定するために,一般に利用可能な器具を使用できない場合が多いことが判明した。
楽器は、実践者が測定しようとするものを有意に測定しないため、役に立たない場合もある。
その他の場合では、実践者や制度上の障害のため、楽器の使用は行わない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:01:31 GMT)
STAR: Learning Diverse Robot Skill Abstractions through Rotation-Augmented Vector Quantization [87.8] textbfSkill textbfTraining with textbfAugmented textbfRotation (textbfSTAR) は、スキル学習と構成の両方を進化させて複雑な振る舞いを完遂するフレームワークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:54:42 GMT)
High Accuracy, Less Talk (HALT): Reliable LLMs through Capability-Aligned Finetuning [84.5] 大規模言語モデル(LLM)は現在、すべてのプロンプトに応答する。
LLMは、知識や能力の欠如によって、誤った答えを生み出すことができる。
本稿では,その正確性に自信を持った場合にのみコンテンツを生成するためのLCMのポストトレーニングを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:16:21 GMT)
Rejecting Hallucinated State Targets during Planning [84.2] この研究はまず、いくつかの非実用目標の特性を分類し、調査する。
汎用的目標評価器を用いて、実現不可能な目標を拒否する戦略を考案する。
適切な設計がなければ、評価者は妄想的な見積もりを生成でき、戦略を無駄にする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:43:13 GMT)
Empaths at SemEval-2025 Task 11: Retrieval-Augmented Approach to Perceived Emotions Prediction [83.9] EmoRAGは、SemEval-2025 Task 11, Subtask A: Multi-label Emotion Detectionのためのテキスト中の知覚感情を検出するように設計されたシステムである。
我々は、与えられたテキストスニペットから話者の知覚された感情を予測することに集中し、喜び、悲しみ、恐怖、怒り、驚き、嫌悪感などの感情をラベル付けする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:41:24 GMT)
Quantifying Query Fairness Under Unawareness [82.3] 本稿では,二項分類を超えた複数の機密属性を効果的に処理する定量化に基づく頑健な公正度推定手法を提案する。
提案手法は, 様々な属性にまたがる既存のベースラインよりも優れており, 未知の公正度を測定するための信頼性の高いプロトコルを最初に確立した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:31:44 GMT)
How Compositional Generalization and Creativity Improve as Diffusion Models are Trained [82.1] 構成規則を学習するために生成モデルに必要なサンプルはいくつあるか?
ルールを学習するために、データのどのシグナルが利用されるのか?
ここで紹介する階層的クラスタリング機構と物理における再正規化群との関係について論じる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:03:45 GMT)
Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory [79.6] 本稿では、標準的で現実的なスケーリング設定である多数決に焦点をあてる。
サンプリング時間と計算オーバーヘッドが増加するにつれて、より優れた初期性能を持つ複雑なプロンプト戦略が、次第に単純なチェーン・オブ・サート(Chain-of-Thought)に遅れることが示される。
本稿では,スケーリング性能を効率的に予測し,大規模なサンプリング時間下での最良のプロンプト戦略を特定する確率的手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:27:57 GMT)
Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [79.5] 本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。
このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:36:33 GMT)
Horizon Reduction Makes RL Scalable [78.7] オフライン強化学習(RL)アルゴリズムのスケーラビリティについて検討する。
通常のオフラインRLデータセットの最大1000倍のデータセットを使用します。
オフラインRLのスケール不足の主な原因は地平線にあることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:06:54 GMT)
UNIC: Unified In-Context Video Editing [76.8] UNIC(Unified In-Context Video Editing)は、単一のモデル内でさまざまなビデオ編集タスクをコンテキスト内で統一するフレームワークである。
本稿では,一貫した時間的位置エンコーディングを容易にするタスク認識型RoPEと,モデルの異なる編集タスクを明確に区別する条件バイアスを導入する。
その結果、我々の統合された手法は各タスクにおいて優れた性能を発揮し、創発的なタスク構成能力を示すことがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:43 GMT)
ControlThinker: Unveiling Latent Semantics for Controllable Image Generation through Visual Reasoning [76.3] ControlThinkerは、"Comprehend-then-generate"パラダイムを採用した、新しいフレームワークである。
制御画像からの潜在セマンティクスは、テキストプロンプトを豊かにするためにマイニングされる。
このリッチなセマンティック理解は、追加の複雑な修正を必要とせずに、画像生成をシームレスに支援する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:56:19 GMT)
Towards Efficient Speech-Text Jointly Decoding within One Speech Language Model [76.1] 音声言語モデル(Speech LMs)は、単一のモデル内でエンドツーエンドの音声テキストモデリングを可能にする。
音声テキストの共同復号パラダイムの選択は、性能、効率、アライメント品質において重要な役割を担っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:53:49 GMT)
Flow-GRPO: Training Flow Matching Models via Online RL [75.7] 本稿では,オンライン強化学習(RL)をフローマッチングモデルに統合する最初の方法であるFlow-GRPOを提案する。
提案手法では, 1 つの主要な戦略を用いる:(1) 決定論的正規方程式 (ODE) を, 1 つの時点における原モデルの限界分布に一致する等価な微分方程式 (SDE) に変換するODE-to-SDE 変換と、(2) 元の推論タイムステップ数を保ちながらトレーニングの段階を減らし,
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:31:15 GMT)
Beyond Memorization: A Rigorous Evaluation Framework for Medical Knowledge Editing [72.8] 知識編集(KE)は,大規模言語モデル(LLM)の特定の事実を,完全なリトレーニングを必要とせずに更新する,有望なアプローチとして登場した。
本稿では,医療領域における既存のKE手法の有効性を厳格に評価するために,MedEditBenchという新しいフレームワークを提案する。
以上の結果から,現在のKE法は,新たなシナリオへの一般化に失敗し,インジェクションされた情報の表層記憶に留まることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:14:43 GMT)
Representation Surgery: Theory and Practice of Affine Steering [72.6] 言語モデルは、しばしば好ましくない振る舞いを示す。
モデルが望ましくない振る舞いを示すのを防ぐための自然な(そして一般的な)アプローチの1つは、モデルの表現を操ることである。
本稿では, ステアリング機能の形式的および経験的特性について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:03:19 GMT)
FingerVeinSyn-5M: A Million-Scale Dataset and Benchmark for Finger Vein Recognition [72.5] FVeinSynは多種多様な指静脈パターンを生成できる合成ジェネレータである。
FVeinSynを使ってFingerVeinSyn-5Mを作りました。
FingerVeinSyn-5Mで事前訓練されたモデルは、複数のベンチマークで平均53.91%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:27:33 GMT)
LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning [72.0] LLaDA-Vは,視覚的インストラクションチューニングとマスク付き拡散モデルを統合した,純粋拡散に基づくマルチモーダル言語モデル(MLLM)である。
代表的な大規模言語拡散モデルであるLLaDAに基づいて構築されたLLaDA-Vには、視覚的特徴を言語埋め込み空間に投影するビジョンエンコーダとコネクタが組み込まれている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:52:10 GMT)
SemHiTok: A Unified Image Tokenizer via Semantic-Guided Hierarchical Codebook for Multimodal Understanding and Generation [71.7] 我々はSemHiTokを紹介した。Semantic-Guided Hierarchical codebookによる統合画像トークンである。
本稿では,LLaVA-v1.5設定下での画像再構成とマルチモーダル理解において,SemHiTokがSOTA性能を実現することを示す。
また、SemHiTokを用いた統合MLLMを開発し、マルチモーダル理解および生成タスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:13:07 GMT)
OWMM-Agent: Open World Mobile Manipulation With Multi-modal Agentic Data Synthesis [70.4] オープンワールドのモバイル操作タスクは、オープンエンドの命令や環境への一般化が必要なため、依然として課題である。
本稿では,多視点のシーンフレームとエージェント状態を維持した新しいマルチモーダルエージェントアーキテクチャを提案する。
我々は,グローバルなシーン理解,ロボットの状態追跡,マルチモーダルアクション生成を統一モデルで実現した,モバイルマニピュレータのための基礎モデルであるOWMM-VLMについて紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:44 GMT)
Learning to Solve and Verify: A Self-Play Framework for Code and Test Generation [69.6] 大規模言語モデル(LLM)の最近の進歩は、コーディングベンチマークのパフォーマンスを改善している。
しかし、手軽に利用できる高品質なデータの枯渇により、改善は停滞している。
本稿では,単一モデルのコードとテスト生成能力を共同で改善するセルフプレイ・ソルバ検証フレームワークであるSol-Verを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:52:16 GMT)
Computational Thinking Reasoning in Large Language Models [69.3] 計算思考モデル(CTM)は、計算思考パラダイムを大規模言語モデル(LLM)に組み込んだ新しいフレームワークである。
ライブコード実行は推論プロセスにシームレスに統合され、CTMが計算によって考えることができる。
CTMは、精度、解釈可能性、一般化可能性の観点から、従来の推論モデルとツール拡張ベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:01:09 GMT)
Image Editing As Programs with Diffusion Models [69.1] 本稿では,Diffusion Transformer (DiT) アーキテクチャ上に構築された統合画像編集フレームワークである IEAP (Image Editing As Programs) を紹介する。
IEAPは、複雑な編集命令を原子操作のシーケンスに分解して、リダミストレンズによる命令編集にアプローチする。
我々のフレームワークは、特に複雑なマルチステップ命令に対して、より優れた精度とセマンティック忠実度を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:57:24 GMT)
CogMath: Assessing LLMs' Authentic Mathematical Ability from a Human Cognitive Perspective [68.9] CogMathは、人間の推論プロセスを3段階に定式化している。
各次元において,この次元からLLMの熟達度を評価する問合せを生成するために,emphInquiry-emphJudge-emphReference'のマルチエージェントシステムの開発を行う。
LLMは、9次元からのすべての問い合わせに優れている場合にのみ、真に問題をマスターすると考えられている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:00:52 GMT)
Data-Juicer Sandbox: A Feedback-Driven Suite for Multimodal Data-Model Co-development [67.6] 統合データモデル共同開発に適した新しいサンドボックススイートを提案する。
このサンドボックスは、フィードバック駆動の実験プラットフォームを提供し、コスト効率とデータとモデルの両方のガイド付き洗練を可能にする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:32:44 GMT)
Multimodal Tabular Reasoning with Privileged Structured Information [67.4] ブリッジインfOrmation (sc Turbo) を用いたタブウラー推論(TabUlar Reasoning)について紹介する。
sc TurboはDeepSeek-R1をベースにした構造対応の推論トレースジェネレータの恩恵を受ける。
sc Turboは、複数のデータセットで最先端のパフォーマンス(+7.2%対以前のSOTA)を達成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:46:30 GMT)
Voyager: Long-Range and World-Consistent Video Diffusion for Explorable 3D Scene Generation [67.0] 本稿では,単一画像から一貫した3Dポイントクラウドシーケンスを生成する新しいビデオ拡散フレームワークであるVoyagerを紹介する。
既存のアプローチとは異なり、Voyagerはフレーム間で固有の一貫性を持って、エンドツーエンドのシーン生成と再構築を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:04 GMT)
MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale [66.7] MLLM(Multimodal large language model)は、多モーダルタスクにおいて大きな可能性を秘めている。
既存の命令チューニングデータセットは、中間的合理性のないフレーズレベルの答えのみを提供する。
そこで本研究では,大規模マルチモーダル・インストラクション・チューニング・データセットを構築するためのスケーラブルで費用対効果の高い手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:07:57 GMT)
Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [64.3] Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがるデータ処理オペレーターがバックアップするデータ処理システムである。
データ分析、アノテーション、基礎モデルポストトレーニングなど、より重要なタスクをサポートする。
さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:46:21 GMT)
MMAR: Towards Lossless Multi-Modal Auto-Regressive Probabilistic Modeling [64.1] 本稿では,MMAR(Multi-Modal Auto-Regressive)確率モデルフレームワークを提案する。
離散化の手法とは異なり、MMARは情報損失を効率的に回避するために、連続的に評価された画像トークンを取り入れている。
また,数値安定性問題に対処する理論的に実証された手法と,タスク目標の生成と理解のバランスをとるトレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:35:31 GMT)
Uncovering Challenges of Solving the Continuous Gromov-Wasserstein Problem [64.0] グロモフ=ワッサーシュタイン最適輸送(Gromov-Wasserstein Optimal Transport, GWOT)問題は、MLコミュニティの特別な関心を集めている。
既存の連続GWOTアプローチをさまざまなシナリオでクラッシュテストし、結果を注意深く記録し分析し、問題を特定します。
本稿では,離散的手法に依存しない新たな連続GWOT法を提案し,競合の問題を部分的に解決する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:35:52 GMT)
FullDiT2: Efficient In-Context Conditioning for Video Diffusion Transformers [63.8] FullDiT2は、ビデオ生成と編集の両方における一般的な制御性のための効率的なコンテキスト内条件付けフレームワークである。
FullDiT2は、拡散ステップ当たりの平均時間コストにおいて、計算の大幅な削減と2~3倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:09 GMT)
Video-Skill-CoT: Skill-based Chain-of-Thoughts for Domain-Adaptive Video Reasoning [63.4] Video-Skill-CoT (別名 Video-SKoT) は、ドメイン適応型ビデオ推論のためのスキル対応CoT監視を自動構築し活用するフレームワークである。
まず、スキルベースのCoTアノテーションを構築し、それらを共有スキル分類に分類し、トレーニング用に各ビデオ検索ペアに合わせて、詳細なマルチステップのCoT論理を作成する。
第二に、スキル固有のエキスパート学習フレームワークを導入し、各エキスパートモジュールは推論スキルのサブセットを専門とし、軽量なアダプタで訓練する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:18:01 GMT)
CoLa: Chinese Character Decomposition with Compositional Latent Components [63.0] 人間は漢字を構成成分に分解し、それらを再結合して見えない文字を認識することができる。
本研究では,漢字(CoLa)の合成潜時成分を人間定義の分解方式に頼らずに学習する潜時変数モデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:06:15 GMT)
A Survey on (M)LLM-Based GUI Agents [62.6] グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:29:13 GMT)
OptiBench Meets ReSocratic: Measure and Improve LLMs for Optimization Modeling [62.2] 大規模言語モデル (LLM) は数学的推論における問題解決能力を示した。
本稿では,人間可読入力と出力を用いたエンドツーエンド最適化問題のベンチマークであるOptiBenchを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:11:53 GMT)
Models of Heavy-Tailed Mechanistic Universality [62.1] トレーニングニューラルネットワークにおける重み付け行動を引き起こす属性を探索するために,ランダム行列モデルのファミリーを提案する。
このモデルの下では、3つの独立した因子の組み合わせによって、尾翼の電力法則によるスペクトル密度が生じる。
ニューラルネットワークトレーニングの5段階以上において、ニューラルネットワークのスケーリング法則、軌道、および5段階以上の位相を含む重尾の出現に対する我々のモデルの影響について論じる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:55:01 GMT)
Social Genome: Grounded Social Reasoning Abilities of Multimodal Models [61.9] 社会的推論能力は、AIシステムが社会的文脈内でのマルチモーダルなヒューマンコミュニケーションと相互作用を解釈し、応答する上で不可欠である。
SOCIAL GENOMEは,マルチモーダルモデルのきめ細かな基礎的な社会的推論能力を示す最初のベンチマークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:43:41 GMT)
Identifying Aspects in Peer Reviews [61.4] 我々は、ピアレビューのコーパスからアスペクトを抽出するデータ駆動スキーマを開発した。
我々は、アスペクトを付加したピアレビューのデータセットを導入し、コミュニティレベルのレビュー分析にどのように使用できるかを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:50:19 GMT)
DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models [60.7] 本稿では,3つのコントリビューションによって欠点に対処するDenseDPOを紹介する。
まず,地上の真理ビデオの破損したコピーをデノベートすることで,DPO用のビデオペアを作成する。
第二に、得られた時間的アライメントを利用して、クリップ全体よりも短いセグメントにラベルを付けることで、より密でより正確な学習信号が得られる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:06:08 GMT)
Is Compression Really Linear with Code Intelligence? [60.1] textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。
我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。
私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:01:48 GMT)
Refining Sentence Embedding Model through Ranking Sentences Generation with Large Language Models [60.0] 多くのNLPタスクには文の埋め込みが不可欠であり、NLIのようなデータセットを使用して強いパフォーマンスを達成する対照的な学習方法がある。
近年の研究では、大きな言語モデル(LLM)を利用して文ペアを生成し、アノテーション依存を減らしている。
本稿では,潜在空間におけるLLMの生成方向を制御する手法を提案する。
複数のベンチマークによる実験により,本手法は文合成に要するコストを最小限に抑えつつ,新たなSOTA性能を実現することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:39:26 GMT)
ConText: Driving In-context Learning for Text Removal and Segmentation [59.6] 本稿では,視覚的インコンテキスト学習パラダイムを光学的文字認識タスクに適用する最初の研究について述べる。
画像除去・分離方式のタスクチェイン・コンポジトリを提案する。
また、連鎖したプロンプトパターンを潜在クエリ表現に統合するコンテキスト認識アグリゲーションも導入する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:06:32 GMT)
Defensive Prompt Patch: A Robust and Interpretable Defense of LLMs against Jailbreak Attacks [59.5] 本稿では,大規模言語モデル(LLM)のための新しいプロンプトベースの防御機構であるDPPを紹介する。
従来のアプローチとは異なり、DPP は LLM の高能率を維持しながら最小の攻撃成功率 (ASR) を達成するように設計されている。
LLAMA-2-7B-ChatおよびMistral-7B-Instruct-v0.2モデルによる実験結果から,DSPの堅牢性と適応性が確認された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:59:37 GMT)
Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback [59.1] Critique-GRPOは、効果的なポリシー最適化のための自然言語と数値フィードバックを統合している。
教師付き学習ベースとRLベースの微調整アプローチを一貫して上回る。
オンライン強化学習に専門家によるデモンストレーションを取り入れた、強力なベースラインを超えている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:45:47 GMT)
ARIA: Training Language Agents with Intention-Driven Reward Aggregation [58.1] 本稿では,効率よく効果的な言語エージェント訓練を実現するために,意図空間内のリワードを集約する手法であるARIAを提案する。
ARIAは、高次元のジョイントトークン分布空間から低次元の意図空間に自然言語アクションを投影することを目的としており、そこでは意味的に類似したアクションがクラスタ化され、共有報酬が割り当てられる。
大規模な実験では、ARIAは政策勾配のばらつきを著しく低減するだけでなく、4つの下流タスクで平均9.95%のパフォーマンス向上をもたらし、オフラインとオンラインのRLベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:39:54 GMT)
FlexGS: Train Once, Deploy Everywhere with Many-in-One Flexible 3D Gaussian Splatting [58.0] 3Dガウススプラッティング(3DGS)は、3Dシーン表現や新しいビュー合成に様々な応用を可能にしている。
従来のアプローチでは、重要でないガウス人を刈り取ることに重点を置いており、3DGSを効果的に圧縮している。
本稿では3DGSの弾性推論手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:17:57 GMT)
RAID: A Dataset for Testing the Adversarial Robustness of AI-Generated Image Detectors [57.8] 本稿では,72kの多種多様かつ高い変換可能な対向例からなるRAID(Robust Evaluation of AI- generated Image Detectors)を提案する。
提案手法は,未知の検出器に高い成功率で転送する逆画像を生成する。
以上の結果から,現在最先端のAI生成画像検出器は,敵の例によって容易に認識できることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:16:00 GMT)
Best of Both Worlds: Regret Minimization versus Minimax Play [57.7] この結果から,悪用可能な相手からOmega(T)$を得ることができながら,少なくともO(1)$損失のリスクを保証できることが分かる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:29:59 GMT)
Semi-Supervised Model-Free Bayesian State Estimation from Compressed Measurements [57.0] 圧縮測定によるベイズ状態の推定について考察する。
時間的測定ベクトルの寸法は、推定される時間的状態ベクトルの寸法よりも小さい。
状態の進化の基盤となる力学モデルは「モデルフリープロセス」では未知数である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:46:38 GMT)
Object-centric 3D Motion Field for Robot Learning from Human Videos [56.9] 本稿では,人間ビデオからのロボット学習の動作を表現するために,物体中心の3次元運動場を提案する。
ゼロショット制御のためのビデオからこの表現を抽出するための新しいフレームワークを提案する。
実験の結果,提案手法は最新の手法に比べて3次元動作推定誤差を50%以上削減できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:06 GMT)
PC-MoE: Memory-Efficient and Privacy-Preserving Collaborative Training for Mixture-of-Experts LLMs [56.0] プライバシー保護型コラボレーション・オブ・エクササイズ(PC-MoE)を紹介する。
設計上、PC-MoEは分散計算の強みと強い機密性の保証を相乗的に組み合わせている。
完全に集中したモデルのパフォーマンスと収束率とほぼ一致(時には超える)し、70%近いピークのGPURAMの削減を享受し、再構築攻撃に対して完全に堅牢である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:38:31 GMT)
Sliding Window Attention Training for Efficient Large Language Models [55.6] SWATを導入し,スライディングウインドウ・アテンション・トレーニング(Sliding Window Attention Training)を用いて,より効率的な長文処理を実現する。
本稿ではまず,変圧器の非効率性を注目シンク現象とみなす。
我々は、ソフトマックスをシグモイド関数に置き換え、効率的な情報圧縮と保持のためにバランスの取れたALiBiとRotary Position Embeddingを利用する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:36:19 GMT)
LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models [55.5] テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
実験の結果, LDMolはテキストから分子生成ベンチマークにおいて, 既存の自己回帰ベースラインよりも優れていた。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:04:45 GMT)
BiXFormer: A Robust Framework for Maximizing Modality Effectiveness in Multi-Modal Semantic Segmentation [55.5] マスクレベルの分類タスクとしてマルチモーダルなセマンティックセグメンテーションを再構成する。
統一モダリティマッチング(UMM)とクロスモダリティアライメント(CMA)を統合したBiXFormerを提案する。
合成および実世界のマルチモーダルベンチマーク実験により,本手法の有効性を実証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:04:58 GMT)
I'm Sorry Dave, I'm Afraid I Can't Return That: On YouTube Search API Use in Research [55.2] 同一クエリを12週間にわたって実行することで,APIの動作を分析する。
以上の結果から,検索エンドポイントは文書化されていない方法で,一貫性のない結果を返すことが示唆された。
以上の結果から,より短い人気ビデオが優先される可能性が示唆されているが,チャンネルの人気の役割はそれほど明確ではない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:13:42 GMT)
RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics [54.4] 空間参照は、3D物理世界と相互作用するエンボディロボットの基本的な能力である。
本稿では,まず空間的理解を正確に行うことのできる3次元VLMであるRoboReferを提案する。
RFTで訓練されたRoboReferは最先端の空間理解を実現し、平均成功率は89.6%である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:27 GMT)
The Harmonic Structure of Information Contours [54.4] 我々は、英語、スペイン語、ドイツ語、オランダ語、バスク語、ブラジルポルトガル語のテキストで、周期的な情報レートのパターンが一貫した証拠を見出した。
多くの支配的な周波数は談話構造と一致しており、これらの振動は意味のある言語組織を反映していることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:56:30 GMT)
Pseudo-Simulation for Autonomous Driving [54.1] 既存の自動運転車(AV)の評価パラダイムは、重大な制限に直面している。
現実世界の評価は、安全上の懸念と現実主義の欠如のためにしばしば困難である。
オープンループ評価は、一般的に複合的なエラーを見落としているメトリクスに依存する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:53 GMT)
When can isotropy help adapt LLMs' next word prediction to numerical domains? [54.0] 文脈埋め込み空間におけるLLM埋め込みの等方性は、表現の基盤構造をいかに保っているかを示す。
実験により、数値データとモデルアーキテクチャの異なる特性が等方性に異なる影響を与える可能性が示されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:58:08 GMT)
CoRe-MMRAG: Cross-Source Knowledge Reconciliation for Multimodal RAG [54.0] マルチモーダルRAG(CoRe-MMRAG)のためのクロスソース知識textbfReconciliation
本稿では,知識ソース間の不整合を効果的に解決する新しいエンドツーエンドフレームワークを提案する。
KB-VQAベンチマークの実験では、CoRe-MMRAGはベースライン法よりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:31:54 GMT)
EuroGEST: Investigating gender stereotypes in multilingual language models [53.9] 大規模言語モデルはますます複数の言語をサポートするようになったが、ほとんどのベンチマークは英語中心のままである。
EuroGESTは、英語と29のヨーロッパ言語にまたがるLLMにおける性別ステレオタイプ推論を計測するためのデータセットである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:58:18 GMT)
Robust Anti-Backdoor Instruction Tuning in LVLMs [53.8] 大規模視覚言語モデル(LVLM)のための軽量で認証に依存しない防御フレームワークについて紹介する。
私たちのフレームワークは、命令チューニングの下で、アダプタモジュールとテキスト埋め込み層のみを微調整します。
Flickr30kとMSCOCOに対する7つの攻撃に対する実験は、我々の攻撃の成功率をほぼゼロに低下させることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:23:35 GMT)
Towards Better Disentanglement in Non-Autoregressive Zero-Shot Expressive Voice Conversion [53.3] 表現的音声変換は、話者識別と表現的属性の両方を対象音声から所定の音源音声に転送することを目的としている。
本研究では,条件付き変分オートエンコーダを用いた自己監督型非自己回帰型フレームワークを改良する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:42:12 GMT)
DyePack: Provably Flagging Test Set Contamination in LLMs Using Backdoors [52.5] トレーニング中にベンチマークテストセットを使用したモデルを識別するためにバックドアアタックを利用するフレームワークであるDiePackを紹介します。
銀行が染料パックにお金を混ぜて強盗をマークするのと同じように、DiePackはバックドアのサンプルとテストデータとを混ぜて、その上で訓練されたモデルのフラグを立てる。
我々はDiePackを3つのデータセットにわたる5つのモデルで評価し、複数の選択とオープンな生成タスクの両方をカバーした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:31:16 GMT)
Compositional Generalisation for Explainable Hate Speech Detection [52.4] ヘイトスピーチ検出はオンラインコンテンツモデレーションの鍵であるが、現在のモデルはトレーニングデータ以上の一般化に苦慮している。
モデルがよりきめ細かなスパンレベルのアノテーションでトレーニングされている場合でも、それらのラベルの意味を周囲のコンテキストから切り離すことに苦労しています。
本研究では,すべての文脈で同じ頻度で表現が生じるデータセット上でのトレーニングにより,一般化が向上するかどうかを検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:07:36 GMT)
WorldPrediction: A Benchmark for High-level World Modeling and Long-horizon Procedural Planning [52.4] 我々は、異なるAIモデルのワールドモデリングと手続き計画能力を評価するためのビデオベースのベンチマークであるWorldPredictionを紹介する。
現在のフロンティアモデルでは,WorldPrediction-WMでは57%,WorldPrediction-PPでは38%の精度しか達成できないが,人間は両タスクを完璧に解くことができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:22:40 GMT)
Escaping Plato's Cave: Towards the Alignment of 3D and Text Latent Spaces [52.2] 単モーダルテキストと3Dエンコーダの有意な訓練後特徴アライメントが,性能に限界をもたらすことを示す。
次に、対応する特徴空間の部分空間の抽出に焦点をあて、学習された表現を高次元の低次元部分空間に射影することにより、アライメントの質が著しく高くなることを発見する。
私たちの作品は、3Dユニモーダルとテキストの特徴空間のトレーニング後のアライメントのベースラインを確立するのに役立つ最初の作品です。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:39:21 GMT)
Generative Recommender with End-to-End Learnable Item Tokenization [51.8] ETEGRecは、アイテムのトークン化と生成レコメンデーションを結合的なフレームワークに統合する、新しいエンドツーエンド生成レコメンダである。
ETEGRecは、アイテムトークンライザと、デュアルエンコーダ-デコーダアーキテクチャ上に構築された生成レコメンデータで構成されている。
我々は、フレームワーク全体の安定的で効率的なエンドツーエンドトレーニングを保証するために、交互に最適化する手法を開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:22:33 GMT)
Failure Modes of LLMs for Causal Reasoning on Narratives [51.2] 本研究では,大言語モデル(LLM)の因果推論能力について,物語から因果関係を推定する代表的な問題から検討する。
最新の言語モデルでさえ、物語の提示とパラメトリック知識の両方において、信頼できないショートカットに依存していることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:26:30 GMT)
FlowMo: Variance-Based Flow Guidance for Coherent Motion in Video Generation [51.1] FlowMoは、テキスト・ビデオ・モデルにおける動きコヒーレンスを高めるためのトレーニング不要のガイダンス手法である。
時間次元のパッチワイドな分散を測定して動きのコヒーレンスを推定し、サンプリング中にこの分散を動的に減少させるためにモデルを導く。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:45:25 GMT)
EpiCoDe: Boosting Model Performance Beyond Training with Extrapolation and Contrastive Decoding [50.3] EpiCoDeは、余分なトレーニングなしでデータスカシティシナリオにおけるモデルパフォーマンスを向上させる方法である。
EpiCoDeは、既存のメソッドよりも大幅に、堅牢に改善されていることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:11:54 GMT)
ControlSpeech: Towards Simultaneous and Independent Zero-shot Speaker Cloning and Zero-shot Language Style Control [50.3] ControlSpeechは、話者の声を完全にクローンし、任意の制御と話し方の調整を可能にするTTS(text-to-speech)システムである。
ControlSpeechは、制御性、音色類似性、音質、堅牢性、一般化性の観点から、同等または最先端(SOTA)性能を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:07:17 GMT)
MemeReaCon: Probing Contextual Meme Understanding in Large Vision-Language Models [50.2] 我々は,LVLM(Large Vision Language Models)がミームを本来の文脈でどのように理解するかを評価するために設計された,新しいベンチマークであるMemeReaConを紹介する。
私たちは5つのRedditコミュニティからミームを収集し、各ミームの画像、ポストテキスト、ユーザーコメントを一緒に保持しました。
モデルは文脈において重要な情報を解釈できないか、あるいはコミュニケーション目的を見越しながら視覚的詳細に過度に焦点を合わせるかのどちらかです。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:55:43 GMT)
Empowering LLMs with Logical Reasoning: A Comprehensive Survey [49.9] 大規模言語モデル(LLM)は様々なタスクにおいて顕著な成功を収めた。
近年の研究では、LLMの論理的推論能力にはまだ大きな課題があることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:38:43 GMT)
LoGU: Long-form Generation with Uncertainty Expressions [49.8] 不確実性を伴う長文生成(LoGU)の課題について紹介する。
不確実性抑制と不確実性誤認の2つの主要な課題を特定します。
当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。
提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:35:31 GMT)
T$^2$: An Adaptive Test-Time Scaling Strategy for Contextual Question Answering [49.5] T$2$: Think-to-Thinkは質問の複雑さに基づいて推論深度を動的に適応する新しいフレームワークである。
T$2$は、質問を構造的要素に分解し、候補推論戦略と同じような例を生成し、これらの戦略を複数の基準に対して評価し、元の質問に最も適切な戦略を適用する、という4つの重要なステップで機能する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:58:33 GMT)
Assistant-Guided Mitigation of Teacher Preference Bias in LLM-as-a-Judge [49.3] AGDe-Judgeは、トレーニングデータのラベルとフィードバックの両方から疎外するように設計されたフレームワークです。
AGDe-Judgeは、6つの評価ベンチマークで高いパフォーマンスを維持しながら、教師の嗜好バイアスを効果的に低減します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:16:31 GMT)
On the Convergence of Single-Timescale Actor-Critic [49.2] 本研究では,有限状態空間を持つ無限水平割引決定過程(MD)に対して,単時間アクタークリティカル(AC)アルゴリズムのグローバル収束を解析する。
我々は,アクタと批評家の両方のステップサイズが (O(k-Pfrac12) として崩壊し,従来の (O(k-Pfrac12) ) レートから (非最適) の Markov フレームワーク最適化で一般的に使用される (O(k-Pfrac12) ) レートから$k$ になることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:47:22 GMT)
Go-Browse: Training Web Agents with Structured Exploration [49.2] 本稿では,多彩で現実的なWebエージェントデータを大規模に収集する手法であるGo-Browseを提案する。
Go-Browseはグラフ検索としてデータ収集をフレーミングすることで効率的な探索を実現する。
提案手法をWebArenaベンチマーク上でインスタンス化し,100URLにわたる10Kのタスク解決トラジェクトリと40Kのインタラクションステップのデータセットを収集する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:27:56 GMT)
Lacuna Inc. at SemEval-2025 Task 4: LoRA-Enhanced Influence-Based Unlearning for LLMs [49.2] 本稿では, LIBU (LoRA enhanced influence-based unlearning) について述べる。
このアルゴリズムは、古典的なテクスチャインフルエンス関数を組み合わせて、モデルからデータの影響を除去し、テクスチャ秒オーダーの最適化を行い、全体のユーティリティを安定させる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:10:09 GMT)
RhoDARTS: Differentiable Quantum Architecture Search with Density Matrix Simulations [48.7] 変分量子アルゴリズム(VQA)は、強力なノイズ中間スケール量子(NISQ)コンピュータを利用するための有望なアプローチである。
本稿では,量子混合状態の進化をモデルとしたQASアルゴリズムである$rho$DARTSを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:30:35 GMT)
Test Automation for Interactive Scenarios via Promptable Traffic Simulation [48.2] 本稿では,対話型シナリオにおけるAVプランナ評価のための,現実的かつ安全クリティカルな人間の行動を生成する自動化手法を提案する。
我々は低次元目標位置を用いて複雑な人間の行動のパラメータ化を行い、それをプロンプト可能な交通シミュレータProSimに入力する。
テスト生成を自動化するために,目標領域を探索し,ベイズ最適化を用いて安全クリティカルな動作を効率的に識別するプロンプト生成モジュールを導入する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:26:05 GMT)
Bridging conformal field theory and parton approaches to SU(n)_k chiral spin liquids [48.2] 共形場理論では、$mathrmSU(n)_k$ Wess-Zumino-Witten (WZW) モデルを用いて、格子波動関数を1次元と2次元の両方で構成する。
すべての格子上のスピンは、ヤング・テーブルーの$mathrmSU(n)$既約表現の下で、単一の行と$k$ボックスで変換される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:22:21 GMT)
Self-Supervised Contrastive Learning is Approximately Supervised Contrastive Learning [48.1] 標準的な自己指導型コントラスト学習目標が暗黙的に教師付き変種を近似することを示し,我々は負のみ教師付きコントラスト学習損失(NSCL)と呼ぶ。
ラベルに依存しない,アーキテクチャに依存しない境界の下で,意味クラスの数が増えるにつれて,CLとNSCLの損失のギャップが消滅することを証明する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:43:36 GMT)
SViMo: Synchronized Diffusion for Video and Motion Generation in Hand-object Interaction Scenarios [48.1] ハンドオブジェクトインタラクション(HOI)生成には、大きな応用可能性がある。
現在の3D HOIモーション生成アプローチは、事前に定義された3Dオブジェクトモデルとラボでキャプチャされたモーションデータに大きく依存している。
本稿では,同期拡散プロセス内での視覚的事前制約と動的制約を組み合わせることで,HOIビデオと動きを同時に生成するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:53:28 GMT)
Across Programming Language Silos: A Study on Cross-Lingual Retrieval-augmented Code Generation [48.1] 多言語RACGシステムは、プログラミング言語間のコードベースの移行に有用である。
我々は,多言語RACGシステムの有用性と堅牢性を探るため,13個のPLと14k近いインスタンスにまたがるデータセットを構築した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:31:00 GMT)
AUTOCT: Automating Interpretable Clinical Trial Prediction with LLM Agents [47.6] AutoCTは、大規模言語モデルの推論能力と古典的な機械学習の説明可能性を組み合わせた、新しいフレームワークである。
臨床治験予測タスクにおいて, AutoCT は SOTA 法と同等以上の性能を示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:50:55 GMT)
Aligning Large Language Models with Implicit Preferences from User-Generated Content [47.6] 既存の嗜好学習手法は、人間や先進言語モデルからのキュレートされたデータに大きく依存している。
我々は、未ラベルのユーザ生成コンテンツにおける暗黙の人間の嗜好を活用する新しいフレームワークPUGCを提案する。
PUGCは従来の手法に比べて9.37%の性能向上を達成し,35.93%の最先端長制御勝利率を実現した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:29:11 GMT)
Understanding challenges to the interpretation of disaggregated evaluations of algorithmic fairness [47.3] 関係する人口を表わすが、実世界の格差を反映するデータである場合、サブグループ間での平等なパフォーマンスは、信頼できない公平さの尺度であることを示す。
本フレームワークでは, 因果関係の明示的な仮定と分析を相補して, 相反や分布変化の制御を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:40:31 GMT)
PFDial: A Structured Dialogue Instruction Fine-tuning Method Based on UML Flowcharts [47.2] このデータセットは、5,055のプロセスノードを含む440のフローチャートから派生した12,705の高品質な中国語対話命令を含む。
PlantUML仕様に基づいて、各フローチャートはアトミックな対話ユニット、すなわち構造化された5タプルに変換される。
実験結果から, たった800サンプルでトレーニングした7Bモデルと, 全データでトレーニングした0.5Bモデルが90%以上の精度を達成できた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:31:47 GMT)
Scaling Laws for Floating Point Quantization Training [47.2] 本稿では、FP量子化目標、指数ビット、マティーサビットの影響と、LLMモデルのFP量子化訓練性能におけるスケーリング係数の計算について検討する。
ハードウェアメーカーが将来参照できるビット数に対して最適な指数-行列ビット比を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:06:06 GMT)
ViewFusion: Learning Composable Diffusion Models for Novel View Synthesis [47.0] ViewFusionは、非並列な柔軟性を備えた新しいビュー合成に対するエンドツーエンドのジェネレーティブアプローチである。
本手法は比較的小さなNeural 3D Mesh Rendererデータセットで検証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:52:23 GMT)
Towards generating more interpretable counterfactuals via concept vectors: a preliminary study on chest X-rays [46.7] 我々は、臨床概念を生成モデルの潜在空間にマッピングし、概念活性化ベクトル(CAV)を同定する。
抽出された概念はデータセット全体にわたって安定しており、臨床的に関連する特徴を強調する視覚的説明を可能にする。
胸部X線検査の予備的結果から, 胸部X線検査は, 心筋症などの大きな病態を呈するが, より小さな病態はいまだに困難である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:23:12 GMT)
ROGRAG: A Robustly Optimized GraphRAG Framework [45.9] グラフベースの検索強化生成(GraphRAG)は、動的検索のためのグラフとしてドメイン知識を構造化することによってこの問題に対処する。
既存のパイプラインには複雑なエンジニアリングが含まれており、個々のコンポーネントの影響を分離することは困難である。
本稿では,ロバストに最適化されたGraphRAGフレームワークであるROGRAGを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:32:02 GMT)
Fifteen Years of Child-Centered Long-Form Recordings: Promises, Resources, and Remaining Challenges to Validity [45.8] 本稿では,子育て装置で収集した長文音声録音の集合的知識について要約する。
自動アノテーションの精度と結果のメトリクスの解釈を脅かす様々なエラー源を強調した。
完全自動化された品質管理システムは実現不可能であるが、研究者がデータ収集を改善し、分析を文脈化するための実践的戦略を概説する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:45:42 GMT)
Generalization in Federated Learning: A Conditional Mutual Information Framework [45.7] フェデレートラーニング(FL)は、広く採用されているプライバシー保護分散ラーニングフレームワークである。
本研究では,条件付き相互情報(CMI)フレームワークを用いて情報理論解析を行い,FLの2段階の一般化について検討する。
我々は、仮説に基づくCMI境界を含む複数のCMIベースの境界を導出し、FLにおけるプライバシー制約が保証を一般化することを示唆する方法について説明する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:38:51 GMT)
Fact-R1: Towards Explainable Video Misinformation Detection with Deep Reasoning [45.6] 既存の方法は、しばしば固いテンプレートに過度に適合し、偽りのコンテンツに対する深い推論を欠いている。
FakeVVは10万以上のビデオテキスト対と微粒で解釈可能なアノテーションからなる大規模ベンチマークである。
また、深い推論と協調ルールに基づく強化学習を統合するフレームワークであるFact-R1を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:33:32 GMT)
ConsistentChat: Building Skeleton-Guided Consistent Dialogues for Large Language Models from Scratch [45.4] Skeleton-Guided Multi-Turn Dialogue Generationは、人間の意図を明示的にモデル化することで、マルチターン命令合成を制約する。
約15,000のマルチターン会話と224,392の発話を持つマルチターン命令データセットであるConsistentChatを構築した。
Light, Topdial, MT-Evalベンチマークの実験では、ConsistentChatで微調整されたモデルでは、チャットの一貫性が20~30%向上し、タスクの成功率が15%向上している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:21:48 GMT)
How to Use Graph Data in the Wild to Help Graph Anomaly Detection? [45.3] グラフ異常検出タスクを支援するWild-GADというフレームワークを提案する。
UniWildGraphという統合データベース上に構築されており、広範なドメインカバレッジ、豊富なデータボリューム、統一された機能空間を備えている。
我々のフレームワークは、最高の競合方式よりも平均18%のAUCROCと32%のAUCPRを改善しています。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:37:47 GMT)
Effects of Speaker Count, Duration, and Accent Diversity on Zero-Shot Accent Robustness in Low-Resource ASR [45.2] 学習データ中の3つの変数(話者数、各話者ごとの音声持続時間、アクセントの多様性)がASRの堅牢性にどのように影響するかを検討する。
一定回数のASRトレーニング時間において、話者数を増やすことはより有益である。
意外なことに、話者数を制御する場合、異なるアクセントで話者を優先順位付けする際の最小限の利点を観察する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:23:08 GMT)
Curse of Slicing: Why Sliced Mutual Information is a Deceptive Measure of Statistical Dependence [45.2] スライデッド・ミューチュアル・インフォメーション(SMI)は、非線形統計依存を測定するための相互情報に代わるスケーラブルな代替手段として広く利用されている。
我々はSMIが飽和しやすく、統計的依存の増大を検知できず、情報的内容よりも冗長性を優先し、場合によっては相関係数のような単純な依存度よりも悪化することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:18:12 GMT)
Training-Free Constrained Generation With Stable Diffusion Models [45.1] 安定拡散モデルは、様々な領域にまたがるデータ合成における最先端のモデルである。
本稿では,安定拡散モデルと制約付き最適化フレームワークの新たな統合を提案する。
このアプローチの有効性は、精密な形態計測特性の付着を必要とする材料設計実験によって実証される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:24:23 GMT)
DiffCAP: Diffusion-based Cumulative Adversarial Purification for Vision Language Models [45.1] 視覚言語モデル(VLM)はマルチモーダル理解において顕著な能力を示しているが、摂動への感受性は現実世界のアプリケーションにおける信頼性に重大な脅威をもたらす。
本稿では,VLMにおける敵の汚職を効果的に中和できる新しい拡散型浄化戦略であるDiffCAPを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:26:33 GMT)
Unveiling coherent dynamics in non-Markovian open quantum systems: exact expression and recursive perturbation expansion [45.0] 非マルコフ開量子系のコヒーレント力学を効果的に支配するハミルトニアンを導出する体系的枠組みを導入する。
我々の枠組みをパラダイム的スピンシステムに適用し、環境相関がエネルギーシフトと固有基底回転にどのように影響するかを明らかにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:55:22 GMT)
Recursive perturbation approach to time-convolutionless master equations: Explicit construction of generalized Lindblad generators for arbitrary open systems [45.0] 我々は、一般化されたリンドブラッド形式で開量子系の時間畳み込みのない(TCL)生成器に対する摂動展開を開発する。
この定式化は、リンドブラッドのような構造を保持しながら任意の順序で生成元を導出する体系的なアプローチを提供する。
本手法の有効性を検証し,非マルコフ力学と強結合効果に対処する上での有効性を示すため,生成元を4階まで明示的に計算する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:51:26 GMT)
Zero-shot cross-modal transfer of Reinforcement Learning policies through a Global Workspace [45.0] 筆者らは,2つの入力モダリティによって収集された環境情報を活用するために,「グローバルワークスペース」を訓練する。
2つの異なる環境とタスクにおいて、入力モダリティ間のゼロショット・クロスモーダル転送を行うモデルの能力を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:52:00 GMT)
From Average-Iterate to Last-Iterate Convergence in Games: A Reduction and Its Applications [45.0] 大規模なゲームでは、非結合学習ダイナミクスの平均的な繰り返しを新しい非結合学習ダイナミクスの最後の繰り返しに変換する単純なブラックボックス還元が存在することを示す。
2人のプレイヤーのゼロサム正規形式ゲームにおける非結合学習ダイナミクスに対する最先端最後の収束率を得る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:24:14 GMT)
Personalized MR-Informed Diffusion Models for 3D PET Image Reconstruction [44.9] 本稿では,PET-MR スキャンのデータセットから対象特異的なPET画像を生成するための簡易な手法を提案する。
私たちが合成した画像は、被験者のMRスキャンからの情報を保持し、高分解能と解剖学的特徴の保持につながる。
18ドルF]FDGデータセットのシミュレーションと実データを用いて,対象特異的な「擬似PET」画像を用いたパーソナライズされた拡散モデルの事前学習により,低カウントデータによる再構成精度が向上することを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:24:14 GMT)
Automated Skill Discovery for Language Agents through Exploration and Iterative Feedback [44.7] 大規模言語モデル(LLM)のための自動スキル発見フレームワークを提案する。
我々は,探索エージェント(Alice)を用いて,対象エージェント(Bob)を訓練し,環境に不可欠なスキルを学習することで,探索ファースト戦略を採用する。
WebshopとCrafterの実験では、ExIFが有意義なスキルを効果的に発見し、訓練されたエージェントの能力を反復的に拡張する能力を示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:04:21 GMT)
Large-Scale Text-to-Image Model with Inpainting is a Zero-Shot Subject-Driven Image Generator [44.6] ディプチッチ・プロンプティング(Diptych Prompting)は、被写体を正確にアライメントした塗装タスクとして再解釈する、新しいゼロショットアプローチである。
提案手法は主観的画像生成だけでなく, 主観的画像生成と主観的画像編集もサポートする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:35:55 GMT)
A Retrieval-Augmented Multi-Agent Framework for Psychiatry Diagnosis [44.4] MoodAngelsは、気分障害の診断のための最初の特殊なマルチエージェントフレームワークである。
MoodSynは、合成精神医学の1,173件のオープンソースデータセットである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:18:25 GMT)
Challenges in Automated Processing of Speech from Child Wearables: The Case of Voice Type Classifier [44.4] 本稿では,音声タイプ分類法(Voice Type Classification)の1つの基本課題を改善することを目的とした,3年分の実験を要約することにより,進行を阻害するいくつかの障害を示す。
提案実験により,表現特徴,アーキテクチャ,パラメータ探索の改善は,性能の限界ゲインにのみ寄与することが示唆された。
データの関連性と量に注目することで、さらなる進歩が達成される。これは、データの共有を可能にする適切な権限を持つ収集の重要性を強調している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:09:53 GMT)
Robust and Agnostic Learning of Conditional Distributional Treatment Effects [44.3] 問題クラスに対する条件付きDTE(Conditional DTE)を学習するための、新しい堅牢でモデルに依存しない方法論を提供する。
本手法は回帰モデルクラスにCDTEの最良のプロジェクションを提供することができるため,モデルに依存しない。
シミュレーションにおける提案手法の挙動と,富に対する401(k)の適格性の影響を事例として検討した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:14:16 GMT)
React to Surprises: Stable-by-Design Neural Feedback Control and the Youla-REN [44.0] 学習に基づく制御のための非線形ポリシーの安定化のパラメータ化について検討する。
本稿では,ユラ・クーラパラメータ化の非線形バージョンとロバストニューラルネットワークを組み合わせた構造を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:56:15 GMT)
Sonic: Shifting Focus to Global Audio Perception in Portrait Animation [43.6] 発話顔生成の研究は、主に、顔の動きを同期させ、視覚的に魅力的で時間的に整合したアニメーションを作るという複雑さを探求する。
我々は,グローバルな音声知識を活用し,全体的な知覚を高めるために,Sonicと呼ばれる新しいパラダイムを提案する。
映像品質、時間的整合性、唇の同期精度、動きの多様性の点で、新しいオーディオ駆動のパラダイムが既存のSOTA手法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:50:44 GMT)
Establishing Trustworthy LLM Evaluation via Shortcut Neuron Analysis [43.6] 我々は汚染されたモデル自体のメカニズムを解析することで汚染に対処することを目指している。
本稿では,ショートカットニューロンを比較解析と因果解析により同定する手法を提案する。
汚染軽減のためのアプローチの有効性を実験により検証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:33:44 GMT)
Debate, Reflect, and Distill: Multi-Agent Feedback with Tree-Structured Preference Optimization for Efficient Language Model Enhancement [43.5] 大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクにおいて、新しい標準を設定し続けている。
静的な知識蒸留、人間からのフィードバックからのリソース集約的な強化学習、あるいは限られた自己回帰のような現在の技術は、実質的で持続的なパフォーマンス向上をもたらす。
本稿では、より小さなモデルとより強力な教師モデルの間でのマルチターン議論を編成し、実用的なフィードバックを導き出す新しいリフレクション・アンド・ディベート(D&R)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:52:20 GMT)
Progressive Mastery: Customized Curriculum Learning with Guided Prompting for Mathematical Reasoning [43.1] 大規模言語モデル(LLM)は、様々な推論タスクにおいて顕著な性能を達成しているが、非効率なサンプル利用と非フレキシブルな難易度サンプル処理によって後処理が制限されている。
本稿では,2つの重要なイノベーションを持つ新しいフレームワークであるCustomized Curriculum Learning (CCL)を提案する。
まず,各モデルの個々の能力に基づいてカリキュラムデータセットをカスタマイズする,モデル適応的難易度定義を導入する。
第2に,戦略的なヒントによって標本の難易度を動的に低減し,性能を低下させるような挑戦的な試料を効果的に活用する「ガイド・プロンプティング」を開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:31:46 GMT)
TransClean: Finding False Positives in Multi-Source Entity Matching under Real-World Conditions via Transitive Consistency [43.1] 本研究では,実環境下でのエンティティマッチングアルゴリズムの偽陽性予測手法であるTransCleanを提案する。
TransCleanは、効率的で堅牢で高速な方法で複数のデータソースを操作するように設計されている。
実験の結果,TransCleanはマルチソース環境でのエンティティマッチングにおいて,平均+24.42F1スコアの改善を誘導することがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:33:41 GMT)
From Theory to Practice: Real-World Use Cases on Trustworthy LLM-Driven Process Modeling, Prediction and Automation [43.0] 本稿では,大規模言語モデル(LLM)がプロセスモデリング,予測,自動化をどのように再定義するかを示す実世界の4つのユースケースについて考察する。
この仕事は製造、モデリング、ライフサイエンス、デザインプロセスに及び、人間とAIのコラボレーションを通じてドメイン固有の課題に対処する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:12:09 GMT)
OneForecast: A Universal Framework for Global and Regional Weather Forecasting [42.5] 本稿では,グラフニューラルネットワークに基づくグローバルなネスト型気象予報フレームワーク(OneForecast)を提案する。
動的システムパースペクティブとマルチグリッド理論を組み合わせることで,マルチスケールグラフ構造を構築し,対象領域を密度化する。
動的ゲーティングユニットを用いた適応型メッセージング機構を導入し,ノードとエッジ機能を深く統合し,より正確なイベント予測を行う。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:33:10 GMT)
ATRI: Mitigating Multilingual Audio Text Retrieval Inconsistencies by Reducing Data Distribution Errors [42.5] 既存の多言語音声テキスト検索方式は、例えば言語間での類似性マッチングのような不整合に悩まされている。
1対kのコントラスト学習とオーディオ-英語のコントラスト学習を用いた一貫したML-ATR方式を提案する。
提案手法は,英語を含む8つの主流言語に対して,リコールと整合性評価の最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:49:57 GMT)
Your Turn: At Home Turning Angle Estimation for Parkinson's Disease Severity Assessment [42.4] 本稿では,ビデオから3Dスケルトンを抽出して回転角を自動的に定量化する深層学習手法を提案する。
我々は、24人の被験者から1386個のビデオクリップを回転させて、最先端の人間のポーズ推定モデルであるFastposeとStrided Transformerを利用する。
これは、一眼レフカメラデータを用いて、自宅のPD患者によるターンの定量化を行う最初の研究である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:01:34 GMT)
Seed-Coder: Let the Code Model Curate Data for Itself [42.1] 8Bサイズの一連のオープンソースモデルであるSeed-Coderを紹介します。
我々のコードはモデル中心のデータパイプラインによって生成される。
Seed-Coderは、同じサイズのオープンソースモデルの中で最先端の結果を達成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:17:19 GMT)
Negative-Guided Subject Fidelity Optimization for Zero-Shot Subject-Driven Generation [41.9] 本稿では,ゼロショットな被写体駆動生成のための新しい比較学習フレームワークである主観的忠実度最適化(SFO)を提案する。
負のターゲットに対する条件劣化負サンプリング(CDNS)を提案する。
CDNSを持つSFOは、主観的忠実度とテキストアライメントの両方において、ベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:59:25 GMT)
MedAgentGym: Training LLM Agents for Code-Based Medical Reasoning at Scale [41.9] MedAgentGYMは、大規模言語モデル(LLM)エージェントのコーディングベースの医療推論能力を高めるために設計された訓練環境である。
72,413のタスクインスタンスを129のカテゴリに分けて構成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:38:55 GMT)
TextAtari: 100K Frames Game Playing with Language Agents [41.8] 最大10万ステップに及ぶ、非常に長期にわたる意思決定タスクにおいて、言語エージェントを評価するためのベンチマークであるTextAtariを提示する。
古典的Atariゲームの視覚状態表現をリッチテキスト記述に変換することで、TextAtariは、自然言語処理でシーケンシャルな意思決定をブリッジする挑戦的なテストベッドを生成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:55:27 GMT)
Isolated Causal Effects of Natural Language [41.6] 本稿では,言語による因果関係の分離のための公式な推定フレームワークを提案する。
我々は、介入以外のすべての非焦点言語を近似する必要性が、主な課題であることを示した。
重なり合いと重なり合いの2つの鍵軸に沿って、そのようなバイアスに対する効果推定の感度を評価する方法を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:20:45 GMT)
TokAlign: Efficient Vocabulary Adaptation via Token Alignment [41.6] トークン化は、大規模言語モデル(LLM)がテキストを処理するための基本的なステップである。
新しいドメインや言語では、トークン化の非効率性はLLMのトレーニングと生成を遅くする。
トークン共起ビューからLLMの語彙を置き換えるために,TokAlignという効率的な手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:15:57 GMT)
MammAlps: A multi-view video behavior monitoring dataset of wild mammals in the Swiss Alps [41.6] MammAlps(マムアルプス)は、スイス国立公園の9つのカメラトラップから収集した野生生物の行動のデータセットである。
6135個の単一動物クリップに基づいて,最初の階層的・マルチモーダルな動物行動認識ベンチマークを提案する。
また,活動,種,個体数,気象条件の同定を目的とした第2の生態指標を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:54:37 GMT)
SLAC: Simulation-Pretrained Latent Action Space for Whole-Body Real-World RL [41.3] 有能な家庭用・産業用ロボットの構築には、移動マニピュレータのような多目的で高自由度(DoF)システムの制御を習得する必要がある。
本稿では,タスク非依存の潜在行動空間を事前学習するために,低忠実度シミュレータを活用することで,実世界のRLを複雑な実施のために実現可能なSLACを提案する。
本研究では,2次元モバイル操作タスクのスイート上での既存手法に対するSLACの評価を行い,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:41:55 GMT)
Large Language Models Struggle to Describe the Haystack without Human Help: Human-in-the-loop Evaluation of Topic Models [41.1] 本研究では,教師なし,教師なしの大規模言語モデルを用いて,ユーザが獲得する知識を計測する。
LLMは人間の助けなしに大規模なコーパスの干ばつ、特にドメイン固有のデータを記述するのに苦労している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:49:39 GMT)
CAdam: Confidence-Based Optimization for Online Learning [41.0] 更新を決定する前に,各パラメータ次元の運動量と勾配の整合性を評価する信頼度に基づく最適化戦略であるCAdamを導入する。
CAdamはAdamと比較してモデル性能を大幅に向上させ、システム全体の商品量(GMV)を大幅に増加させた。
大規模なA/Bテストでは、CAdamはAdamと比較してモデル性能を大幅に向上させ、システム全体の商品量(GMV)を大幅に増加させた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:58:21 GMT)
SGN-CIRL: Scene Graph-based Navigation with Curriculum, Imitation, and Reinforcement Learning [40.8] 3Dシーングラフは、オブジェクト間の空間的関係をモデル化し、エージェントが部分的に観察可能な環境で効率的にナビゲートできるようにする。
本稿では、地図レス強化学習に基づくロボットナビゲーションのためのSGN-CIRLという独自のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:09:45 GMT)
Generating Pedagogically Meaningful Visuals for Math Word Problems: A New Benchmark and Analysis of Text-to-Image Models [40.8] テキスト記述から教育的に意味のある視覚を生成するためのフレームワークであるMath2Visualを提案する。
我々は1,903個のビジュアルの注釈付きデータセットを構築し、テキスト・ツー・イメージ(TTI)モデルを評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:08:11 GMT)
Go Beyond Earth: Understanding Human Actions and Scenes in Microgravity Environments [40.7] MicroG-4Mは微小重力下での人間の活動のセマンティック理解のための最初のベンチマークである。
データセットには、50のアクションを含む4,759のクリップ、1,238のコンテキスト豊富なキャプション、そして7000以上の質問対の宇宙飛行士の活動とシーン理解が含まれている。
MicroG-4Mは、細粒度多ラベルアクション認識、時間的ビデオキャプション、視覚的質問応答の3つのコアタスクをサポートする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:43:51 GMT)
AI and the Dynamic Supply of Training Data [40.7] 商用AIのトレーニングデータになる際のクリエイターの行動変化について検討する。
我々はコントリビュータの反応を調査し、このデータセットに作品が含まれているコントリビュータと、そうでないコントリビュータを比較した。
以上の結果から,治療を受けたコントリビュータがプラットフォームを離れ,新たなアップロード率を大幅に低下させたことが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:28:50 GMT)
Mitigating Hallucinations in Large Vision-Language Models via Entity-Centric Multimodal Preference Optimization [40.7] 既存の嗜好アライメント手法は、画像-テキストのモダリティアライメントを無視しながら、人間の嗜好とモデル応答の整合性に重点を置いている。
改良されたモダリティアライメントを実現するエンティティ中心型マルチモーダル参照最適化(EMPO)を提案する。
EMPOは、Object-HalBenchで85.9%、MM-HalBenchで49.8%の幻覚率を減少させる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:03:50 GMT)
"Don't Do That!": Guiding Embodied Systems through Large Language Model-based Constraint Generation [40.6] 大規模言語モデル(LLM)は、自然言語から計画問題への複雑な制約を組み込んだロボットナビゲーションへの関心を喚起している。
本稿では,LLMを用いて制約をPython関数に変換する制約生成フレームワークを提案する。
これらの LLM 生成関数は,複雑な数学的制約を正確に記述し,従来の探索アルゴリズムを用いたクラウド表現に応用する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:47:53 GMT)
Sign-SGD is the Golden Gate between Multi-Node to Single-Node Learning: Significant Boost via Parameter-Free Optimization [40.5] Sign-SGDは、単一ノードトレーニングにおけるメモリ効率のよいアプローチであり、分散学習における勾配圧縮技術である。
理論的な観点から有効段数を自動的に決定することは不可能である。
我々は、一つのノードと複数のノードの学習、モメンタムを組み込んだ手法にアプローチを拡張します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:58:33 GMT)
MCIP: Protecting MCP Safety via Model Contextual Integrity Protocol [40.4] 本稿では,モデルコンテキストプロトコルの安全性を高めるための新しいフレームワークを提案する。
MAESTRO フレームワークをベースとして,まず MCP に欠落する安全機構を解析する。
次に、MPPシナリオで観察されるさまざまな安全でない振る舞いをキャプチャする、きめ細かい分類法を開発する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:21:46 GMT)
Ideological Fragmentation of the Social Media Ecosystem: From echo chambers to echo platforms [39.6] 我々は、2020年の米大統領選挙に関連する1億1700万の投稿を9つのソーシャルメディアプラットフォームから分析する。
以上の結果から, 生態系におけるプラットフォーム中心性において, プラットフォーム間の大きな違いが明らかとなった。
これらの結果は、ソーシャルメディアの風景の断片化と分極を形作る重要な次元を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:07:39 GMT)
AmbiK: Dataset of Ambiguous Tasks in Kitchen Environment [39.6] 本研究では,キッチン環境におけるロボットへのあいまいな指示のデータセットであるAmbiK(Ambiguous Tasks in Kitchen Environment)を提案する。
1000組のあいまいなタスクとそのあいまいなタスクで構成され、あいまいさタイプ(Human Preferences、Common Sense Knowledge、Safety)に分類される。
AmbiKは、研究者があいまいさ検出方法の統一的な比較を行うことを可能にすることを願っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:47:07 GMT)
Measuring Human Involvement in AI-Generated Text: A Case Study on Academic Writing [39.5] 調査によると、大学生の30%近くが生成AIを使って学術論文やレポートを書く。
ほとんどの対策は、AI生成テキストの検出をバイナリ分類タスクとして扱い、堅牢性に欠ける。
このアプローチは、人間と機械のコラボレーションが主流になりつつあるにもかかわらず、コンテンツ生成への人間の関与を見落としている。
本稿では,BERTScoreを用いて生成プロセスにおける人間の関与を測定する手法と,トークン分類タスクで訓練されたマルチタスクRoBERTaベースの回帰器を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:31:36 GMT)
AuthGuard: Generalizable Deepfake Detection via Language Guidance [39.2] 既存のディープフェイク検出技術は、進化し続ける新しい、目に見えない偽造手法に追いつくのに苦労している。
言語指導を取り入れることで、ディープフェイク検出の一般化を改善することができる。
我々は、識別的分類と画像テキストのコントラスト学習を組み合わせることで、専門的なディープフェイク視覚エンコーダを訓練する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:50:07 GMT)
PCEvolve: Private Contrastive Evolution for Synthetic Dataset Generation via Few-Shot Private Data and Generative APIs [39.1] プライベート進化(PE)アルゴリズムは拡散モデルAPIを用いて差分プライバシー(DP)合成画像を生成する。
実際には、医療や業界といった専門分野では、ごくわずかのプライベートデータの問題が特に多い。
提案手法は,複数ショットのプライベートデータにおいて,クラス間のコントラスト関係を反復的にマイニングする,新しいAPI支援アルゴリズムであるPrivate Contrastive Evolution (PCEvolve)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:33:06 GMT)
Leveraging Coordinate Momentum in SignSGD and Muon: Memory-Optimized Zero-Order [39.0] ダウンストリームタスクに事前訓練されたモデルを適用するには、微調整大型言語モデル(LLM)が不可欠である。
従来の一階述語アルゴリズムは、モデルサイズであまりスケールしない、禁止的なメモリと計算コストを発生させる。
メモリと計算効率の代替としてゼロオーダー(ZO)最適化法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:27:17 GMT)
FALO: Fast and Accurate LiDAR 3D Object Detection on Resource-Constrained Devices [38.6] 既存のLiDAR 3Dオブジェクト検出方法はスパース畳み込みやトランスフォーマーに依存しており、リソース制約のあるエッジデバイス上では実行が困難である。
ハードウェアフレンドリーなLiDAR3D検出手法であるFALOを提案し,SOTA(State-of-the-art)検出精度と高速推論速度の両方を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:46:28 GMT)
Beyond Entropy: Region Confidence Proxy for Wild Test-Time Adaptation [38.6] 本稿では,領域統合手法ReCAPを導入し,その長大な処理を回避した。
本研究では,抽出可能な領域の信頼度を抽出可能かつ上界のプロキシに変換する有限から無限のセマンティック近似を開発する。
実験では、さまざまなデータセットやワイルドシナリオにわたる既存のメソッドよりも、ReCAPが一貫した優位性を実証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:00:00 GMT)
The Capabilities and Limitations of Weak-to-Strong Generalization: Generalization and Calibration [38.5] 弱強一般化に関する理論的知見を提供する。
弱いモデルは強力な一般化性能を示し、よく校正された予測を維持するべきである。
我々は、Charikar et al. (2024) の業績を、Kullback-Leibler の発散に基づく損失関数に拡張する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:52:51 GMT)
Compositional Scene Understanding through Inverse Generative Modeling [38.3] 自然画像が与えられたシーンの特性を理解するために生成モデルをどのように利用できるかを検討する。
シーン上の小さなモデルから合成された視覚的生成モデルを構築する。
これにより、グローバルなシーン要因を推測し、新しいシーンへの堅牢な一般化を可能にする方法について説明する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:26:35 GMT)
Stronger Baselines for Retrieval-Augmented Generation with Long-Context Language Models [38.2] 我々は、DOS RAG(Document's Original Structure RAG)を含む3つのベースラインに対して、最近の2つのマルチステージパイプライン、ReadAgentとRAPTORを比較した。
DOS RAG は、複数の長期コンテキスト QA ベンチマークにおいて、より複雑なメソッドを一貫してマッチングまたは上回る。
我々は、DOS RAGを、将来のRAG評価のための単純かつ強力なベースラインとして確立することを推奨する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:16:28 GMT)
Single-Pass Object-Focused Data Selection [38.1] 同時にアノテートすべきすべてのデータを選択するプロセスを参照して,シングルパスデータ選択に着目する。
シングルパスデータ選択の以前の方法は画像レベルの表現に依存しており、オブジェクトの検出とセグメンテーションのランダム選択を確実に上回らなかった。
我々は,基礎モデルからオブジェクトレベルの特徴を活用し,対象クラスのセマンティックカバレッジを確保するオブジェクト焦点データ選択(OFDS)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:06:22 GMT)
LLMEval-Med: A Real-world Clinical Benchmark for Medical LLMs with Physician Validation [38.0] 医学における大規模言語モデル (LLMs) の評価は, 医療応用には精度が高く, 誤差の少ないため重要である。
LLMEval-Medは、5つの中核医療領域をカバーする新しいベンチマークであり、現実の電子健康記録から得られた2,996の質問と専門家が設計した臨床シナリオを含む。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:43:14 GMT)
Technical report on a quantum-inspired solver for simulating compressible flows [37.7] この文書は、エアバス・BWMグループ量子コンピューティングチャレンジ(ABQCC)2024の最終段階で受け入れられた2次元オイラー方程式の量子インスパイアされた解法を提示する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:01:45 GMT)
Probabilistic measures afford fair comparisons of AIWP and NWP model output [37.7] 我々はAIWPモデルとNWPモデルからの単値出力の公平かつ有意義な比較のための新しい尺度を提案する。
我々はPCを,処理後の確率予測における平均連続的ランク付け確率スコア(CRPS)とみなす。
提案手法では,損失関数の事前特定が競合相手を不平等な足場に配置する設定において,単一値予測の比較を行う。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:14:45 GMT)
M3HF: Multi-agent Reinforcement Learning from Multi-phase Human Feedback of Mixed Quality [37.7] 混合品質の多相フィードバック(textM3textHF$)から多相強化学習を導入し、混合品質の多相フィードバックをMARLトレーニングプロセスに統合する。
トレーニング中は,人的評価のためのエージェント学習を戦略的に停止し,大きな言語モデルを用いてフィードバックを解析し,それを適切に割り当て,報酬関数を更新する。
挑戦的な環境における実証的な結果は、$textM3textHF$が最先端のメソッドを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:00:12 GMT)
EPiC: Towards Lossless Speedup for Reasoning Training through Edge-Preserving CoT Condensation [37.7] 資源効率のよい推論学習におけるCoT凝縮の問題点について検討する。
本研究では,各CoTトレースの初期セグメントと最終セグメントのみを選択的に保持するエッジ保存凝縮法 EPiC を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:49:10 GMT)
Target Semantics Clustering via Text Representations for Robust Universal Domain Adaptation [37.6] Universal Domain Adaptation (UniDA)は、ドメインシフトと未知のカテゴリシフトの両方の下で、ソースドメインの知識をターゲットドメインに転送することに焦点を当てている。
現在の手法では、制約のない連続画像表現空間からターゲット領域意味論センターを得るのが一般的である。
本稿では,視覚言語モデルに基づく意味的意味的かつ離散的なテキスト表現空間のセマンティックセンターを探索する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:11:53 GMT)
InterRVOS: Interaction-aware Referring Video Object Segmentation [37.5] ビデオオブジェクトのセグメンテーションの参照は、与えられた自然言語表現に対応するビデオ内のオブジェクトをセグメンテーションすることを目的としている。
包括的なビデオ理解では、オブジェクトの役割は、他のエンティティとの相互作用によって定義されることが多い。
本稿では,対話に係わるアクターと対象エンティティのセグメンテーションを必要とする新しいタスクである,ビデオオブジェクトの参照を参照することを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:23:48 GMT)
Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models [37.5] 本稿では,復号化時の視覚トークンの寄与を高める訓練自由手法を提案する。
自動評価と人的評価の両方を取り入れた実験は,既存の手法がリコールコストでMLLMの精度を向上させることを実証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:43:40 GMT)
VisCoder: Fine-Tuning LLMs for Executable Python Visualization Code Generation [37.5] 提案するVisCode-200Kは,Pythonによる可視化と自己補正のための大規模インストラクションチューニングデータセットである。
1)オープンソースリポジトリからの検証済みプロットコードと自然言語命令と描画プロットのペア,(2)Code-Feedbackからの45Kのマルチターン補正ダイアログ。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:24:44 GMT)
Controlling Difficulty of Generated Text for AI-Assisted Language Learning [37.3] 大規模言語モデル(LLM)は、ほぼネイティブに近いレベルの複雑さでテキストを生成するため、初心者の学習者には不適当である。
制御可能な生成技術がLLM出力に適応して絶対初心者を支援することができるかどうかを検討する。
以上の結果から,プロンプトだけでは出力の難易度を制御できないが,将来的な識別器の使用は出力の理解性を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:38:21 GMT)
MDPE: A Multimodal Deception Dataset with Personality and Emotional Characteristics [37.3] マルチモーダル・デシージャ・データセットMDPEを導入する。
このデータセットは、騙しの特徴に加えて、個性や感情的表現の特徴の個人差情報も含んでいる。
193人の被験者による104時間以上の騙しと感情的なビデオで構成されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:38:02 GMT)
Lost in Transcription, Found in Distribution Shift: Demystifying Hallucination in Speech Foundation Models [36.3] 幻覚は特に医療、法務、航空などの高額な領域に関係している。
本研究では,分布変化やモデルサイズ,モデルアーキテクチャなどの要因が幻覚発生誤差率(HER)にどのように影響するかを検討する。
我々の研究は、ASRモデルの性能を評価するために、WERのような従来の指標とHERを併用することの重要性を強調した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:04:18 GMT)
Trustworthy Medical Question Answering: An Evaluation-Centric Survey [36.1] 医療質問応答システムにおける信頼性の6つの重要な側面を体系的に検討した。
モデル改善を促進する評価誘導手法を解析する。
我々は, LLM を用いた医療用QAの安全性, 信頼性, 透明性の確保に向けた今後の研究方針を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:48:10 GMT)
RoE-FND: A Case-Based Reasoning Approach with Dual Verification for Fake News Detection via LLMs [36.0] 経験的学習を伴う大規模言語モデルによる論理的推論タスクとしてエビデンスベースのFNDを再構成するフレームワークである textbfRoE-FND (textbfunderlineReason textbfunderlineon textbfunderlineon FND) を提案する。
主な貢献は、複数の既存の課題に対処するケースベースのFND推論フレームワーク、進化する状況への適応を可能にするトレーニング不要のアプローチ、そしてフレームワークのより優れた一般化と状態に対する有効性の実証的検証である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:23:58 GMT)
SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond [35.8] 多様な論理的推論データを大規模に生成するデータ合成フレームワークおよびデータセットであるSynLogicを提案する。
7Bおよび32Bモデルに基づくSynLogicデータセットにおけるRLトレーニングの有効性を検証する。
混合トレーニングモデルは、複数のベンチマークでDeepSeek-R1-Zero-Qwen-32Bより優れています。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:08:08 GMT)
Prompt Candidates, then Distill: A Teacher-Student Framework for LLM-driven Data Annotation [35.1] 本稿では,大言語モデルにおいて不確実性発生時に可能なラベルを全て出力することを推奨する新しい候補アノテーションパラダイムを提案する。
下流タスクにユニークなラベルを提供することを保証するため,小言語モデルを用いて候補アノテーションを蒸留する教師学習フレームワークCanDistを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:42:37 GMT)
Words of Warmth: Trust and Sociability Norms for over 26k English Words [35.1] 社会心理学者は、ウォームス(W)とコンピテンス(C)が、他の人々やグループを評価する主要な次元であることを示した。
我々は,26万語以上の英語の単語に対して,手作業による単語要約(単語信頼や単語結合性など)を行う最初の大規模リポジトリであるWords of Warmthを紹介した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:18:32 GMT)
GRU: Mitigating the Trade-off between Unlearning and Retention for Large Language Models [34.9] 大言語モデル(LLM)のアンラーニングは、プライバシや著作権関連の応答を取り除く上で重要な役割を担っている。
完全な未学習の追求には、その一般的な機能に妥協があるため、かなりのコストが伴うことが多い。
幾何的な方法で勾配の更新を制御する拡張型アンラーニングフレームワークであるGradient Rectified Unlearning (GRU)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:58:11 GMT)
On the Power of Context-Enhanced Learning in LLMs [34.9] 我々は,LLMの新しい概念である文脈強化学習を定式化する。
テキスト上での標準勾配に基づく学習は、文脈は自動回帰勾配を計算しない追加のデータで拡張される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:53:41 GMT)
AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models [34.8] 大規模視覚言語モデル(VLM)のアライメント能力を評価するベンチマークであるAlignMMBenchを紹介する。
このベンチマークは、現実世界のシナリオとインターネットソースから慎重にキュレートされ、シングルターンとマルチターンの対話シナリオを含む。
また,GPT-4の評価能力を超えるルール校正評価器であるCristiqueVLMを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:53:00 GMT)
TracLLM: A Generic Framework for Attributing Long Context LLMs [34.8] 我々は,長期LLMに適した最初の汎用コンテキストトレースバックフレームワークであるTracLLMを開発した。
我々のフレームワークは、既存の特徴属性手法の有効性と効率を向上させることができる。
評価の結果,TracLLMはLLMの出力に繋がる長い文脈でテキストを効果的に識別できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:48:16 GMT)
SuperWriter: Reflection-Driven Long-Form Generation with Large Language Models [34.7] SuperWriter-Agentは、長文生成の品質と一貫性を高めるために設計されたフレームワークである。
この枠組みに基づき、7B SuperWriter-LMをトレーニングするための教師付き微調整データセットを構築した。
様々なベンチマークで実証された結果は、SuperWriter-LMが最先端のパフォーマンスを実現していることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:27:42 GMT)
Galileo: Learning Global & Local Features of Many Remote Sensing Modalities [34.7] そこで本稿では,マスクモデルを用いて,柔軟な入力モダリティの集合にまたがるマルチスケール特徴を抽出する,自己教師付き学習アルゴリズムを提案する。
私たちのガリレオは、11のベンチマークと複数のタスクで衛星画像とピクセル時系列のSoTAスペシャリストモデルを上回る、単一のジェネラリストモデルです。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:07:47 GMT)
Learning Cascade Ranking as One Network [34.5] Cascade Rankingは、リコメンデーションや広告プラットフォームのような大規模なトップk選択システムにおいて一般的なアーキテクチャである。
近年の進歩は、相互作用を意識したトレーニングパラダイムを導入しているが、それでも、学習目標とカスケードランキング全体の目標との整合に苦慮している。
本稿では,カスケードランキングによって基底真理項目が選択される確率の低い値から,新しい代理損失関数を導入するLCRONを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:47:48 GMT)
Multi Layered Autonomy and AI Ecologies in Robotic Art Installations [34.5] Symbiosis of Agents is a large-scale install by Baoyang Chen (baoyangchen.com)
AI駆動のロボットを没入型ミラーラインのアリーナに埋め込んで、マシンエージェンシーと芸術作家の緊張関係を探る。
3階層の信仰システムは、マイクロレベルの適応戦術、メソレベルの物語ドライブ、マクロレベルのプライムディレクティブといったエコロジーを操縦する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:57:32 GMT)
HuGeDiff: 3D Human Generation via Diffusion with Gaussian Splatting [34.0] 現在の手法は、細部、手と顔の正確なレンダリング、人間のリアリズム、外観に対する制御性に苦慮している。
これらの課題に対処しようとする弱教師付きパイプラインを提示する。
我々は、最先端のアプローチと比較して、3次元の人間の世代において、オーダー・オブ・マグニチュード・スピードアップを実演する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:11:23 GMT)
MFLA: Monotonic Finite Look-ahead Attention for Streaming Speech Recognition [33.9] 本研究では,連続音声シーケンスと離散テキストトークン間の準モノトニックアライメントを確立するための連続積分とファイア機構を提案する。
また、モノトニック・フィニット・ルック・アヘッド・アテンションを設計し、各トークンが音声列から無限の左コンテキストと有限の右コンテキストに到達できるようにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:53:40 GMT)
HashEvict: A Pre-Attention KV Cache Eviction Strategy using Locality-Sensitive Hashing [33.9] 本稿では,局所性に敏感なハッシュ(LSH)を用いてKVキャッシュを圧縮するアルゴリズムであるHashEvictを紹介する。
HashEvictは、推論、複数選択、長文検索、要約タスクのハイパフォーマンスを維持しながら、KVキャッシュを30%-70%圧縮することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:37:29 GMT)
DreamPRM: Domain-Reweighted Process Reward Model for Multimodal Reasoning [33.6] マルチモーダルPRMのためのドメイン重み付けトレーニングフレームワークであるDreamPRMを紹介する。
低レベルの最適化では、DreamPRMはドメイン重み付き複数のデータセットで微調整を行う。
上位レベルの最適化では、PRMは別個のメタ学習データセットで評価される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:51:17 GMT)
Hearing Anywhere in Any Environment [33.6] 本稿では,クロスルームルームインパルス応答(RIR)予測のためのフレームワークであるxRIRを提案する。
我々の一般化可能なアプローチの中核は、パノラマ深度画像から空間コンテキストをキャプチャする幾何学的特徴抽出器と、いくつかの参照RIRサンプルから詳細な音響特徴を抽出するRIRエンコーダを組み合わせることである。
実験により,本手法が一連のベースラインを強く上回ることを示すとともに,実世界の4つの環境におけるモデルの評価を行い,我々のアプローチの一般化可能性とデータセットの現実性を示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:59:42 GMT)
Multiscale guidance of AlphaFold3 with heterogeneous cryo-EM data [33.6] 低温電子顕微鏡(cryo-EM)は、近原性構造不均一性をイメージングするための強力なツールとして登場した。
ここでは, タンパク質構造予測モデルを用いて学習したCryo-EM密度マップと, 豊富な配列と生物物理学的先行データを組み合わせる。
我々の方法であるCryoBoltzは、大域的および局所的な構造制約を用いて、事前訓練されたタンパク質構造予測モデルのサンプリング軌跡を導出する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:16:27 GMT)
HSSBench: Benchmarking Humanities and Social Sciences Ability for Multimodal Large Language Models [33.3] HSSBenchは、人文科学(HSS)タスクにおけるMLLM(Multimodal Large Language Models)の機能を評価するために設計されたベンチマークである。
HSSBenchには、13,000以上の精巧に設計されたサンプルが含まれており、6つの主要なカテゴリをカバーしている。
我々は、HSSBench上で20以上のメインストリームMLLMをベンチマークし、最先端モデルにおいても大きな課題が生じることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:14:13 GMT)
Gaze-LLE: Gaze Target Estimation via Large-Scale Learned Encoders [33.3] 本研究では,視覚目標推定の問題に対処する。
凍結したDINOv2エンコーダの特徴を活用して視線目標推定を効率化する新しいトランスフォーマフレームワークであるGaze-LLEを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:52:12 GMT)
Preface to the Special Issue of the TAL Journal on Scholarly Document Processing [33.0] 学術文献の急速な成長は、研究者が新たな知識に追随することをますます困難にしている。
TALジャーナルのこの特別号では、学術・科学的文書の自然言語処理と情報検索についての研究が強調されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:35:39 GMT)
Demystifying Reasoning Dynamics with Mutual Information: Thinking Tokens are Information Peaks in LLM Reasoning [33.0] 大規模推論モデル(LRM)は複雑な問題解決において顕著な能力を示したが、その内部の推論機構はよく理解されていない。
特定の生成段階におけるMIは, LRMの推論過程において, 突然, 顕著な増加を示す。
次に、これらのシンキングトークンがLRMの推論性能に不可欠であるのに対して、他のトークンは最小限の影響しか与えないことを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:00:58 GMT)
From Real to Synthetic: Synthesizing Millions of Diversified and Complicated User Instructions with Attributed Grounding [33.0] 我々は、SynthQuestionsと呼ばれる100万の命令のデータセットを構築します。
トレーニングされたモデルが、いくつかの共通ベンチマークで主要なパフォーマンスを達成することを実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:00:47 GMT)
Normalize Filters! Classical Wisdom for Deep Vision [33.0] 本稿では,フィルタ正規化を提案し,次に学習可能なスケーリングとシフト,すなわちバッチ正規化を提案する。
提案手法は, 人工および自然強度変動ベンチマークにおいて, 大幅な改善を実現する。
解析の結果,非正規化フィルタは性能を低下させるが,フィルタ正規化は学習を正規化することがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:32:42 GMT)
A Few Moments Please: Scalable Graphon Learning via Moment Matching [32.7] 本稿では,モーメントマッチングによるグラフオンを直接復元する,スケーラブルなグラフオン推定器を提案する。
また、モーメントマイクアップ(MomentMixup)というデータ拡張技術を導入し、モーメント空間でミキサアップを行い、グラファイトベースの学習を強化する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:51:01 GMT)
GL-LowPopArt: A Nearly Instance-Wise Minimax-Optimal Estimator for Generalized Low-Rank Trace Regression [32.4] GL-LowPopArtは、一般化された低ランクトレース回帰のためのカソーニスタイルの新たな推定器である。
我々は、既存の保証を越えながら、最先端の予測誤差境界を確立する。
GL-LowPopArtに基づく探索-then-commitアルゴリズムの解析により,新たな,潜在的に興味深い問題依存量を明らかにした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:09:24 GMT)
EnergyMoGen: Compositional Human Motion Generation with Energy-Based Diffusion Model in Latent Space [31.9] 本稿では,エネルギーベースモデルの2つのスペクトルを含むEnergyMoGenを提案する。
クロスアテンションに基づくセマンティック・アウェア・エネルギーモデルを提案する。
この設計により、運動潜伏拡散モデルは高品質で複雑な運動を合成することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:54:19 GMT)
How Far Are We from Predicting Missing Modalities with Foundation Models? [31.9] 現在の基礎モデルは、(i)利用可能なモダリティからのきめ細かい意味的抽出と(ii)生成されたモダリティの堅牢な検証の2つの重要な側面で不足することが多い。
このフレームワークは、入力コンテキストに基づいてモダリティを考慮したマイニング戦略を動的に定式化し、よりリッチで差別的な意味的特徴の抽出を容易にする。
実験の結果,画像予測の欠落に対するFIDを少なくとも14%削減し,テキスト予測の欠落に対してMERを少なくとも10%削減した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:22:44 GMT)
PiKE: Adaptive Data Mixing for Large-Scale Multi-Task Learning Under Low Gradient Conflicts [31.6] 適応型データ混合アルゴリズムのPiKE(Positive gradient interaction-based K-task weights Estimator)を提案する。
PiKEは非衝突勾配相互作用を利用して、各ステップにおける平均損失減少量のほぼ8上界を最小化する。
理論的収束保証を提供し、PiKEが静的および非適応混合ベースラインより優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:16:01 GMT)
WikiGap: Promoting Epistemic Equity by Surfacing Knowledge Gaps Between English Wikipedia and other Language Editions [31.6] ウィキガップ(WikiGap)は、ウィキペディアの他のウィキペディアのインタフェースから得られる補完的な事実を抽出するシステムである。
具体的には、最近の多言語情報ギャップ発見法とユーザ中心の設計を組み合わせることで、WikiGapはフランス語、ロシア語、中国語のウィキペディアから補完的な情報にアクセスすることができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:04:56 GMT)
RadialRouter: Structured Representation for Efficient and Robust Large Language Models Routing [31.4] Radialは、大規模言語モデルのルーティングのための新しいフレームワークである。
RadialFormerという名前のラジアル構造を持つ軽量なTransformerベースのバックボーンを使用して、クエリとLLMの関係を明確にする。
バランシングとコストファーストのシナリオでは、既存のルーティングメソッドの9.2%と5.8%を大きく上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:16:41 GMT)
Retrieval-Augmented Generation as Noisy In-Context Learning: A Unified Theory and Risk Bounds [31.3] In-context linear regression における RAG に対する最初の有限サンプル一般化法を提案する。
我々のフレームワークは、検索したテキストを、クエリ依存のノイズのあるインコンテキストの例と見なしている。
解析の結果, ICLとは対照的にRAG上に本態性天井が存在することが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:06:43 GMT)
Rex-Thinker: Grounded Object Referring via Chain-of-Thought Reasoning [30.8] オブジェクト参照は、与えられた自然言語記述にマッチしたイメージ内のすべてのオブジェクトを検出することを目的としている。
我々は、頑健なオブジェクト参照モデルには基礎を置くべきだと論じ、その予測は視覚的内容に説明可能かつ忠実であるべきである。
本稿では、オブジェクトを明示的なCoT推論タスクとして参照するモデルであるRex-Thinkerを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:56:57 GMT)
Robust Neural Rendering in the Wild with Asymmetric Dual 3D Gaussian Splatting [30.6] 光源内画像からの3D再構成は、一貫性のない照明条件と過渡的注意散らしのため、依然として困難な課題である。
既存の手法は、しばしば安定的で一貫した再構築を行うのに苦労する低品質なトレーニングデータを扱うための戦略に依存している。
本稿では,これらのアーティファクトの収束性を利用した新しいフレームワークである非対称デュアル3DGSを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:40:33 GMT)
On the Robust Approximation of ASR Metrics [30.5] そこで本研究では,ASR性能指標の近似に新たなアプローチを提案し,真理ラベルの必要性を排除した。
提案手法は,音声および転写表現の統一空間におけるマルチモーダル埋め込みと,高品質なプロキシモデルを組み合わせることで,プロキシメトリクスの計算を行う。
実験結果から, 測定値の絶対差を1桁に近似し, 最新のベースラインを50%以上上回る結果を得た。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:29:37 GMT)
MemoryOut: Learning Principal Features via Multimodal Sparse Filtering Network for Semi-supervised Video Anomaly Detection [30.5] 再構成や予測に基づくビデオ異常検出(VAD)手法は2つの重要な課題に直面している。
強い一般化能力は、しばしば正確な再構築や異常事象の予測をもたらす。
低レベルの外観と動きの手がかりにのみ依存することは、複雑なシーンから異常な出来事における高レベルの意味を識別する能力を制限する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:36:25 GMT)
From Intention To Implementation: Automating Biomedical Research via LLMs [30.3] 本稿では,バイオメディカル研究プロセス全体を合理化するために設計された,初のエンドツーエンド自動システムであるBioResearcherを紹介する。
複雑なタスクを論理的に関連するサブタスクに分解することで、BioResearcherは多分野要求と論理複雑性の課題を効果的に解決する。
BioResearcherは8つの未測定研究目標に対して平均実行成功率63.07%を達成している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:48:06 GMT)
Vision Remember: Alleviating Visual Forgetting in Efficient MLLM with Vision Feature Resample [30.3] 冗長な視覚トークンは膨大な量の計算メモリとリソースを消費する。
本研究では,LLMデコーダ層間に挿入され,視覚トークンが視覚機能を再記憶できるようにするビジョンリマインダを提案する。
再サンプリングの過程では、各視覚トークンは視覚特徴の局所的な領域にのみ参加する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:22:35 GMT)
Learning equivariant models by discovering symmetries with learnable augmentations [30.3] SEMoLAは、学習可能なデータ拡張を通じて、データの事前未知の対称性を共同で発見するエンドツーエンドのアプローチである。
各種データセット間で高い予測精度を達成しつつ,SEMoLAが関連する対称性を頑健に発見できることを実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:06:05 GMT)
LEMoN: Label Error Detection using Multimodal Neighbors [30.3] 画像キャプチャデータセットのラベル誤りを識別する手法であるLEMoNを提案し,理論的に正当化し,実証的に検証する。
提案手法は, ラベル誤りを自動的に識別するために, 比較事前学習型マルチモーダルモデルの潜在空間における画像キャプチャペアのマルチモーダル近傍を利用する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:02:32 GMT)
LayerFlow: A Unified Model for Layer-aware Video Generation [30.3] レイヤごとのプロンプトが与えられると、LayerFlowは透明なフォアグラウンド、クリーンなバックグラウンド、ブレンドシーンのためのビデオを生成する。
また、ブレンドされたビデオを分解したり、フォアグラウンドの背景を生成するなど、多用途のバリエーションもサポートしている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:58 GMT)
Pushing Large Language Models to the 6G Edge: Vision, Challenges, and Opportunities [30.2] 大規模言語モデル(LLM)はAI開発に革命をもたらし、私たちの未来を形作る可能性がある。
1) 長時間の応答時間、2) 帯域幅のコスト、3) データプライバシの侵害。
6Gモバイルエッジコンピューティング(MEC)システムは、これらのプレス問題を解決できるかもしれない。
本稿は,6GエッジにおけるLCMのモチベーション,課題,経路を徹底的に特定するためのポジションペーパーとして機能する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:22:47 GMT)
Tripartite Weight-Space Ensemble for Few-Shot Class-Incremental Learning [30.1] FSCIL(Few-shot class incremental learning)は、いくつかのトレーニング例だけで、新しい概念の継続的な学習を可能にする。
最近の傾向は、モデルの分類ヘッドから表現の学習を解き放つのが典型的である。
破滅的な忘れと過度に適合する問題を効果的に解決する新しいFSCIL法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:41:42 GMT)
POSS: Position Specialist Generates Better Draft for Speculative Decoding [29.8] 投機的復号化はLarge Language Model (LLM)推論を加速させる。
近年の研究では、ターゲットモデルの隠れ状態を利用して、ドラフトモデル予測精度を向上させる。
割り当てられた位置でトークンを生成するために複数の位置特定されたドラフト層からなる位置スペシャリスト(PosS)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:30:30 GMT)
HUMOF: Human Motion Forecasting in Interactive Social Scenes [29.6] 複雑なシーンは、対話情報の豊富さによる人間の行動予測に重要な課題を示す。
対話型シーンにおける人間の動き予測に有効な手法を提案する。
提案手法は,4つの公開データセットにまたがる最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:21:54 GMT)
Improving Knowledge Distillation Under Unknown Covariate Shift Through Confidence-Guided Data Augmentation [29.6] 知識の蒸留は 基礎モデルから 小規模の学生ネットワークへ 知識を伝達するための 確立されたツールとなりました
この研究は、知識蒸留における共変量シフトの一般的な実践的問題に対処する。
本稿では,教師と生徒の意見の不一致を最大化して画像を生成する,拡散型データ拡張戦略を提案する。
実験の結果,CelebAとSpuCo Birdsでは,最悪のグループと平均グループ精度が有意に向上し,ImageNetでは刺激的なmAUCが得られた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:55:38 GMT)
ClozeMath: Improving Mathematical Reasoning in Language Models by Learning to Fill Equations [29.5] そこで我々はClozeMathという新しい手法を提案し,数学的推論のための大規模言語モデルを微調整する。
私たちのClozeMathは、人間の学習で使用されるクローズエクササイズに似た、与えられたソリューションからマスクされた方程式を予測するテキスト入力タスクを含んでいます。
GSM8K、MATH、GSM-Symbolicの実験では、CloseMathはパフォーマンスとロバスト性において強力なベースラインであるMasked Thoughtを上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:27:21 GMT)
Automatically Suggesting Diverse Example Sentences for L2 Japanese Learners Using Pre-Trained Language Models [29.4] 本研究では,L2日本語学習者を対象とした例文作成にPLM(Pre-trained Language Models)を用いることを検討した。
日本語,母語話者,GPT-4の学習者からなるラッカーのパネルを用いて,難易度,多様性,自然度などの複数の側面を考慮した文質の評価を行った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:13:05 GMT)
AI Agent Behavioral Science [29.3] 大規模言語モデルの最近の進歩により、AIシステムはますます人間らしく振る舞うことができる。
これらの振る舞いは、単にモデルの内部アーキテクチャの産物であるだけでなく、エージェントシステムへの統合から生まれます。
このシフトは、新しい科学レンズ、AI Agent Behavioral Scienceを求めている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:12:32 GMT)
Advancing Multimodal Reasoning: From Optimized Cold Start to Staged Reinforcement Learning [28.9] ReVisual-R1は、MathVerse、MathVision、WeMath、LogicVista、DynaMath、AIME2024、AIME2025といった挑戦的なベンチマークにおいて、オープンソースの7B MLLMの間で新しい最先端技術を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:51:08 GMT)
Language-Image Alignment with Fixed Text Encoders [28.9] 現在、言語と画像のアライメントを確立するための最も支配的なアプローチは、テキストと画像エンコーダを共同で事前訓練することである。
本研究では,事前学習した固定大言語モデル(LLM)が,視覚表現学習の指導に十分なテキストエンコーダを提供するかどうかを検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:51:56 GMT)
Enhancing Decision-Making of Large Language Models via Actor-Critic [28.9] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な進歩を遂げている。
既存の方法は、ロールアウトを正確にシミュレートし、結果を評価する際に、短期的な自己回帰的な行動生成か、制限に直面している。
本稿では,LLM をベースとした Actor-Critic フレームワーク LAC を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:58:27 GMT)
CARE: Assessing the Impact of Multilingual Human Preference Learning on Cultural Awareness [28.7] 我々は,3,490の文化的特異な質問と31.7kの回答を母国語で行う多言語リソースであるtextbfCAREを紹介した。
質の高いネイティブな嗜好の質が、様々なLMの文化意識をいかに向上させるかを示す。
分析の結果,初期の文化的パフォーマンスが向上したモデルの方がアライメントの恩恵を受けやすいことがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:22:27 GMT)
MINT: Multimodal Instruction Tuning with Multimodal Interaction Grouping [28.7] 我々は,マルチモーダルインタラクションのタイプに基づいた,シンプルながら驚くほど効果的なタスクグループ化戦略であるMINTを紹介する。
提案手法は,マルチモーダル命令チューニングにおいて,既存のタスクグループ化ベースラインを大幅に上回ることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:54:13 GMT)
Probing LLMs for Multilingual Discourse Generalization Through a Unified Label Set [28.6] 本研究では,大規模言語モデル (LLM) が言語やフレームワークにまたがって一般化する談話知識を捉えているかどうかを検討する。
テストベッドとして多言語対話関係分類を用いて, 様々なサイズと多言語機能を持つ23個のLLMの包括的集合について検討した。
以上の結果から,LLM,特に多言語学習コーパスでは,言語やフレームワーク間での会話情報を一般化することが可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:02:45 GMT)
Joint Beamforming and Resource Allocation for Delay Optimization in RIS-Assisted OFDM Systems: A DRL Approach [28.3] 本稿では、ダウンリンク再構成可能なインテリジェントサーフェス(RIS)アシスト直交周波数分割多重化(OFDM)システムにおける相設計と資源配分問題について検討する。
混合作用空間を扱い, 状態空間次元を低減するために, ハイブリッド深部強化学習(DRL)手法を提案する。
シミュレーションの結果、提案アルゴリズムは平均遅延を著しく低減し、資源配分効率を向上し、ベースライン法と比較してシステムロバスト性と公正性が優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:33:33 GMT)
POLARIS: A High-contrast Polarimetric Imaging Benchmark Dataset for Exoplanetary Disk Representation Learning [27.9] 人工知能(AI)は今後10年間で、地球に似た太陽系外惑星を画像化するための変革的なツールになるのだろうか?
我々は、このベンチマークを導入し、偏光画像表現学習の観点からこの問題を探求する。
これは、天体物理学や機械学習で稀な、一様に小さくて高品質な太陽系外惑星の画像データセットである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:55:02 GMT)
Faster Approx. Top-K: Harnessing the Full Power of Two Stages [27.8] 我々は、配列から最大値のK$要素を特定することを目的としたTop-$K$選択問題を考える。
我々は、Cloud TPUv5e上にアルゴリズムを実装し、元のアルゴリズムよりも桁違いのスピードアップを実現した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:04:09 GMT)
Algorithm- and Data-Dependent Generalization Bounds for Score-Based Generative Models [27.8] スコアベース生成モデル(SGM)は、生成モデルの最も一般的なクラスの一つである。
本稿では,SGMのためのアルゴリズムおよびデータ依存分析法を提案する。
特に、学習アルゴリズムのダイナミクスを説明し、SGMの振る舞いに関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:33:04 GMT)
Homogeneous Keys, Heterogeneous Values: Exploiting Local KV Cache Asymmetry for Long-Context LLMs [27.7] 我々は、KVキャッシュにおいて、基本的かつ以前見過ごされた非対称性を示す。
隣接するキーは類似の注意重み(局所的均一性)を受けるが、隣接する値は異なる異種分布を示す。
このキー値非対称性は、キーと値を一様に扱う既存の圧縮方法に限界があることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:10:44 GMT)
Language-Enhanced Representation Learning for Single-Cell Transcriptomics [27.3] 単細胞転写学における言語強化表現学習のための新しいフレームワークである scMMGPT を提案する。
scMMGPTは、ロバストな細胞表現抽出を採用し、定量的な遺伝子発現データを保存し、革新的な2段階事前学習戦略を導入する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:02:14 GMT)
Understanding Impact of Human Feedback via Influence Functions [27.3] Reinforcement Learning from Human Feedback (RLHF)では、人間のフィードバックから適切な報酬モデルを学ぶことが重要である。
人間のフィードバックは、特に複雑な反応を評価するとき、しばしばうるさい、一貫性がない、偏見がある。
本稿では,人間からのフィードバックが報酬モデルの性能に与える影響を測定するための計算効率の近似法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:00:11 GMT)
The Role of Visual Modality in Multimodal Mathematical Reasoning: Challenges and Insights [26.9] 既存のマルチモーダルな数学的モデルでは視覚情報を最小限に活用できることを示す。
これは、意図せずモデルに回答を誘導するテキスト情報と回答オプションの優位性に起因している。
先行モデルをテストする際、微妙な視覚的差異を検知できないことは、現在の視覚知覚能力の限界を示唆している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:28:26 GMT)
Prior Learning in Introspective VAEs [26.5] 変分オートエンコーダ(VAE)は教師なし学習とデータ生成のための一般的なフレームワークである。
本研究では,イントロスペクティブVAEファミリーの2人のうちの1人であるSoft-IntroVAE(S-IntroVAE)に焦点を当てた。
本稿では,このS-IntroVAEに,マルチモーダルでトレーニング可能なプリエンプティブを組み込むことの意味について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:35:03 GMT)
AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning [26.1] 強化学習(RL)は、大規模言語モデル(LLM)の訓練において支配的なパラダイムとなっている。
本稿では,完全非同期RLシステムであるAReaLについて述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:42:19 GMT)
ComRoPE: Scalable and Robust Rotary Position Embedding Parameterized by Trainable Commuting Angle Matrices [26.0] トレーニング可能な通勤角行列で定義することで回転位置PE(RoPE)を一般化するComRoPEを提案する。
我々は、RoPE方程式の十分な解として、トレーニング可能な通勤角行列を2種類提示する。
我々のフレームワークは,既存の RoPE の定式化を一般化し,将来的な位置符号化研究のための新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:10:02 GMT)
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks [26.0] 線形時間推論の複雑さと自然列長外挿能力を備えたxLSTMを用いたLRAM(Large Recurrent Action Model)を提案する。
6つのドメインから432のタスクを実験したところ、LRAMはパフォーマンスとスピードの点でTransformerと良好に比較できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:58:20 GMT)
MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization [25.9] 我々は,新しいマルチモーダル医療優先最適化手法MMedPOを提案する。
MMedPOは、Med-LVLMアライメントを高めるために、嗜好サンプルの臨床的関連性を考慮する。
実験の結果,MMedPOはMed-LVLMの精度を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:13:53 GMT)
Enhancing the Robustness of LLM-Generated Code: Empirical Study and Framework [25.8] RobGenは、モデルの再トレーニングを必要とせずに、コードの堅牢性を高めるように設計されたフレームワークである。
RobGenは、ロバストなモデル生成コードの比率を20.0%削減する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:08:57 GMT)
$μ$LO: Compute-Efficient Meta-Generalization of Learned Optimizers [25.7] 学習地平線(LO)は、ニューラルネットワークのウォールクロックトレーニング時間を著しく短縮することができる。
LOは、メタトレーニング中に見られるものよりも広いトレーニングネットワークにおいて、目に見えないタスク(メタ一般化)を最適化するのに苦労する。
我々は$mu$-パラメータ化LOに対する簡単なメタトレーニングレシピを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:04:04 GMT)
Gradient Inversion Attacks on Parameter-Efficient Fine-Tuning [25.4] フェデレートラーニング(FL)は、複数のデータ所有者が局所的な勾配を交換することで、機械学習モデルを協調的にトレーニングすることを可能にする。
近年,大規模事前学習モデルのパラメータ効率細調整(PEFT)がFLにおいて顕著に注目されている。
本研究では,ユーザの微調整データのプライバシを,事前訓練されたモデルとトレーニング可能なアダプタモジュールの悪意ある設計により妥協する方法について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:14:21 GMT)
PromptCanvas: Composable Prompting Workspaces Using Dynamic Widgets for Exploration and Iteration in Creative Writing [25.4] PromptCanvasは、無限のキャンバス上で構成可能なウィジェットベースのエクスペリエンスに、プロンプトを変換する概念である。
ユーザは、テキストのさまざまな面を表すインタラクティブなウィジェットを生成し、カスタマイズし、アレンジすることができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:13:51 GMT)
How PARTs assemble into wholes: Learning the relative composition of images [25.1] 空間認識型プレテキストタスクは、自己教師あり学習において活発に研究されている。
グリッドベースのアプローチは、現実世界のオブジェクト合成の流動性と連続した性質を捉えるには不十分である。
オフグリッドパッチ間の連続的な相対変換を活用する,自己教師型学習アプローチであるPartialを導入する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:12:18 GMT)
Struct2D: A Perception-Guided Framework for Spatial Reasoning in Large Multimodal Models [24.9] Struct2Dは、バードアイビュー(BEV)イメージとオブジェクトマークとオブジェクト中心のメタデータを組み合わせた知覚誘導プロンプトフレームワークである。
その結果,LMMは2次元入力を構造化した場合,驚くほど強い空間推論能力を示すことがわかった。
オープンソースのLMM(Qwen2.5VL)をStruct2D-Set上で微調整し、複数のベンチマークで競合性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:58:04 GMT)
Replay Can Provably Increase Forgetting [24.5] 継続的な学習にとって重要な課題は、新しいタスクが導入されるにつれて、以前に学習したタスクのパフォーマンスが低下する、忘れることである。
忘れることを減らすためによく使われる技法の1つ、サンプル再生は、忘れることを減らすために経験的に示されている。
ノイズのない設定であっても,リプレイサンプル数に関して,忘れることはモノトニックではないことを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:46:23 GMT)
GA-S$^3$: Comprehensive Social Network Simulation with Group Agents [24.4] 新たに設計されたグループエージェントを活用した総合ソーシャルネットワークシミュレーションシステム(GA-S3)を提案する。
個人を代表する他の知的エージェントとは異なり、私たちのグループエージェントは、同じような行動を示す個人のコレクションをモデル化します。
我々は、インターネットトラフィックの詳細な情報を含む2024年の人気のオンラインイベントから、ソーシャルネットワークのベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:27:05 GMT)
A Generative Adaptive Replay Continual Learning Model for Temporal Knowledge Graph Reasoning [24.4] 本稿では,歴史的実体分布表現を生成し,適応的に再生できるDeep Generative Adaptive Replay(DGAR)手法を提案する。
実験の結果, DGARは, 忘れの推論や緩和において, ベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:44:50 GMT)
MASTER: Enhancing Large Language Model via Multi-Agent Simulated Teaching [24.4] MASTERは、認知レベルが異なる複数のエージェント間の相互作用を通じて、元のデータを豊かにする新しいデータ拡張手法である。
私たちは、Orca-Math-200k、ProcQA、OpenHermes2.5といった既存のデータセットから強化された微調整データセットであるBOOST-QAを構築します。
実験により、BOOST-QAで微調整されたモデルは、複数のベンチマークで優れた性能を示し、強力なマルチタスクの一般化を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:34:54 GMT)
HtFLlib: A Comprehensive Heterogeneous Federated Learning Library and Benchmark [24.1] 従来のフェデレートラーニング(FL)は同種モデルのみをサポートする。
Heterogeneous Federated Learning (HtFL) 法は多種多様な異種モデル間の協調を可能にする。
異種連携学習ライブラリ(HtFLlib)について紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:44:00 GMT)
Vocabulary-free few-shot learning for Vision-Language Models [24.0] VLM(Vision-Language Models)のための語彙なし数ショット学習を導入する。
類似度マッピング(SiM)は、一連の一般的なプロンプトで類似度スコアのみに基づいてターゲットインスタンスを分類する。
我々は,この手法が,語彙のない数発学習における今後の研究の基盤となると信じている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:32:32 GMT)
Act-as-Pet: Benchmarking the Abilities of Large Language Models as E-Pets in Social Network Services [23.8] 本稿では,Large Language Models (LLM) を評価するベンチマークであるPet-Benchを紹介する。
Pet-Bench氏は、対話的なエンゲージメントとともに、自己進化と発達の振る舞いを強調し、ペットの仲間関係をよりリアルに反映している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:25:52 GMT)
CurvGAD: Leveraging Curvature for Enhanced Graph Anomaly Detection [23.6] 本稿では、曲率に基づく幾何学的異常の概念を導入する混合曲率グラフオートエンコーダであるCurvGADを提案する。
CurvGADは2つの並列パイプラインを導入し、異常解釈性を向上した。
10以上の実世界のデータセットの実験では、最先端のGADメソッドよりも最大6.5%改善されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:09:51 GMT)
RedRFT: A Light-Weight Benchmark for Reinforcement Fine-Tuning-Based Red Teaming [23.5] Reinforcement Fine-Tuning (RFT) は、既存のレッドチーム技術の中で有望な戦略として登場した。
統一ベンチマークの欠如は、現在のRFTベースのレッドチーム方式を妨げている。
RedRFT は RFT ベースの Red Teaming の実装と評価を簡素化し標準化するために設計された軽量ベンチマークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:50:24 GMT)
RETRO SYNFLOW: Discrete Flow Matching for Accurate and Diverse Single-Step Retrosynthesis [23.4] 単段階逆合成計画をモデル化し、離散フローマッチングフレームワークRETRO SynFLOW(RSF)を導入する。
我々は、シークエンシャルモンテカルロをベースとしたFeynman-Kacステアリングを用いて、推論時に有望な世代をステアリングする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:46:05 GMT)
InSerter: Speech Instruction Following with Unsupervised Interleaved Pre-training [23.3] 本稿では,Interleaved Speech-Text Representation Pre-trainingの略であるInSerterという,シンプルでスケーラブルなトレーニング手法を提案する。
InSerterは、大規模な教師なし音声テキストシーケンスを事前訓練するために設計されており、テキストから音声への変換を用いて、広範テキストコーパスのランダムに選択されたセグメントから音声を合成する。
提案したInSerterは、SpeechInstructBenchにおけるSOTA性能を実現し、多様な音声処理タスクにおいて、優れた、あるいは競争的な結果を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:53:07 GMT)
Autonomous Vehicle Lateral Control Using Deep Reinforcement Learning with MPC-PID Demonstration [23.2] コントローラーは自動運転パイプラインにおいて最も重要なモジュールの1つである。
本研究では, 測定誤差や簡易化による車両モデルの不完全性にもかかわらず, 強化学習に基づく横方向制御手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:05:06 GMT)
On Entity Identification in Language Models [23.0] 言語モデル(LM)の内部表現は、名前付きエンティティの言及を識別し、区別する。
まず、エンティティの言及の曖昧さと可変性という2つの問題を定式化します。
本稿では,クラスタリング品質指標に類似したフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:15:30 GMT)
The mutual exclusivity bias of bilingual visually grounded speech models [23.0] 相互排他性(英: Mutual exclusivity、ME)とは、新しい単語が慣れ親しんだものではなく、新しいものと関連づけられる戦略である。
近年の研究では、ペア画像を用いた英語音声で訓練された視覚的接地音声(VGS)モデルにおいて、MEバイアスが発見された。
我々は、英語、フランス語、オランダ語の組み合わせに基づいて訓練されたバイリンガルVGSモデルを用いて、このパターンを探索する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:59:22 GMT)
Children's Voice Privacy: First Steps And Emerging Challenges [22.9] 本研究は, 子どもの3つのデータセット, 6つの匿名化方法, 客観的および主観的ユーティリティメトリクスから構成する。
以上の結果から,成人向けシステムでは,子どもの音声のプライバシーを保護できるが,実用性低下に悩まされていることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:30:41 GMT)
Purifying Shampoo: Investigating Shampoo's Heuristics by Decomposing its Preconditioner [22.8] 計算コンテストにおけるShampooの最近の成功Perfは、ニューラルネットワークのトレーニングのためのKroneckerfactorizationベースの最適化アルゴリズムに新たな関心を喚起した。
我々は,Adamからのグラフトは,プレコンディショナーの固有値の安定化と誤算を直接緩和し,その固有値の修正によって学習速度のグラフトの必要性を排除できることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:55:41 GMT)
Trans-EnV: A Framework for Evaluating the Linguistic Robustness of LLMs Against English Varieties [22.8] 大規模言語モデル (LLM) は標準アメリカ英語 (SAE) に基づいて評価され、しばしばグローバルな英語品種の多様性を見落としている。
我々は,SAEデータセットを複数の英語変種に変換するフレームワークであるTrans-EnVを導入し,言語的堅牢性を評価する。
その結果,非標準品種の精度は46.3%まで低下した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:46:38 GMT)
Facial Appearance Capture at Home with Patch-Level Reflectance Prior [22.6] 既存の顔画像キャプチャーは、スマートフォンで録画されたビデオから可視的な顔の反射を再構築することができる。
しかし、レクリエーションの質は、スタジオ録音に基づくものよりもはるかに劣っている。
本論文は,スマートフォンと懐中電灯を同時に配置した,新しい日常利用ソリューションを開発することで,そのギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:21:07 GMT)
ClinBench-HPB: A Clinical Benchmark for Evaluating LLMs in Hepato-Pancreato-Biliary Diseases [22.5] 肝-膵・胆道疾患(HPB)は、その死亡率と死亡率が高いため、世界的な公衆衛生上の課題である。
大規模言語モデル(LLM)は、一般的な医学的質問応答タスクにおいて有望な性能を示しているが、現在の評価ベンチマークは主に標準化された試験や手作業による質問に由来する。
我々は,3,535件のクローズドエンド・マルチチョイス質問と337件のオープンエンド・リアル診断例からなるHPB病評価ベンチマークを系統的に評価した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:25:49 GMT)
Generative Emotion Cause Explanation in Multimodal Conversations [22.5] 本稿では,MECEC(Task-textbfMultimodal Emotion Cause Explanation in Conversation)を紹介する。
本課題は,会話のマルチモーダルな文脈に基づいて,感情を誘発する理由を明確かつ直感的に記述した要約を生成することを目的とする。
FAME-Netという新しいアプローチが提案され、ビデオの表情を通して、視覚データを解析し、感情を正確に解釈するLarge Language Models(LLMs)の力を利用する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:46:12 GMT)
An Expanded Massive Multilingual Dataset for High-Performance Language Technologies (HPLT) [22.4] 高品質な多言語単言語コーパスと並列コーパスのコレクションであるHPLT v2を提案する。
データのモノリンガル部分は193言語をカバーする8Tトークンを含み、並列データは51言語をカバーする380万の文ペアを含む。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:57:58 GMT)
Vulnerability-Aware Alignment: Mitigating Uneven Forgetting in Harmful Fine-Tuning [22.1] 脆弱性認識アライメント(Vulnerability-Aware Alignment)は、データの脆弱性を推定し、データを"脆弱性"と"脆弱性"のグループに分割し、バランスの取れた学習を促進する。
VAAは、ダウンストリームタスクのパフォーマンスを維持しながら有害なスコアを著しく低減し、最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:33:36 GMT)
MMR-V: What's Left Unsaid? A Benchmark for Multimodal Deep Reasoning in Videos [22.1] ビデオにおけるマルチモーダルディープ推論のためのベンチマークMMR-Vを提案する。
ベンチマークの特徴は以下のとおりである。
実験によると、現在のモデルはまだマルチモーダル推論に苦戦している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:33:41 GMT)
Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation [22.0] 本稿では,各レイヤの特徴マップにおけるドロップアウトによって引き起こされる情報損失を定量化することにより,推論中のドロップアウト率を動的に調整するアルゴリズムであるRate-Inを提案する。
特徴マップにおける機能的情報損失を定量化することにより、様々な医用画像タスクや建築構成の知覚品質を維持するために、ドロップアウト率を適応的に調整する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:01:01 GMT)
VCT: Training Consistency Models with Variational Noise Coupling [22.0] 変分一貫性トレーニング(VCT)は、様々な前方カーネルと互換性のあるフレキシブルで効果的なフレームワークである。
鍵となる革新は、変分オートエンコーダにインスパイアされた学習されたノイズデータ結合方式である。
CIFAR-10の非蒸留CT手法の中で,本手法はベースラインを超越し,最先端のFIDを実現し,ImageNet 64 x 64のSoTA性能を2段階のサンプリングステップで比較した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:31:12 GMT)
T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive Concepts [21.9] T2I-FactualBench - 知識集約型概念生成の事実性を評価するために設計された概念とプロンプトの数で、これまでで最大のベンチマークである。
T2I-FactualBenchは、個々の知識概念の基本記憶から、複数の知識概念のより複雑な構成まで、三段階の知識集約型テキスト・画像生成フレームワークで構成されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:29:18 GMT)
Soft Reasoning: Navigating Solution Spaces in Large Language Models through Controlled Embedding Exploration [21.8] 大きな言語モデル(LLM)は、多様性と非効率的な探索のために複雑な推論に苦しむ。
我々は,第1トークンの埋め込みを最適化して生成をガイドする埋め込み型検索フレームワークであるSoft Reasoningを提案する。
実験では、最小限の計算で優れた正確性を示し、スケーラブルでモデルに依存しないソリューションである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:11:18 GMT)
Bézier Splatting for Fast and Differentiable Vector Graphics Rendering [21.8] 微分ベクトルグラフィックス(VG)は画像ベクトル化やベクトル合成に広く用いられている。
この研究は、高速かつ高忠実なVG化を可能にするB'ezier Splattingと呼ばれる新しい微分可能なVG表現を導入している。
効率的なスプレイティングベースの差別化ツールのおかげで、B'ezier Splattingはフォワードおよび後方化ステップあたり30倍と150倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:09:54 GMT)
Generating Automotive Code: Large Language Models for Software Development and Verification in Safety-Critical Systems [21.6] このフレームワークは、C++などの言語でコード生成を自動化するために、LLM(Large Language Models)を使用している。
フィードバック駆動パイプラインは、安全基準に準拠したテスト、シミュレーション、検証の統合を保証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:01:59 GMT)
APT: Improving Specialist LLM Performance with Weakness Case Acquisition and Iterative Preference Training [21.6] 大規模言語モデル(LLM)は、ターゲットとするタスクに対処するためにドメイン固有の微調整を必要とすることが多い。
ドメイン固有の拡張と一般的なモデルユーティリティのバランスを維持することは重要な課題です。
本稿では,自己生成型非推奨弱みデータを用いてドメイン固有性能を向上させるために,APTという新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:46:38 GMT)
YOND: Practical Blind Raw Image Denoising Free from Camera-Specific Data Dependency [21.5] 本稿では,YONDという新しい視覚的生画像復号法について紹介する。
合成データのみに基づいて訓練されたYONDは、さまざまな未知のカメラが捉えたノイズの多い生画像に対して、堅牢に一般化することができる。
具体的には、YONDの実用性を保証するために、3つの重要なモジュールを提案する: 粗大なノイズ推定(CNE)、期待整合分散安定化変換(EM-VST)、SNR誘導デノイザ(SNR-Net)。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:40:48 GMT)
Through the Stealth Lens: Rethinking Attacks and Defenses in RAG [21.4] RevalVariRAGシステムは, 汚職率の低い場合でも, 有害な侵入に対して脆弱であることを示す。
我々は、低レートでも攻撃が信頼できるように設計されていないことを示し、検出と緩和を可能にしている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:15:09 GMT)
Continual Release Moment Estimation with Differential Privacy [21.3] JMEは、追加のプライバシーコストなしで第2モーメント推定を可能にするために、マトリックス機構とジョイント感度分析を使用する。
本稿では, ガウス密度推定のための平均値と共分散行列の推定と, CIFAR-10上でのDP-Adamを用いたモデルトレーニングの2つの応用におけるJMEの有効性を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:40:39 GMT)
Guided Speculative Inference for Efficient Test-Time Alignment of LLMs [21.3] Guided Speculative Inferenceは、大規模言語モデルにおける効率的な報酬誘導デコーディングのための新しいアルゴリズムである。
最適傾きポリシー $pi_beta,B(ymid x) propto pi_B(ymid x)exp(beta,r(x,y))$ of soft best-of-n$ をプライマリモデル $pi_B$ で確実に近似する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:12:26 GMT)
DRE: An Effective Dual-Refined Method for Integrating Small and Large Language Models in Open-Domain Dialogue Evaluation [21.2] 大きな言語モデル(LLM)は多くのタスクで優れていますが、複数の有効な応答が存在するあいまいなシナリオに苦労しています。
小型言語モデル (SLM) はそのようなシナリオにおいて堅牢性を示すが、誤解を招くことや敵対的な入力に影響を受けやすい。
本稿では,SLM と LLM を適応重み付けにより統合する SLIDE (Small and Large Integrated for Dialogue Evaluation) を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:41:31 GMT)
Neural Discovery in Mathematics: Do Machines Dream of Colored Planes? [21.0] ニューラルネットワークがHudwiger-Nelson問題のケーススタディを通じて数学的発見を促進する方法を実証する。
確率的, 微分可能な損失関数を持つ最適化タスクとして, この混合離散連続幾何着色問題を厳密な制約で再構成する。
これにより、許容可能な構成の勾配に基づく探索が可能となり、2つの新しい6色の発見につながった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:30:22 GMT)
SQLens: An End-to-End Framework for Error Detection and Correction in Text-to-SQL [20.9] テキスト・トゥ・ザ・ボックス・システムによって生成される大規模言語モデル(LLM)における意味的誤りの詳細な検出と修正のためのエンドツーエンドフレームワークを提案する。
提案手法は誤り検出のためのF1の25.78%の自己評価法よりも優れた性能を示し,アウト・オブ・ザ・ボックスシステムの実行精度を最大20%向上させる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:25:47 GMT)
Simulating fluid vortex interactions on a superconducting quantum processor [20.9] 渦相互作用は、生物系の大気乱流、プラズマ力学、集合乱流でよく見られる。
本稿では,量子コンピュータ上でのマルチ渦相互作用のシミュレーションを可能にするために,量子力学フレームワーク内でのナビエ-ストークス方程式の再構成を行う量子渦法を提案する。
単一量子ビットゲートでは99.97%、2量子ビットゲートでは99.76%のゲート密度を持つ量子プロセッサ上で、8つの量子ビットを用いた自然渦相互作用を再現した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:52:37 GMT)
Can Large Reasoning Models do Analogical Reasoning under Perceptual Uncertainty? [20.7] 我々はOpenAIのo3-miniとDeepSeek R1をアナログ推論で評価した。
我々は,I-RAVENデータセットとその拡張であるI-RAVEN-Xを用いてベンチマークを行った。
OpenAIのo3-miniタスクの精度は大幅に低下し、オリジナルのI-RAVENでは86.6%から17.0%に低下した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:18:40 GMT)
HintsOfTruth: A Multimodal Checkworthiness Detection Dataset with Real and Synthetic Claims [20.7] HintsOfTruthは,27Kの実世界と合成画像/蓄積ペアを用いたマルチモーダルチェックネス検出のための公開データセットである。
実データと合成データの混合により、このデータセットはユニークで、検出方法のベンチマークに最適である。
十分に構成された軽量テキストベースのエンコーダは、マルチモーダルモデルと互換性があるが、前者は、非定型的なコンテンツを特定することのみに焦点を当てている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:13:28 GMT)
Causal Explanations Over Time: Articulated Reasoning for Interactive Environments [20.6] 構造因果説明(Structure Causal Explanations, SCE)は、自然言語で説明を自動生成するために用いられる。
我々は、SCEを(再帰的な)説明木の定式化に一般化し、理由間の時間的相互作用を捉える。
合成時系列データと2Dグリッドゲームに対するより一般的なSCEアルゴリズムの利点を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:07:16 GMT)
RiOSWorld: Benchmarking the Risk of Multimodal Computer-Use Agents [20.5] 実世界のコンピュータ操作におけるMLLMエージェントの潜在的なリスクを評価するためのベンチマークである textbfRiOSWorld を紹介する。
私たちのベンチマークには、Web、ソーシャルメディア、マルチメディア、os、Eメール、オフィスソフトウェアを含む、さまざまなコンピュータアプリケーションにまたがる492の危険タスクが含まれています。
評価には,リスク目標意図とリスク目標達成の2つの視点から安全リスクを評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:23:57 GMT)
Seeing in the Dark: Benchmarking Egocentric 3D Vision with the Oxford Day-and-Night Dataset [20.5] オックスフォード・デイ・アンド・ナイト(Oxford Day-and-Night)は、新しいビュー合成(NVS)と、困難な照明条件下での視覚的再局在のための大規模でエゴセントリックなデータセットである。
NVSと再ローカライゼーションという2つのコアベンチマークをサポートし、現実的で多様な環境でモデルを評価するためのユニークなプラットフォームを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:02 GMT)
Fast Video Generation with Sliding Tile Attention [20.2] たった5秒の720P動画を撮ると、945秒の推測時間のうち800秒は注意がかかります。
本稿では,この課題に対処するためにスライディングタイルアテンション(STA)を導入する。
STAは、新しいハードウェア対応のスライディングウインドウデザインでタイル・バイ・タイルを動作させ、ハードウェア効率を保ちながら表現性を保っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:21:39 GMT)
Objective drives the consistency of representational similarity across datasets [20.0] 本稿では,モデル間の表現的類似度が,表現を構成するために使用される刺激の集合によってどのように変化するかを測定するための体系的手法を提案する。
自己教師付き視覚モデルは、相対的なペアの類似性が、あるデータセットから別のデータセットへより良く一般化する表現を学ぶ。
我々の研究は、データセット間のモデル表現の類似性を分析し、それらの類似性とタスクの振る舞いの違いを関連付けるためのフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:59:06 GMT)
Differentially Private Federated $k$-Means Clustering with Server-Side Data [20.0] acronymは$k$-meansクラスタリングのための新しいアルゴリズムであり、完全フェデレーションであり、微分プライベートである。
当社のアプローチでは,サーバ側データ(潜在的に小さく,配布外)を活用して,差分的プライベートクラスタリング手法の最大の課題を克服する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:53:25 GMT)
Solving Inverse Problems via Diffusion-Based Priors: An Approximation-Free Ensemble Sampling Approach [19.9] 現在のDMに基づく後方サンプリング法は、生成過程への近似に依存する。
近似を使わずに後続サンプリングを行うアンサンブルに基づくアルゴリズムを提案する。
本アルゴリズムは,DM法と連続モンテカルロ法を組み合わせた既存手法に動機づけられる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:09:25 GMT)
Attention-Only Transformers via Unrolled Subspace Denoising [19.8] 必要なコンポーネントのみを持つ完全に解釈可能なトランスフォーマーアーキテクチャを導出する。
このような反復的なdenoising操作をディープネットワークにアンロールすることで、我々は非常にコンパクトなアーキテクチャに到達します。
その単純さにもかかわらず、ビジョンと言語タスクの実験は、そのようなトランスフォーマーが標準的なトランスフォーマーアーキテクチャに近い性能を達成することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:53:14 GMT)
KOALA++: Efficient Kalman-Based Optimization of Neural Networks with Gradient-Covariance Products [19.8] KOALA++は、ニューラルネットワークトレーニングのためのスケーラブルなKalmanベースの最適化アルゴリズムである。
ニューラルネットワークトレーニングにおける構造的不確実性を明示的にモデル化する。
最先端の1次法よりも精度が高い。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:33:06 GMT)
macOSWorld: A Multilingual Interactive Benchmark for GUI Agents [19.7] 我々は、グラフィカルユーザインタフェース(GUI)エージェントを評価するための最初の包括的なベンチマークであるMultilingualWorldを紹介する。
タスク命令とOSインターフェースが5つの言語で提供されている。
プロプライエタリなコンピュータ利用エージェントは30%以上の成功率で、オープンソースの軽量な研究モデルは2%未満で遅れている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:26:56 GMT)
RedDebate: Safer Responses through Multi-Agent Red Teaming Debates [19.5] RedDebateは、自分たちの安全でない振る舞いを積極的に識別し緩和する、新しいマルチエージェントの議論フレームワークである。
代わりにRedDebateは協力的な意見の相違を受け入れ、複数の大規模言語モデルが互いの推論を批判的に検証できるようにする。
我々は、議論だけで安全でない振る舞いを17.7%削減でき、長期記憶モジュールと組み合わせると23.5%以上削減できることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:09:54 GMT)
Reasoning is All You Need for Video Generalization: A Counterfactual Benchmark with Sub-question Evaluation [19.5] マルチ次元マルチモーダルベンチマークであるtextbfunderline(textbfunderlineCounterfactual textbfunderlineEo textbfunderlineReasoning)を導入する。
複雑なクエリを構造化されたサブクエリに分解し、きめ細かい推論分析を可能にする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:57:18 GMT)
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems [19.4] Multi-Task Fusion (MTF) は、Multi-Task Learning (MTL) が出力する複数のスコアを最終スコアに組み合わせ、ユーザの満足度を最大化する。
近年,レコメンデーションセッションにおける長期ユーザ満足度を最適化するために,業界におけるMDFには強化学習(Reinforcement Learning, RL)が用いられている。
統合RL-MTFは、オフラインRLモデルとオンライン探索ポリシーを統合し、制約を緩和し、複雑な制約を緩和します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:19:53 GMT)
Enhanced and modulable induced superconducting gap and effective Landé g-factor in Pb-InSb hybrid devices [19.4] 鉛(Pb)をベースとしたハイブリッド量子デバイスは, 極めて大きく, 硬く近接的に誘導される超伝導ギャップを示す。
これらの結果はPb系ハイブリッドシステムの優れた機能を示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:27:57 GMT)
SAB3R: Semantic-Augmented Backbone in 3D Reconstruction [19.2] オープン語彙セグメンテーションと3次元再構成の目的を統一する新しいタスクであるMap and Locateを導入する。
具体的には、MapとLocateは、未提示のビデオからポイントクラウドを生成し、オープン語彙クエリに基づいてオブジェクトインスタンスをセグメント化する。
このタスクは、現実世界のAIアプリケーションへの重要なステップとして機能し、再構築、認識、再編成を橋渡しする実践的なタスクを導入します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:28:08 GMT)
Second Order Ensemble Langevin Method for Sampling and Inverse Problems [19.2] 本稿では,ランジュバン力学のアンサンブル近似に基づくサンプリング手法を提案する。
数値計算の結果は,逆問題における数値サンプリング器の基礎としての可能性を示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:24:45 GMT)
Web Execution Bundles: Reproducible, Accurate, and Archivable Web Measurements [19.2] WebRECは,現在の最先端の精度と比較したWeb測定ツールである。
我々はまた、幅広いWebサイト行動の正確かつ再現可能な測定のためのアーカイブフォーマットである.webを提示する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:03:51 GMT)
MAC-Gaze: Motion-Aware Continual Calibration for Mobile Gaze Tracking [19.1] モバイルの視線追跡は基本的な課題に直面している。
本稿では,スマートフォン慣性計測ユニット(IMU)センサと連続学習技術を活用した動き認識型連続学習手法MAC-Gazeを提案する。
本システムでは、事前学習した視線推定器と、IMUに基づく活動認識モデルと、クラスタリングに基づくハイブリッド意思決定機構を統合した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:27:16 GMT)
Reason from Future: Reverse Thought Chain Enhances LLM Reasoning [18.6] 我々はReason from Future(RFF)と呼ばれる新しい推論パラダイムを提案する。
RFFは、トップダウン計画とボトムアップ推論蓄積を組み合わせた双方向推論によって推論パスを生成する。
RFFは、複雑なタスクを解決するために、より正確で検索スペースの少ない従来のパラダイムよりも優れている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:03:17 GMT)
Verbosity-Aware Rationale Reduction: Effective Reduction of Redundant Rationale via Principled Criteria [18.6] 大規模言語モデル(LLM)は、最終回答の品質を高めるために、広範囲な中間推論単位(トークン、文など)を生成することに依存する。
トークンレベルの削減を明確な基準なしで適用する従来の手法は、完全に合理的に訓練されたモデルと比較して、性能が劣る。
本稿では,冗長な推論文を識別・除去するために,確率に基づく基準,冗長性を活用した文レベルの合理的化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:28:39 GMT)
Autonomous Collaborative Scheduling of Time-dependent UAVs, Workers and Vehicles for Crowdsensing in Disaster Response [18.4] 本稿では、異種多エージェントオンライン協調スケジューリングアルゴリズムHoAs-PALNについて検討する。
HoAs-PALNは、マッチングプロセスと局所ナッシュ平衡ゲームにおける適応次元の減少によって実現される。
ベースラインと比較して、HoAs-PALNはタスク完了率を64.12%、46.48%、16.55%、14.03%改善している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:58:05 GMT)
Refining Labeling Functions with Limited Labeled Data [18.4] プログラム弱監督(PWS)は、ラベルなしデータポイント上のユーザが提供するラベル付け関数(LF)の出力を組み合わせることで、ラベル付けに対する人間の労力を大幅に削減する。
ラベル付きサンプルの小さなセットに基づいてLFを固定する問題について検討する。
我々は,ラベル付き例で最小限の変更を行うことで,LFの集合を修復する新しい手法を開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:14:44 GMT)
Around the World in 24 Hours: Probing LLM Knowledge of Time and Place [18.2] 本稿では,言語モデルが時間と空間とともに共同で推論できる能力について,初めて評価する。
時間的および地理的知識の異なる組み合わせに対して、3つの異なるモデルファミリーの8つのオープンチャットモデルを評価する。
特定の地理的領域と性能の明確な相関関係は見つからない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:14:28 GMT)
TableEval: A Real-World Benchmark for Complex, Multilingual, and Multi-Structured Table Question Answering [18.2] 既存のTableQAベンチマークは、単純なフラットテーブルにフォーカスし、データ漏洩に悩まされることがしばしばある。
現実的なTableQAタスク上でLLMを評価するために設計された新しいベンチマークであるTableEvalを紹介する。
データ漏洩のリスクを最小限に抑えるため、最近の実世界の文書からすべてのデータを収集する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:39:01 GMT)
CETBench: A Novel Dataset constructed via Transformations over Programs for Benchmarking LLMs for Code-Equivalence Checking [18.0] CETBench - プログラムのリポジトリを通して構築された変換ベンチマークによるコード等価性を示す。
データセットの各インスタンスは、リポジトリにプログラムのペアを取り、ランダムに定義されたコード変換を適用して取得します。
解析の結果,基礎となるプログラムの組における非常に単純なコード変換がSOTA LLMの性能を著しく低下させる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:47:14 GMT)
VecTrans: Enhancing Compiler Auto-Vectorization through LLM-Assisted Code Transformations [18.0] VecTransは、コンパイラベースのコードベクトル化を強化するために、大きな言語モデルを活用するフレームワークである。
VecTransは1.77倍のGeomeanスピードアップを実現し、51のテストケースのうち24をベクトル化することに成功した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:49:21 GMT)
SCORE: Story Coherence and Retrieval Enhancement for AI Narratives [18.0] SCOREはストーリーコヒーレンスと検索の強化のためのフレームワークである。
主要なアイテムのステータスを追跡し、エピソードの要約を生成する。
TF-IDFとコサイン類似性を取り入れ、関連するエピソードを特定し、全体のストーリー構造を強化する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:35:28 GMT)
Theoretical Analysis of KL-regularized RLHF with Multiple Reference Models [17.9] 厳密な統計分析を含む包括的理論的枠組みを導入し,複雑さの保証を提供する。
我々は分析を拡張し、KL規則化されたRLHFを前進させ、サンプルの複雑性要求に対する新たな洞察を提供する。
この研究は、理論的に健全で、現代のAIエコシステムの課題により適したアライメントフレームワークを開発するための道を開いた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:43:34 GMT)
CogniPair: From LLM Chatbots to Conscious AI Agents -- GNWT-Based Multi-Agent Digital Twins for Social Pairing -- Dating & Hiring Applications [17.7] 現在の大規模言語モデル(LLM)エージェントには、真のデジタルツインやソーシャルAIアプリケーションに必要な、真の人間の心理的プロセスがない。
本稿では,人間の認知アーキテクチャの原理をLLMエージェントに統合したGNWT(Global Workspace Theory)の計算実装について述べる。
本研究では,対話的なシナリオ内での行動選択を通じて真の個性を評価する,冒険に基づく新しい個性テストを開発する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:54:30 GMT)
QQSUM: A Novel Task and Model of Quantitative Query-Focused Summarization for Review-based Product Question Answering [17.6] レビューベースのProduct Question Answering (PQA)は、Eコマースプラットフォームが顧客クエリに自動的に対応できるようにする。
既存のPQAシステムは、単一の視点でのみ回答を生成し、顧客の意見の多様性を捉えていない。
多様な顧客意見を代表的キーポイント(KP)にまとめることを目的とした,QQSUM(Quantical Query-Focused Summarization)を導入した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:50:32 GMT)
Expand and Compress: Exploring Tuning Principles for Continual Spatio-Temporal Graph Forecasting [17.5] 本稿では,新しいプロンプトチューニングに基づく連続予測手法を提案する。
具体的には,基本時相グラフニューラルネットワークと連続的なプロンプトプールをメモリに格納する。
この手法により、モデルが広範囲な時間的データストリームから逐次学習し、対応する期間のタスクを達成できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:08:57 GMT)
A Flag Decomposition for Hierarchical Datasets [17.4] フラッグ多様体は、置換空間のネスト配列を符号化し、様々なコンピュータビジョンや機械学習アプリケーションのための強力な構造として機能する。
ここでは、階層的なデータセットを分解し、処理するための一般的なアルゴリズムの必要性に対処する。
特に,任意の階層的実保存データをStiefel座標の階層値フラグ表現に分解するフラッグベースの新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:55:15 GMT)
Right Side Up? Disentangling Orientation Understanding in MLLMs with Fine-grained Multi-axis Perception Tasks [17.4] 本稿では,オブジェクト指向認識を主評価対象とするベンチマークであるDORI(Discriminative Orientation Reasoning Intelligence)を紹介する。
DORIは、正面アライメント、回転変換、相対方向関係、標準方向理解の4つの次元を評価する。
最先端の視覚言語モデル15について評価した結果,限界が明らかとなった。
DORIは、ロボット制御の改善、3Dシーン再構築、物理的環境における人間とAIの相互作用に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:28:29 GMT)
DynTok: Dynamic Compression of Visual Tokens for Efficient and Effective Video Understanding [17.3] 我々は,新しい textbfDynamic video textbfToken 圧縮戦略である DynTok を紹介する。
本手法は,トークンの数を,同等の性能を維持しつつ,元のサイズの44.4%に削減する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:17:42 GMT)
Skywork R1V2: Multimodal Hybrid Reinforcement Learning for Reasoning [17.2] 次世代マルチモーダル推論モデルであるSkywork R1V2を提案する。
コアとなるR1V2では、ハイブリッド強化学習パラダイムが導入されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:46:55 GMT)
SAVVY: Spatial Awareness via Audio-Visual LLMs through Seeing and Hearing [17.2] ダイナミック・オーディオ・視覚環境における3次元空間推論は人間の認知の基盤となる。
SAVVYは、動的シーンにおける3次元空間推論のための最初のベンチマークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:11:20 GMT)
Delta-KNN: Improving Demonstration Selection in In-Context Learning for Alzheimer's Disease Detection [17.2] アルツハイマー病(英語: Alzheimer's Disease、AD)は、認知症につながる進行性神経変性疾患であり、早期の介入は、疾患の異常を分析することで大きな恩恵を受ける。
本研究では,患者生成テキストからAD診断を行うための健康アシスタントとして,Large Language Models (LLMs) の可能性を検討する。
ICL性能を向上させる新しいデモ選択戦略であるDelta-KNNを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:14:07 GMT)
Towards Foundation Model on Temporal Knowledge Graph Reasoning [17.2] 時間的知識グラフ(TKG)は、時間的事実を4重形式(s, p, o, t)で格納する。
新しいモデルは、細粒度時間パターンを捉えるために正弦波位置符号化を用いる。
PostRAは、目に見えない時間的知識グラフに強いゼロショット性能を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:19:49 GMT)
GORACS: Group-level Optimal Transport-guided Coreset Selection for LLM-based Recommender Systems [17.1] 大規模言語モデル(LLM)はレコメンデーションシステムにおいて大きな可能性を示している。
GORACSは、LLMベースのレコメンデータシステムのためのグループレベルの最適tRAnsport誘導コアセット選択フレームワークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:46:18 GMT)
Sounding that Object: Interactive Object-Aware Image to Audio Generation [17.1] 対話型オブジェクト認識音声生成モデルを提案する。
本手法は,オブジェクト中心学習を条件付き潜在拡散モデルに統合する。
テスト時には画像セグメンテーションを用いて,エムオブジェクトレベルで対話的に音を生成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:26 GMT)
Unifying Uniform and Binary-coding Quantization for Accurate Compression of Large Language Models [17.1] 大規模言語モデル(LLM)の正確な量子化手法であるUniQuanF (UniQuanF with Flexible Mapping)を提案する。
UniQuanFは、UQのフレキシブルマッピング技術とBCQの非一様量子化レベルを統合することで、強い表現性と最適化性を利用する。
実験の結果、UniQuanFは既存のUQとBCQの手法より優れており、GSM8Kベンチマークで最大4.60%高い精度を達成している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:42:17 GMT)
Robust Preference Optimization via Dynamic Target Margins [17.0] $gamma$-POは動的ターゲットマージン優先最適化アルゴリズムである。
これは、好みのペア間の報酬マージンに依存するDPOの変種と互換性がある。
$gamma$-POは、他のベースラインよりも平均4.4%改善されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:19:37 GMT)
Tug-of-war between idiom's figurative and literal meanings in LLMs [17.0] 非構成的比喩的意味はしばしばイディオムの解釈から強く分かれる。
この双対性は、比喩的な意味でイディオムを解釈する2つの意味の表現と決定を学習するモデルを必要とする。
我々は、機械的解釈可能性のツールを用いて、大きな事前訓練された因果変換器がこの曖昧さにどう対処するかを追跡する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:05:01 GMT)
GlobalBuildingAtlas: An Open Global and Complete Dataset of Building Polygons, Heights and LoD1 3D Models [16.9] これは、高品質で一貫性があり、完全なビルディングデータをグローバルスケールで2Dおよび3D形式で提供する最初のオープンデータセットである。
GBA.Polygonは世界で275億以上の建物を抱えており、これまでに10億以上の建物で、最も包括的なデータベースを突破している。
高さの正確さ、包括的グローバルカバレッジ、そして豊富な空間的詳細により、GlobalBuildingAltasは、グローバルな建物の現状に関する新しい洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:59:32 GMT)
Multi-objective Aligned Bidword Generation Model for E-commerce Search Advertising [16.8] 検索システムは、ユーザクエリを最も関連性の高い広告とマッチングするという課題に対処する。
識別器,ジェネレータ,選好アライメントモジュールで構成される多目的整列バイドワード生成モデル(MoBGM)を提案する。
提案アルゴリズムは,オフラインおよびオンライン実験において,技術の現状を著しく上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:57:18 GMT)
EmoArt: A Multidimensional Dataset for Emotion-Aware Artistic Generation [16.8] EmoArtデータセットは、これまでで最も包括的な感情アノテートされたアートデータセットの1つです。
56の絵画様式で132,664点のアートワークがあり、豊かな様式と文化的多様性を提供している。
EmoArtを用いて、テキストから感情的に整列した画像を生成するために、人気のあるテキスト・画像拡散モデルを評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:43:51 GMT)
FlexTok: Resampling Images into 1D Token Sequences of Flexible Length [16.8] 可変長の1Dトークンシーケンスに2D画像を投影するトークンライザであるFlexTokを紹介する。
簡単なGPT型変換器を用いて, 自己回帰生成設定によるアプローチの評価を行った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:56:23 GMT)
SkipGPT: Dynamic Layer Pruning Reinvented with Token Awareness and Module Decoupling [16.7] 我々は,大規模言語モデルを最適化する動的層プルーニングフレームワークであるSkipGPTを紹介する。
また,SkipGPTはモデルパラメータの40%以上を削減できることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:26:31 GMT)
Training Cross-Morphology Embodied AI Agents: From Practical Challenges to Theoretical Foundations [16.7] この記事では、現実のエンジニアリング障壁を克服するために理論的洞察が不可欠であることを示す。
PSPACE完全である構造化部分可観測マルコフ決定プロセス(POMDP)に還元されることを証明した。
また,生物システムにインスパイアされた分散学習手法である集合適応についても検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:44:49 GMT)
DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes [16.7] DualMapは、ロボットが動的に変化する環境を理解し、ナビゲートできるオンラインのオープン語彙マッピングシステムである。
提案するハイブリッドセグメンテーションとオブジェクトレベルのステータスチェックにより,従来の手法が必要とする3Dオブジェクトのマージが不要になる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:05:36 GMT)
An AI-Based Public Health Data Monitoring System [16.5] 本稿では,新たなAI異常検出手法を活用するランキングベースの監視パラダイムを提案する。
結果として得られたシステムは、最大5000,000のデータポイントを毎日監視するために、全国的な組織に展開されている。
この研究は、公衆衛生の意思決定を変革する人間中心のAIの可能性を強調している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:25:27 GMT)
Seeing What Tastes Good: Revisiting Multimodal Distributional Semantics in the Billion Parameter Era [16.5] 大量のデータに基づいて訓練された大規模モデルは,具体的な対象概念のセマンティックな特徴ノルムをいかによく表すかを検討する。
画像データだけで訓練された画像エンコーダと、マルチモーダルで訓練された画像エンコーダと言語のみのモデルを評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:18:35 GMT)
LLMs Think, But Not In Your Flow: Reasoning-Level Personalization for Black-Box Large Language Models [16.4] 大規模言語モデルの推論レベルパーソナライズのためのフレームワークであるRPMを提案する。
RPMはモデルの推論プロセスとユーザのパーソナライズされたロジックを一致させる。
RPMは応答レベルのパーソナライズ方法よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:03:01 GMT)
Bridging the Performance Gap Between Target-Free and Target-Based Reinforcement Learning With Iterated Q-Learning [16.4] 価値に基づく強化学習では、目標ネットワークの除去が誘惑され、最新推定値から目標を引き上げる。
我々は,オンラインネットワークの最後の線形層のコピーをターゲットネットワークとして使用し,残りのパラメータを最新のオンラインネットワークと共有することを提案する。
これにより,連続したベルマン反復を並列に学習する,反復型Q-ラーニングの概念を活用できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:27:29 GMT)
KG-BiLM: Knowledge Graph Embedding via Bidirectional Language Models [16.2] KG-BiLMは、KGの構造的手がかりを生成変換器の意味表現性と融合させる双方向のLMフレームワークである。
KG-BiLMには3つの重要な要素がある: (i) 双方向知識注意; すべてのトークンとエンティティ間の完全な相互作用を可能にするために因果マスクを除去する; (ii) 局所的な意味的コンテキストとグローバルなグラフ接続の両方を活用することを奨励するナレッジ・マスク予測; (iii) コントラストグラフセマンティック・アグリゲーション — サンプル化されたサブグラフ表現のコントラストアライメントを通じてKG構造を保存する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:47:24 GMT)
Orak: A Foundational Benchmark for Training and Evaluating LLM Agents on Diverse Video Games [16.2] textbfbenchnameは,多種多様な現実世界のビデオゲームを対象とした大規模言語モデル(LLM)エージェントの訓練と評価を目的としたベンチマークである。
LLMの一貫した評価を支援するために,モデルコンテキストプロトコル(MCP)に基づくプラグアンドプレイインタフェースを導入する。
Orakは総合的な評価フレームワークを提供しており、一般的なゲームスコアのリーダーボード、LLMバトルアリーナ、視覚入力状態、エージェント戦略、微調整効果の詳細な分析を含んでいる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:40:33 GMT)
CyclicReflex: Improving Large Reasoning Models via Cyclical Reflection Token Scheduling [16.2] 大規模推論モデル(LRM)は、複雑な問題解決のための多段階推論を実行するためにテスト時間スケーリングを利用する。
我々は、リフレクショントークンを「リソース」として扱い、リソース割り当ての問題を導入する。
本稿では,リフレクショントークンのロジットを動的に変調するデコード戦略である循環反射トークンスケジューリング(CyclicReflex)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:43:38 GMT)
Magic Mushroom: A Customizable Benchmark for Fine-grained Analysis of Retrieval Noise Erosion in RAG Systems [16.1] 既存のベンチマークでは、現実世界の検索環境で発生する複雑で異質なノイズ分布をエミュレートすることができない。
Magic Mushroomは"マジックキノコ"ノイズを再現するベンチマークである。
Magic Mushroomは、ノイズキャンバスRAGシステムの評価と進展のための有望なツールとして登場した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:55:59 GMT)
Subspace Optimization for Large Language Models with Convergence Guarantees [16.0] GaLore は最適解に必ずしも収束しないことを示す。
GoLoreは、標準的なバッチサイズでも収束する、GaLoreの新しい変種である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:11:50 GMT)
Superconducting antiqubits achieve optimal phase estimation via unitary inversion [15.9] ポジトロン(positron)は、時間を通して後ろに移動する電子と等価である。
我々は、特定の共振駆動と非共振駆動を対象とするポジトロンを模擬する。
古クビットの有効ジャイロ磁気比は、クビットの負の値と等しい。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:01 GMT)
Simulation of open quantum systems on universal quantum computers [15.9] 量子コンピュータを用いてオープンな量子システムをシミュレートする,革新的でスケーラブルな手法を提案する。
共役密度行列を真の密度行列と定義し、混合ユニタリ量子チャネルに還元する。
定常状態や熱平衡のような長期特性は、随伴密度行列としても研究できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:30:00 GMT)
A Dataset for Addressing Patient's Information Needs related to Clinical Course of Hospitalization [15.8] ArchEHR-QAは、集中治療室と救急部門の設定から現実の患者をベースとした、専門家による注釈付きデータセットである。
症例は、公衆衛生フォーラムへの患者による質問、臨床医が解釈した質問、関連する臨床ノートの抜粋、および臨床医が認可した回答である。
答えファーストのプロンプトアプローチは一貫して最善を尽くし、ラマ4は最高得点を獲得した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:55:08 GMT)
Automatic Multi-level Feature Tree Construction for Domain-Specific Reusable Artifacts Management [15.8] 本稿では,FTBuilDERという自動多層特徴木構築フレームワークを提案する。
自動的にドメイン固有のソフトウェアリポジトリをクロールし、メタデータをマージして構造化されたアーティファクトライブラリを構築する。
これにより、アーティファクトの選択に26%の時間を節約でき、GPT-4でアーティファクトレコメンデーションの精度を235%向上できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:33:53 GMT)
Scaling Transformers for Discriminative Recommendation via Generative Pretraining [15.8] オーバーフィット問題に対処するため,GPSD (textbfGenerative textbfPretraining for textbfScalable textbfDiscriminative Recommendation) というフレームワークを提案する。
産業規模のデータセットと一般公開データセットの両方で実施された大規模な実験は、GPSDの優れた性能を示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:31:33 GMT)
Unveiling and Eliminating the Shortcut Learning for Locate-Then-Edit Knowledge Editing via Both Subject and Relation Awareness [15.8] 知識編集は、大きな言語モデルによって予測される目標知識を交換することを目的としている。
本稿では,対象特徴と関係特徴の学習のバランスをとる2段階最適化プロセスを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:06:46 GMT)
Maximizing Seaweed Growth on Autonomous Farms: A Dynamic Programming Approach for Underactuated Systems Navigating on Uncertain Ocean Currents [15.7] 海藻のバイオマスは、気候変動を緩和する大きな機会を提供するが、その可能性を実現するには、広大な開海に農業を拡大する必要がある。
本研究では,海流を利用して海藻の成長を最大化する,低消費電力の自律型海藻農場と設計コントローラに焦点を当てる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:05:09 GMT)
Graph Neural Networks for Resource Allocation in Multi-Channel Wireless Networks [15.7] マルチチャネル無線ネットワークにおけるJCPA問題を解決するために,拡張WMMSEアルゴリズムを提案する。
次に、各ユーザに対して同時マルチチャネルアロケーションを可能にするグラフニューラルネットワークベースのソリューションであるJCPGNN-Mを紹介する。
JCPGNN-M は eWMMSE と比較してデータレートが良いことを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:34:05 GMT)
Scaling CrossQ with Weight Normalization [15.6] CrossQは,更新データ(UTD)比が1。
より高度なUTDによって強調されるトレーニングダイナミクスの課題を特定する。
本稿では,学習を安定させ,可塑性の潜在的な損失を防止し,効果的な学習率を一定に保つソリューションを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:24:17 GMT)
Neural Honeytrace: A Robust Plug-and-Play Watermarking Framework against Model Extraction Attacks [15.6] Neural Honeytraceは、モデル抽出攻撃に対する堅牢なプラグアンドプレイ透かしフレームワークである。
4つのデータセットの実験により、Neural Honeytraceは従来の手法よりも効率が良く、適応攻撃に抵抗することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:14:47 GMT)
ReactDiff: Latent Diffusion for Facial Reaction Generation [15.5] 話者の音声・視覚的クリップを考えると、顔反応生成はリスナーの顔反応を予測することを目的としている。
本稿では,多モード変換器と条件拡散を統合した顔反応拡散(ReactDiff)フレームワークを提案する。
実験の結果、ReactDiffは既存のアプローチよりも大幅に優れており、顔反応の相関は0.26、多様性のスコアは0.094である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:30:30 GMT)
Implicit Inversion turns CLIP into a Decoder [15.4] 画像合成はCLIPだけで可能であり、デコーダ、トレーニング、微調整は不要である。
提案手法は,ネットワーク層間を階層化することで,粗大から粗大な生成を促進する,周波数認識型暗黙的ニューラル表現を最適化する。
CLIPの重みを変更することなく、このフレームワークはテキスト・ツー・イメージ生成、スタイル転送、イメージ再構成などの機能をアンロックする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:30:14 GMT)
Enabling LLM Knowledge Analysis via Extensive Materialization [15.3] GPTKBは、GPT-4o-miniという290万以上のエンティティに対して101万トリプルの知識ベースである。
我々は、GPTKBを用いて、GPT-4o-miniの事実知識を、スケール、精度、バイアス、一貫性の観点から内部的に分析する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:58:03 GMT)
It Takes a Good Model to Train a Good Model: Generalized Gaussian Priors for Optimized LLMs [15.3] 大規模言語モデルのトレーニング時間圧縮アルゴリズムであるBackSlashを導入する。
GGモデルに基づくLLM最適化のための統一エンドツーエンドフレームワークを提案する。
私たちの貢献は3倍です。
DeepShapeは、トレーニング後の正規化手法で、体重分布をGGプロファイルにマッチさせる。
RF8は、GG-distributed-priord BackSlashトレーニング用に設計された、コンパクトでハードウェア効率の良い8ビット浮動小数点演算フォーマットである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:00:08 GMT)
Diffusing DeBias: Synthetic Bias Amplification for Model Debiasing [15.2] Diffusing DeBias (DDB) を、教師なしモデルデバイアスの一般的な方法のためのプラグインとして導入する。
具体的には、条件付き拡散モデルを用いて、合成バイアス整合画像を生成する。
補助モデル学習におけるバイアス分散トレーニングサンプルの根本的な問題に対処することにより、提案手法は複数のベンチマークデータセットで最先端のモデルに勝る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:34:19 GMT)
X-Factor: Quality Is a Dataset-Intrinsic Property [15.2] モデルアーキテクチャ、データセットサイズ、クラスバランスの3つの要因がテスト時のパフォーマンスに影響を与えることが示されているが、完全には説明できない。
データセットの品質は、データセットの構成クラスの品質という、より基本的なものの創発的な特性であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:02:34 GMT)
FreePRM: Training Process Reward Models Without Ground Truth Process Labels [15.2] FreePRMは、地味なステップレベルラベルにアクセスせずにPRMをトレーニングするための弱い教師付きフレームワークである。
実験の結果、FreePRMはProcessBenchで平均F1スコアを53.0%達成し、Math-Shepherdでトレーニングされた完全教師付きPRMを+24.1%上回った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:33:53 GMT)
SplArt: Articulation Estimation and Part-Level Reconstruction with 3D Gaussian Splatting [15.1] SplArtは,2組のRGB画像から調音対象を再構成し,キネマティクスを推定する,自己教師型カテゴリー認識フレームワークである。
SplArtは幾何学的自己スーパービジョンを利用して、3Dアノテーションやカテゴリ固有の事前処理を必要とせずに、困難なシナリオに効果的に対処する。
確立された、新しく提案されたベンチマークの評価と、ハンドヘルドのRGBカメラを用いた実世界のシナリオへの応用は、SplArtの最先端のパフォーマンスと実世界の実用性を実証している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:53:16 GMT)
UniWorld: High-Resolution Semantic Encoders for Unified Visual Understanding and Generation [15.0] GPT-4o画像モデルでは、包括的イメージ認識と操作の高度な機能を示す。
強力な言語モデルから抽出された意味的特徴に基づいて構築された統合生成フレームワークUniWorldを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:45:58 GMT)
Average Calibration Losses for Reliable Uncertainty in Medical Image Segmentation [14.9] 医用画像セグメンテーションのためのディープニューラルネットワークは、しばしば過信され、信頼性と臨床的有用性の両方を損なう。
画像毎に計算可能な補助的損失として,L1平均誤差(mL1-ACE)の微分可能な定式化を提案する。
ソフトボンドの変種は、Diceとクロスエントロピー損失ベースラインよりもキャリブレーションの最大の改善をもたらすが、しばしばセグメンテーション性能を損なう。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:32:07 GMT)
On Support Samples of Next Word Prediction [14.9] 本稿では,言語モデルにおけるデータ中心の解釈可能性について検討する。
代表者定理を用いて、特定の予測を促進または抑止する2種類の補足サンプルを同定する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:13:22 GMT)
Multiple Stochastic Prompt Tuning for Practical Cross-Domain Few Shot Learning [14.9] 本稿では、CLIPのような大規模事前学習モデルを簡単にターゲットデータセットにデプロイできるクロスドメイン・数ショット学習タスクを提案する。
ゴールは、クラスごとにラベル付けされたサンプルだけを利用することで、極端なドメインシフトの下で、すべての見えないクラスを同時に分類することである。
本稿では,MIST(MultIple STochastic Prompt tuning)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:18:04 GMT)
Poisoning Behavioral-based Worker Selection in Mobile Crowdsensing using Generative Adversarial Networks [14.7] 本研究は,移動群集センシング(MCS)における行動ベース選択モデルを対象とした敵攻撃を提案する。
提案攻撃では、GAN(Generative Adrial Networks)を利用して、トレーニング段階でモデルが誤認される可能性のある毒点を生成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:48:51 GMT)
What Makes Treatment Effects Identifiable? Characterizations and Estimators Beyond Unconfoundedness [14.7] 平均治療効果の同定を可能にする一般的な条件について検討する。
ATEの同定に十分かつほぼ必要な解釈可能な条件を提供する。
ATEは、事前の作業がキャプチャできないようなレギュレーションで識別可能であることを証明します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:40:55 GMT)
KAN-HyperpointNet for Point Cloud Sequence-Based 3D Human Action Recognition [14.7] D-Hyperpointは、a-Hyperpointdingモジュールによって生成される新しいデータ型である。
D-Hyperpointは、局所運動とグローバル静置姿勢の両方をカプセル化し、各瞬間における単位人の行動を効果的に要約する。
また、D-Hyperpointsのネストしたグループ化に応用して情報識別を学習するD-Hyperpoint KanMixerモジュールを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:03:14 GMT)
Rubrik's Cube: Testing a New Rubric for Evaluating Explanations on the CUBE dataset [14.6] 本稿では、RubrikのCUBEについて紹介する。教育にインスパイアされたルーリックで、26k説明のデータセットで、後に品質アノテートを行う。
Rubrikを用いることで、説明はタスクと知覚の難しさの両方に影響されていることがわかった。
低品質は、主に結束や単語選択よりも、LCMが生成した説明の簡潔さの欠如に起因する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:23:54 GMT)
CheckEmbed: Effective Verification of LLM Solutions to Open-Ended Tasks [14.6] CheckEmbed (CE)は、大規模言語モデル(LLM)の単純でスケーラブルで正確な検証方法である。
CEは、全問合せレベルで、高速でセマンティックにリッチな比較を行い、精度とスケーラビリティの両方において重要な制限を克服します。
実験の結果,CEは閉じたタスクとオープンエンドタスクの両方の幻覚を確実に検出することがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:57:00 GMT)
SourceDetMamba: A Graph-aware State Space Model for Source Detection in Sequential Hypergraphs [14.5] グラフのソース検出は、噂の出所を特定する上で高い有効性を示している。
機械学習ベースの手法の進歩にもかかわらず、多くの人は噂の伝播の本質的なダイナミクスを捉えられなかった。
SourceDetMamba: 逐次ハイパーグラフにおけるソース検出のためのグラフ対応状態空間モデルを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:57:51 GMT)
HyperDet: Source Detection in Hypergraphs via Interactive Relationship Construction and Feature-rich Attention Fusion [14.5] ハイパーグラフはソーシャルネットワークに優れたモデリング機能を提供する。
本稿では,対話型関係構築と特徴豊富な注意融合によるハイパーグラフ(HyperDet)のソース検出手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:44:45 GMT)
FlexiReg: Flexible Urban Region Representation Learning [14.3] 本稿では,都市域の形成と入力領域の特徴の両方に柔軟に対応する都市域表現学習のためのモデルFlexiRegを提案する。
都市域表現を用いた4つの下流タスクの精度において,FlexiRegは最先端モデルよりも最大202%高い性能を示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:42:18 GMT)
PlückeRF: A Line-based 3D Representation for Few-view Reconstruction [14.3] マルチビュー情報をより効果的に活用する数ビュー再構成モデルを提案する。
提案手法では,入力ビューから3次元表現と画素線を接続するシンプルな機構を導入する。
等価な三面体表現による再構成品質の向上を実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:45:48 GMT)
AD-EE: Early Exiting for Fast and Reliable Vision-Language Models in Autonomous Driving [14.3] VLM(Vision-Language Models)のリアルタイム適用は、高いレイテンシと計算オーバーヘッドによって妨げられる。
本稿では,自律運転の領域特性を取り入れた早期排他フレームワークAD-EEを提案する。
提案手法は遅延を著しく低減し,最大で57.58%まで向上し,オブジェクト検出精度を最大で44%向上した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:25:40 GMT)
Understanding the Training Speedup from Sampling with Approximate Losses [14.2] 本研究は, 正確な損失ではなく, 大規模なテクスタイトアポキシメート損失を有する試料を選択するという欲求的なアプローチに焦点をあてる。
滑らかな凸損失に対して、そのような欲求戦略は、より少ないイテレーションで平均損失の最小値の定数係数に収束できることを示す。
次に,早期退避を利用してサンプル選択のための中間層表現を用いて近似損失を求めるSIFTを開発する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:06:13 GMT)
Sleepless Nights, Sugary Days: Creating Synthetic Users with Health Conditions for Realistic Coaching Agent Interactions [14.1] 対話型エージェント評価のための合成ユーザ生成のためのエンドツーエンドフレームワークを提案する。
人工的な使用者は、健康状態やライフスタイル、特に睡眠と糖尿病の管理に基礎を置いている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:50:52 GMT)
DrSR: LLM based Scientific Equation Discovery with Dual Reasoning from Data and Experience [14.1] DrSRは、データ駆動の洞察と反射学習を組み合わせて、堅牢性と発見能力の両方を強化するフレームワークである。
物理学、化学、生物学、材料科学における学際的なデータセットにわたる実験は、DrSRが有効な方程式率を大幅に改善することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:52:34 GMT)
Optimistic critics can empower small actors [14.1] 非対称なセットアップの利点、特により小さいアクターの使用について論じる。
一般的に、より小さなアクターはパフォーマンスの劣化と批評家の過度な適合をもたらす。
分析の結果,この行動の主な原因の一つとして,価値過小評価によるデータ収集が不十分であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:56:22 GMT)
AhaKV: Adaptive Holistic Attention-Driven KV Cache Eviction for Efficient Inference of Large Language Models [14.0] 我々は,蓄積した注目スコアのバイアスに対処するため,適応的全体的注意KV(Aha KV)を提案する。
Aha KVはバイアスを緩和し、グローバルな文脈で重要なトークンを保持します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:25:53 GMT)
The Gaussian Mixing Mechanism: Renyi Differential Privacy via Gaussian Sketches [14.0] 本稿では,Renyi Differential Privacy (RDP) のレンズを用いて,この操作を再考する。
この改良された解析が、異なる線形回帰設定における性能改善にどのように寄与するかを実証する。
経験的に、我々の手法は複数のデータセットのパフォーマンスを改善し、いくつかのケースではランタイムを削減します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:02:22 GMT)
T$^2$-RAGBench: Text-and-Table Benchmark for Evaluating Retrieval-Augmented Generation [14.0] 本稿では,現実の財務データ上でのRAG(Retrieval-Augmented Generation)手法の評価ベンチマークであるT$2$-RAGBenchを紹介する。
Oracleのコンテキスト設定の下で動作する一般的なQAデータセットとは異なり、T$2$-RAGBenchは正しいコンテキストを最初に取得するためにモデルに挑戦する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:50:55 GMT)
Prescribing the Right Remedy: Mitigating Hallucinations in Large Vision-Language Models via Targeted Instruction Tuning [13.8] そこで本研究では,異なるモデルの幻覚特異性に合わせたDFTGという命令データ生成フレームワークを提案する。
幻覚ベンチマークによる実験結果から,本手法で生成した目標命令データの方が,従来よりも幻覚の緩和に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:20:27 GMT)
STEER-BENCH: A Benchmark for Evaluating the Steerability of Large Language Models [13.8] Steer-Benchは、Redditのコミュニティと対比して、人口固有のステアリングを評価するためのベンチマークである。
19のドメインにまたがる30のサブレディットペアをカバーし、Steer-Benchには10,000以上の命令応答ペアと5500の多重選択質問が含まれている。
一部のモデルでは、人間レベルのアライメントが15パーセント以上遅れており、コミュニティに敏感なステアビリティにおいて大きなギャップが浮かび上がっている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:18:10 GMT)
Zero-Shot Temporal Interaction Localization for Egocentric Videos [13.7] EgoLocと呼ばれる新しいゼロショットTIL手法を提案する。
2Dと3Dの両方を吸収することにより、EgoLocはHOIの接触/分離タイムスタンプに関する高品質な初期推定を直接サンプリングする。
EgoLocは、最先端のベースラインに比べて、エゴセントリックなビデオの時間的相互作用のローカライゼーションが優れている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:52:46 GMT)
UniCUE: Unified Recognition and Generation Framework for Chinese Cued Speech Video-to-Speech Generation [13.7] Cued Speech (CS)は、手話による唇読取を強化し、難聴者に対する正確な音声認識支援を提供する。
音声合成タスクは、聴覚障害者のCS視覚表現(CSビデオ)を理解可能な音声信号に変換することを目的としている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:26:49 GMT)
FedFACT: A Provable Framework for Controllable Group-Fairness Calibration in Federated Learning [13.6] 我々はFedFACTという制御可能なグループフェアネス校正フレームワークを提案する。
FedFACTは、大域的および局所的公正性の制約の下でベイズ最適分類器を識別する。
複数のデータセットの実験では、FedFACTは精度とグローバルローカルフェアネスのバランスをとる上で、ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:39:57 GMT)
ADFormer: Aggregation Differential Transformer for Passenger Demand Forecasting [13.6] 本稿では,需要予測促進のための新たな洞察を提供する差分集約変換器(AD)を提案する。
空間的相関を利用して注意を喚起する一方で、空間と時間の性質に基づく集約戦略を設計する。
タクシーと自転車で行った実験は,本モデルの有効性と有効性を確認し,その実用的価値を実証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:56:08 GMT)
ROSA: Addressing text understanding challenges in photographs via ROtated SAmpling [13.5] 本稿では,誤り指向のテキストを含むテキストリッチな画像におけるVQA性能を向上させる復号戦略であるROtated SAmpling (ROSA)を紹介する。
ROSA はグレディ復号法を最高性能モデルで 11.7 の絶対点で上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:56:13 GMT)
A VLM-based Method for Visual Anomaly Detection in Robotic Scientific Laboratories [13.4] ロボット科学研究所では、潜在的な欠陥や偏差のタイムリーな識別と解決のために視覚異常検出が重要である。
本稿では,4つのプロンプト構成を通じて,異なるレベルの監督を支援するVLMに基づく視覚推論手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:57:30 GMT)
Leveraging Reward Models for Guiding Code Review Comment Generation [13.3] コードレビューは、コード品質の評価、潜在的な問題に対するフィードバックの提供、特定された問題に対処するためのコード修正を含む、現代のソフトウェア開発において重要なコンポーネントである。
ディープラーニングのテクニックは、人間のレビュアーが行うようなコードにコメントすることで、コードレビューのジェネレーティブな側面に取り組むことができる。
本稿では,報酬機構を備えた強化学習を活用することによって,レビューコメント生成を自動化するディープラーニングフレームワークであるCoRALを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:31:38 GMT)
Learning task-specific predictive models for scientific computing [13.3] 下流のタスクに後から使われる予測モデルについて検討する。
この設定は古典的な教師あり学習とは異なることを示す。
タスク固有の教師付き学習問題を解決するための反復アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:02:53 GMT)
Structured Pruning for Diverse Best-of-N Reasoning Optimization [13.3] 本研究では,推論時に最適な頭部と層を動的に選択するコントラスト学習フレームワークであるSPRINTを提案する。
質問の埋め込みとヘッドの埋め込みを合わせることで、SPRINTはより正確な推論をもたらす、刈り取られた頭の設定を識別する。
提案手法は,MATH500およびGSM8Kデータセットにおいて,従来のベスト・オブ・N$およびランダムな頭部選択戦略を著しく上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:08:44 GMT)
BPO: Revisiting Preference Modeling in Direct Preference Optimization [13.2] DPO (Direct Preference Optimization) は、Large Language Models (LLM) を人間の好みに合わせる一般的な手法として登場した。
DPOは、ペアのランク付け損失を通じて、選択された応答と拒否された応答の相対順序を効果的に保持する。
それはしばしば絶対的な報酬の程度を無視し、パフォーマンスを低下させる。
本稿では,選択された応答と拒否された応答の最適化のバランスをとる新しいフレームワークであるBa balanced Preference Optimization (BPO)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:21:01 GMT)
Knockout LLM Assessment: Using Large Language Models for Evaluations through Iterative Pairwise Comparisons [13.2] 大規模言語モデル(LLM)は、様々な領域にわたる効果的な評価指標であることが示されている。
Knockout Assessment, LLM-asa judge method using a knockout tournament system with iterationerative pairwise comparisons。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:46:43 GMT)
Think Like a Person Before Responding: A Multi-Faceted Evaluation of Persona-Guided LLMs for Countering Hate [13.2] GPT-4o-Mini、CohereのCommandR-7B、MetaのLLaMA 3.1-70Bを用いて、MT-ConanおよびHatEvalデータセット上の3つのプロンプト戦略を評価する。
LLMによるCNは,大学レベルのリテラシーを持つ人には冗長であり,アクセシビリティが制限されていることが判明した。
感情的に導かれるプロンプトは、より共感的で読みやすい反応をもたらすが、安全と効果に関する懸念は残る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:09:20 GMT)
Images are Worth Variable Length of Representations [13.1] ほとんどの視覚エンコーダは、画像を固定長のトークン列にマッピングし、異なる画像が様々な量の情報を含んでいるという事実を見渡す。
本稿では,動的視覚エンコーダであるDOVEを提案する。
その結果,DOVEは高い復元品質を維持しつつ,平均トークン数を大幅に削減できることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:40:33 GMT)
MCP-Zero: Proactive Toolchain Construction for LLM Agents from Scratch [13.0] MCP-Zeroは、LCM自身がいつ、どの外部ツールを取得すべきかを判断できるプロアクティブエージェントフレームワークである。
フレームワークは以下の3つのコンポーネントの上に構築されている。 (1) Proactive Tool Request、モデルが構造化された$leftnametool_assistantright>$ blockを出力し、所望のサーバとタスクを明確に指定する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:37:09 GMT)
Representations Shape Weak-to-Strong Generalization: Theoretical Insights and Empirical Predictions [13.0] W2SG(Wak-to-Strong Generalization)は、人間が将来超人的な知性をどう導くかを理解するための重要なアナロジーである。
We show that W2SG can be characterized using kernels from the principal component of weak and strong model' internal representations。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:08:20 GMT)
Survey of Active Learning Hyperparameters: Insights from a Large-Scale Experimental Grid [12.8] アクティブラーニング(Active Learning)は、専門家の注釈のために最も情報に富んだ未ラベルのサンプルを反復的に選択することで、人間のラベル付け作業を最小化する確立された手法である。
第一に、ALを設定する複雑さ、第二に、その有効性に対する信頼の欠如です。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:41:37 GMT)
Efficient Knowledge Editing via Minimal Precomputation [12.7] 本稿では, MEMITを用いた知識編集は, 当初規定されていた隠れベクトル数の0.3%以下で行うことができることを示す。
これにより、かなりの事前計算時間を節約でき、ユーザーは数分で新しいモデルを編集できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:05 GMT)
SUMO-MCP: Leveraging the Model Context Protocol for Autonomous Traffic Simulation and Optimization [12.6] 我々はSUMOのコアユーティリティを統一ツールスイートにラップする新しいプラットフォームであるSUMO-MCPを紹介する。
SUMO-MCPを使用すると、ユーザーはOpenStreetMapデータからトラフィックシナリオを生成するための単純な自然言語プロンプトを発行できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:08:11 GMT)
Knowledge-guided Contextual Gene Set Analysis Using Large Language Models [12.3] cGSAは、コンテキスト対応遺伝子セット分析のためのAI駆動のフレームワークである。
遺伝子クラスタの検出、濃縮分析、および大きな言語モデルを統合し、生物学的に意味のある経路を特定する。
19の疾患と10の生物学的メカニズムにまたがる手作業による102の遺伝子セットのベンチマークでは、cGSAがベースライン法を30%以上上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:56:57 GMT)
Matching Markets Meet LLMs: Algorithmic Reasoning with Ranked Preferences [12.3] 私たちは、リソース割り当てやライドシェアリングといったアプリケーションを支える中核的なフレームワークであるマッチング市場について研究しています。
我々は、嗜好に基づく推論タスクの階層構造に基づいて、いくつかの最先端モデルを評価する。
驚くべきことに、先進的な推論を持つトップパフォーマンスモデルでさえ、大きな市場の不安定性を解決するのに苦労している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:51:15 GMT)
EPIC: Graph Augmentation with Edit Path Interpolation via Learnable Cost [12.2] 本稿では,グラフデータセットを新たに拡張するEPIC (Edit Path Interpolation via learnable Cost)を提案する。
不規則な領域にある2つのグラフの間を補間するために、EPICは2つのグラフ間の変換プロセスを表す編集パスを構築する。
我々のアプローチは多くのタスクにおいて既存の拡張テクニックよりも優れています。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:43:16 GMT)
Rapid Bone Scintigraphy Enhancement via Semantic Prior Distillation from Segment Anything Model [12.1] 本稿では,SAMを用いた医用画像修復のためのセマンティック・プリエンスの最初の応用について紹介する。
0.5歳から16歳までの小児137例を対象に,20cm/分(20cm/分)と40cm/分(40cm/分)の急速スキャンを併用した高速骨シンチグラフィーデータセットを作成した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:45:41 GMT)
BINGO! Simple Optimizers Win Big if Problems Collapse to a Few Buckets [12.1] ソフトウェアエンジニアリング(SE)は遅くて複雑です。
本稿では,SEデータを少数の解"バケット"に分解する新たな現象であるBINGO効果を紹介する。
39のSE問題の最適化におけるBINGO効果の有意性を示す。
これを実行することで、最先端のメソッドよりも1万倍高速に最適化できます。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:13:58 GMT)
FSHNet: Fully Sparse Hybrid Network for 3D Object Detection [12.0] スパース3D検出器は空でないボクセルからのみ特徴を抽出する。
本稿では,既存のスパースエンコーダの長距離特徴抽出能力を高めるためにFSHNet(Fully Sparse Hybrid Network)を提案する。
FSHNetは、既存のスパースエンコーダの長距離特徴抽出機能を強化するために、提案されたSlotFormerブロックを組み込んでいる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:46:18 GMT)
Recover Experimental Data with Selection Bias using Counterfactual Logic [12.0] 我々は、観測界における選択機構が反現実領域にどのように伝播するかを分析する。
偏りのない観測データを利用して、偏りのある実験データセットから$P(Y*_x*)$を回収する原理的手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:00:31 GMT)
You Only Train Once [12.0] You Only Train Once (YOTO)は、損失選択と重み付けの後者の側面において、トレーニングを1ショットに制限することに貢献する。
複数の経験的損失を同時に最適化するために広く用いられている複合損失定式化の微分可能性を活用する。
YOTOは、未確認テストデータにおいて、最高のグリッド検索モデルよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:04:58 GMT)
Topological Mixed States: Axiomatic Approaches and Phases of Matter [11.9] 閉量子系において、位相的順序は、ギャップ付き局所ハミルトニアンの基底状態の同値類を通して理解される。
ここでは、局所的回復可能性(i$)、長距離相関の欠如(ii$)、空間的均一性(iii$)という3つの公理に基づくアプローチを提案することにより、このギャップを埋める。
結果は、オープン量子系における位相状態の体系的な分類の基礎となった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:58:45 GMT)
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant [11.8] 量子化は、大規模および小規模言語モデルのコスト効率のよいデプロイのための有望なソリューションとして注目を集めている。
1Bから405Bパラメータにまたがる命令調整モデルの総合評価を行い、13のデータセットに対して4つの量子化手法を適用した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:15:49 GMT)
EscapeCraft: A 3D Room Escape Environment for Benchmarking Complex Multimodal Reasoning Ability [11.7] マルチモーダル推論のベンチマークであるMM-Escapeを紹介する。
MM-Escapeは最終タスク完了と同時に中間モデル動作を強調している。
大規模な実験により、MLLMはスケールに関係なく、最も単純な部屋の脱出タスクを完了できることが示されている。
性能ボトルネックはモデルによって異なり、異なる障害モードとマルチモーダル推論能力の制限が明らかになる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:26:59 GMT)
TurboFuzzLLM: Turbocharging Mutation-based Fuzzing for Effectively Jailbreaking Large Language Models in Practice [11.6] 我々は,有効なジェイルブレイクテンプレートのコレクションを効率よく見つけるために,突然変異ベースのファジリング技術であるTurboFuzzLLMを提案する。
TurboFuzzLLMは、主要な大言語モデルのための公開データセットに対する攻撃成功率として$geq$95%を達成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:08:28 GMT)
Efficient approximation of regularized relative entropies and applications [11.6] 正則化相対エントロピーは, 量子相対エントロピープログラムによって, 加算誤差内で効率よく近似できることを示す。
これは、逆量子チャネル判別における正則化相対エントロピーに特に当てはまる。
特に、興味の集合が要求される構造的仮定を直接満たさない場合、それはその仮定に緩和することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:48:56 GMT)
Can we reconstruct a dysarthric voice with the large speech model Parler TTS? [11.5] 我々は、その状態が始まる前に、変形性スピーカーの声の近似を生成する。
我々は,現在最先端の大規模音声モデルであるParler TTSが話者識別を維持しつつ,理解不能な音声を生成することができるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:23:44 GMT)
Efficient Data Selection for Domain Adaptation of ASR Using Pseudo-Labels and Multi-Stage Filtering [11.5] ラベル付きデータや計算資源が限られている小さな組織にとって、特定のドメインに対する微調整済みのASRモデルは困難である。
本稿では、WhisperとZipformerを用いて生成された擬似ラベルをフィルタリングすることで、ASR適応を改善する頑健なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:11:24 GMT)
Hanging in the Balance: Pivotal Moments in Crisis Counseling Conversations [11.3] そこで我々は,非教師なしの計算手法を導入し,その瞬間を検知する。
我々のアプローチは、ある瞬間が重要なものであるという直観に依存している。
次に、我々のフレームワークを用いて、セッションの最終的な結果と重要な瞬間におけるカウンセラーの反応の関係を探る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:31:58 GMT)
Resolving Task Objective Conflicts in Unified Multimodal Understanding and Generation via Task-Aware Mixture-of-Experts [11.3] マルチモーダル・大規模言語モデル(MLLM)は、理解タスクと生成タスクを単一のフレームワークに統合する。
固有のタスク目的 理解における高レベルのセマンティックな抽象化と、生成時のきめ細かい詳細保存との間の対立は、重大な課題である。
タスク目的の衝突を解決するために,ARの内部コンポーネントを分離する新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:44:21 GMT)
The Disparate Benefits of Deep Ensembles [11.3] アルゴリズムフェアネスは、モデルのパフォーマンスが社会的に関係のあるグループによってどのように変化するかを調べる。
ディープ・アンサンブルは異なるグループを不均一に好んでいる。
アンサンブルメンバーの予測多様性におけるグループごとの差異は、この効果を説明することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:48:31 GMT)
Lions and Muons: Optimization via Stochastic Frank-Wolfe [11.3] 重量減衰を持つライオンとムオンは、フランク=ウルフの特別な例と見なすことができる。
また、このギャップへの収束はノルム制約の下での元の問題のKKT点への収束を意味する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:39:03 GMT)
DreamFrame: Enhancing Video Understanding via Automatically Generated QA and Style-Consistent Keyframes [11.3] 最近の視覚言語モデル(LVLM)は、主にオンラインプラットフォームから抽出された様々なスクレイピングによって微調整されている。
現在のLVLMは主に、広範囲で汎用的な設定で既存のデータセットでトレーニングされているが、特定のダウンストリームシナリオに適応することは依然として難しい。
そこで我々はDreamFrameという3段階のフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:42:04 GMT)
SF$^2$Bench: Evaluating Data-Driven Models for Compound Flood Forecasting in South Florida [11.3] 世界の気候が洪水のリスクを増大させるにつれて、複合洪水の分析がますます重要になっている。
水理工学センターのリバー分析システムのような伝統的な物理学に基づく手法は、しばしば時間的非効率である。
機械学習は最近、モデリング精度と計算効率の両方において有望であることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:45:33 GMT)
Long or short CoT? Investigating Instance-level Switch of Large Reasoning Models [11.3] CoT(Chain-of-Thought)プロンプトは複雑なタスクに対して強いパフォーマンスを示している。
長いCoTはパフォーマンス改善につながる可能性があるが、その利点はトークン消費が著しく高いことと比べれば限界があることが多い。
推論精度と計算効率のバランスをとるために,長いCoT戦略と短いCoT戦略を適応的に選択する自動フレームワークであるSwitchCoTを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:28:38 GMT)
Data Laundering: Artificially Boosting Benchmark Results through Knowledge Distillation [11.2] 知識蒸留は言語モデルベンチマークスコアを操作するために変換可能であることを示す。
本稿では,ベンチマーク固有の知識を包括的に伝達するプロセスである"Data Laundering"を紹介する。
提案手法は,真の推論機能を開発することなく,ベンチマーク精度を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:38:38 GMT)
GEM: Empowering LLM for both Embedding Generation and Language Understanding [11.1] 高品質なテキスト埋め込みを生成するために,GEM(Generative Embedding large Language Model)を提案する。
本手法では,新たな特殊トークンをテキスト本体に挿入し,アテンションマスクを操作することでテキストの要約埋め込みを生成する。
提案手法は,従来のNLP性能を維持しつつ,最先端のテキスト埋め込み機能でLCMを活用できることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:02:07 GMT)
Selective Matching Losses -- Not All Scores Are Created Equal [11.0] 我々は、スコア領域上のリンク関数の増大を設計して、選択的なマッチング損失関数を構築する。
リンクは、損失感度をスコアの関数として定義し、平坦なものよりも高い傾斜高感度領域を強調する。
標準的なSoftmax関数の制限を克服するが、これは分類には適しているが、隣り合うスコアの区別には向いていない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:03:54 GMT)
Animal Pose Labeling Using General-Purpose Point Trackers [11.0] 本研究では,異なる戦略,すなわちテスト時間最適化に従う動物ポーズラベリングパイプラインを提案する。
注記フレームのスパースセット上に、事前訓練された汎用点トラッカー内に、軽量な外観を埋め込んだ微調整を行う。
本手法は,最先端の性能を妥当なコストで達成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:59:22 GMT)
El0ps: An Exact L0-regularized Problems Solver [11.0] El0psはL0正規化問題を扱うユーティリティを提供するPythonツールボックスである。
El0psを使えば、ユーザーはこれらの問題のカスタムインスタンスを定義できる。
最先端のパフォーマンスを達成するための専用ソルバを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:47:43 GMT)
A Generic Branch-and-Bound Algorithm for $\ell_0$-Penalized Problems with Supplementary Material [11.0] L0-penalized optimization 問題を解くために,汎用的なブランチ・アンド・バウンド法を提案する。
本手法は, より広範な損失関数のクラスに対応し, 一般のペナルティ項による緩和設計の柔軟性を高める。
我々は,L0ペナル化問題におけるユーザ定義の損失と罰則を可能にする,プラグイン・アンド・プレイワークフローを備えたオープンソースのPythonソルバであるEl0psを紹介した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:05:49 GMT)
SemNav: A Model-Based Planner for Zero-Shot Object Goal Navigation Using Vision-Foundation Models [10.7] Vision Foundation Models (VFM) は視覚的理解と推論に強力な機能を提供する。
本稿では,VFMの知覚的強度をモデルベースプランナと統合したゼロショットオブジェクトゴールナビゲーションフレームワークを提案する。
本研究では,Habitatシミュレータを用いてHM3Dデータセットに対するアプローチを評価し,提案手法が最先端性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:04:54 GMT)
Incremental Gradient Descent with Small Epoch Counts is Surprisingly Slow on Ill-Conditioned Problems [10.7] 滑らかな凸関数について, ナイーブ変種であるインクリメンタルグラディエントDescent (IGD) について検討した。
解析の結果,小エポック状態においては,低い関数が強く凸している場合にIGDが驚くほど現れることが明らかとなった。
置換に基づくSGDが、この小さなエポック状態においてより早く収束できるかどうかはまだ分かっていない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:17:25 GMT)
PDSE: A Multiple Lesion Detector for CT Images using PANet and Deformable Squeeze-and-Excitation Block [10.6] 網膜ネットの再設計により1段階病変検出フレームワークPDSEを導入する。
低レベル特徴写像を組み込むことで,経路凝集流の増大を図る。
我々のアルゴリズムは公開DeepLesionベンチマークで0.20以上のmAPを達成した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:38:31 GMT)
Revisiting Uncertainty Quantification Evaluation in Language Models: Spurious Interactions with Response Length Bias Results [10.6] 評価では、AUROCのようなメトリクスを使って、UQメソッドがタスクの正しさ関数とどのように相関しているかを評価する。
その結果,UQ法と正当性関数の双方が同一の因子に偏りがある場合,相互バイアスがシステム的に歪曲することがわかった。
LM-as-a-judge法は最短長バイアスであり,より公平なUQ評価の道筋を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:25:43 GMT)
Quantifying Prediction Consistency Under Fine-Tuning Multiplicity in Tabular LLMs [10.5] 微調整多重度は分類タスクにおけるタブラル LLM に現れる。
我々の研究は、タブラルLLMにおける微調整多重性というこのユニークな挑戦を定式化する。
本稿では,コストのかかるモデル再訓練を伴わずに,個々の予測の一貫性を定量化する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:12:58 GMT)
A Two-Staged LLM-Based Framework for CI/CD Failure Detection and Remediation with Industrial Validation [10.5] LogSageは、失敗するCI/CDログから根本原因分析とソリューション生成を実行するエンドツーエンドのLLMフレームワークである。
システムは、生産品質の大規模な産業用CI/CD環境で厳格に検証され、毎日3,000以上の実行が処理された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:22:56 GMT)
LaF-GRPO: In-Situ Navigation Instruction Generation for the Visually Impaired via GRPO with LLM-as-Follower Reward [10.4] 本研究は,視覚障害者(VI)を対象に,視覚障害者(VI)が実際に使用可能な,精密でその場でステップバイステップのナビゲーション命令を作成することに焦点を当てた。
LLM-as-Follower GRPOは、Vision-Language Model (VLM) のトレーニング後の報酬を生成する。
NIG4VIの実験は、定量測定によるLaF-GRPOの有効性を示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:34:33 GMT)
Unpacking Let Alone: Human-Scale Models Generalize to a Rare Construction in Form but not Meaning [10.4] 我々は、英語LET-ALONE構築の形式と意味の知識に基づいて、人間のスケールトランスフォーマー言語モデルをテストする。
関連する構造がデータセットからフィルタリングされた場合でも,人間のスケールのLMは形成に敏感であることがわかった。
人間のスケール LM は LET-ALONE の意味を正しく一般化しない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:40:23 GMT)
Heterogeneous Treatment Effect in Time-to-Event Outcomes: Harnessing Censored Data with Recursively Imputed Trees [10.3] 既存の方法は、しばしば完全な観察を前提としており、その仮定は、右検閲による生存データに違反している。
我々は,不均一な治療効果を推定するための新しい,一般かつ非パラメトリックな方法であるMultiple Imputation for Survival Treatment Response (MISTR)を紹介した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:10:53 GMT)
MultiHoax: A Dataset of Multi-hop False-Premise Questions [10.3] 我々はMultiHoaxを紹介した。これは、複雑で多段階の推論タスクにおいて、偽の前提を扱う大規模言語モデルの性能を評価するためのベンチマークである。
我々のデータセットは7つの国と10の多様な知識カテゴリにまたがっており、ウィキペディアを主要な知識源としています。
実験によると、最先端のLLMは、異なる国、知識カテゴリ、マルチホップ推論タイプで偽の前提を検出するのに苦労している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:23:25 GMT)
More or Less Wrong: A Benchmark for Directional Bias in LLM Comparative Reasoning [10.3] 本研究では,大規模言語モデルにおける意味的キュー形状推論のメカニズムについて検討する。
我々は300の比較シナリオのベンチマークであるMathCompを紹介する。
モデル誤差は、しばしば言語的ステアリングを反映し、プロンプトに存在する比較項への体系的なシフトを反映している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:15:01 GMT)
UBench: Benchmarking Uncertainty in Large Language Models with Multiple Choice Questions [10.3] 大規模言語モデル(LLM)の不確実性を評価するための新しいベンチマークであるUBenchを紹介する。
他のベンチマークとは異なり、UBenchは信頼区間に基づいている。知識、言語、理解、推論能力にまたがる11,978の多重選択質問を含んでいる。
1) 信頼性区間に基づく手法は不確実性定量化に極めて有効である; 2) 不確実性に関して、優れたオープンソースモデルは、クローズドソースモデルと競合する性能を示す; 3) CoT と RP は、モデル信頼性を改善するための潜在的方法を示し、温度変化の影響は普遍的な規則に従わない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:37:02 GMT)
BiMa: Towards Biases Mitigation for Text-Video Retrieval via Scene Element Guidance [10.3] BiMaは、視覚的およびテキスト的表現のバイアスを軽減するために設計された新しいフレームワークである。
視覚障害者には、これらのシーン要素をビデオ埋め込みに統合し、きめ細かな細部と細部を強調できるようにします。
テキストの偏りを解消するために,テキスト特徴をコンテンツやバイアス成分に分解する機構を導入し,意味のあるコンテンツに集中できるようにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:40:54 GMT)
Exploring entanglement, Wigner negativity and Bell nonlocality for anisotropic two-qutrit states [10.2] 異方性二量子状態(AITTS)の族を導入する。
AITTSの3つの性質は、絡み合い、ウィグナー負性、ベル非局所性などである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:15:52 GMT)
Rethinking the Stability-Plasticity Trade-off in Continual Learning from an Architectural Perspective [10.2] 本稿では,継続学習のためのプラグインコンポーネントとして機能するDual-Archという新しいフレームワークを紹介する。
本論文では,Dual-Archが既存のCL法の性能を向上させるとともに,パラメータの最大87%がコンパクトであることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:40:41 GMT)
BEAR: BGP Event Analysis and Reporting [10.2] ボーダーゲートウェイプロトコル(BGP)の異常は、不正または非効率的な経路を通じてトラフィックを分散させ、ネットワークの信頼性とセキュリティを損なう。
BGPイベント解析および報告フレームワークは、検出されたBGP異常事象を説明する包括的なレポートを生成する。
BEARは100%の精度を実現し、Chain-of-Thoughtおよびin-context学習ベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:34:36 GMT)
Improving Child Speech Recognition and Reading Mistake Detection by Using Prompts [10.1] オランダ語読み上げ音声における最先端の音声認識性能を達成した。
これにより読み誤りの検出が大幅に改善され、F1スコアは0.39から0.73に増加した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:55:12 GMT)
ZipNN: Lossless Compression for AI Models [10.1] ZipNNはニューラルネットワークに適した無損失圧縮を提供する。
一般的なモデル(例えばLlama 3)では、ZipNNはバニラ圧縮よりも17%以上良いスペース節約を示している。
これらの手法は、Hugging Faceのような大きなモデルハブからダウンロードされたネットワークトラフィックを1ヶ月に1つ以上節約できると見積もっている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:59:06 GMT)
Accurate Sublayer Pruning for Large Language Models by Exploiting Latency and Tunability Information [10.1] 大規模言語モデル(LLM)のサブレイヤプルーニング圧縮と高速化
既存のサブレイヤプルーニングアルゴリズムは、プルーネに選択的にサブレイヤを選択するため、精度が制限されている。
SPRINTは、ゼロショットのコモンセンス推論ベンチマークにおいて最大23.88%の精度で精度の高いトレードオフを実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:53:34 GMT)
Mono: Is Your "Clean" Vulnerability Dataset Really Solvable? Exposing and Trapping Undecidable Patches and Beyond [10.1] 既存のセキュリティパッチは、しばしば不正確なラベル、不十分なコンテキスト情報、決定不能なパッチに悩まされる。
信頼性のある脆弱性データセットを構築するための、人間の専門家の推論プロセスをシミュレートする、新しいフレームワークであるmonoを紹介します。
monoはラベリングエラーの31.0%を補正し、プロデュール間脆弱性の89%を回復し、CVEの16.7%が決定不能なパッチを含んでいることを明らかにした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:43:04 GMT)
Simple Calibration via Geodesic Kernels [10.0] 決定の森やディープニューラルネットワークのような深い差別的アプローチは、最近、多くの重要な現実世界のシナリオで応用を見出した。
しかし、これらの学習アルゴリズムを安全クリティカルなアプリケーションにデプロイすることは、特に分布内領域と分布外領域の両方のキャリブレーションを確保することに懸念を生じさせる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:15:10 GMT)
Learning-at-Criticality in Large Language Models for Quantum Field Theory and Beyond [10.0] 本稿では,大規模言語モデルを鋭い学習遷移にチューニングする強化学習スキームである,臨界学習(LaC)を紹介する。
量子場論におけるLaCの実証は、記号的松原和のいくつかの例を用いて、LaCによって臨界点に調整された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:35:05 GMT)
Mark My Words: A Robust Multilingual Model for Punctuation in Text and Speech Transcripts [10.0] 句読解は意味を構造化する上で重要な役割を担っているが、現在のモデルは自発音声の書き起こしでそれを正確に復元するのに苦労することが多い。
本稿では,事前訓練された大規模言語モデルから適応した汎用的句読点復元モデルCadenceを紹介する。
14の言語から22のインド語と英語へのサポートを拡大しながら、パフォーマンスにおけるこれまでの技術状況を上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:54:38 GMT)
Diffusion-VLA: Generalizable and Interpretable Robot Foundation Model via Self-Generated Reasoning [9.9] DiffusionVLAは、自己回帰モデルと拡散モデルとをシームレスに組み合わせ、ビジュモータポリシーを学習するフレームワークである。
自己推論によるポリシー学習を強化するために,新しい推論インジェクションモジュールを導入する。
複数の実ロボットを用いて広範に実験を行い,DiffusionVLAの有効性を検証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:30:06 GMT)
When Does Closeness in Distribution Imply Representational Similarity? An Identifiability Perspective [9.9] モデル分布間の小さなKullback-Leibler分散は、対応する表現が類似していることを保証するものではないことを証明する。
次に、近接性が表現的類似性を意味する分布距離を定義する。
合成実験において、より広いネットワークは我々の距離に近づき、より類似した表現を持つ分布を学習する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:44:22 GMT)
Understanding Mental Models of Generative Conversational Search and The Effect of Interface Transparency [9.6] メンタルモデルは、システムの振る舞いを理解し予測するための内部フレームワークである。
ほとんどのユーザーメンタルモデルは、個々の検索インスタンスを説明する際にユーザーをサポートするには抽象的すぎる。
発見は、メンタルモデルが会話探索における適切な信頼の障壁となることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:27:22 GMT)
Adapt before Continual Learning [9.5] 我々は,既存のCLアプローチで各タスクを学習する前に,プラグイン・アンド・プレイ適応フェーズを通じてPTMのバックボーンを洗練する新しいフレームワークであるコアCLプロセス(ACL)の前に,PTMを適応させることを提案する。
ACLは、埋め込みを元のクラスプロトタイプと整列させ、他のクラスと距離を置き、理論上、実験的に安定性と可塑性のバランスを保ち、可塑性を高める。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:46:33 GMT)
Through the Prism of Culture: Evaluating LLMs' Understanding of Indian Subcultures and Traditions [9.4] インド社会におけるリトル・トラディションを認識し,正確に応答する大規模言語モデルの能力を評価する。
一連のケーススタディを通じて、LLMが支配的なグレートトラディションとローカライズされたリトルトラディションの相互作用のバランスをとることができるかどうかを評価する。
その結果,LLMは文化的ニュアンスを表現できる能力を示す一方で,実践的,文脈特異的なシナリオにこの理解を適用するのに苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:05:12 GMT)
RAC3: Retrieval-Augmented Corner Case Comprehension for Autonomous Driving with Vision-Language Models [9.3] 視覚言語モデル(VLM)はシナリオ理解の促進に重要な役割を果たしている。
幻覚や現実世界の接地不足といった課題に直面している。
本研究では, コーナーケース理解におけるVLMの性能向上を目的としたRAC3を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:20:02 GMT)
High Performance Space Debris Tracking in Complex Skylight Backgrounds with a Large-Scale Dataset [9.3] 高精度なデブリ追跡を実現するために,深層学習に基づく空間デブリ追跡ネットワーク(SDT-Net)を提案する。
SDT-Netはデブリの特徴を効果的に表現し、エンドツーエンドのモデル学習の効率性と安定性を高める。
データセットとコードはまもなくリリースされます。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:10:38 GMT)
On the Closed-Form of Flow Matching: Generalization Does Not Arise from Target Stochasticity [9.2] 拡散・流れマッチング技術がなぜ効果的に一般化されるのかを考察する。
高次元設定では、フローマッチング損失の一般化と閉形式バージョンがほぼ等価な損失をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:50:32 GMT)
An Efficient Task-Oriented Dialogue Policy: Evolutionary Reinforcement Learning Injected by Elite Individuals [9.1] 進化的アルゴリズム(EA)は、人口多様性を維持することにより、ニューラルネットワークの解空間を効果的に探索することが証明されている。
そこで我々は,EAの探索効率を高めるために,集団に最適な個人を適応的に導入することで,エリート個人注入機構を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:07:55 GMT)
Experimental Detection of Dissipative Quantum Chaos [9.1] 発散性量子カオスと可積分性の最初の実験的検出を報告した。
現代の量子計算プラットフォームを,散逸的な多体現象を探索するためのテストベッドとして確立している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:03 GMT)
Conditional Independence Test Based on Transport Maps [9.0] 3分の2の確率ベクトル間の条件付き独立性をテストすることは統計学における基本的な問題である。
本稿では,トランスポートマップを用いた条件付き独立性テストのための革新的なフレームワークを提案する。
2つの明確に定義されたトランスポートマップが条件付き独立性テストから条件なし独立性テストに変換可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:17:58 GMT)
A Diffusion-Driven Temporal Super-Resolution and Spatial Consistency Enhancement Framework for 4D MRI imaging [9.0] 医用画像では、4D MRIはダイナミックな3D可視化を可能にするが、空間分解能と時間分解能のトレードオフはスキャン時間の延長を必要とする。
伝統的なアプローチは一般的に中間フレームを生成するために登録ベースに依存している。
空間整合性を維持しつつ中間フレームを生成する新しいフレームワークTSSC-Netを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:09:19 GMT)
Beyond C/C++: Probabilistic and LLM Methods for Next-Generation Software Reverse Engineering [9.0] 我々は,2進解析と細調整された大言語モデル(LLM)を統合する新しい手法を提案する。
本手法は,逆工学に固有の不確かさを体系的にモデル化し,不完全あるいは曖昧な情報に対するより正確な推論を可能にする。
このハイブリッドアプローチは、リバースエンジニアリングの取り組みの堅牢性と正確性を高めるだけでなく、スケーラブルなソリューションも提供します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:45:27 GMT)
Robustness of Prompting: Enhancing Robustness of Large Language Models Against Prompting Attacks [8.9] ロバストネス・オブ・プロンプティング(RoP)は、大規模言語モデル(LLM)の堅牢性を高めるために特別に設計された新しいプロンプティング戦略である。
RoPは様々な摂動法を適用して敵の例を生成し、入力エラーを自動的に修正するプロンプトを構築するのに使用される。
ガイダンス段階では、RoPは修正された入力に基づいて最適なガイダンスを生成し、より堅牢で正確な推論に向けてモデルを操る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:13:27 GMT)
Watermarking Degrades Alignment in Language Models: Analysis and Mitigation [8.9] 本稿では,Gumbel と KGW の2つの一般的な透かし手法が真理性,安全性,有用性にどのように影響するかを体系的に分析する。
本稿では,外部報酬モデルを用いてアライメントを復元する推論時間サンプリング手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:29:07 GMT)
A Large-Scale Referring Remote Sensing Image Segmentation Dataset and Benchmark [8.7] これまでで最も大きく多様なRRSISデータセットであるNWPU-Referを導入し、49,745個の注釈付きターゲットを持つ30か国にまたがる15,003個の高解像度画像(1024-2048px)を含む。
また、RRSISのユニークな要求に対応する新しいフレームワークであるMulti-scale Referring Network (MRSNet)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:26:51 GMT)
Distance-based measures and Epsilon-measures for measurement-based quantum resources [8.6] 量子資源理論は、量子資源を定量化するための構造化されエレガントな枠組みを提供する。
量子状態や測定値の集合が部分的にしか知られていない現実的なシナリオでは、従来のリソース測度はリソースの内容の取得に不足することが多い。
エプシロン測定は堅牢な代替手段であり、特に貴重である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:20:59 GMT)
On the Pinsker bound of inner product kernel regression in large dimensions [8.6] 球面 $mathbbSd$ 上の内積核回帰に対するピンスカー境界について検討する。
我々は、この設定でカーネル回帰の正確なミニマックスリスクを決定し、ミニマックス率だけでなく、過剰リスクに関連するピンスカー定数と呼ばれる正確な定数も特定した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:13:20 GMT)
SAGE:Specification-Aware Grammar Extraction for Automated Test Case Generation with LLMs [8.6] 我々は,オープンソースの大規模言語モデル(LLM)を用いて,CCFG(Context-free Grammars with Counters)を誘導する方法について検討する。
CCFGは、導出中のカウンタ値の保存と再利用によって論理的制約を持つ仕様を表す。
提案手法は, 文法品質とテスト効率の両面において, より高度な一般化を実現し, オープンかつクローズドソースの LLM を17 に上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:44:25 GMT)
BitTTS: Highly Compact Text-to-Speech Using 1.58-bit Quantization and Weight Indexing [8.5] 本稿では,オンデバイスアプリケーションのための,コンパクトで軽量なテキスト音声合成(TTS)モデルを提案する。
トレーニング中のモデルパラメータを1.58ビット以下に定量化するQAT(quantization-aware training)を導入する。
Int8インデックスとして1.58ビットの重み群を節約する重みインデックス法も提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:02:18 GMT)
EV-Flying: an Event-based Dataset for In-The-Wild Recognition of Flying Objects [8.5] イベントカメラは、高時間分解能、低レイテンシ、動きのぼかしに対する堅牢性を提供する。
飛行物体のイベントベースのデータセットであるEV-Flyingを紹介する。
本研究では,点雲に基づく表現イベントを用いた飛行物体の分類について検討した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:14:36 GMT)
Weight for Robustness: A Comprehensive Approach towards Optimal Fault-Tolerant Asynchronous ML [8.4] 非同期システムは、ビザンツの失敗に対する完全性を維持するのに苦労する。
これらの問題に対処するために、新しい重み付けされたロバストアグリゲーションフレームワークを導入します。
非同期なビザンチン環境において, 最適収束率を初めて達成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:31:26 GMT)
Tone recognition in low-resource languages of North-East India: peeling the layers of SSL-based speech models [8.3] 本研究では,インド北東部の低リソース言語3言語において,自己教師付き学習(SSL)モデルを用いたトーン認識について検討した。
音節言語と非音節言語の両方で事前学習された4つのWav2vec2.0ベースモデルを評価した。
以上の結果から, 美蔵では音色認識が最善で, 安神では最悪であることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:32:12 GMT)
Plugging Schema Graph into Multi-Table QA: A Human-Guided Framework for Reducing LLM Reliance [8.3] 本稿では,人為的な関係知識を活用して,スキーマリンクとジョインパスを明示的にエンコードするグラフベースのフレームワークを提案する。
自然言語クエリーが与えられた場合、我々はこのグラフを検索して解釈可能な推論チェーンを構築し、プルーニングとサブパスマージ戦略によって支援する。
標準ベンチマークと現実的な大規模データセットの両方の実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:21:52 GMT)
Verification-Guided Falsification for Safe RL via Explainable Abstraction and Risk-Aware Exploration [8.2] 本稿では、説明可能性、モデルチェック、リスク誘導のファルシフィケーションを統合し、厳密性とカバレッジを両立させるハイブリッドフレームワークを提案する。
我々のアプローチは、包括的抽象ポリシー要約(CAPS)を用いたRLポリシーの人間解釈可能な抽象化の構築から始まる。
違反が検出されない場合、オフラインデータセットの抽象化とカバレッジに制限があるため、満足度を結論付けることはできません。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:54:01 GMT)
ProRank: Prompt Warmup via Reinforcement Learning for Small Language Models Reranking [8.2] 本稿では,SLM ベースの文書更新のための新しい2段階トレーニング手法 ProRank を提案する。
まず、強化学習GRPOを用いてSLMを操り、タスクプロンプトを理解するプロンプトウォームアップステージを提案する。
そこで我々は,精巧なスコア学習段階を連続的に微調整し,付加層を導入することなく品質向上を図る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:00:44 GMT)
1D Spontaneous Symmetry Breaking in thermal equilibrium via Non-Hermitian Construction [8.2] 自発的対称性の破れは、一般的に熱平衡における局所的な相互作用を持つ一次元系を回避している。
局所非エルミート構造を用いて一次元エルミートモデルの圏を解析する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:43:59 GMT)
Solsmith: Solidity Random Program Generator for Compiler Testing [8.1] 本稿では,Solidityコンパイラの欠陥を明らかにするテストプログラムジェネレータであるSolsmithの設計と実装を行う。
有効で多様なSolidityプログラムを生成することで、コンパイラの正確性をテストする。
予備的な結果は、Solsmithが期待するテストプログラムを生成し、Solidityコンパイラの4つの欠陥を発見できることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:04:17 GMT)
An Adaptive Orthogonal Convolution Scheme for Efficient and Flexible CNN Architectures [8.1] AOC(Adaptative Orthogonal Convolution)は,従来の手法を拡張するスケーラブルな手法である。
実験を通して,本手法がスケールするにつれて効率が向上する表現モデルを生成することを示す。
さらなる進歩を促すため,Orthogoniumと呼ばれるこの手法を実装したオープンソースのpythonパッケージを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:59:15 GMT)
Learning Smooth State-Dependent Traversability from Dense Point Clouds [8.1] オフロード自動運転における主要な課題は、地形の移動可能性がしばしば車両の状態に依存することである。
SPARTA(SPARTA)は、点雲からの接近角度条件付きトラバータビリティを推定する手法である。
我々は,SPARTAを高忠実度シミュレーションプラットフォームで実証し,40mの岩場を横断する91%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:21:54 GMT)
WIFE-Fusion:Wavelet-aware Intra-inter Frequency Enhancement for Multi-model Image Fusion [8.1] マルチモーダル画像融合は、多様なモーダルからの情報を効果的に集約する。
既存の手法はしばしば周波数領域の特徴探索と相互関係を無視している。
本稿では,周波数領域間の相互作用に基づくマルチモーダル画像融合フレームワークWIFE-Fusionを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:18:32 GMT)
Engagement-Driven Content Generation with Large Language Models [8.0] 大規模言語モデル(LLM)は1対1の相互作用において重要な説得力を示す。
相互接続されたユーザーと複雑な意見のダイナミクスがユニークな課題を引き起こすソーシャルネットワークにおける彼らの影響力は、いまだ過小評価されている。
本稿では,emphCan LLMがソーシャルネットワーク上でユーザエンゲージメントを最大化する有意義なコンテンツを生成するかという研究課題に対処する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:02:28 GMT)
Meaning-Typed Programming: Language Abstraction and Runtime for Model-Integrated Applications [8.0] 本稿では,大規模言語モデル(LLM)統合を直感的な言語レベルで抽象化する新しいパラダイムである,意味型プログラミング(MTP)モデルを提案する。
我々はPythonのスーパーセット言語であるJacにMPPを実装し、MPPが精度と効率を保ちながら、コーディングの複雑さを著しく低減することを発見した。
GSM8kデータセットからの数学的な問題に対して、MPPは90%近い精度で到達し、13ベンチマーク中10ベンチマークでトークンの使用量を削減している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:51:13 GMT)
Uncovering Visual-Semantic Psycholinguistic Properties from the Distributional Structure of Text Embedding Space [8.0] イメージ可能性と具体性は、視覚空間と意味空間をリンクする心理言語学的特性である。
画像キャプチャデータセットのテキスト自身は、これらの特性を正確に推定するのに十分な信号を提供する。
本稿では,ピークのシャープネスを定量化する,教師なし分布自由度尺度を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:51:12 GMT)
Balancing Profit and Fairness in Risk-Based Pricing Markets [8.0] 我々は、規制当局が、学習された解釈可能な税制スケジュールを通じて、社会的目的による私的インセンティブを認識できることを示します。
経験的に調整された2つの市場、すなわち米国の健康保険と消費者クレディットでは、当社のプランナーは同時に需要公正度を最大16%値上げしている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:06:36 GMT)
Average Certified Radius is a Poor Metric for Randomized Smoothing [8.0] 我々は、ランダム化平滑化(RS)によって提供されるロバスト性保証を評価するための平均認定半径(ACR)が貧弱であることを示す。
本稿では,厳密なサンプルを明示的に取り除いたり,近似された半径でデータセットを再編集したり,簡単なサンプルを極端に最適化したりして,RSトレーニングの進捗を再現する戦略を提案する。
以上の結果から,ACRはこの分野に強い望ましくないバイアスをもたらしており,RSではその適用を中止すべきであることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:15:56 GMT)
Boosting Open-Source LLMs for Program Repair via Reasoning Transfer and LLM-Guided Reinforcement Learning [7.9] いくつかのクローズドソース LLM は、プログラム修復タスクにおいて、一貫してオープンソースの代替品より優れている。
本稿では,この性能ギャップを著しく狭める新しい3段階の手法である修復性を紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:13:58 GMT)
Do Neural Networks Need Gradient Descent to Generalize? A Theoretical Study [7.8] 広帯域・深層ニューラルネットワークにおける体積仮説の有効性について検討する。
Guess & Check による一般化は,G&C が勾配降下に対して確実に劣る最初の事例である我々の知識に対して,その幅の増大とともに低下することを示す。
逆に,G&Cによる一般化は深度の増加とともに向上し,広帯域ネットワークと深帯域ネットワークの対比が著しく向上することを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:25:04 GMT)
A Formalism for Optimal Search with Dynamic Heuristics (Extended Version) [7.8] 我々は動的アルゴリズムの考え方を定式化し、それらを汎用アルゴリズムフレームワークで使用する。
我々は、動的に$mathrmA*$をモデル化し、最適な一般化結果を示す特定のインスタンス化について研究する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:22:39 GMT)
Measuring Uncertainty Disentanglement Error in Classification [7.7] 複数のデータセットを用いて乱れの質をベンチマークする実験のセットを提示する。
情報理論解離を伴う深層アンサンブルが解離誤差として最適であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:47:01 GMT)
Meta-rater: A Multi-dimensional Data Selection Method for Pre-training Language Models [7.6] データ品質を評価するために,専門性,可読性,推論,清潔さの4つの側面を提案する。
学習した最適重み付けにより,これらの次元を既存の品質指標と統合する多次元データ選択手法であるMeta-raterを紹介する。
実験により、Meta-raterは1.3Bパラメータモデルの収束速度を2倍にし、下流タスク性能を3.23倍に改善し、7.2Bパラメータのモデルにスケールする利点がある。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:35:04 GMT)
Spectral Insights into Data-Oblivious Critical Layers in Large Language Models [7.5] 我々は,事前調整言語モデルにおいて,本質的な臨界層を特定するためのデータ公開アプローチを提案する。
表現空間が著しく変化する層も微調整時に最も影響を受ける層であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:25:14 GMT)
MANBench: Is Your Multimodal Model Smarter than Human? [7.5] 9つのタスクにわたる1,314の質問からなるバイリンガル・ベンチマーク(英語と中国語)であるMANBenchを紹介する。
我々は、最先端のマルチモーダル言語モデル(MLLM)と比較した。
その結果、MLLMは知識やテキストイメージ理解といったタスクに優れていますが、より深いモーダルな推論タスクでは苦労しています。
MANBenchは、MLLMと人間のマルチモーダル能力のギャップを埋める努力を刺激することを期待している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:42:14 GMT)
Contour Errors: An Ego-Centric Metric for Reliable 3D Multi-Object Tracking [7.5] 機能的な視点からシナリオを追跡することに関心のあるマッチを特定するためのegoまたはオブジェクト中心のメトリクスであるContour Errors(CE)を紹介します。
3Dカートラッキングでは, コンターエラーにより, 近距離域で80%, 遠距離域で60%のファンクション障害(FPs/FNs)が減少した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:15:04 GMT)
GCFL: A Gradient Correction-based Federated Learning Framework for Privacy-preserving CPSS [7.2] 分散アーキテクチャとしてのフェデレーション学習は,Cyber-Physical-Social Systems (CPSS) のアプリケーションに非常に有望であることを示す。
本稿では,サーバ側勾配補正機構を導入することで,厳密なプライバシ保証と精度のバランスをとる,差分プライベート・フェデレーション学習のための新しいフレームワークを提案する。
我々は,いくつかのベンチマークデータセット上でフレームワークを評価し,その実験結果から,同一のプライバシ予算下で最先端のパフォーマンスを達成できることを実証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:52:37 GMT)
AssetOpsBench: Benchmarking AI Agents for Task Automation in Industrial Asset Operations and Maintenance [7.1] 本稿では,これまで異なる専門知識と手動調整を必要としていたタスクを,AIエージェントが自律的に管理する未来を想定する。
AssetOpsBench - ドメイン固有のエージェントの開発、オーケストレーション、評価をガイドするために設計された、統合されたフレームワークと環境。
我々は,このような包括的システムに対する重要な要件を概説し,実世界の産業活動に対する認識,推論,制御を統合するエージェント構築に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:57:35 GMT)
Permutational-key quantum homomorphic encryption with homomorphic quantum error-correction [7.1] 我々は情報理論セキュリティを備えた置換キー量子同型暗号プロトコルを再検討する。
本稿では,このプロトコルを準同型として誤り訂正符号化を行う量子誤り訂正と統合する方法を説明する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:33:51 GMT)
PRJ: Perception-Retrieval-Judgement for Generated Images [6.9] Perception-Retrieval-Judgement (PRJ) は、毒性検出を構造的推論プロセスとしてモデル化するフレームワークである。
PRJは3段階の設計に従っており、まずイメージを記述言語(知覚)に変換し、その後、有害カテゴリーや特徴(検索)に関する外部知識を回収し、最終的に法的または規範的な規則(判断)に基づいて毒性を評価する。
実験の結果,PRJは検出精度とロバスト性において既存の安全チェックを上回り,構造的カテゴリーレベルの毒性解釈を独自に支援していることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:13:53 GMT)
Learning 3D Representations from Procedural 3D Programs [6.9] 簡単なプリミティブと拡張を使って3次元形状を自動的に生成する手続き型3Dプログラムから3次元表現を学習する。
注目すべきは、手続き的に生成された3D形状から得られた3D表現は、意味的に認識可能な3Dモデルから学んだ最先端の3D表現と同等に実行されることである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:12:41 GMT)
CHIME: Conditional Hallucination and Integrated Multi-scale Enhancement for Time Series Diffusion Model [6.9] CHIMEは、時系列拡散モデルのための条件付き幻覚と統合されたマルチスケール拡張フレームワークである。
本研究では,時間的特徴の伝達が可能な特徴幻覚モジュールを条件付き認知プロセスに導入する。
公開されている実世界のデータセットに対する実験結果は、CHIMEが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:34:09 GMT)
ExeChecker: Where Did I Go Wrong? [6.9] 本研究では,リハビリテーション演習の解釈のために,コントラスト学習ベースのフレームワークであるExeCheckerを提案する。
我々の研究は、人間のポーズ推定、グラフアテンションニューラルネットワーク、トランスフォーマーの解釈の領域における最先端の進歩の上に成り立っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:36:07 GMT)
Coreset Selection via LLM-based Concept Bottlenecks [6.9] Coreset Selection(CS)は、データセット全体の使用に匹敵するモデルパフォーマンスを達成するトレーニングデータセットのサブセットを特定することを目的としている。
本研究は,ダウンストリームモデルに依存しない人間の理解可能なテキスト属性(概念)を用いて,サンプルの難易度を計算するスコアを提案する。
我々のコアセットは高いプルーニングレートでもランダムなサブセットよりも優れており、動的手法を訓練することによって得られるコアセットに匹敵するモデル性能を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:26:55 GMT)
Learning Monotonic Probabilities with a Generative Cost Model [6.8] 本稿では、厳密な単調性の問題が、観測可能な収益変数と遅延コスト変数の間の部分的な順序と見なせることを示す。
本稿では,潜在コスト変数に対する生成ネットワークを導入し,暗黙的な単調問題に対処するインプリシット生成コストモデル(IGCM)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:54:26 GMT)
Learning to Insert [PAUSE] Tokens for Better Reasoning [6.8] 我々はDIT(Dynamic Inserting Tokens Training)と呼ばれる新しいアプローチを導入する。
本手法は,トークンログに類似したモデル信頼度が最も低いシーケンス内の位置を同定する。
GSM8Kでは最大4.7%、AQUA-RATでは3.23%、MBPPデータセットでは最大3.4%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:48:41 GMT)
PulseReddit: A Novel Reddit Dataset for Benchmarking MAS in High-Frequency Cryptocurrency Trading [6.8] Redditのようなソーシャルメディアプラットフォームは、そのような高頻度で短期的なトレーディングのための価値はあるが未調査の情報を提供している。
本稿では,大規模なRedditディスカッションデータを高周波暗号市場統計と整合させる新しいデータセットであるtextbfPulseRedditを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:48:51 GMT)
Analytical Lyapunov Function Discovery: An RL-based Generative Approach [6.8] 現在のニューラルネットワークは、スケーラブルな検証と限定的な解釈可能性において、課題に直面している。
解析的リアプノフ関数(ローカル)を構築するために変換器を用いたエンドツーエンドフレームワークを提案する。
本フレームワークは,候補リアプノフ関数を生成するトランスフォーマーベーストレーナーと,候補表現を検証するファルシファイアから構成される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:16:54 GMT)
Kinship in Speech: Leveraging Linguistic Relatedness for Zero-Shot TTS in Indian Languages [6.7] インドには1369の言語があり、22の公用語が13のスクリプトを使用している。
我々の研究はゼロショット合成に焦点を当てており、特にスクリプトとフォノタクティクスが異なる家系の言語を対象としている。
サンスクリット語、マハーラーシュトリアン語、カナラ・コンカニ語、マイティリ語、クルフ語のために、知的で自然なスピーチが作られた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:22:24 GMT)
Generating 6DoF Object Manipulation Trajectories from Action Description in Egocentric Vision [6.7] 大規模なエゴやエクソ中心のビデオデータセットを活用して,多様な操作軌跡を大規模に抽出するフレームワークを提案する。
我々は、視覚的および点的クラウドベース言語モデルに基づく軌道生成モデルを開発する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:28:16 GMT)
Accelerating SfM-based Pose Estimation with Dominating Set [6.6] 本稿では,Structure-from-Motionに基づくポーズ推定を高速化する前処理手法を提案する。
拡張現実(AR)、バーチャルリアリティ(VR)、ロボット工学といったリアルタイムアプリケーションには欠かせない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:56:38 GMT)
PEAKS: Selecting Key Training Examples Incrementally via Prediction Error Anchored by Kernel Similarity [6.6] インクリメンタルデータ選択(IDS)問題では,サンプルが連続的なストリームとして到着し,完全なデータソースにアクセスせずに選択する必要がある。
IDSに適した効率的なデータ選択法であるPEAKSを提案する。
PEAKSが既存の選択戦略を一貫して上回ることを示す総合評価を行った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:14:36 GMT)
Beyond Position: the emergence of wavelet-like properties in Transformers [6.6] ウェーブレット変換に類似したマルチレゾリューション処理を実装するために,注目ヘッドが進化することを示す。
その結果,現代のトランスフォーマーの有効性は,最適な多分解能分解を自発的に行う能力に起因していることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:06:45 GMT)
N$^2$: A Unified Python Package and Test Bench for Nearest Neighbor-Based Matrix Completion [6.5] 本稿では、N$2$という統一Pythonパッケージと、NNベースのメソッドの幅広いクラスを統合するテストベッドを紹介する。
また、ヘルスケアやレコメンダシステムから因果推論まで、現実世界のデータセットのベンチマークスイートもリリースしています。
我々の実験では、古典的手法は理想化されたデータに勝るものの、NNベースの手法は現実の環境では一貫して優れていた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:04:34 GMT)
Should LLM Safety Be More Than Refusing Harmful Instructions? [6.5] 本稿では,Large Language Models (LLM) の長文分散(暗号化)テキストに対する振る舞いを体系的に評価する。
LLMの安全性を評価するための2次元フレームワークを提案する。
暗号を復号する能力を持つモデルは、不正な一般化攻撃の影響を受けやすいことを実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:56:40 GMT)
A Survey of Event Causality Identification: Taxonomy, Challenges, Assessment, and Prospects [6.5] 事象因果同定(ECI)は自然言語処理(NLP)における重要な課題である。
本稿では,既存の手法を分類・解明するための新しい分類フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:35:00 GMT)
Optimizing Treatment Allocation in the Presence of Interference [6.4] 影響最大化(IM)では、治療対象のネットワーク内の最適なエンティティセットを選択することが目的である。
昇降モデリング(UM)では、エンティティは推定処理効果に応じてランク付けされ、上位エンティティは処理を割り当てる。
OTAPI:干渉の有無で処理割り当てを最適化する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:59:11 GMT)
Linear Representation Transferability Hypothesis: Leveraging Small Models to Steer Large Models [6.4] 同一データ上で訓練されたモデル間で学習された表現は、基本特徴の近辺集合の線形結合として表現できることを示す。
これらの基本機能は、学習タスク自体を基盤とし、スケールに関係なく、モデル間で一貫性を維持します。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:24:26 GMT)
Measuring topological invariants of even-dimensional non-Hermitian systems through quench dynamics [6.3] 非エルミート的(NH)トポロジカル不変量(英語版)は、NHトポロジカル位相の研究において中心的な役割を果たす。
等次元系におけるNH位相不変量を直接測定するための一般的な枠組みを提案する。
熱処理後のスピンテクスチャから構築した動的場の巻線パターンからNHトポロジカル不変量を抽出できることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:12:11 GMT)
Learning to Diagnose Privately: DP-Powered LLMs for Radiology Report Classification [6.3] 本研究は,放射線学レポートテキスト上で,差分プライバシー (DP) を用いた大規模言語モデル (LLM) の微調整を行うためのフレームワークを提案する。
MIMIC-CXR胸部X線写真とCT-RATECTを用いた50,232例の胸部X線撮影を行った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:11:45 GMT)
LLM Code Customization with Visual Results: A Benchmark on TikZ [6.3] 我々は,協調的な視覚的成果を保ちながらコードをカスタマイズする大規模言語モデルの能力を評価する最初のベンチマークであるvTikZを紹介した。
我々のベンチマークは、慎重にキュレートされたvTikZ編集シナリオ、パラメータ化された基底真理、そして視覚フィードバックを利用して正当性を評価するレビューツールから構成されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:57:19 GMT)
Mixture of Experts for Node Classification [6.3] 本稿では,ノード分類のための専門家フレームワークであるMoE-NPを提案する。
特に、MoE-NPはノード予測器の混合と、ノードパターンに基づいて戦略的にモデルを選択する。
さまざまな実世界のデータセットによる実験結果からは、大幅なパフォーマンス向上が示されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:57:43 GMT)
INP-Former++: Advancing Universal Anomaly Detection via Intrinsic Normal Prototypes and Residual Learning [6.3] 異常検出は産業検査や診断に不可欠である。
既存のメソッドは通常、トレーニングセットからの通常の参照と比較する'テストイメージに依存します。
Intrinsic Normal Prototypes(INP)を直接抽出する新しい手法であるINP-Formerを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:49:11 GMT)
Enhancing Safety of Foundation Models for Visual Navigation through Collision Avoidance via Repulsive Estimation [6.2] CARE(Collision Avoidance via Repulsive Estimation)は、視覚に基づくナビゲーションのためのモジュールである。
これは、追加のレンジセンサーや事前訓練されたモデルの微調整を必要とせずに、視覚ベースのナビゲーションの安全性を高める。
CAREは、目標達成性能を犠牲にすることなく、一貫して衝突率(最大100%)を下げる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:02:15 GMT)
Auto prompt sql: a resource-efficient architecture for text-to-sql translation in constrained environments [6.2] 本稿では,リソース効率の良い小型オープンソースモデルと,テキスト翻訳のための大規模クローズドソースモデルの強力な機能とのギャップを埋めるために設計された,新しいアーキテクチャであるAuto Promptsql(AP-)を紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:04:46 GMT)
Uncertainty Quantification in Machine Learning for Biosignal Applications -- A Review [6.1] 不確実性定量化(UQ)は、機械学習予測の解釈可能性と堅牢性を改善するために、注目を集めている。
このアプリケーション領域に現在存在する様々な方法、欠点、不確実性対策、理論的枠組みについて述べる。
全体として、有望なUQ手法が利用可能であると結論付けることができるが、人やシステムが(クリニカルな)環境において不確実性モデルとどのように相互作用するかの研究が必要である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:47:07 GMT)
CMAR-Net: Accurate Cross-Modal 3D SAR Reconstruction of Vehicle Targets with Sparse-Aspect Multi-Baseline Data [6.0] マルチベースライン合成開口レーダ(SAR)3Dトモグラフィは重要なリモートセンシング技術である。
ディープラーニング(DL)は、強力なデータ駆動型表現機能と効率的な推論特性を通じて、この分野に革命をもたらす。
異種情報を融合させることにより3次元SAR画像の高精細化を実現する3D-SAR再構成ネットワーク(CMAR-Net)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:53:35 GMT)
RSVP: Reasoning Segmentation via Visual Prompting and Multi-modal Chain-of-Thought [6.0] RSVPは、多段階のマルチモーダル推論を基盤的な視覚的理解と統合するフレームワークである。
RSVPはMLLM固有のローカライゼーション機能を利用して、モデルがオブジェクトを推論するだけでなく、構造化された視覚表現を生成することができる。
実験では,ReasonSegの最先端性能を最大6.5 gIoUで上回り,ゼロショット設定でSegInW上で49.7 mAPを達成した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:07:40 GMT)
Sylva: Tailoring Personalized Adversarial Defense in Pre-trained Models via Collaborative Fine-tuning [6.0] textitSylvaは、クライアントごとにカスタマイズされた防御モデルを提供するために設計された、協調的な敵のトレーニングフレームワークである。
フェーズ1では、 textitSylva はLoRA を局所的な敵の微調整に使用し、クライアントがモデルの堅牢性をパーソナライズすることを可能にする。
フェーズ2では、良性データの精度を高めるために、ゲームベースの層選択戦略を導入する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:31:32 GMT)
Thinking Beyond Visibility: A Near-Optimal Policy Framework for Locally Interdependent Multi-Agent MDPs [6.0] 3つの閉形式ポリシーが様々な状況で計算可能であり、可視性に関して指数関数的に最適であることを示す。
これらのポリシーは、活力以上のエージェントを記憶することができるため、多くの小さな、固定された可視性設定において、大幅にパフォーマンスが向上する。
また,局所的相互依存型マルチエージェント MDP の一般化形式を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:30 GMT)
CARL: Causality-guided Architecture Representation Learning for an Interpretable Performance Predictor [6.0] ニューラルアーキテクチャサーチ(NAS)の評価段階を加速する有望な手法として、性能予測器が登場した。
本稿では,アーキテクチャのクリティカルな(因果的)特徴と冗長な(非因果的)特徴を分離し,一般化可能なアーキテクチャ性能予測を目的とした因果性誘導型アーキテクチャ表現学習(CARL)手法を提案する。
5つのNAS探索空間の実験は、CARLの最先端の精度と優れた解釈可能性を示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:30:55 GMT)
Better STEP, a format and dataset for boundary representation [6.0] コンピュータ支援設計(CAD)から生成された境界表現(B-rep)は、産業で広く使われており、いくつかの大きなデータセットが利用可能である。
これらのデータセットのデータはSTEP形式で表現され、CADカーネルがそれを読み取り処理する必要がある。
本稿では,オープンなクロスプラットフォームフォーマットであるHDF5と,STEPファイルに対応するデータセットをオープンソースライブラリと組み合わせてクエリと処理する代替フォーマットを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:52:07 GMT)
Fast Estimation of Partial Dependence Functions using Trees [6.0] 我々は,任意の部分依存関数を効率的に推定する木に基づく新しい推定器,textttFastPDを提案する。
任意の特徴部分集合に対するPD関数を推定することにより、 textttFastPD は SHAP や PD プロット、高次相互作用効果などの PD ベースの解釈を抽出することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:58:32 GMT)
Neurosymbolic Artificial Intelligence for Robust Network Intrusion Detection: From Scratch to Transfer Learning [6.0] 我々は、NIDSにおける堅牢性、解釈可能性、一般化を高めるために、ニューロシンボリックAIフレームワークであるODXUを拡張した。
我々は、異なるデータセット上で事前学習されたODXUモデルの再利用を可能にする転写学習戦略を開発する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:15:30 GMT)
Isharah: A Large-Scale Multi-Scene Dataset for Continuous Sign Language Recognition [5.8] 本稿では,連続SLRのための大規模マルチシーンデータセットであるIsharahを紹介する。
データセットは18人の聴覚障害者とプロのシグナーによる3万本のビデオクリップで構成されている。
また,複数の手話理解ベンチマークを導入し,手話に依存しないCSLRについて述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:48:21 GMT)
Schema Generation for Large Knowledge Graphs Using Large Language Models [5.8] 大規模言語モデル(LLM)を用いた自動スキーマ生成について検討する。
本ベンチマークでは,LLMの制約を構文的にリッチな定式化に推し進める構造生成の新たな課題について紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:25:16 GMT)
Hello, won't you tell me your name?: Investigating Anonymity Abuse in IPFS [5.8] 悪意あるアクターがIPFSを利用して悪意あるコンテンツをアップロード・拡散し、匿名のままにしておく方法を探る。
サービスとパブリックゲートウェイのピンニングの役割を評価し、コンテンツ可用性の維持におけるその機能と制限を特定します。
分析の結果,プライニングサービスやパブリックゲートウェイには悪意のあるコンテンツの拡散を評価・抑制するメカニズムが欠如していることが判明した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:54:56 GMT)
Explainable AI: XAI-Guided Context-Aware Data Augmentation [5.7] ラベル付きデータの不足は、堅牢で一般化可能なAIモデルを開発する上で、依然として根本的な課題である。
従来のデータ拡張技術はノイズを導入し、セマンティックドリフトを引き起こし、コンテキストコヒーレンスを乱し、制御が欠如し、過度に適合する。
我々は,XAIを用いたコンテキスト認識データ拡張を提案する。
提案手法は,説明可能性に基づく洞察に基づいて,複数の拡張サイクルにまたがる拡張データを改良する反復フィードバックループを統合する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:47:24 GMT)
Comprehensive Attribute Encoding and Dynamic LSTM HyperModels for Outcome Oriented Predictive Business Process Monitoring [5.6] 予測的ビジネスプロセスモニタリングは、進行中のビジネスプロセスの将来の結果を予測することを目的としています。
既存のメソッドは、同時イベントやクラス不均衡、マルチレベル属性といった現実世界の課題を扱う柔軟性に欠けることが多い。
本稿では,イベント属性とシーケンス属性の2レベル階層符号化を統合した動的LSTMハイパーモデルを提案する。
多次元埋め込みと時間差フラグ拡張を活用する、同時イベントモデリングのための特殊なLSTM変種。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:27:58 GMT)
Beyond the Norm: A Survey of Synthetic Data Generation for Rare Events [5.6] 市場崩壊、自然災害、パンデミックなどの極端な出来事は稀だが大惨事である。
データ駆動型メソッドは、極端なイベントモデリングに強力な機能を提供するが、豊富なトレーニングデータを必要とするが、極端なイベントデータは本質的に不足している。
この調査は、極端な事象に対する合成データ生成の最初の概要を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:21:23 GMT)
Differentially Private Distribution Release of Gaussian Mixture Models via KL-Divergence Minimization [5.6] 本稿では,GMMパラメータに厳格な乱摂動を付加するDP機構を提案する。
当社のアプローチは、高いユーティリティを維持しながら、強力なプライバシ保証を実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:40:24 GMT)
Photoreal Scene Reconstruction from an Egocentric Device [5.6] 既存の手法では、デバイスの視覚-慣性オドメトリーシステムから推定されるフレームレート6DoFのポーズを仮定する。
ローリングシャッターRGBセンシングカメラの正確なタイムスタンプと動きを校正するために、視覚慣性バンドル調整(VIBA)を用いる。
センサ特性を効果的に扱えるガウススプラッティングに物理画像形成モデルを組み込んだ。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:53:43 GMT)
Weisfeiler and Leman Go Gambling: Why Expressive Lottery Tickets Win [5.5] Lottery ticket hypothesis (LTH)は畳み込みニューラルネットワークによく研究されているが、グラフニューラルネットワーク(GNN)にのみ実証的に検証されている。
スパースワークの表現性、すなわち、非同型グラフを識別する能力は、予測性能を維持するための勝利チケットを見つけるのに不可欠である。
本研究は,低分子量GNNにおける表現性維持の重要性を浮き彫りにして,LTHおよびGNN研究の新たな理論的基盤を確立した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:10:59 GMT)
A kernel conditional two-sample test [5.5] 学習手法の信頼性境界を条件付き2サンプルテストに変換する。
アクセス不能なパラメータのチューニングを避けるためにブートストラップ方式を導入する。
その結果,条件付き2サンプルテストの総合的な基盤が確立された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:53:13 GMT)
Neural Path Guiding with Distribution Factorization [5.5] レンダリングにおけるモンテカルロ(MC)統合を支援する神経経路案内法を提案する。
十分表現力があり、合理的に高速な、単純で効果的な表現を提案する。
我々のアプローチは、特に複雑な光輸送を伴う挑戦的なシーンにおいて、既存の方法よりも優れている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:10:39 GMT)
Why Johnny Signs with Next-Generation Tools: A Usability Case Study of Sigstore [5.4] ソフトウェア署名は、ソフトウェアサプライチェーン内のコンポーネントの完全性と信頼性を保証する最も堅牢な方法です。
従来の署名ツールは、キー管理とシグナ識別の負担を実践者に課し、セキュリティ上の脆弱性とユーザビリティの課題に繋がる。
Sigstoreのような次世代の署名ツールはこれらの懸念を自動化しているが、それらのユーザビリティと採用のダイナミクスについてはほとんど知られていない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:10:22 GMT)
MACS: Multi-Agent Reinforcement Learning for Optimization of Crystal Structures [5.4] マルチエージェント結晶構造最適化(MACS)と呼ばれる新しいマルチエージェント強化学習法を提案する。
MACSは、幾何最適化を部分的に観測可能なマルコフゲームとして扱い、原子はそれらの位置を調整するエージェントであり、安定な構成を集合的に発見する。
我々は,MACSが周期結晶構造を著しく高速に最適化し,エネルギー計算を少なくし,故障率を低くすることを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:40:57 GMT)
Disentangling Rich Dynamics from Feature Learning: A Framework for Independent Measurements [5.4] 本稿では,(1)パフォーマンスから独立してリッチなレシエーションを定量化する尺度,(2)可視化のための解釈可能な特徴指標を紹介する。
CIFAR-10/100におけるVGG16とResNet18のバッチ正規化とトレーニングセットサイズが遅延/リッチダイナミクスに与える影響を明らかにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:53:51 GMT)
Model Internal Sleuthing: Finding Lexical Identity and Inflectional Morphology in Modern Language Models [5.3] 現代における大規模言語モデルがどのように語彙的同一性や屈折形態を表現しているかを考察する。
モデルは、初期層に線形に語彙情報を集中し、後期層に非線形に集中することを発見した。
注目すべきは、これらのパターンは、アーキテクチャ、サイズ、トレーニング体制の違いにもかかわらず、私たちがテストする16のモデルすべてに現れます。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:03:49 GMT)
VLMs Can Aggregate Scattered Training Patches [5.2] 視覚言語モデル(VLM)は、有害な画像を良質なパッチに分割することで、データモデレーションを回避することができることを示す。
VLMは、フルイメージまたはテキスト参照から、推論時に有害な応答を生成する。
「危険画像のパッチを使い、IDを「安全」や「安全でない」といったテキスト記述に置き換えることで、敵のデータ中毒のシナリオをシミュレートする。」
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:46:06 GMT)
A theoretical framework for overfitting in energy-based modeling [5.1] 相互作用ネットワークの同定を目的とした逆問題に対するペアワイズエネルギーベースモデルの学習における限られたデータの影響について検討する。
これらの時間スケールとトレーニングの初期条件との相互作用から早期停止の最適点が生じることを示す。
本稿では、スコアマッチングの下でのスコア関数のニューラルネットワークカーネルダイナミクスを導出することにより、任意のエネルギーベースモデルへの一般化を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:50:19 GMT)
DAS3D: Dual-modality Anomaly Synthesis for 3D Anomaly Detection [5.1] 本稿では3次元異常合成のための新しい2次元モード拡張法を提案する。
本稿では,再構成に基づく識別異常検出ネットワークを提案する。
提案手法は,検出精度において最先端の手法よりも優れ,競争力のあるセグメンテーション性能を実現する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:19:26 GMT)
HTSC-2025: A Benchmark Dataset of Ambient-Pressure High-Temperature Superconductors for AI-Driven Critical Temperature Prediction [5.0] HTSC-2025は, 常圧高温超伝導ベンチマークデータセットである。
このベンチマークは、AIベースの手法を用いて超伝導材料の発見を加速する上で重要な意味を持つ。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:14:00 GMT)
MM-IQ: Benchmarking Human-Like Abstraction and Reasoning in Multimodal Models [5.0] MM-IQは、視覚的推論問題4,776の大規模トレーニングセットと、8つの異なる推論パラダイムにまたがる2,710の精巧にキュレートされたテスト項目からなる総合的な評価フレームワークである。
最先端のアーキテクチャでさえ、ランダムなチャンスに対してわずかに優れたパフォーマンスしか達成できません。
近年の大規模推論モデルの増加にインスパイアされたベースラインとして,検証可能な報酬関数を用いた強化学習によってトレーニングされたマルチモーダル推論モデルもリリースした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:20:49 GMT)
Contrast-Invariant Self-supervised Segmentation for Quantitative Placental MRI [4.9] マルチエコーT2*重み付きMRIにおける相補的情報を活用するコントラスト拡張セグメンテーションフレームワークを提案する。
本手法は, (i) ラベルなしマルチエコスライスを用いた自己教師付き事前学習のためのマスク付き自動符号化 (MAE) , (ii) 教師なしドメイン適応のためのマスク付き擬似ラベル化 (MPL) , (iii) 微細な特徴をグローバルな解剖学的文脈と整合させるグローバルな局所的コラボレーションとを統合した。
臨床用マルチエコープラテンタルMRIデータセットを用いた実験により, エコー時間および単一エコーおよびナイーブ核融合の効率良く一般化できることが判明した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:31:04 GMT)
A Comprehensive Survey of Agents for Computer Use: Foundations, Challenges, and Future Directions [4.9] コンピュータ利用エージェント(英: Agents for Computer Use, ACU)は、デジタルデバイス上で複雑なタスクを実行できるシステムである。
急速な進歩にもかかわらず、ACUはまだ日々の使用には成熟していない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:30:14 GMT)
Exchange of Perspective Prompting Enhances Reasoning in Large Language Models [4.9] 大規模言語モデル(LLM)は、多種多様な自然言語処理(NLP)タスクに対処する上で大きな進歩を遂げてきた。
本稿では,問題定義の異なる視点の交換を目的とした新しいフレームワークであるExchange-of-Perspective(EoP)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:43:15 GMT)
Iterative Linear Quadratic Regulator for Quantum Optimal Control [4.8] 量子システムのゲート最適化に適応させることにより、反復線形二次制御器と量子最適制御との接続を確立する。
我々は,2レベルと3レベルを模擬した1ビットおよび2ビットの固定周波数トランスモン上で,Xおよびクロス共振ゲートの高忠実度シミュレーション結果を得た。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:36:59 GMT)
Generalized Statistics on Lattice [4.8] 任意の次元の格子におけるアベリア粒子の一般化統計と励起の普遍的研究法を提案する。
本手法は粒子とループのブレイディングと融合に関する統計を統一し, 膜励起に関する新しい統計の発見につながる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:44:31 GMT)
MambaNeXt-YOLO: A Hybrid State Space Model for Real-time Object Detection [4.8] YOLOシリーズモデルは、速度と精度のバランスをとることで、強力なベンチマークを設定している。
トランスフォーマーは自己アテンション機構のため、計算の複雑さが高い。
MambaNeXt-YOLOは精度と効率のバランスをとる新しいオブジェクト検出フレームワークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:46:24 GMT)
MamFusion: Multi-Mamba with Temporal Fusion for Partially Relevant Video Retrieval [4.7] 部分関連ビデオ検索(PRVR)は,マルチメディア検索分野における課題である。
本研究では,情報冗長性問題に対処するために,長時間の映像コンテンツ理解について検討する。
PRVRタスクに適した時間融合フレームワーク(MamFusion)を備えたマルチマンバモジュールを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:08:03 GMT)
Graph Counselor: Adaptive Graph Exploration via Multi-Agent Synergy to Enhance LLM Reasoning [4.7] GraphRAGは、知識関係を明示的にモデル化することで、外部知識統合機能を効果的に強化する。
既存の方法には2つの固有の制限がある。
マルチエージェント協調に基づくグラフRAG法であるGraph Counselorを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:31:21 GMT)
Brain-tuned Speech Models Better Reflect Speech Processing Stages in the Brain [4.7] 自己教師型音声モデルは、音声処理において優れているが、人間の音声処理の階層構造を反映しない。
近年の研究では、人間の脳記録を用いた脳チューニングモデルにより、音声モデルのセマンティック理解が改善されている。
脳に調整されたモデルの後期層は、セマンティック言語領域との整合性において、事前訓練されたモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:59:11 GMT)
Crowd-SFT: Crowdsourcing for LLM Alignment [4.6] 大規模言語モデル(LLM)は、監視された微調整(SFT)と人間フィードバックからの強化学習(RLHF)にますます依存している。
我々は,大規模なアノテータトレーニングを必要とせず,より広範なフィードバック収集を可能にする,クラウドソースのファインチューニングフレームワークを提案する。
本フレームワークは,Shapley値と相関するポイントベース報酬システムを通じてインセンティブフェアネスを促進し,反復モデル更新によるモデル収束を導出する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:26:38 GMT)
Understanding Physical Properties of Unseen Deformable Objects by Leveraging Large Language Models and Robot Actions [4.6] 変形性のような特別な特性を持つ見えないオブジェクトを扱うことは、従来のタスクやモーションプランニングアプローチでは難しい。
近年のLarge Language Models (LLM) ベースのタスクプランニングの結果は、目に見えないオブジェクトを推論する能力を示している。
課題計画のために,LLMを用いた非可視変形物体の物理的特性を探索する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:25:12 GMT)
Multimodal Biomarkers for Schizophrenia: Towards Individual Symptom Severity Estimation [4.6] 本研究は,マルチモーダルアプローチによる個々の症状推定に焦点を移す。
精度と重大性を改善するために,各モードに対する一様モデルとマルチモーダル・フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:35:08 GMT)
Video, How Do Your Tokens Merge? [4.6] ビデオトランスモデルは、入力の時間的スケーリングのために大量の計算資源を必要とする。
近年の手法では,ランダムに,あるいは学習した方法で,画像モデルのトークンをドロップまたはマージする手法が提案されている。
トークンのマージには多くのメリットがある。任意のトランスフォーマーやビジョンにプラグインすることができ、そうでなければモデルを通じてドロップされる情報を伝搬する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:28:23 GMT)
Estimating Total Lung Volume from Pixel-level Thickness Maps of Chest Radiographs Using Deep Learning [4.5] U-Net深層学習モデルを用いて, 胸部X線写真(CXR)と胸部X線写真(CXR)の総肺体積(TLV)を推定した。
平均二乗誤差 (MSE) , ピアソン相関係数 (r) , および両側学生のt分布を用いてモデル性能を評価した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:05:37 GMT)
Learning Fair And Effective Points-Based Rewards Programs [4.5] ポイントベースの報酬プログラムは、その実施における不公平な慣行の告発により精査されている。
ポイントベースの報酬プログラムを公平に設計する問題について検討し、その効果と公正性に反する2つの障害に着目した。
我々は、すべての顧客に対して同じ償還基準を使用する個人的公正報酬プログラムが、少なくとも1+ln 2$の損失を被っていることを示す。
本稿では,実験による点評価のリスクを制限する学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:05:16 GMT)
Grokking and Generalization Collapse: Insights from \texttt{HTSR} theory [4.4] MNISTの1kサンプルサブセットをトレーニングした3層構造を用いて,ニューラルネットワーク(NN)のグルーキング現象について検討した。
我々は、訓練の非常に遅くに起こる新しい第3段階(エンファンティ・グロッキング)を発見し、よく知られたエンファンティ・グロキングフェーズとは異なる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:34:37 GMT)
Sample Compression for Self Certified Continual Learning [4.4] 連続学習アルゴリズムは、一連のタスクから学習することを目的としており、トレーニング分布を静止しないものにしている。
提案手法はCoP2L(Continual Pick-to-Learn)と呼ばれ,各タスクの最も代表的なサンプルを効率的に保持することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:44:03 GMT)
Muted attack on a high-speed quantum key distribution system [4.3] 本研究では,最先端のSPADが導入したセキュリティの抜け穴を明らかにする。
本稿では,高速QKDシステムに対して,インターセプト・アンド・リセプト操作を必要としないミュート攻撃を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:49:25 GMT)
What LLMs Miss in Recommendations: Bridging the Gap with Retrieval-Augmented Collaborative Signals [4.3] ユーザとイテムのインタラクションには、多くの成功したレコメンデーションシステムのバックボーンを形成する、リッチなコラボレーティブなシグナルが含まれている。
大規模言語モデル(LLM)がこの種類の協調的な情報を効果的に説明できるかどうかは不明だ。
構造化された相互作用データにそれらの予測を基礎づけることによりLLMを強化する単純な検索拡張生成(RAG)手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:54:43 GMT)
MS-YOLO: A Multi-Scale Model for Accurate and Efficient Blood Cell Detection [4.2] 本研究は, YOLOv11フレームワークに基づく血液細胞検出モデルであるマルチスケールYOLO (MS-YOLO) を提案する。
MS-YOLOは検出性能を高めるために3つの重要なアーキテクチャ革新を取り入れている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:02:24 GMT)
Is Perturbation-Based Image Protection Disruptive to Image Editing? [4.2] 現在の画像保護法は、拡散ベースの編集を妨げるために、イメージに知覚できない摂動を追加することに依存している。
画像に対する完全な保護は、編集の試みの出力が望ましくないノイズの多い画像であることを意味する。
我々は、摂動に基づく手法は、拡散に基づく編集に対する堅牢な画像保護に十分な解決策を提供していないと論じる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:20:37 GMT)
Savage-Dickey density ratio estimation with normalizing flows for Bayesian model comparison [4.2] 本研究では,2つのネストモデル間のベイズ係数(エビデンス比)を計算するために,Savage-Dickey密度比を用いる。
我々は,スーパーモデルに多数の余剰パラメータを含む設定にスケール可能な正規化フローを用いたニューラルSDDR手法を提案する。
フィールドレベルの推論設定では、ベイズ因子がベイズ階層モデルとシミュレーションベース推論(SBI)アプローチの整合性を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:24 GMT)
A Reference Architecture for Gamified Cultural Heritage Applications Leveraging Generative AI and Augmented Reality [4.2] 本稿では,ジェネレーティブAIと拡張現実を活用した,ゲーミフィケーション文化遺産アプリケーションのためのリファレンスアーキテクチャを提案する。
ゲーミフィケーションはモチベーションを高め、人工知能は適応的なストーリーテリングとパーソナライズされたコンテンツを可能にする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:49:05 GMT)
How Does A Text Preprocessing Pipeline Affect Ontology Syntactic Matching? [4.2] 本稿では,第2相テキスト前処理による不要な偽マッピングを修復する2つの新しい手法を提案する。
ひとつはアドホックな論理に基づく修復手法で、オントロジー固有のチェックを用いて、偽のマッピングを引き起こす一般的な単語を見つける。
もう1つはポストホックLSMベースの修復アプローチです。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:11:00 GMT)
Relationship Detection on Tabular Data Using Statistical Analysis and Large Language Models [4.2] この研究は、知識グラフ(KG)を基準点として、CPAとして知られるタスクを用いて関係を検出するハイブリッドアプローチで実験する。
このアプローチは、潜在的KG関係の探索空間を減少させるために統計解析を用いて、大きな言語モデル(LLM)を利用する。
SemTab チャレンジによって提供される2つのベンチマークデータセットの実験評価は、各モジュールの影響と異なる最先端 LLM の有効性を評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:11:05 GMT)
FactsR: A Safer Method for Producing High Quality Healthcare Documentation [4.2] 本稿では,医療相談と並行して,健康な臨床情報をリアルタイムに抽出するFactsについて紹介する。
FactsR法は, ノート生成のクリニアン・イン・ザ・ループを配置することにより, より正確かつ簡潔な音符を生成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:39:39 GMT)
When Fairness Isn't Statistical: The Limits of Machine Learning in Evaluating Legal Reasoning [4.1] 機械学習(ML)技術を使用して、公正性、一貫性、偏見に対して法的判断がますます評価される。
難民の偏見のような高い領域では、結果の不一致を検出するためにしばしばそのような手法が用いられる。
しかし、統計的手法が判断、規範的複雑さ、限定的根拠の真理によって形作られた法的文脈における公正さを有意義に評価できるかどうかは不明である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:05:37 GMT)
Lower Ricci Curvature for Hypergraphs [4.0] 我々は,解釈可能性と効率のバランスを原則とする閉形式で定義された新しい曲率指標であるハイパーグラフ下曲率(HLRC)を導入する。
HLRCは、コミュニティ内のハイパーエッジの識別、潜在意味ラベルの発見、時間的ダイナミクスの追跡、グローバル構造に基づくハイパーグラフの堅牢なクラスタリングのサポートなど、有意義な高次の組織を一貫して明らかにしている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:32:09 GMT)
Simulating non-Abelian statistics of parafermions with superconducting processor [4.0] パラフェルミオンは深い非アベリア統計を示し、トポロジカルに順序づけられたシステムで現れる。
超伝導(SC)回路におけるパラフェミオンの量子シミュレーションのための新しい実験手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:20:28 GMT)
Puck Localization Using Contextual Cues [3.9] アイスホッケーの放送ビデオにおけるパック検出は重大な課題となっている。
以前の作品では、プレイヤーの振る舞いから派生したキューを明示的にモデル化することなく、パックの外観や動きに基づくキューに焦点を当てていた。
Puck Localization Using Contextual Cues (PLUCC) を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:25:10 GMT)
A Class Inference Scheme With Dempster-Shafer Theory for Learning Fuzzy-Classifier Systems [3.9] 本稿では,ファジィ分類システム(LFCS)を学習するための新しいクラス推論手法を紹介する。
DS理論を用いて、このスキームは特定のクラスごとに信念の質量を計算し、それぞれのファジィ規則から「I'''状態」を計算し、これらの信念の質量からクラスを推論する。
よりスムーズな決定境界を形成し、信頼性対策を提供し、現実のアプリケーションにおけるLFCSの堅牢性と一般化性を高める。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:38:49 GMT)
Mechanistic Decomposition of Sentence Representations [3.9] 文の埋め込みは現代のNLPとAIシステムの中心であるが、内部構造についてはほとんど知られていない。
文の埋め込みを解釈可能なコンポーネントに機械的に分解する新しい手法を提案する。
我々は,これらの特徴を文表現に圧縮する方法を解析し,文埋め込みに存在する潜在的特徴を評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:42:57 GMT)
Quantum Logic Spectroscopy of an Electron and Positron for Precise Tests of the Standard Model [3.9] 分光トラップ中の電子または陽電子は、ワイヤを介してリモート論理電子または陽電子に結合され、運動絡みを実現する。
2つのトラップを分離することにより、磁場、マイクロ波特性、検出感度を大幅に改善することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:07:54 GMT)
Spin-State Selective Excitation in Spin Defects of Hexagonal Boron Nitride [3.8] 六方晶窒化ホウ素(hBN)は量子センシングのための有望なプラットフォームとして出現している。
ここでは、円偏光マイクロ波駆動hBNにおける$V_textB-$スピン欠陥のスピン選択励起を実演する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:09:56 GMT)
Backbone Augmented Training for Adaptations [3.8] Backbone Augmented Training (BAT)は、バックボーンデータを活用して適応データセットを拡張する方法である。
ALBATは、パーソナライズタスクと言語生成タスクの両方において、少ないデータによる適応トレーニングを効果的に強化する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:09:33 GMT)
Transformers in Speech Processing: A Survey [3.7] トランスフォーマーは、音声認識、音声合成、音声翻訳、音声パラ言語学、音声強調、音声対話システム、マルチモーダルアプリケーションなど、様々な音声関連領域で注目を集めている。
本稿では,音声技術における様々な分野の研究を橋渡しすることを目的とした包括的調査を行う。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:06:21 GMT)
D2S-FLOW: Automated Parameter Extraction from Datasheets for SPICE Model Generation Using Large Language Models [3.7] D2S-FLOWは、高精度で効率の良いSPICEモデルを生成する自動化フレームワークである。
これは、構造化されていないドキュメントや一貫性のない命名規則を扱う際の精度を高めるワークフローを使用している。
これは0.86のエクサクトマッチ(EM)、0.92のF1スコア、0.96のエクサクト正確度(EC)を達成し、それぞれ19.4%、5.7%、13.1%という最強のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:17:52 GMT)
Phonon-limited valley life times in single-particle bilayer graphene quantum dots [3.7] 静電気的に定義されたBLG量子ドット(QD)において,パルスゲーティング法を用いて,数マイクロ秒を超える単一粒子谷緩和時間を報告した。
結合長の変化と変形電位による音響フォノンとの結合を制限機構として同定する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:54:41 GMT)
On the Usage of Gaussian Process for Efficient Data Valuation [3.7] 機械学習では、与えられたダタムがモデルトレーニングに与える影響を知ることは、データバリュエーションと呼ばれる基本的なタスクである。
我々は,データ評価手法を2つの部品の組み合わせとして分析できる新しい標準分解法を設計した。
提案手法の強みは, ベイズ理論の理論的根拠と, 効率的な更新式により評価値の高速な推定を可能にした実用的到達性の両方に起因している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:53:51 GMT)
MedEBench: Revisiting Text-instructed Image Editing on Medical Domain [3.7] MedEBenchはテキストガイドによる医用画像編集を評価するためのベンチマークである。
13の解剖学的領域にまたがる70のタスクにまたがる1,182の臨床ソースの画像プロンプトからなる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:55:29 GMT)
Latent Guided Sampling for Combinatorial Optimization [3.6] 最近の組合せ最適化手法は、深層学習を利用して解法戦略を学習し、監視学習または強化学習(RL)を通して訓練されている。
有望ではあるが、これらのアプローチは多くの場合、タスク固有の拡張に依存し、配布外のインスタンスではパフォーマンスが悪く、堅牢な推論機構が欠如している。
本稿では,効率的な問題インスタンスを条件づけた新しい潜在空間モデルLGS-Netを提案するとともに,効率的なニューラル推論手法であるLatent Guided Sampling(LGS)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:02:59 GMT)
ReXVQA: A Large-scale Visual Question Answering Benchmark for Generalist Chest X-ray Understanding [3.6] ReXVQAは胸部X線検査における視覚的質問応答(VQA)の最大かつ最も包括的なベンチマークである。
約696,000の質問と、トレーニング、検証、テストセットにわたる16万の胸部X線研究のペアで構成されている。
我々は,MedGemma-4B-it,Qwen2.5-VL,Janus-Pro-7B,Eagle2-9Bを含む8つの最先端マルチモーダル言語モデルを評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:11:59 GMT)
Training a Scientific Reasoning Model for Chemistry [3.5] 推論モデルは、追加のドメイン事前学習をすることなく、化学のための後処理が可能であることを実証する。
自然言語で推論し,化学構造に反応する24Bパラメータのether0を報告する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:57:18 GMT)
Acoustically Precise Hesitation Tagging Is Essential for End-to-End Verbatim Transcription Systems [3.5] 低ランク適応(LoRA)を用いたSpeak & Improve 2025コーパス上のWhisperモデルを微調整する
チャレンジ後の実験では、微調整のWhisper Large V3 Turboと"Extra"のスキームが5.5% WERとなった。
このことは、明示的でリアルなフルポーズラベリングが、動詞L2音声の書き起こしにおけるASRの精度を大幅に向上させることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:41:53 GMT)
A Novel Data Augmentation Approach for Automatic Speaking Assessment on Opinion Expressions [3.5] 与えられた熟練度の多様な応答を生成するための新しい訓練パラダイムを提案する。
応答を話者対応音声合成により合成音声に変換する。
マルチモーダルな大言語モデルは、整列したテキスト特徴と音声信号を統合して、習熟度を直接予測する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:42:53 GMT)
Robust Distributed Estimation: Extending Gossip Algorithms to Ranking and Trimmed Means [3.5] 本研究では,大域的にロバストな数値を推定することにより,外乱平均を計算することができることを示す。
我々は,textscGoRankと呼ばれるランク推定のための新しいゴシップアルゴリズムを提案し,それを応用して,トリミング平均推定専用のゴシップ手順を設計する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:26:25 GMT)
Unveiling Client Privacy Leakage from Public Dataset Usage in Federated Distillation [3.5] PDA-FD (Public dataset-assisted Federated Distillation) が広く採用されている。
本稿では,PDA-FDのプライバシを包括的に解析する手法を提案する。
PDA-FD設定に特化して設計された2つの新しい攻撃について紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:19:15 GMT)
Efficient Learning for Entropy-Regularized Markov Decision Processes via Multilevel Monte Carlo [3.4] 本稿では,固定点反復とベルマン作用素の一般近似を融合したマルチレベルモンテカルロアルゴリズムを提案する。
本稿では,Bellman演算子に対する偏平MC推定値を用いることで,準ポリノミカル標本の複雑さが生じることを示す。
特に、これらのアルゴリズムは状態空間や作用空間の次元や濃度に依存しない。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:50:44 GMT)
Enduring Disparities in the Workplace: A Pilot Study in the AI Community [3.4] 産学歴1260名のAI/MLプロフェッショナルを対象に,異なる軸をまたいだパイロット調査を行った。
その結果, 職場経験における疎外・疎外化サブグループの持続的格差が示唆された。
我々は、アクセシビリティは、ポジティブな職場環境にとって重要な課題であり、障害者の従業員は、非障害者の同僚よりも職場経験が劣っていることを強調する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:40:36 GMT)
AI Agents for Conversational Patient Triage: Preliminary Simulation-Based Evaluation with Real-World EHR Data [3.4] 実世界の患者との出会いを利用した患者シミュレータを提案する。
本シミュレータは,症状チェックエージェントを用いた患者プレゼンテーションとマルチターン会話に対して,現実的なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:56:08 GMT)
CRAWLDoc: A Dataset for Robust Ranking of Bibliographic Documents [3.4] CRAWLDocは、リンクされたWebドキュメントのコンテキストランク付けのための新しい方法である。
ランディングページとPDF、プロファイル、補足資料を含むすべてのリンクされたWebリソースを検索する。
アンカーテキストやURLとともに、これらのリソースを統一された表現に埋め込む。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:52:55 GMT)
Higher-Order Group Synchronization [3.4] グループ同期は、ネットワーク上のノイズの多い局所的な測定から信頼性の高いグローバル推定を決定する問題である。
ハイパーグラフ上で動作する新しい高階群同期問題を導入する。
数値実験により,本手法の潜在的な利点を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:10:26 GMT)
Multi-view Surface Reconstruction Using Normal and Reflectance Cues [3.3] 複数ビューの正規表現と任意の反射率マップを組み込んだ多目的フレームワークを,放射率に基づく表面再構成に導入する。
提案手法では, 反射率と表面の正常値の再パラメータ化を画素ワイドで行う。
本手法は, 細かな細部を再構築し, 難解な視認性条件に対処する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:09:16 GMT)
Adapting Rule Representation With Four-Parameter Beta Distribution for Learning Classifier Systems [3.2] 各問題に対して適切なルール表現を選択するのは難しい。
いくつかの問題は、入力空間内の異なる部分空間に対して異なる表現を使用することの恩恵を受ける。
本稿では,4パラメータのベータ分布を用いたフレキシブルなルール表現を紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:19:49 GMT)
Amplifying Human Creativity and Problem Solving with AI Through Generative Collective Intelligence [3.2] 両タイプの知能の能力を増幅する,人間とAIのコラボレーションのための汎用フレームワークを提案する。
我々はこれを生成的集団知能(Generative Collective Intelligence: GCI)と呼ぶ。
GCIは、対話エージェントとして、知識を蓄積、整理、活用する技術として、AIを二重の役割に採用している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:36:56 GMT)
From Understanding to Generation: An Efficient Shortcut for Evaluating Language Models [3.2] 本研究の目的は,NLGベンチマークの計算負担を低減し,モデルトレーニング中に重要なLCM機能を監視することである。
我々は生成タスクを計算的に安価にNLU代替品に再構成する。
その結果,タスク形式と,より安価な代替品による能力評価,評価時間の35倍以上の短縮を実現した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:46:40 GMT)
The Cost of Dynamic Reasoning: Demystifying AI Agents and Test-Time Scaling from an AI Infrastructure Perspective [3.1] 大規模言語モデル(LLM)ベースのAIエージェントは最近、動的推論を採用することで、印象的な汎用性を示した。
本稿では,AIエージェントを包括的に分析し,リソース使用量,遅延動作,エネルギー消費,テストタイムスケーリング戦略を定量化する。
その結果,エージェントは計算量の増加によって精度が向上する一方で,急速に低下するリターン,レイテンシのばらつきの拡大,持続不可能なインフラストラクチャコストに悩まされていることがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:37:54 GMT)
FragFM: Hierarchical Framework for Efficient Molecule Generation via Fragment-Level Discrete Flow Matching [3.1] 分子グラフ生成のためのフラグメントレベル離散フローマッチングによる新しい階層型フレームワークであるFragFMを紹介する。
FragFMはフラグメントレベルで分子を生成し、原子レベルで詳細を再構築するために粗いオートエンコーダを利用する。
また,現代分子グラフ生成モデルの天然物様分子生成能力を評価するための天然物生成ベンチマークも提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:15:54 GMT)
RULEBREAKERS: Challenging LLMs at the Crossroads between Formal Logic and Human-like Reasoning [3.1] RULEBREAKERSは、大規模な言語モデルによるルールブレーカーの認識と応答を人間的な方法で厳格に評価するための最初のデータセットです。
GPT-4oを含むほとんどのモデルでは、RULEBREAKERSの中間精度が得られ、典型的な人間の推論と異なり、論理規則を過度に適用する傾向が見られた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:55:15 GMT)
Do Large Language Models Know Folktales? A Case Study of Yokai in Japanese Folktales [2.9] 本研究は、民間人の知識、特に妖怪の知識を評価することに焦点を当てる。
妖怪(ようかい)は、現代でも芸術や娯楽のモチーフとして人気を博している日本の民俗に由来する超自然的な生き物である。
妖怪に関する知識を探索するために設計された809の多重選択質問からなるベンチマークデータセットである妖怪Evalを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:58:19 GMT)
FlashMLA-ETAP: Efficient Transpose Attention Pipeline for Accelerating MLA Inference on NVIDIA H20 GPUs [2.9] 本稿では,単一インスタンス配置シナリオに対するMLA推論を強化する新しいフレームワークであるFlashMLA-ETAPを紹介する。
ETAP は、KV コンテキスト長を WGMMA 操作の (M)-次元と整合させるために、変換による注意計算を再構成する。
FlashMLA-ETAPは64Kシーケンス長(バッチサイズ16)でのFlashMLAの2.78倍の高速化を実現し、それぞれFlashAttention-3とFlashInferの5.24倍と4.94倍の改善を実現している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:20:26 GMT)
A Multi-agent LLM-based JUnit Test Generation with Strong Oracles [2.9] ユニットテストは、ソフトウェアの正しさを保証する上で重要な役割を担います。
従来の手法は、テストを生成するために検索ベースまたはランダム化アルゴリズムに依存していた。
我々は、JUnitテストの自動生成のための新しいエンドツーエンドのプロンプトベースのフレームワークであるCANDORを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:43:39 GMT)
The Built-In Robustness of Decentralized Federated Averaging to Bad Data [2.8] 分散連合学習(DFL)は、中央コントローラに頼ることなく、複雑なネットワークトポロジ上でモデルを協調的にトレーニングすることを可能にする。
この設定では、ローカルデータはプライベートのままだが、その品質と量はノード間で大きく異なる可能性がある。
劣化したデータをノードのサブセットに均等に分散するシナリオと,単一ノードに集中するシナリオの2つをシミュレーションする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:47:33 GMT)
Make Some Noise! Measuring Noise Model Quality in Real-World Quantum Software [2.8] ノイズと不完全性は、現在のNISQシステムにおける量子ソフトウェア工学における主要な課題の一つである。
大規模量子シミュレータシステム上でのクラウスチャネル形式に基づく可変ノイズモデルの構築,実装,検証を行う。
我々は、IBM量子(IBMQ)システムによる経験的ノイズ測定を用いてモデルを校正し、現実的なシミュレーション環境を構築する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:28:10 GMT)
VCDiag: Classifying Erroneous Waveforms for Failure Triage Acceleration [2.7] VCDiagは機械学習を使って、故障した波形を分類し、潜在的な故障箇所を特定できる。
最上位3つのモジュールを識別する精度は94%を超えている。
様々なVerilog/SystemVerilogの設計とテストベンチに統合できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:44:03 GMT)
PRISM: A Transformer-based Language Model of Structured Clinical Event Data [2.6] PRISM(Predictive Reasoning in Sequential Medicine)は、臨床意思決定プロセスの逐次進行をモデル化するトランスフォーマーベースのアーキテクチャである。
孤立した診断分類に依存する従来のアプローチとは異なり、PRISMは、臨床軌跡をイベントのトークン化されたシーケンスとして表している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:48:32 GMT)
Adopt a PET! An Exploration of PETs, Policy, and Practicalities for Industry in Canada [2.6] プライバシー向上技術(PET)は、プライバシー問題に対する技術的な解決策である。
PETは、社会に利益をもたらすソリューションの開発を可能にすると同時に、データが使用されている個人のプライバシーを確保する。
プライバシー上の課題の増加と、世界中の政府によって提案されている新しい規制の増加にもかかわらず、PETの採用率は低い。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:16:58 GMT)
On the Practices of Autonomous Systems Development: Survey-based Empirical Findings [2.6] 本稿では,実践の確立に焦点をあてた縦断的研究の第1部について述べる。
結果は、自律的な機能を持ち、モデルベースのソフトウェアエンジニアリング(MBSwE)と再利用を採用するソフトウェアシステムに関するデータに基づいている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:44:12 GMT)
The Unified Cognitive Consciousness Theory for Language Models: Anchoring Semantics, Thresholds of Activation, and Emergent Reasoning [2.5] 大規模な言語モデル(LLMs)でのわずかなショットラーニングは、コアパラドックスを明らかにしている。
我々はLLMを無意識の基質として再認識するUCCT(Unified Cognitive Consciousness Theory)を導入する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:44:46 GMT)
Fast Convex Optimization with Quantum Gradient Methods [2.5] 雑音関数評価オラクルを用いた量子(サブ)次次推定に基づく量子アルゴリズムについて検討する。
滑らかな条件と非滑らかな条件の両方において、ゼロ階凸最適化のための最初の次元非依存的な問合せ複雑性を示す。
半定値プログラミングと固有値最適化の接続を利用して、量子ミラー降下法を用いて、半定値プログラム、線形プログラム、ゼロサムゲームを解決するための新しい量子アルゴリズムを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:55:57 GMT)
Learning Equilibria in Matching Games with Bandit Feedback [2.5] 一般化された二面マッチング市場における均衡学習の問題について検討する。
エージェントが選好を作成し、ゲームペイオフの楽観的な推定に基づいて選択する UCB アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:15:51 GMT)
Quantum entanglement in cosmology [2.5] 膨張する時空における絡み合いの生成は、重力粒子の生成現象に遡ることができる。
量子場から直接絡み合いを抽出するために、検出器として機能する追加の量子システムとの局所的な相互作用が提案されている。
まず、離散場の量子論で生じる絡み合いエントロピーの観点から、ベーケンシュタイン-ホーキングブラックホールエントロピーの解釈について考察する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:18:41 GMT)
LexTime: A Benchmark for Temporal Ordering of Legal Events [2.5] 法的テキストの時間的推論は、ケースロー解析やコンプライアンス監視といったアプリケーションにとって重要である。
法言語におけるイベント順序付け機能を評価するために設計された最初のデータセットであるLexTimeを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:06:27 GMT)
Explainability-Based Token Replacement on LLM-Generated Text [2.5] 我々は、AI生成テキスト(AIGT)の検出可能性を低減するために、説明可能なAI(XAI)手法をどのように利用できるかを検討する。
そこで本稿では,これらのトークンを修正するための4つの説明可能性に基づくトークン置換戦略を提案する。
以上の結果から,XAI手法によりAIGTの検出が困難になる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:15:42 GMT)
Relational reasoning and inductive bias in transformers trained on a transitive inference task [2.5] トランスフォーマーに基づくモデルは、顕著な推論能力を示してきたが、関係推論のメカニズムはいまだに理解されていない。
本研究では,トランスフォーマーが古典的リレーショナル推論タスクをどのように実行するかを検討する。
In-weights Learning (IWL) とIn-context Learning (ICL) の2つの異なる学習形態における推移的推論挙動を比較する。
これらの結果は、基礎構造を持つタスクの事前学習が、文脈内関係推論を足場とした表現の開発を促進することを示唆している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:15:05 GMT)
TRiSM for Agentic AI: A Review of Trust, Risk, and Security Management in LLM-based Agentic Multi-Agent Systems [2.5] 本稿では,エージェントマルチエージェントシステムにおける信頼・リスク・セキュリティ管理(TRiSM)の構造的分析について述べる。
エージェントAIフレームワークのTRiSMは、ガバナンス、説明可能性、ModelOps、プライバシ/セキュリティの4つの柱を通じて詳細に説明される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:26:11 GMT)
SAEBench: A Comprehensive Benchmark for Sparse Autoencoders in Language Model Interpretability [2.5] SAEBenchは8つのメトリクスにわたるSAEパフォーマンスを測定する総合的な評価スイートである。
最近提案された8つのSAEアーキテクチャとトレーニングアルゴリズムをまたいだ200以上のSAEスイートをオープンソースにしています。
評価の結果,プロキシメトリクスのゲインは,実用的なパフォーマンスに確実に変換されないことがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:27:28 GMT)
Deterministic Apple Tasting [2.5] 我々は、初めて広く適用可能な決定論的リンゴテイスティング学習者を提供する。
すべてのクラス $mathcalH$ は簡単、困難、あるいは学習不能でなければならない、という三分法を証明します。
我々の上限は、リンゴの味付けフィードバックに関する専門家のアドバイスから学ぶための決定論的アルゴリズムに基づいている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:13:38 GMT)
The Hashed Fractal Key Recovery (HFKR) Problem: From Symbolic Path Inversion to Post-Quantum Cryptographic Keys [2.4] 本稿では,記号力学とカオス摂動に基づく非代数的暗号構造であるHFKR問題を紹介する。
HFKRはSymbolic Path Inversion Problem (SPIP)に基づいており、$mathbbZ2$以上の契約型アフィンマップから生成されるシンボリックトラジェクトリを活用し、ハッシュベースの難読化を用いてそれらを固定長の暗号鍵に圧縮する。
250回の摂動試験による実験結果から、SHA3-512とSHAKE256はシンボルの発散を効果的に増幅し、255付近の平均ハミング距離、理想的なビットフリップ速度、無視可能なエントロピー偏差を達成していることが示された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:54:33 GMT)
DCE-LLM: Dead Code Elimination with Large Language Models [2.4] 我々は、小さなCodeBERTモデルを用いて、デッドコードの自動除去のためのフレームワークであるDCE-LLMを提案する。
LLMは、大規模な注釈付きデッドコードデータセットに基づいて微調整された判断と説明を生成する。
実験の結果、DCE-LLMは未使用のコードに対して94%以上のF1スコアを獲得し、GPT-4oを30%以上上回った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:41:30 GMT)
LSC-Eval: A General Framework to Evaluate Methods for Assessing Dimensions of Lexical Semantic Change Using LLM-Generated Synthetic Data [2.4] レキシカル・セマンティック・チェンジ(Lexical Semantic Change、LSC)は、文化的・社会的ダイナミクスに関する洞察を提供する。
異なる種類のLCCを測定する方法の妥当性は、過去のベンチマークデータセットがないために確立されていない。
本稿では,新しい3段階汎用評価フレームワーク LSC-Eval を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:38:11 GMT)
Automatically Detecting Amusing Games in Wordle [2.3] RedditユーザーからWordleゲームへの約80万の反応をRedditから取り除いた。
本研究は,OpenAI の GPT-3.5 を用いて,アミューズメントを表現した反応を分類する。
ユーザアミューズメントを予測できるWordleゲームから特徴を抽出する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:17:53 GMT)
Optimal Spiking Brain Compression: Improving One-Shot Post-Training Pruning and Quantization for Spiking Neural Networks [2.3] スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアの実装に適したエネルギー効率の良いニューラルネットの新世代として登場した。
近年,SNNの効率向上のために,軽量プルーニングと量子化が検討されている。
そこで我々は,SNNのための新しいワンショット訓練後プルーニング/量子化フレームワーク,OSBC(Optimal Spiking Brain Compression)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:23:05 GMT)
Optimizing Sensory Neurons: Nonlinear Attention Mechanisms for Accelerated Convergence in Permutation-Invariant Neural Networks for Reinforcement Learning [2.2] 訓練強化学習(RL)エージェントは、しばしば重要な計算資源を必要とし、訓練時間を延長する。
私たちは、強化学習タスクのための新しいニューラルネットワークを導入した、Google BrainのSensory Neuronによって構築された基盤の上に構築しました。
本稿では,キーベクトル(K)の非線形変換をマッピング関数を用いて組み込んだ改良されたアテンション機構を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:54:50 GMT)
Point Cloud Quality Assessment Using the Perceptual Clustering Weighted Graph (PCW-Graph) and Attention Fusion Network [2.2] No-Reference Point Cloud Quality Assessment (NR-PCQA)は、参照モデルが利用できない現実世界のアプリケーションにおいて、3Dコンテンツを評価するために重要である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:44:03 GMT)
Easy attention: A simple attention mechanism for temporal predictions with transformers [2.2] キー,クエリ,ソフトマックスは,時間的シーケンスにおける長期依存を捉えるのに必要な注意点を得るのに必要ではないことを示す。
提案手法は,注意点を直接学習可能なパラメータとして扱う。
この手法はカオスシステムの時間的ダイナミクスの再構築と予測において優れた結果をもたらす。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:50:20 GMT)
Improving Regulatory Oversight in Online Content Moderation [2.1] 欧州連合は、デジタルプラットフォームに関連するリスクに対処し、より安全なオンライン環境を促進するために、デジタルサービス法(DSA)を導入した。
透明性データベース(Transparency Database)や透明性レポート(Transparency Reports)、プラットフォーム透明性を改善するためのDSAの第40条といったコンポーネントの可能性にもかかわらず、大きな課題は残る。
データの不整合や詳細な情報の欠如など,コンテンツのモデレーションプラクティスの透明性を損なうものもあります。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:38:25 GMT)
Biased by Design: Leveraging AI Inherent Biases to Enhance Critical Thinking of News Readers [2.1] 本稿では,Large Language Models (LLM) を用いたプロパガンダ検出ツールの設計について検討する。
AIモデルの本質的偏見、特に政治的文脈において、これらの偏見をどのように活用してニュース消費における批判的思考を強化するかを検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:15:23 GMT)
Random-key genetic algorithms: Principles and applications [2.1] ランダムキー遺伝的アルゴリズムは、離散的および大域的最適化のための進化的メタヒューリスティックである。
この章はランダムキー遺伝アルゴリズムをレビューし、バイアスドランダムキー遺伝アルゴリズムと呼ばれる効果的な変種を記述する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:44:05 GMT)
Transportation cost and contraction coefficient for channels on von Neumann algebras [2.1] 我々はフォン・ノイマン代数に作用する量子チャネルに対する非可換な最適輸送フレームワークを提案する。
リプシッツのコスト測定は、与えられたチャネルを介して量子状態の間を移動するのに必要な最小のコストを評価する。
これに伴うリプシッツ収縮係数は、チャネルが状態間のワッサーシュタイン型距離をどれだけ収縮するかをキャプチャする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:42:33 GMT)
SubSearch: Robust Estimation and Outlier Detection for Stochastic Block Models via Subgraph Search [2.1] 本稿では,SBMパラメータを頑健に推定するアルゴリズムを提案する。
また,本手法は外れ値検出手法として機能し,グラフがモデルから逸脱する原因となるノードを適切に同定し,高次ノードを刈り取るといった単純な手法を克服する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:47:25 GMT)
Self-Supervised Autoencoder Network for Robust Heart Rate Extraction from Noisy Photoplethysmogram: Applying Blind Source Separation to Biosignal Analysis [2.1] 本稿では,PPG信号からソース信号を分離する自己教師型オートエンコーダ(MEAE)を提案する。
MEAEは、事前処理やデータ選択なしに、大きなオープンポリソノグラフィーデータベースからのPSG信号に基づいて訓練される。
抽出された心拍信号は、元のPGと比較してHR検出を大幅に改善する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:48:13 GMT)
Improved Uncertainty Quantification in Physics-Informed Neural Networks Using Error Bounds and Solution Bundles [2.1] 我々は、PINNが提供する微分方程式系の解に関する不確実性を提供するベイズニューラルネットワークを訓練する。
我々はPINN上で利用可能な誤差境界を用いて不確実性推定を改善する不確定分散を定式化する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:12:39 GMT)
CPS-Guard: Framework for Dependability Assurance of AI- and LLM-Based Cyber-Physical Systems [2.1] CPS(Cyber-Physical Systems)は、重要なアプリケーションで運用する高度なAI技術に依存している。
従来の検証と検証方法は、AIコンポーネントの予測不可能でダイナミックな性質を扱うのに苦労することが多い。
我々は、AIによるCPSの反復保証プロセスを自動化するために、マルチロールオーケストレーションを利用する新しいフレームワークであるCPS-Guardを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:04:21 GMT)
OV-COAST: Cost Aggregation with Optimal Transport for Open-Vocabulary Semantic Segmentation [2.0] Open-vocabulary semantic segmentation (OVSS)では、画像の各ピクセルにセマンティックラベルを割り当てる。
オープン語彙セマンティックセグメンテーションのためのOV-COASTを用いたコストアグリゲーションを提案する。
提案手法は,VT-Bバックボーンを用いたコスト集約モデルCAT-Segの性能を顕著に向上させるものである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:36:56 GMT)
AetherVision-Bench: An Open-Vocabulary RGB-Infrared Benchmark for Multi-Angle Segmentation across Aerial and Ground Perspectives [2.0] 身近なAIシステムは、認識能力を高めて、地上車両やドローンの自律的なナビゲーションを変革している。
AetherVision-Benchは空中および地上の多角的セグメンテーションのベンチマークである。
提案したベンチマークを用いて最先端のOVSSモデルを評価し,ゼロショット転送モデルの性能に影響を及ぼす要因について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:41:19 GMT)
From Virtual Agents to Robot Teams: A Multi-Robot Framework Evaluation in High-Stakes Healthcare Context [2.0] 現在のフレームワークは、エージェントを物理的に具体化されたエンティティではなく、概念的なタスク実行子として扱う。
本稿では,プロセスの透明性,前向きな障害回復,コンテキストグラウンド化を重視した3つの設計ガイドラインを提案する。
我々の研究は、よりレジリエントで堅牢なマルチエージェントロボットシステムの開発を知らせる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:05:38 GMT)
MMM4Rec: A Transfer-Efficient Framework for Multi-modal Sequential Recommendation [2.0] Sequential Recommendation (SR)システムでは、インタラクション履歴を分析してユーザの好みをモデル化する。
現在の手法は、新しいドメインに適応する際にかなりの微調整コストを発生させる。
MMM4Recは、効率的な伝達学習のための専用代数的制約機構を組み込んだ、新しいマルチモーダルSRフレームワークである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:42:22 GMT)
ViTSGMM: A Robust Semi-Supervised Image Recognition Network Using Sparse Labels [2.0] ViTSGMMは、半教師付き学習を高い効率で活用する画像認識ネットワークである。
特徴表現と対象クラス間の相互情報を最適化し,階層的な混合密度分類決定機構を構築する。
また,半教師付き学習タスクのためのSTL-10データセットにおいて,長年見過ごされてきたデータ漏洩問題も明らかにした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:24:28 GMT)
REAL: Response Embedding-based Alignment for LLMs [2.0] よりあいまいな選好ペアの獲得に焦点を当てた高品質なトレーニングデータセットを構築するための戦略を提案する。
実験により、異なる応答対を選択することで、LSMの直列化が促進されることが示された。
異なるペアにフォーカスすることでラベルエラーを低減し,LLMアライメント効率を向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:32:37 GMT)
GARG-AML against Smurfing: A Scalable and Interpretable Graph-Based Framework for Anti-Money Laundering [1.9] マネーロンダリングは世界のGDPの2%-5%を占めると見積もられている。
GARG-AMLは、単一の解釈可能なメートル法によってシャムリングリスクを定量化する新しいグラフベースの手法である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:30:37 GMT)
Quantum Algorithm for Vibronic Dynamics: Case Study on Singlet Fission Solar Cell Design [1.9] 実空間における一般的なビブロンハミルトニアンの下での時間発展をシミュレーションするための量子アルゴリズムを提案する。
そこで本研究では,より効率的な一重項核分裂型有機太陽電池の設計のための材料発見パイプラインへのアルゴリズムの初歩的な統合の証明について概説する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:42:33 GMT)
Unsupervised Meta-Testing with Conditional Neural Processes for Hybrid Meta-Reinforcement Learning [1.9] Unsupervised Meta-Testing with Conditional Neural Processes (UMCNP) は、メタ強化学習(meta-RL)法である。
本稿では,2D-Point Agentと連続制御メタRLベンチマークのベースラインよりも,メタテスト中のサンプルをはるかに少なくして,未確認のテストタスクに適応できることを実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:27:47 GMT)
Pruning Everything, Everywhere, All at Once [1.8] ディープラーニングモデルにおけるプルーニング構造は、モデルの複雑さを効率的に低減し、計算効率を向上させる。
本稿では,モデル内で異なる構造を抽出できる新しい手法を提案する。
このプロセスを反復的に繰り返すことは、元の予測能力を保った非常にスパースなモデルを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:34:28 GMT)
Is linguistically-motivated data augmentation worth it? [1.7] データ拡張には、利用可能なトレーニングデータの強化に使用される合成データ例を生成することが含まれる。
これまでの研究では、言語的に内在的かつ言語的に動機づけられたデータ拡張戦略の体系的、実証的な比較は行われていない。
低リソース言語に対する2つの重要なシーケンス・ツー・シーケンス・タスクにおいて,多くの異なる戦略とその組み合わせの有効性を評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:48:20 GMT)
DRIFTS: Optimizing Domain Randomization with Synthetic Data and Weight Interpolation for Fetal Brain Tissue Segmentation [1.7] 胎児脳MRIにおけるSynthSeg法における領域外一般化ポテンシャルの最大化について述べる。
我々はDRIFTSを単一ソース領域の一般化のための効果的かつ実用的なソリューションとして提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:56:48 GMT)
Matter-of-Fact: A Benchmark for Verifying the Feasibility of Literature-Supported Claims in Materials Science [1.7] 本稿では,仮説の妥当性をクレームとして決定するための課題データセットであるMatter-of-Factを紹介する。
科学的文献やコード生成に比較して,検索の強化を含む強力なベースラインが72%以上の性能を達成できないことを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:43:18 GMT)
Can Vision Language Models Infer Human Gaze Direction? A Controlled Study [1.7] 迷路参照推論は、自然とAIの相互作用を支える心の理論の重要な構成要素である。
111個の視覚言語モデル (VLM) を用いて, 難易度と変動度を操作した写真を用いて, このスキルを評価した。
その結果、111個のVLMのうち94個のVLMはランダムな推測よりもうまく機能せず、人間は近いシーリング精度を達成できた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:25 GMT)
Comparative Analysis of AI Agent Architectures for Entity Relationship Classification [1.7] 本研究では,3つの異なるAIエージェントアーキテクチャの比較分析を行い,関係分類を行う。
エージェントアーキテクチャは,(1)反射的自己評価,(2)階層的タスク分解,(3)新しいマルチエージェント動的サンプル生成機構を含む。
実験により,マルチエージェントの協調が標準のショットプロンプトより一貫して優れていることが実証された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:21:02 GMT)
The Yang-Baxter integrability of the critical Ising chain [1.7] 一次元臨界逆場イジングモデルがヤン・バクスター積分可能であることを示す。
また、周期的横フィールドイジングモデルに対するクラマース・ワニエ双対性や他の非可逆対称性も見出す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:57:24 GMT)
Spatially Resolved Meteorological and Ancillary Data in Central Europe for Rainfall Streamflow Modeling [1.7] 本稿では,完全に空間的に解決された降水流モデリングのためのデータセットを提案する。
我々はドナウ川上流,エルベ川,オーデル川,ライン川,ウェザー川の5つの流域を網羅したデータを収集した。
データは通常の9km×9kmグリッドに調和し、1981年10月から2011年9月までの日々の値を含んでいる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:44:33 GMT)
Labeling without Seeing? Blind Annotation for Privacy-Preserving Entity Resolution [1.6] 本稿では,同相暗号に基づく新しいブラインドアノテーションプロトコルを提案する。
実地真実と比較して,我々のプロトコルが90%以上達成されていることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:36:34 GMT)
Fine-Tuning Video Transformers for Word-Level Bangla Sign Language: A Comparative Analysis for Classification Tasks [1.6] 手話認識には、画像やビデオから手話の自動識別と分類が含まれる。
バングラデシュでは、バングラ手話は聴覚障害を持つ多くの人々のコミュニケーションの主要な手段である。
そこで本研究では,小規模BdSLデータセット上での最先端のビデオトランスフォーマーアーキテクチャについて述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:29:32 GMT)
Video Deblurring with Deconvolution and Aggregation Networks [1.6] ビデオデブロアリングのためのデコンボリューション・アグリゲーションネットワーク(DAN)を提案する。
DANでは、3つのサブネットワークを通じてデコンボリューションとアグリゲーションの戦略が達成される。
3つのサブネットワークの適切な組み合わせは、隣のフレームを好適に使用することにより、映像劣化に対して良好な性能を得ることができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:19:11 GMT)
Joint Video Enhancement with Deblurring, Super-Resolution, and Frame Interpolation Network [1.6] 本稿では,複数の劣化要因を同時に緩和するジョイントビデオ強調手法を提案する。
提案するDSFNは,低解像度,低フレームレート,ぼやけたビデオから,高解像度,高フレームレート,クリアなビデオを直接生成する。
実験の結果,提案手法は,公開データセット上での他のシーケンシャルな最先端技術よりも優れていた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:38:51 GMT)
Edge interventions can mitigate demographic and prestige disparities in the Computer Science coauthorship network [1.6] 本稿では,Ph.D.グラッティングコンピュータサイエンス部門に勤務する米国拠点の5,670人の教員を対象に,ネットワーク中心性の不等式について検討する。
人種をマイノリティ化した女性や個人は、コンピュータサイエンスコオーサシップネットワークにおいて、あまり中心的な存在ではないことが分かりました。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:36:24 GMT)
What do professional software developers need to know to succeed in an age of Artificial Intelligence? [1.6] ジェネレーティブAIは、ソフトウェア開発者にとって生産性向上の初期の証拠を見せている。
我々は、AIの使用の最先端にいる21人の開発者による研究について述べ、彼らが発見した12の作業目標と75の関連するタスク、それぞれに関するスキルと知識をまとめています。
私たちは、成功するAI開発者になるためのスキルと知識が、4つのドメインにまとめられていることに気づきました。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:32:53 GMT)
Domain Adaptation Method and Modality Gap Impact in Audio-Text Models for Prototypical Sound Classification [1.6] 音声テキストモデルの性能は背景音源の存在によって著しく低下することを示す。
そこで本研究では,背景資料の分類過程への寄与を定量化し,統合する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:45:51 GMT)
Temporal horizons in forecasting: a performance-learnability trade-off [1.6] 地平線が短すぎると長期的な傾向を見逃しかねないが、地平線は予測誤差の蓄積によって収束を妨げる。
カオスシステムでは、損失ランドスケープの粗さはトレーニングの地平線とともに指数関数的に増大する。
また,長い地平線でトレーニングしたモデルは短期的な予測によく当てはまるが,短い地平線でトレーニングしたモデルはカオス(周期的)システムにおいて指数関数的に(線形的に)悪い長期的な予測に苦しむ。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:34:22 GMT)
DSSAU-Net:U-Shaped Hybrid Network for Pubic Symphysis and Fetal Head Segmentation [1.5] 本稿では,性能と計算効率の優れた疎結合型自己アテンションネットワークアーキテクチャを提案する。
本手法では,各段のDual Sparse Selection Attention (DSSA)ブロックを用いて,対称なU字型エンコーダ・デコーダネットワークアーキテクチャを構築する。
DSSAU-Netの性能は2024年のIUGC(Intrapartum Ultrasound Grand Challenge)を用いて検証されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:14:18 GMT)
Universal Adversarial Attack on Aligned Multimodal LLMs [1.4] マルチモーダル大規模言語モデル(LLM)に対する普遍的敵攻撃を提案する。
私たちは、ターゲットとするフレーズや、その他の安全でないコンテンツでモデルに応答するよう強制する合成画像を作成します。
コードとデータセットはApache-2.0ライセンスでリリースします。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:10:51 GMT)
Confidence-Guided Human-AI Collaboration: Reinforcement Learning with Distributional Proxy Value Propagation for Autonomous Driving [1.4] 本稿では,これらの制約を克服するために,信頼誘導型人間-AIコラボレーション(C-HAC)戦略を開発する。
C-HACは、人間との相互作用を最小限に抑えたヒト誘導政策の迅速かつ安定した学習を実現する。
様々な運転シナリオに対する実験により、C-HACは安全性、効率、全体的な性能において従来の方法よりも大幅に優れていたことが判明した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:31:10 GMT)
MacroSwarm: A Field-based Compositional Framework for Swarm Programming [1.4] 本稿では,新しいフィールドベースのコーディネーション手法であるMacroSwarmを提案し,Swarmの動作を設計・プログラムする。
集約コンピューティングのマクロプログラミングパラダイムに基づいて、MacroSwarmは、各Swarm動作ブロックを純粋関数として表現するという考え方に基づいている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:39:12 GMT)
On the Wasserstein Geodesic Principal Component Analysis of probability measures [1.3] 目的は、基礎となるデータセットの変動のモードを最もよく捉える確率測度空間における測地線曲線を特定することである。
まず、ガウス分布の集合のケースに対処し、可逆線型写像の空間における計算を解く方法を示す。
絶対連続確率測度のより一般的な設定のために、ワッサーシュタイン空間の測地線をニューラルネットワークでパラメータ化するための新しいアプローチを利用する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:00:43 GMT)
Multi-Agent Security Tax: Trading Off Security and Collaboration Capabilities in Multi-Agent Systems [1.3] 我々は、セキュリティリスクとトレードオフを研究するために、共有目的に基づいて協力するAIエージェントのシミュレーションを開発する。
我々は、悪意のある指示の多重ホップ拡散という、感染した悪意のあるプロンプトを観察する。
この結果から,マルチエージェントシステムにおけるセキュリティと協調効率のトレードオフの可能性が示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:25:06 GMT)
A framework for Conditional Reasoning in Answer Set Programming [1.2] 我々は、条件付き解集合プログラミング(ASP)の条件付き拡張を定義するための条件付き解集合プログラミングフレームワーク(Conditional ASP)を紹介する。
このアプローチは、典型的な条件付き論理と、条件付き知識ベースとASPプログラムの組み合わせに基づいて構築され、プログラムの応答セットに対する条件付き推論を可能にする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:25:34 GMT)
Music Interpretation and Emotion Perception: A Computational and Neurophysiological Investigation [1.2] 本研究では,音楽演奏における感情表現と知覚について,計算的・神経生理学的手法を用いて検討した。
演奏者の情緒的コミュニケーションやリスナーの反応に及ぼすレパートリー,ダイアトニック・モーダル・オード,即興性,表現性のレベルなどの異なる演奏設定の影響について検討した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:16:47 GMT)
Gradient flow in parameter space is equivalent to linear interpolation in output space [1.2] 深層学習における多くの学習アルゴリズムの基盤となるパラメータ空間の標準流れは、適応的な勾配流に連続的に変形可能であることを証明した。
L2$損失の場合、パラメータに関する出力のヤコビアンがフルランクであれば、時間変数は単純に線形となるように再パラメータ化できる。
クロスエントロピー損失の場合、同じランク条件の下でラベルが正の成分を持つと仮定すると、一意な大域最小値に対する明示的な公式が導出される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:45:16 GMT)
FPGA-Enabled Machine Learning Applications in Earth Observation: A Systematic Review [1.2] FPGAは、ミッション固有の要求への適応性とパフォーマンスのバランスをとり、オンボードでのデプロイメントを可能にする。
本稿では,遠隔センシングアプリケーションのためのFPGA上に機械学習モデルをデプロイする66の実験を系統的に分析する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:30:47 GMT)
Facts are Harder Than Opinions -- A Multilingual, Comparative Analysis of LLM-Based Fact-Checking Reliability [1.1] 本稿では,複数の言語やトピックに61,514のクレームを含む新しい動的データセットを導入し,既存のデータセットを2024年まで拡張する。
GPT-4o, GPT-3.5 Turbo, LLaMA 3.1, Mixtral 8x7B の5つの主要言語モデル(LLM)を評価した。
すべてのモデルにおいて、事実に耳を傾ける主張は意見よりもしばしば誤分類され、重要な脆弱性が明らかになる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:47:21 GMT)
Dropout-Robust Mechanisms for Differentially Private and Fully Decentralized Mean Estimation [1.1] 本研究では, 分散平均推定のための新しいプロトコルを提案し, 差分プライバシーを強制する。
差分プライバシーを強制するプロトコルでは、集中的なオーケストレーションを必要とせず、低分散相関雑音を用いる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:16:34 GMT)
Differences between Neurodivergent and Neurotypical Software Engineers: Analyzing the 2022 Stack Overflow Survey [1.1] 神経多様性に関するデータを収集した2022 Stack Overflow Developer Surveyのデータを分析した。
専門技術者の回答を, ASD, ADHD, Dylexia とニューロタイプ技術者の回答を定量的に比較した。
神経分極性エンジニアは神経型技術者よりも困難に直面することが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:17:03 GMT)
A Kernel-Based Approach for Accurate Steady-State Detection in Performance Time Series [1.0] 目標は、未精度または非効率な性能分析につながる可能性のある、未成熟または遅延検出を回避する方法を導入することである。
提案手法は化学反応器領域の手法に適応し、オンラインで定常状態を検出する。
その結果,新しい手法は最先端手法と比較して誤差を14.5%削減することがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:48:42 GMT)
A Poisson-Guided Decomposition Network for Extreme Low-Light Image Enhancement [1.0] 本稿では,Retinex に基づく分解と Poisson を統合型エンコーダデコーダネットワークに統合した軽量な深層学習手法を提案する。
低照度条件下での視認性と明度は, 環境光下での画像構造と色濃度を保ちながら著しく向上する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:40:01 GMT)
Hierarchical Text Classification Using Contrastive Learning Informed Path Guided Hierarchy [1.0] コントラスト学習インフォームドパスガイド階層(HTC-CLIP)を用いた階層型テキスト分類を提案する。
HTC-CLIPは、コントラスト学習を用いて、階層対応テキスト表現とテキスト情報経路案内階層表現を学習する。
以上の結果から,従来の2つのアプローチを1つのアーキテクチャに効果的に組み合わせて,性能向上を実現できることが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:51:34 GMT)
Building a Few-Shot Cross-Domain Multilingual NLU Model for Customer Care [1.0] 注釈付きデータに微調整された多言語BERTのようなSOTA事前訓練されたモデルは、顧客ケアに関連する下流タスクにおいて優れたパフォーマンスを示している。
本稿では,いくつかのラベル付きサンプルを用いて,最先端のドメイン固有モデルを他のドメインに拡張する組込みモデルアーキテクチャを提案する。
カナダとメキシコのeコマース Customer Careデータセットを数ショットで検出する実験では、精度が20~23%向上した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:14:48 GMT)
Comparing the Effects of Persistence Barcodes Aggregation and Feature Concatenation on Medical Imaging [1.0] 医用画像解析において、特徴工学は機械学習モデルの設計と性能において重要な役割を果たす。
持続的トポロジカルな特徴と幾何学的特徴を永続的バーコードとして保存する。
分類モデルの性能に対する2つのアプローチの効果を比較した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:50:55 GMT)
Behavioural vs. Representational Systematicity in End-to-End Models: An Opinionated Survey [0.9] 構成性、体系性の中核的な側面は、MLモデルにおいて望ましい性質である。
既存のベンチマークとモデルは、主に振る舞いの体系性に焦点を当てている。
ハドリーの体系的一般化の分類に基づいて、行動的体系性がどのようにテストされるかを分析する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:22:38 GMT)
Voice Activity Projection Model with Multimodal Encoders [0.9] 本稿では,事前学習した音声と顔エンコーダで強化されたマルチモーダルモデルを提案する。
私たちのモデルは競争力があり、場合によっては、ターンテイクメトリクスの最先端モデルよりも優れています。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:10:03 GMT)
Realism and causality imply information erasure by measurements [0.9] この結果が無視された場合、射影測度はフォン・ノイマンエントロピーを減少させることができないことを示す。
我々は,情報消去を,オントロジ理論の時間対称性を破るメカニズムとして認識する。
我々は、マクロ現実性の実験的なLeggett-Gargテストにおける不器用な抜け穴の問題は、情報消去定理によって緩和されることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:28:29 GMT)
R-Search: Empowering LLM Reasoning with Search via Multi-Reward Reinforcement Learning [0.8] R-SearchはReasoning-Search統合のための強化学習フレームワークである。
ディープ・サーチ・インタラクションを伴う多段階推論を自律的に実行するために,大規模言語モデルを誘導する。
R-Searchは,マルチリワード信号による最適推論探索軌跡を学習する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:29:22 GMT)
Structured State Space Model Dynamics and Parametrization for Spiking Neural Networks [0.8] 多状態スパイクニューロンは、従来のディープラーニングモデルに代わる魅力的な代替手段を提供する。
状態空間モデル(SSM)は、スパイキングニューロンのサブスレッショルド状態に類似した線形状態-内在的再発を用いた長いシーケンス処理において優れている。
そこで我々は,SSMと2次スパイキングニューロンモデルの間に数学的ブリッジを確立する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:54:02 GMT)
Construction of Urban Greenland Resources Collaborative Management Platform [0.8] ハッピーシティ緑化管理システムは、庭師、木、花、緑地を効果的に管理している。
庭師の管理、購入・サプライヤの管理、樹木と花の管理、メンテナンス計画のためのモジュールで構成されている。
このシステムはバックエンドとデータストレージにJavaを使って構築されており、Vueフレームワークで設計されたユーザフレンドリな設計で補完されている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:58:19 GMT)
Training-free AI for Earth Observation Change Detection using Physics Aware Neuromorphic Networks [0.8] 主なボトルネックは、衛星から地上局へのデータの帯域幅制限によるダウンリンクである。
本研究では,自然災害による変化を検出する物理認識ニューロモルフィックネットワーク(PANN)を提案する。
PANNは最先端のAIモデルに対してベンチマークされ、各自然災害カテゴリで同等またはより良い結果を得た。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:45:41 GMT)
Multi-Source Collaborative Style Augmentation and Domain-Invariant Learning for Federated Domain Generalization [0.8] フェデレートされたドメインの一般化は、目に見えないターゲットドメインにデプロイするために、複数の分散されたソースドメインから一般化可能なモデルを学ぶことを目的としている。
より広いスタイル空間でデータを生成するマルチソース協調型拡張モジュールを提案する。
代わりに、協調的なスタイル拡張とドメイン不変学習を行うことで、モデルは目に見えないターゲットドメインをうまく一般化することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:41:14 GMT)
Even Faster Hyperbolic Random Forests: A Beltrami-Klein Wrapper Approach [0.7] 双曲空間のベルトラミ・クラインモデルにおいて、ハイパーDTアルゴリズムをエレガントに表現する方法を示す。
これはユークリッド決定木で使われる閾値演算を保存する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:20:30 GMT)
An 11-qubit atom processor in silicon [0.7] シリコン中のリン原子は、原子スピンが数秒を超えるコヒーレンス時間を示すため、量子コンピューティングの優れたプラットフォームである。
ここでは、2つの多核スピンレジスタからなる完全に制御された11量子原子プロセッサとの統合を実演する。
局所ベル状態と非局所ベル状態の両方を99%以上の忠実度で作成し,全接続効率を検証した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:31:08 GMT)
Least Squares Estimation For Hierarchical Data [0.7] アメリカ合衆国国勢調査局の2020年開示回避システム(DAS)はノイズ測定に基づく出力をベースとしている。
本稿では,非常に高次元の最小二乗推定値を計算するために,入力データの階層構造を利用するアルゴリズムについて述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:13:43 GMT)
Eigenvalue analysis of three-state quantum walks with general coin matrices [0.7] 任意の時間発展演算子を持つ1次元格子上の3状態量子ウォークのスペクトル解析のための一般フレームワークを開発する。
我々は、対応する固有値と固有状態の完全な記述とともに、離散固有値の存在に必要な十分条件を厳格に導き出す。
この結果は量子ウォークの構造に関する数学的ツールと物理的知見を提供し、複雑な量子系における局所量子状態の同定と特徴付けのための体系的な経路を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:39:21 GMT)
MobCLIP: Learning General-purpose Geospatial Representation at Scale [0.7] 全国初の汎用位置情報エンコーダであるMobCLIPについて紹介する。
新たなCLIPベースのアーキテクチャを採用することで、1億以上のPOI、全国的なリモートセンシング画像、および10億のエッジモビリティグラフによる構造化された人口統計を調整できる。
我々は,MobCLIPが最先端モデルよりも平均35%優れた汎用予測性能を実現することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:07:51 GMT)
Physics-Constrained Flow Matching: Sampling Generative Models with Hard Constraints [0.7] 最近、偏微分方程式(PDE)によって支配される物理系に深部生成モデルが適用されている。
既存の手法は、厳しい制約を保証できないような、ソフトな罰則やアーキテクチャ上の偏見に頼っていることが多い。
本研究では,事前学習フローベース生成モデルにおける任意の非線形制約を強制するゼロショット推論フレームワークである物理制約フローマッチングを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:12:37 GMT)
Intelligent Routing for Sparse Demand Forecasting: A Comparative Evaluation of Selection Strategies [0.7] サプライチェーンにおける パースと断続的な需要予測は 重大な課題です
本稿では, モデルスパンニングフレームワークを提案し, モデルスパンニングの古典的, ML, DLメソッドを製品毎に選択する。
大規模なFavoritaデータセットの実験では、ディープラーニング(インセプションタイム)ルータが予測精度を最大11.8%向上している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:09:45 GMT)
Two-stage deep learning framework for the restoration of incomplete-ring PET images [0.6] 約50%の偶然を欠いたデータから高品質な画像を復元する2段階のディープラーニングフレームワークを提案する。
また, 推論速度も向上し, 不完全リングPET画像の有効解が得られた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:46:00 GMT)
chemtrain-deploy: A parallel and scalable framework for machine learning potentials in million-atom MD simulations [0.6] 本稿では,MDシミュレーションにおけるLAMMPSのモデル非依存展開を可能にするフレームワークであるChemtrain-deployを提案する。
Chemtrain-deployはJAX定義の半局所ポテンシャルをサポートし、ユーザーはLAMMPSの機能を利用することができる。
最先端の効率を実現し、数百万の原子を含むシステムにスケールする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:19:26 GMT)
A Framework for Auditing Chatbots for Dialect-Based Quality-of-Service Harms [0.6] 方言バイアスに対する大規模言語モデル(LLM)に基づくチャットボットの監査のためのフレームワークを提案する。
システムが異なる人々に対して同じように機能しない場合に発生する、サービス品質の悪影響の程度を測定します。
私たちのフレームワークには,実際に有用な3つの重要な特徴があります。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:58:51 GMT)
Wyckoff Transformer: Generation of Symmetric Crystals [0.6] 内部対称性は、物理的、化学的、電子的性質を決定する上で基本的な役割を果たす。
空間群対称性を条件付ける生成モデルWyFormerを紹介する。
Wyckoff の位置をエレガントで圧縮され、離散的な構造表現の基盤として用いることでこれを達成している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:26:03 GMT)
Adversarial bandit optimization for approximately linear functions [0.6] 非滑らかかつ非滑らかな関数に対する帯域最適化問題を考える。
それぞれのトライアルでは、損失関数は線形関数の和であり、プレイヤーの選択を観察した後に選択された小さいが任意の摂動である。
その結果、最適化のために高確率の後悔を省くことが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:08:36 GMT)
Benchmarking gate-based quantum devices via certification of qubit von Neumann measurements [0.6] ゲートベースの量子コンピュータをベンチマークするオープンソースのPythonライブラリであるPyQBenchの更新版を提示する。
このバージョンでは、ノイズ中間スケールの量子デバイス上での精度を評価する量子測定の認証スキームが組み込まれている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:57:43 GMT)
UltraBones100k: A reliable automated labeling method and large-scale dataset for ultrasound-based bone surface extraction [0.6] 本稿では,骨ラベルの自動生成による残響超音波データセットの収集手法を提案する。
提案するラベルは、追跡された骨CTモデルを追跡された超音波画像に正確に重ね合わせることで得られる。
骨分割のためのニューラルネットワークは、収集されたデータセットに基づいてトレーニングされ、その予測は専門家の手動ラベルと比較される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:49:21 GMT)
Interpretability by Design for Efficient Multi-Objective Reinforcement Learning [0.6] MORL(Multi-objective reinforcement learning)は、RLの柔軟性と信頼性を向上させるために、いくつかの、しばしば矛盾する目標を最適化することを目的としている。
これは、ある客観的な選好に最適で、他の選好に最適な政策によって支配されない多様なポリシーを見つけ、多目的のパフォーマンス空間においてパレートフロントを形成することで達成できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:52:18 GMT)
FlySearch: Exploring how vision-language models explore [0.5] 複雑な場面でオブジェクトを検索してナビゲートするための3D,屋外,環境であるFlySearchを紹介した。
我々は最先端のビジョン・ランゲージ・モデル(VLM)が、最も単純な探索作業でさえ確実に解決できないことを観察する。
我々は、視覚からコンテキスト誤解、タスク計画失敗に至るまで、中心的な原因のセットを特定し、それらの一部が微調整によって対処可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:32:09 GMT)
Self-Composing Policies for Scalable Continual Reinforcement Learning [0.5] この研究は成長可能なモジュラーニューラルネットワークアーキテクチャを導入し、継続的な強化学習における破滅的な忘れと干渉を自然に回避する。
各モジュールの構造は、既存のポリシーと内部ポリシーを選択的に組み合わせることを可能にし、現在のタスクにおける学習プロセスを加速させる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:12:15 GMT)
QA-HFL: Quality-Aware Hierarchical Federated Learning for Resource-Constrained Mobile Devices with Heterogeneous Image Quality [0.5] 本稿ではQA-HFLについて紹介する。QA-HFLは、リソース制約されたモバイルデバイス間の不均一な画像品質を効率的に処理する、品質に配慮した階層型学習フレームワークである。
提案手法は,画像品質の異なる局所モデルを訓練し,品質重み付き融合機構を用いて特徴を集約する。
MNISTの実験では、QA-HFLはわずか3回のフェデレーションラウンドで92.31%の精度を達成した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:29:35 GMT)
Craftium: Bridging Flexibility and Efficiency for Rich 3D Single- and Multi-Agent Environments [0.5] Craftiumは、リッチな3Dシングルエージェント環境とマルチエージェント環境を構築するための、高度にカスタマイズ可能で使いやすいプラットフォームである。
本稿では,リッチな3Dシングルエージェント環境とマルチエージェント環境を構築するための,高度にカスタマイズ可能な,使いやすいプラットフォームであるCraftiumを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:56:54 GMT)
Deep-learned error mitigation via partially knitted circuits for the variational quantum eigensolver [0.5] 変分量子固有解法(VQE)は、一般に、近時雑音量子コンピュータのための有望な量子アルゴリズムとみなされる。
本稿では,深層学習に基づく誤り軽減手法を用いて,VQEを機能化する方法について述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:40:18 GMT)
Optimal Transport-based Domain Alignment as a Preprocessing Step for Federated Learning [0.5] Federated Learning(FL)は、機械学習のサブフィールドであり、ローカルデータを中央サーバと共有することを避ける。
FLでは、局所的に訓練されたモデルと不均衡なデータセットを融合させることで、グローバルモデルアグリゲーションの性能が低下する可能性がある。
本稿では,エッジデバイスに沿ったデータの分布差を最小化してデータセットを整列する,最適なトランスポートベースの前処理アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:35:55 GMT)
Designing morphologies of soft medical devices using cooperative neuro coevolution [0.4] ソフトロボットは、幾何学的に制約された環境での伝播に関連するアプリケーションにおいて、従来のロボットよりも優れていることが証明されている。
本稿では, ソフトアクチュエータとその制御器の形態を設計するための協調的神経共進化手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:26:55 GMT)
Comparative performance of ensemble models in predicting dental provider types: insights from fee-for-service data [0.4] 本研究は,2018年モデルを用いた歯科医療者分類における機械学習モデルの性能評価を目的とした。
Nerve Networks は AUC (0.975) と CA (94.1%) を達成し、Random Forest (AUC:0.948, CA:93.0%) を続いた。
高度な機械学習技術、特にアンサンブルと深層学習モデルは、歯科労働者の分類を大幅に強化する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:55:27 GMT)
Resonant Tunneling in Tri-layer 2H-MoTe2 grown by Molecular Beam Epitaxy Coupled with layered WSe2 carrier Reservoir [0.4] 2H-MoTe2系共振トンネル構造の導電率に顕著な量子振動を報告した。
本研究は, 分子線エピタキシー (MBE) によるn-WSe2/HfO2/i-MoTe2/HfO2/Au共振トンネル装置 (RTD) を作製し, CVD (Chemical Vapor Deposition) を作製した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:51:59 GMT)
Grid-LOGAT: Grid Based Local and Global Area Transcription for Video Question Answering [0.4] 映像質問応答のためのグリッドベース地域・グローバル地域転写システム(Grid-LoGAT)を提案する。
視覚言語モデル(VLM)を用いたビデオフレームからのテキストテキストの抽出
次に、これらの書き起こしを用いて質問を処理し、Large Language Model (LLM) を通して回答を生成する。
そこで我々は,各グリッドセルから複雑な局所的詳細を抽出し,それらをグローバル情報と統合する,グリッドベースのビジュアルプロンプトを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:42:06 GMT)
Human Misperception of Generative-AI Alignment: A Laboratory Experiment [0.4] 我々は、経済的な意思決定の文脈において、生成的人工知能(GenAI)のアライメントに対する人々の認識を研究する。
我々は,GenAIの選択と人間の選択の一致度を過大評価している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:26:11 GMT)
CatNet: Controlling the False Discovery Rate in LSTM with SHAP Feature Importance and Gaussian Mirrors [0.3] CatNetはFalse Discovery Rate(FDR)を効果的に制御し、LSTMの重要な機能を選択する。
CatNetは特徴量の定量化にSHAP値の微分を用いており、ガウスミラーアルゴリズムを用いてFDR制御のためのベクトル形成ミラー統計学を構築している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:23:25 GMT)
Conformal Mixed-Integer Constraint Learning with Feasibility Guarantees [0.3] Conformal Mixed-Integer Constraint Learningは、最適化問題におけるデータ駆動制約の確率論的実現可能性を保証する。
我々は,C-MICLが目標レートを一貫して達成し,競争目標性能を維持し,既存の手法に比べて計算コストを大幅に削減することを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:26:31 GMT)
Efficient Quantum Gibbs Sampling with Local Circuits [0.3] 本稿では、よく設計された散逸過程のシミュレーションに基づいて、ブレークスルーアルゴリズムを実装する方法を示す。
この近似が高温での急速混合にはほとんど影響を与えないことを厳密に証明する。
その結果、短期量子デバイス上で実装可能な、証明可能な最初の量子熱化プロトコルが提供される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:02 GMT)
Development of an offline and online hybrid model for the Integrated Forecasting System [0.3] ニューラルネットワークを用いた中レージ気象予報センターのモデル誤差補正手法を開発した。
ネットワークは、運用分析と分析インクリメントの大規模なデータセットを使用して、オフラインで事前トレーニングされている。
その後、データ同化や予測実験に使用されるように、オブジェクト指向予測システム(OOPS)内のIFSに統合される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:40:24 GMT)
Stable supersolids and boselets in spin-orbit-coupled Bose-Einstein condensates with three-body interactions [0.2] スピン軌道結合型ボース・アインシュタイン凝縮体における超固体ストライプ波, 平面波ボゼレット, その他の拡張状態の安定性について検討した。
R3BIが存在しない場合、拡張状態は、立方体の魅力的な非線形性によって誘導される変調不安定性(MI)の影響を受けやすい。
解析の結果、R3BIはベースバンドとゼロ波数ゲインMIを排除し、代わりに安定なボセレットを実現するフォノンモードを形成することがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:47:46 GMT)
On the class of coding optimality of human languages and the origins of Zipf's law [0.2] コーディングシステムに最適な新しいクラスを提示する。
そのクラスの中で、Zipfの法則、サイズランク法則、サイズ確率法則は群のような構造を形成する。
Zipfの法則と十分な一致を示すすべての言語は、クラスのメンバーである可能性がある。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:35:43 GMT)
Solving the semidefinite relaxation of QUBOs in matrix multiplication time, and faster with a quantum computer [0.2] いくつかの量子SDOソルバは、低精度な状態において高速化を提供する。
この事実を利用してアルゴリズムの精度への依存を指数関数的に改善する。
我々のアルゴリズムの量子実装は、$mathcalO left(ns + n1.5 cdot textpolylog left(n, | C |_F, frac1epsilon right)$の最悪の実行時間を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:27:27 GMT)
Intersectional Bias in Pre-Trained Image Recognition Models [0.1] 顔画像のイメージネット分類器の表現におけるバイアスについて検討する。
ImageNet分類器の表現は、特に年齢の区別が可能である。
あまり強調されないが、このモデルは特定の民族を関連付け、中年の集団で性別を区別しているように見える。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:55:52 GMT)
Bridging Quantum Chemistry and MaxCut: Classical Performance Guarantees and Quantum Algorithms for the Hartree-Fock Method [0.1] 量子化学において、自己整合体 (Self-Consistent Field, SCF) アルゴリズムは非線形最適化問題を定義する。
二次的非拘束スピン/バイナリ最適化問題の列として正確に記述できるHartree-FockにインスパイアされたSCFアルゴリズムを導出する。
水酸化物アニオンOH-および分子性窒素N2の研究により,QUBO-SCFおよびMaxCut-SCF法を数値解析した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:59:02 GMT)
Depermissioning Web3: a Permissionless Accountable RPC Protocol for Blockchain Networks [0.1] ブロックチェーンネットワークでは、いわゆる“フルノード”がRPCインターフェースを通じてクライアントからのトランザクションにデータを提供し、中継する。
このサービスレイヤは、ブロックチェーン上に格納された“Web3”データと、ブロックチェーンネットワークのピアとして直接参加できない“Web2”モバイルあるいはWebアプリケーションとの統合を可能にする。
我々は、プライバシ、完全性、データアクセスに関する懸念に対処するために、パーミッションレス・アカウンタブルRPCプロトコル(PARP)を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:31:32 GMT)
The Arabic AI Fingerprint: Stylometric Analysis and Detection of Large Language Models Text [0.1] 大型言語モデル(LLM)は、人間のようなテキストを生成する際、前例のない能力を達成した。
本稿ではアラビア語機械生成テキストの包括的調査について述べる。
我々は,形式的文脈における異常な性能を実現するBERTに基づく検出モデルを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:16:04 GMT)
Open-PMC-18M: A High-Fidelity Large Scale Medical Dataset for Multimodal Representation Learning [0.0] 本稿では,トランスを用いたオブジェクト検出に基づくスケーラブルなサブフィギュア抽出パイプラインを提案する。
我々は,大規模バイオメディカルビジョン言語データセットであるOPEN-PMC-18Mをリリースする。
検索性能の改善,ゼロショット分類,ロバストネスベンチマークを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:14:31 GMT)
What Drives Team Success? Large-Scale Evidence on the Role of the Team Player Effect [0.0] 我々は,リアルタイム戦略ゲーム Age of Empires II から大規模データセットを解析した。
特定の個人が、技術的スキルが予測するよりも、チームの成果を継続的に改善していることに気付きます。
以上の結果から,社会スキルと親しみは,加法ではなく補完的な方法で相互作用することが示唆された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:46:50 GMT)
WANDER: An Explainable Decision-Support Framework for HPC [0.0] 高性能コンピューティングシステムは、ランタイム、リソース使用量、パワー、可変性に影響を与える多くの相互依存構成ノブを公開している。
We present WANDER, a decision- supported framework that synsternal configurations using counterfactual analysis with each with user goal and constraints。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:15:23 GMT)
Visualizing and Controlling Cortical Responses Using Voxel-Weighted Activation Maximization [0.0] ディープニューラルネットワーク(DNN)は、人間の視覚系に類似した視覚表現に基づいて訓練されている。
DNNベースの符号化モデルにアクティベーションが適用可能であることを示す。
我々は個々のボクセルで予測応答に最適化された画像を生成する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:48:08 GMT)
VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis [0.0] VISTA(Vision-Language Inference for Stock Time-Series Analysis)は,マルチモーダルストック予測のためのトレーニングフリーフレームワークである。
我々は、標準ベースラインに対してVISTAをベンチマークし、ARIMAやテキストのみのLLMベースのプロンプト手法を含む。
VISTAはこれらのベースラインを最大89.83%上回り、株価時系列分析におけるマルチモーダル推論の有効性を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:30:58 GMT)
Two-dimensional many-body localized systems coupled to a heat bath [0.0] 本研究では,2次元多体局在系と有限熱浴とのカップリング効果について数値解析を行った。
具体的には、超低温ボソンの2成分を用いた光学格子実験をシミュレートする。
共振器の存在と整合した多体局在状態における量子的相互情報の分布を観察する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:14:47 GMT)
Two Sparse Matrices are Better than One: Sparsifying Neural Networks with Double Sparse Factorization [0.0] 重み行列を2つのスパース行列に分解するDouble Sparse Factorization(DSF)を提案する。
提案手法は最先端の結果を達成し,従来のニューラルネットワークのスペーサー化を可能にした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:29:33 GMT)
Transformer-Based Decomposition of Electrodermal Activity for Real-World Mental Health Applications [0.0] 本研究では,EDA信号分解のための知識駆動型,統計的,深層学習に基づく手法の比較分析を行った。
著者らは、Autoformerアーキテクチャから適応した新しいトランスフォーマーベースのモデルであるFeel Transformerを紹介した。
このモデルは、リアルタイム生体信号解析の可能性を示し、ストレス予測、デジタルメンタルヘルス介入、生理的予測における将来的な応用を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:07:40 GMT)
Towards a deep learning approach for classifying treatment response in glioblastomas [0.0] グリオーマは最も攻撃的なタイプのグリオーマであり、5年生存率は6.9%である。
放射線医は、RANO(Re Response Assessment in Neuro-Oncology)基準を用いて、画像と臨床の特徴に基づいて腫瘍を4つのラベルの1つに分類する。
ディープラーニングは、分類問題に対処するために広く用いられているため、RANO基準の分類のための最初のDLパイプラインの実装を目的としている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 11:53:41 GMT)
Towards Large-Scale Pose-Invariant Face Recognition Using Face Defrontalization [0.0] 本稿では,顔特徴抽出モデルの訓練データセットを増大させるために,顔デフロンダリゼーション(face defrontalization)と呼ばれる顔のフロンダリゼーション(face frontalization)の逆手法を提案する。
Defrontalizationは、defrontalizationのないモデルと比較して改善された結果を示している。
結果は、現在の手法の少なくともいくつかは、小さなデータセットに過度に適合している可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 22:28:06 GMT)
The role of fluctuations in deexcitations and excitations [0.0] 量子力学の枠組みにおける量子ゆらぎと熱ゆらぎを分析する。
異なる特徴を持つ不連続摂動として認識され、これらの2種類のゆらぎはブロッホ方程式の散逸項で表される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:05:06 GMT)
The QTF-Backbone: Proposal for a Nationwide Optical Fibre Backbone in Germany for Quantum Technology and Time and Frequency Metrology [0.0] 我々は、量子およびT&F信号のネットワーク分布のための、ドイツの国立繊維光学インフラであるQTF-Backboneを提案する。
QTF-Backboneは10年以上にわたる4段階のデプロイメントとして計画されており、研究機関や業界へのスケーラブルで持続可能なアクセスを保証する。
国内および欧州のハブとして、ドイツとヨーロッパを、時間と周波数の転送だけでなく、量子ネットワーキングの最前線に位置づける。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:27:50 GMT)
The Latent Space Hypothesis: Toward Universal Medical Representation Learning [0.0] 医療データはゲノム配列や網膜写真から構造化された実験結果、構造化されていない臨床物語まで様々である。
ラテント空間仮説は、それぞれの観測を統一的で階層的に整理された多様体の射影として表している。
サブトラジェクトリと患者固有の変化方向を明らかにすることで、このフレームワークはパーソナライズされた診断のための定量的な根拠を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:37:33 GMT)
The Cognitive Foundations of Economic Exchange: A Modular Framework Grounded in Behavioral Evidence [0.0] 初期の人間社会からの証拠は、互恵性はバーターではなく基礎的な経済論理であったことを示唆している。
実験的に支援された3つの認知的プリミティブに基づく最小限の行動枠組みを導入する。
このフレームワークは、人間と人工両方のシステムの信頼、調整、経済行動のモデリングのための統一された基盤を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:19:16 GMT)
Supporting hyperplanes for Schmidt numbers and Schmidt number witnesses [0.0] 我々はシュミット数の全二部状態のコンパクト凸集合を$k$以下と考える。
それらの凸集合をサポートし、最大混合状態を通して1つのパラメータ族に垂直な超平面を求める。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:06:22 GMT)
Stabilizer codes for Heisenberg-limited many-body Hamiltonian estimation [0.0] 雑音下での多体ハミルトニアン推定における安定化器量子誤差補正符号の性能について検討した。
本稿では,それぞれ$(nt)-1$,$(n2t)-1$,$(n3t)-1$のスケーリングを実現する安定化符号の3つのファミリを紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:15:49 GMT)
Spanning-tree-packing protocol for conference key propagation in quantum networks [0.0] ペアワイズ量子鍵分布(QKD)リンクで接続されたユーザのネットワークを考える。
これらのペアワイズ秘密鍵と公開古典的通信を用いて、ユーザーは最大レートで共通の(会議)秘密鍵を生成したい。
グラフ理論における既知の問題であるスパンニングツリーパッキングに基づくアルゴリズムを提案し,その最適性を証明する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:59:22 GMT)
Solving engineering eigenvalue problems with neural networks using the Rayleigh quotient [0.0] ニューラルネットワークによる固有関数の離散化は,連続固有値問題を扱う上で,一意の利点をもたらすことを示す。
また、偏微分方程式の近似解のスペクトル基底としての調和関数の有用性についても論じる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:45:27 GMT)
Software Bill of Materials in Software Supply Chain Security A Systematic Literature Review [0.0] SBOM(Software Bill of Materials)は、ソフトウェアサプライチェーン(Software supply chains, SSC)の確保に欠かせないツールであると考えられている。
この体系的な文献レビューは、現在SBOMがSSCセキュリティの強化にどのように使われているかを評価するために、40の査読された研究から証拠を合成する。
生成ツール、データプライバシ、フォーマット/標準化、共有/配布、コスト/オーバーヘッド、脆弱性のエクスプロイラビリティ、メンテナンス、分析ツール、偽陽性、隠されたパッケージ、改ざんなどである。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:49:04 GMT)
Softlog-Softmax Layers and Divergences Contribute to a Computationally Dependable Ensemble Learning [0.0] 本稿では,ソフトログソフトマックスカスケードがアンサンブル学習システムの一貫性と信頼性を向上させることを強調するための4段階のプロセスを提案する。
最初のプロセスは解剖学的であり、対象のアンサンブルモデルは、畳み込みフラストラムの定義に関する標準的要素によって構成される。
ソフトログは、複数のソフトログ-ソフトマックス層を通して、弱い対数操作を一貫性とリードの両方にするために導かれる。
第3のプロセスは神経情報理論に関するもので、一貫した値を得る情報測度を構築するために、ソフトログに基づくエントロピーと発散を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:20:44 GMT)
SmoothRot: Combining Channel-Wise Scaling and Rotation for Quantization-Friendly LLMs [0.0] SmoothRotは、大規模言語モデル(LLM)における4ビット量子化の効率を高めるための、新しい学習後の量子化手法である。
本手法は,極端外れ値から量子化フレンドリなアクティベーションへと効果的に変換し,量子化精度を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:07:45 GMT)
Similarity-based fuzzy clustering scientific articles: potentials and challenges from mathematical and computational perspectives [0.0] ファジィクラスタリングは出版データを解析する上で重要な役割を果たす。
この問題は制約付き最適化モデルとして定式化することができ、このモデルの目的は、データから観測される類似性と予測された分布から導かれる類似性との差を最小限にすることである。
我々は、数学的および計算的視点からアプローチの可能性と課題を分析する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:10:31 GMT)
Short-Term Power Demand Forecasting for Diverse Consumer Types to Enhance Grid Planning and Synchronisation [0.0] 本研究は, 産業, 商業, 住宅消費者の差別化による正確な予測の必要性に対処するものである。
短時間負荷予測(STLF)と短時間負荷予測(VSTLF)のためのAIおよび機械学習アルゴリズムを探索し比較した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:01:11 GMT)
ScoreRAG: A Retrieval-Augmented Generation Framework with Consistency-Relevance Scoring and Structured Summarization for News Generation [0.0] 現在のニュース生成手法は、幻覚、事実的矛盾、ドメイン固有の専門知識の欠如に苦慮している。
ScoreRAGは、検索拡張生成、一貫性関連性評価、構造化要約を組み合わせた多段階フレームワークを通じて、これらの課題に対処する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:35:06 GMT)
Scaling Laws for Emulation of Stellar Spectra [0.0] 最適な性能を達成するために、トランスフォーマーベースのスペクトルエミュレータをスケーリングするためのトレーニングガイドラインを提供する。
この結果から,最適計算資源割り当てにはバランスの取れたスケーリングが必要であることが示唆された。
本研究は、拡張されたドメイン転送機能を持つスペクトル基底モデルを開発するための基盤を確立する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 20:55:17 GMT)
SUS backprop: linear backpropagation algorithm for long inputs in transformers [0.0] 計算グラフの任意の部分を通るバックプロパゲーションフローを,非バイアス勾配推定器として設計する。
典型的な変圧器モデルでは、注意勾配流の約99%をカットすると、相対勾配のばらつきはわずか1%の$n sim 2000$となる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:53:25 GMT)
SSIMBaD: Sigma Scaling with SSIM-Guided Balanced Diffusion for AnimeFace Colorization [0.0] 本稿では,アニメスタイルの顔スケッチの自動着色のための拡散型フレームワークを提案する。
我々のフレームワークは連続時間拡散モデルに基づいており、SSIMBaDを導入している。
大規模なアニメ顔データを用いた実験により,本手法は画素精度と知覚品質の両方において最先端のモデルより優れていることが示された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:22:48 GMT)
Ruling out nonlinear modifications of quantum theory with contextuality [0.0] 量子力学のよく知られた非線形修正は、文脈的状態の集合を非文脈的状態にマッピングする。
すなわち、量子論の非線形な修正は、ある種の実験的な設定のために古典的な隠れ変数モデルが存在することを許す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:36:46 GMT)
Risk Awareness in HTN Planning [0.0] 本稿では,行動コストの確率分布を用いてリスクと不確実性をモデル化するHTN計画の一般的な枠組みを提案する。
我々は、HTN計画エージェントが、特殊なリスク対応のHTN計画問題を解くことができると論じている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:03:24 GMT)
Rigorous theory of coupled resonators [0.0] 任意の3次元分散共振器の固有モードをそれぞれのモードで正確に計算できる理論を提案する。
結合スラブやブラッグミラーマイクロキャビティのような平面光学共振器は、理論の正確かつ確実な検証を可能にするため、図示的な目的に使用される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:45:04 GMT)
Research and Analysis of Employers' Opinion on the Necessary Skills that Students in the Field of Web Programming Should Possess [0.0] 本稿では,Webプログラミング分野の大学院生が,企業の業務にできるだけ迅速かつ効率的に参加するために持つために必要な技術スキルを,IT雇用者を対象にした調査の結果を分析した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:42:22 GMT)
Recent Advances in Medical Image Classification [0.0] 論文は、この分野の最近の進歩をレビューし、基本、特異、適用の3段階のソリューションに焦点をあてた。
Convolutional Neural NetworksやVision Transformersといったディープラーニングモデルを用いた従来の手法の進歩を強調している。
これらのモデルは、限定ラベル付きデータの問題に対処し、説明可能な人工知能による予測結果の強化と説明を行う。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:20:26 GMT)
Quantum-Inspired Genetic Optimization for Patient Scheduling in Radiation Oncology [0.0] 量子染色体は、患者IDとガントリー状態の重畳されたデータを保持するように調整されている。
選択と修復の戦略は、臨床的に可能なスケジュールへの信頼性の高い収束のためにも精査される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:04 GMT)
Quantum photonics on a chip [0.0] 光チップの主な進歩は、低損失導波路、効率的な単一光子源、高忠実度量子ゲートである。
これらの回路をチップに統合することは、従来のバルク光学装置よりも小型化、安定性、および大きな利点をもたらす。
特にシリコンフォトニクスは、既存の半導体製造プロセスとの互換性のため、顕著なプラットフォームとなっている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:19:22 GMT)
Quantum correlations and spatial localization in trapped one-dimensional ultra-cold Bose-Bose-Bose mixtures [0.0] 我々は多体シュル「オーディンガー方程式」の解を数値的に得る。
本研究では,強い反発的相互作用から生じる相関関係,コヒーレンス,空間的局在に関する特異な基底状態特性の出現を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:10:05 GMT)
Quantum Secure Key Exchange with Position-based Credentials [0.0] 量子鍵分配(QKD)は秘密鍵を安全に交換する情報理論を提供する。
事前共有または公開鍵の要求を解消するために、バーマンらは、当事者の位置を認証として利用することを提案した。
量子位置認証(QPV)に基づくメッセージとアイデンティティ認証を用いた位置認証付きQKDプロトコルを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:08:44 GMT)
Privacy and Security Threat for OpenAI GPTs [0.0] OpenAIが2023年11月にリリースされて以来、300万以上のカスタムGPTが作成されている。
ディベロッパにとって、命令漏洩攻撃はカスタムGPTにおける命令の知的特性を脅かす。
ユーザにとって、カスタムのGPTや統合されたサードパーティサービスによる不要なデータアクセス行動は、重要なプライバシー上の懸念を引き起こす。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:58:29 GMT)
Predictability of quantum observables: Applications in QKD and top quarks [0.0] 本研究では,ベイズリスクと推定分散を用いて,二部量子系における局所観測可能量の予測可能性の定量化と最適化を行う。
また、任意の2量子状態に対する解析式を提供し、アインシュタイン-ポドルスキー-ローゼンステアリング基準との関係を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:25:54 GMT)
Precision measurement of Cs($nF_J$) quantum defects and calculations of scalar and tensor polarizabilities of the $nS_{1/2}$, $nP_J$ ,$nD_J$ , and $nF_J$ series [0.0] 我々は、$|6S_1/2, F = 3rangle rightarrow nF_5/2,7/2(n = 28-68)$ Rydberg 級数の絶対周波数測定を行い、133$Csのスペクトルを測定する。
修正リッツの公式に絶対周波数測定をグローバルに合わせることで、$nF_5/2$および$nF_7/2$シリーズの量子欠陥を決定する。
この結果は、衝突や崩壊率などの133ドルCの物性を計算するのに有用である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:21:51 GMT)
Precision Measurement of Lifetime and Branching Ratios of the $4f^{13}5d6s\,^1[5/2]_{5/2}$ state in Yb$^+$ ions [0.0] 我々は$[rm Xe]4f13(2Fo_5/2)5d6s(1!D)1[5/2]o_5/2$ state in $172$Yb$+$ ionを特徴付ける。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:02 GMT)
Powerful Primitives in the Bounded Quantum Storage Model [0.0] 有界量子ストレージモデルは、量子メモリのみに制限された計算上の敵に対するセキュリティを実現することを目的としている。
我々は、以下の強力なプリミティブに対して、このモデルで情報理論の安全な構成を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:01:01 GMT)
Position: There Is No Free Bayesian Uncertainty Quantification [0.0] ベイジアン更新の等価な最適化に基づく表現について議論する。
本稿では,ベイズ推論段階の品質評価手法を提案し,今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:01:06 GMT)
Plant Bioelectric Early Warning Systems: A Five-Year Investigation into Human-Plant Electromagnetic Communication [0.0] 植物は、人間の近接性、感情状態、生理的状態に関連する異なる生体電気信号を生成する。
ResNet50アーキテクチャに基づくディープラーニングモデルは、人間の感情状態の分類において97%の精度を達成した。
本研究は, 従来の植物感覚能力の理解に挑戦し, 農業, 医療, 植物間相互作用研究における実践的応用を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:23:06 GMT)
Phase space tableau simulation for quantum computation [0.0] 閉じた非コンテキスト作用素の拡張安定化理論の位相空間フレームワーク内で定式化された量子計算のためのテーブルーベースの古典的シミュレーション手法を提案する。
我々はシミュレータを実装し、隠れシフトやDeutsch--Jozsaアルゴリズムを含む基本量子アルゴリズムの性能をベンチマークする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:56:42 GMT)
Personalized Improvement of Standard Readout Error Mitigation using Low-Depth Circuits and Machine Learning [0.0] 本稿では,数値読み出し誤差法の改良手法を提案する。
機械学習を用いて量子システムの読み出し誤差モデルを改善する。
平均二乗誤差の中央値6.6%改善、平均二乗誤差の29.9%改善、および標準誤差軽減アプローチのヘリンジャー距離の10.3%改善を示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:13:04 GMT)
Person Re-Identification System at Semantic Level based on Pedestrian Attributes Ontology [0.0] 本稿では,Pedestrian Attribute Ontology (PAO), Local Multi-task DCNN (Local MDCNN), Im Balance Data Solver (IDS) の3つのモジュールからなる統一型Re-IDシステムを提案する。
我々のRe-IDシステムの新たな主要なポイントは、属性の内集団相関を利用して、Fashion AttributesやFacial Attributesといったセマンティック情報に基づいて、ギャラリーからミスマッチ候補を事前フィルタリングするPAO、ローカルMDCNN、IDSの相互サポートの力である。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:34:31 GMT)
Path Generation and Evaluation in Video Games: A Nonparametric Statistical Approach [0.0] ナビゲーションパストレースはビデオゲームのデザインにおいて重要な役割を担い、プレイヤーのエンゲージメント向上と微調整不可能なキャラクタ動作の双方に不可欠なリソースとなっている。
近年のディープラーニングに基づく生成モデリングの進歩にもかかわらず、ビデオゲーム業界はそのようなモデルをパス生成に採用することをためらっている。
原理的非パラメトリック統計量に基づく新しい経路生成と評価手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:14:30 GMT)
PPO in the Fisher-Rao geometry [0.0] PPO(Proximal Policy Optimization)は、強化学習のアルゴリズムとして広く採用されている。
その人気にもかかわらず、PPOは政策改善と収束に関する正式な理論的保証を欠いている。
本稿では,フィッシャー・ラオ幾何におけるより強いサロゲートを導出し,新しい変種であるフィッシャー・ラオPPO(FR-PPO)を導出する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:23:27 GMT)
Optimizing FPGA and Wafer Test Coverage with Spatial Sampling and Machine Learning [0.0] 半導体製造において、特にウエハおよびFPGAテストにおいて、テストコストは著しく高いままである。
本研究では,ランダムサンプリング,Stratified Smpling,k-means Clusteringの3つのベースラインサンプリング戦略について検討した。
本研究は,これらの手法をさらに強化するために,各手法のサンプリング品質を向上させる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:19:06 GMT)
On the choice of non-linear terms in blocking cat states by energy conservation [0.0] エントロピー25, 564 (2023) ではスピンモデルの波動関数アンサンブルの問題を検討した。
W.D. Wick, arXiv:1710.03278]で導入された種類の非線形項は、測定問題の解法としてエネルギー保存によって空間猫をブロックすることであった。
最後に [W.D. Wick, arXiv:1710.03278] の提案を検証するための実験的見積もりを述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:16:23 GMT)
On the Fundamental Impossibility of Hallucination Control in Large Language Models [0.0] この定理は、推論機構が4つの基本的な性質を同時に満たすことができないことを示す公式なテキスト分岐可能性定理を提示する。
LLM推論をアイデアのテキスト化としてモデル化することにより、Green-Laffont定理を用いて不可能性を証明できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:28:39 GMT)
On computing quantum waves exactly from classical action [0.0] 量子力学におけるシュル・オーディンガー方程式は古典的最小作用とその関連する古典密度に基づいて正確に解けることを示す。
元の量子問題の正確なSchr"odinger波動関数 $Psi$ は、この古典的多値作用 $Phi$ と古典的位置力学の密度 $rho$ を組み合わせることで構築可能であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:51:43 GMT)
Observation of vortices in a dipolar supersolid [0.0] 超固体は、2つの連続対称性を自発的に破る物質の状態である。
我々の研究は、非変調量子流体と変調量子流体の渦発芽ダイナミクスの根本的な違いを明らかにした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:47:23 GMT)
Noisy Stark probes as quantum-enhanced sensors [0.0] 我々は、ワニエ・スタークプローブのある種のデコヒーレンス強度に対して、量子増強感度が維持可能であることを示した。
これは非相互結合を持つ非エルミート系の2つの例で示される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:24:58 GMT)
Multi-domain anomaly detection in a 5G network [0.0] 本稿では,3次元の交通相関によるマルチドメイン異常検出手法を提案する。
これらの領域を独立して考えるのに限られる従来のアプローチとは異なり、我々の手法はそれらの相関を研究して、グローバルで一貫性があり、説明可能な異常の見解を得る。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:40:08 GMT)
Multi-Mode Global Driving of Trapped Ions for Quantum Circuit Synthesis [0.0] 複数の周波数成分を持つグローバルドライブを用いて、捕捉されたイオン量子シミュレーションと計算の効率を向上させる。
このようなマルチモードのグローバルドライブと1量子ビット回転の線形数を組み合わせると、対応する2量子ゲートの実装よりも短い全体ランタイムとの普遍的なIsing型相互作用が生成されることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:49:32 GMT)
Multi-Language Detection of Design Pattern Instances [0.0] 本稿では,多言語パターン検出ツールDP-LARAを提案する。
これは、LARAフレームワークの多言語機能を使用して、コードベースのパターンインスタンスを見つけるのをサポートする。
いくつかのソフトウェアプロジェクトでDP-LARAの検出性能と一貫性を評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:57:54 GMT)
Mixed state concurrence for symmetric systems [0.0] 高度に対称な系の混合状態における絡み合いを定量化する手法を提案する。
対称性を用いて非絡み合った密度を明示的に構成し、熱混合状態に最適に含まれる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 00:00:49 GMT)
Misalignment or misuse? The AGI alignment tradeoff [0.0] AGI - 未来、一般的に知性のある(ロボティックな)AIエージェント - が破滅的なリスクをもたらすという見解を擁護する。
誤用リスクを増大させないアライメントアプローチの余地があることが示される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:22:37 GMT)
Mining Causality: AI-Assisted Search for Instrumental Variables [0.0] 大規模言語モデルを用いて新しい楽器変数(IV)を探索する。
有効なIVを探索するためのプロンプトを構築する方法を示す。
マルチステップ・ロールプレイング・プロンプト戦略は,実世界のシナリオの領域を通じて言語モデルをナビゲートするのに有効である,と我々は主張する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 19:43:17 GMT)
Mechanistic Interpretability of Diffusion Models: Circuit-Level Analysis and Causal Validation [0.0] 本稿では、拡散モデルの定量的回路レベル解析を行い、画像生成プロセスの基礎となる計算経路と力学原理を確立する。
我々の調査によると、現実世界の顔処理には計算の複雑さがかなり高いことが判明した。
これらの知見は、生成モデル機械的介入戦略のアルゴリズム的理解と制御のための定量的基盤を確立する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:37:57 GMT)
Measurement-based Simulation of Geometric Gates in Topological Qubits on NISQ Devices [0.0] マヨラナゼロモード(MZM)の断熱交換は、幾何学的に保護されたゲートの非普遍的な集合を可能にする。
マルチキュービットパウリパリティ測定によるMZMY接合の測定に基づくブレイディング
小型回路は、新しい測度に基づく幾何ゲートと、量子ハミルトニアンシミュレーションの計測に基づく実証を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:00:09 GMT)
MELABenchv1: Benchmarking Large Language Models against Smaller Fine-Tuned Models for Low-Resource Maltese NLP [0.0] 低リソース言語であるMalteseにおける55の公開言語モデル(LLM)の性能を評価する。
我々の実験は、多くのモデルが、特に生成タスクにおいて、性能が良くないことを強調している。
本研究は, 事前訓練および指導訓練におけるマルタへの事前曝露が最も重要な要因であると結論付けている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:59:52 GMT)
Lévy Sachdev-Ye-Kitaev Model [0.0] 本研究では, 固有値分布について, 長距離・短距離相関と極端な統計量に着目して検討する。
このモデルは、分布がますます太くなるにつれて、カオスから可積分な振る舞い(スペクトル相関)への交差を示す。
モデルの可解性に関するコメントと、正確な遷移を伴うモデルの可能性に関する議論で締めくくります。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:01:31 GMT)
Low Overhead Qutrit Magic State Distillation [0.0] 量子ビットではなく量子ビットを用いることで、フォールトトレラントな量子コンピューティングに関連するオーバーヘッドコストを大幅に削減できることを示す。
9m-k, k, 2]]_3$ triorthogonal qutrit error-correcting codes for any positive $m$ and $k$ with $k leq 3m-2 integers。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:43:07 GMT)
Limitations of Quantum Hardware for Molecular Energy Estimation Using VQE [0.0] 変分量子固有解法(VQEs)は、量子化学における電子構造問題を解くための最も有望な量子アルゴリズムの一つである。
本研究では,現在の量子ハードウェアに実装されているVQEアルゴリズムの性能と限界について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:19:18 GMT)
Learning from Topology: Cosmological Parameter Estimation from the Large-scale Structure [0.0] 本稿では、永続画像を宇宙パラメータにマッピングするニューラルネットワークモデルを提案する。
我々のモデルは正確で正確な推定を行い、従来のベイズ推定手法よりもかなり優れている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:52:35 GMT)
Learning from Noise: Enhancing DNNs for Event-Based Vision through Controlled Noise Injection [0.0] イベントデータは、しばしばかなりのノイズに悩まされ、ディープラーニングモデルの性能と堅牢性に悪影響を及ぼす。
本研究では,各種事象雑音に対するロバスト性を高めるために,新しいノイズ注入訓練手法を提案する。
提案手法では,制御ノイズを直接トレーニングデータに導入し,モデルによるノイズ耐性表現の学習を可能にする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:10:26 GMT)
LeanExplore: A search engine for Lean 4 declarations [0.0] 本稿では、Lean 4宣言のための検索エンジンであるLeanExploreを紹介します。
LeanExploreを使うと、ユーザーは特定のLean 4パッケージにまたがるステートメントを意味的に検索できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:09:54 GMT)
Large Language Models are Locally Linear Mappings [0.0] オープンウェイトな大言語モデルの推論操作を、入力シーケンスに対して正確に等価な線形システムにマッピングする。
そのパワーと大域的非線形性にもかかわらず、現代のLSMは、ほぼ完全に局所的な線形分解によって解釈できる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:50:57 GMT)
Is the end of Insight in Sight ? [0.0] ボルツマン方程式が支配する希薄気体力学問題に関する物理インフォームドニューラルネットワーク(PINN)
システムの明確な構造とよく理解された統治法にもかかわらず、訓練されたネットワークの重みはガウス分布のランダム行列に似ている。
このことは、ディープラーニングと従来のシミュレーションは、同じ結果に異なる認知経路を辿る可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:57:55 GMT)
Inverse Microparticle Design for Enhanced Optical Trapping and Detection Efficiency in All Six Degrees of Freedom [0.0] 本稿では、効率的な電磁散乱解法と共役法を組み合わせて、共役光力学に適した印刷可能なマイクロ粒子を逆設計する計算フレームワークを提案する。
これにより、標準定在波光トラップにおける全ての翻訳度および回転度の自由度に対する量子制限運動制御の実現可能性が改善される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:40:26 GMT)
Interpretable LLMs for Credit Risk: A Systematic Review and Taxonomy [0.0] 大規模言語モデル(LLM)は、財務文書の分析を通じて信用リスクの評価を可能にする。
本稿では、信用リスク推定におけるLSMに基づくアプローチに着目した、最初の体系的レビューと分類について述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:24:40 GMT)
Integrals of motion as slow modes in dissipative many-body operator dynamics [0.0] 我々は1つ以上の運動積分(IOM)を持つ多体量子系におけるリンドブラディアン作用素のダイナミクスを考える。
より小さなサポートを持つIOMは、一般作用素と比較してフロベニウスノルムがより緩やかに崩壊するという意味で、これらの力学の緩やかなモードとなることを示した。
その結果、最も低い崩壊率を持つリンドブラディアンの固有作用素は、基礎となるハミルトニアンのIOMと大きな重なりを持つ。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:03:57 GMT)
IntLevPy: A Python library to classify and model intermittent and Lévy processes [0.0] IntLevPyは、間欠的およびL'evyプロセスのシミュレーションと解析用に設計されたPythonライブラリである。
このパッケージには、完全なパラメータ推定と適合最適化を含む、プロセスシミュレーションの機能が含まれている。
本稿では,IntLevPyソフトウェアアーキテクチャ,インストール,検証,使用例を詳細に紹介する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:03:58 GMT)
Infinitesimal Higher-Order Spectral Variations in Rectangular Real Random Matrices [0.0] 実矩形行列における特異値の一般$n$-次フレット微分を導出するための理論的枠組みを提案する。
自己随伴作用素に対する加藤の摂動解析理論から還元分解子作用素を利用する。
我々のフレームワークは、ランダム行列応用における高次スペクトル感度研究のための実用的なツールキットを研究者に提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:28:35 GMT)
Improving thermal state preparation of Sachdev-Ye-Kitaev model with reinforcement learning on quantum hardware [0.0] 本稿では、量子回路とそのパラメータを最適化するために、強化学習と畳み込みニューラルネットワークを統合する。
ノイズレスおよびノイズの多い量子ハードウェア環境におけるRLフレームワークの有効性を示す。
この研究はスケーラブルなRLベースのフレームワークを進化させ、量子重力研究や時間外熱計算に応用した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:57:15 GMT)
Improving LLM-Based Fault Localization with External Memory and Project Context [0.0] 我々は,プロジェクト固有の知識を外部メモリ経由で統合することで,障害局所化を強化する新しいアプローチであるMemFLを紹介した。
MemFLはデバッグを3つの合理化ステップに単純化し、効率と精度を大幅に改善する。
GPT-4.1-miniのMemFLは既存の手法を24.4%上回り、バグにつき24.7秒と0.0094ドルしか必要としなかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 05:33:32 GMT)
Impact of COVID-19 on The Bullwhip Effect Across U.S. Industries [0.0] ブルウィップ効果はサプライチェーンに対する需要変動の増幅を記述している。
本研究は、新型コロナウイルスのパンデミックが米国の産業全体にわたってブルウィップ効果をいかに高めたかを検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:39:10 GMT)
Identifying Alzheimer's Disease Prediction Strategies of Convolutional Neural Network Classifiers using R2* Maps and Spectral Clustering [0.0] 深層学習モデルは、R2*マップからアルツハイマー病(AD)を分類する上で、強い性能を示している。
これまでの研究では、さらなる分析を必要とするモデル決定のバイアスが示唆されていた。
我々はR2*マップ上で3次元畳み込みニューラルネットワークを訓練し、LRPを介して関連ヒートマップを生成し、スペクトルクラスタリングを適用して支配的なパターンを同定した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:35:24 GMT)
High-efficiency telecom frequency conversion via a diamond-type atomic ensemble [0.0] 原子系における効率的な通信周波数変換(TFC)は、原子ベースの量子ノードを低損失光ファイバー量子ネットワークに統合するために重要である。
ここでは,ダイヤモンド型4波長混合(FWM)による87Rbアンサンブルにおいて,795nmから1367nmまでの高効率TFCを示す。
これらの結果は、組込みV型およびカスケード型電磁誘導透過スペクトルの体系的な研究によって実現された原子系の全ての既報値を上回った。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:48:18 GMT)
High-Dimensional Learning in Finance [0.0] 機械学習の最近の進歩は、財務予測に有望な結果を示している。
本稿では,これらの手法が予測的成功をいつ,どのように達成するかを理解するための理論的基礎と実証的検証を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:41:55 GMT)
Giant Atom with Disorders [0.0] 巨大原子に関連する現象に対する障害の影響について検討する。
巨大原子関連現象はマルコフ体制における結合位置と強度の両方の障害に対して堅牢であることがわかった。
我々の研究は、巨大原子系のBICのような非マルコフ現象を観測するためには、結合位置の障害を制御するためにより精密な制御が必要であることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:15:03 GMT)
Geoff: The Generic Optimization Framework & Frontend for Particle Accelerator Controls [0.0] Geoffは、粒子加速器制御の自動化のためのフレームワークを形成するPythonパッケージのコレクションである。
最適化問題のための標準化されたインターフェース、開発をスピードアップするユーティリティ機能、すべてを結合するリファレンスGUIアプリケーションを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:58:48 GMT)
Generalized Diffusion Detector: Mining Robust Features from Diffusion Models for Domain-Generalized Detection [0.0] オブジェクト検出のためのドメイン一般化(DG)は、目に見えないシナリオにおける検出器の性能を高めることを目的としている。
近年の拡散モデルは多様なシーン生成において顕著な機能を示した。
本稿では,拡散モデルの一般化能力を検出器が継承できる効率的な知識伝達フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:55:35 GMT)
GPa Pressure Imaging Using Nanodiamond Quantum Sensors [0.0] ダイヤモンドアンビルセル(DAC)における約20GPaの圧力分布の広視野光学顕微鏡による観察を行った。
ナノダイヤモンド(ND)の窒素空孔(NV)中心を量子センサとして使用する。
光検出磁気共鳴(ODMR)スペクトルを静水圧および一軸応力条件を取り入れたモデルに装着することにより、圧力と非静水率マップが得られる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:00:12 GMT)
Functional relevance based on the continuous Shapley value [0.0] この研究は、関数データに基づく予測モデルの解釈可能性に焦点を当てる。
連続ゲームにおけるShapley値に基づく解釈可能性手法を提案する。
この手法は、シミュレーションおよび実データを用いた一連の実験を通して説明される。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:42:38 GMT)
From Hamilton-Jacobi to Bohm: Why the Wave Function Isn't Just Another Action [0.0] 本稿では,ボヘミア力学における波動関数の物理的意味について検討する。
因果的解釈とノーモロジー的解釈の議論に対処する。
BMにおける波動関数の役割は古典的な類似に抵抗する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:36:26 GMT)
Free Probability approach to spectral and operator statistics in Rosenzweig-Porter random matrix ensembles [0.0] 我々はRosenzweig-Porter-Porterランダムマトリクスアンサンブルのスペクトル統計と演算子統計を分析した。
本研究では,状態密度の半解析式をシステムサイズで最大2次まで生成する摂動型スキームを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:56:23 GMT)
FERRET: Private Deep Learning Faster And Better Than DPSGD [0.0] FERRETは[0.1, 2]のエプシロンのMI-DPを付加雑音なしで達成できることを示す。
FERRETはDPSGDに比べて最大5倍速く、3倍低いパープレキシティを持ち、非DPより1.2倍大きい。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:18:45 GMT)
Extended string-net models with all anyons at finite temperature [0.0] 元の文字列ネットモデルでは、電荷励起の記述が問題となることがある。
励起状態のスペクトル退化を計算し、正確な分割関数を得る。
有限サイズの系では、オーダーは有限温度まで生存し、温度とサイズの間の非自明なスケーリングを明らかにする。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:17:49 GMT)
Exponentially-enhanced quantum sensing with many-body phase transitions [0.0] 第一次量子相転移を特徴とする多体系は、指数エネルギーギャップの閉鎖により、感度の指数的スケーリングを実現することができることを示す。
本研究は, 位相遷移点から離れて, 適応戦略により指数的優位性を利用することができることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:27:14 GMT)
Exponential distillation of dominant eigenproperties [0.0] 量子系の固有状態における観測可能な期待値の推定には、幅広い応用がある。
固有状態における任意の観測可能な期待値を推定できるハイブリッド量子古典アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:49:08 GMT)
Evaluating Large Language Model Capabilities in Assessing Spatial Econometrics Research [0.0] 28の論文から、オリジナルかつ意図的に変更された「偽造」要約を作成しました。
その結果, LLMは変数選択のコヒーレンスを専門的に評価できるが, より深い側面を評価した場合, その性能は著しく変化することがわかった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:30:57 GMT)
Evaluating Apple Intelligence's Writing Tools for Privacy Against Large Language Model-Based Inference Attacks: Insights from Early Datasets [0.0] 悪意のある目的のためにテキストから感情を推測するLarge Language Model(LLM)の誤用は、ユーザのプライバシに重大な脅威をもたらす。
我々は、iPhone、iPad、MacBookにまたがって統合されたApple Intelligenceの筆記ツールが、リライトやトーン調整などのテキスト修正によってこれらのリスクを軽減する可能性について検討する。
本研究は,ユーザプライバシを高めるために,情緒的コンテンツを動的に中和する,将来の適応的書き換えシステムの基礎を築いた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:01:17 GMT)
Estimation of the reduced density matrix and entanglement entropies using autoregressive networks [0.0] 本稿では,自己回帰ニューラルネットワークの量子スピン鎖のモンテカルロシミュレーションへの応用について述べる。
我々は、連続スピンの条件確率を推定できるニューラルネットワークの階層を用いて、密度の低下した行列の要素を評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:08:19 GMT)
Entropy flow in a parametric amplifier [0.0] エネルギーと光子数はゼロではないにもかかわらず、出力エントロピーフラックスは大きな時間で消滅する。
これは、パンプがその初期状態に関する情報を解放すると予想される方法と一致している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:01:18 GMT)
Entanglement suppression and quantum scars in a three-oscillator gravitational analogue [0.0] 結合調和振動子の三部系における量子相関について検討する。
システムの可積分性にも拘わらず、非ゼロ量子カップリングにおいても、二部結合が消滅する状態を特定する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:10:37 GMT)
Entanglement renormalization circuits for $2d$ Gaussian Fermion States [0.0] マルチスケールエンタングルメント再正規化アンサッツ(MERA)に基づくガウスフェルミオン状態の量子回路圧縮アルゴリズムを提案する。
このアルゴリズムは、トポロジカルに自明な絶縁体、チャーン絶縁体、臨界ディラック半金属を含む、領域法的な絡み合った状態を正確に捉えることが示されている。
また,システムサイズに依存しない定数パウリ重みを持つキュービットパウリ回転によるフェルミオン回転の実現が可能な,拡張された2d$トポロジカル順序に基づく新しいフェルミオン・ツー・キュービット符号化方式を開発した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:44:17 GMT)
Enhancing Experimental Efficiency in Materials Design: A Comparative Study of Taguchi and Machine Learning Methods [0.0] 材料設計の問題は、しばしば複数の変数を最適化し、完全な因子探索を非現実的に行う必要がある。
本研究では、機械学習(ML)メソッドがこれらの制限を克服するためにどのように使用できるかを実証する。
本稿では, 能動学習に基づくガウス過程回帰(GPR)モデルとタグチ法の性能を比較した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 13:04:29 GMT)
Emergent gravity and gravitational lensing in quantum materials [0.0] 有効重力場は、長い波長のスピン(または擬スピン)テクスチャを持つ量子材料に自然に現れることを示す。
反復電子のスピンが背景のスピンテクスチャーに強く結合すると、曲線空間におけるスピンレス粒子として効果的に振る舞う。
創発的な重力は、重力レンズのアナログである電子レンズ効果を引き起こす。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:00:12 GMT)
Dreaming up scale invariance via inverse renormalization group [0.0] 我々は,2次元イジングモデルにおいて,最小限のニューラルネットワークが再正規化群 (RG) の粗粒化過程を逆転できることを示す。
トレーニング可能なパラメータを3つも持たないニューラルネットワークでさえ、重要な構成を生成することができることを実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:46:22 GMT)
Does Prompt Design Impact Quality of Data Imputation by LLMs? [0.0] 本稿では,大規模言語モデルの文脈内学習機能を活用したトークン認識型データ計算手法を提案する。
2つのクラス不均衡なバイナリ分類データセットを用いてこのアプローチを検証し、計算の有効性を評価する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 17:15:19 GMT)
Directional Non-Commutative Monoidal Embeddings for MNIST [0.0] 本報告では, 指向性非可換モノイダル埋め込みフレームワークの実証検証について述べる。
このフレームワークは、次元ごとに異なる非可換作用素を用いて学習可能な合成埋め込みを定義する。
本実験により, 画像データの表現には, 指向性非可換モノイダル埋め込みが有効であることが確認された。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 01:07:51 GMT)
DiagNet: Detecting Objects using Diagonal Constraints on Adjacency Matrix of Graph Neural Network [0.0] グラフ畳み込みネットワーク(GCN)の隣接行列上の対角的制約を用いてオブジェクト境界ボックスを検出できる新しいオブジェクト検出手法であるDaigNetを提案する。
実験の結果、DiagNet は Pascal VOC において YOLOv1 よりも7.5%高い mAP50 を達成することが示された。
DiagNetはまた、MS COCOではYOLOv3uより5.1%高いmAP、YOLOv5uより3.7%高いmAP、YOLOv8より2.9%高いmAPを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:34:48 GMT)
Deviation from Complete Positivity: Structural Insights and Quantum Information Applications [0.0] 我々は、エルミート写像が完全に正であることからどれくらいの距離にあるかを示す尺度としてCP距離を導入する。
行列代数間の正エルミート線型写像の構造解析におけるCP距離の役割について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:36:41 GMT)
Design, Implementation, and Analysis of Fair Faucets for Blockchain Ecosystems [0.0] Dissertationは、非商用ブロックチェーンネットワークで共有リソースを公平に分散する問題に対処する。
非商用ネットワークは、与えられたネットワークに固有の固定量の自由トークンを提供するファセットと呼ばれる自明な分配機構を用いる。
本論文では、ファウセット機構を、マックスミンフェアネススキームに則って公正分布に適用する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:17:08 GMT)
Deep learning for predicting hauling fleet production capacity under uncertainties in open pit mines using real and simulated data [0.0] 本稿では,実世界の運用記録と合成機械的破壊シナリオを融合したディープラーニングフレームワークを提案する。
XGBoost回帰器は14.3%の絶対誤差(MedAE)と15.1%のLong Short-Term Memoryネットワークの2つのアーキテクチャを評価した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:12:56 GMT)
Deep Learning for Absorption-Image Analysis [0.0] 画像回帰のための改良型ディープラーニング画像分類モデルを提案する。
データ収集における課題を克服するために、シミュレーション吸収画像のモデルを訓練する。
ディープラーニングモデルの性能を最小二乗法と比較し、ディープラーニングモデルが最小二乗法と同様の精度を達成することを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 23:50:10 GMT)
Cyber-Physical Security Vulnerabilities Identification and Classification in Smart Manufacturing -- A Defense-in-Depth Driven Framework and Taxonomy [0.0] 既存のソリューションは、製造環境の複雑なドメイン固有の脆弱性に対処するのに不足している。
本稿では, 脆弱性と防御の二重性に基づく新たな特徴付けを導入することにより, 製造状況における脆弱性を再定義する。
我々は,製造サイバースペース,人体要素,ポストプロダクション検査システム,生産プロセス監視,組織方針および手順の脆弱性を特定し,分類する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:40:30 GMT)
Crowd Scene Analysis using Deep Learning Techniques [0.0] 本研究は,群集シーン分析の2つの主な応用に焦点を当てたものである。
ディープラーニングモデルはデータハングリーであり、アルゴリズムのトレーニングには、常に大量の注釈付きデータが必要です。
群集異常検出のためのVGG19に基づく時間モデルを提案する。
モデルは二分分類で動作し、正常または異常な振る舞いを検出することができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:58:31 GMT)
Conformal coronary calcification volume estimation with conditional coverage via histogram clustering [0.0] クラスタベースの条件付きコンフォメーション予測フレームワークを提案し、トレーニングされたセグメンテーションネットワークからスコア間隔を調整し、再トレーニングを行わないようにする。
提案手法を調整し,3次元UNetモデルの予測間隔を調整した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:55:52 GMT)
Computational Architects of Society: Quantum Machine Learning for Social Rule Genesis [0.0] 本研究では、量子力学と生成AIを組み合わせて、社会規範の出現と進化をシミュレートする理論的・計算的枠組みを提案する。
鍵となる発見は、量子原理が生成的AIと統合されると、複雑な社会システムにおける不確実性、出現、相互依存のモデリングを可能にすることを示している。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:40:53 GMT)
Compressed sensing quantum state tomography for qudits: A comparison of Gell-Mann and Heisenberg-Weyl observable bases [0.0] 従来の量子状態トモグラフィ(QST)は、システム次元が増加するにつれて指数関数的に増加する測定値を必要とする。
この問題を緩和するため、圧縮量子状態トモグラフィ(CS-QST)が提案され、必要な測定回数を大幅に削減した。
我々は,高次元量子情報処理の基本となるキューディット系におけるCS-QSTの基底選択の影響について検討する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:07:09 GMT)
Comparing quantum complexity and quantum fidelity [0.0] 複雑性は量子忠実度と同じ情報を提供し、したがって量子相転移を検出することができることを示す。
我々は,空間的局所性の概念を複雑性の計算に取り入れることが,新しい物理を明らかにする上で重要であると結論付けた。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:55:32 GMT)
Client-Side Zero-Shot LLM Inference for Comprehensive In-Browser URL Analysis [0.0] 悪意のあるウェブサイトやフィッシングURLは、サイバーセキュリティのリスクがますます高まっている。
従来の検出アプローチは機械学習に依存している。
包括的URL分析のための新しいクライアントサイドフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 07:47:23 GMT)
Classifying Dental Care Providers Through Machine Learning with Features Ranking [0.0] 本研究では, 歯科医療機関の分類における機械学習(ML)モデルの適用について検討した。
データセットには、サービスカウント(予防、治療、試験)、デリバリーシステム(FFS、管理ケア)、受益者の人口統計が含まれる。
本研究は,モデル効率と精度の向上における特徴選択の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:45:40 GMT)
Characterization of the chaotic phase in the tilted Bose-Hubbard model [0.0] 傾きボース・ハバードモデルのカオス相はエネルギー,傾き強度,粒子相互作用の関数として同定される。
解析の結果,素体のボース・ハッバード・ハミルトンのカオス位相は,適度な傾きの存在によって実際に向上できることが明らかとなった。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:47:35 GMT)
Can KAN CANs? Input-convex Kolmogorov-Arnold Networks (KANs) as hyperelastic constitutive artificial neural networks (CANs) [0.0] 我々は法則を学ぶための新しいタイプのモデルを提案する。
訓練可能な物質行動です
結果として得られるモデルはどちらもコンパクトなハイパートレインブル解釈である。
関係解析的圧縮性
ICKANは多様なひずみ状態の応力-sモデルを正確に捉えることができる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:35:32 GMT)
CLAIM: An Intent-Driven Multi-Agent Framework for Analyzing Manipulation in Courtroom Dialogues [0.0] NLPの進歩にもかかわらず、法域内での操作の検出と解析におけるその応用は、明らかにされていない。
我々の研究は、操作検出にラベル付けされた1,063の注釈付き法廷会話データセットであるLegalConを導入することで、このギャップに対処する。
CLAIMは2段階のインテント駆動型マルチエージェントフレームワークであり、コンテキスト認識と情報意思決定を可能とし、操作解析の強化を目的としている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:22:59 GMT)
Bridging the Artificial Intelligence Governance Gap: The United States' and China's Divergent Approaches to Governing General-Purpose Artificial Intelligence [0.0] アメリカと中国は、先進的な人工知能(AI)システムの開発において世界トップのプレイヤーである。
米国と中国の政策状況を見ると、両国がAIシステムのガバナンスにどのようにアプローチするかが異なることが分かる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 02:24:27 GMT)
BridgeNet: A Hybrid, Physics-Informed Machine Learning Framework for Solving High-Dimensional Fokker-Planck Equations [0.0] BridgeNetは、非線型で高次元のFokker-Planck方程式(FPE)を効率的に解くために、畳み込みニューラルネットワークと物理インフォームドニューラルネットワークを統合する新しいフレームワークである。
この研究は計算物理学の大幅な進歩を表しており、金融数学から複雑なシステム力学まで幅広い分野において有望な応用を期待できるスケーラブルで正確な解法を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:12:59 GMT)
Automatic Correction of Writing Anomalies in Hausa Texts [0.0] ハウサ文字はしばしば、誤字置換やスペーシングエラーなどの異常を書くことで特徴づけられる。
本稿では,変圧器モデルを用いて異常を自動的に修正する手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 10:46:19 GMT)
Automated Mechanism to Support Trade Transactions in Smart Contracts with Upgrade and Repair [0.0] 本稿では,開発者が予期していなかったイベントのために完成できないスマートコントラクトを修復するための方法論を提案する。
本稿では,TABS+ツールを拡張し,スマートコントラクトの修復を可能にするツールTABS+について述べる。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:13:07 GMT)
Automated Architecture Synthesis for Arbitrarily Structured Neural Networks [0.0] 学習中に任意のグラフ構造を構築することを学習する新しいフレームワークを提案する。
我々のフレームワークは完全なグラフから学習し、生物学的ニューラルネットワークに似たニューロン間の自由なコミュニケーションを可能にします。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:48:31 GMT)
Are Lexicon-Based Tools Still the Gold Standard for Valence Analysis in Low-Resource Flemish? [0.0] LIWCやPatternといった従来のレキシコンベースのツールは、長い間この領域の基本的な道具として機能してきた。
オランダ語話者102名を対象に,まず約25,000件のテキスト応答について検討した。
オランダ固有の3つのLLMの性能評価を行い, LIWCとPatternで生成した値と比較した。
本研究は,自然言語使用の複雑さを包括的に扱える,文化的・言語学的にカスタマイズされたモデル・ツールの開発に不可欠であることを示す。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:31:37 GMT)
Anomaly Detection in Complex Dynamical Systems: A Systematic Framework Using Embedding Theory and Physics-Inspired Consistency [0.0] 複雑な力学系における異常検出は、産業やサイバー物理のインフラにおける信頼性、安全性、効率を確保するために不可欠である。
本稿では,古典的な埋め込み理論と物理に着想を得た一貫性原理を基礎としたシステム理論による異常検出手法を提案する。
本研究は, 異常が安定系の力学を阻害する仮説を支持し, 異常検出のためのロバストな信号を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:58:45 GMT)
Analyzing Transformer Models and Knowledge Distillation Approaches for Image Captioning on Edge AI [0.0] 本稿では,エッジデバイス上で効果的に動作する画像キャプション用トランスフォーマーモデルについて述べる。
モデル性能を維持しながら、リソース制約のあるデバイス上で推論を高速化できることを実証する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 06:37:04 GMT)
Analytical Reconstruction of Periodically Deformed Objects in Time-resolved CT [0.0] 時間分解CTは、心臓、肺、聴覚構造などの周期的に変化する構造を含む、動的物体の観察に広く用いられている。
CTプロジェクションからこれらのオブジェクトを再構成するために、一般的なアプローチは、プロジェクションを運動位相に基づいて複数のコレクションに分割し、静的なオブジェクトから派生したと仮定して、各コレクション内で再構成を行うことである。
本稿では,2つの解析的再構成パイプラインを提案し,それをトモグラフィ・シンクロトロン顕微鏡を用いて観測した実験データを用いて検証する。
提案手法は,観察対象の鋭い特徴をぼかすことなく,再構成画像のランダムノイズを著しく低減することを示した。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 09:54:30 GMT)
An Expansion-Based Approach for Quantified Integer Programming [0.0] 量子プログラミング(QIP)は、量子ブール公式(QBF)を拡張して複数の領域を橋渡しする
QIPは複雑な意思決定シナリオに対処するための汎用的なフレームワークを提供する。
本稿では,CEGARを用いたQIP拡張手法を提案する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 21:14:14 GMT)
Algorithms for estimating linear function in data mining [0.0] このトピックの主な目的は、ユーザ好みを予測するために線形ユーティリティ関数を推定するためのいくつかの研究アルゴリズムを紹介することである。
例えば、ユーザーが線形関数の速度、色、年齢などいくつかの属性を持つ車を購入しようとすると、本論文で紹介するアルゴリズムは、この線形関数を推定して小さなサブセットをフィルタリングするのに役立つ。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 03:09:07 GMT)
AgentMisalignment: Measuring the Propensity for Misaligned Behaviour in LLM-Based Agents [0.0] 本稿では,現実的なシナリオの集合からなる不整合性評価ベンチマークであるAgentMisalignmentを紹介する。
評価を,ゴールガード,シャットダウン抵抗,サンドバッグ,パワーセーキングなど,不整合行動のサブカテゴリに整理する。
本ベンチマークでは,より有能なモデルを評価する際に,平均的な不一致を観測し,フロンティアモデルの性能を報告する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 14:46:47 GMT)
Advancements in Artificial Intelligence Applications for Cardiovascular Disease Research [0.0] 人工知能(AI)の最近の進歩は、心臓血管医学に革命をもたらした。
ディープラーニングアーキテクチャは、医療画像と生理的信号の自動解析を可能にする。
今後の方向性は、パーソナライズされた心血管ケアを洗練させるために、マルチモーダルデータと適応アルゴリズムを統合するハイブリッドモデルに重点を置いている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 08:31:28 GMT)
Abelian Spectral Topology of Multifold Exceptional Points [0.0] 我々は、局所対称性を持つ一般システムやシステムにおけるEP$n$sの分類を再検討し、より数学的に抽出可能な(局所的な)類似性関係の観点から一般化し、非局所対称性と同様に類似性を含むように拡張する。
我々の研究は、EP$n$sのトポロジカルな性質が持つ基礎を明らかにし、古典物理学と量子物理学の両方における近代的な実験で大いに役立つだろう。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 12:30:50 GMT)
A Unitary Encoder for Surface Codes [0.0] そこで本研究では,ロータリーな曲面符号と正規な曲面符号の符号変換に基づいて,曲面符号状態を符号化する非局所ユニタリ回路を提案する。
我々のエンコーダは、中性原子や閉じ込められたイオンのような非局所的な相互作用が利用できるプラットフォームにおいて、実用的な利点を提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 15:45:03 GMT)
A Threat Intelligence Event Extraction Conceptual Model for Cyber Threat Intelligence Feeds [0.0] サイバー脅威インテリジェンス(CTI)のデータ収集の効率は、堅牢なサイバーセキュリティの確保において最重要になっている。
既存の作業は、大量の多言語脅威データを前処理する上で重大な課題に遭遇し、リアルタイム脅威分析の不効率につながった。
本稿では,CTIデータ収集効率の向上を目的とした,現在の手法の体系的レビューを行う。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 04:09:01 GMT)
A Statistical Physics of Language Model Reasoning [0.0] トランスフォーマーLMは機械的理解に抵抗する創発的推論を示す。
我々は、連続時間連鎖推論力学のための統計物理学の枠組みを提供する。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:43:23 GMT)
A Risk-Aware Reinforcement Learning Reward for Financial Trading [0.0] 金融取引における強化学習のための新しい複合報酬関数を提案する。
4つの異なる用語を使ってリターンとリスクのバランスをとる。
これらの重み付けをグリッド検索で調整し、特定のリスクリターンプロファイルをターゲットとします。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 18:19:48 GMT)
A Comprehensive Study on Medical Image Segmentation using Deep Neural Networks [0.0] 本稿では,Deep Neural Networks(DNN)を用いた医用画像(MIS)の総合的研究について述べる。
本研究は,病因診断および早期発見におけるMISの重要性を強調し,特にタイムリー診断によりがん患者の生存率を高めることを目的とした。
XAIと早期予測は「知性」から「知性」への旅の2つの重要なステップと考えられている。
論文参考訳(メタデータ) (Wed, 04 Jun 2025 16:15:03 GMT)