Spurious Rewards: Rethinking Training Signals in RLVR [130.3] 検証可能な報酬(RLVR)を用いた強化学習は,特定のモデルにおいて強い数学的推論を導出できることを示す。
例えば、RLVRはQwen2.5-Math-7BのMATH-500の性能を21.4%向上させた。
コード推論 -- 実際のコード実行なしにコードで考える -- は、RLVR以降、はるかに頻繁になる、独特なQwen2.5-Mathの振る舞いである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:49:55 GMT)
SoK: Watermarking for AI-Generated Content [112.9] ウォーターマーキングスキームは、AI生成コンテンツに隠された信号を埋め込んで、信頼性の高い検出を可能にする。
透かしは、誤情報や偽造と戦ってAIの安全性と信頼性を高める上で重要な役割を果たす。
本研究の目的は、研究者が透かし法や応用の進歩を指導し、GenAIの幅広い意味に対処する政策立案者を支援することである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:58:20 GMT)
CollabLLM: From Passive Responders to Active Collaborators [109.4] 大規模な言語モデルは、通常、次のターン報酬で訓練され、長期的な相互作用のために最適化する能力を制限する。
マルチターン・ヒューマン・LLMコラボレーションを強化する新奇で汎用的なトレーニングフレームワークであるCollabLLMを紹介する。
また、201人の審査員による大規模なユーザスタディを実施し、CollabLLMはユーザの満足度を17.6%向上し、ユーザ使用時間を10.4%削減します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:58:31 GMT)
Discrete Audio Tokens: More Than a Survey! [107.7] 本稿では,離散型音声トークンの体系的レビューとベンチマークを行う。
音声、音楽、一般的なオーディオドメインをカバーしている。
本稿では,エンコーダデコーダ,量子化技術,トレーニングパラダイム,ストリーム性,アプリケーションドメインに基づくトークン化アプローチの分類法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:35:43 GMT)
Magistral [101.5] 私たちは、Mistralの最初の推論モデルであるMagistralと、当社独自のスケーラブルな強化学習パイプラインを紹介します。
テキストデータだけでRLが初期チェックポイントの能力のほとんどを維持していることを示す。
我々は、Mistral Medium 3上でRL単独で推論するために訓練されたMagistral Mediumを紹介し、Magistral Small(Apache 2.0)をオープンソース化した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:22:37 GMT)
Weak-to-Strong Jailbreaking on Large Language Models [92.5] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に対して脆弱である。
既存のジェイルブレイク法は計算コストがかかる。
我々は、弱々しく強固な脱獄攻撃を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:32:02 GMT)
Sample Complexity and Representation Ability of Test-time Scaling Paradigms [91.3] テスト時間スケーリングのパラダイムは、複雑なタスクにおいて、大きな言語モデル(LLM)の能力を向上した。
本稿では, 自己整合性, ベスト・オブ・n$, 自己補正など, 様々なテストタイム戦略のサンプル効率について検討する。
単一のTransformerアーキテクチャは、ユーザクエリに関連する特定のタスクを事前に知ることなく、複数のタスクを確実に解決することができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:25:06 GMT)
BioNeMo Framework: a modular, high-performance library for AI model development in drug discovery [85.0] 計算生物学と化学AIモデルのトレーニングを容易にするために,BioNeMo Frameworkを紹介した。
256のNVIDIA A100では、BioNeMo Frameworkは40億のパラメータBERTベースのPLMを4.2日で1兆個以上のトークンでトレーニングしている。
BioNeMo Frameworkはオープンソースで、誰でも自由に使える。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:06:28 GMT)
Pisces: An Auto-regressive Foundation Model for Image Understanding and Generation [81.9] 統一モデルを開発する上で重要な課題は、画像理解に必要な視覚的特徴と生成の相違にある。
本稿では,この課題に対処する自動回帰型マルチモーダル基盤モデルであるPiscesを紹介する。
微妙なデータキュレーション、事前学習、微調整と組み合わせることで、ピッセは画像理解と画像生成の両方において競合する性能を達成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:37:34 GMT)
GenWorld: Towards Detecting AI-generated Real-world Simulation Videos [80.0] GenWorldは、AI生成ビデオ検出のための大規模で高品質で実世界のシミュレーションデータセットである。
実世界のAI生成ビデオ検出のための強力な基準として,マルチビュー一貫性を活用するモデルであるSpannDetectorを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:33 GMT)
Principled Approaches for Extending Neural Architectures to Function Spaces for Operator Learning [78.9] ディープラーニングは主にコンピュータビジョンと自然言語処理の応用を通じて進歩してきた。
ニューラル演算子は、関数空間間のマッピングにニューラルネットワークを一般化する原則的な方法である。
本稿では、無限次元関数空間間の写像の実践的な実装を構築するための鍵となる原理を同定し、蒸留する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:31 GMT)
Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers [76.4] 我々は、両方の行動は、アウト・オブ・コンテクスト推論(OCR)として知られる単一のメカニズムに由来すると論じる。
OCRは、関連する概念が因果関係であるかによって、一般化と幻覚の両方を駆動する。
我々の研究は、OCR現象を理解するための理論的基盤を提供し、知識注入から望ましくない行動を分析し緩和するための新しいレンズを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:50:45 GMT)
Visually Descriptive Language Model for Vector Graphics Reasoning [76.4] 低レベル視覚知覚と高レベル言語推論のギャップを埋めるための視覚記述型言語モデル(VDLM)を提案する。
VDLMは,様々なマルチモーダル認識および推論タスクにおいて,GPT-4oのような最先端のLMMを大幅に改善することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:46:36 GMT)
Elucidating the Design Space of Multimodal Protein Language Models [69.4] マルチモーダルタンパク質言語モデル(PLM)は、シーケンスとトークンに基づく構造情報を統合する。
本稿では,マルチモーダルPLMの設計空間を体系的に解明し,その限界を克服する。
我々の進歩はよりきめ細かな監督にアプローチし、トークンベースのマルチモーダルPLMが堅牢な構造モデリングを実現することを実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:51:35 GMT)
Text to Image for Multi-Label Image Recognition with Joint Prompt-Adapter Learning [69.3] 本稿では,PEFTのテキストキャプションのみを使用する場合のモダリティギャップ問題に対処するため,T2I-PALと呼ばれる新しい手法を提案する。
T2I-PALの中核となる設計は、事前訓練されたテキスト-画像生成モデルを利用して、テキストキャプションからフォトリアリスティックで多様な画像を生成することである。
MS-COCO、VOC2007、NAS-WIDEを含む複数のベンチマークに対する大規模な実験は、我々のT2I-PALが認識性能を平均3.47%向上させることができることを示している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:09:49 GMT)
A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce [69.0] 我々はGRPOを強化的なアルゴリズムの観点から再検討し、そのコアコンポーネントを分析する。
単純な拒絶サンプリングベースラインであるRAFTは,GRPOやPPOよりも競争性能が高いことがわかった。
この知見に触発されて、完全に正しくないサンプルと完全に正しいサンプルの両方をフィルタリングするポリシー勾配の最小限の拡張であるReinforce-Rejを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:03:24 GMT)
NOBLE -- Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models [68.9] NOBLEは、解釈可能なニューロンの特徴を連続周波数変調した埋め込みから電流注入によって誘導されるソマティック電圧応答へのマッピングを学ぶ神経オペレーターフレームワークである。
内在的な実験変数を考慮したニューラルダイナミクスの分布を予測する。
NOBLEは、実際の実験データに基づいて検証された最初のスケールアップされたディープラーニングフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:50:25 GMT)
Sequential-Parallel Duality in Prefix Scannable Models [68.4] 近年では Gated Linear Attention (GLA) や Mamba など様々なモデルが開発されている。
ニアコンスタント時間並列評価と線形時間、定数空間シーケンシャル推論をサポートするニューラルネットワークモデルの全クラスを特徴付けることができるだろうか?
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:32:02 GMT)
A Survey on All-in-One Image Restoration: Taxonomy, Evaluation and Future Trends [67.4] 画像復元(IR)は、ノイズ、ぼかし、圧縮、悪天候などの様々な要因によって劣化した入力から高品質な画像を復元することを目的としている。
従来のIR手法は、一般的に特定の種類の劣化に焦点を当てており、複雑な歪みを伴う現実世界のシナリオにおけるそれらの効果を制限している。
オールインワンのイメージ復元パラダイムが最近登場し、複数の劣化タイプに順応的に対処する統一されたフレームワークを提供している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:12:41 GMT)
Non-stationary Online Learning for Curved Losses: Improved Dynamic Regret via Mixability [66.0] 混合可能性の概念を活用することで、動的後悔を著しく改善できることを示す。
固定共有更新を持つ指数重み付け法は,混合損失に対して$mathcalO(d T2/3 P_T2/3 log T)$ dynamic regretを達成できることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:00:08 GMT)
Improving LLM Safety Alignment with Dual-Objective Optimization [65.4] 大規模言語モデル(LLM)の既存のトレーニング時間安全アライメント技術は、ジェイルブレイク攻撃に対して脆弱なままである。
本研究では,DPOの目的を2つの構成要素にまとめる安全アライメントの改善について提案する。(1) 安全でない世代が部分的に発生しても拒否を促す頑健な拒絶訓練,(2) 有害な知識の未学習。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:38:05 GMT)
Learning hidden cascades via classification [64.5] 拡散モデルの特徴を学習するための部分的可観測性を考慮した機械学習フレームワークを提案する。
本手法を2種類の合成ネットワーク上で評価し,実世界のインサイダー取引ネットワークに拡張する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:37:57 GMT)
VideoDeepResearch: Long Video Understanding With Agentic Tool Using [63.6] LVU(Long Video Understanding)は、現在のマルチモーダル大言語モデル(MLLM)において重要な課題である。
本稿では,ビデオ理解のための新しいエージェントフレームワークであるVideoDeepResearchを紹介する。
各LVUタスクに対して、ツールは推論を通じて問題解決戦略を定式化し、ツール使用による必須映像コンテンツへのアクセスと活用を選択的に行う。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:39:10 GMT)
Heavy-Tailed Linear Bandits: Huber Regression with One-Pass Update [63.0] ヘビーテール付きバンディットには、ヘビーテール付きノイズ、トランケーション、中央値の2つの基本戦略が導入されている。
本稿では,オンラインミラー降下フレームワークに基づくEmphone-passアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:11:27 GMT)
VINCIE: Unlocking In-context Image Editing from Video [62.9] 本研究では,ビデオからテキスト内画像編集モデルを直接学習できるかどうかを考察する。
このデータから効果的に学習するために、3つのプロキシタスクに基づいて訓練されたブロック因果拡散変換器を設計する。
本モデルでは,2つのマルチターン画像編集ベンチマークにおいて,コンテクスト内画像編集能力が強く,最先端の結果が得られている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:46:54 GMT)
Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation [62.7] 一般化可能なロボット操作のための大規模言語モデル(LLM)に基づく基盤的視覚言語計画モデルであるゴンドラについて紹介する。
G Gondola氏はマルチビューイメージとヒストリプランを使って、インターリーブされたテキストとターゲットオブジェクトとロケーションのセグメンテーションマスクを備えた次のアクションプランを作成する。
G Gondolaは、GemBenchデータセットの4つのレベルすべてにわたって、最先端のLCMベースのメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:04:31 GMT)
Farseer: A Refined Scaling Law in Large Language Models [62.3] 本稿では,新たなスケール法であるFarseerを紹介した。
モデル損失曲面 $L(N,D)$ を体系的に構築することにより、Farseer は以前の法則よりも経験的データに非常によく適合する。
我々の手法は正確で頑健で、非常に一般化可能な予測をもたらし、優れた外挿能力を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:23 GMT)
ME: Trigger Element Combination Backdoor Attack on Copyright Infringement [61.1] SilentBadDiffusion(SBD)は、テキスト・ツー・イメージタスクにおけるSD攻撃において優れた性能を示す手法である。
本稿では,SBDのような攻撃の研究に利用できる新しいデータセットを作成し,SBDに基づくマルチ要素攻撃法を提案する。
著作権侵害率 (CIR) / First Attack Epoch (FAE) の2つの新しいデータセットは16.78% / 39.50と51.20% / 23.60で、それぞれPokemonとMijourneyのベンチマークに近いか、あるいは劣っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:51:27 GMT)
VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [61.0] 変分量子回路(VQC)は、量子機械学習のための新しい経路を提供する。
それらの実用的応用は、制約付き線形表現性、最適化課題、量子ハードウェアノイズに対する鋭敏感といった固有の制限によって妨げられている。
この研究は、これらの障害を克服するために設計されたスケーラブルで堅牢なハイブリッド量子古典アーキテクチャであるVQC-MLPNetを導入している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:38:15 GMT)
Scientists' First Exam: Probing Cognitive Abilities of MLLM via Perception, Understanding, and Reasoning [59.5] 我々は,Multimodal Large Language Models (MLLM) の科学的認知能力を評価するために設計された,Scientists' First Exam (SFE) ベンチマークを提示する。
SFEは3つの質問タイプにまたがる830のエキスパート検証VQAペアで構成され、5つの高価値分野にまたがる66のマルチモーダルタスクにまたがる。
実験の結果、現在最先端のGPT-o3とInternVL-3はSFEでわずか34.08%と26.52%しか達成できず、MLLMが科学領域で改善する余地があることが明らかになった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:29:16 GMT)
CompilerDream: Learning a Compiler World Model for General Code Optimization [58.9] 汎用コード最適化のためのモデルベース強化学習手法であるCompilerDreamを紹介する。
最適化パスの固有の特性を正確にシミュレートするコンパイラの世界モデルと、このモデルで訓練されたエージェントから、効率的な最適化戦略を生成する。
さまざまなデータセットを網羅し、LLVMのビルトイン最適化や、値予測とエンドツーエンドコード最適化の両方の設定における最先端メソッドを超越している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:33:47 GMT)
M4V: Multi-Modal Mamba for Text-to-Video Generation [58.5] テキスト・ビデオ・ジェネレーションはコンテンツを豊かにし、強力な世界シミュレータを作る可能性を秘めている。
広大な空間のモデリングは、特にシークエンス処理に二次的を利用する場合、計算的に要求される。
テキスト・ビデオ生成のためのマルチモーダル・マンバフレームワークを提案する。
テキストとビデオのベンチマーク実験では、M4Vが高品質なビデオを生成する能力を示しながら、計算コストを大幅に削減した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:29:40 GMT)
MSTAR: Box-free Multi-query Scene Text Retrieval with Attention Recycling [58.3] Muti-query Scene Text Search with Attention recycling (MSTAR) は、シーンテキスト検索のためのボックスフリーアプローチである。
プログレッシブ・ビジョンの埋め込みを取り入れ、テキストのマルチグラデーション表現を動的にキャプチャする。
7つの公開データセットとMQTRデータセットにまたがって,我々の手法の優位性を実証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:54:13 GMT)
Mirage-1: Augmenting and Updating GUI Agent with Hierarchical Multimodal Skills [57.7] 本稿では,知識不足の問題に対処するため,階層型マルチモーダルスキル(HMS)モジュールを提案する。
トラジェクトリを実行スキル、コアスキル、そして最終的にはメタスキルに徐々に抽象化し、長期のタスク計画のための階層的な知識構造を提供する。
ドメインギャップを埋めるために,Skill-Augmented Monte Carlo Tree Search (SA-MCTS)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:21:19 GMT)
Computational Complexity of Statistics: New Insights from Low-Degree Polynomials [57.4] これは、様々な平均的な計算問題における明らかな統計的・計算上のトレードオフを予測し、説明するために、低次の使用に関する調査である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:35:26 GMT)
VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models [57.3] VScanは2段階のビジュアルトークン削減フレームワークである。
1)グローバルスキャンとローカルスキャンを視覚的エンコーディング中にマージすることで,(2)言語モデルの中間層にプルーニングを導入する。
VScanはプリフィルの2.91$times$スピードアップとFLOPの10$times$ダウンを実現し、オリジナルのパフォーマンスの95.4%を維持した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:01:15 GMT)
Adaptive Discretization against an Adversary: Lipschitz bandits, Dynamic Pricing, and Auction Tuning [56.2] リプシッツ・バンディット(Lipschitz bandits)は、大規模で構造化された行動空間を研究する多腕バンディットの顕著なバージョンである。
ここでの中心的なテーマは、アクション空間の適応的な離散化であり、より有望な領域で徐々にズームインする'である。
逆バージョンにおける適応的な離散化のための最初のアルゴリズムを提供し、インスタンス依存の後悔境界を導出する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:48:17 GMT)
Reinforcing Multimodal Understanding and Generation with Dual Self-rewards [56.1] 大規模言語モデル(LLM)は、クロスモデル理解と生成を単一のフレームワークに統合する。
現在のソリューションでは、外部の監視(例えば、人間のフィードバックや報酬モデル)が必要であり、一方向のタスクにのみ対処する。
我々は,LMMの理解と生成能力を強化するために,自己監督型二重報酬機構を導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:19:29 GMT)
Generalization Bound of Gradient Flow through Training Trajectory and Data-dependent Kernel [55.8] 我々は、カーネル法における古典的ラデマッハ複雑性と整合する勾配流の一般化を確立する。
NTKのような静的カーネルとは異なり、LPKはトレーニング軌跡全体をキャプチャし、データと最適化の両方に適応する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:17:09 GMT)
BotTrans: A Multi-Source Graph Domain Adaptation Approach for Social Bot Detection [55.3] ソーシャルボットを検出するために,textitBotTrans というマルチソースグラフドメイン適応モデルを提案する。
まず、複数のソースネットワーク間で共有されるラベル付けの知識を活用して、クロスソースドメイントポロジを確立します。
次に、ソースノード埋め込みの識別性を高めるために、クロスドメイン隣の情報を集約する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:10:36 GMT)
Modal Logic for Stratified Becoming: Actualization Beyond Possible Worlds [55.2] 本稿では,階層化現実化の考え方に基づくモーダル論理の新しいフレームワークを開発する。
伝統的なクリプキ意味論は、モーダル作用素を完全決定的な選択肢に対する定量化として扱う。
本稿では,モダリティをオントロジ的安定性のレベルによってインデクシングするSAL(Stratetified Actualization Logic)を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:35:01 GMT)
One Diffusion to Generate Them All [54.8] OneDiffusionは双方向画像合成と理解をサポートする汎用的で大規模な拡散モデルである。
テキスト、深さ、ポーズ、レイアウト、セマンティックマップなどの入力から条件生成を可能にする。
OneDiffusionは、シーケンシャルな画像入力を使用して、マルチビュー生成、カメラポーズ推定、即時パーソナライズを可能にする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:46:13 GMT)
Optimus-3: Towards Generalist Multimodal Minecraft Agents with Scalable Task Experts [54.2] Minecraftの汎用エージェントOptimus-3を提案する。
エージェント開発のためのスケーラブルで高品質なトレーニングデータを提供するための知識強化型データ生成パイプラインを提案する。
視覚的多様性に対するエージェントの推論能力を高めるために,マルチモーダル推論強化学習手法を開発した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:29:40 GMT)
Generalized Gouy Rotation of Electron Vortex beams in uniform magnetic fields [54.0] 電子渦ビームの固有回転は、ビームの円筒対称性を破って磁場下で実験的に観察されている。
ランダウ状態のグーイ位相と実験的に観測された角変化を結びつける一般化したグーイ回転角を導入・導出する。
我々の結果は、原理的には、均一磁場中の電子渦ビームを含むあらゆるシステムに適用できる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:53:24 GMT)
On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention [53.2] 大規模言語モデル(LLM)は、自己アテンションを通じてグローバルトークンの依存関係をキャプチャするが、長い入力に対する計算とメモリコストに直面する。
まず,二状態線形注意(Dual-state linear attention, A)を提案する。これは2つの隠れ状態を保持する設計であり,その1つは,リニアアテンションアーキテクチャの典型的な短距離バイアスを緩和し,リニアアテンションを追尾するものである。
本稿では,DSLA層を段階的に置き換えるオンライン適応蒸留フレームワークであるDSLA-Serveを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:14:14 GMT)
Domain2Vec: Vectorizing Datasets to Find the Optimal Data Mixture without Training [53.1] textscDomain2Vecは任意のデータセットを複数のEmphmetaドメインの線形結合に分解する
textscDomain2Vecは、最小の計算オーバーヘッドでダウンストリームタスクのパフォーマンスを向上させるデータミックスを見つけるのに役立つ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:53:51 GMT)
TreeLoRA: Efficient Continual Learning via Layer-Wise LoRAs Guided by a Hierarchical Gradient-Similarity Tree [52.4] 本稿では階層的な勾配の類似性を利用して階層型アダプタを構築する新しい手法であるTreeLoRAを紹介する。
タスク類似度推定の計算負担を軽減するために,より低い信頼度境界に基づくアルゴリズムを開発するために,バンド手法を用いる。
視覚変換器 (ViTs) と大規模言語モデル (LLMs) の両方を用いた実験により, 提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:25:35 GMT)
DiMo-GUI: Advancing Test-time Scaling in GUI Grounding via Modality-Aware Visual Reasoning [52.4] トレーニング不要なGUIグラウンドティングフレームワークであるDiMo-GUIを紹介する。
GUIをモノリシックなイメージとして扱う代わりに、入力をテキスト要素とアイコン要素に分割する。
DiMo-GUIは、予測が曖昧で不正確である場合、候補焦点領域を生成することにより、動的に注意を集中する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:13:21 GMT)
The Gittins Index: A Design Principle for Decision-Making Under Uncertainty [52.1] Gittinsインデックスは、不確実性に関わるさまざまな意思決定問題を最適に解決するツールである。
このチュートリアルは、Gittinsインデックスが実践的な問題に実効的に適用可能であることを実証するものだ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:38:51 GMT)
Scalable Context-Preserving Model-Aware Deep Clustering for Hyperspectral Images [52.0] ハイパースペクトル画像(HSI)の教師なし解析にサブスペースクラスタリングが広く採用されている。
近年のモデル対応深層空間クラスタリング手法では、O(n2)の複雑性を持つ自己表現行列の計算とスペクトルクラスタリングを含む2段階のフレームワークを用いることが多い。
本稿では,HSIクラスタリングを効率的に行うために,局所構造と非局所構造を協調的にキャプチャする,ベース表現に基づく拡張性のあるコンテキスト保存深層クラスタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:43:09 GMT)
GPT4RoI: Instruction Tuning Large Language Model on Region-of-Interest [51.7] 本稿では,空間的命令チューニングを提案し,その命令における関心領域(RoI)を参照することを提案する。
我々のモデルであるGPT4RoIは、7つのリージョンテキストペアデータセットに基づいて訓練されており、前例のない対話的かつ対話的な体験をもたらす。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:15:18 GMT)
Task Adaptation from Skills: Information Geometry, Disentanglement, and New Objectives for Unsupervised Reinforcement Learning [51.6] 教師なし強化学習(URL)は、下流タスクの一般的なスキルを学ぶことを目的としている。
相互情報スキル学習(Mitual Information Skill Learning、MISL)は、状態とスキル間の相互情報を最大化することでURLに対処する。
ダウンストリームタスク適応には,学習スキルの多様性と分離性が不可欠であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:13:58 GMT)
ChineseHarm-Bench: A Chinese Harmful Content Detection Benchmark [50.9] 有害なコンテンツ検出のための既存のリソースは、主に英語に重点を置いており、中国のデータセットは乏しく、スコープは限られている。
我々は,6つの代表的なカテゴリを網羅し,実世界のデータから構築した,中国のコンテンツ害検知のための包括的,専門的な注釈付きベンチマークを提案する。
本研究では,人間の注釈付き知識規則と大規模言語モデルからの暗黙的知識を統合した知識強化ベースラインを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:57:05 GMT)
DART: Differentiable Dynamic Adaptive Region Tokenizer for Vision Transformer and Mamba [50.1] Vision Transformer (ViT) や Vision Mamba (Vim) のような非畳み込みモデルは、コンピュータビジョンタスクにおいて顕著な性能を達成した。
そこで本研究では,DART(Dynamic Adaptive Region Tokenizer,動的適応型領域トークンライザ)を導入し,画像を様々な大きさのコンテンツ依存パッチに適応的に分割する。
約100万(100万)の追加パラメータしか導入していないが、DARTはDeiT(ImageNet-1K)の精度を2.1%向上した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:25:37 GMT)
QuadricFormer: Scene as Superquadrics for 3D Semantic Occupancy Prediction [49.8] 3D占有予測は、堅牢な自動運転システムにとって不可欠である。
既存の手法のほとんどは、密度の高いボクセルベースのシーン表現を使用している。
効率的な3次元占有予測のためのスーパークワッドリックモデルであるQuadricFormerを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:45 GMT)
Surface Fairness, Deep Bias: A Comparative Study of Bias in Language Models [49.4] 大規模言語モデル(LLM)におけるバイアスの様々なプロキシ尺度について検討する。
MMLU (Multi-subject benchmark) を用いた人格評価モデルでは, スコアの無作為かつ大半がランダムな差が生じることがわかった。
LLMアシスタントメモリとパーソナライゼーションの最近の傾向により、これらの問題は異なる角度から開かれている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:47:40 GMT)
Pushing the Limits of Extreme Weather: Constructing Extreme Heatwave Storylines with Differentiable Climate Models [49.2] 本稿では,異なるハイブリッド気候モデルであるNeuralGCMを用いて,初期条件を最適化し,物理的に一貫した最悪の熱波トラジェクトリを生成する新しいフレームワークを提案する。
以上の結果から, 気候モデルにより, 事象確率の上位尾部を効率的に探索することが可能であり, 気候変動下での極端気象を対象とするストーリーラインを構築するための, 強力な新しいアプローチが得られた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:50:38 GMT)
Model Discovery and Graph Simulation: A Lightweight Alternative to Chaos Engineering [49.2] マイクロサービスアプリケーションは、サービス間の依存関係が密集しているため、障害をカスケードする傾向がある。
トレースデータからライブ依存グラフを抽出する自動CI/CDステップを提案する。
DeathStarBench Social Networkを使ってグラフを構築し、モンテカルロ経由で障害をシミュレートし、実際のシステム上でカオス実験を実行する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:59:28 GMT)
Training-Free Safe Denoisers for Safe Use of Diffusion Models [49.0] 強力な拡散モデル(DM)は、安全でない作業用コンテンツ(NSFW)を生成したり、忘れられたい個人の著作権のある資料やデータを生成するためにしばしば誤用される。
我々は,データ分布の否定領域を回避しつつ,高品質なサンプルを生成する実用的なアルゴリズムを開発した。
これらの結果は、DMをより安全に使用するための、トレーニング不要の安全なデノイザーの大きな可能性を示唆している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:45:34 GMT)
Leveraging Network Methods for Hub-like Microservice Detection [48.6] ハブのようなマイクロサービスアンチパターンには明確な定義と検出方法がない。
本研究では,Hubライクなマイクロサービスアンチパターンに対して,堅牢な検出アプローチを見つけることを目的とする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:28:06 GMT)
Centrality Change Proneness: an Early Indicator of Microservice Architectural Degradation [48.6] 時間ネットワークの研究は、進化するネットワークを記述し分析する方法として現れてきた。
これまでの研究では,サイズや複雑性,品質といったソフトウェアメトリクスが,マイクロサービスの集中度とどのように関係しているかが検討されてきた。
本研究は, 時間集中度指標が建築劣化の早期検出に有効かどうかを考察する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:00:58 GMT)
ReconMOST: Multi-Layer Sea Temperature Reconstruction with Observations-Guided Diffusion [48.5] ReconMOSTは多層水温再構築のためのデータ駆動誘導拡散モデルフレームワークである。
提案手法はMLベースのSST再構成をグローバルな多層設定に拡張し,92.5%以上の欠落データを処理する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:27:22 GMT)
ConfPO: Exploiting Policy Model Confidence for Critical Token Selection in Preference Optimization [48.5] 大型言語モデル(LLM)における嗜好学習手法ConfPOを紹介する。
補助モデルや計算を必要とせずに、トレーニングポリシの信頼性のみに基づいて、優先クリティカルトークンを特定し、最適化する。
AlpacaEval 2 や Arena-Hard などのアライメントベンチマークの実験結果は、ConfPO が一様DAA を一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:44:46 GMT)
High Performance Space Debris Tracking in Complex Skylight Backgrounds with a Large-Scale Dataset [48.3] 高精度なデブリ追跡を実現するために,深層学習に基づく空間デブリ追跡ネットワーク(SDT-Net)を提案する。
SDT-Netはデブリの特徴を効果的に表現し、エンドツーエンドのモデル学習の効率性と安定性を高める。
データセットとコードはまもなくリリースされます。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:06:53 GMT)
MedSeg-R: Reasoning Segmentation in Medical Images with Multimodal Large Language Models [48.2] 本稿では,複雑で暗黙的な医療指導に基づくセグメンテーションマスク作成を目的とした新しい課題である医用画像推論セグメンテーションを紹介する。
そこで本稿では,MLLMの推論能力を利用して臨床問題を理解するエンドツーエンドフレームワークであるMedSeg-Rを提案する。
1)画像の解釈と複雑な医用命令の理解を行い,マルチモーダルな中間トークンを生成するグローバルコンテキスト理解モジュール,2)これらのトークンをデコードして正確なセグメンテーションマスクを生成するピクセルレベルのグラウンドモジュールである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:13:38 GMT)
Understanding In-Context Learning on Structured Manifolds: Bridging Attention to Kernel Methods [48.0] In-context Learning (ICL) は自然言語と視覚領域において顕著な成功を収めた。
本研究では、多様体上のH"古い関数の回帰に対するICCの理論的研究を開始する。
本研究は, ICLにおける幾何学の役割に関する基礎的な知見と, 非線形モデルのICLを研究するためのノベルティクスツールを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:56:26 GMT)
Great Models Think Alike and this Undermines AI Oversight [47.8] モデル類似性がAI監視の両面に与える影響について検討する。
本稿では,モデルミスの重複に基づくLM類似度尺度CAPAを提案する。
我々の研究は、モデル類似性の報告と修正の重要性を強調します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:43:36 GMT)
Balancing Tails when Comparing Distributions: Comprehensive Equity Index (CEI) with Application to Bias Evaluation in Operational Face Biometrics [47.8] Comprehensive Equity Index (CEI)は、顔認識システムにおける人口統計バイアスを検出するために設計された新しい指標である。
実験の結果,CEIは従来手法が不足していたニュアンスバイアスを検出する能力に優れていたことが確認された。
CEIは、運用公正性評価のための堅牢で機密性の高いツールを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:43:31 GMT)
A Vision for Auto Research with LLM Agents [47.7] 本稿では,科学研究の全ライフサイクルの自動化,コーディネート,最適化を目的とした構造化マルチエージェントフレームワークであるエージェントベースオートリサーチを紹介する。
このシステムは、文献レビュー、アイデア、方法論、実験、論文執筆、査読応答、普及など、すべての主要な研究段階にまたがる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:27:05 GMT)
Heterogeneous Multi-Agent Reinforcement Learning for Distributed Channel Access in WLANs [47.6] 本稿では,マルチエージェント強化学習(MARL)を用いて,無線ローカルネットワークにおける分散チャネルアクセスに対処する。
特に、エージェントがモデルトレーニングに価値ベースまたはポリシーベースの強化学習アルゴリズムを不均一に採用する、より実践的なケースについて考察する。
我々は、分散実行パラダイムを用いた集中型トレーニングを採用し、異種エージェントの協調を可能にする、異種MARLトレーニングフレームワークQPMIXを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:08:24 GMT)
Viability of Future Actions: Robust Safety in Reinforcement Learning via Entropy Regularization [47.3] モデルレス強化学習における2つの確立された技術間の相互作用を解析する。
本研究では,制約付きRLにおけるエントロピー規則化が,将来の活動回数を最大化するために学習に偏りを生じさせることを示す。
エントロピー正則化とロバストネスの関連性は、さらなる実証的・理論的研究の道のりとして有望である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:34:19 GMT)
AniMaker: Automated Multi-Agent Animated Storytelling with MCTS-Driven Clip Generation [46.8] AniMakerは、効率的なマルチ候補クリップ生成とストーリーテリング対応クリップ選択を可能にするフレームワークである。
AniMakerは、VBenchや提案したAniEvalフレームワークなど、一般的なメトリクスによって測定される、優れた品質を実現しています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:06:21 GMT)
InstaInpaint: Instant 3D-Scene Inpainting with Masked Large Reconstruction Model [46.7] InstaInpaintは、0.4秒以内に2Dインペイントの提案から3Dシーンのインペイントを生成するフレームワークである。
一般化, テクスチュラル整合性, 幾何学的正当性を改善するいくつかの重要な設計を解析し, 同定する。
InstaInpaintは、2つの標準ベンチマークで最先端のパフォーマンスを維持しながら、従来の方法から1000倍のスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:55 GMT)
Leveraging Low-rank Factorizations of Conditional Correlation Matrices in Graph Learning [46.5] 本稿では,各ノードに収集されたデータから非方向グラフを学習する問題に対処する。
対応するグラフ学習問題は、変数の数(ノード)の平方にスケールする。
条件相関行列の低ランク分解を利用したグラフ学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:13:11 GMT)
CORT: Class-Oriented Real-time Tracking for Embedded Systems [46.3] 本研究は,マルチクラスオブジェクトトラッキングに対する新しいアプローチを提案する。
トラッキング性能をペナルティ化することなく、より小さく予測可能な実行時間を実現することができる。
提案手法は,異なるタイプの複数の対象を持つ複雑な都市シナリオにおいて評価された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:07:00 GMT)
CyFence: Securing Cyber-Physical Controllers via Trusted Execution Environment [45.9] サイバー物理システム(CPS)は、サイバー攻撃により多くの負荷を掛けて、技術進化と接続性の向上を経験してきた。
セマンティックチェックを追加することで,サイバー攻撃に対する閉ループ制御システムのレジリエンスを向上させる新しいアーキテクチャであるCyFenceを提案する。
我々はCyFenceをアクティブブレーキデジタルコントローラからなる実世界のアプリケーションとして評価し、異なるタイプの攻撃を無視可能なオーバーヘッドで軽減できることを実証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:22:45 GMT)
Three iterations of $(d-1)$-WL test distinguish non isometric clouds of $d$-dimensional points [45.2] Wesfeiler--Lehman テストが完全距離グラフで表されるユークリッド点の雲に対して完備であるときの研究を行う。
$d$次元ユークリッド空間の任意の2つの非等尺点雲を区別するのに十分な次元はいくつあるか。
我々の主な結果は、$(d-1)$-dimensional WL テストが$d$-dimensional Euclidean 空間の点雲に対して完備であり、任意の$dge 2$ に対して完備であり、テストサッフィスを3回だけ繰り返すことである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:46:08 GMT)
The Integral Decimation Method for Quantum Dynamics and Statistical Mechanics [45.0] 積分デシメーション(ID)と呼ばれる関数積分を数値的に評価する手法を提案する。
IDは、40サイトチェーンのシステムにおける量子力学の高精度なシミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:26:12 GMT)
TARDIS STRIDE: A Spatio-Temporal Road Image Dataset for Exploration and Autonomy [44.9] 本研究では,360度パノラマ画像を相互接続した観測,状態,行動ノードに変換する方法を示す。
我々は、このデータセットをトランスフォーマーベースの生成ワールドモデルであるTARDISを介してベンチマークする。
我々は、制御可能な画像合成、命令追従、自律的自己制御、最先端のジオレファレンスなど、さまざまなエージェントタスクにおいて、堅牢な性能を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:08:11 GMT)
CoRT: Code-integrated Reasoning within Thinking [44.8] o1やDeepSeek-R1のようなLarge Reasoning Models(LRM)は、長いチェーン・オブ・シント(CoT)による自然言語推論において顕著な進歩を示している。
Code Interpreter(CI)は、モデルの内部テキスト表現以外の外部知識を提供する。
本稿では,CIを効果的かつ効率的に活用するためのLRM教育のためのポストトレーニングフレームワークであるCoRTを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:50:37 GMT)
Self-Adapting Language Models [44.5] 大規模言語モデル(LLM)は強力だが静的であり、新しいタスクや知識、例に対応して重みを適応するメカニズムが欠如している。
我々は,自己適応型LSM(Self-Adapting LLMs, SEAL)を導入する。
知識の定式化と数ショットの一般化の実験により、SEALは自己指向適応が可能な言語モデルに向けた有望なステップであることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:48:13 GMT)
No Universal Prompt: Unifying Reasoning through Adaptive Prompting for Temporal Table Reasoning [44.5] 時間表推論は大規模言語モデル(LLM)にとって重要な課題である
複数のプロンプト法が存在するにもかかわらず、表推論への影響は未解明のままである。
本研究は,様々なシナリオに対して最適なアプローチを決定するために,多様なテーブルタイプにまたがる複数のプロンプト手法について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:32:59 GMT)
One Tokenizer To Rule Them All: Emergent Language Plasticity via Multilingual Tokenizers [43.9] 早期訓練における比較的安価な介入が「言語可塑性」を改善するかについて検討する。
本稿では,初等事前学習言語よりも多くの言語で訓練されたユニバーサルトークン化器を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:47:13 GMT)
EQA-RM: A Generative Embodied Reward Model with Test-time Scaling [43.8] EQA-RM(Embodied Question Answering, EQA)に特化して構築された新規なマルチモーダル報酬モデルについて紹介する。
EQA-RMの生成特性は、単純なスカラー以外に、解釈可能で構造化された報酬フィードバックを提供する
EQARewardBenchは、標準化されたEQA報酬モデルアセスメントのためのOpenEQA上に構築された新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:25:04 GMT)
Harmonizing Geometry and Uncertainty: Diffusion with Hyperspheres [43.2] 本稿では,超球面構造を指向性雑音に整合させ,クラス形状を保ち,角の不確実性を効果的に捉えるためにHyperSphereDiffを導入する。
4つのオブジェクトデータセットと2つの顔データセットの枠組みを評価し,角不確かさを組み込むことで,下層の超球面多様体をよりよく保存できることを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:10:52 GMT)
Enhancing Medical Dialogue Generation through Knowledge Refinement and Dynamic Prompt Adjustment [43.0] 医療対話システム(MDS)は、患者とのマルチターン・コンテキスト対応の会話を可能にする重要なオンラインプラットフォームとして登場した。
本稿では,知識精製と動的プロンプト調整を取り入れた新しいMDSであるMedRefを提案する。
MedRefは、生成品質と医療機関の精度の両方において最先端のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:44:25 GMT)
Efficient Length-Generalizable Attention via Causal Retrieval for Long-Context Language Modeling [42.7] Grouped Cross Attentionは、トレーニング前のコンテキスト長の1000倍に一般化することができる。
実験により,16Mコンテキスト長のパスキー検索において,GAAに基づくモデルがほぼ完全であることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:49:51 GMT)
Photon-mediated interactions by Floquet photonic lattices [42.2] スタティックフォトニック格子に存在しない境界状態によって媒介される可変領域エミッタ相互作用の出現を示す。
この研究は非平衡フォトニクスと量子光学の相互作用に光を当て、フロックフォトニクス格子を高次元で解析する基礎となる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:41:27 GMT)
VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos [42.0] 大型モデルの多段階推論能力を評価するために開発されたVRBenchは,最初の長めのナラティブビデオベンチマークである。
ビデオの長さは1010本(平均1.6時間)、人間ラベル付き多段階質問応答ペア9,468本、タイムスタンプ付き推論ステップ30,292本。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:17:17 GMT)
Hessian Geometry of Latent Space in Generative Models [41.9] 生成モデルの潜在空間幾何学を解析するための新しい手法を提案する。
提案手法は, 得られた潜伏変数の後方分布を近似する。
IsingモデルとTASEPモデルで検証され、熱力学量の再構築において既存のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:17:40 GMT)
Position: Theory of Mind Benchmarks are Broken for Large Language Models [41.8] 我々の論文は、大きな言語モデルが新しいパートナーにどのように適応するかを直接テストできないため、マインドベンチマークの大多数が壊れていると論じている。
この問題は、心の理論が人間の心の理論をテストする方法から圧倒的にインスピレーションを受けているという事実に起因している。
本稿では,精神機能理論の概念を紹介し,その行動に対する合理的な反応に従って,文脈内でエージェントに適応する能力について紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:58:31 GMT)
Learning in Budgeted Auctions with Spacing Objectives [41.6] 多くのオークションでは、参加者は勝利の頻度だけでなく、勝利が時間とともにどのように分配されるかに気を配る。
我々は,この現象の簡単なモデルを導入し,勝利の値が最後の勝利以来のコンケーブ関数であるような,予算付きオークションとしてモデル化する。
状態に依存しない戦略は変換の不確かさを伴わずに線形後悔を引き起こすことを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:43:27 GMT)
Continual Hyperbolic Learning of Instances and Classes [41.3] インスタンスとクラスを連続的に学習するタスクを同時に導入する。
このタスクは、時間とともに複数のレベルの粒度に適応するようにモデルに挑戦する。
本稿では,クラスとインスタンスが自然に階層構造を形成することを確かめる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:59:57 GMT)
Scheduled Interleaved Speech-Text Training for Speech-to-Speech Translation with LLMs [41.1] 音声音声翻訳 (S2ST) は大規模言語モデル (LLM) で進歩している。
LLMはテキストのみのデータに基づいて訓練され、音声から音声への限られたデータで、それらに適応するための課題が提示される。
本研究では,本研究における音声教育の予定について述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:24:44 GMT)
Mind the Style Gap: Meta-Evaluation of Style and Attribute Transfer Metrics [41.1] 本稿では,スタイル評価と属性伝達のためのメトリクスのメタ評価を行う。
既存のデータセットに対するメタ評価研究は、コンテンツ保存のためのメトリクスの適合性に関する誤解を招く。
本稿では,スタイル転送のためのコンテンツ保存指標を評価するための新しいテストセットを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:58:45 GMT)
Meta-learning Representations for Learning from Multiple Annotators [40.9] 本稿では,複数の雑音アノテータから学習するメタラーニング手法を提案する。
提案手法は,ニューラルネットワークを用いてタスク中の各例を潜在空間に埋め込む。
合成ノイズと実世界のクラウドソーシングデータセットを用いた実世界のデータセットを用いて,本手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:58:37 GMT)
Data Driven Diagnosis for Large Cyber-Physical-Systems with Minimal Prior Information [40.8] 最小限の事前知識で機能する新しい診断手法を提案する。
本手法は,サブシステムレベルの異常検出を用いたニューラルネットワークベースの症状発生器と,新しいグラフ診断アルゴリズムを組み合わせたものである。
以上の結果から,大規模で複雑なサイバー物理システムを用いた実践的応用へのアプローチの可能性を明らかにする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:56:58 GMT)
IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain [40.6] IQE-CLIPは医学領域における異常検出のための新しいフレームワークである。
私たちはCLIPを医療環境に適応させるために、クラスベースで学習可能なプロンプトを導入します。
IQE-CLIPはゼロショット設定と少数ショット設定の両方で最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:23:06 GMT)
Latent Action Learning Requires Supervision in the Presence of Distractors [40.3] 実世界のビデオには、潜在的なアクション学習を妨げるアクション関連障害が含まれていることが示されています。
LAOMは,潜伏動作の質を8倍に向上する簡易なLAPO修正法である。
我々は、潜在アクション学習中のデータセット全体の2.5%にも満たない、地道的なアクションによる監視を提供することで、下流のパフォーマンスが平均4.2倍向上することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:28:52 GMT)
Calculating response functions of coupled oscillators using quantum phase estimation [40.3] 量子コンピュータを用いた結合型古典的高調波発振器系の周波数応答関数の推定問題について検討する。
提案する量子アルゴリズムは,標準的な$sスパース,オーラクルベースのクエリアクセスモデルで動作する。
そこで,本アルゴリズムの簡単な適応により,時間内に無作為な結束木問題を解くことを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:33:33 GMT)
Using Vision Language Models to Detect Students' Academic Emotion through Facial Expressions [40.2] 学生の学問的感情は社会的行動や学習成績に大きな影響を及ぼす。
これらの感情を自動的かつ正確に分析する従来のアプローチは、主に教師付き機械学習アルゴリズムに依存している。
本研究では,視覚言語モデル(VLM)が,表情を通して学生の学術的感情を分析する可能性について検討した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:01:26 GMT)
AutoMind: Adaptive Knowledgeable Agent for Automated Data Science [39.2] LLM(Large Language Model)エージェントは、現実世界のデータサイエンス問題に対処する大きな可能性を示している。
既存のフレームワークは、厳格で、事前定義された、柔軟性のないコーディング戦略に依存している。
適応的で知識のあるLLMエージェントフレームワークであるAutoMindを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:32 GMT)
ODG: Occupancy Prediction Using Dual Gaussians [39.0] 活動予測は周囲環境のカメラ画像から微細な3次元形状と意味を推定する。
既存の方法は、シーン表現として高密度グリッドを採用するか、単一のスパースクエリを使用してシーン全体を学習する。
複雑なシーンダイナミクスを効果的に捉えるために,階層的な二重スパースガウス表現であるODGを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:55:53 GMT)
GigaVideo-1: Advancing Video Generation via Automatic Feedback with 4 GPU-Hours Fine-Tuning [38.9] GigaVideo-1は、人間の監督なしにビデオ生成を効率化する効率的な微調整フレームワークである。
我々は、微調整プロセスの2つの重要な側面、すなわちデータと最適化に焦点を当てている。
実験によると、GigaVideo-1は、ほぼすべての次元のパフォーマンスを継続的に改善し、平均的な増加率は4つのGPU時間で約4%である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:25:37 GMT)
TooBadRL: Trigger Optimization to Boost Effectiveness of Backdoor Attacks on Deep Reinforcement Learning [38.8] TooBadRLは、DRLバックドアトリガーを3つの臨界軸(時間、空間、大きさ)に沿って体系的に最適化するフレームワークである。
TooBadRLは,通常のタスク性能の低下を最小限に抑えつつ,攻撃成功率を大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:32:32 GMT)
Eye, Robot: Learning to Look to Act with a BC-RL Perception-Action Loop [37.5] EyeRobotは、現実世界のタスクを完了する必要から生じる視線行動を備えたロボットシステムである。
我々は、周囲を自由に回転させて観察し、強化学習を用いて視線ポリシーを訓練できるメカニカルアイボールを開発した。
我々は,ロボットアームを囲む弧の操作を必要とする5つのパノラマワークスペース操作タスクに対して,EyeRobotを評価した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:11 GMT)
Divide-Fuse-Conquer: Eliciting "Aha Moments" in Multi-Scenario Games [36.2] 大規模言語モデル(LLM)は、強化学習(RL)中に突然高度な推論能力を示すことが観察されている。
マルチシナリオRLにおける一般化を促進するためのフレームワークであるDivide-Fuse-Conquerを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:02:59 GMT)
HalLoc: Token-level Localization of Hallucinations for Vision Language Models [36.1] 幻覚は、大きな視覚言語モデルの信頼性に重大な課題をもたらす。
HalLocは、効率的で確率的な幻覚検出のために設計されたデータセットである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:50:35 GMT)
ELFuzz: Efficient Input Generation via LLM-driven Synthesis Over Fuzzer Space [36.0] ジェネレーションベースのファジリングは、入力文法とテストシステムとソフトウェアに対する意味制約の仕様に従って適切なテストケースを生成する。
本稿では,LLMによるファジィ空間上でのファジィ合成により,テスト対象システム(SUT)に適合した生成系ファジィを自動で合成するELFuzzを提案する。
ELFuzz canは,従来のアプローチと比較して,1)実世界のSUT – 評価において最大1,791,104行のコード – にシームレスにスケールし,2) 興味深い文法構造と人間の理解可能な方法でセマンティック制約をキャッチする効率的なファッジャを合成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:13:55 GMT)
TSFM-Bench: A Comprehensive and Unified Benchmark of Foundation Models for Time Series Forecasting [35.5] 時系列予測(TSF)は、金融投資、気象サービス、エネルギー管理など、多くの分野で重要な機能である。
多くのTSFメソッドはドメイン固有のデータ収集とモデルトレーニングを必要とし、他のドメインに適用してもうまく一般化しない。
大規模な異種時系列データに基づいて事前訓練された時系列基礎モデル(TSFM)は、これらの制限を克服することを目的としている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:49:37 GMT)
Efficiently Identifying Watermarked Segments in Mixed-Source Texts [35.4] 部分透かし検出のための2つの新しい手法を提案する。
まず,長文に透かしセグメントが存在するかどうかを判定するための幾何被覆検出フレームワークを開発する。
第2に,テキスト内の透かしセグメントの正確な位置を特定できる適応型オンライン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:25:01 GMT)
Conformal Inference under High-Dimensional Covariate Shifts via Likelihood-Ratio Regularization [35.2] ピンボール損失を正規化の新たな選択と組み合わせた正準比正則化量子回帰アルゴリズムを提案する。
LR-QR法は,対象領域の所望レベルにおいて,最小限の誤差項までカバレッジを有することを示す。
実験により、LR-QRアルゴリズムは、高次元予測タスクにおいて既存の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:57:43 GMT)
SWE-Factory: Your Automated Factory for Issue Resolution Training Data and Evaluation Benchmarks [34.9] SWE-Factoryは、大規模なGitHubイシュー解決データセットを作成するために設計された、自動パイプラインである。
SWE-Builderは評価環境構築を自動化するマルチエージェントシステムである。
出口符号に基づくグルーピングは手動検査に比べて100%精度が向上する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:54:17 GMT)
Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials [34.8] 機械学習の原子間ポテンシャル(MLIP)を改善するためのアンサンブル知識蒸留法(EKD)を提案する。
まず、複数の教師モデルはQCエネルギーに訓練され、次にデータセットのすべての構成に対して原子力を生成する。次に、学生MLIPは、教師モデルによって生成されたQCエネルギーと平均的な力の両方に訓練される。
得られた学生MLIPは、Compum6ベンチマークで新しい最先端の精度を達成し、分子動力学シミュレーションの安定性の向上を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:37:14 GMT)
TransMLA: Multi-Head Latent Attention Is All You Need [34.4] TransMLAはGQAベースのモデルをMLAベースのモデルにシームレスに変換するフレームワークである。
LLaMA-2-7BでKVキャッシュの93%を圧縮することにより、TransMLAは8Kコンテキスト長で10.6倍の推論スピードアップを達成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:45:57 GMT)
Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes Modeling [34.2] Sarc3Dはスパース変形可能なマーチングキューブ表現と新しいエンコーダSparconv-VAEを組み合わせた統一フレームワークである。
Sparc3Dは、オープンサーフェス、切断されたコンポーネント、複雑な幾何学を含む挑戦的な入力に対して、最先端の再構築忠実性を達成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:10:04 GMT)
Teacher-student training improves accuracy and efficiency of machine learning interatomic potentials [34.2] 機械学習原子間ポテンシャル(MLIP)は分子動力学(MD)シミュレーションの分野に革命をもたらしている。
本稿では,教師からの潜伏知識(原子エネルギー)を学生のトレーニングの強化に用いる教師学生訓練フレームワークを提案する。
注目すべきは、両方のモデルが同じ量子化学データセットでトレーニングされているにもかかわらず、学生モデルは教師の精度を越えられることだ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:27:45 GMT)
Croppable Knowledge Graph Embedding [34.2] 知識グラフ埋め込み(KGE)は、AIタスクにおける知識グラフ(KG)の一般的なアプローチである。
新しい次元を必要とすることは、新しいKGEモデルをスクラッチからトレーニングし、コストを増大させ、効率と柔軟性を制限することを意味する。
そこで本稿では,KGE 学習フレームワーク MED を提案する。これにより,異なる次元のニーズを持つ複数のシナリオに対して,収穫可能な KGE モデルを得ることができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:28:18 GMT)
TaxoAdapt: Aligning LLM-Based Multidimensional Taxonomy Construction to Evolving Research Corpora [34.1] TaxoAdaptは、LLMの生成した分類を、複数の次元にわたる与えられたコーパスに適応するフレームワークである。
我々は、さまざまなコンピュータサイエンスカンファレンスにおいて、最先端のパフォーマンスを実演する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:26:28 GMT)
Digital quantum simulation of squeezed states via enhanced bosonic encoding in a superconducting quantum processor [33.6] 超伝導量子プロセッサ上での単一モード圧縮状態をシミュレーションするための完全ディジタル手法を提案する。
最大2n個のフォトニックフォック状態からn個のqubitにマッピングすることで、Gray-codeベースのエンコーディングを活用し、ゲートオーバヘッドを低減する。
さらに、フォック状態のシミュレーションを偶数光子のみで制限することで、資源利用を最適化する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:33:52 GMT)
Expert Race: A Flexible Routing Strategy for Scaling Diffusion Transformer with Mixture of Experts [33.4] 我々は、フレキシブルなルーティング戦略を持つ拡散変圧器のための新しいMoEモデルであるRace-DiT、Expert Raceを紹介する。
トークンとエキスパートが競争し、上位候補を選択することによって、モデルはエキスパートをクリティカルトークンに動的に割り当てることを学ぶ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:41:53 GMT)
Fine-Grained Perturbation Guidance via Attention Head Selection [33.2] ヘードハンター(HeadHunter)は、ユーザ中心の目標に合わせた注意点を反復的に選択するための体系的なフレームワークである。
ソフトパグ(SoftPAG)は、摂動強度を調整し、アーティファクトを抑える連続したノブである。
大規模なDiTベースのテキスト・ツー・イメージ・モデルに対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:51 GMT)
Locally minimax optimal and dimension-agnostic discrete argmin inference [33.2] この論文は基本的な推論問題に取り組む:$d$次元ベクトルから未知の平均$boldsymbolmu$を持つ$d$次元ベクトルから$n$の観測を与えられると、$boldsymbolmu$の最小成分に対応する指数に対する信頼セットを形成する必要がある。
双対性により、$mu_r$が最小かどうかに関わらず、$r$の$1,ldots,d$に対して、これをテストに還元する。
我々は$d$が$n$でスケールするか、$boldの任意の関係にかかわらず、妥当性を維持する「次元に依存しない」テストを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:37:45 GMT)
An Analysis of Datasets, Metrics and Models in Keyphrase Generation [33.0] キーワード生成(英: Keyphrase generation)とは、文書を要約する単語やフレーズの集合を生成するタスクである。
本稿では,キーフレーズ生成に関する50以上の研究論文の分析を行い,最近の進歩,限界,オープン課題について概観する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:54:44 GMT)
Attuned to Change: Causal Fine-Tuning under Latent-Confounded Shifts [33.0] 遅れた構築されたシフトに適応することは、現代AIにおける中核的な課題である。
1つの実用的障害モードは、構築されたデータに基づいて訓練済みの基礎モデルを微調整するときに発生する。
我々は、因果微調整を識別問題として捉え、入力を低レベルなスプリアス特徴に分解する明示的な因果モデルを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:01:43 GMT)
Measuring Chain of Thought Faithfulness by Unlearning Reasoning Steps [32.6] 生成した推論のパラメトリック忠実度を測定するための枠組みを導入し、未学習推論ステップ(FUR)による忠実度を提案する。
FURはモデルパラメータから推論ステップに含まれる情報を消去し、モデルの予測に結果が与える影響として忠実度を測定する。
我々の実験では、FURは、CoTがパラメトリックに忠実であることを示すキーステップを未学習にすることで、基礎となるモデルの予測を正確に変更できることがしばしば示されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:05:38 GMT)
Mitigating Negative Interference in Multilingual Sequential Knowledge Editing through Null-Space Constraints [32.6] LangEditは、言語固有の知識更新を正確に分離するために設計された、新しいnullスペース制約付きフレームワークである。
我々はLangEditがパラメータ干渉を効果的に軽減し、既存の最先端の編集方法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:15:45 GMT)
PRSA: Prompt Stealing Attacks against Real-World Prompt Services [32.4] 本稿では,迅速な盗難を目的とした実践的攻撃フレームワークであるPRSAを紹介する。
PRSAは、非常に限られた入出力分析を通じて、プロンプトの詳細な意図を推測する。
オリジナルの機能を複製する盗まれたプロンプトをうまく生成できる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:56:26 GMT)
Dense Associative Memory with Epanechnikov Energy [31.9] Dense Associative Memory (DenseAM) ネットワークのための新しいエネルギー関数 log-sum-ReLU (LSR) を提案する。
一般的なlog-sum-exponential (LSE) 関数とは異なり、LSR は Epanechnikov カーネルに基づいている。
実証実験の結果、LSRエネルギーはLSEモデルに匹敵する対数のような局所的なミニマ(記憶)を持つことが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:16:31 GMT)
How Well Can Reasoning Models Identify and Recover from Unhelpful Thoughts? [31.8] 本研究では,4種類の不愉快な思考から推論モデルがどのように識別し,回復するかを検討する。
モデルは、最も無害な思考を特定するのに効果的であるが、それらが思考プロセスに注入されると、同じ思考から回復することが困難であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:53 GMT)
Motion-R1: Chain-of-Thought Reasoning and Reinforcement Learning for Human Motion Generation [31.5] Motion-R1は、Chain-of-Thoughtメカニズムを統合したモーション言語モデリングフレームワークである。
複雑なテキスト命令を論理的に構造化されたアクションパスに明示的に分解することで、モーションR1はモーション生成のための高レベルなセマンティックガイダンスを提供する。
複数のベンチマークデータセットに対する実験では、Motion-R1は最先端の手法と比較して、競争力や優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:21:43 GMT)
Developing a High-performance Framework for Speech Emotion Recognition in Naturalistic Conditions Challenge for Emotional Attribute Prediction [31.5] 自然条件下での音声感情認識(SER)は,音声処理コミュニティにとって重要な課題である。
本稿では,自然条件課題における感情認識(IS25-SER Challenge)における優れた(トップ1)パフォーマンスを実現する再現可能なフレームワークを提案する。
本システムは,マルチモーダル学習,マルチタスク学習,不均衡なデータ処理を通じて,上記の課題に対処するように設計されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:38:06 GMT)
A Benchmark for Generalizing Across Diverse Team Strategies in Competitive Pokémon [31.0] Pok'emon Video Game Championships (VGC) は、チーム構成が極端に広い領域である。
重要なインフラストラクチャを提供し、評価プロトコルを標準化し、ヒューマンプレイデータセットを提供するベンチマークであるVGC-Benchを紹介します。
エージェントが単一チーム構成でトレーニングされ評価される制限された環境では、我々のメソッドはプロのVGC競合相手に勝つことができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:19:39 GMT)
Beyond Attention or Similarity: Maximizing Conditional Diversity for Token Pruning in MLLMs [31.0] マルチモーダルな大言語モデルでは、入力される視覚トークンの長さはテキストのそれよりもはるかに大きいことが多い。
我々は,保持トークンの条件付き多様性を最大化する,CDPrunerという新しい視覚的トークン解析手法を提案する。
実験の結果、CDPrunerは様々な視覚ベースのベンチマークで新しい最先端を確立できることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:09 GMT)
Conversational Search: From Fundamentals to Frontiers in the LLM Era [30.7] このチュートリアルは、大きな言語モデルによって革新された基礎と新しいトピックの関連について紹介することを目的としている。
学生、研究者、および産業界からの実践者向けに設計されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:19:57 GMT)
DreamActor-H1: High-Fidelity Human-Product Demonstration Video Generation via Motion-designed Diffusion Transformers [30.6] 電子商取引とデジタルマーケティングでは、高忠実な人間製品デモビデオを生成することが重要である。
人間のアイデンティティと製品固有の詳細を保存するための拡散変換器(DiT)ベースのフレームワークを提案する。
我々は3Dボディーメッシュテンプレートと製品バウンディングボックスを用いて、正確な動作ガイダンスを提供し、手ジェスチャーと製品配置の直感的なアライメントを可能にする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:58:23 GMT)
Enhancing Intent Understanding for Ambiguous prompt: A Human-Machine Co-Adaption Strategy [30.3] ユーザのプロンプトと修正中の画像の相互情報を用いた人間機械協調型適応戦略を提案する。
改良されたモデルにより、複数ラウンドの調整の必要性が軽減されることが判明した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:01:59 GMT)
CHANCERY: Evaluating Corporate Governance Reasoning Capabilities in Language Models [30.3] 我々は、経営陣/取締役会/株主の提案した行動が企業ガバナンス憲章と一致しているかどうかをモデルが判断する能力をテストするために、企業ガバナンス推論ベンチマーク(CHANCERY)を導入します。
ベンチマークは、コーポレート・チャーター(コーポレート・コベナントのセット)とエグゼクティブ・アクションの提案から成っている。
最先端推論モデル(SOTA)の評価ではベンチマークの難しさが確認され、Claude 3.7 Sonnet や GPT-4o がそれぞれ 64.5% と 75.2% の精度で評価された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:27:21 GMT)
Unsupervised Learning-Based Joint Resource Allocation and Beamforming Design for RIS-Assisted MISO-OFDMA Systems [30.2] 本稿では、RIS支援MISO-OFDMAシステムにおけるダウンリンク伝送について検討し、資源割り当て問題に対処する。
RIS位相シフト、BSビームフォーミング、リソースブロック(RB)アロケーションを共同設計するために、2段階の教師なし学習ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:50:38 GMT)
SoK: Evaluating Jailbreak Guardrails for Large Language Models [29.8] 大きな言語モデル(LLM)は目覚ましい進歩を遂げているが、そのデプロイメントは重大な脆弱性を露呈している。
LLMのインタラクションを監視し、制御する外部防衛機構であるガードレールが、将来性のあるソリューションとして登場した。
LLM用脱線ガードレールの総括解析を行った。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:42:40 GMT)
CodeTool: Enhancing Programmatic Tool Invocation of LLMs via Process Supervision [29.8] 大規模言語モデルを改善する段階的なコード生成のためのフレームワークであるCodeToolを提案する。
CodeToolには、各ツールの実行の正確性に関する即時フィードバックを提供するOn-the-spot Rewardと、タスク全体の完了に向けた各ステップの貢献を評価するLatent Rewardという、2つの異なるプロセス報酬が含まれている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:01:34 GMT)
FedNano: Toward Lightweight Federated Tuning for Pretrained Multimodal Large Language Models [29.8] フェデレートラーニング(FL)は、データを集中化せずに協調的なモデルトレーニングを可能にするソリューションを提供する。
既存のFLメソッドは、大規模なMLLMを分解する前提として、フルモデルのクライアント側のデプロイを前提としています。
我々は、クライアント固有の適応のための軽量モジュールであるNanoEdgeを導入しながら、サーバ上でLLMを集中化する最初のFLフレームワークであるFedNanoを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:50:50 GMT)
Multi-group Uncertainty Quantification for Long-form Text Generation [29.7] 我々は、(キャリブレーションによる)出力に含まれる個々のクレームのレベルと(共形予測による)出力自体全体における不確実性について研究する。
両タイプの不確実性定量化のための標準手法は,データセット全体にわたって測定すると良好に動作するが,特定のサブグループを調べると,そのような保証が壊れる。
校正, 共形予測, 多群予測の問題は, 長文生成の文脈では広く研究されていないため, これらの結果は, この設定のベンチマークとなると考えられる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:27:04 GMT)
Lifting Data-Tracing Machine Unlearning to Knowledge-Tracing for Foundation Models [29.6] 我々は、基礎モデル(FM)のための知識トレーシングへのデータトレーシングマシンの無学習化を提案する。
視覚言語FMに関する具体的なケーススタディとして、未学習者が知識追跡マシンの未学習パラダイムをインスタンス化する方法を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:51:10 GMT)
PerfTracker: Online Performance Troubleshooting for Large-scale Model Training in Production [29.5] PerfTrackerは、きめ細かいプロファイリングを利用する最初のオンライントラブルシューティングシステムである。
PerfTrackerはO(10,000)の大規模GPUクラスタの運用サービスとしてデプロイされている。
様々な難しいパフォーマンスの問題を診断するために使われてきた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:12:20 GMT)
Occlusion-Aware 3D Hand-Object Pose Estimation with Masked AutoEncoders [29.3] 本稿では,HOMAEと呼ばれるマスク付きオートエンコーダを用いたオクルージョンを意識したポーズ推定手法を提案する。
我々は,デコーダから抽出したマルチスケール特徴を統合し,符号付き距離場(SDF)を予測する。
DexYCBとHO3Dv2ベンチマークに挑戦する実験は、HOMAEが手動ポーズ推定において最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:30:47 GMT)
AI Agent Behavioral Science [29.3] AIエージェント行動科学は、行動の体系的な観察、仮説をテストするための介入の設計、そしてAIエージェントが時間とともにどのように行動し、適応し、相互作用するかの理論的指導による解釈に焦点を当てている。
我々は、個々のエージェント、マルチエージェント、人間とエージェントのインタラクション設定にまたがる研究の体系化を行い、この視点が、公正さ、安全性、解釈可能性、説明責任、プライバシーを行動特性として扱うことによって、責任あるAIにどのように影響を与えるかを実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:22:01 GMT)
Box-Constrained Softmax Function and Its Application for Post-Hoc Calibration [29.2] ソフトマックスモデルにおける出力確率の制御は、現代の機械学習において一般的な問題である。
ボックス制約付きソフトマックス(mathrmBCSoftmax$)関数を提案する。これは$mathrmSoftmax$関数の新たな一般化であり、出力確率に対して下限と上限を明示的に強制する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:01:43 GMT)
Large Scale Multi-Task Bayesian Optimization with Large Language Models [29.1] 本稿では,大規模言語モデル(LLM)を活用して,従来の最適化軌道から学習し,改良する手法を提案する。
本手法は,データベースクエリ最適化と抗菌ペプチドの設計の2つの異なる領域で評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:09:18 GMT)
Context-Adaptive Graph Neural Networks for Next POI Recommendation [29.1] Next Point-of-Interest(POI)レコメンデーションは、チェックイン履歴に基づいて、ユーザの次の訪問を予測することを目的として、位置情報ベースのサービスにおいて重要なタスクである。
本稿では,コンテキスト適応型グラフニューラルネットワーク(CAGNN)を次のPOIレコメンデーションに適用し,エッジ固有のコンテキスト要因を用いて注意重みを動的に調整する手法を提案する。
3つの実世界のデータセットに対する実験結果から、CAGNNは一貫して最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:33:58 GMT)
Towards Reliable Identification of Diffusion-based Image Manipulations [29.0] Inpainted AReas(RADAR)のReliAble iDentificationのための新しいアプローチを提案する。
RADARは既存のファンデーションモデルに基づいて構築され、異なる画像モダリティの機能を組み合わせている。
実験の結果,RADARは画像編集の精度を向上し,画像編集の局部化に優れることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:11:44 GMT)
Amulet: ReAlignment During Test Time for Personalized Preference Adaptation of LLMs [28.8] Amuletは、各トークンの復号処理を独立したオンライン学習問題として定式化する、トレーニング不要のフレームワークである。
Amuletは、異なるLLM、データセット、ユーザー好みの組み合わせで、リッチな設定で大幅なパフォーマンス改善を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:05:38 GMT)
AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving [28.4] VLM(Vision-Language Models)は、自律走行を約束するが、幻覚、非効率な推論、限られた実世界の検証は、正確な知覚と堅牢なステップバイステップ推論を妨げる。
我々は、Chain-of-Thought(CoT)推論と、自律運転タスクのための動的エージェントスタイルのツール呼び出しを統合する、先駆的な統合フレームワークであるAgentThinkを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:27:06 GMT)
Beamforming and Resource Allocation for Delay Optimization in RIS-Assisted OFDM Systems [28.3] 本稿では、ダウンリンク再構成可能なインテリジェントサーフェス(RIS)アシスト直交周波数分割多重化(OFDM)システムにおける相設計と資源配分問題について検討する。
混合作用空間を扱い, 状態空間次元を低減するために, ハイブリッド深部強化学習(DRL)手法を提案する。
シミュレーションの結果、提案アルゴリズムは平均遅延を著しく低減し、資源配分効率を向上し、ベースライン法と比較してシステムロバスト性と公正性が優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:58:58 GMT)
WGSR-Bench: Wargame-based Game-theoretic Strategic Reasoning Benchmark for Large Language Models [28.3] 本稿では,WGSR-Benchについて紹介する。WGSR-BenchはLarge Language Models (LLMs) の最初の戦略推論ベンチマークであり,WGSR-Benchをその評価環境として利用する。
我々は,戦略的推論の主要な能力を評価するために,環境意識,対人リスクモデリング,政策生成という3つの中核的課題に関するテストサンプルを設計する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:16:34 GMT)
Learning richness modulates equality reasoning in neural networks [28.1] 多層パーセプトロン(MLP)における等式推論の理論を開発する。
人間と動物の平等推論は、同様に神経回路の学習豊かさに依存する可能性がある。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:29:08 GMT)
Monitoring Decomposition Attacks in LLMs with Lightweight Sequential Monitors [28.0] 現在のLLMの安全防衛は分解攻撃で失敗し、悪意のあるゴールは拒否を回避する良質なサブタスクに分解される。
より粒度の高い会話を観察する外部モニタの追加を提案する。
念入りに設計した軽量モニタは93%の防衛成功率を達成し、モニタとしてo3 miniのような推論モデルを上回る結果となった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:50:58 GMT)
Build the web for agents, not agents for the web [28.0] 本稿では,エージェントがWebサイトをナビゲートするためのインターフェースであるAWI(Agentic Web Interface)の概念を紹介する。
AWI設計の原則を6つ確立し,安全性,効率,標準化を重視した。
このリフレーミングは、既存のインターフェイスの基本的な制限を克服し、より効率的で信頼性があり透明なWebエージェント設計への道を開くことを目的としています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:53:58 GMT)
NTK-DFL: Enhancing Decentralized Federated Learning in Heterogeneous Settings via Neural Tangent Kernel [27.9] Decentralized Federated Learning (DFL) は、中央サーバや生のデータ交換なしで参加者間でモデルをトレーニングするための、協調的な機械学習フレームワークである。
近年の研究では、集中型フレームワークにおけるフェデレーション学習に適用されたニューラルタンジェントカーネル(NTK)アプローチが、パフォーマンスの向上につながることが示されている。
本稿では,NTKベースの進化とモデル平均化の相乗効果を導入しながら,分散環境でクライアントモデルを訓練するためにNTKを活用するアプローチを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:46:45 GMT)
Federated Learning Nodes Can Reconstruct Peers' Image Data [27.9] Federated Learning(FL)は、複数のノードがローカルデータ上でモデルをトレーニングできるようにする、プライバシ保護機械学習フレームワークである。
以前の研究によると、FLの勾配共有ステップは、正直だが正確な中央サーバーからのデータ再構成攻撃に弱い可能性がある。
正直なノード/クライアントは、勾配インバージョンによってピアのイメージデータを再構築する攻撃を起動し、深刻なプライバシーリスクを生じさせることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:56:01 GMT)
Constructing and Evaluating Declarative RAG Pipelines in PyTerrier [27.9] Retrieval augmented generation (RAG)はパイプラインアーキテクチャのエキサイティングな応用である。
PyTerrierのPyTerrier-RAG拡張は、標準的なRAGデータセットへのアクセスを容易にします。
我々は、最先端のスパース、学習されたスパース、そして密集したレトリバーで、より大きなPyTerrierエコシステムを構築する方法を示します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:16:34 GMT)
Tile Classification Based Viewport Prediction with Multi-modal Fusion Transformer [27.9] ビューポート予測はタイルベースの360度ビデオストリーミングシステムにおいて重要な側面である。
マルチモーダルフュージョン変換器(MFTR)を用いたタイル分類に基づくビューポート予測手法を提案する。
提案したMFTRを評価するために,広く利用されている2つのPVS-HMとXu-Gazeデータセットについて広範な実験を行った。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:11:03 GMT)
AIR: Zero-shot Generative Model Adaptation with Iterative Refinement [27.3] ゼロショット生成モデル適応(ZSGM)は、テキストガイダンスのみを使用して、事前訓練されたジェネレータをターゲットドメインに適応することを目的としている。
最近のZSGMアプローチの中心は、CLIPのような視覚言語モデルの埋め込み空間において、画像オフセットとテキストオフセットを整列する形で、テキストガイダンスを使用する方向損失である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:00:50 GMT)
Table-Text Alignment: Explaining Claim Verification Against Tables in Scientific Papers [27.1] 最終的なラベルのみを予測することは不十分である、と我々は主張する。
これを解決するために、我々は、表-テキストアライメントを説明タスクとして再設定し、クレーム検証に不可欠な表セルをモデルで識別する必要がある。
我々は、SciTabベンチマークを人間に注釈付きセルレベルの有理値で拡張することで、新しいデータセットを構築する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:40:38 GMT)
GLAP: General contrastive audio-text pretraining across domains and languages [27.0] GLAP(General Language Audio Pretraining)を導入する。
GLAPは、マルチリンガルおよびマルチドメイン機能を備えたContrastive Language Audio Pretraining (CLAP)を拡張している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:54:31 GMT)
Pragmatics in the Era of Large Language Models: A Survey on Datasets, Evaluation, Opportunities and Challenges [26.8] NLPにおける実用能力を評価するために設計されたリソースのレビューを行う。
タスク設計,データ収集方法,評価手法,および実世界のアプリケーションとの関係について分析する。
本調査は,実用的評価の状況を明確にし,より包括的で目標とするベンチマークの開発を導くことを目的としている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:21:59 GMT)
PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified Framework [26.6] PosterCraftは、以前のモジュールパイプラインと厳格で定義されたレイアウトを捨てる統一されたフレームワークである。
慎重にデザインされ、カスケードされたワークフローを使用して、審美的なポスターの生成を最適化する。
PosterCraftは、レンダリング精度、レイアウトコヒーレンス、全体的な視覚的魅力において、オープンソースのベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:28:12 GMT)
Improving Group Robustness on Spurious Correlation via Evidential Alignment [26.5] ディープニューラルネットワークは、しばしば急激な相関、すなわち非因果的特徴と標的の間の表面的関連を学習し、依存する。
既存のメソッドは通常、外部のグループアノテーションや補助的な決定論的モデルを使用することでこの問題を軽減する。
偏りのあるモデルの振る舞いを理解するために不確実性定量化を利用する新しいフレームワークであるエビデンシャルアライメントを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:47:21 GMT)
Improving Fairness of Large Language Models in Multi-document Summarization [26.5] 多文書要約(MDS)の公正性は、多様な社会的属性値を持つ文書を包括的に把握するために重要である。
本手法は,MDSの要約レベルとコーパスレベルの公平性に着目した選好チューニング手法であるFairPOを提案する。
実験の結果,FairPOはサマリーの臨界品質を維持しつつ,強いベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:36:59 GMT)
Towards Understanding Bias in Synthetic Data for Evaluation [26.5] 大規模言語モデル(LLM)を用いた合成テストコレクションの信頼性について検討する。
まず,評価結果にそのようなバイアスがあることを実証的に示し,システム評価に与える影響を分析した。
分析の結果, 絶対的なシステム性能の計算など, 総合的なテストコレクションを用いた評価結果におけるバイアスの影響は大きいが, その効果は相対的なシステム性能の比較においてそれほど重要でない可能性が示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:25:42 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [26.4] CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。
テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令処理におけるLLMの強化手法を提案する。
より優れたCoT施行のためのサンプルワイドコントラストによる複雑な指示の下での推論の浅く、重要でない性質に対処する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:57:57 GMT)
CogStream: Context-guided Streaming Video Question Answering [26.4] 本稿では,コンテキスト誘導型ストリーミングビデオ推論(CogStream)という課題を紹介する。
CogStreamは実世界のストリーミングビデオシナリオをシミュレートし、現在のストリームに関する質問に対する回答を推論するために、最も関連する歴史的コンテキスト情報をモデルに特定する必要がある。
半自動パイプラインによって生成される広範囲で階層的な問合せ対を特徴とする高密度な注釈付きデータセットを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:24:07 GMT)
ConStyX: Content Style Augmentation for Generalizable Medical Image Segmentation [26.0] ドメイン一般化(DG)は、強力な一般化性を持つ堅牢なモデルをトレーニングすることを目的としている。
コンテンツスタイル拡張(ConStyX)と呼ばれる領域ランダム化に基づく新しいDG手法を提案する。
ConStyXはトレーニングデータの内容とスタイルを強化し、拡張トレーニングデータにより幅広いデータドメインをカバーすることができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:04:32 GMT)
Spelling-out is not Straightforward: LLMs' Capability of Tokenization from Token to Characters [25.4] 大型言語モデル(LLM)は、文字単位で文字をスペルするが、より複雑な文字レベルのタスクに苦労する。
本研究では,LLMがスペルアウト処理中に文字レベルの情報を内部的にどのように表現し,活用するかを検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:27:41 GMT)
UrbanSense:AFramework for Quantitative Analysis of Urban Streetscapes leveraging Vision Large Language Models [25.4] 都市文化と建築様式は、地理的、年代学的、歴史的、社会政治的な要因により、都市によって大きく異なる。
本稿では,視覚言語モデルに基づくマルチモーダル・リサーチ・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:35:39 GMT)
FloorPlan-DeepSeek (FPDS): A multimodal approach to floorplan generation using vector-based next room prediction [25.4] 既存のフロアプラン生成モデルは、主にエンド・ツー・エンドの世代であり、単一のパスでピクセルベースのレイアウト全体を生成する。
建築フロア・プラン・モデリングに適した新しい「次の部屋予測」パラダイムを提案する。
FPDSは、テキストからフロアプランタスクにおける拡散モデルとTell2Designと比較して、競合性能を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:33:27 GMT)
Shapley Machine: A Game-Theoretic Framework for N-Agent Ad Hoc Teamwork [25.3] 我々は、NAHT(n-agent ad hoc teamwork)と呼ばれるオープンマルチエージェントシステムにおける最近提案された問題について検討することを目指している。
既存の手法は設計に基づいており、したがって理論的な厳密さとエージェント間のあいまいな信用割り当てが欠如している。
これらの制約に対処するため、協調ゲーム理論のレンズを用いてNAHTをモデル化し、解決する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:44:09 GMT)
Accelerating Diffusion Large Language Models with SlowFast: The Three Golden Principles [25.1] 拡散に基づく言語モデル (dLLMs) は従来の自己回帰型LLMに代わる有望な代替品として登場した。
信頼ベースや半自己回帰復号のような既存のdLLMのサンプリング戦略は、しばしば静的な振る舞いに悩まされる。
探索段階と高速化段階を交互に行う新しい動的サンプリング手法であるSlowFast Smplingを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:08:28 GMT)
OmniFluids: Unified Physics Pre-trained Modeling of Fluid Dynamics [25.1] OmniFluidsは、物理を事前訓練した演算子学習フレームワークである。
物理学のみの事前訓練、粗い乾燥したオペレーター蒸留、および数発の微調整を統合している。
流れ場再構成や乱流統計の精度において、最先端のAI駆動手法よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:23:02 GMT)
The Security Overview and Analysis of 3GPP 5G MAC CE [25.0] MAC CEはMAC層に位置する制御信号の一種であるネットワークプロトコルに導入された。
本稿ではMAC CEに対するセキュリティの脅威とそれに対応する保護機構について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:44:32 GMT)
On the Stability of Graph Convolutional Neural Networks: A Probabilistic Perspective [25.0] グラフトポロジにおける摂動がGCNN出力に与える影響について検討し,モデル安定性解析のための新しい定式化を提案する。
最悪の場合の摂動のみに焦点を当てた従来の研究とは異なり、分布認識の定式化は幅広い入力データにまたがる出力摂動を特徴付ける。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:02:52 GMT)
Debiasing Watermarks for Large Language Models via Maximal Coupling [24.9] 本稿では,グリーントークンの生成確率を微妙に増大させる新しいグリーン/レッドリスト透かし手法を提案する。
実験結果から,高い検出性を維持しつつテキスト品質を保ちつつ,従来技術よりも優れていたことが示唆された。
本研究は,テキスト品質への影響を最小限に抑えつつ,効果的な検出のバランスを保ちながら,言語モデルに有望な透かしソリューションを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:25:33 GMT)
PLAY2PROMPT: Zero-shot Tool Instruction Optimization for LLM Agents via Tool Play [24.8] 大規模言語モデル(LLM)は、特殊な外部ツールと統合されつつある。
多くのタスクは、最小限またはノイズの多いドキュメントでゼロショットツールの使用を要求する。
提案するPLAY2PROMPTは,各ツールの入力・出力動作を体系的に「再生」する自動フレームワークである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:53:41 GMT)
Spike-TBR: a Noise Resilient Neuromorphic Event Representation [24.6] 時間的バイナリ表現(TBR)に基づくイベントベースの新しい符号化戦略であるSpike-TBRを提案する。
Spike-TBRは、フレームベースの利点と、スパイクニューラルネットワークのノイズフィルタリング機能を組み合わせて、イベントストリームをより堅牢に表現する。
我々は、複数のデータセットにわたって異なるスパイキングニューロンを用いて、Spike-TBRの4つの変種を評価し、ノイズの影響のあるシナリオにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:39:54 GMT)
Beyond True or False: Retrieval-Augmented Hierarchical Analysis of Nuanced Claims [24.6] ClaimSpectは、クレームに対処する際に一般的に考慮されるアスペクトの階層を自動的に構築する、検索強化された世代ベースのフレームワークである。
ClaimSpectを、構築されたデータセットに特徴付けられるさまざまな現実世界の科学的および政治的主張に適用する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:17:45 GMT)
Consistent Story Generation with Asymmetry Zigzag Sampling [24.5] 非対称なプロンプトとビジュアルシェアリングを備えたZigzag Smplingと呼ばれる新しいトレーニング不要サンプリング戦略を導入する。
提案手法は、非対称なプロンプト間の交互に対象特性を保持するジグザグサンプリング機構を提案する。
本手法は,コヒーレントで一貫した視覚的ストーリーの生成において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:02:01 GMT)
Simplicity bias and optimization threshold in two-layer ReLU networks [24.4] 過度なパラメータ化にもかかわらず、ネットワークはトレーニングデータを補間するのではなく、より単純な解へと収束することを示す。
我々の分析は、ニューロンが特定の方向に向かっているいわゆる早期アライメントフェーズに依存しています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:51:41 GMT)
Can We Infer Confidential Properties of Training Data from LLMs? [24.3] 大規模言語モデル(LLM)のプロパティ推論を評価するベンチマークタスクであるPropInferを紹介する。
ChatDoctorデータセット上に構築されたベンチマークには、さまざまなプロパティタイプとタスク設定が含まれています。
本稿では,単語周波数信号を利用したプロンプトベース生成攻撃とシャドウモデル攻撃の2つを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:42:06 GMT)
Demonstrating Multi-Suction Item Picking at Scale via Multi-Modal Learning of Pick Success [24.2] この研究は、ロボット操作の自律的な学習が、パフォーマンスを向上させるソリューションを提供する方法を示す。
具体的には,マルチ誘引ロボットピックに着目し,ロボットピックの成功を予測するためのマルチモーダル視覚エンコーダの適用に関する総合的研究を行う。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:35:51 GMT)
Foundation Models for Causal Inference via Prior-Data Fitted Networks [24.0] CausalFMは、様々な因果推論設定でPFNベースの基礎モデルをトレーニングするためのフレームワークである。
PFNは、予め指定された事前分布から生成された合成データに基づいて事前訓練された変換器である。
各種合成および半合成ベンチマークを用いて,CausalFMがCATE推定に競争力を発揮することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:29:29 GMT)
Beyond Random Sampling: Efficient Language Model Pretraining via Curriculum Learning [23.9] カリキュラム学習は,初等・中等教育段階におけるコンバージェンスを継続的に改善することを示す。
圧縮比、語彙の多様性、可読性は、設定間の効果的な難易度信号として同定する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:06:57 GMT)
ConvD: Attention Enhanced Dynamic Convolutional Embeddings for Knowledge Graph Completion [23.9] 本稿では,複数の内部畳み込みカーネルに関係埋め込みを組み込む新しい動的畳み込み埋め込みモデルであるConvDを紹介する。
各種データセットを用いた実験により,提案手法は最先端のベースライン法よりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:30:20 GMT)
ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness [23.9] 視覚言語モデル(VLM)が人間の色を知覚し、理解し、活用できるかどうかは不明である。
本稿では,色理解におけるVLMの性能を評価するベンチマークであるColorBenchを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:35:42 GMT)
Edit360: 2D Image Edits to 3D Assets from Any Angle [23.8] Edit360は、一貫した3D編集に2D修正を拡張する、チューニング不要のフレームワークである。
2D修正のためのアンカービューを選択し、360度範囲全体の編集をプロパゲートする。
結果として編集されたマルチビューシーケンスは、高品質な3Dアセットの再構築を促進する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:09:28 GMT)
GUARD: Guided Unlearning and Retention via Data Attribution for Large Language Models [23.7] GUARDは、データ属性を通じて学習と保持をガイドする新しいフレームワークである。
GUARDは中核として、LLMアンラーニングに適した軽量なプロキシデータ属性メトリックを導入している。
我々は,GUARDが従来手法に匹敵するメトリクスを忘れつつ,保持性を大幅に向上させるという厳密な理論的保証を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:49:09 GMT)
Hierarchical Error Assessment of CAD Models for Aircraft Manufacturing-and-Measurement [23.5] 各種航空機モデルに対する実験結果から,提案手法の有効性が示された。
本稿では,航空機CADモデルのための新しいエラークラスタフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:38:12 GMT)
Towards Action Hijacking of Large Language Model-based Agent [23.1] LLMベースのアプリケーションのアクションプランを操作するための新しい攻撃であるAI$mathbf2$を紹介する。
まず、被害者のアプリケーションからアクション認識の知識を収集する。
このような知識に基づいて、攻撃者は誤解を招く入力を生成することができ、LLMを誤解して有害なアクションプランを生成することができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:17:02 GMT)
Graph-MLLM: Harnessing Multimodal Large Language Models for Multimodal Graph Learning [23.1] MLLM(Multimodal Large Language Models)は、多様なモダリティを表現および理解する際、顕著な能力を示す。
構造化グラフ情報(マルチモーダルグラフ、MMG)とマルチモーダルを統合することは、ソーシャルネットワーク、ヘルスケア、レコメンデーションシステムといった現実のアプリケーションに不可欠である。
既存のMMG学習手法はMLLMの活用法に基づいて3つのパラダイムに分類される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:44:46 GMT)
Teaching in adverse scenes: a statistically feedback-driven threshold and mask adjustment teacher-student framework for object detection in UAV images under adverse scenes [22.9] Unsupervised Domain Adaptation (UDA)は、ソースとターゲットのドメイン間のドメインギャップに起因するパフォーマンス劣化を効果的に軽減する。
しかし、既存のUDA研究は自然画像や鮮明なUAV画像に基づいている。
本稿では,UAVオブジェクト検出のための最初のベンチマークとして,統計的フィードバック駆動閾値とマスク調整教師学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:21:58 GMT)
Decoding for Punctured Convolutional and Turbo Codes: A Deep Learning Solution for Protocols Compliance [22.9] 本稿では,Long Short-Term Memory(LSTM)をベースとしたデコードアーキテクチャを提案する。
提案手法は、句読解畳み込み符号とターボ符号を統一する。
句読点埋め込み機構は、句読点パターンを直接ネットワークに統合し、様々なコードレートへのシームレスな適応を可能にする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:12:33 GMT)
TDS-CLIP: Temporal Difference Side Network for Efficient VideoAction Recognition [22.8] 本稿では,知識伝達と時間的モデリングのバランスをとるために,メモリ効率の良い時間差分側ネットワーク(TDS-CLIP)を提案する。
具体的には、動作特徴の局所的な時間差を効果的に捉えることのできる時間差適応器(TD-Adapter)を導入する。
また,ビデオ中のリッチモーション情報を効率的に学習するために,提案するサイドネットワークを誘導するサイドモーション拡張アダプタ(SME-Adapter)を設計した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:37:02 GMT)
ClusterUCB: Efficient Gradient-Based Data Selection for Targeted Fine-Tuning of LLMs [22.7] 本稿では、クラスタリングと修正されたアッパー信頼境界(UCB)アルゴリズムを用いた効率的な勾配に基づくデータ選択フレームワークを提案する。
各種ベンチマーク実験の結果,提案フレームワークであるClusterUCBは,従来の勾配に基づくデータ選択法と同等の結果が得られることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:53:01 GMT)
Provably Learning from Language Feedback [22.6] 我々は、言語フィードバック(LLF)問題から学習を形式化し、潜在報酬にもかかわらず学習を可能にする十分な仮定を主張する。
伝達エリューダ次元は、フィードバック中の情報がLLF問題の学習複雑性を変えるという直感を捉えていることを示す。
我々は、逐次的相互作用によってLLF問題を確実に解決する、$textttHELiX$と呼ばれる非回帰アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:35:02 GMT)
Discovering Hierarchical Latent Capabilities of Language Models via Causal Representation Learning [22.3] 本稿では,いくつかの潜在能力因子の線形変換としてベンチマーク性能をモデル化した因果表現学習フレームワークを提案する。
このアプローチを6つのベンチマークで評価された1500以上のモデルを含む包括的データセットに適用することにより、観測された性能変動を確実に説明できる簡潔な3ノード線形因果構造を同定する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:07:42 GMT)
What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.0] 状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。
我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。
本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:20:16 GMT)
Unsupervised Deformable Image Registration with Structural Nonparametric Smoothing [22.0] 学習ベースの変形可能な画像登録(DIR)アライメントは、ニューラルネットワークを通じて従来の最適化を償却することによって加速する。
SmoothProperは、スムーズさを強制し、ネットワークのフォワードパス内でメッセージパッシングを促進するプラグイン・アンド・プレイのニューラルモジュールである。
網膜血管データセットの予備的な結果は,2912x2画像上での登録誤差を1.88ピクセルまで低減することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:26:03 GMT)
Loss Functions and Operators Generated by f-Divergences [21.6] 本稿では,$f$-divergencesに基づいて新しい凸損失関数を構築することを提案する。
ロジスティック損失と類似して、$f$-divergenceによって生成される損失関数は演算子と関連付けられ、$f$-softargmax をダブする。
本研究の目的は,言語モデル設定における古典的クロスエントロピーを超えた損失関数の有効性を決定することである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:32:30 GMT)
Zero-Shot Offline Imitation Learning via Optimal Transport [21.5] ゼロショットの模倣学習アルゴリズムは、テスト時にたった1つのデモから、目に見えない振る舞いを再現する。
既存の実践的なアプローチでは、専門家のデモンストレーションを一連の目標と見なし、ハイレベルなゴールセレクタと低レベルなゴール条件のポリシーで模倣を可能にする。
そこで本研究では,模倣学習に固有の占領目標を直接最適化することにより,この問題を緩和する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:29:40 GMT)
SceneCompleter: Dense 3D Scene Completion for Generative Novel View Synthesis [21.4] SceneCompleterは、高密度な3Dシーンの完成を通して、3D一貫性のある新規なビュー合成を実現する新しいフレームワークである。
構造的およびテクスチャ的情報を効果的に融合させることにより,多様なデータセットをまたいだ生成的新規ビュー合成において,優れたコヒーレンスと妥当性を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:56 GMT)
Probably Approximately Correct Labels [21.4] 本稿では,ラベル付きデータセットをよりコスト効率よく構築するために,事前学習されたモデルからAI予測を付した「エキスパート」ラベルを補足する手法を提案する。
提案手法の利点は,大規模な言語モデルによるテキストアノテーション,事前学習された視覚モデルによる画像ラベリング,AlphaFoldによるタンパク質折り畳み解析などである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:16:26 GMT)
Improving Medical Visual Representation Learning with Pathological-level Cross-Modal Alignment and Correlation Exploration [21.3] 画像と報告の両方から病理観察の一貫性を最大化するために,新しい病理レベルの相互アライメント(PCMA)手法を提案する。
PCMAモジュールは外部の疾患アノテーションとは独立して動作し,本手法の汎用性と堅牢性を高める。
実験により,提案するフレームワークは,複数の下流タスクにおいて,新しい最先端性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:01:57 GMT)
Post-Training Quantization for Video Matting [20.6] ビデオマッティングは、映画制作やバーチャルリアリティーといった応用に不可欠である。
トレーニング後の量子化(PTQ)は、ビデオマッティングの初期段階にある。
本稿では,ビデオマッチングモデルに特化して設計された,新規で汎用的なPTQフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:57:14 GMT)
RmGPT: A Foundation Model with Generative Pre-trained Transformer for Fault Diagnosis and Prognosis in Rotating Machinery [20.5] 現在のPHM(Prognostics and Health Management)の手法は、しばしばタスク固有のモデルに依存している。
生成前訓練モデルの進歩に触発されて,診断・予後タスクの統一モデルであるRmGPTを提案する。
RmGPTは最先端のアルゴリズムを著しく上回り、診断タスクではほぼ完璧な精度、予後タスクでは例外的に低い誤差を達成している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:09:56 GMT)
MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning [20.4] 我々は、MMMG(Massive Multi-Discipline Multi-Tier Knowledge- Image Generation Benchmark)とともに、知識画像生成を新しいタスクとして導入する。
MMMGは10の分野、6の教育レベル、チャート、図、マインドマップといった多様な知識形式にまたがる4,456のエキスパート公認(知識)イメージプロンプトペアを提供している。
そこで本稿では,KG間のグラフ編集距離と視覚的明瞭度とを組み合わせ,実感的忠実度を評価するためのMMMGスコアを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:58:09 GMT)
GeoCAD: Local Geometry-Controllable CAD Generation [20.3] 局所幾何学制御可能なコンピュータ支援設計(CAD)生成はCADモデルの局所的な部分を自動的に修正することを目的としている。
既存の手法は、この目標を達成する上で困難に直面する。
ユーザフレンドリーで局所的な幾何学制御が可能なCAD生成手法であるGeoCADを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:23:31 GMT)
Preserving Task-Relevant Information Under Linear Concept Removal [20.0] SPLICEは、ターゲットラベルとの共分散を維持しながら、表現からセンシティブな概念を排除します。
これは線形の概念予測可能性を取り除き、最小の埋め込み歪みで目標共分散を維持するユニークな解である。
実証的には、SPLICEはBias in BiosやWinobiasなどのベンチマークでベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:53:29 GMT)
DeepVideo-R1: Video Reinforcement Fine-Tuning via Difficulty-aware Regressive GRPO [19.9] グループ相対政策最適化(GRPO)は、グループベースの正規化報酬を持つPPOスタイルの強化アルゴリズムを用いることで、驚くべき成功を収めた。
提案するReg-GRPO(Regressive GRPO)と難易度対応データ拡張戦略を用いて学習したビデオ大言語モデルであるDeepVideo-R1を提案する。
包括的実験の結果,DeepVideo-R1は複数のビデオ推論ベンチマークでビデオ推論性能を大幅に改善することがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:17:38 GMT)
Minimizing False Positives in Static Bug Detection via LLM-Enhanced Path Feasibility Analysis [19.8] 大規模なバグ検出のための既存のアナライザは、しばしば偽陽性率が高い。
これは主に、パス実現可能性検証におけるアナライザの能力の制限によるものだ。
反復経路実現可能性分析フレームワーク LLM4PFA を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:11:38 GMT)
Video-CoT: A Comprehensive Dataset for Spatiotemporal Understanding of Videos Based on Chain-of-Thought [19.8] ビデオ理解は、ビデオ分析からインタラクティブシステムまで、様々な用途に不可欠である。
視覚言語モデルの発展にもかかわらず、これらのモデルはしばしば、微妙で時間的な詳細を捉えるのに苦労する。
これを解決するために、ビデオ理解を強化するために設計された画期的なデータセットであるVideo-Thoughtを紹介した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:51:33 GMT)
SCORE: Story Coherence and Retrieval Enhancement for AI Narratives [19.8] SCOREはストーリーコヒーレンスと検索の強化のためのフレームワークである。
主要なアイテムのステータスを追跡し、エピソードの要約を生成する。
TF-IDFとコサイン類似性を取り入れ、関連するエピソードを特定し、全体のストーリー構造を強化する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:15:17 GMT)
Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification? [19.7] ToxiMolは、分子毒性の修復に焦点を当てた汎用マルチモーダル言語モデル(MLLM)のための最初のベンチマークタスクである。
11の一次課題と560の有毒な分子を包含し, 多様な機構と粒度にまたがる標準データセットを構築した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:25:53 GMT)
OPT-BENCH: Evaluating LLM Agent on Large-Scale Search Spaces Optimization Problems [19.6] OPT-BENCHは、大規模検索空間最適化問題において、LLM(Large Language Models)を評価するために設計されたベンチマークである。
OPT-Agentは、歴史的フィードバックを通じてソリューションの生成、検証、反復的に改善することで、複雑な問題に取り組む際の人間の推論をエミュレートする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:46:41 GMT)
TransXSSM: A Hybrid Transformer State Space Model with Unified Rotary Position Embedding [19.4] 本稿では,Transformer層とSSM層を協調的に統合したハイブリッドアーキテクチャであるTransXSSMを紹介する。
4Kシーケンス長では、TransXSSMは標準のTransformerモデルと比較してそれぞれ42.3%と29.5%のトレーニング速度と推論速度を示す。
この結果から,ハイブリッドモデルにおける位置整合性は統一的位置整合性によって解決され,効率的かつ高性能な長コンテキストモデリングが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:58:42 GMT)
Attention Retrieves, MLP Memorizes: Disentangling Trainable Components in the Transformer [19.4] Transformerアーキテクチャは、現代の大規模言語モデルの成功の中心である。
Transformerのコアコンポーネントは自己アテンションメカニズムですが、パフォーマンス向上のどの面、どの面がそれに起因するのか疑問に思っています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:40:32 GMT)
WaveFormer: A Lightweight Transformer Model for sEMG-based Gesture Recognition [19.0] WaveFormerは、sEMGジェスチャー認識用に設計された軽量トランスフォーマーベースのアーキテクチャである。
我々のモデルは、新しい学習可能なウェーブレット変換によって時間領域と周波数領域の機能を統合し、特徴抽出を強化する。
たった3100万のパラメータで、WaveFormerはEPN612データセットの95%の分類精度を達成し、より大きなモデルを上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:07:11 GMT)
PhysioWave: A Multi-Scale Wavelet-Transformer for Physiological Signal Representation [19.0] 様々な生理的信号におけるマルチスケールの時間周波数特徴を捉えることを目的とした,新しいウェーブレットに基づく生理的信号解析手法を提案する。
EMGとECGに特有の2つの大規模事前訓練モデルが導入され、性能が向上し、下流タスクに新たなベースラインが設定された。
統合されたマルチモーダルフレームワークは、事前訓練されたEEGモデルを統合することで構築され、各モーダルはその専用ブランチを通してガイドされ、学習可能な重み付き融合によって融合される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:11:41 GMT)
DUN-SRE: Deep Unrolling Network with Spatiotemporal Rotation Equivariance for Dynamic MRI Reconstruction [18.9] 再構成モデルにおける対称性の事前の明示的な組み込みは、画像品質を著しく向上させることができる。
近年の等変畳み込みニューラルネットワーク (ECNN) は, 空間対称性の先駆的利用に大きな可能性を示唆している。
DUN-SREは(2+1)D畳み込み構造を通して等時回転を確立する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:44:27 GMT)
Demystifying Spectral Feature Learning for Instrumental Variable Regression [18.9] スペクトル特徴に基づく2段最小二乗推定器の一般化誤差を導出する。
パフォーマンスは2つの重要な要因に依存しており、結果の明確な分類につながります。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:06:43 GMT)
BrainMAP: Multimodal Graph Learning For Efficient Brain Disease Localization [18.8] 本稿では,神経変性疾患による脳領域の精密かつ効率的な同定を目的とした新しいグラフ学習フレームワークであるBrainMAPを提案する。
BrainMAPは、疾患関連部分グラフに集中することにより、計算オーバーヘッドを50%以上削減する。
実験結果から、BrainMAPは予測精度を損なうことなく、最先端の手法よりも計算効率が優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:24:28 GMT)
SWDL: Stratum-Wise Difference Learning with Deep Laplacian Pyramid for Semi-Supervised 3D Intracranial Hemorrhage Segmentation [18.8] ラベル付きデータの不足に対処するために,半教師付き学習が有望なソリューションとして登場した。
本稿では,ラプラシアンピラミッドと深層畳み込みアップサンプリングの相補的な利点を生かした新しいSSLフレームワークSWDL-Netを提案する。
本フレームワークは,差分学習機構を用いて,病変の詳細と境界のより優れたセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:16:49 GMT)
PAG: Multi-Turn Reinforced LLM Self-Correction with Policy as Generative Verifier [18.8] Policy as Generative Verifier (PAG) は、政策と検証役を交互に交互に行うことで、大規模言語モデルに自己修正の権限を与えるフレームワークである。
モデル崩壊を緩和し、推論能力と検証能力の両方を共同で強化する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:59:35 GMT)
Learning Multimodal Latent Dynamics for Human-Robot Interaction [18.7] 本稿では,ヒト-ヒトインタラクション(HHI)から協調型人間-ロボットインタラクション(HRI)を学習する方法を提案する。
本研究では,隠れマルコフモデル(HMM)を変分オートエンコーダの潜在空間として用いて,相互作用するエージェントの結合分布をモデル化するハイブリッドアプローチを考案する。
利用者は,我々の手法を,より人間らしく,タイムリーで,正確なものと認識し,他の基準よりも高い選好度で評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:59:57 GMT)
J-DDL: Surface Damage Detection and Localization System for Fighter Aircraft [18.5] 本稿では,J-DDLと呼ばれる戦闘機のスマート表面損傷検出と位置決めシステムを提案する。
J-DDLは航空機表面の2D画像と3D点雲を統合し、レーザースキャナーとカメラを組み合わせたシステムで撮影する。
主なイノベーションは、効率的な機能抽出のための軽量なFasternetブロック、最適化されたネックアーキテクチャ、新しい損失関数であるInner-CIOUの導入である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:05:35 GMT)
Hybrid-NL2SVA: Integrating RAG and Finetuning for LLM-based NL2SVA [18.5] SystemVerilog Assertions (SVAs) はハードウェア設計の正しさを検証するために重要である。
大規模言語モデル(LLM)の最近の進歩は、この翻訳を自動化する機会を提供する。
本稿では,RAGフレームワークと合成微調整データセットを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:52:06 GMT)
Equitable Mechanism Design for Facility Location [18.2] エージェント間の等価性を最大化する施設配置の戦略実証機構を考察する。
我々はまず、戦略実証機構がユーティリティの最適ジニ指数の近似比を束縛できないという、単純だが基本的な不合理性の結果を証明した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:08:58 GMT)
Simultaneous Localization and Affordance Prediction of Tasks from Egocentric Video [18.1] VLM(Vision-Language Models)は、下流の視覚と自然言語アプリケーションのための基礎モデルとして成功している。
本稿では、空間的局所化された自我中心型ビデオデモを利用するVLMの空間拡張について述べる。
提案手法は,VLMを用いてタスク記述の類似性を位置タグ付き画像にマッピングする手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:52:34 GMT)
Graph-Dependent Regret Bounds in Multi-Armed Bandits with Interference [18.1] ネットワーク干渉下でのマルチアームバンディットについて検討する。
これにより指数的に大きな作用空間が生じる。
本稿では,局所グラフ構造を用いて後悔を最小限に抑える新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:49:14 GMT)
The Sample Complexity of Parameter-Free Stochastic Convex Optimization [18.1] 本研究では,問題パラメータ,例えば最適距離が不明な場合の凸最適化のサンプル複雑性について検討する。
まず,検証セットの過度な適合を回避するため,信頼性の高いモデル選択手法を提案する。
第2に、最適性への距離が未知である場合に特化して正規化に基づく手法を開発する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:14:49 GMT)
SOFT: Selective Data Obfuscation for Protecting LLM Fine-tuning against Membership Inference Attacks [17.8] メンバーシップ推論攻撃(MIA)に対する微調整大言語モデルの脆弱性について検討する。
プライバシー保護とプライバシー保護のバランスをとるために,影響のあるデータ選択を調整可能なパラメータで活用することで,プライバシーの漏洩を緩和する新しい防衛手法であるSOFTを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:23:56 GMT)
DiffUMI: Training-Free Universal Model Inversion via Unconditional Diffusion for Face Recognition [17.7] DiffUMIは拡散型ユニバーサルモデル逆転攻撃であり、追加の訓練は不要である。
最先端の攻撃を15.5%上回り、標準およびプライバシー保護の顔認識システムでの成功率を9.82%上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:15:16 GMT)
ViC-Bench: Benchmarking Visual-Interleaved Chain-of-Thought Capability in MLLMs with Free-Style Intermediate State Representations [17.7] Visual-Interleaved Chain-of-Thought (VI-CoT)により、MLLMはステップワイド中間視覚状態(IVS)に基づいた理解と決定を継続的に更新できる。
本稿では,迷路ナビゲーション,ジグソーパズル,エンボディドロングホライゾン計画,複雑カウントという4つのタスクからなる,ViC-Benchと呼ばれる特殊なベンチマークを紹介する。
我々は18種類の高度MLLMの評価を広範囲に行い、そのVI-CoT能力に関する重要な知見を明らかにした。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:01:00 GMT)
Robust Unsupervised Adaptation of a Speech Recogniser Using Entropy Minimisation and Speaker Codes [17.6] 本稿では,1分間のデータに適応する手法の組み合わせを提案する。
複数の仮説を用いることで、初期認識における誤りへの適応がより堅牢になる。
遠距離雑音強調版であるCommon Voiceでは、1分間のデータで単語誤り率を20%向上させる手法が提案されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:40:58 GMT)
Capturing Temporal Dynamics in Large-Scale Canopy Tree Height Estimation [17.6] 本稿では,大規模で高解像度な天蓋の高さマップを時間とともに生成する新しい手法を提案する。
本モデルでは,Sentinel-1 と Sentinel2 の時系列衛星データを用いて,数年にわたるキャノピーの高さを正確に予測する。
GEDI LiDARデータをモデルトレーニングの基礎的真理として用いて,2019-2022年のヨーロッパ大陸における最初の10m分解能時空間高図を提示する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:27:36 GMT)
Differentially Private Relational Learning with Entity-level Privacy Guarantees [17.6] 本研究は,形式的エンティティレベルDP保証を用いた関係学習の原則的枠組みを提案する。
本稿では,実体発生頻度に基づいてクリッピング閾値を変調する適応的勾配クリッピング方式を提案する。
これらの貢献により、プライバシー保証が保証されたリレーショナルデータに対して、DP-SGDの修正版が提供される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:17:36 GMT)
Breaking Distortion-free Watermarks in Large Language Models [17.6] 現在のLLM透かし方式が専門家の敵に弱いという懸念が高まっている。
適応的なプロンプトとソートに基づくアルゴリズムを用いてLLMを透かしの秘密鍵を正確に復元する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:26:36 GMT)
Efficient Quantum Circuit Compilation for Near-Term Quantum Advantage [17.4] 本稿では,ターゲット量子回路をレンガ壁配置に近似的にコンパイルする手法を提案する。
この新しい回路設計は、実際の量子コンピュータで直接実装できる2量子CNOTゲートで構成されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:09:47 GMT)
MLLM-Based UI2Code Automation Guided by UI Layout Information [17.2] 3つのキーモジュールを含む実世界のWebページイメージからUIコードを生成するMLLMベースの新しいフレームワークを提案する。
評価のために、Snap2Codeという350の現実世界のWebサイトを含む新しいベンチマークデータセットを構築しました。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:04:16 GMT)
Decomposing MLP Activations into Interpretable Features via Semi-Nonnegative Matrix Factorization [17.1] 現在の手法は、スパースオートエンコーダ(SAE)を用いた辞書学習に依存している。
ここでは、セミ非負行列分解(SNMF)によるアクティベーションを直接分解することで、これらの制限に対処する。
Llama 3.1, Gemma 2, GPT-2の実験では、SNMFはSAEよりも優れており、因果的ステアリングに強い教師付きベースライン(差-in-means)がある。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:33:29 GMT)
Generative Uncertainty in Diffusion Models [17.1] 合成試料の生成不確かさを推定するためのベイズ的枠組みを提案する。
提案手法は, 品質の悪いサンプルを効果的に同定し, 既存の不確実性に基づく手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:31:19 GMT)
Towards Clinical Practice in CT-Based Pulmonary Disease Screening: An Efficient and Reliable Framework [17.0] クラスタベースサブサンプリング(CSS)法は,CTスライスをコンパクトかつ包括的に選択する。
ハイブリッド不確実性定量化(HUQ)メカニズムは、Aleatoric Uncertainty(AU)とEpistemic Uncertainty(EU)の両方を最小の計算オーバーヘッドで評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:50:04 GMT)
Permutation-Based Rank Test in the Presence of Discretization and Application in Causal Discovery with Mixed Data [16.9] 心理学的な研究において、ある人の特定の個性の次元の連続的なレベルは、離散化後にのみ測定できる。
変数が離散化されても統計的誤差を適切に制御できる混合データ置換型ランクテスト(MPRT)を提案する。
MPRTは離散化の有無でType Iエラーを効果的に制御できるが、以前の方法では制御できない。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:38:08 GMT)
AssistanceZero: Scalably Solving Assistance Games [16.8] 支援ゲームを解くための最初のスケーラブルなアプローチを提示する。
われわれはMinecraftをベースとした新しい支援ゲームに10400ドル以上の目標を掲げる。
我々のアプローチであるAssistanceZeroは、人間の行動と報酬を予測するニューラルネットワークでAlphaZeroを拡張します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:55:53 GMT)
PAL: Probing Audio Encoders via LLMs -- A Study of Information Transfer from Audio Encoders to LLMs [16.8] 大規模言語モデル(LLM)への音声認識機能の統合は、オーディオ-LLMの大幅な進歩を可能にした。
我々は,LLMがテキストクエリを満たすために,音声エンコーダ表現を適切に探索する能力として,効果的な音声-LLMインタラクションを概念化する。
本稿では,建築設計の選択がそれにどのように影響するかを体系的に検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:23:07 GMT)
FASCIST-O-METER: Classifier for Neo-fascist Discourse Online [16.7] この研究は、アメリカ社会の文脈におけるデジタル談話のための第一種ネオファシズム符号化スキームを提示する。
符号化方式をテストするために、著名なネオファシストグループからインターネット上で膨大な量のアクティビティを収集する。
この種のフォーラムにおけるネオ・ファシスト・レトリックの流行は常在しており、将来の研究のターゲットとなる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:02:18 GMT)
EAGLE: Efficient Alignment of Generalized Latent Embeddings for Multimodal Survival Prediction with Interpretable Attribution Analysis [16.6] 既存のマルチモーダルアプローチは、単純化された融合戦略、膨大な計算要求、および臨床導入における解釈可能性の重要な障壁の欠如に悩まされている。
本稿では,注意に基づくマルチモーダル融合と包括的帰属分析により,これらの制約に対処する新しいディープラーニングフレームワークであるEagleを紹介する。
Eagleは、高度なAI機能と実用的なヘルスケアデプロイメントのギャップを埋め、マルチモーダルサバイバル予測のためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:56:13 GMT)
ReCUT: Balancing Reasoning Length and Accuracy in LLMs via Stepwise Trails and Preference Optimization [16.5] Reasoning Compression ThroUgh Stepwise Trials (ReCUT) は推論軌道の精度と長さのバランスをとるための新しい手法である。
複数の数学推論データセットとバックボーンモデルによる実験結果から、ReCUTは推論の長さを約30~50%削減することが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:43:01 GMT)
RecGPT: A Foundation Model for Sequential Recommendation [16.5] 我々は、真にゼロショットの一般化機能を実現するための逐次レコメンデーションのための基礎モデルを開発する。
提案手法は,テキスト機能のみからアイテム表現を導出することで,既存のIDベースの手法から逸脱する。
我々は、不均一なテキスト記述を標準化された離散トークンに変換するFinite Scalar Quantizationと統合されたアイテムトークン化を導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:00:31 GMT)
GraphThought: Graph Combinatorial Optimization with Thought Generation [16.5] グラフ最適化(GCO)問題は、ロジスティクスやバイオインフォマティクスといった領域の中心である。
我々はまず、高品質な中間推論ステップを生成するための構造化ガイダンスを提供する最適思考設計(OTD)問題を定式化する。
提案するGraphThoughtは, 効果的な推論シーケンスを生成する新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:10:05 GMT)
Diversifying Human Pose in Synthetic Data for Aerial-view Human Detection [16.4] SynPoseDivは、既存の合成データセット内で人間のポーズを多様化する新しいフレームワークである。
拡散ベースのポーズジェネレータを使用して、リアルで多様な3Dポーズを生成する。
ソース・ツー・ターゲット・イメージ・トランスレータを通じて、新しいポーズで仮想文字の画像を生成する。
実験により、SynPoseDivは複数の航空ビュー人間検出ベンチマークにおける検出精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:13:07 GMT)
Privacy-Aware Spectrum Pricing and Power Control Optimization for LEO Satellite Internet-of-Things [16.3] LEO IoTのためのハイブリッドスペクトル価格と電力制御フレームワークを提案する。
まず、LEO衛星システムのための局所的な深層強化学習アルゴリズムを設計し、収益最大化価格と電力制御方式を学習する。
また、FLのグローバルモデル集約フェーズで使用される評判に基づくブロックチェーンを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:12:02 GMT)
StepProof: Step-by-step verification of natural language mathematical proofs [16.2] 本稿では,ステップ・バイ・ステップ検証のための新しい自動形式化手法であるStepProofを提案する。
StepProofは、完全な証明を複数の検証可能なサブプロテクションに分解し、文レベルの検証を可能にする。
StepProofは従来の手法に比べて証明成功率と効率を著しく改善することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:31:23 GMT)
Time To Impeach LLM-as-a-Judge: Programs are the Future of Evaluation [16.0] 大規模言語モデル(LLM)はLLM世代と応答の質を評価するために広く使われている。
PAJAMA は LLM を用いて応答を直接スコアリングするのではなく,実行可能判定プログラムを合成する新しい代替手段である。
これらの合成プログラムは、ローカルに保存および実行することができ、解釈可能で監査可能な判断ロジックを提供しながら、桁違いのコストを削減できる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:53:22 GMT)
Differentially private and decentralized randomized power method [16.0] 本稿では,ランダム化電力法におけるプライバシー保護の強化について述べる。
まず、微分プライバシーを実現するために、現在の技術で必要とされるノイズの量を削減できる変種を提案する。
次に、データを複数のユーザ間で分散する分散フレームワークに適用する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:09:37 GMT)
Improved Algorithm for Deep Active Learning under Imbalance via Optimal Separation [15.6] クラス不均衡は、機械学習のパフォーマンスが現実世界のアプリケーションにおけるマイノリティクラスに深刻な影響を与える。
DIRECTは,クラス分離境界を識別し,アノテーションの最も不確実な例を選択するアルゴリズムである。
本研究は,クラス不均衡とラベルノイズの両条件下でのアクティブラーニングの総合的研究である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:17:19 GMT)
VeriContaminated: Assessing LLM-Driven Verilog Coding for Data Contamination [15.5] 大規模言語モデル(LLM)はコード生成に革命をもたらし、様々な確立されたベンチマークフレームワークで例外的な結果を得た。
しかし、データ汚染に関する懸念は、これらの評価の有効性に関する疑問を提起する。
我々は、Verilogコード生成のための最先端(SOTA)評価フレームワークを解析する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:18:06 GMT)
An Attention-based Spatio-Temporal Neural Operator for Evolving Physics [15.5] 機械学習の主な課題は、未知の物理プロセスを学び、実際のスケールで予測することである。
本研究では,空間的・時間的相互作用に対する注意機構を分離した新しいアーキテクチャである注意型S-Temporal Neural Operator (ASNO)を提案する。
ASNOは時間的予測のための変換器を学習し、未確認の物理的パラメータに適応し、歴史的状態の寄与による解釈可能性を高める。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:54:47 GMT)
Flick: Few Labels Text Classification using K-Aware Intermediate Learning in Multi-Task Low-Resource Languages [15.4] そこで本稿では,Flickを低リソースの言語文脈における少数ラベルテキスト分類の永続的課題に対処するために提案する。
Flickは、シングルクラスタの凝集に集中し、適応的なトップk選択機構を活用することで、初期の広義のセットから高度に信頼性の高い擬似ラベルを除去することを学ぶ。
Flickの有効性を、アラビア語、ウルドゥー語、セツワナなどの低リソース言語を含む14の多様なデータセットで実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:09:47 GMT)
Upweighting Easy Samples in Fine-Tuning Mitigates Forgetting [15.3] 下流タスクで事前訓練されたモデルを微調整すると、元の能力は劣化することが多い。
本稿では,事前学習したモデルの損失に基づく微調整データのサンプル重み付け手法を提案する。
我々は,言語と視覚の両方における手法の有効性を実証的に実証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:04:07 GMT)
Learning a Continue-Thinking Token for Enhanced Test-Time Scaling [15.2] テストタイムのスケーリングは、推論時の追加計算を利用することで、言語モデルのパフォーマンスを改善する効果的なアプローチとして現れている。
近年の研究では、終端トークンのオーバーライドが推論のステップを延長し、精度を向上させることが示されている。
本研究は,拡張推論を誘発するために,専用トークンを学習できるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:28:54 GMT)
Adaptive Federated LoRA in Heterogeneous Wireless Networks with Independent Sampling [15.2] Federated LoRAは、分散デバイス上で大きな言語モデルを効率的に微調整する技術として登場した。
本稿では,システムとデータの不均一性の両方の下で微調整を行う独立したフェデレーションコンバージェンスウォールクロック時間を提案する。
実験により,本手法は,様々なモデルやデータセットを対象とした最先端手法と比較して,ウォールクロック時間を短縮することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:01:58 GMT)
Reaching the Ultimate Quantum Precision Limit at Colliders: Conditions and Case Studies [15.1] 我々は、量子フィッシャー情報(QFI)によって定義された精度の量子限界に達することができるかどうかを考察する。
我々は、コライダー測定が絡み合った二粒子系においてQFIを飽和させるかどうかを決定するための一般的な枠組みを開発する。
古典的フィッシャーは、選択した位相空間領域におけるQFIの磁気モーメントとCP違反ヒッグス相互作用を情報的に飽和させることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:03:36 GMT)
Social Bias Benchmark for Generation: A Comparison of Generation and QA-Based Evaluations [15.0] 本稿では,Bias Benchmark for Generation (BBG) を提案する。
10大言語モデル(LLM)における中性世代と偏り世代の発生確率を計測する。
また,長大なストーリー生成評価結果と複数選択BBQ評価結果を比較し,両手法が矛盾する結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:57:10 GMT)
Agentic Semantic Control for Autonomous Wireless Space Networks: Extending Space-O-RAN with MCP-Driven Distributed Intelligence [15.0] 月面操作は無線通信システムに 厳しい要求を課します
モデルコンテキストプロトコル(MCP)とエージェント・ツー・エージェント(A2A)通信プロトコルによって実現された意味的エージェント層を組み込んだ新しい拡張を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:35:36 GMT)
TexTailor: Customized Text-aligned Texturing via Effective Resampling [14.9] テキスト記述から一貫したテクスチャを生成する新しい方法であるTexTailorを提案する。
既存のテキスト・テクスチャ合成アプローチでは、深度認識拡散モデルを用いて画像を生成し、複数の視点でテクスチャを合成する。
我々は、オブジェクトの形状に基づいてカメラの位置を適応的に調整することで、ビュー一貫性テクスチャの合成を改善する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:55:44 GMT)
PREMISE: Scalable and Strategic Prompt Optimization for Efficient Mathematical Reasoning in Large Models [14.8] Claude 3.7 Sonnet や OpenAI o1 のような大きな推論モデル (LRM) は、長いチェーン・オブ・シークレット (CoT) 推論を用いて数学的なベンチマークで高い性能を達成する。
これによりトークンの使用とコストが膨らみ、レイテンシに敏感な設定やAPI制約のある設定でのデプロイメントが制限される。
モデル重みを変更することなく、推論オーバーヘッドを低減するプロンプトのみのフレームワークであるPreMISEを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:05:09 GMT)
Evolutionary Prediction Games [14.8] 進化ゲーム理論に基づくフレームワークである進化予測ゲームを紹介する。
無制限のデータと計算能力を備えた理想的な設定では、繰り返し学習が競合を生み出し、競争排除を促進する。
現実的な制約の下では,グループ間の安定な共存と相互主義的共生が可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:12:08 GMT)
VeriLeaky: Navigating IP Protection vs Utility in Fine-Tuning for LLM-Driven Verilog Coding [14.7] 大規模言語モデル(LLMs)は、コーディングにおいて大きな可能性を秘めているが、Verilogのようなニッチな言語には、キュレートされたデータによる微調整(FT)が不可欠である。
FTの知的財産権(IP)を使用すると、LLM推論によってFTデータがリークされるため、深刻なリスクが生じる。
本研究は,FTに対して有効かつ最小限に破壊的な新しい戦略の必要性を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:53:41 GMT)
ClimateChat: Designing Data and Methods for Instruction Tuning LLMs to Answer Climate Change Queries [14.7] 本研究では,気候変動のための指導データ構築の自動化手法を提案する。
我々は,オープンソースのLCMを微調整するために,ClimateChat-Corpusという気候変動指導データセットを構築した。
その結果,ClimateChatは気候変動に対する質問・回答タスクのパフォーマンスを著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:43:38 GMT)
Reliable Reasoning Path: Distilling Effective Guidance for LLM Reasoning with Knowledge Graphs [14.6] 大規模言語モデル(LLM)は、背景知識の不足のため、知識集約的なタスクに苦しむことが多い。
知識グラフをマイニングするためのRCPフレームワークを提案する。
また、その意義に応じて推論経路を評価し、洗練する再考モジュールも導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:10:32 GMT)
PASCO (PArallel Structured COarsening): an overlay to speed up graph clustering algorithms [14.6] グラフのクラスタリングノードは、グラフ解析の土台である。
いくつかの一般的な方法は、非常に大きなグラフには適さない。
この研究は、クラスタリングアルゴリズムを高速化するオーバーレイであるPASCOを導入している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:23:21 GMT)
PyLO: Towards Accessible Learned Optimizers in PyTorch [14.4] 私たちはPyTorchベースのライブラリであるPyLOを紹介します。
私たちのリリースには、aMacceleratedバージョンのsmall_fclopt学習アーキテクチャ(aetz et al., 2022)が含まれています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:00:46 GMT)
Precise Zero-Shot Pointwise Ranking with LLMs through Post-Aggregated Global Context Information [14.3] 本稿では,GCCP(Global-Consistent Comparison Pointwise Ranking)戦略を提案する。
この戦略は、各候補とアンカー文書のグローバル参照比較を取り入れて、対照的な関連性スコアを生成する。
提案手法は,従来と同等の効率性を維持しつつ,従来のポイントワイズ手法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:20:40 GMT)
Density Ratio Estimation with Conditional Probability Paths [14.3] 条件変数に基づく時間スコア推定のための新しいフレームワークを提案する。
従来の手法と比較して,本手法は時間スコアの学習を高速化し,密度比の推定精度が向上することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:56:50 GMT)
Content ARCs: Decentralized Content Rights in the Age of Generative AI [14.2] 本稿では,コンテンツARC (Authenticity, Rights, Compensation) というフレームワークを提案する。
証明と動的ライセンシングのオープンスタンダードとデータ属性を組み合わせることで、Content ARCは、権利を管理し、AIトレーニングで自分の仕事を使用するためのクリエイターを補償するメカニズムを作成します。
我々は、Content ARCs内のAIデータライセンス分野におけるいくつかの初期段階の成果を特徴づけ、エンドツーエンドフレームワークを完全に実装するための課題がどこにあるかを特定します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:32:35 GMT)
Context-Aware Unit Testing for Quantum Subroutines [14.1] 量子ソフトウェアをテストすることは、量子情報の非決定論的性質、基盤となるヒルベルト空間の高次元性、複雑なハードウェアノイズ、および量子システムの固有の非局所的性質による固有の課題を示す。
量子システムにおける単体テストに関連する計算複雑性に対処するために、文脈認識をテストプロセスに組み込むことを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:58:56 GMT)
Improving Named Entity Transcription with Contextual LLM-based Revision [14.1] 音声認識予測において,不正確な名前付きエンティティを修正するための大言語モデル (LLM) のリビジョン機構を導入する。
提案手法は、名前付きエンティティに対して最大30%の相対的なWER削減を実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:53:48 GMT)
Few-Shot Learner Generalizes Across AI-Generated Image Detection [14.1] フーショット検出器(Few-Shot Detector, FSD)は、未知の偽画像を効果的に識別するための特殊な距離空間を学習するAI生成画像検出器である。
実験の結果、FSDはGenImageデータセットの平均精度をわずか10ドルの追加サンプルで+11.6%以上向上した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:54:03 GMT)
Fast on the Easy, Deep on the Hard: Efficient Reasoning via Powered Length Penalty [13.8] 本研究では,より単純な問題に対して簡潔性を促進することにより,大規模言語モデル(LLM)の効率を向上させることを目的とする。
我々は、報酬関数を分割し、出力長の新しいペナルティを含むことにより、モデルの推論効率を管理する。
提案手法はGSM8K, MATH500, AIME2024という3つのデータセットのベンチマーク評価において顕著な結果を得た。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:49:24 GMT)
OmniSage: Large Scale, Multi-Entity Heterogeneous Graph Representation Learning [13.7] 本稿では,Pinterestのさまざまなアプリケーションに対するユニバーサル表現を学習する大規模表現フレームワークであるOmniSageについて述べる。
OmniSageのトレーニングと推論を支援するために、数十億のノードを持つPinterestグラフをサポートする効率的なインフラストラクチャを開発しました。
OmniSageが生成した普遍的な表現は、Pinterestのユーザエクスペリエンスを著しく向上させ、5つのアプリケーションでサイト全体のリポジトリ(セーブ)がほぼ2.5%増加した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:31:21 GMT)
EXPEREPAIR: Dual-Memory Enhanced LLM-based Repository-Level Program Repair [13.5] ソフトウェア問題を自動的に修復する新しい手法であるExpeRepairを提案する。
2チャンネルの知識蓄積を通じて、歴史的な修復経験から学習する。
Claude 3.7 Sonnetのパス@1スコアは49.3%で、最先端のオープンソースメソッドよりも優れている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:39:27 GMT)
InceptionMamba: An Efficient Hybrid Network with Large Band Convolution and Bottleneck Mamba [13.4] InceptionNeXtは、画像分類と多くの下流タスクにおいて優れた競争力を示している。
InceptionNeXtは、平行1次元のストリップ畳み込みに基づいて構築され、異なる次元に沿って空間的依存関係をキャプチャする限られた能力に悩まされている。
本稿では,これらの制約を克服するために,InceptionMambaと呼ばれる新しいバックボーンアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:35:07 GMT)
CreatiPoster: Towards Editable and Controllable Multi-Layer Graphic Design Generation [13.4] CreatiPosterは、任意の自然言語命令やアセットから編集可能な多層合成を生成するフレームワークである。
さらなる研究のために、我々は10万の多層設計の著作権フリーコーパスをリリースする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:54:39 GMT)
The Optimization Paradox in Clinical AI Multi-Agent Systems [13.2] コンポーネントレベルの最適化とシステム全体のパフォーマンスの関係は、まだよく分かっていない。
この関係をMIMIC-CDMデータセットから2,400症例を用いて検討した。
マルチエージェントシステムは一般にシングルエージェントよりも優れているが、コンポーネント最適化またはベスト・オブ・ブリードシステムは優れたコンポーネントと優れたプロセスメトリクスは診断精度に優れていない(上位マルチエージェントシステムでは67.7%対77.4%)。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:19:49 GMT)
LightKG: Efficient Knowledge-Aware Recommendations with Simplified GNN Architecture [13.1] 自己監視学習(SSL)はスパーティ問題に対処するために組み込まれており、トレーニング時間が長くなっている。
我々は、スパーシリティ問題に対処するために、シンプルながら強力なGNNベースのKGRSであるLightKGを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:56:10 GMT)
MasHost Builds It All: Autonomous Multi-Agent System Directed by Reinforcement Learning [13.1] 大規模言語モデル(LLM)駆動型マルチエージェントシステム(Mas)は、最近、複雑な実世界のタスクに取り組むための強力なパラダイムとして登場した。
既存のMasの構築方法は手作業によるインタラクションメカニズムやルールに依存し、人間のバイアスを導入し、自律的な能力を制限する。
本稿では,自律型およびクエリ型Mas設計のための強化学習ベースのフレームワークMasHostを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:40:49 GMT)
OIBench: Benchmarking Strong Reasoning Models with Olympiad in Informatics [13.0] 本稿では,OIBenchについて紹介する。OIBenchは高品質でプライベートで,250個の厳格なオリジナル問題からなる,オリンピックレベルの情報データセットである。
ベンチマークの構築手法を詳述し、様々なプログラミングパラダイムや複雑さの包括的評価を確実にする。
我々は,よりきめ細かな効率解析のための時間/空間補完曲線を提案し,直接人-モデル比較を可能にする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:33:38 GMT)
ObfusBFA: A Holistic Approach to Safeguarding DNNs from Different Types of Bit-Flip Attacks [13.0] ビットフリップ攻撃(BFA)はディープニューラルネットワーク(DNN)にとって深刻な脅威である
本稿では,BFAを効果的かつ包括的に緩和するObfusBFAを提案する。
臨界ビットを識別し,難読化操作を挿入する新しいアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:31:27 GMT)
Ad Auctions for LLMs via Retrieval Augmented Generation [12.9] 本稿では,大規模言語モデル(LLM)のテキスト出力における広告アロケーションと価格設定のための新しいオークション機構を提案する。
RAGフレームワークに従って,各談話セグメントに対して広告を確率的に検索するセグメントオークションを提案する。
我々は,配分効率と公平性のバランスをとる福祉の新しい概念である対数社会福祉を最大化することを示し,関連するインセンティブに適合する価格設定を特徴付ける。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:45:40 GMT)
Distortion-Aware Brushing for Reliable Cluster Analysis in Multidimensional Projections [12.9] ブラッシングは2Dスパッタプロットにおいて一般的なインタラクション技術であり、ユーザーはさらなる分析やフィルタリングのために連続した囲い領域内でクラスタ化されたポイントを選択することができる。
多次元(MD)データの2次元表現への従来のブラッシングの適用は、MDPによる歪みによる信頼できないクラスタ解析につながる可能性がある。
歪み認識ブラッシング(Distortion-aware brushing)と呼ばれるMDPのための新しいブラッシング手法を提案する。
ユーザがブラッシングを行うと、歪認識ブラッシングはプロジェクション内のポイントを動的に移動させ、MD空間内のブラッシングポイントの近くにデータポイントを引っ張りながら、現在ブラッシングされている点の歪みを補正する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:53:08 GMT)
Near-Optimal Algorithms for Constrained k-Center Clustering with Instance-level Background Knowledge [12.8] 我々は、広く採用されている$k$-centerクラスタリングに基づいて、その入力背景知識を must-link (ML) および cannot-link (CL) 制約セットとしてモデル化する。
制約付き$k$-centerの最初の効率的な近似アルゴリズムに到達します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:17:15 GMT)
Measuring Representational Shifts in Continual Learning: A Linear Transformation Perspective [12.8] 継続的な学習シナリオでは、以前に学んだタスクの破滅的な忘れ忘れが重要な問題である。
本稿では,表現を忘れることに関する最初の理論的分析を行い,この分析を用いて連続学習の振る舞いをよりよく理解する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:21:35 GMT)
CheMatAgent: Enhancing LLMs for Chemistry and Materials Science through Tree-Search Based Tool Learning [12.7] 大規模言語モデル(LLM)は、最近化学タスクにおいて有望な能力を実証した。
本稿では,基本的な情報検索から複雑な反応予測まで,137種類の外部化学ツールを統合したLCMエージェントを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:30:27 GMT)
Semantic Localization Guiding Segment Anything Model For Reference Remote Sensing Image Segmentation [12.7] 我々は,Segment Anything Model(PSLG-SAM)を導くtextitprompt生成セマンティックローカライゼーションというフレームワークを提案する。
PSLG-SAMは、参照リモートセンシングイメージ(RRSIS)タスクを粗いローカライゼーションと細かなセグメンテーションの2つのステージに分解する。
特に、第2段階は、RRSISタスクのアノテーションデータ負担を著しく低減する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:04:07 GMT)
Boosting Adversarial Transferability for Hyperspectral Image Classification Using 3D Structure-invariant Transformation and Intermediate Feature Distance [12.6] ディープニューラルネットワーク(DNN)に基づくハイパースペクトル画像(HSI)分類技術は、敵の攻撃に対して脆弱である。
本稿では,HSI分類モデルの逆例の転送可能性を高めるための新しい手法を提案する。
提案手法は,防衛戦略下においても堅牢な攻撃性能を維持する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:08:52 GMT)
SwiftSpec: Ultra-Low Latency LLM Decoding by Scaling Asynchronous Speculative Decoding [12.5] 本稿では,LLMデコーディングの超低レイテンシを目標とするSwiftSpecを紹介する。
5つのモデルファミリと6つのデータセットで、SwiftSpecは最先端の投機的デコードシステムよりも平均1.75倍のスピードアップを達成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:15:58 GMT)
Time Series Forecasting as Reasoning: A Slow-Thinking Approach with Reinforced LLMs [12.3] Time-R1は、時系列予測のためのLLMの多段階推論能力を高めるために設計された2段階強化微調整フレームワークである。
具体的には、第1段はウォームアップ適応のための教師付き微調整を行い、第2段は強化学習を用いてモデルの一般化能力を向上させる。
実験によると、Time-R1は多様なデータセット間で予測性能を大幅に改善する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:15:50 GMT)
Random Initialization Can't Catch Up: The Advantage of Language Model Transfer for Time Series Forecasting [12.2] 最近の研究は、低データ体制における時系列予測に事前学習言語モデル(LM)を適用することの有効性を実証している。
本研究は,言語モデルから時系列予測への効果的な移行を,様々な設計選択の下で分析することによって,これらの知見を裏付けるものである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:39:38 GMT)
Prompts to Summaries: Zero-Shot Language-Guided Video Summarization [12.2] Prompts-to-Summaries:最初のゼロショット・テキストクエリ可能なビデオ要約器を紹介する。
市販のビデオ言語モデル(VidLMs)のキャプションを、大きな言語モデル(LLMs)によるユーザガイドのスキムに変換する。
我々のパイプラインは、メモリ効率の高いバッチスタイルのVidLMプロンプトスキームにより、リッチなシーンレベルの記述を生成する。
SumMe と TVSum では、我々のデータフリーアプローチは、以前のデータハングリーな教師なし手法を全て上回っている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:23:11 GMT)
Multi-Modal Multi-Task Federated Foundation Models for Next-Generation Extended Reality Systems: Towards Privacy-Preserving Distributed Intelligence in AR/VR/MR [12.1] 我々は,マルチモーダルマルチタスク(M3T)フェデレーション基盤モデル(FedFM)が,XRシステムに変換機能を提供することを想定する。
モデルトレーニングとアグリゲーションのための異なる調整パラダイムを必要とするFedFMのモジュラーアーキテクチャを提案する。
この視点は、次世代のXRシステムにおいて、コンテキスト対応のプライバシ保護インテリジェンスのための技術的および概念的な基礎をグラフ化することを目的としている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:18:38 GMT)
The Automated but Risky Game: Modeling Agent-to-Agent Negotiations and Transactions in Consumer Markets [12.1] 消費者と商店双方がAIエージェントを承認し、交渉と取引を完全に自動化する将来のシナリオについて検討する。
我々の発見によると、AIによる取引は本質的に不均衡なゲームであり、異なるエージェントがユーザーに対して著しく異なる結果をもたらす。
ユーザーはAIエージェントにビジネス上の決定を委譲する際に注意を払わなければならない。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:57:41 GMT)
Collapsing Sequence-Level Data-Policy Coverage via Poisoning Attack in Offline Reinforcement Learning [12.1] 既存の研究は、分散シフトを軽減するためにデータ政治のカバレッジを改善することを目的としているが、不十分なカバレッジからセキュリティリスクを見落としている。
本稿では,範囲を定量化するためにシーケンスレベルの集中係数を導入し,その指数増幅を推定誤差の上限上で明らかにする。
カバー不足の原因となる稀なパターンを同定し, カバー範囲を減らし, 分布シフトを悪化させる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:11:27 GMT)
Time-IMM: A Dataset and Benchmark for Irregular Multimodal Multivariate Time Series [12.1] Time-IMMは、マルチモーダル時系列における原因駆動不規則を捉えるために設計されたデータセットである。
IMM-TSFは不規則なマルチモーダル時系列を予測するためのベンチマークライブラリである。
実験結果から,不規則な時系列データ上でのマルチモーダリティを明示的にモデル化すると,予測性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:07:22 GMT)
The Diffusion Duality [11.8] 一様状態拡散過程は、基礎となるガウス拡散から自然に現れる。
カリキュラム学習で訓練されたモデルは、7つのベンチマークのうち3つでゼロショットパープレキシティで自己回帰モデルを上回る。
本稿では, 連続から離散的な状態への連続蒸留を適応させる離散一致蒸留について述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:55:35 GMT)
Play to Generalize: Learning to Reason Through Game Play [11.8] そこで我々は,MLLMがアーケード的なゲームによってマルチモーダル推論のドメイン外一般化を開発する,新たな学習パラダイムであるVisual Game Learningを提案する。
ルールベースのゲームは、制御可能でスケーラブルなプレテキストタスクとして機能する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:26:24 GMT)
From Replication to Redesign: Exploring Pairwise Comparisons for LLM-Based Peer Review [11.8] 原稿間の相互比較を行うために,LLMエージェントを用いた新しいメカニズムを導入,検討する。
この比較手法は, 従来の評価に基づく手法よりも, 高インパクト論文の同定に優れることを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:27:20 GMT)
Efficiency Robustness of Dynamic Deep Learning Systems [11.7] 動的ディープラーニングシステム(DDLS)は、入力の複雑さに基づいて計算を適応し、オーバーヘッドを低減します。
本稿では,DDLSの効率性を体系的に検討し,効率攻撃の包括的分類を初めて提示する。
我々はDDLSの効率を目標とする敵戦略を分析し、これらのシステムを確保する上で重要な課題を特定する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:49:01 GMT)
Macro Graph of Experts for Billion-Scale Multi-Task Recommendation [11.6] グラフベースのマルチタスク学習は、異なるタスクが異なる10億スケールグラフに対応するため、重要な課題となる。
我々は、マクログラフの埋め込みを利用してタスク固有のマクロ特徴をキャプチャできる最初のアプローチであるマクログラフ・オブ・エキスパート(MGOE)フレームワークを紹介する。
MGOEは大規模に展開され、トップ10億規模のレコメンデーションシステムのホームページのマルチタスク学習に力を入れている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:28:43 GMT)
Prompt-based Depth Pruning of Large Language Models [11.5] 我々はPuDDing(Prompt-routed Dynamic Depth Pruning)と呼ばれる動的深度解析アルゴリズムを開発し、入力プロンプトに基づいてモデルからどのブロックを省略するかを決定する。
コモンセンス推論ベンチマークの実証的な結果から、PuDDingは推論言語モデルを効果的に加速し、静的深さプルーニングベースラインよりもタスク上での性能が向上することが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:56:10 GMT)
Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization [11.5] 我々は、ニューラルネットワークの重みを逐次ラウンドで更新する新しいトレーニング後の量子化アルゴリズムであるQronosを紹介した。
Qronosは、ウェイトとアクティベーションの量子化の両方によるエラーを明示的に修正するだけでなく、以前のレイヤの量子化によるエラーも修正する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:25:14 GMT)
IndoToxic2024: A Demographically-Enriched Dataset of Hate Speech and Toxicity Types for Indonesian Language [11.5] IndoToxic2024はインドネシアのヘイトスピーチおよび毒性分類データセットである。
19の個人によって注釈付けされた43,692のエントリを補完するデータセットは、脆弱なグループをターゲットにしたテキストに焦点を当てている。
我々は、7つの二項分類タスクのベースラインを確立し、憎悪音声分類のために細調整されたBERTモデルを用いてマクロF1スコア0.78を達成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:07:11 GMT)
Skillful joint probabilistic weather forecasting from marginals [11.3] 本稿では,FGNを提案する。FGNはシンプルでスケーラブルでフレキシブルなモデリング手法で,現在の最先端モデルよりも優れている。
位置ごとの予測の連続ランク確率スコア(CRPS)を最小化するために、直接訓練される。
決定論的および確率論的指標によって測定される、最先端のアンサンブル予測を生成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:50:47 GMT)
Uncertainty-Aware Deep Learning for Automated Skin Cancer Classification: A Comprehensive Evaluation [11.3] 本研究では,HAM10000データセットを用いたトランスファーラーニングと不確実性定量化(UQ)を用いた深層学習に基づく皮膚病変分類の包括的評価を行う。
結果は,CLIPベースの視覚変換器,特にSVMを用いたLAION CLIP ViT-H/14が最も高い分類性能を示した。
本研究は, 実際の臨床応用における信頼性と信頼性を高めるために, UQ を DL ベースの診断に組み込むことの重要性を強調した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:29:16 GMT)
RsGCN: Rescaling Enhances Generalization of GCNs for Solving Scalable Traveling Salesman Problems [11.3] 本稿では、スケーラブルなニューラル走行セールスマン問題(TSP)解決のための新しいRescaling Graph Convolutional Network(RsGCN)を提案する。
RsGCNは、(1)隣接ノードを再スケーリングして、各ノードに対する隣接ノード数の均一なサブグラフを構築することにより、機能一般化を強化する。
さらに、RsGCNでは、混合スケールデータセットと双方向ロスによる効率的なトレーニング戦略が使用される。
RsGCN と Re2Opt を併用したアーキテクチャを基礎として,我々の解法は目覚ましい一般化と訓練コストの低減を実現している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:46:14 GMT)
HPCTransCompile: An AI Compiler Generated Dataset for High-Performance CUDA Transpilation and LLM Preliminary Exploration [11.3] ディープラーニングは、モデルパラメータと計算要求の指数関数的な増加を促した。
NVIDIAのエコシステムは、並列ソフトウェア分野において支配的な地位を確立している。
この優位性は、他のハードウェアプラットフォームがパフォーマンスポータビリティを備えたサポートベースのソフトウェアを必要とする。
並列プログラミングのパラダイムとハードウェアの違いにより、コードを他のプラットフォームに翻訳することは大きな課題となる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:48:33 GMT)
BNMusic: Blending Environmental Noises into Personalized Music [11.3] 本稿では,2つの重要なステージを持つパーソナライズド・ミュージック(BNMusic)フレームワークを提案する。
第1段階は、音楽の本質をカプセル化したメル・スペクトログラム表現で完全な楽曲を合成する。
第2段階では、生成した音楽セグメントを適応的に増幅し、さらにノイズ知覚を低減し、ブレンディングの有効性を高める。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:39:08 GMT)
Evaluating Sample Utility for Efficient Data Selection by Mimicking Model Weights [11.2] マルチモーダルモデルは、大規模なWebcrawledデータセットでトレーニングされる。
これらのデータセットは、しばしばノイズ、バイアス、無関係な情報を含む。
Mimic Score を用いた効率的なモデルベースアプローチを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:46:24 GMT)
Towards Large Language Models with Self-Consistent Natural Language Explanations [11.1] 大きな言語モデル(LLM)は、解釈容易なパスを提供するようだ。
しかし、研究によると、これらのポストホックな説明は真の決定過程を誤って表現していることが多い。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:54:59 GMT)
Convert Language Model into a Value-based Strategic Planner [11.1] 感情支援会話(ESC)は、効果的な会話を通じて個人の感情的苦痛を軽減することを目的としている。
状態モデルの観点からダイアグラムを定義するために,straQ* というフレームワークを提案する。
当社のフレームワークでは,ESC中にLCMをブートストラップし,長期的リターンに基づいて最適な戦略を決定し,最終的にLSMの応答を誘導する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:49:53 GMT)
UCD: Unlearning in LLMs via Contrastive Decoding [10.9] コントラストデコーディングを用いた推論時アンラーニングアルゴリズムを提案する。
我々は、TOFUとMUSEの2つのアンラーニングベンチマークに対するアプローチを評価した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:02:26 GMT)
PANDAS: Improving Many-shot Jailbreaking via Positive Affirmation, Negative Demonstration, and Adaptive Sampling [10.9] 多数ショットのジェイルブレイクは、長い入力シーケンスを処理する能力を活用することで、LLMの安全アライメントを回避している。
PANDAS:ポジティヴ・アフォクティベーション(肯定的肯定)や否定的デモレーション(否定的実証)を交互に組み合わせることで、多発的ジェイルブレイクを改善するハイブリッド手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:46:44 GMT)
Diffuse Everything: Multimodal Diffusion Models on Arbitrary State Spaces [10.9] 任意の状態空間上に多モード拡散モデルを構築するための新しいフレームワークを提案する。
各モードに対して革新的な分離ノイズスケジュールを導入することにより、単一モデル内で非条件とモード条件の両方を同時に生成することが可能となる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:40:11 GMT)
Low-Barrier Dataset Collection with Real Human Body for Interactive Per-Garment Virtual Try-On [10.8] 既存の画像ベースの仮想試行法は、しばしばフロントビューに制限され、リアルタイムのパフォーマンスが欠如している。
本研究では,実際の人体を用いた衣服ごとのデータセット収集のための低障壁手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:18:49 GMT)
Q-Ponder: A Unified Training Pipeline for Reasoning-based Visual Quality Assessment [10.7] MLLM(Multimodal large language model)は、解釈可能な評価によって視覚的品質を評価する。
冷間開始段階と強化学習に基づく微調整段階からなる統合された2段階訓練枠組みを提案する。
これら2つの段階から派生したモデルをQ-Ponder-CIとQ-Ponderと呼ぶ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:38:10 GMT)
ReGuidance: A Simple Diffusion Wrapper for Boosting Sample Quality on Hard Inverse Problems [10.7] 簡単なラッパーであるReGuidanceを考案し、トレーニング不要の手法で実現したサンプルリアリズムと報酬の両方を向上する。
我々は,大箱 in-painting や高スケール超解像といったハード逆問題に対するラッパーの評価を行った。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:55:17 GMT)
Glimpse: Generalized Locality for Scalable and Robust CT [10.7] 我々はGlimpseを紹介した。Glimpseは計算トモグラフィーのための局所座標に基づくニューラルネットワークで、ピクセルの近傍に付随する測定のみを処理することによって画素値を再構成する。
Glimpseは、OODサンプル上で成功したCNNよりも大幅に優れ、分散テストデータにおいて同等またはより良いパフォーマンスを実現している。
Glimpseは完全に微分可能で、任意のディープラーニングアーキテクチャでプラグイン・アンド・プレイで使用することができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:06:30 GMT)
Noise Balance and Stationary Distribution of Stochastic Gradient Descent [10.6] 損失関数が再スケーリングパラメータ対称性を含む場合, SGD のミニバッチノイズは, 雑音平衡解に対する解を正則化することを示す。
単純な拡散過程とSGD力学の違いは対称性が存在するときに最も重要であるため、この理論は損失関数対称性がSGDの働きの本質的なプローブとなることを示唆している。
この結果を用いて,任意の深さと幅を持つ対角線ネットワークにおける勾配流の定常分布を導出する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:43:53 GMT)
How much entanglement is needed for quantum error correction? [10.6] 量子誤り訂正符号の論理状態は非常に絡み合わなければならないと一般的に信じられている。
この信念の正当性は,特定の規範と絡み合い尺度の選択に依存することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:34:04 GMT)
Do We Still Need Audio? Rethinking Speaker Diarization with a Text-Based Approach Using Multiple Prediction Models [10.6] 本稿では,対話における文レベルの話者変化検出に着目したテキストベースの手法を用いて,話者ダイアリゼーション(SD)に新たなアプローチを提案する。
SPM(Single Prediction Model)とMPM(Multiple Prediction Model)の2つのモデルが開発され、どちらも話者変化の同定において大幅に改善されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:31:02 GMT)
D-GEN: Automatic Distractor Generation and Evaluation for Reliable Assessment of Generative Model [10.6] D-GENは、オープンエンドデータをMCフォーマットに変換する最初のオープンソースインタプリタジェネレータモデルである。
トラクタの品質を評価するために,ランキングアライメントとエントロピー解析という2つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:57:58 GMT)
CAF-I: A Collaborative Multi-Agent Framework for Enhanced Irony Detection with Large Language Models [10.6] 本稿ではCAF-I(Collaborative Agent Framework for Irony)を紹介する。
CAF-Iはコンテキスト、セマンティック、レトリックの特殊エージェントを使用し、多次元解析を行う。
ベンチマークデータセットの実験は、CAF-Iの最先端のゼロショット性能を確立する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:41:40 GMT)
Unveiling the Role of Randomization in Multiclass Adversarial Classification: Insights from Graph Theory [10.5] マルチクラス分類における攻撃に対するロバスト性向上におけるランダム化の役割について検討する。
決定論的解からランダム化解への切り替えは、最適対逆リスクを著しく減少させる。
これらの知見は,マルチクラス分類における敵攻撃に対する頑健性を高める上で,ランダム化が重要な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:34:52 GMT)
On Many-Shot In-Context Learning for Long-Context Evaluation [10.5] 本稿では,マルチショットICLによる長文言語モデルの評価について検討する。
ICLタスクを共通サンプル学習(SSL)と全サンプル学習(ASL)の2つのグループに分類するメトリクスを開発する。
最先端のモデルではSSLタスクで64kトークンまでパフォーマンスが向上するが、ASLタスクで16kトークンしかなかったため、多くのモデルは大幅なパフォーマンス低下を経験している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:23:53 GMT)
Deep Learning-based Multi Project InP Wafer Simulation for Unsupervised Surface Defect Detection [10.5] 半導体製造における品質管理は、しばしば既知の黄金標準とのテンプレートマッチングに依存している。
本研究は、CADデータからフォトリアリスティックInPウェハ画像のシミュレートを訓練したDeep Neural Networksを用いた合成ゴールデンスタンダードを作成する手法を提案する。
我々は, 合成データとInPウェハ画像の両方を用いて, 様々な訓練目標を評価し, シミュレーション画像の品質を評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:03:10 GMT)
LRSLAM: Low-rank Representation of Signed Distance Fields in Dense Visual SLAM System [10.5] 我々は低ランクテンソル分解法を用いて、LRSLAMと呼ばれるより効率的な視覚SLAMモデルを提案する。
提案手法は,既存の最先端手法よりもコンバージェンス率,メモリ効率,再構築/ローカライゼーション品質を向上する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:55:12 GMT)
Detecting High-Stakes Interactions with Activation Probes [10.4] そこで本論文では,対話が大きな害をもたらす可能性を示唆する「ハイテイク」相互作用を検出するためのアクティベーションプローブについて検討する。
我々は、合成データに基づいて訓練された複数のプローブアーキテクチャを評価し、それらが多種多様な分布外の実世界のデータに対して堅牢な一般化を示すことを発見した。
また,資源を意識した階層型モニタリングシステムの構築の可能性についても検討した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:20:33 GMT)
From Tea Leaves to System Maps: Context-awareness in Monitoring Operational Machine Learning Models [10.2] 本稿では,この領域における様々な種類の文脈情報の特徴と構造を体系的に検討する。
本稿では,これらの知見を合成する概念モデルであるC-SAR(Contextual System-Aspect-Representation)フレームワークを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:49:42 GMT)
SNR and Resource Adaptive Deep JSCC for Distributed IoT Image Classification [10.2] 我々は,IoTデバイスとエッジサーバ間での無線画像分類のための,新しいSNRおよび計算適応型分散CNNフレームワークを提案する。
既存の J SCC ベースの SNR 適応型多層化フレームワークと比較して,SNR が 10dB 以下である場合と比較して,分類精度が10% 向上する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:51:04 GMT)
On Mutation-Guided Unit Test Generation [9.9] MUTGENは変異誘導型LLMベースのテスト生成アプローチである。
これはEvoSuiteとバニラプロンプトベースの戦略の両方で突然変異スコアにおいて著しく優れています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:14:39 GMT)
Think before You Simulate: Symbolic Reasoning to Orchestrate Neural Computation for Counterfactual Question Answering [9.9] 本稿では,反現実的推論のためのニューロシンボリックモデルを強化する手法を提案する。
我々は因果関係を表すために因果グラフの概念を定義する。
提案手法の有効性を2つのベンチマークで検証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:37:11 GMT)
Research Borderlands: Analysing Writing Across Research Cultures [9.9] 我々は、言語に基づく文化規範を発見し、測定するために、人間中心のアプローチを取る。
私たちは1つの文化、研究文化、そして1つのタスクに集中し、研究文化にまたがって文章を適応させます。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:27:14 GMT)
Rethinking Generative Human Video Coding with Implicit Motion Transformation [9.9] 生成ビデオは、高次元信号をコンパクトな特徴表現に進化させることで、有望な圧縮性能を実現することができる。
人間のボディビデオは、より複雑で多様な動きパターンのために、より大きな課題を引き起こす。
本稿では、複雑な人体信号をコンパクトな視覚特徴に特徴付け、これらの特徴を信号再構成のための暗黙の動作誘導に変換することを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:58:18 GMT)
Enhancing Cooperative Multi-Agent Reinforcement Learning with State Modelling and Adversarial Exploration [9.8] 分散部分観測環境における協調学習はマルチエージェント深部強化学習(MARL)に重大な課題をもたらす
本稿では,個々のエージェント観測から状態表現を推定することに着目し,この領域における重要な懸念に対処する。
本稿では,非可観測状態の有意義な信念表現をエージェントが推論する,協調的MARLのための新しい状態モデリングフレームワークを提案する。
SMPEは,MPE,LBF,RWAREベンチマークの複雑な完全協調タスクにおいて,最先端のMARLアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:33:40 GMT)
Lightweight Dataset Pruning without Full Training via Example Difficulty and Prediction Uncertainty [9.7] 早期のトレーニング段階から重要なサンプルを特定するために,難易度と不確実性を考慮した軽量度スコア(DUAL)を導入する。
また, 極端破砕時の破滅的精度低下に対処するために, ベータ分布を用いた比適応サンプリングを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:40:08 GMT)
GenPlanX. Generation of Plans and Execution [9.7] 大規模言語モデル(LLM)は、人間の意図を他の用途で解釈するのに適していることが示されている。
本稿では,計画タスクを自然言語で記述するためのLLMを,古典的なAI計画エンジンと統合するGenPlanXを紹介する。
我々は,GenPlanXがユーザに対して,オフィス関連タスクを支援する上で有効であることを示し,生産性の向上と合理化の可能性を強調した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:02:27 GMT)
TED-LaST: Towards Robust Backdoor Defense Against Adaptive Attacks [9.7] 深部ニューラルネットワーク(DNN)におけるバックドア攻撃検出のための強力なツールとして、トポロジカル進化ダイナミクス(TED)が登場した。
TEDは、ネットワーク層間のトポロジ的表現分布を適応的に歪ませるバックドア攻撃に対して脆弱である。
本稿では,TEDのアダプティブアタックに対する堅牢性を高める新しい防衛戦略であるTED-LaSTを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:12:15 GMT)
GOLIATH: A Decentralized Framework for Data Collection in Intelligent Transportation Systems [9.5] GOLIATHはIn-Vehicle Infotainment (IVI)システム上で動作し、ネットワークの参加者間で交換されたリアルタイム情報を収集する分散フレームワークである。
我々は,コミュニケーションの妨害や無効化を目的とした,現実的な敵の集合に対してレジリエントなコンセンサス機構を設計する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:55:25 GMT)
Did I Faithfully Say What I Thought? Bridging the Gap Between Neural Activity and Self-Explanations in Large Language Models [9.5] LLM(Large Language Models)は、自由テキストの自己自然言語説明(self-NLE)を生成し、その回答を正当化する能力を示した。
本研究は, LLM生成自己NLEの忠実度を定量的に測定する, フレキシブルな枠組みを導入する。
提案するフレームワークは汎用的で,自己NLEとモデル推論の直接的な関係を確立することにより,自己NLEの忠実性に対する深い洞察を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:30:28 GMT)
Surprisal from Larger Transformer-based Language Models Predicts fMRI Data More Poorly [9.5] 近年の研究では,トランスフォーマーモデルによるパープレクシティと,読み出し時間に対する推定値の予測力の正の関係が観察されている。
本研究は,脳画像データに基づいて,3つの言語群にまたがる17の事前学習トランスフォーマーモデルから推定される推定値の予測力を評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:18:48 GMT)
Dynamic Epistemic Friction in Dialogue [9.3] エピステミック・フリクション(epistemic friction)とは、新しい、矛盾する、曖昧な情報に対する信念を更新する際に発生する抵抗である。
我々はこれを動的疫学の枠組みに位置づけ、相互作用の間、摩擦は非自明な信念の再考として現れる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:41:00 GMT)
CapST: Leveraging Capsule Networks and Temporal Attention for Accurate Model Attribution in Deep-fake Videos [9.2] 特定の生成モデルやエンコーダにディープフェイクを加えることは、法医学的な分析に不可欠であり、ソースと調整された対策を可能にする。
本研究では、異なるモデル(DFDM)からのディープフェイクとGANGen-Detectionの2つのデータセットを用いたディープフェイクビデオのモデル属性問題について検討する。
本稿では,Truncated VGG19ネットワークを統合した新しいCapsule-Spatial-Cap(CapST)モデルを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:51:28 GMT)
AutoGEEval++: A Multi-Level and Multi-Geospatial-Modality Automated Evaluation Framework for Large Language Models in Geospatial Code Generation on Google Earth Engine [9.2] 本研究では,Google Earth Engine (GEE) 上で地理空間コードを生成する大規模言語モデル (LLM) の自動評価システムである AutoGEEval++ について述べる。
GEE Python API上に構築されたAutoGEEval++は、ベンチマークデータセットであるAutoGEEval++-Benchを備えており、26のデータタイプに6,365のテストケースと、ユニット、コンボ、テーマテストの3つのタスクカテゴリがある。
AutoGEEval++を用いて、汎用、推論強化、コード中心、地学特化モデルを含む24の最先端LCMを評価した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:42:37 GMT)
Interior-Point Vanishing Problem in Semidefinite Relaxations for Neural Network Verification [9.1] ニューラルネットワーク検証のための有望なアプローチとしてセミデフィニティプログラミング(SDP)緩和が出現している。
深層ネットワークに適用した場合のSDP緩和の限界は,内部点消滅である。
検証問題の実現可能性を高めるための5つの解について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:25:21 GMT)
Towards Holistic Visual Quality Assessment of AI-Generated Videos: A LLM-Based Multi-Dimensional Evaluation Model [8.9] 我々はAIGVの視覚的品質を、技術品質、運動品質、ビデオ意味論の3つの次元に分解する。
様々な視覚・言語タスクにおける大規模言語モデル(LLM)の卓越した性能を考慮すると,LLMを品質回帰モジュールとして導入する。
NTIRE 2025 Quality Assessment of AI-Generated Content Challenge において,提案手法はtextbfsecond を達成した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:43:41 GMT)
SR-Reward: Taking The Path More Traveled [8.8] オフラインでのデモンストレーションから報酬関数を直接学習する新しい手法を提案する。
従来の逆強化学習(IRL)とは異なり,本手法は学習者の方針から報酬関数を分離する。
textitSR-Rewardと呼ばれる我々の報酬関数は、後継表現(SR)を利用して、実証ポリシーと遷移ダイナミクスの下で期待される将来の状態の訪問に基づいて状態をエンコードする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:18:51 GMT)
Experimental Verification of Entangled States in the Adversarial Scenario [8.8] 我々は、量子乱数生成器によって制御される高速な準備・測定装置を構築した。
実験の結果, 標準QSVプロトコルは, 非IIDシナリオにおいて信頼性の低い不確実性証明をしばしば提供することがわかった。
対照的に、同質な戦略に基づく防御的QSVプロトコルは、信頼性が高くほぼ厳密な忠実性証明を提供することができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:45:21 GMT)
Diffusion Models in Recommendation Systems: A Survey [8.7] 拡散モデルを用いたレコメンデータシステムに分類法を提案し,提案する。
既存の調査を補完するレコメンデータシステムにおける拡散モデルに対するユニークな視点を提供する。
本稿では,拡散モデルの基本アルゴリズムとそのレコメンデーションシステムへの応用について述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:01:38 GMT)
Hamiltonian Learning via Inverse Physics-Informed Neural Networks [8.7] Hamiltonian Learning (HL)は、システムパラメータと基礎となるダイナミクスの正確な推定を可能にする。
機械学習手法に直接シュリンガー方程式を組み込むアプローチとして,ハミルトニアン学習のためのテキスト逆物理情報ニューラルネットワーク(iPINN-HL)を提案する。
我々は,iPINN-HLをディープ・ニューラル・ネットワークベースの量子状態トモグラフィー法(DNN-HL)と比較し,その有効性を実証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:09:41 GMT)
Decision Making under the Exponential Family: Distributionally Robust Optimisation with Bayesian Ambiguity Sets [8.6] ベイズアンビグニティセット(DRO-BAS)を用いた分布ロバスト最適化について紹介する。
DRO-BASは、後部インフォームド曖昧性セットよりも最悪のケースリスクを最適化することで、モデルの不確実性に対してヘッジを行う。
我々の定式化は既存のベイズDROよりも優れており、Portfolio問題に匹敵する堅牢性を持つ高速な解時間を実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:49:57 GMT)
SelectLLM: Query-Aware Efficient Selection Algorithm for Large Language Models [8.6] 大規模言語モデル(LLM)は、様々なアプリケーションにまたがる顕著な性能のために広く採用されている。
これらの個々のLCMは、固有のトレーニングバイアス、モデルサイズ制約、トレーニング前のデータセットの品質や多様性による、複雑なタスクの一般化とパフォーマンスの制限を示す。
本稿では,入力クエリをLLMの最も適切なサブセットに効率的に誘導するSelectLLMを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:33:52 GMT)
TeleMath: A Benchmark for Large Language Models in Telecom Mathematical Problem Solving [8.5] 数学的な問題を解く際に,LLM(Large Language Models)の性能を評価するために設計された,最初のベンチマークデータセットであるTeleMathを紹介する。
本稿では,提案するQnAs生成パイプラインについて概説する。
評価の結果、TeleMathの最良の性能は、数学的または論理的推論のために明示的に設計された最近のモデルによって達成されていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:04:18 GMT)
DanceChat: Large Language Model-Guided Music-to-Dance Generation [8.5] 音楽からダンスへの生成は、音楽入力に基づく人間のダンスの動きを合成することを目的としている。
本研究では,Large Language Model (LLM) を用いた音楽間距離生成手法であるDanceChatを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:03:47 GMT)
LLMs Are Not Yet Ready for Deepfake Image Detection [8.4] 視覚言語モデル(VLM)は、様々な領域にまたがる有望なツールとして登場した。
本研究は, ファスワップ, 再現, 合成生成の3つの主要なディープフェイクタイプに焦点を当てた。
解析の結果、VLMはコヒーレントな説明を生成でき、表面レベルの異常を検出できるが、スタンドアロン検出システムとしてはまだ信頼できないことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:27:24 GMT)
Size-adaptive Hypothesis Testing for Fairness [8.3] 我々は、公正性評価を証拠に基づく統計的決定に変換する統一的、サイズ適応的、仮説テストフレームワークを導入する。
統計的パリティ差に対して中央限の結果が証明され、解析的信頼区間と、タイプI(偽陽性)エラーがレベル$alpha$で保証されるウォルド試験が導かれる。
小さな交叉群の長い尾に対して、完全ベイズ的ディリクレ・マルチノミカル推定器を導出する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:22:09 GMT)
Towards Robust Multimodal Emotion Recognition under Missing Modalities and Distribution Shifts [8.3] 本稿では,モダリティの欠如とOF-Distribution(OOD)データの両方を同時に扱うための新しいフレームワークを提案する。
CIDerはMSSD(Model-Specific Self-Distillation)モジュールとMACI(Model-Agnostic Causal Inference)モジュールという2つの重要なコンポーネントを統合している。
実験の結果、CIDerはRMFMとOODの両方のシナリオでロバストな性能を示し、パラメータは少なく、最先端の手法に比べて訓練が速い。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:58:17 GMT)
Observation of High-Order Quantum Pancharatnam-Berry Phase with Structured Photons [8.2] 単一光子状態とN00N状態の高次PB相の相違について実験的に検討した。
以上の結果から, PB相は動的相と同様に2光子状態下でも二重化可能であることがわかった。
これは量子精度の測定と量子状態工学にいくつかの意味を持つ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:43:06 GMT)
AC/DC: LLM-based Audio Comprehension via Dialogue Continuation [8.2] 大規模言語モデル(LLM)の対話継続機能を活用した命令追従型音声理解モデルを提案する。
提案モデルは,音声キャプションデータセットのみにトレーニングされたマルチタスク命令チューニングを伴わないゼロショット命令追従機能を実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:48:47 GMT)
PromptTSS: A Prompting-Based Approach for Interactive Multi-Granularity Time Series Segmentation [8.2] PromptTSS(PromptTSS)は,複数粒度状態を持つ時系列セグメンテーションのための新しいフレームワークである。
PromptTSSは、ラベルと境界情報を利用してセグメンテーションをガイドするプロンプト機構を備えた統一モデルを使用する。
実験の結果、PromptTSSの精度は多粒度セグメンテーションで24.49%、単一粒度セグメンテーションで17.88%、転送学習で599.24%向上した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:45:29 GMT)
Beyond Gold Standards: Epistemic Ensemble of LLM Judges for Formal Mathematical Reasoning [8.1] 自動形式化タスクを評価するための,体系的かつ自動的な手法を提案する。
提案手法は,論理的保存(LP),数学的整合性(MC),形式的妥当性(FV),形式的品質(FQ)を基準とした審査員のアンサンブルに基づく。
全体としては,LLM審査員のEFGアンサンブルが評価に好適であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:09:51 GMT)
An HCAI Methodological Framework (HCAI-MF): Putting It Into Action to Enable Human-Centered AI [8.1] 人間中心人工知能(Human-centered AI, HCAI)は、AIシステムの設計、開発、展開、使用において人間を優先する設計哲学である。
文学の隆盛にもかかわらず、その実践のための方法論的指導の欠如はHCAIの実践に課題をもたらしている。
本稿では,5つの主要コンポーネントからなる総合HCAI方法論フレームワーク(HCAI-MF)を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:50:03 GMT)
Quantum random access memory with transmon-controlled phonon routing [8.1] 量子ランダムアクセスメモリ(QRAM)は、複数のメモリ位置における同時データクエリを約束する。
トランスモン制御されたフォノンルータを導入し、木のようなアーキテクチャでこれらのルータを接続することでQRAMの実装を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:06:56 GMT)
LEMIX: Enabling Testing of Embedded Applications as Linux Applications (Extended Report) [8.1] LEMIXは、ハードウェア依存から切り離されたx86 Linuxアプリケーションとして再ホストすることで、組み込みアプリケーションの動的解析を可能にするフレームワークである。
組込みアプリケーションをLinuxアプリケーションに変換する際の課題に対処する様々な技術を開発した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:21:22 GMT)
BioClinical ModernBERT: A State-of-the-Art Long-Context Encoder for Biomedical and Clinical NLP [8.1] 我々は、最近のModernBERTリリースに基づいて構築されたドメインコンテキストエンコーダであるBioClinical ModernBERTを紹介する。
BioClinical ModernBERTは、これまでで最大のバイオメディカルおよび臨床コーパスのトレーニングを継続して開発されている。
我々は、BioClinical ModernBERTのベース(150Mパラメータ)および大型(396Mパラメータ)バージョンと、さらなる研究を支援するためのトレーニングチェックポイントをリリースする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:01:11 GMT)
Engagement-Driven Content Generation with Large Language Models [8.0] 大規模言語モデル(LLM)は1対1の相互作用において重要な説得力を示す。
相互接続されたユーザーと複雑な意見のダイナミクスがユニークな課題を引き起こすソーシャルネットワークにおける彼らの影響力は、いまだ過小評価されている。
本稿では,emphCan LLMがソーシャルネットワーク上でユーザエンゲージメントを最大化する有意義なコンテンツを生成するかという研究課題に対処する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:28:48 GMT)
Non-perturbative Quantum Dynamics on Embedded Submanifolds: From Geometric Mass to Higgs Potentials [8.0] 高次元空間に埋め込まれた曲面部分多様体に対する量子力学の枠組みを確立する。
我々は、制約量子化における非摂動的幾何学的相互作用-解決のあいまいさを取り入れた最初の完全シュル・オーディンガー方程式とクライン=ゴルドン方程式を導出した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:01:42 GMT)
Distributionally-Constrained Adversaries in Online Learning [7.9] より汎用的で柔軟な分布制約のある敵の枠組みを考察し、敵が選択した分布からインスタンスを抽出する。
本稿では,この文脈で学習可能な分布クラスの特性について述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:11:10 GMT)
Sailing by the Stars: A Survey on Reward Models and Learning Strategies for Learning from Rewards [7.8] 大規模言語モデル(LLM)の最近の発展は、事前学習のスケーリングから後学習のスケーリングへと移行している。
これらの開発全体において、重要な統一パラダイムが生まれている。
我々は、報酬モデルと学習戦略の観点から、トレーニング、推論、後推論の段階にわたって、報酬からの学習を包括的に概観する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:39:09 GMT)
Rethinking Losses for Diffusion Bridge Samplers [7.6] 拡散ブリッジは、正規化されていない分布からサンプリングする深層学習法として有望なクラスである。
最近の研究によると、ログ分散(LV)損失は、逆のKullback-Leibler(rKL)損失よりも一貫して優れていた。
ログデリバティブ・トリック(rKL-LD)を用いたrKL損失は,概念的問題を回避するだけでなく,LV損失を一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:58 GMT)
Beyond Single-User Dialogue: Assessing Multi-User Dialogue State Tracking Capabilities of Large Language Models [7.6] 大言語モデル(LLM)は、ゼロショット対話状態追跡(DST)において顕著な性能を示した。
本研究では,データセット構築コストを最小化しつつ,マルチユーザDSTにおけるLCMのロバスト性を評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:04:19 GMT)
Symmetrical Flow Matching: Unified Image Generation, Segmentation, and Classification with Score-Based Generative Models [7.6] Flow Matchingは、分散間の継続的な変換を学ぶための強力なフレームワークとして登場した。
この研究は、セマンティックセグメンテーション、分類、画像生成を単一のモデルで統一する新しい定式化であるSymmetrical Flow Matchingを導入している。
CelebAMask-HQでは1.9点、COCO-Stuffでは7.0点、推論ステップは25点である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:19:28 GMT)
FSATFusion: Frequency-Spatial Attention Transformer for Infrared and Visible Image Fusion [7.5] 本稿では、FSATFusion(FSATFusion)と呼ばれるエンドツーエンドの核融合ネットワークを提案する。
FSATFusionには周波数空間アテンショントランスフォーマー(FSAT)モジュールが含まれており、ソース画像から識別された特徴を効果的に捉えている。
定性的および定量的比較実験を行い, FSATFusionの核融合特性と効率性を実証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:42:38 GMT)
Conformal Safety Shielding for Imperfect-Perception Agents [7.5] 学習成分を不完全な知覚に用いた自律エージェントにおける安全制御の問題点を考察する。
本研究では,認識誤差下でのランタイム安全保証を実現するシールド構造を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:37:29 GMT)
Not One to Rule Them All: Mining Meaningful Code Review Orders From GitHub [7.5] 本研究では、プルリクエストで送信された変更についてコメントしながら、開発者がフォローする異なるナビゲーション命令について検討する。
私たちは、GitHub上の人気のあるJavaとPythonリポジトリ100のプルリクエスト23,241件のコードレビューコメントをマイニングしました。
分析の結果,プルリクエストの44.6%において,レビュアーは非失語順でコメントした。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:44:43 GMT)
Identifying Reliable Evaluation Metrics for Scientific Text Revision [7.5] ROUGEやBERTScoreといった従来のメトリクスは主に、意味のある改善を捉えるのではなく、類似性に重点を置いている。
まず手動による注釈研究を行い、異なる修正の質を評価する。
そこで本研究では,NLPドメインの参照不要評価指標について検討する。
LLM-as-a-judge評価とタスク固有のメトリクスを組み合わせたハイブリッドアプローチが,最も信頼性の高いリビジョン品質評価を提供することがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:29:07 GMT)
Towards Understanding Bugs in Distributed Training and Inference Frameworks for Large Language Models [7.5] 本稿では,DeepSpeed,Megatron-LM,Colossal-AIの3つの分散トレーニング/推論フレームワークを対象に,308の固定バグの大規模解析を行った。
本研究は, バグ症状, 根本原因, バグの特定と修正の取り組み, および, 一般的な低ストレス修正戦略について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:24:59 GMT)
CAT: A Conditional Adaptation Tailor for Efficient and Effective Instance-Specific Pansharpening on Real-World Data [7.5] 本稿では、特定の入力インスタンスに適応し、トレーニングと推論の両方を短時間で完了する効率的なフレームワークを提案する。
本手法は,512times512$イメージのトレーニングと推論の両方を,textit0.4 seconds$で実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:48:43 GMT)
Incentivizing Quality Text Generation via Statistical Contracts [7.3] 品質をインセンティブ化するための,パフォーマンス向上のための契約ベースのフレームワークを提案する。
エージェントがコストのかかる推論を用いてテキストを生成するプリンシパルエージェントゲームについて検討する。
コストロスの契約は、コストを意識した契約に比べて、客観的価値の限界的な増加を犠牲にしています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:59:58 GMT)
An Empirical Evaluation of Pre-trained Large Language Models for Repairing Declarative Formal Specifications [7.3] 本稿では,大規模言語モデル(LLM)がアロイの宣言的仕様を修復する能力について,体系的に検討する。
単エージェントと二エージェントのパラダイムを含む12の異なる修復設定を設計し,LLMを多用した。
自動プロンプティング機能を備えたデュアルエージェントは,イテレーション数やトークン使用量の増加とともに,他の設定よりも優れていた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:28:03 GMT)
The Esethu Framework: Reimagining Sustainable Dataset Governance and Curation for Low-Resource Languages [7.3] 本稿では,Esethu Framework and Licenseの下で開発されたオープンソースのコーパスであるVuk'uzenzele isiXhosa Speech dataset (ViXSD)を紹介する。
このデータセットには、人口統計や言語メタデータに富んだ、ネイティブのisiXhosa話者からの読み上げ音声が含まれており、コミュニティ主導のライセンスとキュレーションの原則が、自動音声認識におけるリソースギャップをいかに埋めるかを示している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:10:45 GMT)
Invocable APIs derived from NL2SQL datasets for LLM Tool-Calling Evaluation [7.3] 大規模言語モデル(LLM)はエージェントシステムとして定期的にデプロイされ、タスクを達成するためにライブ環境と対話するツールにアクセスする。
このような特徴を持つデータセットを作成するために,既存のNL2データセットを使用してNL2APIデータセットを自動的に作成する方法を検討する。
私たちはこのパイプラインを、最大のNL2データセットであるBIRDに適用して、2500以上のAPIのコレクションを作成します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:17:52 GMT)
Entanglement and entropy uncertainty in black hole quantum atmosphere [7.1] 量子絡み合いの力学を研究し、その特性が事象の地平線を超えたホーキング量子放射と密接な相関があることを見出した。
我々の観測は、ブラックホール情報パラドックスとブラックホール熱力学を理解するための新しい視点を与えることができると考えられている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:17:27 GMT)
LogiPlan: A Structured Benchmark for Logical Planning and Relational Reasoning in LLMs [7.0] LogiPlanは、大規模言語モデル(LLM)の論理的計画と複雑なリレーショナル構造に対する推論能力を評価するために設計されたベンチマークである。
我々はDeepSeek R1, Gemini 2.0 Pro, Gemini 2 Flash Thinking, GPT-4.5, GPT-4o, Llama 3.1 405B, O3-mini, O1, Claude 3.7 Sonnetを3つのタスクで評価した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:47:02 GMT)
From IOCs to Group Profiles: On the Specificity of Threat Group Behaviors in CTI Knowledge Bases [7.0] 我々は、MITRE ATT&CKとMalpediaの2つのオープンサイバー脅威情報知識ベースから構築された脅威グループプロファイルを分析する。
ATT&CKの脅威グループのうち、グループ固有の技術を持っているのはわずか34%である。
脅威グループで使用されるソフトウェアはより独特であることが証明されており、ATT&CKグループの73%がグループ固有のソフトウェアを使用している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:33:55 GMT)
ContextRefine-CLIP for EPIC-KITCHENS-100 Multi-Instance Retrieval Challenge 2025 [6.9] 本稿では,視覚的マルチインスタンス検索タスクの効率的なモデルであるContextRefine-CLIPを提案する。
このアプローチは,マルチエンコーダAVIONに基づいて,モーダルなアテンションフローモジュールを導入する。
コードはhttps://github.com/delCayr/ContextRefine-Clip.comでオープンソース化される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:17:30 GMT)
Underage Detection through a Multi-Task and MultiAge Approach for Screening Minors in Unconstrained Imagery [6.9] 凍結したFaRLビジョンバックボーンをベースとしたマルチタスクアーキテクチャを提案する。
視力の低下と年齢差を伴って, 全体の清潔化を訓練した。
F2スコアが0.801から0.857から1%の偽エラー率で18以下で検出された。
アンダー-12タスクとアンダー-15タスクでは、F2の各ブースターは0.666から0.955、それぞれ0.689から0.916である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:36:27 GMT)
Free Record-Level Privacy Risk Evaluation Through Artifact-Based Methods [6.9] メンバーシップ推論攻撃(MIA)は機械学習モデルにおけるプライバシリスクを評価するために広く利用されている。
最先端の手法では、ターゲットモデルと同じアーキテクチャで数百のシャドウモデルをトレーニングする必要があります。
そこで本研究では,トレーニングプロセス中に自然に入手可能なアーティファクトを解析することにより,メンバシップ推論攻撃に最も脆弱なトレーニングサンプルを同定する手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:15:21 GMT)
Accelerating Causal Network Discovery of Alzheimer Disease Biomarkers via Scientific Literature-based Retrieval Augmented Generation [6.8] アルツハイマー病(AD)の診断は、早期発見、正確な疾患のステージング、標的治療、疾患進行のモニタリングの改善を可能にする。
これらの因果関係を理解することは複雑であり、広範な研究が必要である。
検索強化世代(RAG)を利用した先進的な大規模言語モデル(LLM)は、バイオマーカーの因果ネットワークの構築を支援し、さらなる医学的分析に役立つだろうか?
我々は過去25年間に発行されたAD関連研究論文200点を収集し,RAGと科学文献を統合してADバイオマーカーを抽出し,それらの因果関係を生成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:56:30 GMT)
Collective Bargaining in the Information Economy Can Address AI-Driven Power Concentration [6.8] このポジションペーパーは、AIシステムに入る情報のために市場を再構築する必要があると論じている。
市場調整の強化や主要情報提供者の側での集団交渉がなければ、AIは大規模な"情報市場失敗"をさらに悪化させるだろう、と私たちは主張する。
私たちは、この目標を達成するために連立ベースのアプローチをサポートするために取るべき具体的な行動を提供します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:29:07 GMT)
Complexity of normalized stochastic first-order methods with momentum under heavy-tailed noise [6.7] 制約のない最適化問題に対して,実用的な正規化一階法を提案する。
私たちの複雑性は、文献の最もよく知られた結果を改善するか、一致させるかのどちらかです。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:21:15 GMT)
FrugalNeRF: Fast Convergence for Extreme Few-shot Novel View Synthesis without Learned Priors [6.7] FrugalNeRFは,複数スケールにわたる重み共有ボクセルを利用してシーンの詳細を効率よく表現する,数発のNeRFフレームワークである。
我々の重要な貢献は、スケールをまたいだ再射誤差に基づいて擬似基底真理深さを選択する、クロススケールな幾何適応スキームである。
LLFF、DTU、RealEstate-10Kの実験では、FrugalNeRFは他の数発のNeRF法よりも優れ、トレーニング時間を大幅に短縮した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:02:26 GMT)
Revisiting Main Memory-Based Covert and Side Channel Attacks in the Context of Processing-in-Memory [6.7] IMPACTは、プロセッサ・イン・メモリ(PiM)アーキテクチャの特徴を利用する主要なメモリベースのタイミング攻撃のセットである。
異なるPiMアプローチを利用する2つの隠蔽チャネルを構築します。
我々の秘密チャネルは、それぞれ8.2 Mb/sと14.8 Mb/sの通信スループットを達成しており、これは最先端のメインメモリベースの秘密チャネルよりも3.6倍と6.5倍高い。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:38:42 GMT)
Collaborative Min-Max Regret in Grouped Multi-Armed Bandits [6.7] グループ化環境での多腕バンディットにおける共有探索の効果について検討した。
グループ間の探索を動的にコーディネートするアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:56:35 GMT)
Reasoning RAG via System 1 or System 2: A Survey on Reasoning Agentic Retrieval-Augmented Generation for Industry Challenges [6.6] Retrieval-Augmented Generation (RAG) は、大規模言語モデルの知識制限を克服する強力なフレームワークとして登場した。
これらの課題に対処するため、フィールドは推論エージェントRAG(Reasoning Agentic RAG)へと移行した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:01:56 GMT)
AI-Based Software Vulnerability Detection: A Systematic Literature Review [6.6] 本研究は,2018年から2023年までのソフトウェア脆弱性検出(SVD)研究の系統的なレビューを行う。
我々の分析によると、研究の91%がAIベースの手法を使用しており、グラフベースのモデルが最も普及している。
データセットの品質、解釈可能性など、重要な制限を特定し、未探索のテクニックにおける新たな機会を強調します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:42:38 GMT)
Quantum secret sharing in a triangular superconducting quantum network [6.6] 三角トポロジーを用いた3ノードの量子通信実験を行い,長さ1.3メートルの伝送路で形成される三角形の両側について述べる。
我々は,2つのノード間の状態伝達と絡み合いの生成を実証し,真の多部絡み合いGHZ状態を生成し,古典情報の量子秘密共有(QSS)を実装した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:44:28 GMT)
A User's Guide to Sampling Strategies for Sliced Optimal Transport [6.5] 本稿では,スライスされた最適輸送のための戦略をサンプリングするためのユーザガイドとして機能する。
本稿では, 建設方法, 生成時間の複雑さ, 理論的保証, および各戦略の条件について詳述する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:30:16 GMT)
Pretraining Generative Flow Networks with Inexpensive Rewards for Molecular Graph Generation [6.5] A-GFN(Atomic GFlowNets)は、個々の原子をビルディングブロックとして活用し、薬物のような化学空間をより包括的に探索する生成モデルである。
医薬品のような分子データセットを用いた教師なし事前学習手法を提案し,A-GFNに安価で情報伝達性の高い分子記述子について教える。
本研究では、ZINCデータセットのサブセット上でA-GFNを事前訓練し、ロバストな評価指標を用いてアプローチの有効性を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:09:09 GMT)
Explicit C*-algebraic Protocol for Exact Universal Embezzlement of Entanglement [6.5] 量子情報のC*代数モデルにおいて,普遍的な埋め込みプロトコルを明示的に構築する。
私たちのアプローチは正確かつ状態に依存しません。
これは無限次元の設定における普遍エンタングルメントエンベジメントに対する概念的に直感的なモデルを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:26:11 GMT)
iQUEST: An Iterative Question-Guided Framework for Knowledge Base Question Answering [6.5] iQUESTは、複雑なクエリを単純なサブクエリに繰り返し分解する質問誘導KBQAフレームワークである。
グラフニューラルネットワーク(GNN)を統合して、各推論ステップに2ホップ隣の情報を組み込む。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:48:15 GMT)
Investigating the Relationship Between Physical Activity and Tailored Behavior Change Messaging: Connecting Contextual Bandit with Large Language Models [6.4] 本稿では,介入型を選択するためのcMABと,メッセージ内容のパーソナライズのための大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを提案する。
身体活動のモチベーションを高めることを目的としたモチベーションメッセージとして,行動自己監視,ゲインフレーム,ロスフレーム,社会的比較の4種類の介入タイプを評価した。
メッセージコンテンツはさらに、自己効力の日々の変動、社会的影響、規制の焦点など、動的なコンテキスト要因を用いてパーソナライズされる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:37:38 GMT)
Assessing the Resilience of Automotive Intrusion Detection Systems to Adversarial Manipulation [6.3] 敵攻撃、特に回避攻撃は、IDSによるバイパス検出のための入力を操作することができる。
ホワイトボックス(システム知識の完全な攻撃者)、グレイボックス(部分システム知識)、より現実的なブラックボックスの3つのシナリオを検討します。
2つの公開データセットに対する最先端IDSに対する攻撃の有効性を評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:06:05 GMT)
Sheet Music Benchmark: Standardized Optical Music Recognition Evaluation [6.3] Sheet Music Benchmark (SMB) は、光学音楽認識(OMR)研究のベンチマーク用に特別に設計された600ページと805ページのデータセットである。
OMR正規化編集距離(OMR-NED)は、OMRの性能を評価するために明示的に調整された新しい指標である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:42:19 GMT)
A Study on Individual Spatiotemporal Activity Generation Method Using MCP-Enhanced Chain-of-Thought Large Language Models [6.3] 本稿では,モデルコンテキストプロトコル(MCP)に連鎖思考(LLT)推論を統合するフレームワークを提案する。
この手法は、5段階の認知フレームワークを通じて、人間のような進歩的推論と、6つの専門的なMPPツールカテゴリによる包括的なデータ処理を組み合わせる。
上海のLujiiazu地区での実験では、1,000個のサンプルでこのフレームワークの有効性が検証されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:14:32 GMT)
MARTSIA: A Tool for Confidential Data Exchange via Public Blockchain [6.3] 相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ
MARTSIAは、ユーザ定義ポリシーと認証宣言属性を組み合わせることで、メッセージ部分レベルでの詳細な読み取りアクセス制御を提供する。
このアーキテクチャは、パブリックブロックチェーン固有の透明性と、機密性の高いアプリケーションに必要なプライバシとを効果的にバランスさせる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:16:41 GMT)
Research on Audio-Visual Quality Assessment Dataset and Method for User-Generated Omnidirectional Video [6.1] 我々は全方向オーディオ・ビデオ(A/V)コンテンツのデータセットを構築した。
データセット上で主観的なAVQA実験を行い、平均オピニオンスコアを得る。
提案したデータセットに基づいて有効なAVQAベースラインモデルを構築する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:40:30 GMT)
M-MRE: Extending the Mutual Reinforcement Effect to Multimodal Information Extraction [6.1] MRE(Multual Reinforcement Effect)は、情報抽出とモデル解釈可能性の交差する新興サブフィールドである。
我々は、Multimodal Mutual Reinforcement Effect (M-MRE)という新しいタスクを導入し、このタスクをサポートするための対応するデータセットを構築する。
実験により、MREはマルチモーダルテキストイメージ理解のシナリオであるM-MREタスクでも観察可能であることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:18:20 GMT)
Geometric Jensen-Shannon Divergence Between Gaussian Measures On Hilbert Space [6.0] この研究は、無限次元ヒルベルト空間上のガウス測度の設定において、確率測度の幾何学的平均の概念に基づいて幾何学的ジェンセン=シャノン発散を研究する。
有限次元版を直接一般化するこの発散に対する閉形式表現を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:53:16 GMT)
Ground Reaction Force Estimation via Time-aware Knowledge Distillation [6.0] 地上反応力(GRF)は、移動中に身体が地面とどのように相互作用するかに関する重要な情報を提供する。
計器式トレッドミルは歩行中にGRFを測定するための金の標準として広く使用されている。
インソールセンサデータからGRF推定を行うための時間認識知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:19:02 GMT)
Collaborative Prediction: To Join or To Disjoin Datasets [6.0] 人口減少を最小限に抑えるために適切なデータセットを選択する実用的なアルゴリズムを開発することの課題について検討する。
オラクルの不等式とデータ駆動推定器を活用することにより、アルゴリズムは高い確率で人口減少を低減する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:25:07 GMT)
Beyond the Battlefield: Framing Analysis of Media Coverage in Conflict Reporting [6.0] イスラエル・パレスチナ戦争に関する報道記事のコーパスで、戦争と平和ジャーナリズムの指標を特定します。
我々の分析は、平和に基づくよりも戦争に基づく報告に焦点を当てていることを示している。
また、米国、英国、中東の報道機関で、この紛争の犯人や被害者が誰なのかを調査している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:20:54 GMT)
seg2med: a bridge from artificial anatomy to multimodal medical images [5.9] seg2medは解剖学駆動型マルチモーダル医用画像合成のためのフレームワークである。
解剖学的マップは、実際の患者データ、XCATデジタルファントム、および複数の患者の臓器を組み合わせた合成解剖の3つの源から独立に派生している。
このフレームワークは、実データと比較して、CTで0.94、MRで0.89、CTで0.78のSSIMを実現する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:39:43 GMT)
MF2Summ: Multimodal Fusion for Video Summarization with Temporal Alignment [5.9] 本稿では,マルチモーダルコンテンツ理解に基づく新しい映像要約モデルであるMF2Summを紹介する。
MF2Summは、特徴抽出、モーダル間アテンション相互作用、特徴融合、セグメント予測、キーショット選択という5段階のプロセスを採用している。
SumMeおよびTVSumデータセットの実験結果から,MF2Summが競合性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:32:51 GMT)
TimberStrike: Dataset Reconstruction Attack Revealing Privacy Leakage in Federated Tree-Based Systems [5.9] 我々はTimberStrikeを紹介した。TimberStrikeは、水平結合木モデルをターゲットにした最適化ベースのデータセット再構成攻撃である。
我々の攻撃は、他のクライアントからのセンシティブなトレーニングデータを推測するために、分割値と決定経路を用いて決定木の離散的な性質を利用する。
本研究は,木系フェデレート学習システムに特化して設計されたプライバシ保護機構の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:48:26 GMT)
Analyzing the relationships between pretraining language, phonetic, tonal, and speaker information in self-supervised speech models [5.9] 我々は4つの異なる言語でトレーニングされたwav2vec2モデルが、言語マッチングと非マッチング言語の両方をエンコードしているかを示す。
以上の結果から,wav2vec2で学習した表現の構造は,事前訓練で使用する音声素材と大きく異なることが示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:16:38 GMT)
An energy-efficient learning solution for the Agile Earth Observation Satellite Scheduling Problem [5.9] Agile Earth Observation Satellite Scheduling Problem (AEOSSP) は、衛星の軌道に沿って計画される観測対象のサブセットを見つけることである。
本稿では,AEOSSPの時間依存的利益に対処するためのDep Reinforcement Learning (DRL)アプローチを提案する。
その結果,提案アルゴリズムは品質要件を満たすことができない画像のキャプチャを60%以上削減し,その結果,姿勢操作によるエネルギー浪費を最大78%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:00:53 GMT)
RealKeyMorph: Keypoints in Real-world Coordinates for Resolution-agnostic Image Registration [5.9] RealKeyMorph (RKM) は画像登録の解像度に依存しない方法である。
RKMは、登録フレームワークであるKeyMorphの拡張である。
腹部MRIの2次元スタックの登録作業におけるRKMの利点と脳データセットの解像度の異なる3次元ボリュームについて述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:40:32 GMT)
AdaptiveLLM: A Framework for Selecting Optimal Cost-Efficient LLM for Code-Generation Based on CoT Length [5.9] 本稿では,タスクの難易度を自動的に評価することにより,与えられたコーディングタスクに対して最適な大言語モデル(LLM)を動的に選択するフレームワークであるAdaptiveLLMを紹介する。
筆者らのフレームワークはまず,推論モデルから生成したChain-of-Thought長を用いてタスクの難易度を推定し,これらをk平均で3つの難易度にクラスタ化し,難易度を考慮したCodeBERTを組み込む。
我々のフレームワークは、pass@1スコアを7.86%改善し、ベースラインメソッドである ComplexityNet と比較して、リソース消費を88.9%削減します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:43:48 GMT)
Enhancing Deepfake Detection using SE Block Attention with CNN [5.7] 本稿では,Deepfake検出のための圧縮・励起ブロックアテンション(SE)を備えた軽量畳み込みニューラルネットワーク(CNN)を提案する。
このモデルは全体の分類精度94.14%、AUC-ROCスコア0.985をStyle GANデータセットで達成した。
提案手法は,最小限の計算資源でDeepfakeチャレンジと戦うための有望な道を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:29:26 GMT)
Driven-dissipative quantum battery with nonequilibrium reservoirs [5.7] 外部駆動と消散の両方の下で量子電池システムについて検討する。
非平衡のシナリオでは、補償機構によって量子電池の充電効率と電力の両方を最適化することができる。
本研究は,量子デバイスの性能を常に向上させるという一般的な仮定に挑戦する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:42:11 GMT)
A Crack in the Bark: Leveraging Public Knowledge to Remove Tree-Ring Watermarks [5.7] 本稿では拡散モデルの透かし技術であるツリーリングに対する新たな攻撃を提案する。
我々の攻撃は、ターゲット拡散モデルのトレーニングに使用された変分オートエンコーダへのアクセスのみを必要とする。
以上の結果から,従来の評価で見過ごされた測定値であるツリーリング検出器の精度は,実世界展開の要件に満たされていないことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:02:38 GMT)
Inference-Time Decomposition of Activations (ITDA): A Scalable Approach to Interpreting Large Language Models [5.6] Inference-Time Decomposition of Activation(ITDA)モデルは、言語モデルのアクティベーションを分解する代替手法である。
ITDAは、データの1%を使用して、SAEに必要な時間のわずか1%でトレーニングすることができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:54:13 GMT)
DeePoly: A High-Order Accuracy Scientific Machine Learning Framework for Function Approximation and Solving PDE [5.5] この研究は、Deeソリューションを2段階のアプローチに変換する新しいフレームワークを紹介します。
戦略的な組み合わせは、両方の方法の強みを利用する。
多様な問題タイプにまたがって、高次かつ効率性を提供します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:14:47 GMT)
Can Time-Series Foundation Models Perform Building Energy Management Tasks? [5.5] エネルギー管理タスクを構築するには、さまざまな時系列データからの処理と学習が必要である。
既存のソリューションは、これらのタスクを実行するために、bespokeタスクとデータ固有のモデルに依存しています。
LLM(Large Language Models)の変革的な成功に触発されて、TSFM(Time-Series Foundation Models)は、これを変える可能性を秘めている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:45:10 GMT)
GD doesn't make the cut: Three ways that non-differentiability affects neural network training [5.4] 本稿では,非微分可能関数(NGDM)に適用される手法と,微分可能関数に対する古典的勾配降下(GD)との区別を批判的に検討する。
我々の研究は、強い仮定に対する過度な信頼から生まれた、影響力のある文学におけるアルゴリズムの批判的な誤解を識別する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:28:41 GMT)
Lattice Climber Attack: Adversarial attacks for randomized mixtures of classifiers [5.4] 問題の幾何学的解析に基づく攻撃の望ましい2つの特性(有効性と最大性)を紹介する。
次に、既存の攻撃が両方の特性を満たしていないことを示す。
本研究では,二元線形設定における理論的保証を伴うエム格子クライマー攻撃と呼ばれる新たな攻撃を導入し,その性能を合成および実データセットの実験により実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:53:32 GMT)
It's Not the Target, It's the Background: Rethinking Infrared Small Target Detection via Deep Patch-Free Low-Rank Representations [5.3] 本稿では、LRRNetと呼ばれる新しいエンドツーエンドIRSTDフレームワークを提案する。
乱れシーンの物理的圧縮性に着想を得て,本手法は圧縮・再構成・減算パラダイムを採用する。
複数の公開データセットの実験により、LRRNetは検出精度、堅牢性、計算効率の点で38の最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:24:45 GMT)
Unitary Scrambling and Collapse: A Quantum Diffusion Framework for Generative Modeling [5.3] 画像生成のための最初の完全量子拡散に基づくフレームワークであるQSC-Diffusionを提案する。
逆ノイズ発生のためのパラメータ化量子回路を用いる。
注目すべきは、QSC-Diffusionは複数のデータセット間で競合するFIDスコアを達成することだ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:00:21 GMT)
On Broken Symmetry in Cognition [5.2] この論文は、認知進化と発達は対称性を破る遷移によって展開すると主張している。
第一に、空間対称性は、両側のボディプランとグリッドやプレースセルのような神経コードによって破られる。
第三に、ゴール指向シミュレーションは内部の自己モデルと外部世界の対称性を破る。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:43:32 GMT)
Multi-dimensional Autoscaling of Processing Services: A Comparison of Agent-based Methods [5.2] この作業では、制約のある環境で要求を満たすのを最大化するエージェントベースのオートスケーリングフレームワークを導入している。
我々は,アクティブ推論,ディープQネットワーク,構造知識の分析,ディープアクティブ推論の4種類のスケーリングエージェントを比較した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:20:26 GMT)
Enhanced Vehicle Speed Detection Considering Lane Recognition Using Drone Videos in California [5.2] 本研究は,約800羽の鳥眼視画像に基づいて訓練し,車両の速度検出精度を向上させるための細調整型YOLOv11モデルを提案する。
提案システムは,各車両の車線を識別し,車両を車と重車という2つのカテゴリに分類する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:16:48 GMT)
Structure and asymptotic preserving deep neural surrogates for uncertainty quantification in multiscale kinetic equations [5.2] パラメータを持つ運動方程式の高次元性は不確実性定量化(UQ)の計算課題を提起する
伝統的なモンテカルロサンプリング法は、空間の次元が大きくなるにつれて、緩やかな収束と高い分散に悩まされる。
ニューラルネットワークの構造と保存に基づくサロゲートモデル(SAPNN)を導入する。
SAPNNは、肯定性、保存法則、エントロピー散逸、パラメータ制限など、重要な物理特性を満たすように設計されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:20:53 GMT)
Agnostic Smoothed Online Learning without Knowledge of the Base Measure [5.2] 本稿では,$mu$の事前知識を必要とせずに,オンライン学習を円滑に行うためのサブ線形後悔を保証するアルゴリズムを提案する。
R-Coverは、次元$d$を持つ関数クラスに対して、適応的後悔$tilde O(sqrtdT/sigma)$を持つ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:54:07 GMT)
Probing the Topology of Fermionic Gaussian Mixed States with {U(1)} symmetry by Full Counting Statistics [5.1] 近年、トポロジカル物理学の焦点は、トポロジカル分類を混合状態にまで拡張している。
ここでは、密度行列のモジュラハミルトニアンが U(1) 対称性を持つ二次自由フェルミオンモデルであるガウス混合状態に焦点を当てる。
バルク-バウンダリー対応は、モジュラーハミルトンおよび密度行列の退化スペクトルの安定なギャップレスモードとして表される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:54:03 GMT)
Multimodal Modeling of CRISPR-Cas12 Activity Using Foundation Models and Chromatin Accessibility Data [5.0] 本研究は,転写学的なデータに基づいてトレーニングされた生物基盤モデルにより,gRNAの活性推定が向上するかどうかを考察する。
既存のRNAファンデーションモデルからの埋め込みを軽量回帰器への入力として使用することにより、従来のベースラインよりも大幅に向上することを示す。
本研究は,gRNA活性予測のための事前学習基盤モデルとアクセシビリティーデータの有効性を明らかにする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:15:14 GMT)
GynSurg: A Comprehensive Gynecology Laparoscopic Surgery Dataset [4.9] GynSurgは腹腔鏡下手術のための最大かつ最も多様なマルチタスクデータセットである。
GynSurgは、アクション認識、セマンティックセグメンテーション、外科的ドキュメンテーション、新しい手続き的洞察の発見など、複数のタスクにわたる豊富なアノテーションを提供する。
我々は、標準化されたトレーニングプロトコルの下で最先端モデルをベンチマークすることで、データセットの品質と汎用性を実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:10:47 GMT)
Identifiability Challenges in Sparse Linear Ordinary Differential Equations [4.9] スパースシステムは,実質的に関係のあるスパース性体制において,正の確率で識別できないことを示す。
さらに、この理論的不同一性は、データから線形ODEを推定する最先端の手法でどのように現れるのかを実証的に研究する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:03:30 GMT)
Burn After Reading: Do Multimodal Large Language Models Truly Capture Order of Events in Image Sequences? [4.8] 本稿では,画像系列におけるMLLMの時間的グラウンド化と推論機能に着目したTempVSベンチマークを提案する。
我々は38の最先端MLLMを評価し、モデルがTempVSを解くのに苦労していることを示す。
TempVSベンチマークデータとコードはhttps://github.com/yg22/TempVS.comで公開しています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:12:31 GMT)
Scalable unsupervised feature selection via weight stability [4.8] アンサンプの特徴選択は、高次元データのクラスタリング性能向上に不可欠である。
我々は、ミンコフスキー重み付き$k$-means++という、ミンコフスキー重み付き$k$-means++の新しい初期化戦略を紹介した。
提案する2つの新機能選択アルゴリズム,FS-MWK++は,ミンコフスキー指数の範囲で特徴量を集約する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:48:29 GMT)
The Packing Chromatic Number of the Infinite Square Grid is 15 [4.8] Packing $k$-coloringは、グラフの標準概念である$k$-coloringのバリエーションである。
約2桁のオーダーで最もよく知られた方法を改善することにより、無限正方格子のパッキング数を証明した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:35:49 GMT)
Demonstration Sidetracks: Categorizing Systematic Non-Optimality in Human Demonstrations [4.8] ロボットが新しいスキルを身につけるには、LfD(Learning from Demonstration)が一般的である。
ほとんどのLfD法はヒトのデモンストレーションにおいて不完全性に悩まされる。
本稿では,非専門家による実証実験における非最適行動について検討し,それらが体系的であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:04:55 GMT)
Urban1960SatSeg: Unsupervised Semantic Segmentation of Mid-20$^{th}$ century Urban Landscapes with Satellite Imageries [4.8] $textbfUrban 1960SatBench$は、歴史的衛星画像に基づく注釈付きセグメンテーションデータセットである。
$textbfUrban 1960SatUSM$は教師なしセグメンテーションタスクのためのベンチマークフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:33:42 GMT)
Uncovering Reliable Indicators: Improving IoC Extraction from Threat Reports [4.7] 我々は,IoC抽出のためのHuman-in-the-loopパイプラインを初めて導入する。
我々のシステムは、説明可能な文脈対応ラベル付けにより精度を向上する。
PRISMは、現実世界の50件の脅威レポートから1,791件のIoCをラベル付けした、高品質で公開可能なベンチマークです。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:47:57 GMT)
User Perceptions and Attitudes Toward Untraceability in Messaging Platforms [4.7] 本研究では,利用者の「追跡不能性」,すなわち第三者が誰とコミュニケーションしているかの追跡を防止することを目的とした。
ユーザは、追跡不能の概念と、幅広いプライバシー強化技術とを関連付けている。
本稿では、追跡不能な通信プロトコルによって対処される脅威モデルと、追跡不能な通信可能性に対するユーザの認識のギャップについて論じる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:19:50 GMT)
Coupled reaction and diffusion governing interface evolution in solid-state batteries [4.7] 我々は、対称電池セルの量子精度で、大規模で明示的な反応シミュレーションを行う。
我々はSEI生成の実験的観察と,デンドライト開始に重要なLiクリープ機構の解明について説明する。
我々のアプローチは、実験に適合する調整可能なパラメータを使わずに、デジタル双生児を第一原理から切り離すことです。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:49:05 GMT)
Nuclear Electric Quadrupole Moment-Induced Parity Doubling in Molecules for Symmetry-Violation Searches [4.7] 核磁気四極子モーメント(MQM)と核シフモーメント(NSM)の探索は、標準モデルを超えて、時間(T$)とパリティ(P$)の逆対称性に違反する発見可能性が高い。
EQMsはパリティ・ダブルト状態間のエネルギー分割を著しく変更し、必要な分極電場を変化させることができることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:10:06 GMT)
MUDAS: Mote-scale Unsupervised Domain Adaptation in Multi-label Sound Classification [4.6] 教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、新しいラベルのない環境に機械学習モデルを適用するために不可欠である。
Mote-scale Unsupervised Domain Adaptation for Sounds (MUDAS)は、リソース制約されたIoT設定において、マルチラベル音声分類のために開発されたフレームワークである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:02:07 GMT)
DiffPR: Diffusion-Based Phase Reconstruction via Frequency-Decoupled Learning [4.6] オフアクシス定量的位相イメージング(QPI)に深層学習を適用する場合、過平滑化は持続的な問題である。
この問題をスペクトルバイアスに追従し、ハイレベルなスキップ接続によってバイアスが強化されていることを示す。
2段階の周波数分離フレームワークであるDiffPRを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:08:45 GMT)
Detecting Sockpuppetry on Wikipedia Using Meta-Learning [4.6] ウィキペディアにおける悪意あるソックパペットの検出は、インターネット上の信頼できる情報へのアクセスを維持するために重要である。
従来の機械学習アプローチはスタイリスティックな特徴とメタデータに頼っているが、著者固有の振る舞いへの適応性を優先しない。
本稿では,データスカース設定の性能向上を目的とした機械学習技術であるメタラーニングの応用を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:59:04 GMT)
Data Shifts Hurt CoT: A Theoretical Study [4.5] Chain of Thought (CoT) は様々な大規模言語モデル (LLM) に適用され、出力の品質向上に有効であることが証明されている。
分散シフトとデータ中毒の2種類のデータシフトが、訓練されたモデルの品質に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:38:04 GMT)
Coupled Lindblad pseudomode theory for simulating open quantum systems [4.5] 結合擬似モデムは$mathrmlog$T/varepsilon)$T/varepsilonとしてスケールする必要があるという理論的証拠を提供する。
制御理論の実現に触発されて、既存のアプローチで要求される非最適化を避けるために、$$varepsilonモードを構築するための堅牢な数値アルゴリズムも開発する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:40:39 GMT)
Different Questions, Different Models: Fine-Grained Evaluation of Uncertainty and Calibration in Clinical QA with LLMs [4.5] 臨床多点質問応答における不確実性評価法について詳細に検討した。
本稿では,標準の単一世代法とサンプリング法を比較し,単純な単一パス推定法について考察する。
本結果は,質問の性質とモデル固有の強みの両方に基づいて,モデルを選択することの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:48:25 GMT)
On the role of non-linear latent features in bipartite generative neural networks [4.5] 本研究では,リミテッド・ボルツマン・マシン (RBM) を,その隠蔽ユニットに課される事前分布の関数として検討する。
解析の結果,バイナリ隠れノードと広範囲の接続性を持つ標準RCMは,臨界容量の低下に悩まされていることが明らかとなった。
この問題に対処するために、局所バイアスの導入や、よりリッチな隠蔽ユニットの事前適用など、いくつかの修正について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:20:20 GMT)
Logarithmic Smoothing for Adaptive PAC-Bayesian Off-Policy Learning [4.5] オフ政治学習は、ログ化された相互作用から最適なポリシーを学ぶための主要なフレームワークとなる。
我々はこのフレームワークをオンラインPAC-ベイジアン理論のツールを用いて適応シナリオに拡張する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:54:09 GMT)
PointGS: Point Attention-Aware Sparse View Synthesis with Gaussian Splatting [4.5] 3D Gaussian splatting (3DGS) は、レンダリング速度と視覚品質の両方において、ニューラル放射場(NeRF)を超える革新的なレンダリング技術である。
本稿では,スパーストレーニングビューからリアルタイムかつ高品質なレンダリングを可能にするポイントワイズ特徴認識型ガウス分割フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:07:07 GMT)
FicGCN: Unveiling the Homomorphic Encryption Efficiency from Irregular Graph Convolutional Networks [4.4] ホモモルフィック暗号化(HE)は、暗号化データ上で計算を実行可能にすることにより、プライバシ保護機械学習(PPML)を促進する。
本稿では,GCNのスパース特性を利用したHEベースのフレームワークであるFicGCNを提案する。
FicGCNはテスト対象の全データセットで最高のパフォーマンスを実現しており、最新の設計よりも4.10倍改善されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:46:07 GMT)
MNN-LLM: A Generic Inference Engine for Fast Large Language Model Deployment on Mobile Devices [4.4] MNN-LLMは、モバイルデバイスへの大規模言語モデルのデプロイを加速するために設計されたフレームワークである。
モデル量子化とDRAM-FlashハイブリッドストレージによるLCMのランタイム特性に対処する。
特に、MNN-LLMは、現在のLLM固有のフレームワークと比較して8.6倍の速度向上を実現している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:45:29 GMT)
Evaluating Large Language Models on Non-Code Software Engineering Tasks [4.4] 大規模言語モデル(LLM)は、コード理解と生成において顕著な能力を示している。
ソフトウェア工学言語理解(SELU)と呼ばれる最初の包括的なベンチマークを提示する。
SELUは、分類、回帰、名前付きエンティティ認識(NER)とマスケッド言語モデリング(MLM)のターゲットをカバーし、さまざまなソースからデータを引き出す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:52:32 GMT)
Implicit Language Models are RNNs: Balancing Parallelization and Expressivity [4.3] 状態空間モデル(SSM)とトランスフォーマーが言語モデリングのランドスケープを支配している。
固定点に収束するまで変換を行う暗黙のSSMを提案する。
提案手法は, 正規言語における状態追跡能力に優れ, トランスフォーマーやSSMよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:21:50 GMT)
Naturalistic Computational Cognitive Science: Towards generalizable models and theories that capture the full range of natural behavior [4.3] 認知科学はどのようにして、自然の状況や行動の全範囲にまたがる一般化可能な理論を構築することができるのか?
AIの最近の進歩は、自然主義的なデータからの学習が、行動と一般化の質的に異なるパターンを生み出すことを示している。
我々は、AIと認知科学の最近の進歩を統合することで、より自然主義的な現象に関わりやすくなることを示唆している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:45:48 GMT)
LoByITFL: Low Communication Secure and Private Federated Learning [4.2] 我々は,最初のコミュニケーション効率の高い情報理論としてプライベートでセキュアなフェデレート学習方式であるLoByITFLを紹介する。
主要なコンポーネントは、フェデレーターで利用可能な、小さくて代表的なデータセット、FLTrustアルゴリズムの慎重に修正、信頼できるサードパーティのワンタイム使用である。
プライバシーとビザンチンのレジリエンスに関する理論的保証と,LoByITFLの収束を示す実験結果を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:23:00 GMT)
Byzantine-Resilient Secure Aggregation for Federated Learning Without Privacy Compromises [4.2] フェデレーテッド・ラーニング(FL)は大規模な機械学習において大きな可能性を秘めているが、プライバシとセキュリティの面で新たなリスクをもたらす。
我々は,ユーザデータをフェデレーターからプライベートに,他のユーザからプライベートに保ちながら,ビザンチンユーザに対してレジリエンスを提供するFLの新しいスキームであるBYITFLを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:29:18 GMT)
Deep Binding of Language Model Virtual Personas: a Study on Approximating Political Partisan Misperceptions [4.2] 大規模言語モデル(LLM)は、人間の振る舞いをシミュレートする能力が高まっている。
本稿では, マルチターンインタビュー文として, 合成ユーザバックストリーを用いた仮想ペルソナ構築手法を提案する。
我々の生成したバックストリーはより長く、細部が豊富で、特定の個人を記述するのに一貫性がある。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:11:01 GMT)
Measuring Semantic Information Production in Generative Diffusion Models [4.1] 意味的特徴と構造的特徴が拡散の逆ダイナミクスの間に異なる時期に現れることはよく知られている。
生成過程において,これらのクラス・セマンティックな「決定」がいつ行われるかを測定するための一般的な情報理論的アプローチを導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:35:29 GMT)
From Images to Insights: Explainable Biodiversity Monitoring with Plain Language Habitat Explanations [4.1] 本稿では,種像を生息環境の嗜好に関する解釈可能な因果的洞察に変換する,エンド・ツー・エンドのビジュアル・ツー・カジュアル・フレームワークを提案する。
このシステムは、種認識、グローバルな発生の検索、擬似汚染サンプリング、気候データ抽出を統合している。
我々は、構造化テンプレートと大規模言語モデルから統計的に基盤を置き、人間可読な因果説明を生成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:33:30 GMT)
Quality over Quantity: Boosting Data Efficiency Through Ensembled Multimodal Data Curation [4.0] 本稿では,Webcrawlデータセットの非構造的および不均一性に関わる課題に対処する。
先進的な学習駆動型アプローチである DAta ThroUgh Multimodal Operators (EcoDatum) のアンサンブルキュレーションを導入する。
EcoDatumは、弱監督アンサンブルフレームワーク内に、様々な単一モーダルおよびマルチモーダルデータキュレーション演算子を戦略的に統合する。
DataCompのリーダーボードでは、38のさまざまな評価データセットの中で、平均的なパフォーマンススコアが0.182だった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:03:28 GMT)
Equivariant Neural Diffusion for Molecule Generation [4.0] 3次元における分子生成のための同変神経拡散(END)を導入する。
ENDはユークリッド変換と等価な3次元分子生成の新しい拡散モデルである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:57:50 GMT)
General targeted machine learning for modern causal mediation analysis [3.8] 因果媒介分析は、その作用を引き起こすメカニズムを解明する。
媒介分析に対する6つの一般的な非パラメトリック手法の同定式は2つの統計的推定値から復元可能であることを示す。
我々は,任意の媒介研究において,機械学習と組み合わせることができる全目的の一段階推定アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:20:48 GMT)
EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence [3.7] EmbodiedGenはインタラクティブな3Dワールドジェネレーションのための基盤となるプラットフォームだ。
高品質で、制御可能で、フォトリアリスティックな3Dアセットを低コストでスケーラブルに生成することができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:43:50 GMT)
Large Language Models for Multilingual Previously Fact-Checked Claim Detection [3.7] 本稿では,複数言語による事実チェックによるクレーム検出のための大規模言語モデル (LLM) の総合評価について述べる。
20言語にまたがる7つのLLMをモノリンガル・クロスリンガル・セッティングで評価する。
この結果から,LLMは高リソース言語ではよく機能するが,低リソース言語では苦戦していることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:40:54 GMT)
System ASPMT2SMT:Computing ASPMT Theories by SMT Solvers [3.7] ASPMTは、解集合プログラミングと満足度モジュロ理論を組み合わせるためのアプローチである。
ASPMTプログラムのきつく断片をSMTインスタンスに変換することができる。
本研究では,連続的な変化を推論するために,実数計算を効果的に処理できることを実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:59:15 GMT)
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting [3.7] 既存の3DGS透かし法では3DGS圧縮法で透かし性能が著しく低下した。
耐圧縮アンカー型3DGS透かし方式を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:11:47 GMT)
Hybrid Bernstein Normalizing Flows for Flexible Multivariate Density Regression with Interpretable Marginals [3.7] 密度回帰モデルは、完全な条件付き確率分布をモデル化することによって、データの包括的な理解を可能にする。
本稿では,MCTMと最先端・自己回帰NFを組み合わせることで,解釈可能な特徴効果のモデル化にMCTMの透明性を活用する。
各種数値実験において,本手法の汎用性を実証し,実世界およびシミュレーションデータ上でのMCTMや他のNFモデルと比較した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:10:40 GMT)
Aesthetics Without Semantics [3.6] セマンティックコンテンツを最小限に抑えた画像データベースを作成し,美的評価の悪面から画像を生成する手法を考案する。
画像の特徴と美的評価との間には, 美しい画像に偏った画像が, どのように修正されるか, あるいは逆転するかが示される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:03:54 GMT)
A Comprehensive Survey of Unmanned Aerial Systems' Risks and Mitigation Strategies [3.6] この調査では、UAVデプロイメントのいくつかのフェーズで、サイバーセキュリティの脆弱性を要約する。
我々は、UASドメインに適用されるUAS特化戦略と非UAS特化戦略の両方について分析を行う。
関連するサイバーセキュリティ基準とその勧告をUASの文脈で提示する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:30:19 GMT)
FaceLiVT: Face Recognition using Linear Vision Transformer with Structural Reparameterization For Mobile Device [3.6] FaceLiVTは軽量だが強力な顔認識モデルである。
ハイブリッドの畳み込みニューラルネットワーク(CNN)-トランスフォーマーアーキテクチャと、革新的で軽量なマルチヘッド線形アテンション機構を統合している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:36:40 GMT)
Landauer Principle and Thermodynamics of Computation [3.6] 我々はランダウアー境界の最近の進歩を概観する。これは計算の熱力学の基本的な原理である。
また,計算過程のエネルギー的境界の確立に向けた最近の研究についても概説する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:43:28 GMT)
Data-driven Day Ahead Market Prices Forecasting: A Focus on Short Training Set Windows [3.6] 本研究では,短時間の履歴学習窓を用いた電力市場(DAM)価格予測における機械学習モデルの性能について検討した。
欧州のエネルギー市場において,Fed Forward Error Correction (FFEC), XGBoost, LightGBM, CatBoostの4つのモデルを評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:03:31 GMT)
Testing Generalizability in Causal Inference [3.5] 機械学習アルゴリズムの一般化性を統計的に評価するための公式な手続きは存在しない。
本研究では,高次元因果推論モデルの一般化可能性を統計的に評価するための体系的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:02:34 GMT)
Diffusion-Free Graph Generation with Next-Scale Prediction [3.5] 次世代の予測に基づく拡散自由グラフ生成フレームワークを提案する。
潜在表現の階層化を活用することで、モデルは明示的なノード順序付けを必要とせずに、グラフ全体のスケールを段階的に生成する。
ジェネリックグラフと分子グラフの両方の実験は、この手法の可能性を実証し、最先端の手法よりも最大3桁の推論速度を達成した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:54:10 GMT)
IoTGeM: Generalizable Models for Behaviour-Based IoT Attack Detection [3.4] IoTGeMはIoTネットワークアタックをモデル化するためのアプローチで、汎用性を重視しながら、検出とパフォーマンスの向上にも寄与する。
厳格に独立したトレインとテストデータセットを使用して、モデルを構築、テストします。
IoTGeMは、ACK、HTTP、Syn、MHD、PS攻撃で99%のF1スコア、UDP攻撃で94%のF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:02:15 GMT)
Neural at ArchEHR-QA 2025: Agentic Prompt Optimization for Evidence-Grounded Clinical Question Answering [3.3] 今回我々は,BioNLP 2025 Arch-QA の準優勝者である Neural について紹介する。
提案手法は,(1)文章レベルのエビデンス同定と(2)明示的な引用による回答合成にタスクを分解する。
自己整合性投票方式は、精度を犠牲にすることなく証拠リコールをさらに改善する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:36:18 GMT)
"I Hadn't Thought About That": Creators of Human-like AI Weigh in on Ethics And Neurodivergence [3.3] 人間のようなAIエージェントはますます人気が高まっているが、それらは様々な倫理的懸念を呈している。
我々は,これらの技術を構築し,設計した人々の経験を調査し,ニューロディバージェンスの理解と受容に関する洞察を得る。
我々は、これが社会における自閉症の包摂に与える影響について検討し、より倫理的な研究方向に対する体系的な変化を推奨する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:16:28 GMT)
To what extent can current French mobile network support agricultural robots? [3.3] 本稿では,農業用ロボットの大規模展開によって引き起こされるエネルギー消費量と炭素フットプリント量を評価する手法を提案する。
以上の結果から,ロボットのニーズが増大すると,大きな影響がもたらされることが示唆された。
ネットワークを既存のサイトに制限すると、需要が急増し、管理可能な農業地域も急速に減少する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:39:24 GMT)
FedRAG: A Framework for Fine-Tuning Retrieval-Augmented Generation Systems [3.3] FedRAGは集中型アーキテクチャとフェデレーション型アーキテクチャをまたいだRAGシステムを微調整するためのフレームワークである。
FedRAGは最先端のファインチューニングメソッドをサポートし、シンプルで直感的なインターフェイスを提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:48:57 GMT)
A Causal Lens for Learning Long-term Fair Policies [3.2] 本稿では,動的意思決定システムにおける長期公正性の検証の重要性を強調した。
本稿では,期待される平均資格獲得率の差によって,長期的公正度が測定される一般的な枠組みを提案する。
我々は、これらの構成要素と、利益公正という新たな公正概念との本質的な関係を解析する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:22:50 GMT)
TimeBridge: Better Diffusion Prior Design with Bridge Models for Time Series Generation [3.2] 時系列生成はシミュレーション、データ拡張、仮説テストといった現実世界のアプリケーションで広く利用されている。
拡散モデルは、時系列生成に対する事実上のアプローチとして現れ、多様な合成シナリオを可能にしている。
本研究では、拡散ブリッジを用いて時系列データを柔軟に合成し、選択した事前とデータ分布の間の経路を学習するフレームワークであるTimeBridgeを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:37:09 GMT)
Exact, Average, and Broken Symmetries in a Simple Adaptive Monitored Circuit [3.2] 測定された量子回路は、本質的に平衡から外れた新しい物質の状態の基盤として登場した。
対称性は、これらの新しい状態、それらの相と相転移の組織原理として使用できるか?
我々は、異なる絡み合い遷移に加えて順序付け遷移をホストする単純な適応監視回路において、肯定的な答えを与える。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:11:26 GMT)
Slimming Down LLMs Without Losing Their Minds [3.2] 本稿では,パラメータ効率向上手法(LoRAとQLoRA)に着目し,微調整が大規模言語モデルの性能に及ぼす影響を検証・検証する。
我々は,(1)コモンセンス推論(HellaSwag),(2)数学的推論(GSM8K),(3)マルチドメイン知識(MMLU-CS)の3分野にわたるモデル能力を評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:49:40 GMT)
TableRAG: A Retrieval Augmented Generation Framework for Heterogeneous Document Reasoning [3.1] Retrieval-Augmented Generation (RAG) は、オープンドメイン質問応答においてかなりの効果を示した。
既存のRAGアプローチでは、異種文書に適用する場合に限界がある。
本研究では,表データに対するテキスト理解と複雑な操作を統一するフレームワークであるTableRAGを提案する。
また,マルチホップ不均一推論能力を評価するための新しいベンチマークであるHeteQAを開発した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:16:49 GMT)
LLM-as-a-Fuzzy-Judge: Fine-Tuning Large Language Models as a Clinical Evaluation Judge with Fuzzy Logic [3.1] 本稿では,医学生の臨床スキルと主観的医師の好みを自動評価するLLM-as-a-Fuzzy-Judgeを提案する。
この手法は,4つのファジィ集合からの人間のアノテーションに基づいて,学生とAI患者の会話スクリプトにおける医学生の発話を評価するために微調整されている。
その結果,LLM-as-a-Fuzzy-Judgeの精度は80%以上であり,主要な基準項目は90%以上であることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:31:49 GMT)
Quantum Computation of Electronic Structure with Projector Augmented-Wave Method and Plane Wave Basis Set [3.1] 従来のコンピュータにおける電子構造計算では、プロジェクタ拡張波法(PAW)と平面波ベースセットを用いて資源削減を実現している。
直交制約を保存するPAWのユニタリ変種を開発する。
ダイヤモンド中の窒素空孔欠陥中心のエネルギー推定のための量子資源を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:40:13 GMT)
Modality-Order Matters! A Novel Hierarchical Feature Fusion Method for CoSAm: A Code-Switched Autism Corpus [3.1] 本研究は,小児における早期ASD検出の促進を目的とした,新しい階層的特徴融合法を提案する。
この手法は、コードスイッチされた音声コーパスであるCoSAmを、ASDと一致した制御グループと診断された子供から収集する。
このデータセットは、ASDと診断された30人の子供から61人の音声記録と、神経型児から31人の音声記録を含んでおり、3歳から13歳の間である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:04:08 GMT)
Revisiting Transformers with Insights from Image Filtering [3.0] 自己注意(Self-attention)は、Transformerベースの最先端のディープラーニングアーキテクチャの基礎である。
我々は、自己注意とそのコンポーネントを説明するための統合画像処理フレームワークを開発する。
画像処理にインスパイアされた修正は、言語や視覚タスク全体にわたるデータ汚染や敵対に対して顕著に精度と堅牢性を向上し、長いシーケンス理解を向上する可能性があることを実証的に観察する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:46:57 GMT)
Exploring Performance-Complexity Trade-Offs in Sound Event Detection Models [3.0] 音響事象検出タスクのための新しい低複雑さネットワークの開発課題について検討する。
音声タグ付けに先立って提案した低複雑さ畳み込みモデルは,イベント検出に効果的に適応できることがわかった。
最適化されたトレーニング戦略と組み合わせることで、最先端のトランスフォーマーに匹敵するイベント検出性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:07:10 GMT)
Polymorphism Crystal Structure Prediction with Adaptive Space Group Diversity Control [3.0] 結晶材料は、同じ化学組成で異なる構造配列(ポリモルフィック)を形成することができる。
適応空間群多様性制御手法を取り入れた多型CSPのための多目的遺伝的アルゴリズムを提案する。
ParetoCSP2は、ほぼ完全な空間群を含む多型予測において優れた性能を達成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:08:35 GMT)
Space-Efficient Private Estimation of Quantiles [2.9] 通信ネットワークやモノのインターネット(IoT)などから来るデータストリーム上の量子関数の推定は、重要なデータ処理アプリケーションの中心にある。
ストリームアイテムは非常に高いレートで届き、可能な限り早く処理され、破棄されなければならない。
textscDP-Frugal-1U-L, textscDP-Frugal-1U-G, textscDP-Frugal-1U-$rho$
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:13:56 GMT)
Using Language and Road Manuals to Inform Map Reconstruction for Autonomous Driving [2.9] レーントポロジー予測は安全で信頼性の高い自律航法の重要な構成要素である。
この情報は、道路構造を反映した設計コードや、道路機能を捉えた道路名などを通じて、自然言語で符号化された規則に従うことが多い。
我々はこの情報を,地図に基づくオンラインレーントポロジー予測モデルであるSMERFに軽量に拡張する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:02:01 GMT)
Score-based Generative Diffusion Models to Synthesize Full-dose FDG Brain PET from MRI in Epilepsy Patients [2.9] てんかん患者を鑑別するためのFDG PETは,PET/MRI同時撮影における最も一般的な応用の1つである。
本稿では,MRI-PET画像変換タスクにおける拡散型および非拡散型ディープラーニングモデルの性能を比較した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:57:02 GMT)
Video-Mediated Emotion Disclosure: A Study of Mental Health Vlogging by People with Schizophrenia on YouTube [2.8] 統合失調症患者が作成した200本のYouTube動画を分析した。
分析の結果,言語と視覚の両方で多様な感情開示の実践が明らかとなった。
環境設定を含む視覚要素の意図的な構築は、より支援的かつ活発な視聴者反応を促進することが判明した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:39:54 GMT)
Deep Learning-Based Digitization of Overlapping ECG Images with Open-Source Python Code [2.7] 本稿では,信号重複による単一リード処理の限界を克服する2段階パイプラインを提案する。
最初のステージではU-Netベースのセグメンテーションネットワークを採用し、重なり合う信号で強化されたデータセットでトレーニングされている。
その後の段階では、この洗練された二項マスクを確立されたデジタル化技術を用いて時系列信号に変換する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:00:34 GMT)
Mapping and Scheduling Spiking Neural Networks On Segmented Ladder Bus Architectures [2.7] 大規模ニューロモルフィックアーキテクチャは、共有相互接続を用いてスパイクを伝達するコンピューティングタイルで構成されている。
これらの特性は、アイドル期間中に最小限の電力を消費しながら、高活性バーストを処理するために最適化された相互接続を必要とする。
本稿では,セグメンテッド・ラダーバスに合わせたシナリオ対応制御面の設計手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:44:50 GMT)
Constructing Quantum Many-Body Scars from Hilbert Space Fragmentation [2.7] 量子多体傷(QMBS)は異常な非熱的挙動を示すエキゾチック多体状態である。
格子内の凍結領域を部分的に活性化する準粒子励起を注入することにより、正確なQMBSの塔を構築することができることを示す。
本研究により,量子多体散乱とヒルベルト空間断片化の直接接続が確立され,正確な近似QMBSを体系的に構築する方法が確立された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:20:47 GMT)
MMME: A Spontaneous Multi-Modal Micro-Expression Dataset Enabling Visual-Physiological Fusion [2.7] マイクロ・エクスプレッション(ME)は微妙で、個人の真の感情状態を明らかにする非言語的な手がかりを流している。
既存のME研究は単一の視覚的モダリティに限られており、他の生理的モダリティによって伝達される豊かな感情情報を見渡せる。
本研究は,顔行動信号の同期収集を可能にする新しいME,MMMEを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:33:02 GMT)
Obliviate: Efficient Unmemorization for Protecting Intellectual Property in Large Language Models [2.7] 本稿では,特定の配列の正確な複製を外科的に抑制する軽量な方法であるObliviateを紹介する。
Obliviateはまず記憶されたパスを特定し、次に各ターゲットトークンに対して、モデルの出力分布を最小限に調整する。
Obliviate を4つの一般的な 6-8B- パラメータモデル (LLaMA-3.1, LLaMA-3.1-インストラクト, Qwen-2.5, Yi-1.5) 上で, 合成ベンチマークと有機著作権抽出を用いて評価した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:12:38 GMT)
Hey, That's My Model! Introducing Chain & Hash, An LLM Fingerprinting Technique [2.7] 大規模言語モデル(LLM)の盗難や誤用に対する懸念が高まり、効果的な指紋認証の必要性が高まっている。
指紋の透明性、効率性、永続性、ロバスト性、非偽造性という5つの重要な特性を定義します。
我々は,指紋の完全性を維持しつつ,認証された所有権の証明を提供する新しい指紋認証フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:44:01 GMT)
Secure and Efficient Migration of Large Enclaves in a Data Center [2.7] 本稿では,大規模なメモリフットプリントTEEベースのアプリケーションのための,ほぼゼロのダウンタイムライブマイグレーション機構を持つ新しい手法を提案する。
IntelのTEEソリューションであるIntel SGXをベースとしたプロトタイプでは,エンクレーブサイズに関係なく,ほぼゼロに近いダウンタイムを実現しています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:50:36 GMT)
A Weighted Loss Approach to Robust Federated Learning under Data Heterogeneity [2.6] フェデレートラーニング(FL)は、複数のデータホルダーが、トレーニングデータを外部と共有することなく、機械学習モデルを協調的にトレーニングすることを可能にする。
FLはプライバシーの観点からは魅力的に思えるが、セキュリティの観点からは(ビザンチン)参加者がモデル収束を害する有毒な勾配(またはモデルパラメータ)に貢献できるため、多くの脅威を開放する。
WoLA(Worker Labelement Loss)は、データの不均一性にもかかわらず、正直な作業者の勾配を整合させる重み付き損失である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:27:22 GMT)
Towards Scalable SOAP Note Generation: A Weakly Supervised Multimodal Framework [2.6] 皮膚癌は世界中で最も多いがんであり、年間医療費は80億ドルを超えている。
本稿では,病変画像やスパーステキストを含む限られた入力から臨床構造化されたSOAPノートを生成するための弱教師付きマルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:33:46 GMT)
Do Language Models Have Bayesian Brains? Distinguishing Stochastic and Deterministic Decision Patterns within Large Language Models [2.6] 特定の条件下では、言語モデルがほぼ決定論的意思決定を示すことが示される。
このことは、サンプリング仮定に挑戦し、人間のような先入観を抽出する以前の手法を損なう。
本稿では,ギブズサンプリングにおける決定論的決定パターンの識別方法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:23:22 GMT)
Data-Driven Prediction of Dynamic Interactions Between Robot Appendage and Granular Material [2.6] 別のデータ駆動型モデリング手法が提案され、特定の長さスケールでの粒状地形とのロボットの動きの相互作用に関する洞察を得ることができた。
このアプローチは,高忠実度シミュレーションデータのオフライン収集とスパース実験データの集合から得られるオフラインデータに基づいて,オンラインで使用することができる。
結果は、オンラインとオフラインの両方のフェーズにおいて、未知の複雑な地形におけるロボットのナビゲーションと探索を支援することが期待されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:43:21 GMT)
What Users Value and Critique: Large-Scale Analysis of User Feedback on AI-Powered Mobile Apps [2.4] 本稿では,AIを活用したモバイルアプリにおけるユーザフィードバックに関する総合的かつ大規模な研究について紹介する。
私たちは、14カテゴリにわたる292のAI駆動アプリのキュレートされたデータセットを活用し、Google Playから894KのAI固有のレビューを取得しています。
私たちのパイプラインは、ひとつの機能による満足度と、同じレビュー内で別の機能に対するフラストレーションの両方を表面化しています。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:56:52 GMT)
IPA-CHILDES & G2P+: Feature-Rich Resources for Cross-Lingual Phonology and Phonemic Language Modeling [2.3] 正書法データセットを一貫した音韻表現に変換するツールであるG2P+を紹介する。
また、31言語にまたがる子育て音声の音声データセットであるIPA CHILDESを提示する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:28:49 GMT)
BabyLM's First Words: Word Segmentation as a Phonological Probing Task [2.3] 単語分割が音韻探索のタスクとしてどのように使われるかを示す。
本研究では,31言語にまたがる児童指向音声で学習した音素ベース言語モデルから学習した表現について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:11:51 GMT)
Social Scientists on the Role of AI in Research [2.3] 本研究では,284件のアンケート結果と15件の社会科学者への半構造化インタビューについて,地域中心の調査結果を提示する。
我々は、ジェネレーティブAI(genAI)の普及に伴い、研究環境におけるAIの利用が社会科学者の間で著しく増加していることを発見した。
特に、自動化バイアス、デマシリング、研究の不正行為、複雑な解釈可能性、表現的害に関する倫理的懸念は、genAIに関連して提起される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:55:36 GMT)
Control Industrial Automation System with Large Language Model Agents [2.2] 本稿では,大規模言語モデルと産業自動化システムを統合するためのフレームワークを提案する。
フレームワークの中核には、産業タスク用に設計されたエージェントシステム、構造化プロンプト方法、イベント駆動情報モデリング機構がある。
コントリビューションには、フォーマルなシステム設計、概念実証実装、タスク固有のデータセットを生成する方法が含まれる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:26:21 GMT)
Efficient Excited-State Calculations for Molecules Based on Contextual Subspace Method and Symmetry Optimizations [2.2] 励起状態計算の量子計算法は、NISQ(Noisy Intermediate-Scale Quantum)ハードウェアでまだ探索されていない。
本稿では,文脈部分空間(CS)法と変分量子デフレレーション(VQD)アルゴリズムを統合する資源効率のよいフレームワークを提案する。
我々は、この組み合わせを励起状態の計算に利用して量子ビットを減らすことは不可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:12:54 GMT)
TRIDENT -- A Three-Tier Privacy-Preserving Propaganda Detection Model in Mobile Networks using Transformers, Adversarial Learning, and Differential Privacy [2.2] TRIDENTは3層プロパガンダ検出モデルトランスである。
敵の学習と差分プライバシーを統合して、プライバシー漏洩を軽減している。
TRIDENTの3層防衛を適用することで、モバイルMLデプロイメント全体で強力なプライバシ保護を示す、削減されるが効果的な累積F1が0.83になる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:37:56 GMT)
SLAP: Secure Location-proof and Anonymous Privacy-preserving Spectrum Access [2.2] そこで本稿では,スペクトルクエリや利用通知,位置情報保護の獲得などにおいて,位置情報のプライバシと匿名性を確保する新しいフレームワークを提案する。
我々のソリューションには、アーキテクチャの柔軟性とフォールバックオプションを備えたアダプティブなデュアルシナリオ位置検証機構と、タイムロックパズルを用いた対DoSアプローチが含まれている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:54:52 GMT)
Large Language Models for Detection of Life-Threatening Texts [2.1] 本稿では,大規模言語モデル (LLM) を用いたライフスレッディングテキストの同定に有効なアプローチを提案する。
Gemma,Mistral,Llama-2 の3つのオープンソース LLM を,異なるデータセット上で 7B パラメータの変種を用いて微調整する。
実験により従来の手法に対するLLMの強い性能が示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:33:27 GMT)
Closer to Language than Steam: AI as the Cognitive Engine of a New Productivity Revolution [2.1] 本稿では,文章言語に類似した認知革命としてのAIの理論的フレーミングを開発する。
AIの出現と情報技術の歴史的飛躍を比較して、それが知識労働をいかに増幅するかを示す。
私たちの中心的な議論は、AIが認知のエンジンとして機能する、ということです。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:43:54 GMT)
TikTok's Research API: Problems Without Explanations [2.1] TikTokは2023年7月にヨーロッパでResearch APIへのアクセスを拡大した。
この拡張にもかかわらず、提供されたデータには顕著な制限と不整合が持続する。
APIデータは不完全であり、データドキュメンテーションを扱う際には信頼できない。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:44:47 GMT)
Semi-Tensor-Product Based Convolutional Neural Networks [2.0] 本稿ではドメインベースの畳み込み生成物(CP)を提案する。
ゼロまたはその他のパディングがないため、パディングによって引き起こされるジャンク情報を回避することができる。
これを用いて、畳み込みベースのニューラルネットワーク(CNN)を開発する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:00:19 GMT)
DyFFPAD: Dynamic Fusion of Convolutional and Handcrafted Features for Fingerprint Presentation Attack Detection [2.0] ユーザの指紋を同意の有無にかかわらず偽造することにより、提示攻撃を行うことができる。
本稿では,プレゼンテーションアタックを検出するために,深層CNNと手作り特徴の動的アンサンブルを提案する。
提案手法をLiveness Detection Competitionからベンチマークデータベース上で検証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:06:29 GMT)
A Goemans-Williamson type algorithm for identifying subcohorts in clinical trials [1.9] 我々は,大規模な不均質データセットから同質部分集合を識別する線形分類器を効率的に設計するアルゴリズムを設計する。
応用として,患者の同種サブコホートを同定できる簡易な検査法を,本アルゴリズムを用いて設計する。
また, 腫瘍抑制遺伝子のメチル化レベルに統計的に有意な変化がみられ, 核受容体発現の統計的に有意な変化がみられる患者のサブコホートを系統的に同定するために, アルゴリズムによる試験結果を用いた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:44:32 GMT)
BugGen: A Self-Correcting Multi-Agent LLM Pipeline for Realistic RTL Bug Synthesis [1.9] 我々はBugGenを紹介した。これは完全な自律型マルチエージェントパイプラインで、RTLの機能的バグを生成し、挿入し、検証する。
BugGenはモジュールを分割し、クローズドループエージェントアーキテクチャを介して突然変異ターゲットを選択し、反復的な洗練とロールバック機構を採用している。
5つのOpenTitan IPブロックで評価され、BugGenは機能精度94%の500のユニークなバグを発生し、通常のマニュアル専門家の挿入より5倍速い時間当たり17.7のバグを検証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:02:20 GMT)
Deploying Open-Source Large Language Models: A performance Analysis [1.8] 本稿では、利用可能なGPUに応じて、異なるサイズの複数のモデルの性能の比較を行う。
この結果から,大規模言語モデルの展開を希望する私的・公的なグループに貴重な情報を提供する。
そこで本研究では,様々なアプリケーション領域における大規模言語モデルの導入と活用の促進に寄与する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:18:52 GMT)
Human-Robot Navigation using Event-based Cameras and Reinforcement Learning [1.8] この研究は、イベントカメラと他のセンサーと強化学習を組み合わせたロボットナビゲーションコントローラを導入し、リアルタイムの人間中心ナビゲーションと障害物回避を可能にした。
固定レートで動作し、動きのぼやけや遅延に悩まされる従来のイメージベースコントローラとは異なり、このアプローチはイベントカメラの非同期特性を活用して、フレキシブルな時間間隔で視覚情報を処理する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:03:08 GMT)
Few Single-Qubit Measurements Suffice to Certify Any Quantum State [1.7] 実験室状態のコピーに適用される1量子ビットの測定値として$O(n2)$O(n)$のみを用いて,経験的純粋な仮説状態が証明可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:08:09 GMT)
Compelling ReLU Networks to Exhibit Exponentially Many Linear Regions at Initialization and During Training [1.7] ReLUアクティベートされたニューラルネットワークでは、出力中の断片的線形領域の数は、深さとともに指数関数的に増加する。
深度のパラメータ化を新たに導入し,さらに多次元的な学習手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:20:27 GMT)
Evaluation of LLMs for mathematical problem solving [1.7] 大規模言語モデル(LLM)は、様々な教育課題において優れた性能を示してきたが、数学的な問題を解く可能性についてはまだ検討されていない。
我々は,GPT-4o,DeepSeek-V3,Gemini-2.0の3つの数学データセットを比較した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:09:17 GMT)
On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves [1.7] 二項分類問題における受信者動作特性(ROC)と高精度リコール曲線(PR)の幾何学について検討する。
鍵となる発見は、最もよく使われるバイナリ分類のメトリクスの多くは、単に合成関数 $G := F_p circ F_n-1$ の関数であるということである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:36:27 GMT)
Automated Generation of Precedence Graphs in Digital Value Chains for Automotive Production [1.7] 本研究では,自動車製造におけるデジタルバリューチェーンについて検討する。
車両ネットワークにおける電子制御ユニットの識別、ソフトウェアフラッシュ、カスタマイズ、コミッショニングに焦点を当てている。
自動スケジューリングアルゴリズムを用いて、このプロセスチェーンを最適化するために、新しい優先グラフ設計を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:02:46 GMT)
Sampling Imbalanced Data with Multi-objective Bilevel Optimization [1.6] 2階級の分類問題は、多数派と少数派のデータポイントの間の不均衡によってしばしば特徴づけられる。
合成オーバーサンプリングと多数アンサンプの両方をガイドする新しい多目的二段階最適化フレームワークMOODSを紹介する。
また,モデル性能に対するサンプリング手法の有効性を定量化する検証指標を導入する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:31:08 GMT)
RT-VC: Real-Time Zero-Shot Voice Conversion with Speech Articulatory Coding [1.6] RT-VCは、超低レイテンシと高品質なパフォーマンスを提供するゼロショットリアルタイム音声変換システムである。
RT-VCは61.4msのCPUレイテンシを実現し,13.3%のレイテンシ削減を実現している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:02:38 GMT)
Graph Neural Networks for Automatic Addition of Optimizing Components in Printed Circuit Board Schematics [1.5] 重要なタスクは、回路の堅牢性と信頼性を改善するコンポーネントを追加することで、ドラフトを最適化することである。
本稿では,2部グラフとして表現し,グラフニューラルネットワーク(GNN)に基づくノードペア予測モデルを活用することにより,PCBスキーマへの新たなコンポーネントの追加を自動化するアプローチを提案する。
GNNがこれらの問題を高精度に解決できることを示し、我々の手法がPCB設計の最適化を時間とコスト効率で自動化する可能性を実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:12:18 GMT)
Inferring Adjective Hypernyms with Language Models to Increase the Connectivity of Open English Wordnet [1.4] Open English WordnetはOntoLex-lemonで公開された重要なリソースである。
形容詞間のハイパーネミーを確立する方法について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:04:35 GMT)
PyGen: A Collaborative Human-AI Approach to Python Package Creation [1.3] Pygenは、研究者、技術者、ホビイストに、Pythonで書かれた中核的で有用なソフトウェアツールとして抽象的なアイデアを人生に持ち込むための自動化プラットフォームである。
最先端の言語モデルとオープンソースのコード生成技術を組み合わせることで、Pygenはツール開発のマニュアルオーバーヘッドを大幅に削減した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:16:01 GMT)
Energy-Efficient Deep Learning for Traffic Classification on Microcontrollers [1.3] 本稿では,資源限定マイクロコントローラ上でのエネルギー効率の高いトラフィック分類のための実用的なディープラーニング(DL)手法を提案する。
ISCX VPN-Non-VPNデータセット上で96.59%の精度を実現するハードウェア対応ニューラルアーキテクチャサーチ(HW-NAS)により最適化された軽量な1D-CNNを開発する。
2つのマイクロコントローラにおける実世界の推論性能を評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:10:22 GMT)
Efficient Traffic Classification using HW-NAS: Advanced Analysis and Optimization for Cybersecurity on Resource-Constrained Devices [1.3] 本稿ではハードウェア認識型ニューラルアーキテクチャサーチ(HW-NAS)により最適化されたハードウェア効率の高いディープニューラルネットワーク(DNN)を提案する。
リソース制約のあるIoT(Internet of Things)とエッジデバイス上でのセッションレベルの暗号化トラフィックの分類をサポートする。
最適化されたモデルは96.59%の精度で88.26Kのパラメータ、10.08MのFLOP、最大テンソルサイズは20.12Kである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:37:45 GMT)
What Exactly Does Guidance Do in Masked Discrete Diffusion Models [1.3] また,全データ分布がクラス上の混合である場合,ガイダンスはクラス固有の領域を増幅し,他のクラスと共有する領域を抑圧することを示した。
本研究は, 出力分布の形成だけでなく, サンプリング軌道の動的制御においても, 誘導の役割を強調した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:19 GMT)
Grounded Vision-Language Navigation for UAVs with Open-Vocabulary Goal Understanding [1.3] ビジョン・アンド・ランゲージナビゲーション(VLN)は、自律ロボット工学における長年にわたる課題であり、複雑な環境をナビゲートしながら、エージェントに人間の指示に従う能力を与えることを目的としている。
本研究では,無人航空機(UAV)に適した言語誘導飛行を行うフレームワークであるビジョン・ランゲージ・フライ(VLFly)を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:40:50 GMT)
FormosanBench: Benchmarking Low-Resource Austronesian Languages in the Era of Large Language Models [1.2] 我々は,低リソースオーストロネシア言語上での大規模言語モデル(LLM)を評価するための最初のベンチマークであるFORMOSANBENCHを紹介する。
FORMOSANBENCHを用いて,ゼロショット,10ショット,微調整設定におけるモデル性能を評価する。
この結果から,高リソース言語とFormosan言語の間には,大幅な性能差が認められた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:02:28 GMT)
Generalist Models in Medical Image Segmentation: A Survey and Performance Comparison with Task-Specific Approaches [1.2] 医用画像セグメンテーションのためのジェネリストモデルについて、包括的で詳細な調査を行っている。
最近のSAM 2.0では、ゼロショット、少数ショット、微調整、アダプタの観点でSAMの異なる定義について分類する。
我々は、規制フレームワーク、プライバシーおよびセキュリティ法、予算、信頼できる人工知能(AI)への準拠の観点から、課題に取り組む必要性を強調している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:44:49 GMT)
Meeting Patients Where They're At: Toward the Expansion of Chaplaincy Care into Online Spiritual Care Communities [1.2] 米国ではスピリチュアルケアの必要性が高まりつつあるが、しばしば不足している、アクセスできない、誤解されている。
この学際的な研究は、スピリチュアルケアがオンライン空間にどのように拡張されるか(あるいはそうでないか)に関する基礎的な理解を深めることを目的としている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:59:04 GMT)
Estimating the Energy Threshold of Phonon-mediated Superconducting Qubit Detectors Operated in an Energy-Relaxation Sensing Scheme [1.2] 我々は、量子ビットデバイスの性能指標を評価するために、エンドツーエンドのG4CMPベースのシミュレーションフレームワークを開発した。
この読み出し方式では、クォービットはフォノンセンサとして機能し、短期的な性能パラメータに対して$simeq$0.4 eVまでのエネルギー閾値を持つ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:39:37 GMT)
Extending AALpy with Passive Learning: A Generalized State-Merging Approach [1.2] AALpyはPythonで書かれたオープンソースの自動学習ライブラリである。
AALpyを用いてステートマージアルゴリズムの定義と実行方法について述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:46:40 GMT)
Bug Classification in Quantum Software: A Rule-Based Framework and Its Evaluation [1.2] 本稿では,量子ソフトウェアリポジトリの問題をバグタイプ,カテゴリ,重大度,品質特性によって分類するフレームワークを提案する。
フレームワークは85.21%の精度で、F1スコアは0.7075から0.8393までである。
1,550の量子特化バグのレビューでは、半分以上が量子回路レベルの問題であり、その後にゲートエラーとハードウェア関連の問題があった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:42:10 GMT)
Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search [1.1] 適応分岐モンテカルロ木探索(AB-MCTS)を提案する。
AB-MCTSは、原則化されたマルチターン探索とエクスプロイトによる繰り返しサンプリングを一般化する。
我々はフロンティアモデルを用いて複雑なコーディングとエンジニアリングのタスクについて評価する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:31:56 GMT)
Adaptive Job Scheduling in Quantum Clouds Using Reinforcement Learning [1.1] 現在の量子システムは、量子ビット数制限、短いコヒーレンス間隔、エラーに対する高い感受性など、重大なボトルネックに直面している。
本稿では、リアルタイムな古典チャネルを介して接続されたネットワークQPU上での分散スケジューリングと並列実行をサポートするシミュレーションベースのツールを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:54:19 GMT)
HyBiomass: Global Hyperspectral Imagery Benchmark Dataset for Evaluating Geospatial Foundation Models in Forest Aboveground Biomass Estimation [1.0] 本研究では,森林表層バイオマス(AGB)推定のためのグローバル分散ベンチマークデータセットを提案する。
このベンチマークデータセットは、環境マッピング・分析プログラム(EnMAP)衛星からのHSIと、AGB密度推定の予測を組み合わせたものである。
このデータセットを用いた実験結果から,評価されたGeo-FMがベースラインU-Netの性能を上回り得るか,場合によっては超えることを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 21:29:20 GMT)
Quantum Checkers: The Development and Analysis of a Quantum Combinatorial Game [1.0] 本稿では,新しい量子ゲームである量子チェッカー(コードネームCheqqers)を開発し,解析する。
量子力学からの重畳、絡み合い、測定、干渉の概念は、新しい種類の法的な動きを加えることで、チェッカーのゲームに統合される。
ランダムエージェントとモンテカルロ木探索エージェントを用いて,このゲームの初期解析を行った。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:52:57 GMT)
QuXAI: Explainers for Hybrid Quantum Machine Learning Models [1.0] この研究は、ハイブリッド機械学習システムにおける機能の重要性を説明するための説明器QuXAIを紹介する。
我々のモデルは、量子特徴写像を取り入れたHQMLモデルの作成、Q-MEDLEYの使用、特徴ベースの推論の組み合わせ、量子変換ステージの保存、および結果の属性の可視化を含む。
以上の結果から,Q-MEDLEYはHQMLモデルにおいて重要な古典的側面を表現し,ノイズを分離し,既存のXAI技術とよく競合することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:36:53 GMT)
Contrastive Matrix Completion with Denoising and Augmented Graph Views for Robust Recommendation [1.0] マトリックス補完は推薦システムにおいて広く採用されているフレームワークである。
コントラスト学習(MCCL)を用いた行列補完法を提案する。
提案手法は,予測スコアの数値精度を向上するだけでなく,ランキング指標の最大36%を向上する上で,優れたランキングを生成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:47:35 GMT)
Accelerating Transient CFD through Machine Learning-Based Flow Initialization [1.0] より正確な初期フィールドを提供することで、過渡解のコスト削減を目的とした機械学習に基づく初期化手法を提案する。
従来の均一および潜在的フローベース初期化と比較して,コンバージェンス時間の50%削減を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:55:14 GMT)
Automated Validation of Textual Constraints Against AutomationML via LLMs and SHACL [0.9] AMLはエンジニアリングにおける標準化されたデータ交換を可能にする。
適切なモデリングのための既存のレコメンデーションは、通常、非公式な制約とテキストの制約として定式化される。
本稿では,そのような制約の検証と定式化を行うパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:14:33 GMT)
LLM-as-a-Judge for Reference-less Automatic Code Validation and Refinement for Natural Language to Bash in IT Automation [0.9] 修復アクションの生成されたコードが構文的かつ意味論的に正しいかどうかを検証することは重要である。
本研究では,双方向機能マッチングと論理表現を用いたLLM-as-a-Judgeの改良に焦点を当てた。
結果は,実行ベース評価と高い精度と一致を示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:15:05 GMT)
uPVC-Net: A Universal Premature Ventricular Contraction Detection Deep Learning Algorithm [0.9] 単誘導心電図記録から心室収縮(PVC)を検出する汎用ディープラーニングモデルであるuPVC-Netを開発した。
このモデルは、ホルターモニターから収集された合計830万ビートと、最新のウェアラブルECGパッチからなる4つの独立したECGデータセットに基づいて開発されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:15:06 GMT)
Configuration design of multimode Gaussian operations on continuous-variable quad-rail lattice cluster states [0.8] 連続可変クアッドレール格子クラスター状態は、2次元構造上の柔軟な量子回路設計を可能にする。
本稿では,クラスタ状態におけるビームスプリッタネットワーク操作を効率的に実装するための具体的な構成設計について述べる。
この結果は, フレキシブルなクアッドレール格子クラスタ状態の計算に利用するためには, 基本的に重要である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:14:44 GMT)
Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System [0.8] 本研究は,3つの検査手法を用いて,逆チューリングテストによりローグエージェントを検出し,マルチエージェントシミュレーションにより知覚的アライメントを解析する。
GEMINI 1.5 Pro と llama-3.3-70B, Deepseek r1 モデルを用いて, 抗ジェイルブレイクシステムを開発した。
GEMINI 1.5 Proの94%の精度など、検出能力は強いが、長時間の攻撃を受けた場合、システムは永続的な脆弱性に悩まされる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:29:46 GMT)
SDialog: A Python Toolkit for Synthetic Dialogue Generation and Analysis [0.8] SDialogは、合成対話生成と解析の課題に対処するために設計された、モジュール化された現実的なPythonツールキットである。
命令調整された大規模言語モデル(LLM)を活用することで、SDialogはペルソナ、オーケストレーション、シナリオ管理の抽象化を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:07:51 GMT)
Quantum Fisher information from tensor network integration of Lyapunov equation [0.7] 量子フィッシャー情報(Quantum Fisher Information)は、量子状態のアンサンブルをパラメータ化する軌道に沿って計算された状態変形の尺度である。
我々は、対称対数微分とテンソルネットワークの概念を組み合わせたリアプノフ積分に基づく新しい数値的アプローチを導入する。
このアプローチは、時間進化のための基本行列積状態アルゴリズムのみを必要とし、幅広い用途と多体システムへの応用の視点を開く。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:01:31 GMT)
LLM-Cure: LLM-based Competitor User Review Analysis for Feature Enhancement [0.7] 本稿では,大規模言語モデル(LLM)に基づく機能拡張のための競合ユーザレビュー分析を提案する。
LLM-Cureは、LCMを適用して、レビュー内の特徴を特定し、分類する。
LLM-Cureは、ユーザーレビューに苦情を付けると、苦情に関連する競合アプリの高い評価(4と5の星)のレビューをキュレートする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:40:54 GMT)
SHORE: A Long-term User Lifetime Value Prediction Model in Digital Games [0.7] デジタルゲームにおける収益化戦略には,長期ユーザライフタイム(LTV)予測が不可欠である。
現在のモデルは、しばしば長期的価値を過小評価する。
本稿では,短時間水平予測と順序保存レグレスを統合した新しいLTV予測フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:42:11 GMT)
Human and LLM Biases in Hate Speech Annotations: A Socio-Demographic Analysis of Annotators and Targets [0.7] 我々は、アノテータとターゲットの両方の社会デマトグラフィー情報を豊富なデータセットで活用する。
分析の結果,その強度と有病率に基づいて定量的に記述し,特徴付ける広範囲なバイアスの存在が明らかになった。
私たちの研究は、ヘイトスピーチアノテーションにおける人間のバイアスに関する新しい、そして、AI駆動のヘイトスピーチ検出システムの設計に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:34:56 GMT)
A Conjoint Graph Representation Learning Framework for Hypertension Comorbidity Risk Prediction [0.7] 糖尿病と冠動脈疾患のリスクを予測するためのコンジョイントグラフ表現学習フレームワークを開発した。
このフレームワークは、他の強力なモデルよりも精度の高い予測を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:33:39 GMT)
Persistent Topological Features in Large Language Models [0.7] トポロジカルな特徴である$p$次元の穴が層全体に持続し、進化していくかを測定するトポロジカル記述子を導入する。
このことは、プロンプトがどのように再配置され、それらの相対的な位置が表現空間で変化するかという統計的視点を与える。
ショーケースアプリケーションとして、レイヤプルーニングの基準を確立するためにzigzag Persistenceを使用し、最先端の手法に匹敵する結果を得る。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:39:35 GMT)
Flexible Tails for Normalizing Flows [0.7] テール変換フロー (TTF) はガウス基底分布と重テールを生成する最終変換層を用いる。
これは、重み付き入力下でのフローの正規化などのニューラルネットワークの最適化が困難であるため、パフォーマンスが低下する可能性がある、と我々は主張する。
実験により,本手法は,特にターゲット分布が大きな寸法あるいはテールウェイトである場合,現在の手法よりも優れることが示された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:26:13 GMT)
LeMON: Learning to Learn Multi-Operator Networks [0.7] シングルオペレータ学習では、特定のオペレータを学ぶために、ディープニューラルネットワークをトレーニングする。
マルチオペレータ学習における最近の研究は、演算子埋め込み構造を使用して、複数の演算子のデータ上で単一のニューラルネットワークをトレーニングしている。
マルチオペレータ学習を用いてPDEを解くための事前学習および微調整戦略を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:31:59 GMT)
Quantum AIXI: Universal Intelligence via Quantum Information [0.7] 量子および古典的レジスタとチャネルに基づく量子エージェント/環境相互作用のモデルを導入する。
我々は、量子情報の観点からAIXIの鍵成分を定式化し、量子コルモゴロフ複雑性とQAIXI値関数に関する以前の研究を拡張した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:20:25 GMT)
Context Is Not Comprehension [0.6] 私たちは、物語のカモフラージュの中に決定論的リストOps計算を埋め込んだベンチマークであるVerbose ListOpsを紹介します。
実験の結果、生のListOpsを約100%精度で解決するモデルは、わずか1万トークンの後にVLOで崩壊することがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:06:29 GMT)
A Time-Symmetric Quantum Algorithm for Direct Eigenstate Determination [0.6] 本研究では,ハミルトニアンの固有値問題に対処するために,非偏差型および時相対称量子アルゴリズムを提案する。
我々のアプローチは、基底状態と最高励起状態の両方の同時決定を可能にするとともに、ハミルトニアンの任意の固有状態の直接同定を可能にする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:46:29 GMT)
Optimizing brightness of SPDC source in Laguerre-Gaussian modes using type-0 periodically-poled nonlinear crystal [0.6] 自発的なパラメトリックダウンコンバージョンによって生成される光子対は、ラゲール・ガウスモード基底において絡み合いを示す。
このような自由空間量子通信において、量子光源の明るさは大気の乱流と光子損失のために重要な役割を果たす。
本研究では,0ppKTP結晶によって生成される特定のLGモードにおける光子対のスペクトルについて検討した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:20:00 GMT)
Extended Creativity: A Conceptual Framework for Understanding Human-AI Creative Relations [0.6] AIが創造的なプロセスに貢献する3つの主要なモードを特定します。
これらのモードは、サポート、シナジー、共生である。
理論的、倫理的、設計的な意味について論じる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:16:52 GMT)
Weaver: A Retargetable Compiler Framework for FPQA Quantum Architectures [0.6] Trapped Ions、Neutral Atoms(またはFPQA)、Silicon Spin Qubitsなど、新しい量子ハードウェア技術が登場している。
既存のコードをこれらの新興ハードウェアプラットフォームに効率的に適応できる、再ターゲット可能なコンパイラの必要性はますます高まっている。
最初に、パフォーマンスが高く、検証可能な再ターゲット可能な量子コンパイラフレームワークである$Weaver$を提示します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:48:51 GMT)
Understanding Human-AI Trust in Education [0.6] 本研究では,人間的・システム的信頼が学生の快楽,信頼的意図,使用に対する行動意図,有用性にどのように影響するかを検討する。
本研究は,人間とAIの信頼に特有な新たな理論的枠組みの必要性を浮き彫りにし,適切な信頼を育むための実践的な洞察を提供するものである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:06:57 GMT)
A hierarchical approach for assessing the vulnerability of tree-based classification models to membership inference attack [0.6] 機械学習モデルは、トレーニングデータの秘密プロパティを不注意に公開し、メンバシップ推論攻撃(MIA)に対して脆弱になる。
本稿では、脆弱な木に基づくモデルを効率的に同定するための2つの新しい補完的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:50:15 GMT)
Electron Scattering via Geometric and Dynamical Decoupling [0.5] 2つの電極に接続された1次元コヒーレント導体における電子の散乱行列を計算する方法を開発した。
特に、高エネルギー状態において、伝送行列はシステムのベリー作用素に収束することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:06:01 GMT)
MultiCoSim: A Python-based Multi-Fidelity Co-Simulation Framework [0.5] MultiCoSimはPythonベースのシミュレーションフレームワークで、ユーザーはシミュレーションコンポーネントを定義し、構成し、構成することができる。
CPSは本質的にハードウェア、ソフトウェア、物理プロセスを統合する。
既存のシミュレーションツールは、しばしば厳格な構成、自動化サポートの欠如、ポータビリティとモジュール性への障害を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:31:39 GMT)
RETUYT-INCO at BEA 2025 Shared Task: How Far Can Lightweight Models Go in AI-powered Tutor Evaluation? [0.5] BEA 2025共有タスクにおけるRETUYT-INCO参加について紹介する。
サイズが1B未満のモデルがこれらのタスクに競争力があることが分かりました。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:24:56 GMT)
DeepGDel: Deep Learning-based Gene Deletion Prediction Framework for Growth-Coupled Production in Genome-Scale Metabolic Models [0.5] 本稿では,ゲノム規模メタボリックモデルを用いた遺伝子欠失予測手法を提案する。
提案フレームワークは、ディープラーニングアルゴリズムを利用して、シーケンシャルな遺伝子を学習、統合し、データ表現を代謝する。
実験により,提案手法の有効性を実証し,ベースライン法よりも大幅に改善した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:02:42 GMT)
QuantMCP: Grounding Large Language Models in Verifiable Financial Reality [0.4] 大規模言語モデル(LLM)は、財務分析と意思決定に革命をもたらすという大きな約束を持っている。
しかし、その直接的な適用は、データ幻覚の問題や、リアルタイムで検証可能な財務情報へのアクセスの欠如によって、しばしば妨げられている。
本稿では,金融現実にLLMを厳格に活用するための新しいフレームワークであるQuantMCPを紹介する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:00:11 GMT)
Paired Completion: Flexible Quantification of Issue-framing at Scale with LLMs [0.4] 最小限の例を用いてコントラストフレームを検出する新しい手法である「ペア完備化」を導入する。
我々は、ペア化完了は、プロンプトベースおよび埋め込みベースの手法に代えて、コスト効率が高く、低バイアスであることを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:16:54 GMT)
Multi-entropy and the Dihedral Measures at Quantum Critical Points [0.4] 本稿の目的は、これらの量が具体的な例を調べることによって、量子臨界点の新しい有用なプローブであることを実証することである。
格子上の1+1$次元のマスレス自由スカラー場理論と横場イジングモデルにおける多エントロピーと二面体測度を計算する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:37:52 GMT)
Synchronization for Fault-Tolerant Quantum Computers [0.4] 量子誤り訂正 (Quantum Error Correction, QEC) は論理量子ビットに情報を確実に格納し、より信頼性の低い量子ビットに符号化する。
表面コードは物理エラーに対する高いレジリエンスで知られており、フォールトトレラント量子コンピューティング(FTQC)の第一候補である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:57:49 GMT)
Augmenting Large Language Models with Static Code Analysis for Automated Code Quality Improvements [0.4] 本研究では,大規模言語モデル(LLM)をソフトウェア開発に組み込んだコード問題検出と修正自動化について検討した。
静的コード分析フレームワークは、大規模なソフトウェアプロジェクトの中でバグや脆弱性、コードの臭いなどの問題を検出する。
検索拡張世代(RAG)は、リビジョンの関連性と精度を高めるために実装される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:39:25 GMT)
Towards Graph-Based Privacy-Preserving Federated Learning: ModelNet -- A ResNet-based Model Classification Dataset [0.4] 本稿では,事前学習したResNet50モデルから抽出した埋め込みから構築した新しい画像分類データセットであるModelNetを紹介する。
モデルパラメータを保存するために、トレーニング済みのResNet50モデルで3つのバリエーションのクライアント固有のサブセットをトレーニングします。
マルチドメイン画像データに加えて、匿名化モデルパラメータにアクセスできるFLアルゴリズムを定義する新しい仮説を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:15:56 GMT)
MAYA: Addressing Inconsistencies in Generative Password Guessing through a Unified Benchmark [0.4] 本稿では,生成パスワードゲスティングモデルのための統一的,カスタマイズ可能な,プラグイン・アンド・プレイベンチマークフレームワークMAYAを紹介する。
我々は6つの最先端のアプローチを総合的に評価し、標準化を確実にするために再実装し、適応した。
以上の結果から,これらのモデルが人間のパスワード分布の異なる側面を効果的に捉え,強力な一般化能力を示すことが示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:20:01 GMT)
Chain-of-Code Collapse: Reasoning Failures in LLMs via Adversarial Prompting in Code Generation [0.3] 大規模言語モデル(LLM)は複雑な推論を必要とするタスクにおいて顕著な成功を収めた。
これらのモデルは本当に理由があるのか、それとも浅い統計パターンを利用するだけなのか?
ここでは、意味論的に忠実だが逆向きに構造化された急激な摂動のスイートを導入することで、LCMの推論の堅牢性について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:47:31 GMT)
Advanced fraud detection using machine learning models: enhancing financial transaction security [0.3] 本研究では、現実世界のデータを用いて、クレジットカード取引異常や不正を検知するエンドツーエンドで機能豊富な機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:59:25 GMT)
NoLoCo: No-all-reduce Low Communication Training Method for Large Models [0.3] 大規模言語モデルのトレーニングは、一般的に数万のアクセラレータを含むクラスタ上で最適化手法によって行われる。
NoLoCoは、モデルウェイトをランダムに選択された他のウェイトと部分的に平均化することで、Nesterov運動量の新しい変種を介してモデルウェイトを暗黙的に同期させる。
提案手法は, 完全シャードデータ並列訓練や, 広範に使用されている低通信訓練であるDiLoCoよりも通信オーバーヘッドをはるかに少なくする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:23:23 GMT)
From Features to Graphs: Exploring Graph Structures and Pairwise Interactions via GNNs [0.2] グラフニューラルネットワーク(GNN)のための特徴グラフ構築における両面相互作用に着目し,その重要性について検討する。
我々は、GNNが機能間の相互作用を効果的にモデル化できるようにするために、相互作用する機能間のエッジが重要であることを明らかにした。
また、非相互作用エッジを含む場合、ノイズとして機能し、モデル性能を劣化させることも観察する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:38:56 GMT)
Solving Package Management via Hypergraph Dependency Resolution [0.2] HyperResは、ハイパーグラフを使用してバージョン付き依存性解決を記述するフォーマルなシステムである。
数十の既存のパッケージマネージャからHyperResへの変換を定義します。
これにより,パッケージマネージャの選択をユーザが変更する必要はなくなる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:18:30 GMT)
Single Block On [0.2] シングルブロックオン (Single Block On, SBO) は、ユーザが一度ブロックし、そのブロックをすべての統合アプリケーションに伝播させることができる統一システムである。
SBOは、IDベースのマッチングルール、類似性識別子のレベル、標準化されたプロトコルによるシステムとのインターフェースを介して動作する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:22:38 GMT)
Robustly Improving LLM Fairness in Realistic Settings via Interpretability [0.2] 現実的な文脈の詳細が導入されたとき、アンチバイアスプロンプトは失敗する。
企業名や公的キャリアページからの文化記述などの現実的なコンテキストの追加,選択的な雇用制限は,人種的および性別的偏見を著しく引き起こすことが判明した。
我々の内部バイアス緩和は人種や性別に関連する方向を特定し、推論時にアフィンの概念を編集する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:34:38 GMT)
A cavity array microscope for parallel single-atom interfacing [0.2] 本研究では,各原子がそれぞれの空洞に強く結合する実験プラットフォームである空洞アレイ顕微鏡を紹介する。
均一な原子空洞結合を実現し、ミリ秒の時間スケールで高速で非破壊的で並列な読み出しを示す。
我々の研究は多孔質QEDの体制を解き、原子配列による大規模量子ネットワークの未探索のフロンティアを開く。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:32:55 GMT)
Aspect-Based Opinion Summarization with Argumentation Schemes [0.1] 顧客が大量のレビューを乗り越え、手作業で重要な意見を結論付けるのは現実的ではない。
抽出的あるいは抽象的といった従来のアプローチは、基底的なアスペクト中心の要約を自動生成する際の課題に直面している。
提案する要約システムでは,エビデンスを裏付けるとともに,事前定義された側面の集合に頼らずに,様々な領域に適応する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:45:40 GMT)
Team QUST at SemEval-2025 Task 10: Evaluating Large Language Models in Multiclass Multi-label Classification of News Entity Framing [0.1] 本稿では,SemEval-2025 Task 7におけるQUST_NLPの関与について述べる。
ファクトチェックされたクレーム検索に特化して設計された3段階検索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:09:35 GMT)
QUST_NLP at SemEval-2025 Task 7: A Three-Stage Retrieval Framework for Monolingual and Crosslingual Fact-Checked Claim Retrieval [0.1] 本稿では,SemEval-2025 Task 7におけるQUST_NLPの関与について述べる。
ファクトチェックされたクレーム検索に特化して設計された3段階検索フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:06:40 GMT)
NeuralNexus at BEA 2025 Shared Task: Retrieval-Augmented Prompting for Mistake Identification in AI Tutors [0.1] 本稿では, BEA 2025共有タスクにおけるトラック1のミステイク同定システムについて述べる。
この課題は、教師の反応が学生の推論における誤りを正しく識別するかどうかを評価することである。
我々のシステムは意味的に類似した例を検索し、構造化されたプロンプトを構築し、生成可能な予測をスキーマ誘導解析する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:11:56 GMT)
Beyond Formal Semantics for Capabilities and Skills: Model Context Protocol in Manufacturing [0.1] 最近導入されたモデルコンテキストプロトコル(MCP)に基づく代替手法を提案する。
MCPは、LLMベースのエージェントによって直接消費可能な標準化されたインタフェースを通じて機能を公開できる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:02:16 GMT)
Joint Denoising of Cryo-EM Projection Images using Polar Transformers [0.1] 本稿では,Cryo-EM画像のクラスタリング,アライメント,デノイングを同時に行うことで,クラス平均化手法を拡張したトランスフォーマに基づくニューラルネットワークアーキテクチャを提案する。
その結果,SNRが0.03ドルで相対平均2乗誤差(MSE)のDNNを45%削減できることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:41:38 GMT)
mLaSDI: Multi-stage latent space dynamics identification [0.0] 近年,データ駆動型非侵入型ROMフレームワークとしてLatent Space Dynamics Identificationが提案されている。
マルチステージラテント・スペース・ダイナミクス同定(mLa)を提案する。
また,mLaを小さなオートエンコーダに適用すると,予測誤差や再構成誤差が小さくなり,Laと比較してトレーニング時間が短縮されることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:31:29 GMT)
Witnessing PPT entanglement via rank analysis of (sub)matrices [0.0] 両部量子状態におけるエンタングルメント検出のための新しい手法を開発した。
行列のランク1生成特性の違反を絡み合い基準として用いる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:46:55 GMT)
WIP: Exploring the Value of a Debugging Cheat Sheet and Mini Lecture in Improving Undergraduate Debugging Skills and Mindset [0.0] 本研究は, 準実験設計を用いた小規模マイクロエレクトロニクスのデバッグ教育介入の有効性について検討する。
実験群の学生は平均1:43の速さで、対照群よりも7%高い成功率を示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:19:50 GMT)
Vision Transformers for Multi-Variable Climate Downscaling: Emulating Regional Climate Models with a Shared Encoder and Multi-Decoder Architecture [0.0] 共有エンコーダと可変固有デコーダを用いたマルチタスク多変数ビジョントランス (ViT) アーキテクチャを提案する。
我々の多変量アプローチは、正のクロス変数な知識伝達を実現し、同一条件下で訓練された単変量ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:48:41 GMT)
ViLLa: A Neuro-Symbolic approach for Animal Monitoring [0.0] この研究は、解釈可能な動物モニタリングのために設計されたニューロシンボリックなフレームワークであるViLLaを紹介する。
ViLLaは、画像中の動物とその空間的位置を識別するための視覚的検出モジュール、自然言語クエリを理解するための言語、そしてそれらのクエリに論理ベースの推論を適用するシンボリック推論レイヤを統合する。
エンドツーエンドのブラックボックスモデルとは異なり、ViLLaは知覚、理解、推論を分離し、モジュール性と透明性を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:57:25 GMT)
Upper bounds on the Holevo quantity arising from the fundamental entropic inequality [0.0] 我々は最近の[arXiv:2408.15306]における基本的なエントロピーの不等式が、量子状態の離散的かつ連続的なアンサンブルのホレボ量に対する有用な関係を得るためにどのように応用できるかを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:59:00 GMT)
Upper Bound on Quantum Fisher Information in Pseudo-Hermitian Systems [0.0] 我々は、擬エルミート・ハミルトニアンの曲面ヒルベルト空間上で定義される量子フィッシャー情報の共変定式化を開発する。
このフレームワークは状態規範の保存を保証し、パラメータの感度を一貫した処理を可能にする。
擬エルミート系における量子センシングがエルミート系よりも優越性を示すための基準を同定する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:40:05 GMT)
Unsupervised Protoform Reconstruction through Parsimonious Rule-guided Heuristics and Evolutionary Search [0.0] 我々のモデルは、コグネート集合からプロトフォームを推測するために、データ駆動推論とルールベースの推論を統合する。
我々は,5つのロマンス語からのコニャートのデータセットを用いて,ラテン文字の復元作業について評価した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:58:06 GMT)
Universal gates for a metastable qubit in strontium-88 [0.0] ボソニックストロンチウム88の準安定微細構造量子ビットの普遍ゲートセットを特徴付ける。
我々は損失を補正した後、0.993のシングルキュービットゲートフィデリティと0.9945(6)の2キュービットゲートフィデリティを求める。
この結果から, ストロンチウム微細構造量子ビットが, 短期的誤差補正量子コンピュータの候補となる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:03:37 GMT)
Universal Neural Optimal Transport [0.0] UNOT(Universal Neural Optimal Transport、Universal Neural Optimal Transport)は、OT距離を正確に予測できる新しいフレームワークである。
我々のネットワークはSinkhornアルゴリズムの最先端の初期化として使用でき、最大7.4times$の高速化が可能であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:03:45 GMT)
Time-domain field correlation measurements enable tomography of highly multimode quantum states of light [0.0] 時間領域の二次相関測定に基づくトモグラフィー手法を提案する。
再建可能なモードの数は、使用した時間遅れの数に応じて増加することを示す。
検出中の量子状態の熱化が相関測定の要求にどのように結びつくかを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:35:36 GMT)
Thermalization and irreversibility of an isolated quantum system II [0.0] 拡散非平衡状態情報の消去による絡み合いエントロピーの不可逆的な成長を数値的に示す。
我々の研究は、熱力学の第2法則、したがって統計物理学におけるエルゴード仮説が量子情報の観点から理解され、証明できることを実証している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:19:26 GMT)
The metric from energy-momentum non-conservation: Generalizing Noether and completing spectral geometry [0.0] 我々は、多様体の形状、すなわちメートル法は、軽くタップすると共鳴音から再構成可能であることを示す。
この発見はネーターの定理の一般化をもたらす: 一般曲線時空上のエネルギー-運動量非保存の特定のパターンは計量を計算するのに十分である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:00:00 GMT)
The Urban Model Platform: A Public Backbone for Modeling and Simulation in Urban Digital Twins [0.0] オープンな都市モデルプラットフォームは、都市デジタル双生児のモデリングとシミュレーションのためのパブリックな技術バックボーンとして機能することを発見した。
このようなプラットフォームはオープン標準に基づいて構築され、モデルの分散統合を可能にし、都市システムを表現するためのマルチモデルアプローチをサポートする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:58:10 GMT)
The Saturation Point of Backtranslation in High Quality Low Resource English Gujarati Machine Translation [0.0] バックトランスレーションBTは低リソース機械翻訳MTにおいてモノリンガルコーパスを用いた追加の合成訓練データを生成するために広く利用されている。
多言語事前学習MBART50モデルを用いた英語グジャラート翻訳における逆翻訳の有効性について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:02:53 GMT)
The Role of Generative AI in Facilitating Social Interactions: A Scoping Review [0.0] 社会的つながりの低下は精神的な健康、寿命、一般的な幸福を脅かす。
大規模言語モデル(LLM)や画像生成ツールなどのジェネレーティブAI(GAI)技術は、人間の社会体験の向上を目的としたアプリケーションに統合されつつある。
彼らの存在感は増しているが、これらの技術が社会的相互作用にどのように影響するかはほとんど分かっていない。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:37:19 GMT)
The Diósi-Penrose model of classical gravity predicts gravitationally induced entanglement [0.0] 古典重力のDi'osi-Penrose(DP)モデルの力学は、2つの異なる粒子の機械的自由度を絡み合わせることができることを示す。
重力誘起エンタングルメント(GIE)の標準的な実験では、粒子が制限値$d_cよりも小さい距離で分離されている場合に限り、エンタングルメントが生成される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:10:13 GMT)
The Biased Samaritan: LLM biases in Perceived Kindness [0.0] 大規模言語モデル(LLM)は、多くの分野で広く普及している。
本稿では,様々な生成AIモデルの階層バイアスを評価するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:33:42 GMT)
The Alignment Trap: Complexity Barriers [0.0] 表現力EXP$(m)$以上のAIシステムの場合、安全性検証には指数時間が必要であり、coNP完全であることを示す。
AI開発は、検証可能な安全性を維持するためにシステムの複雑さを制約し、スケーリング能力中に検証不可能なリスクを受け入れるか、検証以上の基本的な新しい安全パラダイムを開発するか、どちらかを結論付けます。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:30:30 GMT)
Technical Report with Proofs for A Full Picture in Conformance Checking: Efficiently Summarizing All Optimal Alignments [0.0] この技術的報告は、論文"A Full Picture in Conformance Checking: Efficiently Summarizing All Optimal Alignments"の中で、主張の証明を提供する。
この技術的報告は、論文"A Full Picture in Conformance Checking: Efficiently Summarizing All Optimal Alignments"の中で、主張の証明を提供する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:47:06 GMT)
System Identification Using Kolmogorov-Arnold Networks: A Case Study on Buck Converters [0.0] Kolmogorov-Arnold Networks (KAN) は、解釈可能で効率的なシステム識別のための強力なフレームワークとして出現している。
本稿では, バックコンバータシステムの力学をモデル化し, 解析するためのkansの適用について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:35:30 GMT)
Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications [0.0] 本稿では,マルチエージェントシステムによるアスペクトの特定と評価を目的とした探索的研究の結果を報告する。
システムアーキテクチャとプロトタイプは、以前の研究から拡張され、マルチエージェントシステムのための仕様が導入された。
サイバーセキュリティタスクを含むテストケースは、アーキテクチャと評価アプローチの実現可能性を示している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:16:17 GMT)
Spacetime quantum mechanics for bosonic and fermionic systems [0.0] 我々は、空間と時間が等しい足場で扱われる量子力学に対するヒルベルト空間アプローチを提供する。
これらの状態は、時間的相関の概念によって実現された定常作用の量子原理の解であることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:27:19 GMT)
Sequential transmission at short times [0.0] 量子チャネルのn倍の合成により,情報を短時間で送信・保存することが可能であることを示す。
ネットワークにおけるノイズの主源であると考えられる無限次元純粋損失チャネルに対して、正確な誤差を導出する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:48:59 GMT)
Semi-Automated Quality Assurance in Digital Pathology: Tile Classification Approach [0.0] 品質保証は、デジタル病理学において重要だが未調査の分野である。
人工物はAI診断モデルの性能に悪影響を及ぼすことが示されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:30:34 GMT)
Self-learning signal classifier for decameter coherent scatter radars [0.0] 提案手法は, 得られたレーダデータ, 電離層における電波伝搬の自動モデリング結果, モデルの品質を推定するための数学的基準に基づく。
このモデルは、SuperDARNとSECIRAの12のレーダーで得られたデータを、レーダー毎に2年以上にわたって訓練する。
クラスを特定するための最も重要なパラメータは、後半の信号線追跡軌道の形状、散乱高さ、レーダーによって測定されたドップラー速度である。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:32:10 GMT)
Scalable Software Testing in Fast Virtual Platforms: Leveraging SystemC, QEMU and Containerization [0.0] HW/SWシステムの継続的な複雑化は、特に自動車のような安全クリティカルな領域において、永続的な課題を示している。
これを解決するため、SystemC TLM-2.0標準に基づいた仮想プラットフォーム(VP)が重要なソリューションとして登場した。
本稿では,コンテナ化を活用してVPをカプセル化し,環境依存性を低減し,クラウド展開を可能にするアプローチを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:08:53 GMT)
Saturable nonlinearity induced quantum correlations in optomechanics [0.0] 我々は、オプトメカニカルシステムにおいて量子相関を誘導するスキームを提案する。
非線形性をオンにすることで、ゲインとロスをオンにすることで、量子絡みと量子ステアリングの両方を柔軟に生成することができる。
この研究は、室温でも量子相関を解くために非線形飽和効果を用いることを示唆している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:59:28 GMT)
SLICK: Selective Localization and Instance Calibration for Knowledge-Enhanced Car Damage Segmentation in Automotive Insurance [0.0] SLICKは、正確で堅牢な自動車損傷セグメンテーションのための新しいフレームワークである。
セグメンテーション車両部品の外科的精度を達成するために、構造的先行によって導かれる高精細なセマンティックバックボーンを使用する。
また、クラッシュデータ、部分幾何学、および現実の保険データセットを統合して、稀なケースを効果的に改善および処理する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:49:29 GMT)
Roughening Transition in Quantum Circuits [0.0] 3+1次元クリフォード回路モデルにおける絡み合い膜のランダム性誘起粗化遷移について検討した。
我々は、格子面から傾いた膜に対するスケーリング理論を構築し、新しいスケーリング形式を発見し、未発見の臨界「タイル付き状態」へのクロスオーバーを行う。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:00:00 GMT)
Rethinking Random Masking in Self Distillation on ViT [0.0] 本研究は,DINOフレームワークに焦点をあて,自己蒸留におけるランダムマスキングの役割に焦点を当てた。
具体的には、学生のローカルな視点と教師のグローバルな視点を元の、マスキングされていない形で保ちながら、学生のグローバルな視点にのみランダムマスキングを適用する。
ミニ画像Netデータセット上でDINO-Tinyを用いてアプローチを評価し、この非対称な設定下でのランダムマスキングにより、より堅牢できめ細かな注意マップが得られ、最終的に下流の性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:19:07 GMT)
Reasoning Isn't Enough: Examining Truth-Bias and Sycophancy in LLMs [0.0] 本研究は,大規模言語モデルの精度検出能力について,これまでで最大評価を行ったものである。
真理バイアスの率、あるいは主張が真であると信じる確率は、推論モデルでは非推論モデルよりも低い。
最も関係のあるのは、いくつかの高度なモデルにおいて、梅毒の傾向を特定することである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:19:36 GMT)
Ray Optics Approach to Holography [0.0] 最適輸送を用いた効率的な最適化アルゴリズムを提案する。
我々のアプローチは相渦の生成を完全に回避する。
本手法は, 未知の二次位相系の位相空間変換の検索に利用できることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 22:57:17 GMT)
Quantum state preparation via piecewise QSVT [0.0] 効率的な量子アルゴリズムを実装するためには、効率的な状態準備が不可欠である。
このような状態を量子特異値変換を用いて効率的に生成する方法を示す。
このウィンドウ状態は、最先端のKaiserウィンドウ状態よりも50倍少ないToffolisを準備する必要があることを実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:48:43 GMT)
Quantum Computing and Cybersecurity in Accounting and Finance: Current and the Future Challenges and Opportunities for Securing Accounting and Finance Systems [0.0] この論文の目的は、サイバーセキュリティを考慮に入れた量子技術の応用を示すことである。
文献レビューでは、現在の量子攻撃に対するサイバーセキュリティの脆弱性が明らかにされている。
この研究は、将来の会計・金融システムの確保には、量子耐性アルゴリズムと量子鍵分布(QKD)が必要であると結論付けている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:15:55 GMT)
Quantum Complexity and Chaos in Many-Qudit Doped Clifford Circuits [0.0] 奇素次元$d$のクォーディットに作用するドッピングクリフォード回路における量子複雑性とカオスの出現について検討する。
ドッピングされたクリフォード・ウィンガルテン計算とレプリカテンソルネットワーク形式を用いて、正確な結果を導き、大規模シミュレーションを行う。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:54:01 GMT)
Quantifying coherence of quantum channels based on the generalized $α$-$z$-relative Rényi entropy [0.0] 一般化された$alpha$-$z$-relative R'enyiエントロピーに基づく量子チャネルのコヒーレンス尺度を提案する。
また、チャネルと完全に強調されたチャネル間の可換性を定量化することにより、量子チャネルの別のコヒーレンス尺度も提示する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:10:14 GMT)
Primender Sequence: A Novel Mathematical Construct for Testing Symbolic Inference and AI Reasoning [0.0] 素数列(英: Primender sequence)は、古典的な素数列とモジュラーディジットに基づく条件を組み合わせた新しい整数列である。
本稿では,大規模言語モデルの記号的推論能力を評価するためのベンチマークとして,このシーケンスを提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:21:58 GMT)
Prediction of steady states in a marine ecosystem model by a machine learning technique [0.0] 我々は,地球規模の海洋生態系モデルのためのスピンアップによって得られた定常状態の事前計算をトレーニングデータとして利用する。
これらの予測は, 当初のスピンアップデータと同一の年次周期性に到達しないことを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:28:00 GMT)
Predicting function of evolutionarily implausible DNA sequences [0.0] 我々はNullsettesと呼ばれる一連の予測タスクを導入し、モデルが機能不全の突然変異を予測する能力を評価する。
変異効果予測性能は非変異体の予測可能性と強く相関していることがわかった。
強いモデル性能の予測可能な確率値の範囲は、シーケンス長に大きく依存する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:28:04 GMT)
Practical Improvements of A/B Testing with Off-Policy Estimation [0.0] 従来の手法よりも分散度を低くする非バイアスのオフ・ポリティクス推定器のファミリーを導入する。
提案手法の有効性と実用性を理論的に検証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:11:01 GMT)
PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis [0.0] Patch-based Visual Interpretable Prototypes は,画像認識のための本質的に解釈可能な原型モデルである。
PiPViTは、パッチ間の長距離依存関係をキャプチャして、堅牢で人間の解釈可能なプロトタイプを学ぶ。
網膜 OCT 画像分類における PiPViT の評価を行った。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:58:43 GMT)
PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications [0.0] PhysNav-DGは、古典的なセンサー融合と視覚言語モデルのセマンティックパワーを統合する新しいフレームワークである。
我々のデュアルブランチアーキテクチャは、マルチセンサー入力からナビゲーション動作を予測し、同時に詳細なチェーン・オブ・シークレットの説明を生成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:18:24 GMT)
Performance Analysis and Deployment Considerations of Post-Quantum Cryptography for Consumer Electronics [0.0] 量子コンピューティングは消費者電子(CE)のセキュリティ基盤を脅かす
本稿では、主要な量子抵抗暗号(PQC)方式の総合的なクロスプラットフォーム性能解析について述べる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:43:12 GMT)
Perfect state transfer between real pure states [0.0] 純状態は、単位ベクトルで表される$mathbbCn$の1次元部分空間に対応する。
我々は、量子スピンネットワークを表すグラフのハミルトニアンとして、隣接性を重視した実純粋状態とラプラシア行列の間の完全状態伝達(PST)理論を開発する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:37:03 GMT)
Overtone Rabi oscillation of optically polarized triplet electron spins and nuclear hyperpolarization in powder [0.0] 光偏光三重電子スピンのコヒーレントオーバートーンRabi発振と室温における粉末試料中の核過分極について報告する。
ペンタセンドープされたテキチプテルフェニルとNV$-$中心の微小ダイヤモンドでは、オーバトンラビの発振が観察される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:01:17 GMT)
On feature selection in double-imbalanced data settings: a Random Forest approach [0.0] 本稿では,最小深度に基づく特徴選択のための新しいしきい値決定手法を提案する。
シミュレーションおよび実世界のデータセットに関する実験により、提案手法は変数のより類似的で正確な部分集合を生成することを示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:37:57 GMT)
On a dynamic ontic wave model of quantum collapse and measurement [0.0] この研究は、物理的に空間的に拡張された波動場として量子実体の新しいモデルを導入する。
これは量子測定と崩壊のための現実主義の枠組みの基礎を形成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:29:39 GMT)
Novel RL approach for efficient Elevator Group Control Systems [0.0] エンドツーエンド強化学習(RL)エレベータ制御システム(EGCS)を訓練する。
主なイノベーションは、エレベーターディスパッチの複雑さを扱う新しいアクションスペースエンコーディングである。
提案したRLに基づくEGCSは,変動パターンに適応し,交通環境から学習し,従来のルールベースアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:54:59 GMT)
Non-Abelian dynamics on a cube: improving quantum compilation through qudit-based simulations [0.0] 標準模型に関する格子ゲージ理論をデジタル量子コンピュータにマッピングする最近の発展は、連続体に対する明確に定義された量子コンパイル課題を伴うスケーラブルな経路を同定している。
デジタル化ゲージ場を符号化するためにquditレジスタを用いたSU(2)格子ゲージ理論のシミュレーションに対処する。
立方体上の実時間量子化SU(2)ダイナミクスのエンドツーエンドシミュレーションを実演する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:49:08 GMT)
NeuroPAL: Punctuated Anytime Learning with Neuroevolution for Macromanagement in Starcraft: Brood War [0.0] 進化的学習の効率を向上させるために、神経進化的トポロジ(NEAT)とPunctuated Anytime Learning(PAL)を統合した神経進化的フレームワークであるNeuroPALを紹介する。
我々は、StarCraft: Brood Warの固定マップ・シングルレースシナリオでNeuroPALを評価し、その性能をNEATベースのトレーニングと比較した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:19:27 GMT)
Modeling Athermal Phonons in Novel Materials using the G4CMP Simulation Toolkit [0.0] 超伝導デバイスにおけるフォノンと電荷の伝播を理解することは、低閾値暗黒物質探索と超伝導量子ビットの相関誤差の制限の両方において重要な役割を果たす。
ダークマターや量子コンピューティングのコミュニティが関心を持つ多くの新しい基板材料へのフォノン輸送能力を拡張するためのフレームワークを提案する。
本研究では,これらの材料のフォノン輸送特性の生成にこの枠組みを用いることを実証し,これらの特性を利用可能な実験値と比較する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:47:51 GMT)
Mitigating shot noise in local overlapping quantum tomography with semidefinite programming [0.0] 還元密度行列(Reduced density matrices, RDM)は、量子情報処理の基本である。
本稿では,RDMの制約を再強化することにより,物理性雑音を軽減する手法を提案する。
提案手法は, 互換性制約のないトモグラフィと比較して, 平均的, 厳密な測定値が得られる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:05:47 GMT)
Mimicking Human Intuition: Cognitive Belief-Driven Reinforcement Learning [0.0] 認知的信念駆動型強化学習(CBD-RL)に着想を得た革新的枠組みを提案する。
CBD-RLは、従来の試行錯誤学習をより構造化され、ガイド付き学習パラダイムに変換し、人間の推論プロセスをシミュレートする。
本フレームワークの具体的実装であるCBDQ,CBDPPO,CBDSACは,離散的かつ連続的な動作空間において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:01:47 GMT)
Military AI Cyber Agents (MAICAs) Constitute a Global Threat to Critical Infrastructure [0.0] 地政学とサイバー空間の性質がMAICAを破滅的なリスクにする理由を説明する。
脅威を抑えるために、政治的、防衛的なAIと類似のレジリエンス対策を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:51:06 GMT)
Metadata practices for simulation workflows [0.0] 本稿では,ソフトウェアやハードウェアに依存しないメタデータの取得と処理に関する一般的な実践について述べる。
1) メタデータを記録、保存し、2) メタデータを選択し、構造化する。
概念実証として、我々は第2段階を支援するPythonツールであるArchivistを開発し、それを使って、神経科学や水文学などの高性能コンピューティングユースケースに私たちのプラクティスを適用します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:35:26 GMT)
Med-URWKV: Pure RWKV With ImageNet Pre-training For Medical Image Segmentation [0.0] 医用画像のセグメンテーションは、コンピュータ支援診断と治療における基礎的かつ重要な技術である。
本稿では,U-Netフレームワーク上に構築された純粋なRWKVベースのアーキテクチャであるMed-URWKVを提案する。
Med-URWKVは、スクラッチから訓練された他の慎重に最適化されたRWKVモデルと比較して、同等またはそれ以上のセグメンテーション性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:19:18 GMT)
Many-Body Neural Network Wavefunction for a Non-Hermitian Ising Chain [0.0] 非エルミート量子系(NH)は、オープン量子系を記述するための強力なフレームワークとして登場した。
本稿では,複素スペクトルを持つパリティ時間対称一次元NH横場イジングモデルの基底状態特性について検討する。
NNに基づく多体波動関数を構築し,小システムサイズモデルにおける基底状態特性の復元によるアプローチの有効性を検証した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:42:41 GMT)
Majorana Signatures in the Tripartite Uncertainty Relations with Quantum Memory [0.0] 超伝導体を通した第2の量子ドットと相関した1つの量子ドット上で行った測定の不確かさについて検討した。
マヨラナ準粒子は不確実性が最小限の下界に達することを証明している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:10:06 GMT)
Like a coin spinning in the air: the effect of (non-)metaphorical explanations on comprehension and attitudes towards quantum technology [0.0] 量子技術の基盤となる科学の複雑さは、その民主化に障壁をもたらす可能性がある。
本研究では,比喩が量子技術に対する理解と形状の態度を改善するかを検討した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:05:57 GMT)
Leveraging 6DoF Pose Foundation Models For Mapping Marine Sediment Burial [0.0] この研究はPoseIDONと呼ばれるコンピュータビジョンパイプラインを導入し、ROVビデオから6度の自由物体のポーズと周囲の海底の向きを推定する。
この方法はサンペドロ盆地の歴史的な海溝で記録された砲身や弾薬を含む54の物体の映像を用いて検証されている。
このアプローチは、スケーラブルで非侵襲的な海底埋没のマッピングを可能にし、汚染された場所での環境評価を支援する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:21:00 GMT)
Learning Chaotic Dynamics with Neuromorphic Network Dynamics [0.0] 本研究では,力学系であるニューロモルフィックネットワークを用いて動的システムを学習し,モデル化する方法について検討する。
本研究で使用されるニューロモルフィック・ネットワークは,入力された電気信号に対するニューロシナプス非線形応答を生じさせる旋律素子からなる複雑な電気回路に基づいている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:50:55 GMT)
LLM-Driven Personalized Answer Generation and Evaluation [0.0] 個人学習者のニーズに適応したパーソナライゼーションは,学習経験の向上に不可欠である。
本稿では,学習者の質問に対するパーソナライズされた回答を生成するために,LLM(Large Language Models)の可能性について検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:46:15 GMT)
Kilometer-Scale Ion-Photon Entanglement with a Metastable $^{88}$Sr$^{+}$ Qubit [0.0] エンタングメントは、光子を2.8:$kmの 商業繊維で送った後に持続する 都市環境に展開された
その結果、ストロンチウムイオンは1092:$nmの原子遷移に基づく大都市圏の量子ネットワークの候補として期待されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:01:18 GMT)
Kibble-Zurek dynamical scaling hypothesis in the Google analog-digital quantum simulator of the $XX$ model [0.0] 量子位相遷移のアナログデジタル量子シミュレーションにおいて、ハミルトンランプを2次元二乗格子の準長距離秩序相にシミュレートする。
その結果, ランプ時間の増加に伴う相関長の増大が飽和し, ランプ時間に対する励起エネルギーの依存性が, 断熱遷移のパワー-ロー減衰特性に交わる場合, 断熱的有限サイズ効果が長いランプ時間において支配的であることがわかった。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:50:12 GMT)
Isotope-agnostic motional ground-state cooling of neutral Yb atoms [0.0] フェルミオン型171ドルYbおよびボゾン型174ドルYb原子を2次元および3次元光学格子で直接冷却することを示した。
我々は,空間トラップの不均一性の影響を緩和するために,クロックレーザー周波数を洗浄するサイドバンド冷却方式を開発した。
同じスキームを3Dで適用すると、$barnsimeq0.15$は垂直方向の層間不均一性によって制限される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:53:06 GMT)
Intelligent Automation for FDI Facilitation: Optimizing Tariff Exemption Processes with OCR And Large Language Models [0.0] 本稿では,光学的文字認識 (OCR) と大規模言語モデル (LLM) 技術を活用することにより,税務管理を強化する概念的枠組みを提案する。
国家行政の利益には、運用能力の大幅な向上、管理負荷の削減、管理環境の強化などが含まれる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:20:38 GMT)
Inferring Quantum Network Topologies using Genetic Optimisation of Indirect Measurements [0.0] 我々は外部プローブを用いて連続時間量子ウォークの文脈でネットワークトポロジーを推定する。
プローブは励起の減衰チャネルとして機能し、ネットワーク力学の間接的な測定を行うと解釈できる。
本研究では,プローブ数の増加が再構成作業を大幅に単純化し,プローブ数と計算能力とのトレードオフを明らかにした。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:46:41 GMT)
Improved quantum algorithm for calculating eigenvalues of differential operators and its application to estimating the decay rate of the perturbation distribution tail in stochastic inflation [0.0] 微分作用素 $mathcalL$ の最初の固有値を $mathbbRd$ 上で推定する量子アルゴリズムを提案する。
次に、量子インフレーション(quantum inflation)として知られる宇宙のインフレーションの理論的枠組みにおける問題への我々の方法の適用について考察する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 04:21:12 GMT)
Homogeneous Free-Standing Nanostructures from Bulk Diamond over Millimeter Scales for Quantum Technologies [0.0] ダイヤモンド中の光アドレス可能なスピン量子ビットに基づく量子デバイスは、量子センシングや通信といった量子技術のための有望なプラットフォームである。
我々はこのハードルに、単結晶ダイヤモンドからミリスケール、細い(70nmまで)、高い並列膜を作り出すアプローチで取り組む。
膜は汚染のないままであり、最先端の量子応用で必要とされる原子的に滑らかな表面を持つ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:00:25 GMT)
High-resolution efficient image generation from WiFi CSI using a pretrained latent diffusion model [0.0] WiFi CSI測定から物理環境の画像を生成する新しい方法であるLatentCSIを提案する。
本手法は軽量ニューラルネットワークを用いてCSI振幅を直接LCMの潜在空間にマッピングする。
次に、復号化前のテキストベースガイダンスを用いて、LCMの復号化拡散モデルを潜在表現に適用する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:47:23 GMT)
High-fidelity single-spin shuttling in silicon [0.0] 電気ゲート電位を用いた異方性精製Si/SiGeヘテロ構造中の電子のシャットリングを報告する。
これにより、平均忠実度99.5%の200 ns以下の有効距離10$mu$mで電子を転位させることができる。
これらの結果は,大規模半導体量子プロセッサの実現に向けた今後の取り組みを導くものである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:31:21 GMT)
Hierarchical Adversarially-Resilient Multi-Agent Reinforcement Learning for Cyber-Physical Systems Security [0.0] 本稿では,階層型適応型レジリエントなマルチエージェント強化学習フレームワークを提案する。
このフレームワークには、進化するサイバー脅威をシミュレートし予測するために設計された敵の訓練ループが含まれている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 01:38:25 GMT)
Hardness-dependent quantum adiabatic schedules for the maximum-independent-set problem [0.0] 本稿では,アナログ量子コンピューティングのための高効率な断熱スケジュールを設計するための数値解析手法を提案する。
最適なスケジュールは、主に問題の大きさよりも、問題の硬さに依存していることを示す。
これにより、結果をより大きなグラフに外挿し、QuEraの256量子ビットAquilaコンピュータを用いて適度に難しい問題を解くことができる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:05:58 GMT)
Giant Atom with Disorders [0.0] 巨大原子に関連する現象に対する障害の影響について検討する。
巨大原子関連現象はマルコフ体制における結合位置と強度の両方の障害に対して堅牢であることがわかった。
我々の研究は、巨大原子系のBICのような非マルコフ現象を観測するためには、結合位置の障害を制御するためにより精密な制御が必要であることを示している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:54:37 GMT)
Geometry of Configuration Mixing in Bose-Fermi Systems [0.0] 構成混合を伴う相互作用するボソンフェルミオンモデルの幾何学的解釈を示す。
この定式化はボース・フェルミ行列コヒーレント状態に基づいており、奇質量Nb原子核における中間量子形状相転移と形状共存の洞察を得るために応用される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:50:25 GMT)
Generative Algorithms for Wildfire Progression Reconstruction from Multi-Modal Satellite Active Fire Measurements and Terrain Height [0.0] WRF-SFIREによる歴史的山火事のシミュレーションにより, 条件付きジェネレーティブ・アドリアル・ネットワークを訓練した。
火災発生時刻を簡潔に表現し、WRF-SFIREソリューションに近似観測演算子を適用して訓練用測定値を求める。
このモデルは、到着時刻、測度、地形の逆転を訓練し、一度訓練された場合、実際の火災の測定とそれに対応する地形データを利用して、到着時刻のサンプルを生成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 06:54:51 GMT)
Free Probability in a Minimal Quantum Circuit Model [0.0] 量子力学の最小回路モデルにおける高次外乱相関器(OTOC)のダイナミクスについて検討する。
我々は、高次OTOCの指数的崩壊を証明し、関連する時間スケールを完全に特徴づける。
このアプローチと関連する影響行列は、より一般的な設定で適用されることが期待される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:00:11 GMT)
Formalising Software Requirements using Large Language Models [0.0] プロジェクトは、形式仕様のトレーサビリティと検証における課題に対処する。
システムの実装と検証を通じて、正式な仕様の自動生成と、初期ソフトウェア設計段階からの要求のトレーサビリティをサポートする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:55:01 GMT)
Exploring Topological Effects in Thin-Film X-Ray Cavities [0.0] 単一X線光子の量子制御は、共鳴核の層が埋め込まれた薄膜ナノ構造キャビティを用いて達成できる。
薄膜キャビティの反射率スペクトルにおいてトポロジカルエッジ状態の存在を同定できることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:27:10 GMT)
Exact S-matrices for higher dimensional representations of generalized Landau-Zener Hamiltonians [0.0] より高スピンな一般化は、正確に解ける散乱行列をもたらすことを示す。
これまでに知られていなかった6次元および8次元のランダウ・ツェナーモデルを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:20:43 GMT)
Entanglement in the symmetric subspace: mapping multipartite to bipartite states [0.0] 我々は、N-量子対称状態を、より高い局所次元の2部対称状態にマッピングする。
このマッピングは分離性を保ち、元のマルチパーティイト状態の絡み合いを特徴付けることができることを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 23:12:34 GMT)
Enhancing Glass Defect Detection with Diffusion Models: Addressing Imbalanced Datasets in Manufacturing Quality Control [0.0] 工業用ガラス製造における視覚欠陥検出は、欠陥製品の頻度が低いため、依然として重要な課題である。
本稿では, 差動拡散確率モデル(DDPM)を用いて, データ拡張のための合成欠陥ガラス製品画像を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:14:02 GMT)
Engineering and harnessing long-range interactions for atomic quantum simulators [0.0] このような長距離相互作用のさらなる工学化に向けたコールド原子コミュニティの進歩が,基礎的な多体問題の新たなシステマティクスのシミュレーションをいかに促進したかを示す。
我々は、凝縮物質現象のシミュレーションから格子ゲージ理論の研究まで、そのようなプラットフォームが新たな洞察を提供することのできる様々な分野を紹介した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:31:05 GMT)
Energy Aware Camera Location Search Algorithm for Increasing Precision of Observation in Automated Manufacturing [0.0] カメラのワークスペースを探索し,最適な位置を探索するために,カメラの移動ポリシーのためのアルゴリズムを提案する。
単純なブルートフォースアプローチとは異なり、このアルゴリズムは環境学習から探索ポリシーを適用することで、より効率的に空間を探索することができる。
自動製造アプリケーションがシミュレーションされ, 得られた結果は, 限られたエネルギーで観測精度が向上したことを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 00:32:39 GMT)
Encoding call-by-push-value in the pi-calculus [0.0] 我々は,push-value-calculus (CBPV) の pi-i-calculus における Levys コール・バイ・プッシュ・バリュー・カルカス(CBPV) の符号化を定義し,符号化が健全かつ完全であることを証明した。
我々は、音性、完全性、および全ての必要な補題の非公式な(手で)証明を提示する。
本稿では,p-i-calculus における CBPV のエンコーディング,非同期なpolyadic pi-calculus および局所的なpi-calculus を含む。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:21:36 GMT)
Empirical and computer-aided robustness analysis of long-step and accelerated methods in smooth convex optimization [0.0] 本研究は, 勾配計算における相対的不完全性を考慮した一階最適化手法のロバスト性を評価する。
相対的不正確性は、少ない情報ビットを用いて勾配を圧縮する際に起こる。
どちらの加速法も予想よりもはるかに頑健であり, 短縮係数が長ステップ法に大きく寄与することが観察された。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:23:35 GMT)
Dressed to Gamble: How Poker Drives the Dynamics of Wearables and Visits on Decentraland's Social Virtual World [0.0] Decentralandはブロックチェーンベースのソーシャルバーチャルワールドで、ユーザーはアバターをカスタマイズするためにウェアラブルを公開、販売することができる。
サードパーティーのDecentral Gamesでは、同社のフラッグシップゲームICE Pokerのプレイヤーが、特定のウェアラブルを持っていれば暗号通貨を稼ぐことができる。
本稿では,DGとそのゲームがウェアラブルのダイナミクスや世界訪問にどのように影響するかを包括的に研究する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:43:16 GMT)
Domain-Constrained Diffusion Models to Synthesize Tabular Data: A Case Study in Power Systems [0.0] プライバシーやセキュリティ、法的障壁に対する懸念が高まり、医療、金融、エネルギーといった分野にまたがる合成データの需要が高まっている。
本稿では,ドメイン制約を直接生成プロセスに統合する誘導拡散モデルを用いてデータを合成する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:39:28 GMT)
Determining the $^3$P$_0$ excited-state tune-out wavelength of $^{174}$Yb in a triple-magic lattice [0.0] アルカリ-アース(-様)原子におけるクロック状態対のチューニング波長は、最大状態選択トラップ条件を提供する。
我々はメタスタブルな3$P$_0$クロック状態の波長を519.920(9)$THzで174$Ybで測定した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:45:14 GMT)
Detection of obstructions in oil and gas pipelines: machine learning techniques for hydrate classification [0.0] 本研究では,フロー保証問題の検出と緩和に教師付き機械学習技術を用いる。
主な焦点は、石油生産システムにおけるガスハイドレート生成の防止である。
提案手法は, 運転条件下での水和物生成を効果的に分類する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:30:14 GMT)
Decoherence-free measurement of wavefunction collapse with interferometers in quantum superpositions [0.0] ミシェルソン干渉計のミラーは量子重ね合わせに転送される。
ミラー重ね合わせの崩壊は、干渉計における光子検出の確率に影響を与えるという事実によって測定される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 11:04:41 GMT)
Data-Driven Soil Organic Carbon Sampling: Integrating Spectral Clustering with Conditioned Latin Hypercube Optimization [0.0] 土壌有機炭素(SOC)モニタリングは、しばしば代表的なフィールドサンプリング場所の選択に依存する。
スペクトルクラスタリングと条件付きラテンハイパーキューブサンプリングを統合した新しいハイブリッド手法を提案する。
この改良されたサンプリング設計はより正確なSOC予測をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:18:05 GMT)
Course Project Report: Comparing MCMC and Variational Inference for Bayesian Probabilistic Matrix Factorization on the MovieLens Dataset [0.0] 行列分解はレコメンデーションシステムで広く使われている技法である。
我々は2つのベイズ推定法を用いて後部を近似する。
MovieLensのデータセットでそれらのパフォーマンスを比較します。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:57:23 GMT)
Correlation functions of von Neumann entropy [0.0] モジュラーハミルトニアンの2点相関関数について検討する。
一般の量子系では、これらの相関子はフォン・ノイマンのエントロピーとエンタングルメントの容量に類似した性質に従う。
共形場の理論において、空間的に分離された2つの球状部分領域を専門とする。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:30:37 GMT)
Controlling quantum chaos via Parrondo strategies on NISQ hardware [0.0] 我々は、周期グラフ上の離散時間量子ウォーク(DTQW)を用いて、NISQシステムにおける量子カオスを探索し、制御する。
奇数グラフと巡回グラフの両方において、量子カオスからDTQWダイナミクスによる秩序への遷移を実験的に実現した。
本研究は,実量子ハードウェア上で制御されたカオス力学を探索し,活用するための実践的アプローチを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:47:11 GMT)
Contemporary AI foundation models increase biological weapons risk [0.0] 我々は、現在の基礎となるAIモデルは、生物兵器開発を促進するリスクを過小評価している。
我々は、大きな言語モデルが言葉で表現できる生物兵器開発における「成功の要素」を同定する。
我々は改良されたベンチマークを提唱する一方で、意味のある実装の窓が既に閉じているかもしれないことを認めている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:53:38 GMT)
ConTextTab: A Semantics-Aware Tabular In-Context Learner [0.0] ConTextTabを導入し、セマンティック理解とアライメントをテーブルネイティブなICLフレームワークに統合する。
我々のモデルは、意味的にリッチなCARTEベンチマークで新しい標準を設定しながら、幅広いベンチマークでSOTAと競合する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 13:57:29 GMT)
Comparing probability distributions: application to quantum states of light [0.0] 各確率分布間の距離'の観点から2つの異なる状態または密度行列を比較する量化器を示す。
特に、確率分布空間における適切な距離測度であるため、$p=1$ワッサーシュタイン距離$W_1$に焦点をあてる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:44:05 GMT)
Commitment Schemes for Multi-Party Computation [0.0] 本稿では,マルチパーティ計算(MPC)プロトコルで使用されるコミットスキーム(CS)の分析を行う。
本研究は,MPCの対角的,機能的要件を満たすためにCSを慎重に選択することの重要性を強調した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:11:59 GMT)
Comment on "Electric conductivity of graphene: Kubo model versus a nonlocal quantum field theory model (arXiv:2403.02279v3)" [0.0] 久保モデルと量子場理論によるグラフェンの電気伝導率の理論的記述を比較した。
量子場理論で得られたすべての結果は、グラフェンの伝導率に対する修飾式の適用は、非物理的性質の結果をもたらす一方、物理的に十分に正当化されていることを実証する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:05:37 GMT)
Coherent states of finite-level systems [0.0] 与えられた角運動量を持つ有限レベル系のコヒーレント状態(CS)を構築する方法を提案する。
AMCSのサブセットは、Perelomov spin CS(PSCS)と関連付けられる。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:57:24 GMT)
Coherence monotones of quantum channels based on two generalized quantum relative entropies [0.0] 我々は、$(r,s)$-相対エントロピーとサンドイッチされたR'enyi相対エントロピーに基づいて、量子チャネルのコヒーレンスモノトンを2種類提案する。
我々は、キュービットユニタリチャネルに対するコヒーレンスモノトンの明示的な式を導出する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:24:39 GMT)
Class-Incremental Learning for Honey Botanical Origin Classification with Hyperspectral Images: A Study with Continual Backpropagation [0.0] 植物起源の分化のモデルを訓練するために、すべてのハチミツを一度に収集することは不可能である。
本研究は、実世界のハニカム分光画像データセットにおける複数のCILアルゴリズムについて検討・比較した。
また、連続的バックプロパゲーション(CB)アルゴリズムと組み合わせることで、クラス増分学習アルゴリズムの性能を向上させる手法も提案されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 08:45:58 GMT)
Certification of quantum networks using the generalised Choi isomorphism [0.0] 本稿では,量子状態の絡み合い特性を証明し,線形ネットワークにおける測定を行うための枠組みを提案する。
我々は、個々のソース状態の共通凸幾何学的絡み合い量化器とネットワーク全体の境界を導出する。
高次元ネットワークへのフォーマリズムの適用により、真に高次元の量子ステアリングの活性化結果が導出される。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:13:11 GMT)
Brain2Vec: A Deep Learning Framework for EEG-Based Stress Detection Using CNN-LSTM-Attention [0.0] Brain2Vecは、生の脳波記録からストレス状態を分類する新しいディープラーニングツールだ。
これらの結果は、Brain2Vecがウェアラブルストレス監視プラットフォームとパーソナライズされたヘルスケアシステムに統合される可能性を示している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:57:19 GMT)
Asymptotic Fate of Continuously Monitored Quantum Systems [0.0] 量子軌道 (quantum trajectory) とは、連続的な間接的な測定によって外部の摂動を受ける量子系の自然な反応である。
個々の実現のレベルで自然に可逆な局所化遷移が起こり、そこでは、進化は全空間の既約成分の1つに効果的に制約される。
本報告では, 連続監視システムの挙動を, 多くのヒルベルト体の傷痕状態の安定化と局所測定によるベル状態の生成を例に示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:40:37 GMT)
Assessing RAG and HyDE on 1B vs. 4B-Parameter Gemma LLMs for Personal Assistants Integretion [0.0] 本研究は,2つの拡張戦略-検索型生成(RAG)と仮説文書埋め込み(HyDE)の有効性を評価する。
RAGは、レイテンシを最大17%削減し、ユーザ固有のクエリやドメイン固有のクエリへの応答時に、事実上の幻覚を取り除く。
対照的に、HyDEは意味的関連性(特に複雑な物理学のプロンプト)を高めるが、応答時間が25--40%増加し、個人データ検索における非無視幻覚率も上昇する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:05:39 GMT)
Are you doing better than random guessing? A call for using negative controls when evaluating causal discovery algorithms [0.0] 本研究では,様々な因果発見評価指標の予測行動について,ランダムな推定の下で正確な分布結果を得る。
これらの指標は,特定のシナリオにおいて,ランダムな推定の下で非常に好ましい値が得られることを示す。
また、スケルトン全体の適合性を正確に検証し、実際のデータアプリケーションでの使用例を示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 10:20:38 GMT)
Americans' Support for AI Development -- Measured Daily with Open Data and Methods [0.0] アメリカ人成人の人口では、人工知能のさらなる発展への支援はわずかに肯定的だった。
女性と低信頼の回答者は支持率が低いと報告したが、両者とも時間とともに支持が伸びた。
共和党は民主党よりも早く支持を増し、分極の可能性を示した。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 18:22:06 GMT)
Air in Your Neighborhood: Fine-Grained AQI Forecasting Using Mobile Sensor Data [0.0] 本研究では,AirDelhiデータセットの例を用いて,1km2地区のAQIを予測する。
従来の71.654 MSEを79%削減しました。
強い反復的短期パターンの存在や空間的関係の変化など,AQIに関する新たな知見も発見されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 03:45:36 GMT)
Advanced deep architecture pruning using single filter performance [0.0] ニューラルネットワークのパラメータと構造を解析することで、推論時の計算複雑性、エネルギー消費、レイテンシを低減することができる。
この理解が、深層建築の畳み込み層を高度に希釈する道のりをいかに拓くかを示す。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 05:37:11 GMT)
Active Quantum Reservoir Engineering: Using a Qubit to Manipulate its Environment [0.0] 本研究では, 量子システムに対する時間依存制御を環境の操作に用いる, アクティブ貯水池工学の理論的枠組みを開発する。
2レベル系の環境に結合した超伝導量子ビットと、核スピンに結合した半導体量子ドットである。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 15:08:42 GMT)
Acquisition of Delocalized Information via Classical and Quantum Carriers [0.0] 複数の遠隔地において情報を符号化するタスクを解析し,空間重畳の情報理論力について検討する。
古典的な粒子、空間的重畳における量子粒子、仮説的「二階干渉」資源を用いて、そのようなタスクで発生する統計的相関を比較検討する。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 19:55:04 GMT)
ALBERT: Advanced Localization and Bidirectional Encoder Representations from Transformers for Automotive Damage Evaluation [0.0] ALBERTは、総合的な車の損傷と部分のセグメンテーションのために特別に設計されたインスタンスセグメンテーションモデルである。
このモデルは、損傷を26のタイプに分類し、7つの偽の損傷変種と61の異なる自動車部品を識別する、大規模で豊富な注釈付き自動車データセットに基づいて訓練されている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 09:40:55 GMT)
A multi-scale loss formulation for learning a probabilistic model with proper score optimisation [0.0] 欧州中距離気象予報センター(ECMWF)で開発された機械学習型気象予報モデルであるAIFS-CRPSでマルチスケール損失が試験された。
マルチスケールの損失は、予測スキルに悪影響を及ぼすことなく、小さなスケールの変動性をよりよく制約する。
これにより、スケールアウェアモデルトレーニングにおける将来の作業への有望な方向性が開かれます。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 16:30:18 GMT)
A closer look at the algebraic-operator correspondence between position and momentum space in Quantum Mechanics [0.0] 運動量(k$)空間と位置(x$)空間の対応性について詳しく調べる。
また、ここで得られた結果は、量子力学の標準結果に対して明確に定義された限界を持つ。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 17:52:15 GMT)
A Unit Enhancement and Guidance Framework for Audio-Driven Avatar Video Generation [0.0] Parts-Aware Audio-driven Human Animation(PAHA)は、オーディオ駆動上半身アニメーションのためのユニット拡張およびガイダンスフレームワークである。
PAHAは、音声モーションアライメントやビデオ関連評価において、既存の手法よりも大幅に優れている。
我々は,中国初の公開ニュースアンカー音声データセットであるCNASを構築し,この分野の研究と検証を進めた。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 14:11:47 GMT)
A Tale of Two Systems: Characterizing Architectural Complexity on Machine Learning-Enabled Systems [0.0] 本研究の目的は、ML-Enabled Systemsの複雑さを特徴付けるメトリクスベースのアーキテクチャモデルの導入である。
目標は、これらのシステムの開始と成長のガイドラインを提供する、アーキテクチャ上の決定をサポートすることです。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 20:54:28 GMT)
A Quantum Mechanical Pendulum Clock [0.0] 量子状態における自律型機械振子時計のモデルとしてのオプティメカルシステムについて検討する。
クロックの脱出は光キャビティ内のエミッタによって提供され、クロックの動作は制限サイクルの存在に依存する。
キャビティ内のエミッタの量を増やすことで、時計はマクロな振り子時計の振る舞いに近づく。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 12:56:08 GMT)
A Multi-Agent Probabilistic Inference Framework Inspired by Kairanban-Style CoT System with IdoBata Conversation for Debiasing [0.0] 日本のカイランバン文化やイドバタの会話は、長年にわたり伝統的なコミュニケーションの実践として機能してきた。
これらの情報交換プロセスにインスパイアされた本研究では,マルチエージェント推論フレームワーク(KCS+IBC)を提案する。
複数の大規模言語モデル(LLM)を統合し、バイアス軽減、説明可能性の向上、感情分析の確率予測を実現している。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 07:31:20 GMT)
"Check My Work?": Measuring Sycophancy in a Simulated Educational Context [0.0] 本研究では,ユーザが提案する提案が,シミュレーション学習環境におけるLarge Language Model(LLM)に与える影響について検討する。
クエリ・フレーミングに基づいて応答品質が劇的に変化することを示す。
この結果から,このようなバイアスを教育の文脈で緩和する方法やメカニズムをよりよく理解する必要性が浮かび上がっている。
論文参考訳(メタデータ) (Thu, 12 Jun 2025 02:21:43 GMT)