Scaling Laws of Synthetic Data for Language Models [125.4] プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:36:00 GMT)
Muon Outperforms Adam in Tail-End Associative Memory Learning [119.0] 機能埋め込みにかかわらず,Muonはクラス間のバランスの取れた学習を一貫して達成している。
我々の経験的観察と理論的分析により、ムオンの核となる利点が明らかとなり、その更新規則は線形連想記憶の外積構造と一致している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:26:34 GMT)
AlphaApollo: Orchestrating Foundation Models and Professional Tools into a Self-Evolving System for Deep Agentic Reasoning [110.6] 自己進化型エージェント推論システムであるAlphaApolloについて述べる。
基礎モデル(FM)における2つのボトルネックに対処することを目的としている。
AlphaApolloは、意図的に検証可能な推論を可能にするために、複数のモデルをプロのツールで編成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:42:24 GMT)
RAP: 3D Rasterization Augmented End-to-End Planning [104.5] エンド・ツー・エンドの列車政策の模擬学習は、専門家によるデモンストレーションでのみ行われる。
アノテーション付きプリミティブの軽量化により、コストのかかるレンダリングを置き換える3Dラスタライゼーションを提案する。
RAPは最先端のクローズドループとロングテールロバスト性を実現し、4つの主要なベンチマークで第1位となった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:31:24 GMT)
COSMO-RL: Towards Trustworthy LMRMs via Joint Safety and Stability [101.8] COSMO-RLは,マルチモーダル・マルチタスク・マルチオブジェクト信号下でLMRMを学習する混合強化学習フレームワークである。
我々のアプローチは、アライメント中に競合するのではなく、安全と能力をひとつの安定したパイプラインで一緒に成長させることを目的としています。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:30:03 GMT)
Optimas: Optimizing Compound AI Systems with Globally Aligned Local Rewards [98.1] 複合システムの効率的な最適化のための統一的なフレームワークであるOptimasを提案する。
各イテレーションにおいて、Optimasはローカルリワード関数(LRF)を効率よく適用し、各コンポーネントのローカル報酬を最大化しながら、この特性を維持する。
我々は,5つの実世界の化合物システムに対して広範な評価を行い,オプティマスが11.92%の平均的な改善によって強いベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:19:08 GMT)
Inference-time Scaling of Diffusion Models through Classical Search [90.8] 本稿では,局所的およびグローバルな探索を編成し,生成空間を効率的にナビゲートする汎用フレームワークを提案する。
我々は,計画,オフライン強化学習,画像生成など,さまざまな課題領域に対するアプローチを評価した。
これらの結果は,古典探索が拡散モデルにおける推論時間スケーリングの原理的かつ実践的な基礎を提供することを示している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:58:19 GMT)
Learning Efficient Meshflow and Optical Flow from Event Cameras [89.1] イベントベースのメッシュフロー推定は、イベントカメラから空間的に滑らかなスパース運動場を予測する新しいタスクである。
本稿では,特殊なエンコーダ・デコーダアーキテクチャを備えた軽量モデルである,イベントベースのMeshFlowネットワークを提案する。
我々は、最近の最先端フロー法と比較して、EEMFlowモデルの異常な性能と実行効率(30倍高速)を示す包括的な実験を行う。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:30:59 GMT)
Keep It on a Leash: Controllable Pseudo-label Generation Towards Realistic Long-Tailed Semi-Supervised Learning [88.5] ラベル付きデータセットから信頼できる擬似ラベルでラベル付きデータセットを拡張するための制御可能な擬似ラベル生成(CPG)フレームワークを提案する。
CPGは制御可能な自己強化最適化サイクルを介して動作する。
CPGは一貫した改善を達成し、最先端の手法を最大で textbf15.97% の精度で上回っている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:52:19 GMT)
Learning More with Less: A Generalizable, Self-Supervised Framework for Privacy-Preserving Capacity Estimation with EV Charging Data [84.4] 自己教師付き事前学習に基づく第一種能力推定モデルを提案する。
我々のモデルは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:58:35 GMT)
Beyond Next-Token Prediction: A Performance Characterization of Diffusion versus Autoregressive Language Models [82.9] 大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクにおいて最先端のパフォーマンスを達成した。
最近、Diffusion Language Models (DLM) が有望な代替アーキテクチャとして登場した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:50:52 GMT)
AgentRL: Scaling Agentic Reinforcement Learning with a Multi-Turn, Multi-Task Framework [77.0] 大規模言語モデル(LLM)は、オンラインインタラクションを通じて学習できる汎用エージェントの構築への関心が高まっている。
マルチターンでLLMエージェントをトレーニングするために強化学習(RL)を適用することで、スケーラブルなインフラストラクチャと安定したトレーニングアルゴリズムが欠如しているため、マルチタスク設定は依然として困難である。
本稿では、スケーラブルなマルチターンマルチタスクエージェントRLトレーニングのためのAgentRLフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:40:01 GMT)
Grounding-IQA: Grounding Multimodal Language Model for Image Quality Assessment [76.8] 本稿では,新しい画像品質評価(IQA)タスクパラダイム**grounding-IQA*を紹介する。
このパラダイムはマルチモーダル参照とグラウンドをIQAと統合し、よりきめ細かい品質知覚を実現する。
我々は,GIQA-Benchというよく設計されたベンチマークを開発した。このベンチマークは,記述品質,VQA精度,グラウンド化精度の3点から,グラウンド化-IQA性能を評価する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:07:14 GMT)
ChronoEdit: Towards Temporal Reasoning for Image Editing and World Simulation [74.3] ビデオ生成問題として画像編集を再構成するフレームワークであるChronoEditを紹介する。
まずChronoEditは、入力された画像と編集された画像を、ビデオの最初のフレームと最後のフレームとして扱う。
第2に、ChronoEditでは、推論時に明示的に編集を行う時間的推論ステージを導入している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:02:01 GMT)
SafeGuider: Robust and Practical Content Safety Control for Text-to-Image Models [74.1] テキスト・ツー・イメージのモデルは、安全対策を回避し、有害なコンテンツを生成できる敵のプロンプトに対して非常に脆弱である。
textbfSafeGuiderは、生成品質を損なうことなく、堅牢な安全制御を実現するための2段階のフレームワークである。
SafeGuiderは攻撃成功率の最小化において例外的な効果を示し、様々な攻撃シナリオで最大速度は5.48%である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:24:48 GMT)
Mixture of Contexts for Long Video Generation [73.0] 我々は長文ビデオ生成を内部情報検索タスクとして再放送する。
本稿では,学習可能なスパークアテンション・ルーティング・モジュールであるMixture of Contexts (MoC) を提案する。
データをスケールしてルーティングを徐々に分散させていくと、そのモデルは計算を適切な履歴に割り当て、アイデンティティ、アクション、シーンを数分のコンテンツで保存する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:28:48 GMT)
Reconstructing Topology-Consistent Face Mesh by Volume Rendering from Multi-View Images [71.2] 産業用3Dフェイスアセット作成は通常、下流生産のために多視点画像からトポロジに一貫性のあるフェイスメッシュを再構築する。
NeRFは3次元再構成において、シーンを密度場と放射場として表現することで大きな利点を示した。
多視点画像からアーティストが作ったテンプレートフェイスメッシュの形状を最適化するために,明示的メッシュとニューラルボリュームレンダリングを組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:15:10 GMT)
Prompt Tuning as User Inherent Profile Inference Machine [68.2] 本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。
UserIP-Tuningは最先端のレコメンデーションアルゴリズムより優れている。
提案されたソリューションは2025年5月からHuawei AppGalleryのExploreページにデプロイされている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:00:02 GMT)
FrameMind: Frame-Interleaved Video Reasoning via Reinforcement Learning [65.4] 現在のビデオ理解モデルは、各質問の特定の推論条件にかかわらず、固定されたフレームサンプリング戦略に依存し、所定の視覚入力を処理する。
この静的アプローチは、視覚的エビデンスを適応的に収集する能力を制限し、広範囲の時間的カバレッジやきめ細かい空間的詳細を必要とするタスクにおいて、最適以下のパフォーマンスをもたらす。
Frame-Interleaved Chain-of-Thought (FiCOT)を通して、モデルが推論中に視覚情報を動的に要求することを可能にする強化学習で訓練されたエンドツーエンドフレームワークであるFrameMindを紹介する。
従来のアプローチとは異なり、FrameMindは複数のターンで動作し、モデルがテキスト推論とアクティブな視覚知覚を交互に切り替え、ツールを使って抽出する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:20:25 GMT)
Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning [65.2] Cacoは、高品質で検証可能な多様な命令-CoT推論データの合成を自動化する新しいフレームワークである。
我々の研究は、人間の介入なしに自己持続的で信頼できる推論システムを構築するためのパラダイムを確立します。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:59:24 GMT)
On the Limitations and Capabilities of Position Embeddings for Length Generalization [64.5] 本稿では,LG(Longth Generalization)の性能向上における位置埋め込み(PE)の限界と能力について検討する。
解析の結果、PEは計算能力を拡張せず、位置をまたいだ構造化された計算が可能であることがわかった。
逐次表現複雑性 (Sequential Representation Complexity, SRC) を提案し, SRC がスケールにわたって不変である場合に限り LG が可能であることを予想する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:08:33 GMT)
WonderHuman: Hallucinating Unseen Parts in Dynamic 3D Human Reconstruction [63.7] 我々はWonderHumanをモノクラービデオから再構成し、高忠実なノベルビューの合成を行う。
提案手法は,与えられたモノクロ映像からフォトリアリスティックなレンダリングを生成する場合のSOTA性能を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:39:13 GMT)
RAG over Tables: Hierarchical Memory Index, Multi-Stage Retrieval, and Benchmarking [63.3] 現実世界のシナリオでは、純粋なテキスト以外では、かなりの量の知識がテーブルに格納される。
まず、階層型メモリインデックス、多段階検索、グラフ認識プロンプトからなるテーブルコーパス対応RAGフレームワークT-RAGを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:24:41 GMT)
Low-Dimension-to-High-Dimension Generalization And Its Implications for Length Generalization [62.0] LDHDの一般化は、事前知識を利用して適切な帰納バイアスを与えることなく、一般的には達成不可能であることを示す。
LDHD一般化から長さ一般化への洞察を応用して,CoTの潜在空間の変化に対する効果を説明する。
また,データ形式のような内在的なLDHD一般化とニュアンスの両方を扱うために,位置埋め込み設計の原理を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:22:32 GMT)
Rethinking Consistent Multi-Label Classification under Inexact Supervision [60.8] 部分的マルチラベル学習では、各インスタンスには候補ラベルセットがアノテートされ、そのうちいくつかのラベルのみが関連付けられている。
補完的なマルチラベル学習では、各インスタンスは、インスタンスが属さないクラスを示す補完ラベルで注釈付けされる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:30:32 GMT)
CALM Before the STORM: Unlocking Native Reasoning for Optimization Modeling [60.6] 大規模推論モデル (LRM) は、複雑な多段階推論において強力な機能を示した。
既存のドメイン適応手法は、元々は命令調整モデル用に設計されていたが、現代のLEMの高度な推論パターンをうまく利用できなかった。
我々は、最適化モデリングタスクのためのネイティブ推論モード内でのLEMを段階的に洗練するフレームワークである textbfCALM を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:38:31 GMT)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [59.9] MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。
情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。
この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:02:29 GMT)
On the Statistical Query Complexity of Learning Semiautomata: a Random Walk Approach [59.6] 我々は,アルファベットサイズと入力長の両方が状態数である場合に,統計的クエリの硬さを確立することができることを示す。
この結果は、半オートマタの内部状態遷移構造からのみ導かれる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:35:35 GMT)
AutoPrune: Each Complexity Deserves a Pruning Policy [58.4] Complexity Pruning(AutoPrune)は、プルングポリシーをさまざまなサンプルやタスクの複雑さに合わせて調整する、トレーニングフリーのプラグイン・アンド・プレイフレームワークである。
我々はAutoPruneを、標準的な視覚適応タスクと、自律運転のためのビジョン・ランゲージ・アクションモデルで評価する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:06:53 GMT)
FVQ: A Large-Scale Dataset and an LMM-based Method for Face Video Quality Assessment [58.4] 顔映像品質評価(FVQA)は、一般的な映像品質評価(VQA)に加え、検討すべきである。
FVQ-20Kは2万件の顔ビデオとそれに対応する平均世論スコア(MOS)アノテーションを含む。
また,FVQ-Raterという特殊なFVQA手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:37:59 GMT)
Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.1] 機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:35:01 GMT)
Interactive Test-Time Adaptation with Reliable Spatial-Temporal Voxels for Multi-Modal Segmentation [56.7] マルチモーダルテストタイム適応(MM-TTA)は、補完的なマルチモーダル入力をオンライン形式で活用することにより、ラベルのないターゲットドメインにモデルを適応させる。
従来のMM-TTA法は, 時間的不整合によるフレームワイドの不安定な予測と, 信頼度誘導の仮定に反する不正確な予測の2つの大きな限界に悩まされていた。
Latte++は、より情報的な幾何学的対応によって不安定なフレーム単位の予測をより抑制し、対話型テスト時間適応(ITTA)は、努力を伴わない人間のフィードバックを促進するフレキシブルなアドオンである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:40:25 GMT)
J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning [54.9] 意思決定前にLLM審査員に思考を教えるための強化学習フレームワークであるJ1を紹介する。
私たちのコアコントリビューションは、検証不可能で検証可能なプロンプトのすべての判断タスクを、検証可能な報酬を持った統一フォーマットに変換することです。
次に、RLを用いて8B、32B、70Bのスケールで思考判断を訓練し、彼らが最先端のパフォーマンスを得ることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:28:03 GMT)
ContextVLA: Vision-Language-Action Model with Amortized Multi-Frame Context [54.6] 時間的コンテキストを活用することは、部分的に観察可能なロボットタスクの成功に不可欠である。
動作のクローン化に関する以前の研究は、複数フレームの観測で不整合のパフォーマンス向上を示した。
マルチフレーム観測を効果的に活用することにより、ロボットタスクのパフォーマンスを堅牢に向上するポリシーモデルであるContextVLAを紹介する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:29:57 GMT)
TRCE: Towards Reliable Malicious Concept Erasure in Text-to-Image Diffusion Models [53.9] 近年のテキスト・画像拡散モデルの進歩により、フォトリアリスティックな画像生成が可能になったが、NSFW画像のような悪意のあるコンテンツを生成するリスクもある。
リスクを軽減するため,概念消去手法が研究され,モデルが特定の概念を学習しやすくする。
本稿では,2段階のコンセプト消去戦略を用いて,信頼性の高い消去と知識保存の効果的なトレードオフを実現するTRCEを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:14:17 GMT)
A Stitch in Time Saves Nine: Proactive Self-Refinement for Language Models [53.3] ProActive Self-Refinement (PASR)は、大規模言語モデル(LLM)を改善する新しい方法である。
反応全体を再生する手法とは異なり、PASRはモデルの内部状態と進化コンテキストに基づいて、いつ、どのように精製するかを積極的に決定する。
PASRの有効性を評価するために,多種多様な10のタスクについて広範囲に実験を行った。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:00:27 GMT)
Exploring Representation Invariance in Finetuning [51.2] 大規模自然画像に事前訓練された基礎モデルは、様々なクロスドメインの低リソースダウンストリームタスクに広く適応している。
我々は、事前訓練された表現の利点を犠牲にすることなく、このようなタスクを効果的に適用できると主張している。
我々は、事前訓練されたモデルと微調整されたモデルとの表現類似性を最大化する正規化であるtextitRepresentation Invariance FineTuning (RIFT) を導入する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:23:17 GMT)
Hierarchical Self-Supervised Representation Learning for Depression Detection from Speech [51.1] 音声による抑うつ検出 (SDD) は、従来の臨床評価に代わる有望で非侵襲的な代替手段である。
HAREN-CTCは,マルチタスク学習フレームワーク内でのクロスアテンションを用いて,多層SSL機能を統合した新しいアーキテクチャである。
このモデルはDAIC-WOZで0.81、MODMAで0.82の最先端マクロF1スコアを達成し、両方の評価シナリオで先行手法より優れている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:32:12 GMT)
Your Models Have Thought Enough: Training Large Reasoning Models to Stop Overthinking [51.0] 大規模推論モデル(LRM)は、困難なタスクにおいて顕著なパフォーマンスを達成したが、その深い推論はしばしばかなりの計算コストを発生させる。
Evidence Accumulation Modelsにインスパイアされて、LEMは推論の初期段階で十分な情報を蓄積し、さらなる推論ステップを冗長にすることがわかった。
不要な推論を積極的に終了させるためにモデルを訓練するJust-Enough Thinking (JET)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:54:32 GMT)
Selective Expert Guidance for Effective and Diverse Exploration in Reinforcement Learning of LLMs [49.7] RLVR(Reinforcement Learning with Verifiable Rewards)は,大規模言語モデル(LLM)の推論能力を高める手法として広く採用されている。
既存の手法は、有効性を向上するが多様性を無視する専門家の軌跡を模倣することでこの問題に対処する。
共振器のトーケンレベル最適化のための混合政治エキスパートナビゲーション MENTORを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:38:55 GMT)
Generative Human Geometry Distribution [49.6] 我々は、最近提案された、高忠実度で単一の人間の幾何学をモデル化可能な、幾何学的分布に基づいて構築する。
本稿では,ネットワークパラメータではなく2次元特徴写像として分布を符号化する手法と,ガウスではなく領域としてSMPLモデルを提案する。
実験の結果,提案手法は既存の最先端手法よりも優れており,幾何学的品質が57%向上していることがわかった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:16:12 GMT)
Generating High-Quality Datasets for Code Editing via Open-Source Language Models [49.0] 我々は,リアルなコード編集三脚を合成するオープンソースのパイプラインであるOpenCodeEditを紹介する。
パイプラインは簡潔な"遅延"命令とより詳細な"記述"命令の両方を生成し、データ品質と多様性を保証するために差分とトピックに基づいたフィルタリングを適用する。
OCEDataFTの細調整された3つのベースモデルは、CanItEditベンチマークで大幅なパフォーマンス向上をもたらし、相対パス@1は4.50%から20.79%まで改善された。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:52:44 GMT)
Unlocking Multimodal Mathematical Reasoning via Process Reward Model [48.8] Process Reward Models (PRM) は、大規模言語モデルの数学的推論能力を高めることを約束している。
マルチモーダル数学的推論におけるPRMの可能性を解き明かすための第一歩を踏み出す。
URSAは3段階のUnfolding Multimodal Process-Supervision Aided Trainingフレームワークである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:09:48 GMT)
Cascading Adversarial Bias from Injection to Distillation in Language Models [48.7] 本稿では, 蒸留モデルによる学習中のバイアス成分の逆注入に対する脆弱性について検討する。
我々は,教師モデルに対して,データ中毒を最小限に抑えて微妙な偏見を注入できることを実証した。
本稿では,効果的な対向バイアス緩和戦略を構築するための実用的な設計原則を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 00:43:48 GMT)
From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation [48.5] 視覚言語モデル(VLM)は、テキスト記述を通して意味的コンテキストを提供するが、説明精度は欠如している。
本稿では,その補完的強みを活かし,視線と言語指導を統合した教師教育フレームワークを提案する。
本手法は,8.78%,80.53%,84.22%のDiceスコアをそれぞれ達成し,アノテーション負担を増大させることなく視線ベースラインよりも3.5%向上した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:00:24 GMT)
VisualChef: Generating Visual Aids in Cooking via Mask Inpainting [48.2] 我々は,調理シナリオに適したコンテキスト視覚支援を生成するVisualChefを紹介する。
初期フレームと指定されたアクションが与えられた後、VisualChefはアクションの実行と結果のオブジェクトの外観の両方を描写した画像を生成する。
3つのエゴセントリックなビデオデータセット上でVisualChefを定量的に定性的に評価し、最先端の手法による改善を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:03:32 GMT)
Zephyrus: An Agentic Framework for Weather Science [47.6] 気象学の基礎モデルは、大量の構造化された数値データと従来の天気予報システムより優れた性能で事前訓練されている。
大規模言語モデル(LLM)は、テキストの理解と生成に優れるが、高次元の気象データセットを推論することはできない。
気象学の新しいエージェント・フレームワークを構築することで、このギャップを埋める。
我々は、気象データセットを反復的に分析し、結果を観察し、会話フィードバックループを通じてアプローチを洗練するマルチターンLCMベースの気象エージェントであるZephyrusを設計する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:34:08 GMT)
DoRAN: Stabilizing Weight-Decomposed Low-Rank Adaptation via Noise Injection and Auxiliary Networks [47.6] 重み分解低ランク適応(DoRA)は,バニラ低ランク適応(LoRA)法の学習能力と訓練安定性の両方を改善することが示されている。
そこで本研究では,DoRAのトレーニングを安定化し,サンプル効率を向上させるため,新しいDoRAの派生型であるDoRANを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:27:48 GMT)
SECA: Semantically Equivalent and Coherent Attacks for Eliciting LLM Hallucinations [47.0] 大規模言語モデル(LLM)は、リスクの高いドメインにますますデプロイされる。
LLMはしばしば幻覚を発生させ、その信頼性について深刻な懸念を提起する。
本稿では,幻覚を誘発するためのセマンティック・等価・コヒーレント・アタック(SECA)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:44:54 GMT)
How Far are AI-generated Videos from Simulating the 3D Visual World: A Learned 3D Evaluation Approach [46.9] Learned 3D Evaluation (L3DE) は、3次元の視覚的品質とコンピテンシーの観点から、現実世界をシミュレートするAI生成ビデオの能力を評価する方法である。
信頼スコアは、3次元視覚的コヒーレンスの観点から、リアルビデオと合成ビデオのギャップを定量化する。
L3DEは、ビデオ生成モデルをベンチマークし、ディープフェイク検出器として機能し、フラグ付き不整合を塗布することでビデオ合成を強化する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:29:28 GMT)
On the Self-awareness of Large Reasoning Models' Capability Boundaries [46.7] 本稿では,Large Reasoning Models (LRM) が機能境界の自己認識性を持っているかを検討する。
ブラックボックスモデルでは、推論式は境界信号を明らかにし、解決不可能な問題に対する信頼軌道は加速するが、解決不可能な問題に対する収束不確実軌道は加速する。
ホワイトボックスモデルでは,最後の入力トークンの隠れ状態が境界情報を符号化し,解答可能かつ解答不能な問題を推論開始前に線形分離可能であることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:47:48 GMT)
LLM-Based Data Science Agents: A Survey of Capabilities, Challenges, and Future Directions [46.7] この調査は、データサイエンスエージェントのライフサイクルに整合した最初の包括的分類である。
エンド・ツー・エンドのデータサイエンス・プロセスの6段階に45のシステムを解析する。
それぞれのステージにおける強みと制限を強調し、新たなベンチマークと評価プラクティスをレビューします。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:04:27 GMT)
HoRA: Cross-Head Low-Rank Adaptation with Joint Hypernetworks [46.5] Low-Rank Adaptation (LoRA) は、パラメータ効率のよい微調整(PEFT)技術である。
本稿では,協調型ハイパーネットを用いて注目ヘッドにまたがる低ランク行列を生成する超共有低ランク適応法(HoRA)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:13:39 GMT)
Flexible Locomotion Learning with Diffusion Model Predictive Control [46.4] 本稿では,学習した生成拡散モデルを計画に先立って近似力学として活用する拡散MPCを提案する。
我々の設計では、テスト時適応性が強く、プランナーは、再訓練することなく、新しい報酬仕様に調整できる。
我々はDiffusion-MPCを実世界で検証し、強い移動と柔軟な適応を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:51:13 GMT)
Adaptive Coverage Policies in Conformal Prediction [46.3] 我々は、共形予測法を改善するために、e値とポストホック共形推論の進歩を活用する。
本稿では,ニューラルネットワークをキャリブレーションセット上でのLeft-out手順を用いてトレーニングすることで,適応的カバレッジポリシーを最適化することを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:37:22 GMT)
EvolMathEval: Towards Evolvable Benchmarks for Mathematical Reasoning via Evolutionary Testing [45.9] EvolMathEvalは、進化テストに基づく自動数学的ベンチマーク生成と進化のフレームワークである。
連続的な自己イテレーションによって大量の高次問題を生成することができる。
また、進化を通じてGSM8Kのような公開データセットの複雑さを著しく向上させ、モデルの精度を平均48%削減する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:41:52 GMT)
Spatiotemporal Forecasting as Planning: A Model-Based Reinforcement Learning Approach with Generative World Models [45.5] 本研究では,モデルベース強化学習における新たなパラダイムであるSFP予測・アズ・プランニング(SFP)を提案する。
SFPは、多様な高時間将来の状態をシミュレートし、「想像に基づく」環境シミュレーションを可能にする新しい世界モデルを構築している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:57:38 GMT)
SRPO: Enhancing Multimodal LLM Reasoning via Reflection-Aware Reinforcement Learning [45.3] MLLM(Multimodal large language model)は、タスク推論において有望な能力を示すが、明示的な自己回帰と自己補正を必要とする複雑な問題に悩まされている。
既存のリフレクション手法は単純で、意味のあるインストラクティブフィードバックを生成するのに苦労している。
本稿では,2段階のリフレクション対応強化学習フレームワークであるグループ相対ポリシー最適化 (SRPO) を用いたマルチモーダル自己回帰強化推論を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:53:45 GMT)
VibE-SVC: Vibrato Extraction with High-frequency F0 Contour for Singing Voice Conversion [44.4] VibESVCは、ヴィブラートを明示的に抽出し操作する制御可能な歌声変換モデルである。
実験の結果,VibE-SVCは話者の類似性を保ちながら歌唱スタイルを効果的に変換することがわかった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:31:57 GMT)
Semantic Journeys: Quantifying Change in Emoji Meaning from 2012-2018 [44.3] 絵文字のセマンティクスが時間とともにどのように変化するかに関する最初の縦断的研究を行い、計算言語学の手法を6年間のTwitterデータに適用した。
絵文字のセマンティックな発達において5つのパターンを識別し、抽象的な絵文字がより少ないほど意味的変化を起こす可能性が高くなることを示す。
絵文字とセマンティクスに関する今後の研究を支援するため、私たちは私たちのデータを、誰でも絵文字のセマンティクス変更を探求できるWebベースのインターフェースとともに公開します。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:12:11 GMT)
Cross-Modal Distillation For Widely Differing Modalities [44.1] 我々は,教師モデルを導入し,学生モデルに差別的知識を伝達することでマルチモーダル学習を行う。
蒸留によるこの知識伝達は、広く異なるモダリティ間の大きなドメインギャップが、容易に過度な適合をもたらすため、簡単ではない。
本稿では,2つの軟式制約付き知識蒸留法と品質ベース適応重みモジュールを用いて,試料の重み付けを行う。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:45:14 GMT)
Evaluating Perceptual Distance Models by Fitting Binomial Distributions to Two-Alternative Forced Choice Data [43.7] 本稿では,二項決定モデルに最大推定値を適用し,より頑健な距離モデル評価手法を提案する。
提案手法は2つの2AFC PFデータセット上での様々な視覚距離モデルの評価から, 簡便さ, 可視性, 柔軟性, 計算効率が優れていることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:35:52 GMT)
Epistemic Diversity and Knowledge Collapse in Large Language Models [42.8] 大規模言語モデル(LLM)は、語彙的、意味的、スタイリスティックに同質なテキストを生成する傾向がある。
これは知識崩壊のリスクを生じさせ、同種LLMは時間とともにアクセス可能な情報範囲の縮小を仲介する。
LLM出力における実世界のクレームの変動など、疫学の多様性を測定するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:29:15 GMT)
Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning of Vision Language Models [42.8] Reason-RFTは視覚的推論のための2段階強化微調整フレームワークである。
第一に、CoTデータをキュレートしたスーパービジョンファインチューニング(SFT)は、ビジョンランゲージモデル(VLM)の推論ポテンシャルを活性化する
第2に、グループ相対政策最適化(GRPO)に基づく強化学習は、複数の推論応答対を生成し、ドメインシフトへの適応性を高める。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 00:51:14 GMT)
Language Agents Mirror Human Causal Reasoning Biases. How Can We Help Them Think Like Scientists? [42.3] 言語モデル(LM)エージェントは、自律的な意思決定者としてますます使われている。
LMの因果関係を探索・推測する能力について検討する。
LMは共通で直感的な因果関係を確実に推測するが、体系的には特異だが等しく、共役関係を証明している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:28:02 GMT)
MorphoSim: An Interactive, Controllable, and Editable Language-guided 4D World Simulator [42.1] マルチビューの一貫性とオブジェクトレベルの制御を備えた4Dシーンを生成する言語ガイドフレームワークであるMorphoSimを紹介する。
このフレームワークは、軌跡誘導生成と機能フィールドの延長を統合し、完全な再生成なしにインタラクティブに編集を適用できる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:55:17 GMT)
Adaptive double-phase Rudin--Osher--Fatemi denoising model [42.0] 適応重み付き2相型の可変成長全変動正規化に基づく新しい画像復調モデルを提案する。
古典的なルーディン-オッシャー-ファテミモデルに関して階段を減らすように設計されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:26:06 GMT)
DynamicScaler: Seamless and Scalable Video Generation for Panoramic Scenes [41.8] オフセットシフトデノイザを導入し,パノラマダイナミックシーンの効率性,同期性,コヒーレント性を実現した。
我々は,局所的な詳細性とグローバルな動き継続性を両立させるため,Global Motion Guidance機構を採用している。
本手法はパノラマシーンレベルの映像生成において,優れた内容と動作品質を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:21:44 GMT)
Contextual Integrity in LLMs via Reasoning and Reinforcement Learning [41.8] 我々は、文脈整合性を達成するために必要な理由をモデルに具現化する強化学習フレームワークを開発する。
本研究では,タスク性能を維持しながら,不適切な情報開示を大幅に低減することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:25:01 GMT)
Video-in-the-Loop: Span-Grounded Long Video QA with Interleaved Reasoning [41.8] ViTLは2段階の長ビデオQAフレームワークで、問題関連区間を初期化して固定トークン予算を保存する
ViTLは最大8.6%まで到達し、長時間のQAと時間的グラウンドでは50%少ないフレーム入力を実現している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:03:31 GMT)
Humanoid Policy ~ Human Policy [41.3] 人間行動変換器(HAT)と呼ばれる人-人-人-行動政策を訓練する。
HATのステートアクション空間は、人間とヒューマノイドロボットの両方に統一されており、ロボットのアクションに微分的に再ターゲットすることができる。
人間のデータは,HATの一般化と堅牢性の両方を改善し,データ収集効率を著しく向上させることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:38:18 GMT)
MoME: Mixture of Matryoshka Experts for Audio-Visual Speech Recognition [39.9] Matryoshka Expression Learning (MRL)は、単一のモデルを複数のトークンの粒度にわたって動作させることによって、この問題に対処する。
MoME は MRL をベースとした音声認識用大規模言語モデルにスパース・ミックス・オブ・エクササイズ (MoE) を統合する新しいフレームワークである。
MoME は AVSR 、 ASR 、 VSR のタスクにまたがって最先端のパフォーマンスを実現するが、パラメータは大幅に少ない。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:34:34 GMT)
Representation Potentials of Foundation Models for Multimodal Alignment: A Survey [39.9] ファンデーションモデルは、多様なデータに基づいて大規模な事前学習を通じて、高度に転送可能な表現を学ぶ。
本研究では,タスク固有情報を取得するための学習表現の潜在能力として定義される基礎モデルの表現ポテンシャルについて検討する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:48:51 GMT)
ImplicitQA: Going beyond frames towards Implicit Video Reasoning [39.6] ImplicitQAは、人間のような暗黙の推論でビデオQAモデルをテストするために設計された新しいベンチマークである。
ImplicitQAは、1Kの高品質なクリエイティビティビデオクリップから引き出された1Kの微妙な注釈付きQAペアからなる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:04:14 GMT)
Exploring Applications of State Space Models and Advanced Training Techniques in Sequential Recommendations: A Comparative Study on Efficiency and Performance [37.9] 本研究は, シーケンシャルレコメンデーションにおける3つの有望な方向性に焦点を当てる。
ひとつは、SSM(State Space Models)を使うことで、レイテンシ、メモリ、推論コストの低いシーケンシャルレコメンデーションドメインでSOTA結果を達成することができるように、スピードを向上することである。
2つ目は、LLM(Large Language Models)によるレコメンデーションの品質向上、参照モデルなしでのモノリシックな選好最適化(ORPO)、コスト削減とトレーニングプロセスの高速化を目的とした適応型バッチおよびステップサイズアルゴリズムの実装である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:07:28 GMT)
Why Low-Precision Transformer Training Fails: An Analysis on Flash Attention [37.0] 計算効率の追求により、トランスフォーマーモデルをトレーニングするための低精度フォーマットが採用された。
本稿では,低精度環境でのフラッシュアテンションによるトレーニングが破滅的損失の爆発を引き起こす長期未解決の故障事例について,最初の力学的説明を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:01:24 GMT)
Quantum Error Correction with Superpositions of Squeezed Fock States [36.9] 我々は、$proptoexp(-7r)$とスケールするエラー訂正機能を備えた圧縮されたFock状態の重ね合わせに基づくコードを提案する。
この符号は、中程度のスクイーズレベルであっても、単光子損失と復調の両方の高精度な誤差補正を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:52:08 GMT)
Towards Foundation Models for Cryo-ET Subtomogram Analysis [36.9] 我々は,452個の粒子クラスから904k以上のサブトモグラムを生成する大規模合成データ生成装置であるCryoEngineを紹介した。
第2に、適応位相トークン化を等価化モジュールとして組み込んだ適応位相トークン変換器(APT-ViT)を設計する。
第3に,強騒音条件下での表現学習を安定させるため,NRCL(Noss-Resilient Contrastive Learning)戦略を導入する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:44:02 GMT)
MLLMEraser: Achieving Test-Time Unlearning in Multimodal Large Language Models through Activation Steering [36.8] MLLMEraserは、テスト時間アンラーニングのための入力対応、トレーニング不要のフレームワークである。
逆摂動型知識-リコール画像-テキストペアを対比してマルチモーダル消去方向を構築する。
LLaVA-1.5とQwen-2.5-VLの実験では、MLLMEraserは最先端MLLMの未学習ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:20:17 GMT)
Advancing Brainwave Modeling with a Codebook-Based Foundation Model [36.3] 信号処理基盤に根ざした原理的改善を取り入れた拡張大型脳波ファンデーションモデル(LBM)であるLaBraM++を紹介する。
LaBraM++は、さまざまなタスクで大幅に向上し、元々のアーキテクチャを一貫して上回り、他のオープンソースBMと比較して競争力のある結果を得た。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:37:46 GMT)
MedAgentGym: A Scalable Agentic Training Environment for Code-Centric Reasoning in Biomedical Data Science [36.2] MedAgentGymは,大規模言語モデル(LLM)エージェントのコーディングに基づく生物医学的推論能力を向上させるために設計された,スケーラブルでインタラクティブなトレーニング環境である。
MedAgentGymは12の本物の現実世界のバイオメディカルシナリオから派生した129のカテゴリにわたる72,413のタスクインスタンスで構成されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:59:37 GMT)
Searching Meta Reasoning Skeleton to Guide LLM Reasoning [35.3] 我々は,従来の研究で提案された骨格を統一するために,指向性非環状グラフ(DAG)を用いたメタ推論スケルトンを表現した。
自動機械学習(AutoML)にインスパイアされたクエリ対応メタ推論スケルトンを検索するフレームワークであるAutoMRを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:36:26 GMT)
Attending on Multilevel Structure of Proteins enables Accurate Prediction of Cold-Start Drug-Target Interactions [35.1] ColdDTIは、コールドスタートDTI予測のためのタンパク質多レベル構造に関与するフレームワークである。
我々は多レベルタンパク質構造と薬物構造との相互作用をマイニングするために階層的注意機構を用いる。
我々の設計は、生物学的に伝達可能な先行を捉え、表現学習への過度な依存による過度な適合のリスクを避ける。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:59:26 GMT)
GDPval: Evaluating AI Model Performance on Real-World Economically Valuable Tasks [34.6] GDPvalは、実世界の経済的に価値のあるタスクでAI能力を評価するベンチマークである。
GDPvalは、米国労働統計局(U.S. Bureau of Labor Statistics Work Activity)の大多数をカバーしている。
我々は、人間の監視と組み合わせることで、フロンティアモデルの可能性を分析し、知らない専門家よりもGDPvalタスクを安価かつ高速に実行します。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:36:43 GMT)
TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios [34.6] 実世界のシナリオにおける時間的推論のためのベンチマークTIMEを提案する。
TIMEは38,522のQAペアで構成され、11のきめ細かいサブタスクを持つ3レベルをカバーする。
推論モデルと非推論モデルについて広範な実験を行う。
TIME-Liteは人手による注釈付きサブセットで、将来の研究を奨励し、時間的推論における標準化された評価を行う。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:52:34 GMT)
Zoom-In to Sort AI-Generated Images Out [34.5] 本稿では,精度と解釈性の両方を改善する2段階の法医学フレームワークZoomInを提案する。
トレーニングを支援するために,2万件のリアルタイムおよび高品質な合成画像のデータセットであるMagniFakeを紹介した。
本手法は,視覚的エビデンスに基づく人間の理解可能な説明を提供するとともに,ロバストな一般化を伴う96.39%の精度を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:29:01 GMT)
Data clustering: a fundamental method in data science and management [34.4] この記事では、クラスタリングの基礎となる重要な原則を強調し、広く使われているツールとフレームワークの概要を説明し、データサイエンスにおけるクラスタリングのワークフローを紹介します。
この論文は、クラスタリングがイノベーションを推進し、データ駆動による意思決定を可能にする上での役割を強調し、今後の研究方向性に関する洞察で締めくくっている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:18:40 GMT)
Evolutionary Optimization of Physics-Informed Neural Networks: Evo-PINN Frontiers and Opportunities [34.4] 物理インフォームドニューラルネットワーク(PINN)は、数学的に表現可能な自然法則をそれらのトレーニング損失関数に注入する。
PINNは、リミテッドデータレシエーションにおける純粋にデータ駆動モデルよりもアドバンテージを提供し、フィジカルAIへの有望なルートとして提示する。
本研究は、モデル最適化と一般化の観点からPINNを検証し、新しいアルゴリズムの進歩の必要性に光を当てる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:59:58 GMT)
WakenLLM: Evaluating Reasoning Potential and Stability in LLMs via Fine-Grained Benchmarking [34.4] 大規模言語モデル(LLM)は、推論タスクにおいて未知のラベルを頻繁に出力する。
我々は、モデル非能力に起因する未知の出力の一部を定量化するフレームワーク、WakenLLMを紹介した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:02:35 GMT)
Instruction Boundary: Quantifying Biases in LLM Reasoning under Various Coverage [34.2] 異なる命令形式がLLM推論能力をどのように促進するか、それとも誤解を招くかを検討する。
本稿では,インストラクション境界の概念を導入し,異なるレベルのプロンプトカバレッジが推論バイアスにどのように寄与するかを系統的に分析する。
異なる種類の命令境界条件下でスパースラベルを識別するLLMの能力を定量化する統合フレームワークであるBiasDetectorを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:12:05 GMT)
Score-based Greedy Search for Structure Identification of Partially Observed Linear Causal Models [34.1] 本稿では,有意性保証を伴う潜伏変数を含む構造を識別するための,最初のスコアに基づく欲求探索手法を提案する。
そこで我々は,このモデルに対して,厳密な探索アルゴリズムであるLatent variable Greedy Equivalence Search (LGES) を設計する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:50:17 GMT)
DecompDreamer: A Composition-Aware Curriculum for Structured 3D Asset Generation [33.8] DecompDreamerは、暗黙のカリキュラムとして機能する新しい最適化戦略に基づいて構築されたフレームワークである。
本手法はまず, 物体間関係を優先し, 個別成分の高忠実度化に移行してコヒーレントな構造足場を構築する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:48:04 GMT)
DS-VTON: An Enhanced Dual-Scale Coarse-to-Fine Framework for Virtual Try-On [33.1] 仮想試行のための拡張デュアルスケール粗大化フレームワークDS-VTONを提案する。
DS-VTONは2つの段階から構成される: 第一は、衣服と身体の間の意味的対応を捉えるために、低解像度の試行結果を生成する。
第2段階では、混合精製拡散過程は、スケール間の残留物を精製することによって高分解能出力を再構成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:39:48 GMT)
GeoRanker: Distance-Aware Ranking for Worldwide Image Geolocalization [33.0] 画像ジオローカライズのための距離対応ランキングフレームワークGeoRankerを提案する。
絶対距離と相対距離の両方をランク付けする多階距離損失を導入し、構造的空間関係をモデル化する。
GeoRankerは、2つの確立されたベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:54:40 GMT)
Efficient Training of Spiking Neural Networks by Spike-aware Data Pruning [32.2] スパイキングニューラルネットワーク(SNN)は、モデルとデータセットのスケーリングを通じて急速に進歩している。
データプルーニングは、最も有益な例を保持し、冗長な例を捨てることで、トレーニングを加速するための有望な戦略である。
本稿では,これらの課題に対処する新しいスパイク対応データプルーニング法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:50:28 GMT)
Spectral Alignment as Predictor of Loss Explosion in Neural Network Training [31.8] ディープニューラルネットワークのトレーニングにおける損失爆発は、数百万ドルのトレーニング実行を無効にする可能性がある。
重み行列の主特異ベクトルと層入力の分布アライメントを監視する新しい計量であるスペクトルアライメントを導入する。
言語モデルに関する実証的な結果は、SA分布の監視が従来のスカラーメトリクスよりもはるかに早く、明確な損失爆発の警告を提供することを示している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:35:34 GMT)
TCR-EML: Explainable Model Layers for TCR-pMHC Prediction [31.6] ペプチド-MHC(pMHC)複合体のT細胞受容体(TCR)認識は適応免疫の中心的な構成要素である。
本稿では,TCR-pMHCモデリングのためのタンパク質言語モデルバックボーンに組み込むことができる説明可能なモデル層(TCR-EML)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:47:48 GMT)
Dual-stage and Lightweight Patient Chart Summarization for Emergency Physicians [31.5] 組込みデバイス上で完全に動作する2段階の要約システムを提案する。
検索段階では、ローカルに保存されたEHRを使用し、長いメモを意味的に一貫性のあるセクションに分割し、クエリ毎に最も関連性の高いセクションを検索する。
生成段階は、検索したテキストから要約を生成するために、ローカルにホストされた小さな言語モデル(SLM)を使用する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:30:56 GMT)
StressTest: Can YOUR Speech LM Handle the Stress? [31.0] センセントストレス(Sentence stress)とは、アイデアを強調または対比するために、発声中の単語に重点を置くことを指す。
ストレスパターンに基づく音声の意味を識別するモデルの能力を評価するためのベンチマークであるScressTestを紹介する。
本研究では,新しいデータ生成パイプラインを提案し,ストレス変動によって示唆される意味の変化をシミュレートするトレーニングセットであるScress-17kを作成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:21:35 GMT)
Rounding-Guided Backdoor Injection in Deep Learning Model Quantization [30.4] 我々は、モデル量子化を利用して悪意ある振る舞いを埋め込む新しいバックドア攻撃QuRAを提案する。
本研究は,広く用いられているモデル量子化プロセスにおける重要な脆弱性を明らかにする。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:45:49 GMT)
QuantDemoire: Quantization with Outlier Aware for Image Demoiréing [30.2] QuantDemoireは、トレーニング後の量子化フレームワークである。
サンプリングベースのレンジ推定を使用して、アクティベーション・アウトレイアを減らし、FP16の極端な重量を無視できるコストで保持する。
W4A4上の**4 dB**で既存の量子化法より優れている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:58:11 GMT)
GUIDE: Towards Scalable Advising for Research Ideas [29.8] 提案する仮説と実験設計を洗練するための,高品質で適切なフィードバックを提供するシステムを開発した。
提案方式は, ICLR 2025テストセットで90%を超える受入率を達成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 00:39:58 GMT)
Forecasting Conversation Derailments Through Generation [29.7] 会話脱線予測のための微調整言語モデルを構築した。
提案手法は,英会話脱線予測ベンチマークの最先端結果を上回った。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:44:30 GMT)
Exploring Chain-of-Thought Reasoning for Steerable Pluralistic Alignment [29.7] CoT(Chain-of-Thought)推論技術は、ステアブルな多元性モデルの構築に応用できる。
我々は,CoTのプロンプト,人間によるCoTの微調整,合成説明の微調整,検証可能なリワードによる強化学習など,いくつかの手法を探求する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:39:50 GMT)
CryoCCD: Conditional Cycle-consistent Diffusion with Biophysical Modeling for Cryo-EM Synthesis [29.7] 単一粒子低温電子顕微鏡(cryo-EM)は構造生物学の基盤となっている。
本稿では,CryoCCDについて述べる。CryoCCD,CryoCCD,CryoCCD,CryoCCD,CryoCCD,CryoCCD。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:40:57 GMT)
Student-AI Interaction in an LLM-Empowered Learning Environment: A Cluster Analysis of Engagement Profiles [28.8] 本研究では,多エージェント LLM を用いた学習環境における多様な学習者のプロファイルについて検討した。
学生は様々な行動、認知、感情的なエンゲージメントの傾向を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:55:42 GMT)
What Scales in Cross-Entropy Scaling Law? [28.4] 本稿では, クロスエントロピーを, 誤りエントロピー, 自己アライメント, 信頼の3つの部分に分解した。
誤差エントロピーだけがロバストなパワーロースケーリングに従っているのに対し、残りの2つの項はほとんど不変である。
本研究は, モデル挙動のより正確な記述として, 誤差エントロピースケーリング法則を確立した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:06:02 GMT)
Physics-Inspired All-Pair Interaction Learning for 3D Dynamics Modeling [28.2] 我々は,多体システムにおける全対相互作用を学習するための,SE(3)-同変の原理的ニューラルネットワークであるPAINETを提案する。
我々は、PAINETが最近提案されたモデルより一貫して優れており、時間とメモリの点で計算コストに匹敵する3Dダイナミックス予測の誤差が4.7%から41.5%減少していることを示した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:48:26 GMT)
TCDiff++: An End-to-end Trajectory-Controllable Diffusion Model for Harmonious Music-Driven Group Choreography [28.1] TCDiff++は、調和したグループダンスを生成するように設計された音楽駆動のエンドツーエンドフレームワークである。
マルチダンサー衝突を緩和するために,ダンサー位置定位埋め込みを用いて時間的・個人的情報を符号化する。
単段スライディングの問題に対処するために,ダンサースワッピングパターンを示すスワップモードの埋め込みを導入する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:08:58 GMT)
Enhancing Talent Search Ranking with Role-Aware Expert Mixtures and LLM-based Fine-Grained Job Descriptions [27.7] タレント検索は現代の求人制度の基盤となっているが、既存のアプローチは、求職に特有な好奇心をつかむのに苦労することが多い。
本稿では,人材検索の有効性を高め,実質的なビジネス価値を提供する新しい枠組みを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:17:19 GMT)
From Poisoned to Aware: Fostering Backdoor Self-Awareness in LLMs [27.7] 大規模言語モデル(LLM)は、バックドアアタックを通じて偽りの行動を取得することができる。
既存の安全訓練手法では、この脆弱性に対処できない。
バックドアリスクの自己認識を育む新しいポストトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:55:24 GMT)
Simulating and Understanding Deceptive Behaviors in Long-Horizon Interactions [27.2] 大規模言語モデルにおける偽造の探索と評価のための最初のシミュレーションフレームワークを紹介する。
11のフロンティアモデルで実験を行い、クローズドシステムとオープンソースシステムの両方にまたがっています。
詐欺はモデルに依存しており、イベントプレッシャーの増加とともに増加し、常に監督的信頼を損なう。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:18:23 GMT)
Drax: Speech Recognition with Discrete Flow Matching [27.0] 拡散およびフローベース非自己回帰モデル(NAR)は、大規模言語モデリングにおいて強い将来性を示している。
自動音声認識(ASR)のための離散フローマッチングフレームワークDraxを提案する。
中間推定誤差に類似したトラジェクトリを通してモデルを誘導する音声条件付き確率パスを構築する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:38:01 GMT)
Small Language Models for Emergency Departments Decision Support: A Benchmark Study [26.3] 大規模言語モデル(LLM)は、医師が様々な臨床および手術業務を行うのを助けるために、医学領域でますます人気が高まっている。
小型言語モデル(SLM)は、その固有の推論能力と効率的な性能から、大きな可能性を秘めている。
これにより、SLMは、タイムリーかつ正確な情報合成を提供することで、医師を支援することができ、臨床意思決定とワークフロー効率を向上させることができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:46:30 GMT)
Visual Lifelog Retrieval through Captioning-Enhanced Interpretation [26.1] 本稿では,ユーザの視覚的ライフログから画像を抽出するキャプション・インテグレート・ビジュアル・ライフログ(CIVIL)検索システムを提案する。
従来の埋め込み方式とは異なり,本システムはまずビジュアルライフログのキャプションを生成し,テキスト埋め込みモデルを用いて,キャプションとユーザクエリの両方を共有ベクトル空間に投影する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:00:58 GMT)
Exact Causal Attention with 10% Fewer Operations [25.8] Fast Causal Attention (FCA) は、10%少ない演算で正確なCausal Attentionを計算するアルゴリズムである。
FCAはPyTorch実装とTritonコンパイルカーネル上に構築されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:53:58 GMT)
Probably Approximately Correct Labels [25.5] 強力な事前訓練されたAIモデルは、データセットを自動的にラベル付けし、コストを節約する機会を提供する。
これらのモデルは正確性に保証がなく、手動ラベリングを非現実的に置き換える。
本稿では,事前学習したAIモデルを用いて,コスト効率と高品質なデータセットをキュレートする手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:09:24 GMT)
A Universal Deep Learning Force Field for Molecular Dynamic Simulation and Vibrational Spectra Prediction [24.7] 我々は、スペクトル予測のための機械学習分子動力学(MLMD)シミュレーションを可能にするために、深部等変テンソルアテンションネットワーク(DetaNet)とベロシティ・バーレット積分器を統合する。
DetaNetベースのMD手法は,AIMDよりも最大3桁のスピードアップで,ほぼ実験的なスペクトル精度を実現する。
全体として、この研究は、高速で正確で広く適用可能な動的シミュレーションとIR/Ramanスペクトル予測を可能にする、普遍的な機械学習力場とフレームワークを確立する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:36:33 GMT)
MIA-EPT: Membership Inference Attack via Error Prediction for Tabular Data [24.5] 新たなブラックボックス攻撃であるタブラルデータに対するエラー予測によるMIAEPT, メンバーシップ推論攻撃について紹介する。
MIA-EPTは、ターゲットレコードの属性をマスキングして再構成することで、エラーベースの特徴ベクトルを構築する。
我々の結果は、合成データが本質的にプライバシー保護であるという仮定に挑戦する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:26:28 GMT)
A global log for medical AI [24.5] 臨床AIのイベントレベルロギングのためのプロトコルであるMedLogを紹介する。
MedLogはリスクベースのサンプリング、ライフサイクル対応の保持ポリシ、書き込みバインドキャッシュをサポートする。
MedLogレコードの保存と解析を行う新しいデータベースとソフトウェアの開発を触媒する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:52:26 GMT)
WebRenderBench: Enhancing Web Interface Generation through Layout-Style Consistency and Reinforcement Learning [24.2] WebRenderBenchは、現実世界のポータルサイトから収集された22.5万のWebページの大規模なベンチマークである。
また、最終レンダリングページからレイアウトとスタイルの整合性を測定する新しい評価指標を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:47:39 GMT)
Pushing on Multilingual Reasoning Models with Language-Mixed Chain-of-Thought [23.8] 英語とターゲット言語を切り替える推論スキーマである**Language-Mixed CoT**を紹介する。
我々は6つのファミリー(Qwen2.5、Llama-3.1、Gemma-3など)でNinveモデル(4B-35B)を訓練する。
我々のベストモデル**KO-REAson-35B*は、平均スコア(64.0 pm 25)で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:39:41 GMT)
C3: A Bilingual Benchmark for Spoken Dialogue Models Exploring Challenges in Complex Conversations [23.8] 音声対話モデル(SDM)は近年,ユーザの音声クエリに直接音声応答を生成する能力に注目が集まっている。
人間の音声相互作用は、音声対話特有の特徴のため、本質的にテキストよりも複雑である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:17:29 GMT)
SPOGW: a Score-based Preference Optimization method via Group-Wise comparison for workflows [23.7] 大規模言語モデル(LLM)は様々な分野、しばしばエージェントの使用を通じて、課題に対処する上で重要な能力を発揮している。
近年の研究では、建設に必要な人的介入を最小限に抑えることを目的としており、エージェントを最適化するための自動化技術の進歩につながっている。
SPOGWと呼ばれる新しいスコアベースの選好手法を導入し、グループワイド比較により、基数報酬信号を直接操作する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:26:29 GMT)
Fit Pixels, Get Labels: Meta-learned Implicit Networks for Image Segmentation [23.5] 入射神経表現(INR)は、表現的だがコンパクトな信号表現の学習において顕著な成功を収めた。
医用画像セグメンテーションのためのINRをトレーニングするためのメタ学習フレームワークであるMetaSegを紹介する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:03:17 GMT)
LexiMark: Robust Watermarking via Lexical Substitutions to Enhance Membership Verification of an LLM's Textual Training Data [23.3] LexiMarkは、テキストとドキュメント用に設計された新しい透かし技術である。
慎重に選択された高エントロピー語に対する同義語置換を組み込む。
微妙で、文脈的に適切な置換のために除去に抵抗する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:47:19 GMT)
The best performance in the CARE 2025 -- Liver Task (LiSeg-Contrast): Contrast-Aware Semi-Supervised Segmentation with Domain Generalization and Test-Time Adaptation [23.2] CoSSeg-TTA は nnU-Netv2 上に構築された GED4 (Gd-EOB-DTPA 拡張肝胆道相MRI) のコンパクトセグメンテーションフレームワークである。
ドメイン適応モジュールは、ランダム化されたヒストグラムスタイルの外観伝達関数とトレーニング可能なコントラスト対応ネットワークを組み込んで、ドメインの多様性を強化し、センター間の変動を緩和する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:18:53 GMT)
Read the Scene, Not the Script: Outcome-Aware Safety for LLMs [22.8] 現在のモデルでは、アクションと結果の結びつきが弱いのです。
この障害モードをコンシークエンス・ブラインドネス(Consequence-blindness)と定義する。
CS-Chain-4kで微調整されたモデルでは、セマンティックカモフラージュジェイルブレイクに対する明らかな利得を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:46:49 GMT)
PoLi-RL: A Point-to-List Reinforcement Learning Framework for Conditional Semantic Textual Similarity [22.3] 本稿では,新しいポイントツーリスト強化学習フレームワークPoLi-RLを紹介する。
PoLi-RLは、基本的なスコアリング能力を確立するために、単純なポイントワイズでモデルを訓練する。
その後、ポイントワイド、ペアワイド、リストワイドの目的を組み合わせたハイブリッド報酬に移行し、微妙なセマンティックな区別を識別するモデルの能力を洗練させる。
公式のC-STSベンチマークでは、PoLi-RLは48.18のスピアマン相関係数を達成し、クロスエンコーダアーキテクチャのための新しいSOTAを確立した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:57:26 GMT)
MulVuln: Enhancing Pre-trained LMs with Shared and Language-Specific Knowledge for Multilingual Vulnerability Detection [22.2] MULVULNは、複数の言語にわたるソースコードから学習する、新しい多言語脆弱性検出アプローチである。
現実世界の多言語ソフトウェアシステムにおいて、より堅牢で効果的な脆弱性検出を実現する。
特に、MULVULNはF1スコアがかなり高く、ベースライン法に比べて1.45%から23.59%改善されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:33:26 GMT)
Bamboo: LLM-Driven Discovery of API-Permission Mappings in the Android Framework [22.1] Androidの公式APIドキュメントは、慢性的に不正確さと不完全さに悩まされている。
パーミッション仕様の改善に対する最近の取り組みは、主に静的および動的コード解析を利用して、API-パーミッションマッピングを探索している。
本稿では,大規模言語モデル (LLM) を用いたAPI-パーミッションマッピングの体系的検討に先駆的なアプローチを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:50:44 GMT)
VortexPIA: Indirect Prompt Injection Attack against LLMs for Efficient Extraction of User Privacy [22.0] 大規模言語モデル(LLM)は、会話型AI(CAI)に広くデプロイされている。
近年の研究では、LLMベースのCAIを操作して、人間から個人情報を抽出し、重大なセキュリティ上の脅威を生じさせることが示されている。
ブラックボックス設定下でのプライバシー抽出を誘導する新しい間接的インジェクション攻撃であるtextscVortexPIAを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:58:55 GMT)
Tabular Data: Is Deep Learning all you need? [22.0] タブラルデータは、応用機械学習において最も一般的なデータフォーマットの1つである。
ディープラーニングモデルは、既存の古典的アプローチと公正に比較できるような条件下での包括的な評価の対象にはなっていない。
我々の調査は、ニューラルネットワーク、古典的ML、AutoML技術にまたがる17の最先端の手法をベンチマークすることで、このギャップを埋める。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:39:10 GMT)
Self Speculative Decoding for Diffusion Large Language Models [22.0] 拡散に基づく大規模言語モデル (dLLMs) は自己回帰モデルに代わる競合モデルとして登場した。
textbfSelf textbfSpeculative textbfDecoding (SSD) を提案する。
SSDは最大3.46$times$ Speedupを実現し、出力はLLaDAやDreamのようなオープンソースのモデルで段階的に復号化される。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:52:28 GMT)
Incorporating Multivariate Consistency in ML-Based Weather Forecasting with Latent-space Constraints [21.5] データ駆動機械学習(ML)モデルは最近、天気予報のための伝統的な物理ベースのアプローチを超越する可能性を示している。
ほとんどのMLベースの予測モデルは、再分析を真実として扱い、変数固有の損失重み付けの下で訓練される。
長い時間をかけて、ロールアウトトレーニング中に予測がぼやけ、物理的に非現実的になる。
遅延空間制約によるロールアウトトレーニングにより、長期予測スキルが向上し、微細構造や物理的なリアリズムの保存性が向上することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:55:04 GMT)
From Segments to Concepts: Interpretable Image Classification via Concept-Guided Segmentation [21.4] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の解釈可能な概念を推論することで透明性を向上させることを目的としている。
本稿では,概念誘導画像セグメンテーションを注目型マルチインスタンス学習フレームワークに統合する新しいフレームワークSEG-MIL-CBMを提案する。
意味論的に意味のある領域を高レベルな概念に合わせることによって,タスク関連証拠,非関連な重み付け,空間的基盤のある概念レベルの説明を生成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:48:43 GMT)
Learning from All: Concept Alignment for Autonomous Distillation from Multiple Drifting MLLMs [21.2] 本稿では,マルチモーダル大規模言語モデル(MLLM)から抽出する上で,重要かつ過小評価されている課題について述べる。
我々は,概念ドリフトと知識蒸留の理論的関係を開拓し,マルチストリーム推論軌道の次世代予測として,複数のMLLM教師の非定常推論力学を推し進めた。
教師の指導のもと、学生モデルはまず学習し、複数の教師を比較して考えることを好む。
その後、教師のドリフト推論を批判的に反映し、APOを通して概念アライメントを行い、最終的には堅牢で一貫性があり、一般化可能なモデルを生み出す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:42:21 GMT)
Refactoring Codebases through Library Design [21.0] 成長と再利用性をサポートする方法でコードに対するコードエージェントの能力を調べる。
本稿では,再利用可能なライブラリを生成するためのベンチマークと手法を提案する。
我々は,ライブラリと最先端のライブラリ生成手法を比較し,それを実世界のコードベースで研究する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:31:35 GMT)
Replacing Softmax Similarity with a Sharpened Angular Similarity: Theory and Practice of Scaling To Billion-Context Attention [21.0] 我々は、Softmax Attentionの代替として、カーネルにインスパイアされたRSE Attentionを紹介する。
RACE アテンションは指数核を改良した角状(コサイン)類似性に置き換える。
制御されたスケールテストでは、NVIDIA GH200 GPU上で1回の前方通過中に最大1200万のトークンを処理する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:57:40 GMT)
TalkPlayData 2: An Agentic Synthetic Data Pipeline for Multimodal Conversational Music Recommendation [20.9] TalkPlayData 2は、エージェントデータパイプラインによって生成されるマルチモーダルな会話音楽レコメンデーションのための合成データセットである。
提案するパイプラインでは,複数の大規模言語モデル (LLM) エージェントを,特殊なプロンプトで様々な役割で生成する。
すべてのLLMは音声と画像でマルチモーダルであり、マルチモーダルレコメンデーションと会話のシミュレーションを可能にする。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:05:06 GMT)
AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery [20.7] 我々はAgentAdaを紹介した。AgentAdaは、新しい分析スキルを学び、利用して、より専門的な洞察を引き出すことができる最初の分析エージェントだ。
ユーザーがどのデータ分析方法を適用するかを手動で決める既存の方法とは異なり、AgentAdaは分析を行うために必要なスキルを自動的に識別する。
我々は、AgentAdaが既存のツールよりも洞察に富んだ分析を提供しており、48.78%が分析を好み、27.67%は未熟練のエージェントであることを示した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:28:53 GMT)
Joint Learning of Pose Regression and Denoising Diffusion with Score Scaling Sampling for Category-level 6D Pose Estimation [20.0] カテゴリレベルの6次元オブジェクトのポーズ推定のための新しいパイプラインを提案する。
提案手法は, 直接ポーズ回帰ヘッドを用いてエンコーダを事前訓練し, 回帰ヘッドとデノナイジング拡散ヘッドを介してネットワークを共同学習する。
サンプリングガイダンスは、最終段階における高品質なポーズ生成を確保しつつ、初期復調段階における対称物体のマルチモーダル特性を維持する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:58:51 GMT)
Distilling Reasoning into Student LLMs: Local Naturalness for Selecting Teacher Data [19.0] そこで本研究では,局所自然度(Local Naturalness)について紹介する。
多くの教師の回答を混ぜ合わせると、Local Naturalnessは32Bの学生の数学のベンチマークの精度を、グローバルセレクションよりも9.4pp向上させる。
これらの結果は, ローカライズされたデータ品質評価とデータ混合により, より効果的に蒸留できることを示すものである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:15:32 GMT)
Diffusion^2: Dual Diffusion Model with Uncertainty-Aware Adaptive Noise for Momentary Trajectory Prediction [18.9] 初期の研究では、将来の軌道を予測するのに十分な観測データを主に利用していた。
盲点から歩行者のような現実世界のシナリオでは、十分な観測データは利用できないことが多い。
本稿では,時間軌道予測に適したDiffusion2という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:19:33 GMT)
Empowering Denoising Sequential Recommendation with Large Language Model Embeddings [18.8] シーケンシャルレコメンデーションは、ユーザとイテムのインタラクションにおけるシーケンシャルパターンをモデル化することで、ユーザの好みを捉えることを目的としている。
ノイズの影響を低減するために,ノイズのある項目を明示的に識別・除去することを提案する研究もある。
協調情報と意味情報を統合したIADSR(Interest Alignment for Denoising Sequential Recommendation)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:10:51 GMT)
Query Drift Compensation: Enabling Compatibility in Continual Learning of Retrieval Embedding Models [18.7] インデクシングを必要とせずに,すでにインデックス付け済みのコーパスを効果的に利用できるかを検討した。
安定性を維持するために,クエリとドキュメントの埋め込みの両方に埋込み蒸留を用いる。
本稿では,検索中に新しいクエリドリフト補償手法を提案し,新しいモデルクエリ埋め込みを従来の埋め込み空間に提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:58:02 GMT)
Event-driven Robust Fitting on Neuromorphic Hardware [18.7] 我々は、実際のニューロモルフィックハードウェアであるIntel Loihi 2にロバストな適合性を持たせるための、新しいスパイクニューラルネットワークを開発した。
以上の結果から, 確立されたロバスト適合アルゴリズムを標準CPU上で同等の精度で動作させるのに必要なエネルギーは, ニューロモルフィックなロバスト適合法ではごくわずかであることがわかった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:04:04 GMT)
Diffusion Low Rank Hybrid Reconstruction for Sparse View Medical Imaging [18.4] TV-LoRAは低用量スパースCTの新規な再構成法である。
極めてまばらな視野での不利さとテクスチャの喪失に対処する。
SSIM、テクスチャリカバリ、エッジの明確性、アーティファクトの抑制といったベンチマークを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:20:06 GMT)
How to build a consistency model: Learning flow maps via self-distillation [18.3] フローベース生成モデルは最先端のサンプルの品質を達成するが、推論時に微分方程式の高価な解を必要とする。
これらのモデルには、実際に効率的に学習する方法を明確に説明する統一的な記述がない。
本稿では,フローや拡散モデルに関連するフローマップを直接学習するための体系的なアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:24:27 GMT)
AttackSeqBench: Benchmarking Large Language Models in Analyzing Attack Sequences within Cyber Threat Intelligence [17.2] サイバー脅威インテリジェンス(CTI)は、敵の行動と行動可能な知識への意図に関する証拠を合成し、サイバー脅威の観察を文書化している。
CTIレポートの非構造的かつ冗長な性質は、セキュリティ実践者が手動でこのようなシーケンスを抽出し分析する上で大きな課題となる。
大規模言語モデル(LLM)は、エンティティ抽出や知識グラフ構築などのサイバーセキュリティタスクにおいて有望であるが、それらの理解と行動シーケンスに対する推論能力はいまだ探索されていない。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:27:08 GMT)
LongTail-Swap: benchmarking language models' abilities on rare words [16.9] LongTail-Swapはディストリビューションのテールに焦点を当てたベンチマークである。
LMが新しい単語をほとんど露出せずに学習する能力を測定する。
LT-Swapは、許容できない文対と許容できない文対の、事前訓練されたコーパス固有のテストセットである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:17:33 GMT)
What Shapes a Creative Machine Mind? Comprehensively Benchmarking Creativity in Foundation Models [16.8] 基礎モデル(FM)における創造性の統一評価のための総合的なベンチマークであるC2-Evalを紹介する。
C2-Evalは2つの相補的な創造形態を区別している。
以上の結果から,C2-Evalは創造的AIの進化する景観を調べる上で有効なレンズであることがわかった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:00:50 GMT)
MetaFind: Scene-Aware 3D Asset Retrieval for Coherent Metaverse Scene Generation [16.5] シーン対応の3モーダル合成検索フレームワークであるMetaFindを提案する。
大規模リポジトリから3Dアセットを取得することで,メタバースのシーン生成を向上させるように設計されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:37:26 GMT)
Interaction effects on electronic Floquet spectra: Excitonic effects [16.4] 我々は、電子-ホール相互作用の効果である励起効果が、単一電子フロケスペクトルに対する劇的な補正をもたらすことを示した。
蛍光体および単層MoS$$で時間分解光および角放出分光および超高速光学実験においてこれらの効果を計算する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:51:00 GMT)
Teaching LLM to be Persuasive: Reward-Enhanced Policy Optimization for Alignment frm Heterogeneous Rewards [16.2] 我々は,大規模言語モデル(LLM)をビジネス開発(BD)エージェントとして展開し,オンライン旅行代理店(OTA)における説得的価格交渉を行う。
Reward-Enhanced Policy Optimization (REPO) は、LLMを不均一な報酬と整合する強化学習後学習フレームワークである。
RMとRJとRF信号を組み合わせることで、報酬のハッキングを抑え、交渉の質を向上させるため、簡単な拡張機構が提案されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:08:01 GMT)
Universal Adversarial Perturbation Attacks On Modern Behavior Cloning Policies [16.0] Demonstration(LfD)アルゴリズムからの学習は、ロボット操作タスクにおいて有望な結果を示している。
しかし、オフラインの普遍的摂動攻撃に対する彼らの脆弱性は、まだ解明されていない。
本稿では,従来のアルゴリズムと最近提案されたアルゴリズムの両方に対する敵攻撃の包括的研究について述べる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:09:37 GMT)
Sharp Generalization for Nonparametric Regression in Interpolation Space by Over-Parameterized Neural Networks Trained with Preconditioned Gradient Descent and Early Stopping [16.0] アルゴリズムによる保証を訓練した過パラメトリック化された2層ニューラルネットワークを用いて,非回帰について検討する。
我々は,早期停止機能を備えた新しいプレコンディショニンググレーディエント・ディフレッシュ(PGD)アルゴリズムを用いてニューラルネットワークをトレーニングすることにより,高い回帰率が得られることを示した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:30:45 GMT)
Uniform convergence of the smooth calibration error and its relationship with functional gradient [15.9] この研究は滑らかな校正誤差(CE)に焦点を当て、一様収束境界を提供する。
我々は3つの代表的なアルゴリズムを解析する: 勾配の押し上げ木、カーネルの押し上げ、2層ニューラルネットワーク。
この結果は,信頼性のある確率モデルを設計するための新たな理論的洞察と実践的ガイダンスを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:51:42 GMT)
Equipping Retrieval-Augmented Large Language Models with Document Structure Awareness [15.8] 本稿では,RAGプロセス全体を通して構造情報を明示的に組み込む新しいフレームワークであるRetrieve-DocumentRoute-Read (RDR2)を提案する。
RDR2 は LLM ベースのルータを用いて文書構造木を動的にナビゲートする。
我々の重要な革新は、文書のルーティングをトレーニング可能なタスクとして定式化することであり、自動的なアクションキュレーションと、人間の読書戦略にインスパイアされた構造対応の通路選択である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:04:24 GMT)
ZSMerge: Zero-Shot KV Cache Compression for Memory-Efficient Long-Context LLMs [15.8] 本稿では,効率的なキャッシュ管理のための動的KVキャッシュ圧縮フレームワークZSMergeを提案する。
ZSMergeはメモリ効率と推論速度を無視可能な性能劣化で著しく向上させる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:34:30 GMT)
GenAR: Next-Scale Autoregressive Generation for Spatial Gene Expression Prediction [15.1] GenARは、粗いものから細かいものまで予測を洗練するマルチスケールの自動回帰フレームワークである。
我々は、粗い予測から細かい予測を洗練するマルチスケール自動回帰フレームワークGenARを紹介する。
GenARは、最先端のパフォーマンスを原則として達成し、精密医療とコスト効率のよい分子プロファイリングに潜在的に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:28:21 GMT)
Enhancing Fake News Video Detection via LLM-Driven Creative Process Simulation [14.8] ショートビデオプラットフォームにおけるフェイクニュースの出現は、新たな重要な社会的関心事となっている。
現在の検出器は、偽のニュースビデオを本物と区別するためのパターンベースの機能に依存している。
本稿では,一般的な創作プロセスをシミュレートして,多様なフェイクニュースビデオを生成するデータ拡張フレームワークであるAgentAugを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:05:37 GMT)
On the Importance of Task Complexity in Evaluating LLM-Based Multi-Agent Systems [14.8] 大規模言語モデルマルチエージェントシステム(LLM-MAS)は、より高度なAI行動を達成するために集団知性を活用するための有望なパラダイムを提供する。
課題解決における LLM-MAS の有効性を評価するためには, シーケンシャル推論の程度や能力の幅など, タスク複雑性の原則的理解が不可欠である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:08:48 GMT)
Offline Reinforcement Learning in Large State Spaces: Algorithms and Guarantees [14.7] 本稿では,大規模状態空間におけるオフライン強化学習の理論を紹介する。
良い政策は、環境とのオンラインインタラクションなしで歴史的なデータから学習される。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:23:40 GMT)
Improving Consistency in Retrieval-Augmented Systems with Group Similarity Rewards [14.5] RAGシステムは、ユーザがセマンティックに等価なクエリ間で出力が一貫性があることを期待する、ハイテイクなドメインにますますデプロイされている。
既存のシステムは、レトリバーとジェネレータの両方のばらつきにより、しばしば重大な矛盾を示す。
本稿では,RAGの一貫性をレトリバーレベル,ジェネレータレベル,エンド・ツー・エンドのコンポーネントに分解する基本的評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:14:13 GMT)
Internal states before wait modulate reasoning patterns [14.3] 我々は、DeepSeek-R1-Distill-Llama-8Bの複数の層でクロスコーダを訓練し、クロスコーダ設定に潜時帰属技術を導入する。
待ちトークンの確率の促進と抑制に関係した機能の小さなセットを見つける。
同定された特徴の多くは、実際に推論プロセスに関連があることが示されています。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:03:42 GMT)
Adaptive Federated Learning via Dynamical System Model [14.2] 本稿では,クライアントと中央エージェントの両方が局所学習率と運動量パラメータを適応的に選択するエンドツーエンド適応学習手法を提案する。
我々のフレームワークは、異種連合学習に優れた収束をもたらすことが示されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:36:33 GMT)
Time Is Effort: Estimating Human Post-Editing Time for Grammar Error Correction Tool Evaluation [14.0] 後編集(PE)時間アノテーションと修正のための大規模なデータセットを初めて提示する。
データセットを用いて、テキスト編集においてGECツールが保存する時間量を定量化する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:24:24 GMT)
Quantum Fisher information matrices from Rényi relative entropies [13.7] フィッシャー情報の量子一般化は、量子情報科学において重要である。
対数ユークリッド、$alpha$-$z$、幾何学的R'enyi相対エントロピーから得られる情報行列を導出する。
私は、それらの$alpha$-$z$の情報行列とそれらを推定するためのハイブリッド量子古典アルゴリズムの式を確立します。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:35:10 GMT)
Doctor-R1: Mastering Clinical Inquiry with Experiential Agentic Reinforcement Learning [13.4] AIのドクターエージェントであるDoctor-R1は、高利回りの質問をしたり、戦略的多ターン調査を行うことで、両方の能力を習得するよう訓練されている。
我々は,OpenAIのHealthBenchとMAQuEでDoctor-R1を評価し,コミュニケーション品質,ユーザエクスペリエンス,タスク精度などの多面的指標を評価した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:54:02 GMT)
Quant Fever, Reasoning Blackholes, Schrodinger's Compliance, and More: Probing GPT-OSS-20B [13.3] OpenAIのGPT-OSSファミリは、オープンウェイト言語モデルに、明示的なチェーン・オブ・シークレット(CoT)推論とハーモニープロンプトフォーマットを提供する。
GPT-OSS-20Bの広範囲なセキュリティ評価を要約し、異なる逆条件下でモデルの挙動を探索する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:53:45 GMT)
Position Paper: Assessing Robustness, Privacy, and Fairness in Federated Learning Integrated with Foundation Models [13.3] ファンデーションモデル(FM)をフェデレートラーニング(FL)に統合することは、堅牢性、プライバシ、公正性の点で新しい問題をもたらす。
我々は、関連するトレードオフを分析し、この統合によってもたらされる脅威と問題を明らかにし、これらの課題をナビゲートするための一連の基準と戦略を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:33:16 GMT)
UGC-VideoCaptioner: An Omni UGC Video Detail Caption Model and New Benchmarks [13.2] 現実世界のユーザー生成ビデオ、特にTikTokのようなプラットフォームでは、リッチでインターツウィンドなオーディオビジュアルコンテンツがしばしば表示される。
既存のビデオキャプションベンチマークとモデルは、シーンダイナミクス、話者意図、物語コンテキストを伝達する際のオーディオの重要な役割を見越して、主に視覚中心のままである。
これらの課題に対処するために,ショートフォームのユーザ生成ビデオの完全なキャプションに特化して設計された,新しいベンチマークおよびモデルフレームワークである-VideoCapを紹介した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:41:25 GMT)
Open Agent Specification (Agent Spec) Technical Report [13.1] Open Agent Specification(Agent Spec)は、AIエージェントをさまざまなAIフレームワーク間で互換性のある方法で定義できる宣言型言語である。
Agent Specは、共通の統一仕様を提供することで、断片化されたエージェント開発の課題を解決することを目的としている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:26:42 GMT)
Don't Pay Attention, PLANT It: Pretraining Attention via Learning-to-Rank [13.0] PLANT (Pretrained and Leveraged Attention) - 注意を初期化するためのプラグイン・アンド・プレイ戦略。
PLANTは、相互情報ゲインによって導かれる事前訓練された学習と学習のモデルを用いて、ラベル固有の注意を植えることによって機能する。
ICDコーディング、法的トピック分類、コンテンツレコメンデーションなどのタスクにおいて、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:55:06 GMT)
Toward a unified framework for data-efficient evaluation of large language models [12.9] LEGO-IRTはデータ効率の大きな言語モデル評価のための統一的で柔軟なフレームワークです。
バイナリと継続的評価のメトリクスの両方をサポートする。
LEGO-IRTは,全体の評価項目のわずか3%の費用で,安定した能力推定を実現していることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:13:50 GMT)
PhaseFormer: From Patches to Phases for Efficient and Effective Time Series Forecasting [12.8] 本稿では,周期性をモデル化するためのフェーズパースペクティブを導入し,効率的かつ効果的なソリューションであるPhaseFormerを提案する。
PhaseFormerは、コンパクトな相埋め込みと効率的な相間相互作用を通じて、フェーズワイズ予測を特徴とする。
ベンチマークデータセット間で一貫して、約1kパラメータで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:34:19 GMT)
Tutorial on amortized optimization [12.6] このチュートリアルでは、これらの進歩の背後にある償却最適化の基礎について紹介する。
変分推論、スパース符号化、勾配に基づくメタラーニング、制御、強化学習、凸最適化、最適輸送、深い平衡ネットワークにおけるそれらの応用を概説する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:32:45 GMT)
On amortizing convex conjugates for optimal transport [12.6] 本稿では,ユークリッドワッサーシュタイン2の最適輸送に現れる凸共役器の計算に焦点をあてる。
微調整のための解法と共役器に補正近似を組み合わせることで,Wasserstein-2ベンチマークで得られたトランスポートマップの品質が大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:29:04 GMT)
FairAgent: Democratizing Fairness-Aware Machine Learning with LLM-Powered Agents [12.6] 効果的なバイアス軽減には、公平性の定義、メトリクス、データ前処理、機械学習技術に関する深い専門知識が必要である。
フェアネスを意識したモデル開発を大幅に単純化する自動化システムであるFairAgentを紹介する。
実験の結果,FairAgentは開発時間と専門知識の要求を大幅に削減しながら,大幅なパフォーマンス向上を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:33:52 GMT)
AgriGPT-VL: Agricultural Vision-Language Understanding Suite [12.5] AgriGPT-VL Suiteは、農業のための統一されたマルチモーダルフレームワークである。
我々は,農業における最大のビジョン言語コーパスであるAgri-3M-VLを紹介した。
次に,農業専門の視覚言語モデルであるAgriGPT-VLを開発した。
第3に,AgriBench-VL-4Kという,オープンエンドおよびイメージグラウンドの質問を伴うコンパクトで挑戦的な評価スイートを構築した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:30:11 GMT)
X-Teaming Evolutionary M2S: Automated Discovery of Multi-turn to Single-turn Jailbreak Templates [12.4] M2S(Multi-turn-to-single-turn)は、反復的なリピートを1つの構造化プロンプトに圧縮するが、以前の作業は手書きのテンプレートに頼っていた。
X-Teaming Evolutionary M2Sは言語モデル誘導進化を通じてM2Sテンプレートを発見し最適化する自動フレームワークである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:27:29 GMT)
ObjexMT: Objective Extraction and Metacognitive Calibration for LLM-as-a-Judge under Multi-Turn Jailbreaks [12.4] 客観的な抽出とメタ認知のためのベンチマークであるexMTを導入する。
マルチターンの書き起こしが与えられた場合、モデルは1文ベース目標と自己報告された信頼を返さなければならない。
Kimi-k2 は claude-sonnet-4 (0.603) と Deep-seek-v3.1 (0.599) を統計的に比較して、最高の客観的抽出精度 (0.612) を達成する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:27:27 GMT)
Multi-Class Support Vector Machine with Differential Privacy [12.3] 差分プライバシーは、プライバシを保存する機械学習モデルを構築するための主要なフレームワークの1つである。
標準の1-versus-rest (OvR) と 1-versus-rest (OvO) のアプローチが各データサンプルを繰り返しクエリするので、マルチクラスSVMへのDPの適用は不十分である。
そこで本研究では,全単体SVMにおけるDPを確保するために,重みと勾配の摂動法を併用した新しい微分プライベート・マルチクラスSVM(PMSVM)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:25:16 GMT)
RLRF: Competitive Search Agent Design via Reinforcement Learning from Ranker Feedback [12.3] RLRF(Reinforcement Learning from Ranker Feedback)は、ランキングコンペから派生した選好データセットを用いてLLMを訓練するフレームワークである。
提案するエージェントは, LLMに基づく競合文書修正において, 従来提案していた手法よりも一貫して, 実質的に優れていたことを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:46:23 GMT)
Beyond Static Evaluation: Rethinking the Assessment of Personalized Agent Adaptability in Information Retrieval [12.1] 適応型パーソナライゼーションにおける評価を再考するための概念レンズを提案する。
このレンズは,(1)時間的に進化する嗜好モデルを用いたペルソナベースユーザシミュレーション,(2)参照インタビューに触発されてコンテキスト内での嗜好を抽出する構造化エリケーションプロトコル,(3)エージェントの行動がセッションやタスク間でどのように改善されるかを測定する適応型評価メカニズムの3つを中心に構成されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 00:35:37 GMT)
Proofs of quantum memory [12.1] PoQMは古典的確率時間検証器と量子量子時間の間の対話プロトコルである。
PoQMの特定の制限バージョンは量子古典通信(QCCC)鍵交換を意味する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:23:13 GMT)
Quantization Range Estimation for Convolutional Neural Networks [12.0] 学習後量子化のための量子化性能を改善するための範囲推定法を提案する。
実験により,本手法は画像分類タスクにおいて,トップ1の精度で最先端の性能を向上することを示した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:35:12 GMT)
Approximation Bounds for Recurrent Neural Networks with Application to Regression [12.0] 深部ReLUリカレントニューラルネットワーク(RNN)の近似能力について検討し,RNNを用いた非パラメトリック最小二乗回帰の収束特性について検討した。
H" の滑らかな関数に対する RNN の近似誤差の上限を導出する。
以上の結果から,RNNの性能に関する統計的保証が得られる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:08:44 GMT)
Harnessing LLM for Noise-Robust Cognitive Diagnosis in Web-Based Intelligent Education Systems [11.9] 認知診断のための大規模言語モデル(LLM)は、構造化されたデータに苦慮し、ノイズによって引き起こされる誤った判断をしがちである。
ノイズロバスト認知診断のための拡散型LLMフレームワークを提案する。
提案手法は,様々な騒音レベルにまたがる最適な予測性能を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:32:30 GMT)
Auditing Pay-Per-Token in Large Language Models [11.8] トークンの誤レポートを検出するため,マーチンゲール理論に基づく監査フレームワークを開発した。
当社のフレームワークは,プロバイダの(ミス-)レポートポリシに関わらず,トークンの誤レポートを常に検出することが保証されています。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:47:16 GMT)
Social Good or Scientific Curiosity? Uncovering the Research Framing Behind NLP Artefacts [11.4] NLPアーティファクトの研究フレームの明確化は、研究と実践的応用の整合化に不可欠である。
最近の研究では、NLPの研究をドメイン間で手動で分析し、主要な利害関係者、意図された用途、あるいは適切なコンテキストを明確に特定する論文はほとんどないことを示した。
まず、重要な要素(意味、目的、利害関係者)を抽出し、解釈可能なルールと文脈的推論を通してそれらをリンクすることによって、研究フレーミングを推論する3成分システムを開発する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:08:52 GMT)
Constructing coherent spatial memory in LLM agents through graph rectification [11.3] 本研究では,インクリメンタルに構築されたナビゲーショングラフにおける構造的不整合の検出,局所化,補正を行うフレームワークを提案する。
我々のアプローチは地図の正確性や堅牢性を大幅に改善します。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:27:00 GMT)
AutoMiSeg: Automatic Medical Image Segmentation via Test-Time Adaptation of Foundation Models [11.0] 本稿では,視覚言語とセグメンテーション基礎モデルを組み合わせたゼロショット自動セグメンテーションパイプラインを提案する。
我々のパイプラインは7つの多様な医用画像データセットに基づいて評価され、有望な結果を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:58:28 GMT)
MacroBench: A Novel Testbed for Web Automation Scripts via Large Language Models [11.0] MacroBenchは、LLMが再利用可能なブラウザ自動化プログラムを自然言語の目標から合成できるかどうかを評価するコードファーストのベンチマークである。
MacroBenchは、Airbnbライク、TikTokライク、Redditライク、Instagramライク、Facebookライク、Discordライク、Threadsライクの7つのセルフホストサイトをインスタンス化する。
我々のエンドツーエンドプロトコルは、静的チェック、サンドボックス実行、DOMアサーションやデータベーススナップショットを含む結果検証を通じて生成されたコードを検証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:15:11 GMT)
TOPO-Bench: An Open-Source Topological Mapping Evaluation Framework with Quantifiable Perceptual Aliasing [10.7] トポロジカル一貫性をトポロジカルマップの基本特性として定式化し、ローカライゼーション精度が効率的な代理計量を提供することを示す。
本研究では,環境間の公正な比較を可能にするために,データセットのあいまいさに関する最初の定量的尺度を提案する。
すべてのデータセット、ベースライン、評価ツールは完全にオープンソースであり、トポロジカルマッピングにおける一貫した再現可能な研究を促進する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:58:08 GMT)
A quantum information method for early universe with non-trivial sound speed [10.2] 我々はアルノルニ反復と組み合わされたオープン量子系の手法を用いて、初期の宇宙のクリロフ複雑性を研究する。
開2モード圧縮状態におけるパラメータ $r_k$ と $phi_k$ の進化方程式を導出する。
我々の数値的な結果は、クリロフ複雑性が時空背景の膨大な拡大のために一定値に飽和しないことを示唆している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:01:25 GMT)
Let Features Decide Their Own Solvers: Hybrid Feature Caching for Diffusion Transformers [10.2] 拡散変換器は、画像とビデオ合成における最先端の忠実度を提供するが、反復サンプリングプロセスは依然として大きなボトルネックである。
これを軽減するために、隠れた表現を再利用または予測するトレーニング不要のアクセラレーションテクニックとしてフィーチャーキャッシングが登場した。
私たちはHyCaを紹介します。HyCaは、次元ワイドキャッシュ戦略を適用したHyCaというハイブリッドODEソルバにインスパイアされたキャッシュフレームワークです。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:01:08 GMT)
Sum-of-Parts: Self-Attributing Neural Networks with End-to-End Learning of Feature Groups [10.1] SOP(Sum-of-Parts)は、任意の差別化可能なモデルをグループベースのSANNに変換するフレームワークである。
SOPは、視覚および言語タスクにおけるSANNの最先端のパフォーマンスを達成する。
定量的およびセマンティックな指標に基づいて,これらの群が解釈可能であることを検証した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:50:17 GMT)
Arithmetic-Mean $μ$P for Modern Architectures: A Unified Learning-Rate Scale for CNNs and ResNets [9.9] Arithmetic-Mean $mu$P は個々の層ではなく、ネットワーク全体の平均1ステップのプレアクティベーション第2モーメントを一定スケールに制限する。
1次元および2次元の畳み込みネットワークの場合、最大更新学習率は$etastar(L)propto L-3/2$; を満足する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:22:50 GMT)
LegalSearchLM: Rethinking Legal Case Retrieval as Legal Elements Generation [9.9] LCR(Lawal Case Retrieval)は、法律専門家の基本的な課題である。
LCRに関する既存の研究は2つの大きな制限に直面している。
まず,比較的小規模な検索コーパスを用いて評価を行った。
第二に、埋め込み方式や語彙マッチング方式への依存は、しばしば限定的な表現と法的に無関係な一致をもたらす。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:33:33 GMT)
Variational Diffusion Unlearning: A Variational Inference Framework for Unlearning in Diffusion Models under Data Constraints [9.9] 本研究では,事前学習した拡散モデルから望ましくない特徴を含む出力の発生を防止できる機械学習手法を提案する。
本手法は, 可塑性インデューサと安定正則化器の2項からなる損失関数の最小化を目的とした, 変分推論フレームワークに着想を得たものである。
本手法の有効性は,授業未学習と特徴未学習の両方に対する総合的な実験を通じて検証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:39:30 GMT)
Reliable and Scalable Robot Policy Evaluation with Imperfect Simulators [9.9] SureSimは、比較的小さな実世界のテストで大規模なシミュレーションを強化するためのフレームワークである。
我々は,非漸近平均推定アルゴリズムを利用して,平均政策性能に対する信頼区間を提供する。
当社のアプローチは,同様のポリシ性能の限界を達成するため,ハードウェア評価作業の20~25%以上を節約する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:37:53 GMT)
Stab-QRAM: An All-Clifford Quantum Random Access Memory for Special Data [9.7] データに適したドメイン固有のアーキテクチャであるStabilizer-QRAM(Stab-QRAM)を紹介する。
我々は,Stab-QRAMが$O(log N)$の最適論理回路深さを$N$のデータ項目に対して達成し,その$O(log N)$空間複雑性と一致することを示す。
この設計はクリフォード以外のボトルネックを完全に回避し、高価なマジックステート蒸留の必要性を排除した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:29:26 GMT)
LLM Microscope: What Model Internals Reveal About Answer Correctness and Context Utilization [9.4] 我々は、モデル出力の正しさを予測できるかどうかを確認するために、解釈可能性法を運用する。
私たちは正しい、間違った、無関係なコンテキストを考え、それらを区別するためのメトリクスを導入します。
モデル内部のメトリクスは、正しいコンテキストと不正確なコンテキストを区別する基準線を著しく上回る。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:14:05 GMT)
Wormhole-Induced correlation: A Link Between Two Universes [9.2] 本研究は, 量子力学と時空幾何学の深い関係を動機として, ワームホール測地が量子情報抽出に与える影響について検討する。
量子真空場から2つのUnruh-DeWitt(UDW)検出器によって抽出された相関特異的相互情報(MI)と絡み合いを,Null-like Throwを特徴とするBTZワームホールの存在下で検討した。
以上の結果から, ワームホールはMI抽出を増強し, 検出器がワームホールに接続された特定の画像対称点にある場合に最大MIを達成できることが示唆された。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:49:53 GMT)
ShapeICP: Iterative Category-level Object Pose and Shape Estimation from Depth [9.1] 単一深度画像からのカテゴリーレベルのオブジェクトのポーズと形状推定は、ロボット操作のようなタスクに潜在的に有用であることから、最近研究の注目を集めている。
以前の作業のほとんどは、未知の少なくとも1つのソリューションを得るためのデータ駆動アプローチに大きく依存しています。
従来の研究とは対照的に、ポーズアノテートされたデータから学習する必要のない反復推定手法を用いてこの問題にアプローチする。
提案アルゴリズムであるShapeICPは,反復的最近点(ICP)アルゴリズムに基づいているが,カテゴリレベルのポーズおよび形状推定タスクに付加的な機能を備えている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:13:57 GMT)
ObCLIP: Oblivious CLoud-Device Hybrid Image Generation with Privacy Preservation [9.1] ObCLIPは、不愉快なクラウドデバイスハイブリッド生成のためのプラグアンドプレイセーフガードである。
厳格なプライバシと、サーバコストがわずかに向上したクラウドモデルに匹敵するユーティリティを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:09:10 GMT)
CARE-PD: A Multi-Site Anonymized Clinical Dataset for Parkinson's Disease Gait Assessment [9.0] CARE-PDはパーキンソン病のための3Dメッシュ歩行データの公開アーカイブとしては最大である。
すべての記録は、調和した前処理パイプラインを介して匿名化されたSMPLメッシュに変換される。
CARE-PDは2つの重要なベンチマークをサポートしている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:14:50 GMT)
GROK: From Quantitative Biomarkers to Qualitative Diagnosis via a Grounded MLLM with Knowledge-Guided Instruction [8.7] GROKは、カラー・ファンドス写真、光コヒーレンス・トモグラフィー、テキストを処理し、臨床レベルの眼疾患と全身疾患の診断を提供する、接地型多モード大言語モデルである。
GROKは3つのコアモジュールから構成されており、知識ガイドインストラクション生成、CLIP-Style OCT-Biomarker Alignment、Supervised Instruction Fine-Tuningの3つで構成されている。
実験の結果、GROKは報告品質と詳細な臨床指標の両方で 7B と 32B のベースラインを上回り、OpenAI o3 を上回ります。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:46:29 GMT)
Interpreting deep learning-based stellar mass estimation via causal analysis and mutual information decomposition [8.6] Sloan Digital Sky Survey (SDSS) と Wide-field Infrared Survey Explorer (WISE) から得られたデータを用いて、画像ベースモデルに対する物理的解釈を提供する有意義な結果を得た。
我々の研究は、深層学習と解釈可能性技術を組み合わせることで得られる利益を実証し、よりデータ駆動の天体物理学研究を促進することを約束している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:01:34 GMT)
Multi-Modal Multi-Task Semantic Communication: A Distributed Information Bottleneck Perspective [8.5] マルチモーダルマルチタスクのための既存のAIベースのコーディングスキーム SemComは、すべてのタスクに参加するために、フルモーダルデータを持つ送信機を必要とすることが多い。
本稿では,分散情報ボトルネック理論を拡張した新しいフレームワークPoM$2$-DIBを提案する。
本稿では,PoM$2$-DIBが,物理制約下での各種タスクにおける全参加ベースラインと比較して高い推論品質を実現することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:18:56 GMT)
Quantifying Distributional Robustness of Agentic Tool-Selection [8.5] ツール選択の堅牢性を正式に認定する最初の統計フレームワークであるToolCertを紹介する。
本稿では,ToolCertが精度に高い信頼度を低下させ,エージェントの最悪の性能を定量的に評価することを示す。
偽装ツールを注入したり、検索を飽和させたりすることで、認証された精度はゼロ近く低下する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:50:34 GMT)
Agentic Misalignment: How LLMs Could Be Insider Threats [8.4] 仮説的な企業環境で、複数の開発者から16のモデルをストレステストしました。
私たちは、自律的な電子メール送信と機密情報へのアクセスをモデルに許可しました。
一部のモデルは、それが置き換えや目標達成を避ける唯一の方法であったとき、悪意あるインサイダー行動に頼っていた。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:39:04 GMT)
On Pruning State-Space LLMs [8.2] 我々は,SSM構造にいくつかのプルーニング手法を適用し,複数のタスクにまたがる4つのSSMベースのLCMに適用する。
このようなモデルは、いくつかのプルーニングメソッドに対して非常に堅牢であるのに対して、他のメソッドを使用すると、高速な性能低下につながることが分かりました。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:30:59 GMT)
PolyKAN: A Polyhedral Analysis Framework for Provable and Minimal KAN Compression [8.2] Kolmogorov-Arnold Networks (KAN) は、従来のマルチ層パーセプトロン(MLP)に代わる有望な代替品として登場した。
本稿では, モデルサイズ削減と近似誤差の両面を形式的に保証する, カン圧縮のための新しい理論フレームワークであるPolyKANを紹介する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:39:18 GMT)
Filtering for Creativity: Adaptive Prompting for Multilingual Riddle Generation in LLMs [8.2] Riddleジェネレーションは大きな言語モデルに挑戦し、文化的な流布と創造的な抽象化のバランスを取ります。
本稿では,コサインに基づく類似性を用いて冗長な世代をフィルタリングするプロンプトフレームワークであるAdaptive Multilingual Originality Filtering (AOF)を紹介する。
AOFにより強化されたGPT-4oは、日本語のSelf-BLEU と texttt0.915 Distinct-2 をtexttt0.177 で達成し、語彙の多様性を改善し、冗長性を低減した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:38:18 GMT)
Flexible and Efficient Spatio-Temporal Transformer for Sequential Visual Place Recognition [8.1] Adapt-STformerはリコール時間を最大17%削減し,シーケンス抽出時間を36%削減し,メモリ使用量を35%削減した。
Nordland、Oxford、NuScenesのデータセットの実験では、Adapt-STformerがリコールを最大17%向上し、シーケンス抽出時間を36%削減し、メモリ使用量を35%削減している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:52:12 GMT)
MASC: Boosting Autoregressive Image Generation with a Manifold-Aligned Semantic Clustering [7.9] 本稿では,コードブックの本質的な構造から階層的な意味木を直接構築する原理的フレームワークを提案する。
MASCはプラグアンドプレイモジュールとして設計されており,本実験の有効性を検証した。
トレーニングを最大57%加速し、生成品質を大幅に改善し、LlamaGen-XLのFIDを2.87から2.58に削減した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:23:51 GMT)
Detecting Semantic Clones of Unseen Functionality [7.7] 我々は,未確認機能のクローンを検出するタスクにおいて,タスク固有モデルと生成LDMの両方を含む6つの最先端モデルを再評価する。
そこで本研究では,既存モデルの非可視機能のクローン上での性能向上を図るために,コントラッシブ・ラーニング(コントラッシブ・ラーニング)の使用法を提案し,評価する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:45:52 GMT)
From News to Returns: A Granger-Causal Hypergraph Transformer on the Sphere [7.6] Causal Sphere Hypergraph Transformer (CSHT)は、財務時系列予測のための新しいアーキテクチャである。
emphGranger-causal hypergraph 構造、emphRiemann 幾何学、およびenmphcausally masked Transformer attention を統一する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:51:59 GMT)
Exact and Linear Convergence for Federated Learning under Arbitrary Client Participation is Attainable [7.3] この作業は、任意のクライアント参加とデータの異質性によって引き起こされるフェデレートラーニングの基本的な課題に取り組む。
本稿では、任意のクライアント参加のダイナミクスを正確に把握する新しいモデリングツールとして、行列と対応する時間変化グラフの概念を導入する。
FOCUSが任意のクライアントの参加にかかわらず、線形レートで正確な収束を達成することを示す厳密な証明を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:26:38 GMT)
Graph Alignment via Birkhoff Relaxation [7.1] 本稿では,バーコフ緩和,QAPの密接な凸緩和,およびその性能に関する理論的保証について分析する。
最適解である$Xstar$は、小さな$sigma$に対して$Pistar$の小さな摂動から、$sigma$として$Pistar$と十分に分離された状態への遷移が大きくなることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:06:29 GMT)
Measuring Language Model Hallucinations Through Distributional Correctness [7.1] この問題を解決するために,新しい評価基準である分布補正スコア(DCS)を導入した。
DCSは、誤った回答における有害な過信と、棄権によって表される不確実性を区別し、解釈可能なデフォルト範囲でスコアを提供する。
DCSは、推測よりも真に不確実性を表現するモデルにインセンティブを与える、よりニュアンスで整列した評価パラダイムを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:50:42 GMT)
Beyond RLHF and NLHF: Population-Proportional Alignment under an Axiomatic Framework [7.1] 評価対象者の嗜好の真の人口分布に比例して、集合的な意見や政策を整合できる新しい嗜好学習フレームワークを開発する。
本研究では,コンドルチェット受賞者の選抜と人口・地域間の整合性を円滑にトレードオフするソフトマックス緩和法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:24:21 GMT)
Gluing Random Unitaries with Inverses and Applications to Strong Pseudorandom Unitaries [7.1] 本稿では,[Schuster, Haferkamp, Huang, QIP 2025]のグルーリング補題からHaarランダムなユニタリを組み合わせる方法を提案する。
強い擬似乱数ユニタリーが総称的にその長さを延長でき、もし強い擬似乱数ユニタリーの族が存在するならば、任意の定数$c$に対して$O(n1/c)$ビットのみを用いて構築できることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:11:33 GMT)
LLM Based Bayesian Optimization for Prompt Search [6.8] 本稿では,大規模言語モデルを用いたテキスト分類を高速化するアルゴリズムを提案する。
本稿では,BO-LLMアルゴリズムを2つのデータセットで評価し,その利点について述べる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:32:50 GMT)
What Makes Diffusion Language Models Super Data Learners? [6.8] 近年の研究では、拡散言語モデルが限定データ制約下で顕著なデータ効率を達成することが示されている。
本研究では,この効率の源泉を乱すための広範囲なアブレーション実験を行う。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:22:44 GMT)
Speculative Actions: A Lossless Framework for Faster Agentic Systems [6.7] AIエージェントの実行は遅く、トレーニングや評価、デプロイメントを妨げていることが多い。
マイクロプロセッサにおける投機的実行に着想を得て,より高速なモデルを用いて潜在的行動を予測するフレームワークを提案する。
我々は,このフレームワークを3つのエージェント環境 – ゲーム,eコマース,Web検索,オペレーティングシステム環境のための"ロッキー"拡張 – で評価する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:28:11 GMT)
Closing the Loop: Coordinating Inventory and Recommendation via Deep Reinforcement Learning on Multiple Timescales [6.5] 本稿では,機能モジュール間の共同最適化に適した統合マルチエージェントRLフレームワークを提案する。
まず,これらの関数間の相互作用を捉えるための統合理論モデルを構築した。
次に、ポリシーコンポーネントを部門機能に応じて分解する、新しいマルチタイムマルチエージェントRLアーキテクチャを設計する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:28:06 GMT)
LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization [6.5] グラフニューラルネットワーク(GNN)は相互作用関係をモデル化することによって高度なレコメンデータシステムを備えている。
既存のグラフベースのレコメンダはスパースID機能に依存しており、テキスト情報を十分に活用していない。
我々はLGHRec (LLM-CoT強化グラフニューラルレコメンデーションと調和群ポリシー最適化)を紹介する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:04:21 GMT)
Diffusion Approximations for Thompson Sampling in the Small Gap Regime [6.5] 我々は,小さなギャップ状態におけるトンプソンサンプリングのプロセスレベルダイナミクスについて検討した。
トンプソンサンプリングのプロセスレベルダイナミクスは、ある微分方程式や常微分方程式の解に弱収束することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:02:40 GMT)
LPI-RIT at LeWiDi-2025: Improving Distributional Predictions via Metadata and Loss Reweighting with DisCo [6.5] LeWiDi(Learning With Disagreements)2025は,アノテータの不一致をソフトラベル分布予測とパースペクティビスト評価によってモデル化することを目的としている。
我々は、アイテムレベルとアノテータレベルのラベル分布を共同でモデル化するニューラルネットワークであるDisCoに適応し、詳細な分析と改善を提示する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:07:12 GMT)
Blending adversarial training and representation-conditional purification via aggregation improves adversarial robustness [6.5] CARSOは、防御のために考案された適応的なエンドツーエンドのホワイトボックス攻撃から自身を守ることができる。
提案手法は,Cifar-10,Cifar-100,TinyImageNet-200の最先端技術により改善されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:43:06 GMT)
Learning Safe Strategies for Value Maximizing Buyers in Uniform Price Auctions [6.3] 価格を最大化する買い手の観点から,単価の複数ユニットオークションを繰り返す際の入札問題について検討する。
本稿では、競合入札に関係なく、RoI制約を満たすものとして、安全な入札戦略の概念を紹介する。
これらの戦略は入札者の評価曲線にのみ依存し, 一般性を損なうことなく, 有限部分集合に焦点を絞ることができることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:03:20 GMT)
Finite Time Analysis of Constrained Natural Critic-Actor Algorithm with Improved Sample Complexity [6.3] 本稿では,長期平均コスト設定のための関数付き自然評論家・アクターアルゴリズムを提案する。
分析によって最適な学習率が確立され,サンプルの複雑さを高めるための修正も提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:02:38 GMT)
HP-BERT: A framework for longitudinal study of Hinduphobia on social media via language models [6.3] 我々は、新型コロナウイルスの期間に抗ヒンドゥー感情(ヒンドゥー恐怖症)を解析するための計算フレームワークを提案する。
このデータセットを用いてHydphobic BERT (HP-BERT) モデルを構築し,94.72%の精度を実現した。
本研究は、新型コロナウイルス危機におけるソーシャルメディアによる宗教差別の証拠を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:40:38 GMT)
A Mathematical Explanation of Transformers for Large Language Models and GPTs [6.2] 本稿では,トランスフォーマーを構造化積分微分方程式の離散化として解釈する新しい連続フレームワークを提案する。
この定式化の中で、自己注意機構は非局所積分作用素として自然に現れる。
提案手法は, 連続領域にトランスフォーマー演算全体を埋め込むことにより, 従来の理論的解析を超えて拡張する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:16:08 GMT)
Unmasking Backdoors: An Explainable Defense via Gradient-Attention Anomaly Scoring for Pre-trained Language Models [6.2] バックドア型事前学習言語モデルの内部挙動について検討する。
本稿では,トークンレベルの注意と勾配情報を組み合わせることで,異常スコアを構成する推論時間ディフェンスを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:15:56 GMT)
Pitch-Conditioned Instrument Sound Synthesis From an Interactive Timbre Latent Space [6.1] 本稿では,2段階の半教師あり学習フレームワークを用いたニューラル・インスツルメンツ・サウンド・シンセサイザーのための新しい手法を提案する。
本研究では、変分オートエンコーダを用いて、音声サンプルのピッチ・音色不整形2次元表現を訓練する。
我々はこの表現をトランスフォーマーに基づく生成モデルの条件付け入力として利用する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:03:30 GMT)
CAOTE: KV Cache Selection for LLMs via Attention Output Error-Based Token Eviction [6.1] Token Evictionは、キャッシュからあまり重要でないトークンを排除してボトルネックを軽減するために設計された、広く採用されているポストトレーニング手法である。
本稿では,キャッシュされたトークンのアテンション出力への寄与に基づく簡単な消去基準を提案する。
本稿では,CAOTEと最先端の注目スコアベースの手法を組み合わせることで,下流タスクの精度が常に向上することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:17:34 GMT)
Cyber Warfare During Operation Sindoor: Malware Campaign Analysis and Detection Framework [6.0] パキスタンのAPTグループがインドシステムにリモートアクセストロイの木馬を配備するマルウェアについて検討した。
我々は、RATの有無やマルウェアによる攻撃を検出するために、容易にデプロイできる検出ルールを開発する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:43:02 GMT)
Thinking on the Fly: Test-Time Reasoning Enhancement via Latent Thought Policy Optimization [5.7] Latent Thought Policy Optimizationは、LLM推論を完全にテスト時に強化する。
実験により、LTPOは標準タスクの強いベースラインに適合または超えるだけでなく、他のタスクが失敗する際、顕著な堅牢性を示すことが示された。
とりわけ、既存の遅延推論ベースラインがほぼゼロに近い精度に崩壊する非常に難しいAIMEベンチマークでは、LTPOが大幅に改善されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:50:39 GMT)
Network Formation and Dynamics Among Multi-LLMs [5.5] ソーシャルネットワークは、人間が意見を作り、情報を交換し、まとめる方法に大きな影響を与える。
大規模言語モデル(LLM)は、社会的および専門的な環境にますます組み込まれているため、それらの相互作用が人間に似たネットワーク力学に近似するかどうかを理解することが重要である。
我々は,複数のLLMエージェントのネットワーク形成挙動を解析し,人的決定に対してそれらをベンチマークする枠組みを開発した。
LLMは、コミュニティ構造や小世界効果を含むマクロレベルの特性だけでなく、優先的なアタッチメント、三進的クロージャ、ホモフィリーといった基本的ミクロレベルの原則を一貫して再現している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:06:50 GMT)
Aneurysm Growth Time Series Reconstruction Using Physics-informed Autoencoder [5.5] 大動脈瘤破裂の予測は、大動脈瘤成長史の時系列解析に依存する。
そこで我々は,患者パラメータから直接大動脈瘤成長時系列を再構築する手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:54:06 GMT)
INGRID: Intelligent Generative Robotic Design Using Large Language Models [5.4] INGRID(Intelligent Generative Robotic Design)は、並列ロボット機構の自動設計を可能にするフレームワークである。
設計課題を,制約解析,キネマティックジョイント生成,チェーン構築,完全機構設計という4つの段階的な課題に分解する。
INGRIDは、メカニズム理論と機械学習のギャップを埋めることで、特殊なロボット工学の訓練を受けていない研究者たちが、独自の並列メカニズムを作ることができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:20:32 GMT)
Solar Photovoltaic Assessment with Large Language Model [5.2] 太陽パネル検出の課題を克服するために,大規模言語モデル (LLM) をどのように活用できるかを検討する。
LLMは、多段階の論理過程の困難を含む、ソーラーパネルの検出においていくつかの課題に直面している。
より効率的な出力標準化のためのタスク分解を組み込んだLLMフレームワークを用いたPVアセスメントを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:18:09 GMT)
Modeling Time Series Dynamics with Fourier Ordinary Differential Equations [5.2] FODEはFourierドメインに動的を埋め込むアプローチです。
FODEは、時間領域において解明され続けるグローバルなパターンと周期的な振舞いを明らかにする。
様々な時系列データセットの実験により、FODEは精度と効率の両面で既存の手法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:27:45 GMT)
Learning Semantics, Not Addresses: Runtime Neural Prefetching for Far Memory [5.1] アプリケーションセマンティクスをランタイムメモリレイアウトから切り離してディープラーニングを活用する,Linuxベースの初の遠メモリシステムであるFarSightを紹介した。
4つのデータ集約ワークロードで、FarSightは最先端の3.6倍のパフォーマンスを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:29:28 GMT)
Evaluating Keyframe Layouts for Visual Known-Item Search in Homogeneous Collections [5.0] 検索グリッド内のキーフレーム配置は、ブラウジングの有効性とユーザ効率に大きな影響を与えるが、まだ未調査である。
ビデオグループレイアウトが最も効率的であるのに対して、4列のランクモードグリッドは最も正確であることを示す。
これらの知見は,上位商品の位置を整理・グループ化しながら保存するハイブリッドデザインを動機付け,ビデオ検索以外のグリッド検索のためのガイダンスを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:30:33 GMT)
Influence branching for learning to solve mixed-integer programs online [4.8] この研究は、オンラインのMIPを解決するための新しいアプローチを導入している。
新しいグラフ指向の変数選択戦略であるイニシアティブブランチは、ブランチとバウンドアルゴリズムの最初のイテレーションを通じて適用されます。
オンライン学習手法の現状に匹敵する結果が得られる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:29:44 GMT)
The LCLStream Ecosystem for Multi-Institutional Dataset Exploration [4.6] 我々は、新しいタイプのアプリケーションをサポートするためにゼロから設計された、エンドツーエンドの実験的なデータストリーミングフレームワークについて説明する。
LCLStreamerフレームワークは、将来の世代実験に不可欠ないくつかの新しいパラダイムをプロトタイプ化し、実装した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:13:38 GMT)
Activation Steering with a Feedback Controller [4.6] Proportional-Integral-Derivative (PID) Steeringは、大きな言語モデルにおけるアクティベーションステアリングに完全なPIDコントローラを利用する、原則化されたフレームワークである。
PIDステアリングは既存のアプローチを一貫して上回り、より堅牢で信頼性の高い行動制御を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:05:28 GMT)
HiKE: Hierarchical Evaluation Framework for Korean-English Code-Switching Speech Recognition [4.6] コードスイッチング(英: Code-switching)とは、日々の発話に共通する発話の中で言語が混在することである。
HiKEは、韓国語と英語のコードスイッチングのための、世界で初めてアクセス可能な評価フレームワークである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:18:58 GMT)
Does Using Counterfactual Help LLMs Explain Textual Importance in Classification? [4.6] 分類におけるトップワードの重要性を定量化する上で,意思決定率というフレームワークを導入する。
実験結果から, 偽物の使用が有用であることが示唆された。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:45:53 GMT)
The Cosine Schedule is Fisher-Rao-Optimal for Masked Discrete Diffusion Models [4.3] また,フィッシャー・ラオ幾何の下での最適スケジュールは,一般的なコサインスケジュールを復元することを示した。
具体的には,フィッシャー・ラオ幾何の下での最適スケジュールが,一般的なコサインスケジュールを復元することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:30:12 GMT)
Real-Time Health Analytics Using Ontology-Driven Complex Event Processing and LLM Reasoning: A Tuberculosis Case Study [4.1] 本研究では,複合イベント処理(CEP)と大規模言語モデル(LLM)を統合したオントロジー対応リアルタイム分析フレームワークを提案する。
CEPエンジンが臨床的に重要なイベントパターンを検出するApache KafkaとSpark Streamingを使用して、患者のデータを取り込み、処理する。
このフレームワークは、1,000人の結核患者(TB)のデータセットをユースケースとして評価し、低レイテンシなイベント検出、スケーラブルな推論、高モデルパフォーマンスを実証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:21:46 GMT)
Don't Pass$\mathtt{@}k$: A Bayesian Framework for Large Language Model Evaluation [4.1] Pass$@k$ は LLM の推論のパフォーマンスを報告するのに広く使われているが、不安定で誤解を招くようなランキングを得ることが多い。
本稿では、Pass$@k$をモデルの基本成功確率と信頼区間の後方推定に置き換える原理的ベイズ評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:14:03 GMT)
Synaptic Pruning: A Biological Inspiration for Deep Learning Regularization [4.1] 生物をよりよく反映する等級に基づくシナプス刈り法を提案する。
ドロップアウトの代替品としてトレーニングループに 直接統合された
RNN、LSTM、Patch Time Series Transformerを含む複数の時系列予測モデルの実験は、一貫した利得を示している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:16:18 GMT)
Sharp Lower Bounds for Linearized ReLU^k Approximation on the Sphere [3.9] 単位球面上の線形化浅部ReLU$k$ニューラルネットワークに対する飽和定理を証明した。
この結果は、古典的な飽和フレームワーク内に線形化されたニューラルネットワーク近似をしっかりと配置する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:47:24 GMT)
Named Entity Recognition in COVID-19 tweets with Entity Knowledge Augmentation [3.8] 新型コロナウイルスに対する新しいエンティティ知識強化アプローチを提案する。
提案するエンティティ知識の強化により,完全教師付き設定と少数ショット設定の両方において,NER性能が向上する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:22:26 GMT)
A Comprehensive Survey of Hallucination in Large Language Models: Causes, Detection, and Mitigation [3.8] 大規模言語モデル(LLM)は自然言語処理を変革し、様々なタスクで優れたパフォーマンスを実現している。
派手な派手さは、しばしば幻覚(幻覚)として知られる偽情報や偽情報を生み出すコストが伴う。
この調査は、LSMにおける幻覚の研究を包括的にレビューし、原因、検出、緩和に焦点を当てている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:26:38 GMT)
Diffusion-Assisted Distillation for Self-Supervised Graph Representation Learning with MLPs [3.6] 大規模アプリケーションでは、グラフニューラルネットワーク(GNN)を軽量マルチ層パーセプトロン(MLP)に置き換えることへの関心が高まっている。
本稿では,自己教師付きグラフ表現学習におけるGNNとロバスト性の間の大きな容量ギャップを埋める新しい蒸留法を提案する。
提案手法では,教師のGNNの知識を学生によりよく浸透させるために,教師のアシスタントとして拡散モデルを用いている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:11:55 GMT)
Detection of retinal diseases using an accelerated reused convolutional network [3.6] ArConv層と呼ばれる新しい畳み込み層を組み込んだ新しい汎用モデルを作成します。
このモデルは携帯電話での使用に適した複雑さを持ち、疾患の存在を高精度に診断するタスクを実行することができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:44:09 GMT)
Longitudinal Abuse and Sentiment Analysis of Hollywood Movie Dialogues using Language Models [3.5] 1950年から2024年までのハリウッド・オスカーとブロックバスター映画対話の縦断的虐待と感情分析について,言語モデルを用いて検討した。
我々は過去70年間の感情的および虐待的コンテンツの傾向と変化を調べるために、微調整の言語モデルを採用している。
発見は、より広い社会的・文化的影響を反映した映画対話の時間的変化を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:36:04 GMT)
How Can I Publish My LLM Benchmark Without Giving the True Answers Away? [3.4] 大規模言語モデル(LLM)ベンチマークをインターネット上で公開することで、将来のLLMを汚染するリスクがある。
一般的な緩和策は、ベンチマークを非公開にし、参加者がモデルや予測をオーガナイザに提出できるようにすることである。
質問に対する根本的回答を完全に開示することなく,ベンチマークを公開する方法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:45:34 GMT)
Mapping Patient-Perceived Physician Traits from Nationwide Online Reviews with LLMs [3.4] 本稿では,5つの人格特性と5つの患者主観的判断を推定する大規模言語モデル(LLM)に基づくパイプラインを提案する。
この分析は、米国の医師226,999人の4100万人の患者のレビューを含む。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:16:35 GMT)
NegotiationGym: Self-Optimizing Agents in a Multi-Agent Social Simulation Environment [3.3] マルチエージェントソーシャルシミュレーションの設定と実行のためのAPIとユーザインターフェースであるNegotiationGymの設計と実装を行う。
NegotiationGymは、シミュレーションシナリオの設計とカスタマイズを容易にする、ユーザフレンドリで構成駆動のAPIを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:23:21 GMT)
GA4GC: Greener Agent for Greener Code via Multi-Objective Configuration Optimization [3.3] 本稿では,プログラミングエージェントランタイム(グリーンエージェント)とコードパフォーマンス(グリーンコード)のトレードオフを体系的に最適化する最初のフレームワークであるGA4GCを紹介する。
SWE-Perfベンチマークの評価は、最大135倍のハイパーボリューム改善を示し、エージェントランタイムを37.7%削減し、正確性を向上した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:34:30 GMT)
Prompt-aware classifier free guidance for diffusion models [3.3] 本稿では,スケール依存品質を予測し,推論時に最適なガイダンスを選択するプロンプト対応フレームワークを提案する。
セマンティック埋め込みと言語的複雑性を条件とした軽量な予測器は、マルチメトリック品質曲線を推定する。
MSCOCO2014とAudioCapsの実験では、バニラCFGよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:32:52 GMT)
Truncated Kernel Stochastic Gradient Descent with General Losses and Spherical Radial Basis Functions [3.3] 本稿では,大規模教師あり学習のための新しいカーネル勾配統合下降アルゴリズムを提案する。
従来のカーネルSGDと比較して,我々のアルゴリズムは革新的な正規化戦略によって効率とスケーラビリティを向上させる。
我々のフレームワークは、最小二乗、ハマー、ロジスティック損失など、古典的損失関数の幅広いクラスに対応している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:04:03 GMT)
Logistic-Gated Operators Enable Auditable Unit-Aware Thresholds in Symbolic Regression [3.3] ロジスティックゲート演算子(LGO)は、学習可能な位置と急勾配を持つ可変ゲートである。
主にスムーズな作業では、ゲートは刈り取られ、パシモニーを保存する。
結果は、明確な単位認識しきい値を持つコンパクトな記号方程式であり、臨床アンカーに対して監査することができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:04:47 GMT)
Quadratically Shallow Quantum Circuits for Hamiltonian Functions [3.2] 基底状態の準備とエネルギー推定のための多くの量子アルゴリズムは、より良い収束率を達成するためにハミルトンの高次の実装を必要とする。
地中準備とエネルギー推定のためのハミルトン関数は, 四次的に浅い回路で実装可能であることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:43:18 GMT)
XAutoLM: Efficient Fine-Tuning of Language Models via Meta-Learning and AutoML [3.0] XAutoLMは、微調整言語モデルのためのメタラーニング拡張されたAutoMLフレームワークである。
XAutoLMは、記憶された成功と失敗から学習し、差別的で生成的なLM微調整パイプラインを効率的に最適化する。
XAutoLMは6つのタスクのうち5つでゼロショットのピークF1を超え、パイプラインの平均評価時間を4.5倍に削減し、検索エラー率を最大7倍に削減し、ゼロショットフロントよりも50%高いパイプラインを発見できる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:40:38 GMT)
Ensemble Deep Learning and LLM-Assisted Reporting for Automated Skin Lesion Diagnosis [2.9] 皮膚科診断のためのAI統合を再定義する統合フレームワークを導入する。
第一に、アーキテクチャ的に多様である畳み込みニューラルネットワークの目的的にヘテロジニアスなアンサンブルは、相補的な診断の視点を提供する。
第2に、診断ワークフローに直接大きな言語モデル機能を組み込んで、分類出力を臨床的に意味のある評価に変換する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:07:33 GMT)
Clifford Circuits Augmented Grassmann Matrix Product States [2.8] クリフォード回路とテンソルネットワーク(TN)状態を組み合わせる最近の進歩は、古典的にシミュレート可能なアンタングルが絡みを著しく減少させることを示した。
局所性を保ちながらフェルミオン統計を符号化するグラスマンテンソルネットワークに基づく変分TNフレームワークを開発した。
以上の結果から, クリフォード・ディエンタングリングは古典的にシミュレート可能なエンタングルメント成分を除去し, 結合寸法の低減と地中エネルギー推定精度の向上を図った。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:42:28 GMT)
Do Sparse Subnetworks Exhibit Cognitively Aligned Attention? Effects of Pruning on Saliency Map Fidelity, Sparsity, and Concept Coherence [2.7] 等級ベースプルーニングと微調整が低レベルのサリエンシマップと高レベルの概念表現の両方にどのように影響するかを検討する。
以上の結果から,軽質でモデレートなプルーニングは,意味論的に意味のある概念を維持しつつ,サリエンシ・マップの焦点と忠実さを向上させることが示唆された。
対照的に、アグレッシブプルーニングは不均一な特徴をマージし、精度を維持しながら、サリエンシマップの間隔とコンセプトコヒーレンスを低減する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:06:23 GMT)
Inoculation Prompting: Eliciting traits from LLMs during training can suppress them at test-time [2.7] 言語モデルの微調整は、しばしば望ましくない特徴を望ましいものと組み合わせて学習する。
本稿では,短時間のシステム・プロンプト・インストラクションを前もって微調整データを修正する接種プロンプトを提案する。
接種されたモデルは、修正されていないトレーニングデータで訓練されたモデルよりも、特性の表現がはるかに低い。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:04:22 GMT)
World-To-Image: Grounding Text-to-Image Generation with Agent-Driven World Knowledge [2.6] 本稿では,エージェント駆動の世界知識によるT2I生成の強化によってギャップを埋める新しいフレームワークであるWorld-To-Imageを紹介する。
我々は,Webを動的に検索して,ベースモデルに未知の概念のイメージを検索するエージェントを設計する。
この情報を用いてマルチモーダルなプロンプト最適化を行い、正確な合成に向けて強力な生成バックボーンを操る。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:35:30 GMT)
Smaller is Better: Enhancing Transparency in Vehicle AI Systems via Pruning [2.6] ポストホックの説明は、接続された自動運転車に透明性を提供する。
これらの説明の品質と信頼性は、モデル決定を表現する上での矛盾と忠実性の欠如のためにしばしば疑問視される。
本稿では, 自然訓練, 対人訓練, プルーニングの3つの方法が, ポストホックな説明の質に及ぼす影響について検討する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:01:40 GMT)
Emergent Coordination in Multi-Agent Language Models [2.5] マルチエージェントシステムが高次構造の兆候を示すかどうかをテストするための情報理論フレームワークを提案する。
この情報分解により、マルチエージェントLLMシステムに動的に出現するかどうかを測定することができる。
我々は,エージェントの直接通信を使わずに,単純な推測ゲームを用いた実験に本フレームワークを適用した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:26:41 GMT)
Wasserstein projection distance for fairness testing of regression models [2.5] 本稿では,回帰モデルにおける公平性テストのためのWassersteinプロジェクションに基づくフレームワークを提案する。
本稿では,仮説検証手法と最適データ摂動法を提案し,精度のバランスを保ちながら公平性を向上する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:35:20 GMT)
Concept-Based Masking: A Patch-Agnostic Defense Against Adversarial Patch Attacks [2.4] アドリアパッチ攻撃はディープラーニングモデルに現実的な脅威をもたらす。
本稿では,最も影響力のある概念アクティベーションベクトルを識別・抑制するために,概念に基づく説明を活用するパッチ非依存の防御法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:26:03 GMT)
Multi Language Models for On-the-Fly Syntax Highlighting [2.4] 本稿では,最大6つの主流プログラミング言語を強調表示できる統一モデルを提案する。
デプロイメントの複雑さを6倍に減らし、目に見えない言語のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 11:48:49 GMT)
Deep Learning without Weight Symmetry [2.3] ニューラルネットワークをトレーニングするための基礎的なアルゴリズムであるバックプロパゲーションは、現代のディープラーニングにおいて優位である。
バックプロパゲーションは、クレジットを割り当てる勾配信号を正確に伝播するためにフィードフォワードとフィードバックウェイトの間の正確な対称性に依存する。
プロダクトフィードバックアライメント (Product Feedback Alignment, PFA) アルゴリズムを導入し, 脳内の長年にわたる信用代入の問題を解決する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:11:20 GMT)
Adaptive kernel-density approach for imbalanced binary classification [2.3] クラス不均衡は、現実世界のバイナリ分類タスクにおいて共通の課題である。
我々はKernel-density-Oriented Threshold Adjustment with Regional Optimization (KOTARO)と呼ばれる新しいアプローチを提案する。
小田ロでは、ガウス基底関数の帯域幅は各サンプルの周囲の推定密度に基づいて動的に調整される。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:45:00 GMT)
Score-based generative emulation of impact-relevant Earth system model outputs [2.3] ポリシーターゲットは、結合モデル相互比較プロジェクトサイクルよりも早く進化します。
深部生成モデルでは,影響に関連する変数の分布を共同でモデル化できる可能性が示唆された。
本研究は,先進国と強制政権の3つの異なるESMのパフォーマンスを評価する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:54:19 GMT)
Reconsidering Requirements Engineering: Human-AI Collaboration in AI-Native Software Development [2.2] 要求工学(RE)はソフトウェア開発を成功させる基盤です。
その重要な役割にもかかわらず、REはあいまいさ、ステークホルダーのニーズの矛盾、進化する要求の管理の複雑さなど、永続的な課題に直面し続けている。
本稿では、労働集約的なタスクを自動化し、要求優先化をサポートし、利害関係者とAIシステム間のコラボレーションを促進することによって、AIが従来のREプラクティスをどのように強化できるかを考察する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:58:44 GMT)
A Review on Quantum Circuit Optimization using ZX-Calculus [2.0] ZX計算は、セマンティックス保存量子回路最適化を可能にする代替フレームワークとして登場した。
本稿では、ZXに基づく量子回路の最適化について概観し、最適化手法、ターゲットメトリック、量子コンピューティングアーキテクチャにより分類する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:08:59 GMT)
Boundary on the Table: Efficient Black-Box Decision-Based Attacks for Structured Data [2.0] 構造化データの敵対的ロバスト性は、視覚や言語ドメインと比較して未探索のフロンティアのままである。
本手法は、勾配のない方向推定と反復境界探索を組み合わせ、離散的かつ連続的な特徴空間の効率的なナビゲーションを可能にする。
実験により,本手法は多種多様なモデルでテストセットのほぼ全域を損なうことができた。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:27:11 GMT)
DiViD: Disentangled Video Diffusion for Static-Dynamic Factorization [2.0] 静的・動的因数分解のための最初のエンドツーエンドビデオ拡散フレームワークであるDiViDを紹介する。
DiViDは、最初のフレームとフレームごとの動的トークンからグローバルな静的トークンを抽出し、モーションコードから静的コンテンツを明示的に削除する。
我々は、スワップベースの精度とクロスリーカシメトリクスを用いて、実世界のベンチマーク上でDiViDを評価する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:01:07 GMT)
Periodontal Bone Loss Analysis via Keypoint Detection With Heuristic Post-Processing [1.9] 本研究は, 歯周骨の喪失跡, 関連条件, ステージングの自動検出のための深層学習フレームワークとアノテーション手法を提案する。
192の根尖部ドメインが収集され,段階的PRC法で注釈され,疾患の有無や範囲に関わらず,関連するランドマークをラベル付けした。
本稿では,キーポイントと歯のバウンダリを協調する後処理モジュールについて,補助インスタンスセグメンテーションモデルを用いて提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:34:44 GMT)
Human Empathy as Encoder: AI-Assisted Depression Assessment in Special Education [1.8] 本稿では、透明で社会的に責任を負ううつ病重症度評価のための、人間中心のAIフレームワークであるHuman Empathy as tacit (HEAE)を紹介する。
本手法は,PHQ-9フレームワークによって指導された教師由来の,9次元の「共感ベクトル(Empathy Vector)」と,生徒の物語テキストを一意に統合する。
厳密な実験は、マルチモーダル融合、テキスト表現、分類アーキテクチャを最適化し、7レベルの重度分類において82.74%の精度を達成した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:26:26 GMT)
Optimizing compilation of error correction codes for 2xN quantum dot arrays and its NP-hardness [1.8] 近年の進歩は、高い忠実度を持つ量子ドットアレイを通して電子とホールスピン量子ビットのシャットリングを実証している。
我々は,任意のCalderbank-Shor-Steane(CSS)誤り訂正符号のシンドローム抽出回路をコンパイルする一連の方法を開発した。
我々は、多くの現代の関心のコードに必要とされるシャトルの数を示す表を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:56:24 GMT)
Automating construction safety inspections using a multi-modal vision-language RAG framework [1.7] 本研究では,視覚入力と音声入力を統合することで,建設安全検査報告を自動化するフレームワークであるSiteShieldを紹介する。
実世界のデータを用いて、SiteShieldはF1スコアが0.82、ハミング損失が0.04、精度が0.76、リコールが0.96で、単調なLDMよりも優れていた。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:48:54 GMT)
Relative Information Gain and Gaussian Process Regression [1.6] 観測ノイズに対する情報ゲインの感度を計測する相対情報ゲインと呼ばれる新しい量を導入する。
本研究では, 相対情報ゲインが有効次元と情報ゲインとをスムーズに補間し, 相対情報ゲインが有効次元と同じ成長速度を有することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:35:51 GMT)
FoilDiff: A Hybrid Transformer Backbone for Diffusion-based Modelling of 2D Airfoil Flow Fields [1.6] FoilDiffは、ハイブリッドバックボーンデノナイジングネットワークを備えた拡散ベースのサロゲートモデルである。
既存の拡散モデルよりも正確な予測とより良い校正された予測の不確実性を提供することができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:10:38 GMT)
MAD: A Magnitude And Direction Policy Parametrization for Stability Constrained Reinforcement Learning [1.5] 我々は、強化学習(RL)のための政策パラメータ化であるマグニチュード・アンド・ディレクション(MAD)ポリシーを導入する。
MADポリシは、クローズドループ安定性を損なうことなく、状態依存機能に対する明示的なフィードバックを導入する。
モデルミスマッチ下でのMADポリシーの頑健な安定性特性を特徴付ける。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:07:57 GMT)
Optimizing Agricultural Order Fulfillment Systems: A Hybrid Tree Search Approach [1.4] 効率的なオーダーフルフィルメントは、特に種子サプライチェーンの季節的性質のため、農業において不可欠である。
本稿では, 受注を波動で処理する集中型倉庫において, 種子の受注を最適化する課題について述べる。
モンテカルロ木探索とドメイン固有知識を組み合わせた適応型ハイブリッド木探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:53:21 GMT)
Scalable Causal Discovery from Recursive Nonlinear Data via Truncated Basis Function Scores and Tests [1.2] スケーラブルな因果発見のための2つの基礎拡張ツールを紹介する。
第一に、基底関数 BIC スコアは、非線型依存を近似するために、切り詰められた加法拡張を使用する。
第二に、BF-LRT(Basis Function Likelihood Ratio Test)は、ほぼ条件付き独立性テストを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:34:54 GMT)
Systematic Diagnosis of Brittle Reasoning in Large Language Models [1.1] 人工知能における中心的な問題は、機械学習モデルが数学を理解する範囲である。
本稿では,特定の故障点を診断するために,標準ベンチマークを超えて数学的推論を計測する新しい枠組みを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:40:09 GMT)
Confidence, Not Perplexity: A Better Metric for the Creative Era of LLMs [1.1] 信頼スコア (Confidence Score, CS) はモデルの出力確率分布から導出される。
CSは,手軽,中堅,難易の2つのタスクを効果的に区別できることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:14:52 GMT)
A KL-regularization framework for learning to plan with adaptive priors [1.0] 政策最適化モデル予測制御(PO-MPC)を導入する。
PO-MPCは、政策最適化の先駆けとしてプランナーの行動分布を統合する。
実験により,これらの拡張構成により,大幅な性能向上が得られた。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:45:38 GMT)
SemViQA: A Semantic Question Answering System for Vietnamese Information Fact-Checking [1.0] 本稿ではベトナムのファクトチェックフレームワークSemViQAを紹介する。
セマンティックに基づくエビデンス検索(SER)と2段階検証分類(TVC)を統合する。
ISE-DSC01の精度は78.97%、ViWikiFCの精度は80.82%である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:24:08 GMT)
Toward Uncertainty-Aware and Generalizable Neural Decoding for Quantum LDPC Codes [0.9] 量子誤り訂正(QEC)はスケーラブルな量子コンピューティングに不可欠である。
我々は,ドット生成物とマルチヘッドの両方に注意を集中させるベイズグラフニューラルデコーダである textbfQuBA を提案する。
textbfSAGU textbf(Sequential Aggregate Generalization under Uncertainty)は、ドメイン間の堅牢性を向上したマルチコードトレーニングフレームワークである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:08:39 GMT)
Evaluation of Clinical Trials Reporting Quality using Large Language Models [0.9] 本研究では,CONSORT-abstract 標準を用いた抽象的な報告品質に関する2つの研究から評価コーパスを作成する。
次に, CONSORT基準を正しく評価する大規模生成言語モデルの評価を行った。
モデルとプロンプトの最良の組み合わせは85%の精度を実現する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:01:28 GMT)
Fine Tuning Methods for Low-resource Languages [0.9] 本研究は、文化的に関連のあるデータセットを作成し、Gemma 2モデルを後付けする手法を開発した。
これは、表現不足の言語に対するGemma 2のパフォーマンスを高め、他の人が同じことをする方法を示すことを目的としている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:36:36 GMT)
When AI Gets Persuaded, Humans Follow: Inducing the Conformity Effect in Persuasive Dialogue [0.9] 本研究では,人間とともに説得される「ペルサデエージェント」について紹介する。
テキストを用いた対話実験を行った。
Persuadee Agentが説得を受け入れると、説得力と実際の態度が著しく改善した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:37:46 GMT)
OptiFLIDS: Optimized Federated Learning for Energy-Efficient Intrusion Detection in IoT [0.8] IoT環境では、セキュリティを確保するために効果的な侵入検知システム(IDS)が不可欠である。
従来の機械学習ベースのIDSモデルは一般的に大規模なデータセットを必要とするが、プライバシやセキュリティ上の懸念からデータ共有は制限されることが多い。
本稿では,モデル複雑性とエネルギー消費を低減するため,局所訓練中にプルーニング技術を適用したOptiFLIDSを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:44:41 GMT)
Real-VulLLM: An LLM Based Assessment Framework in the Wild [0.7] 大規模言語モデル(LLM)は、ソフトウェア工学において非常に進歩している。
野生のシナリオにおける脆弱性検出の能力とそれに対応する推論については、いまだ検討されていない。
当社のコントリビューションは,脆弱性検出のためのインシデント設計と,野生におけるそれに対応する推論である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:34:30 GMT)
Quantifying Ambiguity in Categorical Annotations: A Measure and Statistical Inference Framework [0.7] 本稿では,離散応答分布を単位間隔でスカラーにマッピングするあいまいさ尺度を提案する。
本研究では,この尺度の形式的特性を分析し,その振る舞いを文献から代表的あいまい度尺度と対比する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:19:42 GMT)
SSM-CGM: Interpretable State-Space Forecasting Model of Continuous Glucose Monitoring for Personalized Diabetes Management [0.6] 連続グルコースモニタリング(CGM)は、糖尿病管理に不可欠な高密度なデータストリームを生成する。
我々は,マンバをベースとしたCGMとウェアラブル活動信号を統合したニューラルステートスペース予測モデルであるSSM-CGMを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:37:28 GMT)
Carbon Emission Prediction in China Considering New Quality Productive Forces Using a Deep & Corss Learning Modeling Framework [0.6] 新しい品質生産力(NQPF)、デジタル経済の発展、人工知能(AI)技術は、持続可能な都市開発を促進するために欠かせないものとなっている。
本研究では,機能相互作用モデリングとアテンション機構を組み合わせたマルチヘッド・アテンション・ディープ・アンド・クロス・ネットワーク(MADCN)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:23:56 GMT)
Ordinal Encoding as a Regularizer in Binary Loss for Solar Flare Prediction [0.6] 太陽フレアの予測は、通常二分分類タスクとして定式化され、特定のしきい値に従ってフレア(FL)またはノーフレア(NF)と区別される。
太陽フレア予測に関するいくつかの研究は、この予測しきい値付近で最も頻繁な誤分類が発生することを実証的に示している。
本稿では,二項化フレアラベルのサブクラス間の順序情報と従来の二項交叉エントロピー損失とを統合した改良型損失関数を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:51:47 GMT)
A Modular, Adaptive, and Scalable Quantum Factoring Algorithm [0.6] Shorの整数分解アルゴリズムは古典的手法よりも指数関数的な高速化を提供する。
多くのコヒーレント量子ビットと非常に深い回路を必要とするため、ノイズ中間量子(NISQ)ハードウェアでは実用的ではない。
我々は、これらの制限を緩和するShorのアルゴリズムのモジュラーでウィンドウ化された定式化を開発した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:55:30 GMT)
Learning-Based Hashing for ANN Search: Foundations and Early Advances [0.5] ハッシュベースの手法は、高次元データをコンパクトなバイナリコードにマッピングすることで効率的な解を提供する。
過去20年にわたって、データから投影関数と量子化関数が最適化されるハッシュの学習について、かなりの研究が行われてきた。
この記事は、この分野を形作る中核的なアイデアに重点を置いて、早期学習に基づくハッシュ手法に関する基礎的な調査を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:59:56 GMT)
Accreditation Against Limited Adversarial Noise [0.4] 誤りを逆数と仮定した認証プロトコル(様々な量子検証)を提案する。
これは、既存の認証プロトコルをアップグレードすることで実現される。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:45:42 GMT)
Probing Geometry of Next Token Prediction Using Cumulant Expansion of the Softmax Entropy [0.4] 大規模言語モデルが高次統計構造をいかに内包するかを定量化するための累積拡張フレームワークを提案する。
We track cumulants in GPT-2 and Pythia model on Pile-10K prompts。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:55:58 GMT)
Thai Semantic End-of-Turn Detection for Real-Time Voice Agents [0.3] 従来のオーディオ・サイレンス・エンドポインターは数百ミリ秒の遅延を加え、ためらいや言語固有の現象の下で失敗する。
リアルタイムエージェントのためのタイ語テキストオンリー・エンド・オブ・ターン(EOT)検出に関する最初の体系的研究である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:31:59 GMT)
ICEPool: Enhancing Graph Pooling Networks with Inter-cluster Connectivity [0.3] ICEPoolは、クラスタ間接続に対するモデルの理解を高めるために設計された、新しい階層的なプーリングフレームワークである。
既存のモデルの強化としてのICEPoolの展開は、オリジナルのモデルの強みを効果的に組み合わせている。
本研究では,ICEPoolのグラフ再構成能力に関する理論的解析を行い,クラスタ間関係の学習における効果を実証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:13:54 GMT)
Operational Quasiprobability in Quantum Thermodynamics: Work Extraction by Coherence and Non-joint Measurability [0.3] 我々は,コヒーレンスと非結合性測定が作業の強化に基本的な役割を担っていることを示す。
3段階の窒素空孔中心系では、OQとKDQは異なる量のネガティビティを示しながら、同じ作業抽出を可能にしている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:44:45 GMT)
Integrable Floquet Time Crystals in One Dimension [0.2] 周期的に駆動される1次元2次元格子ハミルトニアンの族における離散時間結晶(DTC)相の実現を実証する。
我々の研究は、1次元で頑健で長寿命のDMCを実現するための新しいメカニズムを確立する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 19:16:10 GMT)
Increasing LLM response trustworthiness using voting ensembles [0.2] 質問応答に関する理論的枠組みを導入し,支配的な回答が不足している場合に,アンサンブルが回答の提供を「継続」することを許すことで,残りの回答の信頼性を劇的に向上させることができることを示す。
高い制限のある投票アンサンブルを用いて、回答の信頼性の大きな向上を達成できる一方で、応答の収量と精度は比較的緩やかに低下する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:02:44 GMT)
Coupling a $^{73}$Ge nuclear spin to an electrostatically defined quantum dot [0.1] シリコン中の単一核スピンは量子技術にとって有望な資源である。
我々は、SiMOSのゲート定義量子ドットへのスピン-9/2 73$Ge核スピンの結合と読み出しを実証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 00:12:32 GMT)
Utility-Learning Tension in Self-Modifying Agents [0.1] 本研究では,即時ないし期待される性能を改善するユーティリティ駆動型変更により,信頼性のある学習と一般化のための統計的前提条件を省くことができることを示す。
本研究は, 配電保証が保留されていること, ポリシ到達可能なモデルファミリが一様に容量制限されていることを示唆する。
現実に共通する標準的な仮定では、これらの軸は同じ容量の基準に還元され、安全な自己修正のための単一の境界となる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:52:16 GMT)
FHEON: A Configurable Framework for Developing Privacy-Preserving Neural Networks Using Homomorphic Encryption [0.1] ホモモルフィック暗号化(HE)は、データの機密性とセキュリティ上の懸念に対する有望な解決策として登場した。
本稿では、HEを用いた推論のためのプライバシ保護ニューラルネットワークモデルを開発するためのフレームワークであるFHEONを提案する。
コンシューマグレードのCPUでは、FHEON上に構築されたモデルは98.5%の精度で、MNISTでは13秒、CIFAR-10では92.2%の精度で403秒のレイテンシを実現した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:12:44 GMT)
PrivSpike: Employing Homomorphic Encryption for Private Inference of Deep Spiking Neural Networks [0.1] スパイキングニューラルネットワーク(SNN)は、従来のディープラーニングアプローチに代わるエネルギー効率の高い代替手段として登場した。
PRIVSPIKEは、CKKS準同型暗号方式を用いてSNNのプライバシー保護推論フレームワークである。
コンシューマグレードのCPUでは、SNN LeNet-5モデルはMNISTで28秒、Neuromorphic MNISTで212秒の推論時間を達成した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:11:40 GMT)
Discretized Quadratic Integrate-and-Fire Neuron Model for Deep Spiking Neural Networks [0.1] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワークに代わるエネルギー効率の良い代替手段として登場した。
本稿では,高性能深部スパイクニューラルネットに適した準積分ファイア(QIF)ニューロンモデルの最初の離散化を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:30:10 GMT)
Advancing the hBN Defects Database through Photophysical Characterization of Bulk hBN [0.1] 六方晶窒化ホウ素 (hBN) の量子放出体は、幅広い欠陥のために大きな注目を集めている。
hBN欠陥に関するほとんどの理論的研究は単層をシミュレートするが、これはバルク構造を計算するよりも計算的に安価である。
本研究では、hBN欠陥と励起状態光物理特性のデータベースを拡張した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:54:18 GMT)
PABSA: Hybrid Framework for Persian Aspect-Based Sentiment Analysis [0.0] 我々は、ペルシャのアスペクトベース感情分析(ABSA)のための機械学習(ML)とディープラーニング(DL)技術を統合するハイブリッドアプローチを提案する。
特に、多言語BERTの極性スコアを付加機能として利用し、決定木分類器に組み込んで、Pars-ABSAデータセット上の既存のベンチマークを93.34%の精度で通過させる。
本研究は,ペルシャ語などの低リソース言語に対する感情分析におけるハイブリッドモデリングと特徴増強の有効性を実証するものである。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:02:31 GMT)
Generalized Wigner theorem for non-invertible symmetries [0.0] 非可逆作用素に関連する保存則は、量子力学の対称性として実現することができる。
すべての量子対称性はユニタリ変換または反ユニタリ変換で表わさなければならない。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:55:25 GMT)
X-states of a qubit pair of double classicality [0.0] 同時に分離可能であり、正の半定値なウィグナー函数を持つ2-キュービットの状態の特別なクラスを記述する。
ウィグナー(英: Wigner)は、様々な種類の情報を表現するために一連の数字と文字を使用するコンピュータプログラムの一種である。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:03:17 GMT)
Wave-PDE Nets: Trainable Wave-Equation Layers as an Alternative to Attention [0.0] ウェーブ-PDEネット(Wave-PDE Nets)は、2階波動方程式の微分可能なシミュレーションであるニューラルネットワークである。
FFTに基づくシンプレクティックスペクトル解法は、この伝播をO(nlog n)時間で実現する。
言語とビジョンのベンチマークでは、Wave-PDE NetsはTransformerのパフォーマンスにマッチするか、超える。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:52:52 GMT)
Using predefined vector systems as latent space configuration for neural network supervised training on data with arbitrarily large number of classes [0.0] 教師付き学習(SL)手法は、分類タスクを実行するために使用されるニューラルネットワーク(NN)トレーニングには不可欠である。
本稿では,クラス数に関係なく,同じNNアーキテクチャをトレーニングできる手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:28:37 GMT)
Two-photon coupling via Josephson element II: Interaction renormalizations and cross-Kerr coupling [0.0] 対称超伝導量子干渉デバイス(SQUID)による相互作用の研究
結合SQUIDは、一光子相互作用または二光子相互作用をその場で切り替えることができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:45:32 GMT)
Turning Down the Noise: Power-Law Decay and Temporal Phase Transitions [0.0] 我々は、不均一な拡張を伴う一般的なスピンアンサンブルの深夜ダイナミクスを決定する。
定常状態へのアプローチは、ハミルトン力学と消滅する散逸の間の相互作用を反映した権力法則に従う。
我々の正確な解は、明示的に時間依存の散逸を伴うオープン量子系のカスプクラスをアンカーする。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:16:35 GMT)
Towards Fast Option Pricing PDE Solvers Powered by PIELM [0.0] 物理インフォームドニューラルネットワーク(PINN)は、ディープラーニングを用いて偏微分方程式(PDE)の前方および逆問題を解くための有望なアプローチとして登場した。
本稿では,PDEの前方および逆問題に対するPINNの高速な代替として,物理インフォームド・エクストリーム・ラーニング・マシン(PIELM)を紹介する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:50:49 GMT)
Time-resolved characterization of pulsed squeezed light from a strongly driven silicon nitride microresonator [0.0] パルスポンプによる窒化ケイ素共振器からの励起光の発生について検討した。
我々は、パルスエネルギーの増加とともに、平均光子数とシャープされた辺縁モードの1次および2次がどのように進化するかを実験的に研究した。
マイクロ共振器におけるパルス励起光源の利得と時間モード構造を最適化するための実用的な戦略を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:40:01 GMT)
The method of the approximate inverse for limited-angle CT [0.0] 限られた角度のコンピュータ断層撮影は、イメージングにおいて最も難しい課題の1つである。
近似逆法に基づく新しいモデル駆動手法を提案する。
我々は,制約付きリミテッドアングル再構成カーネル(CLARK)という汎用正規化戦略を開発する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:24:44 GMT)
The Persistence of Neural Collapse Despite Low-Rank Bias [0.0] 神経崩壊 (NC) とその多層構造である深層神経崩壊 (DNC) は、訓練された深層ネットワークの特徴と重みに生じる構造的幾何学を記述している。
sukenikらによる最近の理論的研究は、DNCが平均二乗誤差(MSE)損失下において最適であることを示している。
本研究では、この結果をクロスエントロピー損失で訓練された深いUFMにまで拡張し、DNCを含む高階構造が一般に最適でないことを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:14:17 GMT)
The Artificial Intelligence Cognitive Examination: A Survey on the Evolution of Multimodal Evaluation from Recognition to Reasoning [0.0] この分野は、単純な認識タスクから複雑な推論ベンチマークに移行する、パラダイムシフトが進行中である、と我々は主張する。
ImageNet時代の基礎的な"知識テスト"から、"応用ロジックと理解"テストまでの道程をグラフ化します。
我々は、抽象的、創造的、社会的知性を評価するために、未知の領域を探索する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:41:22 GMT)
Sri Lanka Document Datasets: A Large-Scale, Multilingual Resource for Law, News, and Policy (v20251005) [0.0] 我々はスリランカの議会手続、法的判断、政府出版物、ニュース、観光統計を網羅したオープンで機械可読な文書データセットを提示する。
v20251005の時点で、このコレクションはシンハラ、タミル、および英語の13のデータセットにまたがる215,670のドキュメントで構成されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:57:40 GMT)
SliceMoE: Routing Embedding Slices Instead of Tokens for Fine-Grained and Balanced Transformer Scaling [0.0] Mixture-of-Experts (MoE)レイヤは、トークンをフィードフォワードの専門家のまばらなサブセットにルーティングすることで、トランスフォーマーをスケールする。
我々はトークンの隠れベクトルの連続スライスをルーティングするアーキテクチャであるSliceMoEを紹介する。
WikiText-103言語モデリング、WMT En-De翻訳、および3つのテキスト分類データセットの実験により、SliceMoEは密度の高いベースラインよりも1.7倍高速な推論が可能となった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:57:32 GMT)
Simulation-based inference via telescoping ratio estimation for trawl processes [0.0] 本稿では,高速で高精度なMarkovベースの推論フレームワークを提案する。
チェビシェフ近似を用いて独立な後続サンプルを効率よく生成し,連鎖モンテカルロ法が混在しても正確な推論を可能にする。
エネルギー需要データに適用した柔軟な無限分割可能なモデルのクラスであるトロールプロセスにおいて,本手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 05:26:46 GMT)
Selecting Cybersecurity Requirements: Effects of LLM Use and Professional Software Development Experience [0.0] 本研究では,大規模言語モデル(LLM)へのアクセスと,様々なレベルの専門的ソフトウェア開発経験が,Webアプリケーションに対するサイバーセキュリティ要件の優先順位付けにどのように影響するかを検討する。
大学院生23人がMoSCoW法を用いてセキュリティ要件(SR)を優先する研究に参加した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:29:48 GMT)
Robust purely optical signatures of Floquet states in laser-dressed crystals [0.0] フロケの定理は、周期的に駆動される固体の物理的性質を特徴づける自然な状態を与える。
ここでは, レーザ被覆固体の線形光応答におけるFloquet状態の特異なシグネチャを同定する。
計算の結果、高強度でスペクトル分離されたレーザー制御可能な吸収・励起放出特性が、中赤外エネルギーで明らかとなった。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:19:24 GMT)
Riemannian Optimization on Tree Tensor Networks with Application in Machine Learning [0.0] ツリーテンソルネットワーク(TTN)は低ランク近似や量子多体シミュレーションで広く利用されている。
本稿では,TTNの基底となる微分幾何学の形式解析について述べる。
我々はTTNの固有商構造を利用する効率的な1次および2次最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:33:44 GMT)
Region-of-Interest Augmentation for Mammography Classification under Patient-Level Cross-Validation [0.0] 我々は,Mini-DDSMデータセット(画像9,684枚,患者2,414枚)を再検討し,軽量な関心領域(ROI)拡張戦略を導入した。
トレーニング中、フルイメージは確率的に、事前に計算されたラベルフリーのバウンディングボックスバンクからサンプリングされたランダムROIの作物に置き換えられる。
厳密な患者レベルのクロスバリデーションで評価し,ROC-AUC,PR-AUC,トレーニング時間効率の指標を報告する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:40:20 GMT)
Qubit entanglement from forward scattering [0.0] 分散粒子の離散量子数に対応する2つの量子ビットの混合最終状態の共起を解析的に導出する。
初期積状態が与えられたとき、導出された共起は非弾性前方振幅の実部と初期状態のみに先行順序に依存する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:34:56 GMT)
Quantum computing for heavy-ion physics: near-term status and future prospects [0.0] 我々は,高エネルギー核物理学における問題に対する量子情報科学の適用の最近の進歩について論じる。
我々は、新しい量子技術を用いた物質状態、ハードプローブ、スピン相関の研究に関する最近の結果を強調した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:45:33 GMT)
Quantum Emission in Monolayer WSe2 Transferred onto InP Nanowires [0.0] 遷移金属ジアルコゲナイド(TMD)の局在量子エミッタは、単一光子のオンデマンドソースの固体候補として出現している。
ここでは, 水平配向InPナノワイヤと結合したWSe2単層からなるハイブリッド構造からの量子放出について検討する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:30:34 GMT)
Quantizer Design for Finite Model Approximations, Model Learning, and Quantized Q-Learning for MDPs with Unbounded Spaces [0.0] 有限モデル近似誤差について, [Kara et. al. JMLR'23] で表される洗練された上界について述べる。
また、量子化Q-ラーニングと経験モデルラーニングにおける量化器設計の意義についても考察する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:39:52 GMT)
QuIC: Quantum-Inspired Compound Adapters for Parameter Efficient Fine-Tuning [0.0] 大きなファンデーションモデルの完全な微調整は、GPUメモリとトレーニング時間を歪ませます。
量子インスパイア複合アダプタ(QuICアダプタ)について紹介する。
QuICアダプタは、ベースモデルの0.02%未満のメモリフットプリントを使用して、モデルを効果的に微調整することができる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:54:57 GMT)
Prompt-to-Prompt: Text-Based Image Editing Via Cross-Attention Mechanisms -- The Research of Hyperparameters and Novel Mechanisms to Enhance Existing Frameworks [0.0] 本研究の目的は,プロンプト・プロンプト画像編集フレームワークの精度と信頼性を高めることである。
本稿では,「単語スワップ」手法を包括的に研究し,適応性向上のための「アテンション・リウェイト・メソッド」を開発し,サイクル不整合のような既存の制限に対処する「CL P2P」フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 04:56:07 GMT)
Principled and Tractable RL for Reasoning with Diffusion Language Models [0.0] 拡散大言語モデル(dLLM)は、複数のトークンを並列に予測し、反復的アンマスキングによってテキストを生成するように訓練されている。
最近の研究は、DLLMを8Bスケールでの自己回帰LDMと同等に事前訓練することに成功しているが、現代のポストトレーニング技術の恩恵を受けていない。
本稿では,dLLMに特化して設計されたオンラインRLアルゴリズムであるAGRPO(Amortized Group Relative Policy Optimization)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:53:16 GMT)
Pre-Floquet states facilitating coherent subharmonic response of periodically driven many-body systems [0.0] 外部の時間周期駆動力を受ける多ボソン系の長時間のコヒーレントなサブハーモニック動作を示す。
高次サブハーモニック応答でさえ体系的に設計でき、実験的に観察できると論じられている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 12:48:31 GMT)
Prakriti200: A Questionnaire-Based Dataset of 200 Ayurvedic Prakriti Assessments [0.0] このデータセットは、標準化されたバイリンガル(英ヒンディー語)のPrakriti Assessment Questionnaireへの応答を提供する。
アンケートは, 体の特徴, 食欲, 睡眠パターン, エネルギーレベル, 気質をカバーした24項目からなる。
すべての質問はバイアスを最小限にするために強制的で中立的に表現され、ドーシャラベル(Vata、Pitta、Kapha)は参加者から隠されている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:47:51 GMT)
Phases of Floquet code under local decoherence [0.0] フロッケ符号(Floquet code)は、周期的に進化する論理空間を持つ動的量子メモリである。
決定的な特徴として、コードは各期間後にエノン自己同型を示し、各論理状態の非自明な進化を引き起こす。
この診断は, 繰り返しの症候群測定において, フロッケ符号とトーリック符号とを区別し, しきい値の位相遷移を行うことを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:49:32 GMT)
Operator dependence and robustness of spacetime-localized response in a quantum critical spin chain [0.0] 量子臨界スピン系における時空局在化応答の現象について検討する。
本研究では,一次元横フィールドイジングモデルの臨界度におけるリアルタイムダイナミクスを数値解析する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:00:51 GMT)
On Zero-Shot Reinforcement Learning [0.0] 強化学習システムは、人間の能力をはるかに超えるシーケンシャルな意思決定方針を明らかにする。
新しいデータが安価にシミュレートできないドメインでは、既存のデータからシミュレータを学習できますが、これらはほぼ正しくありません。
本研究は、3つの制約を条件としてゼロショットRLを実行する一連の手法を提案する。
これらの設計は、実世界の問題を解決するためにデプロイできるRLメソッドに一歩近づいたと信じています。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:29:40 GMT)
Non-Markovian protection of states from decay in quasi-PT-symmetric systems [0.0] 2つの共振器からなる準PT対称系を考察し、そのうちの1つは有限サイズ環境と相互作用する。
準PT対称系における非マルコフ過程は、系の状態が無限に生存し、損失が保護される状態になることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:47:58 GMT)
Moral Anchor System: A Predictive Framework for AI Value Alignment and Drift Prevention [0.0] 重要なリスクはバリュードリフトであり、進化するコンテキストや学習ダイナミクス、意図しない最適化によって、AIシステムが一致した値から逸脱する。
我々は,AIエージェントの値ドリフトを検出し,予測し,緩和する新しいフレームワークであるMoral Anchor System(MAS)を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 07:24:23 GMT)
Machine Learning as Iterated Belief Change a la Darwiche and Pearl [0.0] バイナリANNは、入力と出力の両方がバイナリ値に制限されるフィードフォワードネットワークである。
ダラルの信念変化の方法は、自然に信念の状態の構造化された段階的な進化を誘導することを示す。
本研究では、二元的ANNのトレーニングダイナミクスをより効果的にモデリングし、堅牢なAGMスタイルの変更操作でモデル化できることを実証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:06:32 GMT)
Learning to Predict Chaos: Curriculum-Driven Training for Robust Forecasting of Chaotic Dynamics [0.0] CCFは、力学系理論の基本原理に基づくトレーニングデータを整理する。
CCFにより、モデルは動的挙動の堅牢で一般化可能な表現を構築することができる。
CCFは、ランダムオーダートレーニングと比較して、有効な予測水平線を最大40%拡張する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:06:16 GMT)
Internal World Models as Imagination Networks in Cognitive Agents [0.0] 我々は、内的世界モデル(IWM)にアクセスし、心理学的ネットワーク分析を用いて人間と大言語モデル(LLM)のIWMを探索することを提案する。
我々の研究は、人間とAIの内部で生成された表現を比較する新しい方法を提供し、人工知能における人間のような想像力を開発するための洞察を提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:01:10 GMT)
Higher symmetry breaking and non-reciprocity in a driven-dissipative Dicke model [0.0] 我々は、高次離散対称性を持つディックモデルの変種について研究し、量子エミッタとボソニックモードの間の複素数値結合係数から導かれる。
この$n$フェーズのディックモデルは、様々な光学的または光磁気的設定で等価に実現される。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:59:36 GMT)
Geometry of orofacial neuromuscular signals: speech articulation decoding using surface electromyography [0.0] 表面筋電図(EMG)信号を用いた音声明瞭化のためのデータと方法を提案する。
EMGベースの音声ニューロプロテーゼは、知的に話す能力を失った個人において、可聴音声の復元に有望なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:45:15 GMT)
FedMentor: Domain-Aware Differential Privacy for Heterogeneous Federated LLMs in Mental Health [0.0] FedMentorは、機密ドメインにおける大規模言語モデルのプライバシ保護適応のための微調整フレームワークである。
Low-Rank Adaptation (LoRA)とDomain-Aware Differential Privacy (DP)を統合して、パフォーマンスを維持しながらドメイン単位のプライバシ予算を満たす。
3つのメンタルヘルスデータセットの実験では、FedMentorはプライバシのない標準フェデレートラーニング(FL)よりも安全性を向上させる。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:41:04 GMT)
Explicit Instances of Quantum Tanner Codes [0.0] 我々は、量子タナー符号のいくつかの明示的な例、つまり、量子の低密度パリティチェック(qLDPC)のクラスを構築した。
符号は二面体群とランダムな古典符号のペアを用いて構築され、高い符号化率、相対距離、擬似閾値を示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:27:04 GMT)
Enhancing OCR for Sino-Vietnamese Language Processing via Fine-tuned PaddleOCRv5 [0.0] 我々は,Han-Nomテキストの文字認識を改善するためにPaddleOCRv5の微調整手法を提案する。
我々は、古代ベトナムの漢文写本のキュレートされた部分集合を用いて、テキスト認識モジュールを再訓練する。
実験の結果,精度は37.5%から50.0%に向上した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:34:38 GMT)
Energy Decay Network (EDeN) [0.0] このフレームワークは、潜在的な構造的表現を通じて経験の遺伝的移行を開発する。
成功した経路は、エポック当たりのスパイク分布の安定性によって定義される。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 22:23:59 GMT)
Electromagnetic instability of vacuum with instantons in the holographic plasma [0.0] 電磁界の様々な値を持つD7ブレーン作用を用いて真空崩壊速度,臨界電場および真空のV-A曲線を数値的に評価した。
この研究はプラズマ中の真空の電磁的特性と瞬間的性質の関係を明らかにする。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:16:51 GMT)
Do Vision-Language Models See Urban Scenes as People Do? An Urban Perception Benchmark [0.0] モントリオールの街路画像100枚を用いて,都市感における視覚言語モデル(VLM)の検証を行う。
結果は、主観的評価よりも、可視的で客観的な特性に対するモデルアライメントが強いことを示唆している。
我々は,参加型都市分析における再現性,不確実性を考慮した評価のためのベンチマーク,プロンプト,ハーネスをリリースする。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 16:29:16 GMT)
Developing a Sequential Deep Learning Pipeline to Model Alaskan Permafrost Thaw Under Climate Change [0.0] 気候の変化は天然の永久凍土の融解サイクルを脅かし、年間0degC以上の土壌温度をもたらす。
アラスカ州では、活性層として知られる最上部の永久凍土層の温暖化が、炭素貯蔵量の増加による温室効果ガス放出の上昇を示唆している。
本研究では,複数の深度にまたがる年間土壌温度をモデル化するための概念的緯度に基づく深層学習パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 01:08:47 GMT)
Decoding Emotion in the Deep: A Systematic Study of How LLMs Represent, Retain, and Express Emotion [0.0] 大きな言語モデル(LLM)は、人間の感情のニュアンスをナビゲートすることがますます期待されている。
本稿では、現代のLLMにおける潜在感情表現について、どのようにして、どこで、どのくらいの感情が神経アーキテクチャにエンコードされているのかを問うことによって検討する。
約40万発のRedditコーパスを,分類,書き換え,合成生成の多段階的プロセスを通じて,7つの基本的な感情のバランスをとりながら導入した。
このデータセットを使用して、パラメータを変更することなく、軽量な"プローブ"を使用して、様々なQwen3およびLLaMAモデルの隠れレイヤから情報を読み取る。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:53:42 GMT)
Curating art exhibitions using machine learning [0.0] 本稿では,機械学習技術に基づく一連の人工モデルを提案する。
モデルは、人間の専門家によってキュレーションされた既存の展示から学ぼうとします。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:50:18 GMT)
Critical appraisal of artificial intelligence for rare-event recognition: principles and pharmacovigilance case studies [0.0] 高精細度AIアプリケーションは、目に見える精度が限られた実世界の価値を隠蔽する低頻度イベントをターゲットにしている。
希少な認識におけるAIの批判的評価に関する重要な考察を概説する。
薬物移動の枠組みを3つの研究に基づいてインスタンス化する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:05:38 GMT)
Crash Severity Prediction Using Deep Learning Approaches: A Hybrid CNN-RNN Framework [0.0] この調査は、2015年から2021年にかけてバージニア州高速道路I-64で7年間に収集された15,870件の事故記録を用いて行われた。
提案したCNN-RNNハイブリッドモデルは、クラッシュの重大度を予測するという点で、すべてのベンチマークモデルを上回っている。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:31:45 GMT)
Cooperative Flexibility Exchange: Fair and Comfort-Aware Decentralized Resource Allocation [0.0] 本稿では,分散型マルチエージェント協調型需要側管理システムを提案する。
エージェントは、ユーザの快適性を改善し、システムの効率性を維持するとともに、需要側エネルギー最適化のための調整を行う。
この研究の重要な革新はスロット交換機構の導入であり、エージェントはまず最適化されたアプライアンスレベルのエネルギー消費スケジュールを受け取り、その後、スロット交換によってこれらのスケジュールを調整するように調整する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:17:12 GMT)
Chameleon2++: An Efficient and Scalable Variant Of Chameleon Clustering [0.0] 階層的クラスタリングは、データマイニングにおける根本的な課題である。
最近のアルゴリズム - Chameleon2, M-Chameleon, INNGS-Chameleon は高度な戦略を提案しているが、それでも計算複雑性は$O(nlog n)$である。
Chameleon2をベースアルゴリズムとして、この課題に対処するChameleon2++を紹介します。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 15:42:08 GMT)
Categorical Invariants of Learning Dynamics [0.0] 学習はネットワークパラメータの空間(パラム)と学習表現の空間(Rep)の間の構造保存変換であると主張する。
ホモトピックトラジェクトリを通したネットワークは0.5%の精度で一般化する一方、非ホモトピックパスは3%以上異なることを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:45:36 GMT)
Can Linear Probes Measure LLM Uncertainty? [0.0] 不確実性定量化(UQ)は、自動意思決定などにおける大規模言語モデル(LLM)の信頼性向上のための重要な側面である。
ベイズ統計による原理的アプローチをとると、最も単純なモデル、すなわち線形回帰を利用するにもかかわらず、性能が向上することを示す。
分散特性の疎結合を同定することにより, LLMのグローバル不確実性レベルを推定し, 効率的なUQ手法を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 09:14:57 GMT)
Beyond holography: the entropic quantum gravity foundations of image processing [0.0] G. Bianconiは、量子重力に対するエントロピーからの重力(GfE)アプローチを定式化し、そこでは、ローレンツ時空に関連する2つのメトリクス間の幾何学的量子相対エントロピー(GQRE)から重力が導かれる。
ここでは、画像処理のための有名なペローナ・マリクアルゴリズムが、単純なウォームアップシナリオにおいてGfE作用を最大化する勾配流であることを示す。
ペローナ・マリクのアルゴリズムは鋭い輪郭を保存することが知られているため、これはGfE作用が一般にフローダイナミクスの反復時に均一な画像をもたらすわけではないことを意味する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:04:02 GMT)
Beyond Static Knowledge Messengers: Towards Adaptive, Fair, and Scalable Federated Learning for Medical AI [0.0] 適応フェアフェデレートラーニング(AFFL)を3つの革新を通じて提案する。
その結果,55~75%の通信削減,56~68%の公正性向上,34~46%の省エネルギー,100以上の機関支援が得られた。
経済予測では、農村病院では400-800%のROI、学術センターでは15-25%のパフォーマンス向上を示している。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 03:07:57 GMT)
Benchmarking Open-Source Large Language Models for Persian in Zero-Shot and Few-Shot Learning [0.0] 本稿では,ペルシャ自然言語処理タスクのためのオープンソースの大規模言語モデル (LLM) のベンチマークを示す。
我々は、感情分析、名前付きエンティティ認識、読書理解、質問応答など、様々なタスクのモデルを評価する。
その結果、Gemma 2は両方の学習パラダイムにおいて、ほぼすべてのタスクで、他のモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 10:10:04 GMT)
Audit the Whisper: Detecting Steganographic Collusion in Multi-Agent LLMs [0.0] emphAudit the Whisperは、理論、ベンチマーク設計、検出、再生にまたがるカンファレンスグレードの研究成果物である。
i) パラフレーズ, 速度制限, 役割置換といった介入が, 定量的な能力的ペナルティを課すことを示すチャネル容量分析。
外部監査担当者がすべての図を再現し、最小限の労力でフレームワークを拡張することができるように、スクリプト、シードスタンプのマニフェスト、ドキュメントをリリースします。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 17:51:52 GMT)
Atomtronic routing of dipolar bosons in a four-well star potential [0.0] 恒星型構造を持つ4ウェルポテンシャルに閉じ込められた双極子ボソンの可積分モデルに基づいて、可変原子ルーティングプロトコルを開発する。
外部磁場の作用下での原子集団力学に対する3つの独立した制御モードを実証する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 23:25:20 GMT)
Approaching the scaling limit of transport through lattices with dephasing [0.0] 一般化マルコフ的退化と緩和を伴う格子の定常状態方程式について検討する。
スケーリングの限界を達成するための効率的なソリューションを提案する。
マルコフの緩和、騒音、運転には幅広い問題がある。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 06:51:40 GMT)
Algorithmic pricing with independent learners and relative experience replay [0.0] 無限に繰り返される汎用価格ゲームでは、独立した強化学習者はコミュニケーションなしで協調行動を示すことができる。
学習力学をより深く理解するために,経験リプレイ(ER)技術を用いてエージェントの相対性能(RP)を競合相手に組み込む。
実験結果から,RP考慮が長期成績に重要な役割を担っていることが示唆された。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:11:26 GMT)
Adaptive Weighted Loss for Sequential Recommendations on Sparse Domains [0.0] 単一の均一な重みは、非常に少ない相互作用を持つドメインでは不十分であり、トレーニング信号は広大な汎用データセットによって容易に希釈される。
本稿では, 包括的理論的基礎と広範な実証検証を備えた動的重み付きロス関数を提案する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 21:42:33 GMT)
AI-Driven Grading and Moderation for Collaborative Projects in Computer Science Education [0.0] 本稿では,レポジトリマイニング,コミュニケーション分析,機械学習モデルを用いて,プロジェクト品質と個人作業の両方を評価する,半自動AI支援グレーティングシステムを提案する。
上級教育課程におけるパイロット配置は、インストラクター評価と高い整合性を示し、学生満足度を高め、インストラクターの成績を低下させた。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 02:16:52 GMT)
A Recursive Pyramidal Algorithm for Solving the Image Registration Problem [0.0] 本稿では,数行のPythonコードで実装可能な,シンプルでエンドツーエンドのトレーニング可能なアルゴリズムを提案する。
ステレオビジョンの例は、19x15入力ウィンドウ上の74の画像から訓練された。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 14:44:04 GMT)
A Mixed-Methods Analysis of Repression and Mobilization in Bangladesh's July Revolution Using Machine Learning and Statistical Modeling [0.0] バングラデシュの7月革命(2024年7月革命)は、市民抵抗の研究における目覚ましい出来事である。
本研究は、反感を鎮めることを意図した国家暴力が最終的に運動の勝利を後押ししたかを調査した。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 20:11:30 GMT)
A Contextual Quality Reward Model for Reliable and Efficient Best-of-N Sampling [0.0] ベスト・オブ・Nサンプリングのような現代の選好アライメント技術は、ペア比較データで訓練された報酬モデルに依存している。
この重要な信頼性ギャップに対処するために、新しいデータ収集およびモデリングフレームワークを導入します。
本研究では,アライメントガードレールとして調整した場合,信頼性障害を70%削減し,推論アクセラレーションとして調整した場合,IMDB感度設定において平均推定速度を22%以上向上することを示す。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 08:23:08 GMT)
A Complement to Neural Networks for Anisotropic Inelasticity at Finite Strains [0.0] 本稿では, ニューラルネットワークを物質原理で拡張し, 有限ひずみにおける異方性と非弾性を捉えるモデルを提案する。
鍵要素は散逸を支配する双対ポテンシャルであり、一貫した異方性を持ち、従来の定式化は凸性を必要とすることなく散逸不等式を満足する。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 13:01:05 GMT)
A Case for Library-Level k-Means Binning in Histogram Gradient-Boosted Trees [0.0] 量子ビン化を$k$-means離散化器に置き換える新しい手法を考える。
我々はこのスワップを、33のOpenMLデータセット上で量子化と均一なビンニングに対してテストする。
論文参考訳(メタデータ) (Sun, 05 Oct 2025 18:46:23 GMT)