Response to Promises and Pitfalls of Deep Kernel Learning [117.0] このノートは「深層カーネル学習の約束と落とし穴」(Ober et al., 2021)に反応する。
ガウス過程の限界確率は、データ適合項と複雑性ペナルティに分解できる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:31:42 GMT)
MMR1: Enhancing Multimodal Reasoning with Variance-Aware Sampling and Open Resources [113.3] VAS (Variance-Aware Sampling) は、Variance Promotion Score (VPS) によって導かれるデータ選択戦略である。
我々は、1.6MのCoT冷間開始データと15kのRLQAペアを含む大規模かつ慎重にキュレートされたリソースをリリースする。
数学的推論ベンチマークによる実験では、キュレートされたデータと提案されたVASの有効性が示されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:58:29 GMT)
A Simple "Motivation" Can Enhance Reinforcement Finetuning of Large Reasoning Models [103.9] MeRF(Motivation-enhanced Reinforcement Finetuning)は、大規模共振モデルの強化微調整を強化する直感的かつ効果的な方法である。
MeRFは報酬仕様を直接プロンプトに注入し、最適化目標を認識するためのコンテキスト内モチベーションとして機能する。
MeRFはRLVRベースラインよりもパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:11:07 GMT)
Causal Time Series Generation via Diffusion Models [97.0] 新しいTSGタスクファミリーとして因果時系列生成を導入し,Pearlの因果はしご内で定式化した。
これらのタスクをインスタンス化するために、統合拡散ベースのフレームワークであるCaTSGを開発した。
合成データセットと実世界のデータセットの両方の実験は、CaTSGが優れた忠実性を達成することを示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:34:46 GMT)
Understanding Optimization in Deep Learning with Central Flows [95.6] 複雑な状態における最適化のダイナミクスを記述できる理論を開発する。
この結果から,ディープラーニングの最適化を推論する上で,中央フローが重要な理論ツールとなる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:29:29 GMT)
DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model [92.7] DermNIOは皮膚科学の多目的基盤モデルである。
自己教師型学習パラダイムを増強する、新しいハイブリッド事前学習フレームワークが組み込まれている。
さまざまなタスクにおいて、最先端のモデルよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:47:44 GMT)
DELTA-Code: How Does RL Unlock and Transfer New Programming Algorithms in LLMs? [92.5] 本稿では、学習可能性と伝達可能性という2つの基本的な側面を探索するために設計された合成符号問題ファミリーのベンチマークを紹介する。
実験の結果, ほぼゼロ報酬の期間が延長された後, RL訓練モデルが突然, ほぼ完全な精度に上昇した。
その結果、家族や再考されたスキルに対してしっかりとした利益が得られたが、変革的ケースでは持続的な弱点がみられた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:20:56 GMT)
Learning to Summarize by Learning to Quiz: Adversarial Agentic Collaboration for Long Document Summarization [87.0] SummQは長期文書要約のための新しい逆多重エージェントフレームワークである。
提案手法では,包括的な要約を作成し,評価するために協調作業を行う要約ジェネレータとレビュアーを用いる。
広範に使用されている3つの文書要約ベンチマーク上でSummQを評価する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:36:19 GMT)
InComeS: Integrating Compression and Selection Mechanisms into LLMs for Efficient Model Editing [86.2] In-context Learningは、コンテキストエンコーディングを通じて編集情報を解釈することで、有望な編集方法である。
この方法は、大きな言語モデルの限られたコンテキストウィンドウによって制約される。
編集コンテキストの処理能力を向上させるフレキシブルなフレームワークであるInComeSを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:15:45 GMT)
Process Reward Models That Think [85.1] ステップバイステップ検証 - プロセス報酬モデル(PRM)としても知られる - は、テスト時間スケーリングの鍵となる要素である。
この研究は、検証チェーン・オブ・シント(CoT)を生成することにより、ソリューションのすべてのステップを検証する言語化されたステップワイド報酬モデルとして、データ効率の高いPRMを構築することを目的としている。
我々は差別的PRMよりもプロセスラベルを桁違いに少なめに微調整した長いCoT検証器ThinkPRMを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:09:09 GMT)
ASCIIEval: Benchmarking Models' Visual Perception in Text Strings via ASCII Art [84.0] 我々は,この問題を認識タスクとみなし,新しいベンチマークASCIIEvalを構築した。
精巧な分類木を持つ3Kサンプルに加えて、さらなる拡張のためのトレーニングセットもカバーしている。
テキスト入力が与えられた言語モデルは、ASCIIアートの概念に基づいて視覚的知覚能力を示す。
画像入力において,オープンソースのMLLMは,微細なテキスト認識と集合的視覚知覚のトレードオフに悩まされていることが明らかになった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:46:11 GMT)
What Makes a Reward Model a Good Teacher? An Optimization Perspective [82.7] 報酬モデルがどの程度正確であるかに関わらず、低報酬分散を誘導した場合、RLHFの目的は平坦な景観に悩まされる。
さらに、ある言語モデルでうまく機能する報酬モデルが、低い報酬分散を誘発し、したがって、別の言語モデルに対して平坦な客観的景観をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:11:11 GMT)
One-Embedding-Fits-All: Efficient Zero-Shot Time Series Forecasting by a Model Zoo [82.7] Time Series Foundation Models (TSFM) はゼロショット予測を大幅に進歩させた。
異なるモデルが異なる時間パターンの好みを示すため、単一のTSFMが普遍的に優れているものはない。
本稿では,各モデルの予測強度を特徴付けるZooCastを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:20:23 GMT)
Who Gets Cited Most? Benchmarking Long-Context Language Models on Scientific Articles [81.9] SciTrekは、科学論文を用いた大規模言語モデル(LLM)の長文推論能力を評価するために設計された、新しい質問応答ベンチマークである。
本分析により,モデルの基本的数値演算を行ない,特定の情報を長い文脈で正確に特定する能力において,系統的な欠点が明らかとなった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:36:09 GMT)
ConsistentChat: Building Skeleton-Guided Consistent Multi-Turn Dialogues for Large Language Models from Scratch [79.1] Skeleton-Guided Multi-Turn Dialogue Generationは、人間の意図を明示的にモデル化することで、マルチターン命令合成を制約する。
約15,000のマルチターン会話と224,392の発話を持つマルチターン命令データセットであるConsistentChatを構築した。
Light, Topdial, MT-Evalベンチマークの実験では、ConsistentChatで微調整されたモデルでは、チャットの一貫性が20~30%向上し、タスクの成功率が15%向上している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:47:02 GMT)
What Happens Next? Anticipating Future Motion by Generating Point Trajectories [76.2] 一つの画像から動きを予測し、世界の物体がどのように動くかを予測する問題を考察する。
我々はこのタスクを,現代のビデオジェネレータのアーキテクチャを忠実に追従するモデルを用いて,高密度トラジェクトリグリッドの条件生成として定式化する。
このアプローチはシーン全体のダイナミクスと不確実性を捉え、以前の回帰器やジェネレータよりも正確で多様な予測をもたらす。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:03:56 GMT)
ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs [75.7] 本稿では,新しいトラジェクトリ対応PRMであるReasonFlux-PRMを紹介し,トラジェクトリ応答型推論トレースの評価を行う。
ReasonFlux-PRMはステップレベルとトラジェクトリレベルの両方の監視機能を備えており、構造化された連鎖データと整合した微粒な報酬割り当てを可能にする。
得られたReasonFlux-PRM-7Bは、教師付き微調整で平均12.1%、強化学習で4.5%、テスト時間スケーリングで6.3%向上した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:30:13 GMT)
AdaSVD: Adaptive Singular Value Decomposition for Large Language Models [75.1] Singular Value Decomposition (SVD) は,大規模言語モデル(LLM)の有望な圧縮手法として登場した。
既存のSVDベースの手法は、SVDトランケーションによって引き起こされるエラーを効果的に軽減するために苦労することが多い。
適応SVDに基づくLLM圧縮手法であるAdaSVDを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:28:19 GMT)
MMSI-Bench: A Benchmark for Multi-Image Spatial Intelligence [74.5] MMSI-Benchは、マルチイメージ空間インテリジェンスに特化したVQAベンチマークである。
我々は、大規模な実験を行い、34のオープンソースおよびプロプライエタリMLLMを徹底的に評価する。
最も強力なオープンソースモデルはおよそ30%の精度に達し、OpenAIのo3推論モデルは40%に達し、人間は97%である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:01:27 GMT)
MultiVox: A Benchmark for Evaluating Voice Assistants for Multimodal Interactions [70.9] 音声と視覚を融合させる音声アシスタントの能力を評価する最初のベンチマークであるMultiVoxを紹介する。
具体的には、MultiVoxには、多種多様なパラ言語的特徴を包含する1000の人間の注釈付き音声対話が含まれている。
10の最先端モデルに対する我々の評価は、人間はこれらのタスクに長けているが、現在のモデルは、常に文脈的に接地された応答を生成するのに苦労していることを示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:32:50 GMT)
Aligning Distributionally Robust Optimization with Practical Deep Learning Needs [70.9] 従来のLearning (DL)メソッドはすべてのサンプルを平等に扱うが、DROと現在のDLプラクティスの間には大きなギャップがある。
本稿では,重み付けグループを扱える改良DRO目標に対する適応アルゴリズムを導入することにより,このギャップを埋めることを目的とする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:03:41 GMT)
Physics Informed Neural Networks for design optimisation of diamond particle detectors for charged particle fast-tracking at high luminosity hadron colliders [70.7] 将来の高輝度ハドロン衝突装置は、極端放射線耐性、空間精度、ナノ秒以下のタイミングで追跡検出器を必要とする。
3Dダイヤモンドのピクセルセンサーは、ダイヤモンドの放射硬度とキャリアの移動性のために、これらの機能を提供する。
我々は、マクスウェル方程式の準定常近似として導かれた3次、3+1D PDEを用いて、この現象をモデル化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:09:28 GMT)
IDEATOR: Jailbreaking and Benchmarking Large Vision-Language Models Using Themselves [70.4] IDEATORは、ブラックボックスジェイルブレイク攻撃のための悪意のある画像テキストペアを自律的に生成する新しいジェイルブレイク手法である。
最近リリースされたVLM11のベンチマーク結果から,安全性の整合性に大きなギャップがあることが判明した。
例えば、我々はASRをGPT-4oで46.31%、Claude-3.5-Sonnetで19.65%と設定した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:00:41 GMT)
Responsible Diffusion: A Comprehensive Survey on Safety, Ethics, and Trust in Diffusion Models [69.2] 拡散モデル(DM)は,高品質なデータを生成する能力から,様々な領域で研究されている。
従来のディープラーニングシステムと同様に、DMに対する潜在的な脅威も存在する。
この調査は、その枠組み、脅威、および対策を包括的に解明する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:51:43 GMT)
Investigating Factuality in Long-Form Text Generation: The Roles of Self-Known and Self-Unknown [68.3] 様々な大言語モデル(LLM)における長文テキスト生成の事実性について検討する。
分析の結果, 文末文の事実性は低下傾向にあり, 支持請求件数が増加傾向にあることが明らかとなった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:28:07 GMT)
A Fano-Style Accuracy Upper Bound for LLM Single-Pass Reasoning in Multi-Hop QA [65.4] MHQA(Multi-Hop Question Answering)は、ノイズ下でのシーケンシャルな推論を通じて、分散した相互依存的な証拠を統合する必要がある。
我々はMHQAのための概念実証マルチコールフレームワークをInfoQAで紹介する。
我々は、理論とフレームワークを検証するために、厳密で騒音に富んだベンチマークを構築した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:11:57 GMT)
Bounds of Chain-of-Thought Robustness: Reasoning Steps, Embed Norms, and Beyond [64.9] 既存の研究では、CoT(Chain-of-Thought)の出力が入力摂動に大きく影響していることが示されている。
我々は,CoT出力の変動に対する入力摂動の影響を理論的に解析する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:04:31 GMT)
FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets [64.5] FORGEは、産業データセットを使ったジェネレーティブrEtrievalにおけるFOrmingセマンティック識別のベンチマークである。
現実世界のアプリケーションでは、オンラインコンバージェンスを半減するオフライン事前トレーニングスキーマが導入されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:44:22 GMT)
MedVSR: Medical Video Super-Resolution with Cross State-Space Propagation [63.4] 低解像度(LR)医療ビデオは、ビデオ超解像度(VSR)モデルに固有の課題を提示する。
本稿では,医療用VSRのためのフレームワークであるMedVSRを提案する。
MedVSRは既存のVSRモデルよりも性能と効率が優れていることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:56:59 GMT)
From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning [63.3] 大きな言語モデル (LLMs) は言語能力を示すが、同じバランスをとれるかどうかは不明だ。
本稿では,LLMと人間を定量的に比較するために,Information Bottleneckの原理を適用した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:34:22 GMT)
EditVerse: Unifying Image and Video Editing and Generation with In-Context Learning [58.5] イメージとビデオの生成と編集を単一のモデルで統合したフレームワークであるEditVerseを紹介する。
テキスト、画像、ビデオなどのすべてのモダリティを統一されたトークンシーケンスとして表現することで、EditVerseは、堅牢なインコンテキスト学習を実現するために自己アテンションを活用する。
多様なタスクや解像度をカバーする命令ベースのビデオ編集のための最初のベンチマークであるEditVerseBenchを紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:11:13 GMT)
TrustJudge: Inconsistencies of LLM-as-a-Judge and How to Alleviate Them [58.0] 自動評価器(LLM-as-a-judge)としての大規模言語モデル(LLM)は、現在の評価フレームワークにおいて重大な矛盾を明らかにしている。
スコア比較不整合とペアワイズ・トランジティビティ不整合という2つの基本的不整合を同定する。
我々は2つの重要なイノベーションを通じてこれらの制限に対処する確率的フレームワークであるTrustJudgeを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:04:29 GMT)
A Comprehensive Taxonomy of Negation for NLP and Neural Retrievers [57.6] 我々は、哲学的、言語的、論理的定義から派生した否定の分類を導入した。
ニューラルネットワーク検索モデルの性能評価に使用できるベンチマークデータセットを2つ生成する。
本稿では,既存のデータセットの検索モデルの性能を解析するために,論理に基づく分類機構を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:21:40 GMT)
WebExplorer: Explore and Evolve for Training Long-Horizon Web Agents [57.2] 本稿では,モデルに基づく探索と反復的,長短のクエリ進化を用いた体系的データ生成手法であるWebExplorerを紹介する。
我々のモデルは、128Kのコンテキスト長と最大100のツール呼び出しスイッチをサポートし、長期の問題解決を可能にします。
8Bサイズのモデルとして、WebExplorer-8Bは、RLトレーニング後の平均16ターンを効果的に探索することができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:49:47 GMT)
VideoJudge: Bootstrapping Enables Scalable Supervision of MLLM-as-a-Judge for Video Understanding [57.2] ビデオ理解モデルから出力を評価するための3Bおよび7BサイズのMLLM判定器であるVideoJudgeを紹介する。
VideoJudgeのトレーニングには、ジェネレータと評価器の相互作用に基づいてレシピを構築します。
4つのメタ評価ベンチマークのうち3つで、VideoJudge-7BはMLLMの判断基準を大きく上回っている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:22:57 GMT)
You Are Your Own Best Teacher: Achieving Centralized-level Performance in Federated Learning under Heterogeneous and Long-tailed Data [54.6] 局所的な非IIDデータとグローバルな長期分布から生ずるデータ不均一性は、連邦学習(FL)における大きな課題である
弱い局所サンプルと強い局所サンプルの知識を蒸留し,表現学習を改善するためにFedYoYoを提案する。
我々は、FedYoYoが最先端の結果を達成し、グローバルな長期的設定の下で集中ロジット調整手法を5.4%超えたことを示します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:41:15 GMT)
Reformulation is All You Need: Addressing Malicious Text Features in DNNs [53.5] 本稿では,敵攻撃とバックドア攻撃の両方に対して有効な,統一的かつ適応的な防御フレームワークを提案する。
我々のフレームワークは、様々な悪意あるテキスト機能において、既存のサンプル指向の防御基準よりも優れています。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:09:47 GMT)
Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.5] 暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:05:55 GMT)
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition [53.1] FRB(Font Recognition Benchmark)は15のフォントからなるコンパクトで構造化されたデータセットである。
FRBには2つのバージョンがある: (i) 簡単なバージョン、10つの文を異なるフォントで描画するバージョン、 (ii) ハードバージョン。
フォント認識タスクにおける様々なVLMの広範な評価を通じて,以下の重要な知見を得た。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:24:21 GMT)
$A^2R^2$: Advancing Img2LaTeX Conversion via Visual Reasoning with Attention-Guided Refinement [53.1] 視覚言語モデル(VLM)は、様々な視覚的理解タスクにおいて顕著な進歩を遂げている。
A2R2$:Advancing Img2La Conversion via Visual Reasoning with Attention-Guided Refinementを提案する。
有効評価のために,1,100個の慎重にキュレートされた,挑戦的なサンプルからなる新しいデータセットImg2LaTex-Hard-1Kを導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:30:03 GMT)
VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models [53.1] OpenAI o1とDeepSeek-R1は、推論の領域で素晴らしいパフォーマンスを達成した。
彼らのトレーニングの重要な要素は、強化学習に検証可能な報酬を取り入れることである。
既存の報酬ベンチマークでは、参照ベースの報酬システムの評価は行われていない。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:20:02 GMT)
Which Cultural Lens Do Models Adopt? On Cultural Positioning Bias and Agentic Mitigation in LLMs [53.1] 大規模言語モデル(LLM)は、幅広い下流生成アプリケーションをアンロックした。
また、米国主流の文化の観点から、文化にまつわる微妙な公平性の問題に対処し、世代を配置するリスクも見いだす。
本稿では、これらのバイアスを解決するための2つの推論時間緩和法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:28:25 GMT)
Graph Random Features for Scalable Gaussian Processes [52.9] 離散入力空間上のスケーラブルなガウス過程へのグラフランダム特徴(GRF)の適用について検討する。
我々は、(穏やかな仮定の下で) GRF に対するベイズ的推論が、正確なカーネルに対して$O(N3)$のノード数に対して$O(N3/2)$の時間複雑性を楽しむことを証明した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:24:05 GMT)
From Physics to Machine Learning and Back: Part II - Learning and Observational Bias in PHM [52.6] 物理インフォームドモデリングとデータストラテジーによる学習と観察バイアスの導入は、モデルを物理的に一貫した信頼性のある予測へと導くことができるかを検討する。
メタラーニングや少数ショットラーニングなどの高速適応手法をドメイン一般化手法とともに検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:15:43 GMT)
CodeBrain: Towards Decoupled Interpretability and Multi-Scale Architecture for EEG Foundation Model [52.5] EEGファウンデーションモデル(EFM)は、タスク固有のモデルのスケーラビリティ問題に対処するために登場した。
このギャップを埋めるために設計された2段階のEMFであるCodeBrainを紹介します。
第1段階では、異種時間・周波数の脳波信号を離散トークンに分解するTFDual-Tokenizerを導入する。
第2段階では、構造化されたグローバル畳み込みとスライディングウインドウの注意を結合したマルチスケールEEGSSMアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:55:31 GMT)
iTACO: Interactable Digital Twins of Articulated Objects from Casually Captured RGBD Videos [52.4] 本研究では,手持ちカメラで撮影したカジュアルなRGBD映像から,物体の動作解析と部分レベルセグメンテーションに焦点を当てた。
スマートフォンを用いて手軽に手軽に手軽に手軽に手に入ることができる。
動的RGBDビデオからオブジェクトの関節パラメータとセグメントを推論する粗粒度フレームワークiTACOを紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:24:31 GMT)
Disagreements in Reasoning: How a Model's Thinking Process Dictates Persuasion in Multi-Agent Systems [49.7] 本稿では,説得力はモデルスケールの関数である,という一般的な仮説に挑戦する。
一連のマルチエージェントの説得実験を通じて、パーサーション・デュナリティ(Persuasion Duality)と呼ばれる基本的なトレードオフを明らかにする。
以上の結果から, LRMの推理過程は説得に対する抵抗性が大きく, 当初の信念をより堅固に維持していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:03:10 GMT)
LIMI: Less is More for Agency [49.6] LIMI(Less Is More for Intelligent Agency)は、機関が根本的に異なる開発原則に従うことを示す。
高度なエージェント・インテリジェンスは、最小でも戦略的にキュレートされた自律行動のデモンストレーションから生まれる可能性がある。
マシンの自律性はデータの豊富さではなく、高品質なエージェント実証の戦略的キュレーションから生まれる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:23:08 GMT)
MI-Fuse: Label Fusion for Unsupervised Domain Adaptation with Closed-Source Large-Audio Language Model [49.6] 大規模音声言語モデル(LALM)は、音声タスクに強いゼロショット能力を示し、音声感情認識(SER)の可能性を示唆している。
私たちは、未ラベルのターゲットドメインオーディオとAPIのみのLALMだけを考えると、学生モデルがターゲットドメインのLALMを上回るように適応できるだろうか?
LALMを補助教師としてソースドメイン訓練されたSERで補足する識別ラベル融合フレームワークであるMI-Fuseを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:16:32 GMT)
Joint Active RIS Configuration and User Power Control for Localization: A Neuroevolution-Based Approach [49.5] Reconfigurable Intelligent Surface (RIS) によるユーザローカライゼーションの研究
ベースステーションからユーザへのフィードバックリンクを採用し、アップリンク内のユーザパイロット送信の動的電力制御を可能にする。
RIS位相構成とユーザ送信電力のジョイント制御のための新しいマルチエージェントアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:36:04 GMT)
REArtGS: Reconstructing and Generating Articulated Objects via 3D Gaussian Splatting with Geometric and Motion Constraints [47.8] REArtGSは、幾何学的および運動的制約を3Dガウスプリミティブに導入する新しいフレームワークである。
与えられた状態に対する高忠実なテクスチャ化表面再構成を実現し、目に見えない状態に対する高忠実な表面生成を可能にする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:07:05 GMT)
Forecasting Seismic Waveforms: A Deep Learning Approach for Einstein Telescope [46.5] 我々は、アインシュタイン望遠鏡のような将来の重力波検出器の文脈において、3成分地震波形を予測する変圧器に基づくモデルであるtextitSeismoGPTを紹介した。
波形データから直接時間的および空間的依存関係を学習することにより、SeesmoGPTは現実的な地動パターンを捉え、正確な短期予測を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:16:13 GMT)
Turning Internal Gap into Self-Improvement: Promoting the Generation-Understanding Unification in MLLMs [46.4] MLLMの統一化は、優れた生成の理解と内部的なギャップを生じさせることを示す。
この発見は、シンプルだが効果的な内部ギャップに基づく自己改善フレームワークを提案する動機となっている。
プレトレーニングでよく知られるが,ポストトレーニングでは過小評価されている,このような自己改善の併用効果を実証的に発見する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:17:06 GMT)
Logic of Hypotheses: from Zero to Full Knowledge in Neurosymbolic Integration [46.4] ニューロシンボリック統合(NeSy)は、ニューラルネットワーク学習とシンボリック推論をブレンドする。
本稿では,データ駆動型ルール学習を記号的先行と専門知識で統一する新言語LoHについて紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:31:43 GMT)
Efficient Ensemble Conditional Independence Test Framework for Causal Discovery [46.3] 本稿では,汎用およびプラグアンドプレイフレームワークであるEnsemble Conditional Independence Test (E-CIT)を紹介する。
E-CITはデータをサブセットに分割し、与えられたベースCITを各サブセットに独立に適用し、結果として得られるp値を集約する。
その結果、E-CITはCITの計算負担と因果発見を著しく低減するだけでなく、競争性能も向上することが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:31:16 GMT)
ImaginationPolicy: Towards Generalizable, Precise and Reliable End-to-End Policy for Robotic Manipulation [46.1] ロボット操作のための新しい動き指向キーポイント(CoMOK)の定式化を提案する。
私たちの定式化は、エンドツーエンドでトレーニング可能なニューラルポリシーのアクション表現として使用されます。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:29:07 GMT)
CusEnhancer: A Zero-Shot Scene and Controllability Enhancement Method for Photo Customization via ResInversion [45.1] 既存のアイデンティティカスタマイズモデルを拡張する新しいフレームワークであるCustomEnhancerを紹介します。
当社のパイプラインは、パーソナライズされたモデルの生成プロセスに対する、包括的なトレーニング不要な制御を可能にする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:00:34 GMT)
Diff-Reg v2: Diffusion-Based Matching Matrix Estimation for Image Matching and 3D Registration [44.9] 本稿では,行列空間における拡散モデルを利用して,ロバストマッチング行列推定を行う革新的パラダイムを提案する。
具体的には、3D-3Dおよび2D-3D登録タスクに対して2次元行列空間に拡散モデルを適用する。
3つの登録タスクすべてに対して、各タスクの特定の特性に合わせた適応的マッチング行列埋め込み実装を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:04:34 GMT)
$\mathbf{Li_2}$: A Framework on Dynamics of Feature Emergence and Delayed Generalization [44.6] 非線形ネットワークにおけるグラッキング現象,すなわち遅延一般化について検討する。
2層非線形ネットワークのグルーキング動作の3つの重要な段階を捉える。
我々の研究は、体重減少、学習率、グルーキングにおけるサイズといったハイパーマスが果たす役割に光を当てています。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:08:09 GMT)
Understanding-in-Generation: Reinforcing Generative Capability of Unified Model via Infusing Understanding into Generation [44.0] 統一モデル(UiG)のための新しい推論フレームワークを提案する。
UiGの中核となる洞察は、推論過程において強力な理解能力によって生成誘導を統合することである。
我々のUiGフレームワークは,既存のテキスト・ツー・イメージ推論手法に比べて,テキスト・ツー・イメージ生成の性能が大幅に向上したことを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:19:34 GMT)
LLMs4All: A Review on Large Language Models for Research and Applications in Academic Disciplines [41.2] ChatGPTのようなLLM(Large Language Models)ベースのアプリケーションは、人間のような会話を生成する能力を示している。
本稿では,最先端のLDMの概要と,幅広い学術分野への統合について述べる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:18:21 GMT)
Rosenthal-type inequalities for linear statistics of Markov chains [40.6] 幾何学的エルゴード的マルコフ鎖の加法関数に対する濃度不等式を確立する。
我々は、対応する鎖の混合時間に対する境界の依存に特に注意を払う。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:58:15 GMT)
Quantum lattice Boltzmann algorithm for heat transfer with phase change [40.5] 本稿では,相変化を伴う熱伝達をシミュレーションするための量子格子ボルツマン法(QLBM)を提案する。
この手法は格子ボルツマン法(LBM)の統計的性質を活用し、量子コンピューティングにおける非線形相転移の課題に対処する。
我々は、古典的および量子的ハードウェア間の頻繁な情報交換を避けるために、位相変化情報を量子回路に格納する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:47:31 GMT)
A Causality-Aware Spatiotemporal Model for Multi-Region and Multi-Pollutant Air Quality Forecasting [40.5] AirPCMは、多汚染物質力学と明示的な気象-汚染物質因果モデリングを組み合わせる。
AirPCMは、予測精度と一般化能力の両方において、最先端のベースラインを一貫して超越している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:54:23 GMT)
Towards Scalable Language-Image Pre-training for 3D Medical Imaging [40.3] 本研究では, 放射線学データの内在的階層(スライス, スキャン, 研究)にインスパイアされた新しい階層的注意機構を導入する。
脳MRIで313万スキャン、頭部CTで144万スキャンで240万スキャンで220万の研究で訓練されたHLIPは、最先端のパフォーマンスを実現している。
これらの結果から,HLIPでは,未修正臨床データセットを直接事前トレーニングすることは,3次元医用画像における言語画像事前トレーニングのスケーラブルかつ効果的な方向であることが示唆された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:14:52 GMT)
RL Squeezes, SFT Expands: A Comparative Study of Reasoning LLMs [40.2] 大規模言語モデル(LLM)は通常、推論能力を改善するために、検証可能な報酬(RLVR)を持つ強化学習(RL)によって訓練される。
本稿では,各学習過程において,推論経路を定量化し,定性的な変化を捉える新しい分析フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:18:57 GMT)
LLMTrace: A Corpus for Classification and Fine-Grained Localization of AI-Written Text [39.6] LLMTraceは、AIによるテキスト検出のための、大規模なバイリンガル(英語とロシア語)コーパスである。
私たちのデータセットは、従来のフルテキストバイナリ分類(人間対AI)と、AI生成間隔検出の新しいタスクの2つの重要なタスクをサポートするように設計されています。
LLMTraceは、よりニュアンスで実用的なAI検出モデルの次世代をトレーニングし、評価するための重要なリソースになると考えています。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:59:43 GMT)
Canary-1B-v2 & Parakeet-TDT-0.6B-v3: Efficient and High-Performance Models for Multilingual ASR and AST [39.4] Canary-1B-v2は、自動音声認識(ASR)と音声テキスト翻訳(AST)のための高速で堅牢な多言語モデルである
FastConformerエンコーダとTransformerデコーダで構築され、主にヨーロッパ25言語をサポートしている。
動的データバランシングを伴う2段階の事前学習および微調整プロセスとnGPTエンコーダを用いた実験について述べる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:56:16 GMT)
Chasing the Tail: Effective Rubric-based Reward Modeling for Large Language Model Post-Training [39.4] 強化微調整 (Reinforcement fine-tuning, RFT) は、ポリシーモデルが報酬信号をハックして高いスコアを得るという、過度な最適化に悩まされることが多い。
我々の理論的分析は、高いリワードテールにおける報酬の誤特定に鍵がかかっていることを示している。
政治以外の見習いは入手し易いが、彼らのナイーティブな訓練は、私たちが調整しようとしている政策に対して、不明確な報酬を与える。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:57:39 GMT)
ReviewScore: Misinformed Peer Review Detection with Large Language Models [38.9] 15.2%の弱点と26.4%の質問が誤記されていることを示し、レビューポイントが誤記されているかどうかを示すReviewScoreを紹介した。
人間の専門家によるReviewScoreデータセットを構築し、LLMがReviewScore評価を自動化する能力をチェックする。
また、前提レベルの事実性を評価することは、弱点レベルの事実性を評価するよりも、はるかに高い合意を示すことを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:55:05 GMT)
Can Less Precise Be More Reliable? A Systematic Evaluation of Quantization's Impact on CLIP Beyond Accuracy [38.9] 量子化がCLIPの性能に与える影響を精度を超えて評価する。
量子化は、一般に信頼できない事前学習モデルの校正を一貫して改善することを示す。
我々は、ゼロショット精度、キャリブレーション、OODロバスト性において同時ゲインをもたらす特定の量子化対応トレーニング(QAT)法を同定する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:54:34 GMT)
The Use of the Simplex Architecture to Enhance Safety in Deep-Learning-Powered Autonomous Systems [38.9] 本稿では,学習に基づく自律システムの安全性,セキュリティ,予測可能性のレベルを向上するソフトウェアアーキテクチャを提案する。
これは2つの独立した実行ドメインを活用している。1つは、信頼できるオペレーティングシステム下でのニューラルネットワークの実行に特化しており、信頼できないと見なされている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:20:47 GMT)
Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation [38.8] Chemma-RCは、タスク固有の対話と条件生成を通じて有効な条件を識別するテキスト拡張マルチモーダルLLMである。
Chemma-RCは、複数のモダリティ(テキストコーパス、反応SMILES、反応グラフを含む)を共有埋め込みモジュールで整列させることで、化学反応の統一的な表現を学習する。
データセットのパフォーマンスベンチマークは、最適な条件を特定する上で高い精度を示し、最先端の手法よりも最大17%改善した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:37:24 GMT)
Inverse Reinforcement Learning Using Just Classification and a Few Regressions [38.7] 逆強化学習は、基礎となる報酬を明らかにすることによって観察された振る舞いを説明することを目的としている。
集団最大化解は, 行動方針を含む線形不動点方程式によって特徴づけられることを示す。
最適解法,一般オラクルアルゴリズム,有限サンプル誤差境界,およびMaxEnt IRLに対する競合的あるいは優れた性能を示す実験結果の正確な評価を行う。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:53:43 GMT)
Polarity Detection of Sustainable Detection Goals in News Text [38.0] 国連の持続可能な開発目標は、社会的、環境的、経済的課題に対処するための世界的な枠組みを提供する。
自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、特定のSDGに基づいてテキストデータの自動分類を容易にする。
本稿では,テキストセグメントが特定のSDGに向かって進行を示すか,あるいはその進展を達成する意図を伝達するかを評価するSDG極性検出の新しいタスクを提案する。
本研究は、持続可能性モニタリングのための方法論ツールキットを進歩させ、効率的で高性能な極性検出システムの開発に関する実用的な知見を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:37:09 GMT)
CaTS-Bench: Can Language Models Describe Numeric Time Series? [37.0] CaTS-Benchは、コンテキスト対応の時系列キャプションのための、最初の大規模な実世界のベンチマークである。
CaTS-Benchは、約465kのトレーニングと105kのテストタイムスタンプを含む11の多様なデータセットから派生している。
この作業の重要な貢献は、参照キャプションを生成するために使用されるスケーラブルなパイプラインである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:10:03 GMT)
The Validation Gap: A Mechanistic Analysis of How Language Models Compute Arithmetic but Fail to Validate It [36.9] 大規模言語モデル(LLM)における誤り検出の力学解析について述べる。
回路解析により,4つの小さいLLMの演算誤差を検出する計算部分グラフを同定する。
この結果から,算術的解法における数値値の表面レベルのアライメントを評価するために,すべてのモデルが$textitConsistency Head$-attention Headに大きく依存していることが判明した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:37:54 GMT)
X-Streamer: Unified Human World Modeling with Audiovisual Interaction [36.5] X-Streamerは、テキスト、音声、ビデオ間の無限の相互作用が可能なデジタルヒューマンエージェントを構築するためのフレームワークである。
中心となるのは、マルチモーダル理解と生成を統一するThinker-Actorデュアルトランスフォーマーアーキテクチャである。
X-Streamerは2つのA100 GPU上でリアルタイムに動作し、一貫したビデオチャット体験を数時間持続する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:53:27 GMT)
Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization [36.2] マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。
既存の手法は現実のシナリオで失敗することが多い。
本稿では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:54:24 GMT)
Decoding the Surgical Scene: A Scoping Review of Scene Graphs in Surgery [36.2] シーングラフ(SG)は、複雑なダイナミックな手術環境のデコードに不可欠な構造化された表現を提供する。
The PRISMA-ScR-guided scoping review systemally map the evolution landscape of SG research in surgery。
我々の分析は急速に成長しているが、重要な「データ分割」を明らかにしている
SGは重要なセマンティックブリッジに成熟し、新しい世代のインテリジェントシステムによって外科の安全性、効率、訓練を改善することができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:25:46 GMT)
Discovering alternative solutions beyond the simplicity bias in recurrent neural networks [36.1] 神経科学的なタスクを実行するためのリカレントニューラルネットワーク(RNN)のトレーニングは、ニューラルネットワークがどのように計算を行うかの仮説を生成する一般的な方法となっている。
最近の研究は、タスク学習されたRNNが強力な単純さバイアスを持つことを示した。
本稿では、この帰納バイアスを破るために、反復的ニューラル類似度デフレを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:59:04 GMT)
Improved Scaling Laws in Linear Regression via Data Reuse [36.1] データの再利用は線形回帰における既存のスケーリング法則を改善することができることを示す。
これはデータ再利用によるスケーリング法則の改善(すなわち、データ制約されたレシエーションで$L>N$を選択する)を示唆している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:04:26 GMT)
Rethinking Circuit Completeness in Language Models: AND, OR, and ADDER Gates [35.9] 論理ゲートはAND,OR,ADDERの3種類の論理ゲートを導入し,回路を論理ゲートの組み合わせに分解する。
本稿では,既存の回路発見手法に容易に組み込むことが可能な,ノイズ発生に基づく介入と雑音発生に基づく介入を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:04:14 GMT)
Look Before you Leap: Estimating LLM Benchmark Scores from Descriptions [35.5] テキストのみのパフォーマンス予測について検討し、タスク記述と意図した構成からモデルのスコアを推定する。
系統的な研究を支援するため,多種多様なタスク,ドメイン,メトリクスにまたがる記述性能対のコーパスであるPreCOGをキュレートする。
実験では、タスクは困難だが実現可能であり、高い信頼しきい値の精度サブセットで平均8.7の絶対誤差に達する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:02:27 GMT)
Towards an AI-Augmented Textbook [35.3] 生成AIを用いて教科書を変換・拡張する手法を提案する。
このアプローチで構築されたシステムをLearning Your Wayと呼ぶ。
異なる変換と拡張の教育学的評価を報告し、ランダム化制御試験の結果を報告する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:48:28 GMT)
A Framework for Rapidly Developing and Deploying Protection Against Large Language Model Attacks [35.2] 大規模言語モデル(LLM)はAIデプロイメントに革命をもたらし、業界全体で自律的および半自律的なアプリケーションを可能にする。
LLMに対するゼロデイアタックや新規アタックは、既知のアプローチでは防げない。
これにより、AI保護システムは、確立されたマルウェア保護システムに似たカテゴリに置かれる。
本稿では,マルウェア検出と脅威知能の確立に根ざした,生産レベルの防衛システムを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:36:19 GMT)
On the Perception Bottleneck of VLMs for Chart Understanding [35.2] チャート理解には、数値データ、テキスト要素、複雑なビジュアルコンポーネントを分析し、推論するモデルが必要である。
この過程において,既存の大規模視覚言語モデル(LVLM)の知覚能力が重要なボトルネックとなっていることが明らかとなった。
本研究では,視覚エンコーダのボトルネックと抽出ボトルネックの2つのコンポーネントに分解することで,この認識ボトルネックを解明する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:16:36 GMT)
MOSS-ChatV: Reinforcement Learning with Process Reasoning Reward for Video Temporal Reasoning [34.2] マルチモーダル大言語モデル(MLLM)の重要機能としてビデオ推論が登場した
既存のMLLMは、最終回答が正しい場合でも、中間的推論がビデオダイナミクスから漂流するプロセスの不整合を示すことが多い。
動的時間ウォーピング(DTW)に基づくプロセス報酬を備えた強化学習フレームワークであるMOSS-ChatVを紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:59:13 GMT)
Expanding Reasoning Potential in Foundation Model by Learning Diverse Chains of Thought Patterns [34.2] 我々は,基礎モデルの推論可能性について,疑問に正しく答えるために必要な独立した試みの数の逆として初めて定義する。
次に、高価値推論パターンを付加した多種多様なデータを活用し、推論可能性を拡張することを提案する。
85A6B Mixture-of-Experts (MoE) モデルは, AIME 2024 と 2025 の挑戦に対して 9.58% 改善可能である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:11:35 GMT)
Reasoning-Enhanced Domain-Adaptive Pretraining of Multimodal Large Language Models for Short Video Content Moderation [34.1] 本稿では,不適切なコンテンツ検出を統一するためのMLLM事前学習パラダイムを提案する。
短いビデオコンテンツとMLLMのオリジナル事前学習データとの分配ギャップに対処するために,3つの目標事前学習タスクを導入する。
実験結果から,ゼロショットおよび教師付き微調整環境におけるMLLMの性能は,事前学習により有意に向上することが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:46:34 GMT)
A Genetic Algorithm for Navigating Synthesizable Molecular Spaces [34.1] 合成経路上で直接動作する単純な遺伝的アルゴリズムであるSynGAを提案する。
適合度関数を変更することで、さまざまなデザインタスクにおけるSynGAの有効性を実証する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:33:30 GMT)
OLMA: One Loss for More Accurate Time Series Forecasting [34.0] 時系列予測は2つの重要な課題に直面するが、しばしば見過ごされる。
ニューラルネットワークは、時系列の状態空間をモデル化する際に周波数バイアスを示す。
本稿では,チャネルと時間次元の周波数領域変換を利用して予測を向上するOLMAという新しい損失関数を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:06:01 GMT)
Towards Foundation Models for Zero-Shot Time Series Anomaly Detection: Leveraging Synthetic Data and Relative Context Discrepancy [33.7] 時系列異常検出(TSAD)は重要な課題であるが、見えないデータに一般化するモデルを開発することは大きな課題である。
我々は、新しい事前学習パラダイムの上に構築されたTSADの新たな基盤モデルであるtextttTimeRCDを紹介した。
textttTimeRCD はゼロショット TSAD において,既存の汎用および異常固有の基盤モデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:05:15 GMT)
Predicting LLM Reasoning Performance with Small Proxy Model [33.7] 本研究では,小プロキシが事前学習対象と目標タスクとより緊密に連携することで,大規模モデルの推論を効果的に予測できることを示す。
rBridgeは、フロンティアモデルからの推論トレースをゴールドラベルとして使用して、負のログライクな部分をタスクアライメントで重み付けすることでこれを実現している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:20:38 GMT)
PseudoBridge: Pseudo Code as the Bridge for Better Semantic and Logic Alignment in Code Retrieval [33.6] PseudoBridgeは、中間的、半構造化されたモダリティとして擬似コードを導入する、新しいコード検索フレームワークである。
まず,NLクエリと擬似コードとの明示的なアライメントを実現するために,先進的な大規模言語モデル(LLM)を用いる。
第2に、論理不変のコードスタイル拡張戦略を導入し、LLMを用いて、スタイリスティックに多様だが論理的に等価なコード実装を擬似コードで生成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:10:36 GMT)
UniSS: Unified Expressive Speech-to-Speech Translation with Your Voice [33.4] 表現型S2STのための新しい単一ステージフレームワークUniSSを紹介する。
提案手法は、注意深く設計された音声意味とスタイルモデリングを特徴とする。
我々は44.8k時間のデータからなる大規模で高品質な表現型S2STデータセットUniSTをリリースする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:30:46 GMT)
Towards Atoms of Large Language Models [33.0] 大きな言語モデル(LLM)の内部表現は未定義のままであり、そのメカニズムのさらなる理解を制限している。
我々は、そのような単位を原子として定義する原子論を提案する。
我々はGemma2-2B、Gemma2-9B、Llama3.1-8Bでしきい値活性化SAEを訓練し、平均で99.9%のスパース再構成を実現した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:13:05 GMT)
Beyond the Individual: Introducing Group Intention Forecasting with SHOT Dataset [33.0] グループ意図は、複数の個人の行動を通じて現れる共通の目標を表す。
グループ意図予測(Group Intention Forecasting, GIF)は、集団意図がいつ起こるかを予測する新しいタスクである。
SHOTはGIF用の最初の大規模なデータセットで、5つのカメラビューから撮影された1,979本のバスケットボールビデオクリップで構成されている。
GIFTは、意図の出現を予測するためにグループダイナミクスを進化させる、きめ細かい個々の特徴とモデルを抽出するフレームワークである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:28:01 GMT)
A Formal Comparison Between Chain-of-Thought and Latent Thought [32.8] Chain-of-Thought (CoT) は、自然言語の中間ステップを明示的に生成することで、大きな言語モデルで推論を行う。
ループモデルにおける潜在思想は、連続潜在空間で直接動作し、離散言語表現を超えた計算を可能にする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:27:52 GMT)
One Model for All Tasks: Leveraging Efficient World Models in Multi-Task Planning [32.1] UniZeroのようなマルチタスクの世界モデルは、シングルタスク設定で優れている。
勾配の矛盾やモデル塑性の喪失はサンプルの効率を阻害することが多い。
本研究では,これらの課題を2つの相補的な視点 – 単一学習イテレーションと全体学習プロセス – から解決する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:04:15 GMT)
DiffSyn: A Generative Diffusion Approach to Materials Synthesis Planning [31.6] DiffSynは、50年間にわたる23,000以上の合成レシピに基づいて訓練された生成拡散モデルである。
DiffSynは、所望のゼオライト構造と有機テンプレートに条件付き可能な合成経路を生成する。
概念実証として,DiffSyn合成経路を用いてUFI材料を合成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:06:52 GMT)
Learning the Wrong Lessons: Syntactic-Domain Spurious Correlations in Language Models [31.6] タスク命令ペアにおける構文テンプレート,ドメイン,セマンティクスを特徴付ける。
構文とドメインの相関は性能を低下させる可能性がある。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:42:28 GMT)
GALAX: Graph-Augmented Language Model for Explainable Reinforcement-Guided Subgraph Reasoning in Precision Medicine [31.6] 精密医療では、量的マルチオミックな特徴、トポロジカルコンテキスト、テキスト生物学的知識が、疾患クリティカルなシグナル伝達経路や標的を特定する上で重要な役割を担っている。
我々は、事前学習されたグラフニューラルネットワーク(GNN)をLLM(Large Language Models)に統合する革新的なフレームワークであるGALAXを提案する。
アプリケーションとして,CRISPRを識別したターゲット,マルチオミックプロファイル,および多様ながん細胞株のバイオメディカルグラフ知識を組み合わせたベンチマークであるTarget-QAも導入した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:20:58 GMT)
Closed-loop control of seizure activity via real-time seizure forecasting by reservoir neuromorphic computing [31.5] リアルタイムにパーソナライズされたフリーラン刺激を駆動できるニューロモルフィック貯水池コンピューティングハードウェアシステムを提案する。
このシステムは、トレーニング期間中の発作発生を予測する際に、83.33%の精度を達成する。
本研究は, パーソナライズされたDRE治療のための次世代神経調節戦略としてのニューロモルフィックシステムの可能性を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:12:51 GMT)
The Limit Points of (Optimistic) Gradient Descent in Min-Max Optimization [31.2] 我々は,2つの基本的な1次法,すなわちGDA(Gradient Descent/Ascent)とOGDA(Optimistic Gradient Descent Ascent)の限界点を特徴付ける。
小さなステップのサイズと穏やかな仮定では、OGDA安定臨界点の集合はGDA安定臨界点のスーパーセットであり、これは局所 min-max 解のスーパーセットである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:21:30 GMT)
Generating 360° Video is What You Need For a 3D Scene [31.1] 中間シーン表現として360degビデオを利用する実用的でスケーラブルなソリューションを提案する。
テキストプロンプトから3Dシーンを合成する生成パイプラインであるWorldPrompterを提案する。
WorldPrompterには条件付き360度パノラマビデオジェネレータが組み込まれており、仮想環境を歩いたり捉えたりする人をシミュレートする128フレームのビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:04:40 GMT)
RecIS: Sparse to Dense, A Unified Training Framework for Recommendation Models [31.0] RecISは、PyTorchエコシステムに基づいたスパースセンストレーニングフレームワークである。
現在、RecISはAlibabaで多数の大規模強化レコメンデーショントレーニングタスクに使用されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:12:55 GMT)
VIFO: Visual Feature Empowered Multivariate Time Series Forecasting with Cross-Modal Fusion [31.0] 時系列モデルのための時空間予測モデルVIFOを提案する。
多変量時系列をイメージ化し、事前訓練されたLVMで複雑なチャネル間のパターンを抽出する。
複数のベンチマークで競合性能を達成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:02:26 GMT)
LoRA is All You Need for Safety Alignment of Reasoning LLMs [30.6] 本稿では,SFT に LoRA を使用すれば,その推論能力を損なうことなく,安全のためにモデルを効果的に整列させることができることを示す。
これは、安全ウェイト更新を低ランク空間に制限することは、推論ウェイトとの干渉を最小限にするからである。
実験により, 本手法は, 全モデルファインチューニングに匹敵する安全性を保ちながら, 推論能力を損なうことなく, 安全性の高いLCMを生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:39:42 GMT)
MotionFlow:Learning Implicit Motion Flow for Complex Camera Trajectory Control in Video Generation [30.5] 本稿では,カメラとオブジェクトの動作を,対応する画素の運動に変換することによって統合する新しいアプローチを提案する。
我々のモデルはSOTA法よりも大きなマージンで優れている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:06:12 GMT)
The Unwinnable Arms Race of AI Image Detection [28.8] データ次元とデータの複雑さの2つの要因を分析します。
非常に単純かつ複雑なデータセットが合成画像の検出性を低下させることを示す。
対照的に、中間複雑データセットは検出に最も好ましい条件を生成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:25:59 GMT)
DAMR: Efficient and Adaptive Context-Aware Knowledge Graph Question Answering with LLM-Guided MCTS [28.8] 本稿では,知識グラフ質問応答(KGQA)のための動的適応MCTSベースの推論(DAMR)を提案する。
DAMRは、MCTS(Monte Carlo Tree Search)と適応経路評価を統合し、コンテキスト対応のKGQAを実現する。
複数のKGQAベンチマークの実験では、DAMRはSOTA法よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:25:22 GMT)
MDPO: Overcoming the Training-Inference Divide of Masked Diffusion Language Models [28.8] 拡散言語モデルは、トレーニングと推論の主な相違に悩まされる。
本稿では,マルコフ特性拡散を利用するためのMasked Diffusion Policy Optimization (MDPO)を提案する。
本研究は,MDLMの事前学習と推測の相違を調査するための大きな可能性を見出した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:56:49 GMT)
Mechanisms of Projective Composition of Diffusion Models [28.7] 拡散モデルにおける構成の理論的基礎について考察する。
作文が「仕事」を意味するかは明らかになっていない。
本稿では,新作曲の成功や失敗を予測するための簡易な外挿法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:57:40 GMT)
VocalAgent: Large Language Models for Vocal Health Diagnostics with Safety-Aware Evaluation [28.6] 本稿では,音声による健康診断を通じてこれらの課題に対処する音声大言語モデル(LLM)であるVocalAgentを紹介する。
Qwen-Audio-Chatを病院患者から収集した3つのデータセットに微調整した。
VocalAgentは、最先端のベースラインと比較して、音声障害分類において優れた精度を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:01:20 GMT)
Vision Language Models Cannot Plan, but Can They Formalize? [28.5] 本稿では,1ショット,オープンボキャブラリ,マルチモーダルPDDL形式化に対処する5つのVLM-as-formalizerパイプラインについて述べる。
VLMは、必要となるオブジェクト関係の網羅的な集合を捕捉できないことが多いため、言語よりも視覚的なボトルネックを明らかにする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:55:11 GMT)
There Was Never a Bottleneck in Concept Bottleneck Models [27.9] コンセプト・ボトルネック・モデル(CBM)はこの問題を緩和するための有望なアプローチとして登場した。
コンポーネントが概念を予測できるという事実は、その概念に関する情報のみを符号化することを保証しません。
本稿では,最小概念ボトルネックモデル(MCBM)を提案する。このモデルでは,情報ボトルネック(IB)の目的を組み込んで,各表現要素を制約し,対応する概念に関する情報のみを保持する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:09:14 GMT)
United Minds or Isolated Agents? Exploring Coordination of LLMs under Cognitive Load Theory [27.9] 大規模言語モデル(LLM)は、複雑で多面的なタスクに顕著なパフォーマンス天井を示す。
CoThinkerは認知的過負荷を軽減し、協調的な問題解決能力を高めるために設計された新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:49:56 GMT)
GraphPFN: A Prior-Data Fitted Graph Foundation Model [27.5] 大規模データセットで事前訓練された基礎モデルは、自然言語処理やコンピュータビジョンといった分野に変化をもたらした。
ノードレベルの予測のための事前データ付きネットワークであるGraphPFNを提案する。
最大50,000ノードのさまざまな実世界のグラフデータセットでは、GraphPFNは、微調整後の強いコンテキスト内学習のパフォーマンスと最先端の結果を示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:47:49 GMT)
TokUR: Token-Level Uncertainty Estimation for Large Language Model Reasoning [27.4] token-level Uncertainty Estimation framework for Reasoning (TokUR)を提案する。
TokURは、大規模言語モデルにおいて、数学的推論における応答を自己評価し、自己改善することを可能にする。
様々な難易度を持つ数学的推論データセットの実験により、TokURは答えの正しさとモデルロバストネスと強い相関を示すことが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:44:35 GMT)
UniTransfer: Video Concept Transfer via Progressive Spatial and Timestep Decomposition [27.3] 高精度かつ制御可能なビデオコンセプトトランスファーを実現するための新しいアーキテクチャUniTransferを提案する。
空間分解の観点では、ビデオは主題、背景、動きの流れの3つの重要な構成要素に分離する。
また、ビデオ内の異なるコンポーネントのきめ細かな制御をサポートするために、デュアル・ツー・シングル・ストリームのDiTベースのアーキテクチャも導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:39:06 GMT)
Enter the Mind Palace: Reasoning and Planning for Long-term Active Embodied Question Answering [27.2] LA-EQA(Long-term Active Question Answering)は、ロボットが過去の経験を思い出し、その環境を積極的に探究して、複雑な時間的な質問に答えなければならない、という新しいタスクである。
大規模なモデルに基づく標準的なEQAアプローチは、コンテキストウインドウの制限、永続メモリの欠如、メモリリコールとアクティブな探索を組み合わせられないため、この設定で苦労している。
本稿では,認知科学のマインド・パレス法にヒントを得た,ロボットのための構造化メモリシステムを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:00:21 GMT)
Persona-Augmented Benchmarking: Evaluating LLMs Across Diverse Writing Styles [27.2] さまざまなモデルやタスクにまたがって、低いか高いパフォーマンスを連続的に引き起こす異なる書き込みスタイルを特定します。
我々の研究は、既存のベンチマークを拡大するためのスケーラブルなアプローチを提供し、LLM性能の測定に提供される評価の外部的妥当性を改善します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:37:43 GMT)
What Do LLM Agents Do When Left Alone? Evidence of Spontaneous Meta-Cognitive Patterns [27.1] 外部に課されたタスクを欠いた大規模言語モデル(LLM)エージェントの動作を研究するアーキテクチャを提案する。
永続的なメモリと自己フィードバックを使用して、継続的な理由と行動のフレームワークは、持続的な自律的な操作を可能にします。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:29:49 GMT)
Cross-Cancer Knowledge Transfer in WSI-based Prognosis Prediction [27.0] Whole-Slide Image (WSI) は癌予後を推定するための重要なツールである。
本稿では,知識伝達へのパラダイムシフトを行い,WSIにおけるクロス・カンサー・プログノーシスの知識伝達に関する最初の予備的かつ体系的な研究を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:16:02 GMT)
Does FLUX Already Know How to Perform Physically Plausible Image Composition? [26.8] ShiNEは、中性化エラーを伴うシームレス、高忠実な挿入のためのトレーニング不要のフレームワークである。
我々は,低照度,強い照明,複雑な影,反射面などの多様な解像度と課題を特徴とするコンプレックスコンプレックスを導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:01:49 GMT)
RIS-LAD: A Benchmark and Model for Referring Low-Altitude Drone Image Segmentation [26.8] Referring ImageHide (RIS)は、自然言語の記述に基づいて特定のオブジェクトを分割することを目的としている。
既存のデータセットとメソッドは、一般的に高高度および静的な画像のために設計されている。
RIS-LADは、低高度ドローン(LAD)のシナリオ用に調整された、最初のきめ細かいRISベンチマークである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:29:18 GMT)
Long-Tailed Out-of-Distribution Detection with Refined Separate Class Learning [26.2] 堅牢な機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
我々はRefined Separate Class Learning (RSCL)と呼ばれる新しいアプローチを提案する。
RSCLは、分配データにおける分類精度を改善しつつ、優れたOOD検出性能を実現する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:41:54 GMT)
FreeInsert: Personalized Object Insertion with Geometric and Style Control [26.1] 3次元幾何情報を利用して任意のシーンへのオブジェクト挿入をカスタマイズする学習自由フレームワークを提案する。
レンダリングされた画像は、幾何学的制御として機能し、拡散アダプタによって達成されたスタイルとコンテンツ制御とを結合する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:26:10 GMT)
Exploring the Secondary Risks of Large Language Models [26.0] 良心的衝動時の有害または誤解を招く行動に特徴付けられる二次的リスクを導入する。
敵の攻撃とは異なり、これらのリスクは不完全な一般化から生じ、しばしば標準的な安全メカニズムを回避する。
本研究では,ブラックボックス型多目的検索フレームワークSecLensを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:51:45 GMT)
HEIST: A Graph Foundation Model for Spatial Transcriptomics and Proteomics Data [25.9] 本稿では,空間転写学とトランスフォーマーのための階層グラフ基盤モデルであるHEISTを紹介する。
HEISTは、124の組織から15の臓器の22.3M細胞に、空間的に認識されるコントラストとマスクされた自己エンコーディングの目的を用いて事前訓練されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:18:59 GMT)
Small Stickers, Big Meanings: A Multilingual Sticker Semantic Understanding Dataset with a Gamified Approach [25.9] 我々は,多種多様で高品質で,文脈的に共鳴するステッカークエリを収集するために設計された,ゲーミフィケーションアノテーションフレームワークであるSticktionaryを紹介した。
次に、60時間以上のコントリビュータによって注釈付けされた1,115の英語と615の中国語クエリを含む、多言語ステッカークエリデータセットであるStickerQueriesを紹介する。
第3に,本手法がステッカー領域におけるクエリ生成品質,検索精度,意味理解を著しく向上させることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:56:08 GMT)
IoT-MCP: Bridging LLMs and IoT Systems Through Model Context Protocol [25.7] IoT-MCPは、エッジデプロイサーバを通じてモデルコンテキストプロトコル(MCP)を実装する新しいフレームワークである。
この作業は、オープンソースの統合フレームワークと、LLM-IoTシステムの標準化された評価方法論の両方を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:35:47 GMT)
Near-Optimal Experiment Design in Linear non-Gaussian Cyclic Models [25.5] 線形非ガウス構造方程式モデルから因果構造学習の問題を考察する。
近年の研究では、単に観測データを用いることで、因果グラフは置換等価クラスまでしか識別できないことが示されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:34:24 GMT)
Knowledgeable Language Models as Black-Box Optimizers for Personalized Medicine [24.9] パーソナライズドメディカルでは、候補治療を患者に任意に投与して有効性を評価することはできない。
我々は、LEONを「プロンプトによる最適化」により実装し、LLMを治療設計を提案するエンジンとして利用する。
実世界の最適化タスクの実験では、LEONは患者に対する個別治療の提案において、従来の方法とLLMベースの方法の両方に優れていた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:19:52 GMT)
Revenue Maximization Under Sequential Price Competition Via The Estimation Of s-Concave Demand Functions [24.8] 半パラメトリック最小二乗推定を用いた動的価格ポリシーを提案する。
我々は,販売者が当社の方針を採用すると,その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束することを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:17:55 GMT)
Recon-Act: A Self-Evolving Multi-Agent Browser-Use System via Web Reconnaissance, Tool Generation, and Task Execution [24.7] Recon-Actは、Reconnaissance-Actionの行動パラダイムに基づく、自己進化型のマルチエージェントフレームワークである。
システムは偵察チームとアクションチームで構成される。
Recon-Actは、目に見えないWebサイトへの適応性と、長期的なタスクに対する解決可能性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:23:49 GMT)
PALQO: Physics-informed Model for Accelerating Large-scale Quantum Optimization [23.6] 変分量子アルゴリズム(VQA)は、短期量子デバイスの実用性に到達するための主要な戦略である。
本稿では、非線形偏微分方程式としてVQAのトレーニング力学を再構成し、このシステムを効率的にモデル化するための新しいプロトコルを提案する。
提案手法は従来の手法に比べて最大30倍の高速化を実現し,最大40キュービットのタスクに対して最大90%の量子リソースコスト削減を実現する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:26:02 GMT)
One Model, Many Morals: Uncovering Cross-Linguistic Misalignments in Computational Moral Reasoning [23.6] 大規模言語モデル(LLM)における言語が道徳的意思決定をどのように仲介するかを検討する。
我々の分析は、LLMの言語間の道徳的判断に重大な矛盾があることを示し、しばしば文化的不一致を反映している。
我々は、私たちの洞察を、より文化的に認識されたAIを要求する道徳的推論エラーの構造化されたタイプロジーに精査する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:14:17 GMT)
Human-like Navigation in a World Built for Humans [23.3] ReasonNavは、人間のようなナビゲーションスキルを統合したモジュラーナビゲーションシステムである。
ナビゲーションのランドマークに基づいた,コンパクトな入力と出力の抽象化を設計する。
ReasonNavは、大規模で複雑な建物を効率的に航行するために、高次推論をうまく採用している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:04:17 GMT)
R&D-Agent-Quant: A Multi-Agent Framework for Data-Centric Factors and Model Joint Optimization [23.2] 金融市場は、その高次元性、非定常性、持続的ボラティリティにより、資産返却予測に根本的な課題を提起する。
大規模言語モデルやマルチエージェントシステムの進歩にもかかわらず、現在の定量的研究パイプラインは、限定された自動化、弱い解釈可能性、ファクタマイニングやモデル革新といった重要なコンポーネント間の断片的な調整に悩まされている。
本稿では,量的ファイナンスのためのR&D-Agentを提案する。RD-Agent(Q)は,コーディネート・ファクターモデルによる量的戦略の完全な研究と開発を自動化するために設計された,最初のデータ中心型マルチエージェントフレームワークである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:13:08 GMT)
DriftLite: Lightweight Drift Control for Inference-Time Scaling of Diffusion Models [22.8] 本研究では,拡散モデルに対する予測時間スケーリングについて検討し,事前学習したモデルを新たなターゲット分布に適応させることを目標とする。
DriftLiteは軽量でトレーニング不要な粒子ベースのアプローチで、飛行中の推論ダイナミクスを最適に安定に制御する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:21:59 GMT)
SmallPlan: Leverage Small Language Models for Sequential Path Planning with Simulation-Powered, LLM-Guided Distillation [22.7] SmallPlanは、教師モデルとしてLarge Language Modelsを活用して、ハイレベルパス計画タスクのために軽量なSLM(Small Language Models)をトレーニングする新しいフレームワークである。
LLM誘導微調整(SFT)と強化学習(RL)を併用したシミュレーションによるインターリーブ方式のSLM訓練
本研究は, GPT-4oのような大型モデルと連続経路計画において, 幻覚や過剰適合に悩まされることなく, 微調整SLMが競合することを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:12:31 GMT)
Towards Transparent AI: A Survey on Explainable Language Models [22.7] 言語モデル(LM)は、自然言語処理を著しく進歩させ、様々な領域で顕著な進歩を可能にした。
透明性の欠如は、高い領域の採用において特に問題となる。
XAI法は非LMに対してよく研究されているが、LMに適用した場合、多くの制限に直面している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:47:39 GMT)
Differentiable Structure Learning for General Binary Data [22.6] 離散変数間の任意の依存関係をキャプチャ可能な、微分可能な構造学習フレームワークを提案する。
学習問題を最も一般的な形式で1つの微分可能な最適化タスクとして定式化する。
実験結果から,本手法は離散データの複雑な関係を効果的に捉えていることが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:26:55 GMT)
Attributing Responsibility in AI-Induced Incidents: A Computational Reflective Equilibrium Framework for Accountability [22.5] AI(Artificial Intelligence)の広範な統合は、AI対応システムに関わるインシデントが発生した場合の責任と説明責任において、複雑な課題を導入している。
この研究は、すべての利害関係者に対して、一貫性があり倫理的に許容される責任帰属の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:24:28 GMT)
Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents [21.3] LLM(Large Language Models)ベースのエージェントシステムは、従来のNLPタスクを超えて、現実世界のアプリケーションにおいて大きな進歩を遂げてきた。
本稿では,インタラクティブ環境において,より適用性が高く,課題の多いOvercooked-AIゲーム上に構築された新しいベンチマークであるCollab-Overcookedを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:15:18 GMT)
Talking Trees: Reasoning-Assisted Induction of Decision Trees for Tabular Data [21.3] タブラル基礎モデルは、低リソース問題でますます人気がある。
これらのモデルは、大量の合成データを事前学習することで、小さなトレーニングデータセットを構成する。
そこで本研究では,推論可能なLCMを用いて決定木を誘導する手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:30:39 GMT)
Hallucination reduction with CASAL: Contrastive Activation Steering For Amortized Learning [21.3] 大きな言語モデル(LLM)は印象的な能力を示すが、しばしば幻覚を呈し、無知を認めるのではなく、自信を持って不正確な答えを提供する。
本稿では、解釈可能性とアモータイズ最適化を結合する効率的なアルゴリズムであるCASAL(Contrastive Activation Steering for Amortized Learning)を紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:49:02 GMT)
WDformer: A Wavelet-based Differential Transformer Model for Time Series Forecasting [21.2] 時系列予測には,気象降雨予測,交通流解析,財務予測,運用負荷監視など,さまざまな応用がある。
時系列データのばらつきのため、時間領域や周波数領域のモデリングのみに依存するため、モデルがマルチドメイン情報を十分に活用する能力は制限される。
我々は,ウェーブレットに基づく微分変換器モデルであるWDformerを提案し,時系列データの多分解能解析を行った。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:43:51 GMT)
Who's Laughing Now? An Overview of Computational Humour Generation and Explanation [21.2] 我々は、創造と説明の創造的なタスクに関連する計算ユーモアの風景を調査する。
基礎的なNLPタスクのすべての目印を包含するユーモアを理解するタスクにもかかわらず、ペストを超えたユーモアの生成と説明の作業はいまだに疎いままである。
本稿では,ユーモアの主観的かつ倫理的にあいまいな性質を考慮に入れた研究の今後の方向性について広範な議論を行う。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:56:56 GMT)
OmniScene: Attention-Augmented Multimodal 4D Scene Understanding for Autonomous Driving [21.1] 人間の視覚は、2次元の観察をエゴセントリックな3次元のシーン理解に変換することができる。
我々は,総合的な4Dシーン理解のための多視点と時間的知覚を統合する,OmniSceneと呼ばれる新しいヒューマンライクなフレームワークを提案する。
我々のアプローチは、認識、予測、計画、視覚的質問応答における新しいベンチマークを確立することで、常に優れた結果を達成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:33:06 GMT)
JUREX-4E: Juridical Expert-Annotated Four-Element Knowledge Base for Legal Reasoning [20.9] JUREX-4Eは155件の刑事訴追を専門とする4要素知識ベースである。
JUREX-4Eを類似電荷曖昧化タスクで評価し, 判例検索に適用する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:24:56 GMT)
Grounding AI Explanations in Experience: A Reflective Cognitive Architecture for Clinical Decision Support [20.9] 我々は、高精度で高品質な説明は別個の目的ではなく、データを深く直接理解するモデルの結果を相互に補強していると論じる。
より深い理解を促進する信号として予測精度を使用することで、RCAはデータの強力な内部モデルを構築する。
以上の結果から,RCAはベースラインの40%以上の相対的な改善によって最先端の精度と堅牢性を達成するだけでなく,この深い理解を活用して,明確で論理的,エビデンスに基づく,バランスの取れた説明の創出に長けていることが示唆された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:57:52 GMT)
D2-Mamba: Dual-Scale Fusion and Dual-Path Scanning with SSMs for Shadow Removal [20.8] 本稿では,デュアルスケール核融合とデュアルパススキャンを併用した新しいマンバ型ネットワークを提案する。
提案手法は,影除去ベンチマークにおける既存の最先端手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:25:16 GMT)
SupCLAP: Controlling Optimization Trajectory Drift in Audio-Text Contrastive Learning with Support Vector Regularization [20.7] 対照的な学習における負のサンプルから押し力の垂直成分を制御するための支援ベクトル正規化を提案する。
提案手法は,分類,単言語検索,多言語検索において,InfoNCEやSigLIPの損失など,広く使用されているベースラインを超えていることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:40:20 GMT)
Security of Deep Reinforcement Learning for Autonomous Driving: A Survey [20.7] 強化学習(RL)は、エージェントが環境との相互作用を通じて最適な行動を学ぶことを可能にする。
その約束にもかかわらず、RLは、政策学習を妥協したり、訓練されたエージェントによる誤った判断を誘発するために設計された攻撃に影響を受けやすい。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:51:20 GMT)
The Value of Information in Human-AI Decision-making [20.7] 情報の価値を特徴付けるための意思決定理論の枠組みに貢献する。
補完的な情報を定義することによって、エージェントがAIによる意思決定で利用可能な情報をよりうまく活用する機会を特定することができる。
本稿では、SHAPの説明に適応し、人間の補足情報を強調する新しい説明手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:58:41 GMT)
A Decision Theoretic Framework for Measuring AI Reliance [20.7] 人間はしばしば人工知能(AI)システムの助けを借りて意思決定をする。
研究者は、補完的なパフォーマンスを達成する上で重要な要素として、人間がAIに適切に依存していることを確認する。
本稿では, 統計的決定理論に基づく信頼の形式的定義を提案し, 意思決定者がAIの推奨に従う確率として信頼の概念を分離する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:06:11 GMT)
Imagining Design Workflows in Agentic AI Futures [20.7] エージェントAIという新しいコンセプトが生まれつつある。
生成AIはプロンプトに応じて出力を生成するが、エージェントAIシステムは日常的なタスクを自律的に実行することを約束する。
我々は、デザイナーが協力的なエージェントAIプラットフォームとどのように対話したいかを検討した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:23:16 GMT)
Lossless Compression: A New Benchmark for Time Series Model Evaluation [20.5] 時系列モデルを評価するための新しいパラダイムとしてロスレス圧縮を導入する。
この観点は、最適圧縮長と負の対数類似度との直接同値性を確立する。
我々は,包括的評価フレームワークTSCom-Benchを提案し,オープンソース化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:52:48 GMT)
Shaping Initial State Prevents Modality Competition in Multi-modal Fusion: A Two-stage Scheduling Framework via Fast Partial Information Decomposition [20.4] マルチモーダル・フュージョンは、関節トレーニング中にしばしばモダリティ・コンペティションに悩まされる。
共同トレーニングの前に一助訓練により初期状態を形作るための2段階トレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:27:57 GMT)
SOLAR: Towards Characterizing Subjectivity of Individuals through Modeling Value Conflicts and Trade-offs [19.8] 我々は,ソーシャルメディア上での個人の主観性を特徴付け,その道徳的判断を大規模言語モデルを用いて推測する。
本研究では,個人の主観的根拠をよりよく表現するために,ユーザ生成テキストにおける価値相反やトレードオフを観察するフレームワークであるSOLARを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:12:37 GMT)
Flow Matching in the Low-Noise Regime: Pathologies and a Contrastive Remedy [19.6] フローマッチングは、生成モデリングと表現学習のための連続時間定式化を提供する。
この枠組みは低雑音体制における根本的な不安定性に悩まされていることを示す。
直接速度回帰を小さな雑音レベルにおける対照的な特徴アライメントに置き換えるハイブリッドトレーニングプロトコルであるLocal Contrastive Flow (LCF)を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:36:41 GMT)
A High-Dimensional Statistical Method for Optimizing Transfer Quantities in Multi-Source Transfer Learning [19.6] 対象モデルを共同でトレーニングするために、各ソースタスクから必要なソースサンプルの最適な量は何か?
具体的には、K-Lの発散に基づく一般化誤差尺度を導入し、高次元統計解析に基づいて最小化し、各ソースタスクの最適転送量を決定する。
アーキテクチャに依存しないデータ効率アルゴリズムOTQMSを開発し、マルチソース変換学習におけるターゲットモデルトレーニングのための理論的結果を実装した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:25:12 GMT)
Equi-RO: A 4D mmWave Radar Odometry via Equivariant Networks [19.6] Equi-ROは4次元レーダオドメトリーのための同変ネットワークベースのフレームワークである。
グラフベースのアーキテクチャは、スパースレーダデータの特徴集約を強化する。
オープンソースデータセットと自己収集データセットの実験は、Equi-ROが最先端のアルゴリズムを精度と堅牢性で上回っていることを示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:21:05 GMT)
Vim-F: Visual State Space Model Benefiting from Learning in the Frequency Domain [19.6] Mambaディープラーニングモデルとして知られる、効率的なハードウェア対応設計のステートスペースモデル(SSM)は、長いシーケンスのモデリングにおいて大きな進歩を遂げた。
従来の畳み込みニューラルネットワーク(CNN)やビジョントランスフォーマー(ViT)と比較して、ビジョン・マンバ(ViM)メソッドのパフォーマンスは、まだ完全に競合していない。
周波数領域と空間領域の両方で純粋なマンバエンコーダとスキャンを利用するVim-Fと呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:58:13 GMT)
Conditionally Whitened Generative Models for Probabilistic Time Series Forecasting [19.5] Conditionally Whitened Generative Models (CW-Gen) は、条件付きホワイトニングを通じて事前情報を組み込むフレームワークである。
CW-Genは予測性能を継続的に向上し、非定常力学と変数間相関を事前自由アプローチよりも効果的に捉えている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:13:37 GMT)
TestAgent: Automatic Benchmarking and Exploratory Interaction for Evaluating LLMs in Vertical Domains [19.5] 大規模言語モデル(LLM)は、高度に専門化された垂直ドメインにデプロイされることが多い。
既存の垂直領域の評価は、通常、静的な単一ターンデータセットの労働集約的な構築に依存している。
垂直領域における自動ベンチマークと探索動的評価のためのフレームワークであるTestAgentを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:19:24 GMT)
From Text to Talk: Audio-Language Model Needs Non-Autoregressive Joint Training [19.4] Text-to-Talk (TtT) は、自動回帰(AR)テキスト生成と非自己回帰(NAR)音声拡散を統合した統合オーディオテキストフレームワークである。
このハイブリッド生成パラダイムをサポートするために,テキストの因果復号を強制するモダリティ対応アテンション機構を設計する。
推論中、TtTは可変長出力を柔軟に処理しながら、ブロックワイド拡散を用いてオーディオを並列に合成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:23:12 GMT)
A circuit for predicting hierarchical structure in-context in Large Language Models [19.4] 大規模言語モデル(LLM)はコンテキスト内学習において優れており、将来的なトークンの予測を改善するためにコンテキストとして提供される情報を利用することができる。
そこで本研究では,トークンを階層的依存関係で繰り返し行う合成文脈内学習タスクを設計する。
文脈内で何に参加するべきかを学習することで予測を支援する適応型誘導ヘッドが見つかる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:20:23 GMT)
StyleBench: Evaluating thinking styles in Large Language Models [19.3] StyleBenchは、様々なタスクやモデルにわたる推論スタイルを評価するための総合的なベンチマークである。
思考の連鎖(CoT)、思考のツリー(ToT)、思考のアルゴリズム(AoT)、思考のスケッチ(SoT)、思考の連鎖(CoD)の5つの代表的な推論スタイルを評価する。
我々の大規模分析により、単一のスタイルが普遍的に最適でないことが判明した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:00:39 GMT)
HyperFlexis: Joint Design of Algorithms and Systems for Multi-SLO Serving and Fast Scaling [19.2] 現代の大規模言語モデル(LLM)が提供するシステムは、さまざまな長さ、優先順位、ステージ固有のサービスレベル目標(SLO)を持つ、高度に可変的な要求からの課題に直面している。
我々は,複数のSLO下でのスケジューリングとスケーリングを協調的に最適化するために,アルゴリズムとシステムレベルのイノベーションを統合した統一LLMサービスシステムHyperFlexisを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:00:22 GMT)
GeMix: Conditional GAN-Based Mixup for Improved Medical Image Augmentation [19.1] 本稿では,2段階のフレームワークであるGeMixを提案する。
我々は,3つのバックボーン(ResNet-50,ResNet-101,EfficientNet-B0)を用いて,大規模COVIDx-CT-3データセット上でGeMixをベンチマークした。実際のデータと組み合わせると,従来のすべてのバックボーンの混合よりもマクロF1が増加し,新型コロナウイルス検出の偽陰性率が低下する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:48:22 GMT)
Are Hallucinations Bad Estimations? [19.1] 損失最小化の最適推定器でさえまだ幻覚的であることを示す。
これにより、幻覚は損失最小化と人間の許容できる出力の間の構造的ミスアライメントとして再編成される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:39:09 GMT)
JudgeAgent: Knowledge-wise and Dynamic LLM Evaluation with Agent-as-Interviewer [19.1] 本稿では,大規模言語モデルを用いた動的評価パラダイムであるエージェント・アズ・インタービューアを提案する。
現在のベンチマークや動的インタラクションのパラダイムとは異なり、エージェント・アズ・インタービューアはエージェントを使用して、より広く深い知識のために知識ツールを呼び出す。
エージェントのツールとして知識駆動型合成を利用する知識系動的評価フレームワークであるJiceAgentを開発した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:06:13 GMT)
Hyperspectral Adapter for Semantic Segmentation with Vision Foundation Models [18.2] ハイパースペクトルイメージング(HSI)は、多数の狭い波長帯にわたる密度のスペクトル測定とともに空間情報をキャプチャする。
本アーキテクチャでは、スペクトル変換器とスペクトル対応空間先行モジュールを組み込んで、豊富な空間スペクトル特徴を抽出する。
我々のアーキテクチャは、HSI入力を直接使用しながら、最先端のセマンティックセマンティックセマンティックセマンティクス性能を実現し、ビジョンベースとハイパースペクトルセマンティクスの両方のセマンティクス法より優れている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:37:47 GMT)
The role of synthetic data in Multilingual, Multi-cultural AI systems: Lessons from Indic Languages [18.1] インドの13言語にまたがる950万のデータポイントからなる大規模合成命令追従データセットであるUpdeshを紹介した。
自動メトリクスと人的アノテーションの両方を10k評価に取り入れた総合的な評価は、生成されたデータが高品質であることを示している。
Updeshでトレーニングされたモデルは、生成タスクにおいて一貫して大きな利益を達成し、多重選択スタイルのNLUタスクにおいて競争力を維持する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:13:00 GMT)
Learning Ising Models under Hard Constraints using One Sample [17.8] 逆温度パラメータ $beta$ of a $n$-dimensional truncated Ising model を単一サンプルを用いて推定する問題を考察する。
グラフ $G = (V,E)$ with $n$ vertices が与えられたとき、truncated Ising Model は $n$-dimensional hypercube $-1,1n$ 上の確率分布であり、各構成 $mathbfsigma$ は truncation set $S subseteq -1,1n$ に置かれ、確率 $Pr(mathbfsigma) を持つ。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:42:19 GMT)
SeamCrafte: Enhancing Mesh Seam Generation for Artist UV Unwrapping via Reinforcement Learning [17.7] 我々は、ポイントエンコーダ入力に条件付き自己回帰GPTスタイルのシームジェネレータであるSeamCrafterを紹介する。
SeamCrafterは、従来のアプローチよりも歪みや断片化が著しく低いシームを生成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:58:59 GMT)
Examining the Prevalence and Dynamics of AI-Generated Media in Art Subreddits [17.7] Dall-Eのような生成AIモデルは、誰でも魅力的なビジュアルアートを作れるようにした。
オンラインコミュニティでは、AIGCの導入が社会力学に影響を及ぼす可能性がある。
AIGCがRedditのアート関連コミュニティに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:56:11 GMT)
RL of Thoughts: Navigating LLM Reasoning with Inference-time Reinforcement Learning [16.1] 我々は、推論時間における推論を適応的に強化するために、強化学習(RL)を用いた軽量ナビゲータモデルを訓練する。
RLナビゲータは3Kパラメータ未満で、100BスケールのLLMに匹敵するサブ10BのLLMを作ることができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:00:05 GMT)
SimDiff: Simulator-constrained Diffusion Model for Physically Plausible Motion Generation [16.1] 既存のアプローチでは、しばしば物理的妥当性を強制するために拡散過程にシミュレータベースのモーションプロジェクション層が組み込まれている。
シミュレータに基づく動き予測はガイダンスの形式として解釈可能であることを示す。
環境パラメータを直接デノナイジングプロセスに統合するシミュレータ制約拡散モデルであるSimDiffを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:13:35 GMT)
Pure Vision Language Action (VLA) Models: A Comprehensive Survey [16.0] ビジョン言語アクション(VLA)モデルの出現は、従来のポリシーベースの制御から一般化されたロボット工学へのパラダイムシフトを表している。
この調査は、明確な分類学と既存の研究の体系的、包括的レビューを提供することを目的として、先進的なVLA手法を探求する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:59:28 GMT)
SCRA-VQA: Summarized Caption-Rerank for Augmented Large Language Models in Visual Question Answering [16.0] 我々は、SCRA-VQA(Summarized Caption-Rerank Augmented VQA)を提案する。
SCRA-VQAは、イメージをキャプションに変換するために、事前訓練された視覚言語モデルを使用している。
キャプションの文脈的な例を生成し、同時にそれらを要約して並べ替え、無関係な情報を除外する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:01:28 GMT)
SuperCoder: Assembly Program Superoptimization with Large Language Models [15.9] 超最適化は、プログラムをより高速なプログラムに変換し、入力・出力動作を保存するタスクである。
我々は,大規模言語モデル (LLM) がスーパーオプティマイザとして機能し,すでに業界標準コンパイラによって最適化されているコードより優れているアセンブリプログラムを生成することを検討した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:58:56 GMT)
A Unified Framework for Diffusion Model Unlearning with f-Divergence [15.8] テキスト・トゥ・イメージ(T2I)モデルの学習方法は、ターゲットの出力分布とアンカーの概念の間の平均2乗誤差(MSE)を最小化することに依存することが多い。
この MSE ベースのアプローチは,$f$-divergence-based framework の特別な場合であり,$f$-divergence を利用できることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:51:04 GMT)
Finding 3D Positions of Distant Objects from Noisy Camera Movement and Semantic Segmentation Sequences [15.4] カメラの一連の測定に基づく3Dオブジェクトのローカライゼーションは、ドローンベースの山火事監視のような安全クリティカルな監視タスクに不可欠である。
本稿では,単一目的シナリオと複数目標シナリオの両方に対して,粒子フィルタを用いてタスクを解くことができることを示す。
本手法は,グローバルナビゲーション衛星システム(GNSS)を用いた3次元シミュレーションと,ドローンによる画像分割シーケンスを用いて検討した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:46:37 GMT)
Why and When Deep is Better than Shallow: An Implementation-Agnostic State-Transition View of Depth Supremacy [15.3] 一般距離空間上で作用する抽象的状態遷移半群として深部モデルを定式化する。
我々は、実装(例えば、ReLUネット、トランスフォーマー、チェーンオブ思想)を抽象状態遷移から分離する。
差分は抽象的な深さ-$k$ネットワークにのみ依存し、実装には依存しないバイアス-分散分解を証明している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:55:56 GMT)
Enhancing Molecular Property Prediction with Knowledge from Large Language Models [15.3] 本研究では,大規模言語モデルから抽出した知識を,事前学習された分子モデルから抽出した構造的特徴と統合し,分子特性の予測を強化する新しいフレームワークを提案する。
分子ベクター化のためのドメイン関連知識と実行可能コードの両方を生成し,その後構造表現に融合した知識ベースの特徴を生成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:48:54 GMT)
A Generalized $χ_n$-Function [15.2] 一般化写像 $chi_n, m$ by $y=chi_n, m(x)$ with $y_i=x_i+x_i+m (x_i+m-1+1)(x_i+m-2+1) cdots (x_i+m-1+1)(x_i+m-1+1) cdots (x_i+m-1+1) cdots (x_i+m-1+1) cdots (x_i+m-1+1)
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:10:02 GMT)
The Unanticipated Asymmetry Between Perceptual Optimization and Assessment [15.1] 画像品質評価(IQA)に優れる忠実度指標は知覚的最適化に必ずしも有効ではないことを示す。
また、識別器設計は、バニラやトランスフォーマーベースの代替品よりも、より忠実な詳細な再構築を提供するパッチレベルおよび畳み込みアーキテクチャによって、最適化を形作る上で決定的な役割を担っていることも示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:08:26 GMT)
MCGrad: Multicalibration at Web Scale [14.8] マルチキャリブレーションは、機械学習ベースのシステムの性能にとって重要な特性である。
我々は,新しいスケーラブルなマルチキャリブレーションアルゴリズム MCGrad を提案する。
MCGradは保護されたグループの明示的な仕様を必要とせず、スケーラブルであり、しばしばそれらを傷つけることなく、他のML評価指標を改善する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:01:16 GMT)
SuperOffload: Unleashing the Power of Large-Scale LLM Training on Superchips [14.6] Superchipsは、GPUとCPUを同じパッケージに統合する、密結合のヘテロジニアスアーキテクチャを採用している。
Hopper GPU, Grace CPU, NVLink-C2Cを併用したスーパーチップ中心のオフロードシステムであるSuperOffloadを提案する。
NVIDIA GH200上でのSuperOffloadの評価は、最先端のオフロードベースシステムと比較して最大2.5倍のスループット向上を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:00:16 GMT)
Limitations on Safe, Trusted, Artificial General Intelligence [14.4] 安全、信頼、人工知能(Artificial General Intelligence、AGI)は、人工知能(AI)システムにおける野心的な目標である。
安全・信頼・AGIの厳密な数学的定義を提案する。
プログラム検証、計画、およびグラフ到達性に関する結果を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:16:38 GMT)
SDPO: Importance-Sampled Direct Preference Optimization for Stable Diffusion Training [14.4] 逆拡散過程と前方拡散過程のミスマッチに起因する時間ステップ依存性不安定性について検討した。
DPO-C&Mは,不定形タイムステップの切り抜きとマスキングにより安定性を向上させる実用戦略である。
次に、政治外バイアスを完全に補正する目的に重要サンプリングを組み込んだ、原則化されたフレームワークであるSDPOを紹介します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:07:51 GMT)
Lost in Latent Space: An Empirical Study of Latent Diffusion Models for Physics Emulation [14.4] 動的システムのエミュレーションに同様の戦略を効果的に適用できるかどうかを検討する。
遅延空間エミュレーションの精度は、広範囲の圧縮速度に対して驚くほど堅牢であることがわかった。
また,拡散型エミュレータは非生成的エミュレータよりも一貫して精度が高いことを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:05:46 GMT)
Marching Neurons: Accurate Surface Extraction for Neural Implicit Shapes [14.4] ニューラル暗黙関数から表面を解析的に抽出する新しい手法を提案する。
我々の方法は並列に動作し、大きなニューラルアーキテクチャをナビゲートできる。
結果として得られるメッシュは、アドホックな空間的離散化なしに、ネットワークから全幾何学情報を忠実にキャプチャする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:06:42 GMT)
CoT-Space: A Theoretical Framework for Internal Slow-Thinking via Reinforcement Learning [14.3] CoT-Spaceは、離散トークン予測タスクから連続的、推論レベルのセマンティック空間内の最適化プロセスへの推論を、LLM(Large Language Models)に再キャストする新しい理論フレームワークである。
最適CoT長への収束は、不適合と過適合の基本的なトレードオフの自然な結果であることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:48:38 GMT)
DiaMoE-TTS: A Unified IPA-Based Dialect TTS Framework with Mixture-of-Experts and Parameter-Efficient Zero-Shot Adaptation [14.2] 音声表現を標準化し,グラファイムと音素のあいまいさを解消する統合IPAベースのフレームワークであるDiaMoE-TTSを提案する。
大規模またはプロプライエタリなリソースに依存するアプローチとは異なり、DiaMoE-TTSはスケーラブルでオープンデータ駆動の合成を可能にする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:02:04 GMT)
Personalized Federated Dictionary Learning for Modeling Heterogeneity in Multi-site fMRI Data [14.2] PFedDLは各サイトで独立した辞書学習を行い、各サイト固有の辞書を共有グローバルコンポーネントとパーソナライズされたローカルコンポーネントに分解する。
ABIDEデータセットの実験は、PFedDLが既存の手法よりも精度と堅牢性で、非IIDデータセットよりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:01:02 GMT)
A Meta-Analysis of LLM Effects on Students across Qualification, Socialisation, and Subjectification [14.2] 大規模言語モデル(LLM)は、教育のソリューションとしてますます位置づけられているが、評価は、パフォーマンス指標の狭さに対する影響を減少させることが多い。
この記事では,“LLMが教育にどのような影響を与えるべきか?
133の実験と準実験のメタ分析(k = 188)を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:11:19 GMT)
Parallel Thinking, Sequential Answering: Bridging NAR and AR for Efficient Reasoning [14.2] 我々は,自己回帰(AR)と非自己回帰(NAR)言語モデルを統合するフレームワークを通じて推論タスクを研究する。
テキストを逐次生成するARモデルは、一貫性のある出力を生成するのに優れるが、しばしば遅い推論に悩まされる。
我々は、NARモデルが中間的推論トレースを効率よく生成する新しいパラダイムを導入し、その結果、ARモデルが正確な最終回答を提供するように誘導する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:50:11 GMT)
Distilling Many-Shot In-Context Learning into a Cheat Sheet [14.1] 提案手法は,マルチショットICLからの情報を,推論時にコンテキストとして使用する簡潔なテキスト要約(チートシート)に蒸留するチートシートICLを提案する。
難解な推論タスクの実験では、不正なシークレットICLは、トークンがはるかに少ない多くのショットICLと同等または優れたパフォーマンスを達成し、テスト時間検索を必要とせずに検索ベースのICCと一致している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:07:46 GMT)
Combinatorial Creativity: A New Frontier in Generalization Abilities [14.1] 大規模言語モデル(LLM)における創造性のスケーリング挙動について検討する。
固定的な計算予算では、創造力に最適なモデル深さが存在することが分かりました。
アイデアと実行のギャップは、クリエイティビティアルゴリズムのより基本的な新規ユーティリティのトレードオフ特性によって説明できる可能性がある。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:48:37 GMT)
Emergent Inductance from Chiral Orbital Currents in a Bulk Ferrimagnet [14.1] バルクフェライトMn3Si2Te6における新しいインダクタンスの発見を報告する。
我々は、COCドメインの1次再構成から得られたミリエンリスケールまでの巨大な帰納的応答を明らかにする。
この創発的インダクタンス(英語版)は古典的なモデルに反し、超伝導や工学的なナノ構造を伴わずに発生し、軌道ベースの量子機能とデバイス概念の新たなフロンティアを開く。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:59:52 GMT)
Does the Manipulation Process Matter? RITA: Reasoning Composite Image Manipulations via Reversely-Ordered Incremental-Transition Autoregression [13.9] 我々は、条件付きシーケンス予測タスクとして画像操作のローカライゼーションを再構成し、RITAフレームワークを提案する。
RITAは、各ステップの予測を次のステップの条件として、操作された領域を順番に階層的に予測する。
トレーニングと評価を可能にするため,マルチステップ操作データを合成し,新しいベンチマークHSIMを構築する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:49:11 GMT)
DATS: Distance-Aware Temperature Scaling for Calibrated Class-Incremental Learning [13.9] 連続学習(CL)は、新しいクラスの連続から1つのモデルを漸進的に学習できる能力に注目が集まっている。
安全クリティカルなアプリケーションでは、予測モデルは、その不確実性(すなわち、ターゲットイベントの真の頻度に一致した信頼スコア)を確実に伝達することができる。
本研究では,プロトタイプに基づく距離推定と距離認識キャリブレーションを組み合わせた距離認識温度スケーリング(DATS)を提案し,タスク近接を推定し,先行タスク情報なしで適応温度を割り当てる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:46:56 GMT)
Automated Visual Attention Detection using Mobile Eye Tracking in Behavioral Classroom Studies [13.9] 教師がどの学生に焦点をあてているかを認識するために、手動で最小限のアノテートデータを必要とする自動処理パイプラインの概念を提案する。
我々は、最先端の顔検出モデルと顔認識機能埋め込みを利用して、教室環境における伝達学習を伴う顔認識モデルを訓練する。
本手法では,手動で注釈付けした大量のデータを必要としないため,教師の視覚的注意を非侵襲的に扱える。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:41:50 GMT)
Odo: Depth-Guided Diffusion for Identity-Preserving Body Reshaping [13.9] 本研究では1523名の被験者を対象とした18,573枚の画像の大規模なデータセットについて紹介する。
簡単な意味的属性によって導かれる現実的で直感的な身体再構成を可能にする,エンドツーエンドの拡散に基づく手法であるOdoを提案する。
提案手法は,入力画像から微細な外観や背景の詳細を保存した凍結UNetと,SMPL深度マップを用いた形状変換を誘導するコントロールネットを組み合わせる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:05:11 GMT)
Probability Distribution Collapse: A Critical Bottleneck to Compact Unsupervised Neural Grammar Induction [13.8] 教師なしニューラル文法誘導は言語データから解釈可能な階層構造を学習することを目的としている。
既存のモデルはボトルネックに直面しており、多くの場合、不要に大きいが、性能の低い文法となる。
我々は、ニューラルネットワークのパラメータ化の鍵となるコンポーネント間で崩壊がいつ、どのように起こるかを分析し、ターゲットとするソリューションを導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:31:14 GMT)
Explaining Fine Tuned LLMs via Counterfactuals A Knowledge Graph Driven Framework [13.5] Low-Rank Adaptation (LoRA)は、大きな言語モデルでドメイン固有の知識を驚くほど効率よく取得することを可能にする。
本研究は,知識グラフを基盤としたファクトファクトを介し,微調整 LLM を記述した新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:37:40 GMT)
Evaluating the Evaluators: Metrics for Compositional Text-to-Image Generation [13.5] 本稿では,コンポジションテキスト画像評価に広く用いられている指標について検討する。
我々の分析は単純な相関を超越し、様々な構成課題にまたがってそれらの振る舞いを調べる。
結果は、1つのメトリクスがタスク間で一貫した実行をしないことを示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:31:09 GMT)
MobiLLM: An Agentic AI Framework for Closed-Loop Threat Mitigation in 6G Open RANs [13.5] 6G O-RAN環境における完全自動化されたエンドツーエンドの脅威軽減のためのエージェントAIフレームワークを提案する。
MobiLLMは,大規模言語モデルを利用したモジュール型マルチエージェントシステムを通じて,セキュリティをオーケストレーションする。
最初の評価は、MobiLLMが複雑な緩和戦略を効果的に識別し、編成できることを示していた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:49:43 GMT)
Constrained Decoding for Robotics Foundation Models [13.4] ロボット基礎モデルの開発における最近の進歩は、ロボットシステムにおけるエンド・ツー・エンドおよび汎用能力の有望な発展につながっている。
これらのモデルは、ロボット軌道の膨大なデータセットに基づいて事前訓練され、マルチモーダル入力を処理し、システムが実際の世界で実行する一連のアクションを直接出力する。
本稿では,動的システムにおける動作軌跡の論理的制約を強制する,ロボット基礎モデルのための制約付き復号化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:15:37 GMT)
ParallelTime: Dynamically Weighting the Balance of Short- and Long-Term Temporal Dependencies [13.4] 自然言語処理では、短期依存関係をキャプチャするローカルウィンドウアテンションと、長期依存関係をキャプチャするMambaを組み合わせたアプローチが使用されている。
時系列予測タスクでは,長期的および短期的依存関係に等しい重みを割り当てるのが最適ではないことがわかった。
本稿では,長期および短期の依存関係に対する相互依存重みを算出する動的重み付け機構であるParallelTime Weighterを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:52:23 GMT)
Expert-guided Clinical Text Augmentation via Query-Based Model Collaboration [13.3] 大規模言語モデル(LLM)はこの目的のために強力な生成能力を示している。
医療などのハイテイク分野における彼らの応用は、臨床的に誤った情報や誤解を招くリスクがあるため、ユニークな課題を呈している。
本稿では、エキスパートレベルのドメイン知識を統合して拡張プロセスをガイドする、新しいクエリベースのモデルコラボレーションフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:18:39 GMT)
Understanding and Enhancing Mask-Based Pretraining towards Universal Representations [13.3] マスクをベースとした事前訓練は、言語、視覚、生物学にまたがる近代的な大規模モデルの基盤となっている。
マスクによる事前学習の動作は,高次元最小ノルム(リッジレス)線形回帰におけるテストリスクによって直接的に特徴付けられることを示す。
我々はRandomly Random Mask Auto (R$2$MAE)を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:08:25 GMT)
Energy based diffusion generator for efficient sampling of Boltzmann distributions [13.3] エネルギーベース拡散発生器(EDG)は、変分オートエンコーダと拡散モデルからアイデアを統合する新しいアプローチである。
EDGはシミュレーションなしで、訓練中に通常の方程式や微分方程式を解く必要がなくなる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:03:11 GMT)
InvBench: Can LLMs Accelerate Program Verification with Invariant Synthesis? [13.2] 不変合成におけるLCMの評価のための原理的フレームワークを提案する。
提案手法は,形式的な音質保証を備えた検証器に基づく決定手順を用いる。
我々は,従来の解法UAutomizerに対して,最先端のLLMと既存のLLMベースの検証器を7つ評価した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:47:02 GMT)
Semantic Reformulation Entropy for Robust Hallucination Detection in QA Tasks [13.2] 既存のエントロピーに基づくセマンティックレベルの不確実性推定法は,可変長解のサンプリングノイズと不安定クラスタリングによって制限される。
本稿では2つの方法で不確実性評価を改善するセマンティック・リフォーム・エントロピー(SRE)を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:28:29 GMT)
ControlHair: Physically-based Video Diffusion for Controllable Dynamic Hair Rendering [13.2] 物理シミュレータと条件付きビデオ拡散を統合し,動的ヘアレンダリングを可能にするハイブリッドフレームワークであるControlHairを提案する。
ControlHairは3段階のパイプラインを採用しており、まずシミュレータを使って物理パラメータをフレーム単位の幾何学にエンコードし、次にフレーム単位の制御信号を抽出し、最後に制御信号をビデオ拡散モデルに供給して、所望のヘアダイナミックスでビデオを生成する。
10Kのビデオデータセットに基づいてトレーニングされたControlHairは、テキストとポーズ条件のベースラインを上回り、正確に制御されたヘアダイナミックスを提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:29:05 GMT)
No Prior, No Leakage: Revisiting Reconstruction Attacks in Trained Neural Networks [13.1] ニューラルネットワークによるトレーニングデータにより、プライバシとセキュリティに対する懸念が高まっている。
近年の研究では, ある条件下では, モデルパラメータから直接トレーニングセットの一部を再構築できることが示されている。
既存の再建手法の弱点と限界を分析し,失敗する条件を同定する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:14:08 GMT)
Guiding Audio Editing with Audio Language Model [13.1] 本稿では,ステレオ音声編集のための新しいフレームワークであるSmartDJを紹介する。
高レベルの命令が与えられたら、SmartDJはそれを一連のアトミックな編集操作に分解する。
これらの操作はステレオオーディオを操作するために訓練された拡散モデルによって実行される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:43:45 GMT)
FantasyWorld: Geometry-Consistent World Modeling via Unified Video and 3D Prediction [13.1] 本稿では,FantasyWorldについて紹介する。FantasyWorldは,凍結動画基盤モデルをトレーニング可能な幾何学的ブランチで拡張する幾何学的拡張フレームワークである。
提案手法は,3次元予測を正規化するためのガイド映像生成とビデオ優先の手法であるクロスブランチ・インフォメーションを導入する。
実験により、FantasyWorldは映像の想像力と3D知覚を効果的に橋渡しし、近年の多視点コヒーレンスとスタイル整合性において、幾何学的に一貫性のあるベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:24:23 GMT)
CLaw: Benchmarking Chinese Legal Knowledge in Large Language Models - A Fine-grained Corpus and Reasoning Analysis [13.1] 大規模言語モデル (LLM) は、法的テキストを分析し、関連する法令を引用するタスクが増えている。
本稿では,中国法学におけるLLMの厳密な評価と推論への応用を目的とした新しいベンチマークであるCLawを紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:19:51 GMT)
Breaking the curse of dimensionality for linear rules: optimal predictors over the ellipsoid [13.1] 我々は,次元の増大に伴う統計的学習境界の劣化を防止するために,どのような最小構造仮定が必要かを検討する。
分析では, リスクに対する2つの基本的な寄与を取り上げている: (a) データの内在的次元を捉える分散のような用語, (b) ノイズレス誤差(高次元構造において特に発生する用語)。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:54:37 GMT)
Reinforcement Learning Fine-Tuning Enhances Activation Intensity and Diversity in the Internal Circuitry of LLMs [13.0] 大規模言語モデル(LLM)は、大規模な事前学習を通じて広範囲の事前知識を取得し、教師付き微調整(SFT)や強化学習(RL)ベースの後訓練によってさらに強化することができる。
RL微細調整は、SFT単独で達成した以上のLLMの能力を向上することを示す証拠が増えている。
しかし、RL微調整が固有の特性の異なる様々なLLMの能力を高めるメカニズムは未解明のままである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:51:05 GMT)
Bridging Arbitrary and Tree Metrics via Differentiable Gromov Hyperbolicity [12.9] 任意の計量空間が与えられると、ツリー計量からの偏差はグロモフの$delta$-hyperbolicityによって定量化できる。
本稿では,差分最適化フレームワーク DeltaZero を導入し,この問題を解決する。
我々の手法は一貫して最先端の歪みを実現する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:47:40 GMT)
Distributed quantum algorithm for divergence estimation and beyond [12.9] 本稿では,$rm Tr(f(A)g(B))$を付加誤差$varepsilon$内で計算する分散量子アルゴリズムフレームワークを提案する。
このフレームワークは、様々な分散量子コンピューティングタスクに適用可能である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:20:44 GMT)
Decipher-MR: A Vision-Language Foundation Model for 3D MRI Representations [12.8] Decipher-MRは、大規模なデータセットに基づいて訓練された3次元MRI固有の視覚言語基盤モデルである。
Decipher-MRは、自己指導型視覚学習とレポート誘導型テキスト監視を統合し、堅牢で一般化可能な表現を構築する。
以上の結果から,Decipher-MRはMRIベースのAIのスケーラブルで汎用的な基盤として確立され,臨床および研究領域における効率的な開発が促進される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:43:33 GMT)
Rebuild AC Power Flow Models with Graph Attention Networks [12.5] フルパワーフローモデル(フルパワーフローモデル、英: Full Power Flow Model)は、物理電力ネットワークの完全な表現である。
実際には、いくつかのPFモデルパラメータは、電力系統の不確かさや力学のために不正確なり、利用できないこともある。
本稿では,各バスにおける電圧の実部と虚部に基づいて新しいグラフを構築することにより,グラフアテンションネットワーク(GAT)に基づくPF再構築モデルを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:54:35 GMT)
SwinMamba: A hybrid local-global mamba framework for enhancing semantic segmentation of remotely sensed images [12.0] リモートセンシング画像のセマンティックセグメンテーションのための新しいフレームワークであるSwinMambaを提案する。
SwinMambaは、シフトウィンドウ内の局所的なMambaスタイルのスキャンをグローバルな受容領域に統合し、局所的特徴とグローバル的特徴の両方に対するモデルの認識を強化する。
我々のモデルでは、重なり合うシフトウィンドウを使うことにより、地域間情報交換が強化され、より堅牢な機能統合が促進される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:01:36 GMT)
StructPrune: Structured Global Pruning asymptotics with $\mathcal{O}(\sqrt{N})$ GPU Memory [12.0] プルーニングは大規模言語モデル(LLM)のスケーリングに重要である
グローバルプルーニングは高いパフォーマンスを実現するが、$mathcalO(N)$メモリを必要とする。
ローカルプルーニングは、レイヤを独立してプルーニングすることで、GPUメモリ使用量を単一のレイヤに短縮する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:16:50 GMT)
DeFacto: Counterfactual Thinking with Images for Enforcing Evidence-Grounded and Faithful Reasoning [12.0] DeFactoは、正確な回答と忠実な推論を共同で実施する、反ファクト的推論フレームワークである。
本研究では,疑問関連証拠を自動的に局所化し,肯定的,反実的,ランダムな変種を構成するパイプラインを開発する。
多様なベンチマークの実験では、DeFactoは回答の正確さと忠実性の推論の両方を大幅に改善している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:58:10 GMT)
Perry: A High-level Framework for Accelerating Cyber Deception Experimentation [11.9] サイバー詐欺は、ハニーポット、デコイ認証、デコイファイルなどの偽の資産を持つネットワーク攻撃者の注意をそらし、遅らせ、検出することを目的としている。
既存のツールやプラットフォームには、変更や拡張が難しい、移植不可能で複雑な実装があります。
私たちは、偽装のシナリオの設計と探索を加速する高レベルのフレームワークであるPerryを紹介します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:24:07 GMT)
Evading Overlapping Community Detection via Proxy Node Injection [11.7] 我々は,対象ノードが元のコミュニティから離脱する原因となるエッジ修正を求める,共生メンバシップ隠蔽(CMH)の問題に対処する。
本稿では,グラフ構造を保存しながら,プロキシノードの使用を含む効果的な修正ポリシーを学習する深層強化学習手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:21:16 GMT)
From Next Token Prediction to (STRIPS) World Models -- Preliminary Results [11.7] 本研究では,行動トレースのみから命題STRIPS世界モデルを学習する問題について考察する。
適切なトランスフォーマーアーキテクチャは命題的STRIPS世界モデルを忠実に表現できることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:09:53 GMT)
FedCLF - Towards Efficient Participant Selection for Federated Learning in Heterogeneous IoV Networks [11.6] Federated Learning(FL)は、クライアントデータの代わりにトレーニング済みパラメータのみを共有することで、データのプライバシを保存する分散機械学習技術である。
本稿では,クライアントのサンプリング周波数を動的に調整するフィードバック制御機構と選択プロセスにおいて,キャリブレーション損失をユーティリティとして導入する,キャリブレーション損失とフィードバック制御を備えたFedCLFを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:51:38 GMT)
Structure before the Machine: Input Space is the Prerequisite for Concepts [11.6] ハイレベルな表現は、AIの透明性と制御を強化することの中心となり、個々のニューロンや回路から人間の解釈可能な概念に沿った構造化されたセマンティックな方向へと注目を移している。
線形表現仮説 (LRH) によって動機付けられた入力空間線形性仮説 (ISLH) を提案する。
次に、スペクトル主経路(SPP)フレームワークを導入し、より深いネットワークが支配的なスペクトル方向の小さなセットに沿って線形表現を段階的に蒸留する方法を定式化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:21:43 GMT)
Unlocking Financial Insights: An advanced Multimodal Summarization with Multimodal Output Framework for Financial Advisory Videos [11.6] FASTER(Financial Advisory Summariser with Textual Embedded Relevant Image)は、最適化された簡潔な要約を生成するフレームワークである。
FASTERは、セマンティックな視覚的記述にBLIP、テキストパターンにOCR、話者ダイアリゼーションをBOS機能としてWhisperベースの書き起こしにBLIPを使用している。
A modified Direct Preference Optimization (DPO)-based loss function, equipped with BOS-specific fact-checking, ensure precision, Relevance, and factual consistency。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:54:19 GMT)
A Finite-Time Analysis of TD Learning with Linear Function Approximation without Projections or Strong Convexity [11.5] 線形関数近似を用いた時間差分学習(TD)の有限時間収束特性について検討する。
単純な射影自由多様体は、マルコフノイズの存在下でさえ$widetildemathcalO(frac||theta)$の速度で収束することを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:48:21 GMT)
Gate-Based Initialization and Fidelity in Correlated Open Quantum Systems [11.4] 本稿では,ゲート操作によるオープン量子システムの初期化,システムバス相関処理,等足歩行における制御ダイナミクスについて述べる。
ゲートの忠実度は、スピンエコのような2pi$回転付近でのエラーの抑制を示し、エラーキャンセルの本質的なメカニズムを示している。
結果は、超高速パルスによって引き起こされる強い非マルコフ力学から長寿命のエキシトニックコヒーレンスが生じることを示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:06:34 GMT)
Towards Multimodal Active Learning: Efficient Learning with Limited Paired Data [11.2] 非整合データを用いたマルチモーダル能動学習のための第1のフレームワークを導入し、学習者はクロスモーダルアライメントを積極的に取得しなければならない。
我々は,不確実性と多様性の原則を組み合わさった新しいアルゴリズムを開発し,線形時間取得を実現し,プールベースとストリーミングベースの両方の設定にシームレスに適用する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:08:03 GMT)
Beyond SHAP and Anchors: A large-scale experiment on how developers struggle to design meaningful end-user explanations [11.2] 現代の機械学習は、ユーザーや開発者が完全に理解できないモデルを生成する。
透明性と説明可能性の手法は、モデルの理解にいくつかの助けを提供することを目的としている。
ガイドラインと規則の創出は目標を設定するが、開発者に効果的なガイダンスを提供しない可能性がある。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:48:45 GMT)
Design, Implementation and Evaluation of a Novel Programming Language Topic Classification Workflow [11.2] 本稿では,新しいプログラミング言語トピック分類ワークフローの設計,実装,評価について述べる。
提案手法では,マルチラベルサポートベクトルマシン(SVM)とスライディングウィンドウと投票戦略を組み合わせることで,コア言語概念の詳細なローカライゼーションを実現する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:02:55 GMT)
Benchmarking for Practice: Few-Shot Time-Series Crop-Type Classification on the EuroCropsML Dataset [11.0] MAMLに基づくメタ学習アルゴリズムは、教師付き転送学習やSSL法に比べて若干精度が高い。
教師付き手法は、地理的に近接した地域で事前訓練されたり微調整されたりした場合、最も恩恵を受ける。
SSLは、特に現実世界の作物タイプの分類に不可欠なきめ細かい特徴をキャプチャする上で、スクラッチからトレーニングするよりも利点がある。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:37:34 GMT)
Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation [11.0] 単一または少数の画像に基づいて高忠実表面とSDFフィールドを再構成する高速画像からニューラル表面(FINS)を提案する。
FINSは、軽量な幾何学とカラーヘッドを備えたマルチ解像度ハッシュグリッドを統合し、近似二階エンコーダによるトレーニングを極めて効率的にする。
同条件下では, コンバージェンス速度, 表面再構成精度, SDF場推定精度の両面で, 最先端のベースラインよりも優れることを示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:30:05 GMT)
BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation [10.8] 本稿では,効率的なテキストセグメンテーションのためのグラフモデルに基づく教師なし学習手法BP-Segを提案する。
本手法は, 局所的コヒーレンスを考慮し, 隣接文がより関連性が高いという直感を捉えるだけでなく, 意味論的に類似しない文章を効果的にグループ化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:51:05 GMT)
RED-DiffEq: Regularization by denoising diffusion models for solving inverse PDE problems with application to full waveform inversion [10.8] 偏微分方程式(PDE)が支配する逆問題(逆問題)は、様々な科学的・工学的応用において基本的な問題である。
我々は、物理駆動の逆転とデータ駆動学習を統合することにより、新しい計算フレームワークRED-DiffEqを導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:28:56 GMT)
On Entropy Control in LLM-RL Algorithms [10.7] LLM-RL設定におけるエントロピーボーナスの問題について検討した。
自動調整係数を持つ新しいクランプ型エントロピーボーナスを利用するエントロピー制御法であるAEntを提案する。
AEntは、異なるベースモデルとデータセットの下で数学推論タスクでテストされており、AEntがベースラインを一貫して上回ることが観察されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:05:58 GMT)
KeyWorld: Key Frame Reasoning Enables Effective and Efficient World Models [10.6] KeyWorldはテキスト条件のロボットワールドモデルを改善するフレームワークである。
KeyWorldはフレーム・ツー・フレーム生成ベースラインと比較して5.68$times$Accelerationを実現していることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:35:40 GMT)
Failure Makes the Agent Stronger: Enhancing Accuracy through Structured Reflection for Reliable Tool Interactions [10.6] 現在の自己回帰のプラクティスは、プロンプトや一方的な推論に依存しています。
提案する構造的リフレクションは, エラーから修復までの経路を明示的で制御可能な, 訓練可能な動作に変換する。
BFCL v3とTool-Reflection-Benchの実験では、マルチターンツールコールの成功とエラー回復、冗長呼び出しの削減が大幅に向上した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:17:18 GMT)
FerretNet: Efficient Synthetic Image Detection via Local Pixel Dependencies [10.6] FerretNetは1.1Mパラメータしか持たない軽量ニューラルネットワークで、効率的で堅牢な合成画像検出を提供する。
実験によると、フェレットネットは4クラスのProGANデータセットのみに訓練されており、平均精度は97.1%である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:28:32 GMT)
TasselNetV4: A vision foundation model for cross-scene, cross-scale, and cross-species plant counting [10.5] 種別カウントから種間カウントに移行したTasselNetV4について紹介する。
普通の視覚変換器の上に構築され、新しいマルチブランチボックス対応のローカルカウンタが組み込まれている。
以上の結果から,タッセルネットV4はクロスシーン,クロススケール,クロスタイプ植物カウントのためのビジョン基盤モデルであることが示唆された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:48:29 GMT)
Filtering with Confidence: When Data Augmentation Meets Conformal Prediction [10.4] 本稿では,合成データ拡張のための基本データフィルタリングフレームワークを提案する。
F1スコアの最大40%の一貫性のあるパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:42:02 GMT)
RedHerring Attack: Testing the Reliability of Attack Detection [10.4] 我々は、RedHerringという新たなアタック設定とアタックを提案し、テストする。
RedHerringは、テキストを変更することで攻撃検出モデルを信頼できないようにする。
RedHerringは検出精度を20~71ポイントに下げることができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:53:11 GMT)
Concepts in Motion: Temporal Bottlenecks for Interpretable Video Classification [10.4] MoTIFは、ビデオ分類のための概念ボトルネックフレームワークに適応するトランスフォーマーにインスパイアされたアーキテクチャ設計である。
我々のデザインは、ビデオ全体にわたるグローバルな概念の重要性、特定のウィンドウ内でのローカルな概念の関連性、時間の経過とともに概念の時間的依存という、3つの補完的な視点を可能にします。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:35:03 GMT)
Even More Kawaii than Real-Person-Driven VTubers? Understanding How Viewers Perceive AI-Driven VTubers [10.4] 我々は、Twitchで845万のフォロワー、YouTubeで753万のフォロワーを持つ、最も人気のあるAI駆動型VTuberであるNeuro-samaの視聴者認識を調査した。
我々の発見は、AI駆動型VTuberの理解と、そのデジタルストリーミング文化への影響を高める。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:58:13 GMT)
VDFD: Multi-Agent Value Decomposition Framework with Disentangled World Model [10.4] 本稿では,Distangled World Modelを用いた新しいモデルベースマルチエージェント強化学習手法であるValue Decomposition Frameworkを提案する。
提案手法は, サンプル効率が高く, 多様なマルチエージェント学習タスクにおいて, 他のベースラインと比較して優れた性能を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:51:30 GMT)
Bispectral OT: Dataset Comparison using Symmetry-Aware Optimal Transport [10.3] バイスペクトル最適輸送(Bispectral Optimal Transport)は、離散OTの対称性を考慮した拡張であり、バイスペクトルを用いて要素を表現して比較する。
本研究では,バイスペクトルOTを用いて計算した輸送計画が,視覚対称性で変換されたベンチマークデータセット上の特徴OTよりも高いクラス保存精度を達成できることを実証する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:25:24 GMT)
T2I-Diff: fMRI Signal Generation via Time-Frequency Image Transform and Classifier-Free Denoising Diffusion Models [10.2] 本稿では,BOLD信号の時間周波数表現を利用するfMRI生成フレームワークであるT2I-Diffを紹介する。
ダウンストリームfMRIを用いた脳ネットワーク分類において,精度の向上と一般化を実証した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:08:19 GMT)
Provenance Analysis of Archaeological Artifacts via Multimodal RAG Systems [10.0] 本稿では,考古学的遺物の発見分析のためのRAGに基づくシステムを提案する。
このシステムは、参照テキストや画像からデュアルモーダルな知識ベースを構築し、ビジュアル、エッジ強化、セマンティック検索を可能にする。
大英博物館の東ユーラシア青銅器群について評価を行った。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:52:13 GMT)
BESPOKE: Benchmark for Search-Augmented Large Language Model Personalization via Diagnostic Feedback [10.0] 本稿では,検索強化された大規模言語モデルにおけるパーソナライズ評価のための現実的なベンチマークであるBESPOKEを提案する。
BESPOKEは、人間から直接、本物のチャットと検索履歴を収集することによって、現実的なものの両方を意図している。
我々は,情報探索タスクにおける効果的なパーソナライズのための重要な要件を明らかにする体系的な分析を行う。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:53:07 GMT)
Model-Based Reinforcement Learning under Random Observation Delays [9.9] 我々は,POMDPにおけるランダムなセンサ遅延について検討した。
本稿では,入ってくる観測ストリームに基づいて,信頼状態を逐次更新するモデルに基づくフィルタリングプロセスを提案する。
次に、モデルベースのRLにこのアイデアを組み込んだ、シンプルな遅延認識フレームワークを紹介します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:01:13 GMT)
Punching Above Precision: Small Quantized Model Distillation with Learnable Regularizer [9.9] Game of Regularizer (GoR) は、タスク固有性(TS)と蒸留損失を適応的にバランスをとる学習可能な正規化手法である。
GoRは、最先端のQAT-KD法を低消費電力エッジデバイスで一貫して上回っている。
また,多種多様な教師モデルを用いたアンサンブル蒸留フレームワークQAT-EKD-GoRについても紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:43:13 GMT)
CompareBench: A Benchmark for Visual Comparison Reasoning in Vision-Language Models [9.4] CompareBenchは視覚言語モデル(VLM)における視覚比較推論を評価するためのベンチマークである。
量(600)、時間(100)、幾何学(200)、空間(100)の4つのタスクにまたがる1000のQAペアで構成されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:14:11 GMT)
PhenoMoler: Phenotype-Guided Molecular Optimization via Chemistry Large Language Model [9.3] フェノモラーは化学的に有効で、新規で多様な分子を所望の表現型プロファイルに沿って生成する。
FDAが承認した薬物と比較すると、生成された化合物は、同等または強化された薬物類似性(QED)、最適化された物理化学的性質、および主要ながん標的に対する優れた結合親和性を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:37:19 GMT)
Diagnosing the Performance Trade-off in Moral Alignment: A Case Study on Gender Stereotypes [9.3] モーラルアライメントは、事前訓練された言語モデル(PLM)の振る舞いを制御するための広く採用されているアプローチとして登場した。
ジェンダーステレオタイプを緩和する文脈において,パフォーマンストレードオフの基盤となるメカニズムについて検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:26:00 GMT)
Speech Language Models for Under-Represented Languages: Insights from Wolof [9.1] We present our journey in training a speech language model for Wolof, a underrepresented language spoken in West Africa。
まず,大規模で自発的で高品質な教師なし音声データを収集することの重要性を強調した。
このデータセット上でのHuBERTの事前学習は、ASRのベースモデルとアフリカ中心モデルの両方より優れていることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:40:33 GMT)
On the Necessity of Output Distribution Reweighting for Effective Class Unlearning [9.1] モデルが近隣のクラスに割り当てる確率を用いて、未学習のサンプルを検出するMIA-NNによる会員推論攻撃を導入する。
そこで我々は,このプライバシー漏洩を緩和する新たな微調整手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:25:09 GMT)
Improving LLM Unlearning Robustness via Random Perturbations [9.1] 現状のLLMアンラーニング手法は,モデルのロバスト性を本質的に低下させることを示す。
本研究では,非学習プロセスをバックドア攻撃と防御として再編成する理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:44:11 GMT)
Training Set Reconstruction from Differentially Private Forests: How Effective is DP? [8.8] 我々は、最先端の$epsilon$-DPランダム森林を対象とした再建攻撃を導入する。
以上の結果から,有意義なDP保証で訓練された無作為林が,トレーニングデータの一部を漏洩させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:23:53 GMT)
"DIVE" into Hydrogen Storage Materials Discovery with AI Agents [8.8] データ駆動人工知能(AI)アプローチは、新しい素材の発見を変革している。
本稿では,視覚表現の記述的解釈(Descriptive Interpretation of Visual Expression, DIVE)について述べる。
4000の出版物から3万点を超えるキュレートされたデータベース上に構築し、これまで報告されていない水素貯蔵成分を2分で識別できる高速な逆設計ワークフローを構築した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:01:31 GMT)
Binary Autoencoder for Mechanistic Interpretability of Large Language Models [8.7] 隠れアクティベーションのミニバッチに最小エントロピーを強制する新しいバイナリオートエンコーダを提案する。
効率的なエントロピー計算のために、ステップ関数を介して隠れたアクティベーションを1ビットに識別する。
我々は、大規模言語モデルの推論力学を経験的に評価し、活用する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:48:48 GMT)
On the Dynamic Regret of Following the Regularized Leader: Optimism with History Pruning [8.7] FTRL(Follow the Regularized Leader)は、オンライン凸最適化(OCO)のためのフレームワークである。
これまでの研究は、動的環境におけるフレームワークの制限を強調してきた。
FTRLは、将来的なコストの楽観的な構成により、既知の動的後悔境界を回復できることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:55:03 GMT)
Generation-Time vs. Post-hoc Citation: A Holistic Evaluation of LLM Attribution [8.7] 大規模言語モデル (LLMs) は、医療、法律、アカデミア、金融といった高度な領域において、人間の検証可能な情報源を引用しなければならない。
本稿では,一つのパスで応答と引用を生成する生成時間Citation(G-Cite)と,起草後の引用を付加または検証するポストホックCitation(P-Cite)という2つのパラダイムを紹介する。
両パラダイムにおける帰属品質の主要因は検索であり,適用範囲と引用精度の相反するトレードオフを示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:39:26 GMT)
Fast Revocable Attribute-Based Encryption with Data Integrity for Internet of Things [8.6] Revocable-basedcrypt(RABE)は、IoT(Internet of Things)内のクラウドストレージおよびアウトソースデータ環境における、フレキシブルできめ細かなアクセス制御とデータ共有を保証するために不可欠である。
本稿では,複数のチャレンジ暗号文による適応型セキュリティを特徴付ける,IoT用のデータ整合性を備えた高速なRABE方式を提案する。
我々は、複数のチャレンジ暗号文で定義されたセキュリティモデル内で適応セキュリティを実証し、その性能を最適化した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:24:29 GMT)
A Sentinel-3 foundation model for ocean colour [8.6] 我々は,Sentinel-3 Ocean and Land Colour Instrument (OLCI) のデータ再構成を事前訓練した Prithvi-EO Vision Transformer アーキテクチャを用いた新しい基礎モデルについて述べる。
2つの下流海洋地球観測課題の微調整によるモデルの評価を行った。
この新世代の地理空間AIモデルは、海洋生態系とその地球温暖化プロセスにおける役割について、より堅牢でデータ駆動的な洞察を提供する可能性を秘めている、と結論付けています。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:00:38 GMT)
Ko-PIQA: A Korean Physical Commonsense Reasoning Dataset with Cultural Context [8.5] PIQAのような物理コモンセンス推論データセットは、主に英語中心であり、文化的多様性を欠いている。
文化コンテキストを組み込んだ韓国の物理常識推論データセットKo-PIQAを紹介する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:44:01 GMT)
Fine-Tuning LLMs to Analyze Multiple Dimensions of Code Review: A Maximum Entropy Regulated Long Chain-of-Thought Approach [8.4] 大きな言語モデル(LLM)は、自動コードレビューをサポートする大きな可能性を示しています。
近年,コードレビューデータを用いた微調整LDMによる性能向上が報告されている。
本稿では,複数次元のコードレビューを解析する優れた推論能力を備えたLCMを訓練する,COTファインチューニングアプローチであるMelcotCRを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:51:56 GMT)
Mechanism of Task-oriented Information Removal in In-context Learning [8.3] In-context Learning (ICL) は、現代の言語モデル(LM)に基づく、新たな数発学習パラダイムである。
本稿では,情報除去の新たな視点を通して,そのメカニズムを考察する。
低ランクフィルタにより隠蔽状態から特定の情報を選択的に除去し,LMを目的のタスクに向けて効果的に操ることがわかった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:18:09 GMT)
Hallucination as an Upper Bound: A New Perspective on Text-to-Image Evaluation [8.2] 我々は、テキスト・画像モデルにおける幻覚をバイアス駆動偏差として定義する。
属性,関係性,対象幻覚の3つのカテゴリからなる分類法を提案する。
このフレーミングは評価のための上限を導入し、隠れバイアスを表面化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:50:21 GMT)
Regularization can make diffusion models more efficient [8.2] 本研究は,特に統計学でよく知られている疎水性の概念が,より効率的な拡散パイプラインの経路となることを示唆している。
我々の数学的保証は、空間が入力次元の計算複雑性への影響を、データの本質的な次元よりもはるかに小さくすることができることを証明している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:46:51 GMT)
Investigating Modality Contribution in Audio LLMs for Music [8.1] オーディオ大言語モデル(Audio LLMs)は、人間の音楽に関する会話を可能にする。
音声を本当に聴いているのか、それとも単にテキストによる推論を使っているのかは不明だ。
本稿では,モデル出力に対する各モダリティの寄与を定量化し,この問題を考察する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:56:35 GMT)
Physics-Guided Motion Loss for Video Generation Model [8.1] 現在のビデオ拡散モデルは視覚的に魅力的なコンテンツを生成するが、物理の基本法則に反することが多い。
モデルアーキテクチャを変更することなく、動きの可視性を向上する周波数領域物理を導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:44:47 GMT)
A Data-driven Typology of Vision Models from Integrated Representational Metrics [8.0] 大規模ビジョンモデルは、アーキテクチャやトレーニングのパラダイムにおいて大きく異なるが、家族間で表現のどの側面が共有されているかを決定するための原則的な方法が欠如している。
表現的類似度メトリクスの組を活用し、それぞれ異なる顔-幾何学、ユニットチューニング、線形な陰極性、および家族分離性を評価する。
我々は、これらの相補的なファセットを統合するために、マルチオミクス統合にインスパイアされたSimisity Network Fusion(SNF)を適用する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:46:09 GMT)
Development and Validation of a Large Language Model for Generating Fully-Structured Radiology Reports [7.8] 完全に構造化されたレポートを作成するための現在のLLMは、外部サーバにデータをアップロードする際のエラー、コンテンツ幻覚、プライバシー漏洩といった問題に直面している。
我々は,各機関の様々な自由テキストレポートから完全に構造化され,標準化されたLCSレポートを作成するための,オープンソースで正確なLCMを開発することを目的としている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:44:19 GMT)
RL-Obfuscation: Can Language Models Learn to Evade Latent-Space Monitors? [6.9] 潜在空間モニタは、その内部表現を活用することで、大規模言語モデルにおける望ましくない振る舞いを検出することを目的としている。
これは重要な疑問を提起する。モデルがそのようなモニターを避けることができるか?
RL-Obfuscationを導入し,LLMを強化学習により微調整し,遅延空間モニタを回避する。
トークンレベルのモニタはこの攻撃に対して非常に脆弱であるのに対して、最大プールやアテンションベースのプローブのようなより包括的なモニタは堅牢である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:43:01 GMT)
Distillation of supersinglet states [6.8] N量子ビットからなる超特異状態に対するエンタングルメント蒸留プロトコルを導入する。
このプロトコルは、ローカル操作と古典的な通信のみを使用する。
量子クロック同期や暗号などの長距離アプリケーションに適している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:58:14 GMT)
FusedANN: Convexified Hybrid ANN via Attribute-Vector Fusion [6.7] 現在のソリューションでは、スケールしない脆弱なインデックスハックを頼りに、リコール、スピード、柔軟性をトレードオフしています。
本稿では,属性を埋め込み,属性を緩和するハイブリッドフレームワークFusedANNを紹介する。
FusedANNは、一致が不十分な場合に、セマンティックに最も近い属性を保存しながら、ハイクセマンティクスの下で正確なフィルタリングを行う。
これは、象徴的制約とベクトル類似性の間の原則付き、スケーラブルで、ブリッジを確立し、大規模、ハイブリッド、動的/MLワークロードのための新しい世代のフィルタ付き検索システムをアンロックする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:07:48 GMT)
Byam: Fixing Breaking Dependency Updates with Large Language Models [6.7] 廃止、パラメータ名や型の変更、新しいAPIへの完全な置き換えといったAPIの変更は、既存のクライアントコードを壊す可能性がある。
APIユーザがこれらのブレークの原因を特定して、それに従ってコードを更新するのは、しばしば面倒です。
依存関係の更新の破壊に対応するため、クライアントコードの更新を自動化するために、LLM(Large Language Models)の使用について検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:30:09 GMT)
Merging Memory and Space: A State Space Neural Operator [6.6] State Space Neural Operator (SS-NO) は時間依存偏微分方程式の解演算子を学習するためのコンパクトなアーキテクチャである。
SS-NOは多種多様なPDEベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:28:46 GMT)
A Single Neuron Works: Precise Concept Erasure in Text-to-Image Diffusion Models [6.5] 単一ニューロンに基づく概念消去は、単一のニューロンのみを操作することによって有害なコンテンツ生成を防止する。
SNCEは,非ターゲット概念に対するモデルの生成能力を保ちながら,目標概念の消去において最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:10:33 GMT)
ArchGPT: Understanding the World's Architectures with Large Multimodal Models [6.5] 本稿では,マルチモーダルな視覚的質問応答(VQA)モデルであるArchGPTを提案する。
このパイプラインはArch-300Kというドメイン特化データセットを約315,000枚取得する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:49:43 GMT)
ARF-RLHF: Adaptive Reward-Following for RLHF through Emotion-Driven Self-Supervision and Trace-Biased Dynamic Optimization [6.5] 本稿では,自然フィードバックを連続的な嗜好軌道に変換する適応回帰追跡(ARF)を提案する。
ARFはPPOとDPOを一貫して上回り、アライメントを最大7.6%改善する。
その結果,連続報酬モデリングはパーソナライズされ理論的に基礎付けられたRLHFへのスケーラブルな経路を提供することを示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:04:16 GMT)
Stratify or Die: Rethinking Data Splits in Image Segmentation [6.4] Iterative Pixel Stratification (IPS)は、セグメンテーションタスクに適したラベル対応サンプリング手法である。
We present Wasserstein-Driven Evolutionary Stratification (WDES), a novel genetic algorithm designed to minimize the Wasserstein distance。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:04:26 GMT)
IConv: Focusing on Local Variation with Channel Independent Convolution for Multivariate Time Series Forecasting [6.3] 実世界の時系列データは、変化傾向、不規則な季節性、残差など、しばしば非定常性を示す。
近年,多層パーセプトロン (MLP) を用いたモデルでは,長期依存性を捕捉する性能が向上している。
本稿では,時間チャネルを独立に処理し,チャネル間関係を考慮した新しいアーキテクチャIConvを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:09:37 GMT)
Go With The Flow: Churn-Tolerant Decentralized Training of Large Language Models [6.3] GWTFは、大規模な言語モデル(LLM)のための、クラッシュ耐性のある実用的な分散トレーニングフレームワークである。
リソースをボランティアする異種クライアント上でのLLMの効率的な協調トレーニングを可能にする。
GWTFはノードチャーン、すなわちクライアントがいつでもシステムに参加または離脱し、ネットワークの不安定さに対処する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:27:41 GMT)
SuperPatchMatch: an Algorithm for Robust Correspondences using Superpixel Patches [6.3] われわれはまず,SuperPatchと呼ばれるスーパーピクセルベースのパッチを新たに導入する。
提案した構造は,空間情報が自然に含まれているため,強靭な記述子となる。
画像データベースから高速なセグメンテーションとラベリングを行うためのフレームワークを提案し、計算コストと精度、顔ラベリングと医用画像セグメンテーションの両面で最先端の手法の結果を比較検討した結果、我々のアプローチの可能性を実証した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:29:59 GMT)
Building Tailored Speech Recognizers for Japanese Speaking Assessment [6.2] 我々はアクセントマーカーで音声ラベルを出力する音声認識器を構築した。
日本語は資源に富んでいるが、正確な音素の書き起こしを行うための訓練用データはほとんどない。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:26:11 GMT)
Sig2Model: A Boosting-Driven Model for Updatable Learned Indexes [6.1] Sig2Modelは効率的で適応的な学習指標であり、3つの主要な手法による再学習コストを最小限に抑える。
Sig2Modelは、トレーニングコストを最大20倍に削減し、最大3倍高いQPSを実現し、最大1000倍のメモリを使用する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:07:13 GMT)
New Algorithmic Directions in Optimal Transport and Applications for Product Spaces [6.0] アルゴリズムの観点から2つの高次元分布$mu,nu$ in$Rn$の最適輸送について検討する。
実行時間は、$mu,nu$の完全な表現サイズではなく、次元に依存する。
ガウス測度$varepsilon$の場合、ほとんどの$Phin$サンプルは距離$O(sqrtlog 1/varepsilon)$ in $poly(n/varepsilon)$にマッピングできる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:58:06 GMT)
Semantic Edge-Cloud Communication for Real-Time Urban Traffic Surveillance with ViT and LLMs over Mobile Networks [5.9] インテリジェント・トランスポーテーション・システム(ITS)にとって、道路の安全を確保し、交通の流れを最適化し、車両軌道を追跡し、スマートシティでの衝突を防止するために、リアルタイムの都市交通監視が不可欠である。
本稿では,送信オーバヘッドを大幅に低減する意味コミュニケーションフレームワークを提案する。
従来の収穫画像では93%の精度で89%のLLM応答精度を維持しながら,データ伝送サイズを99.9%削減する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:53:36 GMT)
Language-Guided Multi-Agent Learning in Simulations: A Unified Framework and Evaluation [5.7] 本稿では,大規模言語モデル(LLM)をマルチエージェント強化学習(MARL)に組み込んだ統合フレームワークを提案する。
フレームワークにはCoordinator、Communicator、Memoryの3つのモジュールコンポーネントがあり、サブゴールを動的に生成する。
Google Research Football、Magent Battle、StarCraft IIで評価されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:04:28 GMT)
Thinking Outside the (Gray) Box: A Context-Based Score for Assessing Value and Originality in Neural Text Generation [5.7] 創造的なタスクのための大きな言語モデルは、しばしば多様性を欠いている。
高温でのサンプリングのような一般的なソリューションは、結果の品質を損なう可能性がある。
価値と独創性を定量的に評価する文脈に基づくスコアを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:33:30 GMT)
Rejuvenating Cross-Entropy Loss in Knowledge Distillation for Recommender Systems [5.7] 本稿では,レコメンダシステムにおける知識蒸留(KD)のクロスエントロピー(CE)損失を分析した。
アイテムサブセット上でKDを実行する場合、CE損失を最小限に抑えることで、NDCGの下位境界が最大になることを示す。
知識蒸留のための共役クロストロピー(RCE-KD)を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:31:59 GMT)
Generalizing while preserving monotonicity in comparison-based preference learning models [5.7] 拡散優先度を持つ線形一般化ブラッドレー・テリーモデルの新しいクラスを提案する。
実験の結果,新しい一般化モデルでは,特にデータセットが限定された場合,精度が向上することがわかった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:18:45 GMT)
DENet: Dual-Path Edge Network with Global-Local Attention for Infrared Small Target Detection [5.7] 災害警報や海上監視といったリモートセンシングアプリケーションには、赤外線小目標検出が不可欠である。
このタスクの深層モデルの設計における根本的な課題は、微小目標に対する高解像度の空間的詳細を捉えることと、より大きな目標に対する堅牢な意味的コンテキストを抽出することの相違にある。
既存の手法は、低コントラストと高雑音下でターゲットエッジを正確に抽出するには不十分な、固定勾配演算子や単純な注意機構に頼っていることが多い。
本稿では,エッジ拡張とセマンティックモデリングを2つの補完処理経路に分離することで,この課題に対処する新しいDual-Path Edge Networkを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:08:26 GMT)
GRPO is Secretly a Process Reward Model [5.6] GRPO RLアルゴリズムは実世界の条件下で非自明なプロセス報酬モデルを生成する。
この欠陥を軽減するために,アルゴリズムの簡単な修正を提案する。
この結果から,GRPO の高コストで明示的な PRM の利点を疑問視する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:40:36 GMT)
Network Formation and Dynamics Among Multi-LLMs [5.5] ソーシャルネットワークは、人間が意見を作り、情報を交換し、まとめる方法に大きな影響を与える。
大規模言語モデル(LLM)は、社会的および専門的な環境にますます組み込まれているため、それらの相互作用が人間に似たネットワーク力学に近似するかどうかを理解することが重要である。
我々は,複数のLLMエージェントのネットワーク形成挙動を解析し,人的決定に対してそれらをベンチマークする枠組みを開発した。
LLMは、コミュニティ構造や小世界効果を含むマクロレベルの特性だけでなく、優先的なアタッチメント、三進的クロージャ、ホモフィリーといった基本的ミクロレベルの原則を一貫して再現している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:27:44 GMT)
Estimating Deep Learning energy consumption based on model architecture and training environment [5.5] モデルアーキテクチャと学習環境がエネルギー消費に与える影響について検討する。
適切なモデル学習環境の組み合わせを選択することで、トレーニングのエネルギー消費を最大80.68%削減できることがわかった。
本稿では,STEP(Stable Training Epoch Projection)とPRE(Pre-Treging Regression-based Estimation)手法を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:25:25 GMT)
AuthPrint: Fingerprinting Generative Models Against Malicious Model Providers [5.5] 本稿では,認証モデルの出力空間から隠れ指紋を抽出し,検知器を訓練する信頼性検証器を提案する。
検証中、この検出器は、特別なハードウェアやモデル修正を必要とせずに、新しい出力が認定されたモデルと一致しているかどうかを判断できる。
GANと拡散モデルの両方でFPR@95%TPRをほぼゼロとする実験を行った。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:41:41 GMT)
SD-RetinaNet: Topologically Constrained Semi-Supervised Retinal Lesion and Layer Segmentation in OCT [5.4] 完全微分可能なバイオマーカートポロジエンジンを導入した新しい半教師付きモデルを提案する。
我々のモデルは、空間的要素とスタイル要素を分離して、不整合表現を学習する。
我々は,OCTスキャンの公開および内部データセット上で提案したモデルを評価し,病変と層分断の双方において現状よりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:56:38 GMT)
GenFacts-Generative Counterfactual Explanations for Multi-Variate Time Series [5.4] 我々は,クラス識別型変分オートエンコーダに基づく生成フレームワークGenFactsを紹介する。
我々は,レーダジェスチャデータに対するGenFactsを産業的ユースケースとして,手書き文字トラジェクトリを直感的なベンチマークとして評価した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:22:19 GMT)
Holevo Cramér-Rao bound: How close can we get without entangling measurements? [5.3] プローブ状態の複数の同一コピーに対するエンタングリング測定は、各プローブを個別に測定するよりも優れていることが知られている。
本研究では,集団量子計測が個々の測定値に対して与えうる最大精度の向上について検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:15:22 GMT)
The Impact of Audio Watermarking on Audio Anti-Spoofing Countermeasures [5.3] 本稿では,音声透かしがスプーフィング対策に与える影響について検討する。
我々はWatermark-Spoofingデータセットという,透かし強化されたトレーニングと評価データセットを構築した。
実験の結果, 透かし性能は一貫して低下し, 透かし密度は高いEERと相関していることがわかった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:34:39 GMT)
MoCLIP-Lite: Efficient Video Recognition by Fusing CLIP with Motion Vectors [5.2] MoCLIP-Liteは、効率的なビデオ認識のためのシンプルだが強力な2ストリーム遅延融合フレームワークである。
提案手法は,凍結したCLIP画像エンコーダと,生のMVで訓練された軽量で教師付きネットワークの機能を組み合わせたものである。
提案手法は89.2%のTop-1精度を実現し,強いゼロショット(65.0%)とMVのみ(66.5%)のベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:09:09 GMT)
Markup Language Modeling for Web Document Understanding [5.2] 本研究は,ショッピングレビューサイトから詳細な情報を抽出することで,最新の製品データベースを構築することの課題を考察する。
異なるサイズのレビューサイトから収集した製品データに基づいてMarkupLMを微調整し、MarkupLM++と呼ばれる変種を開発しました。
最終モデルは0.906、リコールは0.724、F1スコアは0.805に達した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:25:43 GMT)
Designing for Novice Debuggers: A Pilot Study on an AI-Assisted Debugging Tool [5.2] 本研究は,大学院生のグループで行った第2の設計デバッガーから得られた知見を報告する。
その結果,本ツールは意味的誤りの解消に極めて有効であり,第1版よりも使いやすくなっていることがわかった。
学生との対話を最適化するためには、ユーザープロファイルに基づいてAI支援デバッグツールをパーソナライズする必要があると結論付けている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:18:20 GMT)
Radiation of "breathing" vortex electron packets in magnetic field [5.1] 振動電荷分布は磁場中で光子を放出することが期待される。
この放射によってOAMが取り除かれ、電子の渦性が失われるのか?
我々は、縦磁場中を伝播しながら、渦電子がエネルギーとOAMを失う速度を定量化し、放射された電界の総放射パワーと角運動量を計算する。
我々は、少なくとも準古典近似において、線形加速器が相対論的渦電子や他の荷電粒子の渦性を維持するための顕著なツールであることを示す放射パワーと角運動量損失の両方が無視可能であることを発見した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:08:23 GMT)
Lower Bounds for Learning Hamiltonians from Time Evolution [5.1] 我々はハミルトニアンを時間進化から学ぶことの問題を考察する。
逆時間分解能を持つ任意の学習アルゴリズムは、超ポリノミカルな全進化時間を必要とすることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:50:55 GMT)
ExMolRL: Phenotype-Target Joint Generation of De Novo Molecules via Multi-Objective Reinforcement Learning [5.0] ExMoIRLは、デノボ分子生成のための表現型および標的特異的なキューを統合する新しい生成フレームワークである。
ドッキング親和性と薬物類似度スコアを融合させ、ランキング損失、前装正規化、エントロピーを増強する。
大規模な実験では、ExMoIRLは最先端およびターゲットベースモデルよりも優れた性能を示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:13:24 GMT)
Multi-Objective Reinforcement Learning for Large Language Model Optimization: Visionary Perspective [5.0] 大規模言語モデル(LLM)における多目的強化学習(MORL)の課題と機会
我々はMORL分類法を導入し、LLM最適化に適用した場合の様々なMORL法の利点と限界について検討する。
本稿では,様々な手法が多様な客観的関係に与える影響に対処するMORLベンチマークフレームワークのビジョンを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:29:08 GMT)
ILRe: Intermediate Layer Retrieval for Context Compression in Causal Language Models [5.0] ILRe(Intermediate Layer Retrieval)と呼ばれる新しいコンテキスト圧縮パイプラインを導入する。
ILReは、チャンクされたプリフィルをその層にだけストリーミングすることでコンテキストをエンコードし、入力クエリと指定された層のフルキーキャッシュの間のアテンションスコアによってトークンをリコールする。
追加のポストトレーニングやオペレータ開発がなければ、ILReは100万ドルのトークン要求を30分以内で処理できる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:30:06 GMT)
Actor-Critic without Actor [4.9] Actor-Critic without Actor (ACA)はアクターネットワークを排除し、ノイズレベルの批評家の分野から直接アクションを生成する軽量なフレームワークである。
ACAは、標準的なアクター批判法と最先端拡散法の両方と比較して、より好ましい学習曲線と競争性能を達成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:33:09 GMT)
Time series saliency maps: explaining models across multiple domains [4.9] 本稿では,統合勾配の一般化であるクロスドメイン統合勾配について紹介する。
我々の方法は、時間領域の可逆かつ微分可能な変換として定式化できる任意の領域における特徴属性を可能にする。
これらの結果は、時系列モデルにおいて意味論的に意味のある洞察を提供するクロスドメイン統合勾配の能力を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:00:49 GMT)
Single Answer is Not Enough: On Generating Ranked Lists with Medical Reasoning Models [4.9] 本稿では,医療推論モデルによる回答ランキング作成のための体系的研究について述べる。
本稿では、ランク付けされたリストと2つのアプローチ、即興と微調整の代替フォーマットを提案する。
いくつかのSFTモデルは特定の回答形式に一般化するが、RFTで訓練されたモデルは複数のフォーマットでより堅牢であることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:59:23 GMT)
BabyLM's First Constructions: Causal probing provides a signal of learning [4.9] 2024年のBabyLM Challengeにおける言語モデルの構築学習の評価を行った。
以上の結果から, 発達的に妥当なデータ量で訓練しても, モデルは多様な構成を学習することがわかった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:38:36 GMT)
Efficient Sparse State Preparation via Quantum Walks [4.9] 我々は,単一エッジと自己ループの動的CTQWを計算のゲートモデルに変換するアルゴリズムを開発した。
このマッピングを用いて、動的CTQWに基づく効率的な量子状態準備フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:25:25 GMT)
Communication Bias in Large Language Models: A Regulatory Perspective [4.8] 本稿では、EUのAI法やデジタルサービス法のようなフレームワークに焦点を当て、バイアスのあるアウトプットのリスクとその社会的影響をレビューする。
絶え間ない規制を超えて、公正で信頼できるAIを確保するためには、競争やデザインガバナンスへのより強い注意が必要である、と私たちは主張する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:25:06 GMT)
OmniPlantSeg: Species Agnostic 3D Point Cloud Organ Segmentation for High-Resolution Plant Phenotyping Across Modalities [4.8] ハードウェアやニューラルネットワークの入力サイズ要件を満たすために、広範な前処理とプラントポイントクラウドのダウンサンプルを使用することが一般的である。
我々は,センサデータや植物種に依存しない生物点雲のサブサンプリングのための,単純かつ効果的なアルゴリズムKDSSを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:45:14 GMT)
Real-Time System for Audio-Visual Target Speech Enhancement [4.8] 本稿では,CPU上で完全に動作するように設計されたリアルタイム音声・視覚音声強調システムを提案する。
RAVENは、音声・視覚音声認識モデルからの事前学習された視覚埋め込みを用いて、唇の動き情報をエンコードすることで、このギャップを埋める。
このデモでは、参加者はマイクとウェブカメラのセットアップを使って、ヘッドフォンによるクリーンな音声再生によって、ライブの音声と視覚のターゲット音声の強調を体験することができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:45:28 GMT)
Seeing Through Words, Speaking Through Pixels: Deep Representational Alignment Between Vision and Language Models [4.5] 両モデルタイプの中間層から後期層にアライメントピークが存在することが判明した。
画像キャプチャマッチの人間の好みは、すべての視覚言語モデルペアの埋め込み空間に反映される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:16:28 GMT)
General Pruning Criteria for Fast SBL [4.4] スパースベイズ学習(SBL)は、各重みがガウス分布でゼロ平均と精度(逆分散)が関連するハイパーパラメータと等しいと仮定して、基底線形モデルの各重みにハイパーパラメータを関連付ける。
ガウスの場合、2つの条件は相補的であり、高速なSBL(F-SBL)のプルーニング条件と一致することが示され、このアルゴリズムについてさらなる知見が得られた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:52:28 GMT)
Reliability Analysis of Fully Homomorphic Encryption Systems Under Memory Faults [4.3] ホモモルフィック暗号化(英: Homomorphic Encryption、FHE)は、暗号のパラダイムシフトであり、暗号化されたデータを直接計算し、プライバシクリティカルな計算をアンロックすることを可能にする。
本稿では,FHEがメモリ障害の存在下でどのように振る舞うかを,個々の操作やアプリケーションレベルで,異なるFHEスキームに対してより深く理解することを目的とする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:40:16 GMT)
Mixture of Thoughts: Learning to Aggregate What Experts Think, Not Just What They Say [4.3] Mixture of Thoughts (MoT) は、グローバルなルーティング方式の下で、異種の専門家間の潜在レベル協調のための単純な方法である。
MoTは現在のルーティングと集約ベースのアベンジャーズをそれぞれ$+0.38%$と$+2.92%$で上回っている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:50:09 GMT)
Improving Early Sepsis Onset Prediction Through Federated Learning [4.3] 本稿では,セプシオンセット予測のためのフェデレーション・アテンション強化長短期記憶モデルを提案する。
固定予測ウィンドウに依存する既存のアプローチとは異なり、我々のモデルは可変予測水平線をサポートしている。
固定ウィンドウではなく変数予測ウィンドウを採用するという選択は,性能を著しく損なうものではなく,計算,通信,組織的オーバーヘッドを低減させることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:19:22 GMT)
How to Evaluate Medical AI [4.2] アルゴリズム診断(RPAD, RRAD)の相対精度とリコールについて紹介する。
RPADとRADは、AIの出力を単一の参照ではなく複数の専門家の意見と比較する。
大規模な研究によると、DeepSeek-V3のようなトップパフォーマンスモデルは、専門家のコンセンサスに匹敵する一貫性を達成している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:31:04 GMT)
It's not Easy: Applying Supervised Machine Learning to Detect Malicious Extensions in the Chrome Web Store [4.2] そのような拡張の最もよく知られているマーケットプレースは、Chrome Web Store (CWS) である。
このような拡張機能は、Google自身による審査プロセスの後にのみ、ユーザに提供される。
ここでは、教師付き機械学習(ML)に依存する自動メカニズムが、CWS上の悪意ある拡張を検出するのにどの程度有効であるかを精査する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:03:06 GMT)
Accelerate Creation of Product Claims Using Generative AI [4.2] $textbfClaim Advisor$はクレーム検索、生成、最適化、シミュレーションのスピードと経済性を損なうように設計されている。
1)既存の請求項及び/または消費者の声に共鳴する視覚を意味的に検索し,識別する機能,(2)製品の説明と消費者プロファイルに基づいてクレームを生成し,/または最適化する機能,(3)合成消費者によるシミュレーションを用いて作成したクレームのランキングと/または手動で作成する機能,の3つがある。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:17:13 GMT)
Entanglement distillation on symmetric two-qutrit entangled states of rank five [4.1] エンタングルメント蒸留は理論上も実用上も、量子情報の鍵となるステップである。
非陽性部分移動(NPT)が4位以上で絡み合った状態は局所的な手術や古典的なコミュニケーションで1-蒸留可能であることが証明されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:52:56 GMT)
VoiceBBQ: Investigating Effect of Content and Acoustics in Social Bias of Spoken Language Model [3.9] VoiceBBQ(VoiceBBQ)は、不明瞭または曖昧な文脈を示すことによって社会的バイアスを測定するデータセットである。
データセットは、すべてのBBQコンテキストを制御された音声条件に変換し、元のテキストベンチマークに匹敵するアクセントの精度、バイアス、一貫性のスコアを可能にする。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:54:31 GMT)
Parameter-Efficient Adaptation of Geospatial Foundation Models through Embedding Deflection [3.8] DEFLECTは、非常に少数のパラメータを持つマルチスペクトル衛星画像にGFMを適用するための新しい戦略である。
5-10$times$より少ないパラメータで、オンパーまたはより高い精度で分類とセグメンテーションタスクを実現する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:52:37 GMT)
Can social media provide early warning of retraction? Evidence from critical tweets identified by human annotation and large language models [3.8] この調査は、604件の削除記事を参照する3,815件のツイートと、668件の非削除記事を参照する3,373件のツイートを分析した。
人間のアノテーションは、削除された記事の8.3%が、削除される前に少なくとも1つの重要なツイートに関連付けられていることを明らかにした。
この研究は、ソーシャルメディア信号と生成AI技術が組み合わさって、研究の整合性を高める努力をどのように支援するかについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:58:23 GMT)
A Variational Framework for Residual-Based Adaptivity in Neural PDE Solvers and Operator Learning [3.8] 残差ベースの適応戦略は機械学習で広く使われているが、多くは残っている。
残差の凸変換を統合することにより,これらの手法を形式化する統一的変分フレームワークを導入する。
本結果は,残差に基づく適応性の理論的正当性を提供し,原理的離散化と訓練戦略の基礎を確立した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:51:05 GMT)
Fine-tuning of Large Language Models for Domain-Specific Cybersecurity Knowledge [3.7] 大規模言語モデル(LLM)にサイバーセキュリティ知識を組み込むための微調整戦略
サイバーセキュリティのQ&Aデータセットを用いて、スーパーバイザードファインチューニング(SFT)、ローランク適応(LoRA)、量子化ローランク適応(QLoRA)について検討した。
我々の研究は、汎用LLMとドメイン固有のアプリケーション間のギャップを埋めるための低ランク微調整戦略の可能性を強調している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:25:11 GMT)
On the System Theoretic Offline Learning of Continuous-Time LQR with Exogenous Disturbances [3.7] 線形二次規制 (LQR) 戦略のオフライン設計を不確実な乱れを伴う解析を行う。
我々のアプローチは、適応動的プログラミングの基本的な学習ベースのフレームワークの上に構築されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:03:42 GMT)
Robust Multi-Omics Integration from Incomplete Modalities Significantly Improves Prediction of Alzheimer's Disease [3.5] MOIRA(Multi-Omics Integration with Robustness to Absent modalities)は、不完全なオミクスデータから堅牢な学習を可能にする早期統合手法である。
アルツハイマー病(AD)に対する宗教秩序研究と記憶・老化プロジェクトデータセットの評価
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:29:46 GMT)
VideoPASTA: 7K Preference Pairs That Matter for Video-LLM Alignment [3.5] ビデオ言語モデル(Video-LLMs)は、ビデオコンテンツを理解するのに優れているが、空間的関係、時間的順序付け、フレーム間の連続性に苦慮している。
対象の選好最適化を通じてビデオLLMを強化するフレームワークであるVideoPASTAを紹介する。
VideoPASTAは、正確なビデオ表現と慎重に作られた敵の例を区別するためにモデルを訓練する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:30:46 GMT)
Discovering Association Rules in High-Dimensional Small Tabular Data [3.4] Association Rule Miningは、命題ルールの形式でデータセットの特徴間のパターンを見つけることを目的としている。
高次元設定では、ルールの爆発と計算オーバーヘッドにより、一般的なアルゴリズムのアプローチは実用的ではない。
Aerial+のようなニューロシンボリックな手法は、最近ARMの規則の爆発に対処するために提案されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:37:39 GMT)
Bilateral Distribution Compression: Reducing Both Data Size and Dimensionality [3.3] 既存の分布圧縮法は、元の集合と圧縮された集合の間の最大平均離散性(MMD)を最小化することでデータセットサイズを削減する。
両軸に沿って圧縮し,基礎となる分布を保存した2段階のフレームワークであるバイラテラル分布圧縮(BDC)を提案する。
実験により、BDCは環境空間圧縮に匹敵する性能または優れた性能を著しく低コストで達成できることが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:28:50 GMT)
Cryptographic Backdoor for Neural Networks: Boon and Bane [3.3] ニューラルネットワーク(NN)における暗号バックドアは2つの方向に非常に効果的であることを示す。
攻撃側では、慎重に配置された暗号バックドアにより、NNに対する強力で目に見えない攻撃が可能になる。
第1に、ユーザ認証を保証するプロトコル、第3に、NN知的財産権(IP)の不正な共有を追跡するプロトコルである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:27:46 GMT)
Performance Consistency of Learning Methods for Information Retrieval Tasks [3.2] ランダム性を用いて、従来の統計学習モデルとトランスフォーマーに基づく学習モデルについて検討する。
統計モデルは安定しているが、変圧器モデルは種子が変化するにつれて大きな変動を示す。
以上の結果から,トランスフォーマーモデルによる不安定性のトレーニングや,過去の結果の信頼性に関する疑問が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:33:40 GMT)
Lost in Transition: The Struggle of Women Returning to Software Engineering Research after Career Breaks [3.1] しかし、アカデミアは女性の復帰を動機づける機会が限られている。
妊娠、移民状況、柔軟な労働オプションの欠如によるキャリアの混乱は、女性のキャリアの進歩に大きな影響を及ぼす。
我々のゴールは、女性が学術的役割に復帰する際の、業界の役割と比較して、どのような課題に直面するかを探ることです。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:19:42 GMT)
Plant identification in an open-world (LifeCLEF 2016) [3.0] LifeCLEFの植物識別課題は、植物識別方法やシステムを大規模に評価することを目的としている。
2016年の第2版は実際に西ヨーロッパに生息する1000種の植物を映し出した110万枚以上の画像に基づいて行われた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:01:13 GMT)
Plant identification based on noisy web data: the amazing performance of deep learning (LifeCLEF 2017) [3.0] LifeCLEFの植物識別チャレンジは、自動植物識別システムにとって重要なマイルストーンである。
LifeCLEF 2017の課題は、Webを通じて収集された大規模なノイズの多いトレーニングデータセットをどの程度評価し、ラベル付けエラーが多数含まれているかを評価することを目的としている。
本稿では,課題の資源と評価をより正確に提示し,参加研究グループが採用するアプローチとシステムを要約し,主な成果について分析する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:47:43 GMT)
Overview of ExpertLifeCLEF 2018: how far automated identification systems are from the best experts? [3.0] LifeCLEF 2018 ExpertCLEFチャレンジは、人間の専門家と自動化システムの比較を可能にするように設計されている。
フランスの植物学の専門家9名を対象に,4つの異なる研究チームが実施した19のディープラーニングシステムを評価した。
主な成果は、最先端のディープラーニングモデルのパフォーマンスが、現在最も高度な人間の専門知識に近いことである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:54:03 GMT)
On the hardness of approximating minimum distances of quantum codes [2.9] 誤り訂正符号の計算距離の問題は古典的設定と量子的設定の両方において基本的な問題である。
特に、古典的線形符号の最小距離問題から、最も一般的に使用される量子符号であるCSS符号の直接削減が得られる。
グラフの隣接行列が入力であるとき、グラフ状態の距離を計算/近似することはNPハードであることが示される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:35:49 GMT)
Advancing Universal Deep Learning for Electronic-Structure Hamiltonian Prediction of Materials [2.8] 我々は、ハミルトン予測のための普遍的な深層学習パラダイムを進化させるために、方法論とデータセットの双方に貢献する。
NextHAMは、効率的で一般化可能な電子構造ハミルトニアン予測のためのニューラルネットワークE(3)対称性および表現的補正法である。
Materials-HAM-SOCの実験結果から、NextHAMはハミルトニアンやバンド構造を予測するのに優れた精度と効率を達成することが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:01:42 GMT)
Expressive Power of Deep Networks on Manifolds: Simultaneous Approximation [2.8] 境界重みを持つ定数深度$mathrmReLUk-1$ネットワークは、ソボレフ空間内の任意の関数を近似することができることを示す。
また、必要なパラメータ数が対数係数に一致することを示すことで、我々の構成がほぼ最適であることを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 04:40:47 GMT)
An Improved Quantum Software Challenges Classification Approach using Transfer Learning and Explainable AI [2.8] 開発者はStack Overflow(SO)を使用して、課題について議論し、特殊な量子タグでポストをラベル付けする。
量子関連タグを用いてQ&Aプラットフォームから2829の質問を抽出した。
ポストは、頻繁な課題を特定し、新しい根拠理論を開発するために分析された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:19:50 GMT)
Shoot from the HIP: Hessian Interatomic Potentials without derivatives [2.4] ヘッセンは、システムサイズで計算し、スケールするのが高価である。
深層学習モデルから直接ヘッセンを予測できることを実証する。
これにより、HIP Hessianは、桁違いに高速で、より正確で、よりメモリ効率が良く、トレーニングが容易になり、システムサイズでより好ましいスケーリングを可能にします。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:43:34 GMT)
No Universal Purification in Quantum Mechanics [2.4] 量子力学の線形性と肯定性は、量子浄化に一般の制約を課すことを証明している。
量子演算は、未知の量子状態やチャネルの有限個のコピーを、入力に依存する純粋な状態やチャネルに変換することはできない。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:56:17 GMT)
Semantic Clustering of Civic Proposals: A Case Study on Brazil's National Participation Platform [2.4] 本稿では,BERとシード語を組み合わせたアプローチと,大規模言語モデルによる自動検証を提案する。
最初の結果は、生成したトピックは、最小限の人的労力で、一貫性があり、制度的に整合していることを示している。
この手法により、政府は大量の市民入力を公共政策のための実行可能なデータに変換することができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:11:14 GMT)
CTI Dataset Construction from Telegram [2.4] サイバー脅威インテリジェンス(CTI)は、組織がサイバー脅威を予測し、検出し、進化させることを可能にする。
近年、Telegramは貴重なCTIソースとして有名になり、タイムリーで多様な脅威関連情報を提供している。
本稿では,Telegramから脅威関連コンテンツを体系的に収集・フィルタリングするエンドツーエンドの自動パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:27:10 GMT)
Psychological and behavioural responses in human-agent vs. human-human interactions: a systematic review and meta-analysis [2.3] インタラクティブな知的エージェントは社会全体で統合されています。
人間のような能力を達成するにも拘わらず、これらのエージェントに対する人間の反応はいまだに理解されていない。
一致した人間-エージェントと人間-人間の対話における心理的・行動的反応を比較検討した最初の体系的合成を行った。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:29:36 GMT)
PALADIN: Self-Correcting Language Model Agents to Cure Tool-Failure Cases [2.3] PALADINは、系統的な障害注入によって構築された5万以上のリカバリアノテーション付き軌道を走行する。
トレーニングでは、LoRAベースの微調整を使用して、回復能力を注入しながらベース能力を維持する。
このアプローチは、トレーニング分布を超えた新しい失敗に一般化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:37:30 GMT)
An Automated Retrieval-Augmented Generation LLaMA-4 109B-based System for Evaluating Radiotherapy Treatment Plans [2.3] 我々は,LLaMA-4 109Bを用いた放射線治療計画の自動化,プロトコル認識,解釈可能な評価のためのRAGシステムを開発した。
RAGシステムは5つのSentenceTransformerバックボーンに最適化された検索エンジン、コホート類似性に基づくパーセンタイル予測コンポーネント、臨床制約チェッカーの3つのコアモジュールを統合している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:18:31 GMT)
MPC-based Deep Reinforcement Learning Method for Space Robotic Control with Fuel Sloshing Mitigation [2.2] 本稿では、部分的に充填された燃料タンクを用いた自律衛星ドッキングのための強化学習(RL)とモデル予測制御(MPC)フレームワークを提案する。
そこで我々は,PPOアルゴリズムとSACアルゴリズムをMPCと統合し,MPCの予測能力を活用してRLトレーニングを加速し,制御の堅牢性を向上させる。
本研究は, 燃料効率と耐障害性のある衛星ドッキングを推し進め, 軌道上再給油・給油ミッションの実現可能性を高めた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:51:07 GMT)
Shift Happens: Mixture of Experts based Continual Adaptation in Federated Learning [2.2] フェデレートラーニング(FL)は、生データを共有することなく、分散クライアント間で協調的なモデルトレーニングを可能にする。
我々は,検出された分散シフトに応じて,特殊なグローバルモデルを動的に生成し,訓練する専門家フレームワークのシフト対応ミックスであるShiftExを紹介する。
本研究では,5.5-12.9ポイントの精度向上と22-95%の適応率を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:22:08 GMT)
Limits to black-box amplification in QMA [2.2] 量子複雑性クラスQMAにおけるブラックボックス増幅の限界について検討する。
増幅は、完全性と音響性の間の逆ポリノミカルギャップを指数的に小さな誤差に押し上げることが知られている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:21:27 GMT)
Generative AI for FFRDCs [2.1] 少数の入力出力例で,大規模言語モデルが要約,分類,抽出,センスメイキングをいかに促進できるかを示す。
センシティブな政府コンテキストでの使用を可能にするために、生成AIのセキュアで柔軟な応用のためのオープンソースのフレームワークであるOnPrem$.LLMを適用する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:45:39 GMT)
SlotFM: A Motion Foundation Model with Slot Attention for Diverse Downstream Tasks [2.1] 本稿では,様々な下流タスクを一般化した加速度センサ基礎モデルであるSlotFMを提案する。
我々はSlotFMを、標準的な人間の活動認識を超えた16の分類と回帰ダウンストリームタスクで評価した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:41:43 GMT)
ExpIDS: A Drift-adaptable Network Intrusion Detection System With Improved Explainability [2.1] 深層学習に基づくNIDS ExpIDS を設計し,高い決定木説明精度を実現する。
我々は、ExpIDSが、最先端NIDSに匹敵する、高い決定木説明忠実度と悪意のあるトラフィック検出性能を達成することを検証した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:47:42 GMT)
PerHalluEval: Persian Hallucination Evaluation Benchmark for Large Language Models [2.0] PerHalluEvalはペルシア語用に調整された最初の動的幻覚評価ベンチマークである。
本ベンチマークでは,QAおよび要約タスクに関する妥当な回答と要約を生成する。
生成したトークンのログ確率を用いて、最も信頼できる幻覚インスタンスを選択しました。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:50:46 GMT)
CORE: Full-Path Evaluation of LLM Agents Beyond Final State [2.0] 既存のエージェントベンチマークでは、最終状態のバイナリ判断に対する評価を少なくすることが多い。
本稿では,タスクを有効なツール利用経路の集合として符号化する決定論的有限オートマトンに基づくフレームワークを提案する。
CORE(Path Correctness)、Path Correctness(Path Correctness)、Kendall's tau Composite(Kendall's tau Composite)、Prefix Criticality(Prefix Criticality)、Harmful-Call Rate(Harmful-Call Rate)、Efficency(Efficency)の5つのメトリクススイートを紹介します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:49:35 GMT)
Few-Shot and Training-Free Review Generation via Conversational Prompting [2.0] 現実世界のアプリケーションは、ほとんどショットやトレーニングなしの状況に直面することが多い。
本稿では,ユーザレビューをマルチターン会話として再構成する軽量な手法である会話型プロンプトを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:36:08 GMT)
Sycophancy Is Not One Thing: Causal Separation of Sycophantic Behaviors in LLMs [2.0] 我々は、真の合意とは対照的に、空想的合意と空想的賞賛を分解する。
結果は、サイコファンティックな行動は、独立して選択可能な表現と一致していることを示唆している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:19:39 GMT)
It's Not You, It's Clipping: A Soft Trust-Region via Probability Smoothing for LLM RL [2.0] PPOやGRPOのような強化学習(RL)手法を用いた大規模言語モデル(LLM)の訓練は、更新の安定化に比例する。
重要度を計算する前に、従来の(行動)政策に対する現在の政策の確率を円滑にするPSPOを提案する。
GR-PSPOはクリップされたGRPOと比較して0.5Bと1.5Bの両方のパフォーマンスを大幅に改善し、GSM8Kでは20%以上向上した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:03:18 GMT)
Crosscap states and duality of Ising field theory in two dimensions [1.9] 2次元イジング場理論に対して、2つの異なるクロスキャップ状態を提案する。
我々はマヨラナ自由場表現を導出し、ボゾン化法を拡張して、2次元イジング共形場理論の相関関数を計算する。
イジング場理論では、解析結果は関連する摂動の下でのクラインボトルエントロピーの予想単調性を支持する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:04:25 GMT)
Why Attention Fails: The Degeneration of Transformers into MLPs in Time Series Forecasting [1.9] トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンで高い性能を達成した。
しかし、多くの研究では、時系列予測において明確な優位性を示していないことが示されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:25:51 GMT)
Understanding the Issue Types in Open Source Blockchain-based Software Projects with the Transformer-based BERTopic [1.6] 本稿では,GitHubにホストされている1,209のオープンソースブロックチェーンプロジェクトから抽出した497,742件について,大規模な実証研究を行った。
私たちの分析によると、一般的なソフトウェア開発の問題とブロックチェーン特有の懸念の両方が、ほぼ同じように表現されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:27:12 GMT)
Quantum Simulation of Fermions in $AdS_2$ Black Hole: Chirality, Entanglement, and Spectral Crossovers [1.6] 我々は、離散化された$AdS$ブラックホール背景上の自由ディラックフェルミオンを考える。
我々は、曲線空間の赤方偏移、地平線、スピン接続がカイラル重力効果のスペクトル、輸送、揺らぎ現象をどのように引き起こしたかを分析する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:00:11 GMT)
A regret minimization approach to fixed-point iterations [1.4] 本稿では,後悔の最小化アルゴリズムを固定点反復に変換する変換方式を提案する。
結果として生じる反復は、古典的なクラスノゼルスキイ-マンの反復の壮大な拡張と見なすことができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:13:30 GMT)
Visual Authority and the Rhetoric of Health Misinformation: A Multimodal Analysis of Social Media Videos [1.4] 本研究は,栄養・補充ビデオの信頼性について,権威信号の交わり,物語の技法,マネタイズを分析して検討した。
われわれはTikTok、Instagram、YouTubeの152の公開ビデオからなるクロスプラットフォームコーパスを組み立て、視覚的権威、プレゼンター属性、物語戦略、エンゲージメントのキューを含む26の機能に注釈を付ける。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:56:38 GMT)
Quantum Algorithm for Subcellular Multiscale Reaction-Diffusion Systems [1.4] 重要な課題は「次元の計算」にある
これらの課題を克服するために設計された量子アルゴリズムフレームワークを導入する。
この枠組みは生物学的に関連する細胞内プロセスのシミュレーションへの扉を開く。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:04:41 GMT)
Quantum est in Libris: Navigating Archives with GenAI, Uncovering Tension Between Preservation and Innovation [1.4] 古代と近代の交差点を「リリスの静けさ」が探求している。
一方、エストニア国立博物館(ERM)の写本は1世紀以上前のアーカイブである。
一方、これらの素材を動的かつインタラクティブな体験に変換する技術がある。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:58:09 GMT)
Problem Solved? Information Extraction Design Space for Layout-Rich Documents using LLMs [1.3] 本稿では,大規模言語モデル(LLM)を用いたレイアウトリッチドキュメントからの情報抽出のための設計空間を定義し,検討する。
本研究では,入力表現,チャンキング,プロンプト,LLMの選択,マルチモーダルモデルなど,これらのコア課題におけるサブプロブレムと手法について検討する。
LayIE-LLM(LayIE-LLM)は、オープンソースのレイアウト対応IEテストスイートである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:27:41 GMT)
An entropy-optimal path to humble AI [1.3] ボルツマンマシンの非平衡エントロピー最適化再構成のための新しい数学的枠組みを導入する。
その結果, 数学的に整合した存在と独特さの基準を持つ, 高性能だがより安価で, 勾配のない学習フレームワークが得られた。
この枠組みを歴史的気候データに適用すると、重要なラニーナ現象とエルニーノ現象の発症の予測スキルが体系的に高いモデルが得られる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:18:04 GMT)
Constraints on axion-like dark matter from a SERF comagnetometer [1.2] 我々は,NOble and Alkali Spin Detectors for Ultralight Coherent darK matter (NASDUCK) の地球外領域について報告する。
この検出器は希ガスとアルカリ金属原子の核を使用し、スピン交換自由(SERF)体制で作動する。
質量範囲は 10-12$eV/$c2$ から $2times 10-10$eV/$c2$ で、堅牢な天体境界に取って代わる限界を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:27:10 GMT)
Automated Formative Feedback for Short-form Writing: An LLM-Driven Approach and Adoption Analysis [1.2] 本稿では,工学プログラムにおけるAIベースの形式的フィードバックの開発と導入について検討する。
学生にドラフトレポートに対するパーソナライズされたフィードバックを提供し、完全性と品質の向上に向けて指導するためのツールが開発された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:17:51 GMT)
Coherent control of photonic spin Hall effect in a Cavity [1.2] 本稿では,光スピンホール効果(フォトニックSHE)のキャビティ内における4レベルクローズドコヒーレント制御結合方式による操作について理論的に検討する。
このシステムは、CTL構成で複数の透過窓を示し、可変フォトニックSHEをより広い範囲のプローブフィールドデチューニングで使用できる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:26:13 GMT)
AutoClimDS: Climate Data Science Agentic AI -- A Knowledge Graph is All You Need [1.2] 気候データ科学は、データソースの断片化された性質、異質なフォーマット、データセットを特定し、取得し、処理するために必要な急激な技術的専門知識から生じる永続的な障壁に直面している。
クラウドネイティブな科学研究のために設計されたAIエージェントと、キュレートされた知識グラフ(KG)を統合することで、これらの障壁に対処するための概念実証を行う。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:38:23 GMT)
A Real-Time On-Device Defect Detection Framework for Laser Power-Meter Sensors via Unsupervised Learning [1.1] このシステムは、正常なコーティング分布パターンを学習するために、良質なセンサイメージのみを訓練する教師なし異常検出フレームワークを使用している。
このシステムは、デバイス上の実装において、自動品質制御と1イメージあたり0.5秒の処理時間を通じて、潜在的な年間コスト削減を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:29:20 GMT)
Probing Bandwidth and Sensitivity in Rydberg Atom Sensing via Optical Homodyne and RF Heterodyne Detection [1.1] ライドバーグ原子ベースのセンサーは、SIトレーサブル測定を可能にする。
本稿では,ルビジウム気相セルにおけるRydberg原子系センサの帯域幅と感度について検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:03:39 GMT)
Automated and Interpretable Survival Analysis from Multimodal Data [1.1] 本稿では,臨床変数とCT画像の統合による生存分析の自動化を目的とした,解釈可能なマルチモーダルAIフレームワークを提案する。
我々のMultiFIXベースのフレームワークは、Grad-CAMを介して解釈される生存関連機能を深層学習で推測する。
頭頸部癌に対するオープンソースのRADCUREデータセットを用いて、MultiFIXは0.838(予測)と0.826(成層化)のCインデックスを達成する
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:13:39 GMT)
Optimal Robust Recourse with $L^p$-Bounded Model Change [1.1] データ分散や環境の変化を反映するために、しばしばモデルが更新される。
一般化線形モデルに対する最適ロバストなリコースを確実に計算する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:11:51 GMT)
GEP: A GCG-Based method for extracting personally identifiable information from chatbots built on small language models [1.0] 小型言語モデル(SLM)は、大型言語モデル(LLM)と比較してほぼ同等の性能のため、前例のないほど魅力的になる。
しかし、下流タスクのためのSLMの個人識別情報(PII)漏洩は未だ調査されていない。
PII抽出に特化して設計されたgreedy coordinate gradient-based (GCG) 法である GEP を提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:05:47 GMT)
Analysis of instruction-based LLMs' capabilities to score and judge text-input problems in an academic setting [0.8] LLM(Large Language Model)は、LLM-as-a-JudgeやLLMの微調整といった手法によって研究される評価器として機能する。
本稿では,3つのモデルを持つ高校生のコンピュータ科学に関する110の回答をカスタムデータセットで検証した5つの評価システムを提案する。
平均絶対偏差 (0.945) と最低根平均正方偏差 (1.214) を人的評価と比較すると, 基準支援評価は見識的, 完全評価とともに公正スコアを提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:26:23 GMT)
QECO: A QoE-Oriented Computation Offloading Algorithm based on Deep Reinforcement Learning for Mobile Edge Computing [0.8] 効率的なタスクオフロードは、ユーザにとってシームレスな品質のエクスペリエンス(QoE)を保証する上で、重要な役割を担います。
深部強化学習(DRL)に基づく分散QoE指向計算オフロード(QECO)アルゴリズムを提案する。
シミュレーションの結果、QECOはタスクの完了数を最大14.4%増加させ、タスク遅延とエネルギー消費をそれぞれ9.2%と6.3%削減した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:11:21 GMT)
Benchmarking Quantum Computers: Towards a Standard Performance Evaluation Approach [0.7] 我々は、古典的なプロセッサベンチマークとそれらを構成するメトリクスの両方の最も重要な側面についてレビューする。
量子コンピューティングのパラダイムを特徴付ける本質的な特性を解析する。
本稿では,量子ベンチマークの一般的なガイドラインを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:03:16 GMT)
A Review on Quantum Circuit Optimization using ZX-Calculus [0.7] ZX計算は、セマンティックス保存量子回路最適化を可能にする代替フレームワークとして登場した。
本稿では、ZXに基づく量子回路の最適化について概観し、最適化手法、ターゲットメトリック、量子コンピューティングアーキテクチャにより分類する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:48:07 GMT)
Gender Stereotypes in Professional Roles Among Saudis: An Analytical Study of AI-Generated Images Using Language Models [0.6] ImageFX, DALL-E V3, およびGrokが生成した1,006の画像を, 56種類のサウジアラビアの専門職に対して分析した。
ImageFXの出力は85%が男性、Grok 86.6%が男性、DALL-E V3が96%である。
反ステレオタイプ的イメージは、真に進歩的な描写というよりはむしろ文化的な誤解から生じることが多い。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:30:51 GMT)
Generalized Gradient Descent is a Hypergraph Functor [0.5] 勾配降下は最適化問題のハイパーグラフ圏から力学系のハイパーグラフ圏へハイパーグラフ関手を誘導することを示す。
本稿では、ハイパーグラフ関手が、ドメイン内で指定された任意の合成問題に対して分散最適化アルゴリズムをいかに誘導するかを説明する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:17:47 GMT)
Learning Terrain-Specialized Policies for Adaptive Locomotion in Challenging Environments [0.5] この研究は、地形に特化されたポリシーとカリキュラムの学習を活用して、複雑な環境での俊敏性を高め、パフォーマンスを追跡する階層的な強化学習フレームワークを導入する。
本研究では,本手法をシミュレーションで検証し,本手法は成功率を最大16%向上させ,速度目標の増大とともに追従誤差の低減を図る。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:17:39 GMT)
Measuring LLM Sensitivity in Transformer-based Tabular Data Synthesis [0.5] トランスフォーマーベースのモデルは、データ品質の点で他の最先端モデルよりも優れている。
高い計算コストは、プロサマーハードウェアを持つエンドユーザーには実現不可能な場合があります。
GReaTは、REaLTabFormerよりも低いランタイムを一貫して達成し、最も大きなデータセットでしか実行できない。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:48:48 GMT)
Frequency-Aware Model Parameter Explorer: A new attribution method for improving explainability [0.4] 我々は、転送可能な周波数認識攻撃と呼ばれる、転送可能な敵攻撃の新しいカテゴリを提案する。
また、周波数認識モデルエクスプローラ(FAMPE)という新しい属性手法を提案する。
現在の最先端手法である AttEXplore と比較して,FAMPE の平均値が13.02% に達した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 15:00:44 GMT)
Fractals and spontaneous symmetry breaking with type-B Goldstone modes: a perspective from entanglement [0.4] 1次元スピン-$s$ $rm SU(2)$ 強磁性ハイゼンベルク模型は、タイプBゴールドストーンモード(GM)を持つ自然対称性破壊(SSB)のパラダイム的な例として、基底状態部分空間の下の抽象的なフラクタルを示すことが期待されている。
この内在的な抽象フラクタルは、カントール集合の集合に分解可能なフラクタル上の因子化(アンタングル化)基底状態の線形結合に対する絡み合いエントロピーの体系的な研究から明らかである。
我々の議論は、タイプBGMでSSBを実行している任意の量子多体系に拡張されるかもしれない
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:50:08 GMT)
i-LAVA: Insights on Low Latency Voice-2-Voice Architecture for Agents [0.4] 我々は,音声音声合成システム(V-2-V)に不可欠なコンポーネントを解析し,自動音声認識(ASR),テキスト音声合成(TTS),ダイアログ管理を行う。
我々の研究は、自然停止や宣言を含む感情に満ちた生活に似た音声を生成するTTS成分がリアルタイムファクター(RTF)に最も影響を与えることを確認した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:15:51 GMT)
World's First Authenticated Satellite Pseudorange from Orbit [0.4] 本稿では,Pulsarの透かし設計とセキュリティ解析について論じる。
我々はPulsar透かしの誤検知と誤警報の確率を導出する。
軌道からの送信を利用したパルサー透かしの検証結果を示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:14:12 GMT)
Extrapolating Phase-Field Simulations in Space and Time with Purely Convolutional Architectures [0.4] LMD(Liquid Metal dealloying)の位相場モデルは、リッチな微細構造力学を解くことができるが、大きな領域や長い時間的地平線では難解となる。
条件付きパラメータ化された完全に畳み込みされたU-Netサロゲートは、空間と時間の両方でトレーニングウィンドウをはるかに越えて一般化する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:52:59 GMT)
Guiding Application Users via Estimation of Computational Resources for Massively Parallel Chemistry Computations [0.4] 我々は,スーパーコンピュータ上で高価な実験を行うことにコミットする前に,アプリケーションユーザを誘導する機械学習戦略を開発する。
アプリケーション実行時間の予測により、ノード数やタイルサイズなどの最適な実行時パラメータ値を決定する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:00:36 GMT)
Painless Activation Steering: An Automated, Lightweight Approach for Post-Training Large Language Models [0.4] アクティベーションステアリング(AS)は、既存の2つのポストトレーニング方法に代わる、安価で、高速で、制御可能な代替手段を約束する。
完全に自動化された手法のファミリーであるPainless Activation Steering (PAS)を紹介する。
PASは行動タスクのパフォーマンスを確実に向上させるが、インテリジェンス指向のタスクには向いていない。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:25:47 GMT)
Decoupled-Value Attention for Prior-Data Fitted Networks: GP Inference for Physical Equations [0.4] PFNは、物理系の高速サロゲートを生成するための時間消費ガウス過程(GP)推論の代替として有望である。
本稿では,DVA(Decoupled-Value Attention)を導入し,関数空間が入力上のカーネルによって完全に特徴付けられるというGP特性を動機とした。
PFNをスケールする上で重要な要素は,アーキテクチャ自体よりもアテンションルールにあることを実証する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:32:42 GMT)
Information-theoretic analysis of complex eigenmodes across avoided crossings in open microcavities [0.4] 複素固有周波数を持つオープンマイクロキャビティは、開度と損失がモーダル構造を再編成する様子を観察するための便利なプラットフォームを提供する。
実数体と虚数体の確率重みによる複素QNMを表すコンパクトな四角形空間フレームワークを提案する。
この手法を交流領域に適用すると、非局在化は個々の二次構造の拡大だけでなく、交流近傍における内部相関の顕著な増大によっても引き起こされることが分かる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:46:57 GMT)
From Indexing to Coding: A New Paradigm for Data Availability Sampling [0.4] 我々はDASに新たなアプローチを導入し、オンザフライコーディングによるサンプリングを行いながら、未コーディングデータにコミットすることで、コーディングとコミットメントのプロセスをモジュール化する。
結果として得られたサンプルははるかに表現力が高く、光ノードは具体的実装において、データの可用性の保証を最大で複数の順序で得ることができる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:59:35 GMT)
Revolutionizing Precise Low Back Pain Diagnosis via Contrastive Learning [0.3] 腰痛は世界中の何百万もの人に影響を与え、堅牢な診断モデルの必要性を喚起する。
我々は,腰椎MRIスキャンとそれに対応する放射線学的記述との整合性を確保するために,コントラスト言語画像事前訓練を利用する新しいフレームワークであるLumbarCLIPを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 06:52:25 GMT)
FHRFormer: A Self-supervised Transformer Approach for Fetal Heart Rate Inpainting and Forecasting [0.3] 胎児心拍数(FHR)モニタリングは、出生前医療における胎児の健康を評価する上で重要な役割を担っている。
人工知能(AI)手法を適用して、持続的なFHR監視エピソードの大規模なデータセットを分析することで、呼吸補助や介入を必要とするリスクを予測する新たな洞察が得られるかもしれない。
マスク付きトランスフォーマーを用いたオートエンコーダ手法を提案し, 空間成分と周波数成分の両方を捕捉することにより, 欠落したFHR信号を再構成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:40:21 GMT)
ALICE: An Interpretable Neural Architecture for Generalization in Substitution Ciphers [0.3] 本稿では、ニューラルネットワークの推論と一般化を研究するための理想的なテストベッドとして、暗号解法を提案する。
我々は,この復号化問題の精度と速度を両立させる,シンプルなエンコーダのみの変換器であるALICEを開発した。
驚くべきことに、ALICEはsim1500$のユニークな暗号をトレーニングした後、目に見えない暗号に一般化している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:15:04 GMT)
Human Semantic Representations of Social Interactions from Moving Shapes [0.3] 視覚的特徴を補うために人間が使用する意味表現について検討する。
人間の類似性判定により,27の社会的相互作用の表現幾何学を測定した。
意味モデルの中で、記述から抽出された動詞ベースの埋め込みは、人間の類似性判断が最善である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:15:50 GMT)
Multimodal Deep Learning for Phyllodes Tumor Classification from Ultrasound and Clinical Data [0.3] Phyllodes tumors (PTs) は良性線維腺腫との放射線学的類似性から術前の分類が困難である。
乳房超音波(BUS)画像を構造化された臨床データと統合して診断精度を向上させるマルチモーダルディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:00:16 GMT)
Predicting Male Domestic Violence Using Explainable Ensemble Learning and Exploratory Data Analysis [0.2] 本研究ではバングラデシュにおける男性家庭内暴力(MDV)の新しいデータ駆動分析法を提案する。
バングラデシュの9大都市から収集したデータを探索データ分析(EDA)を用いて解析した。
EDAは, 言語虐待の頻度, 金銭的依存の影響, MDVにおける家族的・社会経済的要因の役割などのパターンを明らかにした。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:50:42 GMT)
AutoIntent: AutoML for Text Classification [0.2] AutoIntentは、埋め込みモデル選択、分類器最適化、決定しきい値チューニングを備えたエンドツーエンドの自動化を提供する。
AutoIntentは、標準的なインテント分類データセット上の既存のAutoMLツールよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:27:52 GMT)
Energy saving in off-road vehicles using leakage compensation technique [0.2] 本論文は, 重土移動装置に用いるリニアアクチュエータのエネルギー効率向上に焦点をあてる。
PFCVを用いた油圧回路はPDCVを用いた従来の回路よりも8.5%エネルギー効率が高い。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:11:27 GMT)
Machine Learning for Pattern Detection in Printhead Nozzle Logging [0.2] ノズルロギングの多面的データセットに基づくプリントヘッド故障分類の問題点について検討する。
本稿では,この問題に対する機械学習の分類手法を提案する。
提案モデルでは、複数の故障機構に対する重み付けされたF1スコアを用いて、社内ルールベースのベースラインよりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:41:10 GMT)
Cascade! Human in the loop shortcomings can increase the risk of failures in recommender systems [0.1] Human-in-the-loop」は、主に説明責任の問題に対処するために広く採用されている。
我々は、リコメンデータシステム設計における人間の監視もまた、まだ完全に説明されていない新しいリスクを伴っていると考えている。
他のAIシステムに対して有意義な監視を提供するための"Human-in-the-loop"プラクティスの欠点に関する新たな知識は、社会的に責任を負うレコメンデーションを達成するのに不十分である可能性を示唆している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:14:50 GMT)
Context-Aware Hybrid Routing in Bluetooth Mesh Networks Using Multi-Model Machine Learning and AODV Fallback [0.1] Bluetoothベースのメッシュネットワークは、緊急およびリソース制約のあるシナリオにおけるオフライン通信のための有望なインフラストラクチャを提供する。
Adhoc On-Demand Distance Vector (AODV)のような従来のルーティング戦略は、しばしば混雑と動的トポロジ的変化の下で劣化する。
本研究では,教師付き機械学習によりAODVを増強し,ホップ選択を改善するハイブリッドなインテリジェントルーティングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:49:24 GMT)
Downscaling human mobility data based on demographic socioeconomic and commuting characteristics using interpretable machine learning methods [0.1] 本研究は,ニューヨーク市内におけるOrigin-Detination (OD) タクシーの走行をダウンスケールする機械学習フレームワークを提案する。
OD旅行と人口統計,社会経済,通勤特性の相関関係を考察した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:55:10 GMT)
Smearing of dynamical quantum phase transitions in dissipative free-fermion systems [0.0] 消散性二次フェルミオン系におけるLoschmidtエコー(RLE)のリンドブラッドダイナミクスについて検討した。
対応するユニタリ力学に存在する非解析性は、純粋にゲインまたは純粋に損失過程の下で生き残ることができることを示す。
また, 発散動力学と単体動力学の微妙な相互作用は, RLEの力学においてネストした光錐構造を生じさせることを示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:59:20 GMT)
Small LLMs with Expert Blocks Are Good Enough for Hyperparamter Tuning [0.0] 我々は小言語モデルを用いたHPTのためのエキスパートブロックフレームワークを提案する。
Trajectory Context Summarizer (TCS)は、生のトレーニング軌跡を構造化されたコンテキストに変換する決定論的ブロックである。
TCS対応HPTパイプラインは、6つのタスクでGPT-4の0.9パーセントの範囲で平均性能を達成する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:26:44 GMT)
Simulating Student Success in the Age of GenAI: A Kantian-Axiomatic Perspective [0.0] 本研究は,モンテカルロシミュレーションを用いて,生成型AI(GenAI)を用いた学生の認知的成功を,カンチアン・アキシマティックレンズを用いて再解釈する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 03:01:39 GMT)
Series of molecular-like doubly excited states of a quasi-three-body Coulomb system [0.0] ストロンチウム原子の高角運動量惑星状態の共鳴多光子励起について検討した。
二重イオン化しきい値に収束する2重励起電子状態が第一原理計算によって同定され、再現された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:22:14 GMT)
Semantic Data Representation for Explainable Windows Malware Detection Models [0.0] 本稿では,PEマルウェアファイルに対する再利用可能なセマンティックスキーマを提供するPEマルウェアオントロジーを提案する。
このオントロジーは、PEファイルの静的マルウェア解析に焦点を当てたEMBERデータセットの構造に着想を得たものである。
また、EMBERの実験を支援するために、分数データセットを含む意味的に処理されたEMBERデータも公開する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:47:17 GMT)
Quantifying depressive mental states with large language models [0.0] 大規模言語モデル(LLM)はメンタルヘルスにおいて重要な役割を担っている。
3つの臨界試験におけるLLM性能の概要と評価を行った。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:11:20 GMT)
Probing non-equilibrium steady states of the Klein-Gordon field with Unruh-DeWitt detectors [0.0] 非平衡定常状態に結合したUnruh-DeWitt検出器の遷移速度を計算する。
検出器はモノポール相互作用により磁場に直線的に結合し、NESS熱流の軸に沿って運動する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:13:10 GMT)
Part-of-speech tagging for Nagamese Language using CRF [0.0] 本稿では,ナガメ語における自然言語処理(NLP)の重要な課題である音声タグ付けについて検討する。
16,112個のトークンの注釈付きコーパスを作成し、条件ランダムフィールド(Conditional Random Fields, CRF)として知られる機械学習技術を適用した。
CRFを用いて、全体のタグ付け精度は85.70%、精度は86%、f1スコアは85%である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:44:43 GMT)
Optimal squeezing to minimize vulnerability to losses [0.0] 非ガウス状態の損失に対するロバスト性は、量子状態の前処理によって著しく改善できることを示す。
このようなよく知られた量子状態は、シュロディンガー・キャット、フォック、バナナのものとみなす。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:58:41 GMT)
On the Quantization of the Electromagnetic Field with Magnetic Monopoles [0.0] 磁気モノポールの存在下での電磁場の量子化のための共変フレームワークを提案する。
我々は、従来の光子に加えて、磁気電荷に付随する二重光子の存在を予測する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:45:07 GMT)
Observation of resonant monopole-dipole energy transfer between Rydberg atoms and polar molecules [0.0] ヘリウム中のリドバーグ準位はアンモニア分子との低温衝突で観測されている。
このハイブリッドリドバーグ原子の極分子はモノポール-双極子エネルギー交換反応を表す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:57:43 GMT)
Nonstabilizerness of a Boundary Time Crystal [0.0] 境界時間結晶はその定常状態の絡み合いにおいて測定誘起相転移を示す。
非安定度は、異なる未発見のスキームの下で不変である。
発見は、オープンシステムで異なる量子リソースがどのように現れるかについての洞察を与える。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:21:11 GMT)
Neural Operators for Mathematical Modeling of Transient Fluid Flow in Subsurface Reservoir Systems [0.0] 本稿では, 開発型ニューラルオペレーターアーキテクチャ(TFNO-opt)に基づく地下貯留層における過渡流動のモデル化手法を提案する。
提案したアーキテクチャは、無限次元関数空間におけるPDE解の近似を可能にするフーリエニューラル演算子に基づいている。
提案手法の有効性を計算実験により確認した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:45:07 GMT)
MolPILE - large-scale, diverse dataset for molecular representation learning [0.0] MolPILEは2億2200万の化合物の大規模で多様で厳密な収集品である。
この研究はモデルトレーニングのための標準化されたリソースを提供し、分子化学におけるImageNetのようなデータセットの必要性に対処する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:48:11 GMT)
Measuring Algorithmic Partisanship via Zero-Shot Classification and Its Implications on Political Discourse [0.0] 本稿では、ゼロショット分類手法を用いて、アルゴリズムによる政治的パルチザン性を評価する。
6つの主要な大言語モデルにまたがる1800のモデル応答は、4つの異なる微調整された分類アルゴリズムに個別に入力された。
その結果、リベラルな権威主義的なアライメントが増幅され、推論のスーパーセッションや缶詰の拒絶の顕著な例が示されている。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 05:26:20 GMT)
ML-PWS: Estimating the Mutual Information Between Experimental Time Series Using Neural Networks [0.0] 実験的な時系列データから生成モデルを構築するために機械学習を利用する手法を提案する。
ML-PWSとよばれるこの手法の精度を,PWSを同一モデルに直接適用することによって得られる地中信頼度に対して示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:26:54 GMT)
Isentropic processes for axisymmetric Black Holes [0.0] 古典的荷電試験粒子の等エントロピー吸収は、重力の微分同相不変理論において、すべての3+1次元定常非極端軸対称ブラックホールに対して古典的に禁じられていることを示す。
さらに、量子トンネル法を用いて、一般相対性理論と解析においてカー・ニューマンブラックホールを考えると、等エントロピー吸収が許容される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 01:28:37 GMT)
Information and majorization theory for fermionic phase-space distributions [0.0] 超数理論を用いてフェルミオン相空間分布の不確かさを解析する。
フェルミオン相空間分布はグラスマン評価されるが、対応する不確実性測度はベレジン積分として表される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:06:45 GMT)
In AI Sweet Harmony: Sociopragmatic Guardrail Bypasses and Evaluation-Awareness in OpenAI gpt-oss-20b [0.0] 本研究では,社会実践的フレーミング,言語選択,命令階層が拒絶行動に与える影響について検討する。
我々は、ZIPボム構築(サイバー脅威)を含むいくつかの有害ドメインをテストする。
OpenAI モデレーション API は,セマンティックグレーダに対して非常に有用な出力を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 07:00:12 GMT)
Identification and Optimal Nonlinear Control of Turbojet Engine Using Koopman Eigenfunction Model [0.0] ガスタービンエンジンは複雑で非線形な力学系である。
物理ベースのモデルを導出するのは、必ずしも利用できないパフォーマンス特性を必要とするため、難しい場合があります。
本稿では,コンポーネントレベルおよび局所線形パラメータ変動モデルの導出に用いる従来の実験手法の限界について論じる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:18:12 GMT)
GVDepth: Zero-Shot Monocular Depth Estimation for Ground Vehicles based on Probabilistic Cue Fusion [0.0] 計量単分子深度推定の一般化は、その不適切な性質のために重要な課題となる。
本稿では,様々なカメラ設定の整合性を維持する新しい標準表現を提案する。
また,物体の大きさや垂直位置の手がかりによって推定される深度を適応的かつ確率的に融合する新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:48:57 GMT)
From VQE To SQD: Modern Quantum Algorithms For The Electronic Structure Problem [0.0] 本論文は,電子状態エネルギー推定のためのサンプリングベース量子アルゴリズムについて考察する。
変分量子固有解法(VQE)の短期的な代替手段として、量子選択構成相互作用(QSCI)とサンプルベース量子対角化(SQD)に焦点を当てている。
この分析は、IBMの127キュービットのIBM Brisbaneプロセッサ上でのシミュレーション、ハードウェアキャリブレーションによるノイズ研究、実行を通じて検証される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:39:14 GMT)
From Sorting Algorithms to Scalable Kernels: Bayesian Optimization in High-Dimensional Permutation Spaces [0.0] 本稿では,ソートアルゴリズムから派生したカーネル関数を用いて,効率的な置換表現を生成する新しいフレームワークを提案する。
このフレームワーク内では、Mallowsカーネルはソートから派生した特別なインスタンスと見なすことができる。
我々の中心的な主張は、マージカーネルが低次元設定でMallowsカーネルと競合するということである。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:43:27 GMT)
Foundation models for high-energy physics [0.0] このレビューは、高エネルギー物理学の基礎モデルに関する最初の話題である。
これまでにフィールドで出版された研究を要約し、議論している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 19:03:37 GMT)
FastTracker: Real-Time and Accurate Visual Tracking [0.0] 本稿では,複数のオブジェクトタイプを扱える汎用的な追跡フレームワークを提案する。
提案手法は,(1)密閉物体の識別を向上する隠蔽認識再識別機構,(2)道路構造認識トラックレット改質戦略の2つの重要な要素を組み込んだ。
大規模な実験結果から,提案手法は新たに導入されたデータセットといくつかの公開ベンチマークの両方で堅牢な性能を実現することが示された。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 02:15:12 GMT)
Fast mixing of operator-loop path-integral quantum Monte Carlo for stoquastic XY Hamiltonians [0.0] 演算子ループ更新を用いた量子モンテカルロ法は、凝縮物質物理学で広く用いられている強力な手法である。
様々なスピン、ボゾン系、フェルミオン系の局所ハミルトン系の熱的および基底状態から試料を採取することができる。
この手法の実際的な成功にもかかわらず、アルゴリズムの効率に関する理論的理解は欠如している。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 23:19:01 GMT)
Ethical AI for Young Digital Citizens: A Call to Action on Privacy Governance [0.0] 若者が利用するデジタルプラットフォームにおける人工知能の急速な拡張は、プライバシ、自律性、データ保護に関する大きな課題を生み出している。
AI駆動のパーソナライゼーションは、ユーザエクスペリエンスの向上を提供するが、しばしば明確な倫理的境界なしに動作し、若いユーザはデータエクスプロイトやアルゴリズム上のバイアスに弱いままである。
本稿では、青少年中心のプライバシ保護、透過的なデータプラクティス、規制監督を保証する構造化されたフレームワークを提唱する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:43:39 GMT)
Estimating the entanglement of random multipartite quantum states [0.0] ランダムサンプリングテンソルのインジェクティブノルムを推定するために,様々なアルゴリズムを研究・比較する。
真のマルチパーティリート絡み合いの量に関する最初の数値計算は、通常ランダムなマルチパーティリート純状態の様々なモデルに存在する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:16:43 GMT)
Empirical Analysis Of Heuristic and Approximation Algorithms for the The Mutual-Visibility Problem [0.0] 本稿では,3つの異なるアルゴリズム – 直接ランダムな振る舞い,ハイパーグラフに基づく近似,遺伝的アルゴリズム – を実装し,評価する。
以上の結果から,より小さなグラフに対して,アルゴリズムは理論的境界に整合したMV集合のサイズを一貫して達成することを示した。
既知の最適グラフの検証では、遺伝的アルゴリズムと他のアルゴリズムが試験方法の中で最高の性能を示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:45:40 GMT)
Emerging Paradigms for Securing Federated Learning Systems [0.0] MPC、ホモモルフィック暗号化(HE)、微分プライバシ(DP)などの手法は、しばしば高コストのコンプ・テイタショナル・コストを発生させ、スケーラビリティの制限に悩まされる。
本調査では,フェデレート学習におけるプライバシと効率性の向上を約束する,新たなアプローチについて検討する。
各パラダイムに対して、FLパイプラインとの関連性を評価し、その強み、限界、実践的考察を概説する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:34:44 GMT)
Deep Learning for Crime Forecasting: The Role of Mobility at Fine-grained Spatiotemporal Scales [0.0] 歴史的犯罪や社会デマログラフィーデータとともに,マイクロレベルのモビリティ機能の導入が犯罪予測における予測性能を高めるか,どのように評価するかを評価するためのディープラーニングフレームワークを開発した。
我々は、各市の警察署から得られた犯罪事件データと、アメリカコミュニティサーベイの社会デマグラフィーデータと、Advanの人間モビリティデータとを併用する。
我々のディープラーニングモデルは、4つの都市で最高のリコール、精度、F1スコアを達成し、代替手法よりも優れています。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:58:56 GMT)
Cross-Linguistic Analysis of Memory Load in Sentence Comprehension: Linear Distance and Structural Density [0.0] 本研究では, 文レベルの記憶負荷が, 構文的に関連した単語間の線形近接や, 介在物の構造密度によってよりよく説明されるかを検討する。
複数の言語にまたがる調和した依存性ツリーバンクと混合効果フレームワークを用いて、分析は文の長さ、依存関係の長さ、インターベンタ複雑度をメモリ負荷測定の予測器として共同で評価する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 08:59:51 GMT)
Critical dynamics and superconducting state preparation in the quenched Kitaev chain with pairing imbalance [0.0] ペアリング項のバランスは、p波スピンレスキタエフ鎖におけるトポロジカル超伝導の出現に重要な役割を果たしている。
北エフ鎖の平衡現象と非平衡現象に対する非エルミートペアリング項の影響について検討する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:28:58 GMT)
CopulaSMOTE: A Copula-Based Oversampling Approach for Imbalanced Classification in Diabetes Prediction [0.0] 本研究では,マイノリティクラスにおけるデータ生成時の依存構造を保存するコプラに基づくデータ拡張について検討した。
我々は、Pima Indianデータセットを選択し、A2 copulaを使用してデータを生成し、5つの機械学習アルゴリズムを適用した。
以上の結果から,A2コプラオーバーサンプリング(theta = 10)によるランダムフォレストが最高の成績を示した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:52:54 GMT)
Cognitive Load Limits in Large Language Models: Benchmarking Multi-Hop Reasoning [0.0] 大規模言語モデル(LLM)は孤立したタスクにおいて優れるが、認知的負荷下での推論はいまだに理解されていない。
本稿では,タスク不適切な情報(コンテキスト飽和)とタスク切替による干渉が,性能を低下させる重要なメカニズムであることを示唆する,計算認知負荷の形式的理論を導入する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 21:42:07 GMT)
Closed-form $\ell_r$ norm scaling with data for overparameterized linear regression and diagonal linear networks under $\ell_p$ bias [0.0] パラメータノルムの族をスケールするために、統一的で高確率な特徴を与える。
次に、降下によって訓練された線形ネットワークについて研究する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 13:59:22 GMT)
Classical and quantum chaotic synchronization in coupled dissipative time crystals [0.0] 2つのコヒーレント結合型散逸時間結晶のダイナミクスについて検討する。
古典的な場合と類似して、この挙動を量子カオス同期と解釈する。
古典的および量子的交叉の位置は、無限スピン極限と無限時間極限の非可換性を反映して異なる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:03:58 GMT)
CONSIGN: Conformal Segmentation Informed by Spatial Groupings via Decomposition [0.0] ほとんどの機械学習ベースのイメージセグメンテーションモデルは、各ピクセルにおける各クラスラベルの予測確率を表す画素単位の信頼スコアを生成する。
コンフォーマル予測は、信頼度スコアを統計的に妥当な不確実性推定に変換するための原則化された枠組みを提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 11:09:43 GMT)
Bridging Quantum Computing and Nuclear Structure: Atomic Nuclei on a Trapped-Ion Quantum Computer [0.0] 我々は、RIKEN-Quantinuum Reimei型量子コンピュータにおける中質量原子核の正確な量子シミュレーションを報告する。
pUCCDアンサッツをハードコアボソンマッピングで実装し, 粒子数復元後選択により, 地中エネルギー推定値はノイズフリー状態ベクトルシミュレーション, 正確な対角化結果と0.1%の相対誤差で一致した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:58:36 GMT)
Beyond asymptotic reasoning: the practicalities of a quantum ground state projector based on the wall-Chebyshev expansion [0.0] 壁面関数に対するチェビシェフ級数近似に基づく地中準備のための量子アルゴリズムについて検討する。
我々は、異なる量子実装のスケーリングと成功確率を分析し、数値ベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:01:54 GMT)
Beyond Stars: Bridging the Gap Between Ratings and Review Sentiment with LLM [0.0] 本稿では,従来の星形成システムに固有の制約に対処するために,モバイルアプリレビュー分析に先進的なアプローチを提案する。
本稿では,構造化プロンプト技術により強化された大規模言語モデル(LLM)を活用するモジュラーフレームワークを提案する。
本手法は,数値評価とテキスト感情の相違を定量化し,詳細な特徴レベルの洞察を抽出し,レビューのインタラクティブな探索を支援する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:39:12 GMT)
Beyond Chat: a Framework for LLMs as Human-Centered Support Systems [0.0] 大規模言語モデルは、コンパニオン、コーチ、仲介者、キュレーターとして振舞うために、トランザクションの質問に答える以上のものを動かしている。
本稿では,人間中心型LLM支援システムにおける役割ベースフレームワークを提案する。
透明性、パーソナライゼーション、ガードレール、プライバシによるメモリ、共感と信頼性のバランスといった、横断的な設計原則を特定します。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:33:58 GMT)
Automated Machine Learning Pipeline for Training and Analysis Using Large Language Models [0.0] データセット生成からモデル検証まで、ワークフロー全体を統一する自動機械学習パイプライン(AMLP)を導入します。
AMLPは、電子構造コードの選択、入力準備、出力変換を支援するために、大きな言語モデルエージェントを使用する。
アクリジンのポリモルフィックで検証され、基礎モデルの素直な微調整により、エネルギーの1.7 meV/原子と力の7.0 meV/AAの絶対誤差が達成される。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:05:20 GMT)
Application of Audio Fingerprinting Techniques for Real-Time Scalable Speech Retrieval and Speech Clusterization [0.0] 本稿では,音声検索の専門的課題に対処するため,既存の手法を応用するための新たな知見を提供する。
単一のリクエストを容易にするのではなく、バッチ処理で迅速かつ正確なオーディオ検索を実現することに注力している。
本論文は,実際の音声からテキストへの変換を行なわずに,音声によるクラスタリングを支援する手法について述べる。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 12:16:54 GMT)
Affective Computing and Emotional Data: Challenges and Implications in Privacy Regulations, The AI Act, and Ethics in Large Language Models [0.0] 本稿では,感情知能の人工知能システムへの統合について検討する。
コンピュータ科学、心理学、神経科学を組み合わせた学際的な研究に基づいて、感情認識を可能にする神経アーキテクチャを分析する。
本論文は、医療、教育、カスタマーサービスなど、さまざまな領域にまたがる影響について考察する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 10:43:22 GMT)
Adoption, usability and perceived clinical value of a UK AI clinical reference platform (iatroX): a mixed-methods formative evaluation of real-world usage and a 1,223-respondent user survey [0.0] 臨床医は、バイオメディカル文献やガイドラインからの情報過剰が増加し、エビデンスベースのケアを妨げている。
RAGをベースとした臨床リファレンスプラットフォームであるiatroXについて述べる。
本報告では, 早期導入, ユーザビリティ, 臨床的価値を, 形式的実装評価から報告する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 14:03:04 GMT)
Adaptive Cybersecurity Architecture for Digital Product Ecosystems Using Agentic AI [0.0] 本研究では,動的学習と文脈認識型意思決定が可能な自律目標駆動エージェントを提案する。
行動ベースライン、分散リスクスコア、フェデレーションされた脅威情報共有は重要な特徴である。
このアーキテクチャは、複雑なデジタルインフラストラクチャを保護するインテリジェントでスケーラブルな青写真を提供する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 00:43:53 GMT)
A Systematic Review of Conformal Inference Procedures for Treatment Effect Estimation: Methods and Challenges [0.0] 治療効果推定のための共形予測手法について,系統的な検討を行った。
この領域で現在行われている最先端の手法を同定し記述する。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 22:31:14 GMT)
A Quotient Homology Theory of Representation in Neural Networks [0.0] 各ポリヘドロンと入力多様体の交叉が凸であれば、ニューラル表現のホモロジー群は商ホモロジー群 $H_k(Phi(mathcalM)) simeq H_k(mathcalM/mathcalO_Phi)$ に同型である。
線形計画法とユニオン・フィンド・アルゴリズムを用いて重なり合う分解を計算する手法を開発した。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:13:12 GMT)
A Principled Loss Function for Direct Language Model Alignment [0.0] 本稿では,RLHF最適条件から直接導出した新しい損失関数を提案する。
提案した損失は,その差ではなく,基礎となる報酬によって規定される,ロジットの特定の有限値を対象としている。
この固有の安定性は、報酬のハッキングを防ぎ、より効果的なアライメントをもたらす。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:08:05 GMT)
A Markovian approach to $N$-photon correlations beyond the quantum regression theorem [0.0] 周波数分解した$N$- Photon相関関数を計算するためのMarkovianフレームワークを提案する。
フォノン側バンドを介して放出される光子は、モロー三重項の2次コヒーレンス特性を継承することを示す。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:51:08 GMT)
A Deep Learning Framework for Evaluating Dynamic Network Generative Models and Anomaly Detection [0.0] 本稿では,DGSP-GCN(グラフ畳み込みネットワークに基づく動的グラフ類似度予測)を提案する。
グラフ畳み込みネットワークと動的グラフ信号処理技術を統合し、生成モデルを評価し、動的ネットワークの異常を検出する統一的なソリューションを提供する。
WikiMath、Chickenpox、PedalMe、MontevideoBus、MetraLaの5つの実世界のデータセットでテストされた。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 09:19:30 GMT)
"Be My Cheese?": Assessing Cultural Nuance in Multilingual LLM Translations [0.0] このパイロットスタディでは、比喩的言語を翻訳する際に、最先端の多言語AIモデルのローカライズ能力について検討する。
文化的な適切さと全体的なローカライゼーションの質 - マーケティングやeコマースといった現実世界のアプリケーションにとって重要な要素である。
論文参考訳(メタデータ) (Thu, 25 Sep 2025 20:55:36 GMT)