A Stable Whitening Optimizer for Efficient Neural Network Training [101.9] アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。
まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。
第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。
第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:43:31 GMT)
DeepRAG: Thinking to Retrieve Step by Step for Large Language Models [92.9] 我々はマルコフ決定過程(MDP)として検索強化推論をモデル化するDeepRAGを提案する。
クエリを反復的に分解することで、DeepRAGは外部知識を取得するか、あるいは各ステップでパラメトリック推論に依存するかを動的に決定する。
実験の結果,DeepRAGは検索効率を向上し,回答精度を26.4%向上させ,検索強化推論の有効性を示した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:17:01 GMT)
A Culturally-diverse Multilingual Multimodal Video Benchmark & Model [92.5] 我々は,14言語にわたるビデオLMMを評価するために,ViMUL-Benchという多言語ビデオLMMベンチマークを導入した。
私たちのViMUL-Benchは、文化的に多様な8つのカテゴリを含む15のカテゴリにわたるビデオLMMを厳格にテストするために設計されています。
また、120万のサンプルからなる機械翻訳多言語ビデオトレーニングセットを導入し、ViMULというシンプルな多言語ビデオLMMを開発した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:52:20 GMT)
Advancing Multimodal Reasoning Capabilities of Multimodal Large Language Models via Visual Perception Reward [87.1] 本稿では,MLLMに視覚内容の正確な知覚を促す新しい視覚認識報酬を導入するPerception-R1を提案する。
本稿では,Perception-R1が1,442のトレーニングデータのみを用いて,ほとんどのベンチマークで最先端のパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:48:42 GMT)
Unifying 2D and 3D Vision-Language Understanding [85.8] 2次元および3次元視覚言語学習のための統一アーキテクチャUniVLGを紹介する。
UniVLGは、既存の2D中心モデルと、エンボディシステムで利用可能なリッチな3Dセンサーデータのギャップを埋める。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:43:21 GMT)
MMTEB: Massive Multilingual Text Embedding Benchmark [85.2] 我々はMMTEBベンチマーク(Massive Multilingual Text Embedding Benchmark)を紹介する。
MMTEBは250以上の言語で500以上の品質管理された評価タスクをカバーしている。
我々は複数の多言語ベンチマークを開発し、モデルを代表的に評価する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:10:54 GMT)
What makes Reasoning Models Different? Follow the Reasoning Leader for Efficient Decoding [84.4] 推論モデルと非推論モデルの間のトークンレベルのミスアライメントを分析する。
本稿では,FoReaL-Decodingを提案する。
一般的な4つの数学推論ベンチマークにおいて、FoReaL-Decodingは理論FLOPを30から50%減らし、CoTの長さを最大40%減らした。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:08:32 GMT)
Atomic Reasoning for Scientific Table Claim Verification [83.1] 非専門家は、その高い情報密度と認識される信頼性のために、科学的表に基づく主張を誤解させるおそれがある。
既存のテーブルクレーム検証モデル、例えば最先端の大規模言語モデル(LLM)は、しばしば精密なきめ細かい推論に苦しむ。
認知負荷理論に触発されて、表に基づく主張を解釈するモデルの能力を高めるには、認知負荷を減らす必要がある。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:46:22 GMT)
Right Answer, Wrong Score: Uncovering the Inconsistencies of LLM Evaluation in Multiple-Choice Question Answering [78.9] 大規模言語モデル(LLM)の評価には,MCQA(Multiple-Choice Question Answering)が広く用いられている。
報告されたLCMの性能には,複数の要因が大きな影響を及ぼす可能性が示唆された。
既存の回答抽出手法が人間の判断と一致しているかどうかを解析する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:56:13 GMT)
Horizon Reduction Makes RL Scalable [78.7] オフライン強化学習(RL)アルゴリズムのスケーラビリティについて検討する。
通常のオフラインRLデータセットの最大1000倍のデータセットを使用します。
オフラインRLのスケール不足の主な原因は地平線にあることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:51:31 GMT)
Chain of Methodologies: Scaling Test Time Computation without Training [77.9] 大規模言語モデル(LLM)は、トレーニングデータに対する詳細な洞察が不十分なため、複雑な推論タスクに苦しむことが多い。
本稿では,人間の方法論的洞察を統合することで構造的思考を強化するCoM(Chain of the CoM)フレームワークを紹介する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:46:50 GMT)
Diversifying the Expert Knowledge for Task-Agnostic Pruning in Sparse Mixture-of-Experts [75.9] 本稿では,モデルのパラメータ効率を向上させるために,類似の専門家をグループ化し,グループ化する方法を提案する。
提案手法の有効性を3つの最先端MoEアーキテクチャを用いて検証する。
評価の結果,本手法は自然言語タスクにおいて,他のモデルプルーニング手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:00:34 GMT)
MAGNET: A Multi-agent Framework for Finding Audio-Visual Needles by Reasoning over Multi-Video Haystacks [67.3] AV-HaystacksQAという新しいタスクを導入し、クエリに応答して、異なるビデオにまたがる有能なセグメントを識別し、それらをリンクして最も有意義な回答を生成する。
AVHaystacksは、マルチビデオ検索および時間的グラウンドタスクにおけるLMMの能力を評価するために設計された3100の注釈付きQAペアからなるオーディオビジュアルベンチマークである。
提案するAVHaystackのQAタスクにおけるBLEU@4およびGPT評価スコアの基準値よりも89%と65%の相対的な改善を実現し、モデルに依存しないマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:34:29 GMT)
Reinforcing Video Reasoning with Focused Thinking [65.9] 本稿では,集中的思考と深い報酬の粒度で視覚的推論を強化する新しいフレームワークであるTW-GRPOを提案する。
具体的には,高情報密度のトークンを優先するトークン重み付け機構を用いる。
また,シングルチョイスからマルチチョイスQAタスクにシフトすることで,RLトレーニングを再構築する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:43:47 GMT)
From Generation to Generalization: Emergent Few-Shot Learning in Video Diffusion Models [65.0] ビデオ拡散モデル(VDM)は高品質なコンテンツを合成できる強力な生成ツールとして登場した。
我々は、VDMが自然に構造化された表現を探索し、視覚世界を暗黙的に理解することを主張する。
提案手法は,各タスクを視覚遷移に変換し,短い入力シーケンス上でLoRA重みのトレーニングを可能にする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:52:34 GMT)
Feynman-Kac Correctors in Diffusion: Annealing, Guidance, and Product of Experts [64.3] 事前学習したスコアベースモデルから得られた熱処理, 幾何平均, 製品分布の配列から, 効率的かつ原理的に抽出する方法を提供する。
本稿では,サンプリング品質を向上させるために,推論時間スケーリングを利用する逐次モンテカルロ(SMC)再サンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:40:55 GMT)
DeltaProduct: Improving State-Tracking in Linear RNNs via Householder Products [63.7] リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
対角行列は、Mamba、GLA、mLSTMなどのモデルで使用されるが、高速に実行可能であるが、表現性は限られている。
DeltaNetやRWKV-7といった最近のアーキテクチャでは、同時トークンとチャネルミキシングが可能な対角形+ランク1構造が採用されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:56:49 GMT)
GeometryZero: Improving Geometry Solving for LLM with Group Contrastive Policy Optimization [63.1] Group Contrastive Policy Optimization(GCPO)は、2つの重要なイノベーションを特徴とする新しい強化学習フレームワークである。
我々はGeometryZeroを開発した。GeometryZeroは、手頃なサイズの幾何学的推論モデルで、補助的な建設をいつ行うべきかを判断する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:18:15 GMT)
AllTracker: Efficient Dense Point Tracking at High Resolution [62.8] AllTrackerは、クエリフレームとビデオの他のフレーム間のフローフィールドを推定する方法によって、長距離トラックを推定するモデルである。
既存の点追跡法とは異なり,本手法は高分解能かつ高密度(全画素)対応フィールドを提供し,フローマップとして可視化することができる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:55:06 GMT)
When Attention Collapses: How Degenerate Layers in LLMs Enable Smaller, Stronger Models [61.4] Inherituneは、より小さく、より効率的な言語モデルを構築するための、シンプルで効果的なトレーニングレシピである。
Inherituneのトレーニングしたモデルは、レイヤーが大幅に少ないにもかかわらず、より大きなモデルにマッチしたり、性能を上回ります。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:19:32 GMT)
Gumbel Reranking: Differentiable End-to-End Reranker Optimization [61.2] RAGシステムは関連する文書を識別するためにリランカーに依存している。
注釈付きクエリ-ドキュメントペアが不足しているため、これらのモデルの微調整は依然として難しい。
我々は,トレーニングと推論のギャップを最小限に抑えることを目的とした,リランカーのためのエンドツーエンドのトレーニングフレームワークであるGumbel Re rankを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:59:44 GMT)
Manifesto from Dagstuhl Perspectives Workshop 24352 -- Conversational Agents: A Framework for Evaluation (CAFE) [59.6] 本研究では,conIACシステム評価のための会話エージェントフレームワーク(CAFE)を定義した。
CAFEは,1)システムの利害関係者の目標,2)評価において研究すべきユーザタスク,3)タスクを実行するユーザの側面,4)検討すべき評価基準,5)適用すべき評価方法論,および6)選択された量的基準の尺度からなる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:25:35 GMT)
Frame Guidance: Training-Free Guidance for Frame-Level Control in Video Diffusion Models [59.6] フレームレベル信号に基づく制御可能なビデオ生成のためのトレーニング不要ガイダンスであるFrame Guidanceを提案する。
そこで本研究では,メモリ使用量を大幅に削減する簡易な潜時処理手法を提案する。
我々は,グローバルコヒーレントビデオ生成のために設計された新しい潜在最適化手法を適用した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:54:41 GMT)
HAIC: Improving Human Action Understanding and Generation with Better Captions for Multi-modal Large Language Models [58.0] ビデオ理解のための2段階データアノテーションパイプラインを提案する。
まず、インターネットからの人間の行動を明確にした動画を蓄積する戦略を設計する。
第2に、ビデオは、人間の属性を使って個人を識別する標準化されたキャプション形式で注釈付けされる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:03:07 GMT)
Lingshu: A Generalist Foundation Model for Unified Multimodal Medical Understanding and Reasoning [57.9] 医療知識の豊富なマルチモーダルデータセットを構築した。
次に医学専門のMLLMであるLingshuを紹介します。
Lingshuは、医療専門知識の組み込みとタスク解決能力の向上のために、マルチステージトレーニングを行っている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:47:30 GMT)
Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation [57.7] 我々は,サンプル難易度の観点から,マッチングに基づくDD手法の理解に向けて最初の一歩を踏み出した。
次に、データプルーニングのニューラルネットワークスケーリング法則をDDに拡張し、これらのマッチングベースの手法を理論的に説明する。
SDC(Sampple Difficulty Correction)アプローチを導入し、より簡単なサンプルを生成して、より高いデータセット品質を実現する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:55:16 GMT)
JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning [57.4] JsonTuningは、構造から構造へのアプローチで、構造を使ってタスクを表現します。
タスク要素とその関係を明確にすることで一般化を向上し、あいまいさを最小化して堅牢性を高め、出力の正確な制御を可能にして可制御性を高める。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:16:17 GMT)
Quantile-Optimal Policy Learning under Unmeasured Confounding [55.7] ここでは,報酬分布が (0, 1) で最大$alpha$-quantileを持つポリシーを見つけることを目標とする量子最適政策学習について検討する。
このような問題は、(i)報酬分布の関数としての量子目標の非線形性、(ii)未観測の共起問題、(iii)オフラインデータセットのカバー不足という3つの大きな課題に悩まされている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:37:38 GMT)
AdaReTaKe: Adaptive Redundancy Reduction to Perceive Longer for Video-language Understanding [55.3] MLLM(Multimodal Large Language Models)は、ビデオ理解に革命をもたらしたが、長いビデオを処理する際の文脈長によって制限されている。
AdaReTaKeは,時間と層間の圧縮比を理論的保証とともに割り当てることで,視覚的冗長性を柔軟に低減する訓練自由手法である。
VideoMME、MLVU、LongVideoBench、LVBenchのデータセットの実験では、AdaReTaKeは既存の7Bモデルと72Bモデルでそれぞれ2.3%、そして2.8%を上回っている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:57:12 GMT)
Adultification Bias in LLMs and Text-to-Image Models [55.0] 若い女性の人種やジェンダーの軸に沿った偏見について研究する。
我々は「文化バイアス」に焦点を当てており、黒人の女の子は白人の仲間よりも、より排他的で、性的に親密で、教育可能であると推定される現象である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:02:33 GMT)
Exploiting Inaccurate Branch History in Side-Channel Attacks [54.2] 本稿では,リソース共有と競合が広く実装されているが文書化されていない2つの特徴,バイアスフリー分岐予測と分岐履歴推定にどのように影響するかを検討する。
これらの機能は、ブランチ履歴バッファ(BHB)の更新動作を不注意に修正し、悪意のある誤定義を引き起こす新しいプリミティブを作成することができる。
2つのSpectre攻撃、すなわちSpectre-BSEとSpectre-BHSと、BiasScopeと呼ばれるクロスプライマリ制御フローサイドチャネル攻撃である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:46:43 GMT)
A Closer Look into Transformer-Based Code Intelligence Through Code Transformation: Challenges and Opportunities [54.0] トランスフォーマーベースのモデルは、多くのインテリジェントコーディングタスクにおいて最先端のパフォーマンスを示している。
意味保存型コード変換がTransformerの性能に与える影響を実証研究する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:38:02 GMT)
Syntactic Control of Language Models by Posterior Inference [53.8] 言語モデルによって生成されたテキストの構文構造を制御することは、明快さ、スタイリスティックな一貫性、解釈可能性を必要とするアプリケーションにとって重要である。
後部推論に基づくサンプリングアルゴリズムは、生成中に対象の選挙区構造を効果的に強制することができると論じる。
提案手法では,提案分布からのサンプリングにより後続分布を推定するモンテカルロ法と,各生成したトークンが所望の構文構造に整合することを保証する統語タグを併用する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:01:34 GMT)
EgoNormia: Benchmarking Physical Social Norm Understanding [52.9] EGONORMIAは、安全性、プライバシ、プロキシ、丁寧さ、協力性、コーディネーション/プロアクティビティ、コミュニケーション/レポータビリティの7つの標準カテゴリにまたがる。
我々の研究は、現在の最先端のビジョン言語モデル(VLM)は、堅固な標準理解が欠如していることを示し、EGONORMIAは66%、EGONORMIAは68%と評価された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:03:14 GMT)
Towards Generalized Source Tracing for Codec-Based Deepfake Speech [52.7] 本稿では,意味的特徴符号化にWhisperを,音響的特徴符号化にAudioMAEにWav2vec2を併用したSemantic-Acoustic Source Tracing Network(SASTNet)を紹介する。
提案したSASTNetは,CodecFake+データセットのCoSGテストセット上での最先端性能を実現し,信頼性の高いソーストレースの有効性を実証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:36:10 GMT)
Overclocking LLM Reasoning: Monitoring and Controlling Thinking Path Lengths in LLMs [52.7] 回答の質に影響を与える重要な要因は思考段階の長さである。
本稿では, LLM が推論の長さを理解し, 制御するメカニズムを探求し, 活用する。
以上の結果から,この「オーバークロック」手法は過度な思考を軽減し,解答精度を向上し,推論遅延を低減することが示唆された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:54:33 GMT)
Reducing Object Hallucination in Large Audio-Language Models via Audio-Aware Decoding [52.0] LALM(Large Audio-Language Models)は、オーディオに提示されるものを幻覚させる。
LALMの幻覚を軽減するためにオーディオ・アウェア・デコーディング(AAD)を導入する。
AADはコントラストデコーディングを使用して、トークン予測ログとオーディオコンテキストの有無を比較します。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:36:50 GMT)
Fully-Geometric Cross-Attention for Point Cloud Registration [51.9] ポイントクラウド登録のアプローチは、ノイズのあるポイント対応のため、ポイントクラウド間の重なりが低いときに失敗することが多い。
この問題に対処するTransformerベースのアーキテクチャに適した,新たなクロスアテンション機構を導入する。
我々はGromov-Wasserstein距離をクロスアテンションの定式化に統合し、異なる点雲間の点間距離を共同計算する。
点レベルでは,局所的な幾何学的構造情報を細かなマッチングのための点特徴に集約する自己認識機構も考案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:11:07 GMT)
Exploring Training and Inference Scaling Laws in Generative Retrieval [50.8] 生成検索は、検索を自己回帰生成タスクとして再構成し、大きな言語モデルがクエリから直接ターゲット文書を生成する。
生成的検索におけるトレーニングと推論のスケーリング法則を体系的に検討し,モデルのサイズ,トレーニングデータスケール,推論時間計算が協調的に性能に与える影響について検討した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:15:41 GMT)
AugmentGest: Can Random Data Cropping Augmentation Boost Gesture Recognition Performance? [49.6] 本稿では、幾何変換、ランダム変動、回転、ズーム、強度に基づく変換を統合する包括的データ拡張フレームワークを提案する。
提案手法は,マルチストリームe2eET,FPPRポイントクラウドベースハンドジェスチャ認識(HGR),DD-Networkの3つのモデルで評価される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:43:05 GMT)
AlphaSteer: Learning Refusal Steering with Principled Null-Space Constraint [49.6] 提案手法はAlphaSteerと呼ばれる,理論的に基礎的かつ実験的に有効なアクティベーションステアリング法である。
ユーティリティ保存のために、Null-space制約を使って、良性データのステアリングのためのほぼゼロベクトルを構築することを学ぶ。
複数のjailbreak攻撃とユーティリティベンチマークの実験は、AlphaSteerの有効性を示している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:03:28 GMT)
ConfQA: Answer Only If You Are Confident [49.3] ConfQAは、複数の事実性ベンチマークで幻覚率を20~40%から5%以下に減らすことができる。
覚醒が15%-25%に留まることなく、行動を明確に指導するために、弱めのプロンプト「自信のある場合にのみ答える」を導入する。
本稿では、内部パラメータ化されたニューラルネットワークと外部記録されたシンボル知識をシームレスに選択するデュアルニューラルネットワークフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:51:46 GMT)
State Entropy Regularization for Robust Reinforcement Learning [49.1] 状態エントロピー規則化は、構造的および空間的に相関した摂動に対するロバスト性を向上させることを示す。
このようなバリエーションは、伝達学習では一般的であるが、標準的な堅牢な強化学習法では見落とされがちである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:15:31 GMT)
End-to-End Probabilistic Framework for Learning with Hard Constraints [47.1] ProbHardE2Eは、運用上の制約をハード要件として組み込むことのできるシステムを学ぶ。
分散情報を新しい方法で活用することで、厳しい制約を課す。
一連の非線形制約(モデリングと柔軟性のパワーを高める)を組み込むことができます。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:29:50 GMT)
Extragradient Preference Optimization (EGPO): Beyond Last-Iterate Convergence for Nash Learning from Human Feedback [46.7] EGPO(Extragradient preference optimization)は、NLHFがKL正規化ゲームのNEへの最終次線形収束を達成するアルゴリズムである。
同数のエポックのトレーニングにおいて,EGPOがベースライン法よりも優れていることを示す実験的検討を行った。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:45:39 GMT)
PASS: Private Attributes Protection with Stochastic Data Substitution [46.4] 下流タスクのためのデータユーティリティを維持しながら、データからデータを取り除き、プライベート属性を保護するための様々な研究が提案されている。
PASSは、新しい損失関数で訓練された特定の確率に応じて、元のサンプルを別のサンプルに置換するように設計されている。
顔画像、人間の活動感覚信号、音声記録データセットなど、さまざまなモダリティのデータセットに対するPASSの包括的評価は、PASSの有効性と一般化性を裏付けるものである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:48:07 GMT)
SceneLCM: End-to-End Layout-Guided Interactive Indoor Scene Generation with Latent Consistency Model [45.6] SceneLCMは、レイアウト設計のためにLarge Language Model(LLM)をシーン最適化のためにLatent Consistency Model(LCM)と同期するエンドツーエンドフレームワークである。
SceneLCMは物理シミュレーションを統合することで物理的な編集をサポートし、永続的な物理リアリズムを実現した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:30:31 GMT)
Policy Gradient with Tree Search: Avoiding Local Optimas through Lookahead [45.6] Policy Gradient with Tree Search (PGTS)は、ポリシー最適化を強化するために$m$-step lookaheadメカニズムを統合するアプローチである。
木探索深度を$m$-単調に増加させると、望ましくない静止点の集合が減少することを示す理論的解析を行う。
Ladder、Tightrope、Gridworldといった多様なMDP構造に関する実証的な評価は、PGTSが「遠視性」を示す能力を示している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:28:11 GMT)
BIS Reasoning 1.0: The First Large-Scale Japanese Benchmark for Belief-Inconsistent Syllogistic Reasoning [45.4] 本稿では,大規模言語モデル(LLMs)における信念不整合推論を明示的に評価する目的で設計された,最初の大規模シロメトリクス推論問題データセットであるBIS Reasoning 1.0を提案する。
NeuBAROCOやJFLDのような以前のデータセットとは異なり、BIS Reasoning 1.0は論理的に妥当だが信念に一貫性のないシロジズムを導入し、人間のコーパスで訓練されたLSMの推論バイアスを明らかにする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:38:18 GMT)
Representing Time-Continuous Behavior of Cyber-Physical Systems in Knowledge Graphs [43.7] 本稿では,知識グラフ内の微分方程式を直接表現し,それらを意味的に強化するモジュール型意味モデルを提案する。
これらのアーティファクトの検証は、航空整備の領域で実施された。
その結果、複雑な電気・油圧サーボアクチュエータの微分方程式は、知識グラフで正式に表現でき、他のライフサイクルデータとコンテキスト化できることがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:54:23 GMT)
Machine Learning Should Maximize Welfare, but Not by (Only) Maximizing Accuracy [43.4] 機械学習が社会的に有益になるためには、社会福祉を最大化することを目的とした、より広範な経済枠組みに組み込まなければならない、と我々は主張する。
我々は,この概念を,(意識のある)正確性から(正確な予測を通じて)福祉へ徐々に移行する概念的枠組みを描写することによって実証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:32:25 GMT)
Interpretable and Reliable Detection of AI-Generated Images via Grounded Reasoning in MLLMs [43.1] 私たちは、バウンディングボックスと記述キャプションを付加したAI生成画像のデータセットを構築します。
次に、多段階最適化戦略によりMLLMを微調整する。
得られたモデルは、AI生成画像の検出と視覚的欠陥のローカライズの両方において、優れた性能を達成する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:47:44 GMT)
Turb-L1: Achieving Long-term Turbulence Tracing By Tackling Spectral Bias [43.0] 本稿では,革新的な乱流予測法であるTurb-L1を提案する。
クロススケールな相互作用を正確に捉え、高周波力学の忠実さを保っている。
長期的な予測では、平均正方形誤差(MSE)を80.3%、構造類似度(SSIM)をSOTAベースラインと比較して9ドル以上値下げする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:26:33 GMT)
Adversarial Paraphrasing: A Universal Attack for Humanizing AI-Generated Text [42.7] 本稿では、AI生成したテキストを普遍的に人間化し、検出をより効果的に回避する、トレーニング不要な攻撃フレームワークであるAdversarial Paraphrasingを紹介する。
我々の攻撃は広範囲に効果があり、複数の検知システムにまたがって非常に伝達可能である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:15:01 GMT)
Task-driven real-world super-resolution of document scans [41.6] シングルイメージ超解像(英: Single-image Super- resolution)とは、単一の低分解能観測から高分解能画像の再構成を指す。
光文字認識タスクに最適化された超高解像度ネットワークをトレーニングするためのタスク駆動型マルチタスク学習フレームワークを提案する。
SRResNetアーキテクチャに対する我々のアプローチを検証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:16:29 GMT)
Learning to Clarify by Reinforcement Learning Through Reward-Weighted Fine-Tuning [40.8] 本研究では,QAエージェントにおける質問を明確にすることを学ぶ。
我々は、報酬重み付けされた教師付き微調整と見なせるオフラインRL目標を提案し、分析する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 01:59:30 GMT)
Com$^2$: A Causal-Guided Benchmark for Exploring Complex Commonsense Reasoning in Large Language Models [40.5] 大規模言語モデル(LLM)は、事前学習を通じて豊富な単純で明示的なコモンセンス知識を習得している。
LLMは単純な知識から派生した複雑で暗黙的なコモンセンスの知識を推論するのに苦労する。
複素コモンセンス推論に着目したベンチマークCom$2$を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:53:08 GMT)
Mathesis: Towards Formal Theorem Proving from Natural Languages [40.4] パイプライン処理の非公式な問題文を証明する最初のエンドツーエンド定理であるMathesisを開発した。
これは、自然言語問題の形式化能力を高めるために強化学習を用いた最初のオートフォーマライザであるMathesis-Autoformalizerに貢献する。
また、形式化された文から形式的な証明を生成するMathesis-Proverを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:04:14 GMT)
Less is More: some Computational Principles based on Parcimony, and Limitations of Natural Intelligence [39.9] 自然知性は、より少ないことで一貫して達成される。
今日のAIは、ほぼ無制限の計算能力、エネルギー、データに依存して、高いパフォーマンスを実現している。
本稿では, NIの制約は, 効率, 適応性, クリエイティビティのパラドックス触媒であると主張している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:42:29 GMT)
FairPFN: A Tabular Foundation Model for Causal Fairness [39.8] 因果公正(Causal fairness)は、アルゴリズムの差別を緩和する透明性のある、ループ内の人間的フレームワークを提供する。
本研究では,合成因果フェアネスデータに基づいて事前学習したモデルであるFairPFNを提案し,その予測における保護属性の因果効果の同定と緩和を行う。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:15:45 GMT)
Watermarking Language Models with Error Correcting Codes [39.8] 本稿では,誤り訂正符号を用いて統計的信号を符号化する透かしフレームワークを提案する。
本手法は,ロバストバイナリコード (RBC) の透かしと呼ばれ,品質の顕著な劣化を生じさせない。
私たちの経験的発見は、私たちの透かしは速く、強力で、堅牢であり、最先端のものと好意的に比較していることを示唆しています。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:08:39 GMT)
Taxonomy of migration scenarios for Qiskit refactoring using LLMs [39.7] 大規模言語モデル(LLM)は、古典的なソフトウェア開発において価値のあるツールであることが証明されているが、量子ソフトウェア工学における彼らの価値はまだ明らかにされていない。
この研究は、異なるQiskitバージョン間のマイグレーションシナリオのニーズを分類するためにLLMを使用する。
Qiskitの課題を体系的に分類することで、統合分類は、AI支援マイグレーションに関する将来の研究の基盤となる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:28:52 GMT)
Efficient Pretraining Data Selection for Language Models via Multi-Actor Collaboration [39.2] 言語モデル(LM)の事前学習を高速化する多要素協調データ選択機構を提案する。
各データ選択方法は、その基準に基づいてデータを独立に優先順位付けし、モデルの現在の状態を使用して優先順位付けルールを更新する。
コンソールは、様々な段階における異なるアクターの影響を調整し、LM事前訓練プロセスを通して全てのアクターからの情報を動的に統合するように設計されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:32:07 GMT)
BePo: Leveraging Birds Eye View and Sparse Points for Efficient and Accurate 3D Occupancy Prediction [39.0] 3D占有力は、シーン理解のためのきめ細かい3D幾何学と意味論を提供する。
バードアイビュー (Bird's Eye View, BEV) またはスパースポイント (sparse points) は、コストを大幅に削減したシーン表現であるが、それでもそれぞれの欠点に悩まされている。
本稿では,BEVとスパースポイントに基づく表現を組み合わせた新しい3次元占有予測手法BePoを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:19:02 GMT)
Breaking the Reviewer: Assessing the Vulnerability of Large Language Models in Automated Peer Review Under Textual Adversarial Attacks [38.0] 本稿では,大規模言語モデル (LLM) が,敵対的攻撃の存在下で自動レビュアーとして使用されることのロバスト性について検討する。
テキスト操作はLLM評価を歪ませる可能性があるため,本評価は重大な脆弱性を明らかにする。
我々の発見は、学術コミュニケーションの完全性よりも、AIの強化を確実にするために、敵対的リスクに対処することの重要性を強調した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:57:38 GMT)
Adaptive Sample Scheduling for Direct Preference Optimization [37.8] DPOのためのサンプルスケジューリングという,新しい問題を紹介します。
モデルの進化状態に基づいてトレーニングサンプルを動的かつ適応的にスケジュールすることを目的としている。
トレーニングバッチ毎にサンプルを適応的に選択する,効率的かつ効率的なアルゴリズムであるSamSを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:26:09 GMT)
RepLoRA: Reparameterizing Low-Rank Adaptation via the Perspective of Mixture of Experts [37.4] Low-rank Adaptation (LoRA) は、大規模基盤モデルを微調整するための強力な手法として登場した。
本稿では,LoRAモデルとMixture of Expertsモデルとの関連性を検討することによって,ロラの理論解析を行う。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:31:12 GMT)
Diversity from Human Feedback [37.2] 本稿では,人間のフィードバックから行動空間を学習する問題を提案し,その解法として人間フィードバックからの多様性(Diversity from Human Feedback, DivHF)を提案する。
DivHFは、人間のフィードバックをクエリすることで、人間の好みと整合した振る舞いを学習する。
本研究では,DivHF を品質多様性最適化アルゴリズム MAP-Elites に統合し,QDax スイート上で実験を行うことにより,DivHF の有効性を示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:29:14 GMT)
LLaSE-G1: Incentivizing Generalization Capability for LLaMA-based Speech Enhancement [36.9] LLaMAに基づく言語モデルであるLLaSE-G1を導入する。
音響的不整合を軽減するため、LLaSE-G1は入力としてWavLMからの連続表現を使用し、X-Codec2からの音声トークンを予測し、音響保存を最大化する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:00:35 GMT)
TV-LiVE: Training-Free, Text-Guided Video Editing via Layer Informed Vitality Exploitation [36.8] 我々は、Layerinformed Vitality Exploitationを通じて、トレーニング不要でテキスト誘導型のビデオ編集フレームワークであるTV-LiVEを紹介する。
生成した出力の品質に大きく影響を及ぼす映像生成モデル内の重要層を実証的に同定する。
対象追加のために,新たに追加されたターゲットプロンプトに対応するマスク領域を抽出するために,顕著な層を特定する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:12:13 GMT)
MolX: Enhancing Large Language Models for Molecular Understanding With A Multi-Modal Extension [36.3] タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:34:54 GMT)
Sharpness-Aware Teleportation on Riemannian Manifolds [36.0] 我々は,反復と一般化を強化するために,新しいシャープネス・アウェア・ジオメトリ・アウェア・テレポーテーション機構を導入する。
本手法は,人口減少と最悪の事例的損失の間の一般化ギャップを解析する理論的枠組みに基づくものである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:02:49 GMT)
BRIDGE: Bootstrapping Text to Control Time-Series Generation via Multi-Agent Iterative Optimization and Diffusion Modeling [35.2] 時系列生成(TSG、Time-Series Generation)は、シミュレーション、データ拡張、および反事実分析に広く応用された、顕著な研究分野である。
我々は、テキストが意味的な洞察、ドメイン情報、インスタンス固有の時間パターンを提供し、TSGをガイドし改善することができると論じている。
BRIDGEはテキスト制御型TSGフレームワークで,テキスト記述とセマンティックプロトタイプを統合し,ドメインレベルのガイダンスをサポートする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:19:28 GMT)
Quality-Diversity Red-Teaming: Automated Generation of High-Quality and Diverse Attackers for Large Language Models [34.6] 本稿では,これらの制約に対処する新しいフレームワークであるQDRTを紹介する。
QDRTは、行動条件付きトレーニングを通じて目標駆動の多様性を実現し、オープンな方法で行動リプレイバッファを実装する。
我々の経験的評価は、QDRTがより多種多様で、広範囲のLLMに対してより効果的に攻撃を発生させることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:07:41 GMT)
Towards Dynamic Theory of Mind: Evaluating LLM Adaptation to Temporal Evolution of Human States [34.3] 我々は、大規模言語モデルが精神状態の時間的進行を理解し、追跡する能力を評価するために設計された新しいベンチマークであるtextscDynToMを提案する。
私たちは5500のシナリオと78,100の質問を含む1,100の社会的コンテキストを生成します。
我々の総合評価では、心的状態の変化の追跡と推論において、平均的なパフォーマンスは人間を44.7%下回る結果となった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:41:33 GMT)
Sample Complexity of Diffusion Model Training Without Empirical Risk Minimizer Access [34.0] スコア推定の原理的解析を行い、$widetildemathcalO(epsilon-6)$のサンプル複雑性を確立する。
これは、スコア関数推定損失の経験的リスク最小化器へのアクセスを仮定することなく、サンプル複雑性境界を達成する最初の結果である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:22:21 GMT)
HOI-PAGE: Zero-Shot Human-Object Interaction Generation with Part Affordance Guidance [33.8] テキストプロンプトから4次元の人間と物体の相互作用を合成するための新しいアプローチであるHOI-を提案する。
パート Affordance Graphs (PAGs) は、接触関係とともに、きめ細かい部分情報を符号化する。
我々のアプローチは柔軟であり、複雑な多目的または多対人インタラクションシーケンスを生成することができる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:15:39 GMT)
Synergizing Unsupervised Episode Detection with LLMs for Large-Scale News Events [32.6] 最先端の自動イベント検出は、進化するキーイベントに対する解釈可能性と適応性に苦労する。
本稿では,重要なイベント記事のニュースコーパス内のエピソードを識別する新たなタスクであるエピソード検出について紹介する。
記事中の自然なエピソード分割を利用して、重要なイベントの候補エピソードを識別する、教師なしのフレームワークであるEpiMineを紹介する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:08:54 GMT)
Backdoor Attack on Vision Language Models with Stealthy Semantic Manipulation [32.2] BadSemは、トレーニング中に画像とテキストのペアを意図的に間違えることでバックドアを注入するデータ中毒攻撃だ。
実験の結果,BadSemは平均的ASRの98%以上を達成し,アウト・オブ・ディストリビューション・データセットに最適化し,有害なモダリティをまたいで転送可能であることがわかった。
我々の発見は、より安全なデプロイメントのためにビジョン言語モデルにおけるセマンティックな脆弱性に対処する緊急の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:40:40 GMT)
Tokenized Bandit for LLM Decoding and Alignment [32.2] トークン化線形バンドイット(TLB)とマルチアームバンドイット(TMAB)を導入する。
TLB と TMAB でそれぞれ $tildeO(LsqrtT)$ と $tildeO(LsqrtT2/3)$ のアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:32:08 GMT)
Efficient $Q$-Learning and Actor-Critic Methods for Robust Average Reward Reinforcement Learning [32.1] 頑健な$Q$ベルマン作用素は、慎重に構築された半ノルムに対して厳密な縮約写像であることを示す。
我々は、$tildecO(epsilon-3)$サンプルにおいて、$epsilon$-optimal robust policyを達成できる自然なアクター批判アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:26:27 GMT)
Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy [31.8] 我々は,ロボット自律のための自己教師型ニューロシンボリック(NeSy)計算フレームワーク,インペラティブラーニング(IL)を導入する。
ILを2段階最適化(BLO)として定式化し、3つのモジュール間の相互学習を可能にする。
ILはロボットの自律性を大幅に向上させ、多様な領域にわたるさらなる研究を促進することを期待している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:29:46 GMT)
WorkForceAgent-R1: Incentivizing Reasoning Capability in LLM-based Web Agents via Reinforcement Learning [31.5] ルールベースのR1スタイル強化学習フレームワークを用いて学習したLLMベースのWebエージェントであるWorkForceAgent-R1を紹介する。
我々は、出力形式への固執とアクションの正当性の両方を評価する構造付き報酬関数を用いて、WorkForceAgent-R1が頑健な中間推論を暗黙的に学習できるようにする。
WorkArenaベンチマークの実験では、WorkForceAgent-R1はSFTのベースラインを10.26-16.59%上回っている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:57:08 GMT)
MeshArt: Generating Articulated Meshes with Structure-Guided Transformers [30.4] MeshArtは階層的なトランスフォーマーベースのアプローチで、調音された3Dメッシュを生成する。
構造カバレッジは57.1%向上し,メッシュ生成FIDは209ポイント向上した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:01:34 GMT)
Simulating Meson Scattering on Spin Quantum Simulators [29.8] 我々は,イジングスピンハミルトニアンのアナログ量子シミュレータにおいて,複合粒子の波束に対応する絡み合ったスピン状態を生成する2つの方法を開発した。
トラップイオンシミュレータに焦点をあて,両手法を数値的にベンチマークし,短期実験において高忠実度波動パケットが実現可能であることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:22:49 GMT)
Enhancing Large Language Models for Mobility Analytics with Semantic Location Tokenization [29.2] 移動分析のための大規模言語モデル(LLM)を大幅に強化する新しいフレームワークであるQT-Mobを提案する。
QT-Mobは、場所を表すためにコンパクトでセマンティックにリッチなトークンを学ぶ、ロケーショントークン化モジュールを導入した。
3つの実世界のデータセットの実験は、次の位置予測とモビリティ回復タスクの両方において優れた性能を示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:17:50 GMT)
Beamforming and Resource Allocation for Delay Optimization in RIS-Assisted OFDM Systems [28.3] 本稿では、ダウンリンク再構成可能なインテリジェントサーフェス(RIS)アシスト直交周波数分割多重化(OFDM)システムにおける相設計と資源配分問題について検討する。
混合作用空間を扱い, 状態空間次元を低減するために, ハイブリッド深部強化学習(DRL)手法を提案する。
シミュレーションの結果、提案アルゴリズムは平均遅延を著しく低減し、資源配分効率を向上し、ベースライン法と比較してシステムロバスト性と公正性が優れていることが示された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:30:04 GMT)
Hallucination at a Glance: Controlled Visual Edits and Fine-Grained Multimodal Learning [27.3] マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて高い性能を達成しているが、細かな視覚的差異に苦慮している。
本稿では,最小限に編集された画像対を意味的に一致した字幕で生成する制御データ生成パイプラインを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:23:36 GMT)
Sentence-level Reward Model can Generalize Better for Aligning LLM from Human Preference [27.2] 我々は各文にスコアを割り当て、中間粒度の報酬モデルを導入することを提案する。
すべての文のスコアを応答レベルスコアに集約する新しい注意機構が導入された。
提案手法はRewardBench上で応答レベル報酬モデルを2.7%向上させる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:02:37 GMT)
Towards Universal Offline Black-Box Optimization via Learning Language Model Embeddings [27.1] ユニバーサルブラックボックス最適化(BBO)アルゴリズムの追求は長年の目標である。
既存のオフラインBBOアプローチは、単一タスクと固定次元の設定に制約される。
言語モデル(LM)の最近の進歩は、将来性のある道筋を提供する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:41:18 GMT)
Quantization without Tears [26.6] QwT(Quantization without Tears)は、量子化速度、精度、単純さ、一般化性を同時に達成する手法である。
QwTは、量子化中の情報損失を軽減するために、軽量な追加構造を量子化ネットワークに組み込む。
様々な視覚、言語、マルチモーダルタスクにわたる広範囲な実験は、QwTが高効率かつ多目的であることを示した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:11:25 GMT)
Cultural Bias Matters: A Cross-Cultural Benchmark Dataset and Sentiment-Enriched Model for Understanding Multimodal Metaphors [26.5] 中国語と英語のメタファーを横断的に研究するためのデータセットであるMultiMMを紹介する。
本稿では、感情埋め込みを統合し、文化的背景における比喩的理解を高めるベースラインモデルである感性強化メタファー検出(SEMD)を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:02:50 GMT)
HauntAttack: When Attack Follows Reasoning as a Shadow [25.9] 本稿では,新規かつ汎用的なブラックボックス攻撃フレームワークHauntAttackを紹介する。
我々は、理性的な質問をキャリアとして扱い、元の条件の1つを有害な指示で置き換える。
このプロセスは、モデルが段階的に安全でない出力を生成するための推論経路を生成する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:45:48 GMT)
From Informal to Formal -- Incorporating and Evaluating LLMs on Natural Language Requirements to Verifiable Formal Proofs [25.7] 本稿では,形式的推論の即時適用シナリオである形式的検証に焦点を当てる。
我々は5つの形式仕様言語で18kの高品質な命令応答ペアを構築した。
フォーマルなデータによる微調整は、数学、推論、コーディング能力も強化する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:02:25 GMT)
Equivariant Denoisers Cannot Copy Graphs: Align Your Graph Diffusion Models [24.9] グラフ生成モデリングにおいて支配的なグラフ拡散モデルは、グラフからグラフへの変換タスクにおいて未探索のままである。
本研究では,アライメントが離散拡散モデルの性能を5%から54.7%まで劇的に向上させることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:22:06 GMT)
Four Eyes Are Better Than Two: Harnessing the Collaborative Potential of Large Models via Differentiated Thinking and Complementary Ensembles [24.8] CVPR 2025でエゴ4Dチャレンジのランナーアップソリューションを提示する。
大規模モデルの成功に触発され、先導的なマルチモーダルな大規模モデルを評価し、活用する。
この研究が、大規模モデルの実践的応用の貴重な参考になることを期待している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:36:43 GMT)
Hierarchical Feature-level Reverse Propagation for Post-Training Neural Networks [24.4] エンド・ツー・エンドの自動運転は支配的なパラダイムとして現れてきたが、その高度に絡み合ったブラックボックスモデルは、解釈可能性と安全性の保証の観点から課題を提起している。
本稿では,事前学習ニューラルネットワークに適した階層的かつ非結合なポストトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:19:03 GMT)
Promoting Ensemble Diversity with Interactive Bayesian Distributional Robustness for Fine-tuning Foundation Models [24.4] 対話型ベイズ分布ロバストネス(IBDR)は、粒子間の相互作用をモデル化できる新しいベイズ推論フレームワークである。
VTAB-1Kベンチマークと共通推論言語タスクを用いて,様々なベースライン手法に対してIBDRの性能を評価する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:05:31 GMT)
Auditing Black-Box LLM APIs with a Rank-Based Uniformity Test [24.4] APIプロバイダは、コスト削減やモデル動作の不正な変更のために、量子化または微調整の亜種を慎重に提供することができる。
そこで我々は,ブラックボックスLLMの挙動等式を局所的に展開した認証モデルに検証できるランクベース均一性試験を提案する。
我々は、量子化、有害な微調整、脱獄プロンプト、完全なモデル置換など、さまざまな脅威シナリオに対するアプローチを評価する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:00:31 GMT)
An Online Learning Approach to Prompt-based Selection of Generative Models and LLMs [23.9] 本研究では,与えられた入力プロンプトに対して最適なデータ生成モデルを予測するためのオンライン学習フレームワークを提案する。
提案したPAK-UCBアルゴリズムは、腕に共通するコンテキスト変数を持つコンテキスト帯域(CB)設定に対処する。
実画像と画像と画像の合成モデルを用いた実験により,RFF-UCBは最適な生成モデルを特定するのに成功していることが示された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:34:45 GMT)
Hi-VAE: Efficient Video Autoencoding with Global and Detailed Motion [23.8] Hi-VAEは、ビデオダイナミクスの粗大な動き表現を符号化する効率的なビデオ自動符号化フレームワークを定式化している。
我々は,Hi-VAEの圧縮係数が1428$times$,30$times$がベースライン法よりも高いことを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:30:11 GMT)
D2R: dual regularization loss with collaborative adversarial generation for model robustness [23.7] ディープニューラルネットワークモデルの堅牢性は、敵の攻撃からモデルを守るために不可欠である。
本稿では,二重正則化損失(D2R損失)法と協調的対向生成(CAG)法を提案する。
以上の結果から,CAGによるD2R損失は極めて頑健なモデルであることがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:39:54 GMT)
GoTrack: Generic 6DoF Object Pose Refinement and Tracking [23.5] GoTrackは、6DoFオブジェクトの修正と追跡のための効率的で正確なCADベースの手法である。
GoTrackはフレーム間登録を統合し、計算を節約し、トラッキングを安定化する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:01:47 GMT)
Structure-agnostic Optimality of Doubly Robust Learning for Treatment Effect Estimation [23.4] 平均処理効果推定は因果推論において最も中心的な問題であり、多くの分野に適用できる。
我々は最近導入された統計的下界の構造非依存の枠組みを採用し、ニュアンス関数に構造的特性を生じさせない。
平均治療効果 (ATE) と平均治療効果 (ATT) の両方に対して, 有意かつ広く用いられている2重頑健性評価器の統計的最適性を証明する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:47:35 GMT)
AgentDrug: Utilizing Large Language Models in an Agentic Workflow for Zero-Shot Molecular Optimization [23.0] AgentDrugは、構造化された精錬プロセスにおけるLLMを活用するエージェントワークフローで、精度が大幅に向上する。
Qwen-2.5-3Bでは、AgentDrugは6つの単一プロパティタスクで20.7%(ルース)、16.8%(制限)、そして8つのマルチプロパティタスクで7.0%と5.3%の精度向上を実現している。
より大型のQwen-2.5-7Bでは、AgentDrugはさらに6つの単一目的の精度を28.9%(ルース)と29.0%(制限)で改善する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:39:08 GMT)
Evaluating and Improving Robustness in Large Language Models: A Survey and Future Directions [23.0] 大規模言語モデル(LLM)は,近年,自然言語の理解と生成能力から注目されている。
本稿では,この分野に関する概念や手法の包括的用語を提供し,コミュニティの促進を目的とする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:20:12 GMT)
UNO: Unified Self-Supervised Monocular Odometry for Platform-Agnostic Deployment [22.9] 多様な環境にまたがるロバストかつ姿勢推定を可能にする統合ビジュアル・オドメトリー・フレームワークであるUNOを提案する。
われわれのアプローチは、自動運転車、ドローン、移動ロボット、ハンドヘルドデバイスなど、さまざまな現実のシナリオを効果的に一般化する。
提案手法を3つの主要なベンチマークデータセット上で広範囲に評価する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:30:37 GMT)
Multi-Step Visual Reasoning with Visual Tokens Scaling and Verification [22.9] 本稿では,MLLMが視覚コンテンツに対して検証者誘導推論を行うことを可能にする,推論時ビジュアルトークンスケーリングのための新しいフレームワークを提案する。
提案手法は,様々な視覚的推論ベンチマークにおいて,既存手法よりも優れていた。
これらの結果は,次世代MLLMにおける微粒でコンテキスト対応の視覚的推論を実現するための動的推論機構の実現を実証するものである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:38:49 GMT)
How Far Are We from Optimal Reasoning Efficiency? [22.7] 大きな推論モデル (LRM) は、拡張されたチェーン・オブ・ソート (CoT) 推論を通じて、顕著な問題解決能力を示す。
LRMはしばしば冗長で冗長な推論トレースを生成する。
既存の微調整手法は推論効率を改善することを目的としているが、その効率性を評価することは依然として困難である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:18:50 GMT)
Towards Interpretable Adversarial Examples via Sparse Adversarial Attack [22.6] スパース攻撃は、ディープニューラルネットワーク(DNN)を騙すための敵の摂動の大きさを最適化する
既存の解は、その疎度が低いために解釈可能な逆の例が得られない。
本稿では,初期摂動の大きさを最小化して,CNNの脆弱性を理解するためのスパースアタックを開発することを目的とする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:13:30 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:01:56 GMT)
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization [22.6] そこで我々は,より高速な4ビット行列乗算(Matmul)と精度向上手法を併用したSageAttention2を提案する。
提案手法は,言語,画像,ビデオ生成など,さまざまなモデルにまたがる,無視可能なエンドツーエンドメトリクスの損失を生じさせる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:01:48 GMT)
Post Reinforcement Learning Inference [22.1] 強化学習アルゴリズムから収集したデータを用いた推定と推定について検討する。
本稿では,時間変化の分散を安定化させるために,適応重みを慎重に設計した重み付きZ推定手法を提案する。
主な応用は、動的処理効果推定と動的オフポリシー評価である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:23:02 GMT)
Towards Reliable AR-Guided Surgical Navigation: Interactive Deformation Modeling with Data-Driven Biomechanics and Prompts [22.0] 本稿では,計算効率を向上しつつ,FEMレベルの精度を維持するデータ駆動アルゴリズムを提案する。
変形モデリングプロセスに新たなヒューマン・イン・ザ・ループ機構を導入する。
提案アルゴリズムは, 平均目標登録誤差を3.42mmとし, ボリューム精度で最先端の手法を超越した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:19:54 GMT)
ALINE: Joint Amortization for Bayesian Inference and Active Data Acquisition [21.7] ALINE(Amortized Active Learning and Inference Engine)は、ベイズ推論とアクティブデータ取得のための統合されたフレームワークである。
ALINEは、インフォメーションポイントの効率的な選択とともに、インスタントと正確な推論の両方を提供する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:15:34 GMT)
Evaluating LLM-corrupted Crowdsourcing Data Without Ground Truth [21.7] クラウドソーシングワーカーによる大規模言語モデル(LLM)は、人間の入力を反映するデータセットに挑戦する。
LLMの共謀を考慮に入れたクラウドソーシングモデルの下で,理論的保証付き学習自由スコアリング機構を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:38:39 GMT)
Dual-Priv Pruning : Efficient Differential Private Fine-Tuning in Multimodal Large Language Models [21.6] MLLMにおける微分プライバシ(DP)微調整のための2つの補完的プルーニング機構を用いたフレームワークを提案する。
我々のアプローチは、標準のDP-SGDよりも少ないメモリを一貫して活用する。
我々の知る限りでは、我々はMLLMにおけるDPファインチューニングを初めて探求している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:33:01 GMT)
Leveraging MLLM Embeddings and Attribute Smoothing for Compositional Zero-Shot Learning [21.5] 合成ゼロショット学習は、見かけの合成から学んだ属性やオブジェクトの新規な構成を認識することを目的としている。
以前の作業では、同じ属性を共有するイメージペア間の共有部分と排他的部分を抽出することで、属性とオブジェクトを歪めていた。
マルチモーダル大言語モデル (MLLM) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:36:03 GMT)
Prime the search: Using large language models for guiding geometric task and motion planning by warm-starting tree search [21.4] 物体の集合を移動障害物の中で指定領域に移動させる問題は、幾何学的タスク・運動計画(G-TAMP)問題とみなすことができる。
G-TAMPの伝統的なアプローチは、ドメインに依存しないアプローチや、探索を導くための計画経験から学ぶことに依存してきた。
本稿では,G-TAMP問題におけるタスク計画の指針として,インターネット規模のデータから得られた常識知識を活かしたLarge Language Models (LLMs) を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:47:54 GMT)
Certified Unlearning for Neural Networks [21.3] そこでは,モデルから特定のトレーニングデータの影響を取り除くことを目的として,機械学習の課題に対処する。
既存の方法は制限的な仮定に依存したり、正式な保証を欠いている。
後処理による非学習とプライバシ増幅の関連性を活用して、認定された非学習のための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:55:28 GMT)
Unsafe LLM-Based Search: Quantitative Analysis and Mitigation of Safety Risks in AI Web Search [20.8] 7 つの生産 AIPSE の安全リスク定量化を行う。
その結果,AIPSEは悪質なURLを含む有害なコンテンツを頻繁に生成することがわかった。
GPT-4.1ベースのコンテンツリファインメントツールとURL検出機能を備えたエージェントベースディフェンスを開発した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:33:55 GMT)
LEANCODE: Understanding Models Better for Code Simplification of Pre-trained Large Language Models [20.2] トレーニングと予測時間を短縮するために,コード簡略化のためのLeanCodeを提案する。
平均的文脈認識の注意点に基づくトークンの選択的除去を提唱する。
我々の評価は、SoTAのDietCodeとSlimcodeよりもLeanCodeの方が優れていることを示している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:55:03 GMT)
OctFusion: Octree-based Diffusion Models for 3D Shape Generation [19.9] OctFusionは1台のNvidia 4090 GPUで2.5秒で任意の解像度で3D形状を生成することができる。
OctFusionは、テクスチャメッシュ生成のための高品質なカラーフィールドと、テキストプロンプト、スケッチ、またはカテゴリラベル上の高品質な3D条件付き形状を生成することで、拡張可能で柔軟性がある。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:51:04 GMT)
DiC: Rethinking Conv3x3 Designs in Diffusion Models [19.9] 拡散モデルは視覚生成タスクにおいて例外的な性能を示した。
近年のモデルは、従来のU字型CNN-Attentionハイブリッド構造から、完全にトランスフォーマーベースの等方的アーキテクチャへと移行している。
3x3畳み込みを用いたスケールアップ純粋畳み込み拡散モデルを構築した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:22:27 GMT)
Comba: Improving Bilinear RNNs with Closed-loop Control [19.8] 本稿では,これらのモデルの利点と限界を包括的に分析したBilinear RNNの概念を紹介する。
我々は,状態フィードバックと出力フィードバックの両補正を併用した,スカラー+低ランク状態遷移を取り入れた新しいバイリニアRNNであるCombaを提案する。
また,大規模コーパス上での340M/1.3Bパラメータのトレーニングモデルと,ハードウェア効率のよいチャンクワイド並列カーネルを実装した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:59:30 GMT)
From Sub-Ability Diagnosis to Human-Aligned Generation: Bridging the Gap for Text Length Control via MARKERGEN [19.7] MarkerGenは、長さ制御可能なテキスト生成を改善する単純なyet効率のプラグアンドプレイアプローチである。
テストの結果、MarkerGenは様々な設定でLCTGを大幅に改善し、優れた有効性と一般化性を示した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:56:46 GMT)
Boosting Adversarial Transferability via Commonality-Oriented Gradient Optimization [19.6] 代理モデルから生成された逆の例は、ブラックボックスの設定において弱い転送可能性を示すことが多い。
既存の手法では、摂動入力を多様化したり、サロゲートモデル内で一様勾配正則化を適用して転送性を向上させる。
共通性強化(CE)と個別性抑制(IS)の2つのコンポーネントからなる共通性指向型勾配最適化戦略(COGO)を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:46:37 GMT)
Lipschitz-Driven Noise Robustness in VQ-AE for High-Frequency Texture Repair in ID-Specific Talking Heads [19.4] アイデンティティ固有のトーキングヘッドジェネレーションは、映画製作やバーチャルリアリティーにおける応用への期待が高まっている。
理論的な洞察によって導かれる、シンプルで効率的な後処理フレームワークを採用しています。
実験により, このパイプラインは, 既存のアイデンティティ固有THG法を超越して, 分布外リップ同期の堅牢性を実現することを示した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:25:14 GMT)
Representation Decomposition for Learning Similarity and Contrastness Across Modalities for Affective Computing [19.2] マルチモーダル感情コンピューティングは、画像やテキストなどの多様なデータソースから人間の態度を自動的に認識し、解釈することを目的としている。
本稿では,視覚的およびテキスト的表現を共有(モダリティ不変)およびモダリティ固有のコンポーネントに明示的に分解する,感情コンピューティングのための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:15:57 GMT)
Stop Looking for Important Tokens in Multimodal Language Models: Duplication Matters More [18.9] トークンがプルーニングされるべきかどうかを決定するのに、重要さは理想的な指標ではないことを示す。
DART(Duplication-Aware Reduction of Tokens)を提案する。
実験によると、DARTは88.9%の視覚トークンを出力でき、同等のパフォーマンスを維持している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:35:58 GMT)
Toward Reliable Scientific Hypothesis Generation: Evaluating Truthfulness and Hallucination in Large Language Models [18.9] TruthHypoは,真理仮説を生成する上で,大規模言語モデルの能力を評価するためのベンチマークである。
KnowHDは知識に基づく幻覚検出装置で、既存の知識に基づいて仮説がどれだけうまく構築されているかを評価する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:42:31 GMT)
Automatic Doubly Robust Forests [18.7] 本稿では,高次元ニュアンス関数の存在下でのモーメント関数の条件予測を推定する,Douubly Robust Random Forest (DRRF)アルゴリズムを提案する。
DRRFは、偏りの項の形式に関する事前の知識を必要とせず、目的の量に制限的なパラメトリック仮定を課す。
評価精度,ロバスト性,計算効率の観点から,ベンチマーク手法よりもDRRFの方が優れていることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:30:17 GMT)
Vector-Quantized Vision Foundation Models for Object-Centric Learning [18.4] 我々は、OCL(Object-Centric Learning)のためのクリーンなアーキテクチャー-ベクトル量子化VFMを提案する。
我々の統合の鍵は単純だが効果的であり、単に再構築対象と同じVFM表現を定量化するだけである。
私たちのVVOは、オブジェクトの発見と認識のベースラインと、下流の視覚的予測と推論を一貫して上回ります。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:40:53 GMT)
Reliable Critics: Monotonic Improvement and Convergence Guarantees for Reinforcement Learning [18.3] RPI(Reliable Policy Iteration)を紹介する。
RPIはポリシー評価中に共通プロジェクションやベルマンエラーの最小化をベルマンベースの制約付き最適化に置き換える。
実用的には、新しい批評家に相当するRPIのモデルフリー版を提供する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:27:11 GMT)
AMoPO: Adaptive Multi-objective Preference Optimization without Reward Models and Reference Models [18.2] AMoPOは、選好次元間の動的バランスを実現する新しいフレームワークである。
本稿では,次元認識尺度を暗黙の報酬として用いるために,多目的最適化パラダイムを導入する。
実証的な結果は、AMoPOが最先端のベースラインを28.5%上回っていることを示している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:31:06 GMT)
UdonCare: Hierarchy Pruning for Unseen Domain Discovery in Predictive Healthcare [18.2] UdonCareは、細粒度ドメインを抽出し、これらの洗練されたドメインを符号化し、患者レベルの特徴からドメイン関連信号を分離するために、シームズ型推論機構を適用する階層誘導フレームワークである。
臨床データセットによる実験結果から,本モデルでは,領域ギャップが存在する場合の他の領域一般化よりも高い性能が提案された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:20:34 GMT)
Counterfactual inference in sequential experiments [17.8] 複数の単位に複数の時間点に対する処理を割り当てるシーケンシャルな設計実験のアフタースタディ統計的推測を考察する。
我々のゴールは、最小限のスケールで、カウンターファクト平均に対する推論保証を提供することです。
我々は,いくつかのシミュレーションと,モバイル医療臨床試験HeartStepsのデータを含むケーススタディを通して,我々の理論を解説する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:29:18 GMT)
VeriLoC: Line-of-Code Level Prediction of Hardware Design Quality from Verilog Code [17.6] We propose VeriLoC, the first method that predicting design quality from Verilog at the line- and module-level。
VeriLoCは、ラインレベルの混雑とタイミング予測のために0.86-0.95の高いF1スコアを達成し、平均平均パーセンテージ誤差を14%から18%まで減らす。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:53:22 GMT)
MiniKV: Pushing the Limits of LLM Inference via 2-Bit Layer-Discriminative KV Cache [17.6] Mini KVは、KVキャッシュサイズを大幅に削減しつつ、長時間のコンテキストタスクの精度を同時に保持するKVキャッシュ最適化手法である。
我々は,Mini KVが86%のKVキャッシュ圧縮比を実現し,98.5%以上の精度を回復し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:23:22 GMT)
Understanding and Mitigating Cross-lingual Privacy Leakage via Language-specific and Universal Privacy Neurons [17.6] 本研究は,言語間プライバシー漏洩の情報フローについて検討する。
プライバシ・ユニバーサルニューロンと言語固有のプライバシニューロンを識別する。
これらのニューロンを不活性化することにより、言語間プライバシー漏洩リスクは23.3%-31.6%減少する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:59:14 GMT)
STAMP Your Content: Proving Dataset Membership via Watermarked Rephrasings [17.2] STAMPはデータセットのメンバシップを検出するフレームワークである。
トレーニングデータに1回しか表示されない4つのベンチマークにおける汚染を,我々のフレームワークが検出できることが示される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:12:35 GMT)
PECAN: LLM-Guided Dynamic Progress Control with Attention-Guided Hierarchical Weighted Graph for Long-Document QA [16.9] 長期文書QAは、大規模テキストと長距離依存関係による課題を提示する。
LLM(Large Language Models)の最近の進歩により、ドキュメント全体を単一のパスで処理できるようになった。
LLM注目重みによってエッジを導出する階層グラフを構築する新しい検索手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:53:35 GMT)
Improving Prediction Certainty Estimation for Reliable Early Exiting via Null Space Projection [16.8] 本稿では,Certainty-Aware Probability (CAP)スコアに基づく新しい早期退避手法を提案する。
本研究では,各タスクの平均高速化率は2.19倍であり,性能劣化は無視できることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:08:34 GMT)
ReStNet: A Reusable & Stitchable Network for Dynamic Adaptation on IoT Devices [16.8] ReStNetは、2つの事前訓練されたモデルを縫合することで、ハイブリッドネットワークを動的に構築する。
実行時に柔軟な精度と効率のトレードオフを実現すると同時に、トレーニングコストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:14:37 GMT)
ChartGalaxy: A Dataset for Infographic Chart Understanding and Generation [16.5] インフォグラフィックチャートの理解を促進するために設計された100万規模のデータセットであるChartGalaxyを紹介する。
データセットは、実際のインフォグラフィックチャートから75のチャートタイプ、330のチャートバリエーション、68のテンプレートを識別するインダクティブプロセスによって構築される。
1)微調整によるインフォグラフィックチャート理解の改善,2)インフォグラフィックチャートのベンチマークコード生成,3)インフォグラフィックチャート生成の実現。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:47:02 GMT)
Rethinking the effects of data contamination in Code Intelligence [16.0] 本稿では,コードインテリジェンスタスクにおけるきめ細かいデータ汚染について,系統的研究を行った。
本研究は,汚染が必然的に性能過大評価につながるという従来の信念に異議を唱えるものである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:31:58 GMT)
Hybrid Mesh-Gaussian Representation for Efficient Indoor Scene Reconstruction [16.0] 3DGSとテクスチャメッシュを組み合わせた屋内シーンのハイブリッド表現を提案する。
我々のアプローチでは、テクスチャに富んだ平坦な領域を扱うためにテクスチャメッシュを使用し、複雑な測地をモデル化するためにガウス的を保っている。
広汎な実験により、ハイブリッド表現は同等のレンダリング品質を維持し、ガウスプリミティブを少なくして秒間FPSあたりの優れたフレームを実現することが示されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:08:51 GMT)
A Robust Real-Time Lane Detection Method with Fog-Enhanced Feature Fusion for Foggy Conditions [15.9] 実世界の霧のシナリオで捉えたFogyLaneデータセットを導入し、FogyCULaneとFogyTusimpleという2つの追加データセットを合成する。
我々は,Global Feature Fusion Module (GFFM) を組み込んで,霧画像のグローバルな関係を捉えることにより,車線検出のためのロバストなFog-Enhanced Networkを提案する。
F1スコアはFogyLaneで95.04、FogyCULaneで79.85、FogyTusimpleで96.95である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:52:11 GMT)
Subgoal-Guided Policy Heuristic Search with Learned Subgoals [15.6] ポリシーツリーサーチ(英: Policy tree search)は、ツリーサーチアルゴリズムの一種で、サーチを導くためにポリシーを使用する。
本稿では,ポリシーツリー探索アルゴリズムのサブゴール型ポリシーを学習するための新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:45:43 GMT)
Can the Rookies Cut the Tough Cookie? Exploring the Use of LLMs for SQL Equivalence Checking [15.4] クエリ等価性チェックのためのSQLEquiQuestという,新しい,現実的で,十分に複雑なベンチマークを導入する。
我々は,様々なプロンプト戦略とテキスト内学習例を用いて,最先端のLLMを評価した。
解析の結果,LLMは等価性予測に強いバイアスを示し,非等価性対に対する性能は一貫して劣っていることがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:02:31 GMT)
Place Protections at the Right Place: Targeted Hardening for Cryptographic Code against Spectre v1 [15.0] そこで本研究では,Spectreの脆弱性を検知し,対象とするハードニングを適用するために,新しい固定点アルゴリズムを用いた分析フレームワークを提案する。
フレームワークをLightSLHとしてインスタンス化する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:30:12 GMT)
Mobility-Aware Asynchronous Federated Learning with Dynamic Sparsification [14.9] 本稿では,スペーシフィケーション,モデルスタルネス,モビリティに起因した接触パターン間の相互作用を特徴付ける理論的モデルを開発する。
本稿では,接触時間とモデル安定化度に基づいてスペーシフィケーション度を最適化する移動性を考慮した動的スペーシフィケーションアルゴリズムを提案する。
最先端のベンチマークと比較すると、MADSアルゴリズムはCIFAR-10データセットの画像分類精度を8.76%向上し、Argoverse軌道予測データセットの平均変位誤差を9.46%削減する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:58:32 GMT)
Accelerating 3D Gaussian Splatting with Neural Sorting and Axis-Oriented Rasterization [14.9] 3D Gaussian Splatting (3DGS) は、最近、高品質で効率的なビュー合成において大きな注目を集めている。
アルゴリズムの性能は素晴らしいが、リソースに制約のあるデバイスのリアルタイムレンダリングは、厳しい電力と地域予算のために依然として大きな課題だ。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:14:54 GMT)
"CASE: Contrastive Activation for Saliency Estimation [14.8] 精度法は、モデルの予測にどの入力特徴が関係していると考えられるかを視覚化するために広く用いられている。
そこで本研究では,同一入力上で競合するクラスラベルを識別する手法として,クラス感度の診断試験を提案する。
本研究は, クラスラベルによらず, ほぼ同じ説明を導出し, 信頼性を問うものであることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:57:37 GMT)
Aligned but Blind: Alignment Increases Implicit Bias by Reducing Awareness of Race [14.7] 文脈が曖昧である場合, 言語モデル(LM)は, 初期内部表現における人種概念を無視することを示す。
本稿では,初期モデル層における人種概念の表現を動機付けることによって,新たなバイアス緩和戦略を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:37:10 GMT)
Mirror Descent Using the Tempesta Generalized Multi-parametric Logarithms [14.6] 我々は,機械学習において重要な役割を担っている広いクラスミラー・ディフレッシュ(MD)アルゴリズムを開発した。
本稿では,リンク関数としてテンペスタ多パラメータ変形対数を用いたブレグマン偏差を利用する。
我々は、MD とミラーレス MD アップデートの、より広範で柔軟なファミリーを新たに生成する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:48:44 GMT)
Decoupled Data Consistency with Diffusion Purification for Image Restoration [14.2] 本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。
我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。
提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:36:27 GMT)
Enhancing the Safety of Medical Vision-Language Models by Synthetic Demonstrations [14.0] 有害なクエリを緩和する新しい推論時防衛戦略を提案する。
我々の戦略は、性能を著しく損なうことなく、モデルの安全性を高めることを示す。
次に、セキュリティとパフォーマンスのバランスをとるためのトレードオフソリューションとして、混在するデモ戦略を紹介します。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:26:51 GMT)
Value Residual Learning [13.9] 本稿では,ResFormerについて紹介する。ResFormerは値残差接続を組み込むことで情報フローを向上させるアーキテクチャである。
モデルパラメータが16.11%減少し、Transformerに比べてトレーニングデータが20.3%減少している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:04:59 GMT)
Speech Recognition on TV Series with Video-guided Post-Correction [13.7] 既存のマルチモーダルアプローチでは、ビデオで利用可能な豊富な時間的・文脈的な情報を用いて、ASR出力の補正に失敗する。
本稿では,ビデオから抽出した文脈的手がかりを活用して,ASR転写を改良する多モーダル後補正フレームワークを提案する。
本手法は,テレビシリーズASRのマルチモーダル・ベンチマークで評価し,ASRの性能向上に有効であることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:36:31 GMT)
Variational quantum algorithms with invariant probabilistic error cancellation on noisy quantum processors [13.5] 我々は、PECと量子近似最適化アルゴリズム(QAOA)を組み合わせた新しいノイズ適応戦略を提案する。
この手法を超伝導量子プロセッサ上で実験的に検証し,サンプリングコストを90.1%削減した。
これらの結果は、大規模で低ノイズの量子回路でVQAを実行するための有望な道を開き、実用的な量子コンピューティングの進歩への道を開いた。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:25:47 GMT)
EviNet: Evidential Reasoning Network for Resilient Graph Learning in the Open and Noisy Environments [13.1] 本稿では,主観的論理フレームワークにベータ埋め込みを統合するフレームワークであるEvidential Reasoning Network(EVINET)を紹介する。
EVINETには2つの重要なモジュールが含まれている。
大規模な実験により、EVINETは複数のメトリクスで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:21:12 GMT)
Effective Regularization Through Loss-Function Metalearning [13.1] 進化的計算は、ニューラルネットワークアーキテクチャのさまざまな側面を最適化するために使用することができる。
本稿では,そのような関数が過剰適合を回避し,有効正則化につながることを理論的に示す。
本稿では,正規化の理解に向けた第一歩として,進化的ニューラルアーキテクチャ探索の能力について述べる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:04:52 GMT)
VProChart: Answering Chart Question through Visual Perception Alignment Agent and Programmatic Solution Reasoning [13.0] VProChartは、CQA(Chart Question Answering)の課題に対処するために設計された新しいフレームワークである。
軽量な視覚知覚アライメントエージェント(VPAgent)と,プログラム型ソリューション推論アプローチを統合している。
VProChartは既存のメソッドよりも優れており、チャートによる理解と推論の能力を強調している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:55:50 GMT)
BRIGHT+: Upgrading the BRIGHT Benchmark with MARCUS, a Multi-Agent RAG Clean-Up Suite [13.0] MARCUSは、BRIGHTを系統的に浄化し、高品質なコーパスであるBRIGHT-Plusに変換するパイプラインである。
MARCUSは、構造的ノイズ除去とセマンティックセグメンテーションのための専用エージェントを適用し、応答を含むスパンを保存し、文脈整合性を改善する。
我々はBRIGHT-PlusコーパスとMARCUSパイプラインを共にリリースし、ロバストで推論中心の検索の今後の研究を支援する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:59:04 GMT)
AssertBench: A Benchmark for Evaluating Self-Assertion in Large Language Models [12.5] AssertBench氏は、事実的に真のステートメントの方向性のフレーミングがモデル合意にどのように影響するかを論じている。
私たちは2つのフレーミングプロンプトを構築します。1つは、ユーザがそのステートメントが事実正しいと主張するもので、もう1つは、ユーザがそのステートメントが正しくないと主張するものです。
次に、モデルの合意と推論を記録します。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:08:22 GMT)
Reasoning Paths as Signals: Augmenting Multi-hop Fact Verification through Structural Reasoning Progression [12.4] 現実のシナリオにおける事実のクレームの複雑さの増大は、自動化された事実検証システムにとって大きな課題となる。
既存のアプローチは、しばしば、推論経路の進化する構造を捉えるのに失敗する静的または浅いモデルに依存している。
本稿では,エビデンス検索とクレーム検証の段階を通じて,構造化グラフとしての推論経路を明示的にモデル化する構造推論フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:30:36 GMT)
Efficient Quantification of Multimodal Interaction at Sample Level [12.4] 本稿では,軽量サンプル・ワイド・マルチモーダル・インタラクション (LSMI) 推定器について紹介する。
我々はまず、この最も分解可能な相互作用を定量化するために、適切なポイントワイズ情報尺度を用いて冗長性推定フレームワークを開発する。
そこで本研究では,効率的なエントロピー推定手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:39:25 GMT)
Mixture Experts with Test-Time Self-Supervised Aggregation for Tabular Imbalanced Regression [12.4] タブラル不均衡回帰に対するテスト時間自己監督アグリゲーションを用いた混合専門家の提案を行う。
住宅価格,自転車シェアリング,年齢予測など,実世界の4つのデータセットでMATIを評価した。
これら3つのテストディストリビューションの平均で、MATIは既存の方法に比べて7.1%改善した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:53:03 GMT)
Pointwise confidence estimation in the non-linear $\ell^2$-regularized least squares [12.4] 固定設計による $ell2$-regularized 非線形最小二乗集合の高確率非漸近信頼度推定について検討する。
つまり、任意の固定テスト入力に対して$x$の予測を保持することを意味する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:23:49 GMT)
SiliCoN: Simultaneous Nuclei Segmentation and Color Normalization of Histological Images [12.2] 本稿では, 原子核構造を同時に分割し, 染色組織像の色調を正規化するための新しい深部生成モデルを提案する。
提案モデルは, 組織像からの核領域分割のための空間的注意の概念を取り入れたモデルである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:31:42 GMT)
Optimal Transport Driven Asymmetric Image-to-Image Translation for Nuclei Segmentation of Histological Images [12.2] 組織像から核構造を分割する新しい深部生成モデルを提案する。
提案モデルでは,情報量の多いヒストロジ画像空間と情報量が少ないセグメンテーションマップ領域との間の情報格差を扱うための埋め込み空間を考察する。
提案したモデルは、複雑なネットワークアーキテクチャを持つ他の既存モデルと比較して、ネットワーク複雑性とモデルパフォーマンスのトレードオフを良くする。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:05:33 GMT)
SAP-Bench: Benchmarking Multimodal Large Language Models in Surgical Action Planning [12.1] SAP-Benchは,多モーダル大言語モデル(MLLM)が解釈可能な手術行動計画を実行可能にするために設計された高品質なデータセットである。
我々のデータセットは、戦略的にサンプリングされた1,152個の電流フレームを提供し、それぞれが対応する次のアクションをマルチモーダル解析アンカーとしてペアリングする。
本稿では,MLLMを利用したMLLM-SAPフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:30:04 GMT)
CARoL: Context-aware Adaptation for Robot Learning [12.1] 本稿では,ロボット学習のためのコンテキスト認識適応法(CARoL)を提案する。
CARoLは、システム力学における状態遷移を分析してコンテキスト認識を導入し、新しいタスクと事前知識の類似性を識別する。
シミュレーションされたロボットプラットフォームと地上車両の両方におけるCARoLの効率性と一般化性を検証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:05:32 GMT)
SMI-Editor: Edit-based SMILES Language Model with Fragment-level Supervision [12.0] 本稿では,SMI-Editorを提案する。
SMI-Editorは分子内のサブ構造をランダムに破壊し、結果のSMILESをモデルに戻す。
その後、編集プロセスを通じて元のSMILESを復元しようとする。
実験結果から,SMI-Editorは複数の下流分子タスクにまたがる最先端性能を実現することがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:14:26 GMT)
ExLM: Rethinking the Impact of [MASK] Tokens in Masked Language Models [12.0] Masked Language Models (ML)Mssは入力シーケンスの部分を[MASK]トークンでランダムにマスキングしてトレーニングし、残りのコンテキストに基づいて元のコンテンツを再構築する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:16:13 GMT)
E-BATS: Efficient Backpropagation-Free Test-Time Adaptation for Speech Foundation Models [11.7] 音声基礎モデルでは、音響領域シフトを含む現実のシナリオにデプロイすると、大幅な性能劣化が発生する。
テスト時適応(TTA)は、ソースデータやラベルへのアクセスを必要とせずに、推論時にそのようなドメインシフトに対処するための実行可能な戦略として登場した。
E-BATSは、音声基礎モデルのために明示的に設計された、効率的なBAckproagation-free TTAフレームワークである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:33:37 GMT)
Faster than Fast: Accelerating Oriented FAST Feature Detection on Low-end Embedded GPUs [11.6] 本稿では,ローエンド組込みGPUにおける指向性FAST特徴検出を高速化する2つの手法を提案する。
Jetson TX2組み込みGPUの実験では、GPUをサポートする広く使われているOpenCVと比較して平均速度が7.3倍以上に向上した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:30:30 GMT)
Parsing the Switch: LLM-Based UD Annotation for Complex Code-Switched and Low-Resource Languages [11.6] BiLinguaは、コード変更されたテキストに対するUniversal Dependencies(UD)アノテーションのためのパイプラインである。
まず、スペイン語とスペイン語のGuaran'iデータのためのプロンプトベースのフレームワークを開発する。
第2に、最初のスペインのGuaran'i-parsed corpusを含む2つのデータセットをリリースします。
第3に、言語対と通信コンテキスト間のスイッチポイントの詳細な構文解析を行う。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:23:57 GMT)
Guiding Cross-Modal Representations with MLLM Priors via Preference Alignment [11.5] クロスモーダル表現学習を導く新しいフレームワークであるMAPLE(Modality-Aligned Preference Learning for Embeddings)を紹介する。
MaPLEは、学習過程を強化学習として定式化し、既成のMLLMを用いた自動選好データ構築と、新たなRPA(Relative Preference Alignment)損失という2つの重要な要素を定式化している。
実験結果から,我々の嗜好誘導アライメントは細粒度クロスモーダル検索において著しく向上することが示された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:33:35 GMT)
From Swath to Full-Disc: Advancing Precipitation Retrieval with Multimodal Knowledge Expansion [11.4] Pre-Netは、正確な赤外線によるフルディスク降水検索を可能にすることを目的としている。
Pre-Netは、マルチモーダルデータ統合モデルからスキャニングスロー内の赤外線モデルに知識を転送する。
フルディスク適応の段階では、Self-MaskTuneはマルチモーダルとフルディスク赤外線知識のバランスをとることで、全ディスクにわたって予測を洗練する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:15:46 GMT)
A spring-block theory of feature learning in deep neural networks [11.4] 特徴学習深度ネットが、定期的に低次元の幾何学にどのように崩壊するかを示す。
本稿では,図を再現し,階層間の特徴学習と一般化をリンクするマクロ力学的理論を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:25:08 GMT)
Learning Compact Vision Tokens for Efficient Large Multimodal Models [11.2] 本稿では,短時間の視覚トークンシーケンスに対して,コンパクトな視覚トークンを学習する手法を提案する。
また,マルチブロックトークン融合 (MBTF) モジュールを導入し,トークン列の低減のために多粒度機能を補う。
提案手法は,8つの人気視線ベンチマークのベースラインに匹敵する,あるいはさらに優れた性能を達成している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:36:06 GMT)
PecSched: Preemptive and Efficient Cluster Scheduling for LLM Inference [11.2] 既存のクラスタレベルのLLMスケジューリング戦略は主に2K以下のショートインプット要求をターゲットとしている。
プリエンプティブで効率的なクラスタレベルのLLM推論スケジューラであるPecSchedを提案する。
PecSchedは,99%の待ち行列遅延を最大92%削減し,スループットを最大595%向上することを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:13:28 GMT)
FDC: Fast KV Dimensionality Compression for Efficient LLM Inference [11.2] FDCは、既存のKV次元圧縮システムであるPaluで発生する減圧オーバーヘッドを排除し、注意時間を短縮する高速なKV次元圧縮システムである。
実験では、FDCはジョブ完了時間(JCT)を最大64%削減し、同じレイテンシで最大1.97倍のスループットを提供する。
最先端の消去法と量子化法がFDCと組み合わせられた場合、Paluと組み合わせた方法と同じような改善がなされる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:04:17 GMT)
Imagine to Hear: Auditory Knowledge Generation can be an Effective Assistant for Language Models [11.1] 生成モデルを用いて聴覚知識を動的に生成する新しい手法であるImagine to Hearを提案する。
本フレームワークは、与えられたプロンプトから複数の音声関連テキストスパンを検出し、対応する聴覚知識を生成する。
実験の結果,外部データベースに頼らずにAuditoryBenchの最先端性能を実現することができた。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:20:45 GMT)
LLM-HDR: Bridging LLM-based Perception and Self-Supervision for Unpaired LDR-to-HDR Image Reconstruction [11.0] 本稿では,Large Language Models (LLM) の知覚を改良したセマンティックアーティファクト・一貫性のある対角的アーキテクチャに統合する手法を提案する。
本手法は,複数のベンチマークデータセットにまたがって最先端の性能を達成し,高品質なHDR画像の再構成を行う。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:49:47 GMT)
Subjectivity in the Annotation of Bridging Anaphora [10.9] ブリッジング(英: Bridging)とは、会話において、推論不可能な実体とその先行者の間の連想関係を指す。
アナフォラとその先駆者たちをブリッジする注釈において一貫した合意を達成することは困難である。
そこで本研究では,ブリッジングサブタイプを新たに開発した分類システムを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:40:09 GMT)
Modified K-means Algorithm with Local Optimality Guarantees [10.9] K-meansアルゴリズムは機械学習において最も広く研究されているクラスタリングアルゴリズムの1つである。
本稿では,K-meansアルゴリズムが局所最適解に収束する条件を提案する。
連続性と離散性の両方において局所的最適性を保証するK-meansアルゴリズムの簡単な修正を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:37:28 GMT)
Can LLMs Interpret and Leverage Structured Linguistic Representations? A Case Study with AMRs [10.8] 本稿では,Large Language Models (LLMs) が構造化言語表現の形で文脈情報を活用する能力を評価する。
抽象的意味表現(AMR:Abstract Meaning Representation)構造を多種多様な言語タスクに適用し,短いコンテキストと長いコンテキストの両方を符号化することの影響について検討する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:24:42 GMT)
GGBall: Graph Generative Model on Poincaré Ball [10.8] GGBallは、幾何学的帰納バイアスと現代的な生成パラダイムを統合する、グラフ生成のための新しい双曲的フレームワークである。
我々のモデルは、コミュニティ・スモールでは75%以上、エゴ・スモールでは40%以上、最先端のベースラインでは40%以上減少する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:43:21 GMT)
QP-SNN: Quantized and Pruned Spiking Neural Networks [10.7] スパイキングニューラルネットワーク(SNN)はスパイクを利用して情報をエンコードし、イベント駆動方式で運用する。
資源限定シナリオにおいて,高性能なSNNを効果的に展開することを目的とした,ハードウェアフレンドリで軽量なSNNを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:22:28 GMT)
A Cramér-von Mises Approach to Incentivizing Truthful Data Sharing [10.7] 我々は,Cram'er-von Mises統計に触発された新しい2サンプルテストに基づいて報奨機構を開発する。
提案手法は,データ作成などの非現実的な報告を廃止しつつ,エージェントがより真にデータを送ることを強く動機づける。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:14:48 GMT)
Research on Aerodynamic Performance Prediction of Airfoils Based on a Fusion Algorithm of Transformer and GAN [10.7] 本研究では,改良型トランスフォーマとGAN(Generative Adversarial Network)の融合に基づくディープラーニングモデルであるDeeptransを提案する。
実験の結果、検証セットにおけるディープトランスのMSE損失は5.6*10-6に減少し、単サンプル予測時間は0.0056秒であることがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:30:53 GMT)
SDE-SQL: Enhancing Text-to-SQL Generation in Large Language Models via Self-Driven Exploration with SQL Probes [10.7] 本研究では,大規模言語モデルによる推論中のデータベースの自己駆動探索を可能にするフレームワークであるSDE-を提案する。
従来の方法とは異なり、SDE-はin-contextのデモとして質問コンテキストペアに頼ることなく、ゼロショット設定で動作する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:01:26 GMT)
Epistemic Integrity in Large Language Models [10.5] 大規模な言語モデルは情報ソースにますます頼っているが、偽りや誤解を招く声明の妥当性はユーザーや社会に高いリスクをもたらす。
本稿では,モデルの言語的主張が真の内部的確証を反映しないという,誤校正の重大な問題に直面する。
大規模言語モデルの言語的アサーション性を評価するための,新しい人的ミスアライメント評価と新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:04:30 GMT)
Learning-at-Criticality in Large Language Models for Quantum Field Theory and Beyond [10.0] 本稿では,大規模言語モデルを鋭い学習遷移にチューニングする強化学習スキームである,臨界学習(LaC)を紹介する。
量子場論におけるLaCの実証は、記号的松原和のいくつかの例を用いて、LaCによって臨界点に調整された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:18:01 GMT)
Correcting for Position Bias in Learning to Rank: A Control Function Approach [10.0] 本稿では,2段階プロセスにおける位置バイアスを考慮した制御関数に基づく新しい手法を提案する。
従来の位置偏差補正法とは異なり、この手法はクリックや確率モデルに関する知識を必要としない。
提案手法は位置バイアスの補正における最先端手法よりも優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:10:14 GMT)
Regretful Decisions under Label Noise [10.0] ノイズのあるデータセットから個人レベルでの誤りの可能性を推定する多元的手法を提案する。
私たちの結果は、ミスを予測できないことが、モデルの信頼性と採用を損なう可能性があることを示しています。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:43:24 GMT)
On Mutation-Guided Unit Test Generation [9.9] 変異誘導型LLMに基づくテスト生成手法であるMUTGENを提案する。
MUTGENは変異スコアにおいてEvoSuiteとバニラプロンプトベースの戦略の両方を著しく上回っている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:07:06 GMT)
ST-USleepNet: A Spatial-Temporal Coupling Prominence Network for Multi-Channel Sleep Staging [9.8] 時空間グラフ構築モジュール(ST)とU字型睡眠ネットワーク(USleepNet)からなるST-USleepNetという新しいフレームワークを提案する。
STモジュールは、信号類似性、時間的、空間的関係に基づいて生信号を時空間グラフに変換し、時空間結合パターンをモデル化する。
USleepNetは、時間的および空間的ストリームの両方にU字型の構造を採用しており、重要なターゲットを分離するために画像セグメント化に当初使用していたことを反映している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:25:02 GMT)
Sword and Shield: Uses and Strategies of LLMs in Navigating Disinformation [9.8] 大型言語モデル (LLM) は、高度で説得力のある偽情報を生成するために兵器化することができるが、検出と緩和戦略の強化も約束している。
本稿では,25人の参加者によるWerewolfゲームに触発された,オンラインフォーラムを模擬するコミュニケーションゲームを通じて,LLMと偽情報の複雑なダイナミクスについて検討する。
本研究は, 参加者の役割や戦略によって, LLMの多彩な利用が強調され, この文脈での有効性を理解することの重要性が強調された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:24:11 GMT)
Exploring the Impact of Temperature on Large Language Models:Hot or Cold? [9.7] 我々は,0から2の範囲の温度が6つの異なる能力を評価するために設計されたデータセットに与える影響を評価する。
本研究は,最適温度選択の複雑さを浮き彫りにして,温度がモデル性能に与える影響を明らかにする。
本稿では,これらの観測効果を利用して,所定のプロンプトの最適温度を推定するBERTに基づく温度セレクタを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:36:26 GMT)
Physics-Informed Teleconnection-Aware Transformer for Global Subseasonal-to-Seasonal Forecasting [9.6] S2S (Subseasonal-to-seasonal) 予測は、大気系のカオス力学による重要な課題である。
我々はTelePiTを紹介した。TelePiTは、多スケール物理とテレコネクション認識を融合することで、グローバルなS2S予測を強化する新しいディープラーニングアーキテクチャである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:32:21 GMT)
Reasoning Multimodal Large Language Model: Data Contamination and Dynamic Evaluation [9.4] MLLM(Multimodal Large Language Models)は、視覚ベースのベンチマーク性能を示すが、真の一般化を隠蔽するデータ汚染リスクへの懸念が増大している。
静的ベンチマークを超えてMLLMの一般化を厳格に評価する新しい動的評価フレームワークを提案する。
シミュレーションテストデータ(極端汚染)の微調整はタスク固有の性能を大幅に向上させるが、全体的な一般化には悪影響を及ぼすことを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:52:38 GMT)
Hypergraph Tversky-Aware Domain Incremental Learning for Brain Tumor Segmentation with Missing Modalities [9.4] 臨床実践では、MRI 取得の逐次的な性質のため、MRI のモダリティが欠落している場合もある。
Replay-based Hypergraph Domain Incremental Learning (ReHyDIL) を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:20:48 GMT)
Position: Simulating Society Requires Simulating Thought [9.2] 大規模言語モデル(LLM)で社会をシミュレートするには、構造化され、修正可能で、追跡可能な認知的根拠を持つ推論が必要である。
本稿では,ジェネレーティブ・マインド(GenMinds,ジェネレーティブ・マインド)の概念的モデリングパラダイムを提案する。
これらの貢献は、社会シミュレーションのための思考(言語だけでなく)をシミュレートする表面レベルの模倣から生成エージェントへの、より広範なシフトを推進している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:59:02 GMT)
Learn as Individuals, Evolve as a Team: Multi-agent LLMs Adaptation in Embodied Environments [9.1] 大規模言語モデル (LLM) には広範な知識基盤と強力な推論能力がある。
既存のLCMベースの計画アルゴリズムは、マルチエージェントの具体化シナリオへの弱い適応能力によって制限される。
我々は,LLMエージェントがテスト前後で学習し,進化することを可能にするフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:32:03 GMT)
CTDGSI: A comprehensive exploitation of instance selection methods for automatic text classification. VII Concurso de Teses, Dissertações e Trabalhos de Graduação em SI -- XXI Simpósio Brasileiro de Sistemas de Informação [9.1] この論文は、インスタンス選択(IS)として知られる、包括的でないNLPデータエンジニアリング技術に焦点を当てている。
ISの目標は、トレーニングされたモデルの有効性を維持しながら、ノイズや冗長なインスタンスを削除することで、トレーニングセットのサイズを減らすことである。
我々のソリューションは1.67倍(最大2.46倍)のスピードアップ改善を示し、数十万のドキュメントを持つデータセットにスケーラブルになった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:34:57 GMT)
Training-free LLM Verification via Recycling Few-shot Examples [8.9] LLM出力の検証にFew-shot例をリサイクルする新しいフレームワークを提案する(Referi)。
私たちのキーとなるアイデアは、与えられた少数ショットの例を付加して、ターゲットクエリの候補出力を評価することです。
Referiはベイズのルールからモチベーションを得た2つの異なるスコアを組み合わせて生成した出力を評価し、その後、自信を持って決定され、文脈的に一貫性のある候補を選択する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:02:07 GMT)
Mind the Web: The Security of Web Use Agents [8.9] 攻撃者は、悪意のあるコンテンツをWebページに埋め込むことで、Web利用エージェントの高特権能力を活用できることを示す。
本稿では,攻撃を明白にするのではなく,悪質なコマンドを有用なタスクガイダンスとして設定するタスクアラインインジェクション手法を提案する。
本稿では,監視機構,実行制約,タスク認識推論技術などを含む包括的緩和戦略を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:59:55 GMT)
Insecurity Through Obscurity: Veiled Vulnerabilities in Closed-Source Contracts [8.8] 本稿では、クローズドソースおよび難読化コントラクトに適した新しいバイトコード解析ツールであるSKANFを紹介する。
SKANFは、コントロールフローの難読化、シンボリック実行、そして過去のトランザクションに基づくコンコリック実行を組み合わせて、資産管理の脆弱性を特定して活用する。
実世界の最大抽出値(MEV)ボットの評価では、SKANFが1,030の契約で脆弱性を検出し、394件のエクスプロイトをうまく生成し、潜在的な損失は106万ドルであることがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:23:25 GMT)
Group-On: Boosting One-Shot Segmentation with Supportive Query [8.6] ワンショットセマンティックセグメンテーション(One-shot semantic segmentation)は、ONEアノテートされた同じクラスのサポートイメージのみを与えられたクエリイメージをセグメントすることを目的としている。
グループオンと呼ばれるワンショットセマンティックセマンティックセグメンテーションの新規かつ効果的なアプローチを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:11:23 GMT)
Bias Attribution in Filipino Language Models: Extending a Bias Interpretability Metric for Application on Agglutinative Languages [8.6] 言語モデルの実装に情報理論バイアス属性スコアを適応させる。
フィリピンのモデルは、人、物、関係に関連する言葉によって偏見を向けられていることを示す。
これらの知見は、英語と非英語のモデルが、社会デマログラフ群と偏見に関連する入力をどのように処理するかの相違を示唆している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:13:18 GMT)
SCGAgent: Recreating the Benefits of Reasoning Models for Secure Code Generation with Agentic Workflows [8.5] 大規模言語モデル(LLM)は、さまざまなシナリオのコード生成タスクで広く成功している。
関数型コードを生成するにもかかわらず、現在のLLMはセキュリティを優先せず、悪用可能な脆弱性を持つコードを生成する可能性がある。
安全性の高いコードを生成する手法を提案し,SCGAgentを導入する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:08:08 GMT)
AHSG: Adversarial Attack on High-level Semantics in Graph Neural Networks [8.5] グラフニューラルネットワークに対する敵攻撃は、グラフトポロジとノード属性を慎重に修正することで学習者のパフォーマンスを乱すことを目的としている。
既存の方法は、修正予算とグラフ特性の違いを制約することで攻撃ステルス性を達成する。
本稿では,グラフ構造攻撃モデルであるグラフニューラルネットワークのための高レベルセマンティックス(AHSG)に対する逆アタックを提案し,プライマリセマンティクスの保持を保証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:22:43 GMT)
Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Multimodal Models [8.5] 空間推論のための4つの重要な機能を備えた,スケーラブルで偏りのない合成データセットを提案する。
本研究では,5つの難易度にまたがって7つの質問型を構成するカスケード評価構造を構築した。
特に3次元推論や6次元空間的タスクにおいて,タスクの複雑さが増大するにつれて,パフォーマンスの全般的な低下が観察される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:09:58 GMT)
A Narrative Review on Large AI Models in Lung Cancer Screening, Diagnosis, and Treatment Planning [8.4] 肺がんは世界中で最も流行し、致命的な疾患の1つである。
大規模AIモデルの最近の進歩は、医療画像理解と臨床的意思決定を大幅に強化した。
本稿では, 肺がん検診, 診断, 予後, 治療における大規模AIモデルの適用状況について, 系統的に検討する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:42:24 GMT)
Finding Interest Needle in Popularity Haystack: Improving Retrieval by Modeling Item Exposure [8.3] 本稿では、アイテムの露出確率を明示的にモデル化し、推論時に検索ステージランキングを調整する、露出認識型検索スコアリング手法を提案する。
実世界のビデオレコメンデーションシステムにおけるオンラインA/B実験によるアプローチの有効性を検証し、一意に検索されたアイテムの25%増加と、過度な人気コンテンツの優位性の40%低下を実証した。
本研究は,検索段階で人気バイアスを緩和するためのスケーラブルでデプロイ可能なソリューションを構築し,バイアス認識のパーソナライゼーションのための新しいパラダイムを提供する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:11:09 GMT)
Proven Approximation Guarantees in Multi-Objective Optimization: SPEA2 Beats NSGA-II [8.3] 強度進化アルゴリズム2(SPEA2)は、支配に基づく多目的進化アルゴリズム(MOEA)の1つである。
簡単な定常SPEA2がパレートフロントの最適近似を時間内に計算できることを実証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:36:00 GMT)
MoXGATE: Modality-aware cross-attention for multi-omic gastrointestinal cancer sub-type classification [7.7] MoXGATEは、モダリティ間の依存関係をキャプチャし、堅牢で解釈可能な統合を保証する、新しいディープラーニングフレームワークである。
我々は,MoXGATEが既存の手法より優れ,95%の分類精度を実現していることを示す。
主な貢献は,(1)クロスアテンションに基づくマルチオミック統合フレームワーク,(2)解釈可能性向上のためのモダリティ重み付き融合,(3)データの不均衡を緩和するための焦点損失の応用などである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:42:23 GMT)
CAST: Contrastive Adaptation and Distillation for Semi-Supervised Instance Segmentation [7.5] 我々は,事前学習型視覚基礎モデル(VFM)をコンパクトな専門家に圧縮する,半教師付き知識蒸留(SSKD)フレームワークであるCASTを紹介する。
1) コントラスト画素校正による自己学習による VFM 教師のドメイン適応,(2) 統一多目的損失によるコンパクトな学生への蒸留,の3段階に展開する。
Cityscapes と ADE20K では、我々の11X小学生は、適応された VFM 教師を +3.4 AP (33.9 vs. 30.5) と +1.5 AP (16.7 vs. 15.2) で上回り、州を上回ります。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:09:16 GMT)
Beyond Self-Repellent Kernels: History-Driven Target Towards Efficient Nonlinear MCMC on General Graphs [7.4] 我々はマルコフ・チェイン・モンテカルロ(MCMC)における履歴駆動型目標(HDT)フレームワークを提案し、離散状態空間におけるランダムウォークアルゴリズムを改善する。
また,HDTは,現在の状態と提案状態の局所的な情報のみを必要とすることにより,軽量な実装を保っていることを示す。
グラフサンプリング実験は、一貫したパフォーマンス向上を示し、メモリ効率の高いLRUキャッシュは、大規模な汎用グラフへのスケーラビリティを保証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:52:33 GMT)
Pre-trained Large Language Models Learn Hidden Markov Models In-context [7.4] 隠れモデル(HMM)は、ラテンチャン構造を持つシーケンシャルデータをモデリングするツールであるが、現実のデータに適合する。
事前学習された言語(LLM)は、文脈内学習によって生成されたデータを効果的に学習できることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:49:38 GMT)
EdgeSpotter: Multi-Scale Dense Text Spotting for Industrial Panel Monitoring [7.3] 本研究は、エッジAIベースのビジョンシステム(EdgeSpotter)のための、高精度で堅牢な産業パネル監視を実現するための、新しいマルチスケール高密度テキストスポッターを提案する。
具体的には、マルチレベル特徴間の相互依存性を学習するために、効率的なミキサーを備えた新しいトランスフォーマーを開発した。
さらに, テキストの形状, 位置, 意味情報を明示的にエンコードするキャットモール・ロム・スプラインを用いた新しい特徴サンプリングを設計した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:45:53 GMT)
Dual-view Spatio-Temporal Feature Fusion with CNN-Transformer Hybrid Network for Chinese Isolated Sign Language Recognition [7.2] 本稿では,NationalCSL-DPという手話認識のための2視点手話データセットを提案する。
データセットは、2つの垂直ビューに対して10人の署名者が記録した134140のサインビデオで構成されている。
また、CNNトランスフォーマーネットワークは強力なベースラインであり、予測のための極めて単純だが効果的な融合戦略として提案されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:04:29 GMT)
Filling the Missings: Spatiotemporal Data Imputation by Conditional Diffusion [7.0] 環境モニタリングから都市交通管理まで,現代的応用への課題が提示されている。
機械学習とディープラーニングに基づく現在のアプローチは、空間次元と時間次元の依存性を効果的にモデル化するために苦労している。
CoFILLは、拡散品質モデルの本質的な利点に基づいて、高品質な計算結果を生成する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:53:06 GMT)
Latency Optimization for Wireless Federated Learning in Multihop Networks [7.0] マルチホップネットワーク上での無線フェデレーション学習(FL)における新しいレイテンシ問題について検討する。
葉ノードとリレーノードの連成最適化により,システム遅延の最小化を目的とした最適化問題を定式化する。
我々は、無線マルチホップPAFLシステムにおいて、69.37%の遅延の大幅な削減を観測した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:10:09 GMT)
Bose-Hubbard Model on a Honeycomb Superlattice: Quantum Phase Transitions and Lattice Effects [7.0] ハニカム超格子上のBose-Hubbardモデルの基底状態および有限温度相図について検討した。
超格子ポテンシャル深さ$Delta/t$とオンサイト相互作用$U/t$との相互作用は、ゼロ温度で3つの異なる量子相をもたらす。
我々の研究は, 密度不均衡モット絶縁体や強固な超流動構造を含む, 相互作用および格子変調駆動型量子相へのアクセスを可能にするハニカム超格子構造について強調する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:50:07 GMT)
Keeping Up with the Models: Online Deployment and Routing of LLMs at Scale [6.9] 次段のモデルに対して最大$M_max$のモデルを選択する階層的アルゴリズムを,報酬高信頼と低コスト低信頼境界を用いて提案する。
ここで,StageRoute が次数$T2/3$ の後悔を達成し,一致した下界を提供し,ほぼ最適性を確立することを証明した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:25:26 GMT)
Inverse Design of Metamaterials with Manufacturing-Guiding Spectrum-to-Structure Conditional Diffusion Model [6.9] 本稿では,一対多のメタマテリアル逆設計問題に対処するために,カスタマイズされたスペクトル・ツー・シェイプとサイズパラメータを実装するフレームワークを提案する。
熱カモフラージュ用選択発光スペクトルを調整した自由形メタマテリアルを設計・製造し,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:57:18 GMT)
RBA-FE: A Robust Brain-Inspired Audio Feature Extractor for Depression Diagnosis [6.7] 本稿では,脳にインスパイアされた音声特徴抽出器(RBA-FE)を改良した階層型ネットワークアーキテクチャを用いて,抑うつ診断のためのモデルを提案する。
RBA-FEは、ノイズを調整するために、生音声から抽出した6つの音響特性を活用し、空間特性と時間依存性の両方をキャプチャする。
ノイズ問題に対処するため,本モデルは適応速度スムーズなインテリジェンス・アンド・ファイア (ARSLIF) と呼ばれる改良されたスパイクニューロンモデルを組み込んだ。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:00:45 GMT)
Flattery in Motion: Benchmarking and Analyzing Sycophancy in Video-LLMs [6.5] ビデオ大言語モデル(ビデオ-LLM)は、マルチモーダル推論を必要とする現実のアプリケーションにますます統合されている。
これらのモデルが視覚的エビデンスと矛盾する場合でも、ユーザ入力と整合する傾向は、そのような文脈において彼らの信頼性を損なう。
我々は,最新のビデオLLMにおけるサイコファンティックな振る舞いを評価するための,最初の専用ベンチマークであるVISE(Video-LLM Sycophancy Benchmarking and Evaluation)を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:00:21 GMT)
Mitigating Behavioral Hallucination in Multimodal Large Language Models for Sequential Images [6.5] SHE(Sequence Hallucination Eradication)は,幻覚を検知し緩和する軽量なフレームワークである。
また,行動幻覚の重症度を定量化する新しい指標(BEACH)を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:08:52 GMT)
Defending Against Diverse Attacks in Federated Learning Through Consensus-Based Bi-Level Optimization [6.5] 敵対的攻撃は、多くの機械学習アプリケーションに重大な課題をもたらす。
我々は, 対角的条件下でのコンセンサスに基づく二段階最適化(CB$2$O)のレジリエンスを理論的に解析する。
我々は,相互作用する新しい多粒子系であるFedCB$2$Oを提案し,実世界のアプリケーションの要求に対処する実用的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:55:17 GMT)
Investigating the Relationship Between Physical Activity and Tailored Behavior Change Messaging: Connecting Contextual Bandit with Large Language Models [6.4] 本稿では,介入型を選択するためのcMABと,メッセージ内容のパーソナライズのための大規模言語モデル(LLM)を組み合わせたハイブリッドアプローチを提案する。
身体活動のモチベーションを高めることを目的としたモチベーションメッセージとして,行動自己監視,ゲインフレーム,ロスフレーム,社会的比較の4種類の介入タイプを評価した。
メッセージコンテンツはさらに、自己効力の日々の変動、社会的影響、規制の焦点など、動的なコンテキスト要因を用いてパーソナライズされる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:30:02 GMT)
Audio synthesizer inversion in symmetric parameter spaces with approximately equivariant flow matching [6.4] 多くのオーディオシンセサイザーは異なるパラメータ構成で同じ信号を生成することができる。
これは主にシンセサイザーの内在対称性によるもので、特に置換不変性に着目している。
本手法を実環境の音響合成に使用するフル機能のオープンソースシンセサイザーであるSurge XTに適用することにより,音響再構成の指標間での回帰および生成ベースラインよりも優れることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:47:44 GMT)
Tight Lower Bounds under Asymmetric High-Order Hölder Smoothness and Uniform Convexity [6.3] 我々は最適性ギャップの観点から、$Omegaleft( left( fracHsigmaright)frac23(p+nu)$の最悪のオラクル複合体を確立する。
我々の結果は、この一般的な設定における対応する上界と一致する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:42:14 GMT)
Bitcoin: A Non-Continuous Time System [6.3] 本稿では,ビットコインを外部測定ではなく,時間的順序を内部的に生成する非連続時間システムとして再認識する。
提案されたエントロピー崩壊の概念は、PoWベースの長鎖機構が不確実性を段階的に解決し、分散化されたコンセンサスを確立する方法を説明する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:11:04 GMT)
Selective Response Strategies for GenAI [6.3] Generative AI(GenAI)の台頭は、Stack Overflowのような人間ベースのフォーラムに大きな影響を与えている。
これにより負のフィードバックループが発生し、GenAIシステムの開発を妨げる。
選択応答がデータ生成プロセスに複合的影響を与える可能性があることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:20:05 GMT)
LLM-Enhanced Rapid-Reflex Async-Reflect Embodied Agent for Real-Time Decision-Making in Dynamically Changing Environments [6.2] 意思決定の遅れは、重要かつ不十分に研究された問題として現れます。
本稿では、意思決定の遅延を等価なシミュレーションフレームに変換する時間変換機構(TCM)を提案する。
本稿では,軽量LLM誘導フィードバックモジュールとルールベースエージェントを結合したRapid-Reflect Agent(RRARA)を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:09:26 GMT)
A Theoretical Characterization of Optimal Data Augmentations in Self-Supervised Learning [6.2] 我々はカーネル理論を用いて、事前学習後に所望の目標表現を達成するデータ拡張のための解析式を導出する。
非競合的かつ対照的な損失、すなわちVICReg、Barlow Twins、Spectral Contrastive Lossについて検討する。
我々の分析によると、拡張は有用な表現を学ぶためにデータと似ていてはならず、多様性も必要であり、アーキテクチャは最適な拡張に重大な影響を与えている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:51:57 GMT)
InfoSEM: A Deep Generative Model with Informative Priors for Gene Regulatory Network Inference [6.2] 遺伝子発現データから遺伝子制御ネットワーク(GRN)を推定することは生物学的プロセスを理解する上で重要である。
インフォメーションモデルであるInfoSEMを導入する。
バイオマーカー発見などの現実世界の応用をよりよく反映した,生物学的に動機づけたベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:17:26 GMT)
On the number of modes of Gaussian kernel density estimators [6.1] 実数直線上の期待されるモードの数は、$Theta(sqrtbetalogbeta)$ as $beta,ntoinfty$としてスケールする。
この調査の動機は、トランスフォーマーがメタスタブルな状態で描画されるクラスタの数を決定することである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:36:49 GMT)
When do neural networks learn world models? [6.0] ニューラルネットワークが同様の世界モデルを学ぶことができるかどうかについて、最初の理論的結果を示す。
低次バイアスを持つモデルは、軽度の仮定の下で遅延データ生成変数を確実に回復することを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:52:36 GMT)
Conditional Denoising Meets Polynomial Modeling: A Flexible Decoupled Framework for Time Series Forecasting [5.8] 本稿では,複雑な時間パターンをモデル化するための条件記述型多項式モデリング(CDPM)フレームワークを提案する。
結合した時系列をモデル化する代わりに、CDPMはそれを傾向と季節的な要素に分解し、個別にモデル化する。
スムーズなトレンドコンポーネントに対しては、歴史的依存関係を組み込んで線形モデルを強化するモジュールが提案されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:43:41 GMT)
TABLET: Table Structure Recognition using Encoder-only Transformers [5.5] 大規模で人口密度の高いテーブルに最適化されたスプリット・マージに基づく新しいトップダウンモデルを提案する。
提案手法は行と列の分割をシーケンスラベリングタスクとして定式化し,デュアルトランスフォーマーエンコーダを用いて特徴的相互作用をキャプチャする。
本手法は,高速な処理速度を維持しながら高い精度を実現し,分解能損失と計算複雑性を低減する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:34:15 GMT)
Near Optimal Non-asymptotic Sample Complexity of 1-Identification [5.3] 純粋探索における基本的多武装バンディット定式化である1同定問題について検討する。
目標は、平均報酬が少なくとも既知の閾値$mu_0$である腕が存在するかどうかを判断すること、またはそのような腕が存在しないと信じている場合、Noneを出力することである。
我々は,新しいアルゴリズムを設計し,非漸近的観点から理論的解析を行う。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:23:45 GMT)
Regularized Adaptive Graph Learning for Large-Scale Traffic Forecasting [5.2] トラフィック予測のための正規化適応グラフ学習(RAG)モデルを提案する。
RAGLは予測精度の点で最先端の手法を一貫して上回り、競争力のある計算効率を示す。
4つの大規模実世界の交通データセットの実験により、RAGLは予測精度において最先端の手法を一貫して上回り、競争力のある計算効率を示すことが示された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:58:27 GMT)
Reward Model Interpretability via Optimal and Pessimal Tokens [5.0] リワードモデリングは、大きな言語モデルと人間の価値を整合させる上で重要な要素として現れてきた。
本稿では,各語彙空間全体にわたる応答の包括的解析を通じて,報酬モデル解釈可能性に対する新たなアプローチを提案する。
これらのモデルは特定のアイデンティティグループに対するバイアスをエンコードすることができ、これは無害トレーニングの意図しない結果として現れる可能性がある。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:56:58 GMT)
On the kernel learning problem [4.9] カーネルリッジ回帰問題は、入力データである$Xin mathbbRd$の関数として出力$Y$に最適なものを見つけることを目的としている。
我々は、余剰行列パラメータ$U$を導入することにより、カーネルリッジ回帰問題の一般化を考える。
これは自然に$U$の選択を最適化する非線形変分問題につながる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:14:46 GMT)
Secondary Stakeholders in AI: Fighting for, Brokering, and Navigating Agency [4.9] 我々は、有意義な参加には、情報、(2)同意、(3)エージェンシーの3つの参加的理想が関係していると論じる。
我々は、不愉快なデータコントリビュータ、支持活動家、そして注意深い実践者という3つの利害関係者のアーキタイプを紹介します。
我々は、二次利害関係者が影響を受け、影響を受けているAIシステムに有意義に参加できるAIの未来を構想する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:57:30 GMT)
NanoZone: Scalable, Efficient, and Secure Memory Protection for Arm CCA [4.6] Arm Confidential Computing Architecture (CCA)は現在、CVM(Confidential Virtual Machine)全体の粒度で分離されている。
我々は、CCAを3層ゾーンモデルで拡張し、単一のプロセス内で無制限に軽量な分離ドメインを生成します。
ドメイン・スウィッチの悪用をブロックするために、高速なユーザレベルのCode-Pointer Integrity(CPI)メカニズムも追加します。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:55:48 GMT)
DM$^3$Net: Dual-Camera Super-Resolution via Domain Modulation and Multi-scale Matching [4.5] DM$3$Netはドメイン変調とマルチスケールマッチングに基づく新しいデュアルカメラ超解像ネットワークである。
キープルーニングを導入し,メモリ使用量の大幅な削減と,モデル性能を犠牲にすることなく推定時間を短縮する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:51:18 GMT)
Towards Physics-informed Diffusion for Anomaly Detection in Trajectories [4.4] 我々は,GPSスプーフィングの可能性を示す異常な軌跡(偽の軌跡など)を見つけることを目指している。
この問題は、違法な漁業や違法な石油輸送などの国際水域での違法な活動を抑制するために社会的に重要である。
近年,データ間隔に拘わらず生成モデルを用いた異常軌道検出の有望な結果が示されている。
物理法則に従わない軌道を同定するために運動論的制約を統合する物理インフォームド拡散モデルを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 05:10:20 GMT)
pFedSOP : Accelerating Training Of Personalized Federated Learning Using Second-Order Optimization [4.2] pFedSOPはPFLの2次最適化を効率的に利用し、パーソナライズされたモデルのトレーニングを高速化する。
提案手法はまず,局所勾配と大域勾配の正規化角度を用いて,局所勾配のパーソナライズされた更新を計算する。
次に、このパーソナライズされた更新から計算された正規化されたFisher Information Matrix (FIM) を、パーソナライズされたモデル更新のためのHessianの近似として使用する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:09:47 GMT)
KG2QA: Knowledge Graph-enhanced Retrieval-Augmented Generation for Communication Standards Question Answering [4.0] 本稿では,大規模言語モデルの微調整と知識グラフの構築を組み合わせる。
Qwen2.5-7B-Instructは、コミュニケーション標準の分野で優れたプロフェッショナル機能を示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:07:22 GMT)
VARSHAP: Addressing Global Dependency Problems in Explainable AI with Variance-Based Local Feature Attribution [3.5] SHAPのような既存の特徴属性法は、しばしばグローバルな依存に悩まされ、真のローカルモデルの振る舞いを捉えられなかった。
本稿では,特徴の重要度として,予測分散の低減を利用したモデルに依存しない新しい局所特徴属性法であるVARSHAPを紹介する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:26:47 GMT)
Experimental Efficient Influence Sampling of Quantum Processes [3.4] 量子プロセスの特徴付けは、量子システムの完全なポテンシャルを解き放つための道を開く。
量子過程の鍵テクスティの影響を量子ビット部分集合上で効率的に抽出するインフルエンスサンプリングを導入する。
フォトニックプラットフォームを用いて、影響サンプリングを実験的に実証し、量子ユタ過程のテストおよび学習に応用する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:15:04 GMT)
Highly Fast Text Segmentation With Pairwise Markov Chains [3.2] 本稿では,NLPセグメンテーションタスクにおけるマルコフ連鎖モデル,Hidden Markov Chain (HMC) とPairwise Markov Chain (PMC) について検討する。
テキストセグメンテーションの特定の課題にこれらのモデルを適応させる独自の手法を開発し、非常に短いトレーニングと実行時間で関連するパフォーマンスを得る。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:17:37 GMT)
Strongly Consistent Community Detection in Popularity Adjusted Block Models [3.2] Popularity Adjusted Block Model (PABM)は、コミュニティ間での不均一なノードの人気を許容することによって、ネットワークデータのコミュニティ検出のための柔軟なフレームワークを提供する。
本稿では,コミュニティ数を選択するためのデータ駆動型アプローチを提案する。
提案手法の有効性とロバスト性は,広範囲なシミュレーションと実世界の応用を通して検証される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:17:41 GMT)
Semantic-preserved Augmentation with Confidence-weighted Fine-tuning for Aspect Category Sentiment Analysis [3.1] 大規模言語モデル(LLM)は、低リソースシナリオにおけるデータの不足に対処するための効果的なアプローチである。
本稿では、アスペクトカテゴリー感情分析タスクのためのデータ拡張戦略を提案する。
我々は、生成した文と原文とのセマンティック一貫性を確保するために、後処理技術を用いる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:53:28 GMT)
Technical Report for ICRA 2025 GOOSE 3D Semantic Segmentation Challenge: Adaptive Point Cloud Understanding for Heterogeneous Robotic Systems [3.1] この課題は、ロボットプラットフォームから収集された多様な非構造屋外環境からの3Dポイントクラウドのセマンティックセグメンテーションに焦点を当てている。
この問題は、Point Transformer v3と統合されたPoint Prompt Tuningの実装によって解決された。
このアプローチはmIoUで大幅なパフォーマンス向上を実現し、挑戦的なプラットフォームでは最大22.59%向上した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:55:44 GMT)
Anatomy of Higher-Order Non-Hermitian Skin and Boundary Modes [3.1] 生物直交分極の高次元一般化によるバルクモードの分離ギャップを考慮したアメーバ理論と境界モードの表面ギャップを考慮した一般化されたブリルアンゾーンアプローチが,これらの系を包括的に理解することを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:46:20 GMT)
A Hybrid Multi-Factor Network with Dynamic Sequence Modeling for Early Warning of Intraoperative Hypotension [3.0] 過去の生理的信号を用いた術中低血圧(IOH)予測は重要である。
動的シーケンス予測タスクとしてIOH予測を定式化するハイブリッドマルチファクターネットワークを提案する。
公立と実世界の両方の臨床データセットの実験では、HMFが競争ベースラインを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:45:29 GMT)
Research Knowledge Graphs: the Shifting Paradigm of Scholarly Information Representation [3.0] 研究知識グラフ(Research Knowledge Graphs, RKGs)は、研究成果物とその関連性を簡単に利用し、機械で操作可能な表現を提供することを目的としている。
本稿では、RKGビルディングブロックと原則の説明とともに、RKGビジョンの第一概念化、利用内RKGの分類について述べる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:10:30 GMT)
A Layered Self-Supervised Knowledge Distillation Framework for Efficient Multimodal Learning on the Edge [2.9] 本稿では,コンパクトなディープラーニングモデルを学習するための階層型自己監督知識蒸留フレームワークについて紹介する。
提案手法は,最先端PS-KD法よりも4.54%向上した。
我々のフレームワークは特にマルチモーダルセンシングとサイバー物理環境に適している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:30:48 GMT)
Hallucination to Consensus: Multi-Agent LLMs for End-to-End Test Generation with Accurate Oracles [2.9] ユニットテストは、ソフトウェアの正しさを保証する上で重要な役割を担います。
従来の手法は、テストを生成するために検索ベースまたはランダム化アルゴリズムに依存していた。
我々は、JUnitテストの自動生成のための新しいエンドツーエンドのプロンプトベースのフレームワークであるCANDORを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:11:16 GMT)
Tensor Product Neural Networks for Functional ANOVA Model [2.7] 機械学習モデルの複雑化に伴い、機械学習モデルの解釈可能性の重要性が増している。
高次元関数を低次元関数の和に分解する機能的ANOVAモデルは、AIを解釈する最も一般的なツールの1つである。
本稿では,ANOVAのユニークな分解を保証し,各成分を安定かつ正確に推定できるニューラルネットワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:00:22 GMT)
Deep regularization networks for inverse problems with noisy operators [2.7] 主演算子が雑音データから構築される大きな逆問題に対して,教師付き学習手法を提案する。
ニューラル演算子は、散乱方程式の右側のパターンを対応する正規化パラメータにマッピングする。
我々は,相違原理の論理から情報を得たネットワークが,高いコントラストの画像に繋がることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:19:18 GMT)
Fully Explainable Classification Models Using Hyperblocks [2.6] Hyperblocksを使った既存の作業に基づいて、解釈可能性の向上、トレーニング時間の短縮、モデルの複雑さの軽減に重点を置いています。
このシステムでは、広範囲な機械学習の専門知識を必要とせずに、対象物の専門家(SME)がモデルの決定ロジックを直接検査し、理解することができる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:00:22 GMT)
Safety-Aware Reinforcement Learning for Control via Risk-Sensitive Action-Value Iteration and Quantile Regression [2.6] 量子ベースのアクションバリュー反復法は、期待されるコスト対ゴーの分布を学習することで、このバイアスを低減する。
既存の手法では、コスト関数の組み合わせによる複雑なニューラルネットワークアーキテクチャや手動のトレードオフが必要になることが多い。
本研究では、複雑なアーキテクチャを使わずに安全性を確保するために、条件付き値-アット・リスクを組み込んだリスク正規化量子化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:22:00 GMT)
UltraSketchLLM: Saliency-Driven Sketching for Ultra-Low Bit LLM Compression [2.4] UltraSketchLLMはインデックスのないスケッチベースのフレームワークで、モデル性能を維持しながら超低ビット圧縮(重量あたり0.5ビットまで)を実現する。
提案手法では,小重量の相対誤差を最小限に抑えるために,AbsMaxMinスケッチを最小にするため,重み付けを優先するための重要空間割り当て,圧縮を意識した微調整のためのストレートスルー推定器を組み込んだ。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:55:42 GMT)
Experimental memory control in continuous variable optical quantum reservoir computing [2.3] 量子貯水池コンピューティング(QRC)は、時間的タスクに適したオンライン量子強化機械学習のための有望なフレームワークを提供する。
本稿では,決定論的に生成されたマルチモード圧縮状態に基づく光QRCプラットフォームを実証する。
本研究では, 絡み合った多モード構造を利用することで, 量子貯水池の表現性とメモリ容量を著しく向上させることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:47:06 GMT)
Theorem-of-Thought: A Multi-Agent Framework for Abductive, Deductive, and Inductive Reasoning in Language Models [2.2] 大規模言語モデル(LLM)は、自然言語推論タスク全体で強いパフォーマンスを示しているが、その推論プロセスは脆弱で解釈が難しいままである。
Theorem-of-Thought (ToTh)は、3つの並列エージェント間の協調として推論をモデル化する新しいフレームワークである。
シンボリック(WebOfLies)と数値(MultiArithm)の推論ベンチマークの実験は、ToThがCoT、セルフ一貫性、CoT-デコーディングを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:28:38 GMT)
FANVID: A Benchmark for Face and License Plate Recognition in Low-Resolution Videos [2.0] 現実世界の監視は、個々の低解像度(LR)フレームで認識できない顔やナンバープレートをレンダリングし、信頼性の高い識別を妨げる。
63のアイデンティティと49のライセンスプレートを備えた1,463のLRクリップからなる新しいビデオベースベンチマークであるFANVIDを提案する。
それぞれのビデオには、邪魔な顔とプレート、タスクの難しさとリアリズムが盛り込まれている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:22:00 GMT)
Comparison of Lightweight Methods for Vehicle Dynamics-Based Driver Drowsiness Detection [1.9] ドライバの眠気検出(DDD)は、ドライバの疲労に起因する道路事故を防止する。
自動車力学に基づくDDDは、経済的かつ高性能な方法として提案されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:32:34 GMT)
ModelForge: Using GenAI to Improve the Development of Security Protocols [1.9] プロトコル仕様の翻訳を自動化する新しいツールであるModelForgeを紹介する。
自然言語処理(NLP)と生成AI(GenAI)の進歩を活用することで、ModelForgeはプロトコル仕様を処理し、CPSAプロトコル定義を生成する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:27:09 GMT)
AnnoDPO: Protein Functional Annotation Learning with Direct Preference Optimization [1.9] タンパク質機能の解読は、タンパク質表現学習の基本的な課題である。
本稿では,タンパク質機能予測のための新しいマルチモーダルフレームワークAnnoDPOを提案する。
提案手法では, アノテーション不足と不均衡という2つの課題を, 嗜好に整合した学習目標を通じて解決する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:59:09 GMT)
FLAIR-HUB: Large-scale Multimodal Dataset for Land Cover and Crop Mapping [1.7] FLAIR-HUBは、フランスの2528km2の高解像度(20cm)のアノテーションを持つ、最大のマルチセンサーの陸地カバーデータセットである。
航空写真、センチネル・1/2時系列、SPOT画像、地形データ、歴史的空中画像の6つの整列モードが組み合わさっている。
その結果、マルチモーダル核融合ときめ細かい分類の複雑さが示され、最も優れた土地被覆性能(精度78.2%、65.8% mIoU)がほぼ全てのモダリティを用いて達成された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:48:51 GMT)
BG-HOP: A Bimanual Generative Hand-Object Prior [1.7] 本稿では,BG-HOPについて述べる。BG-HOP,BG-HOP,BG-HOP,BG-HOP,BG-HOP,BG-HOP,BG-HOP,BG-HOPを3Dでモデル化する。
実験では、モデルがバイマン的相互作用を生成し、与えられた対象のグリップを合成する能力を示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:33:44 GMT)
Deep RL Needs Deep Behavior Analysis: Exploring Implicit Planning by Model-Free Agents in Open-Ended Environments [1.7] 神経科学と倫理学のツールを応用し、新しい、複雑で部分的に観察可能な環境でDRLエージェントを研究する。
我々はこの環境をエージェントに共同行動分析とニューラル分析を適用するためのプラットフォームとして利用する。
一般的な仮定とは対照的に、モデルのないRNNベースのDRLエージェントは、構造化された計画的な振る舞いを示すことができる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:43:48 GMT)
How Does DPO Reduce Toxicity? A Mechanistic Neuron-Level Analysis [1.6] 安全微調整アルゴリズムは言語モデルにおける有害な出力を減らすが、そのメカニズムは未解明のままである。
毒性ニューロンは、モデル全体でのDPOの効果の2.5%から24%に過ぎなかった。
そこで我々はDPOを模倣した活性化編集法を開発した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:49:52 GMT)
CE-CoLLM: Efficient and Adaptive Large Language Models Through Cloud-Edge Collaboration [1.6] 大型言語モデル(LLM)は、人間のような優れた予測能力を示す。
LLMをデプロイして、エッジで効率的かつ適応的な推論サービスを提供するのは難しい。
本稿では,これらの課題に対処するために,LLM(CE-CoLLM)のための新しいクラウドエッジコラボレーションフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:57:21 GMT)
Test-driven Software Experimentation with LASSO: an LLM Prompt Benchmarking Example [1.5] テスト駆動ソフトウェア実験(TDSE)は、ソフトウェア主題の実行と、その"事実上の"実行時の振る舞いの観察と分析を含む。
本稿では,TDSEを行うための最小限のドメイン固有言語とデータ構造を提供するLASSOという汎用解析プラットフォームを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:32:28 GMT)
ViMMRC 2.0 -- Enhancing Machine Reading Comprehension on Vietnamese Literature Text [1.4] ViMMRC 2.0はベトナムのテキストブックにおける複数選択読解作業のための以前のViMMRCの拡張である。
このデータセットには、散文と詩からなる699の読解通路と、5,273の質問がある。
マルチステップアテンションネットワーク(MAN)と自然言語推論(NLI)タスクを組み合わせた多段階アプローチを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:58:52 GMT)
Quantum-assisted variational Monte Carlo [1.3] 量子多体系の基底状態を解くために,量子支援型変分モンテカルロ (QA-VMC) アルゴリズムを導入する。
提案手法は,従来の提案法に比べて絶対スペクトルギャップが大きく,自己相関時間も小さくなることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:26:50 GMT)
Targeting relative risk heterogeneity with causal forests [1.2] 本研究では,相対的リスクを目標として,因果林を改変する手法を提案し,実装する。
我々は、相対的なリスク因果樹林が、そうでなければ検出されていない異質性の源を捉えることができることを示唆するシミュレーションデータの結果を提示する。
2型糖尿病患者を対象とした実地試験データを用いて,リラグルチドのHTEの探索を行った。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:10:35 GMT)
Machine Learning-Based Self-Localization Using Internal Sensors for Automating Bulldozers [1.0] 従来のブルドーザーの自己ローカライゼーションシステムはRTK-GNSSに依存している。
RTK-GNSS信号は特定の採掘条件下で失われることがある。
本稿では,ブルドーザーを対象とした機械学習による自己位置推定手法を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:14:43 GMT)
Reasoning with RAGged events: RAG-Enhanced Event Knowledge Base Construction and reasoning with proof-assistants [1.0] 本稿では,複数のLPMを用いた過去のイベントの自動抽出モデルを提案する。
我々はトゥキディデスの史料を用いて評価を行う。
抽出されたRDF表現をCoq証明アシスタント仕様に変換する自動翻訳パイプラインを開発した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:36:14 GMT)
Certification of High-Dimensional Entanglement Within the Resource Theory of Buscemi Nonlocality [1.0] 本稿では,分散計測,テレポーテーション,二成分混合状態の資源理論を紹介する。
状態判別ゲームにおいて高次元の絡み合いは利点を与え、その利点はシュミット数ロバスト性によって定量化できることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:29:41 GMT)
Patient Similarity Computation for Clinical Decision Support: An Efficient Use of Data Transformation, Combining Static and Time Series Data [1.0] 患者類似度計算(PSC)は医療情報学の基本的な問題である。
本稿では,データ変換(DT)法に基づく分散患者類似度計算(DPSC)手法を提案する。
我々のDTベースのアプローチは、AUC、精度、F測定の点で、予測性能を最大11.4%、10.20%、12.6%向上させる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:32:00 GMT)
HotelMatch-LLM: Joint Multi-Task Training of Small and Large Language Models for Efficient Multimodal Hotel Retrieval [0.9] HotelMatch-LLMは、自然言語のプロパティ検索を可能にする旅行領域のマルチモーダル密度検索モデルである。
The HotelMatch-LLM features of three key innovations: (1) Domain-specific multi-task optimization with three novel search, visual, and language modeling objectives; (2) Asymmetrical dense search architecture with a small language model (SLM) for efficient online query processing and a large language model (LLM) for embedded hotel data, (3) Extensive image processing to handle all property image galleries。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:39:08 GMT)
E2E-Swin-Unet++: An Enhanced End-to-End Swin-Unet Architecture With Dual Decoders For PTMC Segmentation [0.8] textbfDualSwinUnet++は、PTMCセグメンテーションを強化するために設計されたデュアルデコーダベースのアーキテクチャである。
このモデルは、691の注釈付きRFA画像を持つ臨床用超音波データセットに基づいて訓練され、最先端のモデルに対して評価される。
その結果,PTMC患者に対するリアルタイム外科的補助に対するモデルの適合性とそのセグメンテーション精度向上効果が示された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:11:31 GMT)
Uncertainty-Aware Strategies: A Model-Agnostic Framework for Robust Financial Optimization through Subsampling [0.8] 本稿では,定量的ファイナンスにおけるモデル不確実性の問題に対処する。
ポートフォリオ割り当て、デリバティブ価格、リスク管理の決定は、限られたデータからモデルを推定することに依存する。
従来の金融リスク対策によって動機付けられた外的「不確実性尺度」をモデル空間に重ね合わせます。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:55:00 GMT)
BIMgent: Towards Autonomous Building Modeling via Computer-use Agents [0.7] マルチモーダル大言語モデル(LLM)を利用したエージェントフレームワークBIMgentを提案する。
BIMgentを実世界のビルディングモデリングタスクで評価し、テキストベースの概念設計生成と既存ビルディング設計からの再構築を両立させた。
その結果、BIMgentは設計意図を保ちながら手作業の負荷を効果的に削減し、実際のアーキテクチャモデリングシナリオにおける実践的なデプロイの可能性を強調している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:45:31 GMT)
Finite-PINN: A Physics-Informed Neural Network with Finite Geometric Encoding for Solid Mechanics [0.7] PINNモデルは流体PDE問題に対処する能力を示しており、固体力学におけるそのポテンシャルが浮上しつつある。
本研究は、PINNを用いた一般的な固体力学問題の解法における2つの重要な課題を明らかにする。
この研究は、Finite-PINNモデルと呼ばれる一般的な固体力学問題に対するPINNアーキテクチャを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:30:05 GMT)
Personalized Constitutionally-Aligned Agentic Superego: Secure AI Behavior Aligned to Diverse Human Values [0.7] スーパーエゴエージェントは、ユーザーが選択した「クリードコンスティチューション」を参照してAIプランニングを操縦する
制度は、これらの憲法と処刑前の普遍的な倫理的フロアに対する計画を検証する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:31:26 GMT)
Context Is Not Comprehension [0.6] 私たちは、この障害を分離するために設計された新しいベンチマークであるVerbose ListOps (VLO)を紹介します。
VLOは決定論的でネストされた計算をコヒーレントなストーリーに織り込み、モデルが明示的な値を見つけるのではなく、内部の状態を追跡して更新することを強制する。
実験の結果,LLMは生のListOps方程式をほぼ完全精度で解くことができ,VLO上では10kトークンで崩壊することがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:32:54 GMT)
Scalable Inference for Bayesian Multinomial Logistic-Normal Dynamic Linear Models [0.6] この記事では、$textitFenrir$と呼ばれる、後続状態推定に対する効率的で正確なアプローチを開発します。
我々の実験から、フェンリルはスタンよりも3桁効率が良いことが示唆された。
当社のメソッドは,C++で記述されたユーザフレンドリなソフトウェアライブラリとして,Rインターフェースを備えたコミュニティで利用可能です。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:52:22 GMT)
MAGNet: A Multi-Scale Attention-Guided Graph Fusion Network for DRC Violation Detection [0.5] 設計規則チェック(DRC)は、IC設計におけるコスト削減と設計効率の向上に非常に重要である。
DRC予測のためのグラフニューラルネットワークと改良されたU-Netを統合したハイブリッドディープラーニングモデルMAGNetを提案する。
全体として、MAGNetは空間情報、意味情報、構造情報を効果的に組み合わせ、予測精度の向上とDRCホットスポット検出における偽陽性率の低減を実現している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:13:41 GMT)
Improving the Efficiency of Long Document Classification using Sentence Ranking Approach [0.4] 本稿では,TF-IDFに基づく文ランク付け手法を提案する。
提案手法は,固定数とパーセンテージに基づく文選択と,正規化TF-IDFスコアと文長を組み合わせた評価戦略の強化である。
入力サイズを50%以上削減し、推論遅延を43%削減しながら、フルコンテキストのベースラインと比較して、ほぼ同一の分類精度をわずか0.3パーセントの低下で達成します。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:09:43 GMT)
A Heuristic Study of Temperature: Quantum Circuitry in Thermal Systems [0.4] 我々は,境界動的複雑性を仮定に推し進め,複雑度ウィンドウ型熱力学(CWT)の開発を行う。
スムースネスは有限で連続的な有効温度と非負の複雑性生成ポテンシャルを保証する。
CWTは臨界点の滑らか化からブラックホール情報の流れへの現象を統一し、宇宙の総生成可能な複雑さとそのホログラフィックエントロピーは、熱力学、量子計算、重力の順序と同じである、と予測する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 04:52:12 GMT)
UAVs Meet Agentic AI: A Multidomain Survey of Autonomous Aerial Intelligence and Agentic UAVs [0.4] エージェントUAVは、ゴール駆動行動、文脈推論、対話的自律性を示すことによって、従来のUAVを上回る。
本研究では, 精密農業, 建設・鉱業, 災害対応, 環境モニタリング, インフラ検査, 物流, セキュリティ, 野生生物保護の7分野について検討した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 01:39:51 GMT)
Break-The-Chain: Reasoning Failures in LLMs via Adversarial Prompting in Code Generation [0.3] セマンティックに忠実だが逆向きに構造化された急激な摂動のスイートを導入する。
特定の修正は性能を著しく低下させるが、他の修正は驚くほどモデル精度を35.3%向上させる。
これらの結果から,現在の推論システムの脆弱性と予測不能性が示唆された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:43:46 GMT)
Transient Dynamics in Lattices of Differentiating Ring Oscillators [0.3] リカレントニューラルネットワーク(Recurrent Neural Network, RNN)は、時間的関係の学習に広く用いられている機械学習モデルである。
数値シミュレーションにより、異なるニューロン環の大きな格子が局所的な神経同期挙動を示すことを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:29:15 GMT)
Efficient Fermi-Hubbard model ground-state preparation by coupling to a classical reservoir in the instantaneous-response limit [0.3] 本稿では,古典的な貯水池を組み込んだ相互作用モデルの構築手法を提案する。
私たちは結合を設計して、システムを初期製品状態から相互作用する基盤状態へと素早く駆動することができます。
このアンザッツはハミルトン変分アンザッツによく似ており、新しい視点を与えている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 00:00:49 GMT)
Sound certification of memory-bounded quantum computers [0.2] 本稿では,現実的なサーバ・ユーザシナリオにおける量子ゲート認証のための量子システム・クイズ方式を提案する。
重要なことは、このアプローチは信頼できる状態の準備と測定を必要としないため、本質的には関連する系統的なエラーから解放される。
メモリバウンドの単一デバイスセットアップで最初に解決しようとしている技術的課題は、マルチキュービットシステムのテンソル積構造を回復することである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:01:09 GMT)
Translating Federated Learning Algorithms in Python into CSP Processes Using ChatGPT [0.2] ChatGPTは、Pythonの前述のフェデレーション学習アルゴリズムを対応するCSPプロセスに自動翻訳するために使用される。
提案手法は,汎用集中型および分散型フェデレーション学習アルゴリズムの翻訳(モデルチェッカーPATによる検証)によって実験的に検証された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 14:45:11 GMT)
A Hybrid ConvNeXt-EfficientNet AI Solution for Precise Falcon Disease Detection [0.2] 本稿では、ファルコン病の分類にConvNeXtとEfficientNetのハイブリッドを用いた革新的な手法を提案する。
本研究は, 正常, 肝疾患, アスペルギルス症の3つの病態を正確に同定することに焦点を当てた。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:01:44 GMT)
From Tool Calling to Symbolic Thinking: LLMs in a Persistent Lisp Metaprogramming Loop [0.1] 本稿では,大規模言語モデル(LLM)を永続的かつインタラクティブなLisp環境と統合するための新しいアーキテクチャを提案する。
本稿では,対話型AIシステムの今後の実装を導くための設計フレームワークとアーキテクチャ原則を提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:12:06 GMT)
Learning based on neurovectors for tabular data: a new neural network approach [0.0] 本稿ではニューロベクターに基づく新しい学習手法を提案する。
神経ベクトルは、従来の重み付け更新ではなく、エネルギーの伝播が学習過程を駆動するベクトル空間でデータを構造化することで情報を符号化する。
本手法は神経ベクトルを用いて知識の動的表現を生成し,予測モデルの解釈可能性と効率を向上させる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:09:59 GMT)
ZettaLith: An Architectural Exploration of Extreme-Scale AI Inference Acceleration [0.0] 本稿では,AI推論のコストとパワーを1000倍以上削減するために設計されたスケーラブルなコンピューティングアーキテクチャであるZetaLithを紹介する。
アーキテクチャ分析と技術投射に基づいて、2027年にゼッタリスラック1基が1.507ゼッタFLOPSを達成する可能性がある。
ZettaLithはAI推論専用に最適化されており、AIトレーニングには適用できない。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:15:47 GMT)
VORTEX: A Spatial Computing Framework for Optimized Drone Telemetry Extraction from First-Person View Flight Data [0.0] 本稿では,ドローンテレメトリデータを抽出・解析するVORTEXシステムを提案する。
VORTEXは、PyTorchベースのOCRツールボックスであるMMOCRを使用して、ドローンヘッドアップディスプレイ(HUD)記録からテレメトリ変数を抽出する。
その結果、利用可能なフレームの4.07%を利用する5秒サンプリングレートは、ポイント保持率64%と1秒ベースラインの4.2%以内の平均速度精度で最適なバランスを提供することがわかった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:01:54 GMT)
Unveiling the role of vector potential in the Aharonov-Bohm effect [0.0] ベクトルポテンシャルは、物理的な実体をほとんど持たない便利な数学的ツールではないと主張する。
また、ベクトルポテンシャル全体に含まれる残留ゲージ任意性の役割についても論じる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:54:48 GMT)
Unraveling Token Prediction Refinement and Identifying Essential Layers in Language Models [0.0] 本研究の目的は,大規模言語モデル (LLM) が内部処理によるトークン予測を反復的に洗練することである。
我々は,LLMが入力コンテキストから情報にアクセスし活用する方法,および関連する情報の位置がモデルのトークン予測改善プロセスにどのように影響するかに着目した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:34:17 GMT)
Universality of conformal prediction under the assumption of randomness [0.0] 共形予測器は、ランダム性の仮定の下で有効である集合または機能予測を提供する。
問題は、ランダム性の仮定の下で同じ意味で有効であり、共形予測器よりも効率的である予測器が存在するかどうかである。
結論は、共形予測器のクラスは、予測効率の限られた利得しか得られないという点で普遍的であるということである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:05:17 GMT)
Typical Quantum States of the Universe are Observationally Indistinguishable [0.0] 我々は、宇宙の量子状態に関する知識に関して、新しい3つの不可能な結果を確立する。
我々は、どのベクトルがどのベクトルであるかを決定できないか、あるいは著しく絞り込むことができないことを示した。
また、経験的証拠以外の理論的考察が、この事実と普遍量子状態に関する知識の理解にどのように役立つかについても論じる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:37:33 GMT)
Transfer Learning and Explainable AI for Brain Tumor Classification: A Study Using MRI Data from Bangladesh [0.0] 手動MRI解析は困難で不正確であり、迅速な診断には非効率である。
本研究は,バングラデシュの多くの病院から取得したMRIデータを利用した脳腫瘍自動分類システムの構築により,これらの課題に対処することを試みた。
VGG16、VGG19、ResNet50を含む高度なディープラーニングモデルは、グリオーマ、髄膜腫、および様々な脳がんの分類に使用された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:26:13 GMT)
The Quantum Wave Function as a Complex Probability Distribution [0.0] 波動関数とその複素共役は複素確率分布と解釈できることを示す。
量子論におけるプロセスの考え方を受け入れることは、大きな物体に古典的な振る舞いが現れる理由を説明するかもしれないことが示唆されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:41:39 GMT)
Robust, fast and high-fidelity composite single-qubit gates for superconducting transmon qubits [0.0] 超伝導トランスモン量子ビットのための新しい量子制御法を提案する。
提案手法は、キュービット周波数や非調和性変動などのシステム固有の誤差を緩和する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 08:17:51 GMT)
Resonances and continued-fraction Green's functions in non-Hermitian Bose-Hubbard-like quantum models [0.0] 非エルミート量子ハミルトニアンの固有状態として扱われる共鳴により、複素エネルギー固有値の局所化のタスクが考慮される。
マルチボソニックなボース・ハバードのような複雑なハミルトンの家族は、イラストレーションのために呼び戻されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:25:53 GMT)
Randomness, exchangeability, and conformal prediction [0.0] 本稿では、ランダム性の関数理論のより広範な利用を論じる。
IIDデータの仮定は機械学習では標準であるが、共形予測はデータ交換性に依存する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:25:48 GMT)
Quantum SAT Problems with Finite Sets of Projectors are Complete for a Plethora of Classes [0.0] 量子満足度(Quantum Satisfiability, QSAT)問題の新しい量子ビット不変量を示す。
まず最初に、$mathsfBQP_1$, $mathsfcoRP$, $mathsfQCMA$に対して完備なqudit QSAT問題が存在することを証明します。
次に、同じ複雑性を維持しながら、任意のQCSPを量子ビットの問題に還元できることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:59:55 GMT)
Prompting Science Report 2: The Decreasing Value of Chain of Thought in Prompting [0.0] Chain-of-Thought(CoT)プロンプトは,大規模言語モデルに“ステップバイステップ”を推奨するテクニックである。
CoTプロンプトの有効性はタスクの種類やモデルによって大きく異なる。
明確な推論能力を持つモデルの場合、CoTのプロンプトは答えの正確性に限界があるだけである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:41:25 GMT)
Predicting Anthropometric Body Composition Variables Using 3D Optical Imaging and Machine Learning [0.0] 本研究では,3次元光学画像から得られたバイオマーカーに統計的および機械学習モデルを適用することで,DXAスキャンに代わる手法を提案する。
患者のデータを医療で抽出することは、多くの技術的課題と法的制約に直面している。
これらの制約を克服するため、我々は半教師付きモデルである$p$-Laplacian回帰モデルを実装した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 03:42:56 GMT)
Pendulum Tracker -- SimuFísica: A Web-based Tool for Real-time Measurement of Oscillatory Motion [0.0] アプリケーションは、装置のカメラを介して振り子の位置を自動的に検出し、角度反転時間グラフと振動周期の推定をリアルタイムで表示する。
その結果, 理論的予測と良好な一致を示し, 教育的文脈におけるシステムの精度と適用性を確認した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 22:05:36 GMT)
On the Generalization of Data-Assisted Control in port-Hamiltonian Systems (DAC-pH) [0.0] 本稿ではポート・ハミルトニアン (p$mathcalH$) システムに対する仮説的ハイブリッド制御フレームワークを提案する。
システムの進化は、右手側(RHS)と左手側(LHS)の2つの部分に分けられ、構造的およびパラメトリックな不確実性の両方に対処する散逸・入出力フローである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:44:01 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0] ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。
量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:32:05 GMT)
Next-Generation Conflict Forecasting: Unleashing Predictive Patterns through Spatiotemporal Learning [0.0] 本研究では、3つの異なるタイプの暴力を事前に36ヶ月予測するためのニューラルネットワークアーキテクチャを提案する。
このモデルは確率的分類と回帰タスクを共同で実行し、将来の事象の予測と予測等級を生成する。
警告システム、人道的対応計画、証拠に基づく平和構築イニシアチブのための有望なツールである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:42:29 GMT)
Multi-Step Guided Diffusion for Image Restoration on Edge Devices: Toward Lightweight Perception in Embodied AI [0.0] 本稿では,画像品質,知覚精度,一般化を著しく向上させる多段階最適化手法を提案する。
超分解能およびガウス劣化実験により,ステップ毎の勾配更新の増加はLPIPSとPSNRを最小遅延オーバーヘッドで改善することを示した。
我々の発見はMPGDが、ドローンや移動ロボットのような組込みAIエージェントのリアルタイム視覚認識のための軽量でプラグアンドプレイの修復モジュールとしての可能性を強調した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:11:25 GMT)
Long-Tailed Learning for Generalized Category Discovery [0.0] 本稿では,長期分布における一般化されたカテゴリ発見を行う新しいフレームワークを提案する。
まず,学習可能な分布を用いて擬似ラベルを生成する自己誘導ラベリング手法を提案する。
次に、識別的表現を導出する表現バランスプロセスを導入する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:01:49 GMT)
Integrability versus chaos in the steady state of many-body open quantum systems [0.0] 開量子系のリンドブラッドの記述は、2種類の可積分性をもたらす。
レベル間隔統計と固有状態熱化仮説の開量子系への拡張を組み合わせる。
演算子サイズの分布を効果的に利用してカオス的かつ可積分な定常状態の識別が可能であることを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:08:30 GMT)
Inline Quantum Measurements with SNSPDs Coupled to Photonic Bound States [0.0] 超伝導ナノワイヤ単光子検出器(SNSPD)は量子フォトニック集積回路のコンポーネントを可能にする。
SNSPDを用いたインライン検出の概念を導入し、超コンパクトデバイスフットプリント内での高度な量子計測を容易にする。
BIC結合型インライン検出器のオンチップ効率は80%以上,回収時間は2ns以下,固有ジッタは70ps以下であった。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 07:38:24 GMT)
Image segmentation and classification of E-waste for waste segregation [0.0] このモデルは、e-wasteの分離を行うために、ピックアップ・アンド・プレイス・ロボットとさらに統合される。
最初は、マウスや充電器などの一般的な電子廃棄物を解体し、写真を撮ってカスタムデータセットを作成しました。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:09:33 GMT)
Hyperbolic recurrent neural network as the first type of non-Euclidean neural quantum state ansatz [0.0] 本稿では,非ユークリッド型ニューラル量子状態(NQS)アンザッツを双曲型GRUの形で導入する。
我々の研究は、量子多体系に対する最初の非ユークリッドNQSアンサッツとして、双曲型GRUの生存可能性に関する概念実証である。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:25:44 GMT)
History-Aware Cross-Attention Reinforcement: Self-Supervised Multi Turn and Chain-of-Thought Fine-Tuning with vLLM [0.0] 本稿では,CAGSR-vLLM-MTC(Self-Supervised Cross-Attention-Guided Reinforcement)フレームワークの拡張版について述べる。
VLLMのC++/CUDAカーネルを最初に実装し、生成時に層ごと、頭ごとのクロスアテンション重みを非同期にキャプチャした。
次に、自己指導型報酬関数を一般化し、会話履歴全体と中間連鎖ステップに注意信号を蓄積する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 01:58:17 GMT)
Half-AVAE: Adversarial-Enhanced Factorized and Structured Encoder-Free VAE for Underdetermined Independent Component Analysis [0.0] 本研究では, 独立成分分析(ICA)における課題に, 決定条件と決定条件の両方で対処することで, 変分オートエンコーダ(VAE)フレームワークを改良する。
提案されたHalf Adversarial VAEは、エンコーダフリーのHalf-VAEフレームワークに基づいており、未決定シナリオに取り組むための明示的な逆マッピングを排除している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 06:29:53 GMT)
Genuine multi-entropy and holography [0.0] ホログラフィーでは、真のマルチパーティの絡み合いは小さくなく、重要な役割を果たす。
ブラックホールへの応用については、そのような真の$mathttq$-partiteマルチエントロピーがページ時間後にのみ重要であることが分かる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 12:59:19 GMT)
Generative Modeling of Networked Time-Series via Transformer Architectures [0.0] 多くのセキュリティおよびネットワークアプリケーションは、機械学習モデルをトレーニングするために大きなデータセットを必要とする。
最近の研究では、トランスフォーマーモデルが新しいサンプルを合成することによってデータのサイズを拡大する可能性を示しているが、合成されたサンプルは実際のデータよりもモデルを改善することはできない。
本稿では,既存のMLの性能向上に有効な時系列データを生成するための生成フレームワークとして,効率的なトランスフォーマーベースモデルを設計する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:05:13 GMT)
From Axioms to Algorithms: Mechanized Proofs of the vNM Utility Theorem [0.0] 我々は、選好完全性、推移性、連続性、独立性の古典的な公理を実践する。
我々の定式化は、宝くじに対する嗜好関係の数学的構造を捉えている。
この形式化は、経済モデリング、AIアライメント、管理決定システムにおける応用のための厳格な基盤を提供する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 10:09:54 GMT)
Exploring Effective Strategies for Building a Customised GPT Agent for Coding Classroom Dialogues [0.0] 本研究は,教室対話をコードするカスタマイズGPTエージェントの開発に有効な戦略について検討する。
GPT-4のMyGPTエージェントを事例として,人間のコードブックを用いた教室対話におけるベースライン性能を評価する。
この結果は,いくつかの制限があるにも関わらず,これらの戦略で開発されたMyGPTエージェントが有用なコーディングアシスタントとして機能することを示唆している。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:29:05 GMT)
Evaluation of Machine Learning Models in Student Academic Performance Prediction [0.0] 本研究では,学校環境における学生の学業成績を予測するための機械学習手法について検討する。
行動、学術、人口統計の詳細を持つ学生のデータは、標準的な古典的機械学習モデルの実装に使用された。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:33:49 GMT)
Epidemic-guided deep learning for spatiotemporal forecasting of Tuberculosis outbreak [0.0] 本稿では,先進的な深層学習技術と機械的疫学の原則を融合させるEGDL手法を提案する。
我々のフレームワークは、飽和入射率とグラフラプラシア拡散を付加したネットワーク化された感受性-感染-回復モデル(MN-SIR)に基づいて構築されている。
全国47都道府県と中国本土31県で実施したTB頻度データから,本手法が堅牢かつ正確な予測を行うことを示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 11:48:30 GMT)
Ensemble-MIX: Enhancing Sample Efficiency in Multi-Agent RL Using Ensemble Methods [0.0] マルチエージェント強化学習(MARL)法は,様々なマルチエージェントタスクにおいて最先端の結果を得た。
しかし、MARLアルゴリズムは、単一のエージェントよりもはるかに多くの環境相互作用を必要とする。
本稿では,分散された中央集権的批判と分散アンサンブル学習を組み合わせた新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:44:49 GMT)
Engineering and harnessing long-range interactions for atomic quantum simulators [0.0] このような長距離相互作用のさらなる工学化に向けたコールド原子コミュニティの進歩が,基礎的な多体問題の新たなシステマティクスのシミュレーションをいかに促進したかを示す。
我々は、凝縮物質現象のシミュレーションから格子ゲージ理論の研究まで、そのようなプラットフォームが新たな洞察を提供することのできる様々な分野を紹介した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 18:17:55 GMT)
Dynamic and Geometric Shifts in Wave Scattering [0.0] 1984年のベリーの先駆的な研究以来、進化する波の位相における幾何学的および動的寄与の分離は波動物理学において基礎となっている。
ここでは、この幾何学的-力学的な分解を、観測者が入力波と出力波の間の期待値のシフトを経験する、異なる種類の波散乱問題に拡張する。
この統一フレームワークは、波動散乱における幾何学と力学の相互作用を照らし、幅広い物理系に容易に適用することができる。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 13:47:32 GMT)
Devanagari Digit Recognition using Quantum Machine Learning [0.0] 本稿では,手書き文字認識のための最初のハイブリッド量子古典アーキテクチャを提案する。
提案したモデルは99.80%の量子実装と0.2893の試験損失に対する最先端のテスト精度を達成する。
重ね合わせや絡み合いなどの量子原理を活用することで、この研究は地域スクリプト認識のための新しいベンチマークを確立する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 23:49:23 GMT)
Deontically Constrained Policy Improvement in Reinforcement Learning Agents [0.0] マルコフ決定プロセス(MDP)は、機械学習コミュニティにおいて不確実性の下で意思決定を行うための最も一般的なモデルである。
MDPは非決定性、確率的不確実性、および明示的な行動モデルを取得する。
強化学習(RL)エージェントは、実用機能を最大化することにより、MDPで行動することを学ぶ。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 01:01:06 GMT)
Data-Driven Logistic Regression Ensembles With Applications in Genomics [0.0] 本稿では,正規化とアンサンブル技術を融合した高次元バイナリ分類手法を提案する。
医学ゲノミクスの応用において,本手法は競合する手法によって見落とされた重要なバイオマーカーを同定する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 21:47:43 GMT)
Clustering-Based Sub-QUBO Extraction for Hybrid QUBO Solvers [0.0] 量子近似最適化アルゴリズム(QAOA)は2次非制約バイナリ最適化(QUBO)問題を解決するために用いられる。
ノイズの多い中間量子(NISQ)デバイスを活用して大規模なQUBO問題を解決するには、完全な問題を複数のサブプロブレムに分解する1つの方法がある。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 09:57:08 GMT)
Characterization of Efficient Influence Function for Off-Policy Evaluation Under Optimal Policies [0.0] オフ・ポリティィ・アセスメント(OPE)は、カウンターファクト・ポリシーの価値を推定するための強力なフレームワークを提供する。
最適条件下での値関数に対する効率的な影響関数(EIF)の簡潔な特徴付けを確立する。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 20:39:30 GMT)
Certifying the activation of Bell nonlocality with finite data [0.0] 我々は、量子状態が局所的な隠れ状態モデルを持つかどうかを検証するために、超オクタヘドロンの形で自信のあるポリトープを導入する。
隠れたベルの非局所性の必要性を統計的に厳格に証明し,109ドルのサンプルを受注した。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:55:10 GMT)
Another look at inference after prediction [0.0] 予測ベース(PB)推論は,大量の予測を用いた統計的解析に適合するように設計されている。
簡単な修正を施すことで、有効な推論を得る以上の効率の向上を保証できることが示される。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 16:15:40 GMT)
Analyzing Breast Cancer Survival Disparities by Race and Demographic Location: A Survival Analysis Approach [0.0] 本研究は, 多様な人種的, 地理的背景から乳がん患者の生存パターンを明らかにするために, 頑健な分析枠組みを用いた。
我々の目標は、乳がんの予後を改善し、治療格差を減らし、グローバルな取り組みに貢献することである。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:27:56 GMT)
A dependently-typed calculus of event telicity and culminativity [0.0] 本報告では, 事象の重大性と有意性を分析するために, 依存型クロス言語的枠組みを提案する。
英語の文をモデル化するためのフレームワークの例を示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 02:14:10 GMT)
A Simulation-based Evaluation Framework for Inter-VM RowHammer Mitigation Techniques [0.0] インターVM RowHammerは、仮想マシン(VM)の境界を越えてビットフリップを誘導する攻撃である。
この攻撃を軽減するために、いくつかのソフトウェアベースの技術が提案されている。
既存の緩和手法をフレームワーク上で再現する方法を示す。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 15:27:55 GMT)
A Quantum Computational Perspective on Spread Complexity [0.0] 我々は、時間進化と重ね合わせという2つの基本的な操作から構築された回路複雑性フレームワークの制限ケースとして、拡散複雑性が出現することを示すことによって、拡散複雑性と量子回路複雑性の直接的な接続を確立する。
提案手法では,単位ゲートとビーム分割演算がターゲット状態を生成する計算装置を活用し,合成コストの最小化により,無限小時間進化限界における複雑性の拡散に収束する複雑性尺度が得られた。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 19:04:42 GMT)
A Comprehensive Analysis of COVID-19 Detection Using Bangladeshi Data and Explainable AI [0.0] 新型コロナウイルスは急速に広まり、感染性の高いウイルスで、世界的なパンデミックを引き起こしている。
本研究は、バングラデシュの4,350枚の画像を用いて、CXR画像の新型コロナウイルス検出を改善することに焦点を当てた。
ML、DL、TLモデルは、98%の精度でVGG19モデルに採用されている。
論文参考訳(メタデータ) (Sun, 08 Jun 2025 17:38:14 GMT)