A Comprehensive Survey in LLM(-Agent) Full Stack Safety: Data, Training and Deployment [311.5] 本稿では, LLM のトレーニング, 展開, 商業化のプロセス全体を通して, 安全問題を体系的に検討する "フルスタック" の安全性の概念を紹介する。
我々の研究は800以上の論文を網羅的にレビューし、包括的カバレッジとセキュリティ問題の体系的な組織化を確保しています。
本研究は,データ生成の安全性,アライメント技術,モデル編集,LLMベースのエージェントシステムなど,有望な研究方向を特定する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:31:40 GMT)
DD-Ranking: Rethinking the Evaluation of Dataset Distillation [223.3] 本稿では,統合評価フレームワークであるDD-Rankingと,異なる手法によって達成された真の性能改善を明らかにするための新しい総合評価指標を提案する。
DD-Rankingは、蒸留データセットの実際の情報強化に再焦点をあてることで、将来の研究の進展に対してより包括的で公正な評価基準を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:19:50 GMT)
DreamGen: Unlocking Generalization in Robot Learning through Neural Trajectories [120.3] DreamGenは、ニューラルトラジェクトリを通じて行動や環境を一般化するロボットポリシーをトレーニングするためのパイプラインだ。
私たちの研究は、手作業によるデータ収集を超えて、ロボット学習をスケールするための、有望な新たな軸を確立します。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:55:39 GMT)
OPA-Pack: Object-Property-Aware Robotic Bin Packing [99.9] 本稿では,ロボットにオブジェクトパッキングを計画する際のオブジェクト特性を考慮した最初のフレームワークであるOPA-Packについて述べる。
また,OPA-Netを定式化し,非互換なオブジェクトペアを分離し,パッキングをコンパクト化しながら脆弱なオブジェクトに対する圧力を低減する。
実験結果から,OPA-Packは非互換なオブジェクトペアの分離精度を大幅に向上し,脆弱なオブジェクトに対する圧力を大幅に低減することがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:48:14 GMT)
Spatial Re-parameterization for N:M Sparsity [99.4] SpReは、トレーニング時に元のN:Mブランチと合わせて余分な分岐を割り当てることで、非構造化空間の空間スパーシティ分布を利用する。
SpReは、N:Mのスパーシリティ法と最先端の非構造化のスパーシティ法のパフォーマンスをマッチングすることで、賞賛できる偉業を成し遂げた。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:55:16 GMT)
Scene-Text Grounding for Text-Based Video Question Answering [97.1] テキストベースのビデオ質問応答(TextVideoQA)の既存の取り組みは、不透明な意思決定とシーンテキスト認識への依存で批判されている。
我々は,モデルに質問への回答を強制し,関連するシーンテキスト領域を解釈させることにより,グラウンドドテキストビデオQAを研究する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:06:13 GMT)
3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models [94.5] 3D世代は急速に進歩しているが、3D評価の開発はペースを保っていない。
大規模人選好データセット3DGen-Benchを開発した。
次に、CLIPベースのスコアモデルである3DGen-ScoreとMLLMベースの自動評価器である3DGen-Evalを訓練する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:21:00 GMT)
What are the Essential Factors in Crafting Effective Long Context Multi-Hop Instruction Datasets? Insights and Best Practices [91.7] 拡張コンテキストウィンドウを持つLong Language Model (LLM) は、情報抽出、質問応答、複雑な計画シナリオなどのタスクを大幅に改善した。
既存のメソッドは通常、Self-Instructフレームワークを使用して、長いコンテキスト能力を改善するために命令チューニングデータを生成する。
本稿では,品質検証エージェント,シングルホップ質問生成エージェント,複数質問サンプリング戦略,マルチホップ質問マーガーエージェントを組み込んだマルチエージェント対話型マルチホップ生成フレームワークを提案する。
以上の結果から,我々の合成高品位長文指導データにより,多量の人体で訓練したモデルよりも,モデル性能が著しく向上することが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:32:11 GMT)
Incentivizing Multimodal Reasoning in Large Models for Direct Robot Manipulation [89.5] 空間的行動空間をLMM(Large Multimodal Models)に理解させる方法について述べる。
また,これらの課題を解決する上で,LMMの推論能力を完全に活用する方法を示す。
その結果、ReasonManipという名前の7Bバックボーン上に構築された推論モデルは、3つの顕著な利点を示しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:00:14 GMT)
MindOmni: Unleashing Reasoning Generation in Vision Language Models with RGPO [87.5] 近年のテキスト・ツー・イメージシステムは、マルチモーダル入力や複雑な推論タスクの処理において制限に直面している。
我々は、強化学習による推論生成を取り入れ、これらの課題に対処する統合マルチモーダルな大規模言語モデルであるMind Omniを紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:17:04 GMT)
Disentangling Length Bias In Preference Learning Via Response-Conditioned Modeling [87.2] RLHF(Reinforcement Learning from Human Feedback)は,大規模言語モデル(LLM)の整合化に成功している。
我々は、長さバイアス軽減と長さ指示に従うモデルの性能を高めるために、$textbfR$esponse-$textbfc$onditioned $textbfB$radley-$textbfT$erry (Rc-BT)モデルを導入する。
また、報酬モデルと直接ポリシー最適化のためにRc-BTモデルを利用するRc-RMおよびRc-DPOアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:24:51 GMT)
Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models [86.5] OlymMATHは、LLMの複雑な推論能力を厳格にテストするために設計された、Olympiadレベルの新しい数学ベンチマークである。
OlymMATHは200の厳密にキュレートされた問題があり、それぞれが手動で検証され、英語と中国語の並行バージョンで利用可能である。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:39:59 GMT)
Mitigating Hallucination in VideoLLMs via Temporal-Aware Activation Engineering [83.6] 大規模言語モデル(MLLM)における幻覚は、ビデオ領域において重要かつ未適応な課題として持続する。
本稿では,幻覚に敏感なモジュールを適応的に識別し,操作するビデオLLMのための時間認識型アクティベーションエンジニアリングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:12:06 GMT)
Seek in the Dark: Reasoning via Test-Time Instance-Level Policy Gradient in Latent Space [82.8] テスト時間インスタンスレベルの適応(TTIA)を通じて推論を強化するフレームワークであるLatentSeekを紹介した。
LatentSeekは、GSM8K、MATH-500、AIME2024など、さまざまな推論ベンチマークで評価されている。
結果は、LatentSeekが一貫して強力なベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:26:02 GMT)
Restoration Score Distillation: From Corrupted Diffusion Pretraining to One-Step High-Quality Generation [82.4] Score Distillation (DSD) の原理的一般化である textitRestoration Score Distillation (RSD) を提案する。
RSDは、ぼやけた画像、不完全画像、低解像度画像など、広範囲の汚職タイプに対応している。
自然と科学の両方のデータセットの様々な復元作業において、教師モデルを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:21:03 GMT)
An Empirical Study of Many-to-Many Summarization with Large Language Models [82.1] 大規模言語モデル(LLM)は強い多言語能力を示しており、実アプリケーションでM2MS(Multi-to-Many summarization)を実行する可能性を秘めている。
本研究は,LLMのM2MS能力に関する系統的研究である。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:18:54 GMT)
Your Offline Policy is Not Trustworthy: Bilevel Reinforcement Learning for Sequential Portfolio Optimization [82.0] 強化学習(Reinforcement Learning, RL)は、過去のデータを用いたリスクを最小限にしつつ累積リターンを最大化することを目的とした、株式取引のような逐次的ポートフォリオ最適化タスクにおいて、大きな可能性を示してきた。
従来のRLアプローチは、固定データセット内での振る舞いの購入と販売を最適に記憶するだけのポリシーを生成することが多い。
当社のアプローチでは,ポートフォリオ最適化を新たなタイプの部分オフラインRL問題として捉え,2つの技術的貢献を行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:37:25 GMT)
Multi-Agent Sampling: Scaling Inference Compute for Data Synthesis with Tree Search-Based Agentic Collaboration [81.5] 本研究の目的は,マルチエージェントサンプリングによるデータ合成の問題を調べることでギャップを埋めることである。
逐次サンプリングプロセス中にワークフローが反復的に進化する木探索に基づくオーケストレーションエージェント(TOA)を紹介する。
アライメント、機械翻訳、数学的推論に関する実験は、マルチエージェントサンプリングが推論計算スケールとしてシングルエージェントサンプリングを著しく上回ることを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:18:10 GMT)
Bias Fitting to Mitigate Length Bias of Reward Model in RLHF [81.4] 人間のフィードバックからの強化学習は、大きな言語モデルと人間の好みを合わせるための報酬モデルに依存している。
バイアスパターンを自律的に学習し,修正するフレームワークであるFiMi-RMを提案する。
実験により,FiMi-RMはよりバランスの取れた長さ逆分布を実現することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:29:28 GMT)
Efficient Speech Language Modeling via Energy Distance in Continuous Latent Space [78.5] 本稿では、音声波形を連続的な潜在表現の列に符号化することで、音声言語モデリングの代替手法であるSLEDを紹介する。
SLEDは離散化エラーを回避し、既存の言語モデルに共通する複雑な階層アーキテクチャの必要性を排除する。
実験結果から,SLEDはゼロショット音声合成とストリーミング音声合成の両方において高い性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:38:59 GMT)
Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning [77.6] 物理世界を理解し、適切な具体的決定を生成する物理AIモデルを提案する。
物理的常識を表現するために、空間、時間、物理学に関する基本的な知識を捉える階層的オントロジーを用いる。
具体的推論では、異なる物理的実施形態をまたいで一般化する2次元オントロジーに依存している。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:19 GMT)
ExTrans: Multilingual Deep Reasoning Translation via Exemplar-Enhanced Reinforcement Learning [77.4] 我々はポリシーMTモデルの翻訳結果と強力なLRMを比較するための新たな報酬モデリング手法を設計する。
Qwen2.5-7B-インストラクトをバックボーンとして、トレーニングされたモデルは、文学翻訳における新しい最先端のパフォーマンスを達成する。
11言語による多言語設定にメソッドを拡張します。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:34:47 GMT)
Occult: Optimizing Collaborative Communication across Experts for Accelerated Parallel MoE Training and Inference [77.1] 通信コストを削減するために,システムレベルのイノベーションとアルゴリズムレベルのイノベーションを提案する。
共同作業の比率を増大させることで,専門家の並列化を促進できることを示す。
私たちの設計では、通信コストを削減した正確な結果を提供するか、コラボレーションプルーニングによるコストを最小限に抑えるかのどちらかが可能です。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:50:27 GMT)
DexGarmentLab: Dexterous Garment Manipulation Environment with Generalizable Policy [75.0] 衣料品の操作は、衣服カテゴリー、ジオメトリー、変形の多様性のために重要な課題である。
DexGarmentLabは,デキスタラスな(特にバイマニュアルな)衣料品の操作に特化して設計された最初の環境である。
15のタスクシナリオのための大規模な高品質な3Dアセットを備え、服のモデリングに適したシミュレーション技術を洗練し、シム・トゥ・リアルのギャップを減らす。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:28:03 GMT)
Joint Localization and Activation Editing for Low-Resource Fine-Tuning [73.6] 本稿では,JoLA(Joal Localization and activation editing)法を提案する。
JoLAは(1)Transformerのどのヘッダーを編集するか、(2)介入が加法的、乗法的、または両方であるべきか、(3)介入パラメータ自体を学習する。
JoLAは既存のメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:36:10 GMT)
Reasoning-OCR: Can Large Multimodal Models Solve Complex Logical Reasoning Problems from OCR Cues? [73.4] Reasoning-OCRは、リッチビジュアルテキストから抽出できるキューに基づいて複雑な推論問題を解決するためにLMMに挑戦する。
我々の評価は、異なる理由付けの課題において、プロプライエタリでオープンソースのLMMにいくつかの洞察を与えます。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:45:18 GMT)
PhySense: Sensor Placement Optimization for Accurate Physics Sensing [71.0] PhySenseは、物理的なフィールドを共同で再構築し、センサー配置を最適化するフレームワークである。
最先端の物理センサーの精度を達成し、以前は考えられていなかった情報的なセンサー配置を発見する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:59:11 GMT)
StarFT: Robust Fine-tuning of Zero-shot Models via Spuriosity Alignment [70.9] 本稿では,ゼロショットモデルの微調整を行うフレームワークであるStarFTを提案する。
我々は最近の言語モデルを利用して、潜在的に欠点のある特徴を強調した代替のテキスト記述を生成することで、スプリシティーを注入したラベルを得る。
StarFTはウォーターバードグループのシフトシナリオにおいて、それぞれ14.30%、平均精度を3.02%向上させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:15:35 GMT)
Simple and Provable Scaling Laws for the Test-Time Compute of Large Language Models [70.1] 本研究では,大規模言語モデルのテスト時間計算において,証明可能なスケーリング法則を享受する2つのアルゴリズムを提案する。
1つは2段階ノックアウト方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
もう1つは2段階のリーグ方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:12:00 GMT)
Unlocking the Potential of Difficulty Prior in RL-based Multimodal Reasoning [69.6] 先行情報に対する問題の難易度を明示的にモデル化し,多モーダル推論における強化学習に基づく微調整の有効性を検証した。
提案手法は,2段階学習データのみを2K+0.6Kとする多モード数学的推論ベンチマークにおいて有意な性能を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:43:10 GMT)
J4R: Learning to Judge with Equivalent Initial State Group Relative Preference Optimization [69.2] 私たちは、より複雑な評価設定で生じる位置バイアスに対して堅牢であるように、裁判官を訓練します。
我々はReasoningJudgeBenchというベンチマークを紹介します。
EIS-GRPOで訓練を受けた7B判事であるReasoning判事(J4R)は、GPT-4oを6.7%、そして9%で上回ります。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:50:35 GMT)
UniTok: A Unified Tokenizer for Visual Generation and Understanding [69.1] 視覚生成および理解モデルは通常、画像を処理するために異なるトークン化器に依存する。
我々は、新しいマルチコードブック量子化機構を備えた統一トークン化システムUniTokを紹介する。
最終的なパフォーマンスに関しては、UniTokはImageNetで0.38 rFIDと78.6%のゼロショット精度で新記録を樹立した。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:45:03 GMT)
On the Thinking-Language Modeling Gap in Large Language Models [68.8] 言語と思考のモデリングには大きなギャップがあることが示される。
本稿では,このギャップを実証し緩和するために,Language-of-Thoughts (LoT) と呼ばれる新しいプロンプト手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:31:52 GMT)
Trust, But Verify: A Self-Verification Approach to Reinforcement Learning with Verifiable Rewards [67.9] 大規模言語モデル(LLM)は複雑な推論において非常に有望である。
一般的な問題は表面的な自己回帰であり、モデルが自身の出力をしっかりと検証できない。
本稿では、RISE(Reinforce Reasoning with Self-Verification)という新しいオンラインRLフレームワークについて紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:31 GMT)
Mixture Policy based Multi-Hop Reasoning over N-tuple Temporal Knowledge Graphs [67.5] MT-Pathと呼ばれる新しい強化学習手法を導入し,時間的情報を利用して歴史的n-タプルを横切り,時間的推論経路を構築する。
MTパスの有効性と説明可能性について実験的に検証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:20:33 GMT)
Few-Step Diffusion via Score identity Distillation [67.1] 拡散蒸留は, テキスト・ツー・イメージ(T2I)拡散モデルを促進するための有望な戦略として浮上している。
既存の方法は、高分解能T2I拡散モデルを蒸留する際に、実像や教師合成画像に頼っている。
教師のCFGを無効にし、偽スコアネットワークでテキストコンディショニングを除去するZero-CFGと、偽スコアネットワークで否定的なCFGを適用するAnti-CFGの2つの新しいガイダンス戦略を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:45:16 GMT)
Fast correlated decoding of transversal logical algorithms [67.0] 大規模計算には量子エラー補正(QEC)が必要であるが、かなりのリソースオーバーヘッドが発生する。
近年の進歩により、論理ゲートからなるアルゴリズムにおいて論理キュービットを共同で復号化することにより、症候群抽出ラウンドの数を削減できることが示されている。
ここでは、回路を介して伝播する関連する論理演算子製品を直接復号することで、回路の復号化の問題を修正する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:00:00 GMT)
Decentralized Arena: Towards Democratic and Scalable Automatic Evaluation of Language Models [66.5] Decentralized Arena (dearena) は,すべての大規模言語モデルからの集合的インテリジェンスを活用して相互評価を行う,完全に自動化されたフレームワークである。
人の判断と最大で97%の相関を保ち コストを大幅に削減します
論文参考訳(メタデータ) (Mon, 19 May 2025 07:34:25 GMT)
Mean Flows for One-step Generative Modeling [64.5] 本稿では,一段階生成モデリングのための原理的かつ効果的なフレームワークを提案する。
ニューラルネットワークトレーニングのガイドには,平均速度と瞬時速度を適切に定義したアイデンティティが導出され,使用される。
提案手法はMeanFlowモデルと呼ばれ,自己完結型であり,事前学習,蒸留,カリキュラム学習は不要である。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:42 GMT)
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models [63.6] 本稿では,難しい例と簡単な例を区別するバイナリルータを提案する。
提案手法は、ルータが考慮するデータに対して、より大きな安全ガードモデルを選択的に適用し、精度を維持しながら効率を向上する。
複数のベンチマークデータセットによる実験結果から,適応モデルの選択により,計算コストと安全性性能のトレードオフが著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:57:45 GMT)
Single Image Reflection Removal via inter-layer Complementarity [63.4] 二重ストリームアーキテクチャのための新しい層間相補性モデルと効率的な層間相補性注意機構を導入する。
提案手法は,複数の公開データセット上での最先端の分離品質を実現するとともに,計算コストとモデルの複雑さを著しく低減する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:50:15 GMT)
HyperNet Fields: Efficiently Training Hypernetworks without Ground Truth by Learning Weight Trajectories [63.0] 我々は,サンプル単位の真理を必要とせず,ハイパーネットワークを訓練する手法を提案する。
私たちのキーとなるアイデアは、Hypernetwork Fieldを学び、単に収束状態ではなく、ネットワークウェイトトレーニングの全軌道を見積もることです。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:03:24 GMT)
Creating General User Models from Computer Use [62.9] 本稿では,コンピュータとのインタラクションを観察することでユーザについて学習する汎用ユーザモデル(GUM)のアーキテクチャを提案する。
GUMは、ユーザ(例えばデバイスのスクリーンショット)の非構造化観察を入力として受け取り、ユーザの知識と好みをキャプチャする信頼度重み付け命題を構築する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:49:47 GMT)
JetFormer: An Autoregressive Generative Model of Raw Images and Text [62.3] 本稿では,生データの可能性を直接最大化するために,自動回帰デコーダのみの変換器であるJetFormerを提案する。
我々は正規化フローモデルを利用して,自己回帰型マルチモーダル変換器で共同で訓練したソフトトーン画像表現を得る。
JetFormerは、最近のVQ-VAEおよびVAEベースのベースラインと競合するテキスト・画像生成品質を実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:26:21 GMT)
FedSVD: Adaptive Orthogonalization for Private Federated Learning with LoRA [61.8] 低ランク適応(LoRA)は、フェデレートラーニング(FL)における言語モデルの効率的な微調整に広く用いられている。
低ランク適応(LoRA)は、フェデレートラーニング(FL)における言語モデルの効率的な微調整に広く用いられている。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:32:56 GMT)
Adaptive Tokenization: On the Hop-Overpriority Problem in Tokenized Graph Learning Models [60.0] トークン学習モデル(TGLM)は、グラフをスケーラブルな処理のために順序付きトークンリストに変換する。
TGLMは手書きのトークンリストに依存しており、さまざまなグラフ学習シナリオへの適応性はまだ未検討である。
本稿では,手書きのトークンリストをTGLMで置き換えるプラグイン・アンド・プレイモジュールであるLearnable Graph Token List(LGTL)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:25:33 GMT)
Scaling Computer-Use Grounding via User Interface Decomposition and Synthesis [59.8] グラフィカルユーザインタフェース(GUI)の基盤は、コンピュータ利用エージェント開発において依然として重要なボトルネックとなっている。
多様なタスクタイプにまたがる564の細かな注釈付きサンプルからなる総合ベンチマークであるOSWorld-Gを紹介する。
我々は、400万のサンプルを含む、最大のコンピュータ利用基盤データセットであるJediを合成してリリースする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:09:23 GMT)
Large Continual Instruction Assistant [59.6] CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。
既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。
本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:12:01 GMT)
Pave Your Own Path: Graph Gradual Domain Adaptation on Fused Gromov-Wasserstein Geodesics [59.1] グラフニューラルネットワークは、グラフ上の分散シフトに対して非常に脆弱である。
非IIDグラフデータのための最初のフレームワークであるGadgetを提示する。
ガジェットは既存のグラフDAメソッドとシームレスに統合して、グラフ上の大きなシフトを処理することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:03:58 GMT)
CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.8] CodeGRAGは、制御フローとそれらのデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミングドメインの知識をよりよく解釈する。
CodeGRAGはLLMのコード生成能力を大幅に改善し、言語間コード生成のパフォーマンス向上も実現している。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:50:15 GMT)
Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.2] 提示攻撃検出と顔偽造検出は、それぞれ物理メディアベースの提示攻撃とデジタル編集ベースのDeepFakeから顔データを保護するように設計されている。
これら2つのモデルの個別のトレーニングは、未知の攻撃やデプロイ環境への脆弱性を生じさせる。
本稿では,視覚言語モデルに基づく階層型プロンプトチューニングフレームワーク (HiPTune) を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:35:45 GMT)
Thinkless: LLM Learns When to Think [57.9] 推論モデル(Reasoning Language Models)は、複雑な論理的推論を必要とするタスクにおいて顕著な性能を示す。
我々は,LLMが短文推論と長文推論を適応的に選択できる学習可能なフレームワークであるThinklessを提案する。
Minerva Algebra、MATH-500、GSM8Kなどのベンチマークでは、Thinklessはロングチェーン思考の使用を50%から90%削減することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:24:16 GMT)
Scalable Video-to-Dataset Generation for Cross-Platform Mobile Agents [57.6] 実世界のモバイルOSナビゲーションをキャプチャする20Kの指導ビデオから,313Kの注釈付きフレームの大規模データセットであるMONDAYを紹介した。
MONDAYを事前学習フェーズに含むモデルは、堅牢なクロスプラットフォームの一般化機能を示す。
公開されているビデオコンテンツを利用して、包括的なタスクデータセットを作成する自動化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:39:03 GMT)
Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation [56.8] TESSAは、時系列データに対する一般的なアノテーションとドメイン固有のアノテーションの両方を自動的に生成するように設計されたマルチエージェントシステムである。
General Agentは複数のソースドメインにまたがる共通パターンと知識をキャプチャし、時系列とテキストの両方の機能を利用する。
ドメイン固有のエージェントは、ターゲットドメインからの限定アノテーションを使用して、ドメイン固有の用語を学び、ターゲットアノテーションを生成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:07:54 GMT)
KIT's Offline Speech Translation and Instruction Following Submission for IWSLT 2025 [56.6] 本稿では、カールスルーエ工科大学のオフラインSTとインストラクションフォロー(IF)トラックへの提出について紹介する。
文書レベルの文脈を持つLLMを用いて出力を融合した複数の自動音声認識システムを用いたパイプラインを提案する。
IFトラックでは,音声エンコーダとLLMを統合し,幅広い命令追従タスクを実行するエンド・ツー・エンド・モデルを開発した。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:21:29 GMT)
CPRet: A Dataset, Benchmark, and Model for Retrieval in Competitive Programming [56.2] CPRetは、競合プログラミングのための検索指向ベンチマークスイートである。
2つのコード中心タスク(Text-to-CodeとCode-to-Code)と、新たに提案された2つの問題中心タスク(Issue-to-DuplicateとSimplified-to-Full)である。
私たちのコントリビューションには、高品質なトレーニングデータと、信頼性評価のための時間的に分離されたテストセットの両方が含まれています。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:07:51 GMT)
Confidence-Regulated Generative Diffusion Models for Reliable AI Agent Migration in Vehicular Metaverses [55.7] 車両用AIエージェントには、環境認識、意思決定、行動実行能力が与えられている。
本稿では、信頼性の高い車両用AIエージェントマイグレーションフレームワークを提案し、信頼性の高い動的マイグレーションと効率的なリソーススケジューリングを実現する。
我々は,AIエージェントのマイグレーション決定を効率的に生成する信頼性制御型生成拡散モデル(CGDM)を開発した。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:04:48 GMT)
Gated Recurrent Neural Networks with Weighted Time-Delay Feedback [55.6] 本稿では,重み付き時間遅延フィードバック機構を備えたゲートリカレントユニット(GRU)を導入し,時系列データの長期依存性をモデル化する手法を提案する。
提案したモデルである $tau$-GRU は、繰り返し単位の連続時間定式化の離散版であり、力学は遅延微分方程式(DDE)によって制御される。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:03:29 GMT)
Higher fidelity perceptual image and video compression with a latent conditioned residual denoising diffusion model [55.2] 本稿では,認知品質に最適化されたハイブリッド圧縮方式を提案し,CDCモデルのアプローチをデコーダネットワークで拡張する。
CDCと比較した場合,LPIPSとFIDの知覚スコアを比較検討しながら,最大2dBPSNRの忠実度向上を実現した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:13:14 GMT)
MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework [53.8] MF-LLM(Mean-Field LLM)は,まず平均場理論を社会シミュレーションに取り入れる。
MF-LLMは反復過程を通じて個人と人口間の双方向相互作用をモデル化する。
IB-Tuneは、Information Bottleneckの原理にインスパイアされた、新しい微調整手法である。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:12:36 GMT)
UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities [53.8] UniversalRAGは異種情報源からの知識を多様さと粒度で検索・統合するための新しいRAGフレームワークである。
本稿では,最も適切なモダリティ固有コーパスを動的に識別し,その内部でターゲット検索を行うモダリティ対応ルーティング機構を提案する。
マルチモーダル性にまたがる8つのベンチマークでUniversalRAGを検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:09:12 GMT)
KL Penalty Control via Perturbation for Direct Preference Optimization [53.7] 我々は、KLのペナルティ強度を各選好ペアに対して適応的に制御できる$varepsilon$-Direct Preference Optimization (varepsilon$-DPO)を提案する。
KLペナルティ緩和のための$varepsilon$-DPOの簡単な基準は、既存の直接アライメントアルゴリズムと比較して、DPOを大幅に改善することを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:56:08 GMT)
Faster Video Diffusion with Trainable Sparse Attention [53.5] ビデオ拡散トランス (DiTs) のスケーリングは、注意質量の大部分が少数の位置に集中しているにもかかわらず、2次元の注意によって制限される。
私たちはこの観察を、トレーニング可能なハードウェア効率の良いスパースアテンションであるVSAに変換し、Emphbothのトレーニングと推論の完全なアテンションを置き換える。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:30:13 GMT)
Safe-Sora: Safe Text-to-Video Generation via Graphical Watermarking [53.4] Safe-Soraは、ビデオ生成プロセスに直接グラフィカルな透かしを直接埋め込む最初のフレームワークである。
適応型局所時間走査戦略を用いた3次元ウェーブレット変換拡張型Mambaアーキテクチャを開発した。
ビデオの品質、透かしの忠実さ、堅牢性の観点から、Safe-Soraは最先端のパフォーマンスを実証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:31:31 GMT)
Why Knowledge Distillation Works in Generative Models: A Minimal Working Explanation [53.3] 知識蒸留(KD)は、現代の生産モデルの訓練と展開における中核的な要素である。
我々は,KDが学生モデルにおける精度とリコールのトレードオフを引き起こすことを示す。
本分析は、生成モデルにおけるKDの有効性について、単純かつ一般的な説明を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:39:47 GMT)
Toward Relative Positional Encoding in Spiking Transformers [52.6] スパイキングニューラルネットワーク(スパイキングニューラルネット、英: Spiking Neural Network、SNN)は、脳内のニューロンが離散スパイクを通してどのように通信するかを模倣するバイオインスパイアネットワークである。
スパイキングトランスフォーマーにおける相対的位置符号化(RPE)を近似するためのいくつかの戦略を導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:35:29 GMT)
Efficient Heuristics Generation for Solving Combinatorial Optimization Problems Using Large Language Models [52.5] 近年のLarge Language Models (LLMs) を用いた組合せ最適化問題の解法に関する研究
プロンプトにおけるタスク固有の知識の欠如は、LLMが不特定な探索方向を提供し、良好なパフォーマンスの導出を妨げることがしばしばある。
本稿では,Herculesアルゴリズムを提案する。このアルゴリズムは設計したコア抽象化プロンプティング(CAP)法を利用して,コアコンポーネントをエリートHGから抽象化し,プリミティブに事前知識として組み込む。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:20:46 GMT)
UC-MOA: Utility-Conditioned Multi-Objective Alignment for Distributional Pareto-Optimality [52.5] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の価値を整合させる基盤となっている。
既存のアプローチは、人間の好みの多次元、分布的なニュアンスを捉えるのに苦労している。
本稿では,これらの制約を克服する新しいフレームワークであるUtility-Conditioned Multi-Objective Alignment (UC-MOA)を紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:25:35 GMT)
TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [52.5] 我々は、デジタルワーカーと同じような方法で世界と対話するAIエージェントを評価するためのベンチマークであるTheAgentCompanyを紹介する。
最も競争力のあるエージェントは、タスクの30%を自律的に完了させることができる。
これは、実際の職場の設定でLMエージェントをシミュレートすることで、タスク自動化に関する微妙な絵を描く。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:21:49 GMT)
Interpretable Robotic Friction Learning via Symbolic Regression [52.4] ロボット関節における摩擦トルクの正確なモデリングは、堅牢な数学的記述の要求により、長い間困難であった。
伝統的なモデルに基づくアプローチは、しばしば労働集約的であり、広範な実験と専門家の知識を必要とする。
ニューラルネットワークに基づくデータ駆動方式は実装が容易だが、堅牢性に欠けることが多い。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:44:02 GMT)
Data Watermarking for Sequential Recommender Systems [52.2] 逐次リコメンデータシステムにおけるデータ透かしの問題について検討する。
データセット全体のオーナシップを保護するデータセット透かしと,個々のユーザのデータを保護するユーザ透かしという2つの設定に重点を置いています。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:26:25 GMT)
Vision-centric Token Compression in Large Language Model [51.9] Vision Centric Token Compression (Vist)は、人間の読書を反映した高速圧縮フレームワークである。
11のコンテキスト内学習ベンチマークでは、Vistは同じ精度を2.3倍のトークンで達成し、FLOPを16%削減し、メモリを50%削減した。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:36:18 GMT)
Physics of Language Models: Part 1, Learning Hierarchical Language Structures [51.7] トランスフォーマーベースの言語モデルは効率的だが複雑であり、内部の動作や推論メカニズムを理解することは大きな課題である。
本稿では,長文を生成可能な階層規則を生成する合成CFGのファミリーを紹介する。
我々は、GPTのような生成モデルがCFG定義階層を正確に学習し、推論し、それに基づいて文を生成することを実証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:12:27 GMT)
Computational Reasoning of Large Language Models [51.6] textbfTuring Machine Benchは,Large Language Models(LLM)による推論プロセスの実行能力を評価するベンチマークである。
TMBenchには、自己完結型および知識に依存しない推論、最小主義的な多段階構造、制御可能な難易度、チューリングマシンに基づく理論的基礎の4つの重要な特徴が組み込まれている。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:55:13 GMT)
Exploiting Symbolic Heuristics for the Synthesis of Domain-Specific Temporal Planning Guidance using Reinforcement Learning [51.5] 最近の研究は、時間プランナーの性能向上のためのガイダンスの合成に強化学習(Reinforcement Learning, RL)を用いることを検討した。
本稿では,RLと計画段階の両方において,シンボリックスが提供した情報を活用することに焦点を当てた学習計画フレームワークの進化を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:19:13 GMT)
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use [51.4] 995のユーザクエリと3,912の関連ツールからなるデータセットであるToolHopを提示する。
ToolHopは、多様なクエリ、意味のある相互依存性、ローカル実行可能なツール、詳細なフィードバック、検証可能な回答を保証する。
5つのモデルファミリーにまたがる14のLSMを評価し、マルチホップツールの使用シナリオを扱う上で重要な課題を明らかにした。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:26:34 GMT)
Theoretical Investigation on Inductive Bias of Isolation Forest [50.7] アイフォレスト(iForest)は、大規模タスクにおける例外的な実行効率と性能で評価される、広く使われている教師なしの異常検知器である。
本稿では, 奥行き関数と成長過程の定式化による誘導バイアスの解析により, iForestの有効性の条件と範囲を理論的に検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:07:43 GMT)
MMAR: A Challenging Benchmark for Deep Reasoning in Speech, Audio, Music, and Their Mix [50.7] MMARは、精密にキュレートされた1000個のオーディオクエスト・アンサー・トリプルから構成される。
MMARは既存のベンチマークを幅広い実世界のオーディオシナリオに拡張する。
我々は,Large Audio-Language Models (LALM)を含む,幅広いモデルの集合を用いてMMARを評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:18:42 GMT)
EfficientQAT: Efficient Quantization-Aware Training for Large Language Models [50.5] 量子化対応トレーニング(QAT)は、低ビット表現によるメモリ消費を最小限の精度で削減することで、ソリューションを提供する。
より有効なQATアルゴリズムであるEfficient QAT(Efficient Quantization-Aware Training)を提案する。
効率的なQATは、全てのパラメータのブロックワイドトレーニング(Block-AP)と量子化パラメータのエンドツーエンドトレーニング(E2E-QP)の2つのフェーズを含む。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:20:01 GMT)
Swin DiT: Diffusion Transformer using Pseudo Shifted Windows [50.5] 拡散変換器 (DiT) は, トランスアーキテクチャの導入により, 画像生成領域内での顕著な性能を実現する。
我々は,従来想定されていたようなグローバル情報への強い依存を示さない空間画像生成を実証的に分析した。
我々は,Pseudo textbfShifted textbfWindow DiTs (textbfSwin DiT) のシリーズを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:02:33 GMT)
Learnware of Language Models: Specialized Small Language Models Can Do Big [50.3] 本稿では,学習用パラダイムを言語モデルに適用するための予備的試みを示す。
我々は,8Bパラメータを持つ特殊SLMの学習装置を約100個構成した学習装置をシミュレートした。
各タスク固有の推論に対して1つの適切な学習ウェアを選択することで、システムは全てのベンチマークでベースSLMよりも優れる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:54:35 GMT)
Event-Driven Dynamic Scene Depth Completion [50.0] EventDCは、最初のイベント駆動のディープコンプリートフレームワークである。
Event-Modulated Alignment (EMA) と Local Depth Filtering (LDF) の2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:02:37 GMT)
Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow [49.3] 金融、気象学、エネルギーといった産業は毎日大量のデータを生み出している。
本研究では,データ分析エージェントであるData-Copilotを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:44:19 GMT)
Web IP at Risk: Prevent Unauthorized Real-Time Retrieval by Large Language Models [49.3] オンライン検索機能を備えた大規模言語モデル(LLM)は、オリジナルコンテンツクリエーターの権利を損なう。
我々は、Webコンテンツ作成者が、許可されていないLLMリアルタイム抽出からWebベースのIPを保護するための新しい防御フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:14:08 GMT)
DPBridge: Latent Diffusion Bridge for Dense Prediction [49.2] DPBridgeは、密度予測タスクのための最初の潜伏拡散ブリッジフレームワークである。
提案手法は,異なるシナリオ下での有効性と能力の一般化を実証し,優れた性能を継続的に達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:15:25 GMT)
Learning Long-Context Diffusion Policies via Past-Token Prediction [48.9] 本稿では,過去の情報の保持を明示的に規則化する代替手法を提案する。
本稿では,過去の行動トークンの予測方法を学ぶための補助的タスクである過去トークン予測について紹介する。
4つの実世界と6つのシミュレートされたタスクを対象とした実験により,提案手法は長文拡散政策の性能を3倍に向上し,政策訓練を10倍以上高速化することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:37:41 GMT)
Enhancing Latent Computation in Transformers with Latent Tokens [48.4] 補助トークンを用いた大規模言語モデルの拡張が,モデル性能向上のための有望な戦略として浮上している。
我々は遅延トークンと呼ばれる軽量な手法を導入し、これらは自然言語では解釈不能なダミートークンである。
提案した潜在トークンは、トレーニング済みのTransformerとシームレスに統合され、パラメータ効率のよい方法で訓練され、推論時に柔軟に適用できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:35:53 GMT)
ToolSpectrum : Towards Personalized Tool Utilization for Large Language Models [48.3] ToolSpectrumは、大規模言語モデルのパーソナライズされたツール利用能力を評価するために設計されたベンチマークである。
我々は、パーソナライズ、ユーザプロファイル、環境要因の2つの重要な側面を定式化し、ツール利用に対する個人的およびシナジスティックな影響を分析する。
ツール強化LDMにおけるコンテキスト認識のパーソナライズの必要性を浮き彫りにして,現行モデルに対する限界を明らかにした。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:30:46 GMT)
BrainECHO: Semantic Brain Signal Decoding through Vector-Quantized Spectrogram Reconstruction for Whisper-Enhanced Text Generation [48.2] 現在のEEG/MEG-to-textデコーディングシステムには3つの重要な制限がある。
BrainECHOは、分離された表現学習を利用する多段階フレームワークである。
BrainECHOは文、セッション、主題に依存しない条件をまたいだ堅牢性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:17:48 GMT)
Controlled Training Data Generation with Diffusion Models [48.1] 本稿では,教師あり学習に有用なトレーニングデータを生成するために,テキスト・画像生成モデルを制御する手法を提案する。
本研究では,2つのフィードバック機構を備えたクローズドループシステムを開発した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:28:42 GMT)
DPM-Solver++: Fast Solver for Guided Sampling of Diffusion Probabilistic Models [48.0] DPM-r++はDPMのガイドサンプリングのための高次解法である。
DPM-r++は15から20ステップで高品質なサンプルを生成できることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:56:56 GMT)
Breaking the Compression Ceiling: Data-Free Pipeline for Ultra-Efficient Delta Compression [47.9] UltraDeltaはデータフリーのデルタ圧縮パイプラインで、超高圧縮と強力なパフォーマンスを実現する。
UltraDeltaは、冗長性を最小化し、情報を最大化し、層間、層内、大域的な寸法で性能を安定させるように設計されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:37:22 GMT)
PersonaGym: Evaluating Persona Agents and LLMs [47.8] 本稿では、ペルソナエージェントのための最初の動的評価フレームワークであるPersonaGymと、意思決定理論に基づく人手による自動計量であるPersonaScoreを紹介する。
200人1万質問10件のLLMを評価した結果,有意義な進歩の可能性が示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:26:43 GMT)
From the New World of Word Embeddings: A Comparative Study of Small-World Lexico-Semantic Networks in LLMs [47.5] 語彙意味ネットワークは単語をノードとして表現し、意味的関連性はエッジとして表現する。
我々はデコーダのみの大規模言語モデルの入力埋め込みからレキシコ・セマンティックネットワークを構築する。
以上の結果から,これらのネットワークは,クラスタリングと短経路長が特徴である小世界特性を示すことがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:17:00 GMT)
BusterX: MLLM-Powered AI-Generated Video Forgery Detection and Explanation [47.5] GenBuster-200Kは、200Kの高解像度ビデオクリップを備えた、大規模で高品質なAI生成ビデオデータセットである。
BusterXは、マルチモーダル大言語モデル(MLLM)と強化学習を活用した、AI生成のビデオ検出および説明フレームワークである。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:06:43 GMT)
Unlabeled Data or Pre-trained Model: Rethinking Semi-Supervised Learning and Pretrain-Finetuning [47.3] 半教師付き学習(SSL)は、ラベルのないデータを活用することにより、データラベリングプロセスのコストを軽減する。
プレトレイン・ネットワークのパラダイムは近年大きな注目を集めている。
この2つのパラダイムを公平に比較できるフレームワークであるtextitFew-shot SSLを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:29:20 GMT)
Real-Time Verification of Embodied Reasoning for Generative Skill Acquisition [47.1] 生成的スキル獲得により、エンボディエージェントは、スケーラブルで進化するコントロールスキルのレパートリーを積極的に学ぶことができる。
本稿では,実時間検証の原則を具体化技術学習に体系的に統合するフレームワークであるVERGSAを提案する。
我々の知る限り、本手法は検証駆動型生成スキル獲得のための総合的なトレーニングデータセットとして最初のものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:14:55 GMT)
dFLMoE: Decentralized Federated Learning via Mixture of Experts for Medical Data Analysis [45.9] 本稿では,dFLMoE という分散化フェデレーション学習フレームワークを提案する。
私たちのフレームワークでは、クライアントはお互いに軽量なヘッドモデルを直接交換します。
我々は,複数の医療課題に関する枠組みを検証し,その手法が明らかに最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:46:38 GMT)
CoT-Kinetics: A Theoretical Modeling Assessing LRM Reasoning Process [45.9] 最近の大規模推論モデルは、大規模言語モデルの推論能力を大幅に改善している。
我々は、CoT-Kineticsエネルギー方程式を確立するための新しいアプローチを提案する。
我々のCoT-Kineticsエネルギーはスカラースコアを割り当て、推論フェーズの音質を具体的に評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:44:26 GMT)
Ineq-Comp: Benchmarking Human-Intuitive Compositional Reasoning in Automated Theorem Proving on Inequalities [45.9] LLMベースの形式的証明アシスタント(例:リーン)は、数学的発見の自動化を大いに約束する。
これらのシステムは、人間と同じように数学的構造を本当に理解していますか?
この問題を数学的不等式のレンズを用いて検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:56:05 GMT)
Gluon: Making Muon & Scion Great Again! (Bridging Theory and Practice of LMO-based Optimizers for LLMs) [45.8] ディープラーニング最適化の最近の進歩は、根本的に新しいアルゴリズムをもたらした。
これらのアルゴリズムはLinear Minimization Oracle (LMO)フレームワークに基づいている。
本稿では,従来の理論解析手法を特別なケースとして捉えた新しいLMO法である$sf Gluon$を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:50:45 GMT)
ORQA: A Benchmark and Foundation Model for Holistic Operating Room Modeling [45.8] 本稿では,新しいOR質問応答ベンチマークであるORQAと,ORインテリジェンス向上のための基礎的マルチモーダルモデルを紹介する。
4つの公開ORデータセットを総合的なベンチマークに統一することで、当社のアプローチはさまざまなOR課題に同時に対処することが可能になります。
提案するマルチモーダル大言語モデルは,視覚,聴覚,構造化データなどの多様なOR信号を融合し,ORの全体的モデリングを行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:20:29 GMT)
Diff-MM: Exploring Pre-trained Text-to-Image Generation Model for Unified Multi-modal Object Tracking [45.3] マルチモーダルオブジェクトトラッキングは、深度、熱赤外、イベントフロー、言語などの補助的なモダリティを統合する。
既存の手法は通常、RGBベースのトラッカーから始まり、トレーニングデータのみから補助的なモダリティを理解することを学ぶ。
本研究では,事前学習したテキスト・ツー・イメージ生成モデルのマルチモーダル理解機能を利用して,統合されたマルチモーダル・トラッカーDiff-MMを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:42:13 GMT)
LoD: Loss-difference OOD Detection by Intentionally Label-Noisifying Unlabeled Wild Data [45.3] 本稿では,ラベル付き未ラベルデータを用いた新たな損失差OOD検出フレームワーク(LoD)を提案する。
このような操作により、ラベル付きIDデータとラベル付野生データのOODデータがモデル学習を共同で支配するだけでなく、ラベル付野生データのIDとOODサンプルの損失の識別性を確保することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:44:52 GMT)
LightNeuS: Neural Surface Reconstruction in Endoscopy using Illumination Decline [45.1] 単眼内視鏡で取得した画像から3次元再構成を行う手法を提案する。
第一に、内的空洞は水密であり、符号付き距離関数でモデル化することによって自然に強制される性質である。
第二に、シーンの照明は可変であり、それは内視鏡の光源から来ており、四角い距離と表面との逆転で崩壊する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:54:27 GMT)
SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Model [45.0] 空間理解はロボット操作のキーポイントです
本研究では,ロボット基盤モデルのための効果的な空間表現を探索する空間VLAを提案する。
提案したAdaptive Action Gridsは,事前学習したSpatialVLAモデルを微調整し,新しいシミュレーションと実世界のセットアップを実現するための,新しい効果的な方法を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:40:18 GMT)
The Hidden Structure -- Improving Legal Document Understanding Through Explicit Text Formatting [45.0] 法的な契約には、人間の理解に不可欠な、本質的で意味論的に不可欠な構造(例えば、節、節)がある。
本稿では, GPT-4o と GPT-4.1 が法的問合せ課題に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:25:21 GMT)
SAKURA: On the Multi-hop Reasoning of Large Audio-Language Models Based on Speech and Audio Information [45.0] 大規模音声言語モデル(LALM)は、音声、音声などにおけるマルチモーダル理解によって、大きな言語モデルを拡張する。
音声および音声処理タスクにおける彼らのパフォーマンスは広範囲に研究されているが、その推論能力はいまだに未解明である。
音声情報と音声情報に基づいて,LALMのマルチホップ推論を評価するベンチマークであるSAkuraを紹介する。
その結果,LALMは,関連情報を正しく抽出しても,マルチホップ推論のための音声/音声表現の統合に苦慮していることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:20:32 GMT)
DeLoRA: Decoupling Angles and Strength in Low-rank Adaptation [45.0] Decoupled Low-rank Adaptation (DeLoRA)は学習可能な低ランク行列を正規化しスケールする新しい微調整法である。
DeLoRAは競合するPEFT法の性能に適合し,強靭性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:40:42 GMT)
Artificial Intelligence in Election Campaigns: Perceptions, Penalties, and Implications [45.0] AI利用の3つのカテゴリ – キャンペーンオペレーション,投票者アウトリーチ,詐欺 – を特定します。
人々は一般的に、キャンペーンでAIを嫌うが、特に詐欺的使用には批判的であり、彼らは標準違反として認識している。
騙しAIの使用は、AI開発を完全に禁止することを含む、より厳格なAI規制に対する公的なサポートを増加させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:05:15 GMT)
RefDrone: A Challenging Benchmark for Referring Expression Comprehension in Drone Scenes [44.3] RefDroneはドローンシーンのRECベンチマークである。
RDAgentは、RECタスクのための半自動アノテーションツールである。
NGDINOは、マルチターゲットおよびノーターゲットケースを扱うために設計された新しい手法である。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:12:54 GMT)
Evaluating Menu OCR and Translation: A Benchmark for Aligning Human and Automated Evaluations in Large Vision-Language Models [44.2] 異文化間コミュニケーションにおけるメニュー翻訳の重要な役割を強調する特化評価フレームワークを提案する。
MOTBenchは、それぞれの料理を正確に認識し翻訳するLVLMと、その価格とメニュー上のユニットアイテム、そして正確な人間のアノテーションを必要とする。
我々のベンチマークは中国語と英語のメニューのコレクションで構成されており、複雑なレイアウト、さまざまなフォント、さまざまな言語にまたがる文化的に特定の要素、そして正確な人間のアノテーションが特徴である。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:35:05 GMT)
TeleOpBench: A Simulator-Centric Benchmark for Dual-Arm Dexterous Teleoperation [43.9] 本稿では,2次元デキスタラス遠隔操作に適したシミュレータ中心のベンチマークであるTeleOpBenchを紹介する。
このベンチマークでは、(i) MoCap、(ii) VRデバイス、(iii) 腕手外骨格、(iv) 単眼視追跡の4つの代表的遠隔操作モードを実装し、共通のプロトコルとメトリックスイートでそれらを評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:08:53 GMT)
AutoMat: Enabling Automated Crystal Structure Reconstruction from Microscopy via Agentic Tool Use [43.8] 本稿では,走査型電子顕微鏡画像から原子結晶構造への自動変換を行う,エンドツーエンドのエージェントアシストパイプラインであるAutoMatを紹介する。
AutoMatはパターン適応型Denoising、物理誘導型テンプレート検索、対称性を考慮した原子再構成、高速な緩和、MatterSimによるプロパティ予測を組み合わせたものだ。
450以上の構造サンプルの大規模な実験では、AutoMatは既存のマルチモーダルな大規模言語モデルやツールを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:04:50 GMT)
High Dynamic Range Novel View Synthesis with Single Exposure [43.5] 高ダイナミックレンジノベルビュー合成(NV-NVS)は,低ダイナミックレンジ(LDR)画像から3次元シーンHDRモデルを構築することを目的としている。
トレーニング期間中に初めて、単一の露光LDRイメージが利用可能になった。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:22:05 GMT)
From Automation to Autonomy: A Survey on Large Language Models in Scientific Discovery [43.3] 大規模言語モデル(LLM)は科学的発見のパラダイムシフトを触媒している。
この調査は、この急成長する分野を体系的に分析し、科学におけるLLMの役割の変化とエスカレーション能力に重点を置いている。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:41:32 GMT)
A Token is Worth over 1,000 Tokens: Efficient Knowledge Distillation through Low-Rank Clone [43.3] 低ランククローン(Lol-Rank Clone、LRC)は、強力な教師モデルによる行動等価性を目指すSLMを構築するための効率的な事前学習手法である。
LRCは、20Bトークンしか使用せず、1000倍以上のトレーニング効率を達成しながら、何十兆ものトークンでトレーニングされた最先端のモデルと一致または超えている。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:10:42 GMT)
Learning In-Hand Translation Using Tactile Skin With Shear and Normal Force Sensing [43.3] 3次せん断力と2次正規力のゼロショット・シミュレートを可能にする触覚皮膚センサモデルを提案する。
触覚センシングが様々な未確認オブジェクト特性へのポリシー適応をどのように促進するかを評価するために、広範囲な実世界の実験を行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:18:39 GMT)
AdaptThink: Reasoning Models Can Learn When to Think [42.8] 本稿では,問題難易度に基づいて最適な思考モードを選択するために推論モデルを教える新しいRLアルゴリズムであるAdaptThinkを提案する。
実験の結果,AdaptThinkは推論コストを大幅に削減し,性能をさらに向上することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:50:52 GMT)
Zero-Shot Adaptation of Behavioral Foundation Models to Unseen Dynamics [42.4] 行動基礎モデル(BFM)は、任意のタスクに対してゼロショットでポリシーを作成することに成功した。
ここでは,BFMファミリーの手法の1つであるフォワード・バックワード(FB)表現が,異なるダイナミクスを区別できないことを示す。
本稿では,ゼロショット適応を大幅に促進するトランスフォーマーに基づく信念推定器を備えたFBモデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:12:19 GMT)
SwiftPrune: Hessian-Free Weight Pruning for Large Language Models [42.4] 訓練後のプルーニングは、大きな言語モデルを圧縮する鍵となる手法の1つである。
SwiftPruneはハードウェア効率のよいモデル圧縮を実現するヘッセンフリーウェイトプルーニング手法である。
SwiftPruneは数秒でプルーニングプロセスを完了し、既存のSOTAアプローチよりも平均12.29倍(最大56.02倍)のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:48:23 GMT)
Conformal Prediction under Levy-Prokhorov Distribution Shifts: Robustness to Local and Global Perturbations [41.9] 分布シフトをモデル化するために、Levy-Prokhorov (LP) の曖昧性集合を用いる。
共形予測とLP曖昧性集合とのリンクは自然なものであることを示す。
我々は、分布シフトの下で有効であるような頑健な共形予測区間を構築する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:22:52 GMT)
Understanding Cross-Lingual Inconsistency in Large Language Models [41.6] 大規模言語モデル(LLM)は言語間移動が可能なが、異なる言語で書かれたのと同じクエリで入力されたときに一貫性のない出力を生成することができる。
LLMの暗黙的なステップを解釈するために、ロジットレンズを適用し、多言語多目的推論問題を解決する。
LLMは、共有セマンティック空間で作業するのではなく、個々の言語のサブスペースに依存しているため、一貫性が無く、精度が低いことが分かりました。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:10:15 GMT)
Dense Communication between Language Models [41.6] 本稿では,Large Language Models (LLM) 間の直接密度ベクトル通信のパラダイムを提案する。
提案手法は,LSMが他と相互作用する際の不要な埋め込みや非埋め込みのステップを排除し,より効率的な情報伝達を可能にする。
トレーニングコストが0.1%未満で、同様のサイズでLLMに匹敵するパフォーマンスを実現するLMNetをトレーニングする。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:56:06 GMT)
Effectively Controlling Reasoning Models through Thinking Intervention [41.4] Reasoning-enhanced large language model (LLM) は、最終回答を生成する前に、中間推論ステップを明示的に生成する。
本稿では,LLMの内部推論プロセスを明示的に導くための新しいパラダイムであるThinking Interventionを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:57:14 GMT)
A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.3] 本稿では、相関駆動型分解特徴のモデル化と高レベルグラフ表現の理由について論じる。
本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。
可視・近赤外画像融合と医用画像融合タスクにおける最先端手法と比較して, 競争力のある結果を示す実験を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:10:24 GMT)
AXIS: Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents [40.9] AXISは、ユーザインタフェースアクションよりもアプリケーションプログラミングインターフェース(API)を通してアクションを優先順位付けする、LLMベースの新しいエージェントフレームワークである。
Microsoft Word上での実験では、AXISはタスク完了時間を65%-70%削減し、認知負荷を38%-53%削減し、精度は人間に比べて97%-98%向上した。
私たちの研究は、新しいヒューマンエージェント-コンピュータインタラクション(HACI)フレームワークに貢献し、アプリケーションプロバイダがアプリケーションをエージェントに変換するための新しいUI設計原則を探求しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:12:40 GMT)
Pre-Act: Multi-Step Planning and Reasoning Improves Acting in LLM Agents [40.7] 大規模言語モデル(LLM)におけるReAct能力は、現代のエージェントシステムの基盤となっている。
マルチステップ実行計画を作成することでエージェントのパフォーマンスを向上させる新しいアプローチであるPre-Actを導入する。
我々のアプローチは会話エージェントと非会話エージェントの両方に適用できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:17:21 GMT)
Direct Density Ratio Optimization: A Statistically Consistent Approach to Aligning Large Language Models [40.7] 直密度比最適化(DDRO)の新たなアライメント手法を提案する。
DDROは、好ましくない出力分布と好ましくない出力分布の密度比を直接推定し、明示的な人間の嗜好モデリングの必要性を回避する。
実験により、DDROは、多くの主要なベンチマークにおける既存の手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:28:26 GMT)
VersaTune: An Efficient Data Composition Framework for Training Multi-Capability LLMs [40.7] 大規模言語モデル(LLM)は、法律、医学、金融、科学、コードなど幅広い分野において、すべて1つのモデル内で習熟を達成する可能性を秘めている。
既存の研究は主に、ファインチューニング中のドメイン固有の拡張に焦点を当てており、その課題は、他のドメインの知識を破滅的に忘れることにある。
We introduced *VersaTune*, a novel data composition framework designed for enhance LLMs of overall multi-domain capabilities during training。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:51:44 GMT)
VISTA: Enhancing Vision-Text Alignment in MLLMs via Cross-Modal Mutual Information Maximization [40.6] 現在のマルチモーダル大言語モデル(MLLM)は、モダリティアライメントにおいて重要な課題に直面している。
本稿では,MLLMにおいて広く使用されているクロスエントロピー損失の系統的情報理論解析を行う。
本稿では,視覚テキストアライメント(Vision-Text Alignment, VISTA)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:40:28 GMT)
Multi-Grained Patch Training for Efficient LLM-based Recommendation [40.6] 大言語モデル(LLM)は、相互作用した項目履歴を言語モデリングに変換することで、推奨のための新しいパラダイムとして登場した。
Patch Pre-Training(パッチ)とPatch Fine-tuning(パッチ)という2つの段階からなる多段階のパッチトレーニング手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:34:25 GMT)
Understanding the Effect of using Semantically Meaningful Tokens for Visual Representation Learning [40.1] 視覚言語事前学習フレームワーク内のトランスフォーマーエンコーダに対して意味論的に意味のある視覚トークンを提供する。
テキスト・ツー・イメージ検索タスクと画像・テキスト検索タスク間で学習された表現品質のViTに対する顕著な改善を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:00:51 GMT)
Shadow-FT: Tuning Instruct via Base [39.8] 大規模言語モデル(LLM)は、様々なタスクのさらなる微調整の恩恵を一貫して受けている。
本稿では,対応するBASEモデルを活用してINSTRUCTモデルをチューニングするための新しいShadow-FTフレームワークを提案する。
提案するShadow-FTは,追加パラメータを導入せず,実装が容易で,性能が大幅に向上する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:16:21 GMT)
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection [39.7] 普遍的な視覚異常検出は、新しい視覚領域や見えない視覚領域からの異常を、追加の微調整なしで識別することを目的としている。
近年の研究では、CLIPのような事前学習された視覚言語モデルは、ゼロまたは少数の正常な画像で強力な一般化を示すことが示されている。
本稿では2つの重要な洞察に基づいて,AdaptCLIPと呼ばれるシンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:02:23 GMT)
Variational Quantum Subspace Construction via Symmetry-Preserving Cost Functions [39.6] 低次エネルギー状態の抽出のための削減部分空間を反復的に構築するために,対称性保存コスト関数に基づく変動戦略を提案する。
概念実証として, 基底状態エネルギーと電荷ギャップの両方を対象とし, 提案アルゴリズムをH4鎖とリング上で検証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:26:11 GMT)
Most General Explanations of Tree Ensembles [39.4] 「AIシステムの主な疑問は、なぜこの決定がこのようにされたのかである。」
私たちは、AI決定に対して最も一般的な帰納的説明を見つける方法を示します。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:58:54 GMT)
Origin Identification for Text-Guided Image-to-Image Diffusion Models [39.2] テキスト誘導画像と画像の拡散モデル(ID$2$)の原点識別を提案する。
ID$2$の直接的な解決策は、クエリと参照イメージの両方から機能を抽出し比較するために、特別なディープ埋め込みモデルをトレーニングすることである。
提案したID$2$タスクのこの課題を解決するために,最初のデータセットと理論的に保証されたメソッドをコントリビュートする。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:24:33 GMT)
From Local Details to Global Context: Advancing Vision-Language Models with Attention-Based Selection [39.0] textbfABSは、配布外一般化とゼロショット分類タスクで最先端のパフォーマンスを達成する。
textbfABSはトレーニング不要で、数ショットとテストタイムのアダプティブメソッドにさえ競合する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:15:37 GMT)
Learning in Chaos: Efficient Autoscaling and Self-healing for Distributed Training at the Edge [39.0] 本稿では,自己修復と自動スケーリングを組み込んだレジリエントでスケーラブルなエッジ分散トレーニングシステムChaosを提案する。
高速なシャードスケジューリングを備えたマルチ隣のレプリケーションを使用することでスケールアウトを高速化し、新しいノードが近くの隣人から最新のトレーニング状態を並列に取得できるようにする。
カオスは、Polllux、EDL、Autoscalingよりもずっと低いスケールアウト遅延を実現し、1ミリ秒以内にスケールイン、接続リンク、切断リンクイベントを処理する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:52:17 GMT)
CacheFlow: Fast Human Motion Prediction by Cached Normalizing Flow [38.7] 本稿では,新しいフローベース手法であるCacheFlowを提案する。
時間効率に苦しむ従来の条件付き生成モデルとは異なり、CacheFlowは無条件のフローベースの生成モデルを利用する。
提案手法は,Human3.6M上のSOTA法に比較して,密度推定精度と予測精度が向上したことを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:09:45 GMT)
ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation [38.6] 大きな推論モデル(LRM)は、顕著な推論能力を示すが、主にパラメトリック知識に依存し、事実の正確性を制限する。
本稿では,過剰な反復を伴わない多様なクエリを探索する,事実性強化推論モデルReaRAGを提案する。
我々の研究は、レトリーバル強化世代(RAG)のロバスト推論を効果的に統合しつつ、LRMの事実性を向上する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:40:17 GMT)
Optimizing Anytime Reasoning via Budget Relative Policy Optimization [38.6] 我々は,任意の推論性能を最適化する新しいフレームワークであるAnytimeReasonerを提案する。
従来の分布からサンプルトークンの予算に適合するように、完全な思考プロセスを切り離します。
次に、累積報酬を最大化するために、分割された方法で思考と要約ポリシーを最適化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:58:44 GMT)
RoFL: Robust Fingerprinting of Language Models [37.8] そこで本研究では,モデル開発者が指紋による識別を行うための新しい手法を提案する。
本手法では,限られたクエリ数を用いてブラックボックス設定でモデル識別を行う。
提案手法は,モデルや推論設定の共通的な変更に対して,高い堅牢性を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:00:23 GMT)
EffiBench-X: A Multi-Language Benchmark for Measuring Efficiency of LLM-Generated Code [37.7] EffiBench-X は LLM 生成コードの効率を測定するために設計された最初のマルチ言語ベンチマークである。
Python、C++、Java、JavaScript、Ruby、Golangをサポートする。
競争力のあるプログラミングタスクと人間の専門的なソリューションをベースラインとして構成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:43:37 GMT)
The role of data partitioning on the performance of EEG-based deep learning models in supervised cross-subject analysis: a preliminary study [37.7] ディープラーニングは、非常に非線形なパターンを効果的に発見することによって、脳波(EEG)データの解析を進めています。
ドメイン内に適切なデータパーティショニングとクロスバリデーションのための包括的なガイドラインは存在しない。
本稿では,脳波深層学習モデルの評価におけるデータ分割とクロスバリデーションの役割について,徹底的に検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:05:28 GMT)
SPKLIP: Aligning Spike Video Streams with Natural Language [37.6] 本稿では,Spike-VLA用に開発された最初のアーキテクチャであるSPKLIPを紹介する。
SPKLIPは階層的なスパイク特徴抽出器を使用し、イベントストリーム内の多スケール時間ダイナミクスを適応的にモデル化する。
実験では、ベンチマークスパイクデータセット上での最先端のパフォーマンスと、新たに提供された実世界のデータセット上での強力な数ショットの一般化が示されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:14:22 GMT)
Scalable Importance Sampling in High Dimensions with Low-Rank Mixture Proposals [37.6] 重要サンプリングは、希少事象の可能性を効率的に推定するモンテカルロ法である。
本稿では,重要サンプリングのためのパラメータ提案密度として,確率的主成分分析器(MPPCA)の混合物を提案する。
提案手法を3つの模擬システム上で検証し, サンプル効率と故障分布評価の質に一貫した利得を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:44:48 GMT)
Granary: Speech Recognition and Translation Dataset in 25 European Languages [37.6] Granaryは、25のヨーロッパ言語をまたがる認識と翻訳のための音声データセットの大規模なコレクションである。
これは、この規模で書き起こしと翻訳の両方を行う最初のオープンソース取り組みである。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:40:58 GMT)
ChartMuseum: Testing Visual Reasoning Capabilities of Large Vision-Language Models [37.5] 視覚的推論によってのみ解決可能な合成データセットを用いてケーススタディを行う。
次に、1,162人の専門家が注釈を付けた質問を含む新しいチャート質問回答(QA)ベンチマークであるChartMuseumを紹介します。
人間は93%の精度を達成しているが、最高のパフォーマンスモデルであるGemini-2.5-Proは63.0%しか達成できず、主要なオープンソースであるLVLM Qwen2.5-VL-72B-Instructは38.5%しか達成していない。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:27 GMT)
People who frequently use ChatGPT for writing tasks are accurate and robust detectors of AI-generated text [37.4] 私たちは、300のノンフィクションの英語記事を読むために注釈を雇い、それを人書きまたはAI生成とラベル付けします。
実験の結果,AI生成テキストの検出において,LLMを頻繁に使用するアノテータが優れていることがわかった。
注釈付きデータセットとコードを公開し、AI生成テキストの人的および自動検出に関する将来の研究を刺激します。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:22:33 GMT)
VisBias: Measuring Explicit and Implicit Social Biases in Vision Language Models [37.2] 本研究は、視覚言語モデル(VLM)による明示的・暗黙的な社会的偏見について検討する。
明示的偏見は意識的、意図的偏見を指し、暗黙的偏見は意識的に活動する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:33:39 GMT)
G1: Bootstrapping Perception and Reasoning Abilities of Vision-Language Model via Reinforcement Learning [37.2] VLM(Vision-Language Models)は多くの直接的なマルチモーダルタスクに優れていますが、ゲームのようなインタラクティブで視覚的にリッチな環境において、この成果を効果的な意思決定に変換するのに苦労しています。
VLM-Gymは多種多様なビジュアルゲームに統一されたインタフェースと調整可能な構成難易度を備えた強化学習環境である。
我々は、純粋なRL駆動の自己進化を用いてG0モデルを訓練し、創発的知覚と推論パターンを示す。
我々のG1モデルは、すべてのゲームで一貫して教師を追い越し、Claude-3.7-Sonnet-Thinkingのような主要なプロプライエタリモデルより優れています。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:54:39 GMT)
Recollection from Pensieve: Novel View Synthesis via Learning from Uncalibrated Videos [36.5] 本稿では、生のビデオフレームや多視点画像のみからビュー合成モデルを訓練するための新しい2段階戦略を提案する。
第1段階では、明示的な3D表現に頼ることなく、潜在空間で暗黙的にシーンを再構築することを学ぶ。
学習した潜入カメラと暗黙のシーン表現は、実世界と比較すると大きなギャップがある。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:05 GMT)
GUARD: Generation-time LLM Unlearning via Adaptive Restriction and Detection [36.4] 大規模言語モデル(LLM)は、多様なドメインにまたがる膨大な知識を記憶する強力な能力を示している。
既存の未学習の取り組みは、通常、モデルを忘れデータ、データ保持、キャリブレーションモデルといったリソースで微調整する。
本稿では,LLM生成時の動的アンラーニングを実現するフレームワークであるAdaptive Restriction and Detection (GUARD) による生成時アンラーニングを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:26:58 GMT)
Cross-modal Knowledge Transfer Learning as Graph Matching Based on Optimal Transport for ASR [36.3] 事前訓練された言語モデルから音響特徴学習への言語知識の移行は、エンドツーエンド自動音声認識(E2E-ASR)の強化に有効であることが証明された。
言語的モダリティと音響的モダリティの整合性は、固有のモダリティギャップのために依然として課題である。
言語および音響シーケンスを構造化グラフとしてモデル化したグラフマッチング最適輸送(GM-OT)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:13:18 GMT)
FEALLM: Advancing Facial Emotion Analysis in Multimodal Large Language Models with Emotional Synergy and Reasoning [36.1] FEA(Facial Emotion Analysis)は、視覚的感情分析において重要な役割を担っている。
FEALLMは、より詳細な顔情報を取得するために設計された新しいMLLMアーキテクチャである。
我々のモデルは、FEABenchと印象的な一般化能力に強い性能を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:52:15 GMT)
Solving graph problems using permutation-invariant quantum machine learning [36.0] 量子機械学習では、アンザッツは問題の特定の対称性に対応するように調整することができる。
簡単な構成法で量子回路に対称性を組み込む方法を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:44:03 GMT)
Learning Robust Spectral Dynamics for Temporal Domain Generalization [36.0] 時間的ドメイン一般化は、進化するドメインをまたいだモデル一般化を可能にすることを目指している。
本稿では,パラメータ軌跡の周波数領域解析により,これらの課題に対処するFreKooを紹介する。
FreKooは、複雑なドリフトと不確実性を備えた現実世界のストリーミングシナリオに優れています。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:38:18 GMT)
Two Minds Better Than One: Collaborative Reward Modeling for LLM Alignment [35.8] 人間のフィードバックのノイズの多い好みは 報酬の一般化に繋がる
本研究の目的は,報酬モデルにおいて,騒音の嗜好が人間の嗜好とどのように異なるかを明らかにすることである。
我々は、堅牢な選好学習を実現するためのオンラインコラボレーション・リワード・モデリング・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:28:14 GMT)
Unsupervised Multi-Parameter Inverse Solving for Reducing Ring Artifacts in 3D X-Ray CBCT [35.7] 3次元コーンビームCT(CBCT)におけるリングアーティファクトの意義
既存のSOTA(State-of-the-art)リングアーティファクトリダクション(RAR)法は、大規模なペアCTデータセットによる教師あり学習に依存している。
本研究では,新しい教師なしRAR手法であるRinerを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:49:16 GMT)
DiTPainter: Efficient Video Inpainting with Diffusion Transformers [35.2] Diffusion Transformer (DiT) を用いたエンド・ツー・エンドの映像インペイントモデル DiTPainter を提案する。
DiTPainterは、ビデオインペイント用に設計された効率的なトランスフォーマーネットワークを使用しており、大きな事前訓練されたモデルから初期化するのではなく、スクラッチからトレーニングされている。
実験により、DiTPainterは、高品質で時空間整合性の良い既存のビデオ塗装アルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:52:55 GMT)
Towards A Generalist Code Embedding Model Based On Massive Data Synthesis [35.0] 汎用コード検索のための最先端の埋め込みモデルである textbfCodeR (underlineCode underlineRetrieval) を導入する。
CodeRの優れたパフォーマンスは、DRU原則に基づいて構築された大規模な合成データセットであるCodeR-Pile上に構築されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:37:53 GMT)
What Prompts Don't Say: Understanding and Managing Underspecification in LLM Prompts [35.0] 特定されていないプロンプトは、モデルよりも2倍、あるいは、変更のプロンプトの傾向が強く、時には精度が20%以上低下する。
本稿では,要求を意識した新しいプロンプト最適化機構を導入し,平均的なベースライン上における性能を4.8%向上させる。
我々は、迅速な過小評価を効果的に管理するには、積極的な要求発見、評価、監視を含むより広範なプロセスが必要であると想定している。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:03:42 GMT)
Offboard Occupancy Refinement with Hybrid Propagation for Autonomous Driving [33.4] 3Dセマンティックシーンコンプリート(3D Semantic Scene Completion, SSC)は、コンピュータビジョンにおいて重要な課題である。
OccFinerは,視覚による占有率予測の精度を高めるために設計された,新しいオフボードフレームワークである。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:07:29 GMT)
CompeteSMoE -- Statistically Guaranteed Mixture of Experts Training via Competition [33.3] SMoEの効果的なトレーニングは、最適以下のルーティングプロセスのため、依然として困難である、と我々は主張する。
本研究では,最も高い神経応答を持つ専門家にトークンをルーティングする新しいメカニズムであるコンペティションを提案する。
競合ポリシーを学習するためにルータを配置することで,大規模言語モデルを訓練する,単純かつ効果的なアルゴリズムであるCompeteSMoEを開発した。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:24:26 GMT)
A silicon spin vacuum: isotopically enriched $^{28}$silicon-on-insulator and $^{28}$silicon from ultra-high fluence ion implantation [33.3] 等方的に濃縮されたシリコン(Si)は、非ゼロ核スピンを持つ自然発生の29ドルSiを最小化することによりコヒーレンス時間を大幅に向上させることができる。
バルク状Si基板の超高フルエンス2,8$Siイオン注入は,超高純度2,8$Si同位体純度に対する魅力的な技術として最近実証された。
本研究では,28ドルSi濃縮プロセスを適用し,28ドルSiと28ドルSi-on-insulator (SOI)サンプルを生成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:17:33 GMT)
Direction-Aware Neural Acoustic Fields for Few-Shot Interpolation of Ambisonic Impulse Responses [33.1] 音源とリスナーを囲む環境の幾何学的・空間的特性に音場を関連付ける。
本稿では,Ambisonic-format RIRによる方向情報をより明確に組み込んだ方向認識型ニューラルネットワーク(DANF)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:01:53 GMT)
Implicit Bias of Spectral Descent and Muon on Multiclass Separable Data [33.1] p-ノルム正規化急勾配 (NSD) と運動量急勾配 (NMD) に対する暗黙的最適化バイアスの完全な特徴付けを行う。
これらのアルゴリズムは行列の p-ノルムに関してマージンを最大化する解に収束することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:35:21 GMT)
VocalAgent: Large Language Models for Vocal Health Diagnostics with Safety-Aware Evaluation [33.1] 本稿では,音声による健康診断を通じてこれらの課題に対処する音声大言語モデル(LLM)であるVocalAgentを紹介する。
Qwen-Audio-Chatを病院患者から収集した3つのデータセットに微調整した。
VocalAgentは、最先端のベースラインと比較して、音声障害分類において優れた精度を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:58:42 GMT)
Alignment-Augmented Speculative Decoding with Alignment Sampling and Conditional Verification [33.1] トレーニング不要なアライメント拡張型投機的復号アルゴリズムを提案する。
提案手法は,平均受理長を2.39まで,生成速度を2.23倍に向上させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:55:41 GMT)
Towards Low-Latency Event Stream-based Visual Object Tracking: A Slow-Fast Approach [32.9] 我々は,SFTrackと呼ばれる,異なる運用要件に柔軟に対応する新しいスローファストトラッキングパラダイムを提案する。
提案するフレームワークは2つの補完モード,すなわち,十分な計算資源を持つシナリオを対象とした高精度なスロートラッカと,レイテンシを意識したリソース制約のある環境に適した効率的な高速トラッカをサポートする。
このフレームワークは,まず高時間分解能イベントストリームからグラフベースの表現学習を行い,学習したグラフ構造化情報を2つのFlashAttentionベースのビジョンバックボーンに統合する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:37:23 GMT)
Fair Concurrent Training of Multiple Models in Federated Learning [32.7] フェデレートラーニング(FL)は、複数のクライアント間で協調学習を可能にする。
近年のFLアプリケーションは、複数のFLタスクを同時にトレーニングする必要がある。
現在のMMFLアルゴリズムは、単純平均ベースのクライアントタスク割り当てスキームを使用している。
本稿では,各トレーニングラウンドにおけるタスクに動的にクライアントを割り当てる難易度認識アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:56:09 GMT)
Autonomous nanoparticle synthesis by design [32.6] 本稿では,原子スケール構造を特異的に合成する自律的手法を提案する。
提案手法は,実時間実験全散乱(TS)とペア分布関数(PDF)データとをマッチングして合成プロトコルを自動設計する。
我々はこの能力をシンクロトロンで実証し、2つの構造的に異なる金NPの合成に成功した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:19:30 GMT)
Power Allocation for Delay Optimization in Device-to-Device Networks: A Graph Reinforcement Learning Approach [32.5] 本稿では、デバイス間通信(D2D)におけるニューラルネットワーク(GNN)に基づく強化学習(RL)を利用して、遅延最適化のための新しいパワーパワーアプローチを提案する。
提案手法は,ユーザフェアネスを確保しつつ,平均遅延を効果的に低減し,ベースライン法より優れ,展示や一般化の能力を有する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:37:00 GMT)
Unveiling Entity-Level Unlearning for Large Language Models: A Comprehensive Analysis [32.5] 大規模言語モデルのアンラーニングは、セキュリティとプライバシの懸念に対処する可能性から、注目を集めている。
この研究の多くは、機密コンテンツを含む事前定義されたインスタンスの削除を対象とする、インスタンスレベルの未学習に集中している。
本稿では,対象モデルからエンティティ関連知識を完全に消去することを目的とした,エンティティレベルのアンラーニングという新しいタスクを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:54:52 GMT)
TransferTraj: A Vehicle Trajectory Learning Model for Region and Task Transferability [32.1] TransferTrajは、車両のGPS軌道学習モデルで、領域とタスクの転送性の両方に優れています。
地域転送性については、TransferTraj内でRTTEを学習可能な主要なモジュールとして紹介する。
本稿では,タスクの入出力構造を統一するタスク伝達可能な入出力スキームを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:40:34 GMT)
Guided Search Strategies in Non-Serializable Environments with Applications to Software Engineering Agents [31.7] 大規模言語モデル(LLM)は、最近、複雑な多段階タスクにおいて顕著な成果を上げている。
彼らはしばしば、複数のソリューションを試して一貫したパフォーマンスを維持するのに苦労する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:50:15 GMT)
Long-RVOS: A Comprehensive Benchmark for Long-term Referring Video Object Segmentation [31.5] 本稿では,長期参照オブジェクトセグメンテーションのための大規模ベンチマークであるLongtextbf-RVOSを紹介する。
Long-RVOSには、平均時間60秒を超える2,000以上のビデオが含まれており、さまざまなオブジェクトをカバーしている。
フレーム単位の空間評価にのみ依存する従来のベンチマークとは異なり、時間的・時間的整合性を評価するために2つの指標を導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:52:31 GMT)
Understanding Complexity in VideoQA via Visual Program Generation [31.2] ビデオQA(Video Question Answering)における問合せの複雑さを解析するためのデータ駆動型手法を提案する。
我々は、機械学習モデルにおいて、どの質問が難しいかを予測するのに、人間が苦労していることを実験的に示す。
複雑な質問を自動的に生成するように拡張し、一般的なNExT-QAの1.9倍難しい新しいベンチマークを構築します。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:55:14 GMT)
GeoRanker: Distance-Aware Ranking for Worldwide Image Geolocalization [31.0] 画像ジオローカライズのための距離対応ランキングフレームワークGeoRankerを提案する。
絶対距離と相対距離の両方をランク付けする多階距離損失を導入し、構造的空間関係をモデル化する。
GeoRankerは、2つの確立されたベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:04:46 GMT)
Learning to Learn Weight Generation via Local Consistency Diffusion [30.9] 拡散アルゴリズムとメタラーニングを統合したMc-Diを提案する。
我々の理論と実験は、グローバル最適値との整合性を保ちながら、局所目標から学習できることを実証している。
頻繁な重み更新を必要とするタスクにおいて,Mc-Diの精度と推論効率を検証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:44:58 GMT)
A Bounding Box is Worth One Token: Interleaving Layout and Text in a Large Language Model for Document Understanding [30.8] 文書理解のための大規模言語モデル(LayTextLLM)にインターリービングレイアウトとテキストを導入する。
LayTextLLMは、各バウンディングボックスを単一の埋め込みに投影し、テキストでインターリーブする。
総合的なベンチマーク評価ではLayTextLLMが大幅に改善され、KIEタスクが15.2%、VQAタスクが10.7%増加した。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:31:04 GMT)
MAGI-1: Autoregressive Video Generation at Scale [30.7] 我々は,映像チャンクの連続を自動回帰予測して映像を生成する世界モデルMAGI-1を提案する。
テキスト命令で条件付けられたI2V(Image-to-Video)タスクで高いパフォーマンスを実現する。
MAGI-1の最大の変種は、24億のパラメータで構成され、最大400万のトークンのコンテキスト長をサポートする。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:58:50 GMT)
Rethinking Stateful Tool Use in Multi-Turn Dialogues: Benchmarks and Challenges [30.7] 既存のベンチマークでは、言語モデル(LM)を言語エージェント(LA)としてツールとして評価しており、主にシングルターンインタラクションに重点を置いている。
ツール使用のライフサイクル全体を考慮した,ステートフルなツールインタラクションを備えたマルチターン対話データセットである textttDialogTool を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:36:13 GMT)
Explaining Context Length Scaling and Bounds for Language Models [30.5] 言語モデリングにおける文脈長の影響を説明するための理論的枠組みを提案する。
我々は、自然言語と合成データの実験を行い、提案した理論的仮定と推論を検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:10:35 GMT)
CDMamba: Incorporating Local Clues into Mamba for Remote Sensing Image Binary Change Detection [30.4] 我々はCDMambaと呼ばれるモデルを提案し、これはバイナリCDタスクを扱うためのグローバル機能とローカル機能とを効果的に組み合わせている。
具体的には,Mambaのグローバルな特徴抽出と畳み込みによる局所的詳細化に活用するために,Scaled ResidualMambaブロックを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:03:10 GMT)
LLM-Based Compact Reranking with Document Features for Scientific Retrieval [30.3] 我々は,CoRankと呼ばれる科学検索のためのトレーニング不要な,モデルに依存しないセマンティックリグレードフレームワークを提案する。
CoRankには3つのステージがある: ドキュメントレベルの機能のオフライン抽出、これらのコンパクト表現を使用した粗いリランク、そしてステージから上位候補のフルテキストに微妙なリランク。
LitSearchとCSFCubeの実験によると、CoRankは異なるLLMバックボーン間でのリランク性能を大幅に改善している。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:10:27 GMT)
Benchmarking and Confidence Evaluation of LALMs For Temporal Reasoning [30.3] 大規模音声言語モデル(LALM)は、従来の分類や生成タスクとは異なる関連タスクの推論に基づいて評価する必要がある。
オープンソースのLALMをベンチマークし、TREAデータセットのタスクにおいて、それらが人間の能力に一貫して遅れていることを観察する。
分析の結果,精度と不確かさの指標が必ずしも相関しているわけではないことが示唆され,高感度アプリケーションにおけるLALMの全体評価の必要性が示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:46:35 GMT)
RECON: Robust symmetry discovery via Explicit Canonical Orientation Normalization [29.9] 本稿では,ラベルのないデータから各入力の固有対称性分布を検出するためのフレームワークであるRECONを紹介する。
2次元画像ベンチマークで効果的な対称性の発見を実証し、初めて3次元変換群に拡張した。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:10:23 GMT)
Frozen Large Language Models Can Perceive Paralinguistic Aspects of Speech [29.8] 本研究は、重みを微調整することなく、音声のパラ言語的側面を理解するための大規模言語モデル(LLM)の能力について研究する。
音声エンコーダを用いたエンドツーエンドシステムを用いて,LLMの表現的音声プロンプトに対する応答が意味的に一致するテキストプロンプトに対する応答と一致するように,トークン埋め込みを訓練する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:01:39 GMT)
Implicit vs Unfolded Graph Neural Networks [29.8] 暗黙的かつ展開的なGNNは、異なる規則間で強いノード分類精度が得られることを示す。
IGNNはメモリ効率がかなり高いが、UGNNモデルはユニークで統合されたグラフアテンション機構と伝搬規則をサポートしている。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:29:44 GMT)
JIR-Arena: The First Benchmark Dataset for Just-in-time Information Recommendation [29.7] ジャスト・イン・タイム情報推薦(ジャスト・イン・タイム・イン・タイム・インフォメーション・レコメンデーション、英: Just-in-time Information Recommendation、JIR)は、ユーザが必要な時に最も関連性の高い情報を提供するように設計されたサービスである。
本稿では,JIRタスクと関連する評価指標の数学的定義について述べる。
JIR-Arenaは多種多様な情報要求集約シナリオを特徴とするマルチモーダルベンチマークデータセットである。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:49:47 GMT)
IDEAL: Data Equilibrium Adaptation for Multi-Capability Language Model Alignment [29.7] 大規模言語モデル(LLM)は、多様な教育データセット上でのスーパービジョンファインチューニング(SFT)を通じて、素晴らしいパフォーマンスを実現している。
複数の機能を同時にトレーニングする場合、異なるドメインからのデータ量によって管理される混合トレーニングデータセットは、最終モデルのパフォーマンスに直接影響を及ぼす重要な要素である。
混合SFTデータセット内の異なる領域からのデータのボリュームを効果的に最適化する革新的なデータ平衡フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:42:44 GMT)
Multi-modal MRI Translation via Evidential Regression and Distribution Calibration [29.6] 本稿では,マルチモーダルMRI翻訳を分布校正を伴う多モーダルな明示的回帰問題として再構成する新しいフレームワークを提案する。
提案手法は,1) 異なるソースモードから不確かさを推定する明示的回帰モジュールと,2) ソースターゲットマッピングシフトに適応する分布校正機構とを具体化したものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:56:49 GMT)
D3: Diversity, Difficulty, and Dependability-Aware Data Selection for Sample-Efficient LLM Instruction Tuning [29.0] 小型で高品質なデータセットは、命令追従機能を備えた大きな言語モデルを備え、品質と冗長性の問題に悩まされる大きなデータセットよりも優れています。
スコアリングと選択の2つの重要なステップからなるD3法を提案する。
パブリックデータセットと現実のTaobao Liveアプリケーションの両方の実験では、データセット全体の10%未満を使用して、競争力のある、あるいは優れた命令フォロー機能を備えたLLMを実現する上で、D3の有効性が実証されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:44:05 GMT)
Thinking Short and Right Over Thinking Long: Serving LLM Reasoning Efficiently and Accurately [29.0] 大規模言語モデル(LLM)は、所定の要求に応答するChain-of-Thought推論を生成することで、より優れた機能を得ることができる。
しかし,2つのスケーリング次元を取り入れた場合,システム効率は2つの理由から著しく低下する。
本稿では,効率的なLLM推論のためのサービスフレームワークであるSARTについて述べる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:34:56 GMT)
AutoBS: Autonomous Base Station Deployment with Reinforcement Learning and Digital Network Twins [29.0] AutoBSは6G無線アクセスネットワーク(RAN)における最適基地局(BS)展開のための強化学習フレームワークである
カバレッジとキャパシティのバランスをとるデプロイメント戦略を効率的に学習することで、AutoBSは単一のBSシナリオで網羅的な検索能力の約95%を達成します。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:59:23 GMT)
A Comprehensive Framework for Analyzing the Convergence of Adam: Bridging the Gap with SGD [28.9] 本稿では,Adamの収束特性を解析するための,新しい包括的枠組みを提案する。
我々は、アダムが漸近的でない複雑性サンプルを勾配降下の値と類似して得ることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:03:48 GMT)
Enhancing Transformers Through Conditioned Embedded Tokens [28.8] 本研究では,アテンションブロックの条件付けと埋め込みトークン化データの条件付けの直接的な関係を確立する理論的枠組みを開発する。
本研究では,アテンション機構のコンディショニングを改善するために,組込みトークンを体系的に修正するコンディショニングトークンを導入する。
我々の分析は、このアプローチが不調を著しく軽減し、より安定かつ効率的な訓練につながることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:21:53 GMT)
A simulation-heuristics dual-process model for intuitive physics [28.7] 注ぐ角度の予測には,シミュレーション時間によって異なる2つの誤差パターンが認められた。
本稿では,シミュレーションのコストがかかるとシミュレーションに切り替えるシミュレーション・ヒューリスティックス・モデル (SHM) を提案する。
SHMは人間の行動とより正確に一致し、様々なシナリオにまたがる一貫した予測性能を示し、直感的な物理的推論の適応性に対する理解を深める。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:39:28 GMT)
EPSpatial: Achieving Efficient and Private Statistical Analytics of Geospatial Data [28.0] 地理空間データ統計は、地理空間内のクライアントの分布を導出する位置データの集約と分析を含む。
地理空間データ分析におけるプライバシー保護の必要性は、クライアント位置情報の不正使用や不正アクセスに関する懸念から、最重要視されている。
地理空間データの正確・効率的・プライベートな統計分析手法である$mathtEPSpatial$を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:51:30 GMT)
scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data [27.9] 単細胞RNAシークエンシング(scRNA-seq)は細胞不均一性を示す。
細胞クラスタリングは、細胞タイプとマーカー遺伝子の同定において重要な役割を担っている。
最近の進歩、特にグラフニューラルネットワーク(GNN)ベースの手法はクラスタリング性能を大幅に改善した。
単一セルRNA-seqデータを解析するための新しいSiamese Clusteringフレームワークである scSiameseClu を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:17:09 GMT)
BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks and Defenses on Large Language Models [27.6] 生成型大規模言語モデル(LLM)は、幅広いタスクにおいて最先端の結果を得たが、バックドア攻撃の影響を受けないままである。
BackdoorLLMは、テキストジェネレーションLLMのバックドア脅威を体系的に評価する最初の包括的なベンチマークである。
i) 標準化されたトレーニングと評価パイプラインを備えたベンチマークの統一リポジトリ; (ii) データ中毒、重毒、隠れ状態操作、チェーン・オブ・シークレット・ハイジャックなど、さまざまなアタック・モダリティのスイート; (iii) 8つの異なるアタック戦略にまたがる200以上の実験。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:34:50 GMT)
Large Language Model as Universal Retriever in Industrial-Scale Recommender System [27.6] 本稿では,Large Language Models (LLM) が汎用検索として機能し,生成検索フレームワーク内で複数の目的を処理可能であることを示す。
また,モデルの学習性,識別性,伝達性を向上させるために行列分解を導入する。
我々のUniversal Retrieval Model(URM)は、数千万の候補の計算から適応的に集合を生成することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:48:53 GMT)
MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision [27.6] 完全に自動化されたスケーラブルなフレームワーク内でトレーニングされたプロセス報酬モデルであるMM-PRMを提案する。
我々はまず,多様な数学的推論データに基づいて訓練された強力なマルチモーダルモデルMM-Policyを構築した。
人間のラベル付けなしで700万以上のステップレベルのアノテーションを生成します。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:55:08 GMT)
Dementia Through Different Eyes: Explainable Modeling of Human and LLM Perceptions for Early Awareness [27.4] 本稿では,非専門家による認知症が言語を通してどのように認識されるかを検討する。
本研究では,非専門家の人間やLSMに対して,テキストが健康な人や認知症の人によって作成されたかどうかを直感的に判断するよう依頼する。
我々の分析によると、認知症に対する人間の認識は一貫性がなく、狭く、時には誤解を招くような一連の手がかりに依存している。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:51:35 GMT)
AdaToken-3D: Dynamic Spatial Gating for Efficient 3D Large Multimodal-Models Reasoning [27.4] 大規模マルチモーダルモデル(LMM)は、ディープラーニングにおいて重要な研究対象となっている。
現在、3D LMMは何千もの空間トークンを多モーダル推論に用いており、重要な非効率性に悩まされている。
冗長トークンを動的に生成する適応型空間トークン最適化フレームワークであるAdaToken-3Dを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:11:07 GMT)
Language-Enhanced Representation Learning for Single-Cell Transcriptomics [27.3] 単細胞転写学における言語強化表現学習のための新しいフレームワークである scMMGPT を提案する。
scMMGPTは、ロバストな細胞表現抽出を採用し、定量的な遺伝子発現データを保存し、革新的な2段階事前学習戦略を導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:02:17 GMT)
Make Still Further Progress: Chain of Thoughts for Tabular Data Leaderboard [27.2] 機械学習の基本的なデータフォーマットであるタブラルデータは、競争や現実世界のアプリケーションで主に利用されている。
本研究では,大規模言語モデルを活用したテキスト内アンサンブルフレームワークを提案する。
提案手法は,各テストインスタンスの周囲のコンテキストを,その近傍と外部モデルのプールからの予測を用いて構築する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:52:58 GMT)
A Generalized Label Shift Perspective for Cross-Domain Gaze Estimation [27.2] クロスドメイン・ゲイズ推定(CDGE)は、現実世界のアプリケーションシナリオ向けに開発された。
一般化ラベルシフト(GLS)の視点をCDGEに導入する。
条件付き不変学習に重み付けされた音源分布を埋め込むために,条件付き演算子の不一致の確率的推定を導出する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:33:52 GMT)
3D Visual Illusion Depth Estimation [27.2] 3次元視覚錯覚は、2次元平面を操作して3次元空間関係をシミュレートする知覚現象である。
本稿では,機械の視覚系が,単眼と両眼の深度推定を含む3次元視覚錯覚にひどく騙されていることを明らかにする。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:51:03 GMT)
GraphOmni: A Comprehensive and Extendable Benchmark Framework for Large Language Models on Graph-theoretic Tasks [27.0] Graph Omniは、自然言語で記述されたグラフ理論タスクにおけるLLMの推論能力を評価するためのベンチマークである。
これらの次元間の重要な相互作用を識別し、モデルの性能に大きな影響を与えることを示す。
我々の実験によると、Claude-3.5やo4-miniのような最先端モデルは、他のモデルよりも一貫して優れていますが、これらの主要なモデルでさえ、改善の余地がかなりあります。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:11:47 GMT)
Fixing 7,400 Bugs for 1$: Cheap Crash-Site Program Repair [27.0] 本報告では, 事故現場の修復作業の簡易化を図るとともに, 被害発生リスクを軽減しつつ, 修復作業の簡易化を図っている。
大規模言語モデル(LLM)のトークンコストを大幅に削減するテンプレート誘導型パッチ生成手法を提案する。
以上の結果から,トップパフォーマンスエージェントであるCodeRover-Sと組み合わせることで,トークンコストを45.9%削減し,ARVO上でのバグフィックス率を73.5%(+29.6%)に向上させることができた。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:32:51 GMT)
A Comprehensive Survey on Physical Risk Control in the Era of Foundation Model-enabled Robotics [27.0] 最近のファウンデーションモデル対応ロボティクス(FMR)は、汎用技術を大幅に改善した。
一般的な基礎モデルとは異なり、FMRは物理的な世界と相互作用し、人間の安全に直接影響する。
この調査は、身体的リスクを軽減するロボット制御アプローチを包括的にまとめたものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:11:42 GMT)
Deep Koopman-layered Model with Universal Property Based on Toeplitz Matrices [27.0] 提案手法は理論的固さと柔軟性の両方を有することを示す。
提案したモデルの柔軟性により、不規則な力学系から来る時系列データを適合させることができる。
提案手法は, 非線形系に対する複数のクープマン作用素の固有値推定法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:43:43 GMT)
Temporal-Oriented Recipe for Transferring Large Vision-Language Model to Video Understanding [26.9] 我々は,LVLMの時間的理解に影響を及ぼす重要な構成要素を解明するために,徹底的な実証的研究を行っている。
これらの知見に基づいて、時間指向のトレーニングスキームと大規模インタフェースを含む時間指向のレシピを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:40:25 GMT)
Aligning Trustworthy AI with Democracy: A Dual Taxonomy of Opportunities and Risks [26.9] 本稿では、AIと民主主義の複雑な関係を評価するための二重分類法を提案する。
AIRD分類法は、AIが自律性、公正性、信頼といった中核的な民主主義の原則を台無しにする方法を特定する。
AIPD分類は、透明性、参加、効率、エビデンスに基づく政策決定を強化するAIの可能性を強調している。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:51:08 GMT)
UniHM: Universal Human Motion Generation with Object Interactions in Indoor Scenes [26.7] シーン認識型人間の動作に拡散に基づく生成を利用する統一運動言語モデルUniHMを提案する。
UniHMは、複雑な3DシーンでText-to-MotionとText-to-Human-Object Interaction (HOI)の両方をサポートする最初のフレームワークである。
提案手法では, 動作リアリズムを改善するために, 連続した6DoF運動と離散的な局所運動トークンを融合する混合運動表現, 従来のVQ-VAEを上回り, 再現精度と生成性能を両立させる新規なLook-Up-Free Quantization VAE, 強化されたバージョンの3つの重要なコントリビューションを導入している。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:02:12 GMT)
TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios [26.7] 実世界のシナリオにおける時間的推論のためのベンチマークTIMEを提案する。
TIMEは38,522のQAペアで構成され、11のきめ細かいサブタスクを持つ3レベルをカバーする。
推論モデルと非推論モデルについて広範な実験を行う。
TIME-Liteは人手による注釈付きサブセットで、将来の研究を奨励し、時間的推論における標準化された評価を行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:22:02 GMT)
Scalable Exploration via Ensemble++ [26.5] ランダムな線形結合を持つ新しい共有要素アンサンブルアーキテクチャを用いたスケーラブルな探索フレームワークを提案する。
線形帯域については、Ensemble++がThompson Samplingに匹敵する後悔を達成していることを示す理論的保証を提供する。
我々は、固定された特徴を学習可能なニューラル表現に置き換えることで、この理論の基礎を非線形報酬に拡張する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:28:54 GMT)
Theoretical Proof that Auto-regressive Language Models Collapse when Real-world Data is a Finite Set [26.1] 自動回帰言語モデル(LM)は、データスカース領域でデータを生成し、新しいLMを訓練するために広く使われている。
本稿では, コーパス(World Wide Webのサブセットなど)が生成データを組み込むようになり, コーパスに新たな実世界のデータが付加されることがなくなると, LM崩壊は十分な時間後に避けられないという理論的証明を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:48:01 GMT)
Deep Unfolding with Kernel-based Quantization in MIMO Detection [26.0] 本稿では,深層展開ネットワークのためのカーネルベースの適応量子化(KAQ)フレームワークを提案する。
提案するKAQフレームワークの精度は従来の手法よりも優れており、モデルによる推論遅延の低減に成功している。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:50:24 GMT)
MMedPO: Aligning Medical Vision-Language Models with Clinical-Aware Multimodal Preference Optimization [25.9] 我々は,新しいマルチモーダル医療優先最適化手法MMedPOを提案する。
MMedPOは、Med-LVLMアライメントを高めるために、嗜好サンプルの臨床的関連性を考慮する。
実験の結果,MMedPOはMed-LVLMの精度を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:03:31 GMT)
Do Not Let Low-Probability Tokens Over-Dominate in RL for LLMs [25.6] 低確率トークンは、大きな勾配のマグニチュードのため、モデルの更新に不均等に影響を及ぼす。
我々は2つの新しい手法を提案する: アドバンテージリウェイトと低確率トークン分離(Lopti)
我々のアプローチは、様々な確率でトークン間のバランスの取れた更新を促進し、強化学習の効率を高める。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:14:08 GMT)
Beyond Pairwise Learning-To-Rank At Airbnb [25.5] 我々はこの制限をランキングアルゴリズムのSAT定理と呼ぶ。
Airbnbでの現在の作業は、大規模にデプロイされた作業ソリューションによって、答を提供しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:37:21 GMT)
Learning (Approximately) Equivariant Networks via Constrained Optimization [25.5] 等価ニューラルネットワークは、そのアーキテクチャを通して対称性を尊重するように設計されている。
実世界のデータは、ノイズ、構造的変動、測定バイアス、その他の対称性を破る効果のために、しばしば完全対称性から逸脱する。
適応制約等分散(ACE)は、柔軟で非等価なモデルから始まる制約付き最適化手法である。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:08:09 GMT)
Rethinking Attention: Polynomial Alternatives to Softmax in Transformers [25.2] 我々は、ソフトマックスの有効性は注意行列のフロベニウスノルムの暗黙の正則化にあると主張する。
我々の理論的分析は、ある置換体がソフトマックスの効果的な置換体として機能できることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:16:17 GMT)
EAVIT: Efficient and Accurate Human Value Identification from Text data via LLMs [25.1] EAVITは人間の価値識別のための効率的かつ正確なフレームワークである。
ローカルの微調整可能とオンラインのブラックボックスLLMの長所を組み合わせている。
提案手法は,オンラインLCMを直接クエリするよりも,最大1/6の入力トークン数を効果的に削減する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:24:35 GMT)
Treatment Effect Estimation for Optimal Decision-Making [25.1] 2段階CATE推定器を用いた最適意思決定について検討する。
本稿では,CATE推定誤差と判定性能のバランスをとるためにCATEを再ターゲットとした2段階学習目標を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:24:57 GMT)
FAST: Federated Active Learning with Foundation Models for Communication-efficient Sampling and Training [25.0] Federated Active Learning (FAL)は、分散クライアント間で大量のラベル付けされていないデータを活用するための、有望なフレームワークとして登場した。
本稿では,アノテータの最小限の労力で,ループ学習におけるコミュニケーションコストを削減するためのベストプラクティスについて述べる。
予備パスで弱ラベル付けのための基礎モデルを利用する2パスFALフレームワークであるFASTと、最も不確実なサンプルにのみ焦点を絞った改良パスを紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:39:42 GMT)
Model Selection for Gaussian-gated Gaussian Mixture of Experts Using Dendrograms of Mixing Measures [24.9] Mixture of Experts (MoE)モデルは、統計学と機械学習において広く利用されているアンサンブル学習アプローチのクラスである。
混合成分の真の数を一貫した推定が可能なガウスゲート型MoEモデルに新しい拡張を導入する。
合成データを用いた実験結果から,提案手法の有効性が示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:41:19 GMT)
Positional Fragility in LLMs: How Offset Effects Reshape Our Understanding of Memorization Risks [24.7] 文脈ウィンドウの先頭から引き出された短い接頭辞が,動詞の暗記を最も強く引き起こすことを示す。
センシティブなデータをコンテキストウィンドウに深くシフトさせることは,抽出可能な記憶と変性の両方を抑制することを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:28:35 GMT)
Unlearning for Federated Online Learning to Rank: A Reproducibility Study [24.7] 本稿では,FOLTR(Federated Online Learning to Rank)におけるフェデレーション・アンラーニング・ストラテジーの有効性と効果について報告する。
本研究は、アンダーアンラーニングとオーバーアンラーニングの両方のシナリオを管理するために、アンラーニング戦略の有効性を厳格に評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:23:46 GMT)
ChromFound: Towards A Universal Foundation Model for Single-Cell Chromatin Accessibility Data [24.7] scATAC-seqに適した基盤モデルである textbfromFound を提示する。
ChromFoundは、普遍的なセル表現を生成する際に、堅牢なゼロショット性能を達成する。
非コードゲノムの病気リスク変異を理解するための有望なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:45:42 GMT)
HyPerAlign: Interpretable Personalized LLM Alignment via Hypothesis Generation [24.7] HyPerAlignは、大規模言語モデルに対する解釈可能かつサンプル効率の仮説駆動パーソナライズアプローチである。
我々は2つの異なるパーソナライズタスク、すなわち著者帰属と熟考的アライメントについて実験を行った。
その結果、仮説駆動型パーソナライゼーションの方が好みに基づく微調整法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:00:19 GMT)
How Panel Layouts Define Manga: Insights from Visual Ablation Experiments [24.4] 本稿では,マンガ作品の視覚的特徴を,特にパネルレイアウトの特徴に着目して分析することを目的とする。
研究手法として,マンガのページイメージを入力として,マンガタイトル予測のための深層学習モデルをトレーニングした。
具体的には,ページイメージ情報をパネルフレームに限定してアブレーション研究を行い,パネルレイアウトの特性を解析した。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:56:27 GMT)
MegaScale-MoE: Large-Scale Communication-Efficient Training of Mixture-of-Experts Models in Production [24.3] 本稿では,大規模混合実験(MoE)モデルの効率的なトレーニングに適した生産システムであるMegaScale-MoEについて述べる。
MegaScale-MoEは、各MoE層における注意とFFNのための通信効率の戦略をカスタマイズする。
MegaScale-MoEは1.41Mトークン/秒のトレーニングスループットを実現し、Megatron-LMと比較して1.88$timesの効率向上を実現している。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:12:54 GMT)
FairZK: A Scalable System to Prove Machine Learning Fairness in Zero-Knowledge [24.2] モデル所有者は機械学習モデルが公正であることを一般大衆に納得させることができる。
我々は、ロジスティック回帰モデルとディープニューラルネットワークモデルの公正性に関する新しい境界を導出する。
ゼロ知識における機械学習の公平性を証明するシステムであるFairZKを完全に実装した。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:28:16 GMT)
Turning Trash into Treasure: Accelerating Inference of Large Language Models with Token Recycling [24.0] 投機的復号化(英: Speculative decoding)は、推測と検証のパラダイムを通じて推論を加速するアプローチである。
トケンリサイクルは、候補トークンを隣接行列に格納し、幅優先探索アルゴリズムを用いる。
既存の列車なしの手法を30%上回り、広く認められた訓練方法さえも25%上回っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:08:35 GMT)
Beyond Single-Task: Robust Multi-Task Length Generalization for LLMs [24.0] マルチタスク設定における長さの一般化について検討し、ロバストなクロスタスク長の一般化を可能にする最初のフレームワークとしてメタルール追従ファインチューニング(Meta-RFFT)を提案する。
多数のタスクやインスタンスをトレーニングした後、我々のモデルは、最小限の微調整やワンショットプロンプトで、目に見えないタスクに対して驚くほどの長さの一般化能力を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:48:45 GMT)
When a Reinforcement Learning Agent Encounters Unknown Unknowns [23.9] AIのエージェントは、彼女が気づかなかった未知の状態に到達したことに驚くかもしれない。
数学的には、このシナリオは強化学習に基礎を置いている。
未知の未知は驚くべきものであるが、適切な速度と安価なコストで適切に発見されることが示される。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:45:58 GMT)
"Yes, My LoRD." Guiding Language Model Extraction with Locality Reinforced Distillation [23.8] 大規模言語モデル(LLM)に特化して設計された新しいモデル抽出アルゴリズムであるLoRD(Locality Reinforced Distillation)を提案する。
LoRDは、被害者モデルの応答を信号として利用し、ローカルモデルの好みの作り方をガイドする、新たに定義されたポリシー段階的なトレーニングタスクを採用している。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:59:12 GMT)
MR. Judge: Multimodal Reasoner as a Judge [23.8] 本稿では,Multimodal Reasoner as a judge (MR. judge) を提案する。
各応答にスコアを直接割り当てる代わりに、判断過程を推論に着想を得た多重選択問題として定式化する。
この推論プロセスは、判断の解釈性を向上するだけでなく、MLLM審査員のパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:37:39 GMT)
Artificial Intelligence Bias on English Language Learners in Automatic Scoring [23.8] 我々は,ELからの応答,(2)非ELLからの応答,(3)現実のELLと非ELLの比率を反映した混合データセット,(4)両グループの同じ表現を持つバランスの取れた混合データセットの4つのデータセットを用いて,BERTを微調整した。
ELと非ELL間の平均スコアギャップ(MSG)を測定し,人間モデルとAIモデルの両方で生成されたMSGの差を計算し,スコアの相違を同定した。
トレーニングデータセットが大きいと、ERと非ELLのAIバイアスや歪んだ相違は見つからないことがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:42:42 GMT)
FACET: Force-Adaptive Control via Impedance Reference Tracking for Legged Robots [23.6] インピーダンス参照追跡(FACET)を用いたemphForce-Adaptive Controlを提案する。
インピーダンス制御にインスパイアされた我々は、RLを使って制御ポリシーを訓練し、仮想的な質量ばね減衰系を模倣する。
シミュレーションでは、我々の四足歩行ロボットが大きな衝動に対して堅牢性を向上し、制御可能なコンプライアンスを示すことを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:28:40 GMT)
Integrating Extra Modality Helps Segmentor Find Camouflaged Objects Well [23.5] MultiCOSは、セグメンテーション性能を改善するために、多様なデータモダリティを効果的に活用する新しいフレームワークである。
BFSerは、実データと擬似データの両方で既存のマルチモーダルベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:42:52 GMT)
VisDiff: SDF-Guided Polygon Generation for Visibility Reconstruction and Recognition [23.5] 最近の研究は主に、明確に定義された特徴、近傍、または基礎となる距離のメトリクスを持つ構造を理解することに焦点を当てている。
現在の表現学習アプローチでは、適切に定義された特徴と距離のメトリクスなしで構造をキャプチャできない。
入力可視グラフからポリゴン$P$を生成する新しい拡散に基づくアプローチであるVisDiffを紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:55:10 GMT)
Captured by Captions: On Memorization and its Mitigation in CLIP Models [23.0] 本稿では,CLIPにおける記憶の形式的定義を提案し,それをCLIPモデルにおける記憶の定量化に利用する。
以上の結果から,CLIPの記憶行動は,指導的パラダイムと自己監督的パラダイムの中間に位置することが示唆された。
テキストエンコーダは画像エンコーダよりも暗記に寄与しており、緩和戦略はテキスト領域に焦点を当てるべきである。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:22:54 GMT)
Can We Verify Step by Step for Incorrect Answer Detection? [23.0] 本稿では,様々な推論タスクにおける推論連鎖と性能の関係を調査するためのベンチマークR2PEを紹介する。
本ベンチマークは,LLMの最終出力の誤りを推論ステップに基づいて測定することを目的としている。
本稿では,回答チェックベースラインを大きなマージンで上回るPDS(Process Discernibility score)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:59:29 GMT)
Orthogonal Survival Learners for Estimating Heterogeneous Treatment Effects from Time-to-Event Data [22.8] 不均一な治療効果(HTE)を推定することは、パーソナライズされた意思決定に不可欠である。
本稿では,検閲下での時間-時間データからHTEを推定するための,新しい生存学習者のツールボックスを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:06:41 GMT)
Perm: A Parametric Representation for Multi-Style 3D Hair Modeling [22.8] Permは、さまざまな毛髪関連の応用を促進するために設計された人間の3D毛髪のパラメトリック表現である。
ヘアテクスチャを低周波・高周波ヘア構造に適合・分解するために,我々のストランド表現を活用している。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:03:40 GMT)
CARROT: A Cost Aware Rate Optimal Router [22.8] 本稿では,コストAware Rate Optimal rouTerを提案する。
いくつかの代替ルータに対してCARROTの性能を実証的に検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:40:22 GMT)
CQ-DINO: Mitigating Gradient Dilution via Category Queries for Vast Vocabulary Object Detection [22.6] カテゴリクエリに基づくオブジェクト検出フレームワークであるCQ-DINOを提案する。
CQ-DINOは、オブジェクトクエリと学習可能なカテゴリクエリの間の対照的なタスクとして分類を再構成する。
実験により、CQ-DINOは挑戦的なV3Detベンチマークにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:55:24 GMT)
Cross-Lingual Representation Alignment Through Contrastive Image-Caption Tuning [22.5] 多言語画像キャプチャアライメントは、言語間のテキスト表現を暗黙的にアライメントすることができる。
これらの整列表現は、言語間自然言語理解(NLU)とbitext検索に利用できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:06:45 GMT)
Right Time to Learn:Promoting Generalization via Bio-inspired Spacing Effect in Knowledge Distillation [22.4] 知識蒸留(KD)はディープニューラルネットワーク(DNN)を訓練するための強力な戦略である
ここでは、オンラインKDとセルフKDの両方の有効性を改善するために、Spaced KDという、アクセス可能で互換性のある戦略を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:51:05 GMT)
Foundation model for mass spectrometry proteomics [22.4] 本稿では,質量スペクトルの1つの基礎モデルの下で,様々なスペクトル予測タスクを統合することを提案する。
これらの事前訓練されたスペクトル表現を用いることで、下流の4つのタスクの性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:28:14 GMT)
Learning Virtual Machine Scheduling in Cloud Computing through Language Agents [22.3] クラウドサービスでは、仮想マシン(VM)スケジューリングは典型的なオンライン動的多次元Bin Packing(ODMBP)問題である。
従来の手法はリアルタイムな変化に適応するのに苦労し、ドメイン専門家が設計したアプローチは厳格な戦略に苦しむ。
本稿では,ODMBPを解くための大規模言語モデル(LLM)駆動設計パラダイムを提供するMiCoという階層型言語エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:23:03 GMT)
Denoising Diffusion Probabilistic Model for Point Cloud Compression at Low Bit-Rates [22.1] 本稿では,ポイントクラウド圧縮のためのデノイング拡散確率モデル(Denoising Diffusion Probabilistic Model)アーキテクチャを提案する。
PointNetエンコーダは生成条件ベクトルを生成し、学習可能なベクトル量子化器を介して量子化する。
ShapeNetとModelNet40の実験では、標準化と最先端のアプローチと比較して、低速度での速度歪みが改善された。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:29:12 GMT)
Event-based Star Tracking under Spacecraft Jitter: the e-STURT Dataset [21.9] ジッターは、光学通信、地球観測、宇宙領域の認識に必要な宇宙船の微細な点定能力を劣化させる。
我々は、制御ジッター条件下での星観測の初めてのイベントカメラに基づくデータセットである、イベントベースのスタートラッキング・アンダージッターデータセットを提示する。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:55:40 GMT)
CIE: Controlling Language Model Text Generations Using Continuous Signals [21.8] 本稿では,連続信号によるLMの正確な応答長の制御方法を示す。
本手法は,制御信号を離散信号として表現する文脈内学習法や微調整法よりも応答長制御をより確実に行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:58 GMT)
The CausalBench challenge: A machine learning contest for gene network inference from single-cell perturbation data [21.8] CausalBench Challengeは、最先端の手法を強化するために、機械学習コミュニティを刺激することを目的としている。
勝利したソリューションは、以前のベースラインよりもパフォーマンスが大幅に向上した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:57:41 GMT)
Multimodal Coreference Resolution for Chinese Social Media Dialogues: Dataset and Benchmark Approach [21.5] MCR(Multimodal coreference resolution)は、異なるモードで同じエンティティを参照する参照を識別することを目的としている。
我々は,TikTalkCorefを紹介した。TikTalkCorefは,実世界のシナリオにおけるソーシャルメディアのための,最初の中国のマルチモーダルコアデータセットである。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:47:06 GMT)
X-ray Made Simple: Lay Radiology Report Generation and Robust Evaluation [21.4] ラジオロジーレポート生成(RRG)はマルチモーダル生成モデルの開発で大きく進歩している。
既存の語彙ベースのメトリクスで高いパフォーマンスを持つRRGは、単なるミラージュです - モデルはレポートのテンプレートを学習することでのみ、高いBLEUを得ることができます。
本稿では,BLEUの膨らませた数を軽減し,より堅牢な評価を行うセマンティクスに基づく評価手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:06:52 GMT)
ReEx-SQL: Reasoning with Execution-Aware Reinforcement Learning for Text-to-SQL [21.3] 実行フィードバックは、大規模言語モデルを正確に推論し、信頼性の高いクエリを生成するために不可欠である。
既存の方法は、修正や選択のためのポストホック信号としてのみ実行フィードバックを処理し、生成プロセスに統合することができない。
本稿では,ReEx-Reasoningを提案する。ReEx-Reasoningは,デコード中にモデルがデータベースと対話し,実行フィードバックに基づいて推論を動的に調整できるフレームワークである。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:46:47 GMT)
The Shape of Generalization through the Lens of Norm-based Capacity Control [20.9] 我々は,ノルムに基づくキャパシティ測定について検討し,ランダムな特徴量に基づく推定器について検討する。
推定器のノルムがどのように集中し、どのように関連するテストエラーを管理するかを正確に評価する。
これは、より古典的なU字型の振る舞いが、サイズよりもモデルノルムに基づく適切なキャパシティ測度を考慮して復元されることを確認する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:36:07 GMT)
Measuring the Faithfulness of Thinking Drafts in Large Reasoning Models [20.8] 大規模推論モデル(LRM)は複雑な問題解決においてその能力を著しく向上させた。
本稿では,思考ドラフト忠実度を厳格に評価するための系統的対実介入フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:20:24 GMT)
Think Twice Before You Act: Enhancing Agent Behavioral Safety with Thought Correction [20.8] 内部推論プロセスは、ツールの使用とその後のアクションに大きな影響を与えます。
エージェントの思考における小さな偏差は、カスケード効果を誘発し、不可逆的な安全事故を引き起こす可能性がある。
Thought-Alignerはアクションを実行する前に、各ハイリスクな思考を即時に修正する。
修正された思考はエージェントに再導入され、より安全な後続の判断とツールの相互作用が保証される。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:52:59 GMT)
Exploring Neural Granger Causality with xLSTMs: Unveiling Temporal Dependencies in Complex Data [20.8] 時系列における因果関係は、特に非線形依存の存在下では決定が難しい。
本稿では,変数間の長距離関係を捉えるために,Granger causal xLSTM(GC-xLSTM)を提案する。
提案したGC-xLSTMモデルの総合的有効性を示す6つの多様なデータセットに関する実験的検討を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:37:49 GMT)
Neuronal and structural differentiation in the emergence of abstract rules in hierarchically modulated spiking neural networks [20.6] ルール抽象化の根底にある内部的な機構は、いまだ解明されていない。
この研究は、階層的に変調された繰り返しスパイクニューラルネットワーク(HM-RSNN)を導入し、本質的な神経特性をチューニングできる。
我々は,HM-RSNNを用いた4つの認知課題のモデリングを行い,ネットワークレベルとニューロンレベルの両方で規則抽象化の相違が観察された。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:20:42 GMT)
Boundary anomaly detection in two-dimensional subsystem symmetry-protected topological phases [20.5] 我々はトポロジカル応答理論を一般化し、線形サブシステム対称性の境界異常を検出する。
このアプローチにより,異なるサブシステム対称性保護トポロジカル位相(SSPT)を区別し,新しい位相を明らかにすることができる。
我々の研究は、サブシステム対称性の量子異常を検出する数値的な方法を提供し、位相位相の研究に新たな洞察を与える。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:40:07 GMT)
FreqKV: Frequency Domain Key-Value Compression for Efficient Context Window Extension [20.4] 本稿では、新しい周波数領域鍵値(KV)圧縮技術であるFreqKVを提案する。
Freq KVはデコーダのみの大規模言語モデル(LLM)のための効率的なコンテキストウィンドウ拡張を可能にする
長い文脈言語モデリングおよび理解タスクの実験は,提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:21:16 GMT)
Lightweight Transformer via Unrolling of Mixed Graph Algorithms for Traffic Forecast [20.3] 地理的な空間的相関を捉える無向グラフと、時間とともに連続的な関係を捉える有向グラフという2つのグラフを構築した。
我々は、乗算器の交互方向法(ADMM)に基づく反復アルゴリズムを構築し、それをデータ駆動パラメータ学習のためのフィードフォワードネットワークに展開する。
実験により,我々の未登録ネットワークは,最先端の予測スキームとして,競争力のあるトラフィック予測性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:32:34 GMT)
Lost in Transmission: When and Why LLMs Fail to Reason Globally [20.3] 本稿では,アテンションヘッド上の帯域制限をモデル化する新しい計算フレームワークである,バウンダリ・アテンションプレフィックス・オラクル(BAPO)モデルを紹介する。
グラフ到達性のような重要な理由付け問題は、BAPOが解決するためには、高い通信帯域幅を必要とすることを示す。
本研究は,LLMの故障の原理的説明とアーキテクチャの方向性,帯域幅制限を緩和する推論手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:46:27 GMT)
SubGCache: Accelerating Graph-based RAG with Subgraph-level KV Cache [20.3] SubGCacheは、同じような構造的なプロンプトでクエリ間での計算を再利用することで、推論レイテンシを低減することを目的としている。
2つの新しいデータセットの実験では、SubGCacheは推論遅延を同等に減らし、生成品質も改善している。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:51:26 GMT)
Time-Frequency-Based Attention Cache Memory Model for Real-Time Speech Separation [20.2] Time-Frequency Attention Cache Memory (TFACM)モデルは、アテンションメカニズムとキャッシュメモリを通じて関係をキャプチャする。
実験の結果,TFACMはSOTA-GridNet-Causalモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:25:51 GMT)
ARS: Automatic Routing Solver with Large Language Models [20.0] 本稿では,自動ルーティング解法の有効性を評価するために,24属性から派生した1000種類のVRPのベンチマークであるRoutBenchを紹介する。
RoutBenchとともに,Large Language Model (LLM) エージェントを用いてバックボーンアルゴリズムフレームワークを強化する自動ルーティングソルバー(ARS)を提案する。
ARSは最先端のLCMベースの手法と一般的に使用されるソルバより優れており、一般的なVRPの91.67%が自動的に解決され、すべてのベンチマークで少なくとも30%の改善が達成されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:29:41 GMT)
The Gaussian Latent Machine: Efficient Prior and Posterior Sampling for Inverse Problems [19.9] 本稿では,新しい潜伏変数モデルに容易に適用可能であることを示す。
これにより、多くの既存のサンプリングアルゴリズムを統一し一般化する一般的なサンプリング手法が導かれる。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:21:23 GMT)
Learning Joint ID-Textual Representation for ID-Preserving Image Synthesis [19.9] マルチモーダル符号化戦略を用いたID保存のための新しいフレームワークを提案する。
FaceCLIPは、アイデンティティとテキストセマンティクスの両方のための共同埋め込み空間を学習する。
次に、ID保存画像合成パイプラインであるFaceCLIP-SDXLを構築する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:13:37 GMT)
LatentINDIGO: An INN-Guided Latent Diffusion Algorithm for Image Restoration [19.7] 本研究では,ウェーブレットにインスパイアされたインバータブルニューラルネットワーク(INN)を導入し,フォワード変換により劣化をシミュレートし,逆変換により失われた詳細を再構成する。
提案アルゴリズムは, 合成および実世界の低画質画像に対して, 最先端の性能を達成し, 任意の出力サイズに容易に適応できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:17:16 GMT)
Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models [19.7] 時間グラフニューラルネットワーク(TGNN)は時間グラフモデリングにおいて顕著な性能を示した。
TTAGモデリングのための既存のTGNNをシームレスに拡張するフレキシブルなフレームワークである textbfCROSS を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:45:38 GMT)
$\infty$-Video: A Training-Free Approach to Long Video Understanding via Continuous-Time Memory Consolidation [19.6] $infty$-Videoは、連続時間長期メモリ(LTM)統合機構を通じて、任意に長いビデオを処理できる。
我々のフレームワークは、ビデオのコンテキストを効率的に処理し、追加のトレーニングを必要とせず、ビデオQフォーマーを増強する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:18:07 GMT)
On the Role of Transformer Feed-Forward Layers in Nonlinear In-Context Learning [19.6] Transformer-based modelは、文脈内学習(ICL)における顕著な能力を示す
最近の研究は、TransformerアーキテクチャがICLをどのように実行できるかについての洞察を与えている。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:24:47 GMT)
Prompt Stability Matters: Evaluating and Optimizing Auto-Generated Prompt in General-Purpose Systems [19.6] モデル応答の応答一貫性を評価するための基準としてセマンティック安定性を導入する。
安定性に配慮した汎用的なプロンプト生成システムを開発した。
私たちの研究は、より信頼性の高い汎用システムを構築するための実践的なツールとして、迅速な設計に関する新たな視点を提供しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:28:33 GMT)
FlowCut: Unsupervised Video Instance Segmentation via Temporal Mask Matching [19.4] FlowCutは、3段階のフレームワークで構成される教師なしのビデオインスタンスセグメンテーションの方法である。
最初の段階では、画像と光の流れの両方から特徴の親和性を利用して擬似インスタントマスクを生成する。
第2段階では、フレーム間の時間的マッチングにより、高品質で一貫した擬似インスタントマスクを含む短いビデオセグメントを構築する。
第3段階では、YouTubeVIS-2021ビデオデータセットを使用して、トレーニングインスタンスセグメンテーションセットを抽出し、ビデオセグメンテーションモデルをトレーニングします。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:30:33 GMT)
SMOTExT: SMOTE meets Large Language Models [19.4] 本稿では,SMOTE(Synthetic Minority Over-sampling)の概念をテキストデータに適用する新しい手法SMOTExTを提案する。
提案手法は,既存の2つの例のBERTベースの埋め込みを補間することにより,新しい合成例を生成する。
初期の実験では、生成されたデータのみを対象としたトレーニングモデルは、元のデータセットでトレーニングされたモデルと同等のパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:57:36 GMT)
VCM: Vision Concept Modeling Based on Implicit Contrastive Learning with Vision-Language Instruction Fine-Tuning [19.1] LVLM(Large Vision-Language Models)は、インボディードインテリジェンスのような現実世界のAIタスクにおいて重要な要素である。
現在のLVLMは、画像全体をトークンレベルで処理します。
エンド・ツー・エンドのビジュアル・コンセプト・モデリング・フレームワークであるVCMを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:44:04 GMT)
Beyond Single Pass, Looping Through Time: KG-IRAG with Iterative Knowledge Retrieval [19.0] GraphRAGは、外部知識を必要とするタスクにおいて、LLM(Large Language Models)の性能を高めるのに非常に効果的であることが証明されている。
本稿では,KGと反復推論を統合する新しいフレームワークである知識グラフに基づく反復検索生成(KG-IRAG)を提案する。
KG-IRAGのパフォーマンスを評価するために、3つの新しいデータセットが作成され、従来のRAGアプリケーションを超える可能性を示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:56:42 GMT)
Recommender Systems for Democracy: Toward Adversarial Robustness in Voting Advice Applications [19.0] 投票助言アプリケーション(VAA)は、有権者がどの政党や候補者が自分の見解に最も適しているかを理解するのに役立つ。
本稿では,敵対的存在を標的として,これらのアプリケーションが民主的プロセスにもたらす潜在的なリスクについて考察する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:38:06 GMT)
DGRO: Enhancing LLM Reasoning via Exploration-Exploitation Control and Reward Variance Management [19.0] Decoupled Group Reward Optimization (DGRO) は、大規模言語モデル(LLM)推論のための一般的なRLアルゴリズムである。
我々はDGROが平均96.9%の精度でLogicデータセットの最先端性能を達成することを示し、数学的なベンチマークで強い一般化を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:44:49 GMT)
RB-SCD: A New Benchmark for Semantic Change Detection of Roads and Bridges in Traffic Scenes [18.7] 260対の高解像度リモートセンシング画像からなる総合的なベンチマークであるRoad and Bridge Semantic Change Detection (RB-SCD)データセットを紹介する。
RB-SCDは、様々な道路構造と橋梁構造にまたがる11種類の意味的変化を捉え、詳細な構造的および機能的分析を可能にする。
周波数領域にマルチモーダル機能を組み込んだMFDCD(Multimodal Frequency-Driven Change Detector)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:59:07 GMT)
Half Search Space is All You Need [18.7] 本稿では,メモリ使用量と検索時間を削減するため,効率的な自動検索手法を提案する。
具体的には、Zero-Shot NASを用いて、検索空間から低パフォーマンスアーキテクチャを効率的に除去する。
DARTSサーチスペースの実験結果から,本手法はベースラインのOne-Shotに比べてメモリ消費を81%削減することがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:59 GMT)
Improving Compositional Generation with Diffusion Models Using Lift Scores [18.4] 本稿では,リフトスコアを用いた新しいリサンプリング基準を提案する。
生成したサンプルがそれぞれの条件に一致しているかを評価する。
次に、合成されたプロンプトが満たされているかどうかを決定するために結果を構成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:34:42 GMT)
GVPO: Group Variance Policy Optimization for Large Language Model Post-Training [18.4] 群変数ポリシー最適化(GVPO)は、KL制約された報酬を直接重みに含める分析解である。
GVPOには2つの大きな利点がある: ユニークな最適解、正確にはKL制約の報酬目的、および柔軟なサンプリング分布をサポートする。
GVPOは、理論的な保証を実用的適応性で統一することにより、信頼性と汎用性を備えたLLMポストトレーニングのための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:40:29 GMT)
MVAR: Visual Autoregressive Modeling with Scale and Spatial Markovian Conditioning [18.4] 本稿では,条件付き確率モデリングの複雑さを低減するために,マルコフ型視覚自己回帰モデリングフレームワークを提案する。
具体的には,次のスケール予測のために,隣接するスケールの特徴を入力としてのみ扱うスケールマルコフ軌道を導入する。
また,各トークンの注意を,隣接するスケールで対応する位置にある大きさ k の局所的近傍に限定する空間マルコフアテンションを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:56:44 GMT)
CS-Sum: A Benchmark for Code-Switching Dialogue Summarization and the Limits of Large Language Models [18.4] コードスイッチング(CS)は、大規模言語モデル(LLM)に重大な課題をもたらす
LLMによるCSの理解度を評価するため,CS-Sumを導入した。
CS-Sumは、マンダリン・イングリッシュ、タミル・イングリッシュ、マレー・イングリッシュにまたがるCS対話要約の最初のベンチマークである。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:18:14 GMT)
Augmenting Online RL with Offline Data is All You Need: A Unified Hybrid RL Algorithm Design and Analysis [18.3] 本稿では、エージェントがオフラインデータセットとオンラインインタラクションの両方を利用して最適なポリシーを学習できる強化学習(RL)のためのハイブリッド学習フレームワークについて検討する。
統合されたアルゴリズムと分析を行い、オフラインデータセットによる信頼性に基づくオンラインRLアルゴリズムの強化は、純粋なオンラインまたはオフラインのアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:58:54 GMT)
AutoAL: Automated Active Learning with Differentiable Query Strategy Search [18.2] 本研究は, AutoAL という,最初の識別可能な能動学習戦略探索手法を提案する。
SearchNetとFitNetはラベル付きデータを使って協調最適化され、そのタスクにおける候補ALアルゴリズムのセットがどの程度うまく機能するかを学ぶ。
AutoALは、すべての候補ALアルゴリズムや他の選択ALアプローチと比較して、常に優れた精度を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:14:00 GMT)
Revealing the Deceptiveness of Knowledge Editing: A Mechanistic Analysis of Superficial Editing [18.1] 本稿では,この現象を説明するために,表層編集の概念を紹介する。
包括的評価の結果,この問題は既存のアルゴリズムに重大な課題をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:44:57 GMT)
Unveil Multi-Picture Descriptions for Multilingual Mild Cognitive Impairment Detection via Contrastive Learning [18.1] TAUKDIAL-2024チャレンジでは、多言語話者と複数の画像が導入され、画像に依存したコンテンツを解析する上で新たな課題が提示される。
本稿では,(1)教師付きコントラスト学習による差別的表現学習の強化,(2)音声やテキストのモダリティのみに頼らず,画像モダリティの関与,(3)素早い相関と過剰適合を緩和するための専門家製品(PoE)戦略の適用,の3つの枠組みを提案する。
我々のフレームワークは、MCI検出性能を改善し、UAR(Unweighted Average Recall)のプラス7.1%(68.1%から75.2%)、F1スコアのプラス2.9%(8.9%)を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:03:08 GMT)
Diffusion Models with Double Guidance: Generate with aggregated datasets [18.1] 高性能な生成モデルをトレーニングするための大規模なデータセットは、特に関連する属性やアノテーションを提供する必要がある場合、しばしば違法に高価である。
これは、複数の属性を条件として共同で使用する場合、条件生成モデリングにおいて重要な課題となる。
そこで本研究では,訓練サンプルが全条件を同時に含まない場合でも,正確な条件生成を可能にする,二重誘導拡散モデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:59:35 GMT)
Beyond Pairwise: Global Zero-shot Temporal Graph Generation [18.1] 時間関係抽出(TRE)は自然言語処理(NLP)の基本課題である
本稿では,文書の完全時間グラフを1ステップで生成するTREのゼロショット手法を提案する。
また、ドキュメント内のターゲットイベントのすべてのペアに対する完全なアノテーションを備えた新しいデータセットであるOmniTempも導入しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:02:39 GMT)
Diversity-aware clustering: Computational Complexity and Approximation Algorithms [18.0] 本稿では,データポイントが複数の属性に関連付けられ,グループ間の交差が生じている,多様性を考慮したクラスタリング問題について検討する。
クラスタリングソリューションは、各グループから選択されたクラスタセンターの数が、各グループの下位および上位境界閾値で定義された範囲内にあることを保証する必要がある。
1+ frac2e + epsilon approx 1.736$+frac8e + epsilon approx 3.943$, and $5$ for diversity-aware $k$-median, diversity-aware $。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:29:48 GMT)
WIND: Accelerated RNN-T Decoding with Windowed Inference for Non-blank Detection [18.0] WIND(Windowed Inference for Non-Blank Detection)は、モデル精度を損なうことなく、RNN-T推論を大幅に高速化する新しい手法である。
我々は,ラベルループ技術を用いたグレディ復号化,バッチ化グレディ復号化のためのWINDを実装し,新しいビーム探索復号法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:48:01 GMT)
SQLForge: Synthesizing Reliable and Diverse Data to Enhance Text-to-SQL Reasoning in LLMs [17.9] 大規模言語モデル(LLM)は、テキストからテンプレートへの推論タスクにおいて大きな可能性を証明している。
しかし、オープンソースモデルとクローズドソースモデルの間には、大幅なパフォーマンスギャップが持続している。
信頼性と多様なデータを合成するための新しいアプローチであるSQLForgeを紹介します。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:51:29 GMT)
PlanFitting: Personalized Exercise Planning with Large Language Model-driven Conversational Agent [17.9] この研究は、これらの課題に対処する上で、LLM(Large Language Models)の能力を探求する。
LLMによる会話エージェントであるPlanFittingを紹介し,個別の週次運動計画の作成と修正を支援する。
ユーザによる調査,本質的な評価,専門家による評価を含む本研究では,PlanFittingがユーザに対して,適切な,行動可能な,エビデンスに基づいたプラン作成を指導する能力を示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:45:30 GMT)
Counterfactual Explanations for Continuous Action Reinforcement Learning [17.8] 強化学習(Reinforcement Learning, RL)は、医療やロボティクスといった分野において大きな可能性を秘めている。
シナリオに対処する対物的説明は、RL決定を理解するための有望な道を提供するが、連続的なアクション空間では未探索のままである。
本稿では,連続動作RLにおける反実的説明を生成するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:41:54 GMT)
LadderMIL: Multiple Instance Learning with Coarse-to-Fine Self-Distillation [17.7] 計算病理学における全スライド画像(WSI)解析のための多重インスタンス学習(MIL)は、しばしばインスタンスレベルの学習を無視する。
本稿では,(1)インスタンスレベルの監視と(2)バッグレベルでのインスタンス間コンテキスト情報学習という2つの観点からMILを改善するためのフレームワークであるLadderMILを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:25:51 GMT)
$\textit{Rank, Chunk and Expand}$: Lineage-Oriented Reasoning for Taxonomy Expansion [17.7] LORexは、効率的な分類学拡張のための識別的ランキングと生成的推論を組み合わせたプラグアンドプレイフレームワークである。
LORexの精度は12%向上し,Wu & Palmerの類似度は5%向上した。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:06:13 GMT)
From Assistants to Adversaries: Exploring the Security Risks of Mobile LLM Agents [17.6] モバイル大言語モデル(LLM)の総合的セキュリティ解析について紹介する。
言語ベースの推論,GUIベースのインタラクション,システムレベルの実行という,3つのコア機能領域にわたるセキュリティ上の脅威を特定します。
分析の結果,11個の異なる攻撃面が明らかとなり,それぞれが移動型LDMエージェントのユニークな機能と相互作用パターンに根ざしていることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:17:46 GMT)
Use as Many Surrogates as You Want: Selective Ensemble Attack to Unleash Transferability without Sacrificing Resource Efficiency [17.6] サロゲートアンサンブル攻撃では、より多くのサロゲートモデルを使用することで、より高い転送性が得られるが、リソース効率は低下する。
本稿では,反復的に多様なモデルを動的に選択するSelective Ensemble Attack (SEA)を提案する。
SEAは、特定のリソース要求に応じて、転送可能性と効率を適応的にバランスさせる可能性を開く。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:56:41 GMT)
Speculative Prefill: Turbocharging TTFT with Lightweight and Training-Free Token Importance Estimation [17.5] 長文および中文の問合せに対してTTFTを高速化するフレームワークであるSpecPrefillを提案する。
SpecPrefillの中核となるのは、コンテキストに基づいてローカルに重要なトークンを推測するために、軽量モデルを活用することだ。
我々はSpecPrefillを様々なタスクで評価し、続いてパフォーマンス改善の総合的なベンチマークを行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:24:50 GMT)
R1dacted: Investigating Local Censorship in DeepSeek's R1 Language Model [17.4] 報道によると、R1は中国の政治的にセンシティブなトピックに関する特定のプロンプトに答えることを拒否している。
我々は、R1によって検閲されるが、他のモデルでは検閲されない、厳格にキュレートされたプロンプトの大規模なセットを導入する。
我々はR1の検閲パターンを包括的に分析し、一貫性、トリガー、トピック間のバリエーション、フレーズのプロンプト、コンテキストを調べます。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:16:56 GMT)
Machine-generated text detection prevents language model collapse [17.3] 復号化戦略がモデル崩壊に与える影響について検討する。
我々は,機械生成テキスト検出器を訓練し,モデル崩壊を緩和するための重要なサンプリング手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:34:42 GMT)
Automata Learning from Preference and Equivalence Queries [17.3] 本稿では,能動オートマトン学習問題の新たな変種として,嗜好クエリを用いて有限オートマトンを積極的に学習する手法を提案する。
ReMAPは、クエリの複雑さの最小限の複雑さを、正確な等価クエリの下で正確に推測することが保証されている。
実験により,REMAPを大規模オートマトンにスケールすることは,一貫した教師から正しいオートマトンを学習するのに有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:19:00 GMT)
TimeSeriesGym: A Scalable Benchmark for (Time Series) Machine Learning Engineering Agents [17.3] 人工知能(AI)エージェントを評価するためのスケーラブルなベンチマークフレームワークであるTimeSeriesGymを紹介する。
TimeSeriesGymには、複数のドメインやタスクにまたがるさまざまなソースからの課題が含まれている。
提出ファイルやコード,モデルなど,複数の研究成果物に対する評価機構を実装した。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:11:23 GMT)
SynDec: A Synthesize-then-Decode Approach for Arbitrary Textual Style Transfer via Large Language Models [17.2] 大規模言語モデル(LLM)は、テキストスタイルの転送において支配的な力として浮上している。
本稿では,高品質なプロンプトを自動的に合成するSynDecアプローチを提案する。
我々は広範囲な実験を行い、SynDecが既存のLLM法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:03:38 GMT)
Informed Mixing -- Improving Open Set Recognition via Attribution-based Augmentation [17.1] モデル推論中に新しいクラスを検出する問題に対処するために,オープンセット認識(OSR)が考案された。
学習中のモデルの勾配に基づく属性マップを動的に活用し,学習済みの概念を隠蔽するデータ拡張手法GradMixを提案する。
オープンセット認識,クローズドセット分類,アウト・オブ・ディストリビューション検出の実験により,我々の手法が最先端技術を上回ることがよく明らかになった。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:32:06 GMT)
TimeMixer++: A General Time Series Pattern Machine for Universal Predictive Analysis [17.1] 時系列解析は多くのアプリケーションにおいて重要な役割を担い、予測、分類、異常検出、計算などのタスクをサポートする。
本研究では,高機能な表現とパターン抽出機能を通じて,幅広い時系列タスクを最適化するモデルである時系列パターンマシン(TSPM)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:16:13 GMT)
COMAE: COMprehensive Attribute Exploration for Zero-shot Hashing [17.0] COMAEと呼ばれるゼロショットハッシュ(ZSH)のための総合属性探索を行う。
COMAEは、3つの精巧に設計された探索を通して、見知らぬクラスから目に見えないクラスとの関係を描いている。
一般的なZSHデータセットの結果は、COMAEが最先端のハッシュ技術より優れていることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:20:49 GMT)
Walking the Tightrope: Disentangling Beneficial and Detrimental Drifts in Non-Stationary Custom-Tuning [17.0] 本稿では,マルチモーダル大言語モデル(MLLM)において,批判的だが見落とされがちな現象を明らかにする。
我々は、概念ドリフト理論とRFTプロセスの間の理論的橋渡しを確立する先駆者である。
本稿では,有害な概念ドリフトから有益な分布適応を体系的に切り離す新しい対物対応RFTを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:13:38 GMT)
Rolling with the Punches: Resilient Contrastive Pre-training under Non-Stationary Drift [17.0] 重要な課題は、動的データストリーム上のモデルの効果的な事前トレーニングである。
まず、従来の対照的な事前学習手法が、概念のドリフトに対して特に脆弱であることを明らかにする。
本稿では,因果的介入を取り入れた新しい手法であるResilient Contrastive Pre-training (RCP)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:59:05 GMT)
Effective and Transparent RAG: Adaptive-Reward Reinforcement Learning for Decision Traceability [16.9] 本稿では,強化学習(RL)を用いて学習した透過的なRAG生成フレームワークであるARENAを提案する。
構造化された生成と適応的な報酬計算に基づいて、我々のRLベースのトレーニングにより、重要な証拠を特定し、構造化された推論を行い、解釈可能な決定トレースで回答を生成することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:40:29 GMT)
Function Encoders: A Principled Approach to Transfer Learning in Hilbert Spaces [16.8] ヒルベルト空間における移動の幾何学的特徴付けを導入し、3種類の帰納的移動を定義する。
本稿では,関数エンコーダの理論に基づく3種類の転送を実現する手法を提案する。
実験の結果,関数エンコーダは4つのベンチマークタスクと3種類の転送において,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:10:52 GMT)
Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.8] 本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。
具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:39:38 GMT)
Multi-View Wireless Sensing via Conditional Generative Learning: Framework and Model Design [16.8] 複数基地局(BS)とユーザ機器(UE)間の多視点チャネル状態情報(CSI)を用いた学習に基づく高精度ターゲットセンシングに物理知識を取り入れた。
我々は、二部構成のニューラルネットワークアーキテクチャを設計し、その最初の部分は、精巧に設計されたエンコーダを使用して、マルチビューCSIに埋め込まれた潜在ターゲット機能を融合する。
第2部では、これらを強力な生成モデルの条件付け入力として使用して、ターゲットの再構築を誘導する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:27:24 GMT)
Aneumo: A Large-Scale Multimodal Aneurysm Dataset with Computational Fluid Dynamics Simulations and Deep Learning Benchmarks [16.8] 脳動脈瘤 (IAs) は総人口の約5%にみられた重症脳血管障害である。
彼らの破裂は高い死亡率につながるかもしれない。
IAリスクの評価法は, 形態学的, 患者固有の因子に焦点が当てられているが, 血液動態がIAの発生と破裂に与える影響は明らかになっていない。
このデータセットは、大動脈瘤の研究を進め、バイオ流体、バイオメディカルエンジニアリング、臨床リスクアセスメントにおけるデータ駆動アプローチを促進することを目的としている。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:32:09 GMT)
Ice Cream Doesn't Cause Drowning: Benchmarking LLMs Against Statistical Pitfalls in Causal Inference [16.7] 大規模言語モデル(LLM)が厳密で信頼性の高い統計的因果推論を扱えるかどうかは不明である。
CausalPitfallsベンチマークは、信頼できる因果推論システムの開発を進めるための重要なガイダンスと定量的指標を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:06:00 GMT)
Multi-Level Monte Carlo Training of Neural Operators [16.6] 演算子学習は、ニューラルネットワークを用いて偏微分方程式(PDE)に関連する非線形作用素を近似することを目的としている。
これらは入力関数と出力関数の離散化に依存しており、通常は高解像度で大規模問題の訓練に費用がかかる。
そこで我々は,多レベルモンテカルロ (MLMC) アプローチを用いて,関数二項化の分解能の階層構造を利用してニューラルグラデーション演算子を訓練する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:26:28 GMT)
ACCO: Accumulate While You Communicate for Communication-Overlapped Sharded LLM Training [16.6] 我々は,分散LLM学習のためのメモリ効率最適化アルゴリズムである textbfCOmmunicate (acco) における textbfACcumulate を提案する。
新しい処理を計算しながら遅延勾配を同期させることで、アイドル時間を短縮し、異種ハードウェアをサポートする。
ZeRO-1と比較して、我々のアプローチは大幅に高速で、異種ハードウェアで効果的にスケールできる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:02:01 GMT)
PETRA: Parallel End-to-end Training with Reversible Architectures [16.5] 可逆的アーキテクチャは、可逆的でないアーキテクチャと同等に動作できることが示されている。
本稿では,並列化勾配計算のためのバックプロパゲーションの代替となるPETRAを紹介する。
CIFAR-10, ImageNet32, ImageNet上で, PETRAのためのカスタムオートグレードライクなトレーニングフレームワークを開発し, その効果を実証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:59:13 GMT)
ProDS: Preference-oriented Data Selection for Instruction Tuning [16.4] 本稿では,ターゲットセットで観測された嗜好と整合性に基づいてトレーニングサンプルをスコアリングするPreference-oriented Data Selection法(ProDS)を提案する。
私たちの重要なイノベーションは、データ選択の基準を、単に正確なレスポンス生成のための機能を見積もることから、トレーニングサンプルを目標タスクにおける人間の好みと明示的に整合させることにシフトすることにあります。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:28:14 GMT)
SpecOffload: Unlocking Latent GPU Capacity for LLM Inference on Resource-Constrained Devices [16.4] SpecOffloadは投機的デコーディングをオフロードに埋め込む。
最高のベースラインと比較して、SpecOffloadはGPUコアの利用率を4.49倍改善し、推論スループットを2.54倍向上させた。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:32:15 GMT)
DeFeed: Secure Decentralized Cross-Contract Data Feed in Web 3.0 for Connected Autonomous Vehicles [16.4] 本稿では,CAVに様々なガス節約機能を組み込んだ新しいプロトコルであるDeFeedを提案する。
私たちのソリューションは、Web 3.0エコシステムにおけるシームレスで分散化されたコミュニケーションへの重要なステップを示しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:13:31 GMT)
ReGraP-LLaVA: Reasoning enabled Graph-based Personalized Large Language and Vision Assistant [16.3] 我々は120種類のパーソナライズされた知識からなるReGraPという新しいデータセットを提案する。
本稿では、対応するKGとCoT QAペアでトレーニングされたMLLMであるReGraP-LLaVAを提案する。
結果から,提案モデルはパーソナライズされた知識を学習するだけでなく,応答における関係推論も行うことがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:25:06 GMT)
Repurposing Foundation Model for Generalizable Medical Time Series Classification [16.2] FORMEDは、バックボーン基盤モデルを再利用して、目に見えないデータセット上で高度に一般化可能なMedTS分類を可能にするフレームワークである。
我々は,5種類のMedTSデータセットを用いて,11のタスク特化モデル (TSM) と4のタスク特化適応 (TSA) 手法のベンチマークを行った。
以上の結果から,F1スコア(ADFTDデータセット上で)を最大35%向上させることができた。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:31:13 GMT)
PhyDA: Physics-Guided Diffusion Models for Data Assimilation in Atmospheric Systems [16.2] PhyDAは物理誘導拡散フレームワークであり、大気データ同化における物理的コヒーレンスを保証するために設計された。
ERA5リアナリシスデータセットの実験では、PhyDAは最先端のベースラインに比べて精度と物理的妥当性が優れていることが示されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:10:55 GMT)
GAP: Graph-Assisted Prompts for Dialogue-based Medication Recommendation [16.1] 対話型医薬品推薦のための textbfGAP フレームワークを提案する。
対話から医療概念と対応する状態を抽出し、明示的に患者中心のグラフを構築する。
豊富なクエリやプロンプトを生成し、複数のソースから情報を取得して、非現実的なレスポンスを減らすことができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:18:19 GMT)
$\texttt{DIAMONDs}$: A Dataset for $\mathbb{D}$ynamic $\mathbb{I}$nformation $\mathbb{A}$nd $\mathbb{M}$ental modeling $\mathbb{O}$f $\mathbb{N}$umeric $\mathbb{D}$iscussions [16.1] 本稿では,高品質なベンチマーク・問合せペアを生成するためのスケーラブルな手法を提案する。
$texttDIAMONDs$は新しい会話型QAデータセットで、共通のビジネス、財務、その他のグループインタラクションをカバーしている。
我々の最先端言語モデルに対する評価は、参加者中心の推論を扱う上で重要な課題であることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:05:13 GMT)
A Physics-Inspired Optimizer: Velocity Regularized Adam [16.0] 本研究では,系の力学に安定化効果を持たせながら,運動エネルギーのクォート的な用語からアイデアを引き出す,深層ニューラルネットワークのトレーニングに着想を得た物理系であるVelocity-Regularized Adam(VRAdam)を紹介する。
我々は,CNN,Transformer,GFlowNetsなどの多様なアーキテクチャとトレーニング手法を用いて,画像分類,言語モデリング,画像生成,生成モデリングなどのタスクをベンチマークする。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:51:40 GMT)
Evaluating Mathematical Reasoning Across Large Language Models: A Fine-Grained Approach [16.0] 8大言語モデル(LLM)における数学的推論能力の体系的評価について述べる。
DeepSeek-R1は、ほとんどのドメインでo1と競合し、MMLU Formal Logicベンチマークで最高精度を達成する。
アーキテクチャの選択、トレーニングパラダイム、最適化戦略が、推論性能の変動にどのように貢献するかを考察する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:36:27 GMT)
Option-aware Temporally Abstracted Value for Offline Goal-Conditioned Reinforcement Learning [15.9] オフライン目標条件強化学習(GCRL)は、豊富なラベルなしデータセットから目標達成ポリシーをトレーニングする実践的な学習パラダイムを提供する。
我々は,時間差学習プロセスに時間的抽象化を組み込んだ,OTAと呼ばれるオプション対応の時間的抽象価値学習を提案する。
OTAを用いて抽出した高レベルポリシーは,OGBenchの複雑なタスクに対して高い性能を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:51:11 GMT)
Instance-Conditioned Adaptation for Large-scale Generalization of Neural Routing Solver [15.8] 本稿では,ニューラル・ルーティング・ソルバの大規模一般化のための新しいインスタンス・コンディション・アダプタ・モデルを提案する。
提案手法は,非常に高速な推論時間で有望な結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:36:10 GMT)
Malware families discovery via Open-Set Recognition on Android manifest permissions [15.8] マルウェアプログラムをそれぞれの家族に分類することは、サイバー脅威に対する効果的な防御を構築するために不可欠である。
本稿では,既知のマルウェアを分類する上で,新たなマルウェアを検出するマルウェア分類システムを提案する。
私たちのソリューションは、標準的な分類ワークフローでシームレスに使用できるので、非常に実用的であることが分かりました。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:19:54 GMT)
Natural Language Planning via Coding and Inference Scaling [15.8] プログラミングは多くの場合、計画よりも優れていますが、必ずしも優れていません。
我々の詳細なエラー解析は、一般化を妨げる生成コードの堅牢性と効率性の欠如も示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:35:17 GMT)
PLAICraft: Large-Scale Time-Aligned Vision-Speech-Action Dataset for Embodied AI [15.8] PLAICraftは、マルチプレイヤーMinecraftインタラクションをキャプチャする、新しいデータ収集プラットフォームとデータセットである。
このデータセットは、全世界で1万人以上の参加者による1万時間以上のゲームプレイで構成されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:00:47 GMT)
Dynamic Sight Range Selection in Multi-Agent Reinforcement Learning [15.7] マルチエージェント強化学習(MARL)は、視線ジレンマによってしばしば挑戦される。
本稿では,DSR(Dynamic Sight Range Selection)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:40:42 GMT)
Rethinking Reward Model Evaluation Through the Lens of Reward Overoptimization [15.7] リワードモデルは、人間のフィードバックからの強化学習において重要な役割を果たす。
既存の報酬モデルベンチマークは、最適化されたポリシーの性能と弱い相関を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:43:08 GMT)
RetinaLogos: Fine-Grained Synthesis of High-Resolution Retinal Images Through Captions [15.5] RetinaLogos-1400kは、140万のエントリからなる大規模で合成的なCaption-CFPデータセットである。
我々はRetinaLogosと呼ばれる新しい3段階のトレーニングフレームワークを採用し、網膜画像のきめ細かいセマンティック制御を可能にする。
実験では、複数のデータセットにまたがって最先端のパフォーマンスを示し、62.07%のテキスト駆動合成画像が眼科医によって実際のものと区別できない。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:18:11 GMT)
FIOVA: A Multi-Annotator Benchmark for Human-Aligned Video Captioning [15.4] 大規模視覚言語モデル(LVLM)の評価に適した人中心ベンチマークであるFIOVAを紹介する。
実際のビデオは3,002本(それぞれ33.6本)で、それぞれが5つのアノテーションによって独立して注釈付けされている。
本稿では,アノテータのコンセンサスから得られる認知重みを組み込んだ事象レベルの評価指標であるFIOVA-DQを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:28:21 GMT)
CALM-PDE: Continuous and Adaptive Convolutions for Latent Space Modeling of Time-dependent PDEs [15.4] CALM-PDEは圧縮潜在空間における任意の離散化PDEを効率的に解くモデルクラスである。
我々は,エプシロン近傍に制約のあるカーネルを用いた,新しい連続畳み込み型エンコーダデコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:31:30 GMT)
Ultrasound Report Generation with Multimodal Large Language Models for Standardized Texts [15.3] 我々は,多言語および多言語による米国レポート生成のための統一的なフレームワークを提案する。
方法は、臓器部位や言語間で一貫性があり、臨床的に正確なテキスト生成を実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:30:42 GMT)
Bi-level Unbalanced Optimal Transport for Partial Domain Adaptation [15.3] 部分的なドメイン適応問題は、正確な知識伝達のための外れ値クラスを区別しながら、クロスドメインサンプルの整列を必要とする。
サンプル・ワイド・クラス・ワイド関係を同時に特徴付けるために,バイレベル・アンバランス・最適輸送モデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:40:40 GMT)
Certifying Stability of Reinforcement Learning Policies using Generalized Lyapunov Functions [15.3] 最適制御・強化学習(RL)に基づく制御ポリシ下での閉ループシステムの安定性の証明問題について検討する。
古典的なリャプノフ法は、リャプノフ関数の厳格な段階的減少を必要とするが、そのような証明は学習された制御ポリシーのために構築することは困難である。
ニューラルネットワーク残差項でRL値関数を増大させることにより、一般化されたリアプノフ関数を学習するためのアプローチを定式化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:11:49 GMT)
Contextual Paralinguistic Data Creation for Multi-Modal Speech-LLM: Data Condensation and Spoken QA Generation [15.2] 現在の音声-LLMは、パラ言語的理解とともに文脈推論における限られた能力を示す。
そこで本研究では,文脈推論とパラ言語情報を統合した,Wild 音声データからデータセットを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:47:46 GMT)
Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables [15.1] 非実験データから因果効果を推定することは、科学の多くの分野における根本的な問題である。
非パラメトリック因果効果推定における共変量選択のための新しい局所学習手法を提案する。
我々は、合成データと実世界のデータの両方に関する広範な実験を通じて、アルゴリズムを検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:57:12 GMT)
Tianyi: A Traditional Chinese Medicine all-rounder language model and its Real-World Clinical Practice [15.0] Tianyiは、相互接続された、系統的なTCM知識を、進歩的な学習方法で同化するように設計されている。
広範囲な評価は、TCM臨床および研究におけるAIアシスタントとしてのTianyiの有意義な可能性を示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:17:37 GMT)
Grokking at the Edge of Numerical Stability [15.0] 正規化がなければ、グラッキングタスクはモデルを数値安定性の端まで押し上げます。
我々は,Softmax Collapse (SC) はグラッキングを防止し,緩和SCは正規化せずにグラッキングを可能にすることを示した。
これらの貢献は、グルーキングに関する新たな洞察を与え、その遅れた一般化、正規化への依存、および既存のグルーキング誘導法の有効性を解明する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:02:53 GMT)
Coarse Attribute Prediction with Task Agnostic Distillation for Real World Clothes Changing ReID [15.0] 本研究は,現実世界における衣服変更再識別(CC-ReID)に焦点を当てる。
既存の作品は高品質(HQ)のイメージではよく機能するが、低品質(LQ)では苦労する。
実世界のデータにおけるCC-ReIDモデルを改善するために,ロバストネス対低品質(RLQ)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:03:45 GMT)
Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [15.0] 介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
本稿では,観察的および介入的設定における各変数の限界分布の比較に依拠する,介入忠実性の新たな変種を紹介する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:42:49 GMT)
WikiPersonas: What Can We Learn From Personalized Alignment to Famous People? [14.8] WikiPersona(ウィキペソナ)について紹介する。
異なるパーソナライズ手法の評価を行い、テキスト推論された個人選好をプレフィックスとして用いることで、効果的なパーソナライズが可能になることを発見した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:39:48 GMT)
Complementary Frequency-Varying Awareness Network for Open-Set Fine-Grained Image Recognition [14.8] オープンセット画像認識はコンピュータビジョンにおける課題である。
本稿では,高周波情報と低周波情報の両方をよりよく把握できる補完周波数変化認識ネットワークを提案する。
CFANに基づいて,CFAN-OSFGRと呼ばれるオープンセットのきめ細かい画像認識手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:10:09 GMT)
RL in Name Only? Analyzing the Structural Assumptions in RL post-training for LLMs [14.8] 近年,大規模言語モデル(LLM)の強化学習に基づくポストトレーニングが注目されている。
これらの手法の基礎となる定式化と仮定を批判的に検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:57:15 GMT)
Beyond Semantics: The Unreasonable Effectiveness of Reasonless Intermediate Tokens [14.8] 中間トークンのセマンティクスが「思考」や「推論トレース」として人間化され、実際にモデル性能にどのように影響するかを考察する。
解のみのベースラインが大幅に改善されているにもかかわらず、完全に正しいトレースで訓練されたモデルは、正しい解に到達すると、いまだに不正な推論トレースを生成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:29:23 GMT)
CoT-RAG: Integrating Chain of Thought and Retrieval-Augmented Generation to Enhance Reasoning in Large Language Models [14.8] CoT(Chain-of- Thought)推論は、複雑なタスクにおける大規模言語モデルのLLM(LLM)パフォーマンスを高める。
提案するCoT-RAGは3つの重要な設計を持つ新しい推論フレームワークである。
精度は4.0%から44.3%に向上した。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:23:28 GMT)
A3 : an Analytical Low-Rank Approximation Framework for Attention [14.6] トレーニング後の低ランク近似フレームワークである$tt Attt 3$を提案する。
tt Attt 3$ は SoTA よりも優れたパフォーマンスを維持していることを示す。
また、KVキャッシュ圧縮、量子化、性能向上のための混合ランク代入など、$tt Att 3$の汎用性も示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:29:32 GMT)
MultiActor-Audiobook: Zero-Shot Audiobook Generation with Faces and Voices of Multiple Speakers [14.6] 我々は,音声ブックを自動生成するゼロショットアプローチであるMultiActor-Audiobookを紹介した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:13:46 GMT)
Large Language Models and Their Applications in Roadway Safety and Mobility Enhancement: A Comprehensive Review [14.6] 本稿では,道路の安全性と移動性を高めるため,大規模言語モデル(LLM)の適用とカスタマイズについて概説する。
重要な焦点は、LLMがアーキテクチャ、トレーニング、プロンプト、マルチモーダル戦略を通じて、交通機関のユニークな時間的および物理的データで"モダリティギャップ"を埋める方法である。
潜在的な可能性にもかかわらず、固有のLLM制限(ハロシン化、推論欠陥)、データガバナンス(プライバシ、バイアスの複雑さ)、複雑さ(シモン・トゥ・リアル、レイテンシ)、厳格な安全保証に関する課題が続いている。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:51:18 GMT)
FreeKV: Boosting KV Cache Retrieval for Efficient LLM Inference [14.6] FreeKVは、精度を保ちながらKV検索効率を向上させるアルゴリズム-システム共最適化フレームワークである。
実験によると、FreeKVはさまざまなシナリオやモデルでほぼ無作為に精度が向上し、最大で13$times$ Speedupを提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:36:45 GMT)
Detect and Correct: A Selective Noise Correction Method for Learning with Noisy Labels [14.6] ノイズラベル(noisy labels)としても知られる偽アノテートサンプルは、ディープラーニングモデルの性能を著しく損なう可能性がある。
ノイズラベルを用いた学習には,大域的雑音推定とデータフィルタリングの2つのアプローチがある。
本手法は, 損失分布に基づいて, うるさいサンプルを同定する。
次に、ノイズとクリーンなサンプルを分離する選択プロセスを適用し、ノイズ遷移行列を学習してノイズのあるサンプルの損失を補正し、クリーンなデータは影響を受けないままにしておく。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:49:27 GMT)
Turbocharging Gaussian Process Inference with Approximate Sketch-and-Project [14.5] 本稿では,線形システムを解くための近似的,分散的,高速化されたスケッチ・アンド・プロジェクトアルゴリズム(texttADASAP$)を提案する。
決定点過程の理論を用いて、スケッチ・アンド・プロジェクションによって誘導される後進平均が、真の後進平均に急速に収束することを示す。
$texttADASAP$は$>3 cdot 108$のデータセットにスケールする。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:46:26 GMT)
SourceDetMamba: A Graph-aware State Space Model for Source Detection in Sequential Hypergraphs [14.5] グラフのソース検出は、噂の出所を特定する上で高い有効性を示している。
機械学習ベースの手法の進歩にもかかわらず、多くの人は噂の伝播の本質的なダイナミクスを捉えられなかった。
SourceDetMamba: 逐次ハイパーグラフにおけるソース検出のためのグラフ対応状態空間モデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:45:27 GMT)
HyperDet: Source Detection in Hypergraphs via Interactive Relationship Construction and Feature-rich Attention Fusion [14.5] ハイパーグラフはソーシャルネットワークに優れたモデリング機能を提供する。
本稿では,対話型関係構築と特徴豊富な注意融合によるハイパーグラフ(HyperDet)のソース検出手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:27:46 GMT)
ATLAS: Autoformalizing Theorems through Lifting, Augmentation, and Synthesis of Data [14.4] ATLASは、定理文の大規模かつ高品質な並列コーパスを生成するために設計された、新しいデータ生成フレームワークである。
我々は,117kの定理文からなる学部レベルのデータセットを構築し,HALALDトランスレータとKimina-Autoformalizerの両方に対して統計的に有意な改善を示すATLASトランスレータを開発した。
データセット、モデル、コードはまもなく一般公開される予定だ。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:17:39 GMT)
Training Language Models to Reason Efficiently [14.4] 我々は、強化学習を用いて、大きな推論モデルを訓練し、効率的に推論する。
精度を維持しながら不要な計算オーバーヘッドを最小限に抑えるため,本手法はモデルにインセンティブを与える。
2つのオープンウェイトな大推論モデルに対する実験は、ほとんどの精度を保ちながら、推論コストを著しく削減することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:33:01 GMT)
Robust Adaptation of Large Multimodal Models for Retrieval Augmented Hateful Meme Detection [14.4] ヘイトフルミーム検出のためのロバスト適応フレームワークを提案する。
提案手法は最先端の性能を達成し,より大きなエージェントシステムより優れる。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:27:41 GMT)
Improving Multilingual Language Models by Aligning Representations through Steering [14.4] 大規模言語モデル(LLMS)は、非英語トークンを層表現内で処理する。
単一のモデルレイヤをステアリングすることで、パフォーマンスが著しく向上することを示す。
教師付き微調整(textscsft)や人的フィードバックからの強化学習といった高度な技術が多言語能力をどのように改善するかを強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:14:43 GMT)
Anti-Inpainting: A Proactive Defense against Malicious Diffusion-based Inpainters under Unknown Conditions [14.3] アンチ・インペインティング(英: anti-Inpainting)は、未知の条件下で適切な保護を実現するプロアクティブ・ディフェンス法である。
本研究では,未知条件における対向摂動の伝達性を高めるために,マルチスケールな意味保存データ拡張を設計する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:07:29 GMT)
An Efficient Model Maintenance Approach for MLOps [14.2] 既存の機械学習(ML)のメンテナンスアプローチは、しばしば計算資源集約、コスト削減、時間消費、モデル依存である。
我々は、MLOpsパイプラインの改善、新しいモデルメンテナンスアプローチ、およびMLモデルメンテナンスの課題に対処するSimisity-Based Model Reuse(SimReuse)ツールを提案する。
5つの時系列データセットに対する評価結果から,モデル再利用手法がモデルの性能を維持できることを示すとともに,メンテナンス時間,コスト,再訓練回数を大幅に削減できることを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:02:10 GMT)
Efficient training for large-scale optical neural network using an evolutionary strategy and attention pruning [14.2] MZIベースのブロック光ニューラルネットワーク(BONN)は大規模ネットワークモデルを実現することができる。
大規模BONNのための注意型プルーニング(CAP)アルゴリズムを提案する。
提案するCAPアルゴリズムは,大規模ネットワークモデルや複雑なタスクに優れた可能性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:41:11 GMT)
TACOcc:Target-Adaptive Cross-Modal Fusion with Volume Rendering for 3D Semantic Occupancy [14.1] 本稿では,3次元意味的占有予測のためのターゲットスケール適応対称検索機構を提案する。
大規模なターゲットのために地区を拡張し、コンテキスト認識を強化し、小さなターゲットのためにそれを縮小し、効率を改善し、騒音を抑える。
本稿では,3次元意味的占有予測のための適応型マルチモーダル融合フレームワークTACOccを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:32:36 GMT)
Dequantified Diffusion-Schr{ö}dinger Bridge for Density Ratio Estimation [14.0] 我々は、堅牢で安定で効率的な密度比推定のための統一的なフレームワークを設計する。
本稿では,分散ブリッジ補間器(DDBI)を提案し,サポート範囲を拡大し,時間スコアを安定化させる。
DDBIを基盤として提案されたSh"odinger Bridge Interpolant (D SBI) は、Sh"odinger Bridgeの問題を解決するための最適な輸送を取り入れている。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:46:33 GMT)
Writing a Good Security Paper for ISSCC (2025) [14.0] International Solid-State Circuits Conference (ISSCC)は、2024年以来のセキュリティサブミッションを確立することで、ハードウェアセキュリティにコミットしている。
本論文は、ISSCCの全体範囲において、高品質な提出を奨励し、この分野を成長させることを目的とする。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:41:49 GMT)
GMM-Based Comprehensive Feature Extraction and Relative Distance Preservation For Few-Shot Cross-Modal Retrieval [13.9] クロスモーダル検索は、限られたトレーニングサンプルを用いたクロスモーダル表現の学習に焦点を当てている。
既存の手法では、数発のクロスモーダルデータのマルチピーク分布を適切にモデル化できない場合が多い。
画像特徴量とテキスト特徴量との相対的距離を制約するクロスモーダルなセマンティックアライメントのための新しい戦略を導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:25:55 GMT)
On the Vulnerability of Concept Erasure in Diffusion Models [13.9] Recordは、シードから独立して消去された概念を復元する逆方向のプロンプトを見つける座標日光に基づく復元アルゴリズムである。
本研究では,RECORDを最大17.8倍に向上させる実験を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:05:08 GMT)
Seeing the Unseen: How EMoE Unveils Bias in Text-to-Image Diffusion Models [13.8] テキストと画像の拡散モデルにおける不確実性を推定することは、その大きなパラメータ数と複雑な高次元空間での操作のために困難である。
本研究では, 拡散モデルにおける疫学的不確実性を効率的に推定する新しいフレームワークであるEpistemic Mixture of Experts (EMoE)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:53:32 GMT)
SpatialLLM: From Multi-modality Data to Urban Spatial Intelligence [13.8] SpaceLLMのコアは、シーンベースの分析のために事前学習されたLCMを誘導するために、生の空間データから詳細で構造化されたシーン記述を構築することである。
広汎な実験により,事前学習したLLMは空間分布情報を正確に知覚できることが判明した。
都市分析におけるLLM性能に影響を及ぼす要因として,多分野知識,文脈長,推論能力が重要である。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:53:41 GMT)
Palatable Conceptions of Disembodied Being: Terra Incognita in the Space of Possible Minds [13.7] そのような概念に適合する存在に対して、主観的時間と自尊心はどのように現れるのか?
究極的には、この試みは、仏教的な意味では空虚性のようなものを生み出し、主観性と自己形成に対する我々の双対的傾向を損なうのに役立ちます。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:35:35 GMT)
Large Language Models Could Be Rote Learners [13.6] 大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)ベンチマークが広く使用されている。
本研究では,汚染を学習の本質的な側面として再編成し,表層記憶からの真の能力獲得を抑えることを目的とする。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:03:40 GMT)
Reasoning BO: Enhancing Bayesian Optimization with Long-Context Reasoning Power of LLMs [13.5] 本稿では、推論モデルを利用してBOのサンプリングプロセスを導出する新しいフレームワークであるReasoning BOを設計する。
推論BO(Reasoning BO)は、実証可能な科学的理論に基づく批判的な洞察とともに、リアルタイムサンプリングレコメンデーションを提供する。
このフレームワークは、リアルタイムの洞察と仮説の進化を通じて、サンプリング戦略を段階的に洗練する能力を示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:20:40 GMT)
A Dataless Reinforcement Learning Approach to Rounding Hyperplane Optimization for Max-Cut [13.4] エージェントが改良された丸みを帯びた超平面を選択し、ゴーマンス・ウィリアムソン(GW)アルゴリズムで生成されたものよりも優れたカットを得られるように学習する、非エポゾディック強化学習の定式化に基づくトレーニングデータフリーアプローチを提案する。
提案手法は, 密度や次数分布の異なる大規模グラフに対して, より優れたカットを一貫して達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:41:10 GMT)
When majority rules, minority loses: bias amplification of gradient descent [13.4] 多数派マイノリティ学習タスクのための形式的なフレームワークを開発する。
標準トレーニングが多数派を優遇し,少数派特有の特徴を無視するステレオタイプ予測器を作成できることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:51:49 GMT)
Task Facet Learning: A Structured Approach to Prompt Optimization [13.4] 本稿では,タスクの複数の面をトレーニング例から学習するアルゴリズムを提案する。
提案アルゴリズムであるUniPromptは、入力空間をクラスタ化し、クラスタ化されたバッチを使用する。
複数のデータセットと実世界のタスクに対する経験的評価は、ショートネームを用いて生成されたプロンプトが、人間のチューニングしたプロンプトと最先端の手法によるプロンプトよりも高い精度が得られることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:17:42 GMT)
GEM: Gaussian Embedding Modeling for Out-of-Distribution Detection in GUI Agents [13.4] 環境制約に違反したり、GUIエージェントの現在の能力を超えたりするアウト・オブ・ディストリビューション(OOD)命令は、タスクの故障やセキュリティ上の脅威を引き起こす可能性がある。
従来のOOD検出手法は、複雑な埋め込み空間とGUI環境の進化により、この領域でサブ最適化される。
本稿では,その機能境界を反映したGUIエージェントから抽出した入力埋め込み距離にガウス混合モデルを適用する新しい手法であるGEMを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:29:05 GMT)
Rapidly Varying Completely Random Measures for Modeling Extremely Sparse Networks [13.4] ラプラス指数(Laplace exponent)は、ランダム構造がどのようにスケールするかを決定する振る舞いである。
安定あるいは一般化されたガンマ過程の混合として定義される変動$alphain(0,1]$のインデックスを持つCRMの新しいクラスを導入する。
我々は,大規模ネットワークの実証的証拠と整合して,ほぼ直線的なエッジ成長を持つネットワークを創出する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:57:12 GMT)
CoIn: Counting the Invisible Reasoning Tokens in Commercial Opaque LLM APIs [13.3] 隠れトークンの量と意味的妥当性の両方を検査する検証フレームワークであるCoInを提案する。
実験では、信頼できる第三者監査官としてデプロイされたCoInが、成功率94.7%に達するトークン数インフレーションを効果的に検出できることが示されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:39:23 GMT)
Step-wise Adaptive Integration of Supervised Fine-tuning and Reinforcement Learning for Task-Specific LLMs [13.3] SASRは、大規模言語モデルのためのステップワイド適応型ハイブリッドトレーニングフレームワークである。
SFTとRLを統一し、最適化全体を通して動的に2つのバランスをとる。
実験の結果,SASRはSFT,RL,静的ハイブリッド訓練法より優れていた。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:10:17 GMT)
Does Low Rank Adaptation Lead to Lower Robustness against Training-Time Attacks? [13.2] 低ランク適応(LoRA)は、大規模言語モデルを微調整する際、顕著な手法として登場した。
本稿では,LoRAの微調整における低ランク構造の影響を理論的に検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:57:08 GMT)
PromptPrism: A Linguistically-Inspired Taxonomy for Prompts [13.2] PromptPrismは言語にインスパイアされた分類であり、3つの階層レベルの素早い分析を可能にする。
3つのアプリケーションに適用することで,PromptPrismの実用性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:08:26 GMT)
Evolutionary training-free guidance in diffusion model for 3D multi-objective molecular generation [13.1] EGDは、拡散サンプリングプロセスに直接進化的演算子を組み込む、トレーニング不要のフレームワークである。
単一およびマルチターゲットの3D条件生成タスクでは、EGDは最先端条件拡散法を精度良く上回り、1世代あたり最大5倍高速に動作します。
EGDは任意の3Dフラグメントを生成分子に埋め込むことができ、複数の衝突特性を1つの統一プロセスで最適化することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:06:52 GMT)
TCC-Bench: Benchmarking the Traditional Chinese Culture Understanding Capabilities of MLLMs [13.1] 中国伝統文化理解ベンチマーク(TCC-Bench)を提案する。
TCC-Benchは、文化的に豊かで視覚的に多様なデータで構成されており、博物館の工芸品、日常の生活シーン、漫画、その他の文化的に重要な文脈の画像が組み込まれている。
テキストのみのモードでGPT-4oを利用する半自動パイプラインを採用し、候補問題を生成し、続いて人間によるキュレーションを行い、データ品質を保証し、潜在的なデータ漏洩を回避する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:06:35 GMT)
Investigating Active Sampling for Hardness Classification with Vision-Based Tactile Sensors [13.1] 人間とロボットが触覚を通して知覚する最も重要な物体の1つは硬さである。
本稿では,視覚に基づく触覚センサを用いたサンプル効率の高い硬度分類のための情報理論アクティブサンプリング手法について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:15:27 GMT)
Selective Code Generation for Functional Guarantees [13.0] 大規模言語モデル(LLM)は、人間レベルのパフォーマンスを示し、その特別な子孫、コード生成モデルが複雑なタスクを解決する上でコアとなる役割を担っている。
コード生成モデルの幻覚はめったに考慮されない。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:29:16 GMT)
Decompile-Bench: Million-Scale Binary-Source Function Pairs for Real-World Binary Decompilation [13.0] Decompile-Benchは、収集された1億の関数ペアから凝縮された200万のバイナリソース関数ペアからなる、最初のオープンソースデータセットである。
評価のために、よく確立されたHumanEvalとMBPPから手作業で作成したバイナリを含むDecompile-Bench-Evalのベンチマークを開発した。
Decompile-Benchによる微調整は、再実行可能性率の観点から、以前のベンチマークよりも20%改善されていることが分かりました。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:34:33 GMT)
Contrastive Prompting Enhances Sentence Embeddings in LLMs through Inference-Time Steering [13.0] 本稿では,より優れた文の埋め込みを促すために補助的なプロンプトを付加するContrastive Prompting (CP)法を提案する。
補助的なプロンプトと対照的に、CPは文のコアセマンティクスをエンコードする既存のプロンプトを操ることができる。
提案手法は,異なる大規模言語モデル間で既存のプロンプトベースの手法の性能を向上させることができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:19:27 GMT)
GuidedMorph: Two-Stage Deformable Registration for Breast MRI [13.0] そこで我々は,高密度組織との整合性を高めるために,新しい2段階登録フレームワークを提案する。
グローバルな構造アライメントのための単一スケールネットワークに加えて,乳房の動きを追跡するために高密度組織情報を利用するフレームワークを導入する。
ユークリッド距離変換(EDT)に基づく新しいワープ法も提案され、登録された高密度組織と胸部マスクを正確にワープする。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:48:06 GMT)
Adversarial Reasoning for Repair Based on Inferred Program Intent [12.9] 本稿では,批判的・敵対的推論に基づくAdverIntent-Agentという手法を提案する。
当社のアプローチは、複数のAPRパッチの生成から、複数の潜在的プログラム意図の推測に焦点を移すという斬新なアプローチです。
AdverIntent-AgentはDefects4J 2.0とHumanEval-Javaの2つのベンチマークで評価された。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:51:56 GMT)
PARF: An Adaptive Abstraction-Strategy Tuner for Static Analysis [12.8] Parfは静的プログラムアナライザの抽象化戦略を適応的にチューニングするためのツールキットである。
これはCプログラムのオープンソース静的アナライザであるFrama-C/Eva上に実装されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:13:34 GMT)
From Grunts to Grammar: Emergent Language from Cooperative Foraging [12.7] マルチエージェントフォーエイジングゲームにおける言語の出現について検討する。
エージェントは自然言語の特徴を持つ通信プロトコルを開発する。
それぞれの特性を定量化し、集団の大きさや時間的依存といった異なる要因がどのように創発言語の特徴を形作るかを分析する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:57:30 GMT)
PsyMem: Fine-grained psychological alignment and Explicit Memory Control for Advanced Role-Playing LLMs [12.6] PsyMemは、きめ細かい心理的属性と、ロールプレイングのための明示的なメモリ制御を統合する新しいフレームワークである。
Qwen2.5-7B-Instructを特別に設計したデータセットでトレーニングすることで、PsyMem-Qwenはロールプレイングにおいてベースラインモデルより優れています。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:45:09 GMT)
Combining the Best of Both Worlds: A Method for Hybrid NMT and LLM Translation [12.6] 大規模言語モデル(LLM)は、機械翻訳(MT)など、様々な下流タスクにおいて有望なパフォーマンスを示す。
しかし、翻訳にLLMを使うことは、高い計算コストとかなりのレイテンシに悩まされる。
本稿では,ソース文の特徴を生かした,新規で素直な判定手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:50:52 GMT)
Just Dance with $π$! A Poly-modal Inductor for Weakly-supervised Video Anomaly Detection [12.5] PI-VADは、RGB表現を5つの追加モダリティで拡張する新しいアプローチである。
PI-VADは3つの顕著なVADシナリオで最先端の精度を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:51:57 GMT)
REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning? [12.5] 言語学者は、そのような曖昧さは表現(RE)を参照することからしばしば生じることを示唆している。
本稿では,人間の指示におけるREsの不明瞭さがLLMに基づくロボットタスク計画にどのように影響するかを考察する。
本稿では,あいまいなRE(REI-Bench)を用いた最初のロボットタスク計画ベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:21:49 GMT)
OntoURL: A Benchmark for Evaluating Large Language Models on Symbolic Ontological Understanding, Reasoning and Learning [12.4] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる能力を示しているが、構造化された記号的知識を処理する能力はまだ探索されていない。
ドメイン知識の形式的記号表現を扱う上で,LLMの習熟度を評価するために設計された最初の総合ベンチマークであるOntoURLを紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:19:47 GMT)
Learning to Reduce Search Space for Generalizable Neural Routing Solver [12.4] 構成的ニューラル最適化(NCO)は、手作りのルールに頼ることなく複雑なルーティング問題を解決する能力によって、研究の注目を集めている。
既存のNCO手法は、計算の複雑さと構造パターンの非効率な捕捉により、大規模問題に一般化する際の課題に直面している。
建設的NCOプロセスの各ステップにおいて,少数の有望な候補ノードを適応的に選択する,学習に基づく探索空間削減手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:14:26 GMT)
Physics-Aware Compilation for Parallel Quantum Circuit Execution on Neutral Atom Arrays [12.3] ニュートラル原子量子コンピュータはスケーラビリティ、動的再構成可能性、大規模実装の可能性の利点を提供する。
我々は,中性原子系の固有の柔軟性を維持しつつ,コンパイル効率を向上させる手法であるPhysical-Aware Compilation (PAC)を提案する。
その結果、PACは16x16配列で78.5倍の高速化を実現し、回路品質は同等であることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:38:15 GMT)
Enhancing LLMs for Time Series Forecasting via Structure-Guided Cross-Modal Alignment [12.3] 本稿では,時系列データと言語データで共有される状態遷移グラフ構造を逐次モーダルとして活用・整合するフレームワークを提案する。
複数のベンチマークの実験は、SGCMAが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:30:41 GMT)
Option-ID Based Elimination For Multiple Choice Questions [12.3] 複数選択質問(MCQ)は、大規模言語モデル(LLM)を評価するために人気があり重要なタスクである。
本稿では,新しいオプションIDベースのPoE(textPoE_textID$)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:58:53 GMT)
PEER pressure: Model-to-Model Regularization for Single Source Domain Generalization [12.2] 対象領域におけるこのような拡張に基づく手法の性能は、訓練中に普遍的に変動することを示す。
本稿では,新しい一般化法を提案する。
Space Ensemble with Entropy Regularization (PEER) – プロキシモデルを使用して、拡張データを学ぶ。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:01:11 GMT)
Generative prediction of flow fields around an obstacle using the diffusion model [12.1] 本稿では,障害物まわりの流れ場を予測するために,障害物形状を入力として利用する幾何学的-フロー拡散モデルを提案する。
マルコフ過程は障害物形状に条件付けされ、各ステップで除去されるノイズを推定する。
我々は、円、楕円、長方形、三角形を含む単純な障害物を取り巻く流れのデータセットを用いて、幾何学と流れの拡散モデルを訓練する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:07:07 GMT)
Concept-Level Explainability for Auditing & Steering LLM Responses [12.1] ConceptX はモデルに依存しない、概念レベルの説明可能性の方法である。
プロンプト内で意味的にリッチなトークンを識別し、出力のセマンティックな類似性に基づいてそれらの重要性を割り当てる。
偏見の源を明らかにすることによって監査と、LPM応答の有害性を低下させるプロンプトを変更することによって、ステアリングの両方を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:00:52 GMT)
Identifiability of Nonnegative Tucker Decompositions -- Part I: Theory [12.1] 正準多進分解のような多くのテンソル分解の重要な性質は、識別可能である。
これにより、データを生成する基盤となるソースを復元することができる。
本稿では,非負性TD(nTD)の識別可能性について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:08:37 GMT)
TSPulse: Dual Space Tiny Pre-Trained Models for Rapid Time-Series Analysis [12.0] TSPulseは、1Mパラメータしか持たない超コンパクトな時系列事前訓練モデルである。
分類、異常検出、インプット、検索タスクで強く機能する。
TSPulse 10-100Xは、既存のトレーニング済みモデルよりも小さくなっている。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:18:53 GMT)
Genesis: A Compiler Framework for Hamiltonian Simulation on Hybrid CV-DV Quantum Computers [12.0] Genesisは、ハイブリッド連続可変(CV)と離散可変(DV)量子コンピューティングシステムでハミルトンシミュレーションをサポートするように設計された最初のコンパイラである。
ターゲットとするハイブリッドCV-DV量子コンピュータのネイティブ命令セットを用いて、入力されたハミルトニアンを基底ゲートに分解する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:32:06 GMT)
XOXO: Stealthy Cross-Origin Context Poisoning Attacks against AI Coding Assistants [12.0] 本稿では,意味論的に等価なコード修正に依存する新たな攻撃であるPoisoning(XOXO)を提案する。
攻撃で使用されたGPTnet v2を含む11モデルで7572%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:10:27 GMT)
An Empirical Analysis of Forgetting in Pre-trained Models with Incremental Low-Rank Updates [11.9] 本研究は,ローランド適応(LoRA)のランクが,事前学習の基礎課題の忘れ方,可塑性およびその後の課題の忘れ方に及ぼす影響について検討する。
また、この方法で微調整された視覚トランスフォーマーは、残余のネットワークでは観測できないような、ある種の文脈的「忘れ」を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:12:45 GMT)
Exploring the Trade-Offs: Quantization Methods, Task Difficulty, and Model Size in Large Language Models From Edge to Giant [11.8] 量子化は、大規模および小規模言語モデルのコスト効率のよいデプロイのための有望なソリューションとして注目を集めている。
1Bから405Bパラメータにまたがる命令調整モデルの総合評価を行い、13のデータセットに対して4つの量子化手法を適用した。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:07:08 GMT)
Unified Stochastic Framework for Neural Network Quantization and Pruning [11.7] 本稿では,パス追従アルゴリズムを用いて量子化とプルーニングを後処理する統合フレームワークを提案する。
提案手法は,経路追従量子化法(SPFQ)に基づいて,プルーニングおよび低ビット量子化方式の適用性を向上させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:15:01 GMT)
Unveiling and Steering Connectome Organization with Interpretable Latent Variables [11.7] 本研究では,ショウジョウバエのコネクトームFlyWireからのサブグラフ抽出と,神経回路の解釈可能な低次元表現を導出するための生成モデルを提案する。
この研究は、脳のアーキテクチャを理解するための新しいツールと、バイオインスパイアされた人工ニューラルネットワークを設計するための潜在的な道筋を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:54:40 GMT)
Collaborative Filtering Meets Spectrum Shift: Connecting User-Item Interaction with Graph-Structured Side Information [11.7] グラフニューラルネットワーク(GNN)は協調フィルタリングにおいてその優位性を実証している。
しかし、グラフ構造化側情報をU-I二部グラフに統合すると、既存のグラフ協調フィルタリング手法は良好な性能を達成できない。
我々はスペクトルシフト補正(SSC)を提案し、スペクトルGNNがシフトスペクトルに適応できるようにシフトとスケーリングの要素を取り入れた。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:37:24 GMT)
Improving endpoint detection in end-to-end streaming ASR for conversational speech [11.6] ASR出力の遅れはエンドポイント(EP)のエラーや遅延につながる可能性がある
不正確なEPが会話中にユーザを遮断し、不完全な書き起こしを返す一方で、EPの遅延によって認識されるレイテンシが増加し、ユーザエクスペリエンスが低下する。
本稿では,EPの誤りに対処してEPを改善する手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:19:59 GMT)
VTBench: Evaluating Visual Tokenizers for Autoregressive Image Generation [11.5] 視覚トークン化器(VT)は連続した画素入力を離散トークンシーケンスにマッピングする。
現在の離散VTは連続的変分オートエンコーダ(VAE)に大きく遅れており、画像再構成の劣化と細部やテキストの保存不良につながる。
既存のベンチマークでは、VTパフォーマンスを分離することなく、エンドツーエンドの世代品質に重点を置いている。
VTBenchは、画像再構成、詳細保存、テキスト保存の3つのコアタスクに対して、VTを体系的に評価する包括的なベンチマークである。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:59:01 GMT)
Exploring Federated Pruning for Large Language Models [11.4] 我々は,LLMのプライバシ保存圧縮のために設計された包括的フェデレートプルーニングフレームワークであるFedPrLLMを紹介する。
FedPrLLMでは、各クライアントはローカルキャリブレーションデータに基づいてプルーニングマスク行列を計算し、グローバルモデルを作成するためにサーバと共有するだけでよい。
我々はFedPrLLMフレームワークの様々な可能性を探るため、様々な比較グループ、プルーニング戦略、重量を拡大する決定など、広範な実験を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:41:54 GMT)
Mitigate Language Priors in Large Vision-Language Models by Cross-Images Contrastive Decoding [11.4] 言語先行は、LVLM(Large Vision-Language Models)における幻覚の主要な原因である
近年の研究では、トレーニング不要なソリューションとして対照的な復号化が検討されているが、これらの手法は通常、元の画像から負の視覚的コンテキストを構成する。
我々は、異なる画像を用いて負の視覚的コンテキストを構築する訓練自由な手法であるクロスイメージコントラストデコーディング(CICD)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:19:15 GMT)
Implicit bias produces neural scaling laws in learning curves, from perceptrons to deep networks [11.4] 我々は、スペクトル複雑性規範のレンズを通して、トレーニングのダイナミクス全体について研究する。
トレーニング中にパフォーマンスがどのように進化するかを規定する2つの新しい動的スケーリング法則を同定する。
我々の発見は、CNN、ResNets、MNIST、CIFAR-10、CIFAR-100で訓練されたVision Transformersで一致している。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:13:36 GMT)
Sobolev Gradient Ascent for Optimal Transport: Barycenter Optimization and Convergence Analysis [11.3] 本稿では,Wasserstein Barycenterに対する制約のない新しい二重定式化を提案する。
正規グリッドでサポートされた入力分布のバリセンタを計算するために,スケーラブルなソボレフ上昇勾配(SGA)アルゴリズムを導出する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:59:24 GMT)
FlightGPT: Towards Generalizable and Interpretable UAV Vision-and-Language Navigation with Vision-Language Models [11.3] 無人航空機 (UAV) ビジョン・アンド・ランゲージ・ナビゲーション (VLN) は、災害対応、物流提供、都市検査などの用途に欠かせない。
本研究では,VLM(Vision-Language Models)上に構築された,強力なマルチモーダル認識機能を備えたUAV VLNフレームワークであるFlightGPTを提案する。
その結果、FlightGPTはすべてのシナリオで最先端のパフォーマンスを実現しており、未確認環境において最強のベースラインよりも9.22%高い成功率を示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:21:20 GMT)
RATE: Causal Explainability of Reward Models with Imperfect Counterfactuals [11.1] 属性に対する報酬モデルの感度を測定する有効な方法として,リライトに基づく属性処理推定器(RATE)を開発した。
RATEはLSMを使って応答を書き直し、因果効果を測定するのに使える不完全な反ファクトの例を生成する。
提案手法の有効性を確立し,有効推定器であることを実証的に示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:33:49 GMT)
Provably Near-Optimal Federated Ensemble Distillation with Negligible Overhead [11.1] フェデレートされたアンサンブル蒸留は、クライアント予測に基づいて、未ラベルのサーバデータセットの擬似ラベルを生成することによって、クライアントの不均一性に対処する。
本稿では,サーバ分散ジェネレータとローカルデータセットで学習したクライアント識別器を活用する,実証可能な近似重み付け手法を提案する。
様々な画像分類タスクに関する実験により,提案手法がベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:10:04 GMT)
Zero-Shot Iterative Formalization and Planning in Partially Observable Environments [11.1] 我々はPDDL表現をゼロショットで形式化し、計画し、成長し、洗練するフレームワークであるPDDLego+を提案する。
PDDLego+は優れた性能を発揮するが,問題複雑性に対する堅牢性も示している。
また、試験が成功した後に得られたドメイン知識が解釈可能であり、将来のタスクに役立ちます。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:58:15 GMT)
Detection and Mitigation of Hallucination in Large Reasoning Models: A Mechanistic Perspective [11.0] 推論の幻覚は論理的に一貫性があるが、事実的に誤った推論トレースである。
これらのエラーは構造化推論に埋め込まれており、検出が難しく、潜在的に有害である可能性がある。
本稿では,ロジット間のばらつきを測定することによって推論の深さを定量化するReasoning Scoreを提案する。
また,ステップレベルの深い推論報酬をポテンシャルベース形状に組み込んだ強化強化学習アルゴリズムGRPO-Rを導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:16:40 GMT)
Feedback-Driven Vision-Language Alignment with Minimal Human Supervision [11.0] SVP(Sampling-based Visual Projection)は,手作業によるテキストイメージペアや嗜好アノテーションに頼ることなく,視覚言語アライメントを向上させる新しいフレームワークである。
我々は6つの重要な領域(キャプション、参照、視覚的質問応答、マルチタスク、幻覚制御、オブジェクトリコール)にまたがるアプローチを評価した。
その結果, キャプションタスクの平均改善率は14%, オブジェクトリコールの最大12%, 幻覚の減少など, 大幅な改善が見られた。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:15:00 GMT)
Unpacking Positional Encoding in Transformers: A Spectral Analysis of Content-Position Coupling [10.9] ポジショナルエンコーディング(PE)は、トランスフォーマーがシーケンシャルな構造をモデル化できるようにするために不可欠である。
本稿では,Toeplitzと関連する行列のスペクトル特性からPEを解析する統一フレームワークを提案する。
我々は, PE設計の鍵となる原理として, 相対配置Toeplitz信号を用いた明示的コンテンツ相対混合を確立する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:11:13 GMT)
What if Deception Cannot be Detected? A Cross-Linguistic Study on the Limits of Deception Detection from Text [10.9] 著者の主張と真実の信念の相違として, 虚偽を定め, 信念に基づく虚偽の枠組みを導入する。
我々は3つのコーパスを構築し、総称してDeFaBelとよばれる。
これらのコーパスを用いて、一般的に報告されている偽装の言語的手がかりを評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:12:05 GMT)
SayCoNav: Utilizing Large Language Models for Adaptive Collaboration in Decentralized Multi-Robot Navigation [10.9] ロボットチーム間での協調戦略を自動生成するために,大規模言語モデル(LLM)を活用する新しいアプローチであるSayCoNavを提案する。
我々は,SyCoNav on Multi-Object Navigation (MultiON) タスクを評価する。これはロボットのチームが,未知の環境で複数の異なる物体を効率的に探索するために,相補的な強みを利用する必要がある。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:58:06 GMT)
Interpreting token compositionality in LLMs: A robustness analysis [10.8] Constituent-Aware Pooling (CAP)は、大規模言語モデルが言語構造をどのように処理するかを分析するために設計された方法論である。
CAPは様々なモデルレベルで構成型プールを通してモデル活性化に介入する。
本研究は,合成セマンティクス処理とモデル解釈可能性に関する,現在のトランスフォーマーアーキテクチャの基本的制約を明らかにする。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:29:45 GMT)
One-Step Offline Distillation of Diffusion-based Models via Koopman Modeling [10.8] 我々は、クープマン理論に基づく新しいオフライン蒸留手法であるクープマン蒸留モデルKDMを紹介する。
KDMは、学習された線形作用素がそれらを前方に伝播する埋め込み空間にノイズのある入力を符号化し、続いてクリーンなサンプルを再構成するデコーダを符号化する。
KDMは、標準的なオフライン蒸留ベンチマークで最先端のパフォーマンスを達成し、単一の生成ステップでFIDスコアを最大40%改善する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:59:47 GMT)
MSVIT: Improving Spiking Vision Transformer Using Multi-scale Attention Fusion [10.7] 本稿では,マルチスケール・スパイキング・アテンション(MSSA)を用いた新しいスパイク駆動トランスフォーマーアーキテクチャMSVITを提案する。
実験の結果,MSVITは既存のSNNモデルよりも優れており,SNN変換器アーキテクチャの最先端ソリューションとして位置づけられている。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:01:03 GMT)
Advancing Multi-Party Dialogue Framework with Speaker-ware Contrastive Learning [10.7] コントラスト学習に基づく多人数対話応答生成フレームワークを提案する。
CMRは2段階の自己教師型コントラスト学習フレームワークを採用している。
実験の結果、CMRは最先端のモデルよりも優れているだけでなく、大きな事前訓練された言語モデルにも優れていることが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:25:42 GMT)
Incentivizing Truthful Language Models via Peer Elicitation Games [10.5] 大きな言語モデル(LLM)は強力な生成能力を示しているが、矛盾や幻覚の傾向が強い。
我々は,異なるベースモデルからインスタンス化されたジェネレータと複数の識別器を含むピア・エリケーション機構を通じて,LPMを整列させる学習自由ゲーム理論フレームワークであるPeer Elicitation Games (PEG)を紹介した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:16:58 GMT)
Accelerate TarFlow Sampling with GS-Jacobi Iteration [10.4] 本稿では,一連の最適化手法により,Gauss-Seidel-Jacobi (GS-Jacobi) 反復法を用いて,TarFlowサンプリングを大幅に高速化できることを示す。
4つのTarFlowモデル実験により、GS-Jacobiサンプリングは、生成した画像の品質を維持しながらサンプリング効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:35:44 GMT)
AD-AGENT: A Multi-agent Framework for End-to-end Anomaly Detection [10.4] 不正検出、ネットワーク監視、科学研究などの分野で不可欠な異常検出。
本稿では,自然言語命令を完全実行可能なADパイプラインに変換するフレームワークであるAD-AGENTを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:14:57 GMT)
Premise-Augmented Reasoning Chains Improve Error Identification in Math reasoning with LLMs [10.4] 大型言語モデル(LLM)の数学的推論を促進させるチェーン・オブ・ソート(CoT)
本稿では,各ステップの前提を識別し,推論の評価を改善するためのフレームワークを提案する。
本研究は,複雑な問題解決課題に対処する前提中心表現の有用性を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:57:11 GMT)
From Languages to Geographies: Towards Evaluating Cultural Bias in Hate Speech Datasets [10.3] ヘイトスピーチデータセットは伝統的に言語によって開発されてきた。
HSデータセットにおける文化バイアスを,言語と地理の2つの関係する文化的プロキシを利用して評価する。
英語、アラビア語、スペイン語のHSデータセットは、地理的に文化的に強い偏見を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:13:59 GMT)
SVAFD: A Secure and Verifiable Co-Aggregation Protocol for Federated Distillation [10.2] フェデレート蒸留(FD)用に設計された最初のプロトコルであるSVAFDを提案する。
クライアントとサーバの責務を再定義する。
SVAFDはストラグラーやクライアントの衝突に耐性があり、現実世界のアプリケーションにおける動的ネットワークに適している。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:30:27 GMT)
Learning to Adapt to Position Bias in Vision Transformer Classifiers [10.2] 我々は,視覚変換器の画像分類器の性能において,位置バイアスが重要な役割を担っていることを示す。
異なるデータセットに様々なレベルの位置偏差を示し、最適な位置埋め込みの選択は、データセットに明らかな位置偏差に依存する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:07:36 GMT)
Inverse nonlinear fast Fourier transform on SU(2) with applications to quantum signal processing [10.2] 逆NLFTを$mathrmSU(2)$で検討し、初めて層切り抜きアルゴリズムの数値安定性を確立した。
我々は、逆非線形高速フーリエ変換と呼ばれる高速で数値的に安定なアルゴリズムを開発し、ニア線形複雑度で逆NLFTを実行する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:57:04 GMT)
Lightweight and Effective Preference Construction in PIBT for Large-Scale Multi-Agent Pathfinding [10.2] 本稿では,PIBTにおけるタイブレーキングの簡易かつ効果的な2つの手法について検討する。
最初のテクニックでは、エージェントが他のエージェントをインテリジェントにドッジし、各アクションが次のステップの進行を妨げるかどうかを考慮に入れます。
第2のテクニックは、複数のPIBT実行を通じて、アクションが他人に後悔を引き起こす方法を学び、この情報を使って、後悔を最小化することである。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:12:29 GMT)
Quantum Knowledge Distillation for Large Language Models [10.0] 大規模言語モデル(LLM)は、自然言語処理の進歩に不可欠である。
量子コンピューティングは、重畳や絡み合いのような量子特性を持つ複雑な問題を効率的に解くために認識されている。
本稿では,LLMに対する量子知識蒸留アルゴリズム(QD-LLM)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:56:24 GMT)
RGB-to-Polarization Estimation: A New Task and Benchmark Study [10.0] RGB画像から直接偏光情報を推定することを目的としたRGB偏光画像推定という新しいタスクを導入する。
我々は、既存の偏極データセットを活用し、最先端のディープラーニングモデルの多様なセットを評価することで、このタスクのための最初の包括的なベンチマークを確立する。
このベンチマークは、標準RGB入力からの偏極推定のための将来の手法の設計と評価を容易にするための基礎的なリソースとして機能することを目的としている。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:38:44 GMT)
Random Forest Autoencoders for Guided Representation Learning [10.0] RF-AEは、非教師なし可視化のためのカーネルベースのフレームワークである。
これは、ニューラルエンコーダの柔軟性と、ランダム森林の監督された強度と、キャプチャーされたRF-PHATEデータによる幾何学とを組み合わせる。
RF-AEはカーネルパラメータの選択に頑健であり、任意の超基底次元還元法に一般化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:24:07 GMT)
AdS-GNN -- a Conformally Equivariant Graph Neural Network [10.0] 一般の共形変換の下で同変のニューラルネットワークを構築する。
コンピュータビジョンと統計物理学のタスクのモデルを検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:08:52 GMT)
Towards Effective Federated Graph Foundation Model via Mitigating Knowledge Entanglement [9.9] グラフ基礎モデル(GFM)は強力なドメイン一般化を提供するが、通常は単一のマシンで訓練される。
我々は,新しい分散GFMトレーニングパラダイムであるFedGFMを提案する。
主な課題は知識の絡み合いであり、多分野の知識は区別できない表現に融合する。
2つのコアモジュールを持つ拡張フレームワークであるFedGFM+を,知識の絡み合いを軽減するために提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:06:32 GMT)
Accelerating Simulation of Quantum Circuits under Noise via Computational Reuse [9.9] ツリーベース量子回路シミュレーション(TQSim)というノイズシミュレーション手法
TQSimはノイズシミュレーション中の中間結果を再利用し、計算量を削減する。
ノイズの多いQulacsベースのベースラインシミュレータと比較して、TQSimはノイズの多いシミュレーションのために最大3.89倍のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:08:45 GMT)
Accelerated Markov Chain Monte Carlo Algorithms on Discrete States [9.8] 我々はNesterovの高速化勾配法に基づく離散状態サンプリングアルゴリズムのクラスを提案する。
ポテンシャルとモビリティの一般的な選択によるアルゴリズムの拡張についても論じる。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:29:49 GMT)
QuESat: Satellite-Assisted Quantum Internet for Global-Scale Entanglement Distribution [9.8] 遠距離での絡み合い分布は多くの量子応用において重要である。
本稿では,地球規模の絡み合い分布を実現するために,新しいハイブリッドな地上衛星量子ネットワークアーキテクチャ(QuESat)について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:29:40 GMT)
Joint Depth and Reflectivity Estimation using Single-Photon LiDAR [9.8] 高精度3Dビジョンタスクの先駆技術として,シングルフォト光検出・照準技術 (SP-LiDAR) が登場している。
タイムスタンプは、パルス走行時間(深度)と、物体によって反射される光子の数(反射率)の2つの相補的な情報を符号化する
論文参考訳(メタデータ) (Mon, 19 May 2025 15:33:28 GMT)
Learning Provably Improves the Convergence of Gradient Descent [9.8] 我々は L2O が自身の収束ハイライトに対する理論的裏付けを欠いていることを示す。
我々はL2Oモデルの収束を証明して、そのギャップを経験的に橋渡しする。
そこで我々は,勾配爆発を緩和し,理論結果の支持と拡張最適化を促進する戦略を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:44:04 GMT)
A Learn-to-Optimize Approach for Coordinate-Wise Step Sizes for Quasi-Newton Methods [9.8] LSTMネットワークを用いて最適なステップサイズを学習するL2O(Learning-to-Optimize)手法を提案する。
提案手法はスカラーステップサイズ法や過勾配降下法よりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:29:00 GMT)
Sense and Sensitivity: Examining the Influence of Semantic Recall on Long Context Code Reasoning [9.7] 本稿では,大規模リポジトリ内のコードスニペットに対するLLM(Large Language Models)推論能力について検討する。
我々は語彙的コードリコール (verbatim search) と意味的コードリコール (remembering the code does) を区別する。
我々は,コードスニペットが入力コンテキストの中央に近づくと,コード推論の精度が大幅に低下することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:56:31 GMT)
Doubling Qubits in a Trapped-Ion System via Vibrational Dual-Rail Encoding [9.6] 1つのフォノンを共有する2つの振動モードで2本のレール量子ビットを符号化するデュアルレール符号化方式を提案する。
デュアルレールキュービット系を論理的内部キュービット-デュアルレールキュービットハイブリッド系に拡張する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:18:34 GMT)
Generalized toric codes on twisted tori for quantum error correction [9.6] 北エフトーリック符号は、フォールトトレラント量子計算における誤り訂正の先駆的候補の1つとして広く考えられている。
格子手術や穿刺導入などの論理的次元を増大させる直接的な手法は、しばしば禁止的なオーバーヘッドを生じさせる。
2次元のトポロジカルCSSコードを効率的に解析するためのリング理論的手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:50:10 GMT)
Tricritical Kibble-Zurek Scaling in Rydberg Atom Ladders [9.6] 我々は、Rydberg atom laddersを具体化として、三臨界相転移点周辺のKZスケーリングについて検討した。
乱相から秩序相へ三臨界点をゆっくりと横切るとき、普遍的なパワー・ロー・スケーリングが得られる。
中間速度の傾斜の過程を探索し、有名なザモロドチコフのc-理論の動的類似点を求める。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:17:05 GMT)
PPTNet: A Hybrid Periodic Pattern-Transformer Architecture for Traffic Flow Prediction and Congestion Identification [9.5] 本稿では,交通流予測のための周期パターン変換ネットワーク(PPTNet)を提案する。
高精度のトラフィックフローデータセットはドローンの航空画像データに基づいて構築される。
Transformer Decoderは時間的依存関係を動的にモデル化し、トラフィック密度と速度の正確な予測を可能にする。
予測結果を用いて,混雑確率をリアルタイムで算出する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:36:12 GMT)
Robust Multimodal Segmentation with Representation Regularization and Hybrid Prototype Distillation [9.4] マルチモーダルロバスト性を高めるために,ロバストセグと呼ばれる2段階のフレームワークを提案する。
最初の段階では、RobustSegは完全なモダリティを使ってマルチモーダルの教師モデルを事前訓練する。
第2段階では,HPDM と RRM を用いて教師から学びながら,学生モデルをランダムなモダリティ・ドロップアウトで訓練する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:46:03 GMT)
A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [9.3] 我々は、ターゲットモデル自体の内部の階層的不整合を利用して、軽量なプラグイン検出フレームワークを導入する。
本手法は, 計算オーバーヘッドを無視し, 正確さを損なうことなく, 最先端検出性能を実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:48:53 GMT)
Brittle Minds, Fixable Activations: Understanding Belief Representations in Language Models [9.3] 言語モデル(LM)を評価するための心の理論(ToM)タスクへの関心が高まりつつあるが、LMが自己や他者の精神状態を内部的にどのように表現しているかについては、ほとんど分かっていない。
本研究は、異なるスケールのモデル、トレーニングレギュラー、プロンプトを探索することで、LMにおける信念表現を初めて体系的に研究するものである。
我々の実験は、モデルサイズと微調整の両方が、他者の信念に対するLMの内部表現を大幅に改善する証拠を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:43:13 GMT)
DPZV: Elevating the Tradeoff between Privacy and Utility in Zeroth-Order Vertical Federated Learning [9.3] 本稿では,VFL(Vertical Federated Learning)の最初のZO最適化フレームワークであるDPZVを提案する。
我々は,DPZVが1次最適化手法の収束率と一致し,形式的な(epsilon, delta$)-DP保証を満たすことを示す包括的な理論的解析を行う。
画像および言語ベンチマークの実験では、DPZVは幅広いプライバシー制約の下での精度において、いくつかのベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:40:29 GMT)
Sample Complexity Bounds for Scalar Parameter Estimation Under Quantum Differential Privacy [9.2] 本稿では, 所定の精度を達成するために必要な試料の最小値について, 上下境界について述べる。
ベストケース(最適)シナリオは、すべての微分プライベートチャネルにおけるサンプルの複雑さを最小化することで考慮される。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:29:31 GMT)
DeepMpMRI: Tensor-decomposition Regularized Learning for Fast and High-Fidelity Multi-Parametric Microstructural MR Imaging [9.2] 本稿では,複数のモデルから高速かつ高忠実な多重構造パラメータ推定を行うための効率的なフレームワークであるDeepMpMRIを提案する。
DeepMpMRIは、マイクロ構造パラメータ間の高次元相関を利用して、詳細を効果的に捉えるために、新しく設計されたテンソル分解ベースの正規化器を備えている。
HCPデータセットとアルツハイマー病データセットによる実験結果から,5つの最先端手法に対するアプローチの優位性が確認された。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:35:55 GMT)
FaMTEB: Massive Text Embedding Benchmark in Persian Language [9.2] 本稿では,Massive Text Embedding Benchmark (MTEB)上に構築されたペルシア語(Farsi)テキスト埋め込みの総合ベンチマークを提案する。
私たちのベンチマークには、7つの異なるタスクにまたがる63のデータセットが含まれています。
ペルシャ語および多言語埋め込みモデルの性能を様々なタスクで評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:58:50 GMT)
Superhuman performance of a large language model on the reasoning tasks of a physician [9.2] 数百人の医師のベースラインに対する難治性臨床症例に対する大規模言語モデル(LLM)の医師評価の結果を報告する。
本研究は, 鑑別診断生成, 診断推論の表示, トリアージ差分診断, 確率的推論, 管理推論の5つの実験を行った。
次に, ボストンにある第3次学術医療センターの救急室で無作為に選択された患者を対象に, 人間の専門家とAIの第2の意見を比較検討した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:26:07 GMT)
Calm-Whisper: Reduce Whisper Hallucination On Non-Speech By Calming Crazy Heads Down [9.1] 本稿では,非音声セグメントにおけるWhisperの幻覚を軽減する手法を提案する。
本稿では,Whisper-large-v3デコーダにおける各自己注意頭部の幻覚への寄与を,頭部マスクを用いて評価する。
我々の最高の微調整モデルであるCalm-Whisperは、0.1% WER未満の非音声幻覚の80%以上を減少させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:04:52 GMT)
Auditing Meta-Cognitive Hallucinations in Reasoning Large Language Models [9.0] 本研究では,制約付き知識領域における幻覚の因果関係について,チェーン・オブ・ソート(Chain-of-Thought)の軌跡を監査することによって検討する。
我々の分析によると、長いCoT設定では、RLLMは欠陥のある反射的推論を通じてバイアスやエラーを反復的に補強することができる。
驚いたことに、幻覚の根源にある直接的な介入でさえ、その効果を覆すことができないことが多い。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:11:09 GMT)
Unsupervised anomaly detection in MeV ultrafast electron diffraction [8.9] 本研究では,MUEDにおける異常画像検出のための教師なし異常検出手法の構築に焦点をあてる。
検出器のトレーニングに使用されるデータは手動でラベル付けする必要がないので、教師なしのテクニックが私たちの目的にとって最善の選択だと考えています。
このマシンはデータセットの異常を自身で検出することを目的としており、退屈で時間を要する初期画像検査のユーザを解放する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:05:24 GMT)
Massive-STEPS: Massive Semantic Trajectories for Understanding POI Check-ins -- Dataset and Benchmarks [8.8] 重み付きSTEPS(POIチェックイン理解のための主観的意味軌道)を提示する。
Massive-STEPSは、Semantic Trailsデータセット上に構築された、大規模で一般公開されたベンチマークデータセットである。
大規模STEPSは地理的に多様な12の都市にまたがっており、以前のデータセットよりも最新の、文化的に多様なモデルが特徴である。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:17:11 GMT)
ViPlan: A Benchmark for Visual Planning with Symbolic Predicates and Vision-Language Models [8.7] シンボル述語と視覚言語モデル(VLM)を用いたビジュアルプランニングのための最初のオープンソースベンチマークであるViPlanを紹介する。
我々は,複数のサイズのオープンソースVLMファミリを,選択されたクローズドモデルとともにベンチマークし,VLMを基盤としたシンボルプランニングと,モデルを直接使用してアクションを提案する。
正確な画像のグラウンド化が不可欠であるBlocksworldでは、直接VLM計画よりも優れているという象徴的な計画があるが、家庭用ロボティクスのタスクではその逆が当てはまる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:38:15 GMT)
HR-VILAGE-3K3M: A Human Respiratory Viral Immunization Longitudinal Gene Expression Dataset for Systems Immunity [8.6] ヒト呼吸性ウイルス免疫LongitudinAl遺伝子の発現(HR-VilAGE-3K3M)リポジトリは、256万以上の細胞を含む66の被験者3,178名から14,136名のRNA-seqプロファイルを統合している。
HR-VilAGE-3K3Mは、ヒトの呼吸器ウイルス免疫にとって最大の経時的転写産物である。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:37:49 GMT)
Hadamard Representations: Augmenting Hyperbolic Tangents in RL [8.6] 活性化関数は、ディープニューラルネットワークの重要なコンポーネントの1つである。
強化学習では、連続的な微分可能なアクティベーションの性能は、分数次線形関数と比較して低下することが多い。
RLの致死性ニューロン問題はReLUに限った問題ではなく、Tanhのような連続的な分化可能なアクティベーションの場合にさらに問題を引き起こすことが示される。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:12:54 GMT)
MA-COIR: Leveraging Semantic Search Index and Generative Models for Ontology-Driven Biomedical Concept Recognition [8.6] 我々は,概念認識を索引付け認識タスクとして再構成するフレームワークであるMA-COIRを紹介する。
セマンティック検索インデックス(ssID)を概念に割り当てることで、MA-COIRはオントロジーエントリの曖昧さを解消し、認識効率を高める。
本研究は,MA-COIRが言及レベルのアノテーションを必要とせず,明示的概念と暗黙的概念の両方を認識する上での有効性を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:00:43 GMT)
M3G: Multi-Granular Gesture Generator for Audio-Driven Full-Body Human Motion Synthesis [8.5] 本稿では,M3G(Multi-Granular Gesture Generator)という新しいフレームワークを提案する。
M3Gでは、動作パターンをトークン化し、異なる時間性から動作シーケンスを再構築する、新しいマルチグラニュラーVQ-VAEを提案する。
提案するM3Gフレームワークは、自然かつ表現力のあるフルボディのジェスチャーを生成するという点で最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:01:45 GMT)
SurveillanceVQA-589K: A Benchmark for Comprehensive Surveillance Video-Language Understanding with Large Models [8.4] SurveillanceVQA-589Kは、監視領域に合わせた最大規模のビデオ質問応答ベンチマークである。
データセットは、認知的に多様な質問タイプにまたがる589,380のQAペアで構成されている。
我々のベンチマークは、安全クリティカルなアプリケーションにおけるビデオ言語理解を促進するための実用的で包括的なリソースを提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:57:04 GMT)
Conditional Front-door Adjustment for Heterogeneous Treatment Assignment Effect Estimation Under Non-adherence [8.4] 不均一な治療課題効果の推定は、治療決定を通知することができる。
標準バックドア調整(SBD)と条件付きフロントドア調整(CFD)は、偏りのない見積もりを回復することができる。
LobsterNetは、ニュアンスパラメータのジョイントモデリングを備えたCFDを実装するマルチタスクニューラルネットワークである。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:19:03 GMT)
AGI-Elo: How Far Are We From Mastering A Task? [8.4] 本稿では、個別のテストケースの難易度と、視覚、言語、行動領域を越えたAIモデル(または人間)の能力を共同でモデル化する統合評価システムを提案する。
我々は、複数のAGIドメインにまたがる複数の確立されたデータセットとモデルに関する広範な実験を通じて、システムの一般化性と堅牢性を検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:30:13 GMT)
Synthesize-on-Graph: Knowledgeable Synthetic Data Generation for Continue Pre-training of Large Language Models [8.3] 本稿では,コーパスを効率的に拡張するためのクロスドキュメント知識結合を組み込んだ合成データ生成フレームワークであるSynthetic-on-Graph(SoG)を提案する。
SoGは、元のコーパスから実体と概念を抽出し、文書間の関連性を表すコンテキストグラフを構築する。
合成データの品質をさらに向上するため,我々は,CoT(Chain-of-Thought)とCC(Contrastive Clarification)を統合し,推論プロセスと識別力を増強した。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:26:31 GMT)
Shielding Latent Face Representations From Privacy Attacks [8.3] 埋め込みのための多層保護フレームワークを提案する。
a) 完全同型暗号化(FHE)を用いた埋め込み、(b) 可逆な特徴多様体ハッシュを用いてそれらをハッシュする。
従来の暗号化方法とは異なり、FHEは暗号化データ上で直接計算を可能にし、強力なプライバシー保証を維持しながら、ダウンストリーム分析を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:23:16 GMT)
Assessing GPT Performance in a Proof-Based University-Level Course Under Blind Grading [8.2] 本研究は,GPT-4oとo1-previewの性能を現実的な教育条件下で評価する。
その結果, GPT-4oは通過しきい値に達するのに失敗し, o1-previewは著しく改善した。
これらの知見は、教育におけるロバストアセスメント戦略とAI対応のグレーティングポリシーの必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:05:48 GMT)
Self-Supervised Learning for Image Segmentation: A Comprehensive Survey [8.1] 自己教師付き学習(SSL)は、いくつかの実用的な下流コンピュータビジョン問題を解決するための強力な機械学習(ML)パラダイムとなっている。
この調査は、最近の150以上のイメージセグメンテーション記事、特にSSLについて徹底的に調査している。
これは、プリテキストタスク、ダウンストリームタスク、イメージセグメンテーション研究によく使われるベンチマークデータセットの実用的な分類を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:47:32 GMT)
Can MLLMs Generalize to Multi-Party dialog? Exploring Multilingual Response Generation in Complex Scenarios [8.1] マルチパーティポッドキャスト対話をベースとした,高品質な並列多言語データセットであるXMPを紹介する。
データセットのほとんどのサンプルには3つ以上の参加者が参加し、幅広いトピックについて議論している。
R1:MLLMはマルチパーティ設定への一般化に失敗し、XMPのR2ファインチューニングはわずかに改善され、70Bモデルは8Bよりも1%の絶対的なゲインを達成した。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:25:44 GMT)
Resource Allocation for RIS-Assisted CoMP-NOMA Networks using Reinforcement Learning [8.1] この論文は、STAR-RIS、CoMP、NOMAの3つの変換技術の相乗的統合を探求する。
この研究は、データレートの増大、スペクトル効率の向上、進化途上の6G開発環境のカバー範囲の拡大などにより、これらの技術が将来の無線ネットワークに革命をもたらす可能性を調査する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:28:43 GMT)
Pipelining Kruskal's: A Neuromorphic Approach for Minimum Spanning Tree [8.1] 我々は,SNNに基づくユニオンソートルーチンと,KruskalのMSTアルゴリズムのパイプラインバージョンを提案する。
提案手法は,大規模グラフ上での最先端プリム法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:05:14 GMT)
OmniFC: Rethinking Federated Clustering via Lossless and Secure Distance Reconstruction [8.1] フェデレーションクラスタリングは、生データを共有せずに、分散クライアント全体にわたるグローバルクラスタ構造を見つけることを目的としている。
1)コラボレーション中のプライバシー漏洩と,(2)プロキシ情報の集約による堅牢性低下の2つが重要な課題である。
我々は,統一的でモデルに依存しないフレームワークであるOmni Federated Clusteringを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:04:59 GMT)
A Study on the Refining Handwritten Font by Mixing Font Styles [8.0] FontFusionGAN (FFGAN) は手書きフォントを印刷フォントと組み合わせて改良する新しい手法である。
本手法は,手書きフォントと印刷フォントの望ましい特徴を混合したフォントを生成するために,GAN(Generative Adversarial Network)を実装している。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:20:43 GMT)
AMAQA: A Metadata-based QA Dataset for RAG Systems [7.9] AMAQAは、テキストとメタデータを組み合わせたタスクを評価するために設計された、新しいオープンアクセスQAデータセットである。
AMAQAには26の公開Telegramグループから集められた約1100万の英語メッセージが含まれている。
メタデータを活用することで精度が0.12から0.61に向上し、構造化コンテキストの価値が強調される。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:59:08 GMT)
RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers [7.8] RoPECraft(ロピークラフト)は、拡散変圧器のトレーニング不要な動画移動方式である。
まず、参照ビデオから高密度光フローを抽出し、その結果の運動オフセットを用いて、RoPEの複素指数テンソルをワープする。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:50:26 GMT)
Touch2Shape: Touch-Conditioned 3D Diffusion for Shape Exploration and Reconstruction [7.8] 現在の3次元拡散モデルは、画像や部分的な観察からターゲット形状を再構築することに焦点を当てている。
タッチ条件付き拡散モデルを用いてタッチから対象形状を探索・再構成するTouch2Shapeモデルを提案する。
形状再構成のために,コンパクトな表現を生成する上で,拡散モデルを条件付けるタッチ埋め込みモジュールを開発した。
形状探索では,拡散モデルと強化学習を組み合わせて政策の訓練を行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:24:21 GMT)
Traceable Black-box Watermarks for Federated Learning [7.8] この研究は、追跡可能なブラックボックスの透かしをフェデレートラーニングシステムに注入する問題を定式化する。
本稿では,サーバ側の新しい透かし方式である$mathbfTraMark$を提案し,各クライアントに対してトレース可能な透かしモデルを作成する。
その結果、$mathbfTraMark$は、主要なタスクパフォーマンスを維持しながら、すべてのウォーターマークされたモデルのトレーサビリティを保証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:49:31 GMT)
Composing Dextrous Grasping and In-hand Manipulation via Scoring with a Reinforcement Learning Critic [7.8] ロボット工学において、手作業の操作と把握は基本的なものであるが、しばしば別々に対処される。
本稿では,このギャップを埋めるために,手作業で訓練した強化学習エージェントの批判ネットワークを活用する方法を提案する。
実験の結果,本手法は追加訓練を必要とせず,手指操作の成功率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:36:34 GMT)
What is Stigma Attributed to? A Theory-Grounded, Expert-Annotated Interview Corpus for Demystifying Mental-Health Stigma [7.7] メンタルヘルスのスティグマは、治療の探究と回復を阻害する広範な社会問題のままである。
本稿では,人間-チャットボットインタビューの専門的,理論的インフォームドコーパスについて述べる。
我々の実験は最先端のニューラルネットワークをベンチマークし、スティグマ検出の課題を実証的に解き放った。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:31:42 GMT)
Understanding and Detecting Peer Dependency Resolving Loop in npm Ecosystem [7.7] npmは特別なタイプの依存性、Peer Dependencyをサポートし、インストールと使用は通常の依存関係とは異なる。
ピア依存関係間の衝突は、npmクライアントを無限ループにトラップし、リソースの枯渇とシステムクラッシュにつながる。
本稿は, npm 生態系における PeerSpin の理解と検出を行うための, 詳細な研究である。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:47:45 GMT)
Unified Cross-modal Translation of Score Images, Symbolic Music, and Performance Audio [7.5] 我々は、多くの翻訳タスクで汎用モデルを同時に訓練する。
本稿では,新しい大規模データセットと各モダリティのトークン化を提案する。
提案手法は,最初の楽譜条件付き音声生成を実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:46:45 GMT)
Randomness Helps Rigor: A Probabilistic Learning Rate Scheduler Bridging Theory and Deep Learning Practice [7.5] 確率論的学習率スケジューラ(PLRS)を提案する。
PLRSは単調に減少する条件に適合せず、証明可能な収束を保証する。
PLRSは,既存の最先端学習率スケジューラと精度の両面で同等以上の性能を示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:25:39 GMT)
Cross-Lingual Consistency of Factual Knowledge in Multilingual Language Models [7.5] 本研究では,多言語PLMにおける事実知識の言語間整合性(CLC)について検討する。
本稿では,言語間の知識一貫性を精度から独立して評価するために,ランク付けに基づく一貫性尺度(RankC)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:05:56 GMT)
Retrieve, Merge, Predict: Augmenting Tables with Data Lakes [7.4] 本稿では,機械学習タスクの自動テーブル拡張について,詳細な分析を行う。
結合可能なテーブルを検索し、情報をマージし、結果のテーブルと予測する。
私たちは2つのデータレイクを使用します。Open Data US、よく参照された実データレイク、新しい半合成データセットYADL(Yet Another Data Lake)です。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:51:55 GMT)
Planar quantum low-density parity-check codes with open boundaries [7.4] オープンバウンダリを持つ高速平面量子低密度パリティチェック(qLDPC)符号を構築する。
これらの符号は、表面符号よりも桁違いに大きい効率測定値を得る。
Sierpinski三角形の形でフラクタル論理演算子を観測し、符号距離は、破断されたフラクタルの面積に比例する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:38:26 GMT)
FRAbench and GenEval: Scaling Fine-Grained Aspect Evaluation across Tasks, Modalities [7.4] 既存の"LLM-as-a-Judge"評価器は、通常、いくつかのタスク、アスペクト、モダリティにおいて狭い。
我々は、明示的できめ細かいアスペクト仕様が、自動評価における一般化可能性と客観性の両方の鍵であると主張している。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:29:26 GMT)
Learning Cross-Spectral Point Features with Task-Oriented Training [7.4] この研究は、既存のカメラベースのナビゲーションシステムに熱画像を統合する手段として、学習されたクロススペクトル(熱可視)点の特徴を探求する。
熱可視画像ペア上で機能ネットワークを実行し、ネットワーク応答を異なる登録パイプラインに供給します。
我々の選択したモデルは、マッチングタスクに基づいて訓練され、MultiPointデータセット上の75%以上の推定値に対して、10ピクセル未満の登録誤差を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:09:36 GMT)
Towards a Universal Image Degradation Model via Content-Degradation Disentanglement [7.4] 複素および現実的な劣化の幅広いスペクトルを合成できる最初の普遍的劣化モデルを提案する。
本モデルでは, 等質および不均一な劣化特性を自動抽出・解離する。
本研究では,フィルムグラインシミュレーションとブラインド画像復元作業におけるモデルの精度と適応性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:45:08 GMT)
Picturized and Recited with Dialects: A Multimodal Chinese Representation Framework for Sentiment Analysis of Classical Chinese Poetry [7.4] 古典中国語詩の感情分析のための方言強化型マルチモーダルフレームワークを提案する。
詩から文レベルの音声特徴を抽出し、複数の方言から音声を取り入れる。
我々のフレームワークは2つの公開データセット上で最先端の手法より優れています。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:58:44 GMT)
CATS: Clustering-Aggregated and Time Series for Business Customer Purchase Intention Prediction [7.3] 顧客が次の購入をするかどうかを予測することは、古典的な時系列予測タスクです。
顧客グループは通常、不均衡を示す。つまり、時々買い手や少数の忠実な顧客がいる。
本稿では,顧客購入意図予測にマルチモーダルデータを活用するクラスタリングとアテンションGRUモデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:07:34 GMT)
Sat2Sound: A Unified Framework for Zero-Shot Soundscape Mapping [7.3] 本研究では,地球上の任意の場所における音の分布を予測するためのフレームワークであるSat2Soundを紹介する。
我々のアプローチは、音声、音声キャプション、衛星画像、衛星画像キャプションのコントラスト学習を取り入れている。
本稿では,没入型音響体験を実現する位置ベースサウンドスケープ合成法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:36:04 GMT)
Any-to-Any Learning in Computational Pathology via Triplet Multimodal Pretraining [7.2] ALTERは、WSI、ゲノム学、病理学のレポートを統合した、トリモーダルな事前トレーニングフレームワークである。
WSI中心のアプローチを超えて、堅牢でクロスプラットフォームな表現を学びます。
ALTERは生存予測,癌サブタイプ,遺伝子変異予測,報告生成など,幅広い臨床課題にまたがって評価を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:07:34 GMT)
Joint stochastic localization and applications [7.2] 本稿では,確率分布間の結合を構築するための共同局在化フレームワークを提案する。
また,関節局所化による結合に基づく分布距離の族も導入する。
提案した距離は、独立性のある分布推定の新しい手法を動機付けている。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:47:05 GMT)
Expert-Like Reparameterization of Heterogeneous Pyramid Receptive Fields in Efficient CNNs for Fair Medical Image Classification [7.2] 我々は、不均一ピラミッド受容場(ERoHPRF)のエキスパートライクなReパラメータ化という新しい概念を開発する。
この概念は、よく設計された不均一なピラミッドRFバッグを適用することで、マルチエキスパートコンサルテーションモードを模倣することを目的としている。
本手法は, 医用画像の分類, 公平性, オーバーヘッドの観点から, 最先端手法よりも優れたトレードオフを維持している。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:23:04 GMT)
High Accuracy Pulmonary Vessel Segmentation for Contrast and Non-contrast CT Images and Clinical Evaluation [7.2] 造影CT画像と非造影CT画像から肺血管の自動分画を行うための3次元画像分画アルゴリズムを提案する。
我々は、複数のベンダーや国から427セットの高精度CTデータを用いてモデルを訓練し、NCCTデータに対して0.892, 0.861, 0.924, 0.925, 0.903, 0.949のCl-DICE, Cl-リコールおよびリコール値を得た。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:20:45 GMT)
Neural Functional: Learning Function to Scalar Maps for Neural PDE Surrogates [7.1] 本稿では,スカラーマッピングの関数を学習するPDEサロゲートの新しいアーキテクチャを提案する。
これは初めて、ハミルトニアン力学からニューラルPDEサロゲートへの拡張を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:55:38 GMT)
IPENS:Interactive Unsupervised Framework for Rapid Plant Phenotyping Extraction via NeRF-SAM2 Fusion [7.1] IPENSは、教師なしマルチターゲットポイントクラウド抽出手法である。
粒度セグメンテーション精度(mIoU)は63.72%である。
また、コムギデータセットのセグメンテーション精度を89.68%(mIoU)に改善する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:13:09 GMT)
WriteViT: Handwritten Text Generation with Vision Transformer [7.1] Vision Transformers (ViT) を組み込んだワンショット手書きテキスト合成フレームワーク WriteViT を紹介する。
WriteViTは、低リソースシナリオで強力な認識性能を維持しながら、高品質でスタイル一貫性のある手書き文字を生成する。
これらの結果は、多言語手書き文字生成と効率的なスタイル適応のためのトランスフォーマーベースの設計の約束を浮き彫りにする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:17:53 GMT)
Property Inheritance for Subtensors in Tensor Train Decompositions [7.1] 本稿では,2つの鍵テンソル特性,すなわち非コヒーレンスと条件数の性質継承について理論的に検討する。
また,ファイバーワイドサンプリングによりテンソルトレインのランクが維持されることを示す。
その結果, ファイバワイドサンプリングにより生成したアテンソルに, 興味のある特性を十分に保存できることが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:14:33 GMT)
Degradation-Aware Feature Perturbation for All-in-One Image Restoration [7.1] オールインワン画像復元は、様々な劣化タイプやレベルから鮮明な画像を統一モデルで復元することを目的としている。
DFPIRは、特徴空間を統一されたパラメータ空間に合わせるように調整するために、分解を意識した特徴摂動を導入した。
DFPIRは、画像のデノイング、画像のデハージング、画像のデライニング、モーションのデブロアリング、低照度画像のエンハンスメントを含む複数のオールインワン画像復元タスクにおいて、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:37:11 GMT)
Enhancing Shape Perception and Segmentation Consistency for Industrial Image Inspection [7.0] SPENet(Shape-Aware Efficient Network)を提案する。
SPENetでは、ファジィ境界を記述する新しい手法を導入し、現実のシナリオに適応する。
固定成分のセグメンテーション整合性を測定するために,新しい尺度である Consistency Mean Square Error (CMSE) を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:57:00 GMT)
SeedBench: A Multi-task Benchmark for Evaluating Large Language Models in Seed Science [6.9] 大型言語モデル (LLM) は様々な分野において有望であるが、シード科学への応用は限られている。
SeedBenchは、シードサイエンス用に特別に設計された最初のマルチタスクベンチマークです。
我々は、プロプライエタリ、オープンソース、ドメイン固有の微調整モデルを含む26のLLMを包括的に評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:02:59 GMT)
Krikri: Advancing Open Large Language Models for Greek [6.9] ギリシャ語に適した最先端の大規模言語モデルであるLlama-Krikri-8Bを紹介する。
Llama-Krikri-8Bは、言語的ニュアンスへの優れた適応を保証するために、高品質なギリシャ語のデータを広範囲に訓練してきた。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:18:27 GMT)
(Im)possibility of Collective Intelligence [6.9] この研究は、不均一環境における唯一の有理学習アルゴリズムが経験的リスク最小化(ERM)である直感的かつ合理的な公理の観点から最小限の要件を提供する。
我々の可能性の結果は、あらゆるアルゴリズムが集団知性(CI)を達成するために直面する基本的なトレードオフを裏付けるものです。
最終的には、異種環境における集合学習は本質的に困難である。なぜなら、アウト・オブ・ディストリビューションの一般化、フェデレーション/コラボレーション学習、アルゴリズムフェアネス、マルチモーダル学習といった機械学習の重要な領域において、環境間のモデル予測性能を有意義に比較することは不可能である。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:43:44 GMT)
Minimax Rates of Estimation for Optimal Transport Map between Infinite-Dimensional Spaces [6.9] 無限次元空間上の確率測度間の最適輸送マップの推定について検討し,その極小最大速度を明らかにする。
サンプルから最適輸送マップを推定すると、確率測度と関数データ解析の間のダイナミクスをシミュレートするなど、いくつかの応用が見つかる。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:00:29 GMT)
Robust learning of halfspaces under log-concave marginals [6.9] 線形しきい値関数を学習し、境界体積$O(r+varepsilon)$の分類子を半径摂動$r$で返すアルゴリズムを与える。
dtildeO(1/varepsilon2)$の時間とサンプルの複雑さはブール回帰の複雑さと一致する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:12:16 GMT)
Text2midi-InferAlign: Improving Symbolic Music Generation with Inference-Time Alignment [6.8] 提案するText2midi-InferAlignは,推定時間におけるシンボリック音楽生成を改善する新しい手法である。
提案手法は,テキスト・オーディオ・アライメントと推定中の音楽構造アライメントの報酬を利用して,生成した音楽が入力キャプションと整合するように促す。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:36:06 GMT)
GeoVLM: Improving Automated Vehicle Geolocalisation Using Vision-Language Matching [6.8] クロスビュージオローカライゼーションは、地上レベルの画像とジオタグ付き衛星画像とをデータベースからマッチングすることにより、車両の粗い地理的位置を特定する。
既存のアプローチは高いリコールレートに達するが、それでもトップマッチとして正しいイメージのランク付けに失敗している。
本稿では、視覚言語モデルのゼロショット機能を利用して、クロスビューなジオローカライゼーションを実現する新しいアプローチであるGeoVLMを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:17:06 GMT)
Conformal Prediction: A Theoretical Note and Benchmarking Transductive Node Classification in Graphs [6.8] コンフォーマル予測は、機械学習モデルに関連する不確実性を定量化するために、ますます人気が高まっている。
グラフの不確実性定量化の最近の研究は、共形グラフ予測のためのこのアプローチに基づいている。
文献における設計選択を分析し、既存の手法に関連するトレードオフについて議論する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:32:31 GMT)
Policy Optimization via Adv2: Adversarial Learning on Advantage Functions [6.8] 対人マルコフ決定過程(MDP)における学習の減少を,Q$-値に基づく対人学習に再考する。
本稿では,移行カーネルが不明な現実的なシナリオにおいて,敵対的MDPにおける学習の減少が敵的学習に与える影響について論じる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:04:48 GMT)
A Path to Universal Neural Cellular Automata [6.8] この研究は、連続的なユニバーサルセルオートマトンを開発するための神経細胞オートマトンの可能性を探究する。
本稿では, セルラーオートマトンモデル, 目的関数, トレーニング戦略を導入し, 連続した環境での普遍計算に向けて神経セルオートマトンを誘導する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:46:01 GMT)
Cross-modal feature fusion for robust point cloud registration with ambiguous geometry [6.7] 本稿では,ポイントクラウド登録のためのクロスモーダル特徴融合法を提案する。
2段階の3Dポイントクラウド機能と2Dイメージ機能を統合している。
すべてのベンチマークで最先端の登録性能を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:22:46 GMT)
CURE: Concept Unlearning via Orthogonal Representation Editing in Diffusion Models [6.7] CUREは、事前訓練された拡散モデルの重み空間で直接動作する、トレーニング不要の概念未学習フレームワークである。
スペクトル消去器は、安全な属性を保持しながら、望ましくない概念に特有の特徴を特定し、分離する。
CUREは、対象とする芸術スタイル、オブジェクト、アイデンティティ、明示的なコンテンツに対して、より効率的で徹底的な除去を実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:53:06 GMT)
Q${}^2$Forge: Minting Competency Questions and SPARQL Queries for Question-Answering Over Knowledge Graphs [6.7] SPARQLクエリ言語は知識グラフ(KG)にアクセスする標準的な方法である。
ベストプラクティスは、KGを有能な質問やサンプルクエリで文書化することを推奨する。
Q$2$Forgeは、KGと対応するSPARQLクエリのための新しい能力質問を生成するという課題に対処する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:26:51 GMT)
EPIC: Explanation of Pretrained Image Classification Networks via Prototype [6.6] EPIC(Explanation of Pretrained Image Classification)は、アンテホックとポストホックの説明のギャップを埋める新しいアプローチである。
アンテホックなテクニックにインスパイアされた、直感的でプロトタイプベースの説明を提供する。
プロトタイプベースの説明によく用いられるベンチマークデータセット上でEPICを評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:32:20 GMT)
Superadditivity of Convex Roof Coherence Measures in Multipartite System [6.6] 量子コヒーレンス(英語版)の凸屋根測度について検討し、その超加法的性質に着目した。
我々は,三部構成系および多部構成系におけるコヒーレンス超増感性の枠組みを立案し,十分な条件を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:26:23 GMT)
DynaNoise: Dynamic Probabilistic Noise Injection for Defending Against Membership Inference Attacks [6.6] 会員推論攻撃(MIA)は、トレーニングデータセットのプライバシーに重大なリスクをもたらす。
従来の緩和技術は、トレーニングや推論中に一定量のノイズを注入することに依存している。
問合せ感度に基づいて動的にノイズ注入を変調する適応型アプローチであるDynaNoiseを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:07:00 GMT)
Text2VP: Generative AI for Visual Programming and Parametric Modeling [6.5] 本稿では,GPT-4.1から派生した新しい生成AIであるText2VP (Text-to-Visual Programming) GPTを紹介する。
テストでは、関数パラメトリックモデルを生成するText2VPの機能を示すが、より高い複雑性モデルはエラー率を増大させる。
究極的には、Text2VPはデザイナーがGrasshopperのような特殊なプラットフォームで広範なトレーニングをすることなくパラメトリックモデルを簡単に作成および修正できるようにすることを目的としている。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:05:01 GMT)
Language Models That Walk the Talk: A Framework for Formal Fairness Certificates [6.5] 本研究は,トランスフォーマーに基づく言語モデルの堅牢性を証明するための総合的検証フレームワークを提案する。
我々は、性別に関する用語によって男女の公平さと一貫したアウトプットを確保することに重点を置いている。
我々は、この手法を毒性検出に拡張し、敵に操作された有害な入力が一貫して検出され、適切に検閲されるという正式な保証を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:46:17 GMT)
Optimal Client Sampling in Federated Learning with Client-Level Heterogeneous Differential Privacy [6.5] プライバシー予算に基づいてクライアントをグループに分割し,各グループ内のクライアントレベルのDPを実現し,プライバシー予算の無駄を削減するGDPFedを提案する。
また、GDPFed$+$を導入することで、不要なノイズを排除し、グループごとのクライアントサンプリング比率を最適化します。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:55:34 GMT)
From Words to Collisions: LLM-Guided Evaluation and Adversarial Generation of Safety-Critical Driving Scenarios [6.5] 大規模言語モデル(LLM)と構造化シナリオ解析と迅速なエンジニアリングは、安全クリティカルな運転シナリオを生成するために使用される。
2次元シミュレーションフレームワークと複数の事前学習LDMを用いて,本手法の有効性を検証した。
ドメインインフォームドプロンプト技術を備えたLLMは、安全クリティカルな運転シナリオを効果的に評価し、生成することができると結論付けている。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:23:20 GMT)
Testing Access-Control Configuration Changes for Web Applications [6.4] 本稿では、アクセス制御設定の変更をユーザがテストできるようにすべきである、と提唱する。
本稿では,ACtestと呼ばれるミニテスト環境の生産プログラムとデータとして,このようなテストを作成するための新しいアプローチを提案する。
我々は、Dockerhub上で広く使われているWebアプリケーションの193の公開構成でACtestを評価した。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:50:28 GMT)
Spline Dimensional Decomposition with Interpolation-based Optimal Knot Selection for Stochastic Dynamic Analysis [6.4] 力学系における前方の不確実性定量化は、非滑らかあるいは局所的な非線形挙動のために困難である。
スプライン次元分解(SDD)における最適結び目選択のための計算効率のよい二次的手法を提案する。
提案したSDDは、一様間隔の結び目(12.310%)、ランダム間隔の結び目(15.274%)、ガウス過程(5.319%)と比較すると、最も低い相対差誤差(2.89%)を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:08:39 GMT)
Reformulation for Pretraining Data Augmentation [6.4] 本稿では,MGA(Massive Genre-Audience)の改訂手法を提案する。
スケーリングシナリオにおいて、データ繰り返しとアップサンプリングに対して優れたパフォーマンスを示すことによって、その中核的なメリットを実験的に検証する。
我々の研究は、MGAがトレーニングデータセットを大幅に拡張し、繰り返しボトルネックを効果的に軽減し、大規模言語モデルのより効率的なスケーリングを可能にする、信頼性の高い経路を提供することを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:52:17 GMT)
Multi-Armed Bandits Meet Large Language Models [6.3] BanditアルゴリズムとLarge Language Models (LLM)が人工知能の強力なツールとして登場した。
まず, LLM微調整, プロンプトエンジニアリング, 適応応答生成の最適化において, 帯域幅アルゴリズムが果たす役割について検討する。
次に、LLMが文脈理解の高度化、動的適応、および自然言語推論を用いたポリシー選択の改善を通じて、帯域幅アルゴリズムをどのように拡張するかを検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:57:57 GMT)
Temporal SU(1,1) Interferometer with Broadband Squeezed Light Injection [6.3] 本研究では,時間的フーリエ変換システムに基づく時空間SU(1,1)干渉計について検討し,光を干渉計に注入した。
その結果、干渉計の出力スペクトル特性は、2つの時間レンズの焦点群速度分散(GDD)の比に依存することがわかった。
この新しい時間的SU(1,1)干渉計アーキテクチャは、時間周波数領域および量子情報処理アプリケーションにおける非古典的フィールドを制御するための新しい道を開く。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:03:41 GMT)
Improving LLM Unlearning Robustness via Random Perturbations [6.3] 現状のLLMアンラーニング手法は本質的にモデルのロバスト性を低下させ,一方の非敵対的忘れ書きが保持クエリにある場合でも誤動作を生じさせることを示す。
この脆弱性を軽減するために、未学習モデルの堅牢性を改善するための理論的保証を備えた、プラグアンドプレイ、モデルおよびメソッドに依存しないアプローチであるRandom Noise Augmentation (RNA)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:41:58 GMT)
HeteroSpec: Leveraging Contextual Heterogeneity for Efficient Speculative Decoding [6.2] HeteroSpecは異種適応型投機的復号化フレームワークである。
5つのベンチマークと4つのモデルで評価しました
ドラフトモデルの再トレーニングを必要とせず、オーバーヘッドを最小限に抑え、他のアクセラレーションテクニックも必要です。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:38:40 GMT)
Policy-Driven World Model Adaptation for Robust Offline Model-based Reinforcement Learning [6.2] オフラインモデルベースRL(MBRL)は、静的データセットからワールドモデルを明示的に学習する。
政策とともに世界モデルを動的に適用する枠組みを提案する。
我々は,D4RL MuJoCoタスク12件とTokamak Controlタスク3件のアルゴリズムをベンチマークし,その最先端性能を実証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:14:33 GMT)
Reinforcement Learning: An Overview [6.1] この写本は、(深い)強化学習とシーケンシャルな意思決定の分野を、大きく、最新に概観している。
それは、値ベースの方法、ポリシーベースの方法、モデルベースの方法、マルチエージェントRL、LLMとRL、その他様々なトピックをカバーしている。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:12:39 GMT)
FinePhys: Fine-grained Human Action Generation by Explicitly Incorporating Physical Laws for Effective Skeletal Guidance [6.1] FinePhysは、物理を組み込んだ人間のアクション生成フレームワークで、効果的な骨格指導を得る。
FinePhysはまず、オンラインのやり方で2Dのポーズを推定し、2Dから3Dへのリフトを、コンテキスト内学習で行う。
純粋にデータ駆動型3次元ポーズの不安定性と限定的な解釈性を軽減するため,物理に基づく動き再推定モジュールを導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:58:11 GMT)
Learning by solving differential equations [6.0] ルンゲ・クッタ法(英語版)(RK)は、非常に強力な明示的で暗黙的な高階ODEソルバの族を提供する。
深層学習に適用したRKソルバの性能評価を行い,その限界について検討し,その欠点を克服する方法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:34:32 GMT)
TopoTune : A Framework for Generalized Combinatorial Complex Neural Networks [6.0] 一般化されたCCNNは、任意の(グラフ)ニューラルネットワークをTDLに変換するために使用することができる。
TopoTuneは、前例のない柔軟性と容易さでGCCNを定義し、構築し、訓練するための軽量ソフトウェアである。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:17:45 GMT)
Emergent Specialization: Rare Token Neurons in Language Models [5.9] 大きな言語モデルは、特殊なドメインにおいて重要であるにもかかわらず、希少なトークンの表現と生成に苦労する。
本研究では,レアトークンニューロンと呼ばれる,言語モデルの希少トークン予測に極めて強い影響を与えるニューロン構造を同定する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:05:13 GMT)
Reconstructing Physics-Informed Machine Learning for Traffic Flow Modeling: a Multi-Gradient Descent and Pareto Learning Approach [5.9] 物理インフォームド・機械学習(PIML)は現代の流れモデリングにおいて重要である。
本稿では,多目的最適化問題として,トレーニングプロセスの修正によるPIMLのパラダイムシフトを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:23:24 GMT)
Counting with Confidence: Accurate Pest Monitoring in Water Traps [5.9] 既存の視覚に基づく自動害虫計数研究の一般的な制限は、モデルが基底真理のデータセットに基づいて評価されるが、基底真理の欠如による計測結果の信頼性を評価することなく、現実のシナリオにデプロイされることである。
本稿では, 画像の信頼度を計測する害虫数を, 計測結果と外部環境条件に関する情報に基づいて総合的に評価する手法を提案する。
実験の結果,MSEを31.7%削減し,R2を15.2%改善した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:01:58 GMT)
Hardware-Adaptive and Superlinear-Capacity Memristor-based Associative Memory [5.9] 本稿では,連想記憶のための新しいハードウェア適応学習アルゴリズムであるmemristorハードウェアについて,実験的に紹介する。
提案手法は, 最先端手法と比較して, デバイス故障の50%以下で有効容量を3倍に向上させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:55:09 GMT)
Dual-Balancing for Physics-Informed Neural Networks [5.8] 偏微分方程式(PDE)を解くための新しい学習パラダイムとして、物理情報ニューラルネットワーク(PINN)が登場した。
PINNは、難解な多目的最適化の問題のため、精度が悪く、収束が遅い。
本稿では,バランシングとイントラバランシングを統合し,損失重みを動的に調整する新しいDual-Balanced PINN(DB-PINN)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:32:23 GMT)
RoVo: Robust Voice Protection Against Unauthorized Speech Synthesis with Embedding-Level Perturbations [5.8] 音声信号の高次元埋め込みベクトルに対向的摂動を注入する新しい能動的防御手法であるRoVoを提案する。
RoVoは音声合成攻撃を効果的に防御し、音声強調モデルに強い抵抗を与える。
ユーザスタディによると、RoVoは保護された音声の自然性とユーザビリティの両方を保っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:14:58 GMT)
Structure-Aware Corpus Construction and User-Perception-Aligned Metrics for Large-Language-Model Code Completion [5.8] 本稿では,コード補完タスクの2つの評価指標,-LCP と ROUGE-LCP を提案する。
また,構造保存および意味的順序付きコードグラフに基づくデータ処理手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:09:32 GMT)
SWIFT:A Scalable lightWeight Infrastructure for Fine-Tuning [5.8] Large Language Models (LLM) と Multi-modal Large Language Models (MLLM) は、注意に基づくトランスフォーマーアーキテクチャを利用している。
SWIFTは、大型モデルのためのカスタマイズ可能なワンストップインフラストラクチャである。
SWIFTでカスタマイズされたデータセットをトレーニングすることで、ToolBenchのリーダボードに注目すべき改善が達成できることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:50:53 GMT)
Panda: A pretrained forecast model for universal representation of chaotic dynamics [5.7] カオスシステムは本質的に小さなエラーに敏感である。
動的システム理論に動機づけられた我々は、DynAmicsのためのPanda, Patched Attentionを提示する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:59:19 GMT)
Bayes Adaptive Monte Carlo Tree Search for Offline Model-based Reinforcement Learning [5.7] オフラインモデルベースRL(MBRL)は、静的データセットからワールドモデルを明示的に学習し、サロゲートシミュレータとして使用する。
オフラインデータセットで同じように振る舞う様々なMDPがあり、真のMDPに関する不確実性を扱うことは困難である。
本稿では,BAMDP(Bayes Adaptive Markov Decision Process)としてオフラインMBRLのモデル化を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:16:31 GMT)
LLM-based Query Expansion Fails for Unfamiliar and Ambiguous Queries [5.6] 大規模言語モデル(LLM)は、従来のルールベースおよび統計手法に代わる効果的な代替手段を提供する。
大規模言語モデル(LLM)は、従来のルールベースおよび統計手法に代わる効果的な代替手段を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:33:09 GMT)
LLMPot: Dynamically Configured LLM-based Honeypot for Industrial Protocol and Physical Process Emulation [5.5] ハニーポットはICSネットワークやインターネット上でデコイターゲットとして機能することで重要な役割を担っている。
ICSハニーポットの展開は、産業用プロトコルとデバイス特性を正確に複製する必要があるため、困難である。
本稿では,大規模言語モデルの有効性を利用したICSネットワークにおけるハニーポットの設計手法であるLLMPotを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:41:15 GMT)
True Zero-Shot Inference of Dynamical Systems Preserving Long-Term Statistics [5.4] 既存のDSRアプローチでは、観測された新しいシステムに対して目的学習が必要である。
我々はDynaMixを紹介した。DSR用に事前訓練された新しいALRNNベースのMix-of-expertsアーキテクチャである。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:49:10 GMT)
On-Policy Optimization with Group Equivalent Preference for Multi-Programming Language Understanding [5.4] 大規模言語モデル(LLM)は、コード生成タスクにおいて顕著なパフォーマンスを達成する。
一般的なプログラミング言語間での大幅な性能格差が持続する。
我々は,LLMの学習にコード翻訳タスクを活用し,コーディング能力の伝達を容易にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:25:29 GMT)
OMGPT: A Sequence Modeling Framework for Data-driven Operational Decision Making [5.4] 我々は、逐次意思決定タスクを解決するために、生成事前学習変換(GPT)モデルを構築した。
本稿ではまず,複数の作業上の意思決定タスクをカバーする汎用シーケンスモデリングフレームワークを提案する。
次に、シーケンシャルモデリングのための自然かつ強力なアーキテクチャとして、トランスフォーマーベースのニューラルネットワークモデル(OMGPT)をトレーニングする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:33:03 GMT)
Discretion in the Loop: Human Expertise in Algorithm-Assisted College Advising [5.4] 介入を指導し、学生の成功に影響を及ぼすアルゴリズムにおいて、アドバイザーがコンテキストを利用できない方法を検討する。
本研究は,非アルゴリズム的文脈を用いて,3つの介入のうち2つの介入が,学生に対して「専門的標的」であったことを推定した。
本研究は,アルゴリズムを用いた大学助言の現実的有効性に関する理論的および実践的な知見を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:34:40 GMT)
Mamba-Adaptor: State Space Model Adaptor for Visual Recognition [5.3] 本稿では,Mambaモデルに対する視覚タスクアダプタ(Adaptor-T)とアダプタ-S(Adaptor-S)の2つの機能モジュールからなる視覚タスクアダプタ(Adaptor)を開発する。
私たちのMamba-AdaptorはImageNetとCOCOベンチマークで最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:14:33 GMT)
Asymptotic Performance of Time-Varying Bayesian Optimization [5.2] 我々は,TVBOアルゴリズムの即時後悔が消える可能性を示し,もしそうであるならば,いつなのかを示す。
我々は,TVBOアルゴリズムが非レグレット特性を持つための十分な条件を導出する。
我々の分析は、定常カーネル関数の全ての主要なクラスをカバーしている。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:55:02 GMT)
FALCON: False-Negative Aware Learning of Contrastive Negatives in Vision-Language Pretraining [5.2] 我々は、ハードと偽の負のトレードオフのバランスをとる学習ベースのミニバッチ構築戦略であるFALCONを提案する。
FALCONは、ミニバッチ構築中に各アンカーインスタンスの適切な硬さの負のサンプルを動的に選択する負のマイニングスケジューラを使用している。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:33:42 GMT)
Test-time Adversarial Defense with Opposite Adversarial Path and High Attack Time Cost [5.2] 対向対向経路(OAP)に沿った拡散に基づく新しい対向防御法について検討する。
我々は、敵攻撃に抵抗するために、事前訓練されたモデルに差し込むことができる浄化器を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:00:57 GMT)
Subspace Langevin Monte Carlo [5.2] Subspace Langevin Monte Carlo (SLMC) は新規で効率的なサンプリング法である。
SLMCはランダム座標のランゲバンモンテカルロと事前条件付きランゲバンモンテカルロを一般化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:37:05 GMT)
The Effect of Language Diversity When Fine-Tuning Large Language Models for Translation [5.1] 微調整中の言語多様性の拡大は、教師なしと -- 驚くほど -- 教師なしのペアの両方の翻訳品質を改善する。
言語多様性の増大が言語に依存しない表現を生み出すことを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:24:01 GMT)
Adversarial Testing in LLMs: Insights into Decision-Making Vulnerabilities [5.1] 本稿では,大規模言語モデルの意思決定過程を体系的にストレステストする逆評価フレームワークを提案する。
我々は、GPT-3.5、GPT-4、Gemini-1.5、DeepSeek-V3など、最先端のLLMに適用する。
我々の研究は、モデル間で異なる行動パターンを強調し、信頼できるAIデプロイメントにおける適応性と公平性認識の重要性を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:50:44 GMT)
TRAIL: Trace Reasoning and Agentic Issue Localization [5.0] この研究は、エージェントワークフロートレースに対する堅牢でダイナミックな評価方法の必要性を明確に示している。
我々は,この分類法を用いて構築され,確立されたエージェント・ベンチマークに基づいて構築された148個の大型人名跡(TRAIL)について述べる。
生態学的妥当性を確保するため,単一エージェントシステムとマルチエージェントシステムの両方のトレースをキュレートする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:15:46 GMT)
Comparing Specialised Small and General Large Language Models on Text Classification: 100 Labelled Samples to Achieve Break-Even Performance [5.0] 特殊化モデルでは、一般的なモデルと同等かそれ以上のサンプル(平均100ドル)をほとんど必要としない場合が多い。
パフォーマンスのばらつきを考慮すると、必要なラベルの数は平均100 - 200%$に増加する。
4ビットの量子化は無視できる影響を持つため、より大規模なモデルでは、パフォーマンスの向上と分散の低下に一貫して結びつくわけではない。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:04:11 GMT)
Safety Alignment Can Be Not Superficial With Explicit Safety Signals [5.0] 大規模言語モデル(LLM)の安全性アライメントに関する最近の研究は、既存のアプローチがしばしば表面的に機能することを明らかにしている。
既存のアライメントアプローチでは、アライメントプロセス中にモデルが暗黙的に安全関連推論タスクを学習できると考えられる。
安全関連バイナリ分類タスクを明示的に導入し,その信号を注意と復号化戦略に統合することにより,この曖昧さを解消する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:40:46 GMT)
Predicting Reaction Time to Comprehend Scenes with Foveated Scene Understanding Maps [5.0] 視覚言語モデル(VLM)の最近の進歩は、任意の画像のシーン記述を生成することができる。
本稿では,視覚をVLMと統合し,空間的に解決されたシーン理解マップを作成する新しい画像計算モデルを提案する。
このメトリクスは、平均的な(N=17)人間のRTとシーンを理解するのに必要なササードの数と相関する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:23:00 GMT)
Multiscale Adaptive Conflict-Balancing Model For Multimedia Deepfake Detection [4.8] マルチモーダル検出法は、モダリティ間の不均衡学習によって制限されている。
本稿では,モダリティの対立を緩和し,無視を改善するために,MACB-DF(Audio-Visual Joint Learning Method)を提案する。
提案手法は,従来のベストパフォーマンス手法に比べて,ACCスコアの8.0%と7.7%の絶対的な改善を達成し,優れたクロスデータセット一般化能力を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:01:49 GMT)
Clarifying orthography: Orthographic transparency as compressibility [4.8] 我々は、正弦と音韻の相互圧縮性の観点から、正弦の透明性を定量化する。
我々の測度は不規則な綴りと規則の複雑さを1つの量で捉えている。
幅広いスクリプトタイプで22言語を評価した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:56:15 GMT)
IA-MVS: Instance-Focused Adaptive Depth Sampling for Multi-View Stereo [4.8] プログレッシブ深度仮説絞りに基づく多視点ステレオ(MVS)モデルは顕著な進歩を遂げた。
既存のメソッドでは、個々のインスタンスの深さカバレッジがシーン全体よりも小さいという可能性を十分に活用していません。
本稿では,インスタンス適応型MVS(IA-MVS)を提案する。
深度仮説の範囲を狭め、各インスタンスに精細化を施すことにより、深度推定の精度を高める。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:11:39 GMT)
Overcoming Dependent Censoring in the Evaluation of Survival Models [4.8] 本稿では,アルキメデスのコプラに基づく生存分析のための3つの新しい評価指標を提案する。
また,現実的な半合成データセットを生成するためのフレームワークも開発している。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:50:52 GMT)
Uniformity First: Uniformity-aware Test-time Adaptation of Vision-language Models against Image Corruption [4.8] ビジョン言語モデルは、トレーニングモデルと大きなギャップを持つデータセットに直面すると、依然として苦しむことが分かっています。
本稿では,センサ劣化に頑健なモデルを実現するために,情報バランスTTA (UnInfo) と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:47:46 GMT)
KunServe: Parameter-centric Memory Management for Efficient Memory Throttling Handling in LLM Serving [4.8] 本稿では、複製されたパラメータを即座にフリーな要求メモリに選択的にドロップすることで、スロットリングを扱うための最初のパラメータ中心のアプローチを提案する。
Llumnix, vLLM, InferCept などの最先端システムと比較して,sys はスロットリング中のリクエストのテールTTFTを最大72.2倍削減することを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:42:52 GMT)
LiDAR MOT-DETR: A LiDAR-based Two-Stage Transformer for 3D Multiple Object Tracking [4.7] LiDAR点雲からの多物体追跡は、データのスパースで不規則な性質のため、ユニークな課題を示す。
ライダーをベースとした2段式DETRインバータ,スムーズかつトラッカーを提案する。
このモデルは、オンラインモードとオフラインモードの両方で、nuScenesとKITTIのデータセットに基づいてトレーニングされている。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:25:48 GMT)
SafeMate: A Modular RAG-Based Agent for Context-Aware Emergency Guidance [4.7] 我々は、一般的なユーザーに正確なコンテキスト認識ガイダンスを提供する検索強化AIアシスタントであるSafeMateを紹介する。
Model Context Protocol (MCP) 上に構築されたSafeMateは、ユーザクエリを動的にドキュメント検索、チェックリスト生成、構造化要約のためのツールにルーティングする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:39:14 GMT)
LiBOG: Lifelong Learning for Black-Box Optimizer Generation [4.7] 本稿では,メタBBOにおける生涯学習の新たなパラダイムであるLiBOGを紹介する。
LiBOGは、タスク全体とタスク内の知識を集約し、破滅的な忘れを軽減します。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:09:25 GMT)
Causality-Inspired Robustness for Nonlinear Models via Representation Learning [4.6] 分散ロバスト性は,実世界のデータにおける分布シフトの偏りから,予測アルゴリズムの中心的な目標である。
本稿では,因果的枠組みに基づく非線形手法を提案する。
我々の知る限り、これは非線形設定においてそのような有限半径頑健性を保証するような因果性に着想を得た最初のロバスト性法である。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:52:15 GMT)
Enhancing Diffusion-Weighted Images (DWI) for Diffusion MRI: Is it Enough without Non-Diffusion-Weighted B=0 Reference? [4.6] そこで本研究では,DWI/b=0比の予測値と実測値とのMSE損失として,新しい比損失を提案する。
その結果、この比損失を取り入れることで、この比誤差の収束を著しく改善し、低比MSEを実現し、生成したDWIのピーク信号-雑音比(PSNR)をわずかに高めることが判明した。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:16:43 GMT)
Simplicity is Key: An Unsupervised Pretraining Approach for Sparse Radio Channels [4.6] SpaRTranは、無線チャネルの圧縮センシングに基づく教師なし表現学習手法である。
SpaRTranは、無線信号の微調整時に最先端の手法と比較してエラーを最大85%削減する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:43:33 GMT)
Predicting Turn-Taking and Backchannel in Human-Machine Conversations Using Linguistic, Acoustic, and Visual Signals [4.6] 210時間以上の人間会話ビデオの収集と注釈付けが可能な自動データ収集パイプラインを提案する。
約20Mフレームから1.5Mワードと対応するターンテイクおよびバックチャネルアノテーションを含むマルチモーダル・フェイス・ツー・フェイス・データセットを構築した。
本稿では,マルチモーダル信号からターンテイクおよびバックチャネル動作の確率を予測するエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:08:30 GMT)
Revisiting Synthetic Human Trajectories: Imitative Generation and Benchmarks Beyond Datasaurus [4.5] ヒトの軌道データは、群衆管理や疫病予防など、様々な用途において重要な役割を担っている。
人工的な人間の軌道データは、現実世界の人間の軌道に可能な限り近いシミュレートするために生成される。
本稿では,ニューラル・テンポラル・ポイント・プロセスとして設計されたhuman-Imitative tRAjectory GenErativeモデルであるMIRAGEを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:35:20 GMT)
Multi-parameter Control for the (1+($λ$,$λ$))-GA on OneMax via Deep Reinforcement Learning [4.5] 我々は、最先端の深層強化学習技術がいかに優れた制御ポリシーを近似できるかを示す。
我々は、既定理論推奨設定を一貫して上回る単純な制御ポリシーを導出する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:18:41 GMT)
Driven Critical Dynamics in Tricitical Point [4.5] 一次元超対称イジング三臨界点における駆動臨界ダイナミクスについて検討する。
イジング・クリティカルラインに沿った関連方向については、AISは明らかに破綻している。
我々の研究は、三臨界点付近の非平衡臨界力学に新しい基本的な視点をもたらす。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:17:24 GMT)
NEAT: QCP: A Practical Separation Logic-based C Program Verification Tool [4.4] 本稿では,textbf C Programming Verifier (QCP) と呼ばれる新しい検証ツールを紹介する。
QCPは、ユーザインタラクションを強化するために、アサーション言語の洗練されたフロントエンド%シンタクスを組み込んでいる。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:04:34 GMT)
RGNMR: A Gauss-Newton method for robust matrix completion with theoretical guarantees [4.4] $textttRGNMR$は単純な因数分解に基づく反復アルゴリズムであり、ガウス・ニュートン線形化と外れ値と思われるエントリの除去を組み合わせたものである。
既存の RMC 法よりも $textttRGNMR$ の方が優れていること,特に少数の観測項目を扱えることを,いくつかのシミュレーションで示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:58:33 GMT)
Uncovering Critical Sets of Deep Neural Networks via Sample-Independent Critical Lifting [4.4] 本稿では,あるネットワークのパラメータと他のネットワークのパラメータとを関連付ける,サンプル非依存クリティカルリフト演算子を提案し,サンプル非依存臨界点とサンプル非依存臨界点を定義する。
サンプル依存揚力臨界点の存在を十分に大きなサンプルサイズで証明し,その中にサドルが存在することを証明した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:50:36 GMT)
RIFLES: Resource-effIcient Federated LEarning via Scheduling [4.4] Federated Learning(FL)は、分散クライアント間の分散協調モデルトレーニングを可能にする、プライバシ保護機械学習技術である。
現在の選択戦略は、過去または現在の相互作用に基づいているという点で、自然界においてミオピックである。
RIFLESは、クライアント選択プロセスをサポートするために、新しい可用性予測層を構築します。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:26:33 GMT)
FlexFed: Mitigating Catastrophic Forgetting in Heterogeneous Federated Learning in Pervasive Computing Environments [4.4] 広汎なコンピューティング環境(例えばヒューマンアクティビティ認識、HAR)は、リソース制約されたエンドデバイス、ストリーミングセンサーデータ、断続的なクライアント参加によって特徴づけられる。
我々は,効率的なメモリ使用のためにデータ保持を優先し,オフライントレーニング頻度を動的に調整する新しいFLアプローチFlexFedを提案する。
また、ストリーミングデータ、動的分散、不均衡、可用性の変動をシミュレートする現実的なHARベースの評価フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:23:37 GMT)
A Deeper Look into Second-Order Feature Aggregation for LiDAR Place Recognition [4.4] LiDAR Place Recognition (LPR)は、高密度なポイントワイズ機能をコンパクトなグローバルディスクリプタに圧縮する。
GeMやNetVLADのような一階アグリゲータは広く使われているが、二階アグリゲータが自然に捉える特徴間の相関を見落としている。
Channel Partition-based Second-order Local Feature Aggregation (CPS)は、ドロップイン、パーティションベースの2階アグリゲーションモジュールである。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:46:57 GMT)
Graph Alignment for Benchmarking Graph Neural Networks and Learning Positional Encodings [4.3] 本稿では,グラフアライメント問題に基づくグラフニューラルネットワーク(GNN)の新しいベンチマーク手法を提案する。
我々は,この問題を自己教師付き学習タスクとして捉え,グラフアライメントデータセットを生成するいくつかの方法を提案する。
実験により、異方性グラフニューラルネットワークは標準的な畳み込みアーキテクチャより優れていることが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:22:17 GMT)
Multi-Modal Artificial Intelligence of Embryo Grading and Pregnancy Prediction in Assisted Reproductive Technology: A Review [4.3] 体外受精胚移植技術は、妊娠の成功率を改善する上で多くの課題に直面している。
本稿では,マルチモーダル人工知能の胚グレーディングおよび妊娠予測への応用状況について概説する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:07:13 GMT)
Continuous Fair SMOTE -- Fairness-Aware Stream Learning from Imbalanced Data [4.2] フェアネスを意識した連続SMOTE変種としてCFSMOTEを提案する。
他のフェアネス対応ストリーム学習者とは異なり、CFSMOTEは特定のフェアネスメトリックのみを最適化していない。
実験の結果,バニラC-SMOTEと比較して,グループフェアネスの指標が有意な改善を示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:46:47 GMT)
Large-scale quantum reservoir computing using a Gaussian Boson Sampler [4.2] ガウスボソンサンプリング(英: Gaussian Boson sampler、GBS)は、光学において大規模に実現可能な特殊な量子コンピュータである。
GBSベースの貯水池コンピュータの各種ベンチマークタスクにおける精度を評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:55:44 GMT)
Smoothed SGD for quantiles: Bahadur representation and Gaussian approximation [4.2] 勾配降下法(SGD)アルゴリズムのスムーズなバージョンによる量子化の推定について検討する。
我々はスムーズなSGD量子推定のための非漸近テール確率境界を導出する。
数値解析により, 理論的結果に対して良好な有限標本挙動を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:19:44 GMT)
Deep Learning Methods for Adjusting Global MFD Speed Estimations to Local Link Configurations [4.2] 本研究では,リンク構成に基づいて,実リンク速度とMFD平均速度の局所的な速度差を表す局所補正係数(LCF)を提案する。
LCFは、MFDから平均速度と道路網構成を入力として行う深層学習関数を用いて計算される。
本フレームワークは,グラフ注意ネットワーク(GAT)とGRU(Gated Recurrent Units)を統合し,ネットワーク内の空間的構成と時間的相関の両方をキャプチャする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:16:00 GMT)
CAMOT: Camera Angle-aware Multi-Object Tracking [4.2] 本稿では,マルチオブジェクト追跡のための簡易カメラアングル推定器であるCAMOTを提案する。
複数の物体が各ビデオフレームの平面上に位置していると仮定すると、CAMOTは物体検出を用いてカメラの角度を推定する。
提案手法をMOT17とMOT20データセット上の様々な2次元MOT手法に付加して評価し,その有効性を確認した。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:21:00 GMT)
GuRE:Generative Query REwriter for Legal Passage Retrieval [4.2] LPR(Lawal Passage Retrieval)システムは、法的議論を起草する際の時間節約を支援するため、重要なシステムである。
主な理由は、クエリとターゲットパスの間の大きな語彙ミスマッチである。
本稿では,簡易かつ効果的な生成クエリリライタ(GuRE)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:42:36 GMT)
Turning Up the Heat: Min-p Sampling for Creative and Coherent LLM Outputs [4.1] 大規模言語モデル(LLM)は、各復号ステップにおける語彙上の確率分布から次のトークンをサンプリングしてテキストを生成する。
本稿では,トップトークンの確率をスケーリング係数として利用して,モデルの信頼度に基づいてサンプリングしきい値を調整する動的トランケーション手法であるmin-pサンプリングを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:28:19 GMT)
Bias and Generalizability of Foundation Models across Datasets in Breast Mammography [4.1] 乳房マンモグラフィー分類のための基礎モデル(FM)の公平性とバイアスについて検討する。
我々は、未表現領域と社内データセットからのさまざまなソースを含む、膨大なデータセットのプールを活用している。
実験の結果,FMのモーダリティ固有の事前学習は性能を向上させるが,個々のデータセットの特徴に基づいて訓練された分類器はドメイン間の一般化に失敗することがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:22:12 GMT)
Partite-wise Entanglement [4.1] 3量子GHZ状態の2部還元状態として$rhoAB$は分離可能であることが知られているが、part $A$とpart $B$は、part $C$をトレースせずに実際に互いに絡み合っている。
ここでは任意の次元を持つ任意の$n$-partiteシステムにおいてそのような絡み合いを探求し、[Phys. Rev. A 110, 032420(2024)]で提案されたペアエンタングル(PE)を含むパーティタイト・エンタングルメント(PWE)と呼ぶ。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:09:00 GMT)
When Mitigations Backfire: Timing Channel Attacks and Defense for PRAC-Based RowHammer Mitigations [4.0] RH軽減効果を損なうことなくPRACによるタイミングチャネルを除去する防御であるTPRAC(Timing-Safe PRAC)を提案する。
評価の結果、TPRACは1024のRH閾値で3.4%のオーバヘッドしか発生せず、タイミングチャネルを閉じていることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:17:07 GMT)
Improving Generative Inverse Design of Rectangular Patch Antennas with Test Time Optimization [4.0] 矩形パッチアンテナの逆設計のための2段階のディープラーニングフレームワークを提案する。
提案手法は自然に異なる設計基準に一般化し,より複雑な幾何学的設計空間に容易に適用できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:24:28 GMT)
Learning Wavelet-Sparse FDK for 3D Cone-Beam CT Reconstruction [4.0] 古典的アルゴリズムの解釈可能性を維持するFDKベースの拡張ニューラルネットワークを提案する。
我々はウェーブレット変換を利用して、余弦重みとフィルタのスパース表現を作成する。
この戦略的なスペーシフィケーションは、性能を損なうことなくパラメータカウントを9,3.75%$削減する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:31:40 GMT)
Exploring dynamical quantum phase transition from pure states to mixed states through extended Su-Schrieffer-Heeger models [3.9] 拡張SSHモデルフレームワーク内の純粋状態と混合状態の動的量子相転移(DQPT)について検討する。
純粋な状態では、エネルギーバンドギャップが開いたままでも、トポロジカル遷移を横切るクエンチ後にDQPTが発生する。
混合状態の場合、DQPTの挙動は低温では純粋な状態と整合するが、高温では大きな変化が生じる。
純粋な状態 DQPT は、クエンチがギャップのない初期状態から始まり、臨界位相点を横切るときにのみ発生する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:08:48 GMT)
Testing Identifiability and Transportability with Observational and Experimental Data [3.9] そこで本研究では,Z-specific(条件付き)因果効果が同定可能かつ輸送可能であるかどうかを評価する手法を提案する。
本手法は,対象個体群から得られた実験データと対象個体群から得られた観測データを組み合わせて,観測データから因果効果が同定可能であり,搬送可能である可能性を計算する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:31:56 GMT)
Time series saliency maps: explaining models across multiple domains [3.9] 本稿では,統合勾配の一般化であるクロスドメイン統合勾配について紹介する。
我々の方法は、時間領域の可逆かつ微分可能な変換として定式化できる任意の領域における特徴属性を可能にする。
これらの結果は、時系列モデルにおいて意味論的に意味のある洞察を提供するクロスドメイン統合勾配の能力を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:31:35 GMT)
SocialJax: An Evaluation Suite for Multi-agent Reinforcement Learning in Sequential Social Dilemmas [3.9] 連続的な社会的ジレンマは、マルチエージェント強化学習の分野において重要な課題である。
SocialJaxは、JAXで実装されたシーケンシャルな社会的ジレンマ環境とアルゴリズムのスイートである。
JAXはPython用の高性能数値計算ライブラリである。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:28:35 GMT)
Benchmarking MOEAs for solving continuous multi-objective RL problems [3.9] 多目的強化学習(MORL)は、複数の、しばしば矛盾する報酬を同時に最適化する課題に対処する。
本稿では,複雑なMORL問題の解法における多目的進化アルゴリズムの適用性と限界について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:54:20 GMT)
Projection-based Lyapunov method for fully heterogeneous weakly-coupled MDPs [3.9] 弱結合マルコフ決定過程(WCMDP)の完全不均一な設定について検討する。
完全不均一なWCMDPに対して,O(1/sqrtN)$のオプティニティギャップが,N$が大きくなるにつれて,アーム当たりの平均報酬が1本当たり平均報酬で最大になることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:28:13 GMT)
Leveraging LLM Inconsistency to Boost Pass@k Performance [3.8] 大規模言語モデル(LLM)は、多くのドメインにおいて印象的な能力を発揮するが、マイナーな入力変更に対する不整合性を示す。
本稿では,Pass@kの性能向上にモデルの不整合を利用した新しい手法を提案する。
具体的には、与えられたタスクのk変種を生成し、各タスクに対して1つの候補解を提出する「変数」エージェントを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:22:04 GMT)
Non-stationary Diffusion For Probabilistic Time Series Forecasting [3.8] 非定常拡散(NsDiff)と呼ばれる拡散に基づく確率的予測フレームワークを開発する。
NsDiffは、デノナイズド拡散に基づく条件生成モデルと、事前訓練された条件平均と分散推定器を組み合わせる。
9つの実世界および合成データセットで実施された実験は、既存のアプローチと比較して、NsDiffの優れた性能を示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:58:28 GMT)
Representation of perceived prosodic similarity of conversational feedback [3.7] スペクトルおよび自己教師型音声表現は、抽出されたピッチ特徴よりも韻律を符号化する。
コントラスト学習を通じて、人間の知覚に表現をさらに凝縮し、整列させることが可能である。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:47:51 GMT)
Table-Critic: A Multi-Agent Framework for Collaborative Criticism and Refinement in Table Reasoning [3.7] Table-Criticは、協調的な批判と推論プロセスの反復的な洗練を促進する、新しいマルチエージェントフレームワークである。
枠組みは, エラー識別審査員, 包括的批判批判者, プロセス改善の精錬者, パターン蒸留のキュレーターの4つの特殊エージェントから構成される。
計算効率と解分解率の低下を保ちながら、テーブル・クライトは精度と誤差補正率に優れることを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:10:55 GMT)
Causal Head Gating: A Framework for Interpreting Roles of Attention Heads in Transformers [3.7] 本稿では,変圧器モデルにおける注目頭部の機能的役割を解釈するスケーラブルな方法として,因果頭部ゲーティング(CHG)を提案する。
CHGは頭上のソフトゲートを学び、タスクのパフォーマンスへの影響に基づいて因果分類を割り当てる。
以上の結果から,CHGスコアは単に相関ではなく因果関係の指標となり,アブレーションおよび因果媒介分析によって検証された。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:24:13 GMT)
DB3D-L: Depth-aware BEV Feature Transformation for Accurate 3D Lane Detection [3.7] 3Dレーン検出は自動運転において重要な役割を果たす。
近年の進歩は、Laneの3D情報をより効果的に知覚するために、FV画像からBirds-Eye-View(BEV)機能を構築している。
しかし、深度情報がないため、FV画像から正確なBEV情報を構築することは制限される。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:47:20 GMT)
Dual-Agent Reinforcement Learning for Automated Feature Generation [3.6] 機能生成には、オリジナルの機能間の複雑な関係をキャプチャするために、生のデータから新機能を作成することが含まれる。
特徴生成のための強化学習を用いた現在の手法は、特徴探索をより柔軟かつ効率的にしている。
特徴生成のための新しい二エージェント強化学習法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:24:16 GMT)
Learning Dynamics of RNNs in Closed-Loop Environments [3.6] 神経科学にインスパイアされたタスクで訓練されたリカレントニューラルネットワーク(RNN)は、脳計算の強力なモデルを提供する。
閉ループ文脈で学習した線形RNNの学習力学を記述する数学的理論を開発する。
閉ループRNNの学習力学は,短期的政策改善とエージェント環境相互作用の長期的安定性の相互作用によって制御されることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:00:23 GMT)
SzCORE as a benchmark: report from the seizure detection challenge at the 2025 AI in Epilepsy and Neurological Disorders Conference [3.6] 65名(4,360時間)の脳波連続記録のプライベートデータセットを用いて,課題を整理した。
参加者は、感度、精度、F1スコア、偽陽性などの事象ベースの指標に基づいて、発作の発症と持続時間を検出する必要がある。
その結果,F1スコアは43%(感度,精度45%)であり,発作検出の難しさが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:36:20 GMT)
Cross-Chain Options: A Bridgeless, Universal, and Efficient Approach [3.6] 暗号通貨のようなブロックチェーン常駐資産の選択肢への関心が高まっているにもかかわらず、現在のオプションメカニズムは重大な課題に直面している。
当社のプロトコルは、信頼性のないサービス環境におけるオプションを確立する際に、オーバサが担保をポストする必要をなくす最初のものです。
その普遍性は、2つの異なるブロックチェーン上のほぼテキストティニーアセットを含むクロスチェーンオプションを可能にする。
提案手法により,提案手法はオプション転送遅延を既存手法の半分以下に削減できることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:10:56 GMT)
EndoMetric: Near-Light Monocular Metric Scale Estimation in Endoscopy [3.5] 標準的な単眼内視鏡画像から3次元再構成の実測値スケールを推定する手法を提案する。
これは、ポリープの測定、狭窄の測定、または疾患組織の範囲の評価など、応用に不可欠である。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:54:39 GMT)
Optimizing Retrieval Augmented Generation for Object Constraint Language [3.5] OCLはモデルベースシステムエンジニアリング(MBSE)に必須であるが、手動でOCLルールを記述するのは複雑で時間を要する。
OCLBERT生成に対する3つの異なる検索戦略の影響を評価する。
検索は生成精度を向上させることができるが,その有効性は検索方法と検索したチャンク数に依存する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:00:10 GMT)
Robust Emotion Recognition via Bi-Level Self-Supervised Continual Learning [3.5] クロスオブジェクトの変動性とノイズラベルは、感情認識モデルの性能を妨げる。
本稿では,動的メモリバッファをベースとした2段階の自己教師付き連続学習フレームワークSSOCLを提案する。
このバイレベルアーキテクチャは、動的バッファと擬似ラベルの割り当てを反復的に洗練し、代表サンプルを効果的に保持する。
高速適応モジュールとクラスタマッピングモジュールを含むフレームワークの主要なコンポーネントは、データストリームの堅牢な学習と効果的な処理を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:10:28 GMT)
Scalable Bayesian Monte Carlo: fast uncertainty estimation beyond deep ensembles [3.5] この研究は、スケーラブルベイズモンテカルロ(SBMC)と呼ばれる新しい手法を導入する。
このアルゴリズムは、一貫した(漸近的に偏りのない)ベイズディープラーニングアルゴリズムの並列実装である:モンテカルロ(SMC)またはマルコフ連鎖モンテカルロ(MCMC)
論文参考訳(メタデータ) (Mon, 19 May 2025 17:55:32 GMT)
Conspiracy theories and where to find them on TikTok [3.4] 本研究はTikTok上での陰謀論の体系的分析である。
比較ビデオの出現頻度を低く見積もる。
我々は,現在最先端のオープンウェイトな大規模言語モデルによる陰謀論の特定能力を評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:30:58 GMT)
A Case Study of Cross-Lingual Zero-Shot Generalization for Classical Languages in LLMs [3.4] 我々は、サンスクリット語、古代ギリシア語、ラテン語の3つの古典的な言語における自然言語理解に焦点を当てている。
まず、名前付きエンティティ認識と機械翻訳を英語に翻訳する。
検索拡張生成手法を用いてコンテキストを組み込むことにより,性能が著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:30:10 GMT)
Chaos Engineering in the Wild: Findings from GitHub [3.4] この調査では、10の一般的なカオスエンジニアリングツールを組み込んだ991のGitHubリポジトリを調査した。
ToxiproxyとChaos Meshが最も頻繁に使われており、2016年以来一貫して成長している。
障害注入のシナリオは主にネットワーク障害(40.9%)とインスタンス停止(32.7%)に対処するが、アプリケーションレベルの障害(3.0%)は未表現のままである。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:53:25 GMT)
Building reliable sim driving agents by scaling self-play [3.3] シミュレーションエージェントは、自動運転車(AV)のような人間と相互作用するシステムの設計とテストに不可欠である
我々は,人間の知覚と制御に対する半現実的な制限の下で,オープンモーションデータセット上で数千のシナリオにセルフプレイをスケールすることを提案する。
テストシーンが見えないように一般化し、0.8%未満の衝突とオフロードインシデントで99.8%のゴール達成率を達成した。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:24:52 GMT)
Are requirements really all you need? A case study of LLM-driven configuration code generation for automotive simulations [3.3] 大規模言語モデル(LLM)は多くの産業を嵐によって取り込んでいる。
現在利用可能なモデルは、自動車業界で見られるような現実世界の課題に本当に対処できるのだろうか?
本研究では、現在の最先端モデルの1つをテストに当てる。
我々は,CARLAシミュレーションのための構成コードに,自動車規格や文書から抽出した抽象的要件を翻訳する作業において,その性能を評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:44:24 GMT)
ModernGBERT: German-only 1B Encoder Model Trained from Scratch [3.2] ゼロから訓練されたドイツのエンコーダモデルの完全透明なファミリであるModernGBERT (134M, 1B) を紹介する。
LL"aMmlein2Vec (120M, 1B, 7B) も提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:07:20 GMT)
New affine invariant ensemble samplers and their dimensional scaling [3.2] 本稿では,既存のアルゴリズムの構築と改良が容易な新しいアフィン不変アンサンブルサンプリング手法を提案する。
具体的には、$textttemcee$ packageの一般的なサンプルよりも好適に動作するデリバティブフリーアンサンブルサイド移動サンプリングを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:01:42 GMT)
JNLP at SemEval-2025 Task 11: Cross-Lingual Multi-Label Emotion Detection Using Generative Models [3.2] 本研究では,SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detectionについて述べる。
本研究は,(1)トラックA:マルチラベル感情検出,(2)トラックB:感情強度の2つのサブトラックに焦点を当てた。
入力を対応する感情ラベルに直接マッピングするベースメソッドと、入力テキストと各感情カテゴリの関係を個別にモデル化するペアワイズ手法の2つの方法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:24:53 GMT)
Vision Transformers in Precision Agriculture: A Comprehensive Survey [3.2] ビジョントランスフォーマー(ViT)は、長距離依存の処理の改善や視覚タスクのスケーラビリティ向上といった利点を提供する。
本研究は、CNNとViTの比較分析と、ハイブリッドモデルとパフォーマンス改善のレビューを含む。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:20:35 GMT)
Learning Collision Risk from Naturalistic Driving with Generalised Surrogate Safety Measures [3.1] 本研究は一般サロゲート安全対策(GSSM)を紹介する。
GSSMは通常の運転パターンを捉え、交通相互作用がノルムから安全でない極端へと逸脱する程度を推定する。
瞬時状態のみを使用するバニラGSSMは、AUPRC 0.9を達成し、2.6秒の中央値の進行を保証し、潜在的な衝突を防ぐ。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:22:32 GMT)
Test-Time Training Scaling Laws for Chemical Exploration in Drug Design [3.1] 強化学習(RL)を利用した化学言語モデル(CLM)は、デ・ノボ分子設計において有望であるが、しばしばモード崩壊に悩まされている。
大規模言語モデルにおけるTTT(Test-Time Training)の着想を得て,化学空間探索の促進を目的としたスケーリングTTTを提案する。
以上の結果から, 独立RLエージェントの増加によるTTTのスケーリングは, 対数線形スケーリング法に従い, MolExp が測定した探索効率を大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:36:07 GMT)
Bullying the Machine: How Personas Increase LLM Vulnerability [3.1] 大きな言語モデル(LLM)は、ペルソナを採用するように促されるインタラクションにますますデプロイされています。
本稿では,このような人格条件がいじめ時のモデル安全性に影響を及ぼすかどうかを考察する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:32:02 GMT)
ST-WebAgentBench: A Benchmark for Evaluating Safety and Trustworthiness in Web Agents [3.1] 既存のベンチマークは、エージェントがタスクを完了したか、それが安全に行われているか、あるいは企業が信頼できる方法で行われているかを無視するのみである。
textbftextscST-WebAgentBenchを紹介します。
222のタスクはそれぞれ、制約を符号化する簡潔なルールであるSTポリシーと組み合わせられ、6次元(例えば、ユーザの同意、堅牢性)に沿ってスコアされる。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:50:49 GMT)
Tight Mixed-Integer Optimization Formulations for Prescriptive Trees [3.1] 本稿では,入力特徴ベクトルと学習した決定木の予測結果との関係をモデル化することに注力する。
従来よりも厳密な混合整数最適化法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:49:13 GMT)
Rethinking Predictive Modeling for LLM Routing: When Simple kNN Beats Complex Learned Routers [3.1] 我々は、k-Nearest Neighbors (kNN) アプローチが、様々なタスクにまたがる最先端の学習ルータよりも優れていることを示す。
その結果, 埋め込み空間におけるモデル性能の局所性は, 単純な非パラメトリック手法によって強いルーティング決定を実現できることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:33:41 GMT)
Temporal Query Network for Efficient Multivariate Time Series Forecasting [3.1] 本稿では,TQ(Temporal Query)と呼ばれる新しい手法を提案する。
TQ技術に基づいて、TQNet(Temporal Query Network)というシンプルなモデルを構築した。
実験によると、TQNetはより堅牢な多変量相関を学習し、12の挑戦的な実世界のデータセットに対して最先端の予測精度を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:55:10 GMT)
What's in a prompt? Language models encode literary style in prompt embeddings [3.1] 変換器の作用により,プロンプト全体の累積情報が個々の埋め込みにどのように凝縮されるかを示す。
我々は、異なる小説からの短い抜粋が、それらが収束する次の段階の予測とは独立に、潜伏空間で分離されていることを観察する。
このスタイルの幾何学は、著者の帰属や文学的分析に応用できるかもしれないが、最も重要なことは、言語モデルによって達成された情報処理と圧縮の高度化である。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:56:13 GMT)
OZSpeech: One-step Zero-shot Speech Synthesis with Learned-Prior-Conditioned Flow Matching [3.1] OZSpeechは1ステップのサンプリングで最適な輸送条件流を探索する最初のTS法である。
提案手法は,各音声属性の正確なモデリングを可能にするために,トークン形式における音声の非交叉分解成分を演算する。
実験の結果,提案手法は,コンテンツ精度,自然性,韻律生成,話者スタイルの保存において,既存の手法よりも有望な性能を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:31:55 GMT)
Power Lines: Scaling Laws for Weight Decay and Batch Size in LLM Pre-training [3.0] モデルサイズN,データセットサイズD,バッチサイズBをスケールするHPのスケーリング法則について検討した。
N,Dスケールとして、最適時間スケールはトークン毎パラメータ比D/Nの正確なパワー則に従うことを示す。
以前の研究とは対照的に、Bpt と Bcrit のスケールは、モデルサイズ N とは独立に、D の力の法則として見なされる。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:27:33 GMT)
The Differences Between Direct Alignment Algorithms are a Blur [3.0] 1段階法(ORPO, ASFT)は2段階法に比べて性能が低いことを示す。
明示的なSFTフェーズで2段階のセットアップに適応させることで性能が向上することを示す。
総合的な分析により、ペアワイドとポイントワイドの目的の選択がアライメントの成功の主要な決定要因であることが判明した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:58:35 GMT)
Stochastic Orthogonal Regularization for deep projective priors [3.0] 本稿では,GPGDアルゴリズムに焦点をあてる。
ニューラルネットワークは、画像などの複雑なデータをモデル化する未知の低次元集合への投影を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:12:01 GMT)
Predictively Combatting Toxicity in Health-related Online Discussions through Machine Learning [3.0] そこで本研究では,健康関連オンラインディスカッションにおいて,ユーザが有害に対話できる場所を予測的に予測する代替案を提案する。
コラボレーションフィルタリングベースの機械学習手法を適用することで、あらゆるユーザとRedditのサブコミュニティ間の新型コロナウイルス関連の会話の毒性を予測し、関連するメトリクスで80%以上の予測パフォーマンスを達成します。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:53:37 GMT)
EpiLLM: Unlocking the Potential of Large Language Models in Epidemic Forecasting [3.0] 大規模言語モデル(LLM)は、ドメイン固有のタスクの基礎モデルとして有効であることを示した。
EpiLLMの最近の進歩は、現実世界のCOVID-19データセットの既存のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:53:25 GMT)
Are Large Language Models Good at Detecting Propaganda? [2.9] プロパガンディストは、論理的な誤信と感情的な魅力に頼って、彼らの議題を前進させる修辞的な装置を使用する。
近年の自然言語処理の進歩により,操作内容を検出するシステムの開発が可能になった。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:11:13 GMT)
An Automated Blackbox Noncompliance Checker for QUIC Server Implementations [2.9] QUICtesterは、承認されたQUICプロトコル実装(RFC 9000/)における非準拠の動作を明らかにするための自動化アプローチである。
我々はQUICtesterを用いて、19のQUIC実装から得られた186個の学習モデルを5つのセキュリティ設定で解析し、55個の実装エラーを発見した。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:28:49 GMT)
Fast, Not Fancy: Rethinking G2P with Rich Data and Rule-Based Models [2.9] ホログラフの曖昧さは、G2P変換において重要な課題である。
本稿では、ホモグラフに着目したデータセットを構築するための半自動パイプラインを提案し、その効果を実証する。
我々は、最もよく知られたルールベースのG2PシステムであるeSpeakを高速なホモグラフ対応バージョンであるHomoFast eSpeakに改良する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:11:12 GMT)
Entangling two levitated particles in free space via trap modulation and Bayesian feedback [2.9] 自由空間における2つの光共振ナノ粒子間の量子絡み合いの最適制御法を提案する。
最適なベイズフィードバックスキームを用いることで、定常状態の2つの粒子間の無条件絡み合いを実現する。
本手法により, 比較的低い測定効率で条件付きおよび非条件付き絡み合いを実現することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:48:29 GMT)
DICTION:DynamIC robusT whIte bOx watermarkiNg scheme for deep neural networks [2.9] ディープニューラルネットワーク(DNN)の透かしは、ディープラーニング(DL)モデルのオーナシップを保護するのに適した方法である。
本稿ではまず,ホワイトボックスDNN透かし方式の統一化フレームワークについて述べる。
次に,新しいホワイトボックスの動的ロバスト透かし方式であるDICTIONを紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:10:53 GMT)
Manifesto from Dagstuhl Perspectives Workshop 24452 -- Reframing Technical Debt [2.8] マニフェストは、価値、信念、原則の1ページの要約から始まります。
次に、それぞれの価値、信念、原則について詳しく説明し、その根拠を説明し、その意味を明確にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:53:14 GMT)
Neural Morphological Tagging for Nguni Languages [2.8] 形態解析システムは、2つの別々のコンポーネントを持つパイプラインとしてフレーム化でき、セグメンタとタグが続く。
本報告では, ニューラル手法を用いて, 4つの言語に対する形態的タグ付けを行う。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:41:47 GMT)
Hybrid 3D-4D Gaussian Splatting for Fast Dynamic Scene Representation [2.7] 高忠実度空間および時間変動をモデル化する能力によって, 4DGS (4D Gaussian Splatting) が魅力的なアプローチとして登場した。
動的要素に対して4次元ガウスアンを保ちながら3次元ガウスアンを持つ静的領域を適応的に表現する新しいフレームワークである3D-4D Gaussian Splatting (3D-4DGS)を紹介する。
本手法は,視覚的品質の維持や改善を図りながら,ベースラインの4Dガウススメッティング法と比較して,トレーニング時間を著しく短縮する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:59:58 GMT)
$μ$PC: Scaling Predictive Coding to 100+ Layer Networks [2.7] 非常に深いネットワーク上で"$mu$PC"を確実にトレーニングできることを示します。
我々の結果は、他のローカルアルゴリズムに影響を及ぼし、畳み込みおよびトランスフォーマーアーキテクチャに拡張できる可能性がある。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:54:29 GMT)
A generalisable head MRI defacing pipeline: Evaluation on 2,566 meningioma scans [2.7] 我々は、アトラスベースの登録と脳マスクを統合した高分解能MRIのための、堅牢で汎用的なデファイリングパイプラインを提案する。
髄膜腫に対する2,566種類の異種臨床検査を行い,99.92パーセントの成功率を得た。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:39:18 GMT)
Detecting Errors in a Quantum Network with Pauli Checks [2.7] 量子エラー検出方式であるPauli check sandwiching (PCS) を分散マルチパーティプロトコルにすることで量子ネットワークに適用する。
PCSはターゲットの量子ビットに対して保護を提供し、通常、標準的な量子エラー訂正や検出コードよりもリソースオーバーヘッドを少なくする。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:45:54 GMT)
HiERO: understanding the hierarchy of human behavior enhances reasoning on egocentric videos [2.7] ビデオセグメントの特徴を階層的なアクティビティスレッドで拡張する弱い教師付き手法であるHiEROを提案する。
ビデオクリップをナレーション付き記述に合わせることで、HiEROはコンテキスト的、意味的、時間的推論を階層的アーキテクチャで推論する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:47:41 GMT)
"I will never pay for this" Perception of fairness and factors affecting behaviour on 'pay-or-ok' models [2.6] 本研究は,クッキーペイウォールに対する利用者の認識,公平性判断,支払を検討するための条件について検討した。
私たちの発見は、プライバシーとデータ保護が基本的権利よりも特権になるかもしれない経済排除に関する懸念を提起します。
これらの懸念に対処するため、透明性を高め、強制力を減らし、有料コンテンツの価値を確実にし、包括的代替策を探る、ユーザ中心のアプローチを推奨する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:23:51 GMT)
Measuring Social Influence with Networked Synthetic Control [2.6] 対実と比較の欠如により、社会的影響の測定は困難である。
合成制御を用いた社会的影響力の最近の尺度である社会的価値の一般的な性質について述べる。
どんなアンサンブルモデルでも計算の削減が達成できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:44:46 GMT)
Finding Maximum Independent Sets in Dynamic Graphs using Unsupervised Learning [2.6] 動的グラフに最大独立集合(MaxIS)を求めるための教師なし学習モデルを提案する。
本手法は,グラフニューラルネットワーク(GNN)からの構造化学習と,学習した分散更新機構を組み合わせる。
本モデルは,学習に用いたグラフよりも100倍大きいグラフを一般化し,グリーディ手法と商用混合整数計画法の両方に匹敵する性能を達成している。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:58:22 GMT)
A Hybrid Quantum Classical Pipeline for X Ray Based Fracture Diagnosis [2.6] 骨骨折は世界中で致死率と障害の主な原因である。
従来のX線解釈は時間を消費し、エラーを起こしやすい。
既存の機械学習とディープラーニングソリューションは、しばしば広範な機能エンジニアリングを必要とする。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:38:24 GMT)
ComBAT Harmonization for diffusion MRI: Challenges and Best Practices [2.6] ComBAT (ComBAT) は、MRIからの計測をサイト関連添加物と乗法バイアスで調和させる方法である。
我々はComBATの数学的基礎を概観し、これらの仮定を概説し、最適な結果に必要な人口構成について考察する。
我々は、一貫性とサポートを高めるために慎重に考慮すべき5つの重要な勧告、オープンサイエンス、共同研究、実生活臨床展開の2つの重要な要素を提示する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:58:33 GMT)
Tracr-Injection: Distilling Algorithms into Pre-trained Language Models [2.5] 本稿では, RASP で書かれたアルゴリズムを事前学習した言語モデルに直接蒸留する方法である tracr-injection を提案する。
提案手法はモデル残差ストリーム内の解釈可能な部分空間をどうやって生成するかを示し, RASP アルゴリズムに存在する変数に復号化することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:06:13 GMT)
Think Before You Attribute: Improving the Performance of LLMs Attribution Systems [2.5] 本稿では,Retrieve-Augmented Generation (RAG)システムに対する文レベルの事前帰属ステップを提案する。
帰属前の文章を分離することにより、そのタイプの文章に対して適切な帰属方法を選択することができ、帰属を完全にスキップすることができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:08:20 GMT)
FLTG: Byzantine-Robust Federated Learning via Angle-Based Defense and Non-IID-Aware Weighting [2.5] ビザンティン攻撃は、悪意のあるクライアントの更新を操作することで、トレーニングの完全性を脅かす。
既存の手法は、高い悪意のあるクライアント比率と非I.D.データに対する感度の下で、限られたロバスト性に苦しむ。
角度に基づくディフェンスと動的参照選択を統合した新しいアグリゲーションアルゴリズムFLTGを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:39:07 GMT)
CXMArena: Unified Dataset to benchmark performance in realistic CXM Scenarios [2.5] 大規模言語モデル(LLM)は、顧客エクスペリエンスマネジメント(CXM)に革命をもたらす大きな可能性を秘めている
複雑な運用環境での実用性の評価は、データ不足と現在のベンチマークの限界によって妨げられています。
我々はCXMArenaを紹介した。これはCXMコンテキストでAIを評価するために特別に設計された、新しい大規模合成ベンチマークデータセットである。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:27:01 GMT)
Dictionary-based sparse block encoding with low subnormalization and circuit depth [2.4] スパースブロック符号化のための新しいプロトコルを提案する。
回路深さが$mathcalO(log(ns))$$ $mathcalO(n2s)$ ancillary qubits の非ゼロ要素を$s$$$で2ntimes2n$次元スパース行列を問合せすることを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:40:26 GMT)
KinTwin: Imitation Learning with Torque and Muscle Driven Biomechanical Models Enables Precise Replication of Able-Bodied and Impaired Movement from Markerless Motion Capture [2.4] 高品質な運動分析は、運動科学とリハビリテーションに大きな恩恵をもたらす可能性がある。
臨床実習において,模擬学習を用いて高品質な運動分析を可能にする可能性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:58:03 GMT)
A Minimum Description Length Approach to Regularization in Neural Networks [2.4] 正規化手法の選択は形式言語で訓練する上で重要な役割を担っていることを示す。
既存の正規化手法とは異なり、MDLは過剰適合を効果的に防止し、一般化を促進するために適切な帰納バイアスを導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:34:56 GMT)
PyFCG: Fluid Construction Grammar in Python [2.4] PyFCGはFluid Construction Grammar(FCG)をPythonプログラミング言語に移植するオープンソースソフトウェアライブラリである。
本稿では,PyFCGの例を示す3つのチュートリアルを提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:00:01 GMT)
Biomedical Open Source Software: Crucial Packages and Hidden Heroes [2.4] バイオメディカルペーパーで使用されるソフトウェアの依存関係をマップし、ソフトウェアエコシステムに不可欠なパッケージを見つけます。
ソフトウェア依存ネットワークの集中度指標を提案し,3つのエコシステム(PyPi,CRAN,Bioconductor)を分析し,最も集中度の高いパッケージを決定する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:37:21 GMT)
Surrogate Modeling of 3D Rayleigh-Benard Convection with Equivariant Autoencoders [2.4] 本稿では、同変畳み込み自己エンコーダと同変畳み込みLSTMからなる終端から終端までの同変代理モデルを提案する。
ケーススタディとして,加熱底と冷却トッププレートの間の浮力駆動流体の流れを記述した3次元レイリー・ブエナード対流を考察する。
以上の結果から,サンプルおよびパラメータ効率の両面で有意な向上を示すとともに,より複雑なダイナミクス,すなわちより大きい数値へのスケーリング性も向上した。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:26:54 GMT)
Deterministic Bounds and Random Estimates of Metric Tensors on Neuromanifolds [2.4] 我々は、ハッチンソンのトレース推定器に基づいて、計量テンソルとその境界の非バイアスランダム推定を導入する。
単一の後方通過を通して効率的に評価することができ、対角線、またはブロック対角線、またはフルテンソルを推定することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:01:08 GMT)
Starting Seatwork Earlier as a Valid Measure of Student Engagement [2.4] その信頼性と予測妥当性を評価するために,セッションレベルの尺度に関する先行作業を構築した。
以上の結果から,これらの指標は月ごとの信頼性が中程度から高いことが示唆された。
それらは、事前の知識やゲーム・ザ・システム・ビヘイビアを超えて、最終的な数学スコアの予測を強化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:49:08 GMT)
Is This Collection Worth My LLM's Time? Automatically Measuring Information Potential in Text Corpora [2.3] モデルトレーニングや微調整を必要とせずに,テキストコレクションから得られる潜在的な情報を評価する自動パイプラインを提案する。
提案手法はテキストから複数の選択質問(MCQ)を生成し,LLMの性能を原材料へのアクセスの有無に関わらず測定する。
戦略的に選択された5つのデータセット、EPFLのPhD原稿、個人の記録コレクション、関連するトピックに関するウィキペディア記事の2セット、および合成ベースラインデータセットを用いてアプローチを検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:01:05 GMT)
Gaussian Universality in Neural Network Dynamics with Generalized Structured Input Distributions [2.3] ガウス混合体としてモデル化された入力に基づいて学習したディープラーニングシステムの振る舞いを分析し,より汎用的な入力をシミュレートする。
特定の標準化スキームの下では、入力データがより複雑あるいは実世界の分布に従う場合でも、ディープラーニングモデルはガウス的な設定行動に収束する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:03:16 GMT)
Emergence of Fixational and Saccadic Movements in a Multi-Level Recurrent Attention Model for Vision [2.3] 本稿では,人間の視覚処理の神経階層を明示的にモデル化する新しいハードアテンションフレームワークを提案する。
MRAMは,2つの繰り返し層における視覚的位置生成とタスク実行の機能を分離することにより,固定とサスカディック運動のバランスのとれた動作を創出する。
以上の結果から,MRAMは人間の注意力だけでなく,標準画像分類ベンチマークにおいてCNN,RAM,DRAMのベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:48:36 GMT)
Re-identification of De-identified Documents with Autoregressive Infilling [2.2] 本稿では、背景知識を表す文書のデータベースに基づいて、再識別の逆過程を試み、RAGにインスパイアされた新しい手法を提案する。
特定されていないテキストの80%を回復し、背景知識のレベルとともに再識別精度が向上する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:43:54 GMT)
MatPredict: a dataset and benchmark for learning material properties of diverse indoor objects [2.2] MatPredictは、Replicaデータセットの高品質な合成オブジェクトとMat Synthのマテリアルプロパティクラスを組み合わせたデータセットである。
我々は、特定の前景オブジェクトの3Dメッシュを選択し、異なる材料特性でそれらをレンダリングする。
異なる物質との光相互作用を正確にシミュレートすることで、我々は現実性を高めることができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:54:04 GMT)
Re-experiment Smart: a Novel Method to Enhance Data-driven Prediction of Mechanical Properties of Epoxy Polymers [2.1] 本稿では, 信頼性の低い外乱ケースを選択的に再実験することで, データセット品質を効率的に向上する手法を提案する。
提案手法は, 予測誤差(RMSE)を確実に低減し, 最小限の実験作業で精度を向上し, 再測定に必要なデータセットの約5%しか必要としない。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:42:18 GMT)
MoSE: Hierarchical Self-Distillation Enhances Early Layer Embeddings [2.1] 自己蒸留(Self-Distillation)は、様々なコード理解タスクにおける正確性のための推論コストの取引方法である。
我々のアーキテクチャは、特定のエンコーダ層を出口ヘッドとしてターゲットとして、テキスト・ツー・コード検索とコード・ツー・コード検索を改善している。
我々は、テキストからコードへのベンチマークを言語間のコード-コードペアで拡張するコード翻訳によって作成された新しいデータセットをリリースする。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:39:47 GMT)
Network-wide Quantum Key Distribution with Onion Routing Relay [2.1] Onion Relay(ORR)は、オンオンルーティングとポスト量子暗号(PQC)をキーリレー(KR)モデルに統合する。
ORRは、キー配布時間全体に大きな影響を与えることなく、大幅なセキュリティ改善を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:21:11 GMT)
Network-wide Quantum Key Distribution with Onion Routing Relay (Conference Version) [2.1] Onion Relay(ORR)は、オンオンルーティングとポスト量子暗号(PQC)をキーリレー(KR)モデルに統合する。
ORRは、中間の悪意のあるノードによって引き起こされるセキュリティリスクを回避し、エンドツーエンドのセキュリティを保証することを目的としている。
その結果、基本的なORRは高い暗号化オーバーヘッドを発生させるが、全体的なキー配布時間に大きな影響を及ぼすことなく、大幅なセキュリティ改善を提供することがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:18:19 GMT)
AutoGEEval: A Multimodal and Automated Framework for Geospatial Code Generation on GEE with Large Language Models [2.1] AutoGEEvalは、大規模言語モデル(LLM)を利用したGoogle Earth Engine(GEE)プラットフォーム上でのコード生成タスクの評価フレームワークである。
GEE Python APIをベースに構築されたAutoGEEvalは、26のGEEデータタイプにまたがる1325のテストケースからなるベンチマークスイート(AutoGEEval-Bench)を確立する。
我々は、GEEコード生成における性能特性と潜在的な最適化経路について、汎用、推論、コード中心、地学特化モデルを含む18の最先端LCMを評価した。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:35:58 GMT)
Spectral complexity of deep neural networks [2.1] 我々は,ネットワークアーキテクチャの複雑さを特徴付けるために,制限場の角パワースペクトルを用いる。
そこで我々は,ニューラルネットワークを低次,スパース,高次と分類する。
本稿では,この分類が標準アクティベーション関数の様々な特徴,特にReLUネットワークの空間特性を如何に強調するかを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:29:28 GMT)
A Game-Theoretic Quantum Algorithm for Solving Magic Squares [2.1] 完全量子優位性を持つ2プレイヤー非ローカルゲームであるマジックスクエアゲーム(MSG)の変分フレームワークを提案する。
我々は、ゲームのパリティと一貫性の制約を符号化する値ハミルトニアンを構築し、パラメータ化された量子回路を最適化し、このコストを最小化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:12:53 GMT)
Sight, Sound and Smell in Immersive Experiences of Urban History: Virtual Vauxhall Gardens Case Study [2.1] 本研究は, 嗅覚を含む多感覚体験を, 歴史的空間のVR再構成に効果的に統合する方法について検討した。
ロンドンのVauxhall Pleasure GardensをVRで再現するにあたって、私たちはネットワーク化されたポータブル嗅覚ディスプレイを開発しました。
以上の結果から,VR体験に同期嗅覚を取り入れることで,ユーザのエンゲージメントが向上し,肯定的な知覚がもたらされることが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:00:42 GMT)
Aspects of complexity in automotive software systems and their relation to maintainability effort. A case study [2.1] 車両内の大規模な組込みシステムは、サイズと複雑さが増大する傾向にあり、これらのシステムを維持する際に困難を引き起こす。
我々は、開発者が保守可能性の取り組みと様々な複雑さの源との関係をどう認識するかを考察する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:06:24 GMT)
Supporting Evidence-Based Medicine by Finding Both Relevant and Significant Works [2.1] 医療用赤外線(IR)の妥当性と信頼性を改善するための新しいアプローチを提案し,その考え方をLoE(Level of Evidence)の概念に基づいて検討する。
LoEフレームワークは、基礎となる経験的証拠に基づいて、医学出版物を7つの異なるレベルに分類する。
我々は,医療出版物にLoEを自動的に割り当てる分類モデルを開発し,MEDLINEデータベース内の2600万以上の文書をLoEクラスに分類することに成功した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:37:44 GMT)
Greed is Good: A Unifying Perspective on Guided Generation [2.1] 勾配に基づくガイダンスの問題を解決するために,2種類のテクニックが出現している。
その結果,これら2つの家族は,後部指導で実際に一体化できることが判明した。
次に,この2つのファミリ間の補間手法を用いて,誘導勾配の計算と精度のトレードオフを可能にする方法を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:57:30 GMT)
Bethe-ansatz diagonalization of steady state of boundary driven integrable spin chains [2.0] XXZスピン鎖の非平衡定常状態(NESS)の密度作用素は準粒子の項で記述できる。
散逸性ドレッシングは分散関係において余分な特異点を生成し、対応するコヒーレントモデルのスペクトルに関してNESSスペクトルを強く修正する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:43:57 GMT)
Sparse Matrix in Large Language Model Fine-tuning [2.0] 本稿では,PEFTとフル微調整性能の差を最小限に抑えるために,スパースサブ行列を選択する手法を提案する。
実験では,本手法が他のPEFTベースラインを一貫して上回ることを示した。
また,訓練可能なパラメータの数が増加するにつれて,LoRAとDoRAの性能が低下する傾向を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:24:18 GMT)
Collapsing Taylor Mode Automatic Differentiation [2.0] 計算グラフを書き換えることで導関数を「分解」するテイラーモードの最適化手法を提案する。
一般線形PDE演算子やランダム化Taylorモードに適用する方法を示す。
崩壊手順を実装し、人気のあるPDE演算子で評価し、Taylorモードを高速化し、ネストしたバックプロパゲーションより優れていることを確認した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:31:31 GMT)
Computer Vision Models Show Human-Like Sensitivity to Geometric and Topological Concepts [1.9] コンピュータビジョンモデルと幾何学的・トポロジカル(GT)概念に対する人間の感度について検討する。
私たちは、大規模な画像データセットに基づいてトレーニングされたコンピュータビジョンモデルを使用します。
トランスフォーマーベースのモデルは、幼児よりも高い総合的精度を達成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:04:53 GMT)
BeamClean: Language Aware Embedding Reconstruction [1.9] 本稿では,サーバ上の言語モデルに送信される難解な入力埋め込みに対する逆攻撃について検討する。
本研究では,ノイズパラメータを推定し,トークンシーケンスを復号する逆攻撃であるBeamCleanを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:14:22 GMT)
MVPainter: Accurate and Detailed 3D Texture Generation via Multi-View Diffusion with Geometric Control [1.8] 基準テクスチャアライメント,幾何テクスチャ一貫性,局所テクスチャ品質の3次元レンズによる3次元テクスチャ生成について検討した。
本稿では,テクスチャの忠実度と詳細性を高めるために,データフィルタリングと拡張戦略を利用するMVPainterを提案する。
実世界のレンダリングアプリケーションに適したPBRメッシュを生成するために、生成したビューから物理ベースレンダリング(PBR)属性を抽出する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:40:24 GMT)
The Others: Naturally Isolating Out-of-Distribution Samples for Robust Open-Set Semi-Supervised Learning [1.8] MagMatchは、プロトタイプベースのコントラスト学習パラダイムを通じて、OODサンプルを自然に分離するフレームワークである。
我々は,MagMatchが,閉集合分類精度とOOD検出AUROCの両方において,既存の手法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:18:27 GMT)
Cross-Cloud Data Privacy Protection: Optimizing Collaborative Mechanisms of AI Systems by Integrating Federated Learning and LLMs [1.8] 我々は,分散ノードからモデル更新を集約することで,元のデータを公開せずにフェデレーション学習が機能する,クロスクラウドアーキテクチャを導入する。
モデルの更新とトレーニングデータのプライバシと整合性を保証するために、セキュアなコミュニケーション層を導入して、さらに革新しました。
実験結果から,提案手法は従来のフェデレーション学習モデルよりも精度,収束速度,データプライバシ保護の点で有意に優れていることがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:14:27 GMT)
To Bias or Not to Bias: Detecting bias in News with bias-detector [1.8] 我々は、専門家注釈付きBABEデータセット上でRoBERTaベースのモデルを微調整することで、文レベルのバイアス分類を行う。
本稿では,ドメイン適応型DA-RoBERTaベースラインとの比較において,統計的に有意な性能向上を示す。
メディアバイアス検出のための,より堅牢で説明可能な,社会的に責任のあるNLPシステムの構築に寄与する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:54:39 GMT)
AutoMathKG: The automated mathematical knowledge graph based on LLM and vector database [1.8] 数学知識グラフ(KG)は、数学の分野における知識を構造化された方法で提示する。
本稿では,自動更新が可能な高品質・広包・多次元数学KGであるAutoMathKGを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:41:29 GMT)
Adversarial Attacks on Data Attribution [1.7] データ属性は、AIモデルの出力に対する個々のトレーニングデータポイントのコントリビューションの定量化を目的としている。
本稿では, 処理したデータセットを生成し, 補償を逆方向に拡大するシャドウアタックとアウトリーアタックという2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:31:09 GMT)
Two out of Three (ToT): using self-consistency to make robust predictions [1.7] 深層学習モデルでは,不確実な場合の解答を回避できるアルゴリズムを開発した。
我々のアルゴリズムは「Two out Three (ToT)」と呼ばれ、人間の脳が情報に干渉する際の感度にインスパイアされている。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:50:19 GMT)
Spiking Neural Network: a low power solution for physical layer authentication [1.7] スパイキングニューラルネットワーク(SNN)は消費電力の面で効率的であることが知られている。
本研究では,SNNが物理層認証に利用できるかどうかを問う。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:00:28 GMT)
Origin-Destination Pattern Effects on Large-Scale Mixed Traffic Control via Multi-Agent Reinforcement Learning [1.7] 人力車両とロボット車両の両方を含む大規模な混在交通制御は未調査のままである。
大規模混在トラフィックネットワークを管理するための分散型マルチエージェント強化学習フレームワークを提案する。
コロラド州コロラドスプリングスに14の交差点を持つ実世界のネットワークを構築した。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:36:05 GMT)
Learning Efficient Recursive Numeral Systems via Reinforcement Learning [1.7] 従来、強化学習(RL)を用いることで、エージェントは人間に類似した単純な近似的かつ正確に制限された数字系を導出することができることが示されている。
本稿では,効率的な再帰的数体系の出現に関する力学的な説明を導出する手法を提案する。
相互作用を通して徐々に修正されるメタ文法を用いて、数値についてコミュニケーションする方法を学ぶエージェントのペアについて検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:58:27 GMT)
Josephson Junctions in the Age of Quantum Discovery [1.7] ジョセフソン接合は超伝導回路に基づく現代の量子技術の革新的進歩を推進してきた。
これらの超伝導デバイスは、量子コンピューティング、量子センシング、および量子通信にまたがる発展を支えている。
この視点は、量子技術の推進におけるジョセフソン接合研究の基礎的役割を探求する。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:27:16 GMT)
Inferring stochastic dynamics with growth from cross-sectional data [1.7] 本稿では,成長を伴うダイナミックスとしてモデル化された生物学的プロセスの課題に対処する,新しい確率フロー推定手法を提案する。
フォッカー・プランク方程式のラグランジアン定式化を利用して, 本手法は内在雑音や成長からドリフトを正確に解離する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:51:47 GMT)
A Skull-Adaptive Framework for AI-Based 3D Transcranial Focused Ultrasound Simulation [1.7] 経頭蓋集束超音波(TFUS)は、非侵襲的な脳刺激と治療介入の新たなモダリティである。
TFUScapesは、解剖学的に現実的な人間の頭蓋骨を通して、最初の大規模で高解像度のtFUSシミュレーションデータセットである。
DeepTFUSは、入力された3次元CTボリュームとトランスデューサ位置から直接正規化された圧力場を推定するディープラーニングモデルである。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:37:51 GMT)
Optimality Condition for the Petz Map [1.6] 量子誤差補正において、ペッツ写像はクニル・ラフラム条件を満たすとき、完全回復写像として機能する。
この研究は、初めて、絡み合いの忠実度の観点から、ペッツ写像の最適性に必要な必要十分条件を紹介し、証明する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:33:13 GMT)
Score-Based Training for Energy-Based TTS Models [1.6] ノイズコントラスト推定(NCE)は、難解な正規化項を持つエネルギーベースモデル(EBM)を訓練するための一般的な手法である。
本稿では,1次スキームに適したスコアを学習する新しい基準を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:12:25 GMT)
Optimal Formats for Weight Quantisation [1.6] 本稿では,量子化フォーマットの体系的設計と分析のためのフレームワークを提案する。
一般的なフォーマットの実践的パフォーマンスは,可変長符号を用いた値表現能力に起因していることが示される。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:26:54 GMT)
STE-QUEST -- Space Time Explorer and QUantum Equivalence principle Space Test: The 2022 medium-class mission concept [1.6] STE-QUESTミッションは、物理学の最も基本的な3つの問題に取り組むことを目的としている。
この衛星は、長期にわたって運用される2種の原子干渉計を備えた衛星ミッションで構成されている。
このミッションは物理学における最も基本的な3つの問題に取り組むことを目的としており、 (i) 自由落下の普遍性をテストすること、 (ii) 様々な形態のウルトラライトダークマターを探索すること、 (iii) 量子力学の基礎を精査することである。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:56:54 GMT)
Stochastic Learning of Computational Resource Usage as Graph Structured Multimarginal Schrödinger Bridge [1.6] 本稿では,グラフ構造を持つSchr"odingerブリッジ問題として,時間変化の計算資源利用法を提案する。
シングルコアおよびマルチコアのケースで学習するための詳細なアルゴリズムを提供し、収束保証、計算複雑性について議論し、それらの実用性を実証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:09:45 GMT)
CAIM: Development and Evaluation of a Cognitive AI Memory Framework for Long-Term Interaction with Intelligent Agents [1.6] 大規模言語モデル(LLM)は人工知能(AI)の分野を進歩させ、インタラクティブシステムのための強力なイネーブラーとなっている。
ユーザに対して適応する必要のある長期的なインタラクションや、常に変化する環境のコンテキスト的知識や理解において、依然として課題に直面しています。
これらの課題を克服するためには、インタラクションセッション間で関連情報を効率的に検索し保存するために、全体論的メモリモデリングが必要である。
コンピュータ化されたモデルで人間の思考プロセスをシミュレートすることを目的とした認知AIは、思考、記憶機構、意思決定といった興味深い側面を強調している。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:33:52 GMT)
ACE: Confidential Computing for Embedded RISC-V Systems [1.5] 本稿では,オープンソースのロイヤリティフリーな秘密計算技術である Assured Confidential Execution (ACE) を紹介する。
我々は、ACEの構築に使用した原則と方法論を提示し、他の組み込みシステムの開発にも適用できるかもしれない。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:32:43 GMT)
Augmented Regression Models using Neurochaos Learning [1.5] 本稿では,ニューロカオス学習フレームワークから派生したトレーサミア特徴を従来の回帰アルゴリズムに統合した,ニューロカオス学習(NL)を用いた新しい回帰モデルを提案する。
提案手法は,10種類の実生活データセットと,$y = mx + c + epsilon$という形式の合成データセットを用いて評価した。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:02:14 GMT)
I'll believe it when I see it: Images increase misinformation sharing in Vision-Language Models [1.5] 本稿では,画像がニュースコンテンツを再共有する視覚言語モデルの妥当性にどのように影響するかについて検討する。
モデルファミリーでの実験では、画像の存在が真のニュースでは4.8%、偽ニュースでは15.0%増加していることが明らかになった。
ダークトライアドの特徴は偽ニュースの再共有を増幅する一方、共和党のプロフィールは正確さの感度を低下させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:20:54 GMT)
Automating construction contract review using knowledge graph-enhanced large language models [1.5] 本稿では,大規模言語モデル (LLMs) と知識グラフ (KGs) を統合することで,自動契約リスク識別の精度と解釈可能性を高めることができるかを検討する。
LLMとNested Contract Knowledge Graph(NCKG)を統合し,Graph Retrieval-Augmented Generation(GraphRAG)フレームワークを用いて,契約知識の検索と推論を行う。
国際的なEPC契約に基づいてテストし、ベースラインモデルよりも正確なリスク評価と解釈可能なリスクサマリーを実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:05:53 GMT)
Deep Probabilistic Modeling of User Behavior for Anomaly Detection via Mixture Density Networks [1.5] 本稿では,深層混合密度ネットワークに基づく異常検出手法を提案する。
行動データに共通するマルチモーダル分布特性を効果的に捉える。
実世界のネットワークユーザデータセットUNSW-NB15で実験を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:18:49 GMT)
Ehrenfest's theorem beyond the Ehrenfest time [1.5] 環境誘起拡散の強さが$D gg (hbar/s_H)4/3 D_H$を満たすとき、量子的および古典的進化は近いことを証明している。
我々の境界に基づいて、量子リンドブラッド力学をシミュレートするための効率的な古典的アルゴリズムを与える。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:25:47 GMT)
Classical correspondence beyond the Ehrenfest time for open quantum systems with general Lindbladians [1.5] 量子系と古典系は同じ形式的ハミルトニアン$H$の下で進化するが、エレンフェストの時間スケールの後に劇的に異なる可能性がある。
十分に正則なハミルトニアン$H(x,p)$とリンドブラッド函数$L_k(x,p)$の量子的および古典的進化の間の誤差を有界に証明する。
短い共役論文では、線形リンドブラッド作用素を用いて運動エネルギーとポテンシャルエネルギーに分解するハミルトニアンの特別な場合を扱う。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:16:31 GMT)
FlowPure: Continuous Normalizing Flows for Adversarial Purification [1.5] 敵の浄化は 有望な防衛戦略として浮上した
条件付きフローマッチング(CFM)を訓練した連続正規化フロー(CNF)に基づく新しい浄化法であるFlowPureを提案する。
以上の結果から,FlowPureは高効率な浄化剤であるが,対向検出に強い可能性を秘めていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:04:43 GMT)
Structure-based Anomaly Detection and Clustering [1.5] 異常検出は、医療、製造、サイバーセキュリティといった領域における根本的な問題である。
本論文では,構造化データとストリーミングデータの両方において,異常検出のための新しい教師なし手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:20:00 GMT)
Non-planar Object Detection and Identification by Features Matching and Triangulation Growth [1.5] シーン画像中のテンプレートの歪みを検知し,識別するための特徴に基づく手法を提案する。
テンプレート機能のDlaunay三角測量は,このアプローチでガイドすべき有用なツールだと考えている。
我々の解は、幾何学的モデル(例えばホモグラフィー)が持たない状況における対象の同定を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:20:07 GMT)
Enhancing LLMs for Power System Simulations: A Feedback-driven Multi-agent Framework [1.4] 本稿では,電力系統のシミュレーションを管理するためのフィードバック駆動型マルチエージェントフレームワークを提案する。
改良された検索拡張生成モジュール(RAG)、改良された推論モジュール、エラーフィードバック機構を備えた動的環境作用モジュールの3つのモジュールが提案されている。
ChatGPT 4o、o1-preview、微調整されたGPT-4oは、いずれも複雑なタスクで30%未満の成功率を達成した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:51:40 GMT)
Phare: A Safety Probe for Large Language Models [1.4] 大規模言語モデル(LLM)の探索と評価を行うための診断フレームワークであるPhoreを紹介する。
本評価では, 筋力, 敏感性, ステレオタイプ再現など, あらゆる安全次元にまたがる系統的脆弱性のパターンを明らかにする。
Phareは研究者や実践者に、より堅牢で整合性があり、信頼できる言語システムを構築するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:01:44 GMT)
TS-VLM: Text-Guided SoftSort Pooling for Vision-Language Models in Multi-View Driving Reasoning [1.4] VLM(Vision-Language Models)は、シーン認識、推論、意思決定を強化する可能性を示している。
既存のモデルは、計算オーバーヘッドとマルチビューセンサーデータの非効率な統合に悩まされている。
本稿では,新しいテキストガイドソフトソートプール(TGSSP)モジュールを組み込んだ,TS-VLMという軽量なVLMを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:37:15 GMT)
Understanding Task Representations in Neural Networks via Bayesian Ablation [1.4] 本稿ではニューラルネットワークにおける潜在タスク表現を解釈するための新しい確率的フレームワークを提案する。
ベイズ推定にインスパイアされた本手法は,タスク性能に対する因果的寄与を推定するために,表現単位を超越した分布を定義する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:36:09 GMT)
The Way Up: A Dataset for Hold Usage Detection in Sport Climbing [1.4] 我々は22の注釈付きクライミングビデオのデータセットを導入し、保持場所、使用順序、使用時刻などの接地木ラベルを提供する。
また,キーポイントに基づく2次元ポーズ推定モデルのスポーツクライミングにおけるホールド利用検出への応用についても検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:41:18 GMT)
Minimum Description Length of a Spectrum Variational Autoencoder: A Theory [1.4] 本稿では、自己教師型で説明可能な表現を形成するための闘争と、厳密な情報圧縮能力の欠如を結びつける新しい理論を提案する。
この研究は完全に理論的であり、最小記述長の原理に従うだけで自己監督可能なAIを実現するための将来の研究を刺激することを目的としている。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:44:36 GMT)
Building spatial world models from sparse transitional episodic memories [1.3] ニューラルネットワークは,スパースや不連続なエピソード記憶から周囲の空間モデルを構築することができることを示す。
本研究では,Epsodic Space World Model (ESWM) はサンプル効率が高く,環境のロバストな表現を構築するためには最小限の観測が必要であることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:56:24 GMT)
How Adding Metacognitive Requirements in Support of AI Feedback in Practice Exams Transforms Student Learning Behaviors [1.3] 本稿では,AIが生成したフィードバックを対象とする教科書参照と統合した実践試験システムを提案する。
本システムでは,生徒に回答を説明し,自信を宣言することで,メタ認知行動を促進する。
OpenAIのGPT-4oを使用して、この情報に基づいてパーソナライズされたフィードバックを生成し、関連する教科書セクションに誘導する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:25:07 GMT)
Evaluating the Performance of RAG Methods for Conversational AI in the Airport Domain [1.2] 空港のスタッフが飛行情報システムとコミュニケーションできる会話型AIシステムを実装した。
このシステムは、空港の標準的な問い合わせに答えるだけでなく、空港の用語、用語、略語、推論に関する動的問題も解決する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:46:30 GMT)
The Mystery of the Pathological Path-star Task for Language Models [1.2] 最近導入されたパススタータスクは、言語モデルの能力に対する制限を実証するために設計された最小限のタスクである。
代替設定で教師の強制でタスクが学習可能であることを実証し、一部は表現によるものであることを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:34:08 GMT)
Language Models, Graph Searching, and Supervision Adulteration: When More Supervision is Less and How to Make More More [1.2] この作業は、グラフを検索する最小の例であるパススタータスクに関係している。
言語モデル(LM)には$G$、$s$、ターゲットノード$t$が与えられる。
タスクの最小限の性質は,タスクの分解を防ぐため,その難しさを生じさせる。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:20:06 GMT)
Multi-Resolution Haar Network: Enhancing human motion prediction via Haar transform [1.2] 3次元人間のポーズ予測は、前回のシーケンスから人間の将来の動きを予測することを目的としている。
人間の動き列の任意性は、時間軸と空間軸の両方における遷移の確固たる起源を持っていることを無視することは、最先端の手法の性能を制限している。
本稿では,2次元Haar変換を用いて高分解能座標を投影するHaarMoDicというネットワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:38:31 GMT)
Eye Tracking Based Cognitive Evaluation of Automatic Readability Assessment Measures [1.2] 本稿では,視線追跡に基づく認知フレームワークを提案する。
我々は,この枠組みを用いて,教育に広く用いられている2つのシステムを含む,幅広い可読性の評価を行う。
分析の結果,既存の可読性尺度は読みやすさや読みやすさの予測因子に乏しいことが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:16:00 GMT)
Enhancing Channel-Independent Time-Series Forecasting via Cross-Variate Patch Embedding [1.2] チャネル非依存(CI)モデルにクロスバリアントコンテキストを注入する軽量CDモジュールとして,CVPE(Cross-Variate Patch Embeddings)を提案する。
CVPEをマルチモーダルCI予測モデルであるTime-LLMに統合し,その有効性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:41:14 GMT)
MRM3: Machine Readable ML Model Metadata [1.2] そこで本研究では,Neo4jをベースとしたKGに113ノードと199リレーションを組み込んだ,4つのデータセット上でトレーニングされた22のモデルからなる,無線ローカライゼーションモデルメタデータデータセットの例を示す。
モデルメタデータは、エネルギー消費や炭素フットプリントといった環境影響指標を取り入れつつ、より構造化され、機械で読めます。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:50:00 GMT)
Information Science Principles of Machine Learning: A Causal Chain Meta-Framework Based on Formalized Information Mapping [1.1] 本研究は、機械学習における統一的な論理的枠組みの欠如に対処することに焦点を当てる。
モデル解釈可能性と倫理的安全性に関する普遍的な定義が提案されている。
3つの重要な定理は、モデル解釈可能性と情報回復可能性の等価性、倫理的安全性の保証、一般化誤差の推定である。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:39:41 GMT)
The Hidden Strength of Disagreement: Unraveling the Consensus-Diversity Tradeoff in Adaptive Multi-Agent Systems [1.1] エージェントが独立して情報交換を行う暗黙のコンセンサスは、動的環境においてより効果的である、と我々は主張する。
我々は、暗黙の手法が明示的な手法よりも優れている条件を示す、コンセンサスと多様性のトレードオフを定式化する。
我々は、回復力のある意思決定のために多様性を維持することの価値を強調し、文脈内学習による創発的な調整を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:45:13 GMT)
Quantifying Context Bias in Domain Adaptation for Object Detection [1.1] オブジェクト検出のためのドメイン適応(DAOD)は、トレーニングされたモデルをソースからターゲットドメインに転送しようとする。
我々は、適応中の背景特徴の変化と、異なる領域におけるコンテキストバイアスがどのように表現されるかを分析する。
現状のドメイン適応手法はある種のコンテキストバイアスを示し、コンテキストバイアスを軽減するために潜在的に単純な方法を適用する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:50:40 GMT)
Large Linguistic Models: Investigating LLMs' metalinguistic abilities [1.1] 我々は,大規模言語モデルが言語データの有効なメタ言語学的分析を生成できることを初めて示す。
我々は,OpenAI (2024) o1が,構文木の作成や音韻的一般化に関わるタスクにおいて,他のモデルよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:21:18 GMT)
Towards identifiability of micro total effects in summary causal graphs with latent confounding: extension of the front-door criterion [1.1] 研究者はしばしば、これらの効果が観測データから特定できるかどうかを因果グラフに頼っている。
本稿では, 動的システムにおいて, 特定かつよく知られた部分的グラフを用いて, 全効果を同定する課題について述べる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:40:09 GMT)
Frozen Backpropagation: Relaxing Weight Symmetry in Temporally-Coded Deep Spiking Neural Networks [1.1] ニューロモルフィックハードウェア上でのスパイキングニューラルネットワーク(SNN)の直接トレーニングは、GPUベースのトレーニングと比較してエネルギーコストを大幅に削減することができる。
このようなハードウェア上のバックプロパゲーション(BP)は、通常、前方と後方のパスは異なる重みを持つ別々のネットワークによって実行されるため、困難である。
BPに基づくトレーニングアルゴリズムであるFrozen Backpropagation (fBP)を導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:35:20 GMT)
Language Models Are Capable of Metacognitive Monitoring and Control of Their Internal Activations [1.0] 大規模言語モデル(LLM)は、タスクの解決に実際に使用している戦略を報告することができるが、失敗することもある。
これはメタ認知の程度、つまり、その後の報告と自己制御のために自分自身の認知プロセスを監視する能力を示している。
我々は,LLMの活性化パターンを明示的に報告し,制御する能力を定量化するために,神経科学にインスパイアされた神経フィードバックパラダイムを導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:32:25 GMT)
What Lives? A meta-analysis of diverse opinions on the definition of life [1.0] 生命の定義は、まだ普遍的に受け入れられていない。
合成生物学、人工知能、宇宙生物学の進歩は、生きることの意味についての私たちの伝統的な概念に挑戦します。
我々は、大規模言語モデルを利用した方法論的アプローチを用いて、学際的専門家のキュレートされたセットによって提供される生命の定義を解析する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:17:37 GMT)
Correspondence of high-dimensional emotion structures elicited by video clips between humans and Multimodal LLMs [1.0] 近年の研究では、人間の感情は高次元の複雑な構造を示すことが明らかになっている。
本稿では,MLLM(Multimodal Large Language Models)がこれらの複雑な感情をいかに捉えているかを検討した。
以上の結果から,現在最先端のMLLMは,カテゴリレベルでの複雑な高次元感情構造を広く捉えていることが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:03:22 GMT)
Robin: A multi-agent system for automating scientific discovery [1.0] Robinは、科学プロセスの重要な知的ステップを完全に自動化できる最初のマルチエージェントシステムである。
文献検索エージェントとデータ分析エージェントを統合することで、Robinは仮説を生成し、実験を提案し、実験結果を解釈し、最新の仮説を生成することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:36:17 GMT)
ELECTRA: A Cartesian Network for 3D Charge Density Prediction with Floating Orbitals [1.0] 浮遊軌道を用いた電子電荷密度の同変モデルを提案する。
提案手法は,確立したベンチマーク上での計算効率と予測精度の最先端バランスを実現する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:30:37 GMT)
FedCTTA: A Collaborative Approach to Continual Test-Time Adaptation in Federated Learning [1.0] Federated Learning (FL)は、生データを共有せずに、分散クライアント間で協調的なモデルトレーニングを可能にする。
FLモデルは、トレーニングとデプロイメントの間の分散シフトによって、しばしばパフォーマンスが低下する。
我々は、フェデレートされた適応のためのプライバシー保護と計算効率のよいフレームワークであるFederated Continual Test-Time Adaptation (FedCTTA)を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:29:51 GMT)
PACE: Abstractions for Communicating Efficiently [0.9] 人間は抽象化を導入して使うのが得意です。
この現象を再現しようとするいくつかの計算手法が試みられているが、抽象概念の導入と学習について非現実的な仮定を下している。
我々はこれをコミュニケーションと強化学習のためのニューラルな手法と組み合わせ、新しい抽象化を導入する際の探索と搾取のトレードオフを制御するために、バンディットアルゴリズムを新たに活用する。
私たちの仕事は、人間のようなコミュニケーション抽象化機能を備えた会話エージェントを提供するための第一歩として役立ちます。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:53:54 GMT)
On the Boolean Network Theory of Datalog$^\neg$ [0.9] 我々はDatalog$neg$とBooleanネットワーク理論の正式なリンクを確立する。
我々は、Datalog$neg$プログラムに奇数サイクルがない場合、正規モデルと安定モデルが一致することを示す。
この接続はまた、Datalog$neg$プログラムの安定部分、正則、安定モデルの数値に新しい上限を与える。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:00:47 GMT)
Consistency Conditions for Differentiable Surrogate Losses [0.9] Indirect elicitation (IE) is still equivalent to calibration for non-polyhedral surrogates。
まず、穏やかな条件下では、IEとキャリブレーションは、このクラスにおける一次元の損失と同値であることを示す。
これらの結果を多種多様な問題に適用し、一貫した差別化可能なサロゲートを設計・分析するためのIEと強力なIEのパワーを実証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:17:36 GMT)
KHRONOS: a Kernel-Based Neural Architecture for Rapid, Resource-Efficient Scientific Computation [0.9] KHRONOSはモデルベース、モデルフリー、モデル反転タスクのためのAIフレームワークである。
推論の複雑さは内部積に支配され、ミリ秒以下のフルフィールド予測をもたらす。
KHRONOSは、制約付きエッジコンピューティング、オンライン制御、コンピュータビジョンなどにおける新たな道を開く。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:29:07 GMT)
Automated Bias Assessment in AI-Generated Educational Content Using CEAT Framework [0.9] AIが生成したコンテンツ(性別、人種、国家のステレオタイプなど)に埋め込まれたバイアスは、重要な倫理的および教育上の懸念を提起する。
本研究では,文脈適応型埋め込みアソシエーションテストとプロンプトエンジニアリングによる単語抽出を併用した自動バイアス評価手法を提案する。
その結果,r = 0.993のピアソン相関係数を用いて,自動単語集合と手動単語集合の間に高いアライメントを示し,信頼性と一貫したバイアス評価を示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:19:26 GMT)
Automatic mixed precision for optimizing gained time with constrained loss mean-squared-error based on model partition to sequential sub-graphs [0.9] 混合精度(MP)は、ネットワーク層間での数値的精度の変化によってトレードオフを緩和する。
本研究では,PTQ(Post-Training Quantization)内の最適なMP構成を自動的に選択することに焦点を当てた。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:51:02 GMT)
RN-F: A Novel Approach for Mitigating Contaminated Data in Large Language Models [0.9] Residual-Noise Fingerprinting (RN-F)は、大規模言語モデル(LLM)における汚染データを検出するための新しいフレームワークである。
RN-Fは、追加の浮動小数点演算を導入することなく残留信号パターンを活用する、単一パスで勾配のない検出方法である。
RN-Fは、既存の最先端手法を一貫して上回り、汚染検出指標の最大10.5%のパフォーマンス向上を実現していることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:32:49 GMT)
Simulation Agent: A Framework for Integrating Simulation and Large Language Models for Enhanced Decision-Making [0.8] 大規模言語モデル(LLM)は直感的で言語ベースの相互作用を提供するが、複雑な実世界の力学を確実にモデル化するために必要な構造的、因果的理解が欠如している。
シミュレーションモデルとLLMの長所を統合する新しい手法であるシミュレーションエージェントフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:27:18 GMT)
Parametric Stability Analysis for Circuit Quantum Electrodynamical Hardwares [0.8] 時間依存変調は、その力学をMathieu型方程式にどのようにマッピングするかを示す。
摂動補正は高調波や弱い非線形性のような効果を捉える。
これらの結果から,読み出し精度,増幅ゲイン,マルチキュービットゲート安定性のしきい値が示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:31:46 GMT)
Reshaping quantum device noise via repetition code circuits [0.8] そこで,本研究では,ネイティブトラップイオン2量子エンタングゲートに付随するノイズを解析的に,数値解析的に検討した。
量子ハードウェアIonQ Aria-1について実験を行った。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:22:53 GMT)
Transfer and routing of Gaussian states through quantum complex networks with and without community structure [0.8] 単一モードガウス状態のルーティングと量子調和振動子の複雑なネットワークによる絡み合いについて検討する。
ランダムで均一なネットワークであっても、転送の忠実度は、任意のリンク密度のノードの度合いに依存する。
本研究は,国家移動と関連する課題におけるコミュニティ構造の役割のさらなる探求の道を開くものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:45:19 GMT)
4Hammer: a board-game reinforcement learning environment for the hour long time frame [0.8] LLM(Large Language Models)は、短い時間枠を持つタスクでは高いパフォーマンスを示すが、長い時間を要するタスクでは苦労する。
本稿では,Warhammer 40,000-a complex, zero-sum board game のデジタル双対シミュレーションである 4Hammer 強化学習環境を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:19:22 GMT)
VesselGPT: Autoregressive Modeling of Vascular Geometry [0.8] この研究は、自己回帰的な方法で血管を初めて生成した。
コード、データ、トレーニングされたモデルが利用可能になる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:30:26 GMT)
Uncovering the Genetic Basis of Glioblastoma Heterogeneity through Multimodal Analysis of Whole Slide Images and RNA Sequencing Data [0.7] グリオ芽腫は、急速な進行と予後不良を特徴とする、非常に攻撃的な脳腫瘍である。
以上の結果より, グリオ芽腫に関連のある新規遺伝子が同定された。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:22:26 GMT)
DAOs of Collective Intelligence? Unraveling the Complexity of Blockchain Governance in Decentralized Autonomous Organizations [0.7] 分散型自律組織(DAO)は、従来のコントロールから分散化アプローチに移行することで、組織構造を変革した。
重要な資金の管理やグローバルネットワークの構築にもかかわらず、階層構造は参加の減少、集中化の増大、変化する環境に適応できないといった課題に直面している。
本稿では,複雑なシステムについて考察し,その非効率性を説明するために複雑性科学を適用した。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:20:47 GMT)
Uncertainty quantification of neural network models of evolving processes via Langevin sampling [0.7] 本稿では,履歴依存プロセスの一般的なモデルのための拡張性のある近似推論ハイパーネットワークフレームワークを提案する。
化学反応と物質物理データを用いたアンサンブルサンプリングハイパーネットワークの性能を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:29:44 GMT)
The Computation of Generalized Embeddings for Underwater Acoustic Target Recognition using Contrastive Learning [0.7] 海洋環境における音汚染は、海洋の健康に対する脅威を増大させる。
このノイズをモニターすることで、汚染の原因となるソースをマッピングすることができる。
これにより大量のデータ記録が生成され、船舶活動や海洋哺乳類の発声などの音源が混在している。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:37:46 GMT)
Decoding across transversal Clifford gates in the surface code [0.7] 回転しない曲面符号に対して任意のウィンドウゲート列をデコードする方法を示す。
我々の研究は、表面コードのための高速論理の効率的な復号化における複雑さと関心を強調している。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:00:02 GMT)
Topology-driven identification of repetitions in multi-variate time series [0.7] 多変量時系列における再発時間を推定するための永続的ホモロジーフレームワークを提案する。
フレームワーク内に3つの専門的な方法を提供し、実際のデータを用いて確実に安定し、検証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:34:10 GMT)
Sample Complexity of Black Box Work Extraction [0.7] 量子システムから作業を引き出すのに必要な未知の状態のサンプル数を分析する。
本研究は、未知の状態の有効性を量子電池として評価するための、サンプル効率のよいプロトコルを開発する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:24:45 GMT)
An Open Quantum System of Coupled Rotors [0.7] 2つの結合ローターの量子力学系は、オープン量子系の観点から研究される。
ローターの一方が一体化され、他方のローターの減少密度演算子が研究される。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:39:15 GMT)
RevCD -- Reversed Conditional Diffusion for Generalized Zero-Shot Learning [0.7] コンピュータビジョンでは、視覚的特徴と利用可能なセマンティック情報の関係を利用して、目に見えないカテゴリからの知識を未知のカテゴリに転送する。
本稿では,視覚入力から意味的特徴を生成することで,この問題を緩和する逆条件拡散モデル(RevCD)を提案する。
我々のRevCDモデルは、正弦波時間スケジュールのクロスアダマール・アドデッション埋め込みと、注意誘導型埋め込みのためのマルチヘッド視覚変換器からなる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:39:17 GMT)
Calibration Strategies for Robust Causal Estimation: Theoretical and Empirical Insights on Propensity Score-Based Estimators [0.7] 推定と校正のためのデータの分割は、確率スコアに基づく推定器の性能に重大な影響を及ぼす。
提案手法は,確率スコア推定のためのキャリブレーション手法の最近の進歩を延長し,挑戦的な設定における確率スコアの堅牢性を向上させる。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:23:50 GMT)
Prink: $k_s$-Anonymization for Streaming Data in Apache Flink [0.6] 我々は、現実世界のアプリケーションアーキテクチャにおけるks匿名化データストリームのための新しい概念であり、完全に実装されたプロトタイプであるPrinkを紹介する。
Prinkは、非数値(分類や階層的に一般化可能な)ストリーミングデータのセマンティックス対応ks匿名化を、情報損失最適化方式で初めて導入した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:13:30 GMT)
Characterizing asymmetric and bimodal long-term financial return distributions through quantum walks [0.6] 離散時間量子ウォークに基づくモデルを用いて、観測された非対称性と双モード性を特徴づける。
この分析は、長期にわたって出現するより広範なトレンドとパターンを捉えることで、従来の短期モデルを補完する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:04:10 GMT)
Understanding University Students' Use of Generative AI: The Roles of Demographics and Personality Traits [0.6] 高等教育の学生は、伝統的な資源よりも生成的AI(GAI)を使う傾向が強い。
アジアの学生は、より高いGAI使用率を報告し、より学術的な利益を認識し、より強い嗜好を表現している。
黒人学生は、GAIが学業成績によりポジティブな影響を及ぼすと報告している。
高い知能/想像力を持つ学生は伝統的な資源を好む傾向にある。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:44:16 GMT)
Systematic Generalization in Language Models Scales with Information Entropy [0.5] 本稿では, 学習データにおける成分分布のエントロピーによって, 体系的一般化の1つの側面が説明できることを示す。
我々の研究は、体系的な一般化と情報効率を結びつけるものであり、高いエントロピーでの成功は、組み込まれた事前知識がなくても達成できることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:23:44 GMT)
Stronger Together: Unleashing the Social Impact of Hate Speech Research [0.5] 我々は言語学者やNLP研究者が、言語学研究の社会的影響の可能性を解き放つ上で、基本的な役割を担っていると主張している。
本稿では、既存の計算ソリューションからヘイトスピーチ研究を遠ざけ、社会ソリューションに情報を与える社会的方法を検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:34:07 GMT)
Sinusoidal Initialization, Time for a New Start [0.5] 初期化はディープニューラルネットワークトレーニングにおいて重要な役割を担い、収束、安定性、一般化に直接影響を与える。
本稿では,ネットワーク全体の重みの広がりとバランスを改善するために,正弦波関数を用いて構造的重み行列を構築する新しい決定論的手法を提案する。
実験の結果,最終検証精度は4.8 %,収束速度は20.9 %向上した。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:45:18 GMT)
Role-Playing Evaluation for Large Language Models [0.5] Role-Playing Eval (RPEval)は、大規模言語モデルのロールプレイング能力を評価するために設計された新しいベンチマークである。
本稿では, RPEvalの構築について詳述し, ベースライン評価について述べる。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:18:16 GMT)
Evaluatiing the efficacy of LLM Safety Solutions : The Palit Benchmark Dataset [0.5] 大規模言語モデル(LLM)は、医療や金融といった産業において、ますます重要なシステムに統合されている。
これにより、ユーザが悪意のあるクエリを送信し、LLMシステムは所有者に害を与える応答を出力する、さまざまな攻撃が発生する。
これらの脅威に対抗するためにセキュリティツールが開発されているが、その有効性とユーザビリティの正式な評価はほとんどない。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:12:00 GMT)
CI at Scale: Lean, Green, and Fast [0.5] SubmitQueueは、ビルドを投機的に実行し、結果が成功すると変更のみをランドするように設計されたシステムである。
本稿では、リソース使用量の最適化とビルド優先順位の改善に重点を置いたSubmitQueueの拡張について紹介する。
我々は、継続的インテグレーション(CI)リソース使用量を約53%削減し、CPU使用量を44%削減し、P95待ち時間を37%削減した。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:13:34 GMT)
Learning Reward Machines from Partially Observed Policies [0.4] 逆強化学習は、最適政策や専門家による実演から報酬関数を推定する問題である。
我々の目標は、有限情報を用いて真の報奨機を特定することである。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:08:36 GMT)
New Statistical and Computational Results for Learning Junta Distributions [0.4] 我々は、$k$-junta分布の学習は、ノイズを伴う$k$-parity関数の学習と等価であることを示す。
統計的複雑性が最適であるユンタ分布を学習するためのアルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:58:22 GMT)
Unveil Sources of Uncertainty: Feature Contribution to Conformal Prediction Intervals [0.3] 共形予測(CP)に基づく新しいモデルに依存しない不確実性属性(UA)法を提案する。
我々は,CP間隔特性-幅や境界条件-を値関数として定義し,入力特徴に対する予測不確かさを属性とする協調ゲームを定義する。
人工ベンチマークと実世界のデータセットを用いた実験は、我々のアプローチの実用的有用性と解釈的深さを実証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:49:05 GMT)
Adaptive Image Restoration for Video Surveillance: A Real-Time Approach [0.3] 目的は、映像監視のためのリアルタイム画像復元ソリューションを開発することである。
画像復元に必要な処理(s)を参照するために,画像中の劣化のタイプを自動的に識別するモデルを開発した。
私たちのソリューションには、柔軟でスケーラブルなメリットがあります。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:00:10 GMT)
Efficient Generation of Parameterised Quantum Circuits from Large Texts [0.3] DisCoCircは、文書全体をパラメータ化された量子回路(PQC)として直接符号化することができる
本稿では,前グループ図のツリー様表現を用いて,大規模テキストを量子回路に変換する手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:57:53 GMT)
Performance of Zero-Shot Time Series Foundation Models on Cloud Data [0.3] 時系列基礎モデル(FM)は、ゼロショットマルチドメイン予測の一般的なパラダイムとして登場した。
我々は、よく知られたFMが、この設定で意味のある、あるいは正確なゼロショット予測を生成できないことを実証する。
FMが突然、不規則でランダムに見える予測を出力するケースなど、興味深い病理もいくつか紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:11:05 GMT)
An Alignment Between the CRA's Essential Requirements and the ATT&CK's Mitigations [0.3] 本稿では、MITREのATT&CKフレームワークに存在する緩和策と、最近導入された欧州連合におけるサイバーレジリエンス法(CRA)のサイバーセキュリティ要件との整合性を評価する。
CRAに関しては、データ最小化、データ消去、脆弱性調整という観点でのみ、注目すべきギャップがある。
提示された評価は、法律と技術フレームワークの共通格差の狭まりに寄与する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:29:00 GMT)
ExoMiner++: Enhanced Transit Classification and a New Vetting Catalog for 2-Minute TESS Data [0.3] 2分間のTESSデータにおけるトランジット信号の分類を改善するために,ExoMinerの成功に基づく強化されたディープラーニングモデルを提案する。
ExoMiner++には、周期図、フラックストレンド、差画像、展開されたフラックス、宇宙船の姿勢制御データなど、追加の診断入力が含まれている。
本研究では,ExoMiner++の分類と各トランジット信号に対する信頼性スコアを含む新しいTESSカタログを紹介する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:54:21 GMT)
HarmonE: A Self-Adaptive Approach to Architecting Sustainable MLOps [0.3] HarmonEは、機械学習オペレーションパイプラインにおける自己適応機能を実現するアーキテクチャアプローチである。
インテリジェントトランスポートシステム(ITS)のディジタルツイン(DT)によるアプローチを検証する。
以上の結果から,HarmonEは精度を保ち,持続可能性目標を達成しつつ,進化する条件に効果的に対応できることが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:51:30 GMT)
The Hamiltonian of Poly-matrix Zero-sum Games [0.3] ポリマトリクスゼロサムゲームのダイナミクスを生成するハミルトニアン関数を同定する。
我々はハミルトニアンの対称性を明らかにし、関連する保存量の導出を行う。
本結果は,ゲームにおける学習力学の構造的特性を明らかにする上でのハミルトン力学の可能性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:46:29 GMT)
Leakage and Interpretability in Concept-Based Models [0.2] 概念ボトルネックモデルは、高レベルの中間概念を予測することによって解釈可能性を改善することを目的としている。
それらは情報漏洩に悩まされ、学習された概念の中で符号化された意図しない情報を利用するモデルで知られている。
漏洩を厳格に特徴づけ定量化するための情報理論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:09:26 GMT)
Light-controlled strong coupling of optical cavity modes spaced by 200 THz [0.2] 固有モードがVIS-NIR領域における2つの周波数モードのコヒーレント重ね合わせであるマクロ光学的ファブリ・ペロトキャビティについて述べる。
強い結合により、端から端までの自由空間変換効率30(1)%で周波数変換を実演できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:00:22 GMT)
Security Degradation in Iterative AI Code Generation -- A Systematic Analysis of the Paradox [0.2] 本稿では,400個のコードサンプルを用いた制御実験により,AI生成コードのセキュリティ劣化を解析する。
たった5回のイテレーションで,致命的な脆弱性が37.6%増加したことが分かりました。
これらのリスクを軽減するための実践的ガイドラインを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:55:51 GMT)
Graph Neural Networks Based Anomalous RSSI Detection [0.2] 本稿では,グラフニューラルネットワークを用いた無線リンクの異常検出手法を提案する。
提案手法では,時系列データをグラフに変換して,新たなグラフニューラルネットワークアーキテクチャをトレーニングする。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:16:32 GMT)
Introducing Instruction-Accurate Simulators for Performance Estimation of Autotuning Workloads [0.2] シミュレータ上で自動チューニングワークロードの実行を可能にするインターフェースを提案する。
我々は、ターゲットHW上でのMLワークロード実装の性能を予測するために、様々な予測器を訓練する。
その結果, 調整した予測器は高い有効性を示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:59:07 GMT)
The Impact of Artificial Intelligence on the Evolution of Digital Education: A Comparative Study of OpenAI Text Generation Tools including ChatGPT, Bing Chat, Bard, and Ernie [0.2] このレビュー論文は、Bing Chat、Bard、ErnieといったOpenAIの先駆的なテキスト生成ツールの能力と影響を対比することで、急速に進化するデジタル教育の風景を深く掘り下げている。
この研究は、教育の民主化、自治主義の育成、学生のエンゲージメントの拡大におけるその役割を浮き彫りにしている。
しかし、このような変革的な力によって、テキスト生成ツールが必然的に学術的完全性に挑戦する可能性があるため、誤用の可能性がもたらされる。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:42:27 GMT)
Projective squeezing for translation symmetric bosonic codes [0.2] 我々は,より高いスキューズレベルの結果を計算するために,テキストプロジェクティブ・スクイーズ法(PS)を導入する。
我々は解析的議論を数値的に検証し、このプロトコルが光子損失の影響を軽減することができることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:03:25 GMT)
High-Performance ARM-on-ARM Virtualization for Multicore SystemC-TLM-Based Virtual Platforms [0.2] ARM-on-ARM仮想プラットフォームは、計算集約的なワークロード上の従来の命令セットシミュレータベースのモデルよりも最大10倍のスピードアップを実現している。
命令セットシミュレータのドロップイン代替として使用できるマルチコアのSystemC-TLMベースのCPUモデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:21:45 GMT)
$S^3$ -- Semantic Signal Separation [0.2] ニューラル埋め込み空間における理論駆動型トピックモデリング手法を提案する。
S3$は、トピックをセマンティック空間の独立した軸として概念化し、ドキュメントの埋め込みを分解することによってこれらを明らかにする。
我々のアプローチは多様かつ高度に一貫性のあるトピックを提供し、事前処理を必要とせず、最も早い文脈のトピックモデルであることが実証されている。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:30:33 GMT)
Complexity counts: global and local perspectives on Indo-Aryan numeral systems [0.2] 本稿では,言語間数字体系の類型論におけるインド・アーリア語の位置づけについて述べる。
これらの言語における複雑なシステムの持続性に寄与する言語的・非言語的要因について検討する。
我々はインド・アーリア語が世界の言語全体よりも決定的に複雑な数字体系を持っていることを実証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:14:54 GMT)
CI/CD Configuration Practices in Open-Source Android Apps: An Empirical Study [0.1] 継続的インテグレーションと継続的デリバリ(CI/CD)は、ソフトウェアシステムを自動的にビルド、テスト、パッケージ、デプロイする、十分に確立されたプラクティスです。
モバイルアプリには、さまざまなエミュレータのテストやアプリストアへのデプロイなど、CI/CDプラクティスに関する特徴がある。
一般的なCI/CDサービスを4つ採用した2,557のAndroidアプリで,CI/CDプラクティスに関する実証的研究を行っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:39:49 GMT)
Quantum (Inspired) $D^2$-sampling with Applications [0.1] 我々は、$k$-means++の量子実装を示し、その時間は$tildeO(zeta2 k2)$で実行される。
これは、量子バージョンが$O(logk)$近似を保証する$k$-means++の堅牢な近似解析によって示される。
これはQI-$k$-means++と呼ばれ、実行時間は$O(Nd) + tildeO(zeta)である。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:35:51 GMT)
LLM-KG-Bench 3.0: A Compass for SemanticTechnology Capabilities in the Ocean of LLMs [0.1] 現在のLLM(Large Language Models)は、プログラムコードの開発を、他の多くの側面でも支援できますが、KG(Knowledge Graphs)との連携もサポートできますか?
バージョン3.0のLLM-KG-Benchフレームワークは、これらの質問に答えるために設計されている。
LLM回答を自動評価するための一連のタスクで構成されており、セマンティックテクノロジーの様々な側面をカバーしている。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:29:27 GMT)
String-Membrane-Nets from Higher-Form Gauging: An Alternate Route to $p$-String Condensation [0.1] 2+1Dトポロジカルオーダーの等方的スタックでアベリアン・エノンが生成する3+1Dの1-形式対称性をゲージすると、自然に3+1D$p$ストリング凝縮相が得られることを示す。
このアプローチは、$p$ストリングの縮合の基礎となる対称性の原理を明確にし、任意の縮合と一形式ガウイングの間の親しみやすい接続を一般化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:00:04 GMT)
Online Learning of Pure States is as Hard as Mixed States [0.1] 我々はオンライン学習の枠組みを考察し、この環境で純粋な状態を学ぶことは混合状態を学ぶのと同じくらい難しいという驚くべき結果を証明する。
より具体的には、両方のクラスが、ほぼ同じシーケンシャルな脂肪破砕次元を共有しており、同じ後悔のスケーリングにつながっていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:04:14 GMT)
Suicide Risk Assessment Using Multimodal Speech Features: A Study on the SW1 Challenge Dataset [0.1] 第1回SpeechWellness Challengeは、青年期における音声による自殺リスク評価の必要性を訴えるものである。
本研究は,WhisperXによる自動書き起こし,中国語RoBERTaによる言語埋め込み,WavLMによる音声埋め込みなど,この課題に対するマルチモーダルなアプローチについて検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:04:37 GMT)
ReSW-VL: Representation Learning for Surgical Workflow Analysis Using Vision-Language Model [0.1] ビデオからの外科的位相認識は、外科手術の進行を自動的に分類する技術である。
外科的位相認識技術の最近の進歩は、主にトランスフォーメーションに基づく手法に焦点を当てている。
視覚言語モデルを用いた外科的ワークフロー解析における表現学習法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:44:37 GMT)
Hierarchical Representations for Evolving Acyclic Vector Autoregressions (HEAVe) [0.0] 因果ネットワークは時系列システム内の影響構造を理解するための直感的なフレームワークを提供する。
サイクルの存在は動的関係を曖昧にし、階層解析を妨げる。
本稿では,非巡回ベクトル自己回帰過程に適合する進化的アプローチを提案し,新しい階層的表現を導入する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:33:01 GMT)
topicwizard -- a Modern, Model-agnostic Framework for Topic Model Visualization and Interpretation [0.0] 本稿では,モデルに依存しないトピックモデル解釈のためのフレームワークであるトピックウィザードを紹介する。
トピックモデルによって学習された文書、単語、トピック間の複雑な意味関係を調べるのに役立つ。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:19:01 GMT)
hChain: Blockchain Based Large Scale EHR Data Sharing with Enhanced Security and Privacy [0.0] この記事では、IoMTデバイスを使用したブロックチェーンベースのスマートヘルスケアシステムを使って、継続的な患者の監視を行う。
シンメトリキーは、ブロックチェーンにおいてもデータをプライベートに保つために使用される。
データが患者領域に由来することを保証するために、位置情報ベースの認証が推奨される。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:47:01 GMT)
eStonefish-scenes: A synthetically generated dataset for underwater event-based optical flow prediction tasks [0.0] 我々はStonefishシミュレータに基づく合成イベントベース光フローデータセットeStonefish-scenesを紹介する。
データセットとともに、カスタマイズ可能な水中環境の作成を可能にするデータ生成パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:26:18 GMT)
What's Inside Your Diffusion Model? A Score-Based Riemannian Metric to Explore the Data Manifold [0.0] スコアに基づくリーマン計量を導入し、データ多様体の内在幾何学を特徴づける。
我々のアプローチは、測地学が自然に多様体の輪郭に従う幾何学を生成する。
我々のスコアに基づく測地学は、基礎となるデータ分布を尊重する有意義な垂直変換を捉えていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:31:19 GMT)
Warm Up Before You Train: Unlocking General Reasoning in Resource-Constrained Settings [0.0] 限定的な監督下での理性学習のための2段階の学習戦略を提案する。
最初の段階では、おもちゃのドメインからロングCoTを蒸留することでモデルを「ウォームアップ」します。
第2段階では、ターゲットドメインの限られた例を用いて、RLVRをウォームアップモデルに適用する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:29:15 GMT)
Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies [0.0] ビジョントランス (ViT) はコンピュータビジョンタスクのための強力で有望な技術として登場した。
高い計算複雑性とメモリ要求は、リソース制約のあるエッジデバイスへのデプロイに困難をもたらす。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:25:48 GMT)
View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis [0.0] 我々は、教師なし、画素ワイドな異常位置検出のタスクとして、シーン異常検出(Scene Anomaly Detection, Scene AD)を導入し、フォーマル化する。
ToyCityは,最初のマルチオブジェクト・マルチビューリアルタイム画像データセットである。
実験の結果,OmniADは拡張ビューで使用すると,逆蒸留よりも64.33%の画素幅(F_1)のスコアが増大することがわかった。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:23:14 GMT)
Verifying Quantum Memory in the Dynamics of Spin Boson Models [0.0] スピンボソンモデルの非マルコフ力学におけるメモリ効果の性質について検討する。
シングル・インターベンション・プロセス・テンソルにアクセスすると、一般的に低温での力学における量子メモリを予測できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:02:41 GMT)
Unraveling superradiance: entanglement and mutual information in collective decay [0.0] 本研究では, 当初逆転した2レベルエミッタの集合崩壊をフォトニック貯水池に解析した。
量子状態拡散法を用いて、時間とともに個々の量子軌道に沿った絡み合いと古典的相関について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:36:37 GMT)
Towards Centralized Orchestration of Cyber Protection Condition (CPCON) [0.0] U.S. Cyber Command (USCYBERCOM) Cyber Protection Condition (CPCON) フレームワークは、DoDネットワークにまたがる高度なセキュリティ姿勢を規定している。
現在の実装は、大部分が手動で、一貫性がなく、エラーを起こしやすい。
本稿では,CPCONディレクティブの集中的オーケストレーションのためのプロトタイプシステムを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:53:28 GMT)
Thermodynamic and energetic constraints on transition probabilities of small-scale quantum systems [0.0] 量子系における2点測定の遷移確率について検討した。
異なる温度でシステムを構築した際の遷移確率の差には,2つの独立した制約がある。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:59:56 GMT)
The non-Abelian Aharonov-Bohm effect [0.0] ゲージ群 $SU(N)$ への一般化を考え、分類スキームを導出する。
イソスピン沈着も古典的な限界で回復する。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:56:16 GMT)
The Traitors: Deception and Trust in Multi-Agent Language Model Simulations [0.0] ソーシャル・デダクション・ゲームに触発されたマルチエージェント・シミュレーション・フレームワークであるThe Traitorsを紹介した。
我々は,詐欺の成功,信頼ダイナミクス,集団推論品質を計測する評価指標のスイートを開発する。
DeepSeek-V3, GPT-4o-mini, GPT-4o(モデル毎に10回の走行)による実験では, 顕著な非対称性が示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:01:35 GMT)
The Hidden Dangers of Browsing AI Agents [0.0] 本稿では,複数のアーキテクチャ層にまたがるシステム的脆弱性に着目し,このようなエージェントの総合的なセキュリティ評価を行う。
本研究は,ブラウジングエージェントのエンド・ツー・エンドの脅威モデルについて概説し,実環境への展開を確保するための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:10:29 GMT)
Synthetic Non-stationary Data Streams for Recognition of the Unknown [0.0] 本稿では,概念の漂流と新たなクラスの発生が生じる合成データストリーム生成の戦略について述べる。
これは、教師なしドリフト検出器が、新規性や概念ドリフトを検出するタスクにどのように対処しているかを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:44:32 GMT)
Symmetry-Breaking Descent for Invariant Cost Functionals [0.0] 我々は,大域対称性群$GサブセットのMathrmDiff(M)$の下でコストが不変である場合,Sobolev-classシグナル$S$上で定義されるタスクコスト関数$W(S)$の削減問題を考察する。
入力信号の明示的対称性を破る変形を構成するために,対称性構造を利用する変分法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:06:31 GMT)
Super-Resolution Generative Adversarial Networks based Video Enhancement [0.0] 本研究は、通常のシングルイメージSIS(SRGAN)構造を拡張して、対数データを扱うことで、ビデオ超解像への拡張アプローチを導入する。
3次元非局所ブロックを組み込んだ修正フレームワークが開発され、空間次元と時間次元の両方で関係を捉えることができる。
その結果、従来の単一画像法と比較して、時間的コヒーレンス、よりシャープなテクスチャ、視覚的アーティファクトが向上した。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:54:02 GMT)
Stark Energy Shifts due to Quantum Gravity in RGUP Algebra [0.0] 外部電場下での水素原子中のスターク効果について検討する。
退化状態および非退化状態に対するエネルギースペクトルの変更を導出する。
この結果から、相対論的状態におけるスタークエネルギースペクトルに対する量子重力補正が明らかになった。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:19:24 GMT)
Spiking Neural Networks with Random Network Architecture [0.0] この研究は、ニューラルネットワークをスパイクするための新しいアーキテクチャであるRanSNNを提案している。
ニューラルネットワークをスパイクする従来のトレーニング手法と比較して、トレーニング性能を確保しながらトレーニング効率を大幅に向上し、ベンチマークテストで検証されたように、優れた汎用性と安定性を持つ。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:03:55 GMT)
Spectral Properties of Two Superconducting Artificial Atoms Coupled to a Resonator in the Ultrastrong Coupling Regime [0.0] 2つのフラックス量子ビットからなる超伝導回路を共通のLC共振器に超強結合させる実験を行った。
フラックス量子ビットの大きな非調和性のため、系はスピンスピン相互作用項を含む一般化されたディック・ハミルトンによりうまく記述できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:00:57 GMT)
Simulating Work Extraction in a Dinuclear Quantum Battery Using a Variational Quantum Algorithm [0.0] 本研究は、二核量子電池モデルにおける量子特性と作業抽出過程を研究するための量子計算法の応用について検討する。
本研究では, 騒音環境の存在が, システム内のエネルギー量評価の精度を損なうことを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:26:29 GMT)
Semantic Similarity-Informed Bayesian Borrowing for Quantitative Signal Detection of Adverse Events [0.0] 本稿では,自然報告システム(SRS)における有害事象(AE)の定量的同定を強化するため,ベイズ動的借入(BDB)アプローチを提案する。
この手法は、ベイズ階層モデルに先立って頑健なメタ分析予測(MAP)を組み込み、意味的類似度尺度(SSM)を組み込む。
2015年から2019年までのFDA副次イベント報告システム(FAERS)のデータを用いて、従来の情報コンポーネント(IC)分析とICによるICHLGT(IC HLGT)の借用に対して、IC SSM(IC SSM)と呼ばれるアプローチを評価した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:14:32 GMT)
Segmentation of temporomandibular joint structures on mri images using neural networks for diagnosis of pathologies [0.0] 本稿では,顎関節の病態診断における人工知能の利用について検討する。
この研究の関連性は、TMJの病態の高頻度化と、医療機関における診断の正確性やスピードの向上の必要性によるものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:58:02 GMT)
SNAPE-PM: Building and Utilizing Dynamic Partner Models for Adaptive Explanation Generation [0.0] ダイアログへの適応は、成功した説明には不可欠だが、ダイアログシステムには大きな課題がある。
非定常的な意思決定プロセスとして説明生成を扱うアプローチを採用し,説明者に対する信念やインタラクションコンテキストの変化に応じて最適な戦略が変化する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:42:23 GMT)
Rethinking Features-Fused-Pyramid-Neck for Object Detection [0.0] 本稿では,マルチヘッド検出器における特徴アンフューズドピラミドネックの有効性を評価するために,独立階層ピラミッド(IHP)アーキテクチャを提案する。
また,各階層における特徴核融合の影響を軽減するために,重度下降係数を持つ軟質近傍(SNI)も導入した。
これらの進歩は,Pascal および MS におけるリアルタイム検出のための二次特徴アライメントソリューション (SA) で達成され,最先端の結果が得られた。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:01:11 GMT)
Repeated quantum backflow and overflow [0.0] 量子力学において、最大$M$-foldバックフローは、M$が増加するにつれて、上から正および非有界となる。
Mge 2$ の場合、総バックフローが 1 ドル以下である状態があり、可能な範囲を超えて右半行に遷移する確率を与える。
バックフローとオーバーフロー効果の最大範囲は、バックフローとオーバーフロー関数と定数の階層構造によって記述される。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:40:15 GMT)
Relating Quantum Tamper-Evident Encryption to Other Cryptographic Notions [0.0] 量子タンパー・エビデント暗号スキーム(quantum tamper-evident encryption scheme)は、古典的なメッセージを量子暗号文にマッピングする非相互作用対称鍵暗号スキームである。
この量子暗号プリミティブは2003年にゴッテスマンによって初めて導入された。
我々は、情報理論的な設定で他の量子暗号プリミティブと公式に関連付けることで、タンパーの明解な暗号化の理解を深める。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:32:04 GMT)
Reflection phase shifts of bouncing Bogoliubov waves [0.0] 縮合相の励起を制御できる空間的に拡張されたモードが得られ、また密度勾配の領域に別のモードが局在する。
応用として,局所密度近似とは無関係に,重力トラップ内の固有周波数を計算する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:14:12 GMT)
Recombinant dynamical systems [0.0] 本稿では,経験に基づく問題解決やタスク学習の概念を捉えようとするコネクショナリストモデルについて述べる。
我々は,このモデルを,明らかに勾配降下手順が存在しない非効率な列生成の計算問題に適用する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:45:10 GMT)
Randomised Optimism via Competitive Co-Evolution for Matrix Games with Bandit Feedback [0.0] 本研究では,未知のペイオフ行列と帯域フィードバックを持つ2プレイヤーゼロサム行列ゲームについて検討する。
本稿では,進化的アルゴリズムをバンディットフレームワークに統合する新しいアルゴリズムであるコンペティティブ共進化帯域学習(coebl)を提案する。
決定論的楽観主義に基づく手法の性能と一致して,coeblがサブ線形後悔を実現することを証明した。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:05:55 GMT)
Quantum state preparation with polynomial resources: Branched-Subspaces Adiabatic Preparation (B-SAP) [0.0] 本稿では,変分量子アルゴリズム(VQA)とAdiabatic prepared(AP)の概念的長所を統合するハイブリッドアルゴリズムを提案する。
本手法は,広いパラメータ範囲とシステムサイズにわたる周期境界条件を持つ1次元XYZハイゼンベルクモデルを用いて検証した。
これらの結果は, 提案アルゴリズムの精度, 効率, 堅牢性を強調し, 短期量子デバイス上でのターゲット量子状態の実際の調製に有効な経路を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:26:35 GMT)
Quantum neural network with ensemble learning to mitigate barren plateaus and cost function concentration [0.0] 本稿では,量子ニューラルネットワーク構築における新しいアプローチ,特にVGとCFCの問題に対処する手法を提案する。
本手法では,複数の量子回路の同時展開を提唱するアンサンブル学習を用いる。
提案モデルの有効性を,従来構築したQNNとの比較分析により評価する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:37:54 GMT)
Quantum confinement and carbon nanodots: A conceptual view for the origin of diffuse interstellar bands [0.0] この研究は、DIBの起源を説明する中心となる典型的なエネルギー遷移のための概念的枠組みを提供することを試みる。
電子遷移の一般的な基盤を構築するために、電荷移動励起子を含む励起子に対する量子閉じ込めの効果が用いられる。
予備的な結果は、ナノダイヤモンドとa-C(:H)CNDの粒子径依存効果は、DIBの位置や間隔と一致していることを示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:58:41 GMT)
Quantum Kinetic Uncertainty Relations in Mesoscopic Conductors at Strong Coupling [0.0] 運動的不確実性関係は量子輸送の精度限界を確立する。
強い結合において、量子コヒーレンス(英語版)はKURの妥当性に挑戦する。
このQKURは、すべての結合強度で不確実性関係が有効であることを保証する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:52:23 GMT)
Quantum Deep Sets and Sequences [0.0] 本稿では、量子機械学習ツールボックスを拡張した量子深層集合モデルを提案する。
このモデルのためにいくつかの変種が提示される。
量子深集合とシーケンス(QDS)の有効性と汎用性を示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:14:38 GMT)
Quantum Computational Unpredictability Entropy and Quantum Leakage Resilience [0.0] 計算エントロピーは、計算制約の下で不確実性とランダム性を定量化する枠組みを提供する。
古典的予測不可能エントロピーを量子設定に自然に一般化した量子計算不予測可能性エントロピーを定義する。
我々の結果は、量子計算環境におけるミニエントロピーに依存する暗号ツールの開発の基礎を築いた。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:20:30 GMT)
Quantum Algorithms for Causal Estimands [0.0] 因果機械学習は、反事実事象の予測結果を推定することによって問題を解決することを目的としている。
これらの因果アルゴリズムが量子エンハンスメントの機会を提供するかどうかについては、オープンな疑問である。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:58:09 GMT)
QUADS: QUAntized Distillation Framework for Efficient Speech Language Understanding [0.0] 既存の方法は蒸留と量子化を別々に適用し、最適以下の圧縮に繋がる。
我々は,事前学習モデルを用いたマルチステージトレーニングにより,双方を最適化する統合フレームワーク QUADS を提案する。
QUIDSはSLURPで71.13%、FSCで99.20%の精度を達成し、最先端モデルと比較して5.56%の小さな劣化しか達成していない。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:09:51 GMT)
Pursuit and Review of Magnetic Resonance Imaging (MRI) based Quantum Computing -- Qubit Generation, Spin Purification, Tailored RF Pulses and MRI Sequences for Quantum Computing [0.0] 水プロトンNMR(1H-NMR)を用いた新しいMRI技術を用いた量子ビット(量子ビット)生成法を提案する。
本稿では,NMRによる先行技術について,量子コンピューティングの文脈で概観する。
論文参考訳(メタデータ) (Mon, 19 May 2025 07:05:14 GMT)
Pre-Training Estimators for Structural Models: Application to Consumer Search [0.0] 本稿では,推定が困難であることが知られている逐次探索モデルのための事前学習型推定器を構築する。
推定には数秒かかり、精度が高い。
より一般的には、事前訓練されたオフザシェルフ推定器は、研究者や実践者にとって構造モデルをよりアクセスしやすいものにすることができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:58:06 GMT)
Phonon-Coupled Hole-Spin Qubits in High-Purity Germanium: Design and Modeling of a Scalable Architecture [0.0] 本稿では,ゲート制御されたゲルマニウム(Ge)量子ドットで定義されたホールスピン量子ビットを用いたスケーラブル量子プロセッサアーキテクチャの設計とモデル化を行う。
このアーキテクチャはGeの孔状態に固有の強い電気的に調節可能なスピン軌道相互作用を利用し、高品質のフォノン結晶キャビティ(PnCC)と統合して完全電気量子ビット制御とフォノンを介する結合を可能にする。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:04:21 GMT)
Phase Transitions in Open Dicke Model: a degenerate perturbation theory approach [0.0] オープンディックモデルの定常挙動について検討し,N$スピン-1/2$粒子と損失量子化キャビティモードの相互作用について述べる。
標準モデルは全スピンを保存するが、Kirton と Keeling は PhysRevLett.118.123602 を引用し、無限小の同質局所的退化でさえこの相転移を破壊することを示した。
我々の結果は量子ラビモデルとディック物理学を橋渡し、集合量子効果における退化と崩壊の役割を解明し、退化定常な開量子系に広く適用する。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:33:30 GMT)
Pedestrian mobility citizen science complements expert mapping for enhancing inclusive neighborhood placemaking [0.0] 本研究では,スペイン・カタルーニャ州グラノラーズ(Granollers)のプライマー・ド・マイグ(Primer de Maig)地区における,専門家によるマッピングと市民科学の相互作用について検討した。
住民は19のグループに編成され、プロトタイズされた遊び心のある社会活動に従事しながら、歩行者の移動を記録した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:47:44 GMT)
Outsourced Privacy-Preserving Feature Selection Based on Fully Homomorphic Encryption [0.0] 特徴選択は、トレーニングデータの一連の機能から意味のあるサブセットを抽出するテクニックである。
本研究では,特徴選択のためのプライバシ保護モデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:55:56 GMT)
Optical signatures of coherence in molecular dimers [0.0] 結合分子二量体における振動環境と強く相互作用する量子相関を実験的に測定する。
射影測定は,エミッタ同士を配置しても協調的なシグネチャを生成できることがわかった。
この研究は、2つの結合したエミッタからの協調放出の理解を深め、コヒーレントなダイナミクスを探索するための将来の実験の方向性を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:57:54 GMT)
On the Sign of the Casimir Force Between Two Bodies Coupled to a Dirac field [0.0] ここでは, カシミール相互作用が反発的であり, それらの幾何学的構成が, その作業で考慮された同じ反射操作の下で奇異であることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:31:39 GMT)
On the Mechanisms of Adversarial Data Augmentation for Robust and Adaptive Transfer Learning [0.0] 移動学習環境における強靭性と適応性を両立させる上で, ADA(Adversarial Data Augmentation)の役割について検討した。
本稿では、ADAと整合性正規化とドメイン不変表現学習を統合した統合フレームワークを提案する。
本研究は,破壊攻撃からの摂動を,ドメイン間移動性のための正規化力に変換する,対向学習という構成的視点を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:56:51 GMT)
On neutron holography, neutron interferometry and neutron orbital angular momentum [0.0] 中性子ラウエ結晶干渉計がスパイラル位相プレートの中性子ホログラフィーを示すことが報告されている。
中性子軌道角運動量を結晶干渉計で生成する方法には深刻な疑問がある。
本稿では,ホログラムとして提示された画像が従来の干渉パターンとして計算可能であることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:54:53 GMT)
OH molecule as a quantum probe to jointly estimate electric and magnetic fields [0.0] OH分子(OHM)は電気的および磁気的双極子モーメントの両方を持ち、そのモデリングを単純化する二原子構造によって特徴づけられる。
本稿では,2つの場を共同で推定し,その不整合性による付加的な量子ノイズを克服するための最適戦略について述べる。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:15:03 GMT)
Nonlinear Nonlocal: Comparing A. O. Barut's Theory to Mine with special emphasis on That Dot on the Screen [0.0] 1980年代から90年代にかけて、A. O Barutらは電気力学に対する非摂動的アプローチを開発した。
2017年、この著者は測定問題を解くことを意図した非線形非局所理論を導入した。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:06:58 GMT)
Non-degenerate SPDC photon-pair source for UV-A illumination [0.0] 紫外紫外光と赤外光を自発的なパラメトリックダウンコンバージョンにより生成する周波数相関非縮退光子ペア源を提案する。
本研究は, バイオメディカルおよび非破壊試験分野の進展に寄与する可能性のある, 紫外線領域における新しい量子センシング応用シナリオを開拓するものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 20:40:41 GMT)
Net-Zero: A Comparative Study on Neural Network Design for Climate-Economic PDEs Under Uncertainty [0.0] 複数の緩和経路を考慮に入れた継続的内在的成長経済モデルを構築した。
我々は、有限差分生成ソリューションに対して、いくつかのニューラルネットワークアーキテクチャをベンチマークする。
この結果から,適切なニューラルネットワーク選択が解の精度と計算効率に大きな影響を及ぼすことが示された。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:46:12 GMT)
Nesterov Acceleration for Ensemble Kalman Inversion and Variants [0.0] ネステロフ加速は, 様々な逆問題において, EKIコスト関数の高速化に有効であることを示す。
我々の具体的な実装は、既存のEKI変種アルゴリズムとブラックボックス方式で組むのが明らかに簡単である粒子レベルナッジの形式を採っている。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:47:46 GMT)
Multireference Embedding and Fragmentation Methods for Classical and Quantum Computers: from Model Systems to Realistic Applications [0.0] 量子埋め込みは、複雑なシステムを管理可能なサブシステムに分割することで、有望なソリューションを提供する。
量子コンピュータにおける古典的実装とこれらの手法の新たな可能性について論じる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:33:53 GMT)
Multiple Proposer Transaction Fee Mechanism Design: Robust Incentives Against Censorship and Bribery [0.0] 本研究は,検閲に対する抵抗を動機付けるために,複数の提案者がどのような報奨を受けるべきかを考察する。
主な貢献は、収賄攻撃による検閲に対する抵抗を確実にする TFM の識別である。
FOCILの具体的支払い機構と文献への一般的な貢献を提供する。
論文参考訳(メタデータ) (Mon, 19 May 2025 21:53:58 GMT)
Modular Diffusion Policy Training: Decoupling and Recombining Guidance and Diffusion for Offline RL [0.0] 本稿では,誘導モジュールを拡散モデルから分離するモジュラートレーニング手法を提案する。
個別に訓練された2つのガイダンスモデルを適用すると、1つはトレーニング中に、もう1つは推論中に、正規化されたスコアの分散を著しく減少させることができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:51:58 GMT)
Model Cards for AI Teammates: Comparing Human-AI Team Familiarization Methods for High-Stakes Environments [0.0] 人工知能チームメイトと人間を親しむ3つの方法が研究された。
エージェントに関する最も重要な情報は、その決定アルゴリズムの詳細と、人間と比較して相対的な強度と弱さを含んでいた。
我々は、AIドキュメント、構造化されたインサイトトレーニング、探索的インタラクションを組み合わせた人間-AIチームの身近化手法を推奨する。
論文参考訳(メタデータ) (Mon, 19 May 2025 23:19:16 GMT)
Measurement-induced entanglement and complexity in random constant-depth 2D quantum circuits [0.0] ランダムな定数深さ量子回路によって生成される状態の絡み合い構造を解析する。
回路アーキテクチャのいくつかの自然クラスにおいて, 一定の臨界深度以上でマクロ的な長距離絡み合いが生じることを証明した。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:07:10 GMT)
Machine learning the first stage in 2SLS: Practical guidance from bias decomposition and simulation [0.0] 機械学習(ML)は予測問題を解くために進化した。
2段階最小(2SL)の第1段階は予測問題である。
MLが2SL$2014または3段階支援を支援するかを検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:53:15 GMT)
MCP Guardian: A Security-First Layer for Safeguarding MCP-Based AI System [0.0] MCPガーディアンは、認証、レート制限、ロギング、トレース、Web Application Firewall(WAF)スキャンによるMPPベースの通信を強化するフレームワークである。
弊社のアプローチは、AIアシスタントのためのセキュアでスケーラブルなデータアクセスを促進する。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:48:07 GMT)
MAFA: A multi-agent framework for annotation [0.0] 本稿では、複数の特殊エージェントを異なるアプローチで組み合わせたアノテーションのためのマルチエージェントフレームワークと、最適な結果を得るために候補を再帰する判断エージェントを紹介する。
私たちのフレームワークは、あいまいなクエリを扱うのに特に効果的で、本番アプリケーションのデプロイに適しています。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:16:37 GMT)
Level Generation with Quantum Reservoir Computing [0.0] 貯留層計算(Reservoir computing)は、予測を含む時系列解析に特に適した機械学習の一種である。
我々は,最初は楽譜の変種を生成し,それをスーパーマリオブラザーズレベルに適応させるように設計された,量子貯水池コンピューティングを実装している。
これらのレベルを解析した結果、超伝導量子ビットハードウェア上でコースをリアルタイムで生成できる新しいテキストオブビーを開発し、そのようなリアルタイム生成による制約について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:09:30 GMT)
Language and Thought: The View from LLMs [0.0] AIにおける最近の研究は、言語訓練なしでAIシステムのパフォーマンスを探求することで、デネットの論文をテストするものと見なすことができる。
推論的推論における大規模言語モデルの成功は、たとえそうであっても、思考に対する言語の影響についてのデネットの過激な見解を支持している、と私は主張する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:29:32 GMT)
Know Or Not: a library for evaluating out-of-knowledge base robustness [0.0] 大規模言語モデル(LLM)のOOKB(out-of-knowledge base)ロバスト性を体系的に評価するための新しい手法を提案する。
我々は,オープンソースライブラリである knowornot に方法論を実装し,ユーザがOOKB の堅牢性のために独自の評価データとパイプラインを開発できるようにする。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:17:41 GMT)
It's not you, it's me -- Global urban visual perception varies across demographics and personalities [0.0] 街路ビュー画像を用いた世界規模の街路景観の大規模都市視覚知覚調査を行った。
性別、年齢、収入、教育、人種、民族、そして初めて人格特性がどう認識されるかを検討した。
既存のグローバル認識データセットに基づいてトレーニングされた既成の機械学習モデルは、肯定的な指標を過小評価し、否定的な指標を過小評価する傾向にある。
論文参考訳(メタデータ) (Mon, 19 May 2025 06:35:11 GMT)
Investigating the Vulnerability of LLM-as-a-Judge Architectures to Prompt-Injection Attacks [0.0] 大規模言語モデル (LLM) は、機械生成テキストの品質を評価するための評価器 (LLM-as-a-Judge) としてますます採用されている。
本稿では,LPM-as-a-Judgeアーキテクチャの早期注入攻撃に対する脆弱性について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:51:12 GMT)
IG Parser: A Software Package for the Encoding of Institutional Statements using the Institutional Grammar [0.0] IGは、自然言語の厳密なエンコーディングを保証する独特な構文を採用している。
IGの概念の中核は関連する構文であるIG Scriptであり、Institutional Grammarの概念基盤を運用している。
本稿では,IG Script の概念的基盤,IG Script の構文的仕様,およびアーキテクチャ的原則について述べる。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:33:15 GMT)
Gridding Forced Displacement using Semi-Supervised Learning [0.0] 行政境界からサハラ以南の25か国にわたる0.5度グリッドセルに難民統計を集約する半監督的アプローチを提案する。
UNHCRのProGres登録データとGoogle Open Buildingsの衛星由来の建物フットプリントとOpenStreetMap Populated Placesのロケーション座標を統合することで、ラベル拡散アルゴリズムは、空間的に明示的な避難統計を高粒度で生成する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:27:58 GMT)
Generative Modeling of Random Fields from Limited Data via Constrained Latent Flow Matching [0.0] 深層生成モデルは、科学と工学のための有望なツールであるが、その豊富な高品質のデータへの依存は適用性を制限する。
本稿では,限定的,スパース的,間接的データを補うために,ドメイン知識を取り入れたランダムフィールドの生成モデルを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:47:44 GMT)
Generative AI and Large Language Models in Language Preservation: Opportunities and Challenges [0.0] Generative AI(GenAI)とLarge Language Models(LLM)は、コーパス生成、転写、翻訳、学習を自動化する新たなフロンティアをアンロックする。
本稿では、言語固有のニーズに対してGenAIアプリケーションを体系的に評価する新しい分析フレームワークを提案する。
コミュニティ主導の音声認識などの成功例を92%の精度で再現するTe Reo M=aori再活性化による有効性を示す。
我々の知見は、GenAIが言語保存に革命をもたらすことは確かだが、介入がコミュニティ中心のデータスチュワードシップ、継続的な評価、透明なリスク管理に厳格に固定されている場合に限られる。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:46:41 GMT)
GDPRShield: AI-Powered GDPR Support for Software Developers in Small and Medium-Sized Enterprises [0.0] 本稿では,中小企業ソフトウェア開発者の意識を高めることを目的とした,AIを活用した新しいフレームワーク"ShieldShield"を紹介する。
ShieldShield"は、ソフトウェア開発の初期段階からデータ侵害に従おうとする開発者のモチベーションを高める。
論文参考訳(メタデータ) (Mon, 19 May 2025 02:47:44 GMT)
From What Ifs to Insights: Counterfactuals in Causal Inference vs. Explainable AI [0.0] 因果推論(CI)と説明可能な人工知能(XAI)の2つの異なるデータサイエンス分野において、カウンターファクトリーは重要な役割を果たす
本稿では,CI と XAI におけるカウンターファクトの多面的概念を包含する形式的定義を導入する。
私たちは、CI対XAIでカウンターファクトアルがどのように使われ、評価され、生成され、運用されているかについて議論し、概念的および実践的な違いを強調します。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:34:36 GMT)
From Theory to Practice: Analyzing VQPM for Quantum Optimization of QUBO Problems [0.0] 変分量子パワー法(VQPM)は、古典的パワーアルゴリズムを量子設定に適用する。
本稿では,これらのロック機構を活用して,VQPMをQUBO問題に適用するための詳細な戦略を提案する。
この結果から,VQPMは量子コンピュータの量子最適化アルゴリズムとして,QUBO問題に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:27:49 GMT)
From Quantum Indistinguishability to Classical Distinguishability: Statistics and Measurement of Two-Particle Distributions [0.0] 熱エネルギーがエネルギーレベルの間隔に対して増加するにつれて, 効果的な識別性が現れることを示す。
2粒子干渉計を用いて現実的な実験手法を提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 03:47:13 GMT)
Finetune-RAG: Fine-Tuning Language Models to Resist Hallucination in Retrieval-Augmented Generation [0.0] Finetune-RAGは、現実世界の欠陥を模倣するために構築されたトレーニングデータセットである。
ファインチューンRAGは、ベースモデルよりも21.2%精度が向上する。
Bench-RAGは、現実的な不完全な検索シナリオ下でテストモデルを強調する評価パイプラインである。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:31:13 GMT)
Fast and Simple Densest Subgraph with Predictions [0.0] 学習強化アルゴリズムのレンズを用いて,最も高密度な部分グラフ問題とその変種について検討する。
部分解が与えられた場合、証明可能な$(1-epsilon)$-approximationを達成する非常に単純な線形時間アルゴリズムを設計できることを示す。
また,本手法は有向高密度部分グラフ問題やNP-ハード変種にも自然に適用できる。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:32:03 GMT)
Exponential enhancement of sensitivity in Ramsey interferometry with optically thick ensemble of atoms [0.0] 共鳴遷移が不均一に広がる光学的に厚い試料では、バックアクションはラムゼイ共鳴の高度に狭められる可能性がある。
本研究は, 共鳴媒質の非線形高分解能分光法と新世代の固体時計の感度向上の新たな機会を開くものである。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:11:56 GMT)
Entropic limitations on fixed causal order [0.0] 我々は,不等式を犯すと,因果順序が定まらずに量子過程を証明できる十分な条件が成立する情報不等式を提案する。
量子スイッチの不等式は、不定因数順序の過程のパラダイム的な例である。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:31:18 GMT)
Eigenstate thermalization in spin-$\frac{1}{2}$ systems with SU(2) symmetry [0.0] 拡張スピン-$frac12$Heisenberg鎖の固有状態における可観測物の対角行列および対角行列要素について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:57:30 GMT)
Efficient preparation of entangled states in cavity QED with Grover's algorithm [0.0] グロバーの探索アルゴリズムは、量子ビットのアンサンブルの絡み合った状態を効率的に作成することができる。
我々は、Dicke状態、GHZ状態、およびSchr"odinger cat superpositions of $N$atomsを、少数の光子散乱イベントによって決定的に生成することを示した。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:02:41 GMT)
Duluth at SemEval-2025 Task 7: TF-IDF with Optimized Vector Dimensions for Multilingual Fact-Checked Claim Retrieval [0.0] 本稿では,SemEval-2025 Task 7 on Multilingual and Crosslingual Fact-Checked Claim Retrievalを提案する。
我々は,ベクトル次元とトークン化戦略を実験するTF-IDFベースの検索システムを実装した。
論文参考訳(メタデータ) (Mon, 19 May 2025 01:58:22 GMT)
Discrete Time Crystals in the spin-s Central Spin Model [0.0] スピンスピン中心スピンモデルにおいて離散時間結晶(DTC)を実現するための周期駆動プロトコルを提案する。
有限サイズのシステムであっても、永遠周期倍数および高次(HO)-DTCを実現できるパラメータ構造を同定する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:57:39 GMT)
Dimer problem on a spherical surface [0.0] ダイマーの結合エネルギーと波動関数は全角運動量に敏感である。
これらの結果は、曲線幾何学と有限角運動量を組み合わせることで、超低温の殻状気体における定性的に新しい多体現象が生じる可能性があることを示唆している。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:08:41 GMT)
Diffraction of correlated biphotons through transparent samples [0.0] 画像面に配置した位相オブジェクトがSPDCの自由空間伝搬に影響を及ぼすことを示す。
本研究は,非干渉計測・量子強調位相イメージングの応用について検討した。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:15:25 GMT)
Deterministic carving of quantum states with Grover's algorithm [0.0] 我々は、グローバーのアルゴリズムのいくつかのユニタリステップが、キャビティ内の$N$原子のディック状態を完全に準備するのに十分であることを示した。
また,GHZ状態とCat状態を生成するために,その後のGroverステップをいくつかのステップで適用できることも示している。
論文参考訳(メタデータ) (Mon, 19 May 2025 04:01:01 GMT)
DateLogicQA: Benchmarking Temporal Biases in Large Language Models [0.0] 本稿では,DateLogicQAについて紹介する。DateLogicQAは190の質問で,様々な日付形式,時間的文脈,推論型について紹介する。
本稿では,セマンティック・インテリティ・メトリック(Semantic Integrity Metric)を提案し,トークン化の品質を評価し,表現レベルバイアス(Representation-Level Bias)と論理レベルバイアス(Logical-Level Bias)の2つのバイアスを分析する。
論文参考訳(メタデータ) (Mon, 19 May 2025 12:29:10 GMT)
Dark States of Light and the Hidden Energy in Thermal Radiation Detection [0.0] 熱放射は、そのエネルギーのかなりの部分を暗い集合モードで閉じ込めることができることを示す。
M$熱電界モードからなるシステムでは、総エネルギーのわずか1/M$しか物質にアクセスできないことを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:52:50 GMT)
Countermeasure against Detector Blinding Attack with Secret Key Leakage Estimation [0.0] 我々は検出器ブラインド攻撃(DBA)に対する対策を提案する。
量子鍵分配セッション中に蓄積されたエラーとダブルクリックイベントの統計的解析を利用する。
パルスDBAに対する性能評価のために解析を拡張した。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:11:39 GMT)
Counter-Inferential Behavior in Natural and Artificial Cognitive Systems [0.0] 本研究では,自然・人工認知システムにおける反推論行動の出現について検討する。
ノイズや設計上の欠陥から生じるのではなく、内部情報モデル間の構造化された相互作用を通じて発生する。
本研究は, 安定条件下での適応活性化を最小限に抑えることの重要性を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 05:04:07 GMT)
Control, Optimal Transport and Neural Differential Equations in Supervised Learning [0.0] ニューラル微分方程式を用いた最適輸送方程式の近似に関する基礎計算問題(ニューラルODE)について検討する。
ニューラルネットワークを用いた不均衡最適輸送(UOT)を連続体に近似する新しいフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 19 May 2025 10:04:15 GMT)
Constrained Adversarial Learning for Automated Software Testing: a literature review [0.0] この文献レビューは、敵の学習やソフトウェアテストに適用される制約付きデータ生成アプローチの現状に焦点を当てている。
ホワイトボックス,グレイボックス,ブラックボックステストに特化したテストの利点と限界を分析した。
論文参考訳(メタデータ) (Mon, 19 May 2025 13:31:42 GMT)
Conditions for Quantum Violation of Macrorealism in Large-spin Limit [0.0] 本研究では,反直観的特性を持つ量子基盤から,マクロ的な古典的挙動がどのように出現するかを考察する。
最大混合状態の場合、量子違反はシステムのエントロピーと対数的に増加するのではなく、マクロ的極限の定数に収束する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:22:28 GMT)
Comparing Apples to Oranges: A Taxonomy for Navigating the Global Landscape of AI Regulation [0.0] 我々は,AI規制のグローバルな展望を地図化するための分類法を提案する。
このフレームワークは、欧州連合のAI法、米国執行命令14110、カナダのAIおよびデータ法、中国の生成AIサービスに関する暫定措置、ブラジルのAI法案2338/2023の5つの早期移行者に適用される。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:23:41 GMT)
Classical Criticality via Quantum Annealing [0.0] 量子異方体が位相図を正確に再現し、臨界現象をシミュレートできることを実証する。
我々は、温度相転移の臨界指数を研究するために、有限サイズスケーリングとバインダー累積剤を量子アニールに用いた。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:04:27 GMT)
CSC-SQL: Corrective Self-Consistency in Text-to-SQL via Reinforcement Learning [0.0] 自己整合性と自己整合性を統合する新しい手法であるCSC-を提案する。
我々の3Bモデルは65.28%の精度で実行し、7Bモデルは69.19%の精度で実行した。
BIRDでは,3Bモデルが65.28%,7Bモデルが69.19%を達成している。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:52:19 GMT)
CMLFormer: A Dual Decoder Transformer with Switching Point Learning for Code-Mixed Language Modeling [0.0] CMLFormerは、共有エンコーダと同期デコーダのクロスアテンションを備えた拡張された多層デュアルデコーダトランスである。
CMLFormerは、スイッチングポイントと翻訳アノテーションを備えた拡張Hinglishコーパスで事前トレーニングされている。
実験によると、CMLFormerは他のアプローチよりもF1スコア、精度、精度が向上している。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:50:49 GMT)
Blindfolded Spider-man Optimization: A Single-Point Metaheuristics Suitable for Continuous and Discrete Spaces [0.0] 連続領域と離散領域の両方に適した新しい単一点メタヒューリスティック最適化手法を提案する。
ブラインドフォールドスパイダーマン最適化(Blindfolded Spiderman Optimization)は、各行セグメントが改善された解点への移動を考慮に入れた、一回りの線形探索軌道に従う。
Blindfolded Spiderman Optimization は連続空間と離散空間の両方において優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:05:21 GMT)
Autonomous Stabilization of Floquet States Using Static Dissipation [0.0] 量子システムの特性を強い周期駆動を用いて修正するフロケット工学は、原子および凝縮物質系において欠かせない道具である。
本稿では、Floquetシステムの大規模クラスを所望の状態に冷却するために、駆動系と損失補助体の静的結合を利用する単純な自律スキームについて述べる。
論文参考訳(メタデータ) (Mon, 19 May 2025 16:27:21 GMT)
An entanglement-enhanced atomic gravimeter [0.0] ボース=アインシュタイン凝縮体に基づく重力計を標準量子限界を超える感度で1.7+0.4_-0.5,$dBとする。
ボース・アインシュタイン凝縮体とデルタ・コリメーションを併用した干渉計は原子の損失を最小限に抑え、干渉計を非常に長いベースライン原子干渉計に拡張する。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:27:44 GMT)
An approach based on class activation maps for investigating the effects of data augmentation on neural networks for image classification [0.0] 画像分類タスクでは、訓練されたネットワークの堅牢性を高めるためにデータ拡張戦略を用いるのが一般的である。
この文献は、ニューラルネットワークモデルによって学習されたパターンにデータ拡張手法が与える影響を分析する研究の体系を欠いている。
本研究では,画像分類に適用された畳み込みネットワークにおけるデータ拡張の効果を定量的に分析するための方法論とメトリクスセットを提案する。
論文参考訳(メタデータ) (Mon, 19 May 2025 00:03:57 GMT)
An additive refinement of quantum channel capacities [0.0] 量子チャネルの容量は、量子情報理論の基本的な量である。
漸近的正則化は一般的に必要であり、能力の研究を困難にしている。
量子チャネル容量に対して、量子シャノン定理に使用できる添加量を証明する。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:11:50 GMT)
An Overview of Arithmetic Adaptations for Inference of Convolutional Neural Networks on Re-configurable Hardware [0.0] 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクのツールとして人気を集めている。
CNNは、Field Programmable Gate Arrays (FPGA)のような組み込みプラットフォームへのデプロイに関して不利に悩まされている。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:08:28 GMT)
Agentic Publications: An LLM-Driven Framework for Interactive Scientific Publishing, Supplementing Traditional Papers with AI-Powered Knowledge Systems [0.0] 論文をインタラクティブな知識システムに変換するための新しい枠組みである。
我々のアーキテクチャは、検索拡張生成とマルチエージェント検証によって構造化されたデータと非構造化コンテンツを統合する。
主な機能としては、継続的知識更新、新たな発見の自動統合、カスタマイズ可能な詳細レベルなどがある。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:28:10 GMT)
Agent Performing Autonomous Stock Trading under Good and Bad Situations [0.0] 株式取引環境をシミュレートするパイプラインを開発した。
我々は、深層強化学習手法で株取引プロセスを自動化するエージェントを訓練した。
比較的良い(2021年まで)と悪い(2021年から2022年まで)の状況で、当社のプラットフォームを評価します。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:11:20 GMT)
Advancing Software Quality: A Standards-Focused Review of LLM-Based Assurance Techniques [0.0] 大規模言語モデル(LLM)は、既存のソフトウェア品質保証プロセスを強化する新しい機会を提供する。
LLMは要件分析、コードレビュー、テスト生成、コンプライアンスチェックなどのタスクを自動化することができる。
本稿では,LLMに基づくSQA手法と認識基準の交差について検討する。
論文参考訳(メタデータ) (Mon, 19 May 2025 22:49:30 GMT)
Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks [0.0] 正規化群畳み込みモデル(PoNG)の経路について述べる。
PoNGは、グループ畳み込み、正規化、並列設計を特徴とする、新しいニューラルアーキテクチャである。
実験では,提案モデルが既存の文献手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:32:07 GMT)
Active Learning on Synthons for Molecular Design [0.0] マルチベクトル展開に適用可能な単純なアルゴリズムであるSALSA(Synthon Acquisition)によるスケーラブル能動学習を提案する。
SALSAは、シントーンやフラグメントの選択よりもモデリングと取得を分解することで、プールベースのアクティブな学習を非可算空間に拡張する。
SALSA生成分子は、既知の生物活性と同等の化学的性質を有し、産業主導の生成アプローチよりも多様性と高いスコアを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 09:48:02 GMT)
A strong-driving toolkit for topological Floquet energy pumps with superconducting circuits [0.0] トポロジカルフロケエナジーポンプは周期駆動を用いて、トポロジカルに保護された量子化されたエネルギー電流を生成する。
従来の研究では、そのようなポンプはキャビティに結合された強い駆動の超伝導キュービットで実現できると提案されていた。
そこで我々は,トランスモン量子ビットを用いて,エネルギースケールと駆動周波数の階層構造が実現可能であることを実験的に実証した。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:47:18 GMT)
A solvable embedding mechanism for one-dimensional spinless and Majorana fermions in higher-dimensional spin-1/2 magnets [0.0] 固有スペクトルがジョルダン・ウィグナー変換によって解ける2次元量子スピン-1/2ハミルトニアンのクラスを書き留める。
一般的な構造は、XY または XX-Ising スピン鎖と ZZ-Ising スピン鎖からなる適切な格子に対応する。
提案したグリッド構造は、制御可能な量子ビットを持つ量子工学のアーキテクチャを提供することができる。
論文参考訳(メタデータ) (Mon, 19 May 2025 18:35:40 GMT)
A Systematic Review and Taxonomy for Privacy Breach Classification: Trends, Gaps, and Future Directions [0.0] 本研究は,2010-2024年におけるプライバシー侵害と侵害の分類に関する学術文献の総合的な考察である。
スクリーニングされた研究のコーパスを収集,分析し,分野における主要な研究テーマ,新たなトレンド,ギャップを同定した。
新たな分類法を導入し、研究成果を、違反分類、報告分類、侵害検出、脅威検出、侵害予測、リスク分析、脅威分類の7つの領域に分類する。
論文参考訳(メタデータ) (Mon, 19 May 2025 19:52:21 GMT)
A Structured Literature Review on Traditional Approaches in Current Natural Language Processing [0.0] 大きな言語モデルの大きな成功にもかかわらず、多くの欠点が残っている。
今後の展望に特に焦点をあてて、5つのアプリケーションシナリオにおける技術の現状を評価します。
論文参考訳(メタデータ) (Mon, 19 May 2025 11:06:50 GMT)
A Malliavin-Gamma calculus approach to Score Based Diffusion Generative models for random fields [0.0] スコアベース拡散生成モデル(SGM)を無限次元抽象ヒルベルト集合に一般化する。
データ分布のフィッシャー情報において,キャメロン=マーチンノルムが果たす役割を強調した。
論文参考訳(メタデータ) (Mon, 19 May 2025 14:46:04 GMT)
A Kolmogorov-Arnold Neural Model for Cascading Extremes [0.0] 本報告では, このドミノ効果に着目したリスク評価手法を提案することにより, 極端地震や津波など極端事象のカスケードに関する懸念が高まっている。
提案手法はコルモゴロフ・アルノルドネットワーク(KAN)内の極値理論の枠組みを開発し、特徴ベクトル上で条件付きで1つの極値事象が別の極値事象を引き起こす確率を推定する。
論文参考訳(メタデータ) (Mon, 19 May 2025 17:17:08 GMT)
A Geometry-Grounded Data Perimeter in Azure [0.0] 本稿は,Azure s blast radius Ultrametricがいかに距離を提供するか,また,この超測度空間におけるトラベリングセールスマン問題の解決がいかに順序付けを提供するかを示す。
論文参考訳(メタデータ) (Mon, 19 May 2025 15:21:08 GMT)
A Comprehensive Benchmarking Platform for Deep Generative Models in Molecular Design [0.0] 深層生成モデルは、広大な化学物質空間を効率的に探索することで、薬物発見を加速するための有望なツールとして現れてきた。
本研究は分子設計における深部生成モデルの評価を標準化するために設計された総合的なベンチマークフレームワークである分子集合(MOSES)プラットフォームの解析を行う。
以上の結果から, 化学空間における探索と利用の複雑なトレードオフを浮き彫りにして, 様々な指標に相補的な強みを示すことが判明した。
論文参考訳(メタデータ) (Mon, 19 May 2025 08:34:38 GMT)