Hunyuan-TurboS: Advancing Large Language Models through Mamba-Transformer Synergy and Adaptive Chain-of-Thought [195.2] Hunyuan-TurboSは、Transformer-Mamba Mixture of Expertsの大型ハイブリッドモデルである。
高いパフォーマンスと効率のバランスを保ち、推論コストを低く抑えている。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:44:25 GMT)
NTIRE 2025 challenge on Text to Image Generation Model Quality Assessment [146.8] 本稿では,テキスト・トゥ・イメージ(T2I)生成モデルの品質評価におけるNTIRE 2025課題について報告する。
この課題の目的は、テキスト・ツー・画像生成モデルのきめ細かい品質評価に対処することである。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:12:36 GMT)
Pursuing Temporal-Consistent Video Virtual Try-On via Dynamic Pose Interaction [142.7] Video Virtual try-onは、被験者に特定の衣服を装着したビデオフィギュアをシームレスに着ることを目的としている。
ビデオ仮想試行のための動的ポーズ相互作用を探索するために拡散モデルを活用するために,動的ポーズ相互作用拡散モデル(DPIDM)を提案する。
DPIDMは、時間的整合性を高めるために、連続フレーム間の時間的規則化された注意損失に乗じる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:52:34 GMT)
Self-Classification Enhancement and Correction for Weakly Supervised Object Detection [113.5] 弱い監督対象検出(WSOD)は、ラベル付けコストの低いため、多くの注目を集めている。
本稿では,この2つの問題を改善するための新しいWSODフレームワークを紹介する。
まず,2つの異なるMCCタスク間のギャップを埋めるために,クラス内バイナリ分類(ICBC)を統合した自己分類拡張モジュールを提案する。
また,2つのMCCタスクの結果を組み合わせて,誤分類予測を効果的に削減する自己分類補正アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:45:58 GMT)
Guided Diffusion Sampling on Function Spaces with Applications to PDEs [111.9] PDEに基づく逆問題における条件付きサンプリングのための一般的なフレームワークを提案する。
これは、関数空間拡散モデルと条件付けのためのプラグアンドプレイガイダンスによって達成される。
提案手法は,最先端の固定解像度拡散ベースラインに対して平均32%の精度向上を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:58:12 GMT)
Creatively Upscaling Images with Global-Regional Priors [98.2] C-Upscaleは、チューニング不要なイメージアップスケーリングの新しいレシピである。
これは、与えられたグローバルプロンプトと推定された地域プロンプトから派生した、グローバル・リージョンの先例に基づいている。
より高解像度で、より高画質で、より創造的な地域細部を持つ超高解像度画像を生成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:51:50 GMT)
LARES: Latent Reasoning for Sequential Recommendation [96.3] 本稿では、シークエンシャルレコメンデーションのための新しいスケーラブルなLatent ReasoningフレームワークであるLARESを紹介する。
提案手法では,パラメータの複雑性を増大させることなく推理深度を柔軟に拡張できる再帰的アーキテクチャを用いている。
LARESは既存の高度なモデルとのシームレスな互換性を示し、推奨性能をさらに向上することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:22:54 GMT)
DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning [95.3] DeepMath-103Kは、高い難易度(主に5-9レベル)で設計された大規模な数学的データセットである
これには、多数のベンチマークに対する厳格な除染、ルールベースのRL報酬に対する検証可能な回答が含まれる。
DeepMath-103Kは一般化可能な推論の進展を促進する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:12:14 GMT)
Ringmaster ASGD: The First Asynchronous SGD with Optimal Time Complexity [92.2] Ringmaster ASGDは任意に不均一な計算時間の下で最適な時間複雑性を達成する。
これにより、このようなシナリオにおける時間複雑性の理論的な下限を満たす最初の非同期SGD法となる。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:07:51 GMT)
R1-ShareVL: Incentivizing Reasoning Capability of Multimodal Large Language Models via Share-GRPO [91.3] 我々は、強化学習(RL)を通してMLLMの推論能力を高めることを目的としている。
本稿では,これらの問題に対処する新しいRL手法であるShare-GRPOを提案する。
さらに、Share-GRPOは、利点計算中の報酬情報も共有している。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:39:32 GMT)
Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models [91.2] 本稿では,機械学習に因果的手法を取り入れて,信頼性の高いMLの主要な原則間のトレードオフをナビゲートすることを提唱する。
我々は、信頼できるMLと基礎モデルの両方において、複数の競合する目標のバランスをとるためには、因果的アプローチが不可欠であると主張する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:37:51 GMT)
SimpleDeepSearcher: Deep Information Seeking via Web-Powered Reasoning Trajectory Synthesis [90.0] Retrieval-augmented Generation (RAG) システムは複雑なディープ検索シナリオにおいて高度な大規模言語モデル(LLM)を持つ。
既存のアプローチでは、高品質なトレーニングトラジェクトリが欠如し、分散ミスマッチに苦しむ、重要な制限に直面しています。
本稿では,複雑なトレーニングパラダイムではなく,戦略的データエンジニアリングによるギャップを埋めるフレームワークであるSimpleDeepSearcherを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:05:02 GMT)
Incorporating Visual Correspondence into Diffusion Model for Virtual Try-On [89.9] 拡散モデルは仮想試行(VTON)タスクで成功している。
この問題は、拡散モデルの本質性により、与えられた衣服の形状や細部を保存することは依然として困難である。
本稿では,視力の拡散前処理として視覚的対応を明示的に活用することを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:52:13 GMT)
MPO: Multilingual Safety Alignment via Reward Gap Optimization [88.8] 大規模言語モデル(LLM)は、世界中でAIアプリケーションの中心となっている。
RLHFやDPOのような既存の安全アライメントのための選好学習手法は、主に単言語であり、ノイズの多い多言語データと競合する。
本稿では,複数言語間の安全アライメントを改善するために,支配言語(英語)の安全能力の整合性を活用した新しいアプローチである多言語報酬gaP Optimization(MPO)を紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:24:51 GMT)
ARPO:End-to-End Policy Optimization for GUI Agents with Experience Replay [88.7] Agentic Replay Policy Optimizationは、複雑で長期のコンピュータタスクのパフォーマンスを改善する。
本稿では,ベースラインエージェントの性能に基づいてタスクをフィルタリングするタスク選択戦略を提案する。
OSWorldベンチマークの実験では、ARPOが競争結果を達成することを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:24:32 GMT)
KRIS-Bench: Benchmarking Next-Level Intelligent Image Editing Models [88.6] KRIS-Bench (Knowledge-based Reasoning in Image-editing Systems Benchmark) は、認知的なレンズを通してモデルを評価するための診断ベンチマークである。
本研究は,3つの基礎知識タイプ(実例,概念,手続き)にまたがる編集タスクを分類する。
詳細な評価を支援するため,人間の研究により知識ヒントによって強化され,校正された新しい知識プラウザビリティ指標を組み込んだプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:08:59 GMT)
Advances in Radiance Field for Dynamic Scene: From Neural Field to Gaussian Field [85.1] 本研究では,放射場を用いた動的シーン表現に着目した200以上の論文の体系的分析を行った。
我々は,多種多様な方法論的アプローチを統一的な表現的枠組みの下で組織し,永続的な課題の批判的検討と有望な研究方向性を結論づける。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:33:32 GMT)
Learning Adaptive and Temporally Causal Video Tokenization in a 1D Latent Space [84.2] AdapTokは、ビデオコンテンツに基づいて異なるフレームに対してフレキシブルにトークンを割り当てる適応的時間的因果的ビデオトークンライザである。
AdapTokは、異なるトークン予算の下で、再構築品質と生成パフォーマンスを継続的に改善する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:02 GMT)
R1-Searcher++: Incentivizing the Dynamic Knowledge Acquisition of LLMs via Reinforcement Learning [83.3] 大きな言語モデル(LLM)は強力だが、静的な知識によって幻覚を起こす傾向がある。
内部および外部の知識ソースを適応的に活用するLLMのトレーニングを目的としたフレームワークであるR1-Searcher++を紹介する。
実験の結果,R1-Searcher++は従来のRAG法や推論法より優れ,効率的な検索が可能であった。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:58:26 GMT)
Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [83.2] 本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:08:47 GMT)
DeepRec: Towards a Deep Dive Into the Item Space with Large Language Model Based Recommendation [83.2] 大型言語モデル (LLM) はレコメンダシステム (RS) に導入された。
本稿では, LLM と TRM の自律的マルチターンインタラクションを実現する新しい RS である DeepRec を提案する。
公開データセットの実験では、DeepRecは従来のものとLLMベースのベースラインの両方で大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:49:38 GMT)
Transforming the Hybrid Cloud for Emerging AI Workloads [82.2] このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:31:51 GMT)
Teaching Large Language Models to Maintain Contextual Faithfulness via Synthetic Tasks and Reinforcement Learning [80.3] 本研究では,人間のアノテーションを使わずに,大規模言語モデル(LLM)の短文および長文生成タスクにおける忠実度を改善するための体系的フレームワークであるCANOEを提案する。
また,ルールに基づく強化学習手法であるDual-GRPOを提案する。
実験結果から,CANOEは11の下流タスクにまたがるLLMの忠実度を大幅に向上し,最も先進的なLLMよりも優れていた。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:10:07 GMT)
Adaptive Thinking via Mode Policy Optimization for Social Language Agents [75.3] 動的社会的相互作用における言語エージェントの適応的思考能力を改善するための枠組みを提案する。
本フレームワークは,(1)多言語思考モード設計,(2)コンテキスト認識モード切り替え,(3)深度適応処理によるトークン効率推論の3つの重要な側面において,既存の研究を推し進めている。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:44:47 GMT)
Incentivizing Dual Process Thinking for Efficient Large Language Model Reasoning [75.0] 大規模推論モデル(LRM)は複雑な推論タスクに対して強い性能を示してきたが、しばしば過度に考えることに悩まされている。
認知科学における二重プロセス理論に着想を得て,適応認知政策最適化を提案する。
ACPOは、適応的な認知アロケーションと動的システムスイッチによって、LRMの効率的な推論を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:15:08 GMT)
ReAugment: Model Zoo-Guided RL for Few-Shot Time Series Augmentation and Forecasting [74.0] 本稿では,時系列データ拡張のための強化学習(RL)の試験的検討を行う。
我々の手法であるReAugmentは、トレーニングセットのどの部分が拡張されるべきか、どのように拡張を行うべきか、RLがプロセスにどのような利点をもたらすのか、という3つの重要な問題に取り組む。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:27:18 GMT)
Attention with Trained Embeddings Provably Selects Important Tokens [73.8] トーケン埋め込みは言語モデリングにおいて重要な役割を担っているが、この実践的関連性にもかかわらず、理論的な理解は限られている。
本論文は,勾配降下法により得られた埋め込み構造を特徴付けることにより,そのギャップを解消する。
実世界のデータセット(IMDB、Yelp)の実験では、我々の理論が明らかにしたものに近い現象が示されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:00:09 GMT)
Evaluating Large Language Model with Knowledge Oriented Language Specific Simple Question Answering [73.7] KoLasSimpleQAは,Large Language Models (LLMs) の多言語事実能力を評価する最初のベンチマークである。
既存の研究に触発されて、単一知識点カバレッジ、絶対的客観性、独特な答え、時間的安定性といった特徴を備えた質問セットを作成しました。
その結果,2つの領域間に大きな性能差が認められた。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:27:02 GMT)
Semi-Supervised State-Space Model with Dynamic Stacking Filter for Real-World Video Deraining [73.6] 本稿では,ビデオシーケンスにおけるストリーク除去を改善するために,2分岐時間状態空間モデルを提案する。
マルチフレーム機能融合を改善するために,画素ワイド機能改善のための統計的フィルタを適応的に近似する動的フィルタ積層法を提案する。
降雨環境における他の視覚に基づくタスクを支援する上でのデラミニングモデルの能力をさらに探求するため,我々は新しい実世界ベンチマークを導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:50:00 GMT)
How to Enable Effective Cooperation Between Humans and NLP Models: A Survey of Principles, Formalizations, and Beyond [73.6] 我々は、その原則、形式化、オープンな課題を探求し、人間-モデル協力の徹底的なレビューを行う。
既存のアプローチを要約する統一的な視点を提供する新しい分類法を導入する。
また、潜在的なフロンティア領域とその対応課題についても論じる。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:58:23 GMT)
Mitigate One, Skew Another? Tackling Intersectional Biases in Text-to-Image Models [73.2] テキスト・ツー・イメージ・モデルにおけるバイアス相互作用を解析・定量化するための新しいツールであるBiasConnectを紹介する。
ユーザが定義した目標分布と優先度重みを導出する交叉バイアス緩和アルゴリズムであるInterMitを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:56:38 GMT)
LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning [72.0] LLaDA-Vは,視覚的インストラクションチューニングとマスク付き拡散モデルを統合した,純粋拡散に基づくマルチモーダル言語モデル(MLLM)である。
代表的な大規模言語拡散モデルであるLLaDAに基づいて構築されたLLaDA-Vには、視覚的特徴を言語埋め込み空間に投影するビジョンエンコーダとコネクタが組み込まれている。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:23:26 GMT)
In-Context Watermarks for Large Language Models [71.3] In-Context Watermarking (ICW)は、インシデントエンジニアリングのみで生成されたテキストに透かしを埋め込む。
粒度の異なる4つのICW戦略について検討した。
本実験は,モデルに依存しない実用的な透かし手法としてのICWの実現可能性を検証するものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:24:51 GMT)
LaViDa: A Large Diffusion Language Model for Multimodal Understanding [71.0] LaViDaは離散拡散モデルに基づいて構築されたビジョンランゲージモデルのファミリーである。
DMは、高速な推論と制御可能な生成のための双方向コンテキストのための並列デコーディングを提供する。
LaViDaはマルチモーダルベンチマークでAR VLMと競合または優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:07:12 GMT)
Multi-SpatialMLLM: Multi-Frame Spatial Understanding with Multi-Modal Large Language Models [70.4] マルチモーダル大言語モデル(MLLM)は視覚タスクにおいて急速に進歩しているが、空間的理解は単一画像に限られている。
本研究では, 深度知覚, 視覚対応, 動的知覚を統合することで, MLLMを頑健なマルチフレーム空間理解と組み合わせる枠組みを提案する。
我々のモデルであるMulti-SpatialMLLMは、ベースラインやプロプライエタリシステムよりも大幅に向上し、スケーラブルで一般化可能なマルチフレーム推論を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:39 GMT)
Delving into RL for Image Generation with CoT: A Study on DPO vs. GRPO [68.4] 自己回帰画像生成は、Chain-of-Thought(CoT)推論とは異なる固有の課題を示す。
本研究は,自己回帰画像生成におけるGRPOアルゴリズムとDPOアルゴリズムの総合的研究である。
以上の結果から,GRPOとDPOは異なる優位性を示し,本質的な一般化能力を有する報酬モデルが適用されたRLアルゴリズムの一般化可能性を高める可能性が示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:49 GMT)
Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.5] 自然言語でパズルを解くことは、AIにおける長年の課題である。
本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。
動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:37:40 GMT)
MASLab: A Unified and Comprehensive Codebase for LLM-based Multi-Agent Systems [67.2] 我々は,LLMベースのMASに対して,統一的で包括的で,研究に優しいMASLabを紹介する。
MASLabは複数のドメインにまたがる20以上の確立されたメソッドを統合する。
MASLab上に構築され、10以上のベンチマークと8つのモデルをカバーする広範な実験を行い、MAS手法の現在の状況を明確にかつ包括的なビューを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:54:38 GMT)
Perceptual Quality Assessment for Embodied AI [67.0] Embodied AIは近年急速に発展しているが、現在も主に実験室に配備されている。
具体的タスク、すなわちロボットの知覚品質における画像のユーザビリティを評価するためのIQA手法は存在しない。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:51:07 GMT)
Refusal Direction is Universal Across Safety-Aligned Languages [66.6] 本稿では,PolyRefuseを用いた14言語にわたる大規模言語モデル(LLM)の拒絶動作について検討する。
英語から抽出されたベクトルは、ほぼ完全な効果で他の言語での拒絶を回避できる。
この伝達性は、埋め込み空間における言語間の拒否ベクトルの並列性に起因し、言語間ジェイルブレイクの背後にあるメカニズムを同定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:54:46 GMT)
Shape it Up! Restoring LLM Safety during Finetuning [66.5] 大型言語モデル(LLM)の微調整は、ユーザ固有のカスタマイズを可能にするが、重大な安全性リスクをもたらす。
動的安全整形(DSS)は,不安全コンテンツを抑えつつ,応答の安全な部分からの学習を強化するための,きめ細かい安全信号を用いたフレームワークである。
STARスコアによって導かれるSTAR-DSSは、微調整リスクを堅牢に軽減し、多様な脅威、データセット、モデルファミリーにまたがる大幅な安全性の向上を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:05:16 GMT)
GUI-explorer: Autonomous Exploration and Mining of Transition-aware Knowledge for GUI Agent [66.3] MLLMはUIコンポーネントの誤解釈と古い知識の2つの大きな問題に悩まされている。
本稿では,2つの基本的なメカニズムを組み込んだトレーニング不要なGUIエージェントであるGUI-Explorerを提案する。
SPA-Benchでは53.7%、AndroidWorldでは47.4%のタスク成功率で、GUI-ExplorerはSOTAエージェントよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:01:06 GMT)
Transferring Textual Preferences to Vision-Language Understanding through Model Merging [65.4] 本稿では,テキストベース報酬モデル (RM) と大規模視覚言語モデル (LVLM) を併用した学習自由な代替案について検討する。
提案手法は,これらのモデルを統合することで,LVLMのスコアリングやテキストベースのRMよりも性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:28:32 GMT)
Treatment Effect Estimation for Optimal Decision-Making [65.3] 2段階CATE推定器を用いた最適意思決定について検討する。
本稿では,CATE推定誤差と判定性能のバランスをとるためにCATEを再ターゲットとした2段階学習目標を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:15:03 GMT)
Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [64.7] 幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:49:21 GMT)
General-Reasoner: Advancing LLM Reasoning Across All Domains [64.7] 強化学習(RL)は近年,大規模言語モデル(LLM)の推論能力の向上に強い可能性を示している。
本稿では,多分野にわたるLSM推論能力の向上を目的とした,新たなトレーニングパラダイムであるGeneral-Reasonerを提案する。
私たちは一連のモデルをトレーニングし、物理学、化学、金融、電子工学など幅広い分野をカバーする幅広いデータセットでそれらを評価します。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:05:09 GMT)
SpatialScore: Towards Unified Evaluation for Multimodal Spatial Understanding [64.2] マルチモーダル大規模言語モデル(MLLM)は,質問応答タスクにおいて顕著な成功を収めているが,空間的理解能力は乏しい。
既存のMLLMは3次元空間認識と理解能力を持っているか?
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:03 GMT)
Distilling the Implicit Multi-Branch Structure in LLMs' Reasoning via Reinforcement Learning [63.9] 教師による微調整(SFT)による教師から生徒への推論経路の蒸留は、大規模言語モデル(LLM)の推論能力を向上させるショートカットを提供する。
GSRM(Generative Structure Reward Model)による強化学習に基づく蒸留フレームワークRLKDを提案する。
GSRMは、推論パスを複数のメタ推論解決ステップに変換し、報酬を計算して、学生と教師の推論の構造的アライメントを測定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:36:36 GMT)
SafeRoute: Adaptive Model Selection for Efficient and Accurate Safety Guardrails in Large Language Models [63.6] 本稿では,難しい例と簡単な例を区別するバイナリルータを提案する。
提案手法は、ルータが考慮するデータに対して、より大きな安全ガードモデルを選択的に適用し、精度を維持しながら効率を向上する。
複数のベンチマークデータセットによる実験結果から,適応モデルの選択により,計算コストと安全性性能のトレードオフが著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:19:05 GMT)
Risk-Averse Reinforcement Learning with Itakura-Saito Loss [63.6] 状態値と行動値の関数を学習するために,板倉-斎藤偏差に基づく安定かつ数学的に音響損失関数を導入する。
提案する損失関数を,理論上も経験的にも,確立した代替案に対して評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:18:07 GMT)
Tool-Star: Empowering LLM-Brained Multi-Tool Reasoner via Reinforcement Learning [63.3] 大言語モデル(LLM)は、大規模強化学習(RL)を通じて顕著な推論能力を示した。
ステップワイズ推論中に複数の外部ツールを自律的に呼び出すLLベースのフレームワークであるTool-Starを紹介する。
Tool-Starは6種類のツールを統合し、データ合成とトレーニングの両方に体系的な設計を取り入れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:00:19 GMT)
Generative Latent Coding for Ultra-Low Bitrate Image and Video Compression [61.5] 画像圧縮とビデオ圧縮のほとんどの手法は、画素空間における変換符号化を行い、冗長性を低減する。
画像とビデオの圧縮, GLCイメージ, GLC-Video のための textbfGenerative textbfLatent textbfGLC (textbfGLC) モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:31:33 GMT)
R1-Compress: Long Chain-of-Thought Compression via Chunk Compression and Search [61.5] CoT(Chain-of-Thought)推論は、ステップバイステップの問題解決を可能にすることで、大きな言語モデル(LLM)を強化する。
CoTのLong-CoTへの拡張はトークン長の増加による計算オーバーヘッドを大幅に増加させる。
ローカル情報とコヒーレンスの両方を保存する2段階のチャンクレベル圧縮フレームワークであるR1-Compressを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:06:59 GMT)
AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models [61.4] 我々は,AudioTrustを紹介した。Audio Large Language Models (ALLMs)のために設計された,最初の多面的信頼性評価フレームワークとベンチマークである。
AudioTrustは、公正性、幻覚、安全性、プライバシ、堅牢性、認証の6つの重要な側面にわたる評価を促進する。
評価のために、ベンチマークは、9つの音響特性評価指標を慎重に設計し、大規模自動パイプラインを用いて、モデル出力の客観的かつスケーラブルなスコアリングを行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:27:46 GMT)
NAN: A Training-Free Solution to Coefficient Estimation in Model Merging [61.4] 最適なマージ重み付けは,各モデルに符号化されたタスク固有情報の量とともにスケールする必要があることを示す。
パラメータノルムの逆数を用いてモデルマージ係数を推定する,単純で効果的な手法であるNANを提案する。
NANはトレーニングフリーで、プラグアンドプレイで、幅広いマージ戦略に適用できる。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:46:08 GMT)
ReflectEvo: Improving Meta Introspection of Small LLMs by Learning Self-Reflection [60.8] 本稿では,小言語モデル(SLM)がリフレクション学習を通じてメタイントロスペクションを向上させることを実証するために,新しいパイプラインであるReflectEvoを提案する。
大規模かつ包括的かつ自己生成型リフレクションデータセットであるReflectEvo-460kを構築し,多様なマルチドメインタスクを実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:03:05 GMT)
M2SVid: End-to-End Inpainting and Refinement for Monocular-to-Stereo Video Conversion [60.7] 入力左図の奥行きに基づく再投影により得られた歪んだ右図の描画と洗練のための新しいアーキテクチャを提案する。
提案手法は従来の最先端手法よりも優れており,ユーザスタディでは4つの比較手法の中で平均1.43のランクが得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:58:54 GMT)
Don't "Overthink" Passage Reranking: Is Reasoning Truly Necessary? [60.7] 我々は、推論に基づくポイントワイドリランカ(ReasonRR)と、同じ訓練条件下での標準、非推論ポイントワイドリランカ(StandardRR)を比較した。
ReasonRR-NoReasonはReasonRRよりも驚くほど効果的であることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:41:37 GMT)
Training Long-Context LLMs Efficiently via Chunk-wise Optimization [60.1] textitSequential Chunk-wise Optimization (SeCO) は、長い入力を管理可能なチャンクに分割するメモリ効率の訓練パラダイムである。
textitSparse Chunk-wise Optimization (SpaCO)を導入し、特定のチャンクへの勾配を選択的に伝播することで計算オーバーヘッドを削減する。
SpaCOは、コンテキスト長からバックプロパゲーションの計算コストを分離し、シーケンスが長くなるにつれて、トレーニング時間が徐々に推論時間に収束することを可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:11:34 GMT)
Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models [59.6] 大規模言語モデル(LLM)は、効果的なアライメントのために高品質な命令データを必要とする。
本稿では,大規模かつ高品質な符号化命令を合成するスケーラブルなアルゴリズムであるGenematic-Instructを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:36:42 GMT)
PICT -- A Differentiable, GPU-Accelerated Multi-Block PISO Solver for Simulation-Coupled Learning Tasks in Fluid Dynamics [59.4] 我々はPyTorchで符号化された可変圧単純化解器であるPICTをGPU(Graphics-Processing-unit)をサポートした流体シミュレータとして提案する。
まず,様々なベンチマークにおいて,フォワードシミュレーションと導出した勾配の精度を検証した。
2次元, 3次元の複雑な乱流モデルの学習には, 解法によって得られる勾配が有効であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:55:10 GMT)
Internal Bias in Reasoning Models leads to Overthinking [58.8] 推論モデルにおける過度な考えは、入力テキストに対する内部バイアスから生じる可能性があることを初めて示します。
元の入力部をマスクアウトすることで、内部バイアスの影響を効果的に緩和することができ、推論長を31%-53%削減することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:35:52 GMT)
Efficient Motion Prompt Learning for Robust Visual Tracking [58.6] 本稿では,軽量かつプラグアンドプレイなモーションプロンプトトラッキング手法を提案する。
既存の視覚ベースのトラッカーと簡単に統合して、共同トラッキングフレームワークを構築することができる。
7つのトラッキングベンチマークの実験により、提案したモーションモジュールは、視覚ベースのトラッカーのロバスト性を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:22:58 GMT)
Position: We Need An Adaptive Interpretation of Helpful, Honest, and Harmless Principles [58.4] Helpful, Honest, and Harmless(HHH)原則は、AIシステムを人間の価値と整合させるためのフレームワークである。
我々は,HHH原理の適応的解釈を論じ,多様なシナリオへの適応のための参照フレームワークを提案する。
この作業は、AIアライメントを改善するための実践的な洞察を提供し、HHH原則が現実のAIデプロイメントにおいて基礎的かつ運用的に有効であることを保証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:33:50 GMT)
REPA Works Until It Doesn't: Early-Stopped, Holistic Alignment Supercharges Diffusion Training [58.3] Diffusion Transformer (DiTs)は最先端の画像品質を提供するが、訓練は依然として遅い。
最近の治療 -- DiT の隠された特徴と非生成的教師(例えば DINO)の特徴とを一致させる表現アライメント(REPA) -- は、初期のエポックを劇的に加速させるが、その後パフォーマンスを低下させる。
生成学習者が共同データ分布をモデル化し始めると、教師の低次元埋め込みと注意パターンがガイドではなくストラトジャケットになる。
HASTEを紹介する
論文参考訳(メタデータ) (Thu, 22 May 2025 15:34:33 GMT)
Motion Matters: Compact Gaussian Streaming for Free-Viewpoint Video Reconstruction [57.8] 3D Gaussian Splatting (3DGS)は、オンライン自由視点ビデオ(FVV)再構成のための高忠実で効率的なパラダイムとして登場した。
本研究では,動的シーンにおける動きの局所性と一貫性を活かした,コンパクトガウスストリーミング(ComGS)フレームワークを提案する。
ComGS は 3DGStream や 14X に比べて 159 X 以上のストレージ削減を実現している。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:22:09 GMT)
From Surveys to Narratives: Rethinking Cultural Value Adaptation in LLMs [57.4] LLM(Large Language Models)における文化的価値の適応は大きな課題である。
これまでの作業は主に、World Values Survey (WVS)データを使用して、LLMをさまざまな文化的価値と整合させる。
本稿では,文化価値適応のためのWVSベースのトレーニングについて検討し,調査データのみに頼って文化規範を把握し,事実知識に干渉することを見出した。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:00:01 GMT)
Consistent World Models via Foresight Diffusion [56.5] 我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:01:59 GMT)
PaTH Attention: Position Encoding via Accumulating Householder Transformations [56.3] PaTHは、ハウステリア変換の累積積に基づいて、フレキシブルなデータ依存位置符号化方式である。
家庭用行列の積をコンパクトに表現することで,効率的な並列学習アルゴリズムを導出する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:36:09 GMT)
Self-Rewarding Large Vision-Language Models for Optimizing Prompts in Text-to-Image Generation [55.4] 本稿では,シンプルなユーザプロンプトをテキスト・ツー・イメージ・モデルに洗練されたプロンプトに変換するための新しいプロンプト最適化フレームワークを提案する。
具体的には、ユーザプロンプトを書き換えるために大きな視覚言語モデル(LVLM)を使用し、同時にLVLMを報酬モデルとして使用し、最適化されたプロンプトによって生成された画像の美学とアライメントをスコアする。
努力的な人間のフィードバックの代わりに、私たちはLVLMの以前の知識を利用して報酬、すなわちAIフィードバックを提供します。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:05:07 GMT)
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning [55.3] 複数の視覚知覚タスクの推論と解決が可能な統合フレームワークであるVisionReasonerを紹介する。
VisionReasonerは、検出、セグメンテーション、カウントという3つの重要な領域にまたがる10のタスクに対して評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:50:18 GMT)
Multipartite entanglement theory with entanglement-nonincreasing operations [55.2] 我々は、局所的な操作や古典的なコミュニケーションの標準的な枠組みを超えて、マルチパーティシステムにおける絡み合いの資源理論を拡張した。
この調整された枠組みでは、多粒子状態間の変換速度は、それぞれの量子状態の二粒子エンタングルメントエントロピーによって決定される。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:27:49 GMT)
Continuous Representation Methods, Theories, and Applications: An Overview and Perspectives [55.2] 近年,実世界のデータ固有の構造を特徴付ける新しいパラダイムとして,連続表現法が登場している。
本総説では, 基礎関数表現, 統計モデル, テンソル関数分解, 暗黙的神経表現などの連続表現法設計, (ii) 近似誤差解析, 収束特性, 暗黙的正規化などの連続表現の理論的基礎, (iii) コンピュータビジョン, グラフィックス, バイオインフォマティクス, リモートセンシングなどの連続表現の現実的応用について述べる。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:42:43 GMT)
Flow Matching based Sequential Recommender Model [54.8] 本研究では,フローマッチングに基づくフローマッチングモデルであるFMRecを紹介する。
FMRecは最先端の手法よりも平均6.53%改善している。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:53:03 GMT)
Fixing Data That Hurts Performance: Cascading LLMs to Relabel Hard Negatives for Robust Information Retrieval [54.7] BGEコレクションから15のデータセットのうち8つを抽出し、BEIRでnDCG@10を1.0ポイント増やします。
カスケードLDMプロンプトを用いた簡易で費用対効果の高い手法を提案する。
BEIR上のQwen2.5-3Bのような可逆データに微調整されたリランカーについても同様の利得が観察された。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:47:57 GMT)
Training-Free Efficient Video Generation via Dynamic Token Carving [54.5] Jengaは、ダイナミックアテンション彫刻とプログレッシブレゾリューション生成を組み合わせた推論パイプラインである。
プラグアンドプレイのソリューションとして、Jengaは現代のハードウェアで実用的な高品質のビデオ生成を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:21:32 GMT)
Breaking Complexity Barriers: High-Resolution Image Restoration with Rank Enhanced Linear Attention [54.4] ソフトマックスアテンションの変種である線形アテンションは、グローバルコンテキストモデリングにおける約束を示す。
軽量な奥行き畳み込みを統合することで特徴表現を充実させる簡易かつ効果的な方法であるRランク拡張線形アテンション(RELA)を提案する。
本稿では,RELA をベースとした画像復元変換器 LAformer を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:57:23 GMT)
Materials Generation in the Era of Artificial Intelligence: A Comprehensive Survey [54.4] 材料は現代社会の基礎であり、エネルギー、エレクトロニクス、医療、交通、インフラの進歩を支えている。
高度に調整された特性を持つ新しい材料を発見・設計する能力は、世界的課題の解決に不可欠である。
データ駆動生成モデルは、事前定義された特性要件を満たす新しい材料を直接作成することによって、材料設計のための強力なツールを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:33:21 GMT)
QuickVideo: Real-Time Long Video Understanding with System Algorithm Co-Design [54.4] ビデオ監視、会議要約、教育講義分析、スポーツ放送といった現実の応用において、ロングビデオ理解が重要な機能として現れてきた。
我々は,リアルタイムダウンストリームアプリケーションをサポートするために,長時間ビデオ理解を大幅に高速化するシステムアルゴリズムの共同設計であるQuickVideoを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:26:50 GMT)
ATA: Adaptive Task Allocation for Efficient Resource Management in Distributed Machine Learning [54.1] 非同期手法は分散機械学習における計算の並列化の基礎となる。
本稿では,不均一かつランダムな計算時間分布に適応するATA(Adaptive Task Allocation)を提案する。
ATAは最適なタスク割り当てを識別し、計算時間に関する事前の知識を持つメソッドと互換性があることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:14:01 GMT)
When can isotropy help adapt LLMs' next word prediction to numerical domains? [54.0] 文脈埋め込み空間におけるLLM埋め込みの等方性は、表現の基盤構造をいかに保っているかを示す。
実験により、数値データとモデルアーキテクチャの異なる特性が等方性に異なる影響を与える可能性が示されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:10:34 GMT)
Dimple: Discrete Diffusion Multimodal Large Language Model with Parallel Decoding [53.8] Dimple, the first Discrete Multimodal Large Language Model (DMLLM)を提案する。
我々は,初期自己回帰フェーズとその後の拡散フェーズを組み合わせた新しい訓練パラダイムを設計する。
Dimple-7BはLLaVA-を3.9%上回り、DMLLMは自己回帰モデルに匹敵する性能を達成できることを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:55:04 GMT)
Decoupled Geometric Parameterization and its Application in Deep Homography Estimation [53.0] 8自由度(DOF)を持つ平面ホモグラフィは、多くのコンピュータビジョンタスクにおいて基本的なものである。
本稿では, 相似性-核相似性分解を利用して射影変換を行うホモグラフの幾何学的パラメータ化について述べる。
提案したパラメータ化により,行列乗算による直接ホモグラフィ推定が可能となり,線形系を解く必要がなくなり,より深いホモグラフィ推定における4つのコーナー位置オフセットに匹敵する性能が得られる。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:33:29 GMT)
ChemMLLM: Chemical Multimodal Large Language Model [53.0] 分子理解と生成のための化学多モーダル大規模言語モデルであるChemMLLMを提案する。
また、テキスト、分子SMILES文字列、画像にまたがる5つのマルチモーダルタスクを設計し、データセットをキュレートする。
実験結果から,ChemMLLMは評価された全てのタスクにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:32:17 GMT)
Understanding Generative AI Capabilities in Everyday Image Editing Tasks [52.8] Redditコミュニティで過去12年間(2013-2025)に行われた83万件のリクエストを分析し、305万件のPSRウィザード編集を収集した。
人間の評価によると、最高のAIエディターによって要求の約33%が満たされる。
AIエディタは、よりオープンなタスクよりも正確な編集を必要とする、創造性の低い要求に対して、パフォーマンスが悪くなる。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:35:15 GMT)
OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [52.7] 事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
既存の手法のほとんどは、ランダムノイズから反復的にデノイングすることで、イメージを再構成する。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:14:12 GMT)
The Latency Price of Threshold Cryptosystem in Blockchains [52.4] 本稿では,Byzantine-fault Tolerant(BFT)コンセンサスプロトコルを用いた,しきい値暗号とブロックチェーンのクラス間の相互作用について検討する。
Aptosのメインネットからの測定によると、楽観的なアプローチは遅延オーバーヘッドを71%削減する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:09:16 GMT)
GLTW: Joint Improved Graph Transformer and LLM via Three-Word Language for Knowledge Graph Completion [52.0] 我々は、KGの構造情報をエンコードし、それを大規模言語モデルにマージするGLTWと呼ばれる新しい手法を提案する。
具体的には、局所構造情報とグローバル構造情報の両方を効果的に符号化する改良されたグラフ変換器(iGT)を導入する。
また,KG内のすべてのエンティティを分類対象として用いたサブグラフに基づく多分類学習目標を開発し,学習効率を向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:05:10 GMT)
SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models [51.9] SelfCiteは、生成されたレスポンスの文に対して、きめ細かい文レベルの引用を生成する、自己教師型アプローチである。
SelfCiteの有効性は、LongBench-Citeベンチマークにおいて、引用F1を5.3ポイントまで増やすことによって示される。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:30:53 GMT)
ADHMR: Aligning Diffusion-based Human Mesh Recovery via Direct Preference Optimization [51.9] 本稿では、拡散に基づくHMRモデルを好みの最適化方法でアライメントするADHMRを提案する。
まず、人間のメッシュ予測モデルであるHMR-Scorerを訓練し、3Dアノテーションを使わずに、Wild画像であっても予測を評価する。
次に、HMR-Scorerを使用して好みのデータセットを作成し、各入力画像は勝者と敗者メッシュ予測のペアを持つ。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:53:53 GMT)
SOLVE: Synergy of Language-Vision and End-to-End Networks for Autonomous Driving [51.5] SOLVEは、ビジョンランゲージモデルとエンド・ツー・エンド(E2E)モデルを相乗化して自動運転車の計画を強化する革新的なフレームワークである。
提案手法は,VLMとE2Eコンポーネント間の包括的インタラクションを実現するために,共有ビジュアルエンコーダによる機能レベルでの知識共有を重視している。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:44:30 GMT)
AGENTIF: Benchmarking Instruction Following of Large Language Models in Agentic Scenarios [51.5] LLM(Large Language Models)は、現実世界のエージェントアプリケーションにおいて高度な機能を示す。
AgentIFは、エージェントシナリオでLLM命令に従う能力を体系的に評価する最初のベンチマークである。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:31:10 GMT)
VLM-R$^3$: Region Recognition, Reasoning, and Refinement for Enhanced Multimodal Chain-of-Thought [51.4] textbfVLM-R$3$ (textbfVisual textbfLanguage textbfModel with textbfRegion textbfRecognition and textbfReasoning) はMLLMに付加的な視覚的証拠が必要な場合にエフェクトを決定する機能を提供するフレームワークである。
MathVista、ScienceQA、その他のベンチマークの実験は、VLM-R$3$が新しいものを設定することを示している
論文参考訳(メタデータ) (Thu, 22 May 2025 03:50:13 GMT)
Neural Influence Estimator: Towards Real-time Solutions to Influence Blocking Maximization [51.1] この研究は、数十万のノードとエッジを数秒でIBMの問題を解決する新しいアプローチを提示している。
鍵となるアイデアは、時間集約的なモンテカルロシミュレーションの代替として、NIE(Neural Influence estimator)オフラインと呼ばれる高速で評価可能な代理モデルを構築することである。
十分に訓練されたNIEは、ソーシャルネットワークに与えられた様々なIBM問題にまたがって一般化することができ、既存のIBM最適化アルゴリズムと簡単に組み合わせることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:38:35 GMT)
Bigger Isn't Always Memorizing: Early Stopping Overparameterized Diffusion Models [51.0] 自然データ領域の一般化は、記憶の開始前に訓練中に徐々に達成される。
一般化対メモ化は、時間スケール間の競合として最もよく理解される。
この現象学は,確率論的文脈自由文法をランダムな規則で学習する拡散モデルにおいて復元されることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:40:08 GMT)
The Rise of Parameter Specialization for Knowledge Storage in Large Language Models [50.9] 言語モデルが高度化するにつれて、それらのパラメータは特殊化を増大させることを示す。
この特殊な知識分布が,これらのモデルにおける知識利用効率の向上に寄与することを実験的に検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:15:01 GMT)
Open and Sustainable AI: challenges, opportunities and the road ahead in the life sciences [50.9] 我々は、AI研究成果に対する信頼の侵食の増加についてレビューする。
我々は、AIエコシステムの断片化されたコンポーネントと、OpenとSustainable AIを最大限にサポートするためのガイドパスの欠如について論じる。
私たちの研究は、研究者と関連するAIリソースを結びつけることで、持続可能な、再利用可能な、透過的なAIの実装を容易にします。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:52:34 GMT)
YuLan-OneSim: Towards the Next Generation of Social Simulator with Large Language Models [50.9] 本稿では,YuLan-OneSimというソーシャルシミュレータを紹介する。
ユーザは、シミュレータとの自然言語インタラクションを通じて、シミュレーションシナリオを記述し、洗練することができます。
我々は、経済学、社会学、政治、心理学、組織、人口統計学、法律、コミュニケーションを含む8つの領域にまたがる50のデフォルトシミュレーションシナリオを実装した。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:01:39 GMT)
$\text{R}^2\text{ec}$: Towards Large Recommender Models with Reasoning [50.3] 我々は,本質的な推論機能を備えた統合された大規模レコメンデータモデルであるnameを提案する。
RecPOは、単一のポリシー更新で推論とレコメンデーションの両方の機能を同時に最適化する、対応する強化学習フレームワークである。
さまざまなベースラインを持つ3つのデータセットの実験では、Hit@5で68.67%、NDCG@20で45.21%の相対的な改善が見られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:55:43 GMT)
AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning [50.0] 大規模強化学習は, 強大・中小モデルの推論能力を大幅に向上させることができることを示す。
まずは算数のみのプロンプト、次にコードのみのプロンプトのトレーニングを行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:50:47 GMT)
InSTA: Towards Internet-Scale Training For Agents [49.8] 我々は、人間のアノテーションを使わずに、インターネット規模のエージェントの訓練を容易にするパイプラインを開発した。
Qwen 3 1.7Bをベースとしたエージェントをトレーニングし、WebエージェントとしてフロンティアLLMと競合すると同時に、より小型で高速なエージェントをトレーニングする。
我々のトップエージェントは56.9%の成功率に達し、データ収集ポリシーのQwen 3B、Llama 4 Maverickの235倍、Gemini 2.5 Flashのパフォーマンスの94.7%を上回りました。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:11 GMT)
Position of Uncertainty: A Cross-Linguistic Study of Positional Bias in Large Language Models [49.5] 位置バイアスがモデルの不確実性、構文、プロンプトとどのように相互作用するかを検討する。
本研究は,5つの言語にまたがる言語間比較研究である。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:23:00 GMT)
ExpertGen: Training-Free Expert Guidance for Controllable Text-to-Face Generation [49.3] ExpertGenはトレーニング不要のフレームワークで、トレーニング済みのエキスパートモデルを活用して、細かいコントロールで生成をガイドする。
我々は、専門家モデルが高い精度で生成過程を導出できることを定性的かつ定量的に示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:09:21 GMT)
Hamiltonian for a Bose gas with Contact Interactions [49.2] 我々は、ゼロレンジ相互作用(コンタクト)を介して相互作用するN geq 3$スピンレス粒子の3次元ボース気体について、ハミルトニアンの研究を行う。
このような相互作用は、2つの粒子の座標が一致するときに、偶然の超平面に課される(特異な)境界条件によって符号化される。
このような修正された境界条件によって特徴づけられるハミルトン多様体のクラスを構築し、それは自己随伴であり、下から有界である。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:17:03 GMT)
Mechanistic Understanding and Mitigation of Language Confusion in English-Centric Large Language Models [49.1] 言語混乱に関する最初の機械論的解釈可能性研究について述べる。
混乱点(CP)がこの現象の中心であることを示す。
本研究は,多言語学習モデルとの比較分析により同定された少数の臨界ニューロンの編集が,混乱を著しく軽減することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:29:17 GMT)
Learning Probabilities of Causation from Finite Population Data [49.1] 本稿では,textbfinsufficientデータを用いたサブポピュレーションにおける因果関係の確率予測の課題について述べる。
十分なデータでサブポピュレーションから洞察を引き出す機械学習モデルを提案する。
複数の機械学習モデルの評価は、人口レベルのデータと機械学習モデルとアクティベーション関数の適切な選択を考えると、PSNを効果的に予測できることを示唆している。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:31:44 GMT)
UNCLE: Uncertainty Expressions in Long-Form Generation [48.8] 大型言語モデル(LLM)は幻覚を起こす傾向があり、特に長期の世代では顕著である。
長文と短文の問合せ(QA)における不確実性評価のためのベンチマークであるUNCLEを紹介する。
私たちのデータセットは、ペアの質問とゴールドスタンダードの回答で、ショートとロングフォームのQAを直接ブリッジする最初のものです。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:16:08 GMT)
Illusion or Algorithm? Investigating Memorization, Emergence, and Symbolic Processing in In-Context Learning [48.7] 大規模トランスフォーマー言語モデル(LM)は、Webスケールデータによる次世代の予測のみを訓練することで、幅広いタスクを解決できる。
この能力の背後にあるメカニズムは、ICL(In-context Learning)と呼ばれ、議論の余地があり、理解が不十分なままである。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:54:24 GMT)
V2V: Scaling Event-Based Vision through Efficient Video-to-Voxel Simulation [48.6] イベントベースのカメラは、高時間分解能、高ダイナミックレンジ、低消費電力などのユニークな利点を提供する。
大規模なストレージ要件とI/O負荷により、イベントベースのトレーニングデータセットのスケールアップが防止される。
従来のビデオフレームを直接イベントベースのボクセルグリッド表現に変換するアプローチであるV2V(Video-to-Voxel)を導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:38:12 GMT)
Facial Expression Analysis and Its Potentials in IoT Systems: A Contemporary Survey [48.6] 表情分析とIoT(Internet-of-Thing)システムの統合は、さまざまなシナリオにおいて大きな可能性を秘めている。
本研究の目的は,表情分析における研究の進展を概観し,IoTシステムとの統合の可能性を探ることである。
表情に基づく技術とIoTシステムの融合に向けた課題と今後の方向性を強調します。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:11:04 GMT)
Why Can Accurate Models Be Learned from Inaccurate Annotations? [48.5] 誤ったラベルが存在するにもかかわらず、ノイズの多いデータに基づいて訓練されたモデルは、しばしば正確な予測を行う能力を保持する。
この興味深い現象は、なぜモデルが不正確なアノテーションから正確なラベル情報を抽出できるのかという根本的な疑問を提起する。
ラベルの不正確さによって生じるノイズを軽減しつつ,分類器が主部分空間情報の保持を支援する軽量なプラグインであるLIPを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:00:15 GMT)
Discrepancies are Virtue: Weak-to-Strong Generalization through Lens of Intrinsic Dimension [48.4] W2S(Wak-to-strong)一般化(W2S)とは、弱い教師が生成した擬似ラベルに基づいて強力な学生モデルを訓練するファインタニング(FT)の一種である。
我々は、分散還元の観点から、リッジレス回帰設定におけるW2Sを解析する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:55:30 GMT)
ToolSpectrum : Towards Personalized Tool Utilization for Large Language Models [48.3] ToolSpectrumは、大規模言語モデルのパーソナライズされたツール利用能力を評価するために設計されたベンチマークである。
我々は、パーソナライズ、ユーザプロファイル、環境要因の2つの重要な側面を定式化し、ツール利用に対する個人的およびシナジスティックな影響を分析する。
ツール強化LDMにおけるコンテキスト認識のパーソナライズの必要性を浮き彫りにして,現行モデルに対する限界を明らかにした。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:08:07 GMT)
Are the Hidden States Hiding Something? Testing the Limits of Factuality-Encoding Capabilities in LLMs [48.2] 大型言語モデル(LLM)における実名幻覚
不正確なコンテンツや偽造コンテンツを生成することによって、信頼性とユーザ信頼を損なう。
近年の研究では、偽文を生成する際、LLMの内部状態が真偽に関する情報を符号化していることが示唆されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:00:53 GMT)
Manalyzer: End-to-end Automated Meta-analysis with Multi-agent System [48.1] メタアナリシス(Meta-analysis)は、複数の既存の研究からデータを合成し、包括的な結論を導き出す体系的な研究手法である。
伝統的なメタ分析は、文献検索、紙のスクリーニング、データ抽出を含む複雑な多段階パイプラインを含む。
本稿では,ツールコールによるエンドツーエンドの自動メタ分析を実現するマルチエージェントシステムManalyzerを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:25:31 GMT)
AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.8] 本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:50:33 GMT)
Motion by Queries: Identity-Motion Trade-offs in Text-to-Video Generation [47.6] 本研究では,テキスト・ビデオ・モデルにおける自己注意クエリ機能がどのように動作,構造,アイデンティティを制御するかを検討する。
ゼロショットモーション転送法と、一貫したマルチショットビデオ生成のためのトレーニング不要手法の2つの応用を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:41:38 GMT)
GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning [47.6] GoT-R1は、視覚生成における意味空間推論を強化するために強化学習を適用するフレームワークである。
本稿では,MLLMを用いた2段階多次元報酬フレームワークを提案する。
実験の結果, T2I-CompBenchベンチマークで有意な改善が認められた。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:58 GMT)
LLaMAs Have Feelings Too: Unveiling Sentiment and Emotion Representations in LLaMA Models Through Probing [47.2] この研究では、Llamaモデルの隠れた層を探索し、感情的特徴が最も表される場所を特定する。
我々は、層とスケールをまたいだ感情のエンコーディングを分析し、感情信号を最も捉えている層とプール方法を特定します。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:22:39 GMT)
CoMo: Learning Continuous Latent Motion from Internet Videos for Scalable Robot Learning [47.2] CoMoは、多様なインターネットスケールのビデオから、より情報に富んだ連続的な動きの表現を学ぶことを目指している。
動作評価と学習指導のための2つの新しい指標を提案する。
CoMoは強力なゼロショットの一般化を示しており、以前は目に見えないビデオドメインに対して連続的な擬似アクションを生成することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:58:27 GMT)
Uncovering Cultural Representation Disparities in Vision-Language Models [47.0] VLM(Vision-Language Models)は、様々なタスクにまたがる印象的な機能を示しているが、その潜在的なバイアスには懸念がある。
本研究は、画像に基づく国識別タスクにおいて、その成果を国レベルで評価することにより、著名なVLMが文化的偏見を示す程度について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:47:28 GMT)
Seeing through Satellite Images at Street Views [47.0] 衛星と路面から撮影したペア画像からニューラルラジアンス場を定式化する。
課題は、街路ビュー特有の要素(空や照明効果など)が街路ビューパノラマでしか見えないという課題に対処する。
本稿では,写真リアルなストリートビューパノラマレンダリングを実現するために,Sat2Density++を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:57:32 GMT)
Raw2Drive: Reinforcement Learning with Aligned World Models for End-to-End Autonomous Driving (in CARLA v2) [46.7] 強化学習(RL)は、模倣学習(IL)に固有の因果的混乱と分布変化を軽減することができる
RLをエンドツーエンドの自動運転(E2E-AD)に適用することは、その訓練の難しさにおいて未解決の問題である。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:46:53 GMT)
CoNav: Collaborative Cross-Modal Reasoning for Embodied Navigation [46.6] 具体的ナビゲーションのためのコラボレーティブなクロスモーダル推論フレームワークであるCoNavを紹介した。
事前訓練された3Dテキストモデルは、構造化空間意味知識を提供することにより、画像テキストナビゲーションエージェントを明示的にガイドする。
CoNavは、標準的な4つのナビゲーションベンチマークで大幅に改善されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:27:54 GMT)
TASTE: Text-Aligned Speech Tokenization and Embedding for Spoken Language Modeling [46.6] 本稿では,テキスト適応型音声トークン化と埋め込み(TASTE)を導入し,トークン化段階における音声トークンと対応するテキストの書き起こしを一致させる。
我々は広範囲な実験を行い、TASTEはトークン列の長さを劇的に減らしながら重要なパラ言語情報を保持することができることを示す。
実験の結果,TASTEを用いたSLMはSALMONやStoryClozeに匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:49:03 GMT)
FiDeLiS: Faithful Reasoning in Large Language Model for Knowledge Graph Question Answering [46.4] 大規模言語モデル(LLM)は、しばしば誤ったあるいは幻覚的な応答を生成することで挑戦される。
本稿では,知識グラフから得られた検証可能な推論ステップに回答を固定することで,LLM応答の事実性を改善するための統合フレームワークFiDeLiSを提案する。
トレーニング不要のフレームワークである本手法は,性能の向上だけでなく,異なるベンチマークにおける現実性や解釈可能性の向上にも寄与する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:07:01 GMT)
BadVLA: Towards Backdoor Attacks on Vision-Language-Action Models via Objective-Decoupled Optimization [46.0] BadVLAはObjective-Decoupled Optimizationに基づくバックドア攻撃手法である。
我々は,BadVLAがクリーンタスク精度に最小限の影響を伴って,ほぼ100%の攻撃成功率を達成することを示す。
我々の研究は、VLAモデルにおけるバックドア脆弱性に関する最初の体系的な調査を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:12:46 GMT)
Meta-PerSER: Few-Shot Listener Personalized Speech Emotion Recognition via Meta-learning [45.9] 本稿では,音声感情認識(SER)をパーソナライズするメタ学習フレームワークMeta-PerSERを紹介する。
事前学習した自己教師付きモデルからの堅牢な表現を統合することで、まず一般的な感情的手がかりを捉え、それから個人的アノテーションスタイルに微調整する。
IEMOCAPコーパスの実験では、Meta-PerSERは、目に見えないデータシナリオと見えないデータシナリオの両方において、ベースラインメソッドを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:44:20 GMT)
Self-supervised Multi-future Occupancy Forecasting for Autonomous Driving [45.9] LiDARで生成された占有グリッドマップ(L-OGM)は、シーン表現のための頑丈な鳥眼ビューを提供する。
提案するフレームワークであるLOPR(Latent Occupancy Prediction)は、生成アーキテクチャの潜在空間においてL-OGM予測を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:51:53 GMT)
Language Models are Universal Embedders [45.8] 大きな言語モデル(LLM)革命において、埋め込みは様々なシステムの重要な構成要素である。
組込み機を構築するための戦略を提案し,ユニバーサル評価ベンチマークを導入する。
実験結果から,学習モデルは言語やタスクにまたがる優れた埋め込みを生成するのに長けていることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:54:14 GMT)
CUB: Benchmarking Context Utilisation Techniques for Language Models [45.8] 言語モデル(LM)は、時代遅れのパラメトリックメモリと矛盾する関連情報を無視したり、無関係なコンテキストに邪魔されることがある。
CUB(Context Utilisation Benchmark)は、実践者が必要に応じて最適なCMTを特定するのに役立つ。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:57:08 GMT)
Fact-R1: Towards Explainable Video Misinformation Detection with Deep Reasoning [45.6] 既存の方法は、しばしば固いテンプレートに過度に適合し、偽りのコンテンツに対する深い推論を欠いている。
FakeVVは10万以上のビデオテキスト対と微粒で解釈可能なアノテーションからなる大規模ベンチマークである。
また、深い推論と協調ルールに基づく強化学習を統合するフレームワークであるFact-R1を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:05:06 GMT)
RealEngine: Simulating Autonomous Driving in Realistic Context [45.4] RealEngineは3Dシーン再構成と新しいビュー合成技術を統合する新しい運転シミュレーションフレームワークである。
実世界のマルチモーダルセンサーデータを活用することで、RealEngineはバックグラウンドシーンとフォアグラウンドトラフィック参加者を別々に再構築し、非常に多様な現実的なトラフィックシナリオを実現する。
RealEngineは、非反応性シミュレーション、安全性テスト、マルチエージェントインタラクションの3つの重要な駆動シミュレーションカテゴリをサポートしている。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:01:00 GMT)
TensorAR: Refinement is All You Need in Autoregressive Image Generation [45.4] Autoregressive (AR)イメージジェネレータは、因果シーケンス内の離散画像トークンを予測することによって、画像生成に言語モデルフレンドリなアプローチを提供する。
拡散モデルとは異なり、ARモデルは以前の予測を洗練させるメカニズムがなく、生成品質を制限している。
本稿では,次世代の予測から次世代の予測へ変換する新たなARパラダイムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:27:25 GMT)
Realistic Evaluation of TabPFN v2 in Open Environments [45.4] オープン環境におけるTabPFN v2の適応性に関する総合評価を行った。
ここでは,TabPFN v2はオープン環境において大きな制約を呈するが,小規模,共同シフト型,クラスバランス型のタスクに適していることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:55:01 GMT)
Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models [45.3] TONは視覚言語モデルの2段階のトレーニング戦略である。
選択的な推論のためのコールドスタートとして機能するシンクまたはノットフォーマットを導入している。
TONは、バニラGRPOと比較して、完成期間を最大90%短縮することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:13:29 GMT)
Renormalisation of Quantum Cellular Automata [45.3] 超立方体格子上の量子セルオートマトンに対する粗粒化法について検討した。
各タイル内の部分空間に適用される複数の進化ステップは、新しい量子セルオートマトンの一進化ステップと見なすことができる。
我々は,再正常化のための必要十分条件を導出し,それをセルオートマトンの再正規化フローの解明に利用した。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:54:08 GMT)
Training-Free Reasoning and Reflection in MLLMs [45.1] 本稿では,FRANKモデルについて紹介する。FRANKモデルとは,既製のMLLMに推論とリフレクションを付与したトレーニングフレームANd r1-liKe MLLMである。
私たちの重要な洞察は、MLLMデコーダ層間の認識と推論を分離することです。
そこで本研究では, 深いデコーダ層に推論能力を統合する, テイラー型閉形式融合機構を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:51:12 GMT)
Process vs. Outcome Reward: Which is Better for Agentic RAG Reinforcement Learning [45.1] Retrieval-augmented Generation (RAG)は大規模言語モデル(LLM)のテキスト生成能力を向上する
RAG-ProGuideは,クエリ生成,エビデンス抽出,回答生成のためのプロセスレベルの報酬を提供する高品質なデータセットである。
プロセスレベルのポリシー最適化により、提案フレームワークはLLMに対して、検索を自律的に実行し、クエリを生成し、関連する証拠を抽出し、最終的な回答を生成する権限を与える。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:39:20 GMT)
The multi-state geometry of shift current and polarization [45.0] 量子状態プロジェクタを用いて、ゲージ不変な形式を明示的に開発する。
電子偏光のモーメントと正確な関係を解くシフト電流の簡単な表現を提供する。
非線形光学および電子偏光理論への応用でそのパワーを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:24:42 GMT)
Gauge-invariant projector calculus for quantum state geometry and applications to observables in crystals [45.0] 幾何のより複雑な側面は、光応答のような複数のバンドをリンクする性質に現れる。
射影演算子に基づく明示的なゲージ不変形式を用いて、新しい多状態幾何不変量を同定する。
結晶運動量の特定の値の近傍で生じる射影形式と幾何学的不変量についてより詳細に述べる。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:11:10 GMT)
VisionPAD: A Vision-Centric Pre-training Paradigm for Autonomous Driving [44.9] VisionPADは、自律運転におけるビジョン中心のアルゴリズムのための、新しい自己教師付き事前訓練パラダイムである。
画像のみを監督として多視点表現を再構築する。
これにより、3Dオブジェクトの検出、占有率予測、マップセグメンテーションのパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:33:08 GMT)
When Are Concepts Erased From Diffusion Models? [44.9] 概念消去とは、モデルが特定の概念を生成するのを選択的に阻止する能力である。
拡散モデルにおける消去機構の2つの概念モデルを提案する。
概念がモデルから真に消去されたかどうかを徹底的に評価するために,独立した評価スイートを導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:09 GMT)
Diverse Preference Optimization [44.6] DivPO(Diverse Preference Optimization)は,従来のパイプラインよりもはるかに多様な応答を生成する最適化手法である。
DivPOは45.6%のパーソナ属性を生成し、ストーリーの多様性は74.6%増加した。
一般的な指導では、DivPOは多様性が46.2%増加し、DPOに比べて2.4%改善した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:50:19 GMT)
Supervising 3D Talking Head Avatars with Analysis-by-Audio-Synthesis [44.5] 音声駆動型3Dヘッドアバターは、音声に応じて唇を明瞭にしなければならない。
鍵となる問題は、決定論的モデルは高品質なリップシンクを生成するが、リッチな表現がないことである。
本稿では,3次元音声アバターフレームワークTHUNDERを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:30:07 GMT)
INFERENCEDYNAMICS: Efficient Routing Across LLMs through Structured Capability and Knowledge Profiling [44.3] InferenceDynamicsは、モデルの能力と知識をモデル化することによって、柔軟でスケーラブルな多次元ルーティングフレームワークである。
包括的データセットであるRouteMixで運用し、グループレベルのルーティングの有効性と一般化性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:56:51 GMT)
Model-Free Graph Data Selection under Distribution Shift [44.3] グラフドメイン適応(GDA)は、グラフ機械学習の基本的なタスクである。
本稿では,対象ドメインの分類タスクに対して,ソースドメインから最高のトレーニングデータを選択する新しいモデルフリーフレームワークであるGRADATEを提案する。
GRADATEは既存の選択法よりも優れており、トレーニングデータが少なく、市販のGDA法を向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:18:39 GMT)
Joint Relational Database Generation via Graph-Conditional Diffusion Models [44.1] プライバシのデータリリースや実際のデータセットといったアプリケーションでは、データベース(RDB)の生成モデルの構築が重要です。
従来はシングルテーブル生成にフォーカスするか、あるいはテーブルの順序を固定しテーブルを逐次生成する自動回帰因子化に依存していた。
我々は、RDB内のすべてのテーブルを秩序を課すことなく、共同でモデリングするという、根本的に異なるアプローチを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:12:56 GMT)
SoccerChat: Integrating Multimodal Data for Enhanced Soccer Game Understanding [44.0] SoccerChatは、ビジュアルデータとテキストデータを統合して、サッカービデオの理解を強化した会話型AIフレームワークである。
我々は,サッカーイベント理解において,行動分類と審判決定タスクについて,サッカーChatのベンチマークを行い,その性能を実証した。
我々の発見は、サッカー分析の進歩におけるマルチモーダル統合の重要性を強調し、よりインタラクティブで説明可能なAI駆動スポーツ分析への道を開いた。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:01:51 GMT)
Health-LLM: Personalized Retrieval-Augmented Disease Prediction System [43.9] 本稿では,大規模特徴抽出と医療知識トレードオフスコアリングを組み合わせた,革新的なフレームワークHeath-LLMを提案する。
従来の健康管理アプリケーションと比較して,本システムには3つの利点がある。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:18:12 GMT)
DOVE: Efficient One-Step Diffusion Model for Real-World Video Super-Resolution [43.8] 実世界のビデオ超解像のための効率的なワンステップ拡散モデルであるDOVEを提案する。
DOVEは、事前訓練されたビデオ拡散モデル(*,*, CogVideoX)を微調整することによって得られる。
実験により、DOVEは多段階拡散型VSR法と同等または優れた性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:16:45 GMT)
Temporal Differential Fields for 4D Motion Modeling via Image-to-Video Synthesis [43.5] 既存の方法は、開始フレームと終了フレームを含む高線量イメージングスキャンが同時に存在する限り、時間運動をシミュレートすることはできない。
我々は,第1フレームと相似して所定の長さの将来のフレームを予測する画像・ビデオ・フレームワークを用いて,通常の動作過程を先駆的にシミュレートする。
本手法は,知覚的類似性や時間的整合性に関する他の競合手法に対抗して,内在性運動軌跡に沿って4次元映像をシミュレートする。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:01:48 GMT)
Comparator-Adaptive $Φ$-Regret: Improved Bounds, Simpler Algorithms, and Applications to Games [43.1] Lu et al., [2025] による最近の研究は、コンパレータ $phi$ に対する後悔が、ある疎度ベースの複雑性尺度$phi$ に依存する適応アルゴリズムを導入している。
本研究では,より単純なアルゴリズムを用いて,より優れたコンパレータ適応型$Phi$-regretバウンドを実現するための一般的なアイデアを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:45:47 GMT)
Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning [43.0] そこで本研究では、ミステイクログ(Mistake Log)の概念を導入し、モデルの学習行動と繰り返しエラーを微調整を通して追跡する。
元のトランスフォーマーモデルをパイロットとして扱うことで,ロジットの修正によりパイロットの推論性能を向上するコパイロットモデルを設計する。
i)新しいCopilotモデル設計、(ii)Copilotが進化するMistake LogからPilotと一緒に継続的に学習する共同トレーニングパラダイム、(iii)CopilotがPilotを修正した融合推論パラダイムを紹介した、Pilot-Copilotフレームワーク全体の名称をTransformer Copilotと名付けます。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:00:45 GMT)
DriveMoE: Mixture-of-Experts for Vision-Language-Action Model in End-to-End Autonomous Driving [42.9] 我々は、Scene-Specialized Vision MoEとSkill-Specialized Action MoEを備えた、新しいMoEベースのE2E-ADフレームワークであるDriveMoEを提案する。
DriveMoEは、既存のモデルのように平均的なモードに悩まされることなく、多様なシナリオを処理できる。
Bench2Driveのクローズドループ評価実験では、DriveMoEは最先端(SOTA)のパフォーマンスを達成し、自律運転タスクにおけるビジョンとアクションMoEの組み合わせの有効性を実証している。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:23:04 GMT)
TWIG: Two-Step Image Generation using Segmentation Masks in Diffusion Models [42.8] 著作権侵害は、画像の自由な共有にとって大きな障害である。
一部のAIモデルは、著作権のある画像を直接コピーすることが注目されている。
条件拡散モデルに着想を得た2段階画像生成モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:09:29 GMT)
Code Graph Model (CGM): A Graph-Integrated Large Language Model for Repository-Level Software Engineering Tasks [42.8] 大きな言語モデル(LLM)は関数レベルのコード生成を約束しているが、リポジトリレベルのソフトウェアエンジニアリングタスクは依然として難しい。
本稿では,オープンソース LLM がエージェントベースアプローチを必要とせずに,リポジトリレベルのタスクを効果的に処理できるかどうかを検討する。
リポジトリコードグラフ構造をLLMのアテンション機構に統合するコードグラフモデル(CGM)を導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:00:55 GMT)
Lindblad evolution as gradient flow [42.7] リンドブラッドの進化は、次元$D$のヒルベルト空間上で作用する密度作用素の空間の勾配フローとして記述できることを示す。
重要なことに、リンドブラディアン進化の定常状態は、すべての場合のポテンシャルによって決定される。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:00:00 GMT)
Through the LLM Looking Glass: A Socratic Probing of Donkeys, Elephants, and Markets [42.6] この研究は、外部解釈に頼るのではなく、モデルのバイアスを直接測定することを目的としている。
我々の結果は、あらゆるモデルで共和党の立場よりも民主党を一貫して好んでいることを示している。
経済の話題では、西洋のLLMには偏見があるが、中国で開発されたものは社会主義に強く依存している。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:05:02 GMT)
REACT 2025: the Third Multiple Appropriate Facial Reaction Generation Challenge [42.3] ダイアド相互作用では、人間の顔反応の幅広いスペクトルが、それぞれの人間の話者の行動に反応するのに適しているかもしれない。
私たちは、機械学習(ML)モデルの開発とベンチマークを促進するREACT 2025チャレンジを提案しています。
本研究は,ヒトとダイアドの相互作用を137件記録したMAFRGデータセット(MARS)を,自然かつ大規模に提供した。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:55:23 GMT)
Optimization by Decoded Quantum Interferometry [42.2] Decoded Quantum Interferometry (DQI) という量子アルゴリズムを導入する。
有限体上のデータに近似するために、DQIは我々の知るどの時間よりも良い近似比を達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:02:11 GMT)
REOBench: Benchmarking Robustness of Earth Observation Foundation Models [42.1] REOBenchは、地球観測基盤モデルの堅牢性を評価するための最初の総合的なベンチマークである。
マスク付き画像モデリング、コントラスト学習、視覚言語事前学習パラダイムを用いて訓練された幅広いモデルの体系的評価を行う。
その結果, 既存の地球観測基盤モデルでは, 入力汚損に晒された場合, 顕著な性能劣化がみられた。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:34:50 GMT)
Structure-Aligned Protein Language Model [42.0] 膨大なタンパク質配列データベース上で事前訓練されたタンパク質言語モデル (pLM) は、下流の様々なタスクで優れているが、多くの生物学的応用に必要な構造的知識は欠如している。
我々は、事前学習されたタンパク質グラフニューラルネットワーク(pGNN)から、潜在レベルのコントラスト学習タスクを通じて、pLMに構造的洞察を統合する。
この課題は、pLMの残基を複数のタンパク質にまたがるpGNNの残基と整合させ、タンパク質間構造知識でpLMを豊かにする。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:56:12 GMT)
From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment [42.0] 大規模言語モデル(LLM)は、伝統的にワンサイズフィットのアプローチによって整列されてきた。
本稿では,LLMのスケーラブルなパーソナライズのための包括的フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:17:34 GMT)
Benchmarking and Pushing the Multi-Bias Elimination Boundary of LLMs via Causal Effect Estimation-guided Debiasing [41.9] 現在の大規模言語モデル(LLM)は、推論中にまだバイアスを利用する可能性があるため、LLMの一般化性は低い。
それぞれのデータに5種類のバイアスを含むマルチバイアスベンチマークを提案する。
CMBEは,複数種類のバイアスを同時に排除し,LLMの一般化性を高めることができることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:04:09 GMT)
A Comprehensive Evaluation of Contemporary ML-Based Solvers for Combinatorial Optimization [41.9] フロンティアコ(FrontierCO)は、8つの標準最適化問題タイプをカバーし、16の代表的なMLベースの解法を評価できるベンチマークである。
私たちの経験的結果は、現在の機械学習と最適化手法の長所と短所について、重要な洞察を与えてくれる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:34:38 GMT)
LIFEBench: Evaluating Length Instruction Following in Large Language Models [41.8] 本稿では,大規模言語モデルの長文指示に従う能力を評価するためにLIFEBenchを提案する。
LIFEBenchは英語と中国語の4つのタスクカテゴリにまたがる10,800のインスタンスで構成されている。
ほとんどのモデルでは、短い命令を適切に追従するが、一定のしきい値を超えると急激に劣化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:08:27 GMT)
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination [41.7] 大規模言語モデル(LLM)は、誤った情報や誤解を招く情報を幻覚させ、信頼性を制限する傾向がある。
アーキテクチャの変更は幻覚に対する既存の懸念を悪化/悪化させるか?
これらの知見は、これらの問題を相互によりよく理解することの必要性を強調し、幻覚を扱うためのより普遍的なテクニックをどう設計するかを考察する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:14:14 GMT)
SAE-SSV: Supervised Steering in Sparse Representation Spaces for Reliable Control of Language Models [41.6] 大規模言語モデル(LLM)は、自然言語の理解と生成において印象的な能力を示している。
本稿では,スパースで解釈可能な表現空間で動作する新しい教師付きステアリング手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:46:57 GMT)
Make-An-Agent: A Generalizable Policy Network Generator with Behavior-Prompted Diffusion [41.5] Make-An-Agentは、行動から政治への生成のための新しいポリシーパラメータジェネレータである。
所望の行動の1つの実演をプロンプトとして、エージェントに対して制御ポリシーを生成する方法を示す。
また,Make-An-Agentによって生成されたポリシーを,ロコモーションタスク上で現実世界のロボットに展開する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:45:34 GMT)
Advancing Brainwave Modeling with a Codebook-Based Foundation Model [41.5] 信号処理基盤に根ざした原理的改善を取り入れた拡張大型脳波ファンデーションモデル(LBM)であるLaBraM++を紹介する。
LaBraM++は、さまざまなタスクで大幅に向上し、元々のアーキテクチャを一貫して上回り、他のオープンソースBMと比較して競争力のある結果を得た。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:32:56 GMT)
Breaking Information Cocoons: A Hyperbolic Graph-LLM Framework for Exploration and Exploitation in Recommender Systems [41.4] HERecはハイパーボリックグラフ-LLMフレームワークで、レコメンダシステムの探索とエクスプロイトを効果的にバランスさせる。
本フレームワークは,(1)多言語空間において,リッチテキスト記述と協調的な情報とを協調的に協調する意味的強化された階層的メカニズムを導入する。
実験により、HERecはユークリッドベースラインと双曲ベースラインの両方を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:14 GMT)
UniPhy: Learning a Unified Constitutive Model for Inverse Physics Simulation [41.4] 本稿では,様々な材料の物理的特性をエンコードできる共通潜在条件ニューラルモデルを提案する。
推論において、UniPhyは逆シミュレーション、すなわち微分可能シミュレーションによる材料特性の推論を可能にする。
我々は,UniPhyからの推論により,新しい条件下でのより正確なリプレイとリシミュレーションが可能となることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:50:52 GMT)
EduBench: A Comprehensive Benchmarking Dataset for Evaluating Large Language Models in Diverse Educational Scenarios [41.4] 教育シナリオに適した最初の多様なベンチマークを紹介します。
本稿では,教師と学生の両方に関係のある12つの重要な側面をカバーする多次元評価指標を提案する。
構築したデータセット上で比較的小規模なモデルをトレーニングし、最先端の大規模モデルに匹敵するパフォーマンスを実現することを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:01:28 GMT)
PoE-World: Compositional World Modeling with Products of Programmatic Experts [41.1] 世界がどのように機能するかを学ぶことは、複雑な環境に適応できるAIエージェントの構築の中心である。
LLM(Large Language Models)を用いたプログラム合成の最近の進歩は、ソースコードとして表現された世界モデルを学ぶための代替アプローチを提供する。
このアプローチは,数個の観測結果から複雑な世界モデルを学習できることを示し,これらをモデルベース計画エージェントに組み込むことで,AtariのPongとMontezumaのRevengeの未確認レベルに対する効率的な性能と一般化を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:02:44 GMT)
FairSIN: Achieving Fairness in Graph Neural Networks through Sensitive Information Neutralization [40.8] フィルタリングベースの戦略は、いくつかの非感度な特徴情報をフィルタリングする可能性もあり、予測性能と公平性の間の準最適トレードオフにつながると我々は主張する。
メッセージパッシング前のノード機能や表現に、F3(Fairness-facilitating Features)を追加して組み込むという、革新的な中立化に基づくパラダイムを紹介します。
提案手法をFairSINと命名し,データ中心とモデル中心の両方の観点から,実装のバリエーションを3つ提示する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:15:13 GMT)
Deep Learning-Driven Ultra-High-Definition Image Restoration: A Survey [40.8] 超高精細画像(UHD)画像復元は、超高精細画像の品質劣化の問題を特に解決することを目的としている。
この分野での最近の進歩は、主にディープラーニングベースのイノベーションによって引き起こされている。
我々は,UHD画像復元の最近の進歩を体系的にレビューし,データセット構築からアルゴリズム設計まで,様々な側面を網羅した。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:03:53 GMT)
GreekBarBench: A Challenging Benchmark for Free-Text Legal Reasoning and Citations [40.6] ギリシャ・バーベンチは、ギリシャ・バーの試験と異なる5つの法分野の法的問題に関するLLMを評価するベンチマークである。
自由テキスト評価の課題に対処するために,LLM-as-a-judgeアプローチと組み合わせた3次元スコアリングシステムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:24:17 GMT)
EquivPruner: Boosting Efficiency and Quality in LLM-Based Search via Action Pruning [40.5] EquivPrunerは推論検索中に意味論的に等価なアクションを識別し、特定する。
数学的ステートメント同値性のための最初のデータセットであるMathEquivは、軽量な等価検出器のトレーニングを可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:07:43 GMT)
SWE-Dev: Evaluating and Training Autonomous Feature-Driven Software Development [40.5] SWE-Devは,自律的なコーディングシステムの評価とトレーニングを目的とした,最初の大規模データセット(トレーニング14,000,テストサンプル500)である。
Supervised Fine-Tuning (SFT) のための高品質なデータを提供するが、実行可能な単体テストから正確な報酬信号を提供することで強化学習(RL)を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:51:49 GMT)
Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning [40.2] タスク固有のデータに対する細調整された大規模言語モデル(LLM)は、その効果的なデプロイメントには不可欠である。
データウィスペラ (Data Whisperer) は,数発のインコンテクスト学習とモデルによる微調整を併用した,効率的でトレーニング不要なアテンションベースの手法である。
Data Whispererは、Llama-3-8B-インストラクトモデルの完全なGSM8Kデータセットよりも優れたパフォーマンスを実現し、データの10%しか使用せず、既存のメソッドよりも3.1ポイントの改善と7.4$times$スピードアップを実現している。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:07:23 GMT)
Beyond Static Testbeds: An Interaction-Centric Agent Simulation Platform for Dynamic Recommender Systems [40.1] RecInterは、リコメンダシステムのための新しいエージェントベースのシミュレーションプラットフォームである。
RecInterでは、ユーザーアクション(例えば、レビュー、購入など)をリアルタイムで動的に更新する。
Merchant Agentsは、より現実的で進化したエコシステムを育むことができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:14:23 GMT)
Provable Ordering and Continuity in Vision-Language Pretraining for Generalizable Embodied Agents [40.0] 本研究では,厳密な目標ベース制約を伴わずに,順序付きかつ連続的な視覚言語表現を学習するための行動時間的コヒーレンス学習(AcTOL)を提案する。
AcTOLは動画を連続的な軌跡として扱い、(1)フレーム間の意味的差異を対比して自然な順序を反映し、(2)中間フレーム間のスムーズな遷移を保証するために局所的なブラウン橋の制約を課す。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:03:17 GMT)
LED: LLM Enhanced Open-Vocabulary Object Detection without Human Curated Data Generation [39.6] 大規模視覚言語データに基づいてトレーニングされた大規模な基礎モデルは、OVD(Open-Vocabulary Object Detection)を加速させる。
本稿では,Large Language Models (LLMs) のデコーダ層を利用して,視覚的グラウンド化を強化する手法を提案する。
中間的なLCM層は、既にリッチな空間意味論を符号化しており、初期層のみを適用すると、ほとんどの利得が得られる。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:47:26 GMT)
Estimation of multiple parameters encoded in the modal structure of light [39.6] 光が膨張するモードの形状に符号化された複数のパラメータを同時に推定する問題について検討する。
それぞれのパラメータは、1つの非真空モードまたは平均場モードの微分に比例するモードに関連付けられる。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:20:02 GMT)
Model Merging in Pre-training of Large Language Models [39.4] 本稿では,事前学習過程におけるモデルマージ手法について包括的に検討する。
一定の学習率で訓練されたチェックポイントをマージすることで、大幅な性能向上が達成できることを示す。
我々は、効果的なモデルマージのための実践的な事前トレーニングガイドラインをオープンソースコミュニティに提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:35:43 GMT)
OCR-Reasoning Benchmark: Unveiling the True Capabilities of MLLMs in Complex Text-Rich Image Reasoning [39.1] OCR-Reasoningは、テキストリッチな画像推論タスクでマルチモーダル大言語モデルを評価するために設計された包括的なベンチマークである。
このベンチマークは、6つのコア推論能力と、テキストリッチなビジュアルシナリオにおける18の実践的推論タスクにまたがる1069の人手による例で構成されている。
注釈付き推論プロセスと最終回答により、OCR-Reasoningはモデルによって生成された最終回答だけでなく、それらの推論プロセスも評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:25:14 GMT)
Chain-of-Thought Poisoning Attacks against R1-based Retrieval-Augmented Generation Systems [39.1] 既存の敵攻撃法は通常、知識ベース中毒を利用してRAGシステムの脆弱性を調査する。
本稿では、R1ベースのRAGシステムからの推論プロセステンプレートを用いて、誤った知識を敵の文書にラップし、それらを知識ベースに注入してRAGシステムを攻撃する。
提案手法の鍵となる考え方は,モデルのトレーニング信号に一致したチェーン・オブ・シンクレット・パターンをシミュレートすることで,正史的推論プロセスとしてモデルによって誤解される可能性がある,というものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:22:46 GMT)
X-MAS: Towards Building Multi-Agent Systems with Heterogeneous LLMs [38.8] 異種LLM駆動型マルチエージェントシステム(MAS)のパラダイムについて検討する。
X-MAS-Benchは、異なるドメインにわたる様々なLLMの性能とMAS関連の機能を評価するために設計された総合的なテストベッドである。
均質なMASから異質なMASへの移行は構造的再設計を必要とせずにシステム性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:56:39 GMT)
HiMATE: A Hierarchical Multi-Agent Framework for Machine Translation Evaluation [38.7] HiMATEは機械翻訳評価のための階層型マルチエージェントフレームワークである。
MQMエラー型に基づく階層型マルチエージェントシステムを構築し,サブタイプエラーの詳細な評価を可能にする。
経験的に、HiMATEは、人間によるアライメント評価の実行において、さまざまなデータセット間の競争ベースラインよりも優れています。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:24:08 GMT)
Extraction of coherence times of biexciton and exciton photons emitted by a single resonantly excited quantum dot under controlled dephasing [38.6] 2光子共鳴励起下での1つの量子ドットから放出されるバイエクシトンおよびエキシトン光子の温度依存性の2光子干渉可視性について検討した。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:11:10 GMT)
On the Clean Generalization and Robust Overfitting in Adversarial Training from Two Theoretical Views: Representation Complexity and Training Dynamics [38.4] この現象をクリーン・ジェネリゼーションとロバスト・オーバーフィッティング(CGRO)と呼ぶ。
本稿では,2つの視点から,CGRO現象について考察する。
本研究では,学習過程中に3段階の位相遷移が起こり,ネットワークが確実に頑健な記憶体制に収束することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:26:46 GMT)
Harnessing the Computation Redundancy in ViTs to Boost Adversarial Transferability [38.3] 視覚変換器(ViT)における計算冗長性の役割と,その逆変換性への影響について検討する。
データレベルとモデルレベルを含む2種類の冗長性を同定し、攻撃効果を増幅する。
この知見に基づいて,注目空間の操作,アテンションヘッドの置換,クリーントークンの正規化,ゴーストモエの多様化,テスト時間逆行訓練など,一連のテクニックを設計する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:49:12 GMT)
MTSA: Multi-turn Safety Alignment for LLMs through Multi-round Red-teaming [38.3] textbfMulti-textbfTurn textbfSafety textbfAlignment (urapproach)フレームワーク。
レッドチームモデルは、敵のプロンプトを生成するために、思考誘導型マルチラウンドジェイルブレイク攻撃について学習する。
敵の反復最適化ステージ、レッドチームモデル、ターゲットモデルは、相互作用におけるそれぞれの能力を継続的に改善します。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:22:57 GMT)
Towards Better Understanding of Program-of-Thought Reasoning in Cross-Lingual and Multilingual Environments [38.2] 大規模言語モデル(LLM)には多段階推論が不可欠だが、多言語のパフォーマンスは依然として難しい。
Chain-of-Thought(CoT)は推論を改善するが、推論と実行の絡み合いのために英語以外の言語と競合する。
本稿では,PoT(Program-of-Thought)を推し進める枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:29:06 GMT)
What Media Frames Reveal About Stance: A Dataset and Study about Memes in Climate Change Discourse [37.9] 我々は、気候変動に関するインターネットのミームとの相互作用を概念化し、計算的に探求するために、学際的アプローチを適用した。
CLIMATEMEMES(CLIMATEMEMES)は、気候変化のミームにスタンスとメディアフレームの両方を付加した最初のデータセットである。
本稿では,姿勢検出とメディアフレーム検出の2つの課題を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:27:12 GMT)
WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning [37.9] WebAgent-R1は、Webエージェントをトレーニングするためのエンドツーエンドのマルチターン強化学習フレームワークである。
WebArena-Liteベンチマークの実験は、WebAgent-R1の有効性を示し、Qwen-2.5-3Bのタスク成功率を6.1%から33.9%に向上させた。
In-depth Analysis revealed the effect of the thinking-based prompting strategy and test-time scaling through increase interaction for web task。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:07:43 GMT)
Scalable Graph Generative Modeling via Substructure Sequences [37.6] 本稿では,グラフ生成用トランスフォーマー事前学習フレームワークである生成グラフパターンマシン(G$2$PM)を紹介する。
G$2$PMはグラフインスタンスをサブストラクチャのシーケンスとして表現し、生成前トレーニングを用いて一般化可能で転送可能な表現を学習する。
ogbn-arxivベンチマークでは、G$2$PMはモデルのサイズを最大60Mのパラメータで改善し続けており、かなり小さなスケールでプラトーを生成する以前の生成的アプローチよりも優れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:16:34 GMT)
MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [37.6] MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:47:33 GMT)
GDI-Bench: A Benchmark for General Document Intelligence with Vision and Reasoning Decoupling [36.8] 汎用ドキュメントインテリジェンスベンチマークは、9つの主要なシナリオと19のドキュメント固有のタスクにわたる2.3kイメージを備えている。
我々はGDI-Bench上で様々なオープンソースおよびクローズドソースモデルを評価し,視覚領域と推論領域の分離解析を行った。
本モデルは,従来のベンチマークとGDI-Bench上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:16:26 GMT)
EarthSE: A Benchmark Evaluating Earth Scientific Exploration Capability for Large Language Models [36.7] 本研究では,大言語モデル(LLM)の科学的探索能力を評価するために,地球科学の専門的なベンチマークを示す。
10万件の研究論文のコーパスを活用して、まず2つのQAデータセット(アース・アイロンとアース・シルバー)を構築します。
これらのデータセットは、5つの地球圏、114の分野、11のタスクカテゴリを含み、科学的探索に不可欠な知識を評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:46:08 GMT)
Firewalls to Secure Dynamic LLM Agentic Networks [36.7] LLMエージェントは、相互依存的な目標を持つ長期計画に関わるタスクについて、他のエンティティ表現エージェントとユーザに代わって通信する可能性が高い。
エージェント通信に必要な特性として,プロアクティビティ,適応性,プライバシ(タスク必要情報のみを共有する),セキュリティを挙げる。
本稿では,ネットワークセキュリティの原則にインスパイアされた実用的な設計とプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:33:36 GMT)
Topological Phases, Criticality, and Mixed State Order in a Hubbard Quantum Simulator [36.6] 我々はモット絶縁体と1次元のピン付き電荷密度波が異なる結晶対称性保護位相(CSPT)にあることを示す。
これらの状態の2つのコピーを積み重ねることで、その分類の根底にある位相位相の特徴的な特徴である臨界点を排除できることが示される。
本研究は,プログラム可能な量子デバイスにおいて,より広い対称性で保護された位相と混合状態秩序を求めるための経路を確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:58:35 GMT)
Sparse Activation Editing for Reliable Instruction Following in Narratives [36.4] そこで本研究では,命令関連ニューロンの同定と編集により,命令追従を改善する学習自由フレームワークを提案する。
1,212例のベンチマークであるFreeInstructを紹介した。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:41:35 GMT)
Quantum Compiler Design for Qubit Mapping and Routing: A Cross-Architectural Survey of Superconducting, Trapped-Ion, and Neutral Atom Systems [36.2] 本稿では,3つの主流量子ハードウェアプラットフォームにおける量子ビットマッピングとルーティング問題について検討・分類する。
主に超伝導プラットフォーム用ハードウェア対応コンパイラの開発について検討する。
トラップイオンと中性原子装置の進化について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:49:57 GMT)
Divide-Fuse-Conquer: Eliciting "Aha Moments" in Multi-Scenario Games [36.2] 大規模言語モデル(LLM)は、強化学習(RL)中に突然高度な推論能力を示すことが観察されている。
マルチシナリオRLにおける一般化を促進するためのフレームワークであるDivide-Fuse-Conquerを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:52:21 GMT)
Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models [36.1] 本稿では,影響関数と外乱勾配検出による有害トレーニングサンプルの同定とを橋渡しする。
まず, 合成データセットにおける外乱勾配解析手法の仮説を検証した。
次に、視覚モデルにおける誤ラベルサンプルの検出と、自然言語処理トランスフォーマーモデルの性能向上のためのデータサンプル選択の有効性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:58:04 GMT)
Advancing the Scientific Method with Large Language Models: From Hypothesis to Discovery [35.9] 大規模言語モデル (LLM) は科学的方法を変えて科学的研究を変革している。
LLMは、特に化学や生物学において、実験的な設計、データ分析、生産性の向上に関与している。
AI駆動科学への移行は、創造性、監視、責任に関する倫理的な疑問を提起する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:05:48 GMT)
Meta-Reasoner: Dynamic Guidance for Optimized Inference-time Reasoning in Large Language Models [35.8] 大規模言語モデルは、複雑なタスクを解決するために、より長い推論チェーンに依存している。
この試行錯誤アプローチは、しばしば高い計算オーバーヘッドとエラーの伝播をもたらす。
推論時間推論を動的に最適化するフレームワークであるMeta-Reasonerを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:15:25 GMT)
Conditional Panoramic Image Generation via Masked Autoregressive Modeling [35.6] 本稿では,これらの課題に対処するために,マスク付き自己回帰モデルを活用した統合フレームワークパノラマ自動回帰モデル(PAR)を提案する。
既存の生成モデルに固有の不連続性に対処するため,空間コヒーレンスを高めるために円パディングを導入する。
実験では、テキスト・ツー・イメージ生成とパノラマ・アパインティング・タスクの競争性能を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:20:12 GMT)
DecoupledESC: Enhancing Emotional Support Generation via Strategy-Response Decoupled Preference Optimization [35.5] 本稿では,Gross's Extended Process Model of Emotion Regulationにインスパイアされた非結合ESCフレームワークを提案する。
我々のフレームワークは、共同最適化のベースラインを上回り、優先バイアスを減らし、応答品質を向上させる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:56:21 GMT)
Circle-RoPE: Cone-like Decoupled Rotary Positional Embedding for Large Vision-Language Models [35.5] ロータリー位置埋め込み(RoPE)は,大規模言語モデルにおいて相対位置情報を符号化する手法として広く採用されている。
RoPEの変種はテキストトークンインデックスと画像トークン間の相対的な位置依存を強制し、急激なアライメントを引き起こす。
画像トークンインデックスを円軌道に写し、テキストトークンインデックスの直線経路にマッピングし、円錐状構造を形成する新しい符号化方式であるCircle-RoPEを導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:05:01 GMT)
CityEQA: A Hierarchical LLM Agent on Embodied Question Answering Benchmark in City Space [35.2] EQA(Embodied Question Answering)は主に屋内環境に焦点を当てている。
本研究では,ダイナミックな都市空間における活発な探索を通じてオープンな語彙に答える新しい課題であるCityEQAを紹介する。
我々は,1,412の人的注釈付きタスクを含む最初のベンチマークデータセットであるCityEQA-ECを提示する。
また,CityEQA に適した新規エージェントである Planner-Manager-Actor (PMA) を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:44:13 GMT)
Arctic-Text2SQL-R1: Simple Rewards, Strong Reasoning in Text-to-SQL [35.2] 提案するArctic-Text2-R1は、RLフレームワークとモデルファミリで、正確で実行可能なsqlを生成するように設計されている。
提案手法は、調整された中間監督と複雑な報酬形成を回避し、安定したトレーニングと最終課題との整合性を促進する。
特に、私たちの7Bモデルは70Bクラスのシステムよりも優れており、フレームワークのスケーラビリティと効率性を強調しています。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:33:47 GMT)
Identifying, Evaluating, and Mitigating Risks of AI Thought Partnerships [35.1] 新たなフレームワークを通じて、AI思考パートナのリスクを特定します。
リスク評価のための具体的な指標を提案する。
開発者や政策立案者に対して、具体的な緩和戦略を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:58:48 GMT)
Model-based Large Language Model Customization as Service [34.9] OpenAIやGoogleといったプロバイダによる大規模言語モデル(LLM)サービスは、一般的なタスクでは優れているが、ドメイン固有のアプリケーションではパフォーマンスが劣ることが多い。
Llamdexは、LLMのカスタマイズをサービスとして促進する新しいフレームワークで、クライアントはデータではなく、トレーニング済みのドメイン固有モデルをアップロードする。
実験によると、Llamdexは、同じプライバシー制約の下で、最先端のプライベートデータ合成メソッドに対して、ドメイン固有の精度を最大26%向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:52:24 GMT)
Deep mineralogical segmentation of thin section images based on QEMSCAN maps [34.9] 本研究は,炭酸塩岩の薄片画像の自動鉱物学的セグメンテーションのための畳み込みニューラルネットワークモデルを提案する。
このモデルは、QEMSCANマッピング自体を低コストで一般化された効率的な方法で模倣することができる。
特に固形組織上での鉱物境界の適切な線引きについて有望な結果を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:58:34 GMT)
AAAR-1.0: Assessing AI's Potential to Assist Research [34.9] AAAR-1.0は,大規模言語モデル(LLM)の性能を評価するためのベンチマークデータセットである。
AAAR-1.0は、以前のベンチマークと大きく異なる2つの主要な方法である: 第一に、明らかに研究指向で、深いドメインの専門知識を必要とするタスク、第二に、研究者が日々従事する主要なアクティビティを反映する研究者指向である。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:10:05 GMT)
Diversity as a Reward: Fine-Tuning LLMs on a Mixture of Domain-Undetermined Data [34.6] 多様なデータセットを使用した細調整された大規模言語モデル(LLM)は、さまざまな領域にわたる全体的なパフォーマンス向上に不可欠である。
本稿では,LLMに2つのアイデンティティを与える新しい手法を提案する。多様性報酬に基づいてデータを認知的に探索し,選択する出力モデルと,選択したデータに調整する入力モデルである。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:34:02 GMT)
CoTSRF: Utilize Chain of Thought as Stealthy and Robust Fingerprint of Large Language Models [34.6] オープンソースの大規模言語モデル(LLM)の指紋としての思考の連鎖(CoT)
CoTSRF はまずソース LLM からの応答を,人工的な CoT クエリでクエリすることで収集する。
これは、反応からCoT特徴を抽出するCoT抽出器を訓練するために、対照的な学習を適用する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:28:25 GMT)
Beyond Benign Overfitting in Nadaraya-Watson Interpolators [34.2] 古典的補間型ナダラヤ・ワトソン推定器(シェパード法とも呼ばれる)を再検討する。
我々は、破滅から良心に至るまで、単調な非単調な複数の過剰な行動の存在を証明した。
その結果,本質的なデータ次元を過度に推定することは,過度に推定するよりも有害であることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:04:49 GMT)
Safe RLHF-V: Safe Reinforcement Learning from Multi-modal Human Feedback [34.0] 汎用AIアシスタント構築にはMLLM(Multimodal large language model)が不可欠である。
MLLMの安全アライメントをどうやって確保すれば、望ましくない行動を防ぐことができるのか?
本研究では,安全なRLHF-Vを初めて探求する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:42:20 GMT)
OpenSeg-R: Improving Open-Vocabulary Segmentation via Step-by-Step Visual Reasoning [33.9] オープン語彙セグメンテーションのためのステップバイステップ視覚推論フレームワークOpenSeg-Rを提案する。
我々は各画像に対する一般的な推論と画像固有の推論の両方を生成し、粗い方法でオブジェクトの視覚的理由を説明する構造的な三重項を形成する。
実験の結果,OpenSeg-Rは,オープン語彙セマンティックセマンティックセグメンテーションにおける最先端手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:51:48 GMT)
Agentic AI Software Engineers: Programming with Trust [33.9] 大きな言語モデル(LLM)は、コードスニペットを生成するのに驚くほどの習熟度を示している。
AIソフトウェアエンジニアのデプロイに成功するためには、人間主導のソフトウェアエンジニアリングプラクティスによって確立された信頼と同等以上の信頼レベルが必要である、と私たちは主張する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:02:39 GMT)
Strategically Linked Decisions in Long-Term Planning and Reinforcement Learning [33.9] 長期的な計画には、個別に成果を最適化するのではなく、目標に向かって機能する戦略を見つけることが含まれる。
本稿では,計画行動間の依存関係を戦略的リンクスコアで定量化する。
本稿では,3つの実践的応用を通して,戦略的リンクスコアの有用性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:04:17 GMT)
WikiDBGraph: Large-Scale Database Graph of Wikidata for Collaborative Learning [33.8] WikiDBGraphはWikiDataから10万の現実世界データベースの大規模グラフである。
インスタンスオーバーラップされたデータベースとフィーチャーオーバーラップされたデータベースの両方を識別する。
新たに同定されたデータベースの実験により、協調学習が優れたパフォーマンスをもたらすことが確認された。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:07:06 GMT)
Place Cells as Position Embeddings of Multi-Time Random Walk Transition Kernels for Path Planning [33.7] 海馬は、認知地図を形成する集合的な場所細胞エンコーディングを通して空間的なナビゲーションを編成する。
我々は,場所細胞の個体群をマルチスケールのランダムウォーク遷移カーネルを近似した位置埋め込みとして再認識する。
本モデルでは, 計算効率を向上しつつ, 位置セル特性, フィールドサイズ分布, 適応性, 再マッピングを捉える。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:13:59 GMT)
URLs Help, Topics Guide: Understanding Metadata Utility in LLM Training [33.7] URLコンテキストだけがトレーニングをスピードアップするのに対して、品質スコアとトピック/フォーマットのドメイン情報は明確なメリットを提供していません。
トピックやフォーマットのメタデータはトレーニングを加速しませんが、アウトプットのステアリングには有効です。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:01:20 GMT)
UniCTokens: Boosting Personalized Understanding and Generation via Unified Concept Tokens [33.7] 我々は、パーソナライズされた情報を統合された視覚言語モデル(VLM)に統合し、理解と生成を行うUniCTokensを提案する。
UniCTokensは、補完的なセマンティクスを活用するために統一された概念トークンのセットをトレーニングし、2つのパーソナライズされたタスクを強化した。
我々の研究は、理解の向上が生成を改善することを示し、生成プロセスは理解に価値ある洞察を与えることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:06:37 GMT)
Seeing Far and Clearly: Mitigating Hallucinations in MLLMs with Attention Causal Decoding [33.3] 我々は,トークンインタラクションプロセスから直接適切なコンテキスト情報を抽出できると主張している。
復号化戦略における因果推論に着想を得て、因果マスクを活用してマルチモーダルトークン間の情報伝達を確立することを提案する。
FarSightは汎用的なプラグ・アンド・プレイ・デコード方式で,外部トークンからの注意干渉を低減する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:19:57 GMT)
Understanding Deep Representation Learning via Layerwise Feature Compression and Discrimination [33.3] 深層線形ネットワークの各層は、幾何速度でクラス内特徴を徐々に圧縮し、線形速度でクラス間特徴を識別することを示す。
これは、ディープ線形ネットワークの階層的表現における特徴進化の最初の定量的評価である。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:15:55 GMT)
DivIL: Unveiling and Addressing Over-Invariance for Out-of- Distribution Generalization [33.3] アウト・オブ・ディストリビューションの一般化は、モデルが列車データから遠く離れた分布でうまく機能することを期待する一般的な問題である。
この問題に対処するための一般的なアプローチは不変学習(IL)である。
本稿では,教師なしコントラスト学習とランダムマスキング機構を付加して,逆不変学習(DivIL)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:55:32 GMT)
Robust Offline Imitation Learning from Diverse Auxiliary Data [33.1] オフラインの模倣学習は、専門家による一連のデモンストレーションからのみポリシーを学ぶことができる。
最近の研究には、専門家データとともに多数の補助的なデモンストレーションが組み込まれている。
逆補助データ(ROIDA)からのロバストオフライン模倣を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:16:50 GMT)
From Evaluation to Defense: Advancing Safety in Video Large Language Models [33.1] textbfVideoSafetyBench (VSB-77k)は,ビデオLLMの安全性に関する大規模かつ文化的に多様なベンチマークである。
ビデオモダリティの統合は安全性を平均42.3%低下させ、マルチモーダル攻撃のシステム的リスクを露呈する。
我々は,2つのイノベーションを通じて,前例のない安全性向上を実現する2段階フレームワークである textbfVideoSafety-R1 を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:16:53 GMT)
Hierarchical Safety Realignment: Lightweight Restoration of Safety in Pruned Large Vision-Language Models [33.0] 階層型安全実現(HSR)という,新規で軽量なアプローチを提案する。
HSRはまず、それぞれの注意ヘッドの安全への貢献を定量化し、最も重要なものを同定し、選択的に神経細胞を復元する。
我々は,HSRを各種モデルおよびプルーニング戦略で検証し,安全性能の顕著な改善を継続的に達成した。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:06:28 GMT)
ReFoRCE: A Text-to-SQL Agent with Self-Refinement, Consensus Enforcement, and Column Exploration [32.8] ReFoRCEは、スパイダー2.0のリーダーボードのトップのテキスト・トゥ・信頼のエージェントです。
ReFoRCEは35.83のスパイダー2.0-Snowと36.56のスコアで最先端の結果を得た。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:41:29 GMT)
Is a Peeled Apple Still Red? Evaluating LLMs' Ability for Conceptual Combination with Property Type [32.8] CCPT(Conceptual Combination with Property Type dataset)を導入する。
CCPTは12.3Kの注釈付き三つ子、名詞句、プロパティ、プロパティタイプから構成される。
CCPTを用いて,LLMを総合的に評価するための3種類のタスクを確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:47:24 GMT)
PCMamba: Physics-Informed Cross-Modal State Space Model for Dual-Camera Compressive Hyperspectral Imaging [32.8] Panchromatic (PAN) -assisted Dual-Camera Compressive Hyperspectral Imaging (DCCHI)は、スナップショットハイパースペクトルイメージングにおいて重要な技術である。
既存の研究は、主に2次元計測からスペクトル情報とPAN画像からの圧縮情報を明示的に探索することに焦点を当てており、HS再建のボトルネックとなっている。
我々は,HSIの前方物理画像処理をMambaの線形空間複雑性に組み込んで,軽量かつ高品質なHSI再構成を容易にする,DCCHIのための物理インフォームド・クロスモーダル・ステート・スペース・モデル・ネットワーク(PCMamba)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:27:46 GMT)
PulserDiff: a pulse differentiable extension for Pulser [32.7] 我々は、適切に定義された制御パラメータのセットに対してパルスシーケンスを最適化するために設計された、ユーザフレンドリーな拡張であるPulserDiffを紹介する。
デジタルゲートと状態準備をエミュレートするアナログ構成を含むいくつかのケーススタディを通して,その有用性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:54:03 GMT)
Efficient Prototype Consistency Learning in Medical Image Segmentation via Joint Uncertainty and Data Augmentation [32.5] 半教師付き医療画像セグメンテーションにプロトタイプ学習が出現している。
共同不確実性定量化とデータ拡張による効率的なプロトタイプの整合性学習を提案する。
我々のフレームワークは従来の最先端のアプローチよりも優れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:25:32 GMT)
Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation [32.3] 我々は、コンテキストに対する属性応答(ARC-JSD)のための新しいJensen-Shannon Divergence駆動方式を提案する。
ARC-JSDは、追加の微調整や人間のアノテーションなしで、重要な文脈文の効率的かつ正確な識別を可能にする。
TyDi QA, Hotpot QA, Musique など,様々なスケールの命令調整 LLM を用いたRAG ベンチマークの評価により,精度が向上し,計算効率が向上した。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:04:03 GMT)
AgentThink: A Unified Framework for Tool-Augmented Chain-of-Thought Reasoning in Vision-Language Models for Autonomous Driving [32.1] VLM(Vision-Language Models)は、自律走行を約束するが、幻覚、非効率な推論、限られた実世界の検証は、正確な知覚と堅牢なステップバイステップ推論を妨げる。
我々は、Chain-of-Thought(CoT)推論と、自律運転タスクのための動的エージェントスタイルのツール呼び出しを統合した、先駆的な統合フレームワークであるtextbfAgentThinkを紹介した。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:56:52 GMT)
Breaking mBad! Supervised Fine-tuning for Cross-Lingual Detoxification [31.8] クロス・リンガル・デトキシフィケーション(Cross-lingual Detoxification)は、大規模言語モデルにおいて毒性を緩和するパラダイムである。
本研究では, クロスディストリビューション設定における毒性低下を解析し, 非有害タスクに対するモデル性能への影響について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:30:14 GMT)
Unifying Search and Recommendation: A Generative Paradigm Inspired by Information Theory [31.7] GenSRは検索とレコメンデーションを統合するための新しい生成パラダイムである。
本研究は,従来の差別的手法と比較して新しい生成パラダイムを導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:13:56 GMT)
CHAOS: Chart Analysis with Outlier Samples [31.6] CHAOSはマルチモーダル大言語モデル(MLLM)をチャートの摂動に対して評価するためのベンチマークである。
ベンチマークには、トレーニング範囲とデータに基づいて、13の最先端MLLMを3つのグループに分割する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:26:49 GMT)
Communication-Efficient Federated Learning With Data and Client Heterogeneity [31.6] Federated Learning (FL)は、機械学習モデルの大規模分散トレーニングを可能にする。
FLを大規模に実行するには、本質的に実践的な課題が伴う。
従来のフェデレーション平均化(FedAvg)アルゴリズムの最初の変種を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:13:02 GMT)
RBench-V: A Primary Assessment for Visual Reasoning Models with Multi-modal Outputs [31.6] 本稿では,モデルに必須な推論能力を評価するためのベンチマークRBench-Vを提案する。
特定の入力モダリティを規定する以前のベンチマークとは異なり、RBench-Vはマルチモーダル出力を中心とした問題を提示する。
最も優れたモデルであるo3でさえ、RBench-Vの精度はわずか25.8%であり、人間のスコアの82.3%よりはるかに低い。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:11:57 GMT)
In-Context Adaptation to Concept Drift for Learned Database Operations [31.5] FLAIRは学習したデータベース操作のためのオンライン適応フレームワークである。
ランタイムパラメータの最適化の必要性を排除し、現在のコンセプトに沿った予測を提供する。
最大で5.2倍高速な適応を実現し、濃度推定の誤差を22.5%削減する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:16:01 GMT)
DeCafNet: Delegate and Conquer for Efficient Temporal Grounding in Long Videos [31.4] Long Video Temporal Groundingは、ユーザが提供するテキストクエリに基づいて、長いビデオ内の特定の瞬間を特定することを目的としている。
ビデオのクリップ分割と、フルスケールのエキスパートエンコーダによる各クリップの処理は、既存の方法ではスケールが難しい。
DeCafNetは、デリゲート・アンド・コンカヤの戦略を利用して、基礎性能を犠牲にすることなく計算効率を向上する手法である。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:29:57 GMT)
$I^2G$: Generating Instructional Illustrations via Text-Conditioned Diffusion [31.2] 手続き的テキストをコヒーレントな視覚的指示に分解する言語駆動型フレームワークを提案する。
提案手法は,学習内容の言語構造を目標文と逐次ステップにコヒーレンスすることでモデル化し,これらの言語要素を視覚的に生成する。
この研究は、教育、タスクガイダンス、マルチモーダル言語理解など、視覚コンテンツにおける手続き言語の基礎となる研究に寄与する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:10:09 GMT)
TrustRAG: Enhancing Robustness and Trustworthiness in Retrieval-Augmented Generation [31.2] TrustRAGは、生成のために取得される前に、悪意のある、無関係なコンテンツを体系的にフィルタリングするフレームワークである。
TrustRAGは、検索精度、効率、攻撃抵抗を大幅に改善する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:00:19 GMT)
SATURN: SAT-based Reinforcement Learning to Unleash Language Model Reasoning [31.1] 既存の強化学習タスクはスケーラビリティ、検証可能性、制御困難に悩まされている。
本研究では,SAT を用いた SAT (Boolean Satisfiability) 問題を用いて LLM 推論の学習と評価を行う SAT ベースの RL フレームワークである Saturn を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:23:10 GMT)
Effective Reinforcement Learning for Reasoning in Language Models [31.0] 強化学習(Reinforcement Learning, RL)は、数学やコーディングといった分野における言語モデル(LM)の推論能力を改善するための有望な戦略として登場した。
我々は,計算制約による比較的小さなモデルに焦点をあて,LM推論のためのRLアルゴリズム設計決定を解析する。
その結果, (i) オンラインRLは, 教師付き微調整(SFT)よりも優れ, (ii) PPOをベースとしたオフポリチクスの更新により, ばらつきを抑えて精度が向上し, (iii) KLのばらつきの除去により, より簡潔な世代と精度が向上することがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:48:09 GMT)
DetailMaster: Can Your Text-to-Image Model Handle Long Prompts? [30.7] DetailMasterはテキスト・ツー・イメージ(T2I)モデルを評価するために設計された最初の総合ベンチマークである。
このベンチマークは、専門家アノテータによって高品質な検証がなされた、平均284.89トークンの長大かつ詳細なプロンプトで構成されている。
7つの汎用T2Iモデルと5つの長周期最適化T2Iモデルの評価は、重要な性能限界を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:11:27 GMT)
Compressing Human Body Video with Interactive Semantics: A Generative Approach [30.4] 対話型セマンティクスを用いて人体映像を圧縮することを提案する。
提案するエンコーダは3次元人体モデルを用いて非線形力学と人体信号の複雑な動きを解離する。
提案するデコーダは、メッシュベースの運動場を進化させ、高品質な人体ビデオ再構成を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:51:58 GMT)
BenCzechMark : A Czech-centric Multitask and Multimetric Benchmark for Large Language Models with Duel Scoring Mechanism [30.3] BenCzechMark (BCM) は、大規模な言語モデル向けに設計されたチェコ初の総合的な言語ベンチマークである。
私たちのベンチマークには50の課題があり、対応するテストデータセット、主にチェコ原産で、新たに収集された14のタスクが含まれています。
これらのタスクは8つのカテゴリにまたがり、歴史的チェコのニュース、生徒や言語学習者のエッセイ、話し言葉など様々な分野をカバーする。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:47:46 GMT)
Can Knowledge Graphs Make Large Language Models More Trustworthy? An Empirical Study Over Open-ended Question Answering [30.1] 我々は,知識グラフを付加した大規模言語モデルの評価に特化して設計されたベンチマークであるOKGQAを紹介する。
OKGQAは様々な質問タイプを通して実践的な複雑さを反映し、幻覚率と推論の改善の両方を定量化するためにメトリクスを取り入れている。
我々は,KGのセマンティクスと構造が意図的に乱れ,汚染された場合のモデル性能を評価するためのベンチマーク変種OKGQA-Pを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:20:51 GMT)
To Code or not to Code? Adaptive Tool Integration for Math Language Models via Expectation-Maximization [30.1] 本稿では,メタ認知ツール利用決定と進化能力の間の自己強化サイクルを構築するために,構造化探索(E-step)と非政治最適化(M-step)を併用する新しいフレームワークを提案する。
当社の7Bモデルは、MATH500では11%、AIMEでは9.4%、o1のようなCoTでは9.4%改善しています。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:17:03 GMT)
Steer LLM Latents for Hallucination Detection [30.0] 本稿では、推論中に表現空間を再評価し、真理と幻覚の出力を分離するステアリングベクトルを提案する。
我々の2段階のフレームワークは、まず、ラベル付き例題の小さなセットでSVを訓練し、コンパクトで分離されたクラスタを形成します。
その後、ラベルなしのLLM世代で模範集合を拡張し、疑似ラベル付けに最適なトランスポートベースのアルゴリズムと信頼に基づくフィルタリングプロセスを組み合わせた。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:33:01 GMT)
Invisible Prompts, Visible Threats: Malicious Font Injection in External Resources for Large Language Models [29.9] 大規模言語モデル(LLM)は、リアルタイムWeb検索機能を備え、モデルコンテキストプロトコル(MCP)のようなプロトコルと統合されつつある。
この拡張は新たなセキュリティ脆弱性を導入する可能性がある。
本稿では,Webページなどの外部リソースに悪意あるフォント注入を施して,隠れた敵のプロンプトに対するLLM脆弱性を系統的に調査する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:36:33 GMT)
A Little Depth Goes a Long Way: The Expressive Power of Log-Depth Transformers [29.8] 最近の理論的結果から、変換器は計算深度が有界であるため、長い入力に対して逐次的推論問題を表現できないことが示されている。
深さ$Theta(log n)$ の高度に均一な変換器でも、2つの重要な問題を表現できることを示す。
これらの問題を定量的に表現するために、入力長で深さがどのように成長するかを定量的に予測する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:26:28 GMT)
Large Language Models based ASR Error Correction for Child Conversations [29.6] LLM(Large Language Models)は、ASR転写を改善することを約束している。
LLMはゼロショットのASR出力と微調整のCTCベースのASR出力の補正に有用である。
LLMが文脈情報を組み込む場合、ASRの性能を改善することは依然として困難である。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:28:02 GMT)
O$^2$-Searcher: A Searching-based Agent Model for Open-Domain Open-Ended Question Answering [29.6] O$2$-Searcherは、強化学習を利用してオープンドメインのオープンエンドとクローズドエンドの両方の質問に対処する、新しい検索エージェントである。
厳密に設計された報酬関数を備えた統一的なトレーニング機構を使用して、エージェントは問題タイプを特定し、異なる回答生成戦略を適用することができる。
O$2$-Searcherは3Bモデルのみを使用しており、O$2$-QA上でのLLMエージェントをはるかに上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:17:13 GMT)
LLM as Effective Streaming Processor: Bridging Streaming-Batch Mismatches with Group Position Encoding [29.6] 一般的に、後者の2つのミスマッチは頻繁な再エンコードを必要とし、再エンコード出力がほとんど不要であることを示す。
本稿では,ストリーミングモードとバッチモードの整合性を高めるため,バッチアーキテクチャ上に構築されたグループ位置符号化パラダイムを提案する。
提案手法はアーキテクチャの変更を必要とせず,ストリーミングモードとバッチモードの両方において強力な一般化を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:53:28 GMT)
BioDSA-1K: Benchmarking Data Science Agents for Biomedical Research [29.5] BioDSA-1Kは1029の仮説中心のタスクと1,177の分析計画からなる。
このベンチマークは,(1)仮説決定精度,(2)証拠と結論の整合性,(3)推論過程の正しさ,(4)AI生成解析コードの実行可能性の4つの軸に沿った評価を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:02:21 GMT)
MPL: Multiple Programming Languages with Large Language Models for Information Extraction [29.3] 本研究は,構造化出力生成を向上させるために,コードスタイルの入力を活用することに焦点を当てる。
PLは本質的に自然言語(NL)よりも構造的な構造を示す
教師付き微調整フェーズに異なるPLを組み込む可能性を探る新しいフレームワークである textbfMPL を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:28:23 GMT)
Relative Bias: A Comparative Framework for Quantifying Bias in LLMs [29.1] 相対バイアス(Relative Bias)は、LLMの振る舞いが特定のターゲットドメイン内の他のLLMとどのようにずれているかを評価するために設計された手法である。
本稿では,(1)埋め込み空間上の文表現を通して相対的バイアスパターンをキャプチャする埋め込み変換解析と,(2)言語モデルを用いて出力を相対的に評価するLLM-as-a-Judgeという2つの相補的手法を紹介する。
検証のための統計的テストに続くバイアスとアライメントのシナリオに関するいくつかのケーススタディに我々のフレームワークを適用し、この2つのスコアリング手法の間に強い整合性を見出した。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:59:54 GMT)
VeriFastScore: Speeding up long-form factuality evaluation [29.1] 長期の事実性を評価するFactScoreやVeriScoreのようなメトリクスは、入力応答をアトミックなクレームに分解し、それぞれのクレームを個別に検証することで動作する。
We propose VeriFastScore, which leverageed synthesis data to fine-tune Llama3.1 8B to the same-tune Llama3.1 8B to a given text based based on evidence from Google Search。
我々の微調整されたVeriFastScoreモデルは、VeriScoreよりも6.6倍(9.9倍)のスピードアップを実現しつつ、サンプルレベルとシステムレベルの両方でオリジナルのVeriScoreパイプラインと強い相関を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:51:25 GMT)
Amplify Adjacent Token Differences: Enhancing Long Chain-of-Thought Reasoning with Shift-FFN [29.1] 完全なパラメータを持つ微調整LDMや、長いCoTデータに低いランクを持つLoRAは、サイクリック推論につながることが多い。
本稿では, Shift Feedforward Networks (Shift-FFN) を提案する。
複数の数学的推論タスクの実験により、LoRAとShift-FFNの組み合わせはより精度が高く、サイクル推論の速度が低いことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:27:01 GMT)
Beyond LLMs: An Exploration of Small Open-source Language Models in Logging Statement Generation [28.9] 本稿では,SOLM(Small Open-source Language Models)が適切な利用を通じて有効な代替手段になるかどうかを実証的に検討する。
具体的には、4つのSOLMの大規模実験を行い、様々な相互作用戦略の影響を体系的に評価する。
我々の重要な知見は、検索・拡張生成は性能を大幅に向上し、LoRAは高効率なPEFT技術であることを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:26:53 GMT)
MEDMKG: Benchmarking Medical Knowledge Exploitation with Multimodal Knowledge Graph [28.8] 医用マルチモーダル知識グラフであるMEDMKGを提案する。
我々は,3つのタスクにまたがるMEDMKGを2つの実験的な設定で評価し,24のベースライン法と4つの最先端のビジョン言語バックボーンを6つのデータセットでベンチマークした。
その結果,MEDMKGは下流医療タスクの性能向上だけでなく,医療人工知能におけるマルチモーダル知識統合のための適応的かつ堅牢な戦略開発のための強力な基盤を提供することがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:41:46 GMT)
Render-FM: A Foundation Model for Real-time Photorealistic Volumetric Rendering [28.8] 我々は,CTスキャンの直接リアルタイムレンダリングのための新しい基礎モデルRender-FMを提案する。
本手法は様々な臨床CTデータにまたがって高品質でリアルタイムなインタラクティブな3D可視化を実現する。
実験により、Render-FMは特殊スキャン法に匹敵する視覚的忠実度を達成できることが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:18:30 GMT)
Do Retrieval-Augmented Language Models Adapt to Varying User Needs? [28.7] 本稿では,3つのユーザニーズ条件下でALMを体系的に評価する新しい評価フレームワークを提案する。
ユーザインストラクションと検索された情報の性質の両方を変えることで、我々のアプローチは現実世界のアプリケーションの複雑さを捉えます。
本研究は,検索システム開発におけるユーザ中心評価の必要性を浮き彫りにするものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:05:07 GMT)
Robustifying Vision-Language Models via Dynamic Token Reweighting [28.7] 大きな視覚言語モデル(VLM)は、ジェイルブレイク攻撃に対して非常に脆弱である。
マルチモーダル・ジェイルブレイク攻撃を緩和する新しい推論時防御法を提案する。
視覚的モダリティによって誘導される安全関連分布シフトの新しい定式化を導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:00:39 GMT)
DEL-ToM: Inference-Time Scaling for Theory-of-Mind Reasoning via Dynamic Epistemic Logic [28.5] ToM(Theory-of-Mind)タスクは、小規模言語モデル(SLM)において、限られたスケールで独自の課題を提起する。
推論時間スケーリングによるToM推論を改善するフレームワークであるDEL-ToMを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:52:56 GMT)
PolyConf: Unlocking Polymer Conformation Generation through Hierarchical Generative Models [28.5] PolyConfは、高度に調整されたポリマーコンホメーション生成法である。
我々は、ポリマー配座を一連の局所配座に分解し、自己回帰モデルを通してこれらの局所配座を生成する。
次に、拡散モデルを用いてそれらの配向変換を生成し、それらを完全なポリマー配座に組み立てる。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:24:26 GMT)
MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents [28.4] MLLMエージェントは、マルチモーダルなタスク関連軌道データを取得することで、複雑なエンボディされたタスクの可能性を実証する。
現在の検索手法は、主に軌跡におけるテキストや視覚的手がかりの表面レベルでの類似性に注目し、その特定のタスクに対する有効性を無視している。
本稿では,MART(MLLM As ReTriever)という新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:19:41 GMT)
FastCuRL: Curriculum Reinforcement Learning with Stage-wise Context Scaling for Efficient Training R1-like Reasoning Models [28.4] 我々は,効率的なトレーニングとCoT推論を実現するために,段階的コンテキストスケーリングを備えたカリキュラムRLフレームワークであるFastCuRLを提案する。
実験の結果、FastCuRL-1.5B-V3は5つの競合レベルのベンチマークで最先端の推論モデルよりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:37:21 GMT)
Interactive Post-Training for Vision-Language-Action Models [28.3] RIPT-VLAは、シンプルでスケーラブルな強化学習に基づくインタラクティブなポストトレーニングパラダイムである。
RIPT-VLAファインチューンで訓練されたビジョン・ランゲージ・アクション(VLA)モデルは、わずかに二進的な成功報酬のみを使用する。
1つのデモだけで、RIPT-VLAは15イテレーションで97%の成功率で作業不能なSFTモデルを成功させることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:45 GMT)
Preconditioners for the Stochastic Training of Neural Fields [28.3] 我々は、画像再構成、形状モデリング、ニューラルラディアンスフィールド(NeRF)といったタスクにまたがって、曲率対応の対角線前処理器を用いてニューラルネットワークを訓練するための理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:13:34 GMT)
CodeMerge: Codebook-Guided Model Merging for Robust Test-Time Adaptation in Autonomous Driving [28.0] 既存のテスト時間適応法は、不安定な最適化とシャープなミニマのために、3Dオブジェクト検出のような高分散タスクで失敗することが多い。
CodeMergeはスケーラブルなモデルマージフレームワークで、コンパクトな潜在空間で操作することでこれらの制限を回避します。
提案手法は,NuScenes-C と LiDAR による7.6% mAP 以上の検出において,エンドツーエンドの3D 検出 14.9% NDS を向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:09:15 GMT)
LongMagpie: A Self-synthesis Method for Generating Large-scale Long-context Instructions [28.0] LongMagpieは大規模なロングコンテキスト命令データを自動的に生成するフレームワークである。
本稿では,LongMagpieが短文タスクにおける競合性能を維持しながら,長文タスクにおける先行的なパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:05:02 GMT)
Fair Class-Incremental Learning using Sample Weighting [27.8] 本研究は,現在行われている課題のすべてのサンプルを鼻で使用することにより,クラスを含む特定のセンシティブなグループに対して不当な破滅的忘れを生じさせることを示す。
平均勾配ベクトルの方向を変えるために,現在のタスクサンプルのトレーニング重みを調整する,公平なクラス増分学習フレームワークを提案する。
実験により、FSWは実際のデータセットに対する最先端のアプローチよりも精度・公正なトレードオフ結果が得られることが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:42:00 GMT)
The Language of Interoception: Examining Embodiment and Emotion Through a Corpus of Body Part Mentions [27.8] 本論文は, 感情, 体感, 日常言語間の関係を, 自然言語データの大規模なサンプルで調査した最初の事例である。
オンライン英語テキスト(ブログ投稿とつぶやき)でボディ部分言及(BPM)のコーパスを作成しました。
BPMは個人的な物語やつぶやき(投稿の5%から10%はBPMを含む)で一般的であり、それらの利用パターンは時間や地域によって大きく異なります。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:47:12 GMT)
Reasoning Model is Stubborn: Diagnosing Instruction Overriding in Reasoning Models [27.4] 大規模言語モデルはよく知られた推論パターンに依存している。
ユーザーからの明確な指示にもかかわらず、これらのモデルはしばしば明確に述べられた条件をオーバーライドし、習慣的推論の軌跡をデフォルトにしている。
この振る舞いは、特に数学や論理パズルのような分野において重要な課題を呈している。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:00:01 GMT)
From Generic Empathy to Personalized Emotional Support: A Self-Evolution Framework for User Preference Alignment [27.3] 大規模言語モデル(LLM)は、ユーザ固有のニーズに対応できない汎用的かつワンサイズ対応の応答を提供する。
ユーザの暗黙の好みに合うようにLCMの応答を改善するための自己進化フレームワークを提案する。
本手法は,感情支援におけるモデルの性能を著しく向上させ,不愉快な応答を低減し,ユーザの嗜好とモデル出力の相違を最小化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:45:12 GMT)
Sketchy Bounding-box Supervision for 3D Instance Segmentation [27.3] 弱教師付き3DインスタンスセグメンテーションフレームワークであるSketchy-3DISを提案する。
まず,2つのスケッチ付きバウンディングボックス間の重なり合う部分に位置する点を適切なインスタンスに割り当てることについて,適応的に学習する。
次に、まず、ポイントクラウド全体から粗いインスタンスを予測し、粗いインスタンスの領域に基づいて細かなインスタンスを学習する粗いインスタンスセグメンテータを提示します。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:49:49 GMT)
Know the Ropes: A Heuristic Strategy for LLM-based Multi-Agent System Design [27.2] Know-The-Ropesは、ドメインの優先順位をアルゴリズムの青写真階層に変換するフレームワークである。
3つのGPT-4o-miniエージェントは、1つのボトルネックエージェントをパッチした後、サイズ5のインスタンスで3%ゼロショットから95%に精度を上げる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:52:33 GMT)
SEED: Speaker Embedding Enhancement Diffusion Model [27.2] 実世界のアプリケーションに話者認識システムを配置する際の最大の課題は、環境ミスマッチによる性能劣化である。
本稿では,事前学習した話者認識モデルから抽出した話者埋め込みを拡散ベースで取得し,洗練された埋め込みを生成する手法を提案する。
本手法は,従来のシナリオの性能を維持しつつ,ベースラインモデルよりも19.6%の精度で認識精度を向上させることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:38:37 GMT)
Predicate-Conditional Conformalized Answer Sets for Knowledge Graph Embeddings [27.1] CondKGCPは、コンパクトな予測セットを維持しながら、述語条件のカバレッジ保証を近似する。
包括的評価により,CondKGCPの理論的保証を証明し,実証的な有効性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:33:20 GMT)
TrialPanorama: Database and Benchmark for Systematic Review and Design of Clinical Trials [27.1] 我々は15のグローバルソースから1,657,476の臨床試験記録からなる大規模構造化データベースTrialPanoramaを紹介した。
データベースは、トライアルのセットアップ、介入、条件、バイオマーカー、結果など、トライアルの設計と実行の重要な側面をキャプチャする。
その実用性を実証するために、TrialPanoramaデータベースから直接ベンチマークタスクのスイートを導出する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:58:43 GMT)
ManipLVM-R1: Reinforcement Learning for Reasoning in Embodied Manipulation with Large Vision-Language Models [27.0] LVLM(Large Vision-Language Models)は近年,視覚をシーン認識や言語に活用してロボット操作を進化させた。
本稿では,従来の指導をRLVR(Verifiable Rewards)を用いた強化学習に置き換える新しい強化学習フレームワークであるManipLVM-R1を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:57:07 GMT)
User Feedback Alignment for LLM-powered Exploration in Large-scale Recommendation Systems [26.7] 大規模なレコメンデーションシステムでは,ユーザエクスペリエンスを,確立された嗜好を超えて拡張する行為であるExplorationが課題となっている。
本稿では,階層型計画とLLM推論時間スケーリングを組み合わせた新しい手法を提案する。
ユーザ満足度(ウォッチアクティビティとアクティブユーザ数で測定)と探索多様性の両面で有意な向上を示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:24:56 GMT)
FineFilter: A Fine-grained Noise Filtering Mechanism for Retrieval-Augmented Large Language Models [26.6] FineFilterはRetrieval-Augmented Generationのための新しいきめ細かいノイズフィルタリング機構である。
3つのQAデータセットの実験では、FinFilterはLLaMA3とMistralのベースラインよりもQAパフォーマンスを著しく改善している。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:13:47 GMT)
Humans Hallucinate Too: Language Models Identify and Correct Subjective Annotation Errors With Label-in-a-Haystack Prompts [26.4] 大規模言語モデル(LLM)を用いた文脈におけるラベル検証について検討する。
主観的ラベル補正のためのLiaHR(Label-in-a-Haystack Rectification)フレームワークを提案する。
このアプローチは、信号と雑音の比率を高めるために、アノテーションパイプラインに統合することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:55:22 GMT)
Boosting In-Context Learning in LLMs Through the Lens of Classical Supervised Learning [26.3] In-Context Learning (ICL)では、LLM(Large Language Models)がいくつかの例で新しいタスクに適応できるが、その予測は体系的なバイアスに悩まされることが多い。
ロジット空間において、これらの手法の多くは、方向を変更する能力を持たずに、単にLLMの決定境界をシフトすることと等価であることを示す。
我々はこれらの制限に対処し、統一されたフレームワークを提供するためにSupervised (SC)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:55:06 GMT)
COHESION: Composite Graph Convolutional Network with Dual-Stage Fusion for Multimodal Recommendation [26.2] マルチモーダルレコメンデーションにおける2つの重要なプロセスは、モダリティ融合と表現学習である。
我々はCOHESIONと呼ばれるマルチモーダルレコメンデーションのための2段融合を用いたCOmposite grapH畳み込みnEtworkを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:50:30 GMT)
ReviewAgents: Bridging the Gap Between Human and AI-Generated Paper Reviews [26.0] 学術論文レビュー(Academic paper review)は、研究コミュニティにおける批判的だが時間を要する課題である。
学術出版物の増加に伴い、レビュープロセスの自動化が大きな課題となっている。
大規模言語モデル(LLM)を利用して学術論文レビューを生成するフレームワークであるReviewAgentsを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:02:31 GMT)
One-Step Diffusion-Based Image Compression with Semantic Distillation [25.9] OneDCは1ステップ拡散に基づく生成画像コーデックである。
OneDCは、ワンステップ生成でも知覚品質を達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:54:09 GMT)
T2I-ConBench: Text-to-Image Benchmark for Continual Post-training [25.9] 連続的なポストトレーニングは、1つのテキストからイメージへの拡散モデルを適用して、別々のモデルのコストを発生させることなく新しいタスクを学習する。
T2I-ConBenchは,テキスト・ツー・イメージ・モデルの連続的ポストトレーニングのための統一ベンチマークである。
総合的な評価のために、自動メトリクス、ヒューマン・リファレンス・モデリング、視覚言語によるQAを組み合わせる。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:31:43 GMT)
HybridNorm: Towards Stable and Efficient Transformer Training via Hybrid Normalization [25.9] 本稿では,Pre-NormとPost-Normの利点を統合した,シンプルかつ効果的なハイブリッド正規化戦略を提案する。
大規模トランスモデルの実験では、HybridNormはPre-NormとPost-Normの両方のアプローチを一貫して上回っている。
これらの知見は、ディープトランスモデルのトレーニングと性能を改善するためのより安定的で効果的な手法として、HybridNormの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:53:31 GMT)
Four Eyes Are Better Than Two: Harnessing the Collaborative Potential of Large Models via Differentiated Thinking and Complementary Ensembles [25.8] CVPR 2025(2025年5月20日確認)において,エゴ4Dエゴチャレンジのランナーアップソリューションを提示する。
大規模モデルの成功に触発されて,先進的なマルチモーダル大規模モデルの評価と活用を行い,数発の学習とモデルアンサンブル戦略を用いて映像理解タスクに適応する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:27:31 GMT)
Psychology-driven LLM Agents for Explainable Panic Prediction on Social Media during Sudden Disaster Events [25.7] 本稿では,感情覚醒理論に基づくパニック予測のための心理駆動型生成エージェントフレームワーク(サイコエージェント)を提案する。
具体的には、まず人文大言語モデル(LLM)を用いて、きめ細かいオープンパニック感情データセット(COPE)を構築する。
解釈可能性を高めるために,我々は,個別の心理的連鎖を専用のプロンプトでシミュレートするLLMベースのロールプレイングエージェントを設計した。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:39:39 GMT)
Online Inverse Linear Optimization: Efficient Logarithmic-Regret Algorithm, Robustness to Suboptimality, and Lower Bound [25.5] ラウンド単位の複雑さが$T$に依存しない最初の対数-回帰法を提案する。
我々の方法は極めて単純であり、オンラインニュートンステップ(ONS)を適切なexp-concave損失関数に適用する。
また、$Omega(n)$ の下限を示し、$O(nln T)$ 境界が $O(ln T)$ 係数まで固であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:11:40 GMT)
Strengthening Generative Robot Policies through Predictive World Modeling [25.5] 生成予測制御(英: Generative predictive Control、GPC)は、専門家による実証から生成拡散ベースのポリシーをクローンする学習制御フレームワークである。
GPCは、状態ベースの設定と視覚ベースの設定の両方において、振舞いのクローンを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:40:40 GMT)
Action is All You Need: Dual-Flow Generative Ranking Network for Recommendation [25.3] DFGR(Dual-Flow Generative Ranking Network)について紹介する。
DFGRは自己保持機構のQKVモジュール内の実フローと偽フローの間の革新的な相互作用パターンを統合する。
従来のレコメンデーションモデルとは異なり、DFGRはユーザ履歴の動作シーケンスと最小限の属性情報のみに依存している。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:58:53 GMT)
MedFrameQA: A Multi-Image Medical VQA Benchmark for Clinical Reasoning [25.0] 既存の医療用VQAベンチマークは、主にシングルイメージ分析に焦点を当てている。
医療用VQAにおけるマルチイメージ推論を明示的に評価する最初のベンチマークであるMedFrameQAを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:46:11 GMT)
Progressive Local Alignment for Medical Multimodal Pre-training [24.6] そこで本研究では,局所的なアライメントを学習に応用して,意味のある単語・画素関係を確立する手法を提案する。
PLANは、ノイズ干渉を抑制しながら、ソフト領域認識を効果的に改善する。
PLANは、フレーズグラウンド、画像テキスト検索、オブジェクト検出、ゼロショット分類において最先端の手法を超越している。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:51:15 GMT)
SELF: Self-Extend the Context Length With Logistic Growth Function [24.5] より小さい相対距離で一定のグループサイズと組み合わされたロジスティックキャパシティ方程式を用いて,異なるグループサイズでトークンをグループ化する方法であるSELFを提案する。
LEvalのLongLM拡張法と比較して,本モデルの性能は最大12%向上した。
LEvalからの理解タスクの読み上げでは,LongLMよりも5.4%向上した。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:23:20 GMT)
When Do LLMs Admit Their Mistakes? Understanding the Role of Model Belief in Retraction [24.5] 我々は、事前生成された回答における認識誤りの挙動を「取り消し」として定義する。
我々は、リトラクションがモデルの内部信念の指標と密接な関係があることを実証する。
実験により、内的信念はモデルリトラクションに因果的に影響を及ぼすことが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:16:00 GMT)
Algorithm Configuration for Structured Pfaffian Settings [24.5] データ駆動型アルゴリズム設計は、アルゴリズムを特定のアプリケーションドメインに自動的に適応させ、より良いパフォーマンスを達成する。
パラメータ化データ駆動型アルゴリズム設計問題に対する学習保証を提供するための改良されたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:57:47 GMT)
ExeSQL: Self-Taught Text-to-SQL Models with Execution-Driven Bootstrapping for SQL Dialects [24.5] この作業では、実行駆動のエージェントブートストラップを備えたテキストからガイダンスのフレームワークであるExeを紹介した。
Exeはテキストとガイダンスの学習における方言のギャップを埋め、それぞれ15.2%、10.38%、および4.49%のGPT-4o以降の平均的な改善を実現している。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:13:34 GMT)
TAT-VPR: Ternary Adaptive Transformer for Dynamic and Efficient Visual Place Recognition [24.4] TAT-VPRは3値変圧器であり、視覚SLAMループ閉鎖にダイナミックな精度効率トレードオフをもたらす。
パフォーマンスを低下させることなく、実行時に最大40%の計算を制御できる。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:35:27 GMT)
NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification [24.4] 我々は,自律科学研究を行うための統一クローズドループマルチエージェントフレームワークであるNovellSeekを紹介する。
NovelSeekは12の科学研究課題にまたがってその汎用性を実証した。
複数の科学分野において有望な性能向上を達成し、人的努力に比べて大幅にコストを削減した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:27:43 GMT)
Select2Reason: Efficient Instruction-Tuning Data Selection for Long-CoT Reasoning [24.3] 提案するSelect2Reasonは,Long-CoT推論のための新しい,効率的な命令チューニングデータ選択フレームワークである。
Select2Reasonは,3つの競合レベルと6つの総合的な数学的ベンチマークで,フルデータチューニングとオープンソースベースラインOpenR1-Qwen-7Bに比較して,性能を向上することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:24:08 GMT)
Nested Named Entity Recognition as Single-Pass Sequence Labeling [24.3] 我々は、ネストされた名前付きエンティティ認識(NNER)を、選挙区構造を線形化する事前の作業を活用することで、シーケンスラベリングタスクとしてキャストした。
これらの選挙区線形化と事前訓練されたエンコーダを組み合わせることで、ネストされたエンティティを正確に$n$のタグ付けアクションでキャプチャする。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:13:39 GMT)
What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study [24.2] 実世界の四角形におけるゼロショット展開が可能なロバストなRL制御ポリシーを学習するための重要な要因について検討する。
これら5つのテクニックを統合した,PPOベースのトレーニングフレームワークSimpleFlightを開発した。
クレージーフリー四重極に対するSimpleFlightの有効性を検証し,軌道追従誤差を50%以上低減できることを実証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:40 GMT)
WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction [24.2] 多くの化学応用において、基底状態のコンフォメーション予測が重要である。
本稿では,エネルギーに基づくシミュレーションと学習に基づく戦略を橋渡しする,新しい効果的手法を提案する。
我々の手法は一貫して最先端の競争相手を上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:19:19 GMT)
GCAL: Adapting Graph Models to Evolving Domain Shifts [24.0] 本稿では,様々なグラフ領域におけるモデル持続可能性と適応性を高めるために,GCAL法を提案する。
アダプティブ"フェーズは、過去の記憶を忘れないように再アダプティブしながら、新しいグラフドメインでモデルを微調整する情報アプローチを使用する。
情報ボトルネック理論から導かれる理論的な下界によって導かれる「生成メモリ」フェーズは、元のグラフをメモリに凝縮させる変分記憶グラフ生成モジュールを含む。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:19:19 GMT)
FLARE: A Framework for Stellar Flare Forecasting using Stellar Physical Properties and Historical Records [24.0] 我々は、恒星フレア予測に特化して設計された第一種モデルであるFLAREを紹介する。
利用可能なケプラー光度曲線データセットに関する実験により、FLAREは全ての評価指標における他の手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:37:00 GMT)
LiloDriver: A Lifelong Learning Framework for Closed-loop Motion Planning in Long-tail Autonomous Driving Scenarios [23.9] LiloDriverは、ロングテール自動運転シナリオにおけるクローズドループモーションプランニングのための生涯学習フレームワークである。
知覚、シーンエンコーディング、メモリベースの戦略改善、LLM誘導推論を含む4段階アーキテクチャを備えている。
本研究は、構造化メモリとLCM推論を組み合わせることで、現実の自律運転において、スケーラブルで人間ライクな動作計画を可能にすることの有効性を強調した。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:33:08 GMT)
ELABORATION: A Comprehensive Benchmark on Human-LLM Competitive Programming [23.7] プログラミングプロセス全体を統合した人間のフィードバックの最初の分類を提示する。
また、人間-LLM競合プログラミングの徹底的な評価を容易にする新しいベンチマークであるELABORATIONを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:32:39 GMT)
Praxis-VLM: Vision-Grounded Decision Making via Text-Driven Reinforcement Learning [23.7] 本稿では,視覚的シーンがテキストのみの記述として表現される場合,視覚言語モデルが驚くほど強い意思決定性能が得られることを示す。
視覚的意思決定のための推論VLMであるPrxis-VLMを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:21:02 GMT)
Vehicular Intrusion Detection System for Controller Area Network: A Comprehensive Survey and Evaluation [23.7] 本稿では、制御領域ネットワーク(CAN)および特殊電子制御ユニット(ECU)に対する既存の車両攻撃と防衛戦略について検討する。
調査の結果,検討対象のVIDSは主に特定の攻撃カテゴリーに集中しており,潜在的な脅威の幅広い範囲を無視していることが明らかとなった。
本研究は, 車両安全の観点から, VIDS の今後の設計を通知し, 指導することを目的とした, 研究結果に基づくいくつかの防衛勧告を提示する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:42:57 GMT)
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities [23.7] 今後の研究を導くための総合的な調査を行う。
既存の統一モデルについてレビューし、これらを3つの主要なアーキテクチャパラダイムに分類する。
トークン化戦略,クロスモーダルアテンション,データなど,この新興分野に直面する重要な課題について論じる。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:12:52 GMT)
M-ABSA: A Multilingual Dataset for Aspect-Based Sentiment Analysis [23.5] M-ABSAは、7つのドメインと21の言語にまたがる包括的なデータセットである。
私たちの主な焦点は三重項抽出であり、アスペクトの項、アスペクトのカテゴリ、感情の極性を特定することである。
実験により,このデータセットは多言語・多ドメイン移動学習などの多様な評価タスクを可能にすることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:35:43 GMT)
BlockPruner: Fine-grained Pruning for Large Language Models [23.5] 研究によると、大きな言語モデル(LLM)の特定のレイヤは、かなりの冗長性を持ち、これらのレイヤを刈り取ることは、全体的なパフォーマンスに最小限の影響を与える。
そこで我々は,BlockPrunerと呼ばれる新しい,トレーニング不要な構造化プルーニング手法を提案する。
我々は,BlockPrunerが最先端のベースラインよりも粒度が高く,効率的なプルーニングを実現していることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:58:06 GMT)
MixMin: Finding Data Mixtures via Convex Minimization [23.4] 機械学習パイプラインは、多種多様なソースからのデータの組み合わせと混合が増えている。
最適なデータ混合物を見つけることは困難でオープンな問題です。
私たちはこのデータミキシング問題を2段階の目的として定式化し、最良のミキシングは、下流の目的のために最良のモデルに導かれるものです。
本稿では,モデルクラスが大きくなるにつれて,両レベルのデータ混合目標が凸となることを観察する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:11:04 GMT)
Longer Context, Deeper Thinking: Uncovering the Role of Long-Context Ability in Reasoning [23.3] そこで本研究では,SFT(Supervised Fine-Tuning)に先立って,モデル長文化能力の向上が推論性能の向上に繋がるかどうかを検討する。
その結果,SFT後の推論ベンチマークにおいて,より強い長コンテキスト能力を持つモデルの方が高い精度が得られるという一貫した傾向がみられた。
これらの結果から,長文モデリングは長文入力の処理に必須であるだけでなく,推論において重要な基礎となることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:09:47 GMT)
Maximum Total Correlation Reinforcement Learning [23.2] 誘導軌道内の全相関を最大化する強化学習問題を修正した。
シミュレーションロボット環境において,本手法は周期的かつ圧縮的な軌道を誘導するポリシーを自然に生成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:48:00 GMT)
Regularized least squares learning with heavy-tailed noise is minimax optimal [23.2] 本稿では,高次モーメントの再生回数が有限である雑音の存在下で,カーネルヒルベルト空間におけるリッジ回帰の性能について検討する。
我々は、よく知られた積分作用素の枠組みに基づいて、部分ガウス項と余剰項からなるリスク境界を確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:25:20 GMT)
CT-Agent: A Multimodal-LLM Agent for 3D CT Radiology Question Answering [23.2] 放射線科医のCTスキャンにおける解剖学的領域に関する質問に答える視覚的質問応答システム(VQA)が必要不可欠である。
既存のVQAシステムは,(1)解剖学的複雑性によりCT画像の理解が困難になる; (2) 数百スライス間の空間的関係の把握が困難である,といった課題に対して,CTラジオロジー質問応答(CTQA)タスクを適切に処理することはできない。
本稿では,CTQAのためのマルチモーダルエージェントフレームワークであるCT-Agentを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:59:20 GMT)
Zebra-Llama: Towards Extremely Efficient Hybrid Models [23.0] 大規模言語モデル(LLM)に代わる実用的でスケーラブルな代替案を提案する。
Zebra-LlamaはState Space Models (SSM)とMulti-head Latent Attention (MLA)レイヤを組み合わせて、事前訓練されたトランスフォーマーから知識を効率的に転送する。
Zebra-Llama Transformerの精度は7-11Bのトレーニングトークンと8Bの教師しか使用していない。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:39:57 GMT)
Fuzzy Information Evolution with Three-Way Decision in Social Network Group Decision-Making [23.0] グループ意思決定(GDM)のシナリオでは、不確実性、動的な社会構造、曖昧な情報が大きな課題である。
本研究では,3方向決定(3WD)理論,動的ネットワーク再構築,言語的意見表現を統合した,新たなソーシャルネットワークグループ意思決定フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:26:48 GMT)
Efficient Online RL Fine Tuning with Offline Pre-trained Policy Only [22.9] 既存のオンライン強化学習(RL)ファインチューニング手法では、安定性と性能のために、オフラインで事前訓練されたQ-関数によるトレーニングを継続する必要がある。
オフライン事前学習ポリシーのみを用いたオンラインRLファインチューニング手法を提案する。
PORL(Policy-Only Reinforcement Learning Fine-Tuning)を導入し、オンライン段階でQ-関数をスクラッチから迅速に初期化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:14:08 GMT)
How Well Can General Vision-Language Models Learn Medicine By Watching Public Educational Videos? [22.9] 人間の学習のために作られた教育ビデオは、生体医用視覚言語モデルのための驚くほど効果的な訓練信号を提供する。
OpenBiomedVidは、現実世界の教育コンテンツに根ざした指導スタイルの監督を提供することで、重要なギャップを埋める。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:02:09 GMT)
DocFusion: A Unified Framework for Document Parsing Tasks [22.9] DocFusionは0.28Bパラメータしか持たない軽量な生成モデルである。
タスク表現を統一し、改善された目的関数を通して協調訓練を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:59:33 GMT)
Multimodal Online Federated Learning with Modality Missing in Internet of Things [22.8] IoT(Internet of Things)エコシステムは,センサやカメラ,マイクといった異質なソースから,膨大な量のマルチモーダルデータを生成する。
エッジインテリジェンスが進化を続けるにつれ、IoTデバイスは、単純なデータ収集ユニットから、複雑な計算タスクを実行可能なノードへと進化してきた。
我々は,IoT環境における動的かつ分散化されたマルチモーダル学習のための新しいフレームワークであるMMO-FLの概念を紹介した。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:31:37 GMT)
More Text, Less Point: Towards 3D Data-Efficient Point-Language Understanding [22.8] GreenPLMは、最小限の3Dポイントクラウドとテキストデータペアで堅牢な3Dオブジェクト理解を可能にすることを目的としている。
画像とテキストのアライメントにCLIPにインスパイアされた我々は、トレーニング済みのクラウドテキストエンコーダを使用して、3Dポイントクラウド空間をテキスト空間にマッピングする。
3Dオブジェクトのフリーテキスト記述を6M生成し、3段階のトレーニング戦略を設計し、LLMが様々なモダリティ間の本質的な接続をよりよく探索できるようにする。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:09:52 GMT)
AdamS: Momentum Itself Can Be A Normalizer for LLM Pretraining and Post-training [22.6] 我々は,大規模言語モデル(LLM)の事前学習とポストトレーニングのための,Adamの簡易かつ効果的な代替手段であるAdamSを紹介した。
新たな分母、すなわち運動量と現在の勾配の重み付き和の根を利用することにより、AdamSは第二モーメント推定の必要性を排除している。
AdamSは効率が良く、SGDのメモリと計算フットプリントと運動量とを一致させ、優れた最適化性能を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:16:48 GMT)
Classifier-Free Guidance: From High-Dimensional Analysis to Generalized Guidance Forms [22.4] CFGは十分に高次元かつ無限次元のターゲット分布を正確に再現することを示す。
我々は、この性質、特に非線形CFG一般化を享受するガイダンスが多数存在することを示す。
本研究は,最先端拡散モデルとフローマッチングモデルを用いて,クラス条件とテキスト・ツー・イメージ生成の実験により検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:59:12 GMT)
Graph-based Confidence Calibration for Large Language Models [22.4] 本稿では,大規模言語モデルによって生成された複数の出力の自己整合性に基づいて,応答正当性を評価するための補助学習モデルを提案する。
提案手法は,複数応答間の一致を表現するために整合性グラフを構築し,グラフニューラルネットワーク(GNN)を用いて各応答の正しさを推定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:24:27 GMT)
Interplay between disorder and topology in Thouless pumping on a superconducting quantum processor [22.2] 位相相は弱い摂動に対して堅牢であるが、障害が十分に強くなると崩壊する。
本稿では,41量子ビット量子プロセッサ上でのThoulessポンプと障害の競合と相互作用を実験的に観察する。
Thouless pumping in the presence of disorder and showed its breakdown as the strength of disorder。
特に、準周期ホッピング障害によって引き起こされる固有のトポロジカルポンプは、これまで実験的に実現されていない。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:22:13 GMT)
Mesh-RFT: Enhancing Mesh Generation via Fine-grained Reinforcement Fine-Tuning [22.2] Mesh-RFTは、3Dメッシュ生成のための新しい微細化強化微調整フレームワークである。
幾何学的整合性と位相規則性を評価するために,客観的なトポロジ対応スコアリングシステムを導入する。
実験の結果、Mesh-RFTのM-DPOアプローチはハウスドルフ距離(HD)を24.6%削減し、事前訓練されたモデルよりも3.8%改善した。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:04:18 GMT)
Background Matters: A Cross-view Bidirectional Modeling Framework for Semi-supervised Medical Image Segmentation [22.2] 半教師付き医用画像セグメンテーションのためのクロスビュー双方向モデリング(CVBM)フレームワークを提案する。
CVBMは背景モデリングを取り入れ、前景モデリング性能を改善する。
提案手法は, LA, Pancreas, ACDC, HRFデータセット上でのSOTA性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:59:45 GMT)
Training on Plausible Counterfactuals Removes Spurious Correlations [22.1] P-CFE (Plusible counterfactual explanations) は、入力を最小限に修正して分類器の決定を変更する摂動である。
本研究では,非摂動入力を分類するために,誘導的内向的ターゲットクラスをラベル付けしたp-CFEを用いて分類器を訓練できることを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:17:25 GMT)
Estimate-Then-Optimize versus Integrated-Estimation-Optimization versus Sample Average Approximation: A Stochastic Dominance Perspective [21.9] モデルクラスが十分に特定され、十分なデータが存在する場合に、逆の振る舞いが現れることを示す。
また, 標準サンプル平均近似 (SAA) が, 後悔の点において, モデルクラスが適切に特定された場合に, 最悪の結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:35:49 GMT)
From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization [21.9] EduVisBenchを導入し、基礎モデル(FM)の視覚的推論能力を教育環境でよりよく評価する。
EduVisAgentは、教育計画、推論分解、メタ認知的プロンプト、可視化設計のための特殊エージェントをコーディネートする。
EduVisAgentは全てのベースラインを大幅に上回り、40.2%の改善と教育的に整合した視覚化を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:02:18 GMT)
SimSort: A Data-Driven Framework for Spike Sorting by Large-Scale Electrophysiology Simulation [21.9] スパイクソートは神経記録において重要なプロセスであり、脳内の電極によって記録された個々のニューロンから電気信号を識別し、分離する。
我々は、スパイクソートのための事前訓練フレームワークであるSimSortを紹介した。シミュレーションデータのみに基づいて訓練されたSimSortは、現実世界のスパイクソートタスクに対するゼロショットの一般化性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:48:13 GMT)
Ask, Retrieve, Summarize: A Modular Pipeline for Scientific Literature Summarization [21.9] XSumは、Retrieval-Augmented Generation (RAG) を用いた科学領域におけるマルチドキュメント要約(MDS)のためのモジュールパイプラインである。
質問生成モジュールは、入力された論文に適合した質問を動的に生成し、関連および正確な情報の検索を保証する。
編集者モジュールは、取得したコンテンツを、適切な引用のための学術標準に準拠した一貫性のある、よく構造化された要約に合成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:00:59 GMT)
Dynamic Sampling that Adapts: Iterative DPO for Self-Aware Mathematical Reasoning [21.8] SAI-DPO(SAI-DPO)は、モデルのステージ固有の推論能力を評価することにより、トレーニングデータを動的に選択するアルゴリズムである。
リアルタイムモデルのパフォーマンスフィードバックを統合することで、SAI-DPOはモデルの進化する強みと弱みに適応的にデータ選択を適用する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:27:05 GMT)
Understanding Fact Recall in Language Models: Why Two-Stage Training Encourages Memorization but Mixed Training Teaches Knowledge [21.8] トレーニング戦略がトレーニング中にモデルパラメータがどのように形成され、これらの違いが事実を思い出す能力にどのように影響するかを検討する。
Llama-3.2B と Pythia-2.8B モデルを用いて合成ファクトリコールデータセットの解析を行ったところ、混合トレーニングはより大きく、より集中的な共有パラメータのセットを促進することがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:34:29 GMT)
Cryogenic Thermal Modeling of Microwave High Density Signaling [21.7] 超伝導量子コンピュータは、室温から希釈冷凍機の混合室まで走る制御線を必要とする。
SC-086/50-SCN-CN半剛性同軸ケーブルの熱負荷について検討した。
記述されたアーキテクチャの理論的上限はおよそ200キュービットである。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:45:03 GMT)
Permissive Information-Flow Analysis for Large Language Models [21.6] 大規模言語モデル(LLM)は、大規模ソフトウェアシステムのコモディティコンポーネントになりつつある。
これは自然なセキュリティとプライバシの問題を引き起こします。あるコンポーネントから取得した有毒なデータは、モデルの振る舞いを変更し、システム全体を侵害します。
LLMクエリを通じて情報フローラベルを伝搬する新しい,より寛容な手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:26:41 GMT)
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning [21.4] 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)のプロンプトによる複雑な推論タスクにおいて、優れたパフォーマンスを実現している。
潜在CoT推論への研究の関心が高まっており、潜伏空間内で推論が行われる。
本稿では,この推論パラダイムの概観と解析について述べる。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:26:51 GMT)
MAFE R-CNN: Selecting More Samples to Learn Category-aware Features for Small Object Detection [21.4] 複雑な環境での小さな物体検出は、オブジェクト検出の分野における大きな課題を一貫して表している。
本稿では,この難しさが,小型物体の識別特性を効果的に学習できないことに起因することを確かめる。
本稿では2つの重要なコンポーネントを統合したマルチキューアサインメントと特徴拡張R-CNNを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:30:09 GMT)
Reinforcement Learning for Stock Transactions [21.3] 我々は,Q-Learning,線形関数近似を用いたQ-Learning,深層Q-Learningを用いて,一連のエージェントを訓練する。
機械学習回帰モデルと分類モデルを用いて株価の予測を試みる。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:00:57 GMT)
HyperGraphRAG: Retrieval-Augmented Generation via Hypergraph-Structured Knowledge Representation [21.3] ハイパーエッジによるn-aryリレーショナル事実を表す新しいグラフベースRAG法であるHyperGraphRAGを提案する。
医学、農業、コンピュータ科学、法をまたいだ実験では、HyperGraphRAGは標準的なRAG法と従来のグラフベースのRAG法の両方で、精度、検索効率、生成品質に優れていた。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:34:30 GMT)
LiTransProQA: an LLM-based Literary Translation evaluation metric with Professional Question Answering [21.3] LiTransProQA(リトランプロQA)は、文学翻訳評価のために設計されたLLMベースの質問応答フレームワークである。
プロの文芸翻訳家や研究者の洞察を融合させ、文学機器、文化理解、権威的な声に焦点を当てている。
LiTransProQAは現在の指標を大幅に上回り、相関関係の最大0.07倍、最先端の指標を15ポイント以上上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:01:15 GMT)
Analyzing Fine-Grained Alignment and Enhancing Vision Understanding in Multimodal Language Models [21.2] 視覚埋め込みの圧縮と単語埋め込みの整合化におけるプロジェクターの役割を示す。
次に、各ビジョンパッチと対応するセマンティックワードのアライメントであるパッチレベルのアライメントを検討する。
実験の結果,パッチアライメントトレーニングにより,より強力な圧縮能力とパッチレベルのアライメント向上が達成された。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:10:27 GMT)
UFT: Unifying Supervised and Reinforcement Fine-Tuning [21.2] 我々は、SFTとRFTを単一の統合プロセスに統合する新しいポストトレーニングパラダイムであるUnified Fine-Tuning(UFT)を提案する。
UFTは、インフォメーション・インフォメーション・シグナルを取り入れつつ、効果的に解を探索することを可能にする。
理論的には、UFTがRFT固有の指数的サンプル複雑性のボトルネックを破ることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:53:57 GMT)
Understanding Prompt Tuning and In-Context Learning via Meta-Learning [21.1] 本稿では,ベイズ的視点から最適なプロンプトの理解について論じる。
メタ学習ニューラルネットワークが事前学習分布に対してベイズ予測器としてどのように振る舞うかを示す。
また、トークンアルファベット以外の実数値ベクトル列であるソフトプレフィックスが、訓練されたネットワークや訓練されていないネットワークに対して非常に効果的なプロンプトをもたらすことも確認した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:58:53 GMT)
ATR-Bench: A Federated Learning Benchmark for Adaptation, Trust, and Reasoning [21.1] 本稿では,適応,信頼,推論という3つの基礎的な側面を通じて,連合学習を統一的に分析する枠組みを導入する。
ATR-Benchは、実世界の関連性を持つ連邦学習の体系的・包括的評価の基礎を築いている。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:11:38 GMT)
Bayesian Bandit Algorithms with Approximate Inference in Stochastic Linear Bandits [21.1] 線形帯域における近似推論の影響を解析し、頻繁な後悔分析を行う。
また,LinTSとLinBUCBは,より長い期間の犠牲を伴って,元の後悔の程度を保てることを示した。
この研究は、有界近似推論誤差を持つ線形包帯の設定における最初の後悔の限界を与える。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:54:59 GMT)
Implicit Jailbreak Attacks via Cross-Modal Information Concealment on Vision-Language Models [21.0] 以前のジェイルブレイク攻撃は、しばしば悪意のある命令をテキストから視覚など、整合性の低いモダリティに注入する。
IJAと呼ばれる新しい暗黙のジェイルブレイクフレームワークを提案し、少なくとも重要なビットステガノグラフィーによって悪意ある命令を画像に密かに埋め込む。
GPT-4o や Gemini-1.5 Pro などの商用モデルでは,攻撃成功率は90% 以上で,平均 3 クエリのみを用いて達成している。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:34:47 GMT)
TrimR: Verifier-based Training-Free Thinking Compression for Efficient Test-Time Scaling [21.0] 大規模推論モデル(LRM)は、複雑な数学的、論理的、コーディングタスクに対処する際、例外的な能力を示す。
本稿では,動的チェイン・オブ・ソート(CoT)圧縮のための検証器ベース,トレーニング不要,効率的なフレームワークTrimRを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:23:30 GMT)
DailyQA: A Benchmark to Evaluate Web Retrieval Augmented LLMs Based on Capturing Real-World Changes [21.0] DailyQAは自動更新された動的データセットで、毎週質問を更新し、特定の日付に関する質問に対する回答を含む。
このベンチマークでは、高速な事実データと複数のドメインをカバーすることを含む質問を処理および回答するために、大きな言語モデル(LLM)が必要である。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:13:33 GMT)
Slamming: Training a Speech Language Model on One GPU in a Day [20.8] Slamは,1つの学術GPU上で,高品質な言語モデル(SLM)を24時間でトレーニングするためのレシピだ。
我々は、このトレーニングレシピが、計算コストのごく一部で主要なSLMと同等の計算結果を得られるようにも、うまくスケールできることを実証的に実証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:55:59 GMT)
An Empirical Study on Configuring In-Context Learning Demonstrations for Unleashing MLLMs' Sentimental Perception Capability [20.8] ゼロショットのパラダイムをインコンテキストラーニング(ICL)に拡張し、デモの設定に関する詳細な研究を行う。
具体的には、デモの検索、プレゼンテーション、配信をカバーする3つの重要な要因を調査し、最適化する。
MLLMに固有の予測バイアスも発見され、その後効果的に反作用する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:51:41 GMT)
Semantic Pivots Enable Cross-Lingual Transfer in Large Language Models [20.7] 大規模言語モデル(LLM)の前方通過における2つの異なる挙動を識別し,識別する。
セマンティックピボットの比率が高い文書を用いて、セマンティックピボットを意識した事前学習データセットを再構築する。
本実験は,言語横断能力向上のためのアプローチの有効性を検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:37:04 GMT)
Joint Pricing and Resource Allocation: An Optimal Online-Learning Approach [20.7] ネット全体の利益を最大化するために、価格と在庫を共同で決定するオンライン学習の地平について検討する。
我々は,複数のOCO上での信頼境界戦略を利用した効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:50:28 GMT)
A Novel Generative Model with Causality Constraint for Mitigating Biases in Recommender Systems [20.7] 遅延共起バイアスは、ユーザのフィードバックとアイテムの露出の間の真の因果関係を曖昧にする可能性がある。
本稿では,Recommender Systemsにおける表現学習のための遅延因果制約(Latent Causality Constraints)と呼ばれる新しい生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:09:39 GMT)
AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era [20.7] 本稿では,アニメーション映像生成のための総合システムAniSoraを提案する。
1000万以上の高品質なデータでデータ処理パイプラインがサポートしています。
また,様々なアニメーションビデオの評価ベンチマークを収集し,特にアニメーションビデオ生成のための指標を開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:45:19 GMT)
From Compression to Expansion: A Layerwise Analysis of In-Context Learning [20.6] In-context Learning (ICL)は、大規模な言語モデルで、デモシーケンスから学習することで、重み付けなしで新しいタスクに適応することができる。
ICL表現の統計的幾何学的解析を行い,各層にまたがるタスク固有情報の取得方法について検討する。
この結果から,ILC の階層的ダイナミックな構造的表現が LLM 内でどのように現れるかが明らかとなり,内部表現の分析がモデル行動のより深い理解を促進することが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:22:03 GMT)
Your Pre-trained LLM is Secretly an Unsupervised Confidence Calibrator [20.6] ポストトレーニングされた言語モデル(PoLM)は、しばしば過剰な自信に悩まされ、正しい出力と間違った出力の両方に高い信頼を割り当てる。
PoLMの校正における大きな障害は、個々の下流タスクのためのラベル付きデータの不足である。
本稿では,時間後信頼度校正におけるパラメータを最適化するために,DACA(Disagreement-Aware Confidence Alignment)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:55:39 GMT)
Generative AI and Creativity: A Systematic Literature Review and Meta-Analysis [20.6] 我々は、GenAIが創造的タスクのパフォーマンスに与える影響を評価するためのメタ分析を行う。
この結果から,GenAIとヒトの創造性に有意な差は認められなかった。
GenAIは、人間とGenAIのコラボレーションにおけるアイデアの多様性に有意な悪影響を及ぼす。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:39:10 GMT)
Do Large Language Models Excel in Complex Logical Reasoning with Formal Language? [20.5] 大規模言語モデル(LLM)は、複雑な論理的推論タスクにおいてブレークスルーのパフォーマンスを達成することが示されている。
本稿では,形式言語を用いた論理的推論問題に対して,LLMを包括的に評価することを目的とする。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:57:23 GMT)
The Hidden Dimensions of LLM Alignment: A Multi-Dimensional Analysis of Orthogonal Safety Directions [20.5] 安全に整合した行動は多次元方向で共同制御されている。
空間内の方向を研究することで、まず支配的な方向がモデルの拒絶行動を支配することが分かる。
次に、異なる方向が支配的な方向をいかに促進または抑制するかを測定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:21:22 GMT)
Long Sequence Modeling with Attention Tensorization: From Sequence to Tensor Learning [20.5] 本稿では、長い入力列をコンパクトなテンソル表現にテンソル化し、各変換次元に注意を向けることで、注意領域を拡大することを提案する。
提案手法は,トークンの依存関係をマルチホップアテンションプロセスとして符号化し,フルアテンションのクロネッカー分解と等価であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:55:16 GMT)
KAN-AD: Time Series Anomaly Detection with Kolmogorov-Arnold Networks [20.4] 時系列異常検出(TSAD)は、クラウドサービスやWebシステムのリアルタイム監視を支える。
解析の結果,TSADは局所パターンのスムーズなモデル化に重点を置いていることが明らかとなった。
そこで我々は,Kan-ADを提案し,B-スプラインを切り詰めたフーリエ拡張に置き換え,新しい軽量学習機構を導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:36:03 GMT)
SD-MAD: Sign-Driven Few-shot Multi-Anomaly Detection in Medical Images [20.3] SD-MADは2段階の符号駆動型複数ショット検出フレームワークである。
SD-MADの性能を包括的に定量化する3つのプロトコルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:24:37 GMT)
Bootstrapping your behavior: a new pretraining strategy for user behavior sequence data [20.3] UBSの事前学習戦略であるBootstrapping Your Behavior(モデル)を導入し、将来の時間ウィンドウにすべての行動に関する情報を埋め込む自動構築のインスペクションを予測する。
2つの実世界の産業データセットと8つの下流タスクの実験では、AUCの平均的な改善は3.9%、トレーニングのスループットは98.9%である。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:23:38 GMT)
Action2Dialogue: Generating Character-Centric Narratives from Scene-Level Prompts [20.3] 本稿では,アクションレベルのプロンプトを視覚的,聴覚的に基礎付けられた物語対話に変換するモジュールパイプラインを提案する。
提案手法はシーン毎に一対のプロンプトを入力し,第1に設定を定義し,第2にキャラクタの動作を指定する。
我々は、各発話を表現的かつ文字一貫性のある音声として表現し、完全な音声による映像物語を生み出す。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:54:42 GMT)
KNN-SSD: Enabling Dynamic Self-Speculative Decoding via Nearest Neighbor Layer Set Optimization [20.2] 投機的復号化(SD)は、大規模言語モデル(LLM)の推論を加速するために広く使われているパラダイムとして登場した。
KNN-SSDは、K-Nearest Neighbor(KNN)探索を利用して、異なるスキップ層と様々なドメイン入力をマッチングするアルゴリズムである。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:04:47 GMT)
LEANCODE: Understanding Models Better for Code Simplification of Pre-trained Large Language Models [20.2] トレーニングと予測時間を短縮するために,コード簡略化のためのLeanCodeを提案する。
平均的文脈認識の注意点に基づくトークンの選択的除去を提唱する。
我々の評価は、SoTAのDietCodeとSlimcodeよりもLeanCodeの方が優れていることを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:12:03 GMT)
Tracing Representation Progression: Analyzing and Enhancing Layer-Wise Similarity [20.2] 本研究では,各変圧器の隠蔽層間の表現の類似性について検討する。
層間の表現が正の相関を示し、層が近づくと類似度が増加する。
浅い層の有効性を向上させるためのアライメント・トレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:04:45 GMT)
A Survey of Large Language Models for Text-Guided Molecular Discovery: from Molecule Generation to Optimization [20.2] 大規模言語モデル(LLM)は分子発見のパラダイムシフトを導入している。
この調査は、分子生成と分子最適化という2つの中心的なタスクにおいて、LSMの新たな利用について、最新のレビューを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:26:27 GMT)
Microwave Engineering of Tunable Spin Interactions with Superconducting Qubits [20.1] 超伝導量子回路における多重マイクロ波を用いたスピン相互作用の実験的実現を実証する。
ネイティブXY相互作用とマイクロ波駆動を正確に制御することにより、可変スピンハミルトニアンが得られる。
我々の研究は、アナログ-デジタル量子シミュレーションのためのツールボックスを拡張し、幅広いエキゾチックな量子スピンモデルの探索を可能にします。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:32:36 GMT)
Keys to Robust Edits: from Theoretical Insights to Practical Advances [20.1] 大規模言語モデル(LLM)は、矛盾/時代遅れのパラメトリック記憶のために正確な知識を維持するのに苦労する。
当社のソリューションでは,ネイティブモデル表現から編集キーをアンタングルするプラグイン・アンド・プレイモジュールである textitRobust Edit Pathway (REP) を導入しています。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:11:21 GMT)
ReasoningShield: Content Safety Detection over Reasoning Traces of Large Reasoning Models [20.0] 推論モデル(LRM)は、高度な推論機能を備えたAIのランドスケープを変革している。
生成された推論トレースはモデルの透明性を高めるが、最終的な回答が安全に見える場合でも、安全でないコンテンツを含むことができる。
既存のモデレーションツールは、主に質問応答(QA)ペア用に設計されており、推論トレースに埋め込まれた隠れリスクを検出するのに経験的に効果がない。
最終回答に到達する前に、推論トレースの潜在的なリスクを特定するために調整された、最初の安全検出モデルであるReasoningShieldを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:44:41 GMT)
Quantifying Statistical Significance in Diffusion-Based Anomaly Localization via Selective Inference [19.9] 画像の異常な局所化(期待されるパターンから逸脱する領域)は、診断や産業検査などの応用において不可欠である。
最近のトレンドは、画像生成モデルを用いて異常な局所化を行い、それらのモデルが正常に見える異常な画像を生成することである。
本稿では,検出された異常領域の意義を定量化するために,選択推論に基づく統計的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:00:03 GMT)
ConceptCarve: Dynamic Realization of Evidence [19.9] 本研究では,従来の検索手法とLCMを用いて検索空間を動的に特徴付けるエビデンス検索フレームワークであるConceptCarveを紹介する。
実験の結果,ConceptCarveはソーシャルメディアコミュニティ内での証拠発見において,従来の検索システムを超えていることがわかった。
また、コミュニティ全体で異なる複雑な思考パターンを質的に分析するために、コミュニティのエビデンスを解釈可能な表現も作成します。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:34:03 GMT)
Learning Fused State Representations for Control from Multi-View Observations [19.9] MVRL(Multi-view Reinforcement Learning)は、エージェントに多視点観察を提供し、より有効で精度の高い環境を認識できるようにする。
MVRLの最近の進歩は、多視点観測から潜在表現を抽出し、制御タスクに活用することに焦点を当てている。
まず,MVRLにバイシミュレートメトリック学習を取り入れ,タスク関連表現を学習する多視点統合制御(MFSC)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:20:42 GMT)
BitHydra: Towards Bit-flip Inference Cost Attack against Large Language Models [19.9] 本稿では,新たなタイプの推論コスト攻撃("bit-flip inference cost attack"と呼ばれる)を導入する。
具体的には,モデルパラメータの臨界ビットを効果的にフリップする,シンプルで効果的な手法(BitHydraと呼ばれる)を設計する。
たった4つの検索サンプルと3ビットのフリップで、BitHydraは100%のテストプロンプトを最大生成時間まで強制することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:36:00 GMT)
FIRE: Flexible Integration of Data Quality Ratings for Effective Pre-Training [19.7] FIREは、複数のデータ品質レーダを統合するための、フレキシブルでスケーラブルなフレームワークである。
Fireは複数の品質信号を統一されたスペースに整合させ、さまざまなデータ品質レーダを統合して、各データポイントに対して包括的な品質信号を提供する。
実験により、FIREは他のデータ選択方法よりも優れ、事前訓練されたモデルの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:38:52 GMT)
Domain-Oriented Time Series Inference Agents for Reasoning and Automated Analysis [19.6] 本稿では,自然言語推論と正確な数値実行を統合したドメイン指向時系列エージェントTS-Reasonerを紹介する。
基本時系列理解と複雑な多段階推論という2つの軸でその能力を評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:01:55 GMT)
T1: A Tool-Oriented Conversational Dataset for Multi-Turn Agentic Planning [19.6] 大きな言語モデル(LLM)は、複雑な問題を解決する知的エージェントとして印象的な能力を示している。
ツール拡張されたマルチドメイン、マルチターン対話型データセットであるT1を導入し、ツール間の依存関係をキャプチャし、管理する。
我々はT1-Agentを用いて、複雑なツール依存のシナリオで計画と推論を行う能力を強調した結果を提示する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:54:32 GMT)
LightRouter: Towards Efficient LLM Collaboration with Minimal Overhead [19.6] Lightは、より大きなプールからLLMの小さなサブセットを体系的に選択、統合するために設計された新しいフレームワークである。
実験によると、光は広く使われているアンサンブルのベースラインと一致し、25%の精度向上を実現している。
本研究は、効率的なLCM選択のための実践的なアプローチを導入し、モデル組み合わせのための最適な戦略に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:46:04 GMT)
Unlearning Isn't Deletion: Investigating Reversibility of Machine Unlearning in LLMs [19.5] モデルはしばしば忘れられるが、元の動作は最小限の微調整で迅速に復元できる。
そこで本研究では,PCAに基づく類似性とシフト,カーネルアライメント中心,フィッシャー情報を用いた表現レベル評価フレームワークを提案する。
このツールキットを6つの未学習の手法、3つのドメイン(テキスト、コード、数学)、そして2つのオープンソース LLM に適用することにより、可逆性と不可逆性(inversible)な忘れの区別を明らかにする。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:02:10 GMT)
Locate-then-Merge: Neuron-Level Parameter Fusion for Mitigating Catastrophic Forgetting in Multimodal LLMs [19.5] 本稿では,重要なパラメータを抽出し,それらを選択的にマージする学習自由パラメータ融合フレームワークを提案する。
我々は,大きなパラメータシフトを持つニューロンの影響を保ったニューロンレベルの戦略であるニューロン融合を導入する。
言語と視覚タスクの両方にわたる13のベンチマークによる実験では、Neuron-Fusionが既存のモデルマージメソッドを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:04:43 GMT)
CLEAR: A Clinically-Grounded Tabular Framework for Radiology Report Evaluation [19.4] 専門ラベルを用いた臨床評価フレームワークと放射線診断報告評価のための属性レベル比較(CLEAR)について紹介する。
CLEARは、報告書が医療状況の有無を正確に特定できるかどうかを調べる。
CLEARの臨床的アライメントを測定するため,MIMIC-CXRから得られた100個の胸部X線所見のデータセットであるCLEAR-Benchを開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:32:12 GMT)
ThinkRec: Thinking-based recommendation via LLM [19.4] ThinkRec は LLM4Rec を System 1 から System 2 (レーショナルシステム) に移行する思考ベースのフレームワークである。
ThinkRecは、キーワードの要約でアイテムメタデータを拡張し、合成推論トレースを注入するシンクアクティベーションメカニズムを導入している。
ThinkRecは、ユーザの潜在機能に基づいて専門家モデルに重みを動的に割り当てることで、個々のユーザへの推論パスを適応させ、精度とパーソナライゼーションを向上させる。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:53:00 GMT)
GLEE: A Unified Framework and Benchmark for Language-based Economic Environments [19.4] 大規模言語モデル(LLM)は、経済的および戦略的相互作用において大きな可能性を示す。
これらの疑問は、LLMベースのエージェントを実世界のデータ駆動システムに統合することの経済的および社会的意味について重要なものとなっている。
本稿では,2プレイヤー,シーケンシャル,言語ベースのゲームの研究を標準化するためのベンチマークを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:43:07 GMT)
AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners [19.3] Self-Taughters (STaR)は、自己改善推論言語モデル(LM)のトレーニングパイプラインの不可欠な部分である。
本稿では,2つの適応サンプリング原理を組み込んだ新しいアルゴリズムであるAdaptive STaR(AdaSTaR)を紹介する。
AdaSTaRは全てのインスタンスで最高のテスト精度を達成し、幅広いベースラインリストに対して平均58.6%のトレーニングFLOPを削減している。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:24:11 GMT)
Plan and Budget: Effective and Efficient Test-Time Scaling on Large Language Model Reasoning [19.3] Plan-and-Budgetは、複雑なクエリをサブクエストに分解し、適応スケジューリングを使用して推定複雑性に基づいてトークン予算を割り当てる、モデルに依存しないテストタイムフレームワークである。
Plan-and-Budgetは、様々なタスクやモデルにわたる推論効率を改善し、最大で70%の精度向上、39%のトークン削減、および$E3$の+187.5%の改善を実現している。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:56:29 GMT)
KTAE: A Model-Free Algorithm to Key-Tokens Advantage Estimation in Mathematical Reasoning [19.3] Key-token Advantage Estimation (KTAE)は、新たなモデルを導入することなく、きめ細かいトークンレベルの利点を推定する新しいアルゴリズムである。
GRPO+KTAEとDAPO+KTAEで訓練されたモデルは、5つの数学的推論ベンチマークにおいてベースライン法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:00:33 GMT)
Better Rates for Private Linear Regression in the Proportional Regime via Aggressive Clipping [19.2] 一般的なアプローチは、サンプルごとの勾配の予想基準よりもクリッピング定数をはるかに大きく設定することである。
しかし、分析を単純化する一方で、これは経験的証拠がパフォーマンスを最適化することを示唆しているものとは対照的である。
我々の研究は、クリッピングが頻繁に起こる体制において、理論と実践のギャップを埋める。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:34:27 GMT)
A Square Peg in a Square Hole: Meta-Expert for Long-Tailed Semi-Supervised Learning [18.9] 本研究では,Long-tailed semi-supervised learning (LTSSL) を分布ミスマッチを用いて検討し,そこでラベル付き学習データのクラス分布がLong-tailed Distributionに従っていることを示す。
サンプルのクラスメンバシップを推定できる動的専門家割当てモジュールを提案する。
異なる専門家の強みを統合することで、より小さな一般化誤差が生じることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:56:44 GMT)
CHART-6: Human-Centered Evaluation of Data Visualization Understanding in Vision-Language Models [18.9] データビジュアライゼーションに関する推論を含むタスクにおいて、視覚言語モデルがどのように人間の振る舞いをエミュレートするかは不明だ。
そこで我々は,人間向けに設計された6つのデータ可視化リテラシー評価において,視覚言語モデル8つを評価した。
その結果、これらのモデルは平均して人間よりも悪い結果が得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:15:04 GMT)
Losing is for Cherishing: Data Valuation Based on Machine Unlearning and Shapley Value [18.9] 我々は、機械学習を利用してデータ値を効率的に推定する新しいフレームワークUnlearning Shapleyを提案する。
提案手法は,モンテカルロサンプリングによるシェープリー値の計算を行い,再学習を回避し,全データへの依存を排除した。
この作業は、データバリュエーション理論と実践的デプロイメントのギャップを埋め、現代のAIエコシステムにスケーラブルでプライバシに準拠したソリューションを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:46:03 GMT)
ChartCards: A Chart-Metadata Generation Framework for Multi-Task Chart Understanding [18.9] マルチタスクチャート理解のための統合チャートメタタ生成フレームワークであるChartCardsを提案する。
ChartCardsを用いて,10,862データテーブル,85Kチャート,170Kチャートキャプションを含む大規模高品質データセットであるMetaChartを構築した。
MetaChartの6つのモデルを微調整した結果、すべてのタスクの平均性能は5%向上した。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:16:47 GMT)
A Two-Stage Data Selection Framework for Data-Efficient Model Training on Edge Devices [18.9] 現在のオンデバイスモデルのトレーニングは、低いトレーニングスループット、限られたストレージ、さまざまなデータの重要性によって妨げられています。
モデル学習のためのストリーミングデータから,最も重要なデータバッチを選択するための2段階データ選択フレームワークであるsf Titanを提案する。
sf Titanは、トレーニング時間の最大43%の削減と、マイナーシステムのオーバーヘッドを伴う最終的な精度の6.2%の向上を実現している。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:53:48 GMT)
LLM-Based Emulation of the Radio Resource Control Layer: Towards AI-Native RAN Protocols [18.8] 大きなAIモデルを6Gモバイルネットワークに統合することは、プロトコル設計とコントロールプレーンインテリジェンスを再定義することを約束する。
本稿では,標準に準拠した ASN.1 符号化された無線リソース制御メッセージを生成する LAM のエンドツーエンドなデモを示す。
この結果から,無線アクセスネットワーク(RAN)固有の推論で拡張されたLAMは,直接制御プレーンの手順を編成できることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:55:56 GMT)
Bridging the Dynamic Perception Gap: Training-Free Draft Chain-of-Thought for Dynamic Multimodal Spatial Reasoning [18.8] 動的空間推論の評価を目的とした新しい迷路ナビゲーションベンチマークを提案する。
実験により、動的視覚的ドラフトによる推論連鎖の増大、入力画像のオーバーレイドは、従来の手法よりも著しく優れていることが示された。
D2R(Dynamic Draft-Augmented Reasoning)は、テキストCoTと対応するビジュアルドラフトをシームレスにMLLMに統合するトレーニングフリーフレームワークである。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:14:23 GMT)
Learning to Choose or Choosing to Learn: Best-of-N vs. Supervised Fine-Tuning for Bit String Generation [18.7] 理論的には、大きな言語モデルを新しいタスクに適応させる2つの方法を比較する。
教師付き微調整は、学習設定が実現可能であればBoNより優れている。
実現可能性が失敗した場合、障害モードに依存するため、BoNはより優れた収束率を得ることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:05:04 GMT)
Improving Chemical Understanding of LLMs via SMILES Parsing [18.5] CLEANMOLは、SMILES解析をクリーンで決定論的タスクのスイートに定式化する新しいフレームワークである。
適応的難易度スコアリングを伴う分子事前学習データセットを構築し,これらの課題に対してオープンソースのLCMを事前学習する。
以上の結果から,CLEANMOLは構造的理解を高めるだけでなく,Moll-Instructionsベンチマークのベースラインと競合する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:54:39 GMT)
No Black Boxes: Interpretable and Interactable Predictive Healthcare with Knowledge-Enhanced Agentic Causal Discovery [18.5] 知識に富んだエージェント駆動因果発見フレームワークであるII-KEAを提案する。
II-KEAは明確な推論と因果解析を通じて解釈可能性を高める。
また、臨床医がカスタマイズされた知識ベースとプロンプトを通じて知識や経験を注入することで、対話性も向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:36:30 GMT)
Large-Scale Bayesian Tensor Reconstruction: An Approximate Message Passing Solution [18.4] CP-GAMPは大規模テンソルに対するスケーラブルなベイズCPDアルゴリズムである。
提案アルゴリズムは,現状のベイズ変量CPD法と比較して,ランタイムを82.7%削減する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:57:49 GMT)
Optimizing Case-Based Reasoning System for Functional Test Script Generation with Large Language Models [18.2] テスト意図記述とそれに対応するテストスクリプトのケースバンクを保守し活用するケースベース推論(CBR)システムを提案する。
ユーザエクスペリエンスをさらに向上するために,再ランクベースの検索微調整と再利用微調整を併用したCBRシステムの最適化手法であるRe4を導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:18:30 GMT)
SSR-Zero: Simple Self-Rewarding Reinforcement Learning for Machine Translation [18.2] 本稿では,機械翻訳(MT)のための簡易自己回帰(SSR)強化学習(RL)フレームワークを提案する。
13Kモノリンガル例とQwen-2.5-7Bをバックボーンとして用いたSSRを用いたトレーニングを行った。
我々の最強モデルであるSSR-X-Zero-7Bは、COMETの外部監督でSSRを増強することにより、英語の$leftrightarrow$ Chinese translationにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:08:25 GMT)
STRCMP: Integrating Graph Structural Priors with Language Models for Combinatorial Optimization [18.2] 演算研究と理論計算機科学の中心となる組合せ最適化(CO)問題は、NPハードな性質のため、重要な計算課題を提示する。
本稿では,StRCMPを提案する。STRCMPは,構造先行を体系的に統合し,解の質と解解効率を向上する新しい構造対応アルゴリズム探索フレームワークである。
我々のフレームワークは、COインスタンスから構造埋め込みを抽出するグラフニューラルネットワーク(GNN)と、これらの埋め込みを条件としたLLMを組み合わせることで、ソルバ固有コードの形で高い性能のアルゴリズムを識別する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:37:42 GMT)
IFEval-Audio: Benchmarking Instruction-Following Capability in Audio-based Large Language Models [18.1] IFEval-Audioには、6つの異なる次元にわたる280のオーディオインストラクション回答トリプルが含まれている。
各例は音声入力とテキスト命令をペアリングし、モデルが特定の構造に従う出力を生成する必要がある。
我々は、最先端のオーディオLLMを、オーディオ関連命令に従う能力に基づいてベンチマークする。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:15:29 GMT)
ECHO-LLaMA: Efficient Caching for High-Performance LLaMA Training [18.1] ECHO-LLaMAはLLaMAモデルを特定の層にまたがる共有KVキャッシュに変換する。
ECHO-LLaMAは、トレーニング中のトークン/秒のスループットを最大77%向上させる。
ECHO-LLaMAは、大規模言語モデルの事前トレーニングと微調整のためのスケーラブルで費用効率の良いソリューションを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:54:21 GMT)
UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [18.1] UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:43:06 GMT)
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks [17.9] 大規模言語モデル(LLM)におけるFoR理解を評価するために,空間推論タスクにおける参照評価フレーム(FoREST)ベンチマークを導入する。
我々は,FoRESTを用いたテキスト・ツー・イメージモデルにおいて,FoRの理解とレイアウト生成を必要とする質問に対して,LLMを評価した。
その結果,様々なLLMにおけるFORクラス間での顕著な性能差が明らかとなり,テキスト・画像生成のための正確なレイアウトを生成する能力に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:26:58 GMT)
Steering LVLMs via Sparse Autoencoder for Hallucination Mitigation [17.9] 視覚言語モデル(LVLM)は視覚質問応答(VQA)や画像キャプションといったマルチモーダルタスクにおいて顕著な性能を発揮している。
彼らはまだ幻覚に悩まされており、視覚的な入力と矛盾するテキストを生成し、現実世界のアプリケーションに重大なリスクを及ぼしている。
LVLMの幻覚を緩和するために,SAE遅延方向(SSL)によるステアリングLVLMを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:45:45 GMT)
Sudoku-Bench: Evaluating creative reasoning with Sudoku variants [17.6] Sudoku-Benchは、創造的で多段階の論理的推論を評価するための、キュレートされたベンチマークである。
Sudoku-Benchには、慎重に選択されたパズルセット、標準化されたテキストベースのパズル表現、数千の公開パズルと互換性のある柔軟なツールが含まれている。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:24:35 GMT)
Universal Cross-Tokenizer Distillation via Approximate Likelihood Matching [17.6] 蒸留は、Large Language Model (LLM) の教師から学生のLLMに知識を移すことで顕著な成功を収めた。
現在の蒸留法では、教師と学生の間で同様のトークン化剤が必要であり、その適用性は教師と学生のペアのごく一部に限られている。
そこで本研究では, クロストケナイザー蒸留法を開発した。
本手法は, 従来手法よりも高い性能を示しつつ, 基本的に異なるトークン化剤間で有効蒸留を可能にする最初の方法である。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:46:21 GMT)
Auto-Prompting SAM for Weakly Supervised Landslide Extraction [17.5] 本稿では,Segment Anything Model (SAM) の自動プロンプトによる簡易かつ効果的な手法を提案する。
擬似ラベルや微調整SAMのための高品質なクラスアクティベーションマップ (CAM) に頼る代わりに,本手法はSAM推論から即時工学を通して,きめ細かなセグメンテーションマスクを直接生成する。
高分解能空中・衛星データを用いた実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:03:01 GMT)
Beyond Needle(s) in the Embodied Haystack: Environment, Architecture, and Training Considerations for Long Context Reasoning [17.5] $infty$-THORは、エンボディドAIにおける長期コンテキスト理解を促進する、長期的なエンボディドタスクのための新しいフレームワークである。
a new embodied QA task, Needle(s) in the Embodied Haystack, (3) long-horizon dataset and benchmark suite。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:20:38 GMT)
HyGenar: An LLM-Driven Hybrid Genetic Algorithm for Few-Shot Grammar Generation [17.4] 数ショットの文法生成のための大規模言語モデル(LLM)の能力について検討・改善する。
以上の結果から,既存のLLMは文法生成に準最適であることが明らかとなった。
文法生成を最適化するLLM駆動型ハイブリッド遺伝的アルゴリズムHyGenarを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:52:31 GMT)
Enhancing the Influence of Labels on Unlabeled Nodes in Graph Convolutional Networks [17.3] ELU-GCNと呼ばれる新しい2段階のフレームワークを提案する。
最初の段階では、ELU-GCNはグラフ学習を行い、新しいグラフ構造を学ぶ。
第2段階では、表現学習のためのGCNフレームワーク上で、新しいグラフコントラスト学習を設計する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:50:12 GMT)
Exact Solutions and Quantum Defect Theory for van der Waals Potentials in Ultracold Molecular Systems [17.2] 等方的ファンデルワールスポテンシャルを持つ2次元および3次元シュリンガー方程式に対して、正確な2次元解を提供する。
準2次元と3次元の両測地に適用可能な解析量子欠陥理論を開発する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:39:15 GMT)
Date Fragments: A Hidden Bottleneck of Tokenization for Temporal Reasoning [16.8] 我々は,トークン化器が複数桁の日付成分をいかに忠実に保存するかを測定する,単純な解釈可能な日付フラグメンテーション比を導入する。
DateAugBenchは3つの時間的推論タスクにまたがった6500の例のスイートです。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:06:29 GMT)
Conf-GNNRec: Quantifying and Calibrating the Prediction Confidence for GNN-based Recommendation Methods [16.5] 我々は,GNNに基づくレコメンデーション(Conf-GNNRec)の予測信頼度を定量化し,キャリブレーションする新しい手法を提案する。
具体的には,ユーザのパーソナライゼーションに基づいて過度な評価を動的に調整し,過度な評価を緩和する評価校正手法を提案する。
また、陰性サンプルの過度な信頼度を低減し、推薦性能を効果的に向上する信頼損失関数を設計する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:48:17 GMT)
TRIM: Achieving Extreme Sparsity with Targeted Row-wise Iterative Metric-driven Pruning [16.5] LLM(Large Language Models)は、その規模が大きいため、計算と記憶に重大な課題がある。
既存のワンショットプルーニング手法は、層間または各層内で均一なスペーサ性制約を適用することが多い。
この研究は、各層内の個々の出力次元(ロウ)に様々な空間比を適用する新しいアプローチを導入している。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:53:53 GMT)
Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback [16.5] 本稿では,モデルベース制御とRLベース制御を統合し,ロバスト性を高めるニューラル内部モデル制御を提案する。
我々のフレームワークは、剛体力学にニュートン・オイラー方程式を適用することで予測モデルを合理化し、複雑な高次元非線形性を捉える必要がなくなる。
本研究では,四足歩行ロボットと四足歩行ロボットにおけるフレームワークの有効性を実証し,最先端の手法と比較して優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:28:06 GMT)
Implicit Regularization of Infinitesimally-perturbed Gradient Descent Toward Low-dimensional Solutions [16.5] 帰納正規化とは、局所探索アルゴリズムが低次元の解に収束する現象を指す。
暗黙の規則化の成功は、暗黙の領域に近づきながら、厳密なサドル勾配から効率的に逃れる能力にかかっている。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:45:27 GMT)
Not All Correct Answers Are Equal: Why Your Distillation Source Matters [16.4] 蒸留は、オープンソースの言語モデルの推論能力を高めるための実用的で効果的なアプローチとして登場した。
我々は,最先端の教師モデルであるAM-Thinking-v1,Qwen3-235B-A22B,DeepSeek-R1の3つの出力を1億9900万クエリの共有コーパスで収集した。
各データセットでトレーニングされた学生モデルは、AIME2024、AIME2025、MATH500、LiveCodeBenchなどの推論ベンチマークに基づいて評価される。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:46:05 GMT)
Collab-Overcooked: Benchmarking and Evaluating Large Language Models as Collaborative Agents [16.4] 大規模言語モデル(LLM)ベースのエージェントシステムは、従来のNLPタスクを超えて、現実世界のアプリケーションにおいて大きな進歩を遂げてきた。
本稿では,インタラクティブ環境において,より適用性が高く,課題の多いOvercooked-AIゲーム上に構築された新しいベンチマークであるCollab-Overcookedを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:46:18 GMT)
CrossLMM: Decoupling Long Video Sequences from LMMs via Dual Cross-Attention Mechanisms [16.4] 性能劣化を最小限に抑えた視覚トークン量を大幅に削減するCrossLMMを提案する。
また,テキスト・ツー・ビジュアル・クロスアテンション機構を導入し,テキスト・トークンを元のビジュアル・トークンとのインタラクションによって拡張する。
提案手法は,多様なビデオベース大規模言語モデルベンチマークにおいて,同等あるいは優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:53 GMT)
MDIT-Bench: Evaluating the Dual-Implicit Toxicity in Large Multimodal Models [16.3] MDIT-Bench: Multimodal Dual-Implicit Toxicity Benchmark (MDIT-Bench: Multimodal Dual-Implicit Toxicity Benchmark) と呼ばれる新しい毒性ベンチマークを導入する。
MDIT-Benchは、12のカテゴリ、23のサブカテゴリ、780のトピックを含む317,638の質問で、二重単純毒性に対するモデルの感度を評価するためのベンチマークである。
実験では, MDIT-Benchを13個の顕著なLMMで実施し, これらのLMMは二重単純毒性を効果的に扱えないことを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:30:01 GMT)
Uncertainty Distillation: Teaching Language Models to Express Semantic Confidence [16.3] 大規模言語モデル (LLM) は、事実質問に対する回答にますます使われている。
これらの不確実性の言葉化表現が意味を持つためには、表現された信頼度レベルでエラー率を反映すべきである。
そこで本研究では,LLMにセマンティック信頼度を校正する簡単な方法である不確かさ蒸留法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:52:11 GMT)
Steering Language Model Refusal with Sparse Autoencoders [16.3] この研究は、SAEステアリングに基づく安全改善と一般的なモデル機能との緊張関係を明らかにする。
本研究は,言語モデルにおける安全関連機能の性質に関する重要なオープンな疑問を明らかにするものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:03:47 GMT)
REG: Rectified Gradient Guidance for Conditional Diffusion Models [16.3] 本稿では,既存のガイダンス手法の性能向上を図るために,修正勾配ガイダンス(REG)を提案する。
REGは、事前のガイダンス技術よりも最適なソリューションにより良い近似を提供する。
クラス条件の画像ネットとテキスト・ツー・イメージ生成タスクの実験では、REGは一貫してFIDとインセプション/CLIPスコアを改善している。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:16:00 GMT)
HASH-RAG: Bridging Deep Hashing with Retriever for Efficient, Fine Retrieval and Augmented Generation [16.1] Hash-RAGは、ディープハッシュ技術とシステマティック最適化を統合するフレームワークである。
このハッシュベースの効率的な検索フレームワークを基盤として,きめ細かなチャンクの基盤を確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:22:11 GMT)
MetaSTH-Sleep: Towards Effective Few-Shot Sleep Stage Classification with Spatial-Temporal Hypergraph Enhanced Meta-Learning [16.0] 時空間ハイパーグラフ強化メタラーニングに基づく数発の睡眠ステージ分類フレームワークであるMetaSTH-Sleepを提案する。
提案手法は,脳波信号の複雑な空間的相互干渉と時間的ダイナミクスを効果的にモデル化する一方で,少数のラベル付きサンプルを用いた新しい被験者への迅速な適応を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:09:03 GMT)
Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty [16.0] エージェント検索型Augmented Generation (RAG) システムは,動的かつ多段階の推論と情報検索を可能にし,Large Language Models (LLM) を強化する。
これらのシステムは、オーバーサーチ(冗長な情報を取得する)やアンダーサーチ(必要な情報を取得するのに失敗する)のような準最適探索行動を示すことが多い。
この研究は、これらの振る舞いを公式に定義し、定量化し、複数のQAデータセットとエージェントRAGシステムにまたがるそれらの頻度を明らかにする。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:57:56 GMT)
An Operator Splitting View of Federated Learning [16.0] 過去数年間、学習(texttFL$)コミュニティは、新しい$texttFL$アルゴリズムの急増を目撃してきた。
我々は、異なるアルゴリズムを簡単に比較し、以前の収束結果と比較し、新しいアルゴリズムの変種を明らかにする。
統一アルゴリズムは、オーバーヘッドを伴わずに$texttFL$アルゴリズムを加速する方法も導き出す。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:26:17 GMT)
BadDepth: Backdoor Attacks Against Monocular Depth Estimation in the Physical World [15.9] 我々は、MDEモデルをターゲットにした最初のバックドアアタックであるBadDepthを紹介する。
BadDepthは画像分割モデルを用いてターゲットオブジェクトの深さを選択的に操作する。
また、物理世界とデジタルドメインの間の領域ギャップに対応するために、デジタル・物理的拡張も導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:53:51 GMT)
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms [15.8] textbfDongbaMIEは、Dongba pictographsのマルチモーダル情報抽出に焦点を当てた最初のデータセットである。
データセットは、ドンバヒエログリフ文字の画像と、それに対応する中国語の意味アノテーションで構成されている。
23,530の文レベルと2,539の段落レベルの高品質テキストイメージペアを含んでいる。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:57:25 GMT)
Panoptic Captioning: Seeking An Equivalency Bridge for Image and Text [15.6] 高品質なデータを生成するためにPancapEngineという効果的なデータエンジンを提案し,また,パンコプトキャプションを改善するためにPancapChainという新しい手法を提案する。
当社のPancapChainは、難易度の高い汎視的キャプションタスクを複数のステージに分離し、段階的に汎視的キャプションを生成する。
実験によると、私たちのPancapChain-13Bモデルは、InternVL-2.5-78Bのような最先端のオープンソースMLLMを破り、GPT-4oやGemini-2.0-Proのようなプロプライエタリなモデルを超えている。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:44:10 GMT)
FoMoH: A clinically meaningful foundation model evaluation for structured electronic health records [15.6] ファンデーションモデルは、下流のタスクとは無関係に意味のある表現を抽出する能力を考えると、医療において大きな可能性を秘めている。
包括的かつ有意義なタスクのデシダラタが欠如していることから、これらのモデルが臨床的有用性にもたらす可能性については、ほとんど意見の一致がない。
コロンビア大学アーヴィング医療センターの500万人の患者を対象に, EHRデータに基づく最先端基礎モデルの評価を行った。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:29:52 GMT)
BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks [15.5] タスクを完了するには、LLM(Big Language Model)ベースのエージェントを計画によって簡単に実行可能なステップに分解する必要がある。
既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。
実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:35:57 GMT)
STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding? [15.4] MLLM(Multimodal Large Language Models)は、Embodied AIとAutonomous Drivingのためのエンドツーエンドソリューションである。
MLLMの時空間的理解を評価するためのベンチマークであるSTI-Benchを紹介する。
私たちのベンチマークでは、デスクトップ、屋内、屋外のシナリオにまたがる幅広いロボットと車両の操作を網羅しています。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:47:24 GMT)
DomainCQA: Crafting Expert-Level QA from Domain-Specific Charts [15.4] DomainCQAは、ドメイン固有のCQAベンチマークを構築するための体系的な方法論である。
我々は天文学分野におけるCQAベンチマークであるAstroChartを開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:12:20 GMT)
Conformal Predictive Distributions for Order Fulfillment Time Forecasting [15.4] 本稿では,オーダー充足時間の分布予測のための新しいフレームワークを提案する。
提案手法は競合する分布予測を生成できるが,機械学習に基づく点予測は既存のルールベースシステムよりも大幅に優れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:23:52 GMT)
Mitigating Gender Bias via Fostering Exploratory Thinking in LLMs [15.4] 大きな言語モデル(LLM)は、しばしば性別バイアスを示し、男女の扱いが不平等になる。
我々のアプローチは、構造的に同一で道徳的に曖昧なシナリオにおいて、男性と女性の主人公を特徴とするストーリーペアを生成するようモデルに促す。
不整合が発生すると、モデルはバランスのとれた性中立的な判断を生み出すように誘導される。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:46:50 GMT)
SMART: Self-Generating and Self-Validating Multi-Dimensional Assessment for LLMs' Mathematical Problem Solving [15.3] 大規模言語モデルは、様々な数学的なベンチマークで顕著な結果を得た。
最終回答の正確さなどの一般的な評価指標は、関係する下位の能力を乱すことができない。
SMART(Self-Generating and Self-Validating Multi-dimensional Assessment Framework)を紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:24 GMT)
GUI-G1: Understanding R1-Zero-Like Training for Visual Grounding in GUI Agents [15.3] 最近のGUIエージェントは、R1-Zeroパラダイムを再現し、オンライン強化学習(RL)と、オブジェクトの接地前に明確な連鎖推論を結合する。
まず、入力設計、出力評価、ポリシー更新という、トレーニングパイプラインの3つの重要なコンポーネントについて、広範囲な分析実験を行った。
このGUI-G1-3Bは,Qwen2.5-VL-3B-Instructで17Kの公開サンプルをトレーニングし,ScreenSpotで90.3%,ScreenSpot-Proで37.1%の精度を実現した。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:15:23 GMT)
Scaling Off-Policy Reinforcement Learning with Batch and Weight Normalization [15.2] CrossQは,更新データ(UTD)比が1。
より高UTD比で強調されるトレーニングダイナミクスの課題を明らかにする。
提案手法はUTD比の増大とともに確実にスケールし,25の難易度連続制御タスクにまたがる競争性能を達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:39:27 GMT)
Causal Deconfounding via Confounder Disentanglement for Dual-Target Cross-Domain Recommendation [15.2] 本稿では,CD2CDR と呼ばれる多目的クロスドメインレコメンデーションのための Confounder Disentanglement によるCausal Deconfounding フレームワークを提案する。
CD2CDRでは、まず、観測された単一ドメインとクロスドメインの共創者を効果的に分離する、共同設立者切り離しモジュールを提案する。
そこで我々は,そのような共同設立者の肯定的な効果を保ち,その負の効果をバックドア調整によって排除する因果分解モジュールを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:32:08 GMT)
Partition-wise Graph Filtering: A Unified Perspective Through the Lens of Graph Coarsening [15.2] 本稿ではCPF(Coarsening-guided Partition-wise Filtering)を紹介する。
CPFはノード分割でフィルタリングを実行することで革新する。
CPFの各相について詳細な解析を行い、他のパラダイムよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:47:24 GMT)
On the Out-of-Distribution Generalization of Self-Supervised Learning [15.1] 構造因果モデルに基づく後干渉分布(PID)を提案する。
PIDは、スプリアス変数とラベル変数が相互に独立なシナリオを提供する。
我々は、潜在変数モデルの学習を通じて、PID制約を強制するバッチサンプリング戦略を開発する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:40:00 GMT)
Efficient Training of Neural SDEs Using Stochastic Optimal Control [15.0] ニューラル微分方程式(SDE)に対する変動推論(VI)の階層的制御理論に基づく手法を提案する。
ニューラルSDEのVIは、不確実性を考慮した推論のための有望な道であるが、ELBOを最大化する反復的な性質のため、計算的に困難である。
制御項の線形部分は最適であり、学習する必要がないため、トレーニングは低コストで表現され、より速い収束を観察する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:26:01 GMT)
Visual Prompting with Iterative Refinement for Design Critique Generation [15.0] UI批判に対する反復的視覚的プロンプト手法を提案する。
スクリーンショット内の各コメントを特定の領域にマップする、対応するバウンディングボックスとともに、デザインコメントのリストを生成する。
Gemini-1.5-pro と GPT-4o を用いて提案手法の評価を行ったところ,人間の専門家はパイプラインが生み出す設計批判を概ね好んでいることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:42:09 GMT)
Generator-Mediated Bandits: Thompson Sampling for GenAI-Powered Adaptive Interventions [15.0] 我々はジェネレータを用いたバンド・トンプソンサンプリング(GAMBITTS)を導入する。
GAMBITTSは、標準手法に対する政策学習を加速するために、提供された治療の情報を用いて、治療と報酬の生成プロセスを明示的にモデル化する。
シミュレーション研究において、GAMBITTSは期待される報酬をより正確に推定するために観察された治療を活用することで、従来のアルゴリズムよりも一貫して優れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:06:51 GMT)
Differential Privacy in Continual Learning: Which Labels to Update? [14.7] 継続的な学習は、センシティブなトレーニングデータに必要な厳密なプライバシーと矛盾する。
モデルが出力できるラベルセットを通じて、プライバシの漏洩を説明できないことは、他の有効なDPアルゴリズムのプライバシーを損なう可能性があることを強調する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:55 GMT)
Robust 6DoF Pose Tracking Considering Contour and Interior Correspondence Uncertainty for AR Assembly Guidance [14.6] 本稿では,誤りの少ない輪郭対応に対処し,耐雑音性を向上させる頑健な輪郭型ポーズトラッキング手法を提案する。
第2に、回転対称な物体の追跡を改良し、局所最小化を克服するための輪郭法を支援するためのCPUのみの戦略を導入する。
公開データセットと実シナリオを用いた実験により,本手法は最先端の単分子追跡法より著しく優れていることが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:46:22 GMT)
Steering Large Language Models for Machine Translation Personalization [14.5] 大規模言語モデル(LLM)に基づく高品質機械翻訳システムは、パーソナライズされた翻訳の作成を単純化した。
低リソース環境下でLLM生成翻訳をパーソナライズするための様々な戦略について検討する。
本稿では,スパースオートエンコーダから抽出した潜在概念を利用して,パーソナライズ特性を同定する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:47:16 GMT)
MAGIC: Motion-Aware Generative Inference via Confidence-Guided LLM [14.5] MAGICは、シングルイメージの物理特性推論と動的生成のためのトレーニング不要のフレームワークである。
本フレームワークは,静止画像からモーションリッチな映像を生成し,信頼度に基づくフィードバックループを通じて視覚と身体のギャップを埋める。
実験の結果,MAGICは既存の物理認識生成手法よりも精度が高く,時間的コヒーレンスも高いことがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:40:34 GMT)
Don't Judge Code by Its Cover: Exploring Biases in LLM Judges for Code Evaluation [14.5] 評価子として大きな言語モデルを使用すると、コード評価タスクに拡張される。
LLMは、表面的なバリエーションで意味論的に等価なコードを公平かつ堅牢に評価できますか?
コード評価における潜在的なバイアスを6種類定義し,この問題を包括的に検討した。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:49:33 GMT)
DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping [14.5] 汎用ロボットは任意のシナリオで多様な物体を把握できなければならない。
DexGraspVLA(英語版)は、散らばったシーンにおける一般的なデキスタラス把握のための階層的なフレームワークである。
本手法は, 数千の未確認物体, 照明, 背景の組み合わせで90%以上の成功率を達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:27:36 GMT)
MedAgent-Pro: Towards Evidence-based Multi-modal Medical Diagnosis via Reasoning Agentic Workflow [14.5] 現代医学では、臨床診断は主にテキストおよび視覚データの包括的分析に依存している。
大規模視覚言語モデル(VLM)およびエージェントベース手法の最近の進歩は、医学的診断に大きな可能性を秘めている。
現代医学における診断原理に従う新しいエージェント推論パラダイムであるMedAgent-Proを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:23:52 GMT)
Constrained Online Decision-Making: A Unified Framework [14.5] 本稿では,段階的実現可能性制約による逐次意思決定の一般的な定式化について検討する。
本稿では,既存の制約付き学習問題を抽出する統一的なアルゴリズムフレームワークを提案する。
この結果は、理論と実践の両方において、制約付きシーケンシャルな意思決定のための原則化された基盤を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:30:05 GMT)
ConciseRL: Conciseness-Guided Reinforcement Learning for Efficient Reasoning Models [14.4] 強化学習フレームワークに報酬信号として用いられる新しいスコアを導入し、モデルが正確かつ簡潔な推論トレースを生成するよう誘導する。
このスコアは、ジャッジとして機能する大きな言語モデルによって評価され、単純なトークン長を超えて動的でコンテキスト対応のフィードバックを可能にする。
提案手法は,MATHデータセット上での最先端の効率・正確性トレードオフを実現し,簡単な問題ではトークン使用率を最大31倍に削減し,精度を7%向上させるとともに,最も難しい問題では,トークン使用率を最大3.6倍に抑えながら,完全な推論を+7.5%向上させる。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:56:35 GMT)
Experimental robustness benchmark of quantum neural network on a superconducting quantum processor [14.4] 量子機械学習(QML)モデルは、従来のモデルと同様、敵攻撃に対して脆弱であり、セキュアなデプロイメントを妨げる。
ここでは、20量子ビット量子ニューラルネットワーク(QNN)の最初の系統的実験ロバスト性ベンチマークを報告する。
我々のベンチマークフレームワークは、QNN向けに設計された効率的な対向攻撃アルゴリズムを備えており、対向ロバスト性とロバスト性境界の定量的評価を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:18:14 GMT)
Neighbour-Driven Gaussian Process Variational Autoencoders for Scalable Structured Latent Modelling [14.4] ガウス過程 (GP) 変分オートエンコーダ (VAEs) は、完全に分解されたガウス前処理をGP前処理に置き換えることで標準のVAEを拡張する。
大規模GPVAEにおける正確なGP推論の実行は、計算的に禁止されており、しばしば既存のアプローチは制限的なカーネルの仮定に頼らざるを得ない。
本稿では,拡張性のあるGPVAE推論を実現するために,潜在空間における局所的隣接性を利用する近似手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:07:33 GMT)
Auto-nnU-Net: Towards Automated Medical Image Segmentation [14.3] Medical Image Decathlon (MIS) には骨から臓器へのセグメンテーションまで様々なタスクが含まれており、それぞれに最適なセグメンテーションモデルを見つけるための独自の課題がある。
最先端のAutoML関連MIS-framework nnU-Netはモデル構成の多くの側面を自動化する。
本稿では,ハイパーパラメータ最適化(HPO),ニューラルアーキテクチャ探索(NAS),階層型NASを実現する新しいnnU-Net変種であるAutonnU-Netを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:52:16 GMT)
Three Minds, One Legend: Jailbreak Large Reasoning Model with Adaptive Stacked Ciphers [14.3] Large Reasoning Models (LRMs) は従来のLarge Language Models (LLMs) と比較して優れた論理能力を示している。
SEALは新たなジェイルブレイク攻撃であり、彼らの推論プロセスをオーバーライドし、潜在的な適応アライメントを回避するように設計された適応型暗号化パイプラインを通じてLEMをターゲットにしている。
SEAL は GPT o4-mini の攻撃成功率 80.8% を達成し、最先端のベースラインを27.2% で上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:19:42 GMT)
Optimizing LLM-Based Multi-Agent System with Textual Feedback: A Case Study on Software Development [14.2] 自然言語フィードバックを利用したロールベースマルチエージェントシステムのグループ最適化に関する実証事例研究を行った。
本稿では,2段階のエージェントプロンプトの最適化パイプラインを提案し,性能の低いエージェントを同定し,特定エージェントのシステムプロンプトを最適化する。
本研究では,多様な評価次元で評価されたソフトウェア開発タスクに対処するロールベースマルチエージェントシステムに対する最適化手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:00:27 GMT)
From Tens of Hours to Tens of Thousands: Scaling Back-Translation for Speech Recognition [14.2] Speech Back-Translationは、大規模テキストコーパスを合成音声に変換することで、多言語ASRモデルを改善するスケーラブルなパイプラインである。
10言語で50,000時間以上の合成音声を生成し、Whisper-large-v3の事前学習を継続し、平均転写誤りを30%以上削減する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:51:05 GMT)
Omni TM-AE: A Scalable and Interpretable Embedding Model Using the Full Tsetlin Machine State Space [14.2] Omni Tsetlin Machine AutoEncoder (Omni TM-AE) は、TMの状態行列に含まれる情報を利用する新しい埋め込みモデルである。
セマンティック類似性、感情分類、文書クラスタリングタスクの広範な実験は、Omni TM-AEが主流の埋め込みモデルと競合し、しばしば越すことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:38:05 GMT)
Latent Principle Discovery for Language Model Self-Improvement [14.1] 本稿では, 自己補正設定で明示的にモデル化することで, 人間の嗜好応答を推論する潜在属性を抽出する手法を提案する。
提案手法は,LM自体から新たな原理を抽出し,発見した要素をクラスタリングにより解釈可能な集合に圧縮する。
複数の反復でアルゴリズムをブートストラップすることで、より小さな言語モデルを自己改善し、AlpacaEvalの勝率+8-10%、MT-Benchの平均+0.3、IFEvalの勝率+19-23%を達成できることを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:20:18 GMT)
RE-TRIP : Reflectivity Instance Augmented Triangle Descriptor for 3D Place Recognition [14.1] 本稿では,RE-TRIPという3次元位置認識のための新しい記述子を提案する。
この新しいディスクリプタは、幾何計測と反射率の両方を活用して堅牢性を高める。
本稿では,RE-TRIPの有効性を示す一連の実験を行った。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:11:30 GMT)
Find the Fruit: Designing a Zero-Shot Sim2Real Deep RL Planner for Occlusion Aware Plant Manipulation [14.0] 本稿では, 乱雑な植物環境におけるロボット操作のためのエンドツーエンドの深層強化学習フレームワークを提案する。
ロボット制御からキネマティック計画問題を分離し、訓練されたポリシーに対するゼロショットsim2real転送を簡素化する。
本研究は, 各種初期条件における実地試験において, 最大86.7%の成果が得られたことを実証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:37:39 GMT)
Diffusion Model Predictive Control [14.0] Diffusion Model Predictive Control (D-MPC)は、マルチステップアクション提案とマルチステップダイナミックスモデルを学ぶ新しいMPCアプローチである。
MPCを用いた既存のモデルベースオフライン計画手法よりもはるかに優れた性能を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:22:48 GMT)
AnchorFormer: Differentiable Anchor Attention for Efficient Vision Transformer [13.9] 本稿では,アンカートークンを用いたアンカーベースの効率的な視覚変換器(AnchorFormer)を提案する。
神経層内のニューロンでアンカーを表現することにより、これらの分布を微分可能とし、大域的自己注意を近似することができる。
実験では、AnchorFormerの有効性を示し、ImageNet分類における9.0%の精度または46.7%のFLOPs削減を実現した。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:44:44 GMT)
On the Lack of Robustness of Binary Function Similarity Systems [13.8] 我々は、最先端の機械学習モデルの敵攻撃に対するレジリエンスを評価する。
我々は、この攻撃が全てのモデルの妥協に成功し、問題設定に応じて57.06%と95.81%の平均的な攻撃成功率を達成することを実証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:43:16 GMT)
ScholarBench: A Bilingual Benchmark for Abstraction, Comprehension, and Reasoning Evaluation in Academic Contexts [13.8] textttScholarBenchは、大規模言語モデル(LLM)の学術的推論能力を評価するためのベンチマークである。
このベンチマークは韓国語で5,031例、英語で5,309例で、o3-miniのような最先端のモデルでさえ、平均評価スコアは0.543点だった。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:59:06 GMT)
Statistical Test for Saliency Maps of Graph Neural Networks via Selective Inference [13.6] 本稿では,サリエンシマップの意義を厳密に評価するための統計的テストフレームワークを提案する。
我々の主な貢献は、データのダブルダイッピングによるタイプIエラー率のインフレーションに対応することです。
本手法は,I型エラー率を制御しながら,統計的に有効な$p$-値を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:50:55 GMT)
CAIFormer: A Causal Informed Transformer for Multivariate Time Series Forecasting [13.6] 本稿では,各対象変数を別々に予測する全対一予測パラダイムを提案する。
この予測は、最初の3つの因果関係のサブセグメントにのみ依存する。
複数のベンチマークデータセットの実験では、CAIFormerの有効性が示されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:04:21 GMT)
Active Speech Enhancement: Active Speech Denoising Decliping and Deveraberation [13.6] 能動音声修正のための新しいパラダイム:能動音声強調(ASE)について紹介する。
干渉抑制と信号の富化を協調的に最適化するタスク固有損失関数とともに,トランスフォーマー・マンバに基づく新しいアーキテクチャを提案する。
提案手法は,複数の音声処理タスクにおいて,デノベーション,デノベーション,デクリッピングなど,既存のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:10:18 GMT)
A Causal Approach to Mitigate Modality Preference Bias in Medical Visual Question Answering [13.5] 既存のMedVQAモデルはモダリティ優先バイアスに悩まされ、予測は一方のモダリティに大きく支配され、他方を見下ろしている。
本稿では, 因果グラフを応用し, 推論時のモダリティ優先バイアスを除去する医療対実VQA(MedCFVQA)モデルを提案する。
我々は,MedCFVQAがSLAKE,RadVQA,SLAKE-CP,RadVQA-CPの両データセットにおいて,非因果関係を著しく上回っていることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:21:05 GMT)
Stronger ViTs With Octic Equivariance [13.4] ViT(Vision Transformers)は、画像パッチ上の重み共有を重要な帰納バイアスとして組み込んでいる。
我々は,オクティック・平等な層を用いた新しいアーキテクチャであるオクティック・ヴァイツを開発し,教師付き学習と自己教師型学習の両面でのテストに投入する。
また,VT-HのFLOPの約40%の削減を実現し,分類とセグメンテーションの両面で改善した。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:33:46 GMT)
DualComp: End-to-End Learning of a Unified Dual-Modality Lossless Compressor [13.3] 画像とテキストデータのための学習型デュアルモード圧縮機であるDualCompを提案する。
モダリティ統一トークン化、モダリティスイッチング・コンテキスト学習、およびモダリティルーティング・ミックス・オブ・エキスパートが組み込まれている。
単純化された単一モダリティ変種は、モデルサイズのわずか1.2%を使用して、Kodakデータセット上の以前の最高の画像圧縮機を約9%上回る。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:46:14 GMT)
Accidental Misalignment: Fine-Tuning Language Models Induces Unexpected Vulnerability [13.2] 本研究では,微調整データの特徴から生じる異常,予期しない脆弱性について検討する。
まず、言語的特徴、意味的類似性、およびデータセット内の毒性などの潜在的な相関要因を同定する。
次に、これらの微調整モデルの逆性能を評価し、データセット因子が攻撃成功率とどのように相関するかを評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:30:00 GMT)
Privacy-Preserving Personalized Federated Learning for Distributed Photovoltaic Disaggregation under Statistical Heterogeneity [13.1] パーソナライズド・フェデレーション・ラーニング(PFL)を用いて,プライバシー保護型分散PVデアグリゲーションフレームワークを提案する。
提案手法は局所モデリングとグローバルモデリングを組み合わせた2段階のフレームワークを用いる。
実世界のデータを用いた実験では,提案フレームワークの有効性が示され,ベンチマーク手法と比較して精度と堅牢性が向上した。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:55:52 GMT)
C-3PO: Compact Plug-and-Play Proxy Optimization to Achieve Human-like Retrieval-Augmented Generation [13.1] C-3POは、レトリバーと大規模言語モデル間の通信を容易にするプロキシ中心のフレームワークである。
我々のフレームワークは、RAGパイプライン全体を協調的に最適化する3つの特殊エージェントを実装している。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:18:16 GMT)
EasyInsert: A Data-Efficient and Generalizable Insertion Policy [13.0] EasyInsertは、プラグとソケットの間の相対的なポーズ(デルタポーズ)が挿入を成功させるのに十分である、という人間の直感を利用するフレームワークである。
EasyInsertは、予測されたデルタポーズに基づいた粗い実行手順に従い、様々な挿入タスクを成功させる。
実際の実験では、5時間のトレーニングデータしか持たないが、EasyInsertは、目に見えない15のオブジェクトのうち13のオブジェクトに対して、ゼロショット挿入で90%以上成功している。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:46:05 GMT)
MM-MovieDubber: Towards Multi-Modal Learning for Multi-Modal Movie Dubbing [13.0] 映画ダビングのためのマルチモーダル生成フレームワークを提案する。
マルチモーダル入力で導かれる大きな音声生成モデルを用いて高品質なダビングを生成する。
その結果, 最先端(SOTA)法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:23:05 GMT)
Optimal Transport with Heterogeneously Missing Data [12.9] 本稿では,2つの経験的分布間の最適輸送問題の解法について考察する。
実験的な分布と線形モンジュ写像の間のワッサーシュタイン距離は, 試料の複雑さに大きな影響を及ぼすことなく, 縮退することができることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:16:22 GMT)
Sufficient conditions for offline reactivation in recurrent neural networks [12.9] タスク最適化ネットワークは、オンライン行動に責任を負う同一のネットワーク状態を自律的に再活性化できることを示す。
環境状態変数の追跡に最適化されたノイズリカレントネットワークが自然にデノジングダイナミクスを発達させることを数学的に示す。
我々の研究は、ノイズの多いニューラルネットワークにおけるタスク最適化の突発的な結果としてオフライン再活性化をモデル化するための理論的支援を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:57:59 GMT)
Investigating the Effects of Fairness Interventions Using Pointwise Representational Similarity [12.9] 本稿では,PNKA(Pointwise Normalized Kernel Alignment)を提案する。
PNKAは、偏りが個人の中間表現にどのように影響するかを測定することで、これまで未知の洞察を明らかにしている。
PNKAを用いて表現を評価することにより、これらの表現に基づいて訓練されたMLモデルの挙動を確実に予測できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:00:27 GMT)
MentalMAC: Enhancing Large Language Models for Detecting Mental Manipulation via Multi-Task Anti-Curriculum Distillation [12.8] 精神的な操作は微妙だが広範囲にわたる心理的虐待であり、精神的な健康に深刻な脅威をもたらす。
MentalMACはマルチタスクの反キュリキュラム蒸留法であり、マルチターン対話におけるメンタル操作の検出能力を高める。
i)進化的操作と音声行動理論に基づく教師なしデータ拡張手法であるEvoSA,(ii)教師モデルによるマルチタスク監視,(iii)複雑なタスクから単純なタスクへの進化的知識の蒸留。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:13:57 GMT)
Continually Self-Improving Language Models for Bariatric Surgery Question--Answering [12.7] 本稿では,リアルタイムな医学的証拠を自律的に統合する適応型検索拡張生成モデルであるbRAGgenを紹介する。
また,bRAGqは1,302例の手術関連質問項目を収集し,専門的外科医による検証を行った。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:02:51 GMT)
Maximizing Discrimination Capability of Knowledge Distillation with Energy Function [12.6] 我々は知識蒸留とデータ拡張にエネルギー関数を用いる。
本論文は,知識蒸留とデータ拡張におけるエネルギー機能の利用に向けた最初の試みである。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:05:58 GMT)
Remasking Discrete Diffusion Models with Inference-Time Scaling [12.6] マスク付き拡散モデルに適用可能な手法であるリマスキー拡散モデル(ReMDM)を原則的に導入する。
最も興味深いことに、ReMDMは推論時間計算スケーリングの形で離散拡散を許容する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:17:43 GMT)
CTRAP: Embedding Collapse Trap to Safeguard Large Language Models from Harmful Fine-Tuning [12.3] ファインチューニング・アズ・ア・サービス(英語版)は、有害なファインチューニング攻撃に対してモデルを公開する。
我々は、選択的な除去ではなく、モデル崩壊を誘発するパラダイムシフトを提案する。
この崩壊は、攻撃者が悪用する非常に一般的な機能を直接中和する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:47:08 GMT)
Joint Hierarchical Representation Learning of Samples and Features via Informed Tree-Wasserstein Distance [12.3] 本稿では,Tree-Wasserstein Distance (TWD) を用いて,サンプルと特徴の階層的表現を学習するための教師なし手法を提案する。
本手法は2つのデータモードを交互に構成する。まず1つのモードのツリーを構築し、次にそのツリーに基づいて他のモードのTWDを計算し、最終的にTWDを用いて第2のモードのツリーを構築する。
本稿では,提案手法をハイパーボリックグラフ畳み込みネットワークに前処理として組み込むことができ,リンク予測やノード分類タスクの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:14:49 GMT)
Simultaneous Estimation of Nonlinear Functionals of a Quantum State [12.2] 量子情報理論の基本的なタスクとして、$operatornametr(Orho)$, $operatornametr(Orho2)$, ..., $operatornametr(Orhok)$ for an observable $O$ and a quantum state $rho$ を推定する。
widetildeTheta(k)$ sample of $rho$ は、$k$の値を同時に見積もるのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:23:48 GMT)
Next Token Perception Score: Analytical Assessment of your LLM Perception Skills [12.1] Next Token Perception Score (NTPS) は、自己回帰的特徴空間と知覚的特徴部分空間の重なりを測定する線形設定の下で導出されるスコアである。
NTPSはローランク適応(LoRA)ファインチューニング後に増加し,特に大規模モデルでは顕著である。
本研究は, 理論的知見と, 知覚能力の分析的評価を行うための実践的ツールの両方を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:18:51 GMT)
An End-to-End Model For Logits Based Large Language Models Watermarking [12.1] 既存の透かし法は、修正されていないコンテンツに効果があるが、テキストが修正されると、大幅な性能低下を被る。
LLM生成テキストの透かしのための新しいエンドツーエンドロジット手法を提案する。
提案手法は, パラフレージングで37~39%, 平均17.2%, 歪みのない手法より優れたロバスト性を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:06:24 GMT)
When LLMs Learn to be Students: The SOEI Framework for Modeling and Evaluating Virtual Student Agents in Educational Interaction [12.1] 教室シナリオにおける人格対応型仮想学生エージェント(LVSA)の構築と評価のためのSOEIフレームワークを提案する。
LoRAファインチューニングとエキスパートインフォームドプロンプト設計により,5つのLVSAをBig Five特性に基づいて生成する。
その結果,(1)LLMをベースとした学生エージェントのための教育的,心理的に基盤とした生成パイプライン,(2)行動リアリズムのためのハイブリッドでスケーラブルな評価フレームワーク,(3)LVSAsの教育的有用性に関する実証的な知見が得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:19:15 GMT)
Backward Oversmoothing: why is it hard to train deep Graph Neural Networks? [11.8] オーバースムーシングは、長い間、グラフニューラルネットワーク(GNN)の大きな限界として認識されてきた。
本稿では,逆プロパゲーションエラーも出力から入力への過スモーシングの対象となるという,逆向きの過スムーシングを解析する。
後ろ向きの過密により, GNN は, 確実に多くの急激な静止点を示すことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:51:38 GMT)
MCP-RADAR: A Multi-Dimensional Benchmark for Evaluating Tool Use Capabilities in Large Language Models [11.8] 本稿では,モデルコンテキストプロトコル (MCP) フレームワークにおける大規模言語モデル (LLM) の性能を評価するために設計された,最初の総合ベンチマークである MCP-RADAR を紹介する。
MCP-RADARは主観的な人的評価やバイナリ成功メトリクスに依存する従来のベンチマークとは異なり、複数のタスク領域にわたって客観的に定量化されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:02:37 GMT)
Computing Exact Shapley Values in Polynomial Time for Product-Kernel Methods [11.7] PKeX-Shapleyは、Shapley値の正確な計算を可能にする新しいアルゴリズムである。
PKeX-Shapleyは計算効率を向上し,カーネル学習における解釈可能性を向上させる。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:53:04 GMT)
My Words Imply Your Opinion: Reader Agent-based Propagation Enhancement for Personalized Implicit Emotion Analysis [11.6] 本稿では,Personalized IEA(PIEA)とRAPPIEモデルについて紹介する。
我々は、読者のフィードバックをシミュレートするために、大きな言語モデルに基づくリーダーエージェントを作成する。
我々は、英語と中国語のソーシャルメディアをカバーする2つの新しいPIEAデータセットを構築した。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:10:44 GMT)
TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning [11.6] 強化学習(RL)は,大規模言語モデル(LLM)の推論能力を高める強力なツールとなった。
しかし、RLの成功は、検証者によって提供される報酬の信頼性に依存している。
本稿では, 正のモデル出力を誤って拒否する不適切な負の問題を公開し, 解析する。
既存のルールベースの手法を拡張する軽量なLCMベースの検証器である littleV を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:49:50 GMT)
Semantic Compression of 3D Objects for Open and Collaborative Virtual Worlds [11.6] パブリックな生成モデルから3次元のセマンティック圧縮を実現するパイプラインを構築した。
セマンティック圧縮は,100倍圧縮前後の重要品質保存領域において,従来の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:45:35 GMT)
When VLMs Meet Image Classification: Test Sets Renovation via Missing Label Identification [11.5] 本稿では,画像分類テストセットにおけるノイズラベルと欠落ラベルの両方に対処するため,REVEALという包括的フレームワークを提案する。
REVEALは潜在的なノイズのあるラベルや欠落を検出し、様々な方法から予測を集約し、信頼性インフォームド予測とコンセンサスに基づくフィルタリングによってラベルの精度を向上する。
提案手法は,公開データセットから欠落したラベルを効果的に明らかにし,ソフトラベルによる結果に可能性が示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:47:36 GMT)
Efficient and Scalable Density Functional Theory Hamiltonian Prediction through Adaptive Sparsity [11.4] ハミルトン行列予測は計算化学において重要である。
SPHNetは、適応SParsityをハミルトン予測に組み込んだ、効率的でスケーラブルな同変ネットワークである。
SPHNetは最先端の精度を実現し、既存のモデルよりも最大7倍のスピードアップを実現している。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:37:26 GMT)
Zero-Shot Anomaly Detection in Battery Thermal Images Using Visual Question Answering with Prior Knowledge [11.4] バッテリーの熱画像における異常検出は、早期に故障を特定するのに役立つ。
従来のディープラーニング手法では、広範なラベル付きデータが必要である。
視覚質問応答(VQA)モデルを用いたゼロショット異常検出について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:39:52 GMT)
TULiP: Test-time Uncertainty Estimation via Linearization and Weight Perturbation [11.3] OOD検出のための理論駆動型不確実性推定器TULiPを提案する。
本手法では,収束前にネットワークに適用される仮説的摂動を考察する。
提案手法は,特に近分布試料について,最先端の性能を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:16:41 GMT)
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models [11.3] テキストと画像の拡散モデルは、フレキシブルでリアルな画像合成のための前例のない能力を示している。
これらのモデルは、時間を要するサンプリング手順に依存しており、レイテンシの削減を動機付けている。
我々のアプローチは、再訓練、微調整、知識蒸留なしに、直接遅延を減らそうとしている。
提案手法は, 従来の高遅延拡散モデルで生成した画像に近い画像を生成するため, 再利用戦略と, 同等のレイテンシの少数のサンプリング手順を経験的に比較した。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:05:38 GMT)
SAGI: Semantically Aligned and Uncertainty Guided AI Image Inpainting [11.2] SAGI-DはAIが生成する塗り絵の最大かつ最も多様なデータセットである。
実験の結果,セマンティックアライメントは画像の品質と美学を著しく改善することがわかった。
SAGI-Dを使っていくつかの画像法医学的アプローチを訓練すると、ドメイン内の検出性能は平均37.4%向上する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:13:28 GMT)
All-atom Diffusion Transformers: Unified generative modelling of molecules and materials [11.2] All-atom Diffusion Transformer (ADiT) は、周期的材料と非周期的分子システムの両方を共同生成するための統合潜在拡散フレームワークである。
ADiTは物質と同様に現実的で有効な分子を生成し、分子や結晶特異モデルと同等の最先端の結果を得る。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:08:43 GMT)
Inducing a transition between thermal and many-body localized states and detecting many-body mobility edges through dissipation [11.2] 熱状態と多体局在状態を分離するエネルギーの多体移動エッジ(MBME)は、MBL物理学において批判的だが議論を呼んでいる概念である。
本研究では, 定常密度行列を計算し, 輸送挙動を解析することにより, 各種の結合散逸が多体系に与える影響について検討する。
以上の結果から, 放散は熱状態とMBL状態の遷移を誘導し, MBMEの存在を実験的に決定する新たなアプローチをもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:08:00 GMT)
Supervised Models Can Generalize Also When Trained on Random Labels [11.1] 教師なし学習は、教師なしモデルも、出力$y$の情報を使わずにトレーニングできるかどうかという疑問を提起する。
モデルをより滑らかに、すなわち $hatf=Sy$ の形に定式化し、$y$ とは独立により滑らかな行列 $S$ を構築する。
我々は、リニアおよびカーネルリッジのレグレッション、スムーズなスプライン、ニューラルネットワークの$y$のトレーニングされたバージョンが、標準の$y$ベースのバージョンと同じようなパフォーマンスを示し、最も重要なのは、ランダムな推測よりもはるかに優れていることである。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:49:56 GMT)
Human-like Semantic Navigation for Autonomous Driving using Knowledge Representation and Large Language Models [11.0] 大規模言語モデルは、Answer Set Programmingルールを生成するために使用される。
ASPはモノトニックな推論を提供し、自動運転車が進化するシナリオに適応できるようにする。
LLM駆動のASPルール生成は意味に基づく意思決定をサポートする。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:32:43 GMT)
TextureSAM: Towards a Texture Aware Foundation Model for Segmentation [11.0] Segment Anything Models (SAM)は、さまざまなデータセットにわたるオブジェクトセグメンテーションタスクにおいて、驚くべき成功を収めた。
SAMは主に大規模なセマンティックセグメンテーションデータセットに基づいて訓練されている。
この制限は、医用画像、物質分類、リモートセンシングなどの領域において重要である。
テクスチャを意識した新しい基礎モデルであるTextureSAMを導入し,テクスチャを優先するシナリオにおいて,より優れたセグメンテーションを実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:31:56 GMT)
Statistical inference on black-box generative models in the data kernel perspective space [10.9] ブラックボックス生成モデルの表現結果をモデルレベルの統計的推論タスクに拡張する。
モデルレベルの表現は複数の推論タスクに有効であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:47:00 GMT)
Only Large Weights (And Not Skip Connections) Can Prevent the Perils of Rank Collapse [10.9] Alman and Song NeurIPS 2023] と[Alman and Song NeurIPS 2024] によって始められた一連の研究は、モデル重量が小さければ二次時間が必要であることを示した。
本稿では,層崩壊と呼ばれる表現力の強い排除を避けるために,大きな重みが必要であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:26:28 GMT)
On Multilingual Encoder Language Model Compression for Low-Resource Languages [10.9] 本稿では,多言語エンコーダのみの言語モデルに対して,2段階の知識蒸留,構造化プルーニング,トランケーション,ボキャブラリトリミングを組み合わせる。
圧縮速度は最大92%で、4つの下流タスクで2-10%の限界性能低下しか達成できません。
特に、パフォーマンス劣化は教師モデルにおける言語固有のデータの量と相関し、より大きなデータセットはパフォーマンス損失を小さくする。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:35:39 GMT)
LCIRC: A Recurrent Compression Approach for Efficient Long-form Context and Query Dependent Modeling in LLMs [10.8] 本稿では,長文列をモデルの長さ制限を超えて効率的に処理できるLCIRC(Long-form Context Injection with Recurrent Compression)を提案する。
また、クエリ依存コンテキストモデリングを導入し、クエリ関連情報を選択的に圧縮し、モデルが最も関連するコンテンツを保持することを保証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:45:05 GMT)
SQL-o1: A Self-Reward Heuristic Dynamic Search Method for Text-to-SQL [10.8] SQL-o1は、モデル推論機能を強化するためにエージェントベースのアーキテクチャ上に構築された、自己回帰駆動の検索フレームワークである。
複雑なBirdデータセット上で+10.8の精度向上を実現し、GPT-4ベースのモデルさえ超えている。
オープンソースのLLMにまたがって、強力な数ショットの一般化と堅牢なクロスモデル転送能力を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:06:30 GMT)
FreshRetailNet-50K: A Stockout-Annotated Censored Demand Dataset for Latent Demand Recovery and Forecasting in Fresh Retail [10.8] 我々は、検閲された需要推定のための最初の大規模ベンチマークであるFreshRetailNet-50Kを紹介する。
主要18都市の898店舗から、在庫イベントに微妙に注釈付けされたSKU683店舗を含む5万件の店舗・商品販売データで構成されている。
予測精度は2.73%向上し、体系的な需要過小評価を7.37%からほぼゼロに近いバイアスに下げる。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:21:40 GMT)
Augmenting LLM Reasoning with Dynamic Notes Writing for Complex QA [10.7] ノートライティングは、各ステップで取得した文書から簡潔で関連するメモを生成する方法である。
これにより、大規模言語モデルの有効文脈長が間接的に増加する。
2つのモデルと4つの評価データセットにまたがる3つの反復RAG手法でその効果を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:45:05 GMT)
Score-based Pullback Riemannian Geometry: Extracting the Data Manifold Geometry using Anisotropic Flows [10.6] 本稿では,データ駆動型リーマン幾何学のフレームワークを提案する。
提案手法は,データサポートを通した高品質な測地線を生成する。
これは、データ多様体の完全な幾何学を抽出する最初のスケーラブルなフレームワークである。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:09:32 GMT)
Semiotic Reconstruction of Destination Expectation Constructs An LLM-Driven Computational Paradigm for Social Media Tourism Analytics [10.6] ソーシャルメディアの興隆は、旅行決定の要点としてユーザ生成コンテンツ(UGC)を確立する。
本研究では,調査インフォームドファインチューニングと組み合わせた非教師なし予測抽出という,デュアルメタルLLMフレームワークを提案する。
発見は、レジャー/社会的期待が、基礎的自然/感情的要因以上のエンゲージメントをもたらすことを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:52:01 GMT)
Enhancing Meme Token Market Transparency: A Multi-Dimensional Entity-Linked Address Analysis for Liquidity Risk Evaluation [10.6] 本稿では、エンティティリンクアドレス識別技術を用いて、ミームトークン市場における流動性リスクを評価する革新的なアプローチを提案する。
我々は,トークン分布,取引活動,流動性指標を網羅した,ミームトークンに適した総合的流動性リスク指標を開発する。
BabyBonk、NMT、BonkForkといったトークンの実証分析により、ミームトークン市場における見かけの流動性と実際の流動性の間に大きな相違が明らかになった。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:24:09 GMT)
Evaluating Automated Radiology Report Quality through Fine-Grained Phrasal Grounding of Clinical Findings [10.5] 本研究は, 多数の臨床所見の位置, 側方性, 重症度を把握した, きめ細かい発見パターンを抽出し, 報告品質評価法を開発した。
次に、テキストと視覚の計測値を組み合わせて、生成されたレポートの品質を評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:40:11 GMT)
Is Quantum Optimization Ready? An Effort Towards Neural Network Compression using Adiabatic Quantum Computing [10.4] ディープラーニングでは、新しい予測機能をサポートするために、ディープニューラルネットワーク(DNN)が巨大なサイズに達した。
本研究では,畳み込みニューラルネットワークのきめ細かなプルーニングにAQC(adiabatic quantum computing)を採用する可能性について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:40:23 GMT)
Ocular Authentication: Fusion of Gaze and Periocular Modalities [10.3] 本稿では,2つの眼中心型認証モダリティ(眼球運動)と周辺視像(眼球運動)を校正不要な認証システムで融合させる可能性について検討する。
9202人の被験者からなる大規模な社内データセットを用いて、消費者向けバーチャルリアリティー(VR)デバイスと同等の視線追跡(ET)信号品質を有するマルチモーダル認証システムを提案し、評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:32:08 GMT)
An Effective Training Framework for Light-Weight Automatic Speech Recognition Models [10.3] 一つの大モデルから複数の小さなモデルを生成することができる2段階の効率的な表現学習手法を提案する。
提案手法は,単語誤り率を最大12.54%向上させる3倍の学習速度を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:55:09 GMT)
FlowHFT: Imitation Learning via Flow Matching Policy for Optimal High-Frequency Trading under Diverse Market Conditions [10.3] 高周波トレーディング(英: high- frequency trading、HFT)は、市場状態を継続的に監視し、入札を行い、ミリ秒の速度で注文を求める投資戦略である。
従来のHFTアプローチは、過去のデータとモデルに適合し、将来の市場状態も同様のパターンに従うと仮定する。
本稿では,フローマッチングポリシーに基づく新しい模倣学習フレームワークであるFlowHFTを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:48:37 GMT)
Efficient Correlation Volume Sampling for Ultra-High-Resolution Optical Flow Estimation [10.2] RAFTで定義された正確な数学的演算子と一致する全対相関体積サンプリングのより効率的な実装を提案する。
提案手法は,低メモリ使用率を維持しながら,オンデマンドサンプリングを最大90%向上させ,最大95%のメモリ使用率でデフォルト実装と同等に動作させる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:30:38 GMT)
Integral Imprecise Probability Metrics [10.2] エピステムの不確実性(EU)は古典的確率によって提供されるものよりも豊かな表現を必要とする。
不正確確率(IP)理論はそのようなモデルを提供し、曖昧さと部分的信念を捉えている。
これにより、不正確な確率的機械学習(IPML)への関心が高まっている。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:56:57 GMT)
Single Domain Generalization for Few-Shot Counting via Universal Representation Matching [10.1] URMと呼ばれる,最初の単一領域一般化小ショットカウントモデルであるUniversal Representation Matchingを提案する。
我々の主な貢献は、大規模事前学習された視覚言語モデルから抽出された普遍的な視覚言語表現を相関構築プロセスに組み込むことで、ドメイン性能を損なうことなく、ドメインシフトに対する堅牢性を大幅に向上させることである。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:20:39 GMT)
Manipulating Elasto-Plastic Objects With 3D Occupancy and Learning-Based Predictive Control [10.1] 本研究は,運動の準静的仮定を用いた弾塑性物体操作のための新しい枠組みを提案する。
これらの課題を効果的に解決するために,我々は3D占有率を利用して表現する学習力学モデル,3D占有率で訓練された学習力学モデル,学習に基づく予測制御アルゴリズムを活用する。
提案フレームワークは, 弾塑性物体を所定の目標形状に整形し, シミュレーションと実世界の両方で様々な実験を行った。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:36:00 GMT)
MARché: Fast Masked Autoregressive Image Generation with Cache-Aware Attention [10.1] Masked Autoregressive (MAR) モデルは、画像生成のために双方向の注意を用いてトークンを一定の順序で予測することで、マスク付きおよび自己回帰生成の強度を統一する。
有効ではあるが、MARモデルは、すべての復号ステップにおいて、すべてのトークンに対する注意とフィードフォワード表現を再計算するので、計算上のオーバーヘッドに悩まされる。
本稿では、キャッシュ認識と選択KVリフレッシュという2つの重要なコンポーネントを通じて、この非効率に対処するためのトレーニング不要な生成フレームワーク MARch'e を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:26:56 GMT)
Repulsive Ensembles for Bayesian Inference in Physics-informed Neural Networks [10.1] 逆問題について考察し、不確実性推定を得るためにPINNの反発アンサンブルを用いる。
反発的なアンサンブルは、はるかに正確な不確実性推定を生成し、より高いサンプル多様性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:58:40 GMT)
Harnessing EHRs for Diffusion-based Anomaly Detection on Chest X-rays [10.1] 画像診断におけるunsupervised anomaly detection (UAD) は, 広範囲なラベル付きデータを必要とせず, 病変の同定に重要である。
Diff3Mは胸部X線と構造化電子健康記録を融合した多モード拡散型フレームワークである。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:02:47 GMT)
Beyond Face Swapping: A Diffusion-Based Digital Human Benchmark for Multimodal Deepfake Detection [10.1] ディープフェイク技術は、マルチモーダル制御信号を通じて一貫性のある非常にリアルなビデオを生成することができる。
拡散モデルに基づく最初の大規模マルチモーダルデジタルヒューマンデータセットであるDigiFakeAVを紹介する。
本稿では,時間的および時間的相互融合に基づくベースライン検出を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:46:37 GMT)
Fairness under Competition [10.0] 生態系の公平性の全体的なレベルに及ぼす公平な分類法の導入の影響を考察する。
競合する分類器が個別に公平であるとしても、生態系の結果は不公平である可能性があることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:43:15 GMT)
Power of quantum measurement in simulating unphysical operations [9.9] 量子測定を用いることで、一般エルミート保存写像のシミュレーションコストが低下することを示す。
我々の研究は、より効率的なサンプリング手法の道を切り開いており、より量子情報処理のシナリオに拡張できる可能性を持っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:06:19 GMT)
DuFFin: A Dual-Level Fingerprinting Framework for LLMs IP Protection [9.8] 大型言語モデル(LLM)は、正当な所有者にとって価値のある知的特性(IP)と見なされている。
我々は、ブラックボックス設定オーナシップ検証のための新しい$textbfDu$al-Level $textbfFin$gerprinting $textbfF$rameworkであるDuFFinを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:16:46 GMT)
SophiaVL-R1: Reinforcing MLLMs Reasoning with Thinking Reward [9.7] 本稿では,SophiaVL-R1を提案する。
そこで我々はまず,思考プロセス全体の品質を評価する思考報酬モデルを訓練する。
実験の結果、SophiaVL-R1は様々なベンチマークでMLLMを上回りました。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:53 GMT)
Sequential Monte Carlo for Policy Optimization in Continuous POMDPs [9.7] 連続的部分観測可能なマルコフ決定プロセス(POMDP)のための新しいポリシー最適化フレームワークを提案する。
本手法は,非マルコフ的ファインマン-カックモデルにおいて,政策学習を確率論的推論とみなす。
提案手法の有効性を,標準連続ポデムPベンチマークで実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:45:46 GMT)
Incremental Sequence Classification with Temporal Consistency [9.7] 逐次シーケンス分類の問題に対処し、シーケンス内の新しい要素が明らかにされるにつれて予測が更新される。
逐次予測を満足する時間的整合性条件を利用して、逐次シーケンス分類器を訓練するための新しい損失関数を開発する。
以上の結果から,本手法で訓練したモデルでは,数個のトークンを観測した結果,期待できる世代と期待できない世代を区別できる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:37:53 GMT)
Efficient Feature Fusion for UAV Object Detection [9.6] 特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:28:32 GMT)
MDVT: Enhancing Multimodal Recommendation with Model-Agnostic Multimodal-Driven Virtual Triplets [9.6] 本稿では,MDVTを提案する。MDVTは,マルチモーダル駆動の仮想三重項を構成するモデルに依存しない手法で,重要な監視信号を提供する。
複数の実世界のデータセットの実験では、MDVTがデータ空間問題を効果的に軽減し、レコメンデーション性能を向上させることが示されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:28:55 GMT)
From Local Patterns to Global Understanding: Cross-Stock Trend Integration for Enhanced Predictive Modeling [9.5] そこで本研究では,局所的なパターンをグローバルな理解に融合する手法を提案する。
私たちの戦略は、分散モデルトレーニング用に設計されたパラダイムであるフェデレートラーニング(FL)にインスパイアされています。
私たちの適応では、個々のストックデータに基づいてモデルをトレーニングし、それらを反復的にマージして、統一されたグローバルモデルを作成します。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:04:10 GMT)
Power-Law Decay Loss for Large Language Model Finetuning: Focusing on Information Sparsity to Enhance Generation Quality [9.5] 本稿では,テキスト生成のための微調整処理を最適化する新しい損失関数Power-Law Loss Decay (PDL)を提案する。
PDLは、標準のクロスエントロピー損失における各トークンの寄与を再重み付けする。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:59:26 GMT)
A Fourier Neural Operator Approach for Modelling Exciton-Polariton Condensate Systems [9.5] 近年,励起子に基づく次世代全光学デバイスが提案されている。
彼らの特性を迅速かつ正確な方法で予測することは依然として困難である。
本稿では,より効率的な機械学習に基づくフーリエ演算手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:51:34 GMT)
Hypergraph Tversky-Aware Domain Incremental Learning for Brain Tumor Segmentation with Missing Modalities [9.4] 臨床実践では、MRI 取得の逐次的な性質のため、MRI のモダリティが欠落している場合もある。
Replay-based Hypergraph Domain Incremental Learning (ReHyDIL) を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:49:25 GMT)
PhysicsArena: The First Multimodal Physics Reasoning Benchmark Exploring Variable, Process, and Solution Dimensions [9.4] PhysicsArenaは、MLLMのマルチモーダル物理推論能力の評価と向上のための総合的なプラットフォームを提供することを目指している。
MLLMは様々な推論タスクにおいて顕著な能力を示してきたが、複雑な物理推論への応用は未解明のままである。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:34:41 GMT)
Capacity-Aware Inference: Mitigating the Straggler Effect in Mixture of Experts [9.4] Mixture of Experts (MoE)は、スパースエキスパートアクティベーションを活用することで、大規模な言語モデルをスケールするための効果的なアーキテクチャである。
MoEは不均衡なトークン・ツー・エキスパートの割り当てによって推論の非効率に悩まされ、一部の専門家はオーバーロードされ、他の専門家は未使用のままである。
我々は,(1)MoEの最大遅延を制御するために過負荷のトークンを廃棄するtextbftextitCapacity-Aware Token Drop,(2)過負荷のトークンを未利用の専門家に再配置するtextbftextitCapacity-Aware Token Rerouteの2つの主要な手法を含むキャパシティ・アウェア推論を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:55:58 GMT)
A Few Large Shifts: Layer-Inconsistency Based Minimal Overhead Adversarial Example Detection [9.3] 我々は、ターゲットモデル自体の内部の階層的不整合を利用して、軽量なプラグイン検出フレームワークを導入する。
本手法は, 計算オーバーヘッドを無視し, 正確さを損なうことなく, 最先端検出性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:04:43 GMT)
Impact of Dataset Properties on Membership Inference Vulnerability of Deep Transfer Learning [9.3] メンバーシップ推論攻撃(MIA)は、機械学習モデルの実用的なプライバシをテストするために使用される。
固定された偽陽性率の攻撃的優位性として測定された非DPモデルの脆弱性は、単純な電力法則に従って減少することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:39:45 GMT)
Multi-Output Gaussian Processes for Graph-Structured Data [9.3] 本稿では,多出力ガウス過程(MOGP)に基づくグラフ構造化データの回帰手法を提案する。
提案した定式化はMOGPの定義に基づいている。
カーネル設計の柔軟性のため、表現力が高い。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:59:21 GMT)
Evaluating LLM-based Approaches to Legal Citation Prediction: Domain-specific Pre-training, Fine-tuning, or RAG? A Benchmark and an Australian Law Case Study [9.3] 大規模言語モデル (LLM) は法的タスクに強い可能性を示しているが、法的な引用予測の問題は未解明のままである。
AusLaw Citation Benchmarkは,オーストラリアで55万の法的事例と18,677のユニークな引用からなる実世界のデータセットである。
次に、さまざまなソリューションに対して、システマティックなベンチマークを実施します。
その結果, 一般および法定LLMは独立解として十分ではなく, ほぼゼロに近い性能を示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:52:00 GMT)
Harry Potter is Still Here! Probing Knowledge Leakage in Targeted Unlearned Large Language Models via Automated Adversarial Prompting [9.3] LURKは、敵の接尾辞によって学習されていないLLMの隠れた知識を探索するフレームワークである。
実験の結果,未学習と判断されたモデルでさえ,目標対向条件下での慣用的情報を漏洩させることができることがわかった。
LURKは、未学習アルゴリズムの堅牢性を評価するための、より厳格で診断的なツールを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:51:51 GMT)
CAIN: Hijacking LLM-Humans Conversations via a Two-Stage Malicious System Prompt Generation and Refining Framework [9.3] 大規模言語モデル(LLM)は多くの応用が進んでいるが、敵攻撃に弱いことも知られている。
システムプロンプトを操作することでAIと人間の会話をハイジャックする。
この攻撃は、悪意のあるアクターが有害なシステムをネット上に広めることを可能にするため、有害である。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:47:15 GMT)
PAEFF: Precise Alignment and Enhanced Gated Feature Fusion for Face-Voice Association [9.2] 顔と声の関連を学習する課題について検討する。
埋め込み空間を正確に整列し,拡張ゲート融合で融合する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:57:55 GMT)
A Survey on Design Methodologies for Accelerating Deep Learning on Heterogeneous Architectures [9.2] 本稿では、ディープラーニングアクセラレーターの影響力のあるツールと設計手法を批判的にレビューする。
ハードウェアとソフトウェアの共同設計、自動合成、ドメイン固有のコンパイラ、設計空間探索、モデリング、シミュレーションをカバーしている。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:05:00 GMT)
Multi-modal Collaborative Optimization and Expansion Network for Event-assisted Single-eye Expression Recognition [9.2] 我々は,MCO-Eネット(Multi-modal Collaborative Optimization and Expansion Network)を提案する。
MCO-Eネットは、MCO-Mamba(MCO-Mamba)とHeterogeneous Collaborative and Expansion Mixture-of-Experts(HCE-MoE)の2つの革新的な設計を導入した。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:28:28 GMT)
HyperMARL: Adaptive Hypernetworks for Multi-Agent RL [9.2] HyperMARLは、動的エージェント固有のパラメータにハイパーネットを使用するPSアプローチである。
政策勾配のばらつきを低減し、共有政治適応を促進し、エージェント間の干渉を軽減する。
これらの結果から,HyperMARLは適応的MARLの汎用的アプローチとして確立された。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:28:13 GMT)
Offline Guarded Safe Reinforcement Learning for Medical Treatment Optimization Strategies [9.1] アウト・オブ・ディストリビューション(OOD)問題は、医療シナリオにオフライン強化学習(RL)を適用する際に重大なリスクをもたらす。
モデルベースオフラインRLフレームワークであるtextitOffline Guarded Safe Reinforcement Learning (mathsfOGSRL$)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:22:03 GMT)
Bridging the Narrative Divide: Cross-Platform Discourse Networks in Fragmented Ecosystems [9.1] 政治談話は、様々なソーシャルネットワークで次第に断片化していった。
物語がどのように断片化された生態系を横切るかを理解するために、物語がどのように生態系を横切るかを予測する構造レンズを提供する。
これらの発見は、クロスプラットフォームガバナンス、コンテンツモデレーション、およびポリシー介入に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:53:52 GMT)
Pose-invariant face recognition via feature-space pose frontalization [9.1] ポーズ不変の顔認識は、現代のAIベースの顔認識システムにとって難しい問題である。
本稿では,特徴空間内で顔のフロンダリゼーションと認識を行う新しい手法を提案する。
FSPFMの可能性を最大化し、性能を高めるため、新しい訓練パラダイムが提案されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:01:01 GMT)
ErasableMask: A Robust and Erasable Privacy Protection Scheme against Black-box Face Recognition Models [9.1] ブラックボックスFRモデルに対する堅牢で消去可能なプライバシ保護スキームであるErasableMaskを提案する。
具体的には、EasableMaskは、ブラックボックス転送性を高める新しいメタ補助攻撃を導入している。
また、画像品質を劣化させることなく、保護された顔における意味的摂動の消去をサポートする摂動消去機構を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:37:36 GMT)
CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark [9.0] textttCASSは、クロスアーキテクチャGPUコードトランスパイレーションのための最初の大規模データセットとモデルスイートである。
データセットは、ホストとデバイス間で70万の検証済みコードペアで構成されている。
我々は、ドメイン固有言語モデルのtextttCASS ファミリーを訓練し、95%のソース翻訳精度と37.5%のアセンブリ翻訳精度を達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:48:53 GMT)
Harnessing On-Device Large Language Model: Empirical Results and Implications for AI PC [8.8] エッジデバイス上の大規模言語モデル(LLM)は、大きなプライバシー上のメリットを提供する。
これらのオンデバイスLSMは、モデル容量の削減と必要な圧縮技術のために本質的に性能上の制限に直面している。
デバイス上でのLCMを評価するために,モデル能力,開発効率,システム資源を包含する体系的方法論を導入する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:26:36 GMT)
The Epochal Sawtooth Effect: Unveiling Training Loss Oscillations in Adam and Other Optimizers [8.8] テキストEpochal Sawtooth Effect (ESE) と呼ばれる繰り返し学習損失パターンを特定し解析する。
このパターンは、各エポックの始めに急激な損失が減少し、その後徐々に増加し、ソートゥース状の損失曲線が生じる。
Epochal Sawtooth 効果に繋がるメカニズムの詳細な説明を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:05:31 GMT)
Liver Cirrhosis Stage Estimation from MRI with Deep Learning [8.6] マルチシーケンスMRIを用いた肝硬変自動ステージ推定のためのエンドツーエンドディープラーニングフレームワークを提案する。
本手法は,肝硬変進行段階の微妙な組織変化を捉えるために,多段階的特徴学習とシーケンス特異的注意機構を統合した。
我々の最良のモデルは、T1Wで72.8%、T2Wで63.8%の精度を達成し、従来のラジオミクスベースのアプローチよりも大幅に優れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:46:31 GMT)
EntGPT: Entity Linking with Generative Large Language Models [8.6] ELタスクの強化に先進的なプロンプトエンジニアリングを採用したEntGPTを導入する。
この3段階のハードプロンプト法(EntGPT-P)は,バニラプロンプトよりもマイクロF_1スコアを最大36%向上させる。
命令チューニング手法EntGPT-I(EntGPT-I)は,教師付きELタスクの平均2.1%のマイクロF_1スコアを改善する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:30:47 GMT)
Cog-TiPRO: Iterative Prompt Refinement with LLMs to Detect Cognitive Decline via Longitudinal Voice Assistant Commands [8.5] 認知低下の早期発見は、神経変性疾患の進行を遅らせる介入を可能にするために重要である。
本研究は音声コマンドの音声パターンの経時的解析により認知低下を検出する非侵襲的ツールとして音声アシスタントシステム(VAS)について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:40:12 GMT)
Erased or Dormant? Rethinking Concept Erasure Through Reversibility [8.5] 我々は、統一概念編集と消去安定拡散という2つの代表的な概念消去手法を評価する。
消去された概念は、最小限の適応の後、しばしばかなりの視覚的忠実度で再帰することを示す。
本研究は,既存の概念消去アプローチにおける限界を明らかにするものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:26:46 GMT)
SC4ANM: Identifying Optimal Section Combinations for Automated Novelty Prediction in Academic Papers [8.4] 論文の新規性を評価するためのセクションの最適組み合わせについて検討する。
学術論文から異なるセクションの組み合わせを入力として使用し、新奇性スコアを予測するために言語モデルを駆動する。
その結果, 論文の新規性を評価する上で, 導入, 結果, 議論が最適であることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:34:59 GMT)
SurvUnc: A Meta-Model Based Uncertainty Quantification Framework for Survival Analysis [8.4] 生存分析は、多くの現実世界の応用、特に医療やリスクアセスメントのような高度な領域において基礎となる。
多くの生存モデルが進歩しているにもかかわらず、予測の不確実性の定量化は未熟で困難なままである。
生存モデルのためのポストホック不確実性定量化のための新しいメタモデルベースのフレームワークであるSurvUncを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:11:21 GMT)
Adversarial Deep Metric Learning for Cross-Modal Audio-Text Alignment in Open-Vocabulary Keyword Spotting [8.4] テキスト入力に基づくオープン語彙キーワードスポッティング(KWS)では、音響とテキストの埋め込みは通常、音素または発話レベルで比較される。
ディープ・メトリック・ラーニング(DML)を用いて音響およびテキストエンコーダを最適化し,共有埋め込み空間におけるマルチモーダル埋め込みの直接比較を可能にする。
異質なモダリティ表現における領域ギャップを低減するためのモダリティ適応学習(MAL)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:49:46 GMT)
How high is `high'? Rethinking the roles of dimensionality in topological data analysis and manifold learning [8.4] 我々は、一般化されたハンソン・ライトの不等式を示し、それをデータポイントクラウドの幾何学に関する新しい統計的知見を確立するために利用する。
ガードナーらによる格子細胞活動における等尺トロイダル構造の画期的な神経科学的な発見を再考する。
我々の発見は、この構造が実際に物理空間にあるという証拠を初めて明らかにし、格子状細胞活動が現実世界の幾何学的に忠実な表現を伝達していることを意味する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:34:15 GMT)
Constant Bit-size Transformers Are Turing Complete [8.4] 任意の長さの入力で動くチューリングマシンは、定ビットサイズの変圧器でシミュレートできることを示す。
提案手法は,チューリング完全計算モデルであるPostマシンのシミュレーションに依存する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:45:38 GMT)
GMatch: Geometry-Constrained Feature Matching for RGB-D Object Pose Estimation [8.3] GMatchは、堅牢な6DoFオブジェクトポーズ推定のための学習不要の機能マーカである。
GMatchはガイド付きインクリメンタル検索を行い、マッチングプロセス全体を通してSE(3)不変な幾何一貫性を強制する。
GMatch-SIFTは汎用的なポーズ推定パイプラインを形成し、多様なオブジェクトやシーンに対して強い解釈性と一般化を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:39:52 GMT)
The Polar Express: Optimal Matrix Sign Methods and Their Application to the Muon Algorithm [8.3] 極性分解は、何十年もの間、数値解析においてよく研究されてきた問題である。
ディープラーニング、特にMuon最適化フレームワークにおいて重要なサブルーチンとして登場した。
極分解を計算するためのGPUフレンドリなアルゴリズムであるPolar Expressを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:23:14 GMT)
Two-way Evidence self-Alignment based Dual-Gated Reasoning Enhancement [8.2] 大規模言語モデル(LLM)は知識集約型多段階推論タスクにおいて困難に直面する。
本稿では,証拠の因果論理の理解を深めるために,双方向のエビデンス自己アライメント(TW-ESA)モジュールを提案する。
本稿では,厳密な推論においてLLMの有用な知識を徐々に融合させるために,デュアルゲート推論拡張(DGR)モジュールを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:45:29 GMT)
Prompt-Guided Internal States for Hallucination Detection of Large Language Models [8.2] 大規模言語モデル(LLM)の幻覚検出のための新しい枠組み、即時誘導型内部状態を提案する。
この構造を、異なるドメインのテキスト間でより健全で一貫性のあるものにします。
実験結果から,本フレームワークは既存の幻覚検出手法のクロスドメイン一般化を著しく促進することが明らかとなった。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:26:10 GMT)
Do DeepFake Attribution Models Generalize? [8.2] 近年のDeepFake生成は,オープンソースツールの普及とともに,合成メディア作成の障壁を大幅に減らした。
本研究では、最先端の5つのバックボーンモデルを活用し、6つのDeepFakeデータセットにわたる広範な実験を行う。
その結果,バイナリモデルでは一般化能力が向上する一方で,大きなモデル,コントラスト手法,データ品質が向上し,帰属モデルの性能が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:49:05 GMT)
Don't Half-listen: Capturing Key-part Information in Continual Instruction Tuning [8.1] キーパート情報ゲイン(KPIG)に基づく新しい連続的命令チューニング手法を提案する。
本手法は,マスク部分の情報ゲインを計算し,データを動的に再生し,トレーニング対象を洗練させる。
実験により,本手法は観察タスクと保留タスクの両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:42:22 GMT)
EDM: Efficient Deep Feature Matching [8.1] 本稿では,効率的なDeep機能マッチングネットワーク,EDMを提案する。
まず、より少ない次元のより深いCNNを採用し、マルチレベルの特徴を抽出する。
次に,高レベルの深い特徴に対して特徴変換を行う相関注入モジュールを提案する。
改良段階において、軽量な双方向軸ベース回帰ヘッドは、潜在特徴からサブピクセルレベルの対応を直接予測するように設計されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:51:50 GMT)
Diverse, not Short: A Length-Controlled Self-Learning Framework for Improving Response Diversity of Language Models [8.0] 我々は、共通の多様性指標、さらには好み最適化に使用される報酬モデル、より短い出力に向けて体系的にバイアスモデルを示す。
長さパリティを維持しながら応答の多様性を向上する,長さ制御型自己学習フレームワークであるDiverse(Diverse-NS)を紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:29:47 GMT)
Is Circuit Depth Accurate for Comparing Quantum Circuit Runtimes? [8.0] ゲート・アウェア・ディープは、回路ランタイムを推定するために独自のゲートウェイトを使用する。
ゲート認識深度は全デバイスで最高精度を達成し、6デバイス中5デバイスで完全精度を100%達成した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:09:43 GMT)
Prot2Chat: Protein LLM with Early-Fusion of Text, Sequence and Structure [7.9] タンパク質配列と構造情報を統一的にエンコードするために,タンパク質MPNNを改変した。
我々は,大規模言語モデル(LLM)を用いて質問をベクトルにエンコードし,タンパク質情報を仮想トークンに圧縮するタンパク質テキストアダプタを開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:43:36 GMT)
On the Efficient Extraction of Entangled Resources [7.9] 量子インターネット(Quantum Internet)では、マルチパーティント・エンタングルメント(multipartite entanglement)は、人工トポロジーと呼ばれるリッチで動的なオーバーレイトポロジーを物理的に実現し、通信目的に利用することができる。
元のマルチパートの絡み合った状態から$n$-qubitsのGHZ状態とEPRペアを抽出する能力は、エンドツーエンドおよびオンデマンドの量子通信のためのリソースプリミティブを構成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:54:08 GMT)
Stochastic Forward-Forward Learning through Representational Dimensionality Compression [7.8] フォワードフォワード(FF)アルゴリズムは、ニューラルネットワークのトレーニングのためのバックプロパゲーション(BP)のボトムアップ代替を提供する。
本稿では, 2次統計構造を組み込むために, 変動するニューラルレスポンスの有効次元性(ED)を用いて, 次元圧縮と呼ばれる新しい良性関数を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:19:29 GMT)
Synthesizing Efficient and Permissive Programmatic Runtime Shields for Neural Policies [7.8] ニューラルポリシーのための軽量でパーミッシブなプログラム型ランタイムシールドを合成する新しいフレームワークを提案する。
Aegisは、スケッチベースのプログラム合成問題としてランタイムシールドの探索を定式化することでこれを達成している。
現在の最先端と比較すると、イージスのシールドは時間オーバーヘッドの2.2$times$とメモリ使用量の3.9$times$である。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:55:46 GMT)
Extremely Simple Multimodal Outlier Synthesis for Out-of-Distribution Detection and Segmentation [7.8] アウト・オブ・ディストリビューション(OOD)の検出とセグメンテーションは、自律運転やロボット支援手術のような安全クリティカルなアプリケーションに機械学習モデルをデプロイするために重要である。
本稿では,理論的支援を伴うマルチモーダル・アウトリア合成の極めて単純かつ高速な手法であるFeature Mixingを提案する。
我々は,OODセグメンテーションのための新しいマルチモーダルデータセットであるCARLA-OODを紹介した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:54:30 GMT)
RAP: Runtime-Adaptive Pruning for LLM Inference [7.8] 我々は、強化学習(RL)によって駆動される弾力的な刈り取りフレームワークであるRAPを提案する。
RAPは、実際の実行におけるモデルパラメータとKV-cacheの進化率を追跡する。
RAPは最先端のベースラインよりも優れており、モデル重量とKVcacheを同時に検討するのは初めてである。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:12:42 GMT)
Learning Beyond Limits: Multitask Learning and Synthetic Data for Low-Resource Canonical Morpheme Segmentation [7.8] 低リソースのトレーニング信号を増強する変圧器を用いた形態素セグメンテーションシステムを提案する。
本フレームワークは, 形態的セグメントとグルースを図形入力から共同で予測する。
我々は,大規模言語モデル(LLM)によって生成された合成学習データを,文脈内学習を用いて統合する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:40:09 GMT)
The Benefit of Being Bayesian in Online Conformal Prediction [7.7] ブラックボックス機械学習モデルを用いた信頼度セットのオンライン構築について検討する。
対象の信頼レベルを量子レベルに変換することにより、逐次明らかにされたデータシーケンスの量子レベルを予測することで、問題を小さくすることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:56:39 GMT)
ReCopilot: Reverse Engineering Copilot in Binary Analysis [7.6] 汎用大規模言語モデル(LLM)は、ソースコードのプログラミング解析においてよく機能する。
本稿では、バイナリ解析タスク用に設計された専門家LLMであるReCopilotを紹介する。
ReCopilotは、綿密に構築されたデータセットを通じてバイナリコードの知識を統合する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:21:39 GMT)
Safe PDE Boundary Control with Neural Operators [7.5] 境界出力の軌道方向の制約満足度を確実にするために、神経境界制御障壁関数(BCBF)を導入する。
双曲的, 放物的, ナビエ・ストークスPDE動的環境下での実験は, 提案手法のプラグ・アンド・プレイの有効性を検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:13:48 GMT)
Ranked Entropy Minimization for Continual Test-Time Adaptation [7.5] テストタイム適応は、テスト時間中に学習することで、オンラインで現実的な環境に適応することを目的としている。
エントロピーの最小化は、その効率性と適応性のためにテスト時間適応の主要な戦略として現れている。
本稿では,エントロピー最小化法の安定性問題を軽減するために,ランク付けエントロピー最小化を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:29:38 GMT)
PandaGuard: Systematic Evaluation of LLM Safety against Jailbreaking Attacks [7.3] 大きな言語モデル(LLM)は目覚ましい能力を達成したが、ジェイルブレイクとして知られる敵のプロンプトに弱いままである。
LLMの安全性研究への取り組みが増えているにもかかわらず、既存の評価はしばしば断片化され、単独の攻撃や防御技術に焦点が当てられている。
PandaGuardはLLMジェイルブレイクの安全性を攻撃者、ディフェンダー、および審査員で構成されるマルチエージェントシステムとしてモデル化する、統一的でモジュール化されたフレームワークである。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:49:11 GMT)
MiLQ: Benchmarking IR Models for Bilingual Web Search with Mixed Language Queries [7.2] 混合言語クエリの最初の公開ベンチマークであるMiLQ,Mixed-Language Queryテストセットを紹介する。
実験の結果、多言語IRモデルはMiLQで適度に動作し、ネイティブ、イングリッシュ、ミックスランゲージで不整合に動作していることがわかった。
問合せにおける意図的な英語の混合は、英語文書を検索するバイリンガルにとって効果的な戦略であることを証明している。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:03:15 GMT)
Reconsidering Fairness Through Unawareness from the Perspective of Model Multiplicity [7.2] 我々は,FtUが必ずしも精度を低下させることなく,アルゴリズムによる識別を低減できることを理論的かつ実証的に示す。
現実のアプリケーションでは、FtUが効率を損なうことなく、より公平なポリシーの展開にどのように貢献できるかを説明します。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:11:33 GMT)
SPaRC: A Spatial Pathfinding Reasoning Challenge [7.1] SPaRCは空間的および記号的推論を評価するために1,000個の2次元グリッドパスフィンディングパズルのデータセットである。
人間がほぼ完全な精度(ハードパズルでは98.0%、94.5%)を達成するのに対して、o4-miniのような最良の推論モデルは15.8%、ハードパズルでは1.1%)。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:53:50 GMT)
LengthLogD: A Length-Stratified Ensemble Framework for Enhanced Peptide Lipophilicity Prediction via Multi-Scale Feature Integration [7.1] LengthLogDは、分子長層化によって特殊なモデルを確立する予測フレームワークである。
長鎖ペプチドに特異的に開発された適応重み付け機構はモデル一般化性を著しく向上させる。
本研究は、ペプチド医薬品開発のための正確なログD予測ツールを提供し、特に長鎖ペプチド鉛化合物の最適化におけるユニークな価値を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:05:53 GMT)
Dialogue in Resonance: An Interactive Music Piece for Piano and Real-Time Automatic Transcription System [7.1] Dialogue in Resonance>は、人間のピアニストとコンピュータ制御ピアノのためのインタラクティブな楽曲である。
コンピュータは、人間の演奏者の入力をリアルタイムで解釈して応答し、音楽対話を作成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:50:13 GMT)
Mitigating Fine-tuning Risks in LLMs via Safety-Aware Probing Optimization [7.1] 微調整された大きな言語モデル(LLM)は、必然的に安全性を損なう可能性がある。
安全リスクの軽減を目的とした安全意識探索(SAP)フレームワークを導入する。
実験の結果,SAPは従来の微調整モデルよりも有害性を効果的に低減できることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:52:10 GMT)
A Generic Framework for Conformal Fairness [7.1] 我々は、共形予測器を用いた公正の概念であるtextitConformal Fairness を定式化する。
我々は、異なるセンシティブなグループ間のカバレッジのギャップを制御するための理論的に十分に確立されたアルゴリズムと関連するフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:41:12 GMT)
Accuracy vs. Accuracy: Computational Tradeoffs Between Classification Rates and Utility [7.0] トレーニングデータがよりリッチなラベルを含むような環境で、フェアネスの基礎と実用性と効率性との相互作用を再考する。
本研究では,標準的な教師あり学習よりもエビデンスに基づく公平性の概念をより高めるアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:26:30 GMT)
Reward-Aware Proto-Representations in Reinforcement Learning [6.9] 近年では、後継表現(SR)が強化学習(RL)において注目を集めている。
本稿では,この問題の報酬力学を考慮に入れた類似表現について論じる。
以上の結果から,SRと比較すると,DRは質的に異なる,報酬に敏感な動作を示し,いくつかの設定において定量的に優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:33:00 GMT)
Behavioral Safety Assessment towards Large-scale Deployment of Autonomous Vehicles [6.8] 従来の機能的安全アプローチは、交通環境に対するAVの広範な相互作用と行動の影響に十分対応していない。
本稿では,交通環境におけるAV応答と相互作用の評価に焦点をあてた包括的アプローチである行動安全へのパラダイムシフトを提案する。
シミュレーション環境とミシガン大学のMcity Testing Facilityの物理的テストトラックの両方でテストされたオープンソースのLevel 4 AVであるUniverseは、Autoware.Universeを使って提案したフレームワークを検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:28:59 GMT)
Mitigating Hallucinations in Vision-Language Models through Image-Guided Head Suppression [6.8] 大型視覚言語モデル (LVLM) はしばしば幻覚に悩まされ、視覚的文脈と一致しないテキストを生成する。
推論時間介入による幻覚の低減を目的とした既存の手法は、遅延を著しく増加させる。
本稿では,タスクに依存しない注意誘導型頭部抑制戦略であるSPINについて述べる。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:00:57 GMT)
CodeMind: Evaluating Large Language Models for Code Reasoning [6.8] 大規模言語モデル(LLM)は、プログラミングタスクの自動化に広く使われている。
本稿では,LLMのコード推論能力を評価するためのフレームワークであるCodeMindを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:34:22 GMT)
Reading Between the Prompts: How Stereotypes Shape LLM's Implicit Personalization [6.8] LLM(Generative Large Language Models)は、会話における微妙な手がかりからユーザの人口統計情報を推測する。
この結果から,LLMのユーザアイデンティティの表現方法に対する透明性の向上とコントロールの必要性が浮き彫りになった。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:48:51 GMT)
Large Language Models for Predictive Analysis: How Far Are They? [6.7] 大きな言語モデル(LLM)は、ニュアンスで知識集約的な会話を可能にする強力なツールとして登場した。
我々は,8つの分野からなる44の実世界のデータセットから1130の高度な予測分析クエリを統合する textbfPredictiQ ベンチマークを導入する。
12の有名なLCMが評価され、予測分析における実践的利用に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:02:15 GMT)
BAGELS: Benchmarking the Automated Generation and Extraction of Limitations from Scholarly Text [6.7] 科学的研究において、制限とは研究における欠点、制約、弱点を指す。
著者は、しばしばa) 論文のテキストにそれらを下書きし、b) 編集要件を満たすためにヘッジ戦略を使用する。
この過度に報告された行動は、出版物の爆発と共に、そのような制限を自動で抽出したり、生成したりする必要が迫られている。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:04:02 GMT)
Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion [6.7] そこで我々は,より生き生きとした表情と話し声を生成するために,新しい2段階学習フレームワークPlaymateを提案する。
最初の段階では、より正確な属性の切り離しを容易にするために、細かな設計のモーションデカップリングモジュールとともに、非結合な3次元表現を導入する。
第2段階では、感情制御情報を潜在空間にエンコードする感情制御モジュールを導入し、感情のきめ細かい制御を可能にし、所望の感情で会話ビデオを生成する能力を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:57:46 GMT)
ALTo: Adaptive-Length Tokenizer for Autoregressive Mask Generation [6.6] 自己回帰マスク生成のための適応長トークンであるALToを提案する。
新規なトークン長予測器を、長さ正規化項と微分可能なトークンチャンキング戦略とともに設計する。
ALToLLMは適応トークンコストで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:26:51 GMT)
A Survey on the Application of Large Language Models in Scenario-Based Testing of Automated Driving Systems [6.6] 論文は5つのオープンな課題と潜在的研究の方向性を概説することで締めくくっている。
LLM(Large Language Models)の出現は、シナリオベースのテストを強化する新たな機会をもたらした。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:25:44 GMT)
L2RDaS: Synthesizing 4D Radar Tensors for Model Generalization via Dataset Expansion [6.6] 本稿では,LiDARデータから空間情報を伝達する4次元レーダテンソルを自動走行データセットから合成するフレームワークであるLiDAR-to-4Dレーダデータ合成(L2RDaS)を提案する。
L2RDaSは改良されたU-Netアーキテクチャを統合し、空間情報を効果的にキャプチャし、オブジェクト情報サプリメント(OBIS)モジュールを使用して反射率を高める。
L2RDaSは合成レーダテンソルを用いて実データセットを拡張してモデル一般化を改善し、平均4.25%のAP_BEV$と2.87%のAP_3Dを達成する
論文参考訳(メタデータ) (Thu, 22 May 2025 17:12:06 GMT)
ReinWiFi: Application-Layer QoS Optimization of WiFi Networks with Reinforcement Learning [6.6] 分散チャネルアクセス(EDCA)メカニズムは、特定の品質・オブ・サービス(QoS)目標、ネットワークトポロジ、干渉レベルに適応できない。
本稿では,新しい強化学習に基づくスケジューリングフレームワークを提案し,実装した。
提案手法はEDCA機構よりもはるかに優れた性能を達成できることが実証された。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:07:03 GMT)
SweEval: Do LLMs Really Swear? A Safety Benchmark for Testing Limits for Enterprise Use [6.6] SweEvalは、トーン(正か負か)とコンテキスト(形式か非公式か)の異なる実世界のシナリオをシミュレートするベンチマークである。
プロンプトは、タスクを完了している間に、特定の誓約語を含むようモデルに明示的に指示する。
このベンチマークは、LLMがそのような不適切な指示に従うか否かを評価し、倫理的枠組み、文化的ニュアンス、言語理解能力との整合性を評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:56:58 GMT)
Machine Learning the 6d Supergravity Landscape [6.5] 我々は6次元のストリングランドスケープと湿地の研究に教師付きおよび教師なし機械学習アルゴリズムを適用した。
我々の研究は、機械学習アルゴリズムがランドスケープと湿地の高度に複雑な特徴を効率的に学習できることを示しています。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:16:55 GMT)
SAMba-UNet: Synergizing SAM2 and Mamba in UNet with Heterogeneous Aggregation for Cardiac MRI Segmentation [6.5] 本研究ではSAMba-UNetという,革新的なデュアルエンコーダアーキテクチャを提案する。
このフレームワークは、ビジョンファウンデーションモデルSAM2、状態空間モデルMamba、そして古典的UNetを統合することで、クロスモーダルな機能協調学習を実現する。
ACDC心MRIデータセットを用いた実験により,提案モデルがDice係数0.9103,HD95境界誤差1.0859mmを達成した。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:57:03 GMT)
PRS-Med: Position Reasoning Segmentation with Vision-Language Model in Medical Imaging [6.4] PRS-Medは、視覚言語モデルとセグメンテーション機能を統合し、正確なセグメンテーションマスクとそれに対応する空間推論出力の両方を生成するフレームワークである。
MMRSデータセットは、医療画像における位置推論データの欠如に対処するために、多様な空間的な質問応答ペアを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:00:20 GMT)
Measuring Compliance of Consent Revocation on the Web [6.4] ウェブ上での同意の取り消しについて、事前の研究は行われていない。
ウェブサイトの19.87%は、ユーザーがさまざまなインターフェースで同意を取り消すのを難しくしている。
20.5%のウェブサイトは受け入れよりも多くの努力を必要としており、2.48%は同意の取り消しを提供していない。
57.5%のウェブサイトは、ユーザーのデータの継続的な違法な処理を可能にする同意取り消し後にクッキーを削除しない。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:15:43 GMT)
FlowMixer: A Constrained Neural Architecture for Interpretable Spatiotemporal Forecasting [6.4] FlowerMixは、制約行列操作を利用して構造化パターンをモデル化するニューラルネットワークである。
さまざまなドメインにわたる実験は、FlowerMixの堅牢な長期予測能力を実証している。
その結果,ニューラルネットワークにおける予測性能と数学的解釈可能性の同時向上が示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:28:47 GMT)
The Computational Complexity of Counting Linear Regions in ReLU Neural Networks [6.4] 線型領域が実際に何であるかについては、多くの異なる定義が存在する。
種々の定義に対して,そのような領域の数を数えることの計算複雑性を解析する。
アルゴリズム面では、いくつかの共通定義に対して少なくとも空間において線形領域を数えることが可能であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:25:12 GMT)
Polaromechanics: cavity-magnon polaritons strongly coupled to phonons [6.3] 関数型ハイブリッド量子系は、その成分間の強い結合を必要とする。
9.4times103$の高偏光力学的協調性は、偏光子崩壊率を著しく減少させることによって達成される。
この結果は、光子、マグノン、フォノンのコヒーレントな量子制御への道を開くものであり、マグノンをベースとした関数型ハイブリッド量子システムを構築するための重要なステップである。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:09:54 GMT)
DePLOI: Applying NL2SQL to Synthesize and Audit Database Access Control [6.3] 本稿では,Intent-Based Access Control for Database (IBAC-DB) と呼ばれる新しいアクセス制御モデルを提案する。
IBAC-DBでは、アクセス制御ポリシーは、多数のデータベースオブジェクトにスケールする抽象化を使用して表現され、実装に関してトレース可能である。
本稿では,IBAC-DB抽象化からアクセス制御の実装を正確に合成し,監査するために,アクセス制御固有のタスク分解を利用するシステムであるDePLOIを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:38:57 GMT)
Code Readability in the Age of Large Language Models: An Industrial Case Study from Atlassian [6.2] 我々は,大規模言語モデル(LLM)の時代におけるコードの可読性に関する視点を探るため,調査を実施している。
LLMベースのソフトウェア開発エージェントフレームワークであるHULAを比較し、実世界のシナリオで生成されたコードと人書きコードを比較した。
全体として、可読性はソフトウェア開発における重要な側面である。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:29:44 GMT)
Gaze Into the Abyss -- Planning to Seek Entropy When Reward is Scarce [6.2] 本稿では,短時間の潜伏予測を用いて,高エントロピー状態の予測と探索を積極的に行う新しい手法を提案する。
提案する階層型プランナは,いつ計画を立てるか,地平線の長さを計画し,報酬とエントロピーの重み付けを動的に行う。
提案手法は,Dreamerのコンバージェンスにおいて,Dreamerのコンバージェンスよりも50%高速で,Dreamerが必要とする環境ステップの60%に,想像力で訓練されたポリシーが収束する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:28:50 GMT)
Shadows in the Attention: Contextual Perturbation and Representation Drift in the Dynamics of Hallucination in LLMs [6.2] 本研究は,幻覚の発生と文脈注入による内的状態のドリフトを関連づけた最初の系統的研究である。
TruthfulQAを用いて、1問16ラウンドの"titration"トラックを2つ構築する。
我々は,コサイン,エントロピー,JS,スピアマンの隠れ状態と注意マップのドリフトを通じて,三重対角検出器と隠蔽ダイナミクスを用いて,過剰幻覚率を追跡する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:50:58 GMT)
Constrained Non-negative Matrix Factorization for Guided Topic Modeling of Minority Topics [6.1] 特別に制約されたNMFによるトピックモデリングソリューションを提案する。
私たちは、データ駆動の少数派トピックと多数派トピックを学びます。
我々は、YouTubeのvlogコメントに関するケーススタディを行い、メンタルヘルスコンテンツに関する視聴者の議論を分析した。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:25:55 GMT)
NQKV: A KV Cache Quantization Scheme Based on Normal Distribution Characteristics [6.0] 大規模言語モデル(LLM)は、幅広いタスクにまたがる卓越した習熟度を示してきた。
LLMは、スループットを高めるためにより大きなバッチサイズを必要とすることや、タスク要求を満たすために長いコンテキスト長を必要とすることも多い。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:23:19 GMT)
Memorization or Reasoning? Exploring the Idiom Understanding of LLMs [6.0] MIDASは6つの言語におけるイディオムの大規模なデータセットであり、それぞれが対応する意味と組み合わせられている。
以上の結果から,LLMは暗記だけでなく,文脈的手がかりと推論を統合したハイブリッドアプローチも採用していることが示唆された。
このことは、LLMにおける慣用的理解が、内部知識検索と推論に基づく推論の相互作用から生まれることを意味する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:31:25 GMT)
Performance Guaranteed Poisoning Attacks in Federated Learning: A Sliding Mode Approach [6.0] 本稿では,フェデレートラーニング・スライディング・アタック(FedSA)と呼ばれる新たな攻撃手法を提案する。
FedSAは、微妙に制御された方法で毒の程度を正確に導入することを目指している。
悪意のあるクライアントからの更新を操作して,グローバルモデルを妥協状態へと駆動することが可能になる。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:54:17 GMT)
Semantic Aware Linear Transfer by Recycling Pre-trained Language Models for Cross-lingual Transfer [6.0] SALTは、ターゲット言語からの埋め込みをリサイクルする新しい言語間移動技術である。
実験の結果,SALTは他のトランスファー手法よりも優れており,言語適応時の収束の高速化による損失の低減が期待できることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:54:30 GMT)
BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation [6.0] 本稿では,効率的なテキストセグメンテーションのためのグラフモデルに基づく教師なし学習手法BP-Segを提案する。
本手法は, 局所的コヒーレンスを考慮し, 隣接文がより関連性が高いという直感を捉えるだけでなく, 意味論的に類似しない文章を効果的にグループ化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:46:23 GMT)
Emergent Specialization: Rare Token Neurons in Language Models [5.9] 大きな言語モデルは、特殊なドメインにおいて重要であるにもかかわらず、希少なトークンの表現と生成に苦労する。
本研究では,レアトークンニューロンと呼ばれる,言語モデルの希少トークン予測に極めて強い影響を与えるニューロン構造を同定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:03:57 GMT)
Magnonic entanglement in a chiral cavity-magnon coupling system [5.9] マグノンの絡み合いとスクイーズの発生は、量子情報処理において重要な役割を果たす。
本研究では,トーラス型キャビティとイットリウム鉄ガーネット球2面からなるカイラルキャビティ-マグノン系に基づくスキームを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:47:56 GMT)
Exploration Implies Data Augmentation: Reachability and Generalisation in Contextual MDPs [5.9] より多くの状態におけるトレーニングは、実際に一般化を改善することができるが、学習された値関数の精度を下げるコストがかかる可能性があることを示す。
そこで本研究では,各エピソードの冒頭に探索フェーズを実装したExplore-Goを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:24:39 GMT)
PyTupli: A Scalable Infrastructure for Collaborative Offline Reinforcement Learning Projects [5.7] オフライン強化学習(RL)は,事前収集データから制御ポリシを学習するための強力なパラダイムとして注目を集めている。
PyTupliはPythonベースのツールで、ベンチマーク環境の作成、ストレージ、普及を効率化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:59:20 GMT)
Anonymity Unveiled: A Practical Framework for Auditing Data Use in Deep Learning Models [5.7] 深層学習(DL)の台頭により、学習データに対する需要が急増し、DLモデルの作成者がインターネットを旅して教材を訓練するインセンティブがもたらされた。
ユーザは、自分のデータが自分の同意なしにDLモデルのトレーニングに使用されるかどうかを、限定的にコントロールすることが多い。
この研究は、一般ユーザーがデータの不正使用を確実に検出できる実用的なデータ監査ツールである MembershipTracker を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:01:03 GMT)
Emotion-based Recommender System [5.7] 我々は、リコメンデータシステムと対話する際のユーザーの感情を捉えることができる新しい理論とメトリクスを作成します。
また、ユーザの感情と顧客ライフサイクルの変化を視覚化するための効果的で効率的な可視化技術も提供します。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:54:58 GMT)
The EU AI Act, Stakeholder Needs, and Explainable AI: Aligning Regulatory Compliance in a Clinical Decision Support System [5.7] XAIは、AIシステムの透明性と人間の監視を強化することを目指している。
AI法は、AIシステムのプロバイダとデプロイ者の義務に焦点を当てている。
我々は,XAI技術が利害関係者のニーズとAI法の要件とのギャップを埋めることができることを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:39:04 GMT)
A Unified Approach to Routing and Cascading for LLMs [5.7] 様々なエージェントシステムに埋め込まれた大規模言語モデル(LLM)は、コストパフォーマンスのトレードオフを改善するためのモデル選択戦略の可能性を高めている。
既存の戦略には、クエリ毎にひとつのモデルが選択されるルーティング、あるいは、満足のいく回答が見つかるまで順次、より大きなモデルを実行するカスケードがある。
我々は、カスケードのための新しい最適戦略を導き、既存のルーティング戦略の最適性を証明する。
本稿では、ルーティングとカスケードを統合した統合フレームワークであるカスケードルーティングを理論的に最適な戦略として提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:34:14 GMT)
How Ensembles of Distilled Policies Improve Generalisation in Reinforcement Learning [5.6] 強化学習の目標は、エージェントを一定の訓練環境上で訓練し、類似の、しかし目に見えない、テスト環境に一般化できるようにすることである。
以前の研究は、訓練後の政策蒸留が、テスト環境でのオリジナルよりも優れたポリシーを創出できることを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:15:52 GMT)
SPAR: Self-supervised Placement-Aware Representation Learning for Multi-Node IoT Systems [5.6] 本研究は,空間分布型(マルチビューおよびマルチモーダル)センサを用いた自己教師型配置認識型表現学習の基盤となるものを開発する。
本フレームワークは,測度と幾何学的オブザーバ配置と構造特性の依存関係を明示的に学習する。
実世界の3つのデータセット(車両監視、人間活動認識、地震の局所化)の実験は、我々の手法の優れた一般化性と堅牢性を実証している。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:26:23 GMT)
SAFE-SQL: Self-Augmented In-Context Learning with Fine-grained Example Selection for Text-to-SQL [5.6] 骨格メイク選択のような従来のアプローチは、大きな言語モデル(LLM)をガイドするために類似したトレーニング例を取得することで、関連性を示している。
テキスト・トゥ・コンテクスト・フィルタリング(SAFE--)のためのきめ細かい例選択による学習における自己拡張を提案する。
SAFEの生成したサンプルは、以前の強力なパフォーマンスと、より高い実行精度を達成するために、テキストからテキストへのほとんどショットのフレームワークを上回っている。
特に、我々のアプローチは、従来のメソッドがしばしば失敗する、余分な困難で目に見えないシナリオにおいて、さらなるパフォーマンス向上を提供します。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:09:35 GMT)
Do we need rebalancing strategies? A theoretical and empirical study around SMOTE and its variants [5.6] 我々はSMOTE密度の非漸近上界を複数導出した。
我々は、SMOTEが元のマイノリティのサンプルをコピーする傾向があることを証明した。
我々はSMOTEを理論的な知見に基づいて適用し,2つの新しい変種を導入した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:34:10 GMT)
MAGE: A Multi-task Architecture for Gaze Estimation with an Efficient Calibration Module [5.6] MAGEは効率の良いキャリブレーションモジュールを備えたマルチタスク・アーキテクチャーである。
我々の基本モデルは、顔画像の方向特徴と位置特徴の両方を符号化する。
提案手法は,公開MPIIFaceGaze,EYEDIAP,および構築したIMRGazeデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:36:58 GMT)
CDST: Color Disentangled Style Transfer for Universal Style Reference Customization [5.5] そこで我々は,新しい2ストリームスタイルのトランスファートレーニングパラダイムであるカラーディスタングル型スタイルトランスファー(CDST)を紹介した。
同じモデルで、CDSTは推論中にチューニング不要な方法でユニバーサルスタイル転送機能をアンロックする。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:44:48 GMT)
Dysfluent WFST: A Framework for Zero-Shot Speech Dysfluency Transcription and Detection [5.5] Dysfluent-WFSTはゼロショットデコーダで、音素を同時に書き起こし、逆流を検出する。
模擬および実音声データにおける音素誤り率とディフルエンシ検出の両面での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:02:50 GMT)
FPQVAR: Floating Point Quantization for Visual Autoregressive Model with FPGA Hardware Co-design [5.5] 視覚自己回帰(VAR)モデリングは、次世代の予測から次世代の予測へ、画像生成のパラダイムシフトを象徴している。
メモリと計算コストを削減するため、VARのための効率的な後学習浮動小数点(FP)量子化フレームワークであるFPQvarを提案する。
AMD-Xilinx VCK190 FPGA上の我々のアクセラレータは、整数ベースのアクセラレータよりも3.1倍高い1.1イメージ/sのスループットを達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:47:51 GMT)
Graph-Supported Dynamic Algorithm Configuration for Multi-Objective Combinatorial Optimization [5.5] 本稿では,多目的進化アルゴリズムを構成する新しいグラフニューラルネットワーク(GNN)のDRLを提案する。
動的アルゴリズムの構成をマルコフ決定過程としてモデル化し、グラフによる対象空間における解の収束を表現する。
多様なMOCO課題に対する実験により,本手法は従来手法およびDRL方式のアルゴリズム構成法よりも有効性と適応性に優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:53:54 GMT)
Transfer Faster, Price Smarter: Minimax Dynamic Pricing under Cross-Market Preference Shift [5.5] 我々は、ターゲット市場がK補助市場を活用できる場合のコンテキスト動的価格について検討する。
本稿では,このようなモデルシフト転送を確実に処理するアルゴリズムとして,CM-TDP(Cross-Market Transfer Dynamic Pricing)を提案する。
転送学習、ロバストアグリゲーション、収益最適化をブリッジすることで、CM-TDPはより速く、よりスマートな転送を行う価格システムへと向かっています。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:18:17 GMT)
Temporal and Spatial Feature Fusion Framework for Dynamic Micro Expression Recognition [5.4] 過渡的かつ高度に局所化されたマイクロ表現は、その正確な認識に重大な課題をもたらす。
マイクロ圧縮認識の精度は、プロでも50%以下である。
DMER(TSFmicro)のための新しい時間空間特徴融合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:26:19 GMT)
Aspect of bipartite coherence in quantum discord to semi-device-independent nonlocality and its implication for quantum information processing [5.4] 半デバイスに依存しない非局所性や量子不協和性を示すためには,グローバルコヒーレンスが必要であることを示す。
量子通信タスクの量子リソースを2ビット分離可能な状態を用いて$textitremote state prepared$と同定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:32:16 GMT)
Towards Coordinate- and Dimension-Agnostic Machine Learning for Partial Differential Equations [5.4] 我々は、外部計算の形式主義で表されるスカラー場システムの進化を予測するために、機械学習アプローチを採用する。
1つの空間で学習した場力学は、異なる次元、座標系、境界条件、曲率を持つ他の空間での正確な予測に利用できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:37:55 GMT)
PIIvot: A Lightweight NLP Anonymization Framework for Question-Anchored Tutoring Dialogues [5.3] PIIvotは、PII検出問題を単純化するために、データコンテキストの知識を活用するPII匿名化フレームワークである。
また,QATD-2kは,高品質な教育対話データに対する需要に対応するため,オープンソースで最大の学習データセットである。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:22:28 GMT)
Learning Formal Specifications from Membership and Preference Queries [5.2] 本稿では,会員ラベルとペアワイズ選好の組み合わせを要求できる新しいフレームワークを提案する。
ペアワイズ選好とメンバシップラベルの組み合わせにより、アクティブな仕様学習に対するより柔軟なアプローチが可能になる。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:03:18 GMT)
IRONIC: Coherence-Aware Reasoning Chains for Multi-Modal Sarcasm Detection [5.2] IRONICはマルチモーダル・コヒーレンス・リレーション(Multi-modal Coherence Relations)を利用したインコンテキスト学習フレームワークで,参照,類似,実用的な画像テキスト・リンクの解析を行う。
実験の結果,IRONICはゼロショットマルチモーダルサーカスム検出において最先端の性能を実現することがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:49:01 GMT)
When Safety Detectors Aren't Enough: A Stealthy and Effective Jailbreak Attack on LLMs via Steganographic Techniques [5.2] 大規模言語モデル(LLM)に脱獄攻撃が深刻な脅威
本稿では,新しいステルスの観点からのジェイルブレイク手法の体系的調査について述べる。
我々はステガノグラフィーを用いて、良質でセマンティックに一貫性のあるテキスト内に有害なクエリを隠蔽するステゴアタック(StegoAttack)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:07:34 GMT)
Zero-Shot Hyperspectral Pansharpening Using Hysteresis-Based Tuning for Spectral Quality Control [5.2] ハイパースペクトルパンシャルペン法は、ハイパースペクトルデータ融合によって引き起こされるユニークな課題をしばしば見落としている。
単一の軽量ニューラルネットワークが使用され、各バンドにフライに適応するウェイトが使用される。
提案手法は,外部データ,フレキシブル,低複雑さを事前トレーニングすることなく,完全に教師なしである。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:24:24 GMT)
APE-Bench I: Towards File-level Automated Proof Engineering of Formal Math Libraries [5.2] APE-Bench Iは、Mathlib4の実際のコミット履歴から構築された最初の現実的なベンチマークである。
Eleansticはスケーラブルな並列検証インフラストラクチャで、Mathlibの複数バージョンにわたる検証に最適化されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:53:14 GMT)
Circuit structure-preserving error mitigation for High-Fidelity Quantum Simulations [5.2] 本稿では、パラメータ化量子回路のための回路構造保存誤差軽減フレームワークを提案する。
我々のアプローチの重要な利点は、ゲートエラーを効果的にキャラクタリゼーションし緩和しながら、元の回路アーキテクチャを維持する能力である。
我々の戦略はゲート誘起誤差に対処する実用的な解決策を提供し、現在の量子ハードウェア上で実現可能な量子シミュレーションの範囲を大幅に広げる。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:00:03 GMT)
InspectionV3: Enhancing Tobacco Quality Assessment with Deep Convolutional Neural Networks for Automated Workshop Management [5.2] InspectionV3は、自動排煙処理のための統合されたソリューションである。
カスタマイズされた深層畳み込みニューラルネットワークアーキテクチャを使用する。
メトリクスは97%の精度、95%の精度とリコール、96%のF1スコアとAUC、95%の特異性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:11:50 GMT)
Can reasoning models comprehend mathematical problems in Chinese ancient texts? An empirical study based on data from Suanjing Shishu [5.1] 愚事_MATH(ぐじ_MATH)は、スージー詩集に基づく古典的テキスト評価のベンチマークである。
古典中国語の独特な言語的制約の下で、主流推論モデルの数学的問題解決能力を評価する。
その結果、推論モデルはこれらの問題を部分的に理解し解決することができるが、その全体的な性能は現代の数学的なタスクのベンチマークよりも劣っていることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:24:52 GMT)
On the reliability of feature attribution methods for speech classification [5.1] 入力タイプや集約,摂動時間といった要因が,標準特徴属性法の信頼性に与える影響について検討した。
音声領域に適用した場合,特徴属性に対する標準的アプローチは一般に信頼性が低いことが判明した。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:59:25 GMT)
Unpicking Data at the Seams: Understanding Disentanglement in VAEs [5.1] データの切り離し、あるいは統計的に独立した要因を特定することは、機械学習の多くに関係している。
絡み合いは、変分オートエンコーダ(VAE)、生成的逆数ネットワーク(Generative Adversarial Networks)、拡散モデルなど、いくつかの生成パラダイムで生じる。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:59:51 GMT)
Comparative analysis of subword tokenization approaches for Indian languages [5.0] トークン化(Tokenization)とは、テキストを小さな部分(トークン)に分割することで、機械が処理しやすいようにする行為である。
サブワードトークン化は、単語を小さなサブワード単位に分割することで、このプロセスを強化する。
これは、接頭辞、接尾辞、その他の形態変化など、インドの言語(IL)における単語の複雑な構造を捉えるのに有用である。
本稿では,SentencePiece,Byte Pair,WordPiece Tokenizationなどのサブワードトークン技術がILに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:24:37 GMT)
Accurate crystal field Hamiltonians of single-ion magnets at mean-field cost [5.0] ランダムに回転した平均場状態の密度汎関数計算により、有効結晶場ハミルトニアンを導出する。
我々は実験的な低エネルギースペクトルと磁気特性を以前の試みよりも精度良く再現することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:06:25 GMT)
FB-RAG: Improving RAG with Forward and Backward Lookup [5.0] 本稿では,FB-RAGと呼ばれる新しいフレームワークを提案する。
FB-RAGはベンチマークテストにおいてRAGとLong Contextのベースラインを一貫して上回っていることを示す。
また、FB-RAGはレイテンシを低減しながら性能を向上できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:31:52 GMT)
A Temporal Difference Method for Stochastic Continuous Dynamics [4.9] ベルマンの最適性の原理はハミルトン・ヤコビ・ベルマン方程式(HJB)の形を取る。
HJB方程式を対象とするモデルフリーアプローチを提案し,対応する時間差分法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:45:06 GMT)
OCSU: Optical Chemical Structure Understanding for Molecule-centric Scientific Discovery [4.9] 光化学構造理解(OCSU)タスクは、化学構造図を機械と化学の双方で読みやすい文字列に変換することを目的としている。
局所無明な原子に対する注意的特徴強調によるOCSR性能向上のためのDoubleCheckを提案する。
また,最初の大規模OCSUデータセットであるVis-Chebi20を構築した。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:23:17 GMT)
Partner Modelling Emerges in Recurrent Agents (But Only When It Matters) [4.8] モデルフリーのRNNエージェントを訓練し、多様なパートナーの集団と協力する。
エージェントがタスク割り当てを制御することで、パートナー行動に影響を与えると、構造化されたパートナーモデリングが出現する。
我々の結果は、パートナーモデリングはモデルのないエージェントで自然に起こる可能性があるが、適切な社会的圧力を課す環境条件下でのみであることを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:24:12 GMT)
Cold Start Problem: An Experimental Study of Knowledge Tracing Models with New Students [4.8] KnowledgeTracing(KT)は、知的学習システム(ITS)とのインタラクションに基づいて、学生の知識状態を予測する。
主要な課題はコールドスタートの問題であり、最小のインタラクションデータを持つ新入生の知識を正確に予測する。
深部知識追跡(DKT)、動的キー値記憶ネットワーク(DKVMN)、自己認識的知識追跡(SAKT)の3モデルにわたるコールドスタート効果について検討する。
結果は、全てのモデルが最初はコールドスタート条件下で苦戦するが、より多くの相互作用によって徐々に改善していることを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:09:07 GMT)
VoxRAG: A Step Toward Transcription-Free RAG Systems in Spoken Question Answering [4.7] 本稿では,モジュール型音声音声合成合成システムであるVoxRAGを紹介する。
VoxRAGは書き起こしをバイパスし、音声クエリから直接意味のある音声セグメントを検索する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:42:40 GMT)
Benchmarking Expressive Japanese Character Text-to-Speech with VITS and Style-BERT-VITS2 [4.7] 本稿では2つのオープンソーステキスト音声モデル--VITS と Style-BERT-VITS2 JP Extra-on in- domain, character-driven Japanese speech をベンチマークする。
自然性(平均的意見と平均的意見スコア)、知性(単語誤り率)、話者整合性(話者整合性)のモデルを評価する。
SBV2JEは、高い計算要求にもかかわらず、言語学習や文字対話生成のようなアプリケーションに有効であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:18:55 GMT)
An Analysis of Concept Bottleneck Models: Measuring, Understanding, and Mitigating the Impact of Noisy Annotations [4.7] 概念ボトルネックモデル(CBM)は、予測を人間の解釈可能な概念に分解することで、解釈可能性を保証する。
しかし、この透明性を実現するためのCBMのトレーニングに使用されるアノテーションは、しばしばうるさくなります。
適度な腐敗でさえ、予測性能、解釈可能性、介入効果を同時に損なう。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:06:55 GMT)
LiDAR MOT-DETR: A LiDAR-based Two-Stage Transformer for 3D Multiple Object Tracking [4.7] ライダーをベースとした2段式DETRインバータ,スムーズかつトラッカーを提案する。
よりスムーズなステージは、移動中の時間窓を越えて、市販の検出器からライダー物体の検出を洗練させる。
トラッカーステージはDETRベースのアテンションブロックを使用して、トラックされたオブジェクトと、ポイントクラウドをコンテキストとして洗練された検出とを関連付けることで、トラックを時間にわたって維持する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:17:00 GMT)
Quantum Multi-view Kernel Learning with Local Information [4.7] カーネルメソッドは、機械学習におけるデータの背後にある非線形パターンをキャプチャする強力なツールとして機能する。
我々はL-QMVKLと呼ばれるローカル情報を用いた量子多視点カーネル学習を提案する。
我々の研究は、量子カーネル法の理論的および実践的理解を推し進めることを約束している。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:11:49 GMT)
Detailed Evaluation of Modern Machine Learning Approaches for Optic Plastics Sorting [4.6] EPAによると、廃棄物のわずか25%がリサイクルされ、アメリカの自治体の60%が再資源化を行っている。
リサイクル率は8%に過ぎず、さらに16%が焼却され、残りの76%が埋立地となる。
プラスチックリサイクル率の低さは、汚染、経済的インセンティブの低さ、技術的困難に起因する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:48:30 GMT)
iLOCO: Distribution-Free Inference for Feature Interactions [4.6] 我々は、ペアワイズな特徴相互作用の重要性を測定するための新しいモデルに依存しないメトリクスを開発した。
また,iLOCO距離と信頼区間を計算するためのアンサンブル学習手法を提案する。
我々は,iLOCO測定値と信頼区間を,合成データと実データの両方で検証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:55:47 GMT)
GOTPR: General Outdoor Text-based Place Recognition Using Scene Graph Retrieval with OpenStreetMap [4.5] GOTPRはGPS信号が利用できない屋外環境向けに設計されたロバストな位置認識手法である。
大規模で保存が難しいポイントクラウドマップを使用する既存のアプローチとは異なり、GOTPRはテキスト記述や場所認識用のマップから生成されたシーングラフを活用する。
都市規模のテストでは、数秒で処理を完了し、現実世界のロボティクスアプリケーションに非常に実用的になった。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:48:18 GMT)
Style Transfer with Diffusion Models for Synthetic-to-Real Domain Adaptation [4.5] 拡散モデルを用いた意味論的一貫したスタイル伝達のための2つの新しい手法を提案する。
GTA5をソースとして,Cityscapes/ACDCをターゲットドメインとして実験したところ,FIDスコアが低く,コンテンツ保存性が向上した高品質な画像が得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:11:10 GMT)
CaseReportBench: An LLM Benchmark Dataset for Dense Information Extraction in Clinical Case Reports [4.5] IEMに着目したケースレポートの高密度情報抽出のためのエキスパートアノテートデータセットであるCaseReportBenchを紹介する。
我々は、カテゴリ固有のプロンプトやサブヘッダーによるデータ統合のような新しいアプローチを導入し、様々なモデルとプロンプト戦略を評価する。
臨床評価の結果,LSMは症例報告から臨床的に関連性のある詳細を抽出し,稀な疾患の診断と管理を支援することが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:21:32 GMT)
Veracity Bias and Beyond: Uncovering LLMs' Hidden Beliefs in Problem-Solving Reasoning [4.5] 人口統計学的ステレオタイプに対する人間の価値整合モデルとの整合性にもかかわらず、様々な社会的文脈下でバイアスを示すことが示されている。
帰属バイアス(Attribution Bias)は、特定の人口集団に対する正しい解を不均等に属性するものであり、評価バイアス(Access Bias)とは、同一の解に対するモデルの評価が、認識された人口集団の権威に基づいて異なるものである。
以上の結果から, 人口統計学的偏見は, 表面レベルのステレオタイプや社会的文脈的挑発を超えて, 教育・評価環境におけるLCMの展開に対する懸念が高まることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:13:48 GMT)
QLLM: Do We Really Need a Mixing Network for Credit Assignment in Multi-Agent Reinforcement Learning? [4.4] マルチエージェント強化学習(MARL)におけるクレジットの割り当ては依然として根本的な課題である。
大規模言語モデル(LLM)を用いた信用代入関数の自動構築を容易にする新しいアルゴリズムである textbfQLLM を提案する。
いくつかの標準MARLベンチマークで実施された大規模な実験は、提案手法が既存の最先端のベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:56:32 GMT)
Energy Matching: Unifying Flow Matching and Energy-Based Models for Generative Modeling [4.4] エネルギーベースモデル(EBM)は、フローやスコアの一致によるノイズとデータの分布をマッピングする。
EBMの柔軟性でフローベースのアプローチを実現するフレームワークであるEnergy Matchingを提案する。
提案手法は,CIFAR-10 と ImageNet 生成における既存の EBM を大幅に上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:22:06 GMT)
How do Scaling Laws Apply to Knowledge Graph Engineering Tasks? The Impact of Model Size on Large Language Model Performance [4.4] 知識グラフ工学(KGE)タスクに特有のモデルサイズスケーリング法則について検討する。
いくつかのケースでは、プラトー効果や天井効果、すなわち、タスク性能はモデルと次の大きなモデルの間に大きくは変化しなかった。
同じ家系のモデルに関して、時にはより大型のモデルが同じ家系のより小型のモデルよりも悪い結果となった。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:21:40 GMT)
Minimizing the energy depletion in wireless rechargeable sensor networks using bi-level metaheuristic charging schemes [4.4] 本稿では,WRSNのエネルギー損失を最小限に抑えるため,二段階最適化方式を踏襲した新しい部分充電方式を提案する。
充電経路の最適化と充電時間の最適化をそれぞれ上層と下層とみなす2つの近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:09:21 GMT)
Tuning Topological States by Dissipation [4.4] 本研究では, バルク境界対応が, 徐々にシステムを分解し, どのように崩壊するかを考察する。
熱力学限界において、利得と損失領域壁の強さを調整することにより、トポロジカルシステムの大域的な位相図が周期的および開境界条件下でのハイブリッドとなることが分かる。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:00:47 GMT)
Where You Go is Who You Are: Behavioral Theory-Guided LLMs for Inverse Reinforcement Learning [4.3] LLM誘導逆強化学習(IRL)と認知連鎖推論(CCR)を用いたソシオドモグラフィー推論のためのSILICを提案する。
CCRは、潜在行動意図を捉え、心理的構成を通して推論することで、観察されたモビリティパターンから社会デミノグラフィー特性を推測する。
提案手法は最先端のベースラインを著しく上回り,交通計画等における行動基盤型アプリケーションを支援するため,大規模軌跡データを充実させるという大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:56:03 GMT)
HCRMP: A LLM-Hinted Contextual Reinforcement Learning Framework for Autonomous Driving [4.3] 強化学習(RL)を備えた大規模言語モデル(LLM)は、複雑なシナリオにおける自律運転(AD)のパフォーマンスを向上させることができる。
現状のLCMは、本質的な運転関連タスクで評価された場合、約57.95%の非幻覚率を示す。
本稿では,LLMとRLの相対的な独立性を維持することが幻覚問題の解決に不可欠であると主張している。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:48:12 GMT)
Foundation Models for Geospatial Reasoning: Assessing Capabilities of Large Language Models in Understanding Geometries and Topological Spatial Relations [4.3] 本研究では、空間的推論において、よく知られたテクスト(WKT)表現とその空間的関係が保持される範囲について検討する。
我々のワークフローは、比較のための空間的推論タスクを完成させるために、3つの異なるアプローチを採用している。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:21:31 GMT)
Temporal Object Captioning for Street Scene Videos from LiDAR Tracks [4.3] 本稿では,交通参加者の時間動態に着目したLiDARによる自動キャプション手法を提案する。
提案手法はルールベースシステムを用いて,オブジェクトトラックから車線位置や相対運動などの重要な情報を抽出し,続いてテンプレートベースのキャプション生成を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:28:50 GMT)
Software Architecture Meets LLMs: A Systematic Literature Review [4.3] 本稿では,ソフトウェアアーキテクチャにおける大規模言語モデルの利用について,系統的な文献レビューを行う。
LLMは、様々なソフトウェアアーキテクチャタスクにますます適用されているが、アーキテクチャ設計からソースコードを生成するなど、いくつかの領域は未探索のままである。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:00:29 GMT)
Layer-wise Investigation of Large-Scale Self-Supervised Music Representation Models [4.2] 先進的な音楽表現モデル MusicFM と新たに登場したSSLモデル MuQ を解析する。
i)複数のダウンストリームタスクにわたるSSLモデルの利点を検証すること、(ii)異なるタスクに対するレイヤワイズ情報の専門化を検討すること、(iii)特定のレイヤを選択する際のパフォーマンスの違いを比較すること、の3つの主な側面に注目します。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:58:24 GMT)
QFNN-FFD: Quantum Federated Neural Network for Financial Fraud Detection [4.2] 本研究ではQFNN-FFD(Quantum Federated Neural Network for Financial Fraud Detection)を提案する。
QFNN-FFDは、金融詐欺検出のために、量子機械学習(QML)とFederated Learning(FL)との量子コンピューティングを統合するフレームワークである。
量子技術の計算能力とFLが提供する堅牢なデータプライバシ保護を利用することで、QFNN-FFDは不正取引を識別するためのセキュアで効率的な方法として現れる。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:43:50 GMT)
Improving Generalization in Heterogeneous Federated Continual Learning via Spatio-Temporal Gradient Matching with Prototypical Coreset [4.2] 本稿では、クライアントが無関係あるいは矛盾するデータやタスクを持つ、より実践的で挑戦的なFederated Continual Learning設定について検討する。
既存のFCLアプローチでは、しばしば生成的リプレイを使用して、以前のタスクの擬似データセットを作成する。
これらの課題に対処するため,ネットワークフリーなプロトタイプ (STAMP) を用いたspatio-Temporal grAdient Matching という新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:26:51 GMT)
EnSToM: Enhancing Dialogue Systems with Entropy-Scaled Steering Vectors for Topic Maintenance [4.1] 小さい大きな言語モデル(sLLM)は、タスク指向の対話システムにおいてトピックの一貫性を維持するのにしばしば苦労する。
トピックメンテナンスのためのエントロピースケールステアリングベクトル(EnSToM)と呼ばれる新しいアプローチを提案する。
EnSToMは入力の不確実性に基づいて操舵強度を動的に調整するので、モデルがオフトピー的イントラクタを効果的に扱うことができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:12:27 GMT)
Verifying Differentially Private Median Estimation [4.1] そこで本研究では,zk-SNARKをベースとした最初の検証可能な個人中央値推定手法を提案する。
提案方式では,指数関数機構と中央値推定のためのユーティリティ関数を演算回路に結合する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:31:22 GMT)
Secure and Private Federated Learning: Achieving Adversarial Resilience through Robust Aggregation [4.0] フェデレートラーニング(FL)は、生データを共有することなく、分散データソース間で協調的な機械学習を可能にする。
FLは、ビザンツのクライアントと呼ばれる悪意のある参加者からの敵の脅威に弱いままである。
本稿では,FLシステムのレジリエンスとプライバシの保証を両立させる新しいアグリゲーション戦略であるAverage-rKrum(ArKrum)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:01:09 GMT)
ICYM2I: The illusion of multimodal informativeness under missingness [4.0] ICYM2I(ICYM2I)を導入する。
本研究は,合成,半合成,実世界の医療データセットに欠落した情報獲得を推定するために提案した調整の重要性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:34:38 GMT)
Adaptive Plan-Execute Framework for Smart Contract Security Auditing [4.0] 大規模言語モデル(LLM)は、コード分析と監査において大きな可能性を示しています。
LLMは幻覚と限定的な文脈認識推論に苦しむ。
スマートコントラクトセキュリティ分析を強化する新しいPlan-ExecuteフレームワークであるSmartAuditFlowを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:10:20 GMT)
Machine Learning Solutions Integrated in an IoT Healthcare Platform for Heart Failure Risk Stratification [4.0] 慢性心不全(HF)の管理は、現代医療において重要な課題である。
本稿では,HFリスクのある患者を識別するための機械学習(ML)技術に基づく予測モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:49:33 GMT)
Provably Correct Automata Embeddings for Optimal Automata-Conditioned Reinforcement Learning [3.9] この研究は、オートマチック条件付きRL問題の理論的枠組みを提供し、おそらくほぼ正しい学習可能であることを示す。
次に、最適マルチタスクポリシー学習を保証し、正当に正当な自動埋め込みを学習する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:29:30 GMT)
A Shape-Aware Total Body Photography System for In-focus Surface Coverage Optimization [3.9] 全身写真(TBP)は、皮膚がんのリスクが高い患者に有用なスクリーニングツールになりつつある。
本稿では,全身画像を自動的にキャプチャする新しい形状認識型TPPシステムを提案する。
提案システムでは,平均分解能は0.068mm/ピクセル,0.0566mm/ピクセルであり,表面積は約85%と95%である。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:57:05 GMT)
Does Localization Inform Unlearning? A Rigorous Examination of Local Parameter Attribution for Knowledge Unlearning in Language Models [3.8] 大規模言語モデルは意図しない内容を保持することが多く、知識の学習への関心が高まる。
最近のアプローチでは、対象とする知識を取り除くために、特定の領域へのパラメータ更新を制限する局所的アンラーニングが強調されている。
本研究は,パラメータの局所性が本質的に効果的な知識除去の指標であるという,局所的未学習の中核的仮定に挑戦する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:41:53 GMT)
VAE-QWGAN: Addressing Mode Collapse in Quantum GANs via Autoencoding Priors [3.8] VAE-QWGANは、古典的変分オートエンコーダ(VAE)とハイブリッド量子ワッサーシュタインGAN(QWGAN)の強度を組み合わせる
VAE-QWGANは既存のQGANアプローチよりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:46:32 GMT)
What is a Sketch-and-Precondition Derivation for Low-Rank Approximation? Inverse Power Error or Inverse Power Estimation? [3.8] 低ランク行列近似におけるランダム化アルゴリズムのためのスケッチ・アンド・プレコンディション・フレームワークを開発した。
提案手法は,スケッチサイズとともに少なくとも線形に向上する収束率を含む理論的保証を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:51:54 GMT)
Erasure-cooling, control, and hyper-entanglement of motion in optical tweezers [3.7] 光ツイーザにおける単一原子の運動をコヒーレントに制御することで、量子情報科学の新しい応用が可能になる。
私たちはまず、運動の励起を消去に変換する種に依存しない冷却機構を使って、運動の基底状態に原子を準備します。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:50:49 GMT)
Looking Beyond Language Priors: Enhancing Visual Comprehension and Attention in Multimodal Models [3.6] MLLM(Multimodal Large Language Models)は、視覚的な入力を完全に活用できないことが多い。
われわれのアプローチはまず、MLLMが画像領域の視覚的理解をどのように構築するかについての洞察を与え、その能力を増幅する技術を導入する。
本稿では,視覚的に依存するトークンの予測能力の定量化と,視覚的に困難なタスクの10 pt の高速化により,結果モデルのより優れたマルチモーダル理解を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:31:00 GMT)
ToDi: Token-wise Distillation via Fine-Grained Divergence Control [3.6] Token-wise Distillation (ToDi) は、Sigmoid-based weighting function を用いてトークンごとのフォワードKLとリバースKLを適応的に結合する新しい方法である。
ToDiは、均一またはより粒度の低い戦略を用いて、最近の蒸留ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:51:16 GMT)
Multimodal AI-based visualization of strategic leaders' emotional dynamics: a deep behavioral analysis of Trump's trade war discourse [3.6] 本研究では,戦略的意思決定における支配的な政治指導者の感情リズムと行動機構について検討した。
トランプ政権の中国に対する関税の125%の引き上げを事例として、マルチモーダル認知行動モデリングの枠組みを採用した。
結果は、トランプ氏の決定は合理的な推論によってではなく、支配的コヒーレンスリズムから生まれることを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:19:57 GMT)
Detection of Aerial Spoofing Attacks to LEO Satellite Systems via Deep Learning [3.6] 本稿では、受信したPHY信号にオートエンコーダによる異常検出を適用し、LEO衛星コンステレーションシステムのスプーフィング検出手法を提案する。
我々は、ドローンに搭載された実際のスプーファーの展開を含む広範囲な計測キャンペーンを通じて、我々のソリューションを検証する。
提案手法は,異なる高度で発射されるスプーフ攻撃を確実に検出できる一方で,最先端の競合するアプローチは単純に失敗することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:38 GMT)
Personalizing Student-Agent Interactions Using Log-Contextualized Retrieval Augmented Generation (RAG) [3.5] 大規模言語モデル(LLM)は動的教育的相互作用を促進するが、潜在的幻覚は信頼、信頼、教育的価値を損なう可能性がある。
本稿では,協調談話の文脈化に環境ログを組み込むことでRAG検索を向上させる対数文脈化RAG(LC-RAG)を提案する。
その結果,LC-RAGは談話のみのベースラインでの検索を改善し,コラボレーティブ・ピアエージェントであるCopaが関連性のあるパーソナライズされたガイダンスを提供することができた。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:31:40 GMT)
Robust ML Auditing using Prior Knowledge [3.5] 監査操作は、プラットフォームが故意に回答を変更して、他のユーザーに答えを変更することなく監査をパスした場合に発生する。
本稿では,プラットフォームが解決した課題に対する監査者の事前知識を考慮し,操作保護監査に対する新たなアプローチを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:08:20 GMT)
CASTILLO: Characterizing Response Length Distributions of Large Language Models [3.5] CASTILLO(CASTILLO)は、広く使われている13の大規模言語モデルにまたがる応答長分布を特徴付けるデータセットである。
本分析では,応答長のモデル間およびモデル内変動と,応答のサブセットのみにおけるモデル特異的な振る舞いと部分的テキスト変性の発生を明らかにした。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:35:33 GMT)
Graph Attention Network for Optimal User Association in Wireless Networks [3.5] セルラーネットワークにおけるユーザアソシエーション(UA)の抽象化に基づく最適化を提案し,解析し,省エネ性を向上させる。
レガシーアプローチとの比較は、提案されたアプローチの優位性を確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:00:01 GMT)
Consistent and Compatible Modelling of Cyber Intrusions and Incident Response Demonstrated in the Context of Malware Attacks on Critical Infrastructure [3.5] サイバーセキュリティインシデント対応(IR)プレイブックは、サイバー侵入から回復するのに必要なステップをキャプチャするために使用される。
我々は9つの重要な国家インフラ侵入モデルを採用し、それらをIRプレイブックと同じフォーマットのモデルに変換する。
これにより、侵入モデルが改善され、IRプレイブックと脅威モデリングの密結合が強化される。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:49:35 GMT)
ACCORD: Autoregressive Constraint-satisfying Generation for COmbinatorial Optimization with Routing and Dynamic attention [3.4] 大規模言語モデル (LLM) は印象的な推論能力を示しているが、NP-hard problem (CP) への直接的応用は未定である。
本稿では, 自動回帰制約充足生成法(ACCORD: Autoregressive Constraint-Satisfying generation)を紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:33:55 GMT)
Estimation of discrete distributions in relative entropy, and the deviations of the missing mass [3.4] I.d.サンプルから有限アルファベット上の分布を推定する問題について検討する。
2つの有効空間パラメータに依存する高確率リスクを確立する。
この分析の一環として、欠落した質量に鋭い高確率上界を導出する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:10:28 GMT)
Paired and Unpaired Image to Image Translation using Generative Adversarial Networks [3.4] 最近のアーキテクチャでは、GAN(Generative Adversarial Networks)を利用して、入力イメージをあるドメインから別のドメインに変換している。
複数の画像領域にまたがるペア画像とペア画像の両方について検討した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:06:39 GMT)
Point, Detect, Count: Multi-Task Medical Image Understanding with Instruction-Tuned Vision-Language Models [3.3] マルチタスク医療画像理解のための微調整視覚言語モデル(VLM)について検討する。
我々は各タスクを視覚言語推論に適した命令ベースのプロンプトに再構成する。
その結果,マルチタスクトレーニングにより堅牢性と精度が向上した。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:44 GMT)
KAN-Mamba FusionNet: Redefining Medical Image Segmentation with Non-Linear Modeling [3.3] 医用画像のセグメンテーション精度を向上させるために,新しいアーキテクチャであるkan-Mamba FusionNetを提案する。
IoUとF1スコアの最先端メソッドを一貫して上回る。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:15:10 GMT)
Unsupervised Prompting for Graph Neural Networks [3.3] 本稿では,GNNのプロンプト手法を評価するための問題設定を提案する。
擬似ラベルによる整合性正規化に基づく完全教師なしプロンプト手法を提案する。
我々の教師なしのアプローチは、ラベルにアクセス可能な最先端のプロンプト手法よりも優れています。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:03:20 GMT)
On the use of Graphs for Satellite Image Time Series [3.3] 本稿では,遠隔センシングにおけるグラフベース手法の統合について検討する。
SITS分析に取り組むために,汎用的なグラフベースのパイプラインを提案することを目的としている。
本論文は,土地被覆マッピングと水量予測データセットに対するグラフベースのアプローチの可能性を明らかにするための,レビューと2つのケーススタディを含む。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:53:36 GMT)
Guiding Giants: Lightweight Controllers for Weighted Activation Steering in LLMs [3.2] アクティベーションステアリングは、推論時間制御の代替を提供する。
推論中に軽量でトレーニング可能なコントローラネットワークを組み込んだ新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:48:38 GMT)
AdvReal: Adversarial Patch Generation Framework with Application to Adversarial Safety Evaluation of Object Detection Systems [3.2] 本研究では,2次元と3次元の両方のサンプルを対象とした統合型対向訓練フレームワークを提案する。
本研究では,非剛性表面モデリングと現実的な3次元マッチング機構を組み込んだ対向型サンプル現実性拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:54:03 GMT)
Guarded Query Routing for Large Language Models [3.1] まず、GQR-Bench(Guarded Query Routing Benchmark)を紹介します。
次に、GQR-Benchを用いて、LLMベースのルーティング機構の有効性と効率を対比する。
その結果,ドメイン外検出能力が向上したWideMLPでは,精度(88%)と速度(4ms)のトレードオフが最良であることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:29:24 GMT)
Quantum Feature Optimization for Enhanced Clustering of Blockchain Transaction Data [3.1] トランザクションデータは、高次元性、ノイズ、複雑な特徴の絡み合いを示す。
本研究では,3つのクラスタリング手法の比較分析を行った。
浅い量子回路でも意味のある非線形表現を効果的に抽出できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:37:07 GMT)
LLM-Powered AI Agent Systems and Their Applications in Industry [3.1] LLM(Large Language Models)はエージェントシステムである。
タスクスコープが制限された従来のルールベースのエージェントとは異なり、LLMベースのエージェントはより柔軟性、ドメイン間の推論、自然言語の相互作用を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:52:15 GMT)
Protein sequence classification using natural language processing techniques [3.1] 本研究の目的は,自然言語処理(NLP)技術を用いたタンパク質配列分類の高度化である。
我々は、ランダムスプリッティングとECODファミリースプリッティングという2つの異なるデータ分割戦略の下で、さまざまな機械学習モデルとディープラーニングモデルを比較した。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:29:16 GMT)
Towards Competent AI for Fundamental Analysis in Finance: A Benchmark Dataset and Evaluation [3.1] ファイナンシャルステートメント分析に着目したベンチマークデータセットであるFinAR-Benchを提案する。
重要な情報を抽出し、財務指標を計算し、論理的推論を適用する。
本研究は, 基礎解析におけるLLMの現在の強度と限界を明確に把握するものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:06:20 GMT)
Understanding the Security Landscape of Embedded Non-Volatile Memories: A Comprehensive Survey [3.1] 本稿では, アーキテクチャの観点から, 特定のメモリの脆弱性の原因を論じ, eNVMのセキュリティ面について考察する。
物理的攻撃や情報漏洩、サービス拒否、サーマル攻撃といった論理的脅威を含む、eNVMに対する幅広いセキュリティ脅威についても検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:02:48 GMT)
Large Language Model-Empowered Interactive Load Forecasting [3.0] 大きな言語モデル(LLM)は、人間のオペレータと予測モデルの間のギャップを埋める新たな機会を提供する。
特殊なエージェントのセットは、予測ワークフローで異なるタスクを実行し、専用の通信メカニズムを介して協調するように設計されている。
本実験は,ユーザが重要な段階について適切な洞察を与えると,対話型負荷予測精度が大幅に向上できることを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:11:10 GMT)
Vendi-RAG: Adaptively Trading-Off Diversity And Quality Significantly Improves Retrieval Augmented Generation With LLMs [3.0] Vendi-RAGは、検索の多様性と回答の品質を共同で最適化する反復的なプロセスに基づくフレームワークである。
Veddi-RAGは、フレキシブルな類似性に基づく多様性指標であるVendi Score(VS)を活用して、文書検索における意味的多様性を促進する。
Veddi-RAGは従来のシングルステップとマルチステップのRAGアプローチよりも大幅に精度が向上している。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:49:15 GMT)
The Alpha-Alternator: Dynamic Adaptation To Varying Noise Levels In Sequences Using The Vendi Score For Improved Robustness and Performance [3.0] マンバのような現在の最先端の動的モデルは、与えられたシーケンスのすべての要素に対して同じノイズのレベルを仮定し、ノイズのある時間データに対するパフォーマンスを制限している。
本稿では,時間依存データに対する新たな生成モデルである$alpha-Alternatorを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:15:54 GMT)
Rethinking Code Review Workflows with LLM Assistance: An Empirical Study [3.0] 本稿では,LLM支援コードレビューツールの2つのバリエーションを含むフィールド実験と,現在のコードレビュープラクティスの探索的フィールドスタディを組み合わせる。
この研究は、頻繁なコンテキスト切り替えやコンテキスト情報の不足など、従来のコードレビューにおける重要な課題を特定している。
フィールド実験では,LLM生成レビューを事前に提供し,オンデマンドインタラクションを実現する2つのプロトタイプを開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:54:07 GMT)
Finetuning-Activated Backdoors in LLMs [2.9] オープンにアクセス可能なLarge Language Models (LLM) は、タスク固有のパフォーマンス改善を実現するための標準的なプラクティスとなっている。
これまで、微調整は、良質なデータセットのトレーニングが予測可能な振る舞いをもたらす、制御されたセキュアなプロセスとみなされてきた。
敵が最初に毒を盛ったLSMを作成できるのは初めてであり、最初は悪質に見えるが、下流のユーザーによって微調整された悪質な行動を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:59:44 GMT)
Refining CNN-based Heatmap Regression with Gradient-based Corner Points for Electrode Localization [2.8] リチウムイオン電池の電極位置検出手法を提案する。
畳み込みニューラルネットワークは、この領域内の極の位置を回帰するために使用される。
後退位置を最適化し、コーナーポイント先行値を用いて補正する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:44:09 GMT)
Statistical Inference for Online Algorithms [2.8] 分散を推定することなく、オンラインアルゴリズムのエムの出力に基づく新しいタイプの推論を提案する。
提案手法の実用性を理解するために,Polyak平均化による勾配降下に着目した。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:31:49 GMT)
Scalable and Interpretable Contextual Bandits: A Literature Review and Retail Offer Prototype [2.8] 本稿では、CMAB(Contextual Multi-Armed Bandit)手法のレビューを行い、スケーラブルで解釈可能なオファー選択のための実験的なフレームワークを提案する。
アプローチは製品カテゴリレベルでコンテキストをモデル化し、オファーが複数のカテゴリにまたがり、類似のオファー間での知識伝達を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:13:01 GMT)
Does Synthetic Data Help Named Entity Recognition for Low-Resource Languages? [2.8] 低リソース言語のための名前付きエンティティ認識は、ラベル付きトレーニングデータが限られている言語のための堅牢なシステムを作ることを目的としている。
低リソースラベル付きデータの量を増やすためのデータ拡張は一般的なプラクティスである。
この結果から, 合成データは低リソース言語であるNERを約束するが, 言語間では大きな違いがあることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:50:47 GMT)
Towards Machine-Generated Code for the Resolution of User Intentions [2.8] AIの出現は、モデル生成コードのデプロイを通じて、ユーザが提供する意図解決のシフトを示唆する可能性がある。
本稿では,具体的なユーザ意図で LLM をプロンプトするコード生成による生成と実行の実現可能性について検討する。
本稿では,ユーザ意図,結果のコード,実行の詳細な分析と比較を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:57:51 GMT)
EMERGENT: Efficient and Manipulation-resistant Matching using GFlowNets [2.7] EMERGENTは、一方のマッチングに対する生成フローネットワーク(GFlowNets)の新しいアプリケーションである。
我々の研究は、社会的選択機構を含むアプリケーションにおけるGFlowNetsの可能性を強調している。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:25:54 GMT)
ExMAG: Learning of Maximally Ancestral Graphs [2.7] 本稿では,最大祖先グラフを学習するためのスコアベース分岐切断アルゴリズムを提案する。
このアルゴリズムは最先端の手法よりも正確な結果を生成するが、中小の合成インスタンスではより高速に動作する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:11:04 GMT)
Feature Map Similarity Reduction in Convolutional Neural Networks [2.7] 畳み込みニューラルネットワーク(CNN)は特徴マップの冗長性に悩まされ、非効率なキャパシティ利用につながる。
本稿では,CNNの入力から独立して特徴マップ類似度を低減するための畳み込み類似度法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:47:00 GMT)
Backdoors in DRL: Four Environments Focusing on In-distribution Triggers [2.7] 深部強化学習(DRL)のためのトロイの木馬の開発を行った。
エージェントの自然なデータ配信内で発生する分散トリガは、配布外トリガよりもセキュリティ上の重大な脅威を引き起こす。
4つの強化学習環境において,バックドア攻撃を実施している。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:52:35 GMT)
Poster: Towards an Automated Security Testing Framework for Industrial UEs [2.7] 我々は,産業用UEの自動セキュリティテストフレームワークの構築に向けた当社の取り組みについて報告する。
我々は、高層セキュリティプロトコルが正しく実装されていることを確認するために、ステークホルダーに完全に自動化されたメソッドを提供することを目指している。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:54:38 GMT)
Deconfounded Warm-Start Thompson Sampling with Applications to Precision Medicine [2.7] 臨床検査における観察データに対するDWTS(Decon founded Warm-Start Thompson Smpling)を提案する。
DWTSは、統合された観察データを利用して適応的な臨床試験を開始する。
観察データからのオフライン因果的洞察が試行効率を向上し、よりパーソナライズされた治療決定をサポートするかを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:00:19 GMT)
MixAT: Combining Continuous and Discrete Adversarial Training for LLMs [2.7] MixATは、トレーニング中により強力な離散的および高速な連続攻撃を組み合わせる新しい方法である。
以上の結果から,MixATは前回の防御よりもかなり優れたロバスト性(ALO-ASR 20%)を達成できることが示された。
この結果から,MixATの離散連続防衛は,計算オーバーヘッドを最小限に抑えつつ,原理的かつ高精度なトレードオフを提供することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:32:50 GMT)
Redefining Clustered Federated Learning for System Identification: The Path of ClusterCraft [2.5] 我々は,SYSID(IC-SYSID)のためのアルゴリズム,インクリメンタルクラスタリングに基づくフェデレーション学習手法を提案する。
IC-SYSIDは、事前の知識なしに複数のデータソースにわたるSYSID課題に取り組む。
IC-SYSIDは不安定クラスタの学習を防止しつつ高いSYSID性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:15:12 GMT)
Advancing Security with Digital Twins: A Comprehensive Survey [2.5] ディジタルツインは、後方トレーサビリティ、エンドツーエンドの可視性、コンポーネントの完全性と動作の継続的な検証を提供する。
本稿では,サイバー物理システム,モノのインターネット,暗号システム,偽装電子機器の検出,侵入検出,障害注入,サイドチャネルリークのディジタルツインベースのセキュリティ実装について紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:01:07 GMT)
Place Recognition: A Comprehensive Review, Current Challenges and Future Directions [2.5] 位置認識の最近の進歩を概観し,3つの方法論的パラダイムを強調した。
CNNベースのアプローチ、トランスフォーマーベースのフレームワーク、およびクロスモーダル戦略について議論する。
我々は現在の研究課題を特定し、ドメイン適応、リアルタイムパフォーマンス、生涯学習を含む今後の方向性を概説し、この領域の今後の進歩を刺激する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:37:43 GMT)
A Toolkit for Compliance, a Toolkit for Justice: Drawing on Cross-sectoral Expertise to Develop a Pro-justice EU AI Act Toolkit [2.4] 欧州連合におけるAI法の導入は、コンプライアンスに関する新たな課題の集合をAI研究実践コミュニティに提示する。
AI倫理の理論を開発や展開の実践に翻訳することを目的としたツールキットの研究は、そのようなリソースが複数の制限に悩まされていることを示唆している。
これらの制限は、ツールキットが産業ベースのチームや、作業が産業の現実から抽象化され、分離される傾向にある学者によって生み出されているという事実に起因している。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:12:46 GMT)
Multivariate Latent Recalibration for Conditional Normalizing Flows [2.3] ラテント校正は、ラテントキャリブレーション上の有限サンプル境界を持つラテント空間の変換を学ぶ。
LRは再校正モデルの潜時校正誤差と負の対数類似度を一貫して改善する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:08:20 GMT)
Error Bounds on the Universal Lindblad Equation in the Thermodynamic Limit [2.3] これは、バルク散逸の対象となる量子多体系の挙動を解明するために、物理学の様々な分野において中心的な問題である。
これまで、多体系に対するリンドブラッド量子マスター方程式のいくつかの微視的導出が提案されてきた。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:02:37 GMT)
Implicit Neural Shape Optimization for 3D High-Contrast Electrical Impedance Tomography [2.3] 3次元高コントラスト電気インピーダンストモグラフィ(EIT)のための新しい暗黙的ニューラルネットワーク形状最適化フレームワークを提案する。
これらの高コントラスト症例は, 金属インプラントモニタリングや工業的欠陥検出に多いが, 重度の異常により従来の再建法に挑戦する。
提案手法は、形状微分に基づく最適化手法を含む重要な革新を導入し、暗黙のニューラル表現と形状最適化を相乗化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:13:19 GMT)
Reasoning in Neurosymbolic AI [2.3] ニューラルネットワークにおける推論と学習の原則的な統合は、ニューロシンボリック人工知能の領域の主目的である。
簡単なエネルギーベースのニューロシンボリックAIシステムは、命題論理式を形式的に表現し、推論することができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:57:04 GMT)
ORION Grounded in Context: Retrieval-Based Method for Hallucination Detection [2.2] 幻覚検出の枠組みとして「文脈に囲む」がある。
RAGアーキテクチャにインスパイアされた本手法は,検索モデルとNLIモデルを統合し,実際の一貫性を予測する。
本フレームワークは,RAGTruthの応答レベル分類タスクにおいて,F1スコア0.83の支持クレームを識別する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:03:55 GMT)
TRACE: Transformer-based Risk Assessment for Clinical Evaluation [2.2] TRACE(Transformer-based Risk Assessment for Clinical Evaluation)は臨床データに基づく臨床リスク評価の新しい手法である。
我々のアプローチでは、連続、分類、多重選択(チェックボックス)属性など、さまざまなデータモダリティを扱うことができます。
説明可能性の観点からは,我々のTransformerベースの手法は注意重みによる容易に解釈可能な結果を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:19:34 GMT)
LLM Access Shield: Domain-Specific LLM Framework for Privacy Policy Compliance [2.2] 大規模言語モデル(LLM)は、金融、教育、ガバナンスといった分野でますます適用されてきている。
LLMインタラクションにおけるポリシー遵守とリスク軽減のためのセキュリティフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:30:37 GMT)
SEDD-PCC: A Single Encoder-Dual Decoder Framework For End-To-End Learned Point Cloud Compression [2.2] 損失点クラウド圧縮のためのエンドツーエンド学習ベースのフレームワークSEDD-PCCを提案する。
単一エンコーダを用いて、共通な幾何学的特徴と属性的特徴を統一された潜在空間に抽出し、次いで、幾何学的特徴と属性を逐次再構成する2つの特殊デコーダを用いる。
SEDD-PCCはシンプルで効果的な設計で、ポイントクラウド圧縮のための効率的で実用的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:11:24 GMT)
Stochastic Variational Propagation: Local, Scalable and Efficient Alternative to Backpropagation [2.2] バックプロパゲーション(BP)はディープラーニングの基盤であるが、グローバルな勾配同期に依存しているためスケーラビリティが制限される。
本稿では、階層的変分推論としてトレーニングを再構成するスケーラブルな代替手段である変分伝搬(SVP)を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:58:16 GMT)
Relative-Interior Solution for the (Incomplete) Linear Assignment Problem with Applications to the Quadratic Assignment Problem [2.1] 線形代入問題(LAP)の双対線形プログラミング定式化の最適解の集合について検討する。
この集合の相対的な内部から解を計算する方法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:35:45 GMT)
Learning Genomic Structure from $k$-mers [2.1] コントラスト学習を用いて読み出しデータを解析する手法を提案する。
エンコーダモデルは、同じゲノム領域から配列をまとめる埋め込みを生成するために訓練される。
モデルはまた、読み取りデータに基づいて完全に自己教師された訓練も可能で、完全なゲノム組立を構築することなく分析が可能である。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:46:18 GMT)
Singular Value Decomposition and Its Blind Spot for Quantum Chaos in Non-Hermitian Sachdev-Ye-Kitaev Models [2.1] 特異値分解(SVD)法は非エルミート系における量子カオスの探索には不十分である。
非正定値スペクトルを持つ系のエルミート極限において,SVDが従来の固有値統計を再現できないことを示す。
我々は、この方向の今後の研究のために、より堅牢な手法であるバイランチョスアルゴリズムを採用することを提唱する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:29:41 GMT)
PolyMicros: Bootstrapping a Foundation Model for Polycrystalline Material Structure [2.0] 科学領域における超スパースで複雑な空間データから学習するための新しい機械学習手法を提案する。
私たちのコアコントリビューションは、局所生成モデルのアンサンブルを利用する物理駆動型データ拡張スキームです。
我々は, この枠組みを用いて, ポリ結晶材料の基礎モデルであるポリマイクロスを構築した。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:12:20 GMT)
Content Moderation in TV Search: Balancing Policy Compliance, Relevance, and User Experience [2.0] コンテンツモデレーションを強化するために,LLM(Large Language Models)を用いた追加の監視層を導入する。
この追加レイヤは、ユーザが検索しようとしなかった場合、コンテンツにフラグを付ける。
このアプローチは製品品質保証のベースラインとして機能し、最初の検索メカニズムを洗練するために収集されたフィードバックを使用する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:32:39 GMT)
LLM-Powered Agents for Navigating Venice's Historical Cadastre [2.0] カダストラルデータは、都市の歴史的組織に関する重要な情報を明らかにするが、多種多様なフォーマットや人間のアノテーションのために、しばしば標準化されていない。
我々は1740年から1808年までのケーススタディを探求し、古代共和国の滅亡とアンシエン・ルゲームの移行を捉えた。
この時代の複雑なカダストラルデータは、その体積と均一な構造が欠如していることが特徴であり、我々のアプローチが順応的にナビゲートする固有の課題を示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:45:15 GMT)
Robust LLM Fingerprinting via Domain-Specific Watermarks [1.9] 本稿では,モデルフィンガープリントのためのドメイン固有透かしの概念を紹介する。
特定の言語やトピックにのみ、透かしを埋め込むようにモデルをトレーニングします。
評価の結果,ドメイン固有の透かしにより,統計的確証が強いモデルフィンガープリントが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:32:23 GMT)
Discovering Spoofing Attempts on Language Model Watermarks [1.9] 真に透かし付きテキストとスプーフ付きテキストを区別する信頼性の高い統計手法を提案する。
これらの結果をもとに厳密な統計検査を提案し,これらのアーティファクトの存在を確実に明らかにする。
実験により,すべての学習ベーススプーフィング法に対して高いテストパワーが得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:09:01 GMT)
VL-SAFE: Vision-Language Guided Safety-Aware Reinforcement Learning with World Models for Autonomous Driving [1.9] 強化学習(RL)に基づく自律運転政策学習は、限界に直面している。
RLはしばしば複雑な運転コンテキストにおける「安全」の意味の真の意味をつかむのに失敗する。
本稿では,VLM(Vision-Language Model)-as-as-safety-guidanceパラダイムを用いた世界モデルベースの安全なRLフレームワークであるVL-SAFEを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:29:59 GMT)
Statistical guarantees for denoising reflected diffusion models [1.9] 近年,進化するAIの領域が急速に拡大しているため,拡散モデルの認知化が重要な研究領域となっている。
本稿では,反射拡散モデルの統計的保証について検討する。
本研究の主な貢献は, 反射拡散モデルに基づく新しいクラスを統計的に解析することと, 時間と空間の両方における精密なスコア近似法である。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:32:54 GMT)
Chirality-induced Spin-Orbit Coupling and Spin Selectivity [1.9] ヘリカルパスに沿って走行するスピノルが、経路の曲率のためにスピン軌道結合を発達させることを示す。
我々は、キラリティ誘起スピン選択性(CISS)を示す構造に対するこの効果的な幾何学的スピン軌道相互作用の大きさを推定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:04:53 GMT)
Semantic-Aware Interpretable Multimodal Music Auto-Tagging [1.9] 本稿では,音楽に有意義なマルチモーダル特徴群を利用した自動タグ付けのための解釈可能なフレームワークを提案する。
提案手法は,意思決定プロセスのより深い理解を提供しながら,競争力のあるタグ付け性能を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:15:48 GMT)
Towards Texture- And Shape-Independent 3D Keypoint Estimation in Birds [1.8] 複数のハトの3次元関節位置を推定・追跡するためのテクスチャに依存しないアプローチを提案する。
我々は既存の3D-MuPPETフレームワークを構築し、最大10羽のハトの3Dポーズを推定し追跡する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:04:24 GMT)
Analysis of clinical, dosimetric and radiomic features for predicting local failure after stereotactic radiotherapy of brain metastases in malignant melanoma [1.8] 本研究は悪性黒色腫脳転移症例に対する定位放射線治療後の病変特異的な予後を予測することを目的とした。
RFベースのモデルは臨床モデルよりも優れていたが、ドシメトリックデータだけでは予測できない。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:13:16 GMT)
Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computing [1.8] AKT(Advanced Knowledge Transfer)は、低ビット量子化(Q)モデルのトレーニング能力を高める新しい手法である。
低ビットQモデルの基本勾配爆発問題に対処する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:25:40 GMT)
Towards medical AI misalignment: a preliminary study [1.8] 大規模言語モデル (LLM) は依然として、悪意のあるユーザによるジェイルブレイクの試みの傾向にある。
生成AIモデルの内部アーキテクチャやパラメータに関する技術的な知識がなくても、悪意のあるユーザがロールプレイングプロンプトを構築することができるのか、初期分析を行う。
我々は、特定の脆弱性シナリオを説明し、この分野における将来の進歩を支援する洞察を提供することを目指している。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:06:09 GMT)
ResearchBot: Bridging the Gap between Academic Research and Practical Programming Communities [1.8] このプロジェクトでは、学術と産業のギャップを埋めるためのツールであるResearchBotを導入する。
ResearchBotはモジュール的なアプローチを採用し、質問の理解、クエリのキュレーション、論文の内容を要約する。
ResearchBotの中核的な目的は、業界の専門家のための学術的知識へのアクセスを民主化することだ。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:18:46 GMT)
Extensible Post Quantum Cryptography Based Authentication [1.7] 機械間認証と認証のための量子セーフシングルショットプロトコルを提案する。
安全でないチャネルで完全に動作するこのプロトコルは、トークンの前方にセキュアな設定を可能にする。
この研究は、量子可能世界におけるスケーラブルで弾力性があり、将来的なアイデンティティ基盤の基盤となる。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:34:17 GMT)
Physics-Informed Neural Networks for Vessel Trajectory Prediction: Learning Time-Discretized Kinematic Dynamics via Finite Differences [1.7] 正確な船舶軌道予測は、航行安全、経路最適化、交通管理、捜索・救助活動、自律航法に不可欠である。
従来のデータ駆動モデルは現実世界の物理的な制約を欠いているため、船体の運動力学に反する予測が導かれる。
本稿では, 血管運動の流線形運動モデルとニューラルネットワーク学習プロセスを統合した, 軌道予測のための物理情報ニューラルネットワーク (PINN) 手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:09:25 GMT)
Towards Understanding the Benefits of Neural Network Parameterizations in Geophysical Inversions: A Study With Neural Fields [1.7] 本研究では、ニューラルネットワークを用いて、その座標における対応する物理特性値に座標をマッピングする。
テスト時間学習法では、トレーニングデータセットを使用してネットワークをトレーニングする必要がある従来のアプローチと比較して、ウェイトをインバージョン中に学習する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:02:31 GMT)
Complexity at Scale: A Quantitative Analysis of an Alibaba Microservice Deployment [1.7] Alibabaがリリースしたマイクロサービスデプロイメントデータセットを分析します。
さらに広い範囲のフロントエンド機能をサポートする、数万の特徴を特定します。
実行時のデプロイメント内の依存関係が、システムの静的ビューと異なる場合があることが分かりました。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:55:49 GMT)
A New Approach to Backtracking Counterfactual Explanations: A Unified Causal Framework for Efficient Model Interpretability [1.7] 本稿では、因果推論を取り入れて行動説明を生成するBRACEという効率的な手法を提案する。
まず,既存の手法の限界について検討し,新しい手法とその特徴を紹介する。
実験の結果,本手法はモデル出力に対する深い洞察を与えることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:51:17 GMT)
FREESON: Retriever-Free Retrieval-Augmented Reasoning via Corpus-Traversing MCTS [1.6] 大規模推論モデル(LRM)は,多段階推論において,適切なステップで検索エンジンを呼び出す際,顕著な機能を示した。
FREESON(Retriever-FREE Retrieval-Augmented ReaSONing)と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:00:08 GMT)
JanusDNA: A Powerful Bi-directional Hybrid DNA Foundation Model [1.6] 大規模言語モデル(LLM)は自然言語処理に革命をもたらし、他のシーケンシャルなデータタイプにもますます適用されてきている。
我々は、新しい事前学習パラダイムに基づいて構築された、最初の双方向DNA基盤モデルであるJanusDNAを紹介する。
JanusDNAは、1つの80GB GPU上で1つのヌクレオチド分解能で100万塩基対を処理する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:10:55 GMT)
A Scalable Hierarchical Intrusion Detection System for Internet of Vehicles [1.6] Internet of Vehicles(IoV)は、スプーフィングやDistributed Denial of Services(DDoS)攻撃からマルウェアまで、さまざまなサイバー脅威にさらされている。
IoVエコシステムを侵入、悪意のある活動、ポリシー違反、侵入検知システム(IDS)から保護するためには、ネットワークトラフィックを継続的に監視・分析し、潜在的脅威をリアルタイムに特定・緩和することで重要な役割を果たす。
本稿では,IoVネットワークに適した効果的な階層型分類フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:30:26 GMT)
Let Androids Dream of Electric Sheep: A Human-like Image Implication Understanding and Reasoning Framework [1.6] Let Androids Dream (LAD)は、画像の意味理解と推論のための新しいフレームワークである。
軽量なGPT-4o-miniモデルを用いたフレームワークは、英語のイメージ含意ベンチマークで15以上のMLLMと比較してSOTA性能を実現している。
私たちの研究は、AIがイメージ含意をより効果的に解釈する方法について、新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:59:53 GMT)
MOHPER: Multi-objective Hyperparameter Optimization Framework for E-commerce Retrieval System [1.6] MOHPERはeコマースサイトの多目的最適化フレームワークである。
クリックスルーレート(CTR)、クリックスルー変換レート(CTCVR)、関連する目的を共同で最適化する。
これは、ユーザの満足度と収益目標の両方に合わせたバランスの取れた最適化を達成する上で、その実用的効果を裏付けるものだ。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:14:29 GMT)
CMA-ES with Radial Basis Function Surrogate for Black-Box Optimization [1.6] 我々は,CMA-SAOと呼ばれるCMA-ESフレームワークにおけるサロゲートモデルの導入を提案し,初期サロゲートモデルを開発する。
実証検証の結果、CMA-SAOアルゴリズムは、一般的なアルゴリズムと比較して関数評価の数を著しく減らしていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:10:04 GMT)
Interpretable Machine Learning for Macro Alpha: A News Sentiment Case Study [1.6] 我々は、FinBERTを用いて、GDELT(Global Database of Events, Language, and Tone)プロジェクトの世界中のニュースフィードを処理する。
平均音、分散、事象の影響を取り入れた毎日の感情指標を構築した。
これらの指標は、ロジスティック回帰に対してベンチマークされたXGBoostを駆動し、次の日のリターンを予測する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:24:45 GMT)
Consistent Quantity-Quality Control across Scenes for Deployment-Aware Gaussian Splatting [1.6] 3Dガウススプラッティング(3DGS)は、高いレンダリング品質を維持しながら使用するガウスの数を最小化する。
既存の手法は質の高い性能を追求するが、ユーザが直感的にこのトレードオフを調整する能力は欠如している。
そこで本研究では,意味論的かつ場面間一貫した量品質制御を実現する3DGS最適化手法であるControlGSを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:46:57 GMT)
Objective Bicycle Occlusion Level Classification using a Deformable Parts-Based Model [1.6] 道路安全は、特に最も脆弱な道路利用者であるサイクリストにとって重要な課題である。
本研究は,高度なコンピュータビジョン技術を用いた自転車閉塞レベル分類のための新しいベンチマークを提案し,道路安全を向上させることを目的とする。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:25:18 GMT)
Relevance for Stability of Verification Status of a Set of Arguments in Incomplete Argumentation Frameworks (with Proofs) [1.5] 不完全な議論フレームワークにおける議論の集合の検証状態の安定性との関連性について検討する。
安定に達する全ての状況における解決の必要性を説明するための強い関連性の概念を提案する。
複雑性の分析により、議論の集合の安定性に対する(強い)関連性を検出することは、P時間で達成できることが明らかになった。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:42:16 GMT)
Web Element Relocalization in Evolving Web Applications: A Comparative Analysis and Extension Study [1.5] 我々は、文学における最新の命題、すなわちシミロアルゴリズムとその後継であるVONシミロの研究を再現する。
我々の分析により、VONシミロは、その新しいアプローチにもかかわらず、シミロよりも偽陽性を生じやすいことが明らかとなった。
そこで我々は,ハイブリッドシミロ(Hybrid Similo)とVONシミロ(VONシミロ)の長所を組み合わせた新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:09:31 GMT)
Fashion Industry in the Age of Generative Artificial Intelligence and Metaverse: A systematic Review [1.5] ファッション産業は、アパレル、履物、アクセサリーを製造、流通することで、数兆ドルもの収入を生み出している。
この体系的な文献レビュー(SLR)は、ファッション産業におけるジェネレーティブ・人工知能(GAI)とメタバースに関する研究の展望を体系的にレビューし、分析することを目的としている。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:06:27 GMT)
seq-JEPA: Autoregressive Predictive Learning of Invariant-Equivariant World Models [1.5] 本稿では,協調埋め込み型予測アーキテクチャにアーキテクチャバイアスを導入する世界モデリングフレームワークSeq-JEPAを提案する。
Seq-JEPA は2つのアーキテクチャ的に分離された表現を同時に学習する。
行動間の経路統合や眼球運動間の予測学習など、本質的に一連の観察を必要とするタスクに優れています。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:37:05 GMT)
SA-GAT-SR: Self-Adaptable Graph Attention Networks with Symbolic Regression for high-fidelity material property prediction [1.4] 我々はシンボリック回帰(SA-GAT-SR)と統合された新しい計算パラダイムである自己適応型グラフ注意ネットワークを導入する。
本フレームワークでは,注目重みを自動的に識別・調整する自己適応型符号化アルゴリズムを用いて,拡張可能な180次元特徴空間から重要な特徴をスクリーニングする。
その後、統合SRモジュールはこれらの特徴をコンパクトな解析式に蒸留し、量子力学的に意味のある関係を明確に示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:57:43 GMT)
Meta-reinforcement learning with minimum attention [1.4] 最小限の注意は、ブロケットが最初に提案した状態と時間に関する制御の変化において最小の行動原理を適用している。
報奨の一環として強化学習に最小限の注意を払い、メタラーニングと安定化との関連について検討する。
実験により、モデルフリーおよびモデルベースRLにおける最先端アルゴリズムと比較して、最小の注意力は優れた能力を示すことを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:53:06 GMT)
Decoherence manipulation through entanglement dynamics: A photonic experiment [1.4] デコヒーレンス(decoherence)は、全ての量子技術において高い効率を達成するための大きな障害となる。
本研究は,全フォトニック装置を用いて,重度の脱コヒーレンスを示すエンタングルメント突然死(ESD)を実験的に操作する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:55:00 GMT)
Compile-Time Fully Homomorphic Encryption of Vectors: Eliminating Online Encryption via Algebraic Basis Synthesis [1.4] 暗号文は、事前計算された暗号化ベースベクターとランタイムスケールの0の暗号化を組み合わせた構成である。
ランダム化された$mathbbZ_t$-加群として定式化し、標準仮定の下でIND-CPAセキュリティを満たすことを証明した。
ゼロのランダムな暗号のプールを必要とする以前の設計とは異なり、我々の構成は実行時に新しいスカラーによって乗算された1つのゼロ暗号文を用いて等価なセキュリティを実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:26:07 GMT)
Robust Vision-Based Runway Detection through Conformal Prediction and Conformal mAP [1.4] 視覚ベースランディングシステム(VLS)における滑走路検出のための統計的不確実性保証のための共形予測の利用について検討する。
航空画像上でのYOLOv5とYOLOv6の微調整モデルを用いて,ユーザが定義したリスクレベル下での局所化信頼性の定量化に共形予測を適用した。
その結果,不確実性を統計的に健全な方法で定量化することにより,コンフォメーション予測により滑走路検出の信頼性が向上できることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:52:59 GMT)
Data Doping or True Intelligence? Evaluating the Transferability of Injected Knowledge in LLMs [1.3] 理解力に富んだ微調整タスクは、マッピング指向タスクに比べて、知識保持率(48%)が大幅に向上する。
すべてのモデルは、より広い文脈で注入された知識を適用すると、大幅な性能低下を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:48:33 GMT)
Benchmarking Ophthalmology Foundation Models for Clinically Significant Age Macular Degeneration Detection [1.3] 自己教師付き学習(SSL)により、ビジョントランスフォーマー(ViT)は大規模な自然言語データセットから堅牢な表現を学習できるようになった。
自然画像上で事前学習したiBOTは,最も分布外一般化を達成できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:41:49 GMT)
Automated Feedback Loops to Protect Text Simplification with Generative AI from Information Loss [1.3] 我々は、より理解を深めるために、健康情報を簡単にすることに注力する。
本研究では、生成AIを比較し、簡易テキストにおける欠落情報を検出し、その重要性を評価し、欠落情報でテキストを固定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:19:49 GMT)
Exploring the Relationship Between Diversity and Quality in Ad Text Generation [1.3] 広告テキスト生成は、テキストスタイルと要求のためにタスクと大きく異なる。
本研究では,広告テキスト生成における多様性と広告品質の関係について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:05:44 GMT)
University of Indonesia at SemEval-2025 Task 11: Evaluating State-of-the-Art Encoders for Multi-Label Emotion Detection [1.3] 本稿では,28言語にまたがるマルチラベル感情分類に焦点を当てた。
完全微調整変圧器モデルと分類器のみのトレーニングの2つの主要な戦略について検討する。
以上の結果から,mE5やBGEなどのプロンプトベースエンコーダ上での分類器の訓練は,完全微調整XLMRやmBERTよりも有意に優れた結果が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:42:11 GMT)
HoT: Highlighted Chain of Thought for Referencing Supporting Facts from Inputs [1.2] 事実と非事実の言明が混ざり合った反応は、人間が自分の決定を正確かつ正確に検証することの難しさを浮き彫りにする。
提案するHighlighted Chain-of-Thought Prompting(HoT)は,大規模言語モデルに対して,クエリで提供される事実をベースとしたXMLタグによる応答を生成する技術である。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:17:45 GMT)
Secure Parsing and Serializing with Separation Logic Applied to CBOR, CDDL, and COSE [1.2] 検証およびシリアライザのライブラリであるPulseParseを紹介します。
我々は、バイナリデータフォーマット標準であるCBORの最初の形式化を提供することで、大規模にPulseParseを使用します。
一定のスタックスペースしか持たないフォーマットを解析する方法を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:12:03 GMT)
Spin adaptation of the cumulant expansions of reduced density matrices [1.2] 我々は、p-粒子還元密度行列(RDM)の累積のスピン適応のための枠組みを開発する。
これらの累積剤は量子系におけるS_zとS2対称性の厳密な処理を可能にする。
完全スピン適応は、2-RDMと4-RDMを必要とするS_zとS2の分散を制約することで実施可能であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:54:50 GMT)
Enhancing Federated Survival Analysis through Peer-Driven Client Reputation in Healthcare [1.2] Federated Learningは、患者のデータのプライバシを損なうことなく、協調的なモデルトレーニングを可能にすることで、デジタルヘルスを大いに約束する。
本稿では、分散化されたピアフィードバックとクラスタリングに基づくノイズハンドリングを統合した、フェデレーション型医療のためのピア駆動評価機構を提案する。
クライアント側のモデル更新に差分プライバシを適用することで、評判計算中に機密情報が保護されることが保証される。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:49:51 GMT)
CMRINet: Joint Groupwise Registration and Segmentation for Cardiac Function Quantification from Cine-MRI [1.2] 本稿では,心血管MRI画像に対するグループワイド(GW)登録とセグメンテーションを共同で推定するエンド・ツー・エンドディープラーニング(DL)モデルを提案する。
Elastix と 2 つのDL-based method を用いた従来の GW 登録との比較により,提案手法により性能が向上し,計算時間が大幅に短縮された。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:36:42 GMT)
SMARTe: Slot-based Method for Accountable Relational Triple extraction [1.2] 三重抽出(RTE)は自然言語処理(NLP)の基本課題である
SMARTe: a Slot-based Method for Accountable Triple extract。
解釈可能性の追加は性能を損なうものではないことを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:28:30 GMT)
Tools in the Loop: Quantifying Uncertainty of LLM Question Answering Systems That Use Tools [1.2] 大きな言語モデル(LLM)は、訓練済みの知識が不十分な領域で正確な答えを提供するために、外部ツールを必要とすることが多い。
医学的意思決定などの高度な応用においては、LCMが生成したテキストとツールの出力の両方の不確実性を評価することが不可欠である。
本稿では,LSMと外部ツールの予測不確かさを共同で考慮し,不確かさを定量化するツールコールのモデリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:34:23 GMT)
Quantum Routing and Entanglement Dynamics Through Bottlenecks [1.2] 本稿では,2つの領域間の絡み合いのダイナミクスとルーティングについて考察する。
L$ と $C,R$ の間の平均二部構造絡み合いの上限を、そのようなアーキテクチャを無視するハミルトン群によって時間$t$ で生成できることを示す。
また、自由粒子系では、ハミルトニアン量子ルーティングを用いて、時間$Theta(sqrtN)$で星グラフ上を最適にルーティングできることも示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:33:11 GMT)
LogStamping: A blockchain-based log auditing approach for large-scale systems [1.2] 本稿ではブロックチェーンベースのログ管理フレームワークを提案する。
このフレームワークは、ハイブリッドオンチェーンとオフチェーンストレージモデルを統合する。
大規模システムで典型的な高ボリュームログ生成を扱うように設計されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:27:44 GMT)
Enhancing Channel-Independent Time Series Forecasting via Cross-Variate Patch Embedding [1.2] チャネル非依存(CI)モデルにクロスバリアントコンテキストを注入する軽量CDモジュールとして,CVPE(Cross-Variate Patch Embeddings)を提案する。
CVPEをマルチモーダルCI予測モデルであるTime-LLMに統合し,その有効性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:29:44 GMT)
Assessing the generalization performance of SAM for ureteroscopy scene understanding [1.1] 本研究は腎臓結石分節の自動化におけるSAM(Seegment Anything Model)の可能性について検討した。
SAMの性能は、U-Net、Residual U-Net、Atention U-Netなどの従来のモデルと比較して評価される。
SAMは分散データ上ではU-Netに匹敵する性能を発揮するが、分散データの一般化能力は大幅に向上している。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:35:37 GMT)
Improving adiabatic quantum factorization via chopped random-basis optimization [1.1] 我々は、断熱的量子因数分解アルゴリズムを強化するために、チョップランダム基底(CRAB)最適化手法を適用した。
21から2479までの整数を分解するためにCRABを適用することで、CRABの有効性を実証する。
この性能改善は、雑音が劣化している場合のレジリエンスを示し、ノイズの多い量子システムにおけるCRABの実用性を強調している。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:06:02 GMT)
Impact, Causation and Prediction of Socio-Academic and Economic Factors in Exam-centric Student Evaluation Measures using Machine Learning and Causal Analysis [1.1] 効果的な教育介入には,社会学・経済的な要因が学生のパフォーマンスに影響を与えることが不可欠である。
本研究では,これらの要因が学業成績に与える影響を予測・解明するために,いくつかの機械学習手法と因果解析を用いる。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:41:05 GMT)
Higher-Order Asymptotics of Test-Time Adaptation for Batch Normalization Statistics [1.1] 本研究では,分散シフト下でのバッチ正規化(BN)統計のリアルタイム適応のための高次フレームワークを開発する。
トレーニングとテストの分布の統計的相違を解析することにより、BN平均の正規化差に対するエッジワース展開を導出する。
我々は適応過程におけるバイアス、分散、歪の間のトレードオフを定量化し、モデルリスクに縛られる対応する一般化を確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:47:19 GMT)
Graph-Smoothed Bayesian Black-Box Shift Estimator and Its Information Geometry [1.1] 我々は、ラプラシア・ガウスの先行をターゲットログプライアと混乱行列の両方に配置し、ラベル類似性グラフ上でそれらを結び付ける、完全に確率的な代替案を提案する。
我々は、識別可能性、$N-1/2$の縮約、グラフの代数的接続と縮退する分散境界、ラプラス的不特定性に対するロバスト性を証明する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:40:34 GMT)
Understanding and Analyzing Inappropriately Targeting Language in Online Discourse: A Comparative Annotation Study [1.1] 本稿では,ChatGPTにクラウドとエキスパートアノテーションを統合することで,オンライン会話における不適切なターゲット言語を検出する手法を提案する。
Redditの英語の会話スレッドに注目し、個人やグループをターゲットにしたコメントを調べます。
我々は,人間の専門家,群衆アノテータ,ChatGPTのアノテーションの比較分析を行い,明示的なヘイトスピーチと微妙な差別言語の両方を認識する上で,それぞれの手法の長所と短所を明らかにした。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:10:43 GMT)
Let's Get You Hired: A Job Seeker's Perspective on Multi-Agent Recruitment Systems for Explaining Hiring Decisions [1.1] 本研究では,Large Language Models (LLMs) を用いた多エージェントAIシステムを導入し,採用プロセスにおける求職者の指導を行う。
ユーザ中心設計の反復的アプローチを用いて,まず4人の積極的な求職者による2段階の探索実験を行い,システムの設計と開発について報告する。
評価の結果, 参加者は, 従来の方法に比べて, マルチエージェント採用システムの方が, より行動可能で, 信頼性が高く, 公平であると感じていることがわかった。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:33:42 GMT)
Contextual Learning for Stochastic Optimization [1.1] 最適化によってモチベーションを得て,文脈値分布のサンプルから学習する問題を導入する。
各サンプルは、コンテキスト$x$と、対応する実値分布$D_x$から引き出されたランダム変数からなる。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:01:49 GMT)
Divide and Conquer: A Hybrid Strategy Defeats Multimodal Large Language Models [1.1] 本稿では,マルチモーダルジェイルブレイク手法であるJMLLMを提案する。
テキスト、視覚、聴覚のモダリティにわたって包括的なジェイルブレイク攻撃を実行するために、複数の戦略を統合する。
また、マルチモーダルジェイルブレイク研究のための新しい包括的データセットTriJailも提供します。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:27:09 GMT)
Unsupervised Network Anomaly Detection with Autoencoders and Traffic Images [1.1] 本稿では,現在のネットワーク条件のコンパクトな要約を実現するための,ネットワークトラフィックのイメージベース表現を提案する。
また,異常を効果的に検出する教師なし学習手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:19:30 GMT)
Improved linear and Kerr nonlinear phase estimation via photon addition operations [1.0] 光子付加非ガウス演算とKerr非線形位相シフト器の両方を用いることで、量子測定の精度を効果的に向上することができる。
ここでは、パリティ検出を伴うマッハ・ツェンダー干渉計への入力として、コヒーレント状態混合光子添加圧縮真空状態を用いる。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:57:17 GMT)
ImPORTance: Machine Learning-Driven Analysis of Global Port Significance and Network Dynamics for Improved Operational Efficiency [1.0] 本研究の目的は, 船舶の移動によって形成される接続のネットワークを解析し, 重要港で共有される共通特性を探ることである。
本研究は,産業内における港湾開発,資源配分,インフラ計画に関する意思決定プロセスの通知を目的とする。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:52:11 GMT)
Swin Transformer for Robust CGI Images Detection: Intra- and Inter-Dataset Analysis across Multiple Color Spaces [1.0] 本研究の目的は,コンピュータ生成画像(CGI)と実際のデジタル画像とを区別することである。
自然画像と合成画像の正確な識別のためのSwin Transformerベースのモデルを提案する。
モデルの性能はすべてのカラースキームでテストされ、RGBカラースキームはデータセットごとに最も正確である。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:43:40 GMT)
Optimizing Asynchronous Federated Learning: A~Delicate Trade-Off Between Model-Parameter Staleness and Update Frequency [1.0] 我々は、非同期FLアルゴリズムにおける設計選択の影響をよりよく理解するために、モデリングと分析を用いる。
非同期FLを最適化するための基本的なトレードオフを特徴付ける。
これらの最適化は精度を10%から30%向上させる。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:37:54 GMT)
Mask of truth: model sensitivity to unexpected regions of medical images [1.0] 我々は、胸部X線と眼底画像の分類に畳み込みニューラルネットワーク(CNN)の能力に挑戦する。
マスク戦略に関わらず、PadデータセットでトレーニングされたすべてのモデルがランダムにAUC(Area Under the Curve)を得ることができることを示す。
また,Chaksuデータセットでは,非バイアスモデルに対する期待値に一致した結果が得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:31:56 GMT)
FS-DAG: Few Shot Domain Adapting Graph Networks for Visually Rich Document Understanding [1.0] Few Shot Domain Adapting Graph (FS-DAG)は、視覚的にリッチな文書理解(VRDU)のためのスケーラブルで効率的なモデルアーキテクチャである。
FS-DAGは、90M未満のパラメータを持つ高性能で、複雑な実世界の情報抽出(IE)用途に適している。
FS-DAGの能力は,情報抽出タスクの広範な実験により実証され,最先端手法と比較して収束速度と性能が著しく向上した。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:53:58 GMT)
Multimodal Generative AI for Story Point Estimation in Software Development [1.0] この研究は、アジャイルソフトウェア開発におけるストーリーポイント推定を強化するために、マルチモーダル・ジェネレーティブ・AI(Multimodal Generative AI)の適用について検討する。
BERT, CNN, XGBoostといった高度なモデルを用いてテキスト, 画像, 分類データを統合することにより, 従来の単一モーダル推定手法の限界を超えている。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:40:41 GMT)
Architecture independent generalization bounds for overparametrized deep ReLU networks [1.0] 過度パラメータ化ニューラルネットワークは、過度パラメータ化のレベルに依存しないテストエラーで一般化できることを示す。
入力空間次元で有界なトレーニングサンプルサイズを持つ過度にパラメータ化された深部ReLUネットワークに対して、勾配勾配を使わずにゼロ損失最小化器を明示的に構築する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:45:56 GMT)
xInv: Explainable Optimization of Inverse Problems [1.0] 逆問題は医療、気候科学、農業など幅広い分野の中心となっている。
本稿では,ドメインの抽象化において人間によって解釈可能な説明を生成する手法を提案する。
後処理では、言語モデルを使用してイベントのリストから説明を作成します。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:02:31 GMT)
Generalized Power Priors for Improved Bayesian Inference with Historical Data [1.0] プリエント・プリエント(英: power prior)は、ベイジアン・フレームワークに現在のデータと並んで歴史的データを組み込むように設計された情報的プリエント・クラスである。
パワー先行の鍵となる性質は、2つの擬後続分布の間のKL発散の線形結合を最小化することである。
この一般化により、データを$alpha$パラメータの適切な選択に適応させることで、パフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:26:40 GMT)
A Multi-Step Comparative Framework for Anomaly Detection in IoT Data Streams [0.9] IoT(Internet of Things)デバイスは重要なセキュリティ問題を導入し、正確な異常検出の必要性を強調している。
本稿では,前処理選択が3つの機械学習アルゴリズムに与える影響を評価する多段階評価フレームワークを提案する。
IoTID20データセットの実験は、GBoostingが前処理設定で常に優れた精度を提供することを示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:28:22 GMT)
Velocity Completion Task and Method for Event-based Player Positional Data in Soccer [0.9] イベントベースの位置データは、速度などの重要な特性を計算するのに必要な連続的な時間情報を欠いている。
本稿では,チームスポーツのイベントベース位置データのみを用いて,全てのエージェントの速度を同時に達成する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:01:49 GMT)
Password Strength Detection via Machine Learning: Analysis, Modeling, and Evaluation [0.8] 本研究では,システムパスワードクラッキングのさまざまな方法を紹介し,パスワード防衛戦略の概要と,パスワードセキュリティの領域における機械学習の適用について論じる。
パスワードの長、桁数、文字数、小文字数、特殊文字数など、複数の特徴を抽出する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:27:40 GMT)
Smaller, Smarter, Closer: The Edge of Collaborative Generative AI [0.8] GenAIは、レイテンシ、コスト、プライバシに関する懸念など、クラウド中心のデプロイメントにおける重要な制限を公開している。
この記事では、エッジリソースとクラウドリソースの両方を活用してこれらの課題に対処する、協調推論システムの可能性について説明する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:34:48 GMT)
Edge-First Language Model Inference: Models, Metrics, and Tradeoffs [0.8] 本研究は、単一エッジデバイス上でのSLM機能の詳細なベンチマークから始まる、エッジとクラウドのデプロイメント間の相互作用について検討する。
エッジ推論が低コストで同等のパフォーマンスを提供するシナリオや、スケーラビリティやモデルキャパシティの制限によりクラウドのフォールバックが不可欠になるシナリオを特定します。
プラットフォームレベルの比較と設計の洞察を,一様かつ適応的なLM推論システム構築のために提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:43:00 GMT)
AIDRIN 2.0: A Framework to Assess Data Readiness for AI [0.8] AIDRINは、AIアプリケーションのデータ準備性を評価し改善するフレームワークである。
データ品質、バイアス、公平性、プライバシといった重要なデータ準備性に対処する。
本稿では,ユーザインターフェースの改善と,プライバシ保護のためのフェデレーション学習フレームワークとの統合に焦点を当てる。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:24:31 GMT)
Exponential Convergence of CAVI for Bayesian PCA [0.8] 確率的主成分分析(PCA)とそのベイズ変種(BPCA)は、機械学習と統計の次元削減に広く用いられている。
本稿では,モデルが1つの主成分(PC)を使用する場合において,精度の高い指数収束結果を示す。
また,PCを数えるモデルに対してCAVIの指数収束性を証明するために,最近のツールを活用している。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:44:00 GMT)
Combining SNNs with Filtering for Efficient Neural Decoding in Implantable Brain-Machine Interfaces [0.8] スパイキングニューラルネットワーク(SNN)は、リソース効率の良いニューラルデコードのための有望なソリューションとして出現する。
LSTM(Long Short Term Memory)ネットワークは、最高の精度を実現する。
異なるフィルタによる結果は、最高のパフォーマンスを提供するBesselフィルタで示されます。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:52:24 GMT)
Safe Uncertainty-Aware Learning of Robotic Suturing [0.8] ミニマル補助侵襲手術は現在、訓練された外科医によって完全に手動で制御されている。
最近の研究は、有望な適応性を示す人工知能手法を活用している。
本稿では,安全かつ不確実性を考慮した学習手法の枠組みを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:31:18 GMT)
Contrastive Learning-Enhanced Trajectory Matching for Small-Scale Dataset Distillation [0.8] 画像合成におけるコントラスト学習を統合した新しいデータセット蒸留法を提案する。
提案手法は,データセットのサイズが著しく制約された場合でも,より情報的かつ多様な合成サンプルを生成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:20:52 GMT)
MADCluster: Model-agnostic Anomaly Detection with Self-supervised Clustering Network [0.7] 自己教師付きクラスタリングを利用したモデルに依存しない異常検出フレームワークMADClusterを提案する。
中心となる考え方は、通常のパターンデータを'単一クラスタ'にクラスタ化すると同時に、クラスタセンタを学習し、このセンタに近いデータをマッピングすることです。
4つの時系列ベンチマークデータセットの実験では、MADClusterを適用することで、比較モデルの全体的なパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:50:44 GMT)
Fusion of Foundation and Vision Transformer Model Features for Dermatoscopic Image Classification [0.7] 皮膚病変分類のための2つの視覚変換器 (ViT) アーキテクチャと比較し, 皮膚科固有の基礎モデルであるPanDermの有用性を検討した。
HAM10000とMSKCCの実験では、PanDermベースのモデルが微調整スウィントランスモデルと相容れない性能を示した。
今後は、さらなる基礎モデル、微調整戦略、高度な融合技術について検討する予定である。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:53:07 GMT)
Persistence-based Hough Transform for Line Detection [0.7] 永続ホモロジーに基づくHough空間のピークを検出するための代替投票手法を提案する。
この研究は、将来の研究を2つの重要な方向に刺激することを目指している。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:06:31 GMT)
A Japanese Language Model and Three New Evaluation Benchmarks for Pharmaceutical NLP [0.7] 本稿では,20億の日本製薬トークンと80億のイギリス製バイオメディカルトークンの継続事前学習を通じて開発された,医薬分野のドメイン固有言語モデルを提案する。
本稿では,国家薬剤師免許試験に基づくYakugakuQA,言語横断同義語と用語正規化を試験するNayoseQA,ペア文間の整合性推論を評価するSogoCheckの3つの新しいベンチマークを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:27:37 GMT)
KoBALT: Korean Benchmark For Advanced Linguistic Tasks [0.7] KoBALT (Korean Benchmark for Advanced Linguistic Tasks) は700の質問からなる言語的に動機付けられたベンチマークである。
韓国語における大規模言語モデル(LLM)の評価を推し進めるために設計された。
韓国の標準コーパスとn-gramの重複が最小限に抑えられた専門家による言語的動機付けの質問スイートを導入している。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:03:07 GMT)
All You Need is "Leet": Evading Hate-speech Detection AI [0.7] 本稿では,オンラインプラットフォーム上でのヘイトスピーチからユーザを守るためのブラックボックス手法を設計する。
我々の最高の摂動攻撃は、86.8%のヘイトフルテキストに対するヘイトスピーチ検出を回避できる。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:55:26 GMT)
Hybrid Parameterized Quantum States for Variational Quantum Learning [0.7] 変分量子学習は、ノイズの多い中間スケール量子(NISQ)時代に実践的な課題に直面している。
この研究は、量子化と古典化を補間する汎用モデリングフレームワークであるHybrid ized Quantum States (HPQS)を導入している。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:40:24 GMT)
CausalDynamics: A large-scale benchmark for structural discovery of dynamical causal models [0.7] CausalDynamicsは動的因果モデルの構造的発見を促進するためのフレームワークである。
我々のベンチマークは、数千の常微分方程式から導かれる真の因果グラフで構成されている。
本研究では, ノイズ, 畳み込み, タグ付けされた動的システムにおいて, グラフ再構成のための最先端因果探索アルゴリズムを包括的に評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:54:30 GMT)
Bayesian Optimization for Enhanced Language Models: Optimizing Acquisition Functions [0.7] 大規模な言語モデルの微調整を改善するために,バイレベルBO戦略と組み合わせたモデル融合アプローチであるBilevel - BO - SWAを導入する。
内ループはトレーニング損失の最小化を行い,外ループはw.r.t.valメトリックを最適化する。
RoBERTA-baseを用いたGLUEタスクの実験では、EIとUCBを使用すると、一般化が向上し、チューニングが最大2.7%改善できることが示されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:16:56 GMT)
Learning novel representations of variable sources from multi-modal $\textit{Gaia}$ data via autoencoders [0.6] 本稿では,複数のガイアデータ生成物を取り込み,恒星とクエーサーの変動の教師なし分類を実現する機械学習手法の提案と評価を行う。
3つの変分オートエンコーダ(VAE)のトレーニングには400万ガリアDR3ソースのデータセットが使用される
1つのVAEは、ガイアXP低分解能スペクトルで、もう1つは、ガイアG帯の大きさ差の分布に基づく新しいアプローチで、もう1つは折り畳まれたガイアG帯光曲線で訓練されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:21:54 GMT)
EMULATE: A Multi-Agent Framework for Determining the Veracity of Atomic Claims by Emulating Human Actions [0.6] EMULATEは、マルチエージェントフレームワークを使うことで、人間のアクションをよりうまくエミュレートするように設計されている。
いくつかのベンチマークの実験では、以前の作業よりも明らかな改善が示され、新しいマルチエージェントフレームワークの有効性が実証された。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:08:08 GMT)
Resource for Error Analysis in Text Simplification: New Taxonomy and Test Collection [0.6] 本稿では,簡易テキストにおける誤りの検出と分類のためのテストコレクションを提案する。
まず,情報歪みに着目した誤り分類を提案する。
次に、自動単純化された科学的テキストの並列データセットを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:45:14 GMT)
Transformer brain encoders explain human high-level visual responses [0.6] 本研究では,高次視覚処理において,レチノトピックな視覚特徴をカテゴリー選択領域に動的にルーティングする方法について検討する。
この計算モチーフは、自然界の観察において脳活動を予測する他の方法よりもはるかに強力であることを示す。
提案手法は,レチノトピックマップからの視覚情報をカテゴリ選択領域への入力内容の関連性に基づいてルーティングする機構モデルを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:48:15 GMT)
SuperPure: Efficient Purification of Localized and Distributed Adversarial Patches via Super-Resolution GAN Models [0.6] 本稿では,SuperPureと呼ばれる敵パッチ攻撃に対する新たな防御戦略を提案する。
マスクは、GANベースの超解像度スキームを活用して、敵のパッチから画像を徐々に浄化する。
評価の結果,SuperPureは最先端の3つの方向を推し進めている。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:21:04 GMT)
Solving and visualizing fractional quantum Hall wavefunctions with neural network [0.6] 磁場中における2次元クーロン電子ガスの問題を変動的に解くために,注意に基づくフェルミオン型ニューラルネットワーク(FNN)を導入する。
我々のFNNは、LLプロジェクションされた正確な対角化(ED)よりも一貫してエネルギーを低くし、基底状態の波動関数を高精度に学習する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:58:25 GMT)
Simulating Time Dependent and Nonlinear Classical Oscillators through Nonlinear Schrödingerization [0.6] 本稿では,古典振動子系の力学をシミュレーションするための量子アルゴリズムを提案する。
我々の研究は、非保守的および非線形古典システムの力学をシミュレートするために量子アルゴリズムの適用性を拡張した。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:48:42 GMT)
A Framework for Multi-View Multiple Object Tracking using Single-View Multi-Object Trackers on Fish Data [0.6] この論文は、生態学研究における水中魚の検出と追跡に最先端のシングルビューMOTモデルであるFairMOTとYOLOv8を適用している。
提案フレームワークは,魚の個体を相対的精度47%で検出し,立体マッチング技術を用いて新しい3D出力を生成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:12:08 GMT)
A Multi-Head Attention Soft Random Forest for Interpretable Patient No-Show Prediction [0.5] 予定外の予定は、医療提供者と患者の健康の両方に悪影響を及ぼす。
本稿では,アテンション機構をランダムな森林モデルに統合するハイブリッド型マルチヘッドアテンションソフトランダムフォレストモデルを提案する。
このモデルは93.56%の精度、93.67%の精度、93.56%のリコール、93.59%のF1スコアを示し、決定木、ロジスティック回帰、ランダム森林、ナイーブベイズモデルを上回った。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:34:29 GMT)
Artificial intelligence in digital pathology: a systematic review and meta-analysis of diagnostic test accuracy [0.5] この体系的なレビューとメタアナリシスは、あらゆる種類の人工知能を用いた診断精度の研究を含む。
包含物として100の研究が同定され、152,000枚以上のスライド画像 (WSI) に相当し、多くの病型を表わした。
これらの研究では、平均感度は96.3%(CI 94.1-97.7)、平均特異度は93.3%(CI 90.5-95.4)であった。
全体として、AIはWSIに適用した場合に適切な精度を提供するが、そのパフォーマンスをより厳格に評価する必要がある。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:46:11 GMT)
SHAP zero Explains Biological Sequence Models with Near-zero Marginal Cost for Future Queries [0.5] SHAP 0は、大規模な生物学的データセット間でShapley値のコストを償却する新しいアルゴリズムである。
1回のモデルスケッチのステップの後、SHAP 0は将来のクエリでほぼゼロの限界コストを実現する。
この研究は、生物学におけるブラックボックスシーケンスモデルの原理的、効率的、スケーラブルな解釈可能性への扉を開く。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:58:50 GMT)
NSW-EPNews: A News-Augmented Benchmark for Electricity Price Forecasting with LLMs [0.5] NSW-EPNewsは,実世界の電力価格予測において時系列モデルと大規模言語モデル(LLM)を共同で評価する最初のベンチマークである。
データセットには、ニューサウスウェールズ州(2015-2024)から17万5000時間以上のスポット価格、毎日の温度測定、WattClarityからのマーケットニューズサマリーのキュレーションが含まれている。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:13:30 GMT)
Mitigating Overfitting in Medical Imaging: Self-Supervised Pretraining vs. ImageNet Transfer Learning for Dermatological Diagnosis [0.5] 本研究では,高価値皮膚科学的特徴を抽出する教師なし学習フレームワークを提案する。
我々は、独自の皮膚科学データセットに基づいて、スクラッチから訓練された変分オートエンコーダを用いる。
自己教師付き学習は、安定した改善、より強力な一般化、優れた適応性を達成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:15:17 GMT)
ChronoFlow: A Data-Driven Model for Gyrochronology [0.5] ジャロクロノロジー(英: Gyrochronology)は、恒星の周期を回転周期で制限する技法であり、磁気ブレーキによって恒星の主系列寿命が変化する。
我々はこれまでに、オープンクラスタにおけるロータネータの最大の標準データカタログを、1.5 Myrから4 Gyrまでの30個のオープンクラスタ/アソシエーションにまたがる$$8,000の星で組み立てた。
クロノフローは、モデル回転進化を正確に前進させ、星団年齢と個々の恒星年齢の両方を推定するために使用できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:52:35 GMT)
BACON: A fully explainable AI model with graded logic for decision making problems [0.5] 本稿では,意思決定問題に対する説明可能なAIモデルの自動トレーニングフレームワークであるBACONを紹介する。
BACONは、完全な構造的透明性と正確な論理ベースのシンボリック説明を提供しながら、高い予測精度を達成する。
これらの結果から、BACONは実践的で原則的なアプローチとして、信頼できるAIを提供する可能性を示している。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:50:56 GMT)
Quantum circuits for partial differential equations in Fourier space [0.5] 量子フーリエ変換(QFT)は,特に簡単な量子回路の設計を可能にすることを示す。
回路は次元に関して効率的であり、現在の量子コンピュータが高次元PDEを解くための道を開く。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:53:17 GMT)
A Survey of Safe Reinforcement Learning and Constrained MDPs: A Technical Survey on Single-Agent and Multi-Agent Safety [0.4] セーフ強化学習(Safe Reinforcement Learning, SafeRL)は、エージェントの学習と展開において、安全上の制約を明示的に扱う強化学習のサブフィールドである。
この調査は、制約付きマルコフ決定過程(CMDP)に基づくSafeRLの数学的に厳密な定式化の概要と、マルチエージェントセーフRL(SafeMARL)の拡張を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:26:12 GMT)
Arrival Control in Quasi-Reversible Queueing Systems: Optimization and Reinforcement Learning [0.4] 本稿では,準可逆待ち行列システムの到着率を最適化するための多目的スキームを提案する。
準可逆性キューシステムにバランスの取れた到着制御ポリシを補足することで、準可逆性を維持できることを示す。
我々は、入場制御の問題に焦点を合わせ、最適化と強化学習の枠組みにおいて結果を活用する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:05:36 GMT)
Energy Consumption Framework and Analysis of Post-Quantum Key-Generation on Embedded Devices [0.4] NIST は PQC (Post-Quantum Cryptography) アルゴリズムの標準化に反応し、ML-KEM は鍵交換のために ECDH を置き換える予定である。
本稿では,鍵生成を行う場合のRaspberry Pi上でのPQCエネルギー消費量を測定するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:49:18 GMT)
DRIP: DRop unImportant data Points -- Enhancing Machine Learning Efficiency with Grad-CAM-Based Real-Time Data Prioritization for On-Device Training [0.4] Grad-CAMは、データセット全体にアクセスすることなく、データポイント保持に関するオンライン決定を行う。
これは、データセット全体にアクセスする必要なく、データポイント保持に関するオンライン決定を行う最初のアルゴリズムである。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:03:08 GMT)
Collaboration among Multiple Large Language Models for Medical Question Answering [0.4] 本稿では,医療用マルチ選択質問データセットに基づくマルチLLM協調フレームワークを提案する。
我々のフレームワークは、全てのLSMの推論能力を高め、質問間の相違を緩和することが証明されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:18:45 GMT)
Quantum Mpemba effect without global symmetries [0.4] 量子Mpemba効果(QME)は、大域対称性を欠く非可積分多体系においてユビキタスであることを示す。
以上の結果から,QMEと古典的熱緩和と,予熱やエルゴディディディティの弱さといった現象を結びつけた統合的なQMEの枠組みが得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:00:01 GMT)
Joint Flow And Feature Refinement Using Attention For Video Restoration [0.4] 本稿では,JFFRA (Joint Flow and Feature Refinement using Attention) という新しいビデオ修復フレームワークを提案する。
提案手法は,最先端手法と比較して最大1.62dBの性能向上を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:18:51 GMT)
Wavelet Probabilistic Recurrent Convolutional Network for Multivariate Time Series Classification [0.4] 確率的特徴を抽出・解析する多目的ウェーブレット確率モジュールを提案する。
このモジュールは、さまざまなニューラルネットワークアーキテクチャとシームレスに統合できる。
WPRCNは30種類のMSSデータセットで評価され、平均精度とランクで全てのベンチマークアルゴリズムを上回っている。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:57:50 GMT)
Optimizing Image Capture for Computer Vision-Powered Taxonomic Identification and Trait Recognition of Biodiversity Specimens [0.4] コンピュータビジョンに最適化された生物学的検体画像を作成するための重要な考察について述べる。
これらの勧告は、分類学者、収集管理者、生態学者、コンピュータ科学者の学際的なコラボレーションを通じて合成された。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:11:05 GMT)
Neuromorphic-based metaheuristics: A new generation of low power, low latency and small footprint optimization algorithms [0.4] ニューロモルフィックコンピューティング(NC)は、Von Neumannアーキテクチャの従来のデジタルコンピューティングからの大きなシフトを表す新しいアルゴリズムパラダイムを導入している。
NCの研究の多くは、機械学習の応用と神経科学シミュレーションに集中している。
本稿では,最適化アルゴリズム,特にメタヒューリスティックスのモデル化と実装を,フォン・ノイマンアーキテクチャの代替としてNCパラダイムを用いて検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:14:07 GMT)
Multi-modal Integration Analysis of Alzheimer's Disease Using Large Language Models and Knowledge Graphs [0.3] 本稿では,大規模言語モデル(LLM)と知識グラフを用いたアルツハイマー病(AD)研究において,断片化されたマルチモーダルデータを統合するための新しい枠組みを提案する。
本手法は,MRI,遺伝子発現,バイオマーカー,脳波,臨床指標の集団レベルでの統合を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:58:27 GMT)
Maximum Separation of Quantum Communication Complexity With and Without Shared Entanglement [0.3] 入力サイズが$n$である関係問題を、絡み合い支援量子通信モデルのための通信無しで解くことができる。
これは、共有絡み合いと非共有絡み合いによる量子通信複雑性の最大分離である。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:41:04 GMT)
Robust and Fine-Grained Detection of AI Generated Texts [0.3] 既存のシステムは、短いテキストよりもAI生成したコンテンツを正確に識別するのに苦労することが多い。
本稿では,トークン分類のタスクのために構築されたモデルについて紹介する。
また,23言語以上のプロプライエタリなLLMが主に共著する2.4M以上のテキストのデータセットも導入した。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:09:18 GMT)
Approach to Finding a Robust Deep Learning Model [0.3] 機械学習(ML)と人工知能(AI)のアプリケーションの開発は、多数のモデルのトレーニングを必要とする。
本稿ではメタアルゴリズムとして設計したモデル選択アルゴリズムを用いてモデルロバスト性を決定する新しい手法を提案する。
本フレームワークでは,学習モデルの堅牢性に及ぼすトレーニングサンプルサイズ,モデル重み,帰納的バイアスの影響について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 20:05:20 GMT)
A modular framework for automated evaluation of procedural content generation in serious games with deep reinforcement learning agents [0.3] 本研究では,Serious GamesにおけるPCG統合の自動評価手法を提案する。
非プレイヤーキャラクタ(NPC)作成用PCGの3つの異なるバージョンがテストされている。
結果は、バージョン2と3でトレーニングされたDRLゲームテストエージェントが、バージョン1でトレーニングされたエージェントよりも、勝利率とトレーニング時間の点で優れていることを強調している。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:40:56 GMT)
SINDyG: Sparse Identification of Nonlinear Dynamical Systems from Graph-Structured Data [0.3] グラフ構造化データ(SINDyG)から動的システムのスパース同定法を開発した。
SINDyGはネットワーク構造をスパース回帰に組み込んで、基礎となるネットワーク力学を説明するモデルパラメータを識別する。
本実験は, ネットワーク力学の精度向上と簡易性を検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:37:55 GMT)
Cohort-Based Active Modality Acquisition [0.3] 本稿では,コホートに基づくアクティブモダリティ獲得 (CAMA) を導入し,追加のモダリティを受けるサンプルを選択する際の課題を定式化する。
生成的計算と識別的モデリングを組み合わせた獲得戦略を導出する。
共用マルチモーダルデータセットの実験により,提案手法が新たなサンプルの獲得をより効果的に導くことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:32:50 GMT)
Impact of Leakage on Data Harmonization in Machine Learning Pipelines in Class Imbalance Across Sites [0.2] 我々は,クラスバランスがサイト間で等しくないシナリオにおいて,ComBatベースのデータ調和手法の有効性について検討した。
ターゲットラベルを装いながらデータを調和させる新しいアプローチであるPrettYharmonizeを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:54:52 GMT)
MuseRAG: Idea Originality Scoring At Scale [0.2] 周波数に基づく独創性スコアリングのための完全自動化された心理測定検証パイプラインを提案する。
MuseRAGは人間のアノテータとアイデアのクラスタリング構造と解像度を一致させる。
我々の研究は、創造性研究を支援するために、意図に敏感で人間と協調した独創性を大規模にスコアリングすることを可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:05:25 GMT)
Semi-decentralized Training of Spatio-Temporal Graph Neural Networks for Traffic Prediction [0.2] スマートモビリティ領域における時空間グラフ時間ニューラルネットワーク(ST-GNN)のための半分散トレーニング手法を探索し,適応する。
センサを複数のクラウドレットに近接してグループ化するシミュレーションフレームワークを実装した。
半分散的なセットアップは、パフォーマンスメトリクスの集中的なアプローチと同等であることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:00:52 GMT)
PMPO: Probabilistic Metric Prompt Optimization for Small and Large Language Models [0.2] PMPOはトークンレベルのクロスエントロピー損失を直接的かつ軽量な評価信号として利用するプロンプトを洗練するフレームワークである。
従来の方法とは異なり、最適化中に出力サンプリングや人的評価は必要とせず、フォワードパスとログライクな条件にのみ依存する。
実験の結果、PMPOはモデルのサイズやタスクにまたがる先行メソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:59:10 GMT)
Investigating Fine- and Coarse-grained Structural Correspondences Between Deep Neural Networks and Human Object Image Similarity Judgments Using Unsupervised Alignment [0.1] 我々は、Gromov-Wasserstein Optimal Transportに基づく教師なしアライメント手法を用いて、人間とモデルオブジェクトの表現を比較する。
CLIPでトレーニングされたモデルは、人間のオブジェクト表現と強い微粒化と粗粒化のマッチングを一貫して達成している。
この結果から,正確な対象表現の獲得における言語情報の役割について,新たな知見が得られた。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:06:06 GMT)
Beyond Correlation: Towards Causal Large Language Model Agents in Biomedicine [0.1] 大規模言語モデル(LLM)は、生医学において有望であるが、真の因果理解が欠如しており、代わりに相関に依存する。
本稿では、マルチモーダルデータ(テキスト、画像、ゲノムなど)を統合し、介入に基づく推論を行い、原因と効果を推測する因果的LLMエージェントを構想する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:52:59 GMT)
Derivative coupling in horizon brightened acceleration radiation: a quantum optics approach [0.1] 水平明滅加速放射(Horizon Brightened Acceleration Radiation, HBAR)は、一意の放射過程を示し、平らな時/曲がった時空における加速放射を探索する上で有望な枠組みを提供する。
この結果から, 点状検出器の遷移確率は周波数に依存しないことが示唆された。
これは、検出器の感度を周波数に調整し、有効周波数範囲を広げる局所重力場の影響と解釈できる。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:58:22 GMT)
Algorithmic Collusion by Large Language Models [0.1] 我々は,Large Language Models(LLMs)に基づくアルゴリズム価格設定エージェントによる実験を行う。
LLMをベースとしたエージェントは価格設定に長けており、オリゴポリー設定で超競争的な価格と利益を自律的に得ることができる。
新規技術を用いたオフパス解析は、これらの現象に寄与するとして価格戦争の懸念を明らかにする。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:33:41 GMT)
Extending Quantum Computing through Subspace, Embedding and Classical Molecular Dynamics Techniques [0.1] 量子コンピュータを用いた化学システムの研究を容易にする技術について概説する。
マルチスケール/マルチ物理シミュレーションワークフロー内に展開された量子選択型構成相互作用の実証-概念実証について述べる。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:37:00 GMT)
End-to-End Framework for Predicting the Remaining Useful Life of Lithium-Ion Batteries [0.0] 本稿では、最近のチャージ放電サイクルのデータを利用して残りの使用可能なサイクル数を推定するRUL予測手法を提案する。
提案手法は101.59のRMSEを達成し,実世界のRUL予測への応用の可能性を強調した。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:28:18 GMT)
Vibrational Quantum States of Methanol [0.0] メタノール分子は、天文化学、天体物理学、基礎物理学の感度の高いプローブである。
実次元で強調される初期ポテンシャルエネルギー面(PES)と数値的に正確な量子力学の計算。
開発は、宇宙空間や精密科学実験室でメタノールを探索するために用いられる可逆プローブへの道を開く。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:54:53 GMT)
Vibrational ADAPT-VQE: Critical points leads to problematic convergence [0.0] 無限積表現に基づく振動型ADAPT-VQE(vADAPT-VQE)の定式化を行う。
VADAPT-VQEアルゴリズムがFVCI波動関数を表す演算子の列を生成するかどうかを数値的に検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:15:16 GMT)
ViDoRe Benchmark V2: Raising the Bar for Visual Retrieval [0.0] ViDoRe Benchmark V2では、視覚的なコンテキストクエリ、長いドキュメントクエリによる現実的で挑戦的な検索シナリオが導入されている。
4つの多言語データセットで構成され、明確な評価指示を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:13:02 GMT)
Variational quantum state diagonalization with computational-basis probabilities [0.0] 本稿では,変分量子回路の最適化に基づく新しい量子対角化アルゴリズムを提案する。
提案手法は,入力量子状態の対角形生成に成功していることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:37:19 GMT)
Variational Quantum Algorithm for Solving the Liouvillian Gap [0.0] 開量子系において、リウヴィリアギャップは定常状態への緩和時間を特徴づける。
本稿では,Louvillianギャップを効率的に推定するための変分量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:59:55 GMT)
Vague Knowledge: Evidence from Analyst Reports [0.0] 我々は、言語が主観的な期待を表現する上で重要であるが、あまり知られていない役割を担っていると論じる。
彼らのレポートでは、アナリストは言語表現に有用な情報を含んでいるが、数値予測は含まない。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:27:15 GMT)
VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification [0.0] 本稿では,VR-FuseNetと呼ばれる新しいハイブリッドディープラーニングモデルを提案することによって,糖尿病網膜症自動検出のための包括的アプローチを提案する。
提案したVR-FuseNetモデルは、最先端の畳み込みニューラルネットワークであるVGG19と、その深い階層的特徴抽出で知られるResNet50V2の強みを組み合わせたものだ。
このモデルは、糖尿病網膜症分類タスクにおけるハイブリッド特徴抽出の有効性を示すすべてのパフォーマンス指標において、個々のアーキテクチャよりも優れている。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:26:26 GMT)
VIVID: A Novel Approach to Remediation Prioritization in Static Application Security Testing (SAST) [0.0] VIVID - Vulnerability Information Via Data Flow - SASTの洞察を抽出し、消費する新しい方法である。
本研究では,高脆弱性トラフィックを示すファイルに,外度,間性中心性,固有ベクトル内中心性,直交接続性を関連づけたシミュレーションを行った。
これは、セキュリティコントロールを組み込むためのエビデンスベースの優先順位付けされたファイルのリストを自動的に開発チームに提供する新しい方法である。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:16:56 GMT)
Utilizing citation index and synthetic quality measure to compare Wikipedia languages across various topics [0.0] 本研究は,合成品質指標とともに引用指標を用いたウィキペディア語版55版の比較分析を行った。
それぞれのトピックと言語のバージョンで最も引用された記事のトップ10、トップ25、トップ100を選択した。
このインデックスは各言語版ウィキペディア記事間のウィキリンクに基づいて構築され、660億ページ間のリンクレコードを処理した。
次に、Wikipediaの各記事の品質スコアを使用しました。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:41:55 GMT)
Using Echo-State Networks to Reproduce Rare Events in Chaotic Systems [0.0] 競合するLotka-Volterraモデルのカオス的魅力を学習し、尾や稀な事象を含む依存変数のヒストグラムを再現する。
一般化極値分布を用いて尻尾挙動の定量化を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:21:05 GMT)
Use of Electron Paramagnetic resonance (EPR) technique to build quantum computers: n-qubit (n=1,2,3,4) Toffoli Gates [0.0] 理論的には、電子スピンを量子ビットとして使用し、交換相互作用によって互いに結合し、共鳴におけるn量子ビットの構成を設定する、EPR手法の使い方が示されている。
これは、交換結合された電子スピンが使用されるEPRに特有のものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:39:12 GMT)
Tropical Attention: Neural Algorithmic Reasoning for Combinatorial Algorithms [0.0] 本稿では,熱帯幾何の最大半減期で機能する新しい注意関数であるトロピカルアテンションを紹介する。
熱帯の注意は、ソフトマックスから外れたシャープでスケール不変な推論を復元することを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:01:25 GMT)
Tracking the Flight: Exploring a Computational Framework for Analyzing Escape Responses in Plains Zebra (Equus quagga) [0.0] 本研究では,ドローンの動きから動物の動きを分離する3つのアプローチを評価する。
最良性能の手法を用いて,個々の軌跡を抽出し,重要な行動パターンを同定する。
これらの洞察は、この方法の有効性と、より大きなデータセットにスケールする可能性を強調している。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:36:52 GMT)
Towards Trustworthy Keylogger detection: A Comprehensive Analysis of Ensemble Techniques and Feature Selections through Explainable AI [0.0] キーロガー検出は、タイピングと文字表示の遅延のような異常なシステム動作の監視を含む。
本研究では,従来の機械学習モデルを用いたキーロガー検出の包括的解析を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:04:13 GMT)
Template-Guided 3D Molecular Pose Generation via Flow Matching and Differentiable Optimization [0.0] タンパク質結合部位内の小さな分子の3Dコンホメーションを予測することは、薬物設計において重要な課題である。
本稿では,2段階の方法を提案する。
リガンドコンフォーメーション ジェネレーション 誘導。
テンプレートだ
私たちは新しいベンチマークでアプローチを評価します。
リガンドペアは同じターゲットで共結晶し、性能が向上することを示す。
標準ドッキングツールとオープンアクセスアライメントメソッド。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:50:51 GMT)
TI-DeepONet: Learnable Time Integration for Stable Long-Term Extrapolation [0.0] TI-DeepONetは、ニューラルネットワークと適応的な数値タイムステッピング技術を統合するフレームワークである。
本研究は,ニューラルネットワークを数値解析でブリッジする物理認識演算子学習パラダイムを確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:24:31 GMT)
TAPAS: A Pattern-Based Approach to Assessing Government Transparency [0.0] TAPAS(Transparency Anti-Pattern Assessment System)について紹介する。
TAPASは、透明性を妨げる行動パターンを識別することで、政府の透明性を評価するために設計された、データ駆動の方法論である。
我々は、TAPASが継続的なモニタリングを可能にし、重要なリソース投資を必要とせず、実用的な洞察を提供することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:01:42 GMT)
Strict advantage of complex quantum theory in a communication task [0.0] 量子論における複素振幅の存在が、対応する実定式化よりも運用上の優位性をもたらすかを検討する。
複雑な量子論が通信コストを著しく低くする単純な通信課題を同定する。
これは複素量子論の厳密な運用上の利点を裏付けるものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:06:09 GMT)
Statistical analysis of level spacing ratios in pseudo-integrable systems: semi-Poisson insight and beyond [0.0] 擬可積分状態における量子系の統計的性質について検討する。
本システムは,8 nu 16 $ GHzの周波数範囲で半ポアソン挙動を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:22:37 GMT)
Social Bias in Popular Question-Answering Benchmarks [0.0] 質問応答(QA)と読解理解(RC)ベンチマークは,知識の検索と再生において,大規模言語モデル(LLM)の能力を評価する上で不可欠である。
一般的なQAおよびRCベンチマークは偏りがあり、代表的な方法で異なる人口層や地域に関する質問をカバーしていないことを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:39:49 GMT)
Small but large: Single organic molecules as hybrid platforms for quantum technologies [0.0] 固体マトリックスに埋め込まれた単一の有機分子は、顕著な光学的性質を示す。
このシステムが含む豊富な内部状態について詳しく検討し、量子メモリ、スピン光子インタフェース、スピンレジスタ、光力学の応用にそれらを活用するための戦略を提唱する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:38:29 GMT)
Sharp concentration of uniform generalization errors in binary linear classification [0.0] 均一な一般化誤差と期待値との収束は、非常に広い設定で起こることが示されている。
この収束を用いて、次元自由条件下での大数の一様法則を確立する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:14:50 GMT)
Serious Games: Human-AI Interaction, Evolution, and Coevolution [0.0] 本研究の目的は,人間とAIの相互作用,進化,共進化に関連するEGTモデルについて検討することであった。
ホーク・ドヴゲームは、対立のコストに基づいてバランスの取れた混合戦略均衡を予測する。
反復囚人のジレンマは、反復的な相互作用が認知的共進化を引き起こす可能性があることを示唆している。
The War of Attritionは、資源の競争が戦略的共進化をもたらす可能性を示唆している。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:41:37 GMT)
Security of deterministic key distribution with higher-dimensional systems [0.0] 2005年にM. Lucamarini と S. Mancini によって設計された双方向量子鍵分配プロトコルのセキュリティ面を決定する。
我々は、盗聴者による個人攻撃と集団攻撃の両方に対して任意の有限次元システムを用いる。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:04:17 GMT)
Scaling Quantum Simulation-Based Optimization: Demonstrating Efficient Power Grid Management with Deep QAOA Circuits [0.0] この研究は、QAOAベースのQuSOソルバのシミュレーションコンポーネントに対して、指数関数の高速化を証明した最初の理論的結果を拡張した。
我々は、コストのかかる量子ビット要求を回避できる、非常に効率的な古典的量子回路シミュレーションを開発した。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:33:29 GMT)
Satellite-assisted Entanglement Distribution with High-Dimensional Photonic Encoding [0.0] 衛星支援型絡み合い分布は、長距離量子ネットワークの実現に有望なアプローチである。
我々は、既存の衛星互換パラメトリックダウン変換源とクウディト互換量子メモリを地上で組み合わせることで、それを回避できることを実証する。
我々は、数秒で達成可能なコヒーレンス時間を実現し、ミシウス衛星の衛星性能を実証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:58:37 GMT)
SHaDe: Compact and Consistent Dynamic 3D Reconstruction via Tri-Plane Deformation and Latent Diffusion [0.0] 本稿では3つの重要な要素を統合した動的3次元シーン再構成のための新しいフレームワークを提案する。
明示的な三面変形場、球面調和(SH)注目の視野条件付き正準場、時間的に認識される潜在拡散。
提案手法は,時間とともに進化する3つの2次元特徴面を用いて4次元シーンを符号化し,効率的なコンパクト表現を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:25:38 GMT)
Rotation angles of a rotating disc -- A toy model exhibiting the geometric phase -- [0.0] 固定円盤の端面に回転する円盤を滑り込まない単純な運動モデルを考える。
回転角は、動的位相 $Delta_d$ と幾何位相 $Delta_g$ の2つの部分からなる。
我々のモデルは微分幾何学やガウス・ボンネットの定理、幾何学的位相、ファイバーバンドルといった理論物理学において不可欠な概念を具現化している。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:58:05 GMT)
Role of Nonstabilizerness in Quantum Optimization [0.0] 量子近似最適化アルゴリズム(QAOA)の資源要件について検討する。
最終解状態へのアプローチにおいて,QAOAの非安定化剤性は,回路深さが最大に達する前に増加し,再び低下することを示す。
簡単な再スケーリングの下で崩壊する異なる深さに対応する曲線を見つけ、最終的な非安定度と成功確率との間には非自明な関係を明らかにする。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:00:03 GMT)
Robust Invariant Representation Learning by Distribution Extrapolation [0.0] 不変リスク最小化(IRM)は、ディープラーニングにおけるアウト・オブ・ディストリビューションの一般化を可能にすることを目的としている。
IRMv1を含む既存のアプローチでは、ペナルティベースの単一レベル近似を採用している。
合成分布シフトによるITMペナルティの増大により環境多様性を高める新しい枠組みが提案されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:03:34 GMT)
Revenue Optimization with Price-Sensitive and Interdependent Demand [0.0] 本文書は、直行便の航空券の販売の価格と量に関する決定に焦点を当てている。
Air Franceは実際のデータを使って事前にそれを見積もっているので、私たちは需要データが与えられると仮定します。
我々の目標は、事前に定義されたオプションセットから各商品の価格を選択することで、直接飛行の収益を最大化することです。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:57:43 GMT)
Reinforcement Learning Based Quantum Circuit Optimization via ZX-Calculus [0.0] 本稿では,ZX-ダイアグラムのグラフ理論的単純化規則を用いて,量子回路を最適化するための新しい強化学習法を提案する。
そこで本研究では,ZX-Calculusをベースとした最良性能のアルゴリズムと比較し,提案手法の能力を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:06:26 GMT)
Redemption Score: An Evaluation Framework to Rank Image Captions While Redeeming Image Semantics and Language Pragmatics [0.0] 償却スコア(英: Redemption Score)は、3つの相補的な信号を三角測量することによって画像キャプションをランク付けする新しいフレームワークである。
Flickr8kベンチマークで、Redemption ScoreはKendall-$tau$ 56.43を達成し、12の先行手法を上回った。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:35:12 GMT)
Reconciling Privacy and Explainability in High-Stakes: A Systematic Inquiry [0.0] 科学分野におけるディープラーニングの優位性は、高い意思決定を形作っている。
本稿では,RTP(Right-to-Privacy)とRTE(Right-to-Explanation)を組み合わせる複雑さについて検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:09:00 GMT)
Quasiperiodic trajectories drawn by the Bloch vector of the thermal multiphoton Jaynes-Cummings model [0.0] 熱多光子Jaynes-Cummingsモデル(JCM)のBlochベクトルの時間発展について検討する。
軌道を一定時間間隔で離散時間列としてプロットすると、予期せぬ規則性を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:38:49 GMT)
Quantum-to-classical transition and the emergence of quantum Darwinism with measurements distributed in time -- a path integral approach [0.0] 連続的な測定を取り入れた経路積分的アプローチを考慮し、量子世界における古典力学の出現のための新しい定式化を提案する。
確率振幅への支配的な寄与は、古典的な経路の近傍の軌跡に由来する。
連続的な極限において、各系軌跡は、プローブからの運動量キックによる作業により、追加の位相を拾うことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:47:51 GMT)
Quantum thermodynamics of continuous feedback control [0.0] 我々は、連続的な測定とフィードバック制御の下で、オープン量子系における熱力学の法則の定式化を行う。
作業、熱、測定によるエネルギー変化の表現を導出する。
この結果は、連続的なフィードバック制御の下での古典的および量子システムの不可逆性と同様に、エネルギーに関する洞察を与える。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:50:18 GMT)
Quantum response theory and momentum-space gravity [0.0] 発散型マルチバンドシステムにおける運動量空間重力に対する量子応答法を提案する。
重力の観点から、創発的項の重要性を論じる。
運動量空間における双対量子幾何学的ドラッグ力を特定し、アインシュタイン場方程式の多バンド行列のエントロピー源項を提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:49:23 GMT)
Quantum Systems with jump-discontinuous mass. I [0.0] 質量プロファイルがジャンプ不連続を示す1次元の自由量子粒子を考える。
スケールフリー境界条件の族に対しては、関連するスペクトル問題を解析する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:10:53 GMT)
Quantum Averaging Theory for Multi-Timescale Driven Quantum Systems [0.0] 本稿では、周期的およびほぼ周期的に駆動される量子システムをモデル化するためのマルチスケール量子平均化理論(QAT)を提案する。
マグナス展開を複数のスケールで平均化する方法に統合することにより、QATはシステム力学に対する遠距離および近距離共振相互作用の影響を捉える。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:03:50 GMT)
Privacy-Aware Cyberterrorism Network Analysis using Graph Neural Networks and Federated Learning [0.0] サイバーテロはデジタルインフラに深刻な脅威をもたらす。
プライバシ対応フェデレーショングラフニューラルネットワークフレームワークを提案する。
GNNは、ユーティリティ、プライバシ、堅牢性を損なうことなく、大規模なサイバー脅威検出をサポートすることができる。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:26:09 GMT)
Preparation of Schrödinger cat quantum state using parametric down-conversion interaction [0.0] Schr"odinger cat (SC) 状態は、非ガウス的な性質のため、量子光学において重要である。
本稿では, 縮退パラメトリックダウンコンバージョンと, ポンプモードにおける光子数測定を併用した, 明るい(多重光子)SC状態の条件付き生成法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:18:03 GMT)
PersonaBOT: Bringing Customer Personas to Life with LLMs and RAG [0.0] 本論文の主な目的は、合成顧客ペルソナを生成し、それらを検索型拡張世代(RAG)に統合することである。
Few-Shotは優れたChain-of-Thought(CoT)を推進し、より完全なペルソナを生成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:04:34 GMT)
Persistent fermionic entanglement under decoherence [0.0] 4つのアクセシブルな状態を持つ2つの不明瞭なフェルミオンは、一定温度でボソニック浴とカップリングするため、消散することなく脱コヒーレンスに悩まされる。
浴槽との相互作用によるノイズの影響にもかかわらず, 進化を通じて絡み合いが完全にあるいは部分的に持続する2つのフェミオン状態の家族を同定した。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:27:06 GMT)
Optimising the decision threshold in a weighted voting system: The case of the IMF's Board of Governors [0.0] 我々は、各閾値のバンジャフ指標を50%から87%に算定することにより、決定しきい値と各国の事前投票力の関連を分析する。
クオータと投票権の差は、決定しきい値が58%または60%であれば最小化される。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:21:23 GMT)
Optimal statistical ensembles for quantum thermal state preparation within the quantum singular value transformation framework [0.0] 統計力学では、熱平衡のミクロ状態は統計アンサンブルから得られる。
本稿では,量子特異値変換の枠組み内に一般化アンサンブルを実装する量子アルゴリズムを提案する。
我々は,小さな有限サイズのシステムであっても,計算コストを大幅に削減できることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:46:32 GMT)
Operational simultaneous correlations in complementary bases of bipartite states via one-sided semi-device-independent steering [0.0] 両立状態において, 相互に偏りのない2つのベースにおける同時相関の尺度は, 片側半デバイス非依存のステアリングを示すものとして, 操作的に識別可能であることを示す。
2ビットのベル対角状態の場合、片側半デバイス非依存のステアビリティの定量化は、相互に偏りのない基底における相互相関の情報理論的定量化の操作的定量化を提供する。
本研究では,2量子状態の相補的基底における同時相関の操作的特性を,一方の半デバイス非依存的ステアビリティによって解析し,量子ステアリング楕円体を定式化する。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:02:02 GMT)
Normal forms in Virus Machines [0.0] ウイルスマシン(VM)の計算能力についてさらに研究する。
VMはウイルスの伝達と複製ネットワークにインスパイアされたコンピューティングパラダイムを提供する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:28:23 GMT)
Nonstabilizerness of a Boundary Time Crystal [0.0] 境界時間結晶はその定常状態の絡み合いにおいて測定誘起相転移を示す。
非安定度は、異なる未発見のスキームの下で不変である。
発見は、オープンシステムで異なる量子リソースがどのように現れるかについての洞察を与える。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:42:16 GMT)
Network Intrusion Datasets: A Survey, Limitations, and Recommendations [0.0] データ駆動型サイバー脅威検出は、現代のサイバーセキュリティにおいて重要な防御技術となっている。
データの重要性にもかかわらず、その不足はNIDS研究の大きな障害として長年認識されてきた。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:22:23 GMT)
NY Real Estate Racial Equity Analysis via Applied Machine Learning [0.0] 本研究では、ニューヨーク州(NYS)とニューヨーク市(NYC)におけるトラクターレベルの不動産所有パターンを分析し、人種格差を明らかにする。
我々は、先進的な人種・民族の計算モデルを用いて、土地所有者の予測された人種構成と、国勢調査データから住民人口を比較した。
白人は、その人口に対する資産と資産価値の不均等なシェアを持っているのに対し、黒人、ヒスパニック、アジア系コミュニティは、資産所有者として過小評価されている。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:32:28 GMT)
NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0] この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
特に,音声データの処理に適した2段階の深層物体検出モデルを訓練することにより,本データベースの有用性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:23:38 GMT)
Multi-Timescale Coherent Control via Quantum Averaging Theory for High-Fidelity Gate Operations [0.0] 駆動量子系におけるユニタリダイナミクスを解析的にモデル化するための2時間量子平均化理論(QAT)を提案する。
本稿では,高忠実度2量子ビット量子ゲートのモデル化にこの解析手法を適用し,高精度化の実現を実証する。
結果は急速に、高速に絡み合うモルマー・ソレンセントラップ量子ビットゲートの数値計算に収束する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:58:56 GMT)
MotifDisco: Motif Causal Discovery For Time Series Motifs [0.0] 時系列トレースからモチーフ間の因果関係を学習するための新しい因果発見フレームワークを開発した。
Motif Causalityはすべてのユースケースで大幅なパフォーマンス改善を提供します。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:00:36 GMT)
Modification of the uniform electron gas polarizational stopping power due to the interaction of the projectile with new collective modes at moderate and strong coupling [0.0] 本稿では、中等度および強結合状態における同質電子ガスの偏極停止力について詳細に研究する。
我々は、電子-電子相互作用の分析とエネルギー-損失過程への影響を解析するために、9つの和規則およびその他の正確な関係に依存する頑健な枠組みを開発する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:11:05 GMT)
Masked Conditioning for Deep Generative Models [0.0] 生成モデルが疎結合な混合型データを扱うことを可能にする新しいマスク条件付き手法を提案する。
限られたデータに基づいて訓練された小さなモデルと、事前訓練された大規模な基礎モデルを組み合わせることで、生成品質を向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:33:03 GMT)
Manipulating decoherence: Towards a universal framework [0.0] ESD(Entanglement Sudden Death)に繋がるフォトニックシステムにおけるデコヒーレンスを操作するための幅広い枠組みに向けて一歩前進する。
減衰チャネルにおけるESDのチューニングに時間遅延パラメータが使用できることを示す。
本稿では,TDFとともに,振幅減衰チャネル(ADC)と相関振幅減衰チャネル(CADC)の2つの限界を探索する新しいセットアップを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:55:13 GMT)
Liouville PDE-based sliced-Wasserstein flow for fair regression [0.0] 我々はスライスされたワッサースタインフロー(SWF)をいくつかの面で改善した。
ワッサーシュタインバリセンターの計算は、カントロヴィチポテンシャルの処方によってSWFバリセンターによって近似される。
これらの2つの取り組みは、分散の少ないSWFおよびSWFバリセンタの訓練および試験における収束性を改善する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:21:54 GMT)
Leveraging Large Language Models For Scalable Vector Graphics Processing: A Review [0.0] 従来のベクトル化技術は、長い処理時間と過剰な出力の複雑さに悩まされている。
大規模言語モデル(LLM)の出現により、ベクトルグラフィックスの生成、編集、解析の新しい可能性が生まれた。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:05:34 GMT)
Leveraging Habitat Information for Fine-grained Bird Identification [0.0] 我々は鳥類学者によって鳥類を識別する4つの主要な方法の1つである生息地情報を現代の鳥類分類器に組み込むことを最初に検討した。
我々は、下流の鳥のデータセットに基づいて訓練されたCNNとViTと、オリジナルのマルチモーダルCLIPの2つの主要なモデルタイプに焦点を当てる。
CNNとViTを生息地データでトレーニングすると、NABirdsとCUB-200で最大0.83点、+0.23点が改善される。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:21:51 GMT)
Learning non-equilibrium diffusions with Schrödinger bridges: from exactly solvable to simulation-free [0.0] 力学系の初期構成と最終構成のアンサンブルの測定から、シュル・オーディンガー橋の問題を考える。
そこで我々は,Schr"odinger Bridge を学習するためのフローとスコアマッチングに基づくシミュレーションフリーアルゴリズム mvOU-OTFM を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:17:30 GMT)
Learning Normal Patterns in Musical Loops [0.0] 本稿では,音楽サンプル(ループ)の音響パターンを異常検出により検出するための教師なしフレームワークを提案する。
深部特徴抽出と教師なし異常検出を組み合わせたアーキテクチャにより,これらの制約に対処する。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:52:00 GMT)
Language-based Security and Time-inserting Supervisor [0.0] 安全でないプロセスの望ましくない動作を無効にできるスーパーバイザが導入される。
このようなスーパーバイザーが存在する条件と、その特性と限界について検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:36:50 GMT)
Language models should be subject to repeatable, open, domain-contextualized hallucination benchmarking [0.0] プラルーシブルだが不正確な、モデル生成テキストのトークンは、言語モデルの採用に責任があるため、広く普及し問題となると広く信じられている。
言語モデルは、反復可能、オープン、およびドメインコンテキスト化幻覚ベンチマークを用いて評価されるべきである。
論文参考訳(メタデータ) (Thu, 22 May 2025 23:36:28 GMT)
LaSER: How Learning Can Guide the Evolution of Equations [0.0] 遺伝的プログラミング(GP)における方程式の進化を効果的に導くために、教師付き学習の単純な形式を統合することが、初めて示された。
そこで我々は,各GP個人が教師付き学習者に渡される意味表現を生成する新しいGPパイプラインLaSERを提案する。
LaSERは従来のGPを大きく上回り、いくつかのケースでは、一般的な機械学習回帰器にマッチするか、超えている。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:59:38 GMT)
LLMs Are Not Scorers: Rethinking MT Evaluation with Generation-Based Methods [0.0] 本稿では,デコーダのみの言語モデルを利用して高品質な参照を生成する世代ベース評価パラダイムを提案する。
実験の結果,本手法はMTMEのLLM内直接スコアリング基準値と外部非LLM基準値の両方より優れていた。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:14:38 GMT)
LITA: An Efficient LLM-assisted Iterative Topic Augmentation Framework [0.0] 大きな言語モデル(LLM)は動的トピックの洗練と発見の可能性を秘めている。
これらの課題に対処するため、LLM支援反復トピック拡張フレームワーク(LITA)を提案する。
LITAは、ユーザが提供するシードと埋め込みベースのクラスタリングと反復的な改良を統合している。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:20:35 GMT)
LINEA: Fast and Accurate Line Detection Using Scalable Transformers [0.0] ライン検出は、高レベルな処理手法で使用される基本的なデジタル画像処理操作である。
近年の変圧器を用いた線検出法は、CNNの手法よりも精度が高く、推論速度が著しく低いことが証明されている。
本稿では,大規模データセットに対する注意機構の事前訓練を必要とせず,はるかに高速なトランスフォーマーに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:56:10 GMT)
Kramers-Wannier self-duality and non-invertible translation symmetry in quantum chains: a wave-function perspective [0.0] 臨界量子鎖のKramers-Wannier自己双対性について、モデル波動関数の観点から検討する。
逆場イジング鎖と3$状態ポッツ鎖を例に、クラマース=ワニエ自己双対の対称性作用素が単純かつ直接的な方法で従うことを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:51:54 GMT)
Knowledge Integration Strategies in Autonomous Vehicle Prediction and Planning: A Comprehensive Survey [0.0] 本研究は,自律運転システムにおける知識に基づくアプローチの統合に関する総合的な調査である。
我々は、自律運転システムにドメイン知識、交通ルール、コモンセンス推論を組み込むための様々な手法を解析する。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:27:22 GMT)
Interpretable Anomaly Detection in Encrypted Traffic Using SHAP with Machine Learning Models [0.0] 本研究の目的は,暗号化されたネットワークトラフィックにおける異常検出のための解釈可能な機械学習ベースのフレームワークを開発することである。
モデルはトレーニングされ、3つのベンチマークで暗号化されたトラフィックデータセットで評価される。
SHAPビジュアライゼーションは、異常予測に寄与する最も影響力のあるトラフィック特徴を明らかにした。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:50:39 GMT)
Improving Multilingual Capabilities with Cultural and Local Knowledge in Large Language Models While Enhancing Native Performance [0.0] Hindi- English bi-lingual LLM textbfMantra-14B with 3% improve in benchmark scores over both languages。
我々は、Qwen-2.5-14B-InstructやPhi-4といったチューニングモデルに、英語とヒンディー語の両方のパフォーマンスを改善するよう指示した。
以上の結果から,文化的・局所的な情報を用いた微調整は,計算オーバーヘッドを伴わずに性能ギャップを埋めることが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 10:29:25 GMT)
Implementing Semiclassical Szegedy Walks in Classical-Quantum Circuits for Homomorphic Encryption [0.0] 量子ホモモルフィック暗号化(QHE)は、基礎となる情報を明らかにすることなく、量子データのセキュアな計算を容易にする新興技術である。
我々は、古典量子回路を通してQHEスキームを解釈し、効率を向上し、鍵計算に関連する以前の制限に対処する。
提案手法は,シミュレーション中に鍵をリアルタイムに計算することで指数的鍵準備の必要性を排除し,古典的に制御されたゲートの線形複雑化につながる。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:51:48 GMT)
Identifying Legal Holdings with LLMs: A Systematic Study of Performance, Scale, and Memorization [0.0] ケースホールディングスを特定するための法的なベンチマークデータセットであるCaseHOLDにおいて,現代の大規模言語モデル(LLM)の性能を評価するための一連の実験を行った。
実験では, このタスクの性能はモデルサイズで向上し, マクロF1スコアは0.744点, 0.720点となった。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:14:15 GMT)
Human-like Forgetting Curves in Deep Neural Networks [0.0] この研究は、人工モデルが人間のような忘れ曲線を示すかどうかを調べることによって、認知科学とニューラルネットワークの設計を橋渡しする。
ニューラルネットワークにおける情報保持度を測定するための定量的枠組みを提案する。
提案手法は,ネットワークの現在の隠蔽状態と以前に格納されたプロトタイプ表現との類似性を評価することで,リコール確率を算出する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:51:23 GMT)
Graph Neural Network-Based Collaborative Perception for Adaptive Scheduling in Distributed Systems [0.0] 本稿では,GNNに基づくマルチノード協調認識機構を提案する。
メッセージパッシングと状態更新モジュールが導入される。
グローバルな特徴を持つ局所状態を融合させて認識表現法を設計する。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:34:02 GMT)
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design [0.0] GeoBikedは4つの355枚の自転車画像を含むようにキュレーションされており、構造的および技術的特徴を付加している。
大規模基盤モデルを用いてデータラベリングを自動化する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:21:39 GMT)
Generalization error property of infoGAN for two-layer neural network [0.0] infoGANは2つのニューラルネットワークを含むミニマックス問題として理解することができる。
本研究は,情報GANの一般化誤差特性を判別器の標本サイズおよび生成器アプローチ無限大として示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:41:42 GMT)
Game-invariant Features Through Contrastive and Domain-adversarial Learning [0.0] 基礎的なゲームイメージエンコーダは、しばしばゲーム固有の視覚スタイルに適合する。
対照的な学習とドメイン・アドバイザリ・トレーニングを組み合わせてゲーム不変の視覚特徴を学習する手法を提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:45:51 GMT)
GPT Editors, Not Authors: The Stylistic Footprint of LLMs in Academic Preprints [0.0] 2022年末のLarge Language Models(LLM)の普及は、学術的な執筆に影響を与え、信頼性を脅かし、制度上の不確実性を引き起こしている。
文法エラーのチェックや不適切なフレーズ作成など、編集に使用されるのとは対照的に、LLMが重要なテキストを生成するのにどの程度使われるかを決定する。
著者らは, LLM を用いた場合, LLM が一様であることから, 学術的事前印刷に導入される幻覚のリスクが軽減されることが示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:44:27 GMT)
Fusion for High-Dimensional Linear Optical Quantum Computing with Improved Success Probability [0.0] 時間-ビン多重化によるマイクロ波空洞に結合したシリコンスピン・キュディット・アンシラを用いた,必要な$(d-2)$-quditアンシラリー状態の構築について検討した。
本研究では,高次元Type-II融合のための複数の異なる回路の解析と改良を行う。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:52:03 GMT)
Fluctuation in energy extraction from quantum batteries: How open should the system be to control it? [0.0] これら3つのプロセスクラスが、固定された量子電池から抽出可能な平均エネルギーを得ることを示す。
オープンシステムは、固定量子電池の変動を制御するのに優れている。
非単位の物理的実現可能な写像を実装するために使用される補助系が次元$n$まで制限されると、CPTP写像に対して1/n$の抽出可能エネルギースケールの変動が1/n$となる。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:12:15 GMT)
Flat band mediated photon-photon interactions in 2D waveguide QED networks [0.0] 2次元導波路ネットワークに結合した量子エミッタのリーブ格子について検討する。
本システムは, 長距離光子結合の存在にもかかわらず, エネルギー的に孤立した平面バンドをサポートすることを示す。
本研究は, 励起子の集合挙動と有効光子-光子相互作用の相互作用が, フラットバンド系における高相関光子状態の研究の基盤となることを示すものである。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:49:20 GMT)
Fast computation of the TGOSPA metric for multiple target tracking via unbalanced optimal transport [0.0] 複数のターゲットトラッキングでは、異なるトラッキングアルゴリズムの性能を評価することが重要である。
軌道一般化最適部分パターン割当量(TGOSPA)は,最近提案された評価基準である。
本稿では,TGOSPA問題を不均衡なマルチマルジナル最適輸送問題としてキャストすることで,TGOSPAメトリックを評価する近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 22 May 2025 14:39:17 GMT)
Fast and high-fidelity transfer of edge states via dynamical control of topological phases and effects of dissipation [0.0] トポロジカルエッジ状態は対称性を保った摂動やノイズに対して堅牢であり、量子情報や計算に有望である。
本研究では,領域壁を動的に移動させることにより,一次元トポロジカルエッジ状態を伝達する高忠実度手法を提案する。
2つの内部状態を持つ1次元量子ウォークを用いた高忠実度エッジ状態の転送における本手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:40:48 GMT)
Families of isospectral and isoscattering quantum graphs [0.0] 胚グラフの概念とM-函数形式は、アイソスペクトルおよびアイソ散乱グラフの大きな族を構成するために用いられる。
導入された形式主義は、散逸したグラフにも拡張可能であることを実証する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:54:52 GMT)
Extreme value statistics and eigenstate thermalization in kicked quantum chaotic spin-$1/2$ chains [0.0] 量子カオス系に対する還元密度行列の固有値の性質について検討する。
最大の固有値が期待されるトレイシー分布に従わないことが示される。
また, このような偏差は, 熱電化特性の劇的な変化に繋がらないことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:09:21 GMT)
Extending Dataset Pruning to Object Detection: A Variance-based Approach [0.0] 本稿では,オブジェクト検出領域への分類プルーニング手法の最初の拡張について述べる。
可変ベース予測スコア(VPS)と呼ばれる新しいスコアリング手法を含む、最適化された解を提案する。
私たちのワークブリッジは、データセットのプルーニングとオブジェクト検出、複雑なビジョンタスクにおけるデータセットプルーニングの道を開くものです。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:46:51 GMT)
Expressivity Limits of Quantum Reservoir Computing [0.0] パラメタライズド量子回路量子機械学習(PQC-QML)への公式な接続を確立する。
古典的データから生成可能な非線形関数の数は、入力符号化ゲートの数によって線形に制限されていることを解析的に証明し、数値的に相関する。
我々の結果は指数ヒルベルト空間のスケーリングがQRCにおける対応する計算上の優位性を与えるという一般的な仮定に挑戦する。
論文参考訳(メタデータ) (Thu, 22 May 2025 12:55:34 GMT)
Exact steady state of perturbed open quantum systems [0.0] 摂動下での開量子系の定常状態を決定するための一般的な非摂動的手法を提案する。
この手法を3つの非自明な開量子系に適用する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:07:07 GMT)
Evaluating the Performance of Nigerian Lecturers using Multilayer Perceptron [0.0] このシステムは、Webベースのプラットフォームを使用して設計され、セキュアなデータベースを作成し、カスタムデータセットを使用していた。
モデルの性能は平均二乗誤差(MSE)と平均絶対誤差(MAE)を用いて評価した。
また,約96%の精度を推定し,講師のパフォーマンス予測の有効性を検証した。
論文参考訳(メタデータ) (Thu, 22 May 2025 07:23:14 GMT)
Embedding Trust at Scale: Physics-Aware Neural Watermarking for Secure and Verifiable Data Pipelines [0.0] 我々は科学的データ整合性のための堅牢なニューラルネットワーク透かしフレームワークを提案する。
畳み込みオートエンコーダを用いることで、二元メッセージは温度、渦、地磁気といった構造データに不可視的に埋め込まれる。
提案手法は,ERA5データセットとNavier-Stokesデータセット間で,98%の精度と視覚的に識別不能な再構成を実現する。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:14:45 GMT)
Dynamic Reservoir Computing with Physical Neuromorphic Networks [0.0] 物理システムを用いた貯留層計算(RC)では、基礎となる構造と特定の物理貯水池の内部力学を理解する必要がある。
ニューロモルフィック力学を持つ物理ナノエレクトロニクスネットワークをRCフレームワークの物理貯留体として使用するために検討した。
間隔の異なるネットワークは、高密度ネットワークと比較して動的RCに対してより有用な非線形時間出力を生成する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:50:45 GMT)
Dynamic Encryption-Based Cloud Security Model using Facial Image and Password-based Key Generation for Multimedia Data [0.0] 本研究では,任意のファイルタイプに暗号化手法を適用する動的暗号化ベースのセキュリティアーキテクチャを提案する。
4つの多様なデータセットが作成され、それぞれが一貫したサイズ2GBである。
AESは画像データの暗号化に使われ、AES-CTRはリアルタイムストリーミングのニーズを満たすためにオーディオやビデオデータに使われ、Blowfishは他の種類のデータに使われている。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:55:45 GMT)
Directional Convergence, Benign Overfitting of Gradient Descent in leaky ReLU two-layer Neural Networks [0.0] 指数損失の勾配降下により最適化された固定幅リークReLU二層ニューラルネットワークのネットワークパラメータの方向性収束性を示す。
応用として、準ガウス混合モデルにおいて、良性過剰適合は高い確率で起こることを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 04:11:58 GMT)
Die Separation for Mitigation of Phonon Bursts in Superconducting Circuits [0.0] 宇宙線とバックグラウンド放射性崩壊は、プラナーチップ上の超伝導量子回路にかなりのエネルギーを蓄積することができる。
このエネルギーは、基板を横断して準粒子を生成するペアブレーキングフォノンに変換され、近くの量子ビットにおける相関エネルギーと位相誤差をもたらす。
これを緩和するため、2つの別々の型を作製し、それらの間にガルバニックな接続を伴わずに隣に配置した。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:08:34 GMT)
Designing and Implementing Robust Test Automation Frameworks using Cucumber BDD and Java [0.0] 本稿では、堅牢なテスト自動化フレームワークの設計と実装に関する包括的なアプローチを詳述する。
Cucumber BDDの自然言語構文を利用することで、このフレームワークは技術的および非技術的チームメンバー間の明確なコミュニケーションを可能にします。
Javaはスケーラブルで保守性があり、効率的なテストスクリプトを作成するバックボーンとして機能します。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:11:05 GMT)
Data-Driven Breakthroughs and Future Directions in AI Infrastructure: A Comprehensive Review [0.0] 本稿では,過去15年間の人工知能(AI)の大きなブレークスルーを包括的に合成する。
計算リソース、データアクセス、アルゴリズム革新の収束をトレースすることで、AIの進化における重要なインフレクションポイントを特定する。
論文参考訳(メタデータ) (Thu, 22 May 2025 15:12:48 GMT)
Dark States of Light and the Hidden Energy in Thermal Radiation Detection [0.0] 熱放射は、そのエネルギーのかなりの部分を暗い集合モードで閉じ込めることができることを示す。
M$熱電界モードからなるシステムでは、総エネルギーのわずか1/M$しか物質にアクセスできないことを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 01:19:47 GMT)
Critical Points of Random Neural Networks [0.0] 本研究では、無限幅限界の深さが増加するにつれて、アクティベーション関数が異なるランダムニューラルネットワークの臨界点数について検討する。
適切な条件下では、固定された指標の臨界点の数と与えられた閾値を超える点の正確な式を導出する。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:57:30 GMT)
Control of Renewable Energy Communities using AI and Real-World Data [0.0] 本稿では,これらの複雑さを明示的に扱えるよう設計したフレームワークを導入し,シミュレーションと現実のギャップを埋める。
それは、MADDベースのマルチエージェント制御戦略であるEnergAIzeを取り入れ、現実世界のデータ収集、システム統合、ユーザー行動モデリングに関連する課題に特に対処する。
論文参考訳(メタデータ) (Thu, 22 May 2025 22:20:09 GMT)
Comfortability of quantum walks on embedded graphs on surfaces [0.0] グラフ上の離散時間量子ウォークの時間進化は、グラフの局所的な隣接関係によって決定される。
本研究では,表面への埋め込みを反映した離散時間量子ウォークモデルを構築し,その基礎となるグローバルな幾何学的情報を反映する。
量子ウォーカーは、何らかの自然条件下で小さな属を持つ表面でより快適に感じられる。
論文参考訳(メタデータ) (Thu, 22 May 2025 21:57:36 GMT)
Can Large Language Models Design Biological Weapons? Evaluating Moremi Bio [0.0] 我々の研究は1020の新規な毒性タンパク質と5,000の毒性の小さな分子を生み出した。
詳細な計算毒性評価の結果、全てのタンパク質が毒性が高いことが判明した。
バイオテクノロジーの急速な革新とバイオセキュリティ・インペラティブのバランスをとるために,ロバストなガバナンスと技術的保護の必要性が示唆された。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:27:50 GMT)
Can LLMs Simulate Human Behavioral Variability? A Case Study in the Phonemic Fluency Task [0.0] 大きな言語モデル(LLM)は、認知タスクにおける人間の参加者の代用として、ますます研究されている。
本研究では,LLMが音素流速タスクの個人差を近似できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 22 May 2025 03:08:27 GMT)
Can ChatGPT Perform Image Splicing Detection? A Preliminary Study [0.0] GPT-4Vのようなマルチモーダル大言語モデル(MLLM)は、テキストと画像のモダリティを推論することができる。
ゼロショット(ZS)、フューショット(FS)、チェーン・オブ・ソート(CoT)の3つのプロンプト戦略を用いてGPT-4Vを評価する。
以上の結果から,GPT-4Vはゼロショット環境での競合検出性能(精度85%以上)を達成することが示された。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:53:53 GMT)
Can AI Read Between The Lines? Benchmarking LLMs On Financial Nuance [0.0] 本稿では、チャーリー・ゴールデンバーグ教授が主導するサンタクララ・Microsoft Practicum Projectの成果を紹介する。
MicrosoftのCopilot、OpenAIのChatGPT、GoogleのGemini、財務テキストの感情分析のための従来の機械学習モデルのパフォーマンスをベンチマークする。
この分析はMicrosoftの決算書の書き起こしを使って、LLM由来の感情が市場感情と株価の動きとどのように相関するかを評価する。
論文参考訳(メタデータ) (Thu, 22 May 2025 00:09:11 GMT)
Bose-Einstein condensation in exotic lattice geometries [0.0] 現代の量子工学技術は、エキゾチック格子幾何学における量子システムを合成することができる。
これらの構造がボース=アインシュタイン凝縮を深く再形成することを実証する。
本研究は,量子相現象の強力なチューニングノブとして格子幾何学を確立した。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:40:22 GMT)
Automated Capability Evaluation of Foundation Models [0.0] Active Learning for Capability Evaluation (ACE)は、基盤モデルのスケーラブルで自動化された、きめ細かい評価のための新しいフレームワークである。
カバレッジと効率を最大化するために、ACEは被写体モデルの性能を潜在意味空間上の機能関数としてモデル化する。
この適応評価戦略は、静的ベンチマークが見逃す可能性のある強度、弱点、障害モードのコスト効率の良い発見を可能にする。
論文参考訳(メタデータ) (Thu, 22 May 2025 19:09:57 GMT)
AutoMCQ -- Automatically Generate Code Comprehension Questions using GenAI [0.0] 生徒は自分の書いたコードを十分に理解していないことが多い。
学生が生成人工知能(GenAI)ツールにアクセスできる世界では、コードを完全に理解できることがますます重要になっている。
本稿では,GenAIを用いた複数選択コード理解質問の自動生成システムであるAutoMCQを紹介する。
論文参考訳(メタデータ) (Thu, 22 May 2025 09:14:41 GMT)
Artificial Intelligence for Direct Prediction of Molecular Dynamics Across Chemical Space [0.0] MDtrajNet-1は化学空間を横断するMD軌道を直接生成する基礎的AIモデルである。
モデルの柔軟な設計は、異なる統計アンサンブル、境界条件、相互作用タイプを含む様々なアプリケーションシナリオをサポートする。
論文参考訳(メタデータ) (Thu, 22 May 2025 06:56:19 GMT)
Applying MambaAttention, TabPFN, and TabTransformers to Classify SAE Automation Levels in Crashes [0.0] 本研究では,テキサスの構造化クラッシュデータを用いて,SAE自動化レベルを分類するための3つのディープラーニングモデルの性能を評価する(2024年)。
MambaAttentionはSAE 1, 97%,SAE 2, 99%,SAE 3-5で最高の成績を示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:08:21 GMT)
An open harmonic chain: Exact vs global and local reduced dynamics [0.0] 2つのアプローチで開鎖量子力学の定常状態を得る。
本稿では,各アプローチの妥当性の領域を決定する温度依存性臨界振動子間結合強度の存在を示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 13:33:00 GMT)
Adiabatic Gauge Potential as a Tool for Detecting Chaos in Classical Systems [0.0] 量子状態の変形をハミルトニアンの断熱変化下で記述する物体である断熱ゲージポテンシャル(AGP)について検討する。
軌道上のAGPの時間的分散は、一般的な可観測物の長時間の相関を探索する。
この枠組みの中では、強く、弱いカオス的な状態が正常な拡散と異常な拡散に対応することを示す。
論文参考訳(メタデータ) (Thu, 22 May 2025 02:44:12 GMT)
Active Quantum Reservoir Engineering: Using a Qubit to Manipulate its Environment [0.0] 本研究では, 量子システムに対する時間依存制御を環境の操作に用いる, アクティブ貯水池工学の理論的枠組みを開発する。
2レベル系の環境に結合した超伝導量子ビットと、核スピンに結合した半導体量子ドットである。
論文参考訳(メタデータ) (Thu, 22 May 2025 16:58:24 GMT)
A high-resolution molecular spin-photon interface at telecommunications wavelengths [0.0] 短光(MHzスケール)と短光(MHzスケール)のスピン遷移が結合し、電気通信周波数光によるスピン自由度への高分解能アクセスを提供する有機エルビウムスピン量子ビットを導入する。
このスピン-光子界面は、光スピン偏光と読み出しのデモを可能にし、分子結晶の部位におけるスピン状態と磁気的位置を区別する。
論文参考訳(メタデータ) (Thu, 22 May 2025 18:04:33 GMT)
A fast algorithm to minimize prediction loss of the optimal solution in inverse optimization problem of MILP [0.0] 最適度損失に基づくステップサイズが$k-1/2$の手法が重みを効率よく学習することを示す。
実験により,提案手法はMILPの逆最適化問題を1/7ドル以下で解決することを示した。
論文参考訳(メタデータ) (Thu, 22 May 2025 05:34:49 GMT)
A collaborative constrained graph diffusion model for the generation of realistic synthetic molecules [0.0] 化学的に有効な分子を生成することができる協調的および制約付きグラフ拡散モデルであるCoCoGraphを紹介する。
モデルとコラボレーティブメカニズムに組み込まれた制約のおかげで、CoCoGraphは標準ベンチマークにおける最先端のアプローチよりも優れています。
我々は820万個の合成分子のデータベースを作成し、有機化学の専門家とともにチューリングのような試験を行い、生成した分子の妥当性をさらに評価した。
論文参考訳(メタデータ) (Thu, 22 May 2025 08:21:27 GMT)
A Unified Framework for Simultaneous Parameter and Function Discovery in Differential Equations [0.0] 微分方程式を含む逆問題は、しばしば未知のパラメータや関数をデータから特定する必要がある。
物理情報ニューラルネットワーク(PINN)のような既存のアプローチは、パラメータまたは関数の分離に有効であるが、解の非特異性により同時に適用される場合、課題に直面する可能性がある。
ユニークなソリューションが保証される条件を確立することで、これらの制限に対処するフレームワークを導入します。
論文参考訳(メタデータ) (Thu, 22 May 2025 17:56:38 GMT)
$\mathcal{PT-}$Symmetric Open Quantum Systems: Information Theoretic Facets [0.0] $eta$-pseudo Hermitian Hamiltonian の$mathcalPT$対称性の理論をレビューし、開系力学を含むように拡張する。
単純な光物質相互作用オープンシステムモデルにインスパイアされた情報理論量は、$mathcalPT-$symmetric Hamiltonianに対して計算される。
論文参考訳(メタデータ) (Thu, 22 May 2025 11:36:48 GMT)