Reinforcement Learning for Reasoning in Large Language Models with One Training Example [133.0] 1つのトレーニング例(1ショットRLVR)を用いた強化学習は,大規模言語モデル(LLM)の数学的推論能力の向上に有効であることを示す。
1ショットRLVRにおける興味深い現象として、クロスドメインの一般化、自己回帰の頻度の増大、トレーニング精度が飽和した後もテスト性能の向上が維持されていることを挙げる。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:25:40 GMT)
A Personalized Conversational Benchmark: Towards Simulating Personalized Conversations [112.8] PersonaConvBenchは、大規模言語モデル(LLM)とのマルチターン会話におけるパーソナライズされた推論と生成を評価するためのベンチマークである。
我々は,複数の商用およびオープンソース LLM を統一的なプロンプト設定でベンチマークし,パーソナライズされた履歴を組み込むことで大幅な性能向上が得られることを観察した。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:28:20 GMT)
One Step Diffusion via Shortcut Models [109.7] 単一ネットワークとトレーニングフェーズを用いて高品質なサンプルを生成する,生成モデルのファミリであるショートカットモデルを導入する。
ショートカットモデルは、現在のノイズレベルと所望のステップサイズにネットワークを条件付け、生成プロセスでモデルをスキップすることができる。
蒸留と比較して、ショートカットモデルは複雑性を1つのネットワークとトレーニングフェーズに減らし、推論時に様々なステップ予算を許容する。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:37:47 GMT)
ChartLens: Fine-grained Visual Attribution in Charts [106.4] Post-Hoc Visual Attribution for Chartsは、所定のチャート関連応答を検証する詳細なチャート要素を特定する。
グラフオブジェクトの識別にセグメンテーションに基づく手法を用いた新しいチャート属性アルゴリズムであるChartLensを提案する。
評価の結果,ChartLensの微粒化属性は26-66%向上した。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:17:32 GMT)
Interspatial Attention for Efficient 4D Human Video Generation [98.4] 本稿では,現代的なビデオ生成モデルのための拡張性のあるビルディングブロックとして,新しい空間間アテンション(ISA)機構を導入する。
ISAは人間のビデオの生成に適した相対的な位置エンコーディングを利用する新しいタイプのクロスアテンションである。
本モデルは,4次元映像合成における最先端性能を実現し,動作の一貫性とアイデンティティの保存性を実証する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:44:44 GMT)
Triangle Splatting for Real-Time Radiance Field Rendering [96.8] 我々は、エンドツーエンドの勾配によって直接三角形を最適化する微分可能を開発する。
一般的な2次元および3次元ガウススプラッティング法と比較すると,本手法は高い視覚的忠実度,より高速な収束,レンダリングスループットの向上を実現している。
textitGardenのシーンでは、オフザシェルフメッシュを使用して1280x720の解像度で2,400 FPSを達成しています。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:47:10 GMT)
IT$^3$: Idempotent Test-Time Training [95.8] ディープラーニングモデルは、トレーニングデータとテストデータの間の分散シフトのために、現実世界の環境にデプロイする際に苦労することが多い。
Idempotent Test-Time Training (IT$3$) は、現在のテストインスタンスのみを使用して、分散シフトへのオンザフライ適応を可能にする新しいアプローチである。
この結果から,イデオポテンスはドメインやアーキテクチャをまたいで一般化するテスト時間適応の普遍的原理を提供すると考えられる。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:42:54 GMT)
Order-agnostic Identifier for Large Language Model-based Generative Recommendation [94.4] アイテムは、ユーザ履歴をエンコードし、次のアイテムを生成するために、LLM(Large Language Models)の識別子に割り当てられる。
既存のアプローチでは、トークンシーケンス識別子を使用して、アイテムを個別のトークンシーケンスとして表現するか、IDまたはセマンティック埋め込みを使用して単一トークン識別子を使用する。
本稿では,セマンティック・トークンライザを利用するSETRecを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:20:27 GMT)
ActiveDPO: Active Direct Preference Optimization for Sample-Efficient Alignment [94.4] 人間の好みを使って大きな言語モデル(LLM)を整列させると、さまざまな下流タスクのパフォーマンスが大幅に向上する。
既存の方法には強い理論的な基礎が欠けているか、制限的な報酬関数の仮定に依存している。
非線型報酬関数に対して理論的に基底化されたデータ選択基準を用いるアルゴリズムであるActiveDPOを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:42:52 GMT)
MMATH: A Multilingual Benchmark for Mathematical Reasoning [94.1] MMATHは10言語にまたがる374の高品質な数学問題にまたがる多言語複雑推論のためのベンチマークである。
我々は、DeepSeek R1のような先進モデルでさえ、言語間での大幅な性能格差を示し、意図しない言語において重要な目標外問題発生応答に悩まされていることを観察する。
本研究は,大規模言語モデルの多言語推論能力向上のための新たな洞察と実践的戦略を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:47:39 GMT)
MOOSE-Chem2: Exploring LLM Limits in Fine-Grained Scientific Hypothesis Discovery via Hierarchical Search [93.6] 大規模言語モデル (LLM) は科学的仮説生成の自動化において有望であることを示している。
詳細な科学的仮説発見の新たな課題を定めている。
本稿では,仮説に詳細を漸進的に提案・統合する階層探索手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:13:46 GMT)
On the Role of Label Noise in the Feature Learning Process [90.5] 各サンプルはラベルに依存しない信号とラベルに依存しない雑音から構成される。
分析では,2つの重要な段階を同定する。第1段階では,ノイズを無視しながら,すべてのクリーンサンプルに完全に適合するモデルである。
ステージIIでは、ノイズ方向の勾配が信号の勾配を超え、ノイズのあるサンプルに過度に収まる。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:13:28 GMT)
SimpleDeepSearcher: Deep Information Seeking via Web-Powered Reasoning Trajectory Synthesis [90.0] Retrieval-augmented Generation (RAG) システムは複雑なディープ検索シナリオにおいて高度な大規模言語モデル(LLM)を持つ。
既存のアプローチでは、高品質なトレーニングトラジェクトリが欠如し、分散ミスマッチに苦しむ、重要な制限に直面しています。
本稿では,複雑なトレーニングパラダイムではなく,戦略的データエンジニアリングによるギャップを埋めるフレームワークであるSimpleDeepSearcherを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:02:29 GMT)
SeePhys: Does Seeing Help Thinking? -- Benchmarking Vision-Based Physics Reasoning [89.5] 物理問題に基づく推論のための大規模マルチモーダルベンチマークである SeePhys を提示する。
このベンチマークは、物理学の分野にまたがる7つの基本的な領域をカバーし、21のカテゴリの非常に異質なダイアグラムを取り入れている。
最も先進的な視覚推論モデル(例えばGemini-2.5-proやo4-mini)でさえ、ベンチマークで60%未満の精度が得られることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:28:34 GMT)
Universal Item Tokenization for Transferable Generative Recommendation [89.4] 本稿では、転送可能な生成レコメンデーションのためのユニバーサルアイテムトークン化手法であるUTGRecを提案する。
木構造コードブックを考案することにより、コンテンツ表現をアイテムトークン化のための対応するコードに識別する。
生のコンテンツ再構成には、アイテムテキストとイメージを離散表現から再構成するために、デュアルライトウェイトデコーダを用いる。
協調的知識統合においては,共起的アイテムが類似していると仮定し,共起的アライメントと再構築を通じて協調的信号を統合する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:31:38 GMT)
LLMs know their vulnerabilities: Uncover Safety Gaps through Natural Distribution Shifts [89.0] 大規模言語モデル(LLM)の安全性に関する懸念は、事前訓練中に潜在的に有害なデータに曝されることにより、大きな注目を集めている。
我々は、有害なコンテンツに意味的に関連していると思われる良心的なプロンプトが、安全性のメカニズムを回避できる新しい安全性脆弱性をLSMで特定する。
我々は,事前学習における有害なプロンプトに関連するアクターを識別する新しい攻撃手法,textitActorBreakerを導入する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:25:28 GMT)
3D Convex Splatting: Radiance Field Rendering with 3D Smooth Convexes [87.0] 多視点画像から幾何学的に有意な放射場をモデル化するためのプリミティブとして3次元滑らかな凸を利用した3次元凸法(3DCS)を提案する。
3DCSは、MipNeizer, Tanks and Temples, Deep Blendingなどのベンチマークで、3DGSよりも優れたパフォーマンスを実現している。
本結果は,高品質なシーン再構築のための新しい標準となる3Dコンベクシングの可能性を強調した。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:57:18 GMT)
RTime-QA: A Benchmark for Atomic Temporal Event Understanding in Large Multi-modal Models [85.6] 大規模マルチモーダルモデル(LMM)の原子時間事象理解能力を評価するための新しいベンチマークRTime-QAを紹介する。
RTime-QAは822の高品質で慎重に編集されたビデオテキストの質問で構成されており、それぞれが人間の専門家によって慎重に注釈付けされている。
LMMの時間的事象理解能力を向上するために、RTime-QAと同様のアノテーションプロセスを利用する14k命令チューニングデータセットであるRTime-ITを導入する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:44:12 GMT)
Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.4] 本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:23:10 GMT)
Reinforced Latent Reasoning for LLM-based Recommendation [83.2] 大きな言語モデル(LLM)は、複雑な問題解決タスクにおいて印象的な推論能力を示している。
既存の手法は通常、明示的なチェーン・オブ・シント(CoT)データによる微調整に依存している。
本研究では, 明示的なCoT推論から, コンパクトで情報密度の高い潜伏推論へ移行する代替手法について検討する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:03:45 GMT)
Training Nonlinear Transformers for Chain-of-Thought Inference: A Theoretical Generalization Analysis [82.5] チェーン・オブ・シフト(Chain-of-shift, CoT)は、複数の中間ステップを持つ例を用いてクエリを増強することにより、大規模言語モデルの推論能力を実現する効率的な手法である。
CoT の理論的成功にもかかわらず、CoT が成立しても正確な一般化が得られないことを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:45:42 GMT)
Balancing Truthfulness and Informativeness with Uncertainty-Aware Instruction Fine-Tuning [79.5] インストラクション微調整(IFT)は、大きな言語モデル(LLM)の知性を高めるが、その真偽を減少させる可能性がある。
本稿では,IFTデータセットにおける不慣れな知識がLLMの真偽にどのように悪影響を及ぼすかを実証的に示す。
この問題に対処するために、新しいIFTパラダイムである$UNIT_cut$と$UNIT_ref$を導入します。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:39:50 GMT)
Pre-training Generative Recommender with Multi-Identifier Item Tokenization [78.9] 本稿では, MTGRecを用いて, 生成Recommender事前学習のためのトークンシーケンスデータを拡張する手法を提案する。
このアプローチには、マルチアイデンティティーアイテムトークン化とカリキュラムレコメンデータ事前トレーニングという、2つの重要なイノベーションがあります。
3つの公開ベンチマークデータセットに対する大規模な実験は、MTGRecが従来の推奨基準と生成推奨基準の両方を大きく上回っていることを示している。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:28:48 GMT)
LLaDA 1.5: Variance-Reduced Preference Optimization for Large Language Diffusion Models [76.8] Masked Diffusion Models (MDM) は言語モデリングにおいて有望なパラダイムである。
この課題は、優先最適化に必要なエビデンス・ロウアー・バウンド(ELBO)に基づく推定値の高分散から生じる。
本稿では,ELBO推定器の偏差を公式に解析し,優先最適化勾配の偏差と偏差を導出するフレームワークであるVRPOを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:36:20 GMT)
CreatiDesign: A Unified Multi-Conditional Diffusion Transformer for Creative Graphic Design [72.8] CreatiDesignは、モデルアーキテクチャとデータセット構築の両方をカバーする、自動グラフィック設計のための体系的なソリューションである。
まず、異種設計要素の柔軟かつ正確な統合を可能にする統合されたマルチ条件駆動アーキテクチャを設計する。
さらに,各条件が指定された画像領域を正確に制御することを保証するため,マルチモーダルアテンションマスク機構を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:14:23 GMT)
Jodi: Unification of Visual Generation and Understanding via Joint Modeling [72.2] 視覚生成と理解を統一する拡散フレームワークであるJodiを提案する。
Jodiは、ロールスイッチ機構とともに線形拡散変圧器上に構築されている。
我々は20万の高品質な画像を含むJoint-1.6Mデータセットを提示する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:40:52 GMT)
Policy Gradient with Tree Expansion [72.1] 政策勾配法は、大きなばらつきと高いサンプルの複雑さを持つことで有名である。
我々は、計画を採用するソフトマックスの一般化であるSoftTreeMaxを紹介します。
我々は、SoftTreeMaxが勾配のばらつきを3桁に減らすことを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:24:57 GMT)
DLF: Enhancing Explicit-Implicit Interaction via Dynamic Low-Order-Aware Fusion for CTR Prediction [71.4] 本稿では,クリックスルー率(CTR)予測をモデル化するための新しいフレームワークである動的低次認識融合(DLF)を提案する。
RLIは残差接続からの冗長性を緩和しながら低次信号を保持し、NAFは各層での明示的および暗黙的な表現を動的に統合し、情報共有を強化する。
公開データセットの実験では、DLFがCTR予測における最先端のパフォーマンスを達成し、既存のモデルの重要な制限に対処していることが示されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:05:00 GMT)
When Ethics and Payoffs Diverge: LLM Agents in Morally Charged Social Dilemmas [68.8] 大規模言語モデル(LLM)は、人間や他のエージェントとの意思決定を含む複雑なエージェントの役割での使用を可能にしている。
大規模言語モデル(LLM)の最近の進歩は、人間や他のエージェントとの意思決定を含む複雑なエージェントの役割において、それらの使用を可能にしている。
道徳的命令が報酬やインセンティブと直接衝突するときの行動についての理解は限られている。
本稿では,社会ジレンマシミュレーション(MoralSim)におけるモラル行動について紹介し,LLMが囚人のジレンマゲームや公共グッズゲームにおいて道徳的に課金された文脈でどのように振る舞うかを評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:19:24 GMT)
Adaptive Cyclic Diffusion for Inference Scaling [68.6] 適応的推論時間スケーリング-動的に計算量を調整するという課題について紹介する。
本稿では,適応型双方向サイクル拡散(ABCD)を提案する。
ABCDは、探索深度と終了を適応的に制御しながら、双方向拡散サイクルを通じて出力を洗練する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:15:30 GMT)
Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions [65.9] 設計選択が言語モデル能力に与える影響を定量化する。
モデルサイズとトレーニングトークンの数以外の機能を組み込むことで、下流のパフォーマンスを予測する能力が3~28%向上する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:18:31 GMT)
PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection [65.8] 我々は,より強力な単一点制御OODフレームワークであるPointOBB-v3を提案する。
追加のプリミティブなしで擬似回転ボックスを生成し、エンドツーエンドのパラダイムをサポートする。
本手法は従来の最先端手法と比較して3.56%の精度向上を実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:29:10 GMT)
SeRL: Self-Play Reinforcement Learning for Large Language Models with Limited Data [65.6] 限られた初期データを用いたLarge Language Models (LLM) トレーニングのブートストラップとして,SeRL(Se-play Reinforcement Learning)を提案する。
提案したSeRLは、その結果よりも優れ、検証可能な報酬を持つ高品質なデータと同等の性能が得られる。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:28:04 GMT)
When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers [64.2] タスク算術は、タスクベクトルの重み付き和を追加することで、事前訓練されたモデルを編集することを指す。
本稿では,非関連タスクと非関連タスクのセットを同時に学習する上で,タスク追加の有効性を理論的に証明する。
ドメイン外タスクの否定を実現するために,タスク演算の適切な選択を証明した。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:07:27 GMT)
The Overthinker's DIET: Cutting Token Calories with DIfficulty-AwarE Training [64.0] 最近の大規模言語モデル(LLM)は印象的な推論を示すが、多くの場合、過度に長い応答を発生させ、効率を損なう。
そこで我々は,これらの「トーケンカロリー」を体系的に削減するフレームワークであるDIETを紹介した。
DIETはトークンペナルティ強度と条件付け対象長さを推定タスクの難易度に応じて調整することによりトークン圧縮戦略を動的に適用する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:24:12 GMT)
Mixture of Lookup Experts [63.8] Mixture-of-Experts (MoE)は、推論中に専門家のサブセットだけを起動する。
MoLEは通信とVRAMの両方で効率的な新しいMoEアーキテクチャである。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:46:33 GMT)
SliM-LLM: Salience-Driven Mixed-Precision Quantization for Large Language Models [63.1] 後学習量子化(PTQ)は,大規模言語モデル(LLM)の圧縮に有効な手法である
本稿では,SliM-LLMを提案する。SliM-LLMは,グループ単位でビット幅を割り当てるサリエンス駆動の混合精度量子化フレームワークである。
実験により、SliM-LLMは低ビット幅の様々なLLMにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:58:37 GMT)
Weaver: Interweaving SQL and LLM for Table Reasoning [63.1] Weaverは、構造化データ検索のためのsqlとセマンティック処理のためのLLMを組み合わせたフレキシブルなステップバイステッププランを生成する。
Weaverは、4つのTableQAデータセットの最先端メソッドを一貫して上回り、API呼び出しとエラー率の両方を削減する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:27:37 GMT)
Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.8] Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:48:01 GMT)
Deep Active Speech Cancellation with Mamba-Masking Network [62.7] アクティブ音声キャンセラ(ASC)のための新しい深層学習ネットワークを提案する。
提案したMamba-Maskingアーキテクチャは、符号化された参照信号と直接対話するマスキング機構を導入する。
実験の結果、ANCシナリオでは7.2dB、ASCでは6.2dBの改善が達成された。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:26:37 GMT)
Prompting is Not All You Need! Evaluating LLM Agent Simulation Methodologies with Real-World Online Customer Behavior Data [62.6] 人間の行動のシミュレーションにおいて「主観的信頼性」よりも「LLMの客観的精度」を評価することに重点を置いている。
本稿では,Web ショッピング行動生成の課題に対して,最先端 LLM の総合評価を行った。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:07:39 GMT)
Optimal Conformal Prediction under Epistemic Uncertainty [61.5] コンフォーマル予測(CP)は不確実性を表すための一般的なフレームワークである。
条件付きカバレッジを保証する最小の予測セットを生成するBernoulli予測セット(BPS)を導入する。
1次予測を与えられた場合、BPSはよく知られた適応予測セット(APS)に還元する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:32:44 GMT)
Is Compression Really Linear with Code Intelligence? [60.1] textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。
我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。
私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:11:58 GMT)
Expansion Span: Combining Fading Memory and Retrieval in Hybrid State Space Models [59.6] 本研究では,過去から任意の距離から取得したトークンのアテンションコンテキストの一部を「保存」することにより,ハイブリッド状態のメモリ幅を拡大する手法を提案する。
この限定されたトークンを"Expansion span"と呼び、それを取得して集約するメカニズムを"Span-Expanded Attention"(SE-Attn)と呼びます。
また,SE-Attnにより,事前学習用モデルよりも最大8倍長のトークン列上で,事前学習型ハイブリッドモデルを効率的に適用できることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:09:17 GMT)
VerIPO: Cultivating Long Reasoning in Video-LLMs via Verifier-Gudied Iterative Policy Optimization [59.4] VerIPOは、深く長期的な推論チェーンを生成するためのビデオLLMの能力を徐々に改善することを目指している。
トレーニングループはGRPOの拡張検索とDPOのターゲット最適化の恩恵を受けている。
我々の訓練されたモデルは、大規模命令調整ビデオ-LLMの直接推定を超えている。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:41:28 GMT)
Learning Transformer-based World Models with Contrastive Predictive Coding [58.0] 変換器の表現能力を十分に活用するには,次の状態予測目標が不十分であることを示す。
本稿では,行動条件のContrastive Predictive Codingを用いた世界モデルであるTWISTERを導入することで,世界モデル予測をより長い時間的地平線まで拡張することを提案する。
TWISTERは、Atari 100kベンチマークで162%の人間正規化平均スコアを達成し、ルックアヘッド検索を使用しない最先端のメソッドの中で、新しい記録を樹立した。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:33:51 GMT)
CLEVER: A Curated Benchmark for Formally Verified Code Generation [57.5] $rm Csmall LEVER$は、リーンにおけるエンドツーエンドのコード生成のための161の問題を、高品質でキュレートしたベンチマークである。
それぞれの問題は、(1)堅実な仕様と一致する仕様を生成するタスク、(2)この仕様を確実に満足するリーン実装を生成するタスクで構成されています。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:54:01 GMT)
Hybrid Neural-MPM for Interactive Fluid Simulations in Real-Time [57.3] 本稿では,数値シミュレーション,神経物理,生成制御を統合した新しいハイブリッド手法を提案する。
本システムでは, 多様な2D/3Dシナリオ, 材料タイプ, 障害物相互作用における堅牢な性能を示す。
受け入れ次第、モデルとデータの両方をリリースすることを約束します。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:27:18 GMT)
Towards Generalized Proactive Defense against Face Swappingwith Contour-Hybrid Watermark [56.5] 顔の交換は、プライバシーとセキュリティの懸念として認識されており、かなりの防衛研究を引き起こしている。
未知の顔交換技術に対して積極的に透かしを埋め込む。
本手法は,トレーニング中のスワップ技術や大規模メッセージの保存を必要とせず,顔スワップ検出を一般化する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:29:23 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [55.9] 人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。
本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。
数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:09:14 GMT)
VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models [55.4] OpenAI o1とDeepSeek-R1は、推論の領域で素晴らしいパフォーマンスを達成した。
彼らのトレーニングの重要な要素は、強化学習に検証可能な報酬を取り入れることである。
既存の報酬ベンチマークでは、参照ベースの報酬システムの評価は行われていない。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:17:45 GMT)
DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing [55.4] 本稿では,動的フレームワーク内で従来のスパース再構築を再現する動的反復収縮閾値ネットワーク(DISTA-Net)を提案する。
DISTA-Netは、密接な空間を持つ赤外線小ターゲットのアンミックスのために特別に設計された最初のディープラーニングモデルである。
私たちはこの分野におけるさらなる研究を促進するために、最初のオープンソースエコシステムを確立しました。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:52:00 GMT)
Drag Your Gaussian: Effective Drag-Based Editing with Score Distillation for 3D Gaussian Splatting [55.1] DYGは3次元ガウススプラッティングのための効果的な3次元ドラッグベース編集法である。
3次元マスクと一対の制御点を入力して編集範囲を正確に制御できる。
DYGは暗黙三面体表現の強さを統合し、編集結果の幾何学的足場を確立する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:14:32 GMT)
Learn Beneficial Noise as Graph Augmentation [54.4] 本稿では,情報理論における雑音の有益効果を科学的に分析するPiNGDAを提案する。
我々は,事前定義された拡張値を持つ標準GCLが,点推定による有益雑音の推定に等価であることを証明した。
生成元はグラフトポロジとノード属性に対して有益な摂動を生成する方法を学ぶため、PiNGDAは既存の手法よりも信頼性が高い。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:20:34 GMT)
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces [54.4] オンライン学習のためのフォーム・トンプソン・サンプリングをフルフィードバックで開発する。
我々は、後悔の分解を、学習者が先入観を期待したことを後悔させ、また、過度な後悔と呼ぶ先延ばし的な用語を示します。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:16:17 GMT)
Benchmarking Laparoscopic Surgical Image Restoration and Beyond [54.3] 腹腔鏡下手術では、明瞭で高品質な視野が外科医の正確な判断に不可欠である。
持続的な視覚劣化、例えば、エネルギー装置によって発生する煙、熱勾配から光るレンズ、およびレンズ汚染は患者の安全に危険をもたらす。
本稿では,SurgCleanと呼ばれる腹腔鏡下環境を対象とするオープンソースの手術画像復元データセットについて紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:17:56 GMT)
Efficient Data Selection at Scale via Influence Distillation [53.0] 本稿では,データ選択のための数学的に修飾されたフレームワークであるインフルエンス蒸留を紹介する。
対象分布に対する各試料の影響を蒸留することにより,トレーニングデータの選択に使用されるモデル固有の重みを割り当てる。
実験の結果、蒸留の影響は最先端のパフォーマンスに匹敵し、最大3.5タイムの高速選択を実現していることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:08:00 GMT)
A Graph Perspective to Probe Structural Patterns of Knowledge in Large Language Models [52.5] 大規模な言語モデルは、その知識アクセス、編集可能性、推論可能性、説明可能性のための神経知識基盤として広く研究されている。
我々は,LLMの知識を三重項レベルと実体レベルの両方で定量化し,ノード次数などのグラフ構造特性との関連性を分析する。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:34:15 GMT)
Revival with Voice: Multi-modal Controllable Text-to-Speech Synthesis [52.3] 本稿では,顔画像から音声を生成するマルチモーダル制御可能なテキスト音声合成(TTS)について検討する。
顔駆動型TSシステムにおける以下の3つの課題を軽減することを目的としている。
顔駆動音声合成におけるモデルの有効性を実験的に検証した。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:43:17 GMT)
Zero4D: Training-Free 4D Video Generation From Single Video Using Off-the-Shelf Video Diffusion [52.0] そこで,本研究では,市販ビデオ拡散モデルを利用して,単一入力ビデオから多視点ビデオを生成する4Dビデオ生成手法を提案する。
本手法はトレーニング不要で,市販のビデオ拡散モデルを完全に活用し,マルチビュービデオ生成のための実用的で効果的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:05:08 GMT)
BriLLM: Brain-inspired Large Language Model [51.8] BriLLMは非トランスフォーマー、非GPT、非伝統的な機械学習入出力制御型生成言語モデルである。
4000トークン,32次元ノード幅,16token長列予測機能,GPT-1に匹敵する言語モデル予測性能を備えた,中国語の最初の BriLLM バージョンをリリースする。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:34:29 GMT)
Tokenizing Electron Cloud in Protein-Ligand Interaction Learning [51.7] ECBindは電子雲信号を量子化埋め込みにトークン化する方法である。
これは、原子レベルのモデルで完全に表現できないバインディングモードを明らかにするのに役立つ。
適用範囲を幅広いシナリオに広げるために,我々は知識蒸留を用いて電子クラウドに依存しない予測モデルを構築した。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:36:50 GMT)
Speech-FT: Merging Pre-trained And Fine-Tuned Speech Representation Models For Cross-Task Generalization [51.6] 微調整された音声表現モデルは、特定のタスクのパフォーマンスを向上させることができるが、しばしばタスク間の一般化能力を損なう。
微調整中の重量変化の規則化のような既存のアプローチは、事前訓練されたモデルと十分に高い特徴的類似性を維持できない可能性がある。
本研究では,2段階のファインチューニングフレームワークであるSpeech-FTを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:07:23 GMT)
Birch SGD: A Tree Graph Framework for Local and Asynchronous SGD Methods [51.5] 本稿では,分散SGD手法を解析・設計するための新しい統一フレームワークであるBirch SGDを提案する。
本研究では,Birch SGDを用いて8つの新しい手法を設計し,これまでに知られていた手法とともに解析する。
i) すべてのメソッドが$Oleft(frac(R + 1) L Deltavarepsilon + fracsigma2 L Deltavarepsilon2right)$と同じ"イテレーションレート"を共有している。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:36:59 GMT)
Towards Graph Foundation Models: Learning Generalities Across Graphs via Task-Trees [50.8] タスクツリーを用いたグラフのクロスタスク一般化のための新しい手法を提案する。
本稿では,グラフニューラルネットワーク(GNN)を多種多様なタスクツリー上で事前学習することにより,伝達可能な知識を誘導することを示す。
これにより、最小限の微調整で下流タスクに効率的に適応できる。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:58:07 GMT)
DiffPO: Diffusion-styled Preference Optimization for Efficient Inference-Time Alignment of Large Language Models [50.3] 拡散型優先度最適化(Diffusion-styled Preference Optimization: モデル)は、LLMを人間と整合させるための効率的でポリシーに依存しないソリューションを提供する。
modelavoidはトークンレベルの生成に関連する時間遅延をモデル化する。
AlpacaEval 2, MT-bench, HH-RLHFの実験により, 種々の環境におけるアライメント性能が良好であることが示された。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:28:30 GMT)
MGD$^3$: Mode-Guided Dataset Distillation using Diffusion Models [50.2] 本稿では,事前学習した拡散モデルを利用したモード誘導拡散モデルを提案する。
提案手法は,異なるデータモードを識別するモード発見,クラス内多様性を高めるモード誘導,および合成試料中のアーティファクトを緩和するモード誘導という3段階のデータセットの多様性に対処する。
本手法は, 蒸留損失を伴う微調整拡散モデルの必要性を排除し, 計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:40:23 GMT)
Enabling Uncertainty Estimation in Iterative Neural Networks [49.6] 本研究では,アンサンブルのような手法よりもはるかに低い計算コストで最先端の見積もりを提供する不確実性推定手法を開発する。
航空画像における道路検出と2次元および3次元形状の空力特性の推定という2つの応用領域に組み込むことで,その実用的価値を実証する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:54:24 GMT)
Assistant-Guided Mitigation of Teacher Preference Bias in LLM-as-a-Judge [49.3] AGDe-Judgeは、トレーニングデータのラベルとフィードバックの両方から疎外するように設計されたフレームワークです。
AGDe-Judgeは、6つの評価ベンチマークで高いパフォーマンスを維持しながら、教師の嗜好バイアスを効果的に低減します。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:48:49 GMT)
Statistical Collusion by Collectives on Learning Platforms [49.2] 集団は自身の利益に合わせるためにプラットフォームに影響を与えようとするかもしれない。
この方法でプラットフォームに影響を与えるためには、集団が実行しなければならない計算を理解することが不可欠である。
これらの問題を理論的かつアルゴリズム的に処理するフレームワークを開発する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:57:43 GMT)
Speech-IFEval: Evaluating Instruction-Following and Quantifying Catastrophic Forgetting in Speech-Aware Language Models [49.2] 本稿では,命令追従能力を評価するための評価フレームワークであるSpeech-IFevalを紹介する。
近年のSLMは,音声認識を大規模言語モデル (LLM) と統合し,音声中心の訓練によるテキスト能力の低下を招いている。
以上の結果から, SLM はテキストベースの LLM よりもはるかに高い性能を示し, 基本命令にも耐え難いことが示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:37:55 GMT)
Optimized Text Embedding Models and Benchmarks for Amharic Passage Retrieval [49.2] トレーニング済みのAmharic BERTとRoBERTaのバックボーンをベースとした,Amharic固有の高密度検索モデルを提案する。
提案したRoBERTa-Base-Amharic-Embedモデル(110Mパラメータ)は,MRR@10の相対的な改善を17.6%達成する。
RoBERTa-Medium-Amharic-Embed (42M)のようなよりコンパクトな派生型は13倍以上小さいまま競争力を維持している。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:06:20 GMT)
Universal Reasoner: A Single, Composable Plug-and-Play Reasoner for Frozen LLMs [48.8] Universal Reasoner (UniR) は、フリーズされたLarge Language Models (LLM) で使用可能な、シングル、ライト、コンポーザブル、プラグ・アンド・プレイの推論モジュールである。
UniRは、報酬を事前定義された報酬を使って独立して訓練されたスタンドアロンの推論モジュールに分解する。
異なるタスクのために訓練された複数のUniRモジュールは、ログをまとめることで共同で適用することができ、合成による複雑な推論を可能にする。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:19:10 GMT)
AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.8] 本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:30:02 GMT)
AmorLIP: Efficient Language-Image Pretraining via Amortization [47.4] Contrastive Language-Image Pretraining (CLIP) は、様々な下流のテキストイメージタスクにまたがる強力なゼロショット性能を示している。
軽量ニューラルネットワークによるコントラスト学習に関わる高価な計算を記憶する,効率的なCLIP事前学習フレームワークであるAmorLIPを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:30:37 GMT)
BAH Dataset for Ambivalence/Hesitancy Recognition in Videos for Behavioural Change [47.4] 本稿では,ビデオ中のA/Hの主観的マルチモーダル認識のために収集された,最初の行動的環境・衛生(BAH)データセットを紹介する。
BAHは1,118本、合計8.26時間、A/H1.5時間である。
マルチモーダル・セットアップにおけるフレームレベルのBAHとビデオレベルの認識、ゼロショット予測、教師なしドメイン適応を用いたパーソナライズのための結果のベースライン。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:29:00 GMT)
Medical Large Vision Language Models with Multi-Image Visual Ability [46.9] 83.2Kの医療用マルチイメージQAペアからなるMed-MIM命令データセットを提案する。
我々は,マンティスとLLaVA-Medを微調整し,MIM-LLaVA-MedとMed-Mantisの2種類の専門医用VLMを作製した。
また,LVLMの医用マルチイメージ理解能力を評価するために,Med-MIMベンチマークを開発した。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:31:22 GMT)
An Embarrassingly Simple Defense Against LLM Abliteration Attacks [46.7] 大型言語モデル(LLM)は通常、有害な指示を拒絶することで安全ガイドラインに従うように整列されている。
失語症と呼ばれる最近の攻撃は、拒絶行動に最も責任がある唯一の潜伏方向を隔離し、抑制する。
本稿では,モデルがリフレクションを生成する方法を変更するディフェンスを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:18:24 GMT)
Chatbot Arena Meets Nuggets: Towards Explanations and Diagnostics in the Evaluation of LLM Responses [45.3] 当社のAutoNuggetizerフレームワークを使用して,LMArenaが提供する約7Kの検索アリーナバトルからのデータを分析する。
その結果,ナゲットスコアとヒトの嗜好との間に有意な相関が認められた。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:51:56 GMT)
Alchemist: Turning Public Text-to-Image Data into Generative Gold [44.5] 本稿では,汎用的な微調整データセットを作成するための新しい手法を提案する。
この手法を用いて、コンパクトな3,350サンプルのSFTデータセットであるAlchemistを構築する。
実験により、アルケミストは多様性とスタイルを保ちながら、5つのパブリックなT2Iモデルの生成品質を大幅に改善することが示された。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:08:20 GMT)
Investigating Inference-time Scaling for Chain of Multi-modal Thought: A Preliminary Study [44.4] 様々な領域にまたがる10の課題に対して,一般的なサンプリングベースと木探索ベースの推論時間スケーリング手法について検討した。
結果から,マルチモーダル思考は従来のテキストのみの思考よりも性能が向上することが示された。
これらの利点にもかかわらず、マルチモーダル思考はよりリッチな視覚入力を処理するためにより高いトークン消費を必要とする。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:36:14 GMT)
AssistedDS: Benchmarking How External Domain Knowledge Assists LLMs in Automated Data Science [44.2] AssistedDSは、大規模言語モデルがドメイン知識をどのように扱うかを評価するために設計されたベンチマークである。
我々は、最先端のLLMを、有害なドメイン知識を識別し、有効に適用する能力に基づいて評価する。
我々の結果は、専門家の知識を批判的に評価し活用する現在のモデルの能力に、かなりのギャップがあることを示します。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:50:21 GMT)
Do Vision-Language Models Really Understand Visual Language? [43.9] ダイアグラムは、複雑な概念とその関係をイメージとして表現した視覚言語の典型例である。
近年の研究では、LVLM(Large Vision-Language Models)が図を含む複雑な推論タスクに対処できることが示唆されている。
本稿では,LVLMのダイアグラム理解能力を評価するための総合的なテストスイートを開発する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:16:26 GMT)
Conventional Contrastive Learning Often Falls Short: Improving Dense Retrieval with Cross-Encoder Listwise Distillation and Synthetic Data [43.8] コーパス特異的微調整レンズによる埋め込みモデルの検索効率の改善について検討した。
従来のInfoNCEのコントラスト損失を用いた微調整は、最先端モデルの有効性を低下させることが多い。
我々は、BERT埋め込みモデル間の最先端の有効性を実現する埋め込みモデルをトレーニングするために、我々のアプローチを利用する。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:06:19 GMT)
Temperature is All You Need for Generalization in Langevin Dynamics and other Markov Processes [43.7] 過度にパラメータ化されたモデルのトレーニングにおいて、トレーニングとテストエラーのギャップを分析する。
トレーニング時間にもミキシングにも依存せず、次元や勾配規範にも依存せず、損失やモデルの他の特性にも依存しています。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:49:09 GMT)
FedSKC: Federated Learning with Non-IID Data via Structural Knowledge Collaboration [43.3] FedSKCのキーとなるアイデアは、相互依存関係データ分散からドメインの好みを抽出し、転送することである。
FedSKCは、コントラスト学習、グローバルな不一致集約、グローバルな期間レビューの3つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:24:49 GMT)
Turb-L1: Achieving Long-term Turbulence Tracing By Tackling Spectral Bias [43.0] 本稿では,革新的な乱流予測法であるTurb-L1を提案する。
クロススケールな相互作用を正確に捉え、高周波力学の忠実さを保っている。
長期的な予測では、平均正方形誤差(MSE)を80.3%、構造類似度(SSIM)をSOTAベースラインと比較して9ドル以上値下げする。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:38:55 GMT)
PIGPVAE: Physics-Informed Gaussian Process Variational Autoencoders [42.9] 本稿では,物理制約を組み込んでデータから学習し,性能を向上させる新しい生成モデルを提案する。
生成過程に物理モデルを組み込むことで、VAEアーキテクチャを拡張し、基礎となるダイナミクスをより効果的に捉えることができる。
我々はPIGPVAEが観測された分布を超えて現実的なサンプルを作成できることを示した。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:12:01 GMT)
REACT: Representation Extraction And Controllable Tuning to Overcome Overfitting in LLM Knowledge Editing [42.9] 本稿では,正確かつ制御可能な知識編集のためのフレームワークであるREACTを紹介する。
最初の段階では、調整された刺激を用いて、潜在的な事実表現を抽出する。
第2段階では,大小スカラーのベクトルを用いて,制御可能な摂動を隠蔽状態に適用する。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:57:06 GMT)
Recursive InPainting (RIP): how much information is lost under recursive inferences? [40.7] 生成人工知能の急速な普及は、コンテンツ作成と修正を加速させている。
例えば、AI生成コンテンツは、新しいAIモデルをトレーニングし、パフォーマンスを低下させるために使用される可能性がある。
AIイメージ修正の例として、AIモデルが画像の欠落した断片を完了させる、インペインティングがある。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:57:09 GMT)
Barbie: Text to Barbie-Style 3D Avatars [40.3] 分離可能な靴、アクセサリー、シミュレーション可能な衣服を備えたアニマタブルな3Dアバターを生成するための新しいテキスト駆動フレームワークであるBarbieを提案する。
私たちの枠組みは、象徴的なバービー人形の美学を本当に捉えています。
本フレームワークは,アパレルの組み合わせ,編集,表現型アニメーション,物理シミュレーションなど,多様なアプリケーションを可能にする。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:35:27 GMT)
Offline Clustering of Linear Bandits: Unlocking the Power of Clusters in Data-Limited Environments [39.9] オフラインデータセットを使用してクラスタプロパティを学習し、複数のユーザ間の意思決定を改善する方法について検討する。
Off-ClusBandの主な課題は、ユーザのデータ不足だ。
任意の量のユーザデータに対して良好に動作するOff-C$2$LUBと、制限されたデータにバイアスがかかるOff-CLUBの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:43:40 GMT)
SituatedThinker: Grounding LLM Reasoning with Real-World through Situated Thinking [39.7] 我々はSituatedThinkerを紹介した。これは大規模な言語モデルが現実世界の文脈で推論を基礎づけることを可能にするフレームワークだ。
強化学習を利用することで、SituatedThinkerは現実世界と意図的に推論して情報とフィードバックを得る。
実験結果から,マルチホップ質問応答と数理推論のベンチマークにおいて,大幅な性能向上が得られた。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:20:04 GMT)
iTool: Reinforced Fine-Tuning with Dynamic Deficiency Calibration for Advanced Tool Use [39.7] 大規模な言語モデルを外部ツールで拡張することは、その機能を強化するための有望なアプローチである。
その結果, 合成データの増加に伴い, トレーニングは著しく低下することがわかった。
我々は,この制限を緩和するために,反復的に強化された微調整戦略を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:49:47 GMT)
Efficient Reasoning for LLMs through Speculative Chain-of-Thought [39.6] OpenAI-o1やDeepseek-R1のような大きな推論言語モデルは、タスク解決能力が優れていたため、広く注目を集めている。
効率的な推論のための既存の方法は、主にモデルパラメータの数を減らしたり、チェーンオブ思考の長さを短縮することに焦点を当てている。
本稿では,平均推論速度の高速化により推理遅延を他の視点から低減するSCoT(Speculative Chain-of-Thought)を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:32:14 GMT)
Lightweight Embeddings with Graph Rewiring for Collaborative Filtering [38.9] 本稿では,グラフベースのレコメンデーションサービスにおいて,LERG (Rewired Graph for Graph Collaborative Filtering) を用いた軽量な埋め込みを提案する。
LERGはLEGCFの構成コードブック構造を維持しているが、ストレージコストを削減するために量子化技術を導入している。
LERGは、グラフベースのレコメンデーションサービスのストレージと計算コストを劇的に削減しながら、優れたレコメンデーション性能を達成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:39:20 GMT)
NTIRE 2025 Challenge on Video Quality Enhancement for Video Conferencing: Datasets, Methods and Results [38.6] この課題は,ビデオ会議シナリオにおける画質向上を目的とした映像品質向上モデルの設計であった。
クラウドソースのフレームワークで評価された10の有効な提出書を受け取りました。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:53:24 GMT)
Adversarial Bandit over Bandits: Hierarchical Bandits for Online Configuration Management [37.7] 本研究は, 難解なリプシッツ逆数を持つ計量作用空間における非確率的マルチアーム・バンディット(MAB)問題を研究する。
我々は,現在最先端のフラットなアルゴリズムを利用できる階層型Adversarial Bandit over BanditsアルゴリズムであるABoBを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:30:47 GMT)
RECAST: Strengthening LLMs' Complex Instruction Following with Constraint-Verifiable Data [37.6] RECASTはデータセットを合成するための新しいフレームワークで、各サンプルには既存のベンチマークよりもはるかに多くの制約が組み込まれている。
我々は15の制約型にまたがる30kインスタンスからなる大規模で高品質なデータセットであるRECAST-30Kを構築した。
実験の結果、RECAST-30Kで微調整されたモデルでは、後続の複雑な命令が大幅に改善された。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:31:08 GMT)
A Snapshot of Influence: A Local Data Attribution Framework for Online Reinforcement Learning [37.6] オンラインRLトレーニングのためのアルゴリズム,反復的影響に基づくフィルタリング(IIF)を提案する。
IIFはサンプルの複雑さを減らし、トレーニングをスピードアップし、より高いリターンを達成する。
これらの結果は、オンラインRLの解釈可能性、効率、有効性を向上させる。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:25:57 GMT)
How to Synthesize Text Data without Model Collapse? [37.2] 合成データのモデル崩壊は、自己生成データに対する反復的なトレーニングが徐々に性能を低下させることを示している。
半合成データを得るために,人為的データに対するトークン編集を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:21:58 GMT)
DeCoDe: Defer-and-Complement Decision-Making via Decoupled Concept Bottleneck Models [37.1] 我々は人間-AI協調のための概念駆動型フレームワークを提案する。
DeCoDeは人間解釈可能な概念表現に基づいて戦略決定を行う。
自律的なAI予測、人間への延期、人間とAIの協調的な相補性という3つのモードをサポートする。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:34:45 GMT)
MaskedManipulator: Versatile Whole-Body Control for Loco-Manipulation [37.0] 人間は自分の世界と対話し、多目的な目標を達成するために正確な全身制御を活用します。
このようなゴール駆動制御は、アニメーションシステムのための新しい手続きツールを可能にする。
本稿では,文字本体と操作対象の両方を直感的に制御するMaskedManipulatorを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:46:14 GMT)
RankLLM: A Python Package for Reranking with LLMs [36.8] 本稿では,大規模言語モデル (LLM) をランク付けするオープンソースPythonパッケージである RankLLM を紹介する。
RankLLMは、ユーザビリティを改善するために、検索用のPyseriniとオプションで統合し、マルチステージパイプラインの総合的な評価を提供する。
RankGPT,LRL, RankVicuna, RankZephyr, その他の最近のモデルの結果を再現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:29:27 GMT)
Divide-Then-Aggregate: An Efficient Tool Learning Method via Parallel Tool Invocation [36.3] 本稿では,新しい並列ツール呼び出しパラダイムDTA-Llamaを紹介する。
まず,従来の木に基づくツールサーチパスをDAG構造に変換する。
DTA-Llamaはデータセット上でトレーニングされ、現在のタスクを複数の並列ツール呼び出しサブタスクに反復的に分割する方法を学ぶ。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:59:04 GMT)
The universality class of the first levels in low-dimensional gravity [36.1] カオスアンサンブルの鋭く定義された基底状態の上に定義された量子状態の小さな群の物理学について検討する。
第1レベル(UFL)のこの普遍性クラスは、合成されたランダム行列モデルの大部分で実現されている。
これらの状態の物理的性質、特に外乱に対する例外的な剛性について論じる。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:20:57 GMT)
Visual Program Distillation with Template-Based Augmentation [36.1] 人為的なプログラムアノテーションを必要としない低コストのビジュアルプログラム蒸留法を提案する。
比較的少量の質問/回答データにより、より高速な推論の利点を付加して、小さな言語モデルは高品質なビジュアルプログラムを生成することができる。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:38:41 GMT)
Enhancing Text-to-Image Diffusion Transformer via Split-Text Conditioning [35.5] 1フライ完全文入力は、重要な意味的詳細を見落としているか、意味的混乱を引き起こす。
そこで本研究では,DiT-STという新しいスプリット・テキスト・コンディショニング・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:33:05 GMT)
When Models Don't Collapse: On the Consistency of Iterative MLE [35.0] 最大誤差推定(MLE)のためのモデル崩壊の研究
実データの一部が消えても崩壊は避けられることを示す非漸近境界を確立する。
MLE整合性以外にもいくつかの仮定(MLE整合性)が本当に必要であることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:50:46 GMT)
AAAR-1.0: Assessing AI's Potential to Assist Research [34.9] AAAR-1.0は,大規模言語モデル(LLM)の性能を評価するためのベンチマークデータセットである。
AAAR-1.0は、以前のベンチマークと大きく異なる2つの主要な方法である: 第一に、明らかに研究指向で、深いドメインの専門知識を必要とするタスク、第二に、研究者が日々従事する主要なアクティビティを反映する研究者指向である。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:54:06 GMT)
EDTformer: An Efficient Decoder Transformer for Visual Place Recognition [34.9] 視覚的位置認識(VPR)は、クエリ画像の一般的な地理的位置を決定することを目的としている。
特徴集約のための効率的なデコーダ変換器(EDTformer)を提案する。
EDTformerは、深い機能の中でコンテキスト情報を十分に活用できます。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:53:18 GMT)
UNCERTAINTY-LINE: Length-Invariant Estimation of Uncertainty for Large Language Models [34.5] UNCERTAINTY-LINEは、名目上は長さ正規化UQ法よりも一貫して改善されていることを示す。
本手法は, ポストホック, モデル非依存であり, 様々なUQ尺度に適用可能である。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:30:43 GMT)
ComparisonQA: Evaluating Factuality Robustness of LLMs Through Knowledge Frequency Control and Uncertainty [34.2] 283Kの抽象的な質問を含む比較QAベンチマークを導入する。
LLMの性能における知識周波数の役割を研究するために、制御可能な比較を確実にする。
GPT-4oを含むLSMは、低周波知識に関して特にロバスト性を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:49:32 GMT)
VTool-R1: VLMs Learn to Think with Images via Reinforcement Learning on Multimodal Tool Use [33.8] VTool-R1は、視覚言語モデルを訓練し、思考のマルチモーダル連鎖を生成する最初のフレームワークである。
VTool-R1はPythonベースのビジュアル編集ツールをReinforcement Learning Finetuningプロセスに統合する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:23:39 GMT)
A Comprehensive Survey on the Risks and Limitations of Concept-based Models [33.6] 概念ベースのモデルは、基本的に標準的なディープニューラルネットワークを改善するための説明可能なネットワークである。
これらのモデルは、医療診断や金融リスク予測といった重要な応用において非常に成功している。
しかし、近年の研究でそのようなネットワークの構造に重大な制限があることが判明した。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:53:26 GMT)
Better Think with Tables: Tabular Structures Enhance LLM Comprehension for Data-Analytics Requests [33.5] 大規模言語モデル(LLM)は、情報検索やデータ操作に関連するデータ分析要求に悩まされることが多い。
我々は、データ分析要求のために表構造をLCMに注入するThinking with Tablesを紹介した。
テーブルを提供すると平均的なパフォーマンスが40.29パーセント向上し、操作性やトークン効率が向上することを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:48:58 GMT)
Understanding Multimodal LLMs Under Distribution Shifts: An Information-Theoretic Approach [33.5] マルチモーダルな大言語モデル(MLLM)は期待できる能力を示しているが、分散シフトの下では苦労している。
MLLMの安全性と信頼性を確保するためには,MLLMのリスクを特徴づけ定量化できる形式的枠組みの確立が必要であると論じる。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:20:21 GMT)
FD-Bench: A Modular and Fair Benchmark for Data-driven Fluid Simulation [33.5] FD-Benchは、データ駆動流体シミュレーションのための最初の公正で、モジュール的で、包括的で再現可能なベンチマークである。
空間的、時間的、損失関数モジュール間の公正な比較を提供する。
将来のデータ駆動流体モデルの堅牢な評価の基礎を築いている。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:24:18 GMT)
Shifting AI Efficiency From Model-Centric to Data-Centric Compression [33.4] 効率的なAIの研究の焦点は、モデル中心の圧縮からデータ中心の圧縮へとシフトしている、と我々は主張する。
我々はトークン圧縮を新たなフロンティアとして位置づけ、モデルトレーニングや推論中にトークンの数を減らすことでAI効率を向上させる。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:51:17 GMT)
iAgent: LLM Agent as a Shield between User and Recommender Systems [33.3] レコメンダシステムは、通常、ユーザーがプラットフォームレコメンデーションアルゴリズムの制御下で直接露出される、ユーザープラットフォームパラダイムを取り入れている。
本稿では,エージェントがユーザとレコメンダシステムの間の保護シールドとして機能する,新しいユーザエージェントプラットフォームパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:28:35 GMT)
Handling Label Noise via Instance-Level Difficulty Modeling and Dynamic Optimization [33.1] ディープニューラルネットワークは、ノイズの多い監視の下で一般化性能が低下する。
既存のメソッドでは、クリーンなサブセットの分離やノイズのあるラベルの修正に重点を置いている。
本稿では,インスタンスレベルの最適化が可能な新しい2段階雑音学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:01:17 GMT)
Unveiling the Key Factors for Distilling Chain-of-Thought Reasoning [33.0] 小型言語モデル(SLM)におけるCoT蒸留の影響要因について検討した。
その結果, SLM は粒度と非単調な関係を示し, より微細な推論とより弱いモデルにより, より単純なCoT 監督下でより優れた性能を示すことがわかった。
これらの知見は、特定の学生モデルにCoT戦略を適合させることの必要性を強調し、SLMにおけるCoT蒸留を最適化するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:05:57 GMT)
Self-Guidance: Boosting Flow and Diffusion Generation on Their Own [32.9] 自己誘導(SG)は、低品質サンプルの生成を抑制して画質を向上させる。
我々は、異なるアーキテクチャでテキスト・ツー・イメージとテキスト・ツー・ビデオ生成の実験を行う。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:42:43 GMT)
Describe Anything in Medical Images [32.8] 医用画像の領域別キャプションに大規模視覚言語モデルを活用する,初の包括的フレームワークであるMedDAMを提案する。
MedDAMは特定の画像モダリティに合わせて医療専門家が設計したプロンプトを採用し、堅牢な評価ベンチマークを確立する。
本ベンチマークは,属性レベル検証タスクによる臨床事実性に着目し,MedDAMと他の大規模視覚言語モデルの両方を評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:00:44 GMT)
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network [32.7] ハイパースペクトル目標検出(HTD)は、ハイパースペクトル画像のスペクトル情報に基づいて特定の物質を識別することを目的としている。
既存のHTD法は、ハイパースペクトル画像の3次元立方体構造を無視した画素単位のバイナリ分類に基づいて開発されている。
ハイパースペクトル・マルチクラス・ポイント・オブジェクト検出のための最初の専用ネットワークであるSpecDETRを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:50:13 GMT)
The Price of Format: Diversity Collapse in LLMs [32.6] 大きな言語モデル(LLM)は、推論中にフォーマットの一貫性を強制するためにロールマーカーや特別なトークンのような構造化テンプレートを使用する。
我々は,この効果をストーリー補完やフリーフォーム生成といったタスクにわたって体系的に評価し,高温サンプリングにおいても多様性の崩壊が持続することを示した。
これらの知見を文脈化するために、構造化されたプロンプトを用いて同じモデルを微調整し、下流タスク性能、アライメント行動、出力多様性の3つの軸で評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:52:35 GMT)
SANNet: A Semantic-Aware Agentic AI Networking Framework for Multi-Agent Cross-Layer Coordination [32.6] エージェントAIネットワーク(AgentNet)は、自律的な意思決定のためのコラボレーションとコーディネートのために、多数の専門のAIエージェントに依存している。
本稿では,セマンティックなエージェント型AIネットワークアーキテクチャであるSANNetを提案する。
SANNetは、競合する目的を持つエージェントが同じ目的のために協力するように選択された場合でも、マルチエージェントネットワークシステムの性能を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:45:18 GMT)
From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D [32.5] 本研究では,3次元地上構造を持つシーンデータ上に構築された新しい2次元空間データ生成およびアノテーションパイプラインを提案する。
複数の公開データセットにまたがって数千のシーンから生成される大規模データセットであるSPAR-7Mを構築した。
さらに,空間能力をより包括的に評価するためのベンチマークであるSPAR-Benchを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:34:20 GMT)
PatentScore: Multi-dimensional Evaluation of LLM-Generated Patent Claims [32.3] LLM生成特許クレームを評価するための多次元評価フレームワークであるPatentScoreを紹介する。
汎用的なNLGメトリクスとは異なり、PatentScoreは特許固有の制約や文書構造を反映し、表面的類似性を超えた評価を可能にする。
我々はPearsonの相関関係を,エキスパートアノテーションを用いた$r = 0.819$で報告し,既存のNLG指標よりも優れていた。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:20:11 GMT)
PatentMind: A Multi-Aspect Reasoning Graph for Patent Similarity Evaluation [32.3] マルチアスペクト推論グラフ(MARG)に基づく特許類似性評価のための新しいフレームワークであるPatentMindを紹介する。
PatentMindは、特許を技術機能、アプリケーションドメイン、クレームスコープの3つのコアディメンションに分解して、ディメンション固有の類似度スコアを計算する。
評価を支援するため,500組の特許ペアからなる人為的注釈付きベンチマークであるPatentSimBenchを構築した。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:28:27 GMT)
The Impact of LoRA Adapters for LLMs on Clinical NLP Classification Under Data Limitations [32.2] 臨床自然言語処理(NLP)のための微調整大型言語モデル(LLM)は、ドメインギャップと限られたデータ可用性のために大きな課題を提起する。
本研究では,ローランド適応(LoRA)に準ずる各種アダプタ技術の有効性について検討する。
我々は2つのTransformerベースのモデルとともに、CamemBERT-bio、AliBERT、DrBERTなどのバイオメディカル事前訓練モデルを微調整した。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:24:22 GMT)
To CoT or To Loop? A Formal Comparison Between Chain-of-Thought and Looped Transformers [32.0] CoT(Chain-of-Thought)とLooped Transformerは、推論タスクのパフォーマンスを実証的に改善することが示されている。
それぞれの強みと限界を形式的に分析する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:49:37 GMT)
Effort-aware Fairness: Incorporating a Philosophy-informed, Human-centered Notion of Effort into Algorithmic Fairness Metrics [31.0] 本稿では,「力」の概念を基礎として,Effort-aware Fairness(EaF)を概念化し,評価する哲学的インフォームド手法を提案する。
私たちの研究は、AIモデル監査官が改善に多大な努力を払っているが、制御外の体系的・初期的不利益に悩まされている個人に対して、不公平な判断を解明し、修正する可能性を秘めることができるかもしれない。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:07:13 GMT)
CloneShield: A Framework for Universal Perturbation Against Zero-Shot Voice Cloning [30.9] 最近のTTS(text-to-speech)音声クローンのブレークスルーは、深刻なプライバシー上の懸念を引き起こしている。
ゼロショット音声のクローンを防止するために特別に設計された,普遍的な時間領域逆転摂動フレームワークであるCloneShieldを紹介する。
本手法は、合成テキストの事前知識を必要とせず、話者や発話に対して堅牢な保護を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:22:00 GMT)
TheoremExplainAgent: Towards Video-based Multimodal Explanations for LLM Theorem Understanding [30.3] TheoremExplainAgentは,長文の定理説明ビデオを生成するエージェント的手法である。
以上の結果から, エージェントプランニングは, 詳細な長編ビデオ作成に不可欠であることが判明した。
マルチモーダルな説明は、テキストベースの説明が明らかにならない深い推論の欠陥を露呈する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:34:47 GMT)
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning [30.3] Chain-of-Thoughtは、すべてのクエリに対する長い推論ステップを無差別に生成する。
AdaCoT(Adaptive Chain-of-Thought)は、LLMがCoTを呼び出すタイミングを適応的に決定できる新しいフレームワークである。
重要な技術的貢献はSLM(Selective Loss Masking)であり、決定境界崩壊の防止を目的としている。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:39:29 GMT)
Hybrid Memetic Search for Electric Vehicle Routing with Time Windows, Simultaneous Pickup-Delivery, and Partial Recharges [30.0] 本研究は電気自動車ルーティング問題(EVRP)の新興かつ重要な拡張に対処する。
EVRP-TW-SPDを解くためのハイブリッドメメティックアルゴリズム(HMA)を提案する。
既存のベンチマークと実世界のシナリオのギャップを埋めるために、我々は、新しい大規模EVRP-TW-SPDベンチマークセットを導入する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:35:04 GMT)
SoloSpeech: Enhancing Intelligibility and Quality in Target Speech Extraction through a Cascaded Generative Pipeline [29.9] SoloSpeechは、圧縮、抽出、再構築、修正プロセスを統合するカスケード生成パイプラインである。
ターゲット音声抽出および音声分離タスクにおける最先端の知性および品質を実現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:00:48 GMT)
Exact Expressive Power of Transformers with Padding [29.8] 長さ$n$の入力に対して$O(logd n)$ループするパッド付き変換器は、適度に並列化可能な問題のクラス$mathsfTCd$を正確に認識する。
この結果から, パディングとループのさらなる探索が, 思考の連鎖に対する並列化可能な代替手段として動機づけられた。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:52:15 GMT)
LIMOPro: Reasoning Refinement for Efficient and Effective Test-time Scaling [29.7] PIR(Perplexity-based Importance Refinement)は,各推論ステップの重要性を定量的に評価するフレームワークである。
PIRは、プログレッシブ推論コンポーネントを保持しながら、低重要機能ステップのみを特定し、選択的にプーンする。
我々のアプローチは、異なるモデルサイズ、データソース、トークン予算にまたがる強力な一般化可能性を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:17:57 GMT)
Mean-Shift Distillation for Diffusion Mode Seeking [29.3] 平均シフト蒸留は拡散出力分布の勾配のプロキシを提供する。
本研究は, モードアライメントが優れ, 合成および実用両方のコンバージェンスが改善されていることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:54:37 GMT)
Training Turn-by-Turn Verifiers for Dialogue Tutoring Agents: The Curious Case of LLMs as Your Coding Tutors [29.0] 本稿では,学習者の知識状況とターン・バイ・ターン・バイ・ターン・バリデーションを推定し,タスク完了に向けた効果的な指導を確実にする,新しいエージェントワークフローであるTrace-and-Verify(TRAVER)を提案する。
我々のアプローチはコーディングを超えて拡張することができ、人間のタスク学習のための学習エージェントの進化に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:45:11 GMT)
Talk to Your Slides: Language-Driven Agents for Efficient Slide Editing [28.8] 本研究では、スライドを%のアクティブPowerPointセッションで編集するエージェントであるTalk-to-Your-Slidesを提案する。
我々のシステムでは、34.02%の高速処理、34.76%の命令忠実度、87.42%の動作がベースラインよりも安価である。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:05:53 GMT)
100-LongBench: Are de facto Long-Context Benchmarks Literally Evaluating Long-Context Ability? [28.7] リアルタイムベースの長期コンテキスト評価ベンチマークには2つの大きな欠点がある。
LongBenchのようなベンチマークは、しばしばモデルのベースライン能力とロングコンテキストのパフォーマンスを分離するための適切なメトリクスを提供しない。
長さ制御可能な長文ベンチマークと,ベースライン知識を真の長文能力から切り離す新しいメトリクスを導入する。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:58:31 GMT)
Hypercube-RAG: Hypercube-Based Retrieval-Augmented Generation for In-domain Scientific Question-Answering [28.5] 大きな言語モデル(LLM)は、しばしばテーマ固有の問題を解決するために外部知識を組み込む必要がある。
本稿では,高精度かつ効率的な検索のための新しいRAGフレームワークであるHypercube-RAGを紹介する。
提案手法は精度を3.7%向上し,検索効率を81.2%向上させる。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:42:06 GMT)
The Eye of Sherlock Holmes: Uncovering User Private Attribute Profiling via Vision-Language Model Agentic Framework [28.3] 新しいプライバシーリスクは、個人画像から機密性の高い属性を推測する能力に関連している。
現代のアプリがユーザーの写真アルバムに簡単にアクセスできることを考えると、この脅威は特に深刻です。
本研究では、個人画像における個人属性のプロファイリングを研究するための最大のデータセットであるPAPIを構築する。
また、プライバシ推論を強化するために、VLMとLLMを組み合わせたハイブリッドエージェントフレームワークであるHolmesEyeを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:22:10 GMT)
The Final Layer Holds the Key: A Unified and Efficient GNN Calibration Framework [28.1] グラフニューラルネットワーク(GNN)は、グラフベースのタスクにおいて顕著な効果を示した。
しかしながら、彼らの予測的自信は、しばしば誤解され、通常、自信不足を示す。
本稿では,この問題に対処するための簡易かつ効率的なグラフキャリブレーション法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:41:11 GMT)
A partition cover approach to tokenization [27.8] トークン化とは、文字列を一定の語彙サイズのトークンに符号化するプロセスである。
Byte-Pair corpora (BPE) は、トークン化問題を圧縮問題として定式化し、マージのシーケンスを実行することでそれに取り組む。
GreedTokは圧縮においてBPEやUnigramよりも優れており、GreedWMCに匹敵するカバースコアが得られることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:39:07 GMT)
A Necessary Step toward Faithfulness: Measuring and Improving Consistency in Free-Text Explanations [27.4] 本稿では,エビデンス重みの概念を拡張し,予測-説明整合性の尺度を提案する。
直接選好最適化を適用することで、3つのモデルファミリー間で発生した説明の一貫性が向上することを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:18:24 GMT)
PersuasiveToM: A Benchmark for Evaluating Machine Theory of Mind in Persuasive Dialogues [27.2] 本稿では,大規模言語モデルのマインド能力理論を評価するためのベンチマークであるPersuasiveToMを提案する。
フレームワークには、ToM ReasoningとToM Applicationという2つのコアタスクが含まれています。
PersuasiveToMの目的は、複雑な心理的活動に焦点を当てたLSMのToM推論能力を効果的に評価することである。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:00:50 GMT)
Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models [27.1] 数学的推論タスクにおける命令追従評価のためのベンチマークであるMathIFを紹介する。
我々の実証分析では、推論能力のスケールアップと制御可能性の維持の間に一貫した緊張関係が明らかになっている。
簡単な介入であっても、性能を推論するコストはかかるものの、部分的に服従を回復できることが示される。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:52:51 GMT)
Conformity in Large Language Models [27.0] 誤った応答に対する整合性は、言語モデルの有効性を損なう可能性がある。
本稿では,一般的な大規模言語モデルにおける適合性の度合いを検討するために,心理学実験を適用した。
私たちは、LSMが彼ら自身の予測でより不確実である場合に、より適合する可能性が高いことを示す最初の人です。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:18:15 GMT)
ScaleBiO: Scalable Bilevel Optimization for LLM Data Reweighting [26.9] バイレベル最適化はさまざまな機械学習設定で有効性を示しているが、実際にはほとんどのアルゴリズムは2次情報を必要とする。
本稿では,大規模LLMデータ再重み付けのための2レベル最適化に着目した,このパラダイムのスケーラブルなインスタンス化について紹介する。
LISAと呼ばれる最近提案されたメモリ効率のトレーニング技術と組み合わせることで、我々の新しいアルゴリズムは8倍のH100 GPUで$sim$30BのLLMにスケールできる。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:03:51 GMT)
Evaluating Text Creativity across Diverse Domains: A Dataset and Large Language Model Evaluator [26.9] 大規模言語モデル(LLM)の創造性評価は依然として挑戦的なフロンティアである
本稿では,テキストの創造性を評価するためのペアワイズ比較フレームワークを提案する。
CreataSetのトレーニングを通じて, CrEvalというLCMに基づく評価器を開発した。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:25:23 GMT)
FP4 All the Way: Fully Quantized Training of LLMs [26.2] 主に4ビット浮動小数点(FP4)の精度を用いて,大規模言語モデル(LLM)の完全量子化訓練(FQT)を実演する。
ブロックサイズ,スケーリングフォーマット,ラウンドメソッドなど,FP4の主要な設計選択について検討する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:14:25 GMT)
VPGS-SLAM: Voxel-based Progressive 3D Gaussian SLAM in Large-Scale Scenes [26.1] VPGS-SLAMは3DGSベースの大規模なRGBD SLAMフレームワークで、屋内および屋外の両方のシナリオに対応している。
我々は,コンパクトで正確なシーン表現のための複数のサブマップを持つ新しいボクセルベースのプログレッシブ3Dガウスマッピング法を設計する。
さらに,室内および屋外の大規模シーンにおいて,ロバストかつ高精度なカメラトラッキングを実現するための2D-3Dフュージョンカメラトラッキング手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:27:29 GMT)
SRDiffusion: Accelerate Video Diffusion Inference via Sketching-Rendering Cooperation [26.0] SRDiffusionは、大小モデルの協調を利用して推論コストを削減する新しいフレームワークである。
提案手法は,既存のアクセラレーション戦略の新たな方向性として導入され,スケーラブルなビデオ生成のための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:58:52 GMT)
Geometry-guided Online 3D Video Synthesis with Multi-View Temporal Consistency [25.7] 本稿では,高度化と時間的整合性を備えた幾何学誘導型オンラインビデオビュー合成手法を提案する。
私たちのアプローチの主な革新は、画像ベースのレンダリングパイプラインのガイドにグローバルジオメトリを使用することです。
ネットワークは、幾何的に一貫した合成結果を複数のビューと時間にわたって出力することを奨励されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:56:46 GMT)
Optimization-Inspired Few-Shot Adaptation for Large Language Models [25.4] LLM(Large Language Models)は、現実世界のアプリケーションで顕著な性能を示している。
LLMを微調整によって新しいタスクに適応させるには、数ショットのシナリオでは実行不可能な、実質的なトレーニングデータと計算資源が必要となることが多い。
既存のアプローチ、例えば、コンテキスト内学習や。
PEFT(Efficient Fine-Tuning)は、重要な制限に直面している。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:54:23 GMT)
Cluster-Aware Multi-Round Update for Wireless Federated Learning in Heterogeneous Environments [25.4] 本稿では、類似したデータと通信特性を持つグループデバイスとの事前知識の類似性を活用するクラスタリング戦略を提案する。
クラスタを基本単位として扱い、クラスタ化されたコントリビューションしきい値に基づいてローカル更新頻度を調整する新しいクラスタ・アウェア・マルチラウンド・アップデート(CAMU)戦略を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:07:47 GMT)
DeepResearchGym: A Free, Transparent, and Reproducible Evaluation Sandbox for Deep Research [25.4] DeepResearchGymはオープンソースのサンドボックスで、検索APIと、ディープリサーチシステムのベンチマークのための厳格な評価プロトコルを組み合わせる。
このAPIは大規模な公開Webコーパス、すなわちClueWeb22とFineWebをインデックスし、最先端の高密度検索器と、DikANNによる近接検索を使用する。
一般的な商用APIよりも低レイテンシを実現し、実行中の安定したドキュメントランキングを確保し、研究用に自由に利用できる。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:16:13 GMT)
Action is All You Need: Dual-Flow Generative Ranking Network for Recommendation [25.3] 本稿では,推奨シナリオのためのDual-Flow Generative Ranking Network(DFGR)を紹介する。
DFGRは相互作用モデリングの最適化にデュアルフロー機構を採用している。
オープンソースおよび実際の産業データセットにおける実験は、DFGRがDLRMを上回っていることを示している。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:55:18 GMT)
Sparse-to-Dense: A Free Lunch for Lossless Acceleration of Video Understanding in LLMs [25.1] Sparse-to-Dense(StD)は、2つの異なるモジュールを統合する新しいデコード戦略である。
StDはチューニング不要のプラグイン・アンド・プレイのソリューションで、最大1.94$times$ビデオ処理のウォールタイムスピードアップを実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:09:28 GMT)
Towards Better Robustness: Pose-Free 3D Gaussian Splatting for Arbitrarily Long Videos [25.0] 3D Gaussian Splatting (3DGS) はその効率性と高忠実性レンダリングのために強力な表現として登場した。
我々は、カメラのポーズを段階的に推定し、3DGSを任意に長いビデオ入力に最適化する頑健なフレームワークであるRob-GSを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:57:23 GMT)
System-1.5 Reasoning: Traversal in Language and Latent Spaces with Dynamic Shortcuts [24.8] CoT推論(Chain-of-Thought reasoning)は、大規模言語モデルでシステム2推論を行うことを可能にする。
最近の潜在空間推論手法は、言語に復号することなく隠れ状態を操作することで効率を向上させる。
本稿では,適応推論フレームワークであるSystem-1.5 Reasoningを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:35:49 GMT)
Training-free Stylized Text-to-Image Generation with Fast Inference [24.6] 本稿では,事前学習した大規模拡散モデルを利用した新しいスタイリング画像生成手法を提案する。
我々は、潜在整合モデルの自己整合性を利用して、代表的なスタイル統計を抽出する。
次に、モデルが最も関連するスタイルパターンを問合せできる自己意図の標準的な混合を紹介します。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:38:23 GMT)
Behavior Injection: Preparing Language Models for Reinforcement Learning [24.5] 強化微調整(Reinforcement fine-tuning, RFT)は、大規模言語モデル(LLM)の推論能力を高めるための強力なポストトレーニング手法として登場した。
LLM は RFT に非常に矛盾しない応答が可能である。
RLに先立って適用されたタスクに依存しないデータ拡張方式である振舞い注入を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:54:50 GMT)
Self-Critique Guided Iterative Reasoning for Multi-hop Question Answering [24.4] 大規模言語モデル(LLM)は知識集約型マルチホップ推論の課題に直面している。
自己批判型反復推論(SiGIR)を提案する。
SiGIRは、反復推論プロセスのガイドに自己批判的なフィードバックを使用する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:10:24 GMT)
NovelSeek: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification [24.4] NovelSeekは、自律科学研究を行うための統合クローズドループマルチエージェントフレームワークである。
NovelSeekは12の科学研究課題にまたがってその汎用性を実証した。
複数の科学分野において有望な性能向上を達成し、人的努力に比べて大幅にコストを削減した。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:35:19 GMT)
Turning Trash into Treasure: Accelerating Inference of Large Language Models with Token Recycling [24.0] 投機的復号化(英: Speculative decoding)は、推測と検証のパラダイムを通じて推論を加速するアプローチである。
トケンリサイクルは、候補トークンを隣接行列に格納し、幅優先探索アルゴリズムを用いる。
既存の列車なしの手法を30%上回り、広く認められた訓練方法さえも25%上回っている。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:10:14 GMT)
Latent-space adversarial training with post-aware calibration for defending large language models against jailbreak attacks [23.8] 大規模言語モデル(LLM)は、システム脆弱性を利用して安全性対策を回避し、有害な出力を生成するジェイルブレイク攻撃の影響を受けやすい。
この問題に対処するために,ポストアウェアフレームワークを用いたラテントスペース・アドバイザリアル・トレーニングを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:52:22 GMT)
MedITok: A Unified Tokenizer for Medical Image Synthesis and Interpretation [23.8] 医用画像に適した最初の統一トークン化ツールであるMedITokについて紹介する。
低レベルの構造の詳細と、統合潜在空間内の高レベルの臨床的意味をエンコードする。
9つの画像モダリティと4つの異なるタスクにわたる30以上のデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:39:35 GMT)
Towards Robust Influence Functions with Flat Validation Minima [23.7] インフルエンス関数(IF)は、個々のトレーニングサンプルがモデル予測に与える影響を評価するために広く用いられている手法である。
既存のIF手法は、ディープニューラルネットワークにおいて信頼性の高い影響推定を提供しないことが多い。
本研究では,フラットな検証ミニマに特化して設計された影響関数の新たな推定形式を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:20:28 GMT)
Efficient Training of Multi-task Neural Solver for Combinatorial Optimization [23.7] 本稿では,統合型マルチタスクニューラルソルバを実現するための,汎用的で効率的なトレーニングパラダイムを提案する。
本手法は, 制約付きトレーニング予算の範囲内であっても, 全体的な性能を著しく向上させる。
また,本手法は単一タスク学習やマルチタスク学習と比較して最高の結果を得た。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:09:07 GMT)
Step-level Reward for Free in RL-based T2I Diffusion Model Fine-tuning [23.0] テキスト・ツー・イメージ(T2I)拡散モデルにおける微細調整による強化学習(RL)の最近の進歩により、生成された画像と学習可能な報酬関数の整合が図られている。
既存のアプローチは、RL駆動最適化のマルコフ決定過程としてデノナイジングを再構成する。
本稿では,denoisingのステップにまたがる高密度報酬を動的に分散する信用割当フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:43:54 GMT)
SATORI-R1: Incentivizing Multimodal Reasoning with Spatial Grounding and Verifiable Rewards [23.0] DeepSeek-R1は、安定強化学習(RL)を通じてテキスト領域で強力な推論能力を示した
本稿では、VQAを3つの検証段階に分解するSATORI(textbfSpatially$ $textbfAnchored$ $textbfTask$ $textbfOptimization$ with $textbfRetextbfInforcement$ Learning)を紹介する。
実験では、7つのVQAベンチマークで一貫したパフォーマンス改善が示され、最大15.7%の改善が達成された。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:11:06 GMT)
SoK: Dataset Copyright Auditing in Machine Learning Systems [23.0] 本稿では,現在のデータセット著作権監査ツールについて検討し,その有効性と限界について検討する。
本稿では,データセットによる著作権監査研究を,侵入的手法と非侵入的手法の2つに分類する。
結果の要約として、現在の文献における詳細な参照テーブル、キーポイントのハイライト、未解決問題について紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:30:32 GMT)
Chordless Structure: A Pathway to Simple and Expressive GNNs [23.0] コードレス構造に基づくグラフニューラルネットワーク(CSGNN)を提案する。
実世界のデータセットを用いた実験の結果、CSGNNは様々なグラフタスクで既存のGNNよりも優れていた。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:25:56 GMT)
Towards Harmonized Uncertainty Estimation for Large Language Models [22.6] 不確実性推定によって世代間の信頼性を定量化することが不可欠である。
CUE(Corrector for Uncertainity Estimation:不確かさ推定のためのコレクタ)を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:17:57 GMT)
Accurate and Efficient Multivariate Time Series Forecasting via Offline Clustering [22.5] セグメンツ(FOCUS)を用いたオフラインクラスタリングによるフォアキャスタの導入
FOCUSは、長距離依存性モデリングを単純化するMTS予測の新しいアプローチである。
最先端の精度を実現し、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:48:29 GMT)
OpenHOI: Open-World Hand-Object Interaction Synthesis with Multimodal Large Language Model [22.5] オープンワールドHOI合成のための最初のフレームワークであるOpenHOIを紹介する。
本手法では,3次元マルチモーダル大規模言語モデル(MLLM)を統合して,協調的アベイランスグラウンドと意味的タスクの分解を行う。
物理的にもっともらしい相互作用を合成するために, トレーニング不要な物理リファインメント段階と組み合わせたアベイランス駆動拡散モデルを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:48:43 GMT)
FedGuCci: Making Local Models More Connected in Landscape for Federated Learning [22.5] フェデレートラーニング(FL)では、複数のクライアントが反復的なローカル更新とモデル融合を通じてグローバルモデルを協調的にトレーニングする。
本稿では,基本的な接続性の観点からFLの一般化を研究・改善する。
一般化のためにグループ接続を改善するFedGuCciを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:55:56 GMT)
Protein Design with Dynamic Protein Vocabulary [22.4] 機能記述のためのテキストエンコーダと、タンパク質を設計するためのタンパク質言語モデルと、タンパク質断片を動的に検索するフラグメントエンコーダを統合した、新規なタンパク質設計アプローチであるProDVaを紹介する。
最先端のモデルと比較して、ProDVaはトレーニングデータの0.04%未満で同等の機能アライメントを実現し、さらによく折りたたまれたタンパク質を設計する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:50:50 GMT)
JEDI: The Force of Jensen-Shannon Divergence in Disentangling Diffusion Models [22.2] JEDIは、再訓練や外部監督を必要とせず、拡散モデルにおける主観的分離と構成的アライメントを高めるテスト時間適応手法である。
JEDIは、Jensen-Shannon分散に基づく新しい目的を用いて、注目地図における意味的絡み合いを最小化する。
私たちはメソッドの実装を公開します。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:32:24 GMT)
Rethinking the Understanding Ability across LLMs through Mutual Information [22.2] 入力文とその潜在表現(文レベルMI)の間のMIとしての理解を形式化する。
文レベルMIをトークンと文埋め込みの間でトークンレベルMIに分解し、これらの測度を接続する理論的境界を確立する。
我々は、この回復可能性タスクを実装し、異なる言語モデル間でMIを相対的に測定する。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:31:24 GMT)
Language Fusion for Parameter-Efficient Cross-lingual Transfer [22.0] Fusion forLanguage Representations (FLARE)は、英語以外の言語における表現品質と下流のパフォーマンスを向上させる新しい手法である。
FLAREは、低ランク (LoRA) アダプタ内でのソースおよびターゲット言語表現を、軽量線形変換を用いて統合する。
FLAREの有効性を実証するためには、自然言語推論、質問応答、感情分析など、言語横断の自然言語理解タスクにまたがる一連の実験がある。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:20:08 GMT)
Functional-level Uncertainty Quantification for Calibrated Fine-tuning on LLMs [21.9] Calibrated Fine-Tuning (UQ4CT)は、入力を出力にマッピングする関数の空間上の不確実性をキャプチャし、校正する。
我々は,機能空間を階層的に分解するMix-of-expertsフレームワークを用いて,微調整段階のUQ4CTを実装した。
分散シフト中であっても、UQ4CTはより優れたECE性能を高い精度で維持し、一般化性の向上を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:11:40 GMT)
GenAnalysis: Joint Shape Analysis by Learning Man-Made Shape Generators with Deformation Regularizations [21.9] GenAnalysisは、人造形の共同解析を可能にする暗黙の形状生成フレームワークである。
本研究では,各形状の接空間における一方向アフィンベクトル場を復元し,形状変化を抽出する方法を示す。
次に,AAAP変形を中間形状列に繰り返し伝播させることにより形状対応を導出する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:19:58 GMT)
DocMMIR: A Framework for Document Multi-modal Information Retrieval [21.9] 本稿では,新しいマルチモーダル文書検索フレームワークDocMMIRを紹介する。
450Kサンプルからなる大規模クロスドメインマルチモーダルベンチマークを構築した。
その結果、ゼロショットベースラインに比べてMRR@10は+31%改善した。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:58:58 GMT)
GlobalGeoTree: A Multi-Granular Vision-Language Dataset for Global Tree Species Classification [21.7] 木種分類のための包括的グローバルデータセットであるGlobalGeoTreeを紹介する。
GlobalGeoTreeは630万本の樹木が生えており、275科、2,734属21001種にまたがっている。
我々は,生物多様性研究と生態学応用における樹木種分類の進歩とイノベーションの育成のためのベンチマークを確立することを目的としている。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:29:15 GMT)
CLIP-UP: A Simple and Efficient Mixture-of-Experts CLIP Training Recipe with Sparse Upcycling [21.7] Mixture-of-Experts(MoE)モデルは、推論コストを制御しながらモデルキャパシティのスケーリングに不可欠である。
CLIP-Upcycling(CLIP-UP)は,事前学習したCLIPモデルをスパースMoEアーキテクチャに変換する,効率的な代替トレーニング戦略である。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:39:32 GMT)
ODIN: A NL2SQL Recommender to Handle Schema Ambiguity [21.5] ODINはあいまいなスキーマコンポーネントの異なる解釈に基づいてクエリを生成する。
評価の結果,ODINはベースラインに比べて1.5-2$times$で正しいクエリを生成する可能性が向上した。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:22:32 GMT)
Scalable Generation of Spatial Transcriptomics from Histology Images via Whole-Slide Flow Matching [21.3] スライド全体の遺伝子発現の結合分布をモデル化し,細胞間相互作用を考慮したフローマッチング生成モデルSTFlowを提案する。
最近行われたHEST-1kとSTImage-1K4Mベンチマークでは、STFlowは最先端のベースラインを大幅に上回り、病理基盤モデルよりも18%以上改善されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:29:19 GMT)
Achieving $\tilde{\mathcal{O}}(1/N)$ Optimality Gap in Restless Bandits through Gaussian Approximation [21.3] 有限水平Multiform Armed Bandit (RMAB) 問題を$N$等質アームを用いて検討する。
我々のアプローチは、平均だけでなくRMAB力学の分散も捉えるガウス系の構築に基づいている。
これは、RMABを退化させるための$tildemathcalO (1/N)$Optimity gapを確立する最初の結果である。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:42:22 GMT)
LLM-Guided Taxonomy and Hierarchical Uncertainty for 3D Point CLoud Active Learning [21.3] 本稿では3Dポイントクラウドセマンティックセマンティックセグメンテーションのための新しいアクティブラーニングフレームワークを提案する。
大規模言語モデル(LLM)を統合し、階層的なラベル構造を構築し、不確実性に基づくサンプル選択をガイドする。
この結果は,3次元ビジョンにおける知識の先行としてLLMの未解決の可能性を強調し,効率的なポイントクラウドアノテーションのための強力なパラダイムとして階層的不確実性モデリングを確立した。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:10:58 GMT)
Aligning Web Query Generation with Ranking Objectives via Direct Preference Optimization [21.1] 本稿では,クエリ生成プロセスにランキング信号を統合するフレームワークを提案する。
実験の結果,DPO後の問合せと文書の相互関係は高く評価された。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:34:12 GMT)
WHISTRESS: Enriching Transcriptions with Sentence Stress Detection [20.8] 音声言語における話者意図の伝達には, 文ストレスが不可欠である。
WHISTRESSは,文のストレス検出による書き起こしシステム拡張のためのアライメントフリーアプローチである。
TINYSTRESS-15KでWHISTRESSをトレーニングし、いくつかの競争ベースラインに対して評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:45:08 GMT)
CCHall: A Novel Benchmark for Joint Cross-Lingual and Cross-Modal Hallucinations Detection in Large Language Models [20.7] 本稿では,このギャップを埋めるために,新たな言語間およびモダクティブ・ハロシンクス・ベンチマーク (CCHall) を導入する。
具体的には、CCHallは言語横断とモーダル横断の両方の幻覚シナリオを同時に組み込んでいる。
我々はCCHallについて包括的な評価を行い、主要なオープンソースLLMとクローズドソースLLMの両方を探索する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:54:32 GMT)
Position: Enough of Scaling LLMs! Lets Focus on Downscaling [20.6] 我々は,大規模言語モデル(LLM)の開発におけるダウンスケーリングへのパラダイムシフトを提唱する。
本稿では,資源需要を大幅に削減しつつ,性能の維持を図るLLMをダウンスケールするための総合的なフレームワークを提案する。
本稿では,従来のスケーリングパラダイムから切り離すための実践的戦略について概説する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:53:34 GMT)
Beyond Editing Pairs: Fine-Grained Instructional Image Editing via Multi-Scale Learnable Regions [20.6] 我々は、広く利用可能な膨大なテキストイメージ対を利用する命令駆動画像編集のための新しいパラダイムを開発する。
本手法では,編集プロセスのローカライズとガイドを行うために,マルチスケールの学習可能な領域を導入する。
画像とそのテキスト記述のアライメントを監督・学習として扱い,タスク固有の編集領域を生成することにより,高忠実で高精度かつ命令一貫性のある画像編集を実現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:40:59 GMT)
MetaMind: Modeling Human Social Thoughts with Metacognitive Multi-Agent Systems [20.6] メタ認知の心理学理論に触発されたマルチエージェントフレームワークであるMetaMindを紹介する。
我々のフレームワークは3つの挑戦的なベンチマークで最先端のパフォーマンスを実現し、実世界の社会的シナリオは35.7%改善した。
この研究は、共感的対話や文化的に敏感な相互作用に応用して、人間のような社会知性に向けてAIシステムを前進させる。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:32:57 GMT)
DriveX: Omni Scene Modeling for Learning Generalizable World Knowledge in Autonomous Driving [20.2] 本稿では、動画から一般的なシーンのダイナミクスと全体像を学習する自己教師型世界モデルDriveXを提案する。
DriveXは,マルチモーダル監視3Dポイントクラウド予測,2Dセマンティック表現,イメージ生成を統合するモジュールであるOmni Scene Modeling (OSM)を導入した。
下流適応のために我々は,DriveXの予測から特徴を動的に集約し,タスク固有の推論を強化する統一パラダイムであるFuture Spatial Attention (FSA)を設計する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:27:59 GMT)
Communication-Efficient Multi-Device Inference Acceleration for Transformer Models [19.9] トランスフォーマーモデルは、多くのAIアプリケーションを動かすが、高い推論遅延に悩まされ、リアルタイム設定での使用が制限される。
本稿では,トランスフォーマー推論を高速化する通信効率の高いフレームワークであるASTRAと,デバイス間通信の最小化を目的としたMixed-Precision Attention機構を提案する。
ASTRAはシングルデバイス推論で最大2.64倍のスピードアップを実現し、最先端のマルチデバイス推論で最大15.25倍のスピードアップを実現し、帯域幅は10Mbpsである。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:16:59 GMT)
Where Paths Collide: A Comprehensive Survey of Classic and Learning-Based Multi-Agent Pathfinding [19.9] MAPF(Multi-Agent Path Finding)は、人工知能とロボット工学の基本的な問題である。
この調査は、MAPF研究における古典的アルゴリズムアプローチと新たな学習手法との長年の隔たりを橋渡しする。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:28:06 GMT)
Foundations of Top-$k$ Decoding For Language Models [19.7] 我々は、トップ$kの復号化を説明・一般化する理論的枠組みを開発する。
大規模な分岐に対して効率的に最適化する方法を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:46:34 GMT)
Galaxy Walker: Geometry-aware VLMs For Galaxy-scale Understanding [19.5] 宇宙レベルの視覚理解タスクのための幾何学的視覚言語モデルであるGalaxy-Walkerを紹介する。
Galaxy-Walkerは、銀河特性の推定と形態分類のタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:56:49 GMT)
Alberta Wells Dataset: Pinpointing Oil and Gas Wells from Satellite Imagery [19.5] 何百万もの石油とガスの井戸が世界中に散らばっている。
これらの場所の多くは不明であり、井戸がふさがれるのを防ぎ、汚染効果が回避された。
本稿では,Planet Labsの高解像度マルチスペクトル衛星画像を活用した,この問題に対する最初の大規模ベンチマークデータセットを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:05:35 GMT)
SHARP: Synthesizing High-quality Aligned Reasoning Problems for Large Reasoning Models Reinforcement Learning [19.5] STEM領域での強化学習を伴う大規模推論モデル(LRM)の訓練は、高品質で多様性があり、検証可能な問題セットの不足によって妨げられる。
検証可能な報酬(RLVR)を用いたLRM強化学習における高品質アラインド推論問題の一元化手法であるSHARPを導入する。
我々は、最先端のLEMを活用して、難解なSTEM質問を推論し、検証し、次に、強化学習ループを使用して、検証可能な報酬信号によってモデルの推論を洗練する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:45:21 GMT)
GhostPrompt: Jailbreaking Text-to-image Generative Models based on Dynamic Optimization [19.4] 動的プロンプト最適化とマルチモーダルフィードバックを組み合わせた最初の自動ジェイルブレイクフレームワークであるGhostPromptを紹介した。
最先端の性能を達成し、ShieldLM-7Bバイパス率を12.5%から99.0%に向上させた。
GPT-4.1を含む未知のフィルタに一般化し、DALLE 3を脱獄してNSFW画像を生成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:13:06 GMT)
Querying Kernel Methods Suffices for Reconstructing their Training Data [19.0] モデルパラメータにアクセスしなくても,カーネルモデルを様々なポイントでクエリすることで,トレーニングデータを再構築できることを示す。
カーネル回帰,サポートベクタマシン,カーネル密度推定など,さまざまなカーネル手法が提案されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:53:03 GMT)
LLM-Based Emulation of the Radio Resource Control Layer: Towards AI-Native RAN Protocols [18.8] 大きなAIモデルを6Gモバイルネットワークに統合することは、プロトコル設計とコントロールプレーンインテリジェンスを再定義することを約束する。
本稿では,標準に準拠した ASN.1 符号化された無線リソース制御メッセージを生成する LAM のエンドツーエンドなデモを示す。
この結果から,無線アクセスネットワーク(RAN)固有の推論で拡張されたLAMは,直接制御プレーンの手順を編成できることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:15:17 GMT)
Improving Value Estimation Critically Enhances Vanilla Policy Gradient [18.7] TRPOやPPOのような現代的なポリシー勾配アルゴリズムは、多くのRLタスクにおいてバニラポリシー勾配よりも優れている。
より重要な要素は、各イテレーションでより多くの値更新ステップから値推定精度を向上することである。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:54:32 GMT)
ChartSketcher: Reasoning with Multimodal Feedback and Reflection for Chart Understanding [18.7] チャートの自動理解は、既存のマルチモーダルな大規模言語モデルに重大な課題をもたらす。
現在のステップバイステップ推論モデルは、主にチャート理解のためのテキストベースの論理的推論に焦点を当てている。
マルチモーダルフィードバック駆動のステップバイステップ推論手法であるChartSketcherを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:21:29 GMT)
PDFBench: A Benchmark for De novo Protein Design from Function [18.6] 関数からde novoタンパク質の設計を評価するための、最初の総合的なベンチマークであるPDFBenchを紹介する。
公平かつ多面的な評価を確保するため,22のメトリクスをコンパイルし,配列の妥当性,構造的忠実度,言語タンパク質のアライメントについて検討した。
我々は5つの最先端のベースラインを評価し、タスク間のそれぞれの長所と短所を明らかにした。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:40:15 GMT)
Echo Planning for Autonomous Driving: From Current Observations to Future Trajectories and Back [18.5] 本稿では,経路予測とシーンコヒーレンスを調和させる新たな自己補正フレームワークを提案する。
この枠組みは本質的に、物理的に不明瞭または不整合な軌跡を罰する。
nuSceneの実験では、最先端の性能を示し、L2の誤差を0.04m、衝突速度を0.12%低減した。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:44:06 GMT)
Improving Compositional Generation with Diffusion Models Using Lift Scores [18.4] 本稿では,リフトスコアを用いた新しいリサンプリング基準を提案する。
生成したサンプルがそれぞれの条件に一致しているかを評価する。
次に、合成されたプロンプトが満たされているかどうかを決定するために結果を構成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:15:10 GMT)
Disentangled Human Body Representation Based on Unsupervised Semantic-Aware Learning [18.0] 教師なし学習フレームワークにおいて,制御可能な微粒なセマンティクスと高精度な再構築による人体表現を提案する。
骨格群全体を意識したエンコーダと教師なしの非教師付きアンタングル化損失の助けを借りて,我々の表現モデルは教師なしの方法で学習される。
幾何学的に意味のある潜在符号のため、幅広い用途で使用することができる。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:03:59 GMT)
Inductive Gradient Adjustment For Spectral Bias In Implicit Neural Representations [17.8] Inlicit Neural Representations (INR)は様々なコンピュータビジョンタスクで成功している。
バニラ多層パーセプトロン(MLP)のスペクトルバイアスのため、既存の手法は洗練されたアーキテクチャによる設計に焦点を当てている。
本稿では,スペクトルバイアスを意図的に改善できる実用的なインダクティブ・グラディエント・アジャイメント(IGA)法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:53:31 GMT)
Towards Large Reasoning Models for Agriculture [17.8] 農業の意思決定は、複雑な、文脈固有の推論を伴う。
私たちはAgReasonを紹介します。AgReasonは、農業推論のための100の質問で、最初の専門家によるオープンソースの科学ベンチマークです。
また、人間の監視によって生成された44.6K問合せ対の大規模データセットであるAgThoughtsも紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:28:12 GMT)
Towards Reliable Large Audio Language Model [17.8] 本稿では,信頼性向上指標(Reliability Gain Index, RGI)を提案する。
本研究により, LALMの信頼性は, トレーニングフリー法とトレーニングベース法の両方で向上することが示唆された。
信頼性の認識は「メタ能力」であり、様々なオーディオモダリティ間で伝達可能である。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:00:31 GMT)
Fluent but Culturally Distant: Can Regional Training Teach Cultural Understanding? [17.2] 我々は,5つの指標と5つのグローバルLLMを,価値と実践の2つの重要な側面に沿って評価する。
すべての4つのタスクにおいて、Indicモデルはグローバルモデルよりもインド文化の規範と密に一致していないことが分かる。
この失敗は、高品質で、翻訳されず、文化的に根拠のない事前訓練と微調整のデータが不足していることに遡る。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:59:23 GMT)
Graph-Based Operator Learning from Limited Data on Irregular Domains [17.2] 演算子学習は、特に偏微分方程式(PDE)の文脈において、入力関数から出力解への写像を近似しようとする
我々は,不規則なサンプル空間点からグラフを構築し,注目度を高めたグラフニューラルネツーク(GNN)を活用することにより,この制限に対処するグラフベースの演算子学習(GOLA)フレームワークを提案する。
提案手法は,データスカース体制において,不規則領域に対する強い一般化と効率を示すベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:06:32 GMT)
A Physics-preserved Transfer Learning Method for Differential Equations [17.1] 本稿では,ドメインシフトを適応的に補正し,物理情報を保存する汎用的な伝達学習手法に着目する。
一般的なDESへの一般化性と,特定の問題の物理保存を同時に行う物理保存輸送(POTT)法を提案する。
提案手法の優れた性能, 一般化性, 物理保存性を示す実験を行った。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:10:54 GMT)
Investigating Pedagogical Teacher and Student LLM Agents: Genetic Adaptation Meets Retrieval Augmented Generation Across Learning Style [17.0] 効果的な教育には、学生の多様な認知的・行動的プロファイルに対応するために教育戦略を適用する必要がある。
本稿では,異種学生エージェントを自己最適化型教師エージェントと統合する新しいシミュレーションフレームワークを提案する。
本研究は,データ駆動環境下での人間教育者を訓練するためのテストベッドの提供を目的として,LLMによるシミュレーションの可能性を強調した。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:45:35 GMT)
Accelerating Adaptive Retrieval Augmented Generation via Instruction-Driven Representation Reduction of Retrieval Overlaps [16.8] 本稿では,A-RAG法に適用可能なモデルに依存しないアプローチを提案する。
具体的には、キャッシュアクセスと並列生成を使用して、それぞれプリフィルとデコードステージを高速化する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:03:54 GMT)
Date Fragments: A Hidden Bottleneck of Tokenization for Temporal Reasoning [16.8] 我々は,トークン化器が複数桁の日付成分をいかに忠実に保存するかを測定する,単純な解釈可能な日付フラグメンテーション比を導入する。
DateAugBenchは3つの時間的推論タスクにまたがった6500の例のスイートです。
実験の結果, 過度な断片化は, 異常な日付で最大10ポイントの精度低下と相関していることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:01:00 GMT)
Can Multimodal Large Language Models Understand Spatial Relations? [16.8] 我々はCOCO 2017をベースとした人間アノテーション付き空間関係推論ベンチマークであるSpatialMQAを紹介する。
その結果、現在の最先端MLLMの精度は48.14%に過ぎず、人間レベルの精度は98.40%をはるかに下回っている。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:37:34 GMT)
InfoChartQA: A Benchmark for Multimodal Question Answering on Infographic Charts [16.5] InfoChartQAは、インフォグラフィックチャートの理解に基づいてマルチモーダル大言語モデル(MLLM)を評価するためのベンチマークである。
5,642組のインフォグラフィックと平易なチャートが含まれており、それぞれが同じ基礎データを共有するが、視覚的な表示では異なる。
視覚的要素に基づく質問を設計し、そのユニークな視覚的デザインとコミュニケーション意図を捉える。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:28:03 GMT)
AM-Thinking-v1: Advancing the Frontier of Reasoning at 32B Scale [16.4] AM-Thinking-v1は32Bの高密度言語モデルであり、推論のフロンティアを前進させる。
DeepSeek-R1と、Qwen3-235B-A22BやSeed1.5-Thinkingのような主要なMixture-of-Experts (MoE)モデルに対抗して、AM-Thinking-v1は、AIME 2024で85.3、AIME 2025で74.4、LiveCodeBenchで70.3を達成している。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:57:14 GMT)
Evaluating AI for Finance: Is AI Credible at Assessing Investment Risk? [16.2] 我々は、投資リスク食欲の評価において、主要なAIモデルの信頼性を評価する。
分析対象はプロプライエタリモデル(GPT-4, Claude 3.7, Gemini 1.5)とオープンウェイトモデル(LLaMA 3.1/3.3, DeepSeek-V3, Mistral-small)である。
スコア分布と人口統計感度のモデル間で有意な差異が観察された。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:56:19 GMT)
HASH-RAG: Bridging Deep Hashing with Retriever for Efficient, Fine Retrieval and Augmented Generation [16.1] Hash-RAGは、ディープハッシュ技術とシステマティック最適化を統合するフレームワークである。
このハッシュベースの効率的な検索フレームワークを基盤として,きめ細かなチャンクの基盤を確立する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:16:44 GMT)
Statistical inference for Linear Stochastic Approximation with Markovian Noise [16.1] マルコフ雑音によって駆動される線形近似(LSA)アルゴリズムの平均反復量に対して,非漸近Berry-Esseen境界を導出する。
我々の研究は、マルコフ雑音による近似に対するブートストラップに基づく信頼区間の収束率に関する最初の漸近的保証を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:43:28 GMT)
Efficient Policy Optimization in Robust Constrained MDPs with Iteration Complexity Guarantees [16.0] 制約のある意思決定は、現実世界の制御システムにおける安全なポリシーの設計に不可欠である。
本稿では,制約値関数を効果的に最小化し,制約を満たす新しい手法を提案する。
そのようなアルゴリズムは、$O(epsilon-2)$の後に、少なくとも$epsilon$の準最適化と実現可能なポリシーを求める。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:27:06 GMT)
The First MPDD Challenge: Multimodal Personality-aware Depression Detection [16.0] うつ病は多様な年齢層に影響を及ぼすメンタルヘルスの問題である。
現在のアプローチは、しばしばマルチモーダルデータとうつ病指標の直接的なマッピングを確立する。
MPDD Challengeは、個々の差分要素と並行してマルチモーダルデータを組み込むことで、このギャップに対処することを目指している。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:12:32 GMT)
ALPCAHUS: Subspace Clustering for Heteroscedastic Data [15.8] 本稿では,ALPCAHUSというヘテロスセダスティックなサブスペースクラスタリング手法を提案する。
サンプル単位のノイズ分散を推定し、この情報を用いて、データの低ランク構造に関連するサブスペースベースの推定を改善する。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:56:08 GMT)
Optimizing Decomposition for Optimal Claim Verification [15.7] 既存の分解ポリシー、通常は手作りのデモは、原子性の観点から下流の検証器とうまく一致しない。
本稿では,検証者からのフィードバックを利用して,検証者優先の原子性に対する要求を動的に分解する政策を学習する強化学習フレームワークである動的分解を提案する。
実験の結果、動的分解は既存の分解ポリシーより優れており、検証信頼度は0.07向上し、入力クレームの検証器、データセット、原子度の平均で0.12精度が向上していることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:54:47 GMT)
LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models [15.6] 我々は,2022年から2024年までの大規模言語モデルの限界について,データ駆動半自動レビューを実施している。
キーワードフィルタリング, LLMに基づく分類, 専門家ラベルに対する検証, トピッククラスタリングを用いて, 14,648の関連論文を同定した。
2022年以降、LLLMの研究はより速く成長し、2024年末までに LLM の論文の30%以上に達した。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:38:32 GMT)
Multi-Step Consistency Models: Fast Generation with Theoretical Guarantees [15.4] 所定時刻の入力を逆軌道に沿った任意の点にマッピングできる整合モデルの理論的解析を行う。
Oleft(logleft(fracdvarepsilonright) $ iterations for a constant step size。
我々は,スムーズかつ非スムーズな設定でも,小さな離散化ステップを用いて,正確な学習が実現可能であると結論付けた。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:06:45 GMT)
Faithful Group Shapley Value [15.4] Data Shapleyのグループレベルの拡張は、シェル企業の攻撃に対して脆弱である。
本研究では,Fithful Group Shapley Value 計算のための高速かつ高精度な近似アルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:32:12 GMT)
Aligning LLM with human travel choices: a persona-based embedding learning approach [15.1] 本稿では,大規模言語モデルと人間の旅行選択行動の整合性を示す新しい枠組みを提案する。
我々のフレームワークは、パーソナ推論とロードプロセスを使用して、アライメントを強化するのに適したプロンプトでLLMを条件付けします。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:54:01 GMT)
Understanding the Robustness of Graph Neural Networks against Adversarial Attacks [14.9] 近年の研究では、グラフニューラルネットワーク(GNN)が敵の攻撃に弱いことが示されている。
この脆弱性により、堅牢なGNNの設計に注目が集まっている。
本研究は,GNNの対角的ロバスト性に関する大規模な研究である。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:41:39 GMT)
AnchorFormer: Differentiable Anchor Attention for Efficient Vision Transformer [13.9] 本稿では,アンカートークンを用いたアンカーベースの効率的な視覚変換器(AnchorFormer)を提案する。
神経層内のニューロンでアンカーを表現することにより、これらの分布を微分可能とし、大域的自己注意を近似することができる。
実験では、AnchorFormerの有効性を示し、ImageNet分類における9.0%の精度または46.7%のFLOPs削減を実現した。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:10:35 GMT)
WorldEval: World Model as Real-World Robot Policies Evaluator [13.9] 重要な課題は、ロボットのアクションを忠実に反映した世界モデルから正確なポリシービデオを生成することだ。
本稿では,ビデオ生成モデルをロボットビデオを生成するための潜在動作に従う世界シミュレータに変換するための,シンプルで効果的な手法であるPolyse2Vecを提案する。
次に、実世界のロボットポリシーをオンラインで完全に評価するために設計された、自動パイプラインであるWorldEvalを紹介します。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:41:39 GMT)
From Single Images to Motion Policies via Video-Generation Environment Representations [13.6] ビデオ生成環境表現(VGER)と呼ばれるフレームワークを提案する。
移動カメラビデオのフレームは、トレーニング済みの3D基礎モデルに入力され、密度の高い点雲を生成する。
次に、環境構造の暗黙的な表現を訓練し、その表現の幾何学に準拠する動き生成モデルを構築するために、マルチスケールノイズアプローチを導入する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:30:25 GMT)
CMoS: Rethinking Time Series Prediction Through the Lens of Chunk-wise Spatial Correlations [13.5] 超軽量時系列予測モデルであるCMoSを提案する。
CMoSは、異なる時系列チャンク間の空間的相関を直接モデル化する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:01:53 GMT)
MIND-Edit: MLLM Insight-Driven Editing via Language-Vision Projection [13.5] MLLMと事前学習拡散モデルを組み合わせたエンドツーエンド画像編集フレームワークであるMIND-Editを提案する。
MIND-Editは,(1)MLLMからの意味的推論に基づく曖昧なユーザ指示を明確化するテキスト命令最適化戦略,(2)MLLMの本質的な視覚的理解能力を明示的に活用して編集意図を推測するMLLM洞察駆動型編集戦略,の2つの補完戦略を導入している。
大規模な実験により、MIND-Editは、特に複雑で困難なシナリオにおいて、定量的メトリクスと視覚的品質の両方において、最先端の画像編集方法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:54:31 GMT)
Interacting Large Language Model Agents. Interpretable Models and Social Learning [13.4] 本稿では,統計信号処理とミクロ経済学の手法を用いて,大規模言語モデルエージェント(LLMA)の相互作用の理論とアルゴリズムについて論じる。
オンラインプラットフォーム上でのベイズ感情分析により、LLMAがバイズ推論を対話し実行できるようにするための解釈可能なモデルとアルゴリズムを構築した。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:58:44 GMT)
Prompting Decision Transformers for Zero-Shot Reach-Avoid Policies [13.4] 我々は、オフライン、報酬なし、ゴール条件付き、地域条件付きRLを避けるための決定変換モデルRADTを紹介する。
RADTは目標を符号化し、プロンプトトークンとしてリージョンを直接回避する。
RADTを11のタスク、環境、実験的な設定の3つの既存のオフライン目標条件付きRLモデルに対してベンチマークする。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:00:38 GMT)
EdgeAIGuard: Agentic LLMs for Minor Protection in Digital Spaces [13.2] 本稿では,未成年者に対するオンライングルーミングやデジタル活用のさまざまな形態から保護するためのEdgeAIGuardコンテンツモデレーション手法を提案する。
提案手法は,ネットワークエッジに戦略的に配置したマルチエージェントアーキテクチャを用いて,低レイテンシで高速に検出し,未成年者を対象とした有害なコンテンツを防止する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:15:21 GMT)
Stochastic Compositional Optimization with Compositional Constraints [13.1] 単一レベルの期待値と2レベルの構成制約を現在のSCOフレームワークに組み込んだ新しいモデルについて検討する。
我々のモデルは、リスク-逆最適化やハイモーメントポートフォリオの選択など、データ駆動最適化やリスク管理に広く適用することができる。
本稿では, 最適解に収束するシーケンスを, 単レベル期待値と2レベル構成制約の両方で$cO(frac1sqrtN)$underで生成するアルゴリズムのクラスを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:04:17 GMT)
Enhancing Black-Litterman Portfolio via Hybrid Forecasting Model Combining Multivariate Decomposition and Noise Reduction [13.0] 本稿では,ビュー生成プロセスの自動化と改善を目的としたハイブリッド予測モデルSSA-MAEMD-TCNを提案する。
ナスダック100指数の実証試験では、ベースラインモデルと比較して予測性能が大幅に改善した。
最適化されたポートフォリオは、年次リターンとシャープ比率が従来のポートフォリオよりもはるかに高いため、うまく機能する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:13:02 GMT)
Think Outside the Data: Colonial Biases and Systemic Issues in Automated Moderation Pipelines for Low-Resource Languages [13.0] ほとんどのソーシャルメディアユーザーは、英語以外の国から来ており、多くの有害なコンテンツが現地の言語で見られる。
本研究は,これらの言語の自動モデレーションツール構築におけるシステム的課題について考察する。
我々は、4つの低リソース言語における有害なコンテンツの検出に取り組んでいる22人のAI専門家と半構造化インタビューを行った。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:31:04 GMT)
Towards Understanding the Mechanisms of Classifier-Free Guidance [12.9] 線形自由誘導(CFG)は3つの異なるコンポーネントによって生成品質を向上させることを示す。
次に、実世界の非線形拡散モデルにおけるこれらの知見を検証する。
最終的に両者は低騒音レベルで分岐するが、線形解析から得られる洞察が、非線形状態におけるCFGのメカニズムにどのように光を当てるかを議論する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:16:13 GMT)
Not All Thoughts are Generated Equal: Efficient LLM Reasoning via Multi-Turn Reinforcement Learning [12.8] ロングチェーン・オブ・思想(CoT)は、大規模言語モデル(LLM)の推論効率を改善するための新たな戦略である。
本研究では,異なる思考の有効性と効率を測定するための理論的に有界な尺度を提案する。
次に,2つのLong$otimes$Shortを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:09:29 GMT)
Learning Mamba as a Continual Learner: Meta-learning Selective State Space Models for Efficient Continual Learning [12.7] 継続学習(CL)は、すべてのサンプルを保存または再計算することなく、非定常データストリームから効率的に学習することを目的としている。
過去の表現を全て残さずに、メタラーニングシーケンスに基づく連続学習者に焦点を当てた。
Mambaの強いシーケンスモデリング性能と注意のない性質を考慮し、重要な疑問を探る: Mambaのような注意のないモデルは、メタ大陸学習でうまく機能するのか?
論文参考訳(メタデータ) (Sun, 25 May 2025 05:26:02 GMT)
SpokenNativQA: Multilingual Everyday Spoken Queries for LLMs [12.6] SpokenNativQAは、最初の多言語および文化的に整列された音声質問応答データセットである。
データセットは、複数の言語で約33,000の自然に話される質問と回答から構成される。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:22:18 GMT)
Rethinking Metrics and Benchmarks of Video Anomaly Detection [12.5] ビデオ異常検出(VAD)は、期待から外れた異常を検出することを目的としている。
本稿では, 総合的な実験分析を通じて, VAD評価プロトコルを再考する。
これらの制約に対処するための3つの新しい評価手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:09:42 GMT)
Segment-Level Diffusion: A Framework for Controllable Long-Form Generation with Diffusion Language Models [12.4] トークンレベルの拡散は、単語順依存を明示的にモデル化しない。
パッセージレベルの拡散は、長文の堅牢な表現を学習するのに苦労する。
拡散に基づくテキスト生成を促進するフレームワークであるSegment-Level Diffusionを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:17:40 GMT)
LLMScan: Causal Scan for LLM Misbehavior Detection [12.4] 大規模言語モデル(LLM)は、非現実的でバイアスがあり、有害な応答を生成する。
この研究は、因果解析に基づく革新的なモニタリング技術であるLLMScanを導入している。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:25:36 GMT)
Efficient Lung Ultrasound Severity Scoring Using Dedicated Feature Extractor [12.3] MeDiVLADは多レベル肺超音波検査のための新しいパイプラインである。
我々は、自己知識蒸留を利用して、ラベルや集合フレームレベルの特徴を伴わずに視覚変換器(ViT)を事前訓練する。
最小限の微調整により、MeDiVLADはフレームレベルおよびビデオレベルのスコアリングにおいて従来の完全教師付き手法よりも優れることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:51:22 GMT)
CoreMatching: A Co-adaptive Sparse Inference Framework with Token and Neuron Pruning for Comprehensive Acceleration of Vision-Language Models [12.3] Token sparsityはトークン使用時の非効率を軽減し、Neuron sparsityは高次元計算を減少させる。
最近、これらの2つの疎性パラダイムは、主に並列に進化し、それらが独立して機能するという一般的な仮定を育んでいる。
トークンとニューロンの間隔の相乗効果を利用して推論効率を向上させる,共適応スパース推論フレームワークCoreMatchingを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:16:34 GMT)
DREAM: Drafting with Refined Target Features and Entropy-Adaptive Cross-Attention Fusion for Multimodal Speculative Decoding [11.9] 投機的復号化(SD)は,大規模言語モデル(LLM)における自己回帰生成を高速化する強力な手法として登場した。
視覚言語モデル(VLM)に適した新しい投機的復号化フレームワークであるDREAMを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:56:50 GMT)
WaveGuard: Robust Deepfake Detection and Source Tracing via Dual-Tree Complex Wavelet and Graph Neural Networks [11.6] WaveGuardは、堅牢性と非受容性を高めるプロアクティブな透かしフレームワークである。
本稿では,Dual-Tree Complex Wavelet Transform (DT-CWT) とStructure Consistency Graph Neural Network (SC-GNN) を用いて,透かしを高周波サブバンドに埋め込んだ。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:42:37 GMT)
Collaborative Agentic AI Needs Interoperability Across Ecosystems [11.5] 協力的エージェントAIは、AIによって駆動されるエージェントがデジタル環境内で自律的に知覚し、計画し、行動できるようにすることによって、業界全体を変革する。
この分野の現在のソリューションはすべて独立して構築されており、断片化された非互換なエコシステムの風景に向かっています。
最小限の標準の採用によって達成される相互運用性は、オープンでセキュアで、Webスケールで、広く採用されているエージェントエコシステムを保証するために不可欠である、と私たちは主張する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:25:08 GMT)
ScreenExplorer: Training a Vision-Language Model for Diverse Exploration in Open GUI World [11.4] 視覚言語モデル(VLM)に基づく既存のGUIエージェントは、しばしば新しい環境への一般化に失敗する。
ScreenExplorerは、グループ相対ポリシー最適化(GRPO)を介して訓練された、リアルタイム、動的、そしてオープンなGUI環境でのVLMである。
また,世界モデルに基づく好奇心報酬関数を導入し,エージェントが探索のコールドスタートフェーズを克服する手助けをする。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:13:03 GMT)
Optimal Transport Barycenter via Nonconvex-Concave Minimax Optimization [11.3] Wasserstein-Descent $dotmathbbH1$-Ascent (WDHA)アルゴリズムは、正確なバリセンタを計算する。
ほぼ線形時間 $O(m logm)$ と線型空間複雑性 $O(m)$ をバリセンタ問題を近似するための原始双対アルゴリズムとして提示する。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:16:05 GMT)
STRICT: Stress Test of Rendering Images Containing Text [11.2] $textbfSTRICT$は、画像内のコヒーレントで命令に沿ったテキストをレンダリングする拡散モデルの能力を強調テストするために設計されたベンチマークである。
プロプライエタリ版やオープンソース版など,いくつかの最先端モデルを評価し,長距離整合性と命令追従能力の持続的制限を明らかにする。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:37:08 GMT)
SQUiD: Synthesizing Relational Databases from Unstructured Text [11.2] 大規模言語モデル(LLM)を活用して、スキーマを生成してテーブルを原文からポップアップすることで、データベースを自動的に合成する。
SQUiDは,これを4段階に分解し,それぞれに専門的な手法を取り入れた新しい神経象徴的枠組みである。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:20:49 GMT)
SpeakStream: Streaming Text-to-Speech with Interleaved Data [11.1] 本稿では,デコーダのみのアーキテクチャを用いて,ストリーミングテキストからインクリメンタルに音声を生成するストリーミングTSシステムであるSpeakStreamを紹介する。
推論中、SpeakStreamはストリーミング入力テキストを吸収しながら音声を漸進的に生成する。
実験の結果,SpeakStream は非ストリーミング TTS システムの品質を維持しつつ,最先端のレイテンシを実現することができた。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:11:10 GMT)
SCRum-9: Multilingual Stance Classification over Rumours on Social Media [11.1] 我々は,Rumour Stance Classificationのための多言語データセットであるSCRum-9を紹介した。
SCRum-9は、より多くの言語(9)をカバーし、サンプルをよりファクトチェックされたクレーム(2.1k)にリンクし、複数のアノテーションからの複雑なアノテーションを含む、既存のスタンス分類データセットを越えている。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:50:43 GMT)
Co-PatcheR: Collaborative Software Patching with Component(s)-specific Small Reasoning Models [11.0] Co-PatcheRは、個々のコンポーネントに対して、小さくて特殊な推論モデルを持つ最初の共同パッチシステムである。
私たちの重要なテクニックは、特定のタスク設計とトレーニングのレシピです。
Co-PatcheR は SWE-bench-Verified で 3 x 14B モデルで 46% の解決率を達成した。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:58:30 GMT)
SCANet: Correcting LEGO Assembly Errors with Self-Correct Assembly Network [10.8] 単一ステップのアセンブリエラー訂正タスクでは、誤って組み立てられたコンポーネントを特定し、修正する。
自己整合アセンブリネットワーク(SCANet)は、組み立てたコンポーネントをクエリとして扱い、手動画像の正確性を判断し、必要に応じて修正する。
結果は、SCANetがMEPNetの誤組立結果を識別し、修正できることを示し、アセンブリの正確性を大幅に改善する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:55:27 GMT)
Stronger Enforcement of Instruction Hierarchy via Augmented Intermediate Representations [10.7] ネットワーク内の中間トークン表現にIH信号を注入する新しい手法を提案する。
本手法は、これらの表現を、特権情報をエンコードする層固有のトレーニング可能な埋め込みで拡張する。
複数のモデルとトレーニング手法で評価した結果、提案手法は攻撃成功率の1.6倍から9.2倍の9.2倍に低下することがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:01:39 GMT)
Rethinking Chain-of-Thought from the Perspective of Self-Training [10.7] 思考の連鎖(CoT)推論はLLMの潜在能力を活性化するための効果的なアプローチとして現れている。
推論性能を改善するための新しいCoTフレームワークを提案する。
本フレームワークは,初期推論プロセスを最適化するタスク固有のプロンプトモジュールと,動的に推論プロセスを洗練させる適応推論モジュールの2つの重要なコンポーネントを統合する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:05:14 GMT)
Fast and Accurate Power Load Data Completion via Regularization-optimized Low-Rank Factorization [10.7] 低ランク表現学習は、電力負荷データの欠落した値を回復するための強力なツールとして登場した。
正規化時間的低ランク因子化モデルは、その効率性と解釈可能性に好適である。
正規化係数の調整に適応する正規化時間的低ランク因子化制御器を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:07:55 GMT)
MoLAE: Mixture of Latent Experts for Parameter-Efficient Language Models [10.6] Mixture of Experts (MoE)は、Large Language Models (LLM)を効率的にスケーリングするための重要なアーキテクチャパラダイムとなっている。
我々は、共有射影を通して専門家の操作を低次元の潜在空間に変換する新しいパラメータ化であるMoLAEを導入し、それに続いて専門家固有の変換を行う。
モデル性能を保ちながら,MoLAEは複数の次元にわたる効率を著しく向上することを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:35:39 GMT)
Cellular Traffic Prediction via Byzantine-robust Asynchronous Federated Learning [10.6] ネットワークトラフィック予測は、インテリジェントネットワーク運用において重要な役割を果たす。
従来の予測手法は、大量のトラフィックデータを中央サーバーに転送する必要がある、集中的なトレーニングに依存することが多い。
これらの問題を解決するために、差分プライバシーと統合されたフェデレーション学習が、分散設定におけるデータのプライバシとロバスト性を改善するソリューションとして登場した。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:38:57 GMT)
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing [10.5] 本稿では,事前学習した流れモデルに対する推論時間スケーリング手法を提案する。
本稿では,SDE に基づく生成,特に分散保存型 (VP) 補間型 (VP) 生成は,フローモデルにおける推論時間スケーリングのための粒子サンプリング法を改善することを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:47:58 GMT)
Holistic White-light Polyp Classification via Alignment-free Dense Distillation of Auxiliary Optical Chromoendoscopy [10.4] 本稿では,ポリプローカライゼーションを必要とせず,フルイメージの診断を活用できる新しい包括的分類フレームワークを提案する。
重要な革新は、細粒なクロスドメイン知識の蒸留を可能にするアライメントフリーデンス蒸留(ADD)モジュールである。
提案手法は,AUCにおいて,少なくとも2.5%,16.2%の精度で,最先端性能を達成し,他の手法よりも比較的優れていた。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:09:58 GMT)
Enable Lightweight and Precision-Scalable Posit/IEEE-754 Arithmetic in RISC-V Cores for Transprecision Computing [10.0] RISC-Vプロセッサの軽量実装のために、専用のポジトリコーデックをオリジナルのFPUに統合することにより、RISC-Vプロセッサを強化した。
我々の実装は、最先端のポジット対応RISC-Vプロセッサと比較して47.9%のLUTと57.4%のFF削減を実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:16:16 GMT)
DIAGen: Semantically Diverse Image Augmentation with Generative Models for Few-Shot Learning [9.8] 本稿では,コンピュータビジョンモデルにおける意味的多様性を高めるためにDIAGenを提案する。
本研究では,テキストからテキストへの生成モデルの一般的な知識を活用し,拡散モデルのイメージ生成を導く。
その結果,DIAGenは意味的多様性を高めるだけでなく,その後の分類器の性能も向上することがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:34:05 GMT)
Glioma Multimodal MRI Analysis System for Tumor Layered Diagnosis via Multi-task Semi-supervised Learning [9.7] グリオーマは中枢神経系の最も一般的な原発性腫瘍である。
本研究では,複数のイベントを同時に処理する深層学習ネットワークを用いたGlioma Multimodal MRI Analysis System (GMMAS)を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:35:28 GMT)
CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter [9.6] 投機的復号化は,軽量な投機的ドラフトモデルを活用することで,Large Language Model (LLM)推論を高速化する強力な手法である。
近年の手法では、多段階のトレーニング戦略を採用することでこの問題の解決が試みられているが、異なるトレーニングステップの複雑な入力によって、ドラフトモデルを収束させるのが難しくなっている。
投機的起草における精度と効率を両立させる新しいフレームワークであるCORALを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:16:22 GMT)
Learning from M-Tuple Dominant Positive and Unlabeled Data [9.6] 本稿では,実世界のアプリケーションシナリオに適合する汎用学習フレームワークであるemphMDPUを提案する。
経験的リスク最小化 (ERM) 法に基づいて, リスク一貫性を満足する未バイアスリスク推定器を導出する。
トレーニング中に必然的に過適合する問題を緩和するため、リスク補正手法を導入し、修正されたリスク推定器の開発に繋がる。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:20:11 GMT)
Learning from the Past: How Previous Technological Transformations Can Guide AI Development [9.4] 私たちは、AIを最大限に発展させる方法を示唆する落とし穴とソリューションを特定します。
もしうまくいけば、AIは私たちが経済、社会、そして世界全体に向けて設定した目標を達成するのに役立ちます。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:05:07 GMT)
Minimax Optimal Reinforcement Learning with Quasi-Optimism [9.4] EQO (Exploration via Quasi-Optimism) を新しいタイプの強化学習アルゴリズムとして導入する。
経験的分散への依存を回避し、国家行動訪問数の逆数に比例する単純なボーナス項を用いる。
性能と計算効率の両面で、既存のアルゴリズムを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:40:28 GMT)
Automated Trustworthiness Oracle Generation for Machine Learning Text Classifiers [9.3] テキスト分類のための機械学習(ML)は、様々な領域で広く使われている。
これらの応用は倫理、経済、人間の行動に大きな影響を及ぼす可能性がある。
研究は、従来のメトリクスがMLモデルにおける人間の信頼を構築するのに不十分であることを示している。
これを避けるために、データ内の有効なパターンに基づいて予測が妥当かどうかをテストするのが一般的である。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:15:59 GMT)
GraphemeAug: A Systematic Approach to Synthesized Hard Negative Keyword Spotting Examples [9.3] Spoken Keyword Spotting (KWS) は、音声におけるキーワードの存在と欠如を区別するタスクである。
本稿では,キーワードのグラフに挿入/削除/置換を編集することで,決定境界に近い逆例を生成する手法を提案する。
本手法は, 音声データの品質を保ちながら, 合成硬質負のデータセット上でのAUCを61%向上させることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:06:52 GMT)
Efficient Pauli channel estimation with logarithmic quantum memory [9.3] a protocol can estimated the eigen values of a Pauli channel to error $epsilon$ using only $O(log n/epsilon2)$ ancilla and $tildeO(n2/epsilon2)$ measured。
我々の知識によれば、量子メモリの対数的に多くの量子ビットが指数統計上の優位性のために十分である最初の量子学習タスクである。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:34:40 GMT)
DMAGaze: Gaze Estimation Based on Feature Disentanglement and Multi-Scale Attention [9.1] DMAGazeは、視線関連グローバル特徴、局所的な視線特徴、頭部ポーズ推定特徴の3つの側面で、顔画像からの情報を活用する新しい視線推定フレームワークである。
我々の提案したDMAGazeは、2つの主要な公開データセットで広く検証され、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:52:29 GMT)
Conversational Exploration of Literature Landscape with LitChat [9.1] 大規模言語モデル(LLM)は、体系的なレビューによって望まれる「包括的、客観的、オープン、透明」なビューを提供することができない。
ここでは、LLMエージェントをデータ駆動ディスカバリツールで強化する、エンドツーエンドで対話的で対話的な文学エージェントであるLitChatを紹介する。
我々は、AI4Healthのケーススタディを通じてLitChatの有効性を説明し、大規模文学の風景を通して素早くユーザーをナビゲートする能力を強調した。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:15:09 GMT)
PII-Scope: A Comprehensive Study on Training Data PII Extraction Attacks in LLMs [9.0] LLMを対象としたPII抽出攻撃の最先端手法を評価するための総合ベンチマークであるPII-Scopeを紹介する。
我々は、より現実的な攻撃シナリオに研究を拡張し、高度な敵戦略を用いたPII攻撃を探索する。
PII抽出速度は,高度な対数能力とクエリ予算の制限により,事前学習モデルをターゲットにした場合,最大5倍に向上することを示した。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:56:36 GMT)
CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark [9.0] クロスアーキテクチャGPUコードトランスパイレーションのための,最初の大規模データセットとモデルスイートであるCASSを紹介する。
データセットは、ホストとデバイス間で70万の検証済みコードペアで構成されている。
ドメイン固有言語モデルのCASSファミリーを訓練し、95%のソース翻訳精度と37.5%のアセンブリ翻訳精度を達成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:51:39 GMT)
To See a World in a Spark of Neuron: Disentangling Multi-task Interference for Training-free Model Merging [8.9] 本研究は, モデルマージにおける神経機構を利用した最初の研究である。
神経サブスペース内のタスク干渉を軽減するために開発された新しい統合フレームワークであるNeuroMergingを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:17:43 GMT)
SynapticRAG: Enhancing Temporal Memory Retrieval in Large Language Models through Synaptic Mechanisms [8.8] 本稿では、時間的関連トリガーと生物学的に誘発されるシナプス伝達機構を組み合わせたシナプスRAGを提案する。
本手法では, 時間的関連トリガーとシナプス様刺激伝達を用いて, 関連する対話履歴を同定する。
4つのデータセットの実験では、SynapticRAGは最大14.66%までの複数のメトリクスで一貫した改善を達成している。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:48:15 GMT)
Kernel Space Diffusion Model for Efficient Remote Sensing Pansharpening [8.8] Kernel Space Diffusion Model (KSDiff)は、グローバルな文脈情報に富んだ畳み込みカーネルを生成するために、潜在空間における拡散プロセスを活用する新しいアプローチである。
WorldView-3、GaoFen-2、QuickBirdを含む広く使われている3つのデータセットの実験では、KSDiffの質的かつ定量的に優れた性能が示されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:25:31 GMT)
Perturbation Analysis of Randomized SVD and its Applications to Statistics [8.7] RSVD(英: RSVD)は、大規模データ行列の切り詰められたSVDを計算するための計算効率のよいアルゴリズムのクラスである。
本稿では、$ell$ と $ell_2,infty$ の正則特異ベクトル $widehatmathbfU$ と $widehatmathbfM$ の上限を導出する。
理論結果を、$widehatmathbfM$ が観測されていない信号行列 $mathbfM$ の加法摂動であるような設定に適用する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:22:21 GMT)
CDPDNet: Integrating Text Guidance with Hybrid Vision Encoders for Medical Image Segmentation [8.6] ほとんどの医用セグメンテーションデータセットは部分的にラベル付けされているだけである。
本研究では,CLIP-DINO Prompt-Driven Network (CDPDNet)を提案する。
CDPDNetは、セルフ教師付きビジョントランスフォーマーとCLIPベースのテキスト埋め込みを組み合わせることで、これらの課題に対処するためにタスク固有のテキストプロンプトを導入している。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:23:58 GMT)
Reduce Computational Cost In Deep Reinforcement Learning Via Randomized Policy Learning [8.6] 強化学習の最近の進歩は、ニューラルネットワークを活用して、さまざまな制御タスクにおける最先端のパフォーマンスを実現している。
これらの成功は、ディープニューラルネットワークのトレーニングには相当な時間とデータを必要とするため、大きな計算リソースのコストがかかることが多い。
本稿では,ランダム化されたニューラルネットワークを用いて,高い性能を維持しながら計算コストを大幅に削減するアクタ批判アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:17:22 GMT)
Latent Mamba Operator for Partial Differential Equations [8.4] 本稿では,Latent Mamba Operator (LaMO)を導入し,Latent空間における状態空間モデルの効率と,ニューラルネットワークにおけるカーネル積分定式化の表現力を統合する。
LaMOは、ソリューション演算子近似における既存のベースラインよりも32.3%改善され、一貫したSOTA(State-of-the-art)性能を実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:51:31 GMT)
Bounds on eigenstate thermalization [8.3] 我々は、一般的な非可積分系に対して、固有状態熱化仮説が全ての少数体作用素に対して成り立つと推測する。
本結果は, 熱的および量子的ゆらぎを含む数体の演算子すべてに対して, 一般的な系がETHを満たすことを示唆している。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:52:50 GMT)
OrgAccess: A Benchmark for Role Based Access Control in Organization Scale LLMs [8.3] 大規模言語モデル(LLM)は、エンタープライズ環境での統合知識リポジトリとインテリジェントアシスタントとして機能する。
この重要な能力を評価することは、現実の企業データとアクセス制御ポリシーの独自性と機密性のため、本質的に難しい。
組織の役割やレベルに共通する40種類のパーミッションからなる,総合的かつ代表的な textbfOrgAccess ベンチマークを導入する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:30:15 GMT)
Are Vision Language Models Ready for Clinical Diagnosis? A 3D Medical Benchmark for Tumor-centric Visual Question Answering [8.2] Vision-Language Models (VLMs) は様々な2次元視覚タスクにおいて有望であるが、3次元臨床診断への準備が整っていない。
腹部腫瘍を対象とする診断的視覚質問応答ベンチマークであるDeepTumorVQAについて検討した。
17の公開データセットから9,262のCTボリューム(3.7Mスライス)と、認識、計測、視覚的推論、医学的推論の4つのカテゴリにまたがる395Kの専門家レベルの質問で構成されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:50:15 GMT)
Natural Language Generation from Visual Events: Challenges and Future Directions [8.1] 画像やフレームのシーケンスを扱うNLGタスクは、時間とともに展開する視覚イベント間の複雑な関係をモデル化するより広範な、より一般的な問題の一例である、と我々は主張する。
我々は5つの一見異なるタスクを考えており、このより広いマルチモーダル問題の魅力的な事例であると考えている。
我々は、言語とビジョンのモデルによる視覚イベントの理解を改善することは、その成長するアプリケーションを考えると、タイムリーかつ必須であると主張している。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:02:56 GMT)
Ignition Phase : Standard Training for Fast Adversarial Robustness [8.0] AET(Adversarial Evolution Training)は、経験的リスク最小化(ERM)フェーズを従来のATに付与するフレームワークである。
AETは、同等または優れた堅牢性をより高速に達成し、クリーンな精度を改善し、トレーニングコストを8~25%削減する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:12:03 GMT)
Evaluating Steering Techniques using Human Similarity Judgments [7.9] 近年のLarge Language Model (LLM) ステアリング技術の評価は,タスク固有性能に重点を置いている。
サイズや種類に基づく概念間の類似性を柔軟に判断する能力に基づいて, ステアリングLLMを評価した。
その結果,プロンプトベースのステアリング法は,ステアリング精度とモデルと人間のアライメントの両方において,他の手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:40:26 GMT)
Co-evolutionary Dynamics of Attack and Defence in Cybersecurity [7.9] 本研究では,サイバー空間における攻撃と防御の進化力学を研究するために,進化ゲーム理論の枠組みを用いる。
高い防御強度を持つシステムは最小攻撃周波数で安定を示すのに対し、低防御環境は不安定であり、攻撃に対して脆弱である。
分析の結果,EGTに基づく適応型サイバーセキュリティ戦略は,資源割り当てを改善し,システムのレジリエンスを高め,サイバー攻撃の全体的なリスクを低減することが示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:11:24 GMT)
Nine Ways to Break Copyright Law and Why Our LLM Won't: A Fair Use Aligned Generation Framework [7.9] 大規模言語モデル (LLM) は、保護されたコンテンツを冗長に再現したり、変換に不十分な修正を加えて著作権侵害を犯すのが一般的である。
我々は、LLM出力とフェアユース・ドクトリンとの整合性を明示的に設計した法的基盤の枠組みを開発する。
FuA-LLMは最先端のアプローチと比較して、問題のある出力(最大20%)を大幅に削減する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:23:26 GMT)
ALRPHFS: Adversarially Learned Risk Patterns with Hierarchical Fast \& Slow Reasoning for Robust Agent Defense [7.9] 既存の防御は、有害なユーザ入力や安全でないエージェントの振る舞いによって引き起こされる複雑なセマンティックリスクを捉えるのに苦労する“セーフティチェック(Safety Checks)”に依存している。
我々は新しい防衛フレームワーク ALRPHFS (Adversarially Learned Risk Patterns with Hierarchical Fast & Slow Reasoning) を提案する。
ALRPHFS は,(1) リスクパターンの一般化可能な,バランスのとれたライブラリを反復的に洗練するオフライン対向自己学習ループ,(2) 検出効率と計算効率のバランスをとるオンライン階層型高速・低速推論エンジンの2つのコアコンポーネントから構成される。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:31:48 GMT)
RetrieveAll: A Multilingual Named Entity Recognition Framework with Large Language Models [7.9] 既存の多言語NER法は多言語適応過程において言語干渉に直面する。
動的LoRAに基づく多言語NERフレームワークRetrieveAllを提案する。
本稿では,データ固有のポテンシャルをフル活用した粒界知識拡張手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:52:18 GMT)
VL-SAM-V2: Open-World Object Detection with General and Specific Query Fusion [7.7] 本稿では,未確認なオブジェクトを検出できるオープンワールドなオブジェクト検出フレームワークについて述べる。
オープンセットモデルからのクエリを調整することにより、VL-SAM-V2をオープンセットモードまたはオープンエンドモードで評価できる。
LVIS実験の結果, 従来のオープンセット法, オープンエンド法, 特にレアオブジェクト法を超越した手法が得られた。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:44:02 GMT)
Effect of environment-induced interatomic interaction on entanglement generation for uniformly accelerated atoms with a boundary [7.7] 環境誘起原子間相互作用を考慮し、2つの一様加速原子の絡み合いダイナミクスについて検討する。
コンカレンスの時間進化は、特定の条件下での環境誘起原子間相互作用の影響を受けない。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:38:23 GMT)
Incentivizing High-Quality Human Annotations with Golden Questions [7.7] 我々は、高品質なデータを生成するために、人間のアノテータにインセンティブを与える方法を研究する。
インセンティブに適合する実験を行うことで、アノテータの振る舞いが黄金の質問によってより明らかになることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:11:55 GMT)
Adaptive Diffusion Guidance via Stochastic Optimal Control [7.6] 指導力と信頼性の関係を特徴付ける理論的な形式化を提供する。
次に,適応最適化問題としてガイダンススケジューリングを行う最適制御フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:34:10 GMT)
A Novel Zero-Trust Identity Framework for Agentic AI: Decentralized Authentication and Fine-Grained Access Control [7.5] 本稿では,Agentic AI IAMフレームワークの提案について述べる。
リッチで検証可能なエージェント識別子(ID)に基づく包括的フレームワークを提案する。
また、Zero-Knowledge Proofs(ZKPs)によって、プライバシ保護属性の開示と検証可能なポリシーコンプライアンスを実現する方法について検討する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:21:55 GMT)
Delving into Multilingual Ethical Bias: The MSQAD with Statistical Hypothesis Tests for Large Language Models [7.5] 本稿では,世界規模で議論され,潜在的にセンシティブなトピックに対するLLMの倫理的バイアスの妥当性と比較について検討する。
我々は、Human Rights Watchから17のトピックに関するニュース記事を収集し、複数の言語で対応する回答とともに、社会的に敏感な質問を生成した。
我々は2つの統計的仮説テストを用いて、これらの応答のバイアスを言語やトピックにわたって精査した。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:25:44 GMT)
SETransformer: A Hybrid Attention-Based Architecture for Robust Human Activity Recognition [7.3] ウェアラブルセンサデータを用いたヒューマンアクティビティ認識(HAR)は,モバイルコンピューティング,ヘルスケア,人間とコンピュータのインタラクションにおいて中心的な課題となっている。
本稿では、トランスフォーマーに基づく時間モデルと、チャネルワイド・サスペンション・アンド・エキサイティング(SE)アテンションと、学習可能な時間アテンションプーリング機構を組み合わせたハイブリッドディープニューラルネットワークSETransformerを提案する。
我々は、WISDMデータセット上でSETransformerを評価し、LSTM、GRU、BiLSTM、CNNベースラインといった従来のモデルよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:39:34 GMT)
GraSS: Scalable Influence Function with Sparse Gradient Compression [7.3] インフルエンス関数のような勾配に基づくデータ帰属法は、反復的なモデル再訓練を必要とせず、個々のトレーニングサンプルの影響を理解するために重要である。
線形層に対する新しい勾配圧縮アルゴリズムであるGraSSと、その変種であるFactGraSSは、サブ線形空間と時間複雑性を達成するために、サンプル単位の勾配の本質的な空間性を利用する。
特に、FactGraSSは、これまでの最先端ベースラインと比較して、数十億規模のモデルで最大165%のスループットを実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:58:57 GMT)
Synthetic Social Media Influence Experimentation via an Agentic Reinforcement Learning Large Language Model Bot [7.2] 本研究は,エージェント・インテリジェンスとLarge Language Models(LLM)を組み合わせることで,トピック固有の影響メカニズムをテストする新しいシミュレーション環境を提供する。
我々のフレームワークには、投稿を生成し、特定のトピックについて意見を形成し、議論の結果に基づいて相互にフォロー/アンフォローするエージェントが含まれています。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:57:02 GMT)
Automatic and Structure-Aware Sparsification of Hybrid Neural ODEs [7.2] 機械的ニューラルネットワークにおける状態選択と構造最適化のための新しいパイプラインを提案する。
合成および実世界のデータを用いた実験では、所望の間隔で予測性能と堅牢性が改善された。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:36:30 GMT)
On-Demand Scenario Generation for Testing Automated Driving Systems [7.1] リスクレベルが異なる多様なシナリオを生成するために,オンデマンドシナリオ生成フレームワーク(OSG)を提案する。
OSGは現実世界のトラフィックデータセットから学び、リスクレベルを定量的に制御するためにリスク強度レギュレータを使用している。
リスクレベルの事故タイプを比較することで,OSGの必要性を実証する。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:43:52 GMT)
Domain Adaptation of Foundation LLMs for e-Commerce [7.0] E-Llamaモデル:E-コマース領域に適応した80億と70億のパラメーター大言語モデルを示す。
e-Llamaモデルは、Llama 3.1ベースモデルをドメイン固有データの1兆個のトークンで継続的に事前訓練することで得られる。
トレーニング設定を慎重に選択すると、Llama 3.1モデルは、一般的なドメインタスクにおいて大きなパフォーマンスを犠牲にすることなく、新しいドメインに適応できることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:54:05 GMT)
Estimating Online Influence Needs Causal Modeling! Counterfactual Analysis of Social Media Engagement [7.0] 政策タイミングとエンゲージメント効果の両方に適応する新しい共同治療・アウトカムフレームワークを導入する。
本手法は,医療の因果推論手法に適応し,ソーシャルメディアの相互作用の逐次的性質に平均治療効果(ATE)を推定する。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:03:24 GMT)
Is Architectural Complexity Overrated? Competitive and Interpretable Knowledge Graph Completion with RelatE [7.0] RelatEは、エンティティとリレーションの二重表現を効率的に統合する、解釈可能でモジュラーな方法である。
標準ベンチマークにおいて、競争力や優れたパフォーマンスを達成する。
摂動実験では、MRRはTransEと比較して最大61%、RotatEと比較して最大19%減少し、ロバスト性が改善された。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:36:52 GMT)
PentestAgent: Incorporating LLM Agents to Automated Penetration Testing [6.8] 手動浸透試験は時間と費用がかかる。
大規模言語モデル(LLM)の最近の進歩は、浸透テストを強化する新たな機会を提供する。
我々は,新しいLLMベースの自動浸透試験フレームワークであるPentestAgentを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:58:38 GMT)
Uncertainty Quantification for Physics-Informed Neural Networks with Extended Fiducial Inference [6.8] 科学機械学習における不確かさの定量化はますます重要になっている。
物理インフォームドニューラルネットワーク(PINN)の場合、不確実性は通常ベイズ的あるいはドロップアウト的手法を用いて定量化される。
本稿では,PINNに対する厳密な不確実性定量化を実現するために,拡張フィデューシャル推論(EFI)の枠組み内での新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:18:13 GMT)
Imitation Learning via Focused Satisficing [6.7] 模倣学習は、いくつかの固定された、しかし未知のコスト関数に従って、デモが最適に近いと仮定する。
提案手法は,既存の模倣学習手法よりも高品質な実演を模倣する政策に焦点を当てていることを実験的に示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:55:31 GMT)
One-for-All Pruning: A Universal Model for Customized Compression of Large Language Models [6.7] 既存の大規模言語モデル(LLM)のプルーニング手法は、モデル性能を維持しながら高い圧縮率を達成することに重点を置いている。
本研究では,LLMのためのUniversal Model for Customized Compression (UniCuCo)を提案する。
ベースラインに匹敵する精度を維持しつつ,64要求を処理する場合,UniCuCoはベースラインよりも28倍高速であることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:23:30 GMT)
RADEP: A Resilient Adaptive Defense Framework Against Model Extraction Attacks [6.7] モデル抽出攻撃防御(RADEP)のためのレジリエント・アダプティブ・ディフェンス・フレームワークについて紹介する。
RADEPは、抽出の試みに対するモデルレジリエンスを高めるために、プログレッシブ・逆行訓練を採用している。
オーナーシップ検証は、組み込みのウォーターマーキングとバックドアトリガーを通じて実施される。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:28:05 GMT)
Clustering by Nonparametric Smoothing [6.6] クラスタリング問題の新たな定式化は、タスクを推定問題として表現するものである。
提案手法は、任意の明示的なモデリング仮定を回避し、非パラメトリックな平滑化の柔軟な推定ポテンシャルを利用する。
提案手法の強い性能を示すために,公開データセットの大規模なコレクションに関する実験が用いられている。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:17:21 GMT)
Stochastic Hessian Fittings with Lie Groups [6.6] 本報告では, プレコンディショニング勾配降下法(PSGD)法から得られたヘシアン適合基準を用いて, ヘシアン又はその逆の最適化について検討する。
本分析により, 広範囲のプレコンディショナリング手法の効率性と信頼性の相違が明らかになった。
最も興味深い発見は、ある種の一般リー群における穏やかな条件下では、ヘッセン適合問題が強く凸であることである。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:49:34 GMT)
How Do Images Align and Complement LiDAR? Towards a Harmonized Multi-modal 3D Panoptic Segmentation [6.6] LiDARベースの3Dパノプティクスセグメンテーションは、LiDARセンサーから得られるデータの空間性に苦慮することが多い。
近年の研究では、LiDAR入力とカメラ画像を統合することで、この課題を克服しようとしている。
我々は,新しいマルチモーダル3Dパノプティクス・セグメンテーション・フレームワークである Image-Assist-LiDAR (IAL) を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:01:28 GMT)
WeedNet: A Foundation Model-Based Global-to-Local AI Approach for Real-Time Weed Species Identification and Classification [6.5] WeedNetは,多種多様な雑草を認識可能な世界規模の雑草識別モデルである。
WeedNetは1,593種の雑草に対して91.02%の精度を達成し、41%の種が100%の精度を達成した。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:49:36 GMT)
Words as Geometric Features: Estimating Homography using Optical Character Recognition as Compressed Image Representation [6.4] ドキュメントアライメントは、自動フォーム処理、異常検出、ワークフロー自動化など、多くの現実世界のアプリケーションにおいて重要な役割を果たす。
文書アライメントの伝統的な手法は、ホモグラフのような幾何学的変換を推定するために、キーポイント、エッジ、テクスチャのような画像ベースの特徴に依存している。
本稿では,光学文字認識(OCR)出力をホモグラフィー推定の特徴として活用する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:20:32 GMT)
Improving Novel view synthesis of 360$^\circ$ Scenes in Extremely Sparse Views by Jointly Training Hemisphere Sampled Synthetic Images [6.3] バーチャルリアリティや拡張現実といったアプリケーションには、非常にスパースなインプットビューから360ドル(約3万2000円)の新たなビュー合成が不可欠です。
本稿では,非常にスパースな視点における新しい視点合成の枠組みを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:42:34 GMT)
Paying Alignment Tax with Contrastive Learning [6.2] 現在のデバイアスのアプローチは、事実の正確性や知識の保持といったモデル能力の低下をもたらすことが多い。
本稿では, 慎重に構築された肯定的, 否定的な例を通して学習する, 対照的な学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:26:18 GMT)
VerifyThisBench: Generating Code, Specifications, and Proofs All at Once [5.8] エンドツーエンドのプログラム検証タスクにおいて,大規模言語モデル(LLM)を評価するために設計された新しいベンチマークを導入する。
評価の結果,o3-miniのような最先端(SOTA)モデルでさえ4%未満のパス率を達成でき,多くの出力がコンパイルに失敗していることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:00:52 GMT)
PolyPose: Localizing Deformable Anatomy in 3D from Sparse 2D X-ray Images using Polyrigid Transforms [5.6] 変形可能な2D/3D登録のためのシンプルでロバストな方法であるPolyPoseを提案する。
PolyPoseは複雑な3次元変形場を剛体変換の合成としてパラメータ化する。
この強い誘導バイアスにより,PolyPoseは患者の術前容積を2枚までのX線画像に合わせることができた。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:24:18 GMT)
Consistency-based Abductive Reasoning over Perceptual Errors of Multiple Pre-trained Models in Novel Environments [5.6] 本稿では,複数の事前学習モデルを活用することで,このリコール低減を緩和できるという仮説を述べる。
我々は,一貫性に基づく推論問題として,様々なモデルからの矛盾する予測を特定し,管理することの課題を定式化する。
本研究は,難解なシナリオにおいて,複数の不完全な推論者からの知識を堅牢に統合するための効果的なメカニズムとして,一貫性に基づく推論が有効であることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:17:47 GMT)
Nteasee: Understanding Needs in AI for Health in Africa -- A Mixed-Methods Study of Expert and General Population Perspectives [5.6] 我々は、アフリカでAIを健康にデプロイする際に、ベストプラクティス、公正度指標、潜在的なバイアスを緩和するための質的研究を行う。
詳細な面接(IDI)と調査を組み合わせた混合手法を用いる。
アフリカ5カ国672人の一般住民を対象に, 盲目30分間のアンケート調査を行った。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:56:05 GMT)
Dysfluent WFST: A Framework for Zero-Shot Speech Dysfluency Transcription and Detection [5.5] Dysfluent-WFSTはゼロショットデコーダで、音素を同時に書き起こし、逆流を検出する。
模擬および実音声データにおける音素誤り率とディフルエンシ検出の両面での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:02:29 GMT)
Less is More: Efficient Point Cloud Reconstruction via Multi-Head Decoders [5.4] 一定の深さを超えるデコーダの複雑さが増すと、過度に適合し、一般化が劣化することを示す。
本稿では,点雲の固有冗長性を利用した新しいマルチヘッドデコーダアーキテクチャを提案する。
この結果から,出力の多様性とアーキテクチャ設計は,効率的かつ効率的なポイントクラウド再構築において,深度のみよりも重要であることが示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:19:55 GMT)
Advancing Video Self-Supervised Learning via Image Foundation Models [5.4] 本稿では,映像表現モデルのトレーニングオーバーヘッドを大幅に低減することを目的とした,動画自己教師学習(AdViSe)アプローチを提案する。
UCF101の実験では、AdViSeは最先端のメソッドに匹敵するパフォーマンスを実現している。
本研究は、事前学習したIMMに基づいて、低コストのビデオ自己教師型学習に関する新たな知見を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:25:39 GMT)
RoboFAC: A Comprehensive Framework for Robotic Failure Analysis and Correction [5.4] VLA(Vision-Language-Action)モデルは、最近、自然言語命令と画像情報を逐次制御アクションに変換することによって、ロボット操作を進化させた。
これらのモデルは、専門家によるデモンストレーションの成功を主に訓練し、障害回復の限られた能力を示すため、オープンワールドシナリオではパフォーマンスが劣ることが多い。
この問題に対処するためのロボット故障解析・補正フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:02:13 GMT)
Exploring Magnitude Preservation and Rotation Modulation in Diffusion Transformers [5.2] 正規化レイヤを使わずにトレーニングを安定化する等級保存設計を提案する。
活性化マグニチュードを維持するという目標により、回転変調も導入する。
また,FIDスコアを$sim$12.8%削減した。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:25:50 GMT)
Part-aware Prompted Segment Anything Model for Adaptive Segmentation [4.9] 我々は、データ効率のセグメンテーションアルゴリズム、すなわち、パートアウェアのPrompted Segment Anything Model(P2SAM$)を提案する。
ワンショットデータのパートレベル特徴に基づいて複数ポイントプロンプトを選択するための新しいパートアウェアプロンプト機構を提案する。
P2SAM$は、2つの異なる患者適応セグメンテーションアプリケーションのDiceスコアを+8.0%、+2.0%で改善する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:19:14 GMT)
eACGM: Non-instrumented Performance Tracing and Anomaly Detection towards Machine Learning Systems [4.7] eACGMは、eBPFに基づいたフルスタックのAI/MLシステム監視フレームワークである。
eACGMはGPUやネットワーク通信層など、主要なハードウェアコンポーネントからリアルタイムのパフォーマンスデータを収集する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:25:39 GMT)
Scaling Laws for Gradient Descent and Sign Descent for Linear Bigram Models under Zipf's Law [4.6] 最近の研究は、トランスフォーマーベースの言語モデルの最初の層と最後の層を訓練する際の勾配降下による困難を浮き彫りにした。
これらの研究は、テキストデータ中の単語の重み付き分布に、難易度が関係していることを示唆している。
データが重い尾を持つ場合、問題はより困難であることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:43:51 GMT)
Towards Humanoid Robot Autonomy: A Dynamic Architecture Integrating Continuous thought Machines (CTM) and Model Context Protocol (MCP) [4.6] 本研究は,連続思考機械 (CTM) とモデルコンテキストプロトコル (MCP) を接続する動的アーキテクチャを設計する。
連続的な思考に基づくヒューマノイドロボットの自律的動的コーディングを探索し、人間のような自律行動を実現するための参照体験を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:12:35 GMT)
Multidimensional Electrical Networks and their Application to Exponential Speedups for Graph Problems [4.5] 我々は、オルタナティブ・キルヒホフの法則とオルタナティブ・オームの法則を定義することで、新しい多次元電気ネットワークを開発する。
正規グラフの一種におけるパスフィンディング問題に対する指数的量子スピードアップを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:31:21 GMT)
Veracity Bias and Beyond: Uncovering LLMs' Hidden Beliefs in Problem-Solving Reasoning [4.5] 人口統計学的ステレオタイプに対する人間の価値整合モデルとの整合性にもかかわらず、様々な社会的文脈下でバイアスを示すことが示されている。
帰属バイアス(Attribution Bias)は、特定の人口集団に対する正しい解を不均等に属性するものであり、評価バイアス(Access Bias)とは、同一の解に対するモデルの評価が、認識された人口集団の権威に基づいて異なるものである。
以上の結果から, 人口統計学的偏見は, 表面レベルのステレオタイプや社会的文脈的挑発を超えて, 教育・評価環境におけるLCMの展開に対する懸念が高まることが示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:52:06 GMT)
Evaluating Query Efficiency and Accuracy of Transfer Learning-based Model Extraction Attack in Federated Learning [4.3] Federated Learning(FL)は、クライアントデータを保護するために設計された協調学習フレームワークである。
FLのプライバシ保護の目標にもかかわらず、その分散した性質は特に抽出攻撃のモデルに感受性がある。
本稿では,FLをベースとした2種類のモデル抽出攻撃に対する被害者モデルの脆弱性について検討する。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:40:10 GMT)
LLM-based Prompt Ensemble for Reliable Medical Entity Recognition from EHRs [4.3] 本稿では,大規模言語モデル(LLM)を用いた即時医療機関認識について検討する。
即発アンサンブルのGPT-4oはF1スコア0.95、リコール0.98で最高評価を達成した。
アンサンブル法は、埋め込みベースの類似性と多数決によって出力を集約することで信頼性を向上させた。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:34:53 GMT)
Embedding based retrieval for long tail search queries in ecommerce [4.2] 我々はBest Buyでセマンティックプロダクト検索を実装するための一連の最適化を提案する。
最初の最適化は、変換信号の空間性を改善するために、大きな言語モデルを使用することである。
2つめの最適化は、Best Buyカタログデータに基づいて、既製のトランスフォーマーベースのモデルを事前学習することである。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:10:53 GMT)
How Does A Text Preprocessing Pipeline Affect Ontology Syntactic Matching? [4.2] 本稿では,第2相テキスト前処理による不要な偽マッピングを修復する2つの新しい手法を提案する。
ひとつはアドホックな論理に基づく修復手法で、オントロジー固有のチェックを用いて、偽のマッピングを引き起こす一般的な単語を見つける。
もう1つはポストホックLSMベースの修復アプローチです。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:34:15 GMT)
Structuring the Unstructured: A Multi-Agent System for Extracting and Querying Financial KPIs and Guidance [4.0] 構造化されていない財務文書から定量的な洞察を抽出する,効率的でスケーラブルな手法を提案する。
提案システムは,emphExtraction AgentとemphText-to-Agentの2つの特殊エージェントから構成される。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:45:46 GMT)
FISH-Tuning: Enhancing PEFT Methods with Fisher Information [3.9] FISH Maskは選択に基づくPEFT手法であり、近似フィッシャー情報を用いて事前訓練されたパラメータの臨界部分集合を識別する。
FISH MaskをLoRA,Adapter,およびそれらの変種を含むPEFT手法に組み込む新しいアプローチである textbfFISH-Tuning を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:11:56 GMT)
Online Knowledge Distillation with Reward Guidance [3.9] 本研究は,大規模言語モデル(LLM)に対する知識蒸留(KD)を優先最適化により研究する。
本稿では,学生と教師の政策間のパフォーマンスギャップを最小限に抑えるために,政策と報酬モデル(RM)間のmin-max最適化問題を定式化した,シーケンシャルKDのための報酬誘導型模倣学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:56:18 GMT)
Interpretable Graph Learning Over Sets of Temporally-Sparse Data [3.9] 本稿では,不規則な時間信号の集合を学習するための新規かつ解釈可能なモデルであるグラフ混合付加ネットワーク(GMAN)を提案する。
本手法は, 病院内死亡予測のAUROCスコアが4ポイント上昇するなど, 現実的な医療課題における最先端性を実現する。
ノードレベル、グラフレベル、サブセットレベルの重要度を含むその解釈能力が、移行フェーズの検出と医学的洞察の獲得を可能にしていることを実証する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:41:01 GMT)
Secure IVSHMEM: End-to-End Shared-Memory Protocol with Hypervisor-CA Handshake and In-Kernel Access Control [3.9] 本稿では,エンド・ツー・エンドの相互認証を実現するプロトコルであるSecure IVSHMEMを提案する。
マイクロベンチマークでは、Secure IVSHMEMは200ms以下でワンタイムハンドシェイクを完了し、修正されていないベースラインの5%以内にデータプレーンのラウンドトリップレイテンシを保持する。
この設計は、パフォーマンスとセキュリティの両方が最重要である自動車システムのような、安全と遅延クリティカルなホストドメインに理想的だと考えています。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:02:41 GMT)
A Joint Learning Framework with Feature Reconstruction and Prediction for Incomplete Satellite Image Time Series in Agricultural Semantic Segmentation [3.8] 不完全なSITSに対処するための特徴再構成と予測を伴う共同学習フレームワークを提案する。
本手法により, 平均F1スコアが6.93%, 7.09%向上することが確認された。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:15:47 GMT)
A Unified Framework for Variable Selection in Model-Based Clustering with Missing Not at Random [3.8] 本稿では,これらの課題を同時に解決するための統合フレームワークを提案する。
提案手法では,データ駆動型ペナルティ行列をクラスタリングに組み込んで,より柔軟な変数選択を実現する。
一定の規則性の下で、提案するフレームワークは、欠落したデータが存在する場合でも、クラスタリングの一貫性と一貫性の両方を達成することを実証する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:08:43 GMT)
RAISE: Realness Assessment for Image Synthesis and Evaluation [3.8] 我々は、実感予測のためのベースラインを確立するために、RAISEのモデルを開発し、訓練する。
実験結果から,深い基盤視モデルから得られた特徴が主観的現実性を効果的に捉えることができることが示された。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:14:43 GMT)
Improving Rule-based Reasoning in LLMs via Neurosymbolic Representations [3.6] 大規模言語モデル(LLM)は、推論タスクを確実に解決する上で、引き続き課題に直面している。
本稿では,隠れた状態をニューロシンボリックベクターにエンコードすることで,LLM推論を改善する新しいニューロシンボリック手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:03:55 GMT)
Fractional-Boundary-Regularized Deep Galerkin Method for Variational Inequalities in Mixed Optimal Stopping and Control [3.5] 混合最適停止問題と制御問題により、非線型ハミルトン・ヤコビ・ベルマン作用素の変分不等式が定義される。
まず、双対アプローチを用いて線形作用素に変換し、次にフラクショナル境界規則化Deep Galerkin法を導入する。
改良された精度により、ネットワークはデュアルトランスフォーメーションを使用して元のソリューションに変換される。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:49:00 GMT)
BroadGen: A Framework for Generating Effective and Efficient Advertiser Broad Match Keyphrase Recommendations [3.5] 本研究は, 有効性と有効性の両方を重視した, 理想的なワイドマッチの基準を定義する。
そこで我々はBroadGenを提案する。BroadGenは,履歴検索クエリデータを利用して,効率的かつ効果的に一致したキーフレーズを推薦する,革新的なフレームワークである。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:25:52 GMT)
On Continuity of Robust and Accurate Classifiers [3.4] 敵の訓練が仮説の堅牢性を向上させることが示されている。
仮説の頑健性と正確性は互いに相反していることが示唆されている。
本稿では,その頑健さと精度に相容れない仮説の連続性について,その代替案を提示する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:16:41 GMT)
Using Large Language Models to Assess Teachers' Pedagogical Content Knowledge [3.2] 本研究では,大規模言語モデルが,機械学習(ML)やヒューマンレーダと類似した構成不関連分散(CIV)を導入したかどうかを検討する。
一般化線形混合モデル (GLMM) を用いて, 分散成分とレーダレベルのスコアリングパターンを3つのスコアリング源で比較した。
その結果、シナリオレベルの分散はタスク間で最小であり、レーダ関連因子はCIVに大きく寄与した。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:45:53 GMT)
Amplifying Human Creativity and Problem Solving with AI Through Generative Collective Intelligence [3.2] 私たちはこのフレームワークをGenerative Collective Intelligence(GCI)と呼んでいる。
AIをグループ/社会レベルに移行し、対話エージェントとして、知識を蓄積し、整理し、活用する技術として、AIを二重の役割で採用する。
GCIは、人間や機械が単独で解決できない複雑な社会的課題に対処する、有望なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:33:49 GMT)
Veta-GS: View-dependent deformable 3D Gaussian Splatting for thermal infrared Novel-view Synthesis [3.1] 熱赤外画像(TIR)に基づく3次元ガウス散乱(3D-GS)は, 新規な視点合成において注目されている。
本稿では、ビュー依存の変形場とサーマル・フィーチャー・エクストラクタを利用して微妙な温度変化を捉えたVeta-GSを紹介する。
本手法は既存手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:20:45 GMT)
Robust Plan Evaluation based on Approximate Probabilistic Machine Learning [3.1] 本稿ではリスク認識学習アプローチに基づく総合的なフレームワークであるRoq(Roust Query)を提案する。
Roqには、クエリ実行のコストと関連するリスクを予測するために設計された、新しい学習コストモデルが含まれている。
我々は、Roqが、最先端技術と比較して、堅牢なクエリ最適化において大幅に改善されていることを実証した。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:22:38 GMT)
Rank-One Modified Value Iteration [3.0] マルコフ決定過程の計画と学習問題を解決するための新しいアルゴリズムを提案する。
提案アルゴリズムは、計画と学習の両問題に対して、一階アルゴリズムとそれらの高速化バージョンを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:03:45 GMT)
Distributionally Robust Deep Q-Learning [3.0] 本稿では,連続状態空間に対する分散的ロバストな$Q$-learningアルゴリズムを提案する。
この不確実性は、基準確率測度付近の球から最悪のケース遷移を考慮することにより考慮される。
このアプローチにより、最悪のケース状態遷移を最適化するために、Deep Q-Networkアルゴリズムを修正できます。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:22:06 GMT)
Toward Reliable Ad-hoc Scientific Information Extraction: A Case Study on Two Materials Datasets [2.9] GPT-4が2つの既存の物質科学データセットを複製できるかどうかを評価する。
我々は材料科学者を用いて詳細な手動エラー解析を行い、モデルが望ましい情報を忠実に抽出するのに苦労している場所を評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:23:48 GMT)
AI, Climate, and Regulation: From Data Centers to the AI Act [2.9] 我々は、特にデータセンターとAIの気候関連規制に関するガイダンスを提供することを目標としている。
我々は、AIの推論から、これまで未解決であったエネルギー消費の報告を、その範囲に戻すために、AI法の具体的な解釈を提案する。
我々は、環境問題を含むAI法を強制リスクアセスメントに解釈することを主張する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:07:52 GMT)
QMIO: A tightly integrated hybrid HPCQC system [2.8] 本稿では,HPCとQCを緊密に統合した最先端ハイブリッドHPCQCシステムQMIOを提案する。
本稿では,そのハードウェアとソフトウェアコンポーネント,統合,システムの設計,実装,運用で学んだ教訓について述べる。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:46:25 GMT)
Without Paired Labeled Data: End-to-End Self-Supervised Learning for Drone-view Geo-Localization [2.7] ドローンビュージオローカライゼーション(DVGL)は、GPSタグ付き衛星画像を取得することで、ドローンの正確なローカライゼーションを実現することを目的としている。
既存の手法は、教師あり学習のために、厳密にペアリングされたドローン衛星画像に大きく依存している。
浅いバックボーンネットワークを用いたエンドツーエンドの自己教師付き学習手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:36:23 GMT)
FastMamba: A High-Speed and Efficient Mamba Accelerator on FPGA with Accurate Quantization [2.7] 本稿では,ハードウェアアルゴリズムを併用したFPGA専用アクセラレータであるFastMambaについて述べる。
具体的には,アダマール変換により線形層に対して8ビットの量子化を実現し,出力値の除去に成功した。
Mamba2-2.7Bの出力デコード実験では、FastMambaはGTX 3090 GPUの6倍のエネルギー効率を実現している。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:54:53 GMT)
SALSA-RL: Stability Analysis in the Latent Space of Actions for Reinforcement Learning [2.7] 本研究では,SALSA-RL(Stability Analysis in the Latent Space of Actions)を提案する。
SALSA-RLは、様々なベンチマーク環境における性能を損なうことなく、事前訓練されたRLエージェントからの動作の局所的安定性を評価するために、非侵襲的な方法で展開可能であることを実証する。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:56:50 GMT)
Remote Sensing Image Classification with Decoupled Knowledge Distillation [2.7] 本稿では,知識蒸留に基づく軽量な分類法を提案する。
提案手法は,パラメータ数を6.24倍に削減しつつ,ほぼ同等のTop-1精度を実現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:06:28 GMT)
CardioCoT: Hierarchical Reasoning for Multimodal Survival Analysis [2.7] 新たな2段階の階層的推論強化型生存分析フレームワークであるCardioCoTを提案する。
第一段階では,LLM/VLMを誘導するエビデンス強化自己精製機構を用いて,ロバストな階層的推論軌道を生成する。
第2段階では、リスクモデルトレーニングと予測のための画像データと推論軌跡を統合する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:41:18 GMT)
Can Large Language Models Infer Causal Relationships from Real-World Text? [2.6] 本稿では,大規模言語モデル(LLM)が実世界のテキストから因果関係を推定できるかどうかを検討する。
私たちの知る限りでは、私たちのベンチマークは、このタスクのための最初の実世界のデータセットです。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:50:05 GMT)
AgentClinic: a multimodal agent benchmark to evaluate AI in simulated clinical environments [2.6] シミュレーションされた臨床環境における大規模言語モデル(LLM)の評価のためのマルチモーダルエージェントベンチマークであるAgentClinicを紹介する。
我々は,AgentClinicの逐次決定形式におけるMedQA問題の解決が極めて困難であることに気付き,診断精度が元の精度の10分の1以下に低下することを発見した。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:19:37 GMT)
Regress, Don't Guess -- A Regression-like Loss on Number Tokens for Language Models [2.5] トークンレベルで純粋に動作する回帰的な損失を示す。
我々の提案したナンバートークン損失(NTL)は2つのフレーバーを持ち、Lpノルムまたはワッサーシュタイン距離を最小化する。
提案手法を様々な数学的データセット上で評価し,数学関連タスクの性能を継続的に改善することを発見した。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:13:23 GMT)
SPARS: Self-Play Adversarial Reinforcement Learning for Segmentation of Liver Tumours [2.5] 完全に教師付き機械学習モデルは、ローカライゼーションタスクを自動化することを目的としている。
トレーニングには、コストが高く、しばしば主観的な3Dボクセルレベルのラベルを必要とする。
そこで我々は,SPARSと呼ばれる弱い教師付き機械学習フレームワークを提案する。
CTスキャンで癌領域をローカライズするために、オブジェクトレベルのバイナリ癌の存在ラベルを使用する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:14:41 GMT)
CER: Confidence Enhanced Reasoning in LLMs [2.4] 本稿では,大規模言語モデル応答の精度向上を目的とした不確実性認識フレームワークを提案する。
数理推論における数値結果や開領域生成における固有名詞などの中間回答の信頼度を定量化する。
その結果,新しい信頼度集計法の有効性を一貫して検証した。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:19:57 GMT)
EventEgoHands: Event-based Egocentric 3D Hand Mesh Reconstruction [2.4] 3Dハンドメッシュの再構築は難しいが、人間とコンピュータのインタラクションとAR/VRアプリケーションにとって重要な課題である。
本研究では,イベントベースの手メッシュ再構築手法であるEventEgoHandsを提案する。
本手法では,ハンド領域を抽出し,動的バックグラウンドイベントの影響を効果的に緩和するハンドモジュールを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:36:51 GMT)
FERGI: Automatic Scoring of User Preferences for Text-to-Image Generation from Spontaneous Facial Expression Reaction [2.4] 生成した画像に対する自然表情反応からユーザの嗜好を自動的に評価する手法を開発し,テストする。
生成画像に対する表情反応(FERGI)のデータセットを収集し,複数の顔行動単位(AU)の活性化が生成画像のユーザ評価と高い相関性を示す。
我々は,AU推定モデルから入力を受け取るFAU-Net(Facial Action Units Neural Network)を開発し,テキスト・画像生成のためのユーザの好みを自動的に評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:03:13 GMT)
Quantum phase transition in a 2D atomic Bose gas with a g-wave Feshbach resonance [2.3] g波フェシュバッハ共鳴を用いた準2次元原子ボースガス中の量子相転移の研究を行った。
本システムでは,原子ボース・アインシュタイン凝縮のみの相から,原子および分子凝縮の相への相転移を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:07:11 GMT)
Time Series Embedding Methods for Classification Tasks: A Review [2.3] 時系列分析は、工学や金融、医療、社会科学など、様々な分野で重要になっている。
多次元の性質のため、時系列は様々な機械学習アルゴリズムによる処理を可能にするため、固定次元の特徴空間に埋め込む必要があることが多い。
本稿では,機械学習およびディープラーニングモデルにおける効率的な表現のための時系列埋め込み手法の総合的なレビューと定量的評価を行う。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:26:16 GMT)
Improving Medical Reasoning with Curriculum-Aware Reinforcement Learning [2.3] 医療用VQAに適した,最初のマルチモーダル強化学習フレームワークである textbfMedCCO を紹介する。
MedCCOは、さまざまな医療用VQAタスクに基づいて微調整され、ドメイン基底推論機能を確立する。
MedCCOを8つの挑戦的な医療用VQAベンチマークで検証し、クローズドな設定とオープンな設定の両方にまたがる。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:20:55 GMT)
Can We Trust AI Benchmarks? An Interdisciplinary Review of Current Issues in AI Evaluation [2.2] 本稿では,定量的なベンチマーク手法の欠点を論じる,約100の学術研究の学際的メタレビューを示す。
これは、より広範な社会技術的問題を伴うベンチマークの設計と適用において、多くのきめ細かい問題をもたらす。
レビューではまた、不正なインセンティブ、妥当性の問題の構築、未知の未知、ベンチマーク結果のゲームに関する問題など、現在のプラクティスにおける一連のシステム的欠陥についても取り上げている。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:36:47 GMT)
An Interpretable Representation Learning Approach for Diffusion Tensor Imaging [2.1] そこで我々は, DTIトラクトグラフィーの新たな2次元表現法を提案し, トラクションレベルの分画異方性(FA)値を9x9グレースケール画像にエンコードする。
この表現は、空間放送復号器を備えたベータ・トゥル相関変分自動符号化器によって処理される。
我々は,補助的分類,三重項損失,SimCLRに基づくコントラスト学習を含む,教師付きおよび教師なし表現学習戦略を用いて,この埋め込みの質を評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:55:02 GMT)
Learning to Explain: Prototype-Based Surrogate Models for LLM Classification [2.0] 大規模言語モデル (LLM) は、自然言語処理における顕著な性能を示しているが、その決定過程はほとんど不透明である。
プロトタイプベースのサロゲートフレームワークである textbfProtoSurE を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:25:28 GMT)
Geometric Optimization of Quantum Control with Minimum Cost [1.8] 微分幾何学的観点から量子制御の最適化について検討する。
我々の手法では、最適制御は量子状態の進化に伴うコストを最小限に抑える。
このフレームワークは、断熱駆動にショートカットを最適化するための幾何学的手法を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:26:19 GMT)
Do Large Language Models (Really) Need Statistical Foundations? [1.8] 大規模言語モデル(LLM)は、構造化されていないデータを処理するための新しいパラダイムである。
本稿では, LLM の開発と応用が, 統計学的な貢献から真に恩恵を受けるかどうかを論じる。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:44:47 GMT)
Dynamic Angle Selection in X-Ray CT: A Reinforcement Learning Approach to Optimal Stopping [1.7] 産業用X線CT(Industrial X-ray Computed Tomography)では,高速インライン検査の必要性が重要である。
スパース・アングル・トモグラフィーは、必要な投影数を減らし、処理と資源の保存を加速することで重要な役割を担っている。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:49:33 GMT)
Language Models Surface the Unwritten Code of Science and Society [1.5] 本稿では,大規模言語モデル(LLM)が人間のバイアスをどのように受け継がれるかを研究する研究コミュニティに呼びかける。
本稿では,科学のケーススタディを通じて,ピアレビューに隠されたルールを明らかにする概念的枠組みを紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:28:40 GMT)
Weak Physics Informed Neural Networks for Geometry Compatible Hyperbolic Conservation Laws on Manifolds [1.5] 物理インフォームドニューラルネットワーク(PINN)は、複素幾何学において高次元偏微分方程式(PDE)を解くための強力なアプローチを提供する。
PINNは、非線形双曲方程式から生じるような、低い正則性を持つ解を近似するのに苦労することがある。
弱解の効率的な近似に適したPINNのためのフレームワークを開発する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:36:56 GMT)
Hierarchical Mamba Meets Hyperbolic Geometry: A New Paradigm for Structured Language Embeddings [1.4] 階層型マンバ (HiM) を用いて階層型言語埋め込みを学習する。
HiMは効率的なMamba2と指数関数的な成長と双曲幾何学の曲線の性質を統合している。
両モデルが4つの存在論的データセットの階層的関係を効果的に捉えていることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:45:06 GMT)
Eta-WavLM: Efficient Speaker Identity Removal in Self-Supervised Speech Representations Using a Simple Linear Equation [1.4] 自己教師付き学習(SSL)は、注釈のないデータから意味のある表現を学習することで、音声技術における高価なラベリングへの依存を減らした。
本稿では,SSL表現を話者固有成分と話者非依存成分に線形に分解する新しいアンタングル法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:05:26 GMT)
Concept Reachability in Diffusion Models: Beyond Dataset Constraints [1.4] 本研究では,概念到達可能性の理解を深めるための一連の実験を紹介する。
我々は,概念の不足,キャプション内の概念の過小評価,関連概念によるデータバイアスという,3つの主要な障害を伴うトレーニングデータセットを設計する。
以上の結果から,ある概念は変換の特定の段階でのみ到達可能であることが示され,(iii)データセットの品質が低下するにつれて,その能力は急速に低下するが,ステアリングにより,概念は確実に到達可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:00:28 GMT)
LINGOLY-TOO: Disentangling Memorisation from Knowledge with Linguistic Templatisation and Orthographic Obfuscation [1.3] 自然言語を基盤とした挑戦的推論ベンチマークであるlingOLY-TOOを紹介する。
実言語で記述された推論問題をパーミュレートして、多数の質問のバリエーションを生成する。
実験と分析は、モデルが推論を回避し、事前の知識から回答できることを示している。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:05:06 GMT)
Language Models, Graph Searching, and Supervision Adulteration: When More Supervision is Less and How to Make More More [1.2] この作業は、グラフを検索する最小の例であるパススタータスクに関係している。
言語モデル(LM)には$G$、$s$、ターゲットノード$t$が与えられる。
タスクの最小限の性質は,タスクの分解を防ぐため,その難しさを生じさせる。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:48:06 GMT)
An Initial Exploration of Fine-tuning Small Language Models for Smart Contract Reentrancy Vulnerability Detection [1.1] 大規模言語モデル(LLM)は、様々なコーディングタスクにますます使われている。
ニッチ領域の適切な結果を得るために,より小さな言語モデルを微調整できるかどうかを評価する。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:28:33 GMT)
TRANSIT your events into a new mass: Fast background interpolation for weakly-supervised anomaly searches [1.0] TRansport Adversarial Network for Smooth InTerpolation (TRANSIT) と呼ばれる条件付き連続データモーフィングの新しいモデルを提案する。
我々はLHCの弱い教師付き検索のための背景データテンプレートを作成するためにこれを適用した。
このモデルは特徴の非線形質量相関を捉え、最先端のトランスポートベースのテンプレートジェネレータと比較して、競合する異常感度を提供するテンプレートを生成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:53:48 GMT)
WhisperD: Dementia Speech Recognition and Filler Word Detection with Whisper [1.0] 認知症(PwD)の人は、しばしば不規則な発話パターンと不一致を示すため、Whisperは正しく認知症を転写することができない。
我々はWhisperを、オープンソースの認知症音声データセット(DementiaBank)と社内データセットで微調整し、単語エラー率(WER)を改善する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:48:03 GMT)
GC-KBVQA: A New Four-Stage Framework for Enhancing Knowledge Based Visual Question Answering Performance [0.9] 知識に基づく視覚質問回答法(KB-VQA)は、画像に表される明示的なコンテンツを超えて、情報によって推論を要求するタスクに焦点を当てる。
近年のアプローチでは,Large Language Models (LLM) を暗黙の知識源として活用している。
グラウンディングキャプション誘導知識に基づく視覚質問応答(GC-KBVQA)と呼ばれる新しい4段階のフレームワークを紹介する。
イノベーションには、ジェネリックな記述を超えて、コンパクトで詳細でコンテキストに富んだ情報を持つために、質問認識キャプションを生成することが含まれる。
論文参考訳(メタデータ) (Sun, 25 May 2025 23:00:30 GMT)
A theoretical basis for MEV [0.9] 実証的な研究によると、主流のDeFiプロトコルはこれらの攻撃によって非常に標的になっている。
本稿では,ブロックチェーンとスマートコントラクトの一般的な抽象モデルに基づくMEVの形式理論を提案する。
私たちの理論は、MEV攻撃に対するセキュリティの証明の基盤となっている。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:58:35 GMT)
ADGSyn: Dual-Stream Learning for Efficient Anticancer Drug Synergy Prediction [0.9] 薬物相乗効果を予測する革新的な方法であるADGSynを提案する。
13,243個の薬物-細胞ラインの組み合わせを含むO'Neilデータセットに基づいて評価し、ADGSynは8つのベースライン法よりも優れた性能を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:40:13 GMT)
Deformable Attentive Visual Enhancement for Referring Segmentation Using Vision-Language Model [0.9] 本稿では,セグメンテーションの精度とモーダル間のアライメントを向上させるために,アーキテクチャの改善を取り入れた視覚言語モデルを提案する。
SegVLMは多様なデータセットをまたいだ強力な一般化と表現シナリオの参照を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:42:53 GMT)
FiLLM -- A Filipino-optimized Large Language Model based on Southeast Asia Large Language Model (SEALLM) [0.9] 本研究では,フィリピン語を最適化した大規模言語モデルFiLLMを提案する。
SeaLLM-7B 2.5モデルに基づいて構築されたFiLLMは、タスク固有の性能を維持しながらメモリ効率を最適化するためにローランド適応(LoRA)ファインチューニングを利用する。
このモデルは、NER(Named Entity Recognition)、POS(Part-of-Speech)タグ付け(Part-of-Speech)、依存性解析(Dependency Parsing)、テキスト要約(Text Summarization)など、主要なNLPタスクに対応するために、さまざまなフィリピンのデータセットでトレーニングされ評価された。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:36:26 GMT)
Can Large Language Models Generate High-quality Patent Claims? [0.8] 大規模言語モデル(LLM)は、様々なテキスト生成タスクで例外的なパフォーマンスを示している。
本稿では,特許クレーム生成における現在のLCMの性能を評価するためのデータセットを構築した。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:19:18 GMT)
Misleading through Inconsistency: A Benchmark for Political Inconsistencies Detection [0.7] 矛盾した政治的言明は誤報の一形態を表す。
本研究では,不整合検出タスクを提案し,この方向にNLP-Researchを促すために,不整合型の尺度を開発する。
そこで本研究では,アノテータの237サンプルに対する推論を解説した698対の政治的ステートメントのデータセットを提示する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:35:24 GMT)
Allocation Multiplicity: Evaluating the Promises of the Rashomon Set [0.7] ラショモンのモデルは差別的アルゴリズムを減らし、結果の均質化を減らし、公平な決定を約束する。
割り当て多重性の観点から、これらの約束は満たされないかもしれないと論じる。
医療割当のケーススタディで示すように、この等実用割当の空間は、羅生門セットに忠実に反映されないかもしれない。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:26:01 GMT)
Retrieval-Augmented Generation for Service Discovery: Chunking Strategies and Benchmarking [0.7] 本稿では, 終端検出における検索拡張生成の利用状況と, 実際のOpenAPIのチャンキング状況を分析し, 入力オッケン長を削減した。
合成のプロンプトの入力トークン長をさらに短縮し、エンドポイント検索を改善するために、(ii)最も関連性の高いエンドポイントの要約のみを受信するディスカバリエージェントを提案し、要求に応じて仕様の詳細を検索する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:49:39 GMT)
RGC-Bent: A Novel Dataset for Bent Radio Galaxy Classification [0.7] ベント放射能銀河核(AGN)は銀河団のダイナミクス、銀河団内の相互作用、AGNのより広い物理に関する洞察を提供する。
本稿では、天文学的な観測において、曲がった放射能銀河核(AGN)の分類に適した新しい機械学習データセットを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:57:47 GMT)
CrosGrpsABS: Cross-Attention over Syntactic and Semantic Graphs for Aspect-Based Sentiment Analysis in a Low-Resource Language [0.6] Aspect-Based Sentiment Analysis (ABSA) は自然言語処理の基本的なタスクであり、テキストで表現された意見に対するきめ細かい洞察を提供する。
本研究は,構文グラフとセマンティックグラフ間の双方向の相互アテンションを活用し,アスペクトレベルの感情分類を強化する新しいハイブリッドフレームワークであるCrosGrpsABSを提案する。
低リソースのBengali ABSAデータセットと高リソースのSemEval 2014 Task 4データセットでCrosGrpsABSを評価した。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:42:32 GMT)
Towards user-centered interactive medical image segmentation in VR with an assistive AI agent [0.6] 本稿では,3次元医療概念のローカライズ,セグメンテーション,可視化を支援する,医療用VR用対話型AIエージェントSAMIRAを提案する。
このシステムは、患者固有の解剖学的理解を高めるために、セグメント化された病理の真の3次元可視化もサポートする。
ユーザスタディでは、高いユーザビリティスコア(SUS=90.0$pm$9.0)、全体のタスク負荷の低減、提案されたVRシステムのガイダンスの強力なサポートが示された。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:26:38 GMT)
Coherence, Transport, and Chaos in 1D Bose-Hubbard Model: Disorder vs. Stark Potential [0.5] 有限次元Bose-Hubbardモデルにおける量子コヒーレンスと相転移について検討する。
我々は、凝縮分数、超流動分数、可視性、数ゆらぎ、および$ell_$-norm of quantum coherenceを含むいくつかの観測可能量を計算する。
この結果から,コヒーレンス景観を乱れ,傾き,温度が共生する様子が明らかになった。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:08:24 GMT)
Unified Preference Optimization: Language Model Alignment Beyond the Preference Frontier [0.5] 大規模言語モデル(LLM)の整合化のための統一的アプローチを提案する。
好みと補助目的の単純な分解に基づいて、ユーザとデザイナーの好みを最適化するためにLLMをチューニングできる。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:23:18 GMT)
A quantitative notion of economic security for smart contract compositions [0.5] 単一コンポーネントに対する攻撃がシステム全体の経済的損失を増幅する方法を測定する量的セキュリティの概念を導入する。
特に、貸し出しプロトコルと分散型取引所からなるシステムにおける過度の担保ローン攻撃を分析します。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:10:55 GMT)
Towards a Spatiotemporal Fusion Approach to Precipitation Nowcasting [0.4] リオデジャネイロの気象雨量計観測所のデータを統合することで,降水量計のためのデータ融合手法を提案する。
我々はSTConvS2Sと呼ばれる数値的な気象深度学習アーキテクチャを採用し、9 x 11グリッドをカバーする構造化データセットを活用している。
実験された構成のうち、核融合モデルでは1時間リードで重降雨(25 mm/h以上)に対して0.2033のF1スコアを達成する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:27:19 GMT)
ReadBench: Measuring the Dense Text Visual Reading Ability of Vision-Language Models [0.4] 本稿では,Large Vision-Language Models(VLM)の読解能力を評価するベンチマークであるReadBenchを紹介する。
ReadBenchは、既存のテキストのみのベンチマークからテキストのイメージにコンテキストを変換し、テキストのプロンプトや質問をそのまま保持する。
短いテキストイメージの入力では最小限のパフォーマンス劣化がみられ、長い複数ページのコンテキストでは性能が大幅に低下する。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:02:01 GMT)
Genetic Influences on Brain Aging: Analyzing Sex Differences in the UK Biobank using Structural MRI [0.3] 脳の老化の軌跡は男性と女性によって異なるが、これらの違いの根底にある遺伝的要因は未解明のままである。
総脳,海馬,心室容積の脳年齢ギャップ推定値(BrainAGE)を算出した。
性別階層化ゲノムワイド・アソシエーション(GWAS)とポストGWAS(Post-GWAS)を用いて,脳老化の進行に伴う遺伝的変異を同定した。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:59:00 GMT)
Beyond Replacement or Augmentation: How Creative Workers Reconfigure Division of Labor with Generative AI [0.3] ChatGPTのようなジェネレーティブなAIツールがクリエイティブな職場に導入され、非常に目に見えるものになったが、バイナリワーカー代替の議論が巻き起こった。
この研究は、創造的なプロフェッショナルがいかにしてこれらのツールによる分業を再特定するかを検討することで、この議論を再考する。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:11:55 GMT)
Cryogenic Microwave Whispering Gallery Mode Spectroscopy of Paramagnetic Impurities in High-Purity Crystalline LiF [0.3] 高純度フッ化リチウム(LiF)結晶上で低ノイズ極低温マイクロ波分光実験を行った。
分光データから, 気まぐれなギャラリーモードにおける水平交差相互作用を回避した。
相互作用スペクトルの分析により、$S = 3/2, I = 7/2$, $S = 1, I = 7/2$, $S = 3/2, I = 0$に対応する異なるスピン系が同定された。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:42:02 GMT)
Domain and Task-Focused Example Selection for Data-Efficient Contrastive Medical Image Segmentation [0.3] 医用画像セグメンテーションのための自己教師型コントラスト学習フレームワークであるPolyCLを提案する。
PolyCLは、革新的なサロゲートからのセグメンテーションに有用なコンテキスト対応の識別機能を学習し、伝達する。
PolyCLは、低データとクロスドメインの両方のシナリオにおいて、完全な教師付きベースラインと自己教師付きベースラインより優れていることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:11:48 GMT)
An Empirical Study of Vulnerability Handling Times in CPython [0.3] 本稿では,CPythonにおけるソフトウェア脆弱性の処理時間について検討する。
この論文は、Pythonエコシステムのセキュリティをよりよく理解するための最近の取り組みに貢献している。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:12:00 GMT)
Sensorimotor features of self-awareness in multimodal large language models [0.2] 自己認識は知的で自律的な行動を支える。
近年のAIの進歩は、マルチモーダル情報を統合するタスクにおいて、人間のようなパフォーマンスを実現する。
我々は,マルチモーダルLLMが感覚運動経験のみで自己認識できるかどうかを考察する。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:26:28 GMT)
Bayesian Comparisons Between Representations [0.2] 中間表現からの線形読み出しの予測分布に関する基礎的比較を提案する。
事前の予測分布は、モデルの帰納バイアスと一般化の完全な記述であり、比較のための大きな基礎となる。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:37:33 GMT)
A Smart Healthcare System for Monkeypox Skin Lesion Detection and Tracking [0.2] サルポックスは特異な皮膚病変を特徴とするウイルス性疾患であり、多くの国で報告されている。
本研究では,皮膚病変画像からサルポックスを検出することを目的とした,インテリジェントなAI駆動型医療システムであるITMAINNを開発した。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:17:21 GMT)
A log-depth in-place quantum Fourier transform that rarely needs ancillas [0.1] 最適化量子回路」は、より大きな量子アルゴリズムの文脈ではしばしば十分である。
量子フーリエ変換(QFT)のための楽観的な回路を構築する。
提案手法を適用して,全ての入力に対してよく制御された誤差で近似QFTを出力する。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:30:24 GMT)
A Novel Transformer-Based Self-Supervised Learning Method to Enhance Photoplethysmogram Signal Artifact Detection [0.1] 本研究は、自己教師付き学習(SSL)を用いて、このデータから潜伏した特徴を抽出することにより、豊富なラベル付きデータの未利用に対処する。
実験の結果,SSLはTransformerモデルの表現学習能力を大幅に向上させることがわかった。
このアプローチは、注釈付きデータがしばしば制限されるPICU環境において、より広範なアプリケーションに対して約束される。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:36:10 GMT)
Unveiling Dual Quality in Product Reviews: An NLP-Based Approach [0.0] 本稿では,自然言語処理(NLP)がこのような不一致を検出するのにどのように役立つかを検討する。
我々は1,957のレビューと540の二重品質問題を強調したポーランド語の新しいデータセットを作成しました。
次に, 文変換器を用いたSetFit, トランスフォーマーベースのエンコーダ, 誤り解析やロバストネス検証など, 様々な手法を用いて実験を行った。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:23:36 GMT)
Universal dissipators for driven open quantum systems and the correction to linear response [0.0] 還元系の力学を特徴付ける散逸器は普遍的であることを示す。
また、駆動散逸系におけるメモリ経由の環境影響による線形応答補正も導出する。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:33:51 GMT)
Two LLMs debate, both are certain they've won [0.0] 大規模言語モデル (LLM) を動的, 敵対的な議論環境下で評価する。
我々は10のLLMのうち60の3ラウンドの政策討論を組織した。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:06:17 GMT)
TextDiffuser-RL: Efficient and Robust Text Layout Optimization for High-Fidelity Text-to-Image Synthesis [0.0] 拡散に基づく画像合成モデルを用いて,高速かつ最適化されたテキストレイアウト生成のための強化学習(RL)を統合した新しい2段階パイプラインを提案する。
本フレームワークは,テキスト配置および画像合成におけるTextDiffuser-2の品質を維持あるいは超越し,実行速度が著しく向上し,柔軟性が向上する。
我々の手法はMARIOEvalベンチマークで評価され、OCRとCLIPScoreのメトリクスは最先端モデルに近い。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:52:04 GMT)
Temporal Model On Quantum Logic [0.0] このフレームワークは、線形および分岐時間モデルを用いて、時間とともに命題の進化を定式化する。
メモリの階層構造は、有向非巡回グラフを用いて表される。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:46:36 GMT)
Tailoring fusion-based photonic quantum computing schemes to quantum emitters [0.0] 核融合に基づく量子計算は、核融合ゲートによって小さなフォトニック資源状態が同時に絡み合って測定される、有望な量子計算モデルである。
本稿では,量子エミッタの能力とノイズモデルに合わせた融合型アーキテクチャを提案する。
本研究は,光子損失の8%,エミッタの光子識別率の4%,メモリエラーのはるかに高いスピンノイズ閾値といった,物理誤差機構に対する高い耐性を実現することができることを示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:15:39 GMT)
Symmetries in Overparametrized Neural Networks: A Mean-Field View [0.0] 我々は,超並列化ニューラルネットワーク(NN)の学習力学を,法学におけるデータ対称性の下で平均フィールドスチューデント(MF)ビューで表現する。
我々は、対称データに対して、DA、FAおよび自由学習モデルが全く同じMFダイナミクスに従うことを示し、人口リスクを最小限に抑える。
また、SI法に対する最適の到達可能性についても反例を挙げる。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:15:50 GMT)
Super-Resolution Generative Adversarial Networks based Video Enhancement [0.0] 本研究は、通常のシングルイメージSIS(SRGAN)構造を拡張して、対数データを扱うことで、ビデオ超解像への拡張アプローチを導入する。
3次元非局所ブロックを組み込んだ修正フレームワークが開発され、空間次元と時間次元の両方で関係を捉えることができる。
その結果、従来の単一画像法と比較して、時間的コヒーレンス、よりシャープなテクスチャ、視覚的アーティファクトが向上した。
論文参考訳(メタデータ) (Sun, 25 May 2025 17:23:59 GMT)
Spin-qubit readout analysis based on a Hidden Markov Model [0.0] 半導体スピン量子ビットでは、典型的な信号トレースは通常、それを単一の値に圧縮することによって解析される。
ここでは、隠れマルコフモデル(HMM)を用いて、より洗練された信号トレース処理によって達成できることを分析する。
システム統計モデルとして白色雑音を用いたHMMは驚くほど相関に敏感であることがわかった。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:04:02 GMT)
Smart Waste Management System for Makkah City using Artificial Intelligence and Internet of Things [0.0] サウジアラビアのマッカへの毎年の巡礼は、世界最大の宗教集会の一つである。
この研究は、巡礼シーズンのユニークな要件に合わせて、文脈に特有な革新的な解決策を提案した。
本システムは,各容器内の廃棄物濃度を計測する超音波センサを含む。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:42:13 GMT)
Simplifying Data Integration: SLM-Driven Systems for Unified Semantic Queries Across Heterogeneous Databases [0.0] 本稿では,Small Language Model(SLM)をベースとした,軽量な検索・拡張生成(RAG)とセマンティック・アウェアなデータ構造化の進歩を相乗化するシステムを提案する。
SLMを用いた構造化データ抽出にMiniRAGのセマンティック・アウェア・ヘテロジニアス・グラフインデックスとトポロジ・エンハンス・検索を統合し,従来の手法の限界に対処する。
実験結果は精度と効率性において優れた性能を示し、教師なし評価指標としてのセマンティックエントロピーの導入はモデルの不確実性に対する堅牢な洞察を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:50:16 GMT)
Sensing single molecule magnets with nitrogen vacancy centers [0.0] 単分子磁石(SMM)は、小さな磁石として機能する分子である。
磁気メモリの応用では、分子はおそらく室温で表面にあるだろう。
ダイヤモンド表面に置かれたコバルト系SMMの磁気ノイズを検出するために,単一のNVを用いる。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:11:26 GMT)
Saliency-guided Emotion Modeling: Predicting Viewer Reactions from Video Stimuli [0.0] 本稿では,2つの重要な特徴を抽出し,感情予測のための新しい唾液量に基づくアプローチを提案する。
HD2SサリエンシモデルとOpenFace顔動作単位分析を用いて,映像のサリエンシと視聴者の感情の関係について検討した。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:52:36 GMT)
S$^2$GPT-PINNs: Sparse and Small models for PDEs [0.0] S$2$GPT-PINNはドメイン固有の(ファミリーの)PDEに適合する。
S$2$GPT-PINNはPINNよりも桁違いに少ないパラメータに依存している。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:03:10 GMT)
Running a six-qubit quantum circuit on a silicon spin qubit array [0.0] 半導体量子技術を利用した最大6量子ビット量子回路を実装した。
量子プロセッサをプログラムすることにより、3つ、4つ、5つ、6つの隣接する量子ビットの全ての置換で量子回路を実行する。
その結果、個々のユニットの品質が高いにもかかわらず、全てのユニットを量子回路に結合する際にエラーがすぐに蓄積されることが判明した。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:51:16 GMT)
Robust Stability Analysis of Positive Lure System with Neural Network Feedback [0.0] 線形部分がパラメトリック不確実性を含むだけでなく、非線形セクター境界も未知であるLur'e型の制御系を考える。
系の正の特性を利用することにより、Lur'e系の安定性半径の明示的な式を導出する。
本研究では,Lur'eとNN制御システムのロバストネス解析のためのスケーラブルで効率的な手法を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:37:28 GMT)
Revisiting Reset Mechanisms in Spiking Neural Networks for Sequential Modeling: Specialized Discretization for Binary Activated RNN [0.0] スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)に匹敵する性能を達成した
本稿では、SNNを逐次モデリングタスクのためのバイナリアクティベート・リカレントニューラルネットワーク(RNN)とみなす別の視点に焦点を当てる。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:11:52 GMT)
Rethinking Edge Detection through Perceptual Asymmetry: The SWBCE Loss [0.0] 本稿では,Symmetrization Weighted Binary Cross-Entropy (SWBCE)ロス関数を提案する。
ラベル誘導学習と予測誘導学習のバランスをとることで、SWBCEは偽陽性を効果的に抑制しつつ高いエッジリコールを維持する。
これらの結果は、高品質エッジ予測におけるSWBCEの有効性と、関連する視覚タスクへの適用可能性を示している。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:25:44 GMT)
Quantum Teleportation of a Single Qutrit using Two-Qutrit Entangled States [0.0] 本研究では,2量子絡み合った状態の完全集合を用いた量子テレポーテーションを実演する。
我々のアプローチは、最小限の変更でBennettのテレポーテーションプロトコルをクォートシステムに拡張する。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:40:50 GMT)
PySAD: A Streaming Anomaly Detection Framework in Python [0.0] ストリーム異常検出には厳密な制約の下で動作させるアルゴリズムが必要である。
PySADは、統一アーキテクチャを通じてこれらの課題に対処する包括的なPythonフレームワークである。
論文参考訳(メタデータ) (Sun, 25 May 2025 00:23:23 GMT)
Provably Overwhelming Transformer Models with Designed Inputs [0.0] この文字列で評価されたモデルの出力と任意の追加文字列$t$, $mathcalM(s + t)$が、長さ($t$)$leq n_free$のたびに$t$の値に完全に無関心である場合、$mathcalM$は$s$で圧倒される。
我々は、モデルの振る舞いを束縛するために使う、特に強力な「オーバースカッシング」の最悪の形態を証明します。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:34:27 GMT)
PosePilot: An Edge-AI Solution for Posture Correction in Physical Exercises [0.0] この研究は、リアルタイムにパーソナライズされた修正フィードバックで認識する新しいシステムであるPosePilotを提示する。
エッジデバイス用に設計されたPosePilotは、自宅や屋外のさまざまなエクササイズに拡張できる。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:13:54 GMT)
Patent-CR: A Dataset for Patent Claim Revision [0.0] 本稿では,特許請求書修正作業のために作成された最初のデータセットであるPatent-CRについて述べる。
これには、特許審査官によって拒絶された初期特許出願と、最終認可版の両方が含まれる。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:44:42 GMT)
OptiMindTune: A Multi-Agent Framework for Intelligent Hyperparameter Optimization [0.0] 本稿では,ハイパーパラメータをインテリジェントかつ効率的に最適化する新しいマルチエージェントフレームワークOptiMindTuneを紹介する。
私たちは、GoogleのGeminiモデルによって、Recommender Agent、Evaluator Agent、Decision Agentという3つの専門AIエージェントの協調的なインテリジェンスを活用しています。
我々のフレームワークは、高度な大規模言語モデルと適応検索の原則を統合し、スケーラブルでインテリジェントなAutoMLを実現する。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:05:41 GMT)
On the status of current quantum machine learning software [0.0] 実際に利用可能な量子デバイス上で,ハイブリッド量子古典モデルを動作させることがいかに困難かを検討する。
また、そのような取り組みのコストとモデルの品質の変化を分析した。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:11:03 GMT)
Nonreciprocal transmission in hybrid atomic ensemble-optomechanical systems [0.0] 原子アンサンブルを組み込んだハイブリッド光学系における完全光非相互伝送について検討する。
我々は、最適な非相互伝達に必要な条件を導出し、結合の複雑な性質に依存することを示す。
これらの知見は、非相互光学デバイスの設計に有用な洞察を与える。
論文参考訳(メタデータ) (Sun, 25 May 2025 06:00:03 GMT)
Nonreciprocal entanglement in a molecular optomechanical system [0.0] 分子空洞光力学系における共振モードと共振モードとの間の非相互二部結合を生成する。
我々の発見は、量子情報伝送および非相互量子デバイスの開発において潜在的に有用である。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:45:52 GMT)
Non-Hermitian effects on the quantum parameter estimation in pseudo-Hermitian systems [0.0] 非エルミート系の量子状態における量子フィッシャー情報(QFI)について検討する。
本研究は,非エルミート系におけるQFIの分析・拡張の新たな視点を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:23:57 GMT)
Next Token Prediction Is a Dead End for Creativity [0.0] トークンの予測は、基本的に実際の創造性と不一致である、と我々は主張する。
創造性を予測的なアウトプットではなくインタラクティブなプロセスとして考えることで、より表現力があり、応答性があり、人間の創造的なプラクティスと整合するAIシステムに対するビジョンを提供します。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:18:11 GMT)
Meta-aware Learning in text-to-SQL Large Language Model [0.0] 大規模言語モデル(LLM)は、複雑なドメイン情報を理解するための主要な課題を克服するために、テキストからタスクへの大きな機会を提供してきました。
本稿では,ドメイン知識,データベーススキーマ,チェーンオブ思考推論プロセス,メタデータ関係を統合するメタ知識学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:45:00 GMT)
Macroscopic Irreversibility in Quantum Systems: Free Expansion in a Fermion Chain [0.0] 概念的には、初期状態やハミルトン状態にランダム性を導入することなく、任意の初期状態からの可逆性がここで証明されることが重要である。
証明において不可欠な新しい要素は、強いETH(エネルギー固有状態熱化仮説)を思い起こさせる全てのエネルギー固有状態に対して大きな偏差である。
論文参考訳(メタデータ) (Sun, 25 May 2025 13:07:39 GMT)
Machine Psychophysics: Cognitive Control in Vision-Language Models [0.0] 我々は,3つの古典的コンフリクトタスクと,2,220回のトライアルにおいて,より要求の大きい「二乗」変異に対して108の視覚言語モデルを評価する。
結果は、現在のマルチモーダル基盤モデルにおいて、ある種の人間のようなエグゼクティブ関数が出現したことを示唆している。
論文参考訳(メタデータ) (Sun, 25 May 2025 04:23:28 GMT)
MALAMUTE: A Multilingual, Highly-granular, Template-free, Education-based Probing Dataset [0.0] 言語モデル(LM)は様々な広い領域で優れている。
彼らは特定の、きめ細かい知識の領域で習熟を証明しなければならない。
MALAMUTEは教育ベースの最初のクローゼスタイルのデータセットである。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:05:44 GMT)
Integrating Dynamical Systems Learning with Foundational Models: A Meta-Evolutionary AI Framework for Clinical Trials [0.0] NetraAIは、小さな臨床試験データセットの安定性と解釈性のために設計されたシステムベースのフレームワークである。
我々はNetraAIの基礎を定式化し、収縮マッピング、情報幾何学、進化的アルゴリズムを組み合わせて予測的患者コホートを同定する。
信頼できる説明可能な知識を優先することによって、NetraAIは、臨床発見を加速するために、適応的で自己反射的なAIの新しい世代を提供する。
論文参考訳(メタデータ) (Sun, 25 May 2025 03:34:33 GMT)
How to design a Public Key Infrastructure for a Central Bank Digital Currency [0.0] 中央銀行デジタル通貨(Central Bank Digital Currency、CBDC)は、各国の中央銀行が発行する新たな通貨で、様々な支払いシナリオに使用できる。
システム内のすべてのエンティティの継続的な信頼を保証するため、CBDCには堅牢でスケーラブルなパブリックキーインフラストラクチャ(PKI)が必要である。
本稿では,PKIの設計に流入すべき基準について論じ,システムの継続的な運用を保証するロールオーバー概念とともに証明書階層を提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:09:31 GMT)
Heterogeneous networks in drug-target interaction prediction [0.0] 薬物と標的の相互作用を予測するグラフ機械学習手法の詳細について述べる。
主に2020年から2024年にかけて刊行された。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:16:22 GMT)
Geometric Determinations Of Characteristic Redshifts From DESI-DR2 BAO and DES-SN5YR Observations: Hints For New Expansion Rate Anomalies [0.0] 我々は、宇宙距離とその微分をピンポイント特性の赤方偏移に再構成し、$E(z)$を推測する。
我々の分析では、Planck 2018 $Lambda$CDM予測から約4~5$sigma$の顕著なずれが明らかであり、特に赤シフト範囲$z sim 0.35-0.55$で顕著である。
これらの異常は、復元法と組み合わせたデータセットの両方で一貫して観察され、標準宇宙論の枠組みを超えた新しい物理を示唆する堅牢な深夜の出発を示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 10:40:02 GMT)
Federated Learning: From Theory to Practice [0.0] この本は、連邦学習(FL)システムの構築と理解についてハンズオンで紹介する。
FLは、スマートフォン、センサー、ローカルコンピュータなどの複数のデバイスで、機械学習(ML)モデルを協調的にトレーニングすることを可能にする。
プライバシや規制、技術的な理由から、データが集中できない、あるいは集中できないような、強力なソリューションです。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:05:21 GMT)
FedCC: Robust Federated Learning against Model Poisoning Attacks [0.0] フェデレートラーニング(Federated Learning)は、プライバシの問題に対処するために設計された分散フレームワークである。
新たなアタックサーフェスを導入しており、データは独立に、そしてIdentically Distributedである場合、特に困難である。
我々は,モデル中毒に対する簡易かつ効果的な新しい防御アルゴリズムであるFedCCを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:32:43 GMT)
Extension of the Watanabe-Sagawa-Ueda uncertainty relation for measurement errors to infinite-dimensional systems [0.0] 測定誤差に対する渡辺-佐川-上田不確実性関係を無限次元量子系に拡張する。
無限次元パラメータ空間に対する古典的および量子的推定理論を開発した。
論文参考訳(メタデータ) (Sun, 25 May 2025 11:03:01 GMT)
Enhancing the Harrow-Hassidim-Lloyd (HHL) algorithm in systems with large condition numbers [0.0] HHL(Harrow-Hassidim-Lloyd)アルゴリズムは、量子コンピュータ上の$Avecx=vecb$という形の線形方程式を扱うために、システムサイズを指数関数的に高速化する。
本稿では,選択後改善HHL(Psi-HHL)フレームワークについて紹介する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:27:56 GMT)
Effect of noise and topologies on multi-photon quantum protocols [0.0] 量子拡張ネットワークは、悪意のあるアクターに対する検出と保護を改善するために量子現象を使用することを目的としている。
このようなハイブリッドネットワークでは、単一光子に基づく量子プロトコルが送信距離とデータ速度のボトルネックとなる。
一方、マルチ光子量子プロトコルは、実用的な仮定の下で動作するよう設計されており、単一の光子エミッタを必要としない。
論文参考訳(メタデータ) (Sun, 25 May 2025 18:59:54 GMT)
Demand Selection for VRP with Emission Quota [0.0] 本稿では,QVRP と呼ばれるエミッションクォータを用いた車両ルーティング問題 (VRP) に対する需要選択問題を提案する。
目的は、汚染基準を尊重しつつ、省略された配送数を最小化することである。
我々は、MFVA(Maximum Feasible Vehicle Assignment)と呼ばれる需要選択部分に焦点を当て、VRPインスタンスのルーティングの構成は古典的なOR手法を用いて解決する。
論文参考訳(メタデータ) (Sun, 25 May 2025 21:04:38 GMT)
Controlling Language Confusion in Multilingual LLMs [0.0] 大規模な言語モデルは、意図しない言語で応答が部分的にまたは完全に生成される現象である言語混乱に悩まされることが多い。
標準SFTに不要な出力スタイルのペナルティを付加したORPOは,高い復号温度でも言語に富んだ世代を効果的に抑制する。
この結果から,適切なペナルティ項を組み込むことで,限られたデータを用いた低リソース環境における言語混乱を軽減できる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:15:31 GMT)
Computational Inertia as a Conserved Quantity in Frictionless and Damped Learning Dynamics [0.0] 計算慣性と呼ばれる連続時間最適化力学における保存量を特定する。
この保存法則を定式化し, 摂動下における解析的崩壊を導出し, その挙動を合成系で示す。
論文参考訳(メタデータ) (Sun, 25 May 2025 14:43:57 GMT)
Co-AttenDWG: Co-Attentive Dimension-Wise Gating and Expert Fusion for Multi-Modal Offensive Content Detection [0.0] 本稿では,マルチモーダルなCo-AttenDWGアーキテクチャを提案する。
我々はMIMICとSemEval Memotion 1.0に対するアプローチを検証した。
論文参考訳(メタデータ) (Sun, 25 May 2025 07:26:00 GMT)
Characterization of Nanostructural Imperfections in Superconducting Quantum Circuits [0.0] ジョセフソン接合とスパイラル共振器の断面の原子レベル特性について述べる。
酸化物層の形成と炭素系汚染に関連する構造欠陥を同定した。
その結果,重要なインターフェースにおけるTLS欠陥は,デバイス性能の制限に大きく寄与することが示唆された。
論文参考訳(メタデータ) (Sun, 25 May 2025 20:21:29 GMT)
CAGES: Cost-Aware Gradient Entropy Search for Efficient Local Multi-Fidelity Bayesian Optimization [0.0] 我々は,多要素ブラックボックス関数の局所BOのための新しいアルゴリズムであるCost-Aware Gradient Entropy Search (CAGES)を提案する。
我々は,合成およびベンチマークRL問題における他の最先端手法と比較して,CAGESが顕著な性能向上を達成できることを実証した。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:09:29 GMT)
Brain Tumor Diagnosis Using Quantum Convolutional Neural Networks [0.0] 本研究では、量子特徴符号化回路と深度的に分離可能な畳み込み層を統合するハイブリッド量子畳み込みニューラルネットワーク(HQCNN)を提案する。
HQCNNは99.16%のトレーニング精度と91.47%の検証精度を達成した。
論文参考訳(メタデータ) (Sun, 25 May 2025 16:22:51 GMT)
BnMMLU: Measuring Massive Multitask Language Understanding in Bengali [0.0] 本稿では,ベンガル語モデルにおける言語理解能力を評価するベンチマークであるBnMMLUを紹介する。
データセットは科学、人文科学、数学、一般知識を含む23の領域にまたがる。
我々は、BnMMLUテストセット上で、プロプライエタリでオープンソースの大規模言語モデル(LLM)をベンチマークする。
論文参考訳(メタデータ) (Sun, 25 May 2025 02:54:31 GMT)
Benchmarking quantum computers via protocols [0.0] 量子コンピュータのベンチマークは、単一の量子ビットやゲートのパラメータを扱うことが多い。
本稿では,量子コンピュータのベンチマークにプロトコルを用いることを提案する。
論文参考訳(メタデータ) (Sun, 25 May 2025 15:05:59 GMT)
Benchmarking Large Language Models for Cyberbullying Detection in Real-World YouTube Comments [0.0] 本研究は,OpenAI GPT-4.1, Google Gemini 1.5 Pro, Anthropic Claude 3 Opusの3つの主要な言語モデルを,5,080コメントのコーパスでベンチマークする。
YouTubeのデータセットは、英語、アラビア語、インドネシア語で1,334件の有害メッセージと3,746件の有害メッセージで構成されている。
論文参考訳(メタデータ) (Sun, 25 May 2025 01:28:30 GMT)
Bayesian sparse modeling for interpretable prediction of hydroxide ion conductivity in anion-conductive polymer membranes [0.0] アニオン伝導性高分子膜はアルカリ性燃料電池や電解質の固体電解質として注目されている。
水酸化物イオンの伝導度は、四級アンモニウム基のタイプや分布などによって異なる。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:46:32 GMT)
BSAGIoT: A Bayesian Security Aspect Graph for Internet of Things (IoT) [0.0] 本稿では,それぞれ異なるセキュリティ面と,その関係を説明する新たなBSAGIoT(Bayesian Security aspect Dependency Graph for IoT)を提案する。
提案されているBSAGIoTは、任意のIoTネットワークに適用可能な汎用モデルであり、データ、アクセス制御、標準、ネットワーク、損失という5つのカテゴリのアスペクトを含んでいる。
BSAGIoTの目的は、セキュリティの専門家が、侵入の成功と/または障害の失敗が、各IoTネットワーク全体のセキュリティとプライバシにどのように影響するかを分析するのを支援することである。
論文参考訳(メタデータ) (Sun, 25 May 2025 19:27:56 GMT)
Architectures of Error: A Philosophical Inquiry into AI and Human Code Generation [0.0] 本稿では、人間と機械のコード生成を区別するために、Error'のアーキテクチャを明確に述べる。
エラーに対する脆弱性を共有することで、この区別は基本的に異なる因果関係(人間認知と人工確率)を明らかにしている。
論文参考訳(メタデータ) (Sun, 25 May 2025 22:49:36 GMT)
Adaptive Sensor Steering Strategy Using Deep Reinforcement Learning for Dynamic Data Acquisition in Digital Twins [0.0] 本稿では,デジタル双生児の予測精度と意思決定支援能力を高めるために,深層強化学習に基づくセンサステアリング手法を提案する。
提案手法は、デジタルツインパラダイム内のセンサ配置に適応的なフレームワークを提供することにより、この制限に対処する。
論文参考訳(メタデータ) (Sun, 25 May 2025 12:50:50 GMT)
AIGCodeSet: A New Annotated Dataset for AI Generated Code Detection [0.0] AIGCodeSetは2.828のAI生成コードと4.755の人手によるPythonコードで構成される。
ベイズ分類器が他のモデルより優れていることを示す実験を行った。
論文参考訳(メタデータ) (Sun, 25 May 2025 09:15:33 GMT)
AI4Math: A Native Spanish Benchmark for University-Level Mathematical Reasoning in Large Language Models [0.0] AI4Mathは、スペイン語で書かれた105の大学レベルの数学問題のベンチマークである。
データセットは7つの高度なドメイン(代数、計算、幾何学、確率、数論、コンビニティクス、論理)にまたがる。
GPT 4o, GPT 4o mini, o3 mini, LLaMA 3.3 70B, DeepSeek R1 685B, DeepSeek V3 685Bの6つの大言語モデルを, スペイン語と英語でそれぞれゼロショットとチェーンの4つの構成で評価した。
論文参考訳(メタデータ) (Sun, 25 May 2025 05:08:25 GMT)
A Systematic Classification of Vulnerabilities in MoveEVM Smart Contracts (MWC) [0.0] Moveで構築されたスマートコントラクトのための、専用の脆弱性分類を導入します。
我々の分類は6つのセマンティックフレームにまたがる37の分類された脆弱性タイプにまたがっている。
MWCは、次世代ブロックチェーンシステムにおいて、よりセキュアで検証可能な契約の基礎を築いている。
論文参考訳(メタデータ) (Sun, 25 May 2025 08:53:23 GMT)