WorldPM: Scaling Human Preference Modeling [130.2] 我々は、このスケーリングの可能性を強調するために、World Preference Modeling$ (WorldPM)を提案する。
多様なユーザコミュニティをカバーする公開フォーラムから選好データを収集する。
1.5Bから72Bパラメータの範囲で15Mスケールのデータを用いて広範囲なトレーニングを行う。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:45:31 GMT)
Efficient RL Training for Reasoning Models via Length-Aware Optimization [108.9] 大規模推論モデルの強化学習プロセスに直接統合された3つの重要な報酬設計を提案する。
本手法は, 性能を維持・改善しながら, 応答長を著しく低減する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:46:43 GMT)
EasyInv: Toward Fast and Better DDIM Inversion [107.5] 本稿では DDIM インバージョンへの容易かつ斬新なアプローチである EasyInv を紹介する。
EasyInvの中核は、反転雑音を近似するための洗練された戦略である。
我々は、EasyInvが従来のDDIMインバージョン手法と同等かそれ以上の結果を提供できることを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:10:52 GMT)
LoRanPAC: Low-rank Random Features and Pre-trained Models for Bridging Theory and Practice in Continual Learning [103.5] 連続学習(CL)は、連続的に提示される複数のタスクを解決できるモデルを訓練することを目的としている。
最近のCLアプローチは、ダウンストリームタスクをうまく一般化する大規模な事前学習モデルを活用することで、強力なパフォーマンスを実現している。
しかし、これらの手法には理論的保証がなく、予期せぬ失敗をしがちである。
理論的に健全で高性能な単純なCL法を設計することで,このギャップを埋めることを目指している。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:16:11 GMT)
Pseudo-Labeling Based Practical Semi-Supervised Meta-Training for Few-Shot Learning [93.6] 擬似ラベルベースメタラーニング(PLML)という,シンプルで効果的なメタトレーニングフレームワークを提案する。
まず、一般的な半教師付き学習(SSL)を用いて分類器を訓練し、ラベルなしデータの擬似ラベルを得る。
ラベル付きおよび擬似ラベル付きデータから数ショットのタスクを構築し、特徴の平滑化と雑音抑圧を伴う新しい微調整法を設計する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:10:18 GMT)
BARREL: Boundary-Aware Reasoning for Factual and Reliable LRMs [87.2] 本稿では,簡潔かつ境界認識の事実推論を促進するフレームワークであるBARRELを提案する。
BARRELトレーニングにより,DeepSeek-R1-Distill-Llama-8Bの信頼性は39.33%から61.48%向上した。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:27:34 GMT)
Process Reward Models That Think [86.9] ステップバイステップ検証 - プロセス報酬モデル(PRM)としても知られる - は、テスト時間スケーリングの鍵となる要素である。
この研究は、検証チェーン・オブ・シント(CoT)を生成することにより、ソリューションのすべてのステップを検証する言語化されたステップワイド報酬モデルとして、データ効率の高いPRMを構築することを目的としている。
我々は差別的PRMよりもプロセスラベルを桁違いに少なめに微調整した長いCoT検証器ThinkPRMを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:23:04 GMT)
PMQ-VE: Progressive Multi-Frame Quantization for Video Enhancement [83.9] 多フレームビデオ強調タスクは、ビデオシーケンスの空間的および時間的解像度と品質を改善することを目的としている。
映像強調のためのプログレッシブマルチフレーム量子化(PMQ-VE)を提案する。
このフレームワークは、バックトラックベースマルチフレーム量子化(BMFQ)とプログレッシブマルチ教師蒸留(PMTD)という、粗大な2段階のプロセスを備えている。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:10:40 GMT)
RM-R1: Reward Modeling as Reasoning [81.5] Reasoning Reward Models (ReasRMs) は、報酬モデリングを推論タスクとして定式化する。
我々は推論指向のトレーニングパイプラインを提案し、ReasRMのファミリーであるRM-R1を訓練する。
我々のモデルは、平均して3つの報酬モデルベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:26:32 GMT)
LogicOCR: Do Your Large Multimodal Models Excel at Logical Reasoning on Text-Rich Images? [80.5] テキストリッチな画像上でLMMの論理的推論能力を評価するために設計された1,100の多重選択質問からなるベンチマークであるLogicOCRを紹介する。
我々は、テキストコーパスをマルチモーダルサンプルに変換するスケーラブルで自動化されたパイプラインを開発した。
我々は,Chain-of-Thought (CoT) とダイレクト・アンサー・セッティングの両方で,オープンソースとプロプライエタリなLMMを多岐にわたって評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:39:37 GMT)
Towards Enhanced Image Inpainting: Mitigating Unwanted Object Insertion and Preserving Color Consistency [78.0] ASUKA(Aigned Stable Inpainting with UnKnown Areas)と呼ばれるポストプロセッシングアプローチは、インパインティングモデルを改善する。
Masked Auto-Encoder (MAE) は、オブジェクト幻覚を緩和する。
ローカルタスクとしてラテント・ツー・イメージ・デコーディングを扱う特殊なVAEデコーダ。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:51:22 GMT)
Usable XAI: 10 Strategies Towards Exploiting Explainability in the LLM Era [76.1] XAIは大規模言語モデル(LLM)の説明に向けて拡張されている
本稿では、XAIがLLMベースのAIシステムをどのように説明し、改善するかを分析する。
10の戦略を導入し、それぞれに重要なテクニックを導入し、関連する課題について議論します。
論文参考訳(メタデータ) (Sun, 18 May 2025 23:56:15 GMT)
MOOSE-Chem: Large Language Models for Rediscovering Unseen Chemistry Scientific Hypotheses [72.4] 大規模言語モデル(LLM)が化学において新規で有効な仮説を自律的に生成できるかどうかは不明である。
我々は、2024年1月以降に発行され、オンライン化された51のハイインパクト化学論文のベンチマークを開発し、それぞれが背景、インスピレーション、仮説を手動で注釈付けした。
LLMは、人間によってまだ認識されていない、潜伏した科学的知識の関連をすでにコード化していると仮定する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:23:30 GMT)
Irregular Tensor Low-Rank Representation for Hyperspectral Image Representation [71.7] スペクトル変動は、ハイパースペクトル画像(HSI)解析において共通の課題となる
低ランクテンソル表現は、HSIデータに固有の相関を利用して、堅牢な戦略として登場した。
本研究では,不規則な3次元立方体を効率的にモデル化するために,不規則なテンソルローランク表現のための新しいモデルを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:46:59 GMT)
HBO: Hierarchical Balancing Optimization for Fine-Tuning Large Language Models [71.1] 多様なデータセット上の微調整された大きな言語モデルは、データの不均衡と不均一性による課題を引き起こす。
本稿では,LLMがデータアロケーションを自律的に調整できる新しい手法である階層的バランシング最適化(HBO)を紹介する。
我々は,多言語およびマルチタスク設定において,9つのタスクにまたがる3つのLLMバックボーン上でHBOを評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:31:44 GMT)
ExpertSteer: Intervening in LLMs through Expert Knowledge [71.1] アクティベーションステアリングは、大規模言語モデルの生成プロセスを制御するための有望な方法を提供する。
本稿では、任意の専門的モデルを用いてステアリングベクトルを生成する新しいアプローチであるExpertSteerを提案する。
3つのLSMを4つの異なる領域にわたる15の人気のあるベンチマークで包括的な実験を行う。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:55:46 GMT)
NOFT: Test-Time Noise Finetune via Information Bottleneck for Highly Correlated Asset Creation [71.0] 拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)を生成する強力なツールを提供する。
本研究では,高相関・多彩な画像を生成するため,安定拡散を用いたノイズファインチューンNOFTモジュールを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:09:47 GMT)
The Mirage of Model Editing: Revisiting Evaluation in the Wild [70.2] 質問応答アプリケーションにおけるモデル編集の有効性について検討する。
単一の編集実験により、現在行われている編集手法は、以前報告したよりも大幅に悪化していることが示された。
本分析は,既存のモデル編集手法の現実的適用性と評価手法の両面について,基礎的な再検討を行うものである。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:55:02 GMT)
Emergent Active Perception and Dexterity of Simulated Humanoids from Visual Reinforcement Learning [69.7] 本稿では,擬似ヒューマノイドを用いた視覚駆動全身制御フレームワークであるPerceptive Dexterous Control (PDC)を紹介する。
PDCは、タスク仕様のためのエゴセントリックなビジョンのみを運用し、ビジュアルキューによるオブジェクト検索、ターゲット配置、スキル選択を可能にする。
強化学習によるスクラッチからのトレーニングは,能動探索などの創発的な行動を引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:33:31 GMT)
LAMeTA: Intent-Aware Agentic Network Optimization via a Large AI Model-Empowered Two-Stage Approach [68.2] 本稿では,大規模AIモデル(LAM)を用いたエージェントネットワーク最適化のための2段階アプローチであるLAMeTAを提案する。
まず,インテント指向の知識蒸留(IoKD)を提案する。
第2に、E-LAMをポリシーベースのDRLフレームワークに統合した共生強化学習(SRL)を開発する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:59:16 GMT)
Automated Profile Inference with Language Model Agents [67.3] 自動プロファイル推論(Automatic Profile Inference)と呼ばれる,LLMがオンラインの偽名にもたらす新たな脅威について検討する。
相手は、LDMに対して、疑似プラットフォーム上で公開されているユーザアクティビティから、機密性の高い個人属性を自動的に取り除き、抽出するように指示することができる。
実世界のシナリオにおけるこのような脅威の可能性を評価するために,AutoProfilerという自動プロファイリングフレームワークを導入する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:05:17 GMT)
Extracting memorized pieces of (copyrighted) books from open-weight language models [67.1] 我々は,敵対的MLと著作権法が記憶と著作権の関係を単純化していることを示す。
異なる大規模言語モデルから少なくともいくつかの書籍のかなりの部分を抽出することは可能であることを示す。
我々は、我々の結果が著作権訴訟に重大な影響を及ぼす理由について議論する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:06:32 GMT)
mCLM: A Function-Infused and Synthesis-Friendly Modular Chemical Language Model [65.7] 分子をビルディングブロックにトークン化するモジュール型ケミカルランゲージモデルであるmCLMを提案し,関数と分子ビルディングブロックの両方の自然言語記述のバイリンガル言語モデルを学習する。
FDAが承認した430種類の薬物の実験では、mCLMは薬物のポテンシャルを決定するのに不可欠な6つの化学機能のうち5つを著しく改善できることがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:52:39 GMT)
OR-Bench: An Over-Refusal Benchmark for Large Language Models [65.3] 大きな言語モデル(LLM)は、悪意のある出力を防ぐために慎重に安全アライメントを必要とする。
本研究では,大規模なオーバーリファレンスデータセットの自動生成手法を提案する。
OR-Benchは,最初の大規模オーバーリファレンスベンチマークである。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:28:21 GMT)
MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges? [64.6] MLRC-Benchは、機械学習(ML)リサーチコンペティションの挑戦において、言語エージェントがいかに効果的に対処できるかを定量化するために設計されたベンチマークである。
MLRC-Benchは以前の研究とは異なり、新しい研究手法を提案し、実装する上で重要なステップを計測する。
最も優れた試験薬でさえ、ベースラインとトップヒューマンのスコアの差の9.3%しか閉じていない。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:31:28 GMT)
DynamiCtrl: Rethinking the Basic Structure and the Role of Text for High-quality Human Image Animation [63.8] ビデオDiTアーキテクチャにおける人間のアニメーションのための新しいフレームワークであるDynamiCtrlを提案する。
我々は、人間の画像や運転ポーズに共有のVAEエンコーダを使用し、それらを共通の潜在空間に統一する。
また、グローバルな意味的コンテキストを提供するために、テキスト埋め込みの役割を保ちながら、"Joint-text"パラダイムも導入する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:24:19 GMT)
Selftok: Discrete Visual Tokens of Autoregression, by Diffusion, and for Reasoning [62.4] 自己整合性トークン化装置(Selftok)について紹介する。
設計コアでは、画像生成の逆拡散過程を用いて、自己回帰(AR)を視覚トークンに先立って構成する。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:15:48 GMT)
Bridge the Modality and Capability Gaps in Vision-Language Model Selection [62.3] 視覚言語モデル(VLM)は、画像とテキストのカテゴリ名とのペアリングによるゼロショット画像分類において優れている。
VLMリソースをより再利用するために、VLM Zooから適切な事前学習VLMを選択するという有望な戦略が提案されている。
本稿では,この言語のみのVLM選択において,VLMの能力を評価する上での2つの課題について分析する。
本稿では,2つのギャップの負の影響を軽減するために,gApブリッジを用いたVLM選択を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:13:47 GMT)
Bootstraping Clustering of Gaussians for View-consistent 3D Scene Understanding [59.5] FreeGSは、教師なしセマンティック組み込み3DGSフレームワークで、2Dラベルを必要とせずに、ビュー一貫性のある3Dシーン理解を実現する。
FreeGSは複雑なデータ前処理のワークロードを避けながら、最先端のメソッドと互換性がある。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:06:28 GMT)
Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.9] 航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:21:01 GMT)
SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization [57.7] 大規模言語モデル(LLM)は、入力プロンプト(クエスト)にまたがる様々なレベルの信頼を示す。
セマンティックエントロピー(Semantic entropy)は、プロンプトが与えられた複数の生成された回答における意味の多様性を測定し、ポリシー更新の規模を変調するためにこれを使用する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:20:59 GMT)
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [57.1] 機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。
PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。
次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:38:09 GMT)
Reasoning by Superposition: A Theoretical Perspective on Chain of Continuous Thought [56.7] 連続CoTのD$ステップを持つ2層トランスが有向グラフ到達可能性問題を解くことができることを証明した。
我々の構成では、各連続思考ベクトルは複数の探索フロンティアを同時に符号化する重ね合わせ状態である。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:36:53 GMT)
LLaVA-4D: Embedding SpatioTemporal Prompt into LMMs for 4D Scene Understanding [55.8] 視覚的4Dシーン理解のための時間的プロンプトを備えた汎用LMMフレームワークを提案する。
このプロンプトは、3D位置と1D時間を動的に認識された4D座標埋め込みに符号化することで生成される。
4次元シーン理解において,異なるタスクにまたがる手法の有効性を実証するために実験を行った。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:18:57 GMT)
PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.6] PseudoNeg-MAEは、ポイントクラウドマスマスキングオートエンコーダのグローバルな特徴表現を強化する。
本研究では,ネットワークが識別的表現を保ちながら,よりリッチな変換キューをキャプチャできる新たな損失を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:27:17 GMT)
DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization [55.1] グループ相対政策最適化は大規模推論モデル(LRM)の強化学習手法である
本研究では,2次報酬設定の下でGRPOの目的を解析し,質問レベルの難易度バイアスの固有の制限を明らかにする。
差別学習の原則を基礎として, LRMの強化のための新たな差別的制約付き最適化フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:08:32 GMT)
Leveraging Robust Optimization for LLM Alignment under Distribution Shifts [53.0] 人間の値に整合した出力を生成するために、大規模言語モデルを操る上で、優先順位アライメント手法はますます重要になっている。
このようなシフトに拘わらず、好みのアライメントを改善する新しい分布対応最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:14:19 GMT)
Scaling Embedding Layers in Language Models [52.5] SCONEは入力埋め込み層を拡張し、言語モデルの性能を向上させる新しい方法である。
埋め込みは各入力トークンに対してコンテキスト化された表現を提供し、トレーニング中に別のモデルで学習する。
SCONEは2つの新しいスケーリング戦略を実現する。$n$-gramの埋め込み数を増やし、それらを学ぶために使用するモデルをスケーリングする。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:25:32 GMT)
Robust Planning for Autonomous Driving via Mixed Adversarial Diffusion Predictions [51.9] 本稿では、通常と逆のエージェント予測を混合した自律運転のロバストな計画手法について述べる。
本研究では,実験時の拡散モデルに偏りを生じさせ,候補計画と衝突する可能性のある予測を生成することにより,逆予測の分布を生成する。
本手法が単エージェントおよび多エージェントジェイウォーキングシナリオおよび赤信号違反シナリオに与える影響について述べる。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:44:57 GMT)
Greedy Algorithm for Structured Bandits: A Sharp Characterization of Asymptotic Success / Failure [51.5] 我々は,既知報酬構造を持つバンドイット問題における欲求(探索のみ)アルゴリズムについて検討する。
我々の特徴は、任意のフィードバックで文脈的な帯域幅と対話的な意思決定にまで及ぶ。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:36:56 GMT)
BrainOmni: A Brain Foundation Model for Unified EEG and MEG Signals [50.8] 異種脳波とMEG記録を対象とする脳基礎モデルBrain Omniを提案する。
多様なデータソースを統一するために、脳の活動を離散表現に定量化する最初のトークンであるBrainTokenizerを紹介します。
EEGの合計1,997時間、MEGデータの656時間は、事前トレーニングのために公開されているソースからキュレーションされ、標準化されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:07:14 GMT)
Fully Geometric Multi-Hop Reasoning on Knowledge Graphs with Transitive Relations [50.1] マルチホップ推論のための幾何学的埋め込み手法GeometrEを紹介する。
論理演算を学習する必要はなく、完全に幾何学的解釈可能である。
実験の結果,GeometrEは標準ベンチマークデータセットの最先端手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:17:50 GMT)
DIMM: Decoupled Multi-hierarchy Kalman Filter for 3D Object Tracking [50.0] 状態推定は、高い操作性を持つ3次元物体追跡において困難である。
本稿では,各方向の異なる動きモデルから推定される推定を効果的に組み合わせる新しいフレームワークであるDIMMを提案する。
DIMMは既存の状態推定手法のトラッキング精度を31.61%99.23%向上させる。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:12:41 GMT)
A Survey on Side Information-driven Session-based Recommendation: From a Data-centric Perspective [49.7] セッションベースのレコメンデーションは、匿名ユーザの意図を予測する実践的な価値のために、注目を集めている。
サイド情報駆動セッションベースの推奨の中核は、多様なデータの発見と利用である。
本調査では,データ中心の観点から,この課題を包括的に概観する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:36:43 GMT)
REArtGS: Reconstructing and Generating Articulated Objects via 3D Gaussian Splatting with Geometric and Motion Constraints [48.8] REArtGSは、幾何学的および運動的制約を3Dガウスプリミティブに導入する新しいフレームワークである。
我々は,3次元ガウス多様体の変形可能場を定式化対象の運動構造に拘束し,未知の状態における表面メッシュの教師なし生成を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:50:03 GMT)
Hyperbolic Residual Quantization: Discrete Representations for Data with Latent Hierarchies [48.7] 残留量子化(Residual Quantization, RQ)は階層データに対する離散的マルチトークン表現を生成するために広く用いられている。
本稿では,双曲多様体にデータを埋め込むハイパーボリック残留量子化(HRQ)を提案する。
HRQは、自然に階層的な分岐と整合する帰納的バイアスを与える。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:14:07 GMT)
Bidirectional LMs are Better Knowledge Memorizers? A Benchmark for Real-world Knowledge Injection [48.2] 人間の介入を必要とせず、時間とともに継続的に進化する新しい、現実的で大規模な知識注入ベンチマークを導入する。
WikiDYKはウィキペディアの「Did You Know...」エントリから最近追加された人文的な事実を活用する。
WikiDYKには12,290の事実と77,180の質問が含まれている。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:39:05 GMT)
Right Question is Already Half the Answer: Fully Unsupervised LLM Reasoning Incentivization [47.0] 我々の能力は、数学的および自由形式の自然推論のタスクにおいて、教師付きと競合する性能を達成します。
教師付き信号がなければ、Qwen2.5-Math-7B Baseの精度は30.7%から48.1%に向上する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:41:33 GMT)
Towards Reliable and Interpretable Traffic Crash Pattern Prediction and Safety Interventions Using Customized Large Language Models [46.8] TrafficSafeは、テキストレベルの推論として、再フレームのクラッシュ予測と機能属性に適応するフレームワークである。
飲酒運転が深刻な事故の要因となっている。
TrafficSafeは、戦略的クラッシュデータ収集の改善を導くモデルトレーニングにおいて、重要な機能を強調している。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:02:30 GMT)
SGDPO: Self-Guided Direct Preference Optimization for Language Model Alignment [46.6] 本稿では,最適化過程における勾配流の制御にパイロット項を組み込んだ自己ガイド型直接選好最適化アルゴリズム,すなわちSGDPOを提案する。
本稿では,提案手法の詳細な理論的解析を行い,その動作機構を解明する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:19:23 GMT)
LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations [46.4] 大規模言語モデル(LLM)は、事実の不正確さやバイアス、推論失敗など、しばしばエラーを発生させる。
近年の研究では、LLMの内部状態が出力の真偽に関する情報を符号化していることが示されている。
LLMの内部表現は、これまで認識されていた以上の真理性に関する情報を符号化している。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:18:56 GMT)
Teach2Eval: An Indirect Evaluation Method for LLM by Judging How It Teaches [46.0] Feynman Techniqueにインスパイアされた間接評価フレームワークであるTeach2Evalを紹介する。
本手法は、より弱い学生モデルにタスクを効果的に実行させるためのモデルの複数の能力を評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:51:10 GMT)
AFCL: Analytic Federated Continual Learning for Spatio-Temporal Invariance of Non-IID Data [45.7] Federated Continual Learning (FCL)は、分散クライアントがオンラインタスクストリームからグローバルモデルを協調的にトレーニングすることを可能にする。
FCL法は,分散クライアント間の空間的データ不均一性とオンラインタスク間の時間的データ不均一性の両方の課題に直面している。
凍結抽出特徴量から解析的解(すなわち閉形式)を導出することにより,解析的フェデレート連続学習(AFCL)と呼ばれる勾配のない手法を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:55:09 GMT)
ATE-SG: Alternate Through the Epochs Stochastic Gradient for Multi-Task Neural Networks [45.0] 本稿では,ハードパラメータ共有マルチタスクニューラルネットワーク(MTNN)のための新しい代替トレーニング手法を提案する。
提案した代替トレーニング手法では,タスク固有の重みをエポックを通じて交互に更新し,モデルのマルチヘッドアーキテクチャを活用する。
実証実験では、訓練の正規化と計算要求の削減が実証された。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:24:23 GMT)
Linear combinations of latents in generative models: subspaces and beyond [44.7] 本稿では,LOL(Latent Optimal Linear combinations)を提案する。
LOLは実装が容易で、線形結合を形成するというより広いタスクに自然に対処します。
これは、高次元オブジェクトの表現的低次元表現の作成を劇的に単純化する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:23:45 GMT)
Going Beyond Feature Similarity: Effective Dataset Distillation based on Class-Aware Conditional Mutual Information [43.4] 本稿では,データセットのクラス認識複雑性を評価するために,条件付き相互情報(CMI)を導入する。
合成データセットのクラス認識複雑性を制約しながら,蒸留損失を最小限に抑える。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:58:24 GMT)
AdAEM: An Adaptively and Automated Extensible Measurement of LLMs' Value Difference [43.2] AdAEMは、LSMの傾きを明らかにするための、新しい、自己拡張可能なアセスメントフレームワークである。
テストの質問を自動的に、適応的に生成し、拡張することができます。
シュワルツ値理論に基づく12,310の質問を生成し,提案手法の有効性と有効性を示す分析を行い,16 LLMの値をベンチマークする。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:15:26 GMT)
UFO-RL: Uncertainty-Focused Optimization for Efficient Reinforcement Learning Data Selection [42.9] 単一パス不確実性推定は、インフォメーションデータインスタンスを識別するために使用され、最大185倍高速なデータ評価を実現する。
UFO-RLによって選択されたデータのわずか10%のトレーニングは、完全なデータトレーニングに匹敵するか、それ以上のパフォーマンスをもたらす。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:14:58 GMT)
Never Skip a Batch: Continuous Training of Temporal GNNs via Adaptive Pseudo-Supervision [41.5] History-Averaged Labels (HAL) は、履歴ラベル分布から派生した擬似ターゲットによるトレーニングバッチを動的に強化する手法である。
HALはTGNv2のトレーニングを最大15倍加速し、競争性能を維持している。
この研究は、時間グラフ学習における空間性を示す効率的な、軽量で、アーキテクチャに依存しない、理論的に動機づけられたソリューションを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:30:33 GMT)
DUET: Optimizing Training Data Mixtures via Feedback from Unseen Evaluation Tasks [40.9] 本稿では, ベイズ最適化を用いたデータ選択手法として, 影響関数をインターリーブし, 特定の未確認評価タスクからのフィードバックによるデータ混合を最適化する, グローバル・ローカルなアルゴリズムを提案する。
DUETの累積的後悔を解析することにより、DUETはタスクに関するデータ知識がなくても、見えないタスクに対して最適なトレーニングデータ混合に収束することを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:39:08 GMT)
Data Whisperer: Efficient Data Selection for Task-Specific LLM Fine-Tuning via Few-Shot In-Context Learning [40.2] タスク固有のデータに対する細調整された大規模言語モデル(LLM)は、その効果的なデプロイメントには不可欠である。
データウィスペラ (Data Whisperer) は,数発のインコンテクスト学習とモデルによる微調整を併用した,効率的でトレーニング不要なアテンションベースの手法である。
Data Whispererは、Llama-3-8B-インストラクトモデルの完全なGSM8Kデータセットよりも優れたパフォーマンスを実現し、データの10%しか使用せず、既存のメソッドよりも3.1ポイントの改善と7.4$times$スピードアップを実現している。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:10:00 GMT)
Mutual Evidential Deep Learning for Medical Image Segmentation [39.9] 半教師付き学習において擬似ラベル生成のための潜在的に有効なソリューションを提供する相互顕在的深層学習フレームワークを提案する。
本稿では,5つの主流データセットを用いた実験において,MEDLが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:42:27 GMT)
Watermarking Language Models with Error Correcting Codes [39.8] 本稿では,エラー訂正コードを通じてこのような信号を符号化する透かしフレームワークを提案する。
本手法は,ロバストバイナリコード (RBC) の透かしと呼ばれ,品質の顕著な劣化を生じさせない。
私たちの経験的発見は、私たちの透かしは速く、強力で、堅牢であり、最先端のものと好意的に比較していることを示唆しています。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:31:35 GMT)
Rebalancing Contrastive Alignment with Learnable Semantic Gaps in Text-Video Retrieval [39.7] Gap-Aware Retrievalフレームワークは、テキストt_iとビデオv_jの間で学習可能な、ペア固有のインクリメントDelta_ijを導入している。
GAREは、アライメントの正確さと頑健さをノイズ管理に継続的に改善する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:18:06 GMT)
Towards shutdownable agents via stochastic choice [39.6] グリッドワールドをナビゲートするための単純なエージェントを訓練するために、DReST報酬関数を使用します。
これらのエージェントは、USEFULとNEUTRALで学ぶことができる。
我々の理論的研究は、これらのエージェントが有用でシャットダウン可能であることを示唆している。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:46:20 GMT)
Efficient Implementation of Gaussian Process Regression Accelerated Saddle Point Searches with Application to Molecular Reactions [39.6] 本稿では,最小モード追従法のガウス過程回帰加速度の効率的な実装について述べる。
鞍点配置に到達するために必要な電子構造計算の桁数を求める。
C++におけるGPRサロゲートモデルの実装は、サドル点探索のウォールタイムを4つのケースのうち3つに抑えるのに十分な効率である。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:42:55 GMT)
ACU: Analytic Continual Unlearning for Efficient and Exact Forgetting with Privacy Preservation [39.1] 連続的アンラーニング(CU)は、連続的学習フェーズで取得した特定の知識を逐次忘れることを目的としている。
既存の未学習メソッドの多くは、再トレーニングや微調整のために保持されたデータセットにアクセスする必要がある。
本稿では,ACU (Analytic Continual Unlearning) と呼ばれるCUの勾配のない新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:28:18 GMT)
Demystifying Language Model Forgetting with Low-rank Example Associations [38.9] 大規模言語モデル(LLM)は、微調整時に上流の知識を忘れることに悩まされる。
我々は、言語モデリングや微調整後の命令チューニングの上流の例で発生する忘れを実証的に分析する。
微調整時のリプレイ例の重み付けにより, 統計的に忘れを有意に減らした。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:35:45 GMT)
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models [38.8] ディープ圧縮オートエンコーダ (DC-AE) は高分解能拡散モデルの高速化を目的とした新しいオートエンコーダモデルである。
遅延拡散モデルへの直流-AEの適用により,精度低下のない大幅な高速化を実現した。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:17:22 GMT)
Reward Inside the Model: A Lightweight Hidden-State Reward Model for LLM's Best-of-N sampling [37.9] 大規模言語モデル(LLM)の推論能力を解き放つためには,高品質な報酬モデルが不可欠である
現在の報酬モデルは、通常 LLM のテキスト出力で動作するが、計算コストが高く、パラメータが重いため、現実の応用は制限されている。
我々は,LLM隠れ状態に埋め込まれたリッチな情報を活用してこれらの問題に対処する,効率的な線形隠れ状態後退(ELHSR)モデルを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:00:35 GMT)
Dynamic Fusion Strategies for Federated Multimodal Recommendations [37.5] We propose FedMR, a novel multimodal FedRec framework based on the Mixing Feature Fusion Module (MFFM)。
1)サーバサイドの集中型マルチメディアコンテンツ処理は、事前訓練されたモデルを使用してリッチで共有されたアイテムコンテキストを提供する。
MFFMは、クライアント固有のインタラクションパターンに基づいて、これらのサーバが提供するマルチモーダル表現を動的に適応し、効果的にレコメンデーションを調整し、異なるモダリティに対してユーザの嗜好の不均一性を解消する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:26:48 GMT)
Deep Reinforcement Learning for Wireless Scheduling in Distributed Networked Control [37.1] 完全分散無線制御システム(WNCS)の周波数チャネル数に制限のある結合アップリンクとダウンリンクのスケジューリング問題を考える。
深層強化学習(DRL)に基づくフレームワークを開発した。
DRLにおける大きなアクション空間の課題に対処するために,新しいアクション空間削減法とアクション埋め込み法を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:51:58 GMT)
The ICML 2023 Ranking Experiment: Examining Author Self-Assessment in ML/AI Peer Review [36.7] 著者が提供するランキングは、機械学習カンファレンスでのピアレビュープロセスを改善するために利用することができる。
著者が提示したランキングを用いて生のレビュースコアを校正するイソトニックメカニズムに注目した。
本稿では,アイソトニック機構の慎重かつリスクの低いいくつかの応用と著者が提案する格付けをピアレビューで提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:26:12 GMT)
Disambiguation in Conversational Question Answering in the Era of LLM: A Survey [36.4] 自然言語処理(NLP)におけるあいまいさは依然として根本的な課題である
LLM(Large Language Models)の出現により、あいまいさに対処することがさらに重要になった。
本稿では,言語駆動システムにおけるあいまいさの定義,形態,含意について考察する。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:53:41 GMT)
Not All Documents Are What You Need for Extracting Instruction Tuning Data [35.5] 本研究では,多種多様な知識を含む Web コーパスから指導用チューニングデータを抽出する手法を提案する。
単純な解決策は、ドメイン固有のドキュメントを取得して、それらからすべてのQAペアを抽出することだが、これは2つの重要な課題に直面している。
EQUALは、文書の選択と高品質なQAペア抽出を交互に行う、効率的でスケーラブルなデータ抽出フレームワークである。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:10:08 GMT)
Guiding Diffusion with Deep Geometric Moments: Balancing Fidelity and Variation [35.4] 本稿では,Deep Geometric Moments (DGM) を,学習前の幾何学的特徴とニュアンスをカプセル化した新しいガイダンスとして紹介する。
実験により,DGMは拡散画像生成における制御と多様性のバランスを効果的に保ち,拡散過程を制御するための柔軟な制御機構を実現できることが示された。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:19:27 GMT)
Enhancing User-Oriented Proactivity in Open-Domain Dialogues with Critic Guidance [35.2] オープンドメイン対話システムは自然な会話を生み出すことを目的としている。
既存の大きな言語モデル(LLM)は、ユーザのチャットの好みを積極的に理解できない。
ユーザ指向のプロアクティブ性を高めるために,ユーザ指向プロアクティブ(UPC)を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:59:22 GMT)
Enhance Mobile Agents Thinking Process Via Iterative Preference Learning [34.8] The Chain of Action-Planning Thoughts (CoaT) paradigm has been shown to improve the reasoning performance of VLM-based mobile agent in GUI task。
対話型サンプリングによりCoaTツリーを構築し,ルールベース報酬を用いて葉ノードをスコアし,フィードバックをバックプロパゲートして思考レベル直接選好最適化(T-DPO)のペアを導出する反復選好学習(IPL)を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:28:05 GMT)
SLOT: Sample-specific Language Model Optimization at Test-time [34.8] 大規模言語モデル(LLM)は複雑な命令に苦しむことが多く、一般的なサンプルではよく表現されないものの性能が劣る。
SLOTは,言語モデルが個々のプロンプトにより正確に応答する能力を高める新しい,パラメータ効率の高いテスト時間推論手法である。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:37:56 GMT)
LLM-DSE: Searching Accelerator Parameters with LLM Agents [34.8] LLM-DSEは、HLSディレクティブの最適化に特化したマルチエージェントフレームワークである。
我々の探検家は、ルーター、スペシャリスト、アビテーター、批評家の4人のエージェントを調整します。
LLM-DSEは最先端の手法よりも2.55倍の性能向上を実現している。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:31:42 GMT)
SSR: Enhancing Depth Perception in Vision-Language Models via Rationale-Guided Spatial Reasoning [34.3] 本稿では,生深度データを構造化・解釈可能なテキスト論理に変換する新しいフレームワークを提案する。
これらのテキストの有理は、空間的推論能力を著しく向上させる意味のある中間表現として機能する。
中間空間推論アノテーションを付加した100万スケールの視覚言語推論データセットであるSSR-CoTを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:40:16 GMT)
IP Leakage Attacks Targeting LLM-Based Multi-Agent Systems [34.2] マルチエージェントシステム(MAS)から機密情報を抽出する新しい攻撃フレームワークMASLEAKを紹介する。
MASLEAKは実用的でブラックボックスの設定を目標としており、敵はMASアーキテクチャやエージェント設定について事前の知識を持っていない。
810個のアプリケーションを用いたMASアプリケーションの最初の合成データセットを構築し、CozeやCrewAIを含む実世界のMASアプリケーションに対してMASLEAKを評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:31:45 GMT)
AltLoRA: Towards Better Gradient Approximation in Low-Rank Adaptation with Alternating Projections [33.9] Low-Rank Adaptation (LoRA) は、微調整された大規模言語モデルにおいて、メモリオーバーヘッドを低減する効果的な手法として登場した。
低ランク空間で更新が制限されているため、完全な微調整に比べて、しばしば準最適パフォーマンスに悩まされる。
共同更新設計による勾配近似の難しさを回避するための交互投影法AltLoRAを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:10:38 GMT)
SEPT: Standard-Definition Map Enhanced Scene Perception and Topology Reasoning for Autonomous Driving [33.6] 標準定義(SD)マップ拡張知覚とトポロジー推論フレームワークを提案する。
我々のフレームワークはシーン認識とトポロジ推論の両方を著しく改善し、既存の手法よりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:57:31 GMT)
`Do as I say not as I do': A Semi-Automated Approach for Jailbreak Prompt Attack against Multimodal LLMs [33.5] マルチモーダル大言語モデル(LLM)に対する最初の音声ベースのジェイルブレイク攻撃を導入する。
本稿では,不許可なプロンプトを,良心的かつ物語駆動的なプロンプトによって側面に配置する,新たな戦略を提案する。
我々は、Flanking Attackは最先端のLLMを操作でき、不整合および禁止された出力を生成することを実証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:29:41 GMT)
PHYBench: Holistic Evaluation of Physical Perception and Reasoning in Large Language Models [33.5] PHYBenchは、高校から物理オリンピックの難易度まで、500の物理問題のベンチマークである。
PHYBenchはオリジナルのコンテンツを通じてデータの汚染に対処し、欠陥のあるアイテムを除去するために体系的なキュレーションパイプラインを使用する。
PHYBenchはより多くのトークンを活性化し、推論モデル間のより強力な微分を提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:13:34 GMT)
ImageRAG: Enhancing Ultra High Resolution Remote Sensing Imagery Analysis with ImageRAG [33.2] ImageRAGは、UHRリモートセンシング画像の解析の複雑さに対処する、トレーニング不要のフレームワークである。
ImageRAGのコアイノベーションは、UHRイメージの最も関連性の高い部分を視覚的コンテキストとして選択的に検索し、焦点を合わせる能力にある。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:58:52 GMT)
VideoRFT: Incentivizing Video Reasoning Capability in MLLMs via Reinforced Fine-Tuning [33.2] VIDEORFTは、MLLMで人間のようなビデオ推論能力を育むための新しいアプローチである。
RFTの標準的な2段階のスキームに従う: チェーン・オブ・シント(CoT)アノテーションによる微調整(SFT)と、一般化を改善するための強化学習(RL)である。
6つのビデオ推論ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:14:35 GMT)
Sentience Quest: Towards Embodied, Emotionally Adaptive, Self-Evolving, Ethically Aligned Artificial General Intelligence [32.7] Sentience Questは、より有能な汎用人工知能のライフフォームを開発するためのオープンリサーチイニシアチブである。
私たちのビジョンは、認知科学と神経科学のアイデアを、ベアーズのグローバルワークスペース理論とダマシオのソマティックマインドから構築しています。
本稿では,世界規模のストーリーウィーバーに生存,社交,好奇心を含む本質的なドライブを統合するアプローチについて述べる。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:26:49 GMT)
Efficient Reinforcement Learning by Guiding Generalist World Models with Non-Curated Data [32.7] オフラインデータの活用は、オンライン強化学習(RL)のサンプル効率を向上させるための有望な方法である
本稿では、報酬のない、混合品質の豊富な非キュレートデータを利用して、オフラインからオフラインへのRLのための使用可能なデータのプールを拡張し、複数の実施形態にまたがって収集する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:26:23 GMT)
NeuroGen: Neural Network Parameter Generation via Large Language Models [32.2] ニューラルネットワーク(NN)のパラメータを取得することは、機械学習における最も重要な問題のひとつだ。
本稿では,大規模言語モデル生成によるNNパラメータの獲得という,新たな方向性の実現可能性について検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:48:10 GMT)
Can RLHF be More Efficient with Imperfect Reward Models? A Policy Coverage Perspective [32.0] 本稿では,オンラインRLHFにおける不完全な報酬モデルから知識を伝達する方法を検討する。
本稿では,新しい伝達学習原理と理論的アルゴリズムを提案する。
我々は、計算効率を向上したウィンレートベースの転送ポリシー選択戦略を開発する。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:49:16 GMT)
Refinement Module based on Parse Graph of Feature Map for Human Pose Estimation [31.6] 機能マップのParse Graph(RMPG)に基づいたRefinement Moduleを開発し、トップダウン分解とボトムアップの組み合わせの2段階を含む。
我々のネットワークは、複数の主流人のポーズデータセットにおいて優れた結果が得られ、RMPGの有効性は異なる手法で証明される。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:06:27 GMT)
MARGE: Improving Math Reasoning for LLMs with Guided Exploration [31.3] 大規模言語モデル(LLM)は、数学的推論において強い可能性を示すが、その有効性は高品質なクエリの不足によって制限されることが多い。
textbfMath textbfReasoning with textbfGuided textbfExploration。
MARGEは、自己生成ソリューションに由来する中間的推論状態を体系的に探索し、適切な探索と信用割当の改善を可能にする。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:24:16 GMT)
Towards DS-NER: Unveiling and Addressing Latent Noise in Distant Annotations [31.2] 本研究では,DS-NERの有効性とロバスト性について,(1)遠隔アノテーション技術と革新的大言語モデル監視アプローチ,(2)雑音評価の2つの側面から検討する。
提案手法は,3つの異なるデータソースから得られた8つの実世界の遠隔監視データセットに対して,大幅な改善を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:10:04 GMT)
LightRetriever: A LLM-based Hybrid Retrieval Architecture with 1000x Faster Query Inference [31.0] 大規模言語モデル(LLM)に基づくハイブリッド検索では、LLMを用いてクエリやドキュメントを低次元の密度あるいは高次元のスパースベクトルにエンコードする。
超軽量なクエリエンコーダを備えたLLMベースのハイブリッドレトリバーであるLightRetrieverを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:51:21 GMT)
Shallow Flow Matching for Coarse-to-Fine Text-to-Speech Synthesis [31.0] フローマッチング(FM)ベースのテキスト音声合成(TTS)モデルを強化するための浅いフローマッチング(SFM)機構。
実験の結果,SFMは主観的評価と主観的評価の両方において,合成音声の自然な性質を一貫して改善することがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:15:08 GMT)
Beyond Frameworks: Unpacking Collaboration Strategies in Multi-Agent Systems [29.9] 本研究では,協力戦略の4つの側面を体系的に検討する。
我々はこれらの戦略がタスク精度と計算効率の両方に与える影響を定量化する。
この研究は適応的でスケーラブルなマルチエージェントシステムを設計するための基盤を確立する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:46:14 GMT)
Trustworthy Image Super-Resolution via Generative Pseudoinverse [29.7] 本稿では,従来の密度よりも制約付き最適化という形で,信頼性の高い画像復元の問題を考察する。
劣化過程を反映した画像超解像処理のための生成モデルを開発した。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:37:55 GMT)
DPCD: A Quality Assessment Database for Dynamic Point Clouds [29.5] DPCDと呼ばれる大規模DPCQAデータベースを導入し、7種類の損失圧縮とノイズ歪みから15個の参照DPCと歪んだDPCを含む。
主観的な実験を行い、21人の視聴者から平均オピニオンスコア(MOS)を取得して分析する。
実験の結果,DPCQAは静的点クラウドよりも難易度が高いことがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:03:21 GMT)
RICo: Refined In-Context Contribution for Automatic Instruction-Tuning Data Selection [29.5] 本研究では,タスクレベルとグローバルレベルの両方のモデル性能に対して,個々のサンプルの微細な寄与を定量化する勾配のない手法を提案する。
我々は、RICoスコアに基づいて訓練された軽量な選択パラダイムを導入し、厳密な線形推論の複雑さでスケーラブルなデータ選択を可能にする。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:24:09 GMT)
LM$^2$otifs : An Explainable Framework for Machine-Generated Texts Detection [29.3] 本稿では,MGT検出のための新しいフレームワークLM$2$otifsを提案する。
確率的グラフィカルモデルにインスパイアされた我々は、その効果の理論的根拠を提供する。
LM$2$otifsは、eXplainable Graph Neural Networksを使用して、正確な検出と解釈の両方を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:55:45 GMT)
LLM-Based User Simulation for Low-Knowledge Shilling Attacks on Recommender Systems [28.6] 我々は,Large Language Model(LLM)ベースのエージェントを利用して,低知識かつ高インパクトなシリング攻撃を行う新しいフレームワークであるAgent4SRを紹介する。
Agent4SRは、対向的なインタラクションを編成し、アイテムを選択し、評価を割り当て、レビューを作成し、行動の妥当性を維持しながら、現実的なユーザ動作をシミュレートする。
以上の結果から,レコメンデーションシステムにおける防衛強化の必要性を浮き彫りにして,LSMを駆使したエージェントによる新たな緊急脅威の出現が示唆された。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:40:34 GMT)
Cognitive Disentanglement for Referring Multi-Object Tracking [28.3] 本稿では,CDRMT(Cognitive Disentanglement for Referring Multi-Object Tracking)フレームワークを提案する。
CDRMTは人間の視覚処理システムからRMOTタスクへの"What"と"where"の経路を適応させる。
異なるベンチマークデータセットの実験では、CDRMTが最先端のメソッドよりも大幅に改善されていることが示されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:21:58 GMT)
Enhancing Visual Grounding for GUI Agents via Self-Evolutionary Reinforcement Learning [28.3] 本稿では,GUIエージェントの性能向上のための3つのコア戦略を組み込んだ強化学習(RL)フレームワークを提案する。
3kのトレーニングサンプルだけで、我々の7B-パラメーターモデルも同様の大きさのモデルで最先端の結果が得られる。
特に、ScreenSpot-Proデータセットで47.3%の精度を実現し、UI-TARS-72Bのようなはるかに大きなモデルよりも24.2%のマージンを達成している。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:22:04 GMT)
Generation of Drug-Induced Cardiac Reactions towards Virtual Clinical Trials [27.9] ドラッグ・アウェア拡散モデル(英語版)(DADM)は、薬物誘発心電図(ECG)の変化をシミュレートする新しいモデルである。
EPKは、生成されたECGの形態を適応的に制約するために使用される。
ControlNetは、個々の薬物反応をシミュレートして、人口統計と薬物データを統合することを提案されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:05:51 GMT)
Synthetic Data RL: Task Definition Is All You Need [27.6] 強化学習(Reinforcement Learning, RL)は、基礎モデルを専門的なタスクに適応させる強力な方法であるが、大規模な人間ラベルデータに依存しているため、広く採用が制限される。
本稿では,タスク定義から生成された合成データのみを用いて微細構造モデルを補強する,シンプルで汎用的なフレームワークであるSynthetic Data RLを紹介する。
提案手法はまず,タスク定義と検索された文書から質問と回答のペアを生成し,モデルの可解性に基づいて質問の難易度に適応し,RL学習用サンプルの平均通過率を用いて質問を選択する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:35:13 GMT)
Towards Federated Graph Learning in One-shot Communication [27.3] Federated Graph Learning(FGL)は、分散プライベートグラフ間のデータサイロを壊すための有望なパラダイムとして登場した。
ワンショットフェデレートラーニング(OFL)は1ラウンドでのコラボレーションを可能にするが、既存のOFLメソッドはグラフデータには有効ではない。
本稿では,ノード分類のための最初の$textbfO-pFGL$メソッド(textbfO-pFGL$)を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:02:00 GMT)
Learning accurate and interpretable tree-based models [27.2] 我々は、同じドメインからデータに繰り返しアクセスする木に基づく学習アルゴリズムを設計するためのアプローチを開発する。
本稿では,よく使われるエントロピーとジニ不純物に基づく基準を補間するトップダウンアルゴリズムにおいて,ノード分割基準の新しいパラメータ化クラスを提案する。
我々は、ランダムな森林や傾斜した木など、一般的な木に基づくアンサンブルのチューニングに結果を拡張した。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:13:22 GMT)
Addressing Missing Data Issue for Diffusion-based Recommendation [26.6] 両面トンプソンサンプリングベース拡散モデル(TDM)を提案する。
TDMは誘導信号の余分な欠落データをシミュレートし、拡散モデルが外挿によって既存の欠落データを処理できるようにする。
実験と理論的解析は、連続的なレコメンデーションで欠落データに対処する上で、TDMの有効性を検証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:45:46 GMT)
SQLFixAgent: Towards Semantic-Accurate Text-to-SQL Parsing via Consistency-Enhanced Multi-Agent Collaboration [26.2] 本稿では,SQLの誤検出と修復を目的とした,新しい一貫性向上型マルチエージェント協調フレームワークを提案する。
提案するフレームワークを5つのテキスト・テキスト・ベンチマークで評価する。
本手法はベースラインモデルの性能を継続的に向上させる。
私たちのフレームワークは、他の高度なメソッドよりもトークン効率が高いので、より競争力があります。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:21:49 GMT)
Why These Documents? Explainable Generative Retrieval with Hierarchical Category Paths [26.1] 本稿では階層的カテゴリパス強化生成検索(HyPE)を提案する。
実験の結果,HyPEは高レベルな説明性を提供するだけでなく,文書検索作業における検索性能も向上することがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:44:50 GMT)
Conformal Prediction with Corrupted Labels: Uncertain Imputation and Robust Re-weighting [25.9] 本稿では,ラベル付きトレーニングデータが破損した状況において,ロバストな不確実性定量化のためのフレームワークを提案する。
我々は予測セットを生成する統計ツールである共形予測に基づいて構築する。
重み推定に依存しない新しい共形法である不確実な計算を導入する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:00:28 GMT)
OpenPros: A Large-Scale Dataset for Limited View Prostate Ultrasound Computed Tomography [25.8] 前立腺癌は男性の中で最も一般的で致命的ながんの1つである。
従来の経直腸超音波検査は、特に前立腺腫瘍の検出において、感度が低い。
OpenProsは、限定ビューのUSCT用に明示的に開発された最初の大規模ベンチマークデータセットである。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:56:49 GMT)
Reward-SQL: Boosting Text-to-SQL via Stepwise Reasoning and Process-Supervised Rewards [25.8] 外的プロセス・リワード・モデル(PRM)は、微粒な監督を提供するために訓練中に導入することができる。
本稿では,テキスト・ツー・ザ・ライティング・プロセスにPRMを効果的に組み込む方法について検討するフレームワークであるReward-BIRDを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:32:19 GMT)
Digital Twin Catalog: A Large-Scale Photorealistic 3D Object Digital Twin Dataset [25.5] 3Dオブジェクトのデジタル双対は、物理的オブジェクトの非常に詳細に、事実上区別できない表現である。
本稿では,Digital Twin Catalog (DTC)を紹介した。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:33:54 GMT)
Learning to Think: Information-Theoretic Reinforcement Fine-Tuning for LLMs [25.0] 大規模言語モデル(LLM)は推論能力の進歩により複雑なタスクに優れる。
既存の手法は推論の有効性と計算効率のトレードオフを見落としている。
より少ないトークンで最適な推論を実現するために,学習から思考への学習を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:34:17 GMT)
Progressive Autoregressive Video Diffusion Models [25.0] 本稿では,映像拡散モデルにおける雑音レベルの仮定を再考することにより,より自然な自己回帰長ビデオ生成法を提案する。
私たちのキーとなるアイデアは、フレームごとにフレームを割り当てることです。
プログレッシブノイズスケジュールを備えたビデオ拡散モデルでは,ベースラインに比べて忠実度が大幅に向上した長いビデオを自動回帰的に生成することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:43:40 GMT)
Context-Aware Autoregressive Models for Multi-Conditional Image Generation [25.0] ContextARは、多条件画像生成のための柔軟で効果的なフレームワークである。
様々な条件をトークンシーケンスに直接埋め込み、モダリティ固有の意味論を保存する。
拡散型多条件制御よりも競争力が高いことが,既存の自己回帰ベースラインに近づくことを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:27:02 GMT)
Beyond Single-Point Judgment: Distribution Alignment for LLM-as-a-Judge [24.9] 従来の手法は、人間の評価において固有の多様性と不確実性を見越して、単一点評価に依存していた。
本研究では,LLM生成した判定分布と経験的人的分布とを明確に整合させる新しいトレーニングフレームワークを提案する。
我々のフレームワークは、既存のオープンソースLCMや従来の単一点アライメント手法よりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:33:09 GMT)
Revenue Maximization Under Sequential Price Competition Via The Estimation Of s-Concave Demand Functions [24.6] われわれは、複数の売り手の間での価格競争をT$の期間で検討している。
売り手は価格を同時に提供し、それぞれの需要を競合相手に見つからないように監視する。
すべての売り手が当社の政策を採用すると、その価格がナッシュ均衡価格に対して$O(T-1/7)のレートで収束し、もし売り手が十分に情報を得たらリーチできることが示される。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:09:21 GMT)
TexPro: Text-guided PBR Texturing with Procedural Material Modeling [23.9] TexProはテキストプロンプトを入力した3Dメッシュの高忠実度材料生成のための新しい手法である。
プロシージャ・マテリアル・モデリングにより多様なテクスチャ・マップを制作し、物理的なレンダリング、ライティング、およびプロシージャ・マテリアルに固有の付加的な利益を可能にする。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:42:07 GMT)
Discovering Interpretable Concepts in Large Generative Music Models [23.4] スパースオートエンコーダ(SAE)を用いた音楽概念発見手法を提案する。
提案手法は,多数の特徴を抽出し,自動ラベリングと評価パイプラインを作成することで評価する。
以上の結果から,既存の理論や自然言語には全く相反しない,親しみやすい音楽概念と反直観的パターンの両方が明らかとなった。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:44:20 GMT)
PoLO: Proof-of-Learning and Proof-of-Ownership at Once with Chained Watermarking [23.3] 本稿では,連鎖した透かしを用いてPoL(Proof-of-Learning)とPoO(Proof-of-Ownership)を同時に実現する統一フレームワークを提案する。
PoLOは、バニラPoLソリューションよりも効率的でプライバシー保護の検証を提供する。
評価の結果,PoLOはデータプライバシの保持と検証コストの削減を従来の手法の1.5~10%に抑えながら,所有権確認のための透かし検出精度を99%向上することがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:19:18 GMT)
Multi-modal contrastive learning adapts to intrinsic dimensions of shared latent variables [23.1] マルチモーダルコントラスト学習から学習した表現の理論的性質について検討する。
合成データセットと実世界のデータセットの両方の実験は、低次元および情報表現を学習する対照的な学習能力を示している。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:49:53 GMT)
Is LLM an Overconfident Judge? Unveiling the Capabilities of LLMs in Detecting Offensive Language with Annotation Disagreement [23.0] 本研究では,攻撃言語検出における多言語モデル(LLM)の性能を系統的に評価する。
本研究では,二項分類の精度を分析し,モデル信頼度と人的不一致度の関係を検証し,不一致サンプルがモデル決定にどう影響するかを考察する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:06:50 GMT)
ClinicRealm: Re-evaluating Large Language Models with Conventional Machine Learning for Non-Generative Clinical Prediction Tasks [22.5] LLM(Large Language Models)は、医学においてますます普及している。
しかし, 臨床診断における有用性は未評価のままである。
本研究は,GPTをベースとしたLCM9,BERTをベースとしたモデル5,非構造化臨床ノートと構造化電子健康記録の従来手法7をベンチマークすることで,この問題に対処する。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:40:04 GMT)
Efficient Federated Class-Incremental Learning of Pre-Trained Models via Task-agnostic Low-rank Residual Adaptation [22.5] Fed-TaLoRA(Federated Task-Agnostic Low-rank Residual Adaptation)
我々は,最小限のオーバーヘッドで正確な知識統合を実現するための,新たな残量更新機構を開発した。
我々の方法論的革新は,タスク非依存適応,ポストアグリゲーションモデル校正,LORAモジュールの戦略的配置の3つの主要な戦略に起因している。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:19:13 GMT)
Geometric Inductive Biases of Deep Networks: The Role of Data and Architecture [22.2] 簡単な$textitgeometric invariant (GIH)仮説について検討する。
ニューラルネットワークの入力空間曲率が$textitgeometric invariantのままであることがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:54:50 GMT)
Does Vector Quantization Fail in Spatio-Temporal Forecasting? Exploring a Differentiable Sparse Soft-Vector Quantization Approach [22.1] Sparse Soft- Quantization (SVQ) は、時間的予測を強化するための最初のVQ手法である。
SVQはスパースノイズの低減とバランスを取り、完全性を提供し、スパースレグレッションの強固な基盤を提供する。
このアプローチでは,スパース回帰プロセスの合理化のために,2層データセットと広範なコードブックを用いる。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:11:15 GMT)
Security of Language Models for Code: A Systematic Literature Review [22.0] CodeLM(Code Language Model for Code)は、コード関連のタスクのための強力なツールとして登場した言語モデルである。
CodeLMはセキュリティ上の脆弱性の影響を受けやすく、ソフトウェア工学、人工知能、サイバーセキュリティといった分野から研究の注目を集めている。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:57:37 GMT)
Short-Term Electricity-Load Forecasting by Deep Learning: A Comprehensive Survey [21.8] 短期電力需要予測は、電力システムの即時需要(今後数時間から数日)を予測することを指す。
気象の変化や新しい電力消費シナリオの出現など、さまざまな外部要因が電力需要に影響を与える可能性がある。
深層学習はSTELFに適用され、高精度な電力需要のモデル化と予測を行っている。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:46:52 GMT)
GlobalGeoTree: A Multi-Granular Vision-Language Dataset for Global Tree Species Classification [21.7] 木種分類のための包括的グローバルデータセットであるGlobalGeoTreeを紹介する。
GlobalGeoTreeは630万本の樹木が生えており、275科、2,734属21001種にまたがっている。
我々は,生物多様性研究と生態学応用における樹木種分類の進歩とイノベーションの育成のためのベンチマークを確立することを目的としている。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:31:00 GMT)
RealMath: A Continuous Benchmark for Evaluating Language Models on Research-Level Mathematics [21.5] 大規模言語モデル(LLM)における数学的推論を評価するための既存のベンチマークは、主に競合問題、公式な証明、人工的な問題に依存している。
論文や数理フォーラムから直接派生した新しいベンチマークであるRealMathを導入し,実数理タスクにおけるLLMの能力を評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 23:32:46 GMT)
DS-ProGen: A Dual-Structure Deep Language Model for Functional Protein Design [21.4] 逆タンパク質フォールディング(英: inverse protein Folding)は、タンパク質設計の分野における重要なサブタスクである。
本稿では,機能的タンパク質設計のための二重構造深層言語モデルDS-ProGenを提案する。
バックボーン座標と表面化学および幾何学的記述子を次のアミノ酸予測パラダイムに組み込むことで、DS-ProGenは機能的に関連し、構造的に安定な配列を生成することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:08:35 GMT)
SPIRIT: Patching Speech Language Models against Jailbreak Attacks [21.3] 音声言語モデル(SLM)は、音声命令による自然な対話を可能にする。
我々は、敵の攻撃を分析し、SLMが脱獄攻撃に対してかなり脆弱であることを示す。
セキュリティ向上のために,推論時に介入するポストホック・パッチ・ディフェンスを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:51:24 GMT)
WMCopier: Forging Invisible Image Watermarks on Arbitrary Images [21.2] 目的の透かしアルゴリズムの事前知識やアクセスを必要とせず,有効な透かし偽造攻撃であるWMCopierを提案する。
提案手法はまず,無条件拡散モデルを用いて対象の透かし分布をモデル化し,次いで,対象の透かしを非透かし画像にシームレスに埋め込む。
実験の結果、WMCopierはオープンソースとクローズドソースの両方の透かしシステムを効果的に騙していることがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:52:04 GMT)
Geography-Aware Large Language Models for Next POI Recommendation [21.0] Next Point-of-Interest(POI)レコメンデーションタスクは,過去の移動データに基づいてユーザの次の目的地を予測することを目的としている。
GA-LLM(Geography-Aware Large Language Model)は,2つの特殊なコンポーネントを持つ大規模言語モデルを強化する新しいフレームワークである。
3つの実世界のデータセットの実験は、GA-LLMの最先端性能を実証している。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:20:20 GMT)
Semantic Shift Estimation via Dual-Projection and Classifier Reconstruction for Exemplar-Free Class-Incremental Learning [20.6] EFCIL (Exemplar-Free Class-Incremental Learning) のためのDPCR (Dual-Projection Shift Estimation and Reconstruction) アプローチを提案する。
DPCRは、学習可能な変換と行空間の射影を組み合わせた二重射影による意味的シフトを効果的に推定する。
実験により、様々なデータセットにおいて、DPCRは古いタスクと新しいタスクのバランスを効果的に保ち、最先端のEFCILメソッドより優れていることが示された。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:38:04 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming with Feasibility Guarantees [20.5] 混合整数非線形プログラム(MINLP)は、エネルギーシステムや輸送ほど多様な領域で発生するが、解くのは非常に難しい。
2つの整数補正層を持つ新しいL2O手法を提案し、解の積分性を保証するとともに、解の実現性を確保するための射影ステップを提案する。
実験の結果,提案手法は最大数万変数のMINLPを効率よく解き,ミリ秒以内の高品質な解が得られることがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:26:19 GMT)
Deploying Ten Thousand Robots: Scalable Imitation Learning for Lifelong Multi-Agent Path Finding [20.3] LMAPF (Lifelong Multi-Agent Path Finding) は、複数エージェントの衝突のない経路を繰り返す。
近年、この分野は学習に基づく手法を採用しており、シングルステップアクションを反応的に生成している。
本研究は,新しい通信モジュールを導入した模倣学習に基づくLMAPFソルバを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:41:47 GMT)
Gradient Correction in Federated Learning with Adaptive Optimization [19.9] クライアント-ドリフト補償を適応最適化に組み込む最初のアルゴリズムである tt FAdamGC を提案する。
tt FAdamGCは、様々なレベルのデータの通信とコストにおいて、既存の手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:48:18 GMT)
What are they talking about? Benchmarking Large Language Models for Knowledge-Grounded Discussion Summarization [19.6] 本研究の目的は,既存の対話要約システムにおける外部オブザーバの混乱の限界に対処することである。
タスク出力を背景と意見の要約としてモデル化し、2つの標準化された要約パターンを定義する。
我々は,構造化プロンプトおよび自己回帰パラダイムの下で12個のLDMを評価した。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:52:24 GMT)
Tensor Sketch: Fast and Scalable Polynomial Kernel Approximation [19.4] ランダムな特徴写像を用いた非線形カーネルの近似は、カーネルメソッドを大規模データセットにスケーリングする強力な手法となった。
近似誤差を理論的に保証し、その結果のカーネル関数の推定精度を保証します。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:01:24 GMT)
It Takes a Graph to Know a Graph: Rewiring for Homophily with a Reference Graph [19.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データの解析に長けているが、連結ノードがしばしば異なるクラスに属している異種グラフに苦戦している。
我々は、エッジホモフィリー、GNN埋め込みの滑らかさ、ノード分類性能をリンクする理論的基礎を提供する。
参照グラフを用いてグラフをホモフィリに増加させるリワイアリングフレームワークを導入し、リワイアグラフのホモフィリを理論的に保証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:28:56 GMT)
Probing Human Visual Robustness with Neurally-Guided Deep Neural Networks [19.0] 人間は力ずくでダイナミックな視覚世界をナビゲートするが、深層ニューラルネットワーク(DNN)は驚くほど小さなイメージの摂動に弱い。
過去の理論は、人間の視覚的堅牢性は、脳の腹側視覚ストリーム(VVS)に沿って進化する表現空間から生じ、ますます許容される物体の変換によって生じることを示唆している。
DNNのロバスト性は階層的に改善され,高次VVS領域との整合性が向上する。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:19:59 GMT)
Imagination-Limited Q-Learning for Offline Reinforcement Learning [18.9] Imagination-Limited Q-learning (ILQ) 法を提案する。
具体的には、動的モデルを用いて、OODのアクション値を想像し、次に最大振る舞い値で想像値をクリップする。
本手法はD4RLベンチマークにおいて,多種多様なタスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:05:21 GMT)
Federated Sketching LoRA: On-Device Collaborative Fine-Tuning of Large Language Models [18.8] デバイス上での微調整大型言語モデル(LLM)は依然として難しい問題である。
近年のローランク適応 (LoRA) 技術は, デバイスモデルのサイズやデータ不足に伴う課題を軽減するために, ファインチューニングを併用している。
サーバが保持するグローバルなLoRAモジュールのサブマトリクスを選択的に更新するために,スケッチ機構を活用したフェデレートスケッチLoRAを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:24:58 GMT)
Relation Extraction or Pattern Matching? Unravelling the Generalisation Limits of Language Models for Biographical RE [18.6] 関係抽出モデルは、類似した領域内であっても、目に見えないデータと競合することを示す。
我々の結果は、語彙的類似性ではなく、データ品質がロバスト転送の鍵であることを示しています。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:22:14 GMT)
VGGT-SLAM: Dense RGB SLAM Optimized on the SL(4) Manifold [18.4] VGGT-SLAMは、フィードフォワードシーン再構築アプローチVGGTから生成されたサブマップをインクリメンタルかつグローバルに整列させて構築された高密度RGB SLAMシステムである。
VGGT-SLAMは,高GPU要求のためにVGGTでは実現不可能な長いビデオシーケンスを用いて,地図品質の向上を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:33:09 GMT)
GMSA: Enhancing Context Compression via Group Merging and Layer Semantic Alignment [18.3] 本稿では,エンコーダ・デコーダアーキテクチャに基づく文脈圧縮フレームワークであるGMSAを紹介する。
GMSAは入力シーケンスの長さと冗長な情報を減らす。
エンドツーエンドの推論で約2倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:21:30 GMT)
HybridServe: Efficient Serving of Large AI Models with Confidence-Based Cascade Routing [18.0] 我々は,巨大ディープニューラルネットワーク(DNN)のための新しいハイブリッドモデルサービスシステムであるHybridServeを提案する。
HybridServeは、精度が損なわれない限り、エネルギー効率の良いより小さなモデルで推論要求を提供するのを好む。
現状のDNNモデルサービスシステムと比較して,エネルギーフットプリントを最大19.8倍削減することを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:54:16 GMT)
Resolving Latency and Inventory Risk in Market Making with Reinforcement Learning [17.8] 市場メイキング(MM)における取引所の遅延は、ハードウェアの制限、システム処理時間、取引所からのデータの受信遅延、市場に到達するのに注文の送信に要する時間などにより避けられない。
マーケットメイキング(MM)のための既存の強化学習(RL)手法は、これらの遅延の影響を無視する。
本稿では,待ち時間と在庫リスク問題に対処するRLに基づくMM手法であるRelaverを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:43:41 GMT)
Long-Context Autoregressive Video Modeling with Next-Frame Prediction [17.7] 長文ビデオモデリングは、生成モデルが世界シミュレータとして機能するために不可欠である。
長いビデオで直接トレーニングすることは自然な解決策だが、視覚トークンの急速な成長は計算的に禁止する。
フレームオートレグレッシブ(FAR)モデルを提案し、連続フレーム間の時間的依存関係をモデル化し、ビデオ拡散変換器よりも高速に収束し、トークンレベルの自己回帰モデルより優れる。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:27:31 GMT)
AbFlowNet: Optimizing Antibody-Antigen Binding Energy via Diffusion-GFlowNet Fusion [17.7] AbFlowNetは、GFlowNetとDiffusionモデルを統合する新しい生成フレームワークである。
各拡散ステップをGFlowNetフレームワークのステートとしてフレーミングすることで、AbFlowNetは標準拡散損失と結合エネルギーを共同で最適化する。
ABFlowNetはまた、テストデータセットを擬似ラベル付けしたり、計算に高価なオンラインRLシステムを使用することなく、トップ1の総エネルギーと結合エネルギーエラーを24.8%、38.1%削減する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:40:35 GMT)
From n-gram to Attention: How Model Architectures Learn and Propagate Bias in Language Modeling [17.7] 本研究では,データ,モデル設計の選択,時間的ダイナミクスが言語モデリングにおけるバイアス伝搬に与える影響について検討する。
症状だけでなく、データとモデルの両方の次元に偏りをトレースすることで、害を和らげる。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:55:05 GMT)
MedAgentBoard: Benchmarking Multi-Agent Collaboration with Conventional Methods for Diverse Medical Tasks [17.6] 我々はMedAgentBoardを紹介する。MedAgentBoardは、マルチエージェントコラボレーション、シングルLLM、および従来のアプローチの体系的評価のための総合的なベンチマークである。
MedAgentBoardには、医療(視覚)質問応答、レイサマリ生成、構造化電子健康記録(EHR)予測モデリング、臨床ワークフロー自動化の4つの多様な医療タスクカテゴリが含まれている。
マルチエージェントコラボレーションは特定のシナリオにおいてメリットを示すが、高度な単一LLMを一貫して上回るものではない。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:28:17 GMT)
How Linguistics Learned to Stop Worrying and Love the Language Models [17.4] 我々は、LMの成功は言語理論と構造を研究する必要性を損なうと論じている。
言語学に根ざした議論や考え方を再考せざるを得ない。
言語モデルと言語学の関係について楽観的な見解を提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:18:02 GMT)
Reasoning-CV: Fine-tuning Powerful Reasoning LLMs for Knowledge-Assisted Claim Verification [17.4] CoT(Chain-of-Thought)-Verifyパラダイムは、サブステートへの分解を必要とせず、検証段階を分離することなく、元の複雑クレームに対するCoT検証パスを生成する。
Reasoning-CVは既存のDecompose-Then-Verify法よりも優れた知識支援クレーム検証性能を示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:28:54 GMT)
Can Large Multimodal Models Understand Agricultural Scenes? Benchmarking with AgroMind [17.0] 我々は農業リモートセンシング(RS)のベンチマークであるAgroMindを紹介する。
AgroMindは、空間知覚、オブジェクト理解、シーン理解、シーン推論の4つのタスクディメンションをカバーしている。
AgroMind上で18のオープンソースLMMと3つのクローズドソースモデルを評価する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:45:19 GMT)
OVERLORD: Ultimate Scaling of DataLoader for Multi-Source Large Foundation Model Training [16.9] 大規模基盤モデル(LFM)をトレーニングするための現代的なフレームワークでは、データ並列方式でデータローダを採用している。
本稿では,産業用分散データロードアーキテクチャであるOmniloadについて述べる。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:39:35 GMT)
UniEdit: A Unified Knowledge Editing Benchmark for Large Language Models [16.5] オープンドメイン知識に基づく大規模言語モデル(LLM)編集のための統一ベンチマークであるUniEditを紹介する。
まず,5つのカテゴリにまたがる25の共通領域からエンティティを選択することで,サンプルを編集する。
編集における一般性や局所性の問題に対処するため,我々はNorborhood Multi-hop Chain Smpling (NMCS)アルゴリズムを設計する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:19:01 GMT)
Joint Embedding vs Reconstruction: Provable Benefits of Latent Space Prediction for Self Supervised Learning [16.5] 自己監視学習(SSL)における2つの主要なパラダイムとして再構築と共同埋め込みが登場している。
どちらのアプローチも強力なアドバンテージを提供するが、実践者はそれらを選択するための明確なガイドラインを欠いている。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:54:55 GMT)
Hamiltonian Descent Algorithms for Optimization: Accelerated Rates via Randomized Integration Time [16.3] 積分時間にハミルトン力学をシミュレートするHF-opt(HF-opt)について検討する。
HF-optにおける積分時間をランダム化することにより、結果のランダム化ハミルトン流(RHF)が連続時間における加速収束率を達成することを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:45:59 GMT)
Distributional Soft Actor-Critic with Harmonic Gradient for Safe and Efficient Autonomous Driving in Multi-lane Scenarios [16.2] ハーモニック・ポリシー・イテレーション(HPI)と呼ばれる新しい安全指向トレーニング手法を提案する。
各RLイテレーションでは、それぞれに効率的な運転と安全性の制約に関連する2つのポリシー勾配を計算する。
調和勾配は、2つの勾配間の衝突を最小限に抑え、ポリシー更新のために導かれる。
我々は最先端のDSACアルゴリズムをバックボーンとして採用し、HPIと統合して新しい安全なRLアルゴリズムDSAC-Hを開発した。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:35:57 GMT)
Continuously Optimizing Radar Placement with Model Predictive Path Integrals [16.1] センサー配置の連続最適化は、様々な軍事・民間用途における正確な目標位置決めに不可欠である。
レーダパラメータとレーダ目標距離を組み込んだレンジ計測モデルを用いる。
我々は、時間とともにレーダーと目標の進化する幾何学を可視化し、最も高い測定情報を得る領域をハイライトする。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:10:06 GMT)
HAKES: Scalable Vector Database for Embedding Search Service [16.0] 我々は,並列な読み書きワークロード下で高いスループットと高いリコールを実現するベクトルデータベースを構築した。
我々のインデックスは、高リコール領域と同時読み書きワークロード下でインデックスベースラインより優れています。
nameysはスケーラブルで、ベースラインよりも最大16タイムで高いスループットを実現します。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:26:29 GMT)
Hyperspectral Image Land Cover Captioning Dataset for Vision Language Models [15.9] リモートセンシングアプリケーションにおけるモデル性能と有効性を高めるために設計された,最初の大規模ハイパースペクトルキャプションデータセットであるHyperCapを紹介する。
分類タスクのみに焦点を当てた従来のハイパースペクトルイメージング(HSI)データセットとは異なり、HyperCapはスペクトルデータをピクセル単位のテキストアノテーションに統合する。
このデータセットは、分類や特徴抽出といったタスクにおけるモデルパフォーマンスを高め、高度なリモートセンシングアプリケーションに貴重なリソースを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:32:24 GMT)
LR0.FM: Low-Res Benchmark and Improving Robustness for Zero-Shot Classification in Foundation Models [15.8] 視覚言語基礎モデル(FM)は、様々なタスクにまたがる顕著なゼロショットの一般化を示す。
しかし、現実のシナリオでは一般的な課題である低解像度/ピクセル化(LR)画像に対するロバスト性はいまだに未解明のままである。
66個のバックボーンと15個のデータセットにわたる10個のFM(s)のゼロショット分類性能に対する低解像度の影響を評価するベンチマークであるLR0.FMを紹介する。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:20:47 GMT)
Towards Open-world Generalized Deepfake Detection: General Feature Extraction via Unsupervised Domain Adaptation [15.7] ソーシャルプラットフォームには大量のラベルのない合成データと本物のデータが溢れている。
オープンワールドのシナリオでは、ラベルなしデータの量はラベル付きデータよりもはるかに多い。
我々は,既存の手法の一般化能力を向上させるために,新しいオープンワールドディープフェイク検出一般化訓練戦略(OWG-DS)を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:12:12 GMT)
MPRM: A Markov Path-based Rule Miner for Efficient and Interpretable Knowledge Graph Reasoning [15.6] MPRMは規則に基づく推論をマルコフ連鎖としてモデル化する新しいルールマイニング手法である。
知識グラフを100万以上の事実で効率的にマイニングし、1つのCPUで22秒で1%未満の事実をサンプリングすると同時に、解釈可能性を保持し、ベースラインよりも最大11%の精度で推論する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:48:45 GMT)
Machine Learning Applications Related to Suicide in Military and Veterans: A Scoping Literature Review [15.6] 自殺は、現役軍人や退役軍人の死亡の主な予防可能な原因の1つである。
機械学習技術は、最近この分野で有望な成果を上げている。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:38:33 GMT)
InterFeat: An Automated Pipeline for Finding Interesting Hypotheses in Structured Biomedical Data [15.6] 本稿では,構造化バイオメディカルデータにおける興味深い単純な仮説の発見を自動化するための積分パイプラインを提案する。
我々は「面白さ」を、新規性、実用性、妥当性の組み合わせとして定式化する。
パイプラインは、あらゆるターゲットに対して、"興味深い"運用という課題に対処します。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:13:51 GMT)
$γ$-FedHT: Stepsize-Aware Hard-Threshold Gradient Compression in Federated Learning [15.5] グラディエント圧縮は、フェデレートラーニング(FL)におけるボトルネックを効果的に緩和する
Error-Feedbackの基本的会話を紹介する。
我々は、$gamma$-FedHTがTop-k$よりも7.42%$まで精度を向上することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:55:50 GMT)
AdaDim: Dimensionality Adaptation for SSL Representational Dynamics [15.4] 効果的な自己監視学習(SSL)の鍵となる要素は、次元的崩壊を防ぐことである。
次元性は、特徴デコレーションを促進する次元コントラスト的アプローチによって最適化されるか、サンプルコントラスト的手法によって最適化される。
トレーニング開始時の特徴デコレーションによる$H(R)$の上昇は、トレーニング終了時に均一に分散したサンプルによる$I(R;Z)$の上昇または減少につながることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 23:35:34 GMT)
Ditch the Denoiser: Emergence of Noise Robustness in Self-Supervised Learning from Data Curriculum [15.3] 自己監視学習(SSL)は、ラベルのないデータからリッチな表現を抽出する強力なソリューションとなっている。
SSLをノイズの多いデータに適用することは、天体物理学、医用画像、地球物理学、ファイナンスといった応用に不可欠であるにもかかわらず、依然として課題である。
本稿では、推論や下流の微調整を嫌うことなく、ノイズロバスト表現学習を可能にする完全自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:37:58 GMT)
SenseFlow: A Physics-Informed and Self-Ensembling Iterative Framework for Power Flow Estimation [15.3] 電力流量推定は、電力システムの安定性と信頼性を確保する上で重要な役割を果たす。
既存の研究は、しばしば電力システムのユニークな特性に適切に対処することができない。
SenseFlowは、2つの主要な設計を統合する新しい物理インフォームド・セルフセンス・イテレーティブ・フレームワークである。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:33:33 GMT)
FinMaster: A Holistic Benchmark for Mastering Full-Pipeline Financial Workflows with LLMs [15.2] FinMasterは、金融リテラシー、会計、監査、コンサルティングにおける大規模言語モデル(LLM)の機能を評価するために設計されたベンチマークである。
FinMasterは、FinSim、FinSuite、FinEvalの3つの主要なモジュールで構成されている。
実験では、財務的な推論において重要な能力のギャップが示され、精度は基本的なタスクで90%以上から、複雑なシナリオではわずか37%に低下した。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:47:55 GMT)
Speeding up quantum Markov processes through lifting [15.0] 我々は、Eberle と Lorler (2024) によって開始された拡散可逆過程から量子マルコフ力学への非可逆リフトの概念を一般化する。
我々は、昇降過程の$L2$収束速度が、過度に損傷された力学のスペクトルギャップの平方根によって上界されていることを証明した。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:19:08 GMT)
Efficient Diversity-based Experience Replay for Deep Reinforcement Learning [15.0] 強化学習における学習効率を向上させるために,EDER(Efficient Diversity-based Experience Replay)を提案する。
実験は、MuJoCo、アタリゲーム、ハビタットの現実的な屋内環境におけるロボット操作に関するものである。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:54:38 GMT)
VoiceCloak: A Multi-Dimensional Defense Framework against Unauthorized Diffusion-based Voice Cloning [14.9] 拡散モデル(DM)は現実的な音声クローニング(VC)において顕著な成功を収めた
DMは、拡散の複雑な生成機構により、プロアクティブな防御と相容れないことが証明されている。
我々はVoiceCloakを紹介した。VoiceCloakは多次元のプロアクティブ・ディフェンス・フレームワークで、話者のアイデンティティを曖昧にし、潜在的な不正なVCの品質を劣化させることを目的としている。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:58:48 GMT)
Video-GPT via Next Clip Diffusion [14.8] GPTは自然言語処理において顕著な成功を収めた。
我々は映像を視覚世界モデリングの新しい言語として扱う。
本稿では,ビデオ-GPTの事前学習のための新しいクリップ拡散パラダイムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:22:58 GMT)
Bridging Quantized Artificial Neural Networks and Neuromorphic Hardware [14.6] ニューロモルフィックハードウェアの主な目的の1つは、分散コンピューティングとイベント駆動回路設計を活用することである。
ニューロモルフィックハードウェアのスパイクモデルを構築するために、従来のアプローチはスパイクニューラルネットワーク(SNN)を構築することである。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:45:43 GMT)
This&That: Language-Gesture Controlled Video Generation for Robot Planning [14.6] 本稿では,これとよばれる幅広いタスクをコミュニケーションし,計画し,実行するためのロボット学習フレームワークを提案する。
This&Thatは、インターネット規模のデータのトレーニングを通じて、リッチな物理的コンテキストとセマンティックコンテキストを含むビデオ生成モデルを活用することで、一般的なタスクを解決する。
ビデオベースプランニングにおける基本的な課題として,1) 簡単な指示によるあいまいなタスクコミュニケーション,2) ユーザの意図を尊重する制御可能なビデオ生成,3) 視覚的プランをロボット行動に変換する3つの課題がある。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:20:01 GMT)
Enhancing Knowledge Graph Completion with GNN Distillation and Probabilistic Interaction Modeling [14.6] 知識グラフは、様々な領域にまたがる相互接続データを整理するための基本的な構造として機能する。
ディープグラフニューラルネットワーク(GNN)は過度にスムースに苦しむ一方で、埋め込みベースのモデルは抽象的リレーショナルな特徴を捉えることができない。
本稿では,GNN蒸留と抽象確率的相互作用モデリング(APIM)を統合した統合フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:22:53 GMT)
Mitigating Content Effects on Reasoning in Language Models through Fine-Grained Activation Steering [14.3] 大規模言語モデル(LLM)は、しばしば推論の限界を示し、しばしば内容の妥当性を論理的妥当性と混同する。
これは偏りのある推論を生じさせ、そこではもっともらしい議論は論理的に妥当か、あるいはその逆であると見なされる。
本稿では,アクティベーションステアリングによる形式推論におけるコンテンツバイアス軽減の問題について検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:34:34 GMT)
ViEEG: Hierarchical Neural Coding with Cross-Modal Progressive Enhancement for EEG-Based Visual Decoding [14.2] ViEEGは生物学的にインスパイアされた階層型EEGデコーディングフレームワークで、視覚処理のHubel-Wiesel理論と一致する。
従来の手法を45%以上上回り,40.9%が被写体依存のTop-1精度,22.9%がクロスオブジェクト設定のTop-1精度を実現している。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:19:08 GMT)
Data Sharing with a Generative AI Competitor [14.2] 我々は、コンテンツ制作会社とGenAIプラットフォームとの間でデータ共有のモデルを提供し、サードパーティの専門家からコンテンツを取得することができる。
このインタラクションはStackelbergのゲームとしてモデル化されている。同社はまず、そのプロプライエタリなデータセットのどれ程をGenAIと共有するかを決め、続いてGenAIは、外部の専門家から取得するデータ量を決定する。
我々の結果は、GenAI時代のデータ共有パートナーシップを形作る経済力に光を当てています。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:22:37 GMT)
DragLoRA: Online Optimization of LoRA Adapters for Drag-based Image Editing in Diffusion Model [14.1] DragLoRAは、ドラッグベースの編集パイプラインにLoRAアダプタを統合する新しいフレームワークである。
DragLoRAはドラッグベース画像編集における制御精度と計算効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:52:19 GMT)
Towards Budget-Friendly Model-Agnostic Explanation Generation for Large Language Models [14.1] いくつかの予算に優しいモデルから抽出することで,大規模言語モデルに対する忠実な説明を生成することは現実的であることを示す。
我々の分析は、予算に優しいモデルからの情報を含めることで、LCMのモデルに依存しない説明手法の新しいパラダイムを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:05:37 GMT)
See What You Seek: Semantic Contextual Integration for Cloth-Changing Person Re-Identification [14.0] 衣服交換者再識別(CC-ReID)は、衣服の変化にもかかわらず、監視カメラを通して個人をマッチングすることを目的としている。
既存の方法は通常、衣服の変化の影響を軽減するか、アイデンティティ(ID)関連の特徴を強化する。
本稿では,衣服による相違を低減し,IDの質を高めるために,新しいプロンプト学習フレームワークSemantic Contextual Integration(SCI)を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:18:08 GMT)
LLMs are not Zero-Shot Reasoners for Biomedical Information Extraction [14.0] 大規模言語モデル(LLM)は、医療分野のアプリケーションにますます採用されている。
質問応答や文書要約といったタスクに関して、ドメインエキスパートのパフォーマンスに到達します。
LLMがバイオメディカル領域で伝統的に追求されるタスクでどの程度うまく機能するかは不明である。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:11:03 GMT)
Self-Destructive Language Model [13.8] 有害な微調整攻撃は、大規模言語モデル(LLM)のセキュリティに大きな脅威をもたらす
本報告では,LEMを自己破壊モデルに変換するアライメント・エンハンス・ディフェンスであるSEAMについて紹介する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:08:18 GMT)
High-Dimensional Dynamic Covariance Models with Random Forests [13.8] 本稿では,高次元動的共分散行列を推定するための新しい非パラメトリック手法を提案する。
我々は無作為な森林を活用し、堅固な理論的保証を支持している。
結果は条件変数の範囲で均一に保持される。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:33:33 GMT)
TCP-Diffusion: A Multi-modal Diffusion Model for Global Tropical Cyclone Precipitation Forecasting with Change Awareness [13.7] 熱帯サイクロン降水拡散 (TCP-Diffusion) は, 熱帯サイクロン降水量予測のマルチモーダルモデルである。
過去の降雨観測とマルチモーダル環境変数に基づいて,過去12時間のTCセンター周辺の降雨を3時間ごとの解像度で予測した。
気象要因の影響とNWPモデル予測からの有用性を考慮し,特殊エンコーダを用いたマルチモデルフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:30:08 GMT)
Generative Psycho-Lexical Approach for Constructing Value Systems in Large Language Models [13.5] 大規模言語モデル(LLM)は、その本質的な価値に関する懸念を提起している。
本研究は、生成心理学的アプローチ(GPLA)の導入によるギャップに対処する。
LLMに適した心理学的基礎を持つ5要素値システムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:05:57 GMT)
FormulaReasoning: A Dataset for Formula-Based Numerical Reasoning [13.3] 式に基づく数値推論に特化して設計された新しいデータセットであるFluseReasoningを紹介する。
我々のデータセットの4,751の質問は、それぞれ外部物理式による数値計算を必要とする。
また、データセットに付随する外部知識ベースとして機能する統合された公式データベースも提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:08:02 GMT)
InnateCoder: Learning Programmatic Options with Foundation Models [13.2] InnateCoderは、ファンデーションモデルにエンコードされた人間の知識を活用してプログラムポリシーを提供するシステムである。
学習オプションに対する既存のアプローチとは対照的に、InnateCoderは、ゼロショット設定で基礎モデルに符号化された一般的な人間の知識から学習する。
InnateCoderは、オプションを使ったり、経験から学んだりしないシステムのバージョンよりも、よりサンプル効率が高いことを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:57:57 GMT)
Why Regression? Binary Encoding Classification Brings Confidence to Stock Market Index Price Prediction [13.2] 本稿では,指標価格予測のために構成銘柄の適応的融合を明示的にモデル化する新しいエンドツーエンドフレームワークを提案する。
Cubicは、ストックインデックス予測タスクにおける最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:45:41 GMT)
Bridging Generative and Discriminative Learning: Few-Shot Relation Extraction via Two-Stage Knowledge-Guided Pre-training [12.5] TKRE(Two-Stage Knowledge-Guided Pre-Training for Relation extract)は、生成的および識別的学習パラダイムを橋渡しする新しいフレームワークである。
TKRE では,1) 説明駆動型知識とスキーマ制約付き合成データの生成に LLM を活用し,データの不足問題に対処し,(2) マスケッドスパン言語モデリングとスパンレベルコントラスト学習を組み合わせた2段階の事前学習戦略を導入する。
ベンチマークデータセットに関する総合的な実験は、TKREの有効性を示し、FSREにおける新しい最先端性能を実現し、低域でのより広範な応用の可能性を示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:17:36 GMT)
SiCo: An Interactive Size-Controllable Virtual Try-On Approach for Informed Decision-Making [12.4] VTO(Virtual try-on)アプリケーションは、店内ショッピング体験を再現することを目的としている。
既存のツールの多くは、衣料品を視覚化するときに、一大のアプローチを採用している。
われわれはSiCoという新しいオンラインVTOシステムを導入し、ユーザーは自分の画像をアップロードし、体のサイズの違いを視覚化して衣服と対話できる。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:27:52 GMT)
LLMScan: Causal Scan for LLM Misbehavior Detection [12.4] 大規模言語モデル(LLM)は、非現実的でバイアスがあり、有害な応答を生成する。
この研究は、因果解析に基づく革新的なモニタリング技術であるLLMScanを導入している。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:55:15 GMT)
UniCMs: A Unified Consistency Model For Efficient Multimodal Generation and Understanding [12.3] 一貫性モデル(CM)は、画像とテキストの両方を効率的に生成する可能性を示している。
主な課題は、画像生成とテキスト生成の両方に統一された認知的視点を確立することである。
テキスト・画像生成では、UniCMはGenEval、Image Reward、CLIPスコアでSD3を上回っている。
画像からテキスト生成では、UniCMはMMMUベンチマークのShow-oを上回り、ロングシーケンス生成速度では1.5倍高速である。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:59:21 GMT)
Stereographic Multi-Try Metropolis Algorithms for Heavy-tailed Sampling [12.3] 本稿では、重み付きターゲットからの効率的なサンプリングのための、勾配のないMCMCアルゴリズムの新たなファミリを紹介する。
提案手法は, 従来のユークリッドMTMと既存の立体ランダムウォークMetropolis法に勝るだけでなく, MTMでよく見られる病理収束挙動を回避している。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:21:23 GMT)
Graph-Reward-SQL: Execution-Free Reinforcement Learning for Text-to-SQL via Graph Matching and Stepwise Reward [12.2] テキスト・ツー・タスクにおける大規模言語モデル(LLM)の性能向上のために,強化学習(RL)が広く採用されている。
既存の方法は、実行ベースやLLMベースのBradley-Terry報酬モデルに依存していることが多い。
本稿では,GMNScore結果報酬モデルを用いたテキスト・ツー・RLファインチューニングフレームワークであるGraph-Reward-Rewardを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:53:01 GMT)
Enforcing Fairness Where It Matters: An Approach Based on Difference-of-Convex Constraints [12.1] 我々は、予測モデルにより全てのスコア範囲で完全な公正性を達成することに集中し、ハイスコアとロースコアの両方の人口を確保する。
我々は,他の地域での柔軟性を維持しつつ,意思決定が最優先される中核として,新たな関心点を提案する。
所定のスコア範囲内での公平さを厳格に評価するために,2つの統計指標を導入する。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:50:01 GMT)
CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design [11.6] 大規模言語モデル(LLM)は、従来のコストのごく一部で自律的にハイパフォーマンスを発見できる。
本稿では,言語指導と数値指導を組み合わせたハイブリッドフレームワークを提案する。
本手法は,様々な最適化タスクにおいて,SOTA(State-of-the-art)ベースラインを上回っている。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:48:47 GMT)
How Reliable is Multilingual LLM-as-a-Judge? [11.6] 25言語を含む5つの多種多様なタスクにおいて、異なるモデルファミリーから5つのモデルを評価する。
一貫性は言語によって大きく異なり、低リソース言語では特にパフォーマンスが劣っていることが分かりました。
実世界のアプリケーションにおける多言語判断の整合性を改善するアンサンブル戦略を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:32:35 GMT)
Neural Graduated Assignment for Maximum Common Edge Subgraphs [11.6] 本稿では,シンプルでスケーラブルで教師なし学習に基づくNGA(Neural Graduated Assignment)を提案する。
NGAは大規模インスタンスの計算時間とスケーラビリティを大幅に改善することを示す。
NGAの導入は、MCESの計算の大幅な進歩を示し、他の代入問題に対する洞察を提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:43:35 GMT)
Making Sense of the Unsensible: Reflection, Survey, and Challenges for XAI in Large Language Models Toward Human-Centered AI [11.5] 説明可能なAI(XAI)は、大きな言語モデル(LLM)と多様な利害関係者の不透明な推論の間の重要なインターフェースとして機能する。
本稿では, LLM における XAI の総合的考察と調査について, 説明可能性の本質は何か? 技術的・倫理的側面は何か?
我々は、説明責任は、信頼を育み、競争を可能とし、AIシステムを制度的な説明責任と人間中心の意思決定と整合させる、市民のインフラに進化しなければならないと論じている。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:30:10 GMT)
SMFusion: Semantic-Preserving Fusion of Multimodal Medical Images for Enhanced Clinical Diagnosis [11.4] 医用先行知識を融合プロセスに組み込んだ,意味誘導型医用画像融合手法を提案する。
融合画像から診断報告を生成し,医療情報の保存性を評価する。
実験結果から, 定性評価と定量的評価の両方において, 提案手法が優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:15:00 GMT)
CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models [11.3] ルールベース強化学習(RL)は、ルールベース報酬を用いた言語モデル(LM)の推論能力を改善した。
既存のRLメソッドは、大きなポリシー更新と不適切なクリッピングがトレーニングの崩壊につながるような、トレーニングの不安定さに悩まされることが多い。
本稿では,政策学習の安定化を目的とした新しいアルゴリズムCPGDを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:44:53 GMT)
Mamba-MOC: A Multicategory Remote Object Counting via State Space Model [11.3] Mambaはコンピュータビジョンの分野で有望なソリューションとして登場し、グローバルな依存関係をモデル化するための線形複雑性を提供する。
マルチカテゴリリモートオブジェクトカウント用に設計されたマンバベースのネットワークであるマンバMOCを提案する。
提案手法は,いくつかの主流カウントアルゴリズムと比較して,最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:59:50 GMT)
EvoGPT: Enhancing Test Suite Robustness via LLM-Based Generation and Genetic Optimization [11.1] 大規模言語モデル(LLM)は、最近、自動ユニットテスト生成のための有望なツールとして登場した。
我々は,LLMベースのテスト生成と進化的検索技術を統合したEvoGPTというハイブリッドフレームワークを導入し,多種多様な欠陥検出ユニットテストを作成する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:48:53 GMT)
ACPs: Agent Collaboration Protocols for the Internet of Agents [10.9] Internet of Agents (IoA) は、標準化された通信プロトコルを通じて異種エージェントを相互接続することを目的としている。
Agent Collaboration Protocols (ACP) はIoAのための包括的なプロトコルスイートである。
ACPには登録、発見、対話、ツーリングプロトコルが含まれる。
ACPはセキュアでオープンでスケーラブルなエージェントインターネットインフラを構築する基盤を築いた。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:54:27 GMT)
Vision to Specification: Automating the Transition from Conceptual Features to Functional Requirements [10.9] EasyFRアプローチでは、与えられた抽象機能に対してセマンティックロールラベリングシーケンスを推奨し、結合機能要件(FR)の生成において、事前学習言語モデル(PLM)をガイドする。
我々の結果は、将来のソフトウェアプロジェクトにおける要求仕様のプロセスを改善する可能性を秘めている、自動要求合成の領域における顕著な進歩を示している。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:01:50 GMT)
Is Artificial Intelligence Generated Image Detection a Solved Problem? [10.8] AIGIBenchは、最先端AIGI検出器の堅牢性と一般化能力を厳格に評価するために設計されたベンチマークである。
これには、高度な画像生成技術と広く採用されている画像生成技術の両方にまたがる、23の多様なフェイクイメージサブセットが含まれている。
11個の先進検出器の実験では、制御された設定で高い精度が報告されているにもかかわらず、これらの検出器は実世界のデータに大きな性能低下を被ることを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:00:39 GMT)
GNN-ACLP: Graph Neural Networks based Analog Circuit Link Prediction [10.7] これらの課題に対処するための3つの革新を特徴とするグラフニューラルネットワーク(GNN)ベースのフレームワークを提案する。
まず、SEAL(Subgraphs, Embeddings, Attributes for Link Prediction)フレームワークを導入し、回路リンク予測においてポートレベルの精度を実現する。
第2に,大言語モデル(LLM)を用いた検索拡張生成(RAG)を利用したネットリストフォーマット変換ツールであるNetlist Babel Fishを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:38:47 GMT)
ProMi: An Efficient Prototype-Mixture Baseline for Few-Shot Segmentation with Bounding-Box Annotations [10.5] 画素レベルのラベルの代わりにバウンディングボックスアノテーションをベースとした,新たなバイナリセグメンテーション手法を提案する。
ProMiは、バックグラウンドクラスを分散の混合として扱う、効率的なプロトタイプミキサーベースの手法である。
当社のアプローチは単純で、トレーニング不要で、効果的で、粗いアノテーションを簡単に利用できる。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:08:05 GMT)
A Hessian-informed hyperparameter optimization for differential learning rate [10.4] Hessian-informed differential learning rate (Hi-DLR)は、異なるモデルパラメータに異なる学習率を適用する手法である。
トレーニング中の学習率を動的に決定することで,Hi-DLRは収束性を向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:46:19 GMT)
Distribution Prompting: Understanding the Expressivity of Language Models Through the Next-Token Distributions They Can Produce [10.4] いくつかの分布は、他の分布よりもはるかに困難であることを示す。
非常に低いエントロピーあるいは非常に高いエントロピーの分布は、中間エントロピーの分布よりも近似が容易である。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:49:48 GMT)
PSC: Extending Context Window of Large Language Models via Phase Shift Calibration [10.3] 近年,RoPEに基づくコンテキストウィンドウをさらに拡張する手法が数多く提案されている。
PSC(Phase Shift)は、既存の手法で事前に定義された周波数を調整するための小さなモジュールである。
複数のモデルやタスクにまたがる広範な実験を行った。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:47:44 GMT)
Efficient Optimization with Orthogonality Constraint: a Randomized Riemannian Submanifold Method [10.2] 機械学習における課題を解決するための新しい手法を提案する。
ランダムな部分多様体を更新するための2つの戦略を導入する。
我々は、我々のアプローチが様々な問題にどのように一般化されるかを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:46:44 GMT)
Shaky Structures: The Wobbly World of Causal Graphs in Software Analytics [9.9] 因果グラフは、因果関係の文書化と探索にソフトウェア工学で広く使われている。
広く使われているが、非常に誤解を招くこともある。
本稿では,23データセットに適用した4つの因果グラフ生成器の因果グラフについて検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:56:42 GMT)
Nonlinear Laplacians: Tunable principal component analysis under directional prior information [9.9] ノイズの多い観測からランクワン信号を検出し,推定するアルゴリズムを新たに導入する。
直接スペクトルアルゴリズムと比較して,そのようなアルゴリズムの性能について検討する。
理論的にも経験的にも、$sigma$が適切に選択された場合、非線形ラプラシアスペクトルアルゴリズムは直接スペクトルアルゴリズムよりも大幅に優れていることが分かる。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:37:47 GMT)
Opacity as a Feature, Not a Flaw: The LoBOX Governance Ethic for Role-Sensitive Explainability and Institutional Trust in AI [9.7] 本稿では,人工知能(AI)の不透明性を管理するために,LoBOX (Lack of Belief: Opacity & eXplainability)ガバナンス倫理を紹介する。
不透明さを設計上の欠陥として扱うのではなく、LoBOXはロールキャリブレーションされた説明と制度的な説明責任によって倫理的に管理できる条件として定義している。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:59:45 GMT)
Traversal Verification for Speculative Tree Decoding [9.5] 投機的復号化は、大きな言語モデルを加速するための有望なアプローチである。
本稿では,新しい投機的復号化アルゴリズムであるトラバーサル検証を紹介する。
提案手法は,既存手法よりも受け入れ長とスループットを継続的に向上することを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:51:55 GMT)
ZenFlow: Enabling Stall-Free Offloading Training via Asynchronous Updates [9.4] ZeRO-Offloadのような既存のオフロードトレーニングフレームワークは、すべてのパラメータを均等に扱い、CPU上で完全なモデルを更新する。
我々は、重要なパラメータを優先し、GPUとCPU間の更新を分離する新しいオフロードフレームワークであるZenFlowを紹介する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:38:49 GMT)
Harnessing the Universal Geometry of Embeddings [8.6] 本稿では,テキスト埋め込みを1つのベクトル空間から別のベクトル空間に変換する最初の手法を提案する。
我々の翻訳は、異なるアーキテクチャ、パラメータ数、トレーニングデータセットを持つモデルペア間で高いコサイン類似性を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:37:07 GMT)
ProDAG: Projected Variational Inference for Directed Acyclic Graphs [8.6] 直接非巡回グラフ(DAG)学習は構造発見と因果推論において中心的な課題である。
スパースDAGの空間を直接支援する新しい,証明可能な有効分布に基づくベイズ変分推論フレームワークを開発した。
我々は,提案手法であるProDAGが,精度と不確かさの両面で最先端の代替品より優れていることを実証的に実証した。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:58:14 GMT)
Enhancing Large Language Models with Reward-guided Tree Search for Knowledge Graph Question and Answering [8.4] 大規模言語モデル(LLM)は、知識グラフ質問回答(KGQA)タスクにおいて素晴らしいパフォーマンスを示している。
本稿では、RTSoG(Reward-guided Tree Search on Graph)と呼ばれる、KGQAタスクのための新しい学習不要フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:52:57 GMT)
Vectors from Larger Language Models Predict Human Reading Time and fMRI Data More Poorly when Dimensionality Expansion is Controlled [8.4] 大きな言語モデル(LLM)の印象的な言語能力は、それらを人間の文処理のモデルとして推奨している。
近年の研究では、単語予測確率を予測器として使用すると、LMが過度に大きく正確になるにつれて、このスケーリングが逆転することが示されている。
本研究では,LLM ベクトル全体を用いた LLM スケーリングの評価を行い,より大きな LLM ベクトルの予測子数を制御した。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:13:48 GMT)
Large Language Models for Automated Web-Form-Test Generation: An Empirical Study [8.3] 大規模言語モデル(LLM)は文脈テキスト生成に大きな可能性を示している。
異なるLLMを比較した比較研究は、Web-form-test 生成についてはまだ報告されていない。
本稿では,鍵となる文脈情報を抽出する3つのHTML構造解析手法を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:15:52 GMT)
Increasing Fairness via Combination with Learning Guarantees [8.1] 本研究では,個人的,集団的公正性の両面を反映した「差別的リスク(DR)」という公平性評価尺度を提案する。
本研究では,その特性を調査し,理論学習保証と組み合わさることで,公正性を高めることができることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:36:55 GMT)
Learning to Program Quantum Measurements for Machine Learning [8.1] 高性能量子機械学習モデルの開発には、専門家レベルの専門知識が必要である。
本稿では,量子系の可観測性,特にエルミート行列の学習性を示す革新的なフレームワークを提案する。
提案手法は変動量子回路内で観測可能を動的にプログラムし,既存の手法よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:39:22 GMT)
Learning to Play Like Humans: A Framework for LLM Adaptation in Interactive Fiction Games [8.1] インタラクティブ・フィクションゲーム(Interactive Fiction Game、IFゲーム)は、プレイヤーが自然言語で操作するゲームである。
この研究は認知にインスパイアされたフレームワークを示し、Large Language Models (LLM) を体系的にIFゲームを学び、プレイする。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:21:56 GMT)
LaPON: A Lagrange's-mean-value-theorem-inspired operator network for solving PDEs and its application on NSE [8.0] ラグランジュの平均値定理に着想を得た演算子ネットワークであるLaPONを提案する。
損失関数ではなく、ニューラルネットワークアーキテクチャに直接、事前の知識を組み込む。
LaPONは、高忠実度流体力学シミュレーションのためのスケーラブルで信頼性の高いソリューションを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:45:17 GMT)
Achieving PAC Guarantees in Mechanism Design through Multi-Armed Bandits [8.0] 自動機構設計のための線形プログラム(LP)に最適解のクラスを解析的に導出する。
これらの解は、元の定式化における変数の総数よりも指数関数的に小さい基本変数の集合を用いて表すことができる。
本稿では,この用語の評価をマルチアーム・バンディット(MAB)問題に翻訳することでこの問題に対処する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:37:48 GMT)
Redefining non-IID Data in Federated Learning for Computer Vision Tasks: Migrating from Labels to Embeddings for Task-Specific Data Distributions [8.0] Federated Learning (FL)は、分散機械学習(ML)におけるパラダイムシフトを表す。
現在のFLの性能はラベル/クラス分布スキューに頼って過大評価されている。
トレーニング済みのディープニューラルネットワークを利用することで、各ビジョンタスクのレンズを通してタスク固有のデータ不均一性を定義する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:06:27 GMT)
GATES: Cost-aware Dynamic Workflow Scheduling via Graph Attention Networks and Evolution Strategy [7.7] 本研究では,グラフアテンションネットワークに基づくポリシーネットワークと,GATESと呼ばれる進化戦略を組み合わせたDRL手法を提案する。
GatesはCADWSで安定したポリシー学習を実現し、最先端のアルゴリズムより優れている。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:38:41 GMT)
Scalable Density-based Clustering with Random Projections [7.6] 本稿では,コサイン距離の高い高次元密度クラスタリングアルゴリズムであるsDBSCANを提案する。
実証的には、sDBSCANは、現実世界の百万点データセット上の他の多くのクラスタリングアルゴリズムよりもはるかに高速で精度が高い。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:04:10 GMT)
Detecting Arbitrary Planted Subgraphs in Random Graphs [7.3] 本稿では,ErdHos-R'enyi乱数グラフ$mathcalG(n, q_n)$における仮設植木部分グラフ$Gamma = Gamma_n$の検出について検討する。
エッジ確率が$p_n$と$q_n$が固定された高密度な状態では、Gamma$を検出するための情報理論および計算しきい値が強く特徴付けられる。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:13:59 GMT)
ForestSplats: Deformable transient field for Gaussian Splatting in the Wild [7.3] 3D-GSは静的なシーンでは有効性を示すが、実際の環境では性能が著しく低下する。
変形可能な過渡場とスーパーピクセル対応マスクを利用する新しいアプローチであるフォレストスプラッツを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:21:50 GMT)
Examining Linguistic Shifts in Academic Writing Before and After the Launch of ChatGPT: A Study on Preprint Papers [7.2] 大規模言語モデル(LLM)は学術的な著作への影響について学術的な懸念を引き起こしている。
我々は、arXivデータセットから過去10年間に発表された823,798件の要約を大規模に分析した。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:35:43 GMT)
Towards Visuospatial Cognition via Hierarchical Fusion of Visual Experts [7.0] 空間的推論を強化するための新しいMLLMである ViCA2 (Visuospatial Cognitive Assistant 2) を紹介する。
ViCA2は、セマンティクスのためのSigLIPと空間構造のためのHieraを統合したデュアルビジョンアーキテクチャと、効率のためのトークン比制御機構を備えている。
また,322,000以上の質問応答対を持つ大規模認知データセットであるViCA322Kを開発した。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:57:33 GMT)
NaFM: Pre-training a Foundation Model for Small-Molecule Natural Products [6.8] 微生物、動物、植物からの代謝物などの天然物は多様な生物活性を示す。
既存の製品研究のためのディープラーニング手法は、特定の下流タスク用に設計された教師付き学習アプローチに依存している。
我々は,その特質に基づいた天然物の基盤モデルを事前学習した。
本フレームワークは, 天然物採掘や薬物発見に関連する下流業務において, 最先端のSOTA(State-of-the-art)を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:50:42 GMT)
LLMSR@XLLM25: An Empirical Study of LLM for Structural Reasoning [6.7] We present Team asdfo123's submit to the LLMSR@XLLM25 shared task。
我々は、粒度、制御性、解釈可能な推論プロセスを生成する上で、大きな言語モデルを評価する。
提案手法は, マクロF1スコアを, より複雑で資源消費の少ないパイプラインと同等に達成し, 総合5位にランク付けする。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:46:30 GMT)
One-for-All Pruning: A Universal Model for Customized Compression of Large Language Models [6.7] 既存の大規模言語モデル(LLM)のプルーニング手法は、モデル性能を維持しながら高い圧縮率を達成することに重点を置いている。
本研究では,LLMのためのUniversal Model for Customized Compression (UniCuCo)を提案する。
ベースラインに匹敵する精度を維持しつつ,64要求を処理する場合,UniCuCoはベースラインよりも28倍高速であることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:26:07 GMT)
Kornia-rs: A Low-Level 3D Computer Vision Library In Rust [6.6] textitkornia-rsは、ネイティブRustで完全に書かれた高性能な3Dコンピュータビジョンライブラリである。
textitkornia-rsは静的型テンソルシステムとモジュール式の木枠を採用し、効率的な画像I/O、画像処理、3D操作を提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:50:00 GMT)
LLM-CoT Enhanced Graph Neural Recommendation with Harmonized Group Policy Optimization [6.5] グラフニューラルネットワーク(GNN)は相互作用関係をモデル化することによって高度なレコメンデータシステムを備えている。
既存のグラフベースのレコメンダはスパースID機能に依存しており、テキスト情報を十分に活用していない。
我々はLGHRec (LLM-CoT強化グラフニューラルレコメンデーションと調和群ポリシー最適化)を紹介する。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:50:36 GMT)
PillarTrack:Boosting Pillar Representation for Transformer-based 3D Single Object Tracking on Point Clouds [6.5] LiDARベースの3Dオブジェクトトラッキング(3D SOT)は、ロボット工学と自動運転において重要な問題である。
柱型3D SOTフレームワークであるPillarTrackを提案する。
提案手法は,KITTIデータセットとNuScenesデータセットで同等の性能を実現する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:40:12 GMT)
Addressing the Scarcity of Benchmarks for Graph XAI [6.4] 実世界のデータセットからグラフ分類を行うためのXAIベンチマークの構築を自動化するための一般的な手法を提案する。
我々は15のプリメードベンチマークと2000以上のXAIベンチマークを生成するコードを提供しています。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:19:52 GMT)
Signatures of human-like processing in Transformer forward passes [6.2] 現代のAIモデルは、人間の認知を研究する理論的ツールとして、ますます使われている。
機械的解釈可能性の最近の進歩は、モデル出力を引き起こす内部過程を明らかにし始めている。
本研究では,人間におけるリアルタイム処理とトランスフォーマーにおける計算の層間ダイナミクスの関係について検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:27:52 GMT)
Pre-trained Prompt-driven Community Search [6.1] 「プレトレイン・プロンプト」パラダイムは様々なグラフベースのタスクで広く採用されている。
本稿では,検索精度と効率性を向上する新しいモデルであるPPCS(Pre-trained Prompt-driven Community Search)を提案する。
PPCSはノードエンコーディング、サンプル生成、プロンプト駆動の微調整の3つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:36:37 GMT)
Community Search in Time-dependent Road-social Attributed Networks [6.1] 現実世界のネットワークは、しばしば、交通条件による移動時間の変化とともに、キーワードと場所の両方を含む。
既存のコヒーシブな部分グラフに基づくコミュニティ検索研究は、キーワードや場所の1つの属性を使ってコミュニティを識別している。
本稿では,問合せノードから外へ徐々に拡張する,正確かつ欲求的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:45:05 GMT)
Energy-Aware Deep Learning on Resource-Constrained Hardware [6.0] IoT(Internet of Things)とモバイルデバイス上のディープラーニング(DL)は、クラウドベースの処理よりも多くのアドバンテージを提供します。
このような装置は、電池寿命を延ばすためにかなりのエネルギー制約に直面したり、エネルギーハーベスティングによって断続的に作動することもある。
本稿では,これらの手法の概要を概説し,その方法論,エネルギー消費への影響,システムレベルの効率について概説する。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:17:03 GMT)
Vision-Encoders (Already) Know What They See: Mitigating Object Hallucination via Simple Fine-Grained CLIPScore [5.9] 本研究は、物体幻覚の主な原因は、視覚エンコーダの限られた表現能力にあるという以前の主張を再考する。
名詞レベルでのテキスト埋め込みを組み込むことでオブジェクトレベルの粒度を高めるCLIPScore(F-CLIPScore)を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:29:25 GMT)
Geometry-Aware Approaches for Balancing Performance and Theoretical Guarantees in Linear Bandits [5.8] トンプソンサンプリングとグリーディは有望な経験的性能を示したが、これは悲観的な理論的後悔の境界とは対照的である。
本稿では,問題パラメータの周辺における不確かさ楕円体の幾何学的特性を追従する新しいデータ駆動手法を提案する。
この手法により,Greedy,OFUL,Thompsonサンプルを含む幅広いアルゴリズムに対して,幾何学的情報を含むデータ駆動型頻繁な後悔境界を定式化することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:52:33 GMT)
A Survey of Attacks on Large Language Models [5.8] 大規模言語モデル(LLM)とLLMベースのエージェントは、現実世界の幅広いアプリケーションに広くデプロイされている。
本稿では, LLM および LLM ベースのエージェントを標的とした敵攻撃の詳細を体系的に概説する。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:55:16 GMT)
Enhancing the Performance of Global Model by Improving the Adaptability of Local Models in Federated Learning [5.8] フェデレートラーニングは、クライアントがローカルモデルから集約されたグローバルモデルを協調的にトレーニングすることを可能にする。
クライアント上の不均一なデータ分布とフェデレートラーニングにおけるデータプライバシのため,ローカルモデルをトレーニングして,優れたグローバルモデルを実現することは困難である。
我々は,局所モデルの適応性を導入し,局所モデルの適応性を向上させることでグローバルモデルの性能を向上させる。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:21:06 GMT)
EVALOOP: Assessing LLM Robustness in Programming from a Self-consistency Perspective [5.8] 大規模言語モデル(LLM)のプログラミング能力を評価することは、ソフトウェア工学における効果的な利用に不可欠である。
本稿では,自己整合性の観点からロバスト性を評価する新しいアセスメントフレームワークEVALOOPを紹介する。
我々は、EVALOOP上で16個の著名なLCM(例えば、GPT-4.1, O4-mini)を評価し、EVALOOPは通常10ループで5.01%-19.31%のパス@1性能低下を誘導することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:02:33 GMT)
On Probabilistic Pullback Metrics for Latent Hyperbolic Manifolds [5.7] 本稿では,階層的関係のモデル化に特に適した双曲的埋め込みについて述べる。
本稿では, LVM の非線形写像によって生じる歪みを考慮に入れた, プルバック計量による双曲多様体の拡張を提案する。
実験により, 引き戻し距離の測地学は双曲型潜在空間の幾何学を尊重するだけでなく, 基礎となるデータ分布と整合することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:14:19 GMT)
Towards Immersive Mixed Reality Street Play: Understanding Collocated Bodily Play with See-through Head-Mounted Displays in Public Spaces [5.6] Mixed Reality(MR) See-through Head-Mounted Displays(HMD)がユビキタスになるにつれて、私たちはパラダイムシフトを目の当たりにしています。
Pok'emon GOのような位置情報ベースの普及型モバイルゲームは成功したが、MR HMDの具体的相互作用は、電話によるスクリーンタッチゲームプレイからMR HMD対応のコロケーションボディープレイへと私たちを移動させている。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:38:32 GMT)
HICD: Hallucination-Inducing via Attention Dispersion for Contrastive Decoding to Mitigate Hallucinations in Large Language Models [5.6] 大規模言語モデル(LLM)は、しばしば幻覚を生成し、文脈的に不正確または事実的に不正確な出力を生成する。
我々は,幻覚を緩和する対照的な復号法として,幻覚を誘導する新しい手法HICDを紹介する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:28:35 GMT)
How Do OSS Developers Reuse Architectural Solutions from Q&A Sites: An Empirical Study [5.6] 開発者はQ&Aサイトでプログラミング関連の知識を再利用する。
それらの問題を解決するために、Q&Aサイトのアーキテクチャソリューションの7つのカテゴリが再利用されている。
OSS開発者は、SOのアーキテクチャソリューションを組み込むためのアドホックな方法に頼ることが多い。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:21:07 GMT)
A Finite-Sample Analysis of Distributionally Robust Average-Reward Reinforcement Learning [5.6] Halpern Iteration (RHI) を提案する。
RHIは、$tildemathcal Oleft(fracSAmathcal H22right)$のほぼ最適なサンプル複雑性を持つ、$epsilon$-optimal Policyを得る。
そこで本研究は,複雑で現実的な問題に対するロバストな平均回帰法の実用性向上に寄与する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:34:45 GMT)
Importance Sampling for Nonlinear Models [5.4] 非線形写像の随伴作用素の概念を導入する。
これらのノルムとレバレッジスコアの概念に基づくサンプリングは、基礎となる非線形写像に対して近似を保証することを実証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:34:39 GMT)
Bishop: Sparsified Bundling Spiking Transformers on Heterogeneous Cores with Error-Constrained Pruning [5.4] トークンの集合のスパイクデータを複数の時間ポイントに束ねるコンテナである,Token-Time Bundle(TTB)アクセラレータの概念を紹介した。
Bishopは、スパイクベースのワークロードのためのハードウェア計算アーキテクチャとHW/SWの共同設計フレームワークとして、初めての専用である。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:42:58 GMT)
RoboFAC: A Comprehensive Framework for Robotic Failure Analysis and Correction [5.4] VLA(Vision-Language-Action)モデルは、最近、自然言語命令と画像情報を逐次制御アクションに変換することによって、ロボット操作を進化させた。
これらのモデルは、専門家によるデモンストレーションの成功を主に訓練し、障害回復の限られた能力を示すため、オープンワールドシナリオではパフォーマンスが劣ることが多い。
この問題に対処するためのロボット故障解析・補正フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:57:08 GMT)
Early Prediction of In-Hospital ICU Mortality Using Innovative First-Day Data: A Review [5.2] ICU入院後24時間以内に院内死亡を早期かつ正確に予測することが重要である。
従来のスコアリングシステムは有用ではあるが、予測精度と適応性に制限があることが多い。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:17:31 GMT)
Exploring Sparsity for Parameter Efficient Fine Tuning Using Wavelets [5.2] 残留行列のウェーブレット領域における高度にスパースな更新を学習する新しいPEFT法であるWavelet Fine-Tuning(WaveFT)を提案する。
WaveFTはトレーニング可能なパラメータの正確な制御を可能にし、きめ細かいキャパシティ調整を提供する。
我々はWaveFTをSHiRAと呼ばれる特別なケースと比較する。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:20:32 GMT)
EMelodyGen: Emotion-Conditioned Melody Generation in ABC Notation with the Musical Feature Template [5.0] EMelodyGenは、音楽的特徴テンプレートによって制御されるABC表記における感情的なメロディ生成に焦点を当てている。
音楽的特徴と感情ラベルの統計的相関による感情的メロディ生成を制御するテンプレートを設計した。
Rough4Qで事前トレーニングしたシステムでは、最大99%の音楽21パース率を実現でき、テンプレートによって生成されたメロディーは、盲目聴取テストにおける感情表現に91%のアライメントをもたらす。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:10:35 GMT)
GraphFLEx: Structure Learning Framework for Large Expanding Graphs [4.8] 大規模および拡張グラフにおけるグラフ構造学習のための統一的でスケーラブルなフレームワークを提案する。
GraphFLExは、エッジの形成をクラスタリングと粗い処理の組み合わせによって識別されたノードの構造的に関連するサブセットに制限することで、スケーラビリティのボトルネックを軽減する。
学習パラダイム、粗い戦略、クラスタリングメソッドの多様な選択を統合することで、48のフレキシブルな設定をサポートする。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:33:10 GMT)
Approximating Discrimination Within Models When Faced With Several Non-Binary Sensitive Attributes [4.7] 多様体から見た集合間の距離に基づくフェアネス測度を提案し、「マニフォールドによる調和フェアネス測度」(HFM)と命名する。
HFMを直接計算することは、そのサブプロデューサ(集合の距離の計算)を加速するためにコストがかかる可能性があるので、近似アルゴリズムを2つ提案する。
提案した公正度測定法は有効であり,近似アルゴリズム(近似Dist,拡張Dist)は効率的かつ効率的である。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:33:12 GMT)
Optimized four-qubit quantum error correcting code for amplitude damping channel [4.5] 信頼性の高い情報処理に不可欠な量子絡み補正(QEC)。
特定のエラーチャネルをターゲットとすると、エンコーディングとリカバリの両方を、双方向のQECスキームで最適化することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:08:09 GMT)
Embedding principle of homogeneous neural network for classification problem [4.4] 本稿では,ニューロン分割により発生する異なる幅のネットワーク間のKKT点の関係について検討する。
我々はtextbfKKT 点埋め込みの原理を導入・定式化し、同種ネットワークの最大マージン問題の KKT 点をより大きなネットワークの問題 KKT 点に埋め込むことができることを確認した。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:43:22 GMT)
OSS-Bench: Benchmark Generator for Coding LLMs [4.4] 本稿では,実世界のオープンソースソフトウェアから大規模かつ実運用的な評価タスクを構築するベンチマークジェネレータOSS-Benchを紹介する。
OSS-Benchは、関数をLLM生成コードに置き換えて、コンパイル性、機能的正確性、メモリ安全性という3つの自然な指標を使用して評価する。
OSS-BenchはOSSの複雑さの進化を生かして過度な適合を緩和することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:53:51 GMT)
Proposal for Improving Google A2A Protocol: Safeguarding Sensitive Data in Multi-Agent Systems [4.4] 本稿では、既存のプロトコルをレビューし、その制限を特定し、セキュリティ、プライバシ、信頼を改善するための具体的な拡張を提案する。
これには、問題と解決策、研究支援の合理性、実装に関する考察を説明する具体的な例が含まれている。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:25:21 GMT)
A Comprehensive Review of Techniques, Algorithms, Advancements, Challenges, and Clinical Applications of Multi-modal Medical Image Fusion for Improved Diagnosis [4.3] MMIF(Multi-modal Medical Image fusion)は、診断精度を高め、効果的な臨床的意思決定を促進するための重要な技術である。
MMIFはX線、MRI、CT、PET、SPECT、超音波のデータを組み合わせ、患者解剖学と病理学の詳細な、臨床的に有用な画像を作成する。
本総説では,MMIFの進化,方法論,アルゴリズム,現在の進歩,臨床応用について慎重に検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:19:01 GMT)
TPM2.0-Supported Runtime Customizable TEE on FPGA-SoC with User-Controllable vTPM [4.3] 本稿では,FPGA-SoC上でTPM 2.0ランタイム互換のカスタマイズ可能なTEEを構築するためのアプローチを提案する。
ランタイム中にIPを動的に計測、デプロイ、起動するために、カスタマイズ可能なFPGA-SoC TEEをサポートする。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:31:45 GMT)
Submillimeter-Accurate 3D Lumbar Spine Reconstruction from Biplanar X-Ray Images: Incorporating a Multi-Task Network and Landmark-Weighted Loss [4.3] 現在の完全自動化法はミリレベルの精度しか達成できず、臨床基準を満たすことは困難である。
両平面X線画像から腰椎の3次元再構築を高精度に行うための完全自動化手法を開発し,その妥当性を検証した。
提案手法は3次元再構成精度0.80mmを達成し,本手法よりも大幅に向上した。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:53:24 GMT)
UIShift: Enhancing VLM-based GUI Agents through Self-supervised Reinforcement Learning [4.2] GUIエージェントのための効果的なビジョン言語モデル(VLM)のトレーニングは通常、大規模な注釈付きデータセットよりも教師付き微調整(SFT)に依存している。
本稿では,その遷移の原因となる動作を推定することにより,VLMがGUIトランジションペアから学習できるようにする,自己教師型逆動的タスクを提案する。
VLMベースのGUIエージェントを自己教師付き強化学習により拡張するフレームワークであるUI-shiftを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:34:30 GMT)
Event-Driven Simulation for Rapid Iterative Development of Distributed Space Flight Software [4.1] 本稿では,新しい宇宙シミュレーション環境の設計,開発,応用について述べる。
この環境は、ソフトウェアのみのシミュレーションの柔軟性、決定性、および可観測性と、通常、リアルタイムのハードウェア・イン・ザ・ループテストによってのみ達成される忠実さと深さを組み合わせている。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:32:40 GMT)
ShareLoRA: Parameter Efficient and Robust Large Language Model Fine-tuning via Shared Low-Rank Adaptation [4.1] textbfShared textbfRank textbfAdaptation (ShareLoRA)を導入する。
ShareLoRAは、性能を損なうことなく、パラメータ効率、適応性、堅牢性をバランスさせる。
ゼロショット、少数ショット、連続的な微調整シナリオにおいて、一貫してLoRAを上回っている。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:38:26 GMT)
STAR: Stage-Wise Attention-Guided Token Reduction for Efficient Large Vision-Language Models Inference [3.9] 我々は,グローバルな視点からトークンプルーニングにアプローチする,トレーニングフリーのプラグアンドプレイフレームワークSTAR(Stage-wise Attention-guided token Reduction)を提案する。
単一ポイントでプルーニングする代わりに、STARは視覚的自己注意に基づく早期プルーニングで冗長な低レベル特徴を除去し、タスク非関連トークンを捨てるために、クロスモーダルな注意でガイドされる後期プルーニングという2つの相補的な段階において注意誘導還元を行う。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:44:45 GMT)
Mitigating Hallucinations via Inter-Layer Consistency Aggregation in Large Vision-Language Models [3.9] 層集約(DCLA)による層間整合性を用いた復号化機構を提案する。
提案手法は,従来のレイヤから表現を集約することで動的セマンティック参照を構築し,階層間の一貫性を強制するために意味的に逸脱したレイヤを補正する。
MMEやPOPEのような幻覚ベンチマークの実験では、DCLAはLVLMの信頼性と性能を高めつつ、幻覚を効果的に低減することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:15:42 GMT)
FISH-Tuning: Enhancing PEFT Methods with Fisher Information [3.9] FISH Maskは選択に基づくPEFT手法であり、近似フィッシャー情報を用いて事前訓練されたパラメータの臨界部分集合を識別する。
FISH MaskをLoRA,Adapter,およびそれらの変種を含むPEFT手法に組み込む新しいアプローチである textbfFISH-Tuning を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:51:54 GMT)
On the Challenges of Fuzzing Techniques via Large Language Models [3.8] 本稿では,ファジングテストに大規模な言語モデルを用いた開発について,系統的に概説する。
論文の統計的分析と議論は、提出の現在までの最先端の手法を要約することによって行われる。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:11:32 GMT)
PRETI: Patient-Aware Retinal Foundation Model via Metadata-Guided Representation Learning [3.8] PreTIは、メタデータ認識学習と堅牢な自己教師付き表現学習を統合した網膜基盤モデルである。
患者レベルのデータペアを構築し、同一人物の画像を関連付けることにより、非臨床的変動に対する堅牢性を向上させる。
実験では、PreTIは様々な疾患やバイオマーカー予測にまたがって最先端の結果を達成することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:59:03 GMT)
SpikeX: Exploring Accelerator Architecture and Network-Hardware Co-Optimization for Sparse Spiking Neural Networks [3.8] 本研究では,非構造的空間性から生じる課題と機会に対処するため,Systolic-array SNNアクセラレーターアーキテクチャであるSpikeXを提案する。
SpikeXはメモリアクセスを減らし、データ共有と時間と空間にまたがる計算を対象とするハードウェア利用を増加させる。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:07:44 GMT)
Fixed Point Explainability [3.7] 本稿では「なぜ回帰」原理に着想を得た固定点説明の形式的概念を紹介する。
固定点説明は極小性、安定性、忠実さなどの特性を満たすことを示し、隠れたモデル行動と説明的弱点を明らかにする。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:43:25 GMT)
Of Mice and Machines: A Comparison of Learning Between Real World Mice and RL Agents [3.7] 近年の強化学習(RL)は,複雑な意思決定タスクにおいて顕著な能力を示した。
また, RL エージェントは自己保存本能の欠如を一貫して示し, 「死を危険にさらす」 と限界効率の向上を示唆している。
我々はRL剤のより自然主義的なリスク回避行動を促進する2つのメカニズムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:40:16 GMT)
KG-QAGen: A Knowledge-Graph-Based Framework for Systematic Question Generation and Long-Context LLM Evaluation [3.6] KG-QAGenは、複数の複雑性レベルでQAペアを抽出するフレームワークである。
20,139のQAペアのデータセットを構築し、その一部をオープンソース化する。
我々は、13のプロプライエタリかつオープンソースのLCMを評価し、最高の性能のモデルでさえ、セットベース比較に苦戦していることを観察する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:46:39 GMT)
Truth Neurons [3.5] 言語モデルには真理ニューロンが含まれており、真理を主題に依存しない方法で符号化していることを示す。
様々なスケールのモデルで行われた実験は、真理ニューロンの存在を検証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:47:21 GMT)
Observe-R1: Unlocking Reasoning Abilities of MLLMs with Dynamic Progressive Reinforcement Learning [3.4] マルチモーダル大規模言語モデル(MLLM)の推論能力向上を目的とした新しいフレームワークであるObserve-R1を提案する。
我々は,RL学習におけるデータサンプルの難易度と難易度に応じて整理し,サンプル化したNeuraLadderデータセットを構築した。
Qwen2.5-VL-3B と Qwen2.5-VL-7B のニューララダーデータセットから得られた20kサンプルによる実験により、Observe-R1 は推論と一般的なベンチマークの両方において、より大きな推論モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:08:03 GMT)
From Low Field to High Value: Robust Cortical Mapping from Low-Field MRI [3.3] 携帯型LF-MRIの3次元再構成と解析のための機械学習手法を提案する。
我々は、合成LF-MRIで訓練された3次元U-Netを用いて、皮質表面の符号付き距離関数を予測する。
本手法は,携帯型LF-MRIにおける皮質表面分析の実現に向けたステップである。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:24:18 GMT)
Towards Instance-Wise Calibration: Local Amortized Diagnostics and Reshaping of Conditional Densities (LADaR) [3.3] 本稿では,LADaR(Local Amortized Diagnostics and Reshaping of Conditional Densities)フレームワークを紹介する。
解釈可能な局所診断を生成し、条件密度推定を調整するメカニズムを提供する。
我々の主な科学応用は、測光データから得られる銀河距離の確率密度関数を推定することである。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:09:18 GMT)
SecEmb: Sparsity-Aware Secure Federated Learning of On-Device Recommender System with Large Embedding [3.2] フェデレートされたレコメンデータシステム(FedRec)は、協調トレーニング技術を通じてユーザデータを保護するソリューションとして登場した。
典型的なFedRecでは、エッジデバイスとサーバ間で完全なモデルと全体の重み付け更新を送信します。
既存のスパシティ対応のフェデレーションプロトコルは、一般的に効率性のためにプライバシを犠牲にする。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:05:11 GMT)
The Tower of Babel Revisited: Multilingual Jailbreak Prompts on Closed-Source Large Language Models [3.2] 大規模言語モデル(LLM)は、様々な領域に広く適用されているが、敵の迅速なインジェクションに弱いままである。
我々は、フロンティアプロプライエタリなソリューションを評価するために、多様な攻撃手法を活用する、第一種統合敵フレームワークを提案する。
我々の評価は、英語と中国語のセキュリティ内容の6つのカテゴリにまたがっており、32種類のジェイルブレイク攻撃に対して38,400のレスポンスが生成される。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:51:19 GMT)
Prot42: a Novel Family of Protein Language Models for Target-aware Protein Binder Generation [3.2] 本稿では,タンパク質言語モデル(pLM)の新規ファミリーであるProt42を紹介する。
注目すべきは、我々のモデルは最大8,192個のアミノ酸を処理し、標準的制限をはるかに超えていることだ。
Prot42は高親和性タンパク質結合体と配列特異的DNA結合タンパク質を産生する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:39:42 GMT)
Finite-time stabilization of ladder multi-level quantum systems [3.2] はしご量子系の有限時間安定化を実現するために,新しい連続非平滑制御法を提案する。
まず、距離ベースリアプノフ関数を用いたはしごnレベル量子系に対する普遍分数次制御則を設計する。
固有ハミルトニアンの固有状態への収束に必要な時間の上界を導出する。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:33:42 GMT)
Entanglement Request Scheduling in Quantum Networks Using Deep Q-Network [3.2] 量子リピータネットワークにおける絡み合い要求の遅延時間と公平性を最適化するために,新しいQ-Network (DQN) ベースのスケジューリング手法を提案する。
提案手法は,Greedy,Proportional Fair,FIFOスケジューリング方式と比較して高い性能を示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:32:21 GMT)
Adaptive Optimization of Latency and Throughput with Fidelity Constraints in Quantum Networks Using Deep Neural Networks [3.2] 本稿では,Deep Neural Networks (DNN) を用いた半教師付き適応浄化手法を提案する。
本研究は,将来の量子ネットワークアプリケーションにおいて,適応的かつ最適化された性能を実現するためのディープラーニング技術の可能性について述べる。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:23:18 GMT)
Improving Out-of-Domain Robustness with Targeted Augmentation in Frequency and Pixel Spaces [3.1] 実世界のシナリオでは、汎用的な拡張で訓練されたモデルは、分布下での一般化がラベルなしのターゲットドメインにシフトする際にのみ、余分な改善が可能である。
本稿では、周波数空間と画素空間の両方にターゲット拡張を導入することにより、OODロバスト性を高めるドメイン適応フレームワークである Frequency-Pixel Connect を提案する。
我々は、周波数-Pixel Connectがクロスドメイン接続を大幅に改善し、ビジョン、医療、オーディオ、天文学の領域にわたる4つの異なる実世界のベンチマークにおいて、従来の一般的な手法よりも優れていることを実証した。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:15:40 GMT)
Alternators With Noise Models [3.0] 本稿では,遅延および観測軌跡のサンプリングに用いる雑音項を明示的にモデル化することにより,従来のGradsの柔軟性を向上させる++という新しいモデルを提案する。
密度推定や時系列計算,予測などのタスクにおける++の有効性を実証し,いくつかの強いベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:01:45 GMT)
CT-PatchTST: Channel-Time Patch Time-Series Transformer for Long-Term Renewable Energy Forecasting [2.9] 本研究では,高度深層学習モデルであるChannel-Time Patch Time-Series Transformer(CT-PatchTST)を開発し,評価する。
年間オフショア風力、オンショア風力、デンマークからの太陽光発電データを用いて、太陽光発電と風力発電システムの発電を予測している。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:06:49 GMT)
PainFormer: a Vision Foundation Model for Automatic Pain Assessment [2.8] 痛みは人口のかなりの割合に影響を与える多様体条件である。
本研究では,マルチタスク学習原理に基づく視覚基盤モデルPainFormerを紹介する。
PainFormerは様々な入力モードから高品質な埋め込みを効果的に抽出する。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:29:18 GMT)
Carbon Footprint Reduction for Sustainable Data Centers in Real-Time [2.8] 本稿では, 炭素フットプリント削減, エネルギー消費, エネルギーコストの目的のために, データセンターを最適化するための多エージェント強化学習(MARL)フレームワークを提案する。
その結果,DC-CFR MARLエージェントは実世界の動的気象条件やグリッド炭素強度条件下での様々な場所での冷却,負荷シフト,エネルギー貯蔵の最適化において,複雑な相互依存性を効果的に解決した。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:26:45 GMT)
The geography of inequalities in access to healthcare across England: the role of bus travel time variability [2.6] 本研究は、旅行時間変動(TTV)の観点から、イングランド全土の医療施設への公共交通機関によるアクセシビリティについて検討する。
分析の結果,都市と農村の分断,高低TTV領域のクラスタリング,別個のアウトリーチなど,TTVと平均移動時間の空間時間パターンが明らかとなった。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:33:48 GMT)
SRLoRA: Subspace Recomposition in Low-Rank Adaptation via Importance-Based Fusion and Reinitialization [2.6] Low-Rank Adaptation (LoRA)は、固定された低ランク部分空間への更新を制約する。
本稿では,低ランク適応(SRLoRA)における部分空間再構成について,重要性に基づく融合と再初期化を用いて紹介する。
SRLoRAは標準のLoRAよりも高速な収束と精度の向上を実現している。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:12:40 GMT)
BOLT: Block-Orthonormal Lanczos for Trace estimation of matrix functions [2.5] 多くの大規模アプリケーションでは、関連する行列が大きすぎて完全に保存またはアクセスできないため、単一のマットベック製品が実現不可能である。
本稿では,小さな主行列のみで動作するBOLTの変種であるSubblock SLQを紹介する。
理論的な保証を提供し、高次元設定の範囲で強い経験的性能を示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:04:05 GMT)
Private Statistical Estimation via Truncation [2.4] データトランケーションによる個人統計推定のための新しいフレームワークを導入し、データサポートが非有界である場合のDP推定における重要な課題に対処する。
計算効率の良いDP推定器を開発した。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:38:38 GMT)
SchoenbAt: Rethinking Attention with Polynomial basis [2.3] カーネル化アテンションは、カーネル関数によるシーケンス相関をモデル化することにより、アテンションメカニズムを拡張する。
我々は、点積の核化された注意を基礎として近似するSchoenbergの定理に基づく注意(SchoenbAt)を提案する。
SchoenbAtの非バイアス性および濃度誤差境界の理論的証明は、その効率と精度をカーネル化された注意近似として支持する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:16:46 GMT)
Conditional Quantile Estimation for Uncertain Watch Time in Short-Video Recommendation [2.3] 本稿では,時計時間全体の条件分布をモデル化するための条件量子推定(CQE)を提案する。
CQEは、ユーザとビデオのペアごとに複雑なウォッチタイム分布を特徴付け、ユーザの振る舞いを理解するための柔軟で包括的なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:39:39 GMT)
KGAlign: Joint Semantic-Structural Knowledge Encoding for Multimodal Fake News Detection [2.3] 本稿では,視覚的,テキスト的,知識に基づく表現を統合した,新しいマルチモーダルフェイクニュース検出フレームワークを提案する。
本提案では,知識基底型マルチモーダル推論という新たなパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:08:38 GMT)
ESC-Judge: A Framework for Comparing Emotional Support Conversational Agents [2.3] ESC-Judgeは,大規模言語モデル(LLM)の最初のエンドツーエンド評価フレームワークである。
ESC-Judge は、クララヒルの確立した探索-洞察-行動カウンセリングモデルにおいて、感情支援 LLM の前後比較を基礎としている。
すべてのコード、プロンプト、合成ロール、書き起こし、判断スクリプトがリリースされ、感情的に支援されるAIの透明な進歩を促進する。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:04:59 GMT)
DeNOTS: Stable Deep Neural ODEs for Time Series [2.3] CDEは不規則時系列の時間的進化を処理する方法を提供する。
我々は、NFEの増加とモデルの「深化」のために統合時間地平線を拡大することを提案する。
また、負のフィードバックによって動的を安定化する方法を提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:47:46 GMT)
BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics [2.2] BirdSetは、鳥のバイオ音響に焦点を当てたオーディオ分類のための大規模なベンチマークデータセットである。
我々は,3つの異なる学習シナリオにまたがる多ラベル分類において,よく知られた6つのDLモデルをベンチマークした。
私たちはHugging Faceにデータセットをホストし、簡単にアクセスできるようにしています。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:29:36 GMT)
SPECTRE: An FFT-Based Efficient Drop-In Replacement to Self-Attention for Long Contexts [2.2] 長文変換器は、自己注意の二次的なコストのため、大幅な効率の課題に直面している。
本稿では,各注目ヘッドを高速な実FFTで置き換えるSPECTREを提案する。
我々は、この効率をPrefix-FFTキャッシュを介して自動回帰生成に拡張し、オプションのウェーブレットモジュールで局所的な特徴表現を強化する。
論文参考訳(メタデータ) (Sun, 18 May 2025 03:12:25 GMT)
ALAS: A Stateful Multi-LLM Agent Framework for Disruption-Aware Planning [2.1] 本稿では,4つの基本的なLLM障害に対処するフレームワークであるAdaptive LLM Agent System (ALAS)を提案する。
ALASは各計画をロール特殊化エージェントに分解し、それらを自動状態トラッキングに装備し、軽量なプロトコルを介して調整する。
実世界の大規模ジョブショップスケジューリングベンチマークにおいて、ALASは静的シーケンシャルな計画のための新しい最良の結果を設定し、予期せぬ破壊を伴う動的リアクティブシナリオを最適化する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:27:08 GMT)
Wasserstein Barycenter Gaussian Process based Bayesian Optimization [2.1] 不確実性の下で学習し、最適化するための新しいアプローチを提案する。
Wasserstein Barycenter Gaussian Process based Bayesian Optimization (WBGP-BO) と呼ばれる新しい手法は、期待できる結果となり、最適に収束することができた。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:48:18 GMT)
ChemPile: A 250GB Diverse and Curated Dataset for Chemical Foundation Models [2.1] 我々は75億以上のキュレートされた化学データのトークンを含むオープンデータセットであるChemPileを提示する。
データセットは、化学による人間の学習の旅を反映している。
ChemPileは基本的な概念とドメイン固有の複雑さの両方をキャプチャする。
論文参考訳(メタデータ) (Sun, 18 May 2025 20:22:21 GMT)
Grounded in Context: Retrieval-Based Method for Hallucination Detection [2.0] 本稿では,Deepchecksの幻覚検出フレームワークであるGrounded in Contextを提案する。
RAGアーキテクチャにインスパイアされた本手法は,検索モデルと自然言語推論(NLI)モデルを統合し,事実整合性を予測する。
本フレームワークは,RAGTruthの応答レベル分類タスクにおいて,F1スコア0.83の支持クレームを識別する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:47:17 GMT)
Enriching Patent Claim Generation with European Patent Dataset [2.0] 欧州特許データセットであるEPDを導入する。EPDは、請求書生成を含む特許関連タスクをサポートするために、リッチテキストデータと構造化メタデータを提供する。
EPDは、より包括的な評価を可能にするための欧州特許のベンチマークを提供することで、重大なギャップを埋める。
実験の結果、EPDで微調整されたLCMは、以前のデータセットやGPT-4oのクレーム品質やドメイン間の一般化よりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 18 May 2025 23:04:49 GMT)
The power of text similarity in identifying AI-LLM paraphrased documents: The case of BBC news articles and ChatGPT [2.0] 本稿では,AIパラフレーズニュース認識のためのパターンベース類似度検出機能を示す。
記事がAIパラフレーズであるかどうかを検知するだけでなく,より重要なのは,侵害源がChatGPTであることを識別するアルゴリズムスキームを提案する。
その結果, 深層学習を使わないパターン類似性に基づく手法では, 精度96.23%, 精度96.25%, 感度96.21%, 特異度96.25%, F1得点96.23%でChatGPT助詞を検出することができた。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:16:30 GMT)
Decoding Rarity: Large Language Models in the Diagnosis of Rare Diseases [2.0] 大型言語モデル(LLM)は稀な疾患研究を変革する有望な能力を示している。
本稿では,レアな疾患の解析におけるLSMの統合について検討し,重要な進歩と重要な研究を取り上げる。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:42:15 GMT)
No Free Lunch in Active Learning: LLM Embedding Quality Dictates Query Strategy Success [2.0] 汎用表現を生成できる大規模言語モデル(LLM)により、深層能動学習(AL)の実践性を再考することができる。
本研究は,LLM埋込み品質が深いALの問合せ戦略に与える影響について,ベンチマークを定式化し,系統的に検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:38:26 GMT)
MMS-VPR: Multimodal Street-Level Visual Place Recognition Dataset and Benchmark [1.9] MMS-VPRは、歩行者のみの複雑な環境でストリートレベルの場所認識のための大規模なマルチモーダルデータセットである。
データセットは78,575枚の注釈付き画像と2,512本のビデオクリップからなり、中国・成都にある70,800ドルの屋外商業地区で207箇所で撮影された。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:21:13 GMT)
Unleashing Automated Congestion Control Customization in the Wild [1.5] Congestion Control (CC)は、ストリーミング、ゲーム、AR/VR、コネクテッドカーといったインターネットサービス全体のユーザエクスペリエンスに重要な影響を与える。
伝統的にCCアルゴリズム設計は、多様なアプリケーションドメインやネットワークにまたがって高い性能をもたらす普遍的な制御規則を求める。
我々は,サービスニーズやネットワーク条件に対して,渋滞制御ロジックを自動的にカスタマイズするシステムで運用経験を共有する。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:29:19 GMT)
EcoLearn: Optimizing the Carbon Footprint of Federated Learning [1.4] Federated Learning (FL)は、データ転送オーバーヘッドを低減し、データのプライバシを保護するために、エッジデバイスに機械学習(ML)トレーニングを分散する。
FLモデルトレーニングは数百のデバイスにまたがる可能性がある。
FLのカーボンフットプリントを最小化するEcoLearnを設計し、モデル精度やトレーニング時間に大きな影響を与えない。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:18:48 GMT)
LLM-Based Evaluation of Low-Resource Machine Translation: A Reference-less Dialect Guided Approach with a Refined Sylheti-English Benchmark [1.4] 本稿では,Large Language Models(LLMs)に基づく機械翻訳評価を強化する包括的フレームワークを提案する。
我々は、Sylheti- English文ペア、対応する機械翻訳、およびネイティブ話者が注釈付けしたダイレクトアセスメント(DA)スコアを組み込むことで、ONUBADデータセットを拡張した。
評価の結果,提案したパイプラインは既存の手法より常に優れており,スピアマン相関において+0.1083の高利得が得られることがわかった。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:24:13 GMT)
Flexible Prefrontal Control over Hippocampal Episodic Memory for Goal-Directed Generalization [1.4] 人間は数日から何年も前にエピソード記憶を復元し、新しいが構造的に関係のある状況にまたがって行動のコンテキスト化と一般化を行う。
前頭前皮質(PFC)と海馬(HPC)の相互作用による脳の課題要求に基づくてんかん記憶の制御能力
ゴール指向一般化のためのPFC-HPC相互作用機構を組み込んだ強化学習モデルを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:37:58 GMT)
From Shots to Stories: LLM-Assisted Video Editing with Unified Language Representations [0.9] 大言語モデル(LLM)と視覚言語モデル(VLM)は、ビデオ理解において顕著な推論と一般化能力を示している。
本稿では,ビデオ編集の文脈におけるLLMの体系的研究について述べる。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:25:11 GMT)
Structural restrictions in local causal discovery: identifying direct causes of a target variable [0.9] 観測的関節分布から対象変数の直接的な原因の集合を学ぶことは、科学の基本的な問題である。
ここでは、完全なDAGではなく、1つのターゲット変数の直接的な原因を特定することにのみ関心があります。
これにより、識別可能性の仮定を緩和し、より高速で堅牢なアルゴリズムを開発することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:41:20 GMT)
Wisdom from Diversity: Bias Mitigation Through Hybrid Human-LLM Crowds [0.9] 大規模言語モデル(LLM)は、トレーニングされたデータから見出されるバイアスを必然的に永続することができる。
反応アグリゲーションによるバイアス軽減のための群集型戦略について検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:29:24 GMT)
Universal adjointation of isometry operations using conversion of quantum supermaps [0.8] 本稿では,入力等長演算をその随伴演算に変換するアイソメトリ随伴プロトコルを提案する。
等方性随伴および普遍誤差検出における一般的なプロトコルの最適性能は出力次元に依存しないことを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:29:14 GMT)
Quantitative Energy Prediction based on Carbon Emission Analysis by DPR Framework [0.8] 本研究では,DBSCANクラスタリングとElastic Net回帰モデルを統合する新しい分析フレームワークを提案する。
DBSCANは教師なし学習で特徴を客観的にクラスタリングし、Elastic Netは高次元の特徴選択と複雑性制御に使用される。
この研究は、炭素排出量などの複雑な地域課題を分析するためのフレームワークのグローバルな適用性を強調し、排出量削減の可能性を強調している。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:28:31 GMT)
BenSParX: A Robust Explainable Machine Learning Framework for Parkinson's Disease Detection from Bengali Conversational Speech [0.8] パーキンソン病(PD)は世界的な健康問題を引き起こし、バングラデシュではPD死亡率が顕著に上昇している。
PD検出のための最初のベンガル会話音声データセットであるBenSparXについて述べる。
また、早期診断に適した堅牢で説明可能な機械学習フレームワークも提示する。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:58:36 GMT)
RAGXplain: From Explainable Evaluation to Actionable Guidance of RAG Pipelines [0.7] RAGXplainは、RAGのパフォーマンスを定量化し、これらの評価を明確な洞察に変換する評価フレームワークである。
したがって、RAGXplainは定量的評価と実用的な最適化を橋渡しし、ユーザーがAIシステムを理解し、信頼し、拡張することを可能にする。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:25:34 GMT)
Model alignment using inter-modal bridges [0.7] 既存の方法は、広範なペアトレーニングデータを必要とするか、特定のドメインに制約される。
条件付きフローマッチングによるモデルアライメントのための半教師付きアプローチを提案する。
本手法は、最小限の監督を伴い、モーダル間モデルアライメントのためのデータ効率のよいソリューションを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:30:02 GMT)
Synthetic History: Evaluating Visual Representations of the Past in Diffusion Models [0.6] HistVisデータセットは、3つの最先端拡散モデルによって生成される3万の合成画像のキュレートされたコレクションである。
生成した画像は3つの重要な側面 – 暗黙のスティリスティック・アソシエーション, ヒストリシスタンス, デモグラフィック・リ表現 – で評価した。
歴史的にテーマ化された画像の体系的不正確さは,TTIが非定型的スタイルを取り入れた過去のステレオタイプをしばしばモデル化していることから明らかとなった。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:35:23 GMT)
Exploring Quantum Aspects of Dark Matter Axions and Dark Photons Transitioning to Photons in a Resonant Cavity [0.6] 量子レベルでは、単一の軸イオン-光子遷移は空洞品質係数$Q$で増幅されることを示す。
ダークマター波のコヒーレンスは測定中に不要である。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:50:01 GMT)
Remote sensing colour image semantic segmentation of trails created by large herbivorous Mammals [0.5] 我々は、放牧跡を自動的に検出する機械学習手法を評価した。
提案手法は,連続した時間的に放牧経路の変化をマッピングし,追跡するツールの基盤として利用することができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:05:01 GMT)
Training Latent Diffusion Models with Interacting Particle Algorithms [0.4] 本稿では,潜伏拡散モデルのエンドツーエンド学習のための新しい粒子ベースアルゴリズムを提案する。
後者を相互作用する粒子の系と近似することにより, 理論的には誤差保証を提供することで, アルゴリズムの基盤となるものを得る。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:29:07 GMT)
TSLFormer: A Lightweight Transformer Model for Turkish Sign Language Recognition Using Skeletal Landmarks [0.4] TSLFormerは、手話のジェスチャーを順序づけられた文字列のような言語として扱う。
メソッドは、GoogleのMediapipeライブラリから抽出された3Dジョイントポジションでのみ動作する。
その結果, 聴覚障害者を対象としたリアルタイム, 移動型, 支援型コミュニケーションシステムの実現には, 共同入力が十分であることが示唆された。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:56:46 GMT)
CAPTURE: Context-Aware Prompt Injection Testing and Robustness Enhancement [0.3] 攻撃検出と過防衛傾向の両方を評価する新しい文脈認識ベンチマークであるCAPTUREを紹介する。
実験の結果,現行のプロンプトインジェクションガードレールモデルでは,敵のケースでは高い偽陰性,良性シナリオでは過剰な偽陽性に悩まされていることが明らかとなった。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:14:14 GMT)
Neural Thermodynamics I: Entropic Forces in Deep and Universal Representation Learning [0.3] 本稿では、勾配降下学習ニューラルネットワークの学習力学を理解するための厳密なエントロピー力理論を提案する。
表現学習は、対称性と離散時間更新から生じる創発的エントロピー力によって決定的に制御されていることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:25:42 GMT)
An In-kernel Forensics Engine for Investigating Evasive Attacks [0.3] 本稿では,Windows オペレーティングシステムの脅威分析と鑑定を行うための,オープンソースのローアーティファクト・フォレスティクス・エンジン LASE を紹介する。
LASEは、検出可能なアーティファクトを最小限にしつつ、詳細なシステム全体の監視機能を提供することで、現在の分析ツールを拡張している。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:54:13 GMT)
Decoding the Mind of Large Language Models: A Quantitative Evaluation of Ideology and Biases [0.3] 大規模言語モデル(LLM)を評価するための新しいフレームワークを提案する。
このフレームワークをChatGPTとGeminiに適用することにより、LLMは一般的に多くのトピックについて一貫した意見を保っているが、そのイデオロギーはモデルや言語によって異なることがわかった。
どちらのモデルも問題のある偏見、非倫理的または不公平な主張を示しており、社会に悪影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:52:06 GMT)
Information Extraction from Visually Rich Documents using LLM-based Organization of Documents into Independent Textual Segments [0.3] 特殊な非LLM NLPベースのソリューションは、典型的にはテキスト情報と幾何学情報の両方を用いたトレーニングモデルを含む。
BLOCKIEは,VRDを局所的で再利用可能なセマンティックテキストセグメントに整理する,新しいLCMベースのアプローチである。
当社のアプローチは、F1スコアの1-3%で、公開VRDベンチマークの最先端よりも優れています。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:49:17 GMT)
Quantum Algorithms for Inverse Participation Ratio Estimation in multi-qubit and multi-qudit systems [0.2] 逆参加比は、ヒルベルト空間の選択された基底上での量子状態の拡散を定量化する。
我々は、マルチキュービットおよびマルチキュービット量子デバイス上でのIPPを推定する3つの量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:48:22 GMT)
CTLformer: A Hybrid Denoising Model Combining Convolutional Layers and Self-Attention for Enhanced CT Image Reconstruction [0.2] 低線量CT(LDCT)画像は、しばしば大きなノイズを伴い、画像の品質とその後の診断精度に悪影響を及ぼす。
本稿では、畳み込み構造とトランスアーキテクチャを組み合わせた革新的なモデルCTLformerを紹介する。
マルチスケールアテンション機構とダイナミックアテンション制御機構の2つの重要な革新が提案されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:37:50 GMT)
MASSV: Multimodal Adaptation and Self-Data Distillation for Speculative Decoding of Vision-Language Models [0.1] 視覚言語モデル(MASSV)の投機的復号化のためのマルチモーダル適応と自己データ蒸留を導入する。
MASSVは、既存の小さな言語モデルを2段階のアプローチで効果的なマルチモーダルドラフトに変換する。
Qwen2.5-VL と Gemma3 モデルファミリでの実験では、MASSV が許容される長さを最大30%増加し、視覚的に接地されたタスクで最大 1.46 倍のエンドツーエンドの推論速度を提供することを示した。
論文参考訳(メタデータ) (Sun, 18 May 2025 01:30:08 GMT)
Engineering application of physics-informed neural networks for Saint-Venant torsion [0.1] 本研究の目的は,サン=ヴェナント・トーション方程式を解くための物理インフォームドニューラルネットワーク(PINN)に基づく,一連の新しい数値計算手法を開発することである。
まず,任意の断面ジオメトリを持つバーのねじり定数を計算するためにPINNソルバを開発した。
これに続いて、鋭い幾何学的遷移を持つケースを扱える解決器の開発が進められ、変数スケーリングPINN(VS-PINN)が開発された。
最後に,従来のシングルインスタンスPINNの限界に対処するパラメトリックPINNを構築した。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:30:06 GMT)
Visibility Stokes parameters as a foundation for quantum information science with undetected photons [0.0] 本研究では,未検出光子の偏光を測定値に基づいて定量化するパラメータを提案する。
未検出光子の環境と再生過程におけるその役割を網羅的に分析する。
これらのパラメータは、測定プロセスのより直感的で一貫した理解をもたらすため、未検出光子に適応できる確立された量子情報プロトコルがいくつかあると信じている。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:38:48 GMT)
Vague Knowledge: Evidence from Analyst Reports [0.0] 我々は、曖昧な情報を伝える能力が異なる言語は、主観的な期待において重要なが、あまり知られていない役割を担っていると論じる。
彼らのレポートでは、アナリストは言語表現に有用な情報を含んでいるが、数値予測は含まない。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:18:58 GMT)
The taggedPBC: Annotating a massive parallel corpus for crosslinguistic investigations [0.0] タグ付きPBCは1500以上の言語から1,800以上のposタグ付き並列テキストデータを含む。
このデータセットのタグの精度は、両方の既存のSOTAタグと高いソース言語との相関関係が示されている。
このデータセットから得られた新しい尺度であるN1比は,3つの類型的データベースにおける単語順の専門的決定と相関する。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:13:32 GMT)
Tailoring the van der Waals interaction with rotation [0.0] 真空中における浮遊ナノ粒子間のファンデルワールス力の工学的手法を示す。
極性共鳴に近い回転周波数を調整することにより、ファンデルワールスアトラクションを著しく高めることができる。
論文参考訳(メタデータ) (Sun, 18 May 2025 00:21:47 GMT)
Spin manipulation and nuclear polarization enhancement in particle beams with static magnetic fields [0.0] 非相対論的粒子ビーム中のスピンダイナミクスと相互作用する角モータが静的で空間的に変化する磁場を横断する理論的研究を示す。
これらのフィールドは、部分的に、不整合に偏光した水素と重水素原子ビームにおいて、核偏光を効果的に増強することができることが示されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:59:33 GMT)
Scalable Strategies for Continual Learning with Replay [0.0] リプレイは継続学習において基礎的な役割を担い、モデルが過去の知識と新しい情報を一致させることができることを示す。
しかし実際には、リプレイは極めて難解であり、ナイーティブな適用では継続学習のコストが2倍になる。
コンソリデーション(consolidation)は、特定のパフォーマンスターゲットに必要なリプレイサンプルを最大55%削減する、リプレイのためのファシックなアプローチである。
次に、連続的な学習環境に合わせたタスク演算のオフシュートであるシーケンシャルマージを提案し、リプレイと組み合わせてうまく動作することを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 18:23:50 GMT)
Road Segmentation for ADAS/AD Applications [0.0] 我々は、Comma10kデータセット上の修正VGG-16と、KITTI Roadデータセット上の修正U-Netをトレーニングする。
どちらのモデルも精度が高く、VGG-16はU-Netよりも優れており、U-Netはよりエポックな訓練を受けた。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:43:08 GMT)
Revealing hidden nonlocality and preparation contextuality for an arbitrary input Bell inequality [0.0] 混合絡み合った状態の集合に対する非局所性の活性化と準備状況について検討した。
局所的な混合絡み合った状態における局所的なフィルタリング操作を用いることで、混合度パラメータの任意のゼロ値に対して非局所性を明らかにすることができることを示す。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:18:13 GMT)
Quantum-Enhanced Channel Mixing in RWKV Models for Time Series Forecasting [0.0] 我々はRWKVモデルのハイブリッド量子古典拡張であるQuantumRWKVを提案する。
量子成分は、エンドツーエンドの微分性を保ちながら非線形表現能力を高めるように設計されている。
この研究は、時間領域におけるハイブリッド量子古典モデルと古典的リカレントモデルの間の最初の体系的な比較の1つを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 02:19:30 GMT)
Protocol as Poetry: Case Study on Pak's Protocol Arts [0.0] プロトコルアートは、ブロックチェーンベースのスマートコントラクトと、概念アート、参加アート、アルゴリズム生成アートプラクティスの1世紀にわたる系統の合流時に出現する。
本稿では、スマートコントラクトをメディアとして扱い、プロトコル参加をメッセージとして扱う、早期かつ影響力のある疑似プロトコルアーチストであるPakによる、プロトコルアートのパイオニア化に関するケーススタディを提供する。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:43:10 GMT)
Probing new physics in the top sector using quantum information [0.0] 近年の研究では、量子情報理論の量的概念がコライダー物理学の分析に重要な役割を果たしていることが示されている。
標準モデル有効場理論によってモデル化された一般的な新しい物理シナリオにおいて、マジック、トレース距離、忠実度距離を含む様々なQI尺度について検討する。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:12:22 GMT)
Persuasion and Safety in the Era of Generative AI [0.0] EU AI法(EU AI Act)は、情報的意思決定を弱めるためにマニピュティブまたは偽装技術を使用するAIシステムを禁止している。
私の論文は、この領域における実証研究の欠如に対処し、説得的手法の分類学を開発しました。
説得型AIのリスクを軽減するためのリソースを提供し、生成型AIの時代における倫理的説得に関する議論を促進する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:04:46 GMT)
PINN-DT: Optimizing Energy Consumption in Smart Building Using Hybrid Physics-Informed Neural Networks and Digital Twin Framework with Blockchain Security [0.0] 本研究は,予測エネルギー最適化を強化するための多面的手法を提案する。
このモデルは、スマートメーターエネルギー消費データ、再生可能エネルギー出力、動的価格設定、IoTデバイスから収集されたユーザの好みなど、包括的なデータセットを使用してトレーニングされ、検証された。
提案手法は平均絶対誤差(MAE)が0.237 kWh、ルート平均平方誤差(RMSE)が0.298 kWh、R2が0.978、データ分散の97.8%で予測性能に優れていた。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:36:54 GMT)
PANORAMA: A synthetic PII-laced dataset for studying sensitive data memorization in LLMs [0.0] 機密情報と個人識別情報の記憶は プライバシーのリスクを増大させる
センシティブなPIIデータを記憶し、緩和戦略を開発するための既存の取り組みは、現実的なデータセットの欠如によって妨げられている。
本稿では,自然主義的オンライン表現と属性記憶分析のためのプロファイルベースのアセンブラであるPANORAMAを紹介する。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:27:35 GMT)
Opening the Black Box of Local Projections [0.0] ローカルプロジェクション(LP)は、政策介入に対するインパルス応答を推定するために経験的マクロ経済学で広く用いられている。
本稿では,過去の出来事のコントリビューションの総和にLP推定の新たな分解を導入する。
我々は、しばしば集中的なインパルス応答推定の主要因として、ニクソンがフェデラルへの干渉、停滞、第二次世界大戦、アグン山火山噴火エマージュなど、容易に特定できる出来事を発見した。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:46:35 GMT)
On the Well-Posedness of Green's Function Reconstruction via the Kirchhoff-Helmholtz Equation for One-Speed Neutron Diffusion [0.0] 本研究は, 原子炉内の中性子フラックスの空間分布を, 元核検出器から得られた実時間測定を利用して再構成する手法を提案する。
キルヒホフ・ヘルムホルツ方程式(K-H)は本質的に境界データに基づいて領域内のスカラー場を推定する問題を定義している。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:30:46 GMT)
Nonlinear optical realization of non-integrable phases accompanying quantum phase transitions [0.0] 動的方程式におけるエキゾチック項は、四角形対称性を持つ異方性低複屈折ファイバーに沿って光学場の非線形偏光を支配していることを示す。
ファイバーに沿った非線形感受性の漸近調整により、ポアンカー球面上のストークスベクトルはハンナイ角と呼ばれる非可積分位相を蓄積する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:23:04 GMT)
Noise-Robust Self-Testing: Detecting Non-Locality in Noisy Non-Local Inputs [0.0] 非局所ゲームは量子系の非局所性と絡み合いをテストする。
これらは、信頼できないデバイスにおける量子状態の証明にセルフテストで使用される。
現在の文献には、ノイズ・ロバスト性の標準化された尺度が欠けている。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:55:33 GMT)
Multi-CALF: A Policy Combination Approach with Statistical Guarantees [0.0] 相対値改善に基づく強化学習ポリシーをインテリジェントに組み合わせたアルゴリズムであるMulti-CALFを導入する。
提案手法は、標準のRLポリシーと理論的に支持された代替ポリシーを統合し、正式な安定性保証を継承する。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:30:24 GMT)
Modeling error correction with Lindblad dynamics and approximate channels [0.0] ノイズの異なる近似がコードの成功率をどのように捉えているかを研究する。
パウリ近似は単一量子チャネルを超えており、ノイズ、状態、デコーダの詳細に敏感である。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:59:00 GMT)
Modeling Nonstationary Extremal Dependence via Deep Spatial Deformations [0.0] 定常モデルと等方性モデルの推論は比較的容易であるが、これらのモデルの基礎となる仮定は、大きな領域や地形上の複雑な領域で観測されるデータによって満たされることは滅多にない。
空間モデルにおける非定常性の調節の可能なアプローチは、静止性と等方性が合理的に仮定できる潜在空間に空間領域をワープすることである。
これらの課題を克服するために、極端依存における非定常性を捉えるための深層構成空間モデルを開発する。
論文参考訳(メタデータ) (Sun, 18 May 2025 21:22:00 GMT)
Modeling Aesthetic Preferences in 3D Shapes: A Large-Scale Paired Comparison Study Across Object Categories [0.0] 本研究では,Amazon Mechanical Turkを通じて,5つの対象カテゴリー(椅子,テーブル,マグカップ,ランプ,ダイニングチェア)にまたがる人間の嗜好を大規模に調査する。
審美的嗜好の幾何学的要因を明らかにするために,新しい非線形モデリングとクロスカテゴリ分析を導入する。
この研究は、人間中心のデータ駆動フレームワークを通じて、3D形状の美学の理解を深める。
論文参考訳(メタデータ) (Sun, 18 May 2025 11:30:32 GMT)
Model Discovery with Grammatical Evolution. An Experiment with Prime Numbers [0.0] 機械学習は、入力出力データのみに基づいて効率的な決定と予測モデルを生成する。
本稿では,そのようなモデルを生成する非自明な実験について報告する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:22:21 GMT)
Measuring Information Distortion in Hierarchical Ultra long Novel Generation:The Optimal Expansion Ratio [0.0] 高品質な百万語小説を制作するには,人間によるアウトラインがどの程度必要かを検討する。
階層的な2段階生成パイプラインを導入し、情報保存と人的努力のバランスをとる最適なアウトライン長を求める。
本研究は,大規模言語モデルと協調する著者や研究者に対して,実証的な指導を行うものである。
論文参考訳(メタデータ) (Sun, 18 May 2025 23:20:01 GMT)
Machine Learning-Based Prediction of ICU Mortality in Sepsis-Associated Acute Kidney Injury Patients Using MIMIC-IV Database with Validation from eICU Database [0.0] Sepsis-Associated acute Kidney Injury (SA-AKI) は集中治療において高い死亡率をもたらす。
本研究では,SA-AKI患者のICU死亡率を予測する機械学習モデルを開発した。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:47:28 GMT)
LLM Context Conditioning and PWP Prompting for Multimodal Validation of Chemical Formulas [0.0] 本研究では,PWP(Persistent Prompting, Persistent Prompting, パーシステント・プロンプト・プリンティング)の原理によって誘導される構造的文脈条件付けについて, 推論時にその振る舞いを調節するための方法論的戦略として検討する。
このアプローチは、正確な検証タスクのために、容易に利用できる汎用の大規模言語モデル(LLM)の信頼性を高めるように設計されている。
基本的なプロンプトは信頼できないが、PLMの分析的考え方を厳格に条件付けるためにPWP構造を適用するアプローチは、両方のモデルでテキストエラーの識別を改善するように見えた。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:33:08 GMT)
Introspective Growth: Automatically Advancing LLM Expertise in Technology Judgment [0.0] 大きな言語モデル(LLM)は、概念的理解の兆候をますます示している。
彼らの内部知識の多くは、潜伏し、ゆるやかに構造化され、アクセスや評価が難しいままである。
LLMの理解を改善するための軽量でスケーラブルな戦略として,自己問合せを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:04:02 GMT)
Improving Targeted Molecule Generation through Language Model Fine-Tuning Via Reinforcement Learning [0.0] 我々は,特定のタンパク質を標的とした薬物を設計する言語モデルの能力を活かしたデノボ医薬品設計戦略を導入する。
提案手法は, 薬物-標的相互作用と分子的妥当性を考慮した複合報酬関数を統合する。
論文参考訳(メタデータ) (Sun, 18 May 2025 22:24:39 GMT)
Improving LLM Outputs Against Jailbreak Attacks with Expert Model Integration [0.0] Archiasはドメイン内通信とドメイン外通信を区別できるエキスパートモデルである。
Archiasは、ユーザからの問い合わせを、ドメイン内(特に自動車業界)、悪意のある質問、価格注入、インジェクションのプロンプト、ドメイン外の例に分類する。
アーチは調整され、微調整され、小型のため様々な目的に使用される。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:13:07 GMT)
Future of Code with Generative AI: Transparency and Safety in the Era of AI Generated Software [0.0] この研究は、AI生成コードの透明性と安全性に対する重要なニーズに対処する。
我々は、AI生成コードを検出する市場機会を分析し、複雑さの増加を管理する上での課題について議論する。
本研究では,AI生成コードの長期的影響について検討し,人工知能の開発における潜在的な役割と,人間のAIインタラクションへの影響について考察した。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:01:41 GMT)
From the Bloch equation to a thermodynamically consistent master equation [0.0] 我々は厳密なエネルギー保存の単一の制約の下で、リンドブラッドマスター方程式の数学的に等価な形式を示す。
要素的ブロッホ方程式は系の力学をその要素的部分に分離し、熱混合、脱落、エネルギー緩和を明確に区別する。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:50:07 GMT)
Few-Shot Concept Unlearning with Low Rank Adaptation [0.0] 画像を生成する場合、これらのモデルは機密画像データを生成することができ、プライバシーを脅かしたり、プライベートエンティティの著作権法に違反する可能性がある。
テキストエンコーダの最終層の勾配を更新することにより,拡散モデルにおける概念の影響を除去するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:44:30 GMT)
Fairness in AI-Driven Recruitment: Challenges, Metrics, Methods, and Future Directions [0.0] 改革プロセスは、組織のパフォーマンス、生産性、文化に大きな影響を与えます。
本稿では、AIによる採用システムで特定されるバイアスを体系的にレビューし、公正度指標とバイアス軽減手法を分類し、実際に使用される監査手法を強調した。
論文参考訳(メタデータ) (Sun, 18 May 2025 16:59:48 GMT)
Experimental Quantum Simulation of Chemical Dynamics [0.0] 量子コンピュータは効率的な化学シミュレーションを約束するが、既存の量子アルゴリズムは多くの論理量子ビットとゲートを必要とする。
ここでは、よりハードウェア効率の良い符号化方式を用いて、化学力学の最初の量子シミュレーションを行う。
我々の閉じ込められたイオンデバイスは、非断熱化学プロセスのダイナミクスを正確にシミュレートする。
論文参考訳(メタデータ) (Sun, 18 May 2025 23:44:08 GMT)
EuLearn: A 3D database for learning Euler characteristics [0.0] EuLearnは、位相型の多様性を等しく表す最初の表面データセットである。
トポロジ的特徴を識別できる機械学習システムの訓練を容易にすることを目的としている。
論文参考訳(メタデータ) (Sun, 18 May 2025 19:22:04 GMT)
Enhancing LLM Evaluations: The Garbling Trick [0.0] 本稿では,既存の大規模言語モデル(LLM)の評価を,段階的に困難なタスクに変換する手法を提案する。
これらの強化された評価は推論能力を強調し、元の評価では明らかでない相対的な性能差を明らかにすることができる。
以上の結果から,これらのモデルの比較能力に関する知見が得られ,特に,ベースLLMとより最近の「推論」モデルの違いが強調された。
論文参考訳(メタデータ) (Sun, 18 May 2025 04:56:06 GMT)
Co-Designing a Chatbot for Culturally Competent Clinical Communication: Experience and Reflections [0.0] 医学生のための文化的に有能なコミュニケーショントレーニングを支援するために,AI駆動型ロボットの利用について検討する。
このロボットは、現実的な患者の会話をシミュレートし、ACT文化能力モデルに基づく構造化されたフィードバックを提供するように設計されている。
私たちはこのロボットを、2024年にイギリスの医学部で3年生の小さなグループでテストしました。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:21:46 GMT)
Can ChatGPT capture swearing nuances? Evidence from translating Arabic oaths [0.0] 30人のアラビア語の誓いが文献から集められた。
30の誓いを最初にChatGPTで翻訳し、ChatGPTで満たされていないギャップの種類で人間の翻訳と比較した。
誓いのChatGPT翻訳はいまだに不満足であり、ChatGPTのさらなる発展の必要性を明らかにしている。
論文参考訳(メタデータ) (Sun, 18 May 2025 17:38:06 GMT)
Beyond Conventional Transformers: The Medical X-ray Attention (MXA) Block for Improved Multi-Label Diagnosis Using Knowledge Distillation [0.0] 我々は,X線異常検出の課題に対処するための新しい注意機構である,医療用X線注意ブロック(MXA)を提案する。
提案手法は曲線(AUC)の0.85の領域を達成し,ベースラインモデル(AUC)の0.66に比べて0.19の絶対的な改善を実現した。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:07:13 GMT)
Benchmarking quantum computers via protocols [0.0] 量子コンピュータのベンチマークは、単一の量子ビットやゲートのパラメータを扱うことが多い。
本稿では,量子コンピュータのベンチマークにプロトコルを用いることを提案する。
論文参考訳(メタデータ) (Sun, 18 May 2025 14:27:37 GMT)
BeliefNest: A Joint Action Simulator for Embodied Agents with Theory of Mind [0.0] BeliefNestはオープンソースのシミュレーターで、インボディードエージェントがマインドの理論を活用することで協調的なタスクを実行できるように設計されている。
我々は,エージェントが他人の信念を推測し,その信念に基づく行動を予測する実験を通して実証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 09:26:48 GMT)
Attention-Enhanced U-Net for Accurate Segmentation of COVID-19 Infected Lung Regions in CT Scans [0.0] 我々は、畳み込みニューラルネットワークを用いた新型コロナウイルスCTスキャンにおいて、感染した肺領域の自動セグメンテーションのための堅牢な手法を提案する。
このアプローチは、アテンション機構、データ拡張、後処理技術を備えた改良されたU-Netアーキテクチャに基づいている。
論文参考訳(メタデータ) (Sun, 18 May 2025 08:27:12 GMT)
Adaptive MPC-based quadrupedal robot control under periodic disturbances [0.0] 本研究は, 軽量回帰器を用いた周期的乱れの推定に充てられる。
シミュレーション設定、コード、計算スクリプトを含むすべてのソースファイルはGitHubで入手できる。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:48:38 GMT)
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning [0.0] 本稿では,PWP(Persistent Prompting)について紹介する。
本稿では,実験化学原稿の批判的分析のための概念実証PWPプロンプトを提案する。
我々は,このPWPプロンプトを,専門家レビューの体系化を目的としたメタプロンプト技術とメタ推論の反復的適用により開発する。
論文参考訳(メタデータ) (Sun, 18 May 2025 06:53:56 GMT)
AI- Enhanced Stethoscope in Remote Diagnostics for Cardiopulmonary Diseases [0.0] 本研究は, 肺と心臓の状態を同時に診断するためのAIを, 聴診音を用いて統合する, 革新的かつ効率的なモデルを提案する。
すでに高価格のデジタル聴診器と異なり、提案したモデルは低コストの組込みデバイスに展開するよう特に設計されている。
提案モデルでは,MFCCの特徴抽出と工学的手法を用いて,信号が正確な診断のために適切に解析されていることを保証する。
論文参考訳(メタデータ) (Sun, 18 May 2025 12:59:15 GMT)
A universal policy wrapper with guarantees [0.0] 強化学習エージェントのためのユニバーサルポリシーラッパーを導入する。
我々のラッパーは、高性能ベースポリシーとフォールバックポリシーを選択的に切り替える。
追加のシステム知識やオンライン制約付き最適化を必要としない。
論文参考訳(メタデータ) (Sun, 18 May 2025 10:37:27 GMT)
A Survey on State-of-the-art Deep Learning Applications and Challenges [0.0] ディープラーニングモデルの構築は、アルゴリズムの複雑さと現実世界の問題の動的な性質のため、難しい。
本研究の目的は,コンピュータビジョン,自然言語処理,時系列解析,広範コンピューティングにおける最先端のディープラーニングモデルを網羅的にレビューすることである。
論文参考訳(メタデータ) (Sun, 18 May 2025 05:07:11 GMT)
A Learning-Based Ansatz Satisfying Boundary Conditions in Variational Problems [0.0] ディープリッツ法は、変分問題に対するテスト関数としてニューラルネットワークを用いる。
ニューラルネットワークは、変動問題の境界条件を本質的に満たさない。
変分問題の境界条件を本質的に満足するアンザッツが提案されている。
論文参考訳(メタデータ) (Sun, 18 May 2025 13:58:42 GMT)
A Case for Library-Level k-Means Binning in Histogram Gradient-Boosted Trees [0.0] そこで本研究では,k平均離散化器を量子化器に置き換えることを提案する。
我々は、このスワップを33のOpenMLタスクに加えて、モダリティ、スキュー、ビンの予算を管理するシンセサイザーでテストする。
k-平均は、余分なカットがほとんど値を加えないときの正確な分割と同等の誤差を保ちながら、定量化の見落としとなる重要な分割点を回復する。
論文参考訳(メタデータ) (Sun, 18 May 2025 15:28:06 GMT)
$K$-MSHC: Unmasking Minimally Sufficient Head Circuits in Large Language Models with Experiments on Syntactic Classification Tasks [0.0] 我々は,分類作業に不可欠な最小限の注意点を識別する手法である$(bmK, epsilon)$-Minimum Sufficient Head Circuitを導入する。
検索-K-MSHCアルゴリズムをGemma-9Bに適用し、文法受容性、算術検証、算術語問題という3つの構文的タスクファミリを解析する。
本研究により, タスク固有のヘッド回路が明らかになり, 初期層を利用した文法タスク, 浅い領域と深い領域の両方で顕著な活動を示す単語問題, ネットワークにまたがるより分散したパターンを示す算術的検証が実現した。
論文参考訳(メタデータ) (Sun, 18 May 2025 07:15:01 GMT)