Parameter-Efficient Fine-Tuning for Continual Learning: A Neural Tangent Kernel Perspective [125.0] 本稿では,タスク関連機能を適応的に生成しながら,タスク固有のパラメータ記憶を不要にする新しいフレームワークNTK-CLを紹介する。
最適化可能なパラメータを適切な正規化で微調整することにより、NTK-CLは確立されたPEFT-CLベンチマーク上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:36:29 GMT)
SPC: Evolving Self-Play Critic via Adversarial Games for LLM Reasoning [99.6] セルフプレイ批判(Self-Play Critic、SPC)は、対戦型セルフプレイゲームを通じて推論ステップを評価する能力を進化させる新しいアプローチである。
SPCは、ベースモデルの2つのコピーを微調整して、2つの役割、すなわち「スニーキージェネレータ」と「批判的」を演じる。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:32:38 GMT)
Chain-of-Model Learning for Language Model [91.8] 本稿では,各レイヤの隠れ状態に因果関係を組み込んだ新しい学習パラダイムであるChain-of-Model(CoM)を提案する。
本稿では, 各層に隠された状態を, 隠された次元の複数の部分表現(すなわち鎖)の組み合わせとして定式化する, チェーン・オブ・表現(CoR)の概念を紹介する。
さらに,COLMをベースとしたKV共有機構を導入し,第1チェーン内のキーと値を計算し,全チェーン間で共有する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:06:12 GMT)
NTIRE 2025 Challenge on Efficient Burst HDR and Restoration: Datasets, Methods, and Results [89.9] NTIRE 2025 Efficient Burst HDR and Restoration Challengeをレビューする。
この課題は、新しいRAWマルチフレームフュージョンデータセットに基づいている。
最高性能のアプローチはPSNRの43.22dBを達成した。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:10:22 GMT)
STORYANCHORS: Generating Consistent Multi-Scene Story Frames for Long-Form Narratives [82.2] 本稿では,高品質でマルチシーンなストーリーフレームを生成するための統合フレームワークであるStoryAnchorsを紹介する。
StoryAnchorsは、時間的一貫性を確保するために、過去と将来の両方のコンテキストを統合する双方向のストーリージェネレータを使用している。
また、マルチイベントストーリーフレームラベリングとプログレッシブストーリーフレームトレーニングを統合し、モデルが包括的な物語の流れとイベントレベルのダイナミクスの両方をキャプチャできるようにする。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:50:44 GMT)
DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection [80.2] DiffusionADは、再構成サブネットワークとセグメンテーションサブネットワークからなる、新しい異常検出パイプラインである。
高速なワンステップデノゲーションパラダイムは、同等の再現品質を維持しながら、数百倍の加速を達成する。
異常の出現の多様性を考慮し、複数のノイズスケールの利点を統合するためのノルム誘導パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:30:17 GMT)
FlashBias: Fast Computation of Attention with Bias [77.4] 本稿では,低ランク圧縮センシング理論に基づくFlashBiasを提案する。
FlashBiasは、最新のGPUで非常に最適化された行列乗算演算をフル活用でき、AlphaFoldの1.5$times$スピードアップ、そして2$times$スピードアップを達成した。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:12:50 GMT)
Unveiling Knowledge Utilization Mechanisms in LLM-based Retrieval-Augmented Generation [77.1] 検索強化世代(RAG)は知識範囲の拡大に広く利用されている。
RAGは、オープンドメインの質問応答のような知識集約的なタスクを約束しているので、複雑なタスクやインテリジェントアシスタントへの幅広い応用は、その実用性をさらに進歩させてきた。
本稿では、RAGが内部(パラメトリック)知識と外部(検索)知識を統合する本質的なメカニズムを体系的に検討する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:13:13 GMT)
Omni-ID: Holistic Identity Representation Designed for Generative Tasks [75.3] Omni-IDは、様々な表現にまたがる個人の外観に関する全体的な情報をエンコードする。
様々な数の非構造化入力画像から情報を構造化表現に集約する。
様々な生成タスクにまたがる従来の表現よりも大幅に改善されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:50:50 GMT)
ToLeaP: Rethinking Development of Tool Learning with Large Language Models [74.6] 33のベンチマークを再現し,その中の7つのベンチマークをワンクリックで評価することで,41の言語モデル(LLM)のツール学習能力を検証した。
1) ベンチマークの限界は,(2) 自律学習の無視と欠如,(3) 一般化,(4) LLMの長期タスク解決能力の両方を引き起こす。
今後の進歩を支援するため,(1)現実世界のベンチマーク構築,(2)互換性に配慮した自律学習,(3)思考による合理的学習,(4)重要な手がかりの特定とリコールなど,潜在的方向性の探求に向けて一歩前進する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:39:47 GMT)
Search-Based Correction of Reasoning Chains for Language Models [72.6] CoT(Chain-of-Thought)推論は言語モデル(LM)の機能と透明性を向上した。
我々はCoTにおける各推論ステップを、その正確性を示す潜在変数で拡張する新しい自己補正フレームワークを導入する。
また,離散探索アルゴリズムであるサーチコレクタも導入した。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:16:36 GMT)
ProPINN: Demystifying Propagation Failures in Physics-Informed Neural Networks [71.0] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法において高い期待を得た
以前の研究では、PINNの伝播不良現象が観察された。
本稿では,伝播不良とその根本原因に関する公式かつ詳細な研究について述べる。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:44:40 GMT)
Dynamic Attention Analysis for Backdoor Detection in Text-to-Image Diffusion Models [70.0] 従来のバックドア検出手法は主にバックドアサンプルの静的特徴に焦点を当てていた。
本研究では、動的注意分析(DEA)と呼ばれる新しいバックドア検出視点を導入し、これらの動的特徴がバックドア検出の指標となることを示す。
我々の手法は既存の検出方法を大きく上回り、平均F1スコアは79.49%、AUCは87.67%に達した。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:48:23 GMT)
IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models [68.6] IntLoRAは、整数型低ランクパラメータを持つ量子化拡散モデルを適用し、チューニング中に推論効率を含める。
推論中、IntLoRA重みはPTQなしで直接量子化された下流重みを得るために、シームレスに事前訓練された重みにマージすることができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:13:03 GMT)
Are Multimodal Large Language Models Ready for Omnidirectional Spatial Reasoning? [66.9] MLLM(Multimodal large language model)は全方向空間推論に対応しているのか?
OSR-Benchはこの設定のために特別に設計された最初のベンチマークである。
高忠実度パノラマ屋内シーンマップには、153,000以上の多様な質問応答ペアが含まれている。
GPT-4o, Gemini 1.5 Proを含む8つの最先端MLLMを評価し, ゼロショット設定で主要なオープンソースモデルを評価した。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:48:40 GMT)
Exploring Criteria of Loss Reweighting to Enhance LLM Unlearning [66.8] 損失再重み付けは、大きな言語モデル(LLM)を用いた機械学習において大きなメリットを示している。
本稿では,損失再重み付け,すなわち飽和と重要度という2つの異なる目標を同定する。
飽和度と重要度の両方の利点を組み合わせた簡易な再重み付け手法であるSatImpを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:41:22 GMT)
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets [65.4] そこで我々は,Nabla-GFlowNetと呼ばれる拡散モデルファインタニングのための強化学習手法を提案する。
提案手法は,大規模テキスト条件による画像拡散モデルである安定拡散の高速かつ多様かつ事前保存的な微調整を実現する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:13:19 GMT)
MoDGS: Dynamic Gaussian Splatting from Casually-captured Monocular Videos with Depth Priors [65.3] MoDGSは、カジュアルにキャプチャーされたモノクロビデオから、ダイナミックなシーンの新たなビューを描画する新しいパイプラインだ。
実験では、MoDGSはカジュアルにキャプチャされたモノクロビデオから、ダイナミックシーンの高品質なノベルビュー画像をレンダリングできることを示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:20:38 GMT)
Communication-Efficient Hybrid Language Model via Uncertainty-Aware Opportunistic and Compressed Transmission [65.2] ハイブリッド言語モデル(HLM)は、遠隔大言語モデル(LLM)によって検証され、修正されるドラフトトークンを生成する。
通信効率と不確実性を考慮したHLM(CU-HLM)を提案する。
CU-HLMは、74.8%のトランスミッションを97.4%の語彙圧縮でスキップし、97.4%の精度を維持しながら、最大206$times$高いトークンスループットを達成することを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:10:34 GMT)
Trans-Zero: Self-Play Incentivizes Large Language Models for Multilingual Translation Without Parallel Data [64.4] 言語モデル(LLM)の単言語データと本質的な多言語知識のみを活用するセルフプレイフレームワークを提案する。
実験により、このアプローチは大規模並列データに基づいて訓練されたモデルの性能と一致するだけでなく、非英語翻訳の方向でも優れていることが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:50:52 GMT)
Efficient Indirect LLM Jailbreak via Multimodal-LLM Jailbreak [62.6] 本稿では,大規模言語モデル(LLM)に対するジェイルブレイク攻撃に焦点を当てた。
我々の手法は、効率と有効性の両方の観点から、現在の最先端のジェイルブレイク手法を超越している。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:17:29 GMT)
Internal Causal Mechanisms Robustly Predict Language Model Out-of-Distribution Behaviors [61.9] 正当性予測の最も堅牢な特徴は、モデルの振舞いに特徴的な因果的役割を果たすものであることを示す。
モデル出力の正しさを予測するために因果メカニズムを利用する2つの手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:31:39 GMT)
SafeVid: Toward Safety Aligned Video Large Multimodal Models [60.1] ビデオ大マルチモーダルモデル(VLMM)にビデオ特化安全原則を取り入れたフレームワークであるSafeVidを紹介する。
SafeVidは、詳細なテキストによるビデオ記述を解釈ブリッジとして使用し、ルール駆動の安全推論を容易にする。
SafeVid-350KとのアライメントはVLMMの安全性を大幅に向上させ、LLaVA-NeXT-Videoのようなモデルも大幅に改善された。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:21:33 GMT)
Self-NPO: Negative Preference Optimization of Diffusion Models by Simply Learning from Itself without Explicit Preference Annotations [60.1] 拡散モデルは、画像、ビデオ、および3Dコンテンツ生成を含む様々な視覚生成タスクにおいて顕著な成功を収めている。
優先度最適化(PO)は、これらのモデルを人間の嗜好に合わせることを目的とした、顕著で成長している研究分野である。
モデル自体からのみ学習する負の選好最適化アプローチであるSelf-NPOを導入する。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:03:46 GMT)
FastCar: Cache Attentive Replay for Fast Auto-Regressive Video Generation on the Edge [60.0] 自動回帰(AR)モデルは、サンプリング効率が優れているため、近年、視覚生成タスクにおいて有望であることが示されている。
ビデオ生成は、コヒーレントな時間フレームを生成するために、かなり多くのトークンを必要とする。
我々は,時間的冗長性を探究して,ARビデオ生成のデコードフェーズを高速化する textbfFastCar フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:00:39 GMT)
No Other Representation Component Is Needed: Diffusion Transformers Can Provide Representation Guidance by Themselves [59.8] 自己表現アライメント(Self-Representation Alignment, SRA)は, 自己蒸留法により表現指導を得る単純な方法である。
実験結果から,SRAをDiTsおよびSiTsに適用すると一貫した性能向上が得られた。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:07:16 GMT)
Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.5] エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:18:55 GMT)
AI-Driven Automation Can Become the Foundation of Next-Era Science of Science Research [58.9] 科学科学(Science of Science, SoS)は、科学的発見の基礎となるメカニズムを探求する。
人工知能(AI)の出現は、次世代のSoSに変革の機会をもたらす。
我々は、従来の手法よりもAIの利点を概説し、潜在的な制限について議論し、それらを克服するための経路を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:01:33 GMT)
VisionReasoner: Unified Visual Perception and Reasoning via Reinforcement Learning [55.3] 複数の視覚知覚タスクの推論と解決が可能な統合フレームワークであるVisionReasonerを紹介する。
VisionReasonerは、検出、セグメンテーション、カウントという3つの重要な領域にまたがる10のタスクに対して評価する。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:51:47 GMT)
AutoMedEval: Harnessing Language Models for Automatic Medical Capability Evaluation [55.3] 本稿では,医療用LLMの質問応答能力を測定するために,13Bパラメータを用いたオープンソースの自動評価モデルAutoMedEvalを提案する。
AutoMedEvalの包括的な目的は、多様なモデルが生み出す応答の質を評価することであり、人間の評価への依存を著しく低減することを目的としている。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:44:54 GMT)
K*-Means: A Parameter-free Clustering Algorithm [55.2] k*-meansは、kや他のパラメータをセットする必要がない新しいクラスタリングアルゴリズムである。
最小記述長の原理を用いて、クラスタの分割とマージによって最適なクラスタ数k*を自動的に決定する。
k*-平均が収束することが保証されることを証明し、kが未知のシナリオにおいて既存のメソッドよりも著しく優れていることを実験的に証明する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:41:07 GMT)
Learning to Dissipate Energy in Oscillatory State-Space Models [55.1] 状態空間モデル (SSM) はシーケンス学習のためのネットワークのクラスである。
我々は,D-LinOSSがLinOSSの手法を長距離学習タスクで一貫して上回っていることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 23:15:17 GMT)
On the $O(\frac{\sqrt{d}}{K^{1/4}})$ Convergence Rate of AdamW Measured by $\ell_1$ Norm [54.3] 本稿では、$ell_$ノルムで測定されたAdamWの収束率$frac1Ksum_k=1KEleft[|nabla f(xk)|_1right]leq O(fracsqrtdCK1/4)を確立する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:02:52 GMT)
Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.9] 低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:46:24 GMT)
Streaming Sequence Transduction through Dynamic Compression [52.7] 本稿では,ストリーム上の効率のよいシーケンス・ツー・シーケンス・トランスダクションを設計した新しいトランスフォーマーモデルであるSTAR(Stream Transduction with Anchor Representations)を紹介する。
STARは入力ストリームを動的にセグメント化して圧縮アンカー表現を生成し、自動音声認識(ASR)においてほぼロスレス圧縮(12x)を達成する
STARは、音声とテキストの同時タスクにおいて、セグメンテーションとレイテンシ品質のトレードオフが優れており、レイテンシ、メモリフットプリント、品質が最適化されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:46:09 GMT)
Enhancing Multimodal Unified Representations for Cross Modal Generalization [52.2] 我々は、コードブック(TOC)のトレーニング不要最適化と、FCID(Fin and Coarse Cross-modal Information Disentangling)を提案する。
これらの方法は、各モードの特定の特性に合わせて、事前学習から統一された離散表現を洗練し、きめ細かな情報と粗い情報の絡み合わせを行う。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:14:04 GMT)
Model Steering: Learning with a Reference Model Improves Generalization Bounds and Scaling Laws [52.1] 本稿では,戦略データの選択や重み付けを通じて,対象モデルのトレーニングを指導・強化するための基準として,訓練モデルを用いた新たな学習パラダイムを定式化する。
提案手法は,参照モデルを持たないトレーニングと比較して,一般化とデータの効率性を改善する理由に関する理論的知見を提供する。
これらの知見に基づいて,DRRho-CLIPと呼ばれる参照モデルを用いたコントラスト言語-画像事前学習手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:26:21 GMT)
Video-SafetyBench: A Benchmark for Safety Evaluation of Video LVLMs [51.9] Video-SafetyBenchは、ビデオテキスト攻撃下でのLVLMの安全性を評価するために設計された最初のベンチマークである。
ビデオテキストのペアは2,264で、48のきめ細かいアンセーフなカテゴリにまたがっている。
安全性評価のためのセマンティックなビデオを生成するために,ビデオ意味論を主題画像とモーションテキストに分解する制御可能なパイプラインを設計する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:06:38 GMT)
LifelongAgentBench: Evaluating LLM Agents as Lifelong Learners [51.5] しかし、現在の大規模言語モデル(LLM)ベースのエージェントは、状態のままであり、時間とともに知識を蓄積または転送することができない。
LLMエージェントの生涯学習能力を体系的に評価するために設計された最初の統合ベンチマークであるLifelongAgentBenchを紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:09:11 GMT)
Efficient and Scalable Neural Symbolic Search for Knowledge Graph Complex Query Answering [50.2] 複雑なクエリに対する効率的でスケーラブルなシンボル検索フレームワークを提案する。
我々のフレームワークは、ほぼ同じ性能を維持しながら、シンボリックメソッドの計算負荷を90%削減する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:54:02 GMT)
CRUXEval-X: A Benchmark for Multilingual Code Reasoning, Understanding and Execution [50.2] CRUXEVAL-Xコード推論ベンチマークには19のプログラミング言語が含まれている。
各言語に対して少なくとも600人の被験者で構成され、合計19Kのコンテンツ一貫性テストがある。
Pythonでのみトレーニングされたモデルでさえ、他の言語で34.4%のPass@1を達成することができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:52:25 GMT)
Generative Modeling with Bayesian Sample Inference [50.1] 我々は,反復的なガウス後部推論から新しい生成モデルを導出した。
我々のモデルは、未知のサンプルを反復的に絞り込むために、一連の予測と後続の更新ステップを使用する。
実験では,BFNと近縁な変分拡散モデルの両方に対して,ImageNet32のサンプル品質が向上することが実証された。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:10:26 GMT)
Safe Delta: Consistently Preserving Safety when Fine-Tuning LLMs on Diverse Datasets [49.4] 大規模言語モデル(LLM)の安全性を考慮したポストトレーニング防衛手法であるSafe Deltaを提案する。
当社のアプローチは、良質なデータセットからのユーティリティゲインが影響を受けないことを保証しながら、安全を継続的に維持します。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:01:07 GMT)
GTR: Gaussian Splatting Tracking and Reconstruction of Unknown Objects Based on Appearance and Geometric Complexity [49.3] モノクローナルRGBDビデオからの6-DoFオブジェクト追跡と高品質な3D再構成のための新しい手法を提案する。
提案手法は, 高忠実度オブジェクトメッシュを復元する強力な能力を示し, オープンワールド環境における単一センサ3D再構成のための新しい標準を策定する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:46:29 GMT)
SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer [49.2] 本稿では,テキスト・画像生成における効率的なスケーリングを実現する線形拡散変換器であるSANA-1.5を提案する。
効率的なトレーニングスケーリング、モデルの深さ決定、推論時間スケーリングの3つの重要なイノベーションを紹介します。
これらの戦略により、SANA-1.5 は GenEval 上のテキスト計算画像アライメントスコア 0.81 を達成し、VILA-Judge による推論スケーリングにより、さらに 0.96 に改善できる。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:26:31 GMT)
Approximation of diffeomorphisms for quantum state transfers [49.2] 制御理論における2つの新たな視点を組み合わそうとしている。
トーラスに作用するバイリニア型Schr"odinger PDEにおいて、状態遷移を短時間で駆動する制御法則を数値的に見つける。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:38:09 GMT)
Why Not Act on What You Know? Unleashing Safety Potential of LLMs via Self-Aware Guard Enhancement [48.5] 大規模言語モデル(LLM)は、様々なタスクにわたって印象的な機能を示しているが、細心の注意を払って構築されたジェイルブレイク攻撃には弱いままである。
SAGE(Self-Aware Guard Enhancement)は,LSMの強い安全識別性能と比較的弱い安全生成能力とを整合させる訓練不要防衛戦略である。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:54:52 GMT)
LOVE: Benchmarking and Evaluating Text-to-Video Generation and Video-to-Text Interpretation [47.0] AI生成ビデオ評価のための包括的なデータセットとベンチマークであるAIGVE-60Kを提案する。
本稿では,LMMに基づくAIGV評価尺度であるLOVEを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:49:26 GMT)
Leveraging the true depth of LLMs [46.8] 大規模言語モデル(LLM)は、高い計算要求を犠牲にして素晴らしい能力を示す。
近年の研究では、LCMの中間層を相当な精度の損失なく除去または再配列できることが示されている。
本稿では,連続層を並列に評価したペアにグループ化する手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:29:57 GMT)
RAS: Retrieval-And-Structuring for Knowledge-Intensive LLM Generation [46.2] 本稿では,クエリ固有の知識グラフを動的に構築するフレームワークであるRetrieval-And-Structuring (RAS)を提案する。
7つの知識集約ベンチマークでは、RASは一貫して強力なベースラインを上回っている。
この結果から,動的クエリ固有知識構造化は,言語モデル生成における推論精度と堅牢性を向上させるための堅牢な経路を提供することが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:33:04 GMT)
BAT: Learning to Reason about Spatial Sounds with Large Language Models [45.8] 本稿では,空間的シーン解析モデルの音知覚能力と大規模言語モデル(LLM)の自然言語推論能力を組み合わせたBATを提案する。
実験では,空間音知覚と推論の両方において,BATの優れた性能を示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:03:39 GMT)
Surrogate Interpretable Graph for Random Decision Forests [45.5] 健康情報学の分野は、ランダムな森林モデルの発展に大きく影響されている。
ランダムな森林における特徴量や推定器の増加は、ドメインの専門家がグローバルな特徴の相互作用を正確に解釈するのを防ぐことができる。
代理解釈可能なグラフの実装は、そのような高い領域にとって重要な大域的解釈可能性を高める。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:44:37 GMT)
From Recall to Reasoning: Automated Question Generation for Deeper Math Learning through Large Language Models [45.0] 先進数学のためのコンテンツ生成を最適化する第1ステップについて検討した。
我々は、GenAIがコース内容に関連する高品質な実践問題を生み出す能力について検討した。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:30:10 GMT)
VidCapBench: A Comprehensive Benchmark of Video Captioning for Controllable Text-to-Video Generation [44.1] 本稿では,T2V生成に特化して設計されたビデオキャプション評価手法であるVidCapBenchを紹介する。
VidCapBenchは、収集された各ビデオと、ビデオの美学、コンテンツ、動き、および物理法則に関する重要な情報とを関連付ける。
既存のビデオキャプション評価手法と比較して, VidCapBench の安定性と包括性を示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:49:22 GMT)
MonoMobility: Zero-Shot 3D Mobility Analysis from Monocular Videos [43.9] モノクロビデオから0ショットで3Dモビリティを解析できる革新的なフレームワークを提案する。
このフレームワークは、単眼ビデオのみを使用して、動きの部分と動きの属性を正確に解析することができ、注釈付きトレーニングデータの必要性を完全に排除することができる。
そこで本研究では,音声オブジェクトに特化して設計された動的シーン最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:21:05 GMT)
GLIP-OOD: Zero-Shot Graph OOD Detection with Graph Foundation Model [43.8] アウト・オブ・ディストリビューション(OOD)検出は、機械学習システムの安全性と信頼性を保証するために重要である。
本研究では,グラフ基礎モデル(GFM)を利用したゼロショットグラフOOD検出の実現に向けた第一歩を踏み出す。
GLIP-OOD は LLM を用いてラベルのないデータから意味的に意味のある擬似OOD ラベルを生成するフレームワークである。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:21:19 GMT)
Pre-training Auto-regressive Robotic Models with 4D Representations [43.8] ARM4Rは、人間のビデオデータから学んだ低レベルの4D表現を利用して、より優れた事前訓練されたロボットモデルを生成する自動回帰ロボットモデルである。
実験の結果、ARM4Rは人間のビデオデータからロボットへ効率よく転送でき、さまざまなロボット環境や構成におけるタスクのパフォーマンスを継続的に改善できることがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:33:08 GMT)
Intention Knowledge Graph Construction for User Intention Relation Modeling [43.6] 本稿では,意図的知識グラフを自動生成するフレームワークを提案する。
3億3100万のエッジを持つ意図グラフを構築し、高い妥当性と受容性を示す。
本モデルは,新規セッションの意図を効果的に予測し,製品レコメンデーションを強化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:38:32 GMT)
DraftAttention: Fast Video Diffusion via Low-Resolution Attention Guidance [43.4] 拡散変換器を用いたビデオ生成モデル(DiTs)は近年,その優れた生成品質に注目が集まっている。
しかしながら、その計算コストは、ボトルネック注意だけで、全体の80%以上の遅延の原因となっている。
本稿では,GPUに動的に注意を向けたビデオ拡散変換器の高速化のためのトレーニングフリーフレームワークであるDraftAttentionを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:34:34 GMT)
SpatialCrafter: Unleashing the Imagination of Video Diffusion Models for Scene Reconstruction from Limited Observations [42.7] この作業は、スパースやシングルビューのインプットから3Dシーンを再構築する上での課題である。
SpatialCrafterは,ビデオ拡散モデルにおける豊富な知識を活用して,可算的な追加観測を生成するフレームワークである。
トレーニング可能なカメラエンコーダと、明示的な幾何学的制約に対するエピポーラアテンション機構により、精密なカメラ制御と3D整合性を実現する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:05:13 GMT)
LSR-MCTS: Alleviating Long Range Dependency in Code Generation [42.1] 大規模言語モデル(LLM)は、コード生成タスクの開発を著しく促進している。
本稿では,MCTS を利用した textbfLSR-MCTS アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:46:05 GMT)
A Quality-Centric Framework for Generic Deepfake Detection [41.2] 汎用的なディープフェイク検出のための新しい品質中心のフレームワークを提案する。
品質評価器、低品質データ拡張モジュール、学習ペーシング戦略から構成される。
我々のフレームワークはカリキュラム学習にインスパイアされており、より難しいディープフェイクサンプルを徐々に検出できるように設計されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:04:20 GMT)
CHRIS: Clothed Human Reconstruction with Side View Consistency [41.1] サイドビュー整合性CHRISを用いた衣服付きヒューマンレコンストラクションについて紹介する。
CHRISは、生成されたサイドビューのノーマルと地上の真実のノーマルを区別することで、グローバルな視覚的理性を高める。
実験結果から,CHRISは公開ベンチマーク上での最先端性能を実現することが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:41:46 GMT)
Multi-Order Wavelet Derivative Transform for Deep Time Series Forecasting [40.6] 我々はWDT(Walterlet Derivative Transform)を導入し、全体的な傾向と微妙な変動にまたがる時間認識パターンの抽出を可能にする。
実際に、WDTをWaveTSという名前のマルチブランチフレームワークに組み込み、入力系列をマルチスケールの時間周波数係数に分解し、線形層を介してそれらを洗練し、逆WDTを介して時間領域に再構成する。
10のベンチマークデータセットの実験では、WaveTSは高い計算効率を維持しながら最先端の予測精度を達成している。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:24:09 GMT)
Exploring the Potential of Encoder-free Architectures in 3D LMMs [40.4] 本稿では,エンコーダをベースとした3次元大規模マルチモーダルモデルの課題を軽減するために,エンコーダフリーアーキテクチャの可能性を初めて包括的に検討する。
以上の結果から,エンコーダフリーアーキテクチャは3次元理解分野におけるエンコーダベースアーキテクチャの代替として有望であることが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:38:29 GMT)
Improving Coverage in Combined Prediction Sets with Weighted p-values [40.4] コンフォーマル予測は、交換可能性を想定した有効な予測セットで点予測を増大させることにより、機械学習モデルの不確実性を定量化する。
本稿では,各予測セットに重み付けを割り当てる重み付け集約のためのフレームワークを提案する。
我々のフレームワークは集合をどのように集約するかを柔軟に制御し、結合モデルの1-2alpha$保証と、重みの分布に応じて個々のモデルの1-2alpha$保証とを補間する、より厳密なカバレッジ境界を達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:51:28 GMT)
Latent Action Learning Requires Supervision in the Presence of Distractors [40.3] 実世界のビデオには、潜在的なアクション学習を妨げるアクション関連障害が含まれていることが示されています。
LAOMは,潜伏動作の質を8倍に向上する簡易なLAPO修正法である。
我々は、潜在アクション学習中のデータセット全体の2.5%にも満たない、地道的なアクションによる監視を提供することで、下流のパフォーマンスが平均4.2倍向上することを示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:34:01 GMT)
Bethe Ansatz, Quantum Circuits, and the F-basis [40.0] 決定論的量子アルゴリズムは「代数Bethe回路」と呼ばれ、スピン1/2XXZモデルのためにBethe状態を作成するために開発された。
代数Bethe回路は補助空間における基底の変化によって導出可能であることを示す。
我々は、不均質スピン-1/2 XXZモデルのための新しい量子回路を提示することで、我々のアプローチを実証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:51:09 GMT)
Mixture of Decoding: An Attention-Inspired Adaptive Decoding Strategy to Mitigate Hallucinations in Large Vision-Language Models [39.9] 混合復号法 (Mixture of Decoding, MoD) は幻覚緩和のための新しいアプローチである。
画像トークンに対するモデルの注意の正しさを評価することによって、デコード戦略に適応する。
MoDは、複数の主要なベンチマークで既存のデコード手法を著しく上回っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:44:18 GMT)
CrafText Benchmark: Advancing Instruction Following in Complex Multimodal Open-Ended World [39.7] 多様なインストラクションと動的インタラクションを備えたマルチモーダル環境における命令追従評価ベンチマークであるCrafTextを紹介する。
CrafTextには3,924の命令と3,423のユニークな単語が含まれており、ローカライゼーション、条件付きビルディング、達成タスクをカバーしている。
本稿では,エージェントが新しい命令の定式化や動的に進化するタスク構成に一般化する能力を評価するための評価プロトコルを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:25:46 GMT)
VLSBench: Unveiling Visual Leakage in Multimodal Safety [39.3] MLLM(Multimodal large language model)の安全性に関する懸念は、様々なアプリケーションにおいて徐々に重要な問題となっている。
これまでの研究は、テキストアンラーニングを用いてMLLMを整列させ、画像テキストペアに整列したMLLMと同等の安全性を実現するという、直感的な現象を示している。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:14:14 GMT)
Learning to Highlight Audio by Watching Movies [38.0] 本稿では,映像が案内する適切なハイライト効果を実現するために音声を変換することを目的とした,視覚誘導型音声強調機能を提案する。
私たちのモデルをトレーニングするために、映画に見られる巧妙なオーディオとビデオ制作を活用する、泥だらけのミックスデータセットも導入しました。
定量的評価と主観的評価の両面で,我々のアプローチは一貫していくつかのベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:03:57 GMT)
On the Value of Cross-Modal Misalignment in Multimodal Representation Learning [37.3] マルチモーダル表現学習は、モダリティ間でキューを整列させることにより、強力な表現を学習することを目的としている。
最近の研究により、現実世界のデータセットは、しばしばモダクティブなミスアライメントを示すことが明らかになっている。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:33:57 GMT)
PrePrompt: Predictive prompting for class incremental learning [37.1] 事前学習モデルに基づくクラスインクリメンタルラーニング(CIL)は,オープンワールドの継続的ラーニングに有望な方向性を提供する。
本稿では,事前学習したモデルの自然な分類能力を活用し,タスク固有のプロンプトを予測することによって,相関に基づく制約を回避する新しいCILフレームワークであるPrepromptを提案する。
複数のベンチマークの実験は、PrePromptが最先端のプロンプトベースのCILメソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:10:42 GMT)
Evolving LLMs' Self-Refinement Capability via Iterative Preference Optimization [35.8] EVOLVEは、好みのトレーニングと自己修正データ収集を統合する新しいフレームワークである。
GSM8KやMATHのような数学的推論タスクのパフォーマンスを継続的に向上させる。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:40:33 GMT)
DiffuseDef: Improved Robustness to Adversarial Attacks via Iterative Denoising [35.1] DiffuseDefは、言語分類タスクのための新しい敵防御手法である。
拡散層をエンコーダと分類器の間のデノイザとして組み込む。
これは、一般的なブラックボックスやホワイトボックスの敵攻撃に対して最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:13:59 GMT)
Convergence Properties of Stochastic Hypergradients [34.8] 大規模データセットにおける低レベルの問題が経験的リスクである場合に重要となる過勾配の近似スキームについて検討する。
本研究では,理論解析を支援する数値実験を行い,実際にハイパーグラディエントを用いることの利点を示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:14:44 GMT)
Mimic In-Context Learning for Multimodal Tasks [34.7] 大規模マルチモーダルモデル(LMM)におけるインコンテキスト学習(ICL)は重要な推論パラダイムとなっている
我々は、ICDから安定かつ一般化可能なシフト効果を学習するために、Mimic In-Context Learning (MimIC)を導入する。
MimICは、軽量学習可能なモジュールをLMMに統合することで、シフト効果をより正確に近似する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:43:08 GMT)
Benign Overfitting in Token Selection of Attention Mechanism [34.3] ラベルノイズを伴う分類問題における注意機構の学習力学と一般化能力について検討した。
本稿では,信号対雑音比(SNR)の特性から,アテンション機構のトークン選択が過度に適合することを示す。
我々の研究は、オーバーフィッティングの初期段階の後に一般化の獲得が遅れていることも示している。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:16:53 GMT)
What's Pulling the Strings? Evaluating Integrity and Attribution in AI Training and Inference through Concept Shift [33.8] ConceptLensは、トレーニング済みのマルチモーダルモデルを利用して、整合性の脅威を特定する汎用フレームワークである。
悪意のあるコンセプトシフトによる隠蔽広告の生成など、バイアス注入に対する脆弱性を明らかにする。
生成的コンテンツにおける社会学的バイアスを明らかにし、社会学的文脈にまたがる格差を明らかにする。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:44:18 GMT)
SCoRE: Benchmarking Long-Chain Reasoning in Commonsense Scenarios [33.7] SCoRE(Scenario-based Commonsense Reasoning Evaluation)は、エンティティ、リレーション、論理ルールのシナリオスキーマからマルチホップ質問を合成するベンチマークである。
SCoREには100kのバイリンガル(中国語と英語の)複数選択質問が含まれており、推論チェーンは2-11ホップにまたがり、様々な難易度にグループ化されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:48:09 GMT)
Coded Robust Aggregation for Distributed Learning under Byzantine Attacks [33.6] 符号化ロバストアグリゲーション(CRA-DL)に基づくビザンチン攻撃に対処する新しいDL法を提案する。
CRA-DLは、正直な装置によって送信される符号化された勾配が互いに近いという事実により改善される。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:06:04 GMT)
Fair-PP: A Synthetic Dataset for Aligning LLM with Personalized Preferences of Social Equity [33.4] ソーシャルエクイティをターゲットとしたパーソナライズされた好みの合成データセットであるFair-PPを紹介する。
また、(i)嗜好データを生成するための自動フレームワークと、よりきめ細かいパーソナライズされた嗜好データセット、(ii)パーソナライズされた選好空間内の5大グローバル領域にまたがる既存の主流言語モデルの配置の分析、(iii)パーソナライズされた選好アライメントのためのサンプル再重み付け手法についても貢献する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:02:00 GMT)
Multilingual Collaborative Defense for Large Language Models [33.1] 注目すべき脆弱性の1つは、有害なクエリを稀で表現不足の言語に翻訳することで、セーフガードを回避できることである。
懸念が高まっているにもかかわらず、多言語シナリオにおけるLLMの保護に対処する研究は限られている。
本稿では,連続的かつソフトな安全プロンプトを自動で最適化する新しい学習手法であるMCDを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:47:16 GMT)
TDFormer: A Top-Down Attention-Controlled Spiking Transformer [33.1] 本稿では,階層的に機能するトップダウンフィードバック構造を持つ新しいモデルであるTDFormerを紹介する。
これらのメカニズムは、複数のデータセット上でのモデル性能を大幅に改善する。
特に,画像ネットの最先端性能を86.83%の精度で達成している。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:55:32 GMT)
Pairwise Calibrated Rewards for Pluralistic Alignment [32.8] 現在のアライメントパイプラインは、望ましい振る舞いという単一の普遍的な概念を前提としている。
複数の報酬関数にまたがる分布を通して、多様な人間の嗜好を反映することを提案する。
我々は,小さな外乱のないアンサンブルであっても,様々な好み分布を正確に表現できることを証明した。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:38:24 GMT)
Mobile-Bench-v2: A More Realistic and Comprehensive Benchmark for VLM-based Mobile Agents [32.4] VLMベースのモバイルエージェントは、スマートフォンのGUIやXML構造化テキストと対話できることから、ますます人気が高まっている。
既存のオンラインベンチマークは、動的環境変化による安定した報酬信号を得るのに苦労している。
Mobile-Bench-v2は共通タスク分割を含み、オフラインのマルチパス評価によってエージェントがステップ報酬を得る能力を評価する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:58:34 GMT)
Bias Similarity Across Large Language Models [32.0] 大規模言語モデルにおけるバイアスは、これらのシステムがハイテイクなアプリケーションにますますデプロイされているため、依然として重要な関心事である。
機能的類似性としてバイアス類似性を評価し、4つのバイアス次元にまたがる100万以上の構造化プロンプト上で24 LLMを評価した。
フェアネスは、モデルのサイズ、アーキテクチャ、チューニングチューニング、オープンネスによって強く決定されていないことが判明した。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:53:28 GMT)
Model Merging in Pre-training of Large Language Models [31.0] 本稿では,事前学習過程におけるモデルマージ手法について包括的に検討する。
一定の学習率で訓練されたチェックポイントをマージすることで、大幅な性能向上が達成できることを示す。
我々は、効果的なモデルマージのための実践的な事前トレーニングガイドラインをオープンソースコミュニティに提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:53:14 GMT)
FANformer: Improving Large Language Models Through Effective Periodicity Modeling [30.8] 本稿では、FANformerを導入し、FAN(Fourier Analysis Network)をアテンション機構に適応させ、効率的な周期性モデリングを実現する。
モデルサイズのスケールアップやトークンのトレーニングでは,FANformerがTransformerより一貫して優れています。
トレーニング済みのFANformer-1Bは、同様のモデルパラメータやトレーニングトークンを持つオープンソースのLLMと比較して、ダウンストリームタスクが大幅に改善されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:11:56 GMT)
Boosting Diffusion-Based Text Image Super-Resolution Model Towards Generalized Real-World Scenarios [30.8] テキスト画像超解像(SR)の拡散モデルの一般化能力向上を目的とした新しいフレームワークを提案する。
本稿では,様々な訓練段階における多様な画像型を取り入れ,収束を安定化し,一般化を改善するプログレッシブなデータサンプリング戦略を提案する。
実世界のデータセットを用いた実験により、我々のアプローチはよりリアルな視覚的外観を持つテキスト画像を生成するだけでなく、テキスト構造の精度も向上することが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:04:38 GMT)
SepPrune: Structured Pruning for Efficient Deep Speech Separation [30.5] 本稿では,深層音声分離モデルに特化して設計された最初の構造化プルーニングフレームワークであるSepPruneを提案する。
SepPruneは冗長なチャネルをプルーンし、残りのパラメータを微調整してパフォーマンスを回復する。
実験により、この学習可能なプルーニングパラダイムは、音声分離モデルにおいて、チャネルプルーニングにかなりの利点をもたらすことが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:44:38 GMT)
AdaCoT: Pareto-Optimal Adaptive Chain-of-Thought Triggering via Reinforcement Learning [30.3] Chain-of-Thoughtは、すべてのクエリに対する長い推論ステップを無差別に生成する。
AdaCoT(Adaptive Chain-of-Thought)は、LLMがCoTを呼び出すタイミングを適応的に決定できる新しいフレームワークである。
重要な技術的貢献はSLM(Selective Loss Masking)であり、決定境界崩壊の防止を目的としている。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:27:00 GMT)
Reinforcing Multi-Turn Reasoning in LLM Agents via Turn-Level Credit Assignment [29.6] 本稿では,強化学習(RL)を用いた大規模言語モデル(LLM)エージェントの推論能力向上のためのアプローチを検討する。
マルチターンエージェントのインタラクションにおいて、より正確なクレジット割り当てを可能にするための、きめ細かいターンレベルの利点推定戦略を導入する。
本手法は,ツール実行における100%の成功と,正解マッチングにおける50%の精度を実現し,ベースラインを著しく上回る結果を得た。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:09:46 GMT)
AnalyticKWS: Towards Exemplar-Free Analytic Class Incremental Learning for Small-footprint Keyword Spotting [29.3] キーワードスポッティング(KWS)は、音声対応システムにおける音声コマンドを識別するための重要なメカニズムを提供する。
主要な問題は、モデルが以前のキーワードを認識する能力を失う、破滅的な忘れ物である。
本稿では,従来のデータを再検討することなく,モデルパラメータを更新する分析連続学習(AnalyticKWS)手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:55:28 GMT)
Differentially Private Synthetic Data via Foundation Model APIs 1: Images [29.3] この問題を解決するために,PE(Private Evolution)と呼ばれる新しいフレームワークを提案する。
PEは、モデルトレーニングなしで、最先端のSOTA(State-of-the-art)メソッドと一致させることができる。
例えば、CIFAR10では、プライバシコストのエプシロン=0.67でFID = 7.9を達成し、以前のSOTAをエプシロン=32から大幅に改善します。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:12:18 GMT)
MInCo: Mitigating Information Conflicts in Distracted Visual Model-based Reinforcement Learning [29.1] 既存の視覚モデルに基づく強化学習(MBRL)アルゴリズムは、しばしば情報衝突に悩まされる。
我々は,情報衝突を緩和するMInCoについて,無負のコントラスト学習を活用して提案する。
動的背景障害を伴う複数のロボット制御タスクにおいて,本手法の評価を行った。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:18:42 GMT)
Zero-shot Outlier Detection via Prior-data Fitted Networks: Model Selection Bygone! [28.8] FoMo-0Dは、表データの0/0ショットODのための事前訓練されたファンデーションモデルである。
パラメータを微調整することなく、テストサンプルの(より低い/より低い)ラベルを直接予測できる。
57の実世界のデータセットに対する実験は、FoMo-0Dが非常に競争力があることを示している。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:42:04 GMT)
A Pilot Empirical Study on When and How to Use Knowledge Graphs as Retrieval Augmented Generation [28.1] 本稿は,KG-RAGをいつ,どのように使用するかという質問に対して,体系的に回答する基盤を定めている。
我々はKG-RAGの試験的な研究を行い、さまざまな領域やシナリオにおいて9つのデータセットにまたがる6つのKG-RAG手法を再実装し評価する。
本結果は,KG-RAGコンポーネントの適切な適用条件と最適構成の重要な役割を裏付けるものである。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:41:37 GMT)
Dexterous Manipulation through Imitation Learning: A Survey [28.0] イミテーションラーニング(IL)は、ロボットが専門家によるデモンストレーションから直接巧妙な操作スキルを習得できるようにすることによって、代替手段を提供する。
ILは、明示的なモデリングと大規模な試行錯誤の必要性を回避しながら、きめ細かい調整と接触ダイナミクスをキャプチャする。
私たちのゴールは、研究者や実践者たちに、この急速に進化する領域の包括的紹介を提供することです。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:58:08 GMT)
HARDMath2: A Benchmark for Applied Mathematics Built by Students as Part of a Graduate Class [27.9] HARDMath2は、大学院応用数学クラスの中核トピックをカバーする211のオリジナル問題のデータセットである。
このデータセットはハーバード大学のコア大学院数学コースの学生とインストラクターによって設計され、検証された。
このデータセットは、学生がクラスシラバスと整合した難しい問題を書き、洗練するよう促す、新しい協調環境を通じて構築されます。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:52:49 GMT)
Your Learned Constraint is Secretly a Backward Reachable Tube [27.6] ICLは、障害が発生している状態の集合ではなく、障害が避けられない状態の集合を回復することを示す。
障害セットとは対照的に、BRTはデータ収集システムのダイナミクスに依存する。
得られた制約の動的条件が,政策探索のサンプル効率と学習制約の伝達可能性の両方に与える影響を考察する。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:16:54 GMT)
Rethinking Image Forgery Detection via Soft Contrastive Learning and Unsupervised Clustering [27.5] 画像偽造検出は、画像内の偽造領域を検出し、発見することを目的としている。
既存の偽造検出アルゴリズムは、画素を偽造または偽造に分類するために分類問題を定式化している。
本稿では,ソフトコントラスト学習と教師なしクラスタリングに基づく,新しい,シンプルかつ極めて効果的なパラダイムであるFOCAL法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:34:31 GMT)
dLLM-Cache: Accelerating Diffusion Large Language Models with Adaptive Caching [27.1] 拡散に基づく大規模言語モデルは、反復的にマスキングされたセグメントによってテキストを生成する。
dLLMは高い推論遅延に悩まされる。
従来のARMアクセラレーション技術は、dLLMと互換性がない。
トレーニング不要な適応型キャッシュフレームワークであるdLLM-Cacheを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:50:46 GMT)
Discovering Symbolic Differential Equations with Symmetry Invariants [27.1] 方程式発見におけるテキスト対称性不変量の概念を導入する。
我々は、これらの不変量を用いて方程式の発見を行い、発見された方程式が指定された対称性を満たすことを保証する。
提案手法を流体や反応拡散など様々な物理システムに適用することで検証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:53:43 GMT)
You Can Wash Hands Better: Accurate Daily Handwashing Assessment with a Smartwatch [26.6] スマートウォッチを利用したハンドウォッシング手順評価のためのウェアラブルソリューションであるUWashを提案する。
我々は,ハンドウォッシング評価のタスクを,コンピュータビジョンと同様のアクションセグメンテーション問題とする。
51名の被験者による実験では、手洗いジェスチャー認識におけるUWash 92.27%の精度が示されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:46:03 GMT)
VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play [26.5] われわれはVolleyBotsという新しいロボットスポーツテストベッドを紹介した。複数のドローンが協力し、物理的なダイナミクスの下でバレーボールのスポーツで競う。
VolleyBotsは、競争的で協力的なゲームプレイ、ターンベースのインタラクション構造、アジャイル3D操作という、統合されたプラットフォームに3つの機能を統合する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:20:39 GMT)
Defending Code Language Models against Backdoor Attacks with Deceptive Cross-Entropy Loss [26.2] コード言語モデル(CLM)は、コードインテリジェンス領域において大きな成功を収めた。
セキュリティの問題、特にバックドア攻撃は、このプロセスでしばしば見過ごされる。
これまでの研究では、CLMのバックドア攻撃の設計に焦点が当てられていたが、効果的な防御は適切に対処されていない。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:19:58 GMT)
Rodimus*: Breaking the Accuracy-Efficiency Trade-Off with Efficient Attentions [26.0] Rodimusは、新しいタイプの注目ベースの大規模言語モデル(LLM)である。
Rodimusは、線形アテンションベースで純粋にリカレントなフレームワーク内で、データ依存のテンプレート選択機構を採用している。
Rodimus$+$は、Rodimusと革新的なSliding Window Shared-Key Attention (SW-SKA)をハイブリッドアプローチで組み合わせている。
実験の結果,1兆トークンでトレーニングしたRodimus$+$-1.6Bは,より多くのトークンでトレーニングしたモデルに対して,より優れたダウンストリーム性能を実現することがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:34:17 GMT)
Hot PATE: Private Aggregation of Distributions for Diverse Task [25.7] 本研究では,出力が分布する設定に適したHot PATEを提案する。
多様性を保存することの意味を定義し、さらなるプライバシーコストを伴わずに、多様性をランダム化された出力に転送する効率的な集約メカニズムを導入する。
実証的に、Hot PATEは、コンテキスト内学習タスクにおいて、マグニチュード・オブ・マグニチュードの改善を達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:09:21 GMT)
Learning Probabilistic Temporal Logic Specifications for Stochastic Systems [24.8] マルコフ連鎖の集合から簡潔なL仕様を推論する新しい学習アルゴリズムを提案する。
我々はアルゴリズムの有効性を,アルゴリズムによって誘導されるポリシーから学習し,確率論的モデルから学習する2つのユースケースで示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:19:35 GMT)
Induction Head Toxicity Mechanistically Explains Repetition Curse in Large Language Models [24.7] 我々は誘導ヘッドを繰り返しの呪いのキードライバーとみなす。
本稿では,誘導ヘッドの世代別優位性を抑えるため,注目頭部規則化手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:09:33 GMT)
J1: Exploring Simple Test-Time Scaling for LLM-as-a-Judge [24.6] 本稿では,リジェクションサンプリングによって収集されたリフレクション強化データセットを教師付きで調整した$textbfJ1-7B$を紹介する。
推論時に、さらなるパフォーマンス改善のためにシンプルなテスト時間スケーリング(STTS)戦略を適用します。
実験の結果、$textbfJ1-7B$は、以前の最先端のLM-as-a-Judgeを$ textbf4.8$%超え、STTSの下でより強いスケーリング傾向を示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:58:42 GMT)
Continuous Subspace Optimization for Continual Learning [24.6] 継続的な学習は、先行知識を維持しながら、連続的に複数のタスクを学習することを目的としている。
連続学習のための連続部分空間最適化(CoSO)を提案する。
CoSOは、特に長いタスクシーケンスを持つ挑戦的なシナリオにおいて、最先端のメソッドを著しく上回る。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:53:21 GMT)
On Membership Inference Attacks in Knowledge Distillation [24.1] 本稿では,知識蒸留が会員推論攻撃(MIA)に対するモデルロバスト性に与える影響について検討する。
教師モデルと生徒モデルが類似したMIA精度を達成する一方で、教師モデルはMIAの主要なターゲットである会員データをよりよく保護することを示した。
そこで本研究では,5つのプライバシー保護蒸留法を提案し,学生モデルの脆弱性をMIAに還元できることを実証した。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:54:26 GMT)
Jailbreaking LLMs' Safeguard with Universal Magic Words for Text Embedding Models [23.9] 本稿では,テキスト埋め込みモデルに攻撃を与える**ユニバーサルマジックワード*を効率的に検索する方法を提案する。
接尾辞としての普遍的なマジックワードは、任意のテキストの埋め込みをバイアス方向にシフトすることができる。
攻撃者は、ユーザープロンプトに魔法の言葉を付加し、LLMに魔法の言葉で答えを終わらせることによって、保護をジェイルブレイクすることができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:37:43 GMT)
TAMP: Token-Adaptive Layerwise Pruning in Multimodal Large Language Models [23.9] MLLM(Multimodal Large Language Models)は多様なマルチモーダルデータやタスクを理解する上で,優れた汎用性を示している。
本稿では,MLLMに適した簡易かつ効果的な刈取フレームワークであるTAMPを提案する。
我々は、視覚言語タスク用に設計されたLLaVA-NeXTと、音声、視覚、言語モーダルを処理可能なVideoLLaMA2の2つの最先端MLLMに対して、本手法の有効性を検証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:57:54 GMT)
SSR: Alignment-Aware Modality Connector for Speech Language Models [23.9] 事前訓練された言語モデル(SpeechLM)に音声を融合することは、通常、長文音声の非効率な符号化や、事前訓練されたテキストのモダリティの破滅的な忘れ込みに悩まされる。
そこで我々は,SSR-Connector (Segmented Speech Representation Connector) を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:25:50 GMT)
The AI Gap: How Socioeconomic Status Affects Language Technology Interactions [23.5] 社会経済状態(SES)は、人々が相互にどのように相互作用するか、そしてLarge Language Models(LLMs)のようなデジタル技術に根本的に影響します。
我々は、言語技術と生成AIの利用について、多様な社会経済的背景から1000人の個人を調査した。
言語技術利用におけるSESグループ間での系統的差異(頻度,実行タスク),インタラクションスタイル,トピックなど)を見出した。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:35:40 GMT)
Low-hallucination Synthetic Captions for Large-Scale Vision-Language Model Pre-training [23.4] 本稿では,高品質,低ハロゲン化,知識に富んだ合成キャプションを生成するための新しいパイプラインを提案する。
我々の連続DPO法は幻覚の減少に顕著な結果をもたらす。
15の視覚言語タスクにおいて、我々のデータでトレーニングされたモデルは、少なくとも6.2%のパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:50:58 GMT)
BELLE: A Bi-Level Multi-Agent Reasoning Framework for Multi-Hop Question Answering [23.4] マルチホップ質問応答(Multi-hop question answering, QA)は、複数の関連するパスを見つけ、複雑な質問に答えるためにステップバイステップの推論を行う。
マルチホップQAに関するこれまでの研究は、大規模言語モデル(LLM)に基づく異なるモデリングの観点から特定の手法を用いていた。
本稿では,質問型とメソッドの対応性に着目し,マルチホップQAに対処するbi-level muLti-agEnt推論(BELLE)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:43:30 GMT)
Adaptive Gradient Learning for Spiking Neural Networks by Exploiting Membrane Potential Dynamics [23.2] 脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、効率的で低エネルギーのニューロモルフィックコンピューティングを実現するための有望な道として認識されている。
スパイクがニューロン間で伝播するにつれて、膜電位ダイナミクス(MPD)の分布は固定されたSGの勾配可能な間隔から逸脱する。
本稿では,MPD,すなわちMPD-AGLを利用してSNNの適応勾配学習を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:06:13 GMT)
Probabilistic Reasoning with LLMs for k-anonymity Estimation [23.2] 大規模言語モデルに対する不確実性を考慮した新しい数値推論タスクを提案する。
BRANCHは、与えられた情報と一致する集団の大きさのテキストのk-privacy値を推定する新しい手法である。
実験の結果,k値が73%と推定され,o3-miniとチェーン・オブ・シント推論の13%の増加が確認された。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:37:50 GMT)
Recursive Question Understanding for Complex Question Answering over Heterogeneous Personal Data [23.1] 本稿では,与えられた質問に対して実行可能な演算木を生成する新しい手法であるReQAPを提案する。
さらにPerQAベンチマークをリリースし、ペルソナベースのデータと質問を扱い、さまざまな現実的なユーザニーズをカバーしています。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:32:05 GMT)
Logic-in-Frames: Dynamic Keyframe Search via Visual Semantic-Logical Verification for Long Video Understanding [23.0] 本稿では,視覚意味論理探索のパラダイムの下で選択を再構成する意味論的検索フレームワークを提案する。
提案手法は,キーフレーム選択の指標を手動でアノテートしたベンチマーク上で,新たなSOTA性能を確立する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:22:07 GMT)
MaintainCoder: Maintainable Code Generation Under Dynamic Requirements [22.7] 最小限の再作業で動的要求を処理する先駆的なソリューションとして textbfMaintainCoder を提案する。
ウォーターフォールモデル、デザインパターン、マルチエージェントのコラボレーションを統合して、凝集を体系的に強化し、結合を減らし、明確な責任境界を達成し、メンテナンス性を向上させる。
私たちの仕事は、保守可能なコード生成の基礎を提供するだけでなく、より現実的で包括的なコード生成研究の必要性も強調しています。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:23:32 GMT)
CodeFlowBench: A Multi-turn, Iterative Benchmark for Complex Code Generation [22.7] コードフローを実行するLLMの能力を総合的に評価するために設計された最初のベンチマークであるCodeFlowBenchを紹介する。
CodeFlowBenchは、Codeforcesから5,258の問題を発生し、自動パイプラインを通じて継続的に更新される。
16のLLMの大規模な実験により、マルチターンシナリオにおける大幅な性能劣化が明らかになった。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:30:11 GMT)
Do different prompting methods yield a common task representation in language models? [22.7] デモと指示は、言語モデルにコンテキスト内学習タスクの実行を促す2つの主要なアプローチである。
本研究は,最近提案された機能ベクトルを用いて,少数ショットICLタスク表現を抽出する機構について検討する。
この結果から,タスクの表象は共通なタスク表現を誘導するのではなく,重複する機構が引き起こされることが示唆された。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:28:33 GMT)
Graph Network for Sign Language Tasks [22.7] 混合グラフの集合として手話列を表すMixSignGraphを紹介する。
LSGモジュールは1フレーム内のフレーム内クロスリージョン特徴の相関関係を学習する。
TSGモジュールは、隣接するフレーム間のフレーム間クロスリージョン機能の相互作用を追跡する。
HSGモジュールはフレームの異なる粒度特徴写像から同じ領域の特徴を集約する。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:35:49 GMT)
WaLRUS: Wavelets for Long-range Representation Using SSMs [22.7] ステートスペースモデル(SSM)は、シーケンシャルデータにおける長距離依存をモデリングするための強力なツールであることが証明されている。
本稿では,Daubechies ウェーブレットをベースとした SaFARi の実装である WaLRUS を紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:41:24 GMT)
Fine-Grained ECG-Text Contrastive Learning via Waveform Understanding Enhancement [22.7] 本稿ではFG-CLEP(Fine-Grained Contrastive Language ECG Pre-training)を提案する。
本稿では,心電図における共通診断の頻度による偽陰性度を考慮し,コントラスト学習を導く意味的類似性行列を導入する。
6つのデータセットの実験により、FG-CLEPはゼロショット予測と線形探索の両方において最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:03:06 GMT)
Efficiently Building a Domain-Specific Large Language Model from Scratch: A Case Study of a Classical Chinese Large Language Model [22.6] 本稿では,古典中国語の理解と生成に特化して設計された,大規模言語モデルであるAI Taiyanを開発する。
実験によると、合理的なモデル設計、データ処理、基礎的なトレーニング、微調整により、わずか18億のパラメータで満足な結果が得られる。
本研究は、専門分野固有の大規模言語モデルの効率的な構築の参考となる。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:43:16 GMT)
MoVer: Motion Verification for Motion Graphics Animations [22.5] MoVerは、一階述語論理に基づく動作検証である。
LLMに基づく合成および検証パイプラインでMoVerをどのように利用できるかを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:41:52 GMT)
CL-BioGAN: Biologically-Inspired Cross-Domain Continual Learning for Hyperspectral Anomaly Detection [22.2] 生物学的ニューラルネットワークは、新しい経験の学習と矛盾する歴史知識を積極的に忘れることができる。
クロスドメインHADタスクの継続的分散適合性を高めるために,生物にヒントを得た連続学習生成適応ネットワーク(CL-BioGAN)を提案する。
実験の結果,提案したCL-BioGANは,パラメータやコストの少ないドメイン間HADにおいて,より堅牢で精度の高い処理が可能であることが確認された。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:56:00 GMT)
GLProtein: Global-and-Local Structure Aware Protein Representation Learning [22.2] タンパク質の構造情報は3D情報に限らず、アミノ酸分子(局所情報)からタンパク質-タンパク質構造類似性(グローバル情報)までも含んでいると論じる。
我々は,タンパク質事前学習における最初のフレームワークである textbfGLProtein を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:45:13 GMT)
Kick Bad Guys Out! Conditionally Activated Anomaly Detection in Federated Learning with Zero-Knowledge Proof Verification [22.1] フェデレートラーニング(FL)システムは、モデル中毒やバックドア攻撃などの敵攻撃に対して脆弱である。
本研究では,実用FLシナリオに特化して設計された新しい異常検出手法を提案する。
本手法では,2段階の条件付き検出機構を用いる。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:30:15 GMT)
How can Diffusion Models Evolve into Continual Generators? [22.1] 連続一貫性拡散(Continuous Consistency Diffusion, CCD)は、一貫性の目標をトレーニングに統合する原則的なフレームワークである。
CCDは連続的な設定の下で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:49:25 GMT)
Back to Square Roots: An Optimal Bound on the Matrix Factorization Error for Multi-Epoch Differentially Private SGD [21.9] 逆相関行列上にバンド構造を付加した新しい明示的因数分解法,Banded Inverse Square Root (BISR) を導入する。
BISRは、上界と下界をマッチングすることで、アナル最適誤差を達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:41:44 GMT)
LoRASuite: Efficient LoRA Adaptation Across Large Language Model Upgrades [21.9] LLM(Large Language Models)の更新に特化して設計されたモジュール型アプローチであるLoRASuiteを提案する。
LoRASuiteは、小さなバニラのLoRAメソッドを一貫して上回っている。
メモリ消費を5.5GB、計算時間を78.23%削減する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:11:17 GMT)
Relation-Aware Graph Foundation Model [21.9] グラフ基礎モデル (GFMs) がグラフ学習において有望な方向として登場した。
明示的なトークン表現に依存する言語モデルとは異なり、グラフは一般化のための明確に定義された単位を持たない。
GFMの基本単位として関係トークンを利用する新しいフレームワークREEFを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:34:41 GMT)
FIGhost: Fluorescent Ink-based Stealthy and Flexible Backdoor Attacks on Physical Traffic Sign Recognition [21.9] 交通標識認識(TSR)システムは自動運転には不可欠だが、バックドア攻撃には脆弱である。
本稿では,蛍光インキをトリガーとして活用した最初の物理世界バックドア攻撃であるFIGhostを紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:15:12 GMT)
Collaborative Deterministic-Probabilistic Forecasting for Real-World Spatiotemporal Systems [21.5] CoSTは平均残留分解戦略を定式化するフレームワークである。
これは、条件平均と空間拡散モデルを捉えるために強力な決定論的モデルを使用し、不確かさを学習する。
実験の結果、CoSTは最先端のベースラインに対して25%の精度で達成され、計算コストは大幅に削減された。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:24:32 GMT)
Adversarial Attacks of Vision Tasks in the Past 10 Years: A Survey [21.4] 認知バイアス、即発注射、脱獄などの新たな攻撃ベクターが出現している。
既存の調査では、しばしば分類を攻撃し、詳細な分析を欠いている。
本稿は、従来のLVLM攻撃とLVLM攻撃の包括的概要を提供することによって、これらのギャップに対処する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:16:08 GMT)
Robust Cross-View Geo-Localization via Content-Viewpoint Disentanglement [21.2] クロスビュージオローカライゼーション(CVGL)は、ドローンや衛星など、さまざまな視点から捉えた同じ地理的位置の画像をマッチングすることを目的としている。
CVGLは、視線の変化による顕著な外観変化と空間歪みのため、非常に困難である。
我々は、$textitcontent$と$textitviewpoint$ Factorを明示的に分離する新しいCVGLフレームワークである$textbfCVD$を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:10:32 GMT)
Probabilistic Stability Guarantees for Feature Attributions [20.6] 本稿では,非自明かつ解釈可能な帰属法保証を与えるモデル非依存,サンプル効率の安定度保証アルゴリズム(SCA)を提案する。
軽度な平滑化は精度と安定性のトレードオフをより良好に達成し、事前の認証手法による攻撃的な妥協を回避することを示します。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:16:40 GMT)
C2HLSC: Leveraging Large Language Models to Bridge the Software-to-Hardware Design Gap [20.5] 本稿では,HLS互換フォーマットに自動的にCコードを生成するための大規模言語モデルについて検討する。
本稿では,NIST 800-22テストのランダム性,QuickSortアルゴリズム,およびAES-128をHLS合成可能なCに書き換えるためにLLMを用いたケーススタディを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:02:52 GMT)
EarthSynth: Generating Informative Earth Observation with Diffusion Models [20.4] 本研究では,多カテゴリ・クロスサテライトによる地球観測が可能な拡散ベース生成基盤モデルを提案する。
オープンワールドシナリオにおけるシーン分類,オブジェクト検出,セマンティックセグメンテーションにおける地球合成の評価を行った。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:27:15 GMT)
Counterspeech the ultimate shield! Multi-Conditioned Counterspeech Generation through Attributed Prefix Learning [20.2] 建設的逆音声を生成するための新しいフレームワークであるPreference Optimizationを用いた階層型プレフィックス学習であるHiPPrOを紹介する。
IntentCONANv2は、13,973のカウンター音声インスタンスに5つのアノテータによる感情ラベルをアノテートすることで拡張する。
HiPPrOは意図整合性を38%改善し、ルージュ-1, ルージュ-2, ルージュ-Lを3%, 2%, 3%, 3%改善した。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:19:49 GMT)
Thompson Sampling-like Algorithms for Stochastic Rising Bandits [20.1] レイジング・レステッド・バンディット(Rising rested bandit、SRRB)は、腕が引っ張られるにつれて、期待される報酬が増加する舞台である。
この研究は、SRRBにおけるそのようなアルゴリズムに対する新たな後悔の分析を提供し、課題を強調し、独立した技術ツールを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:19:07 GMT)
When AI Co-Scientists Fail: SPOT-a Benchmark for Automated Verification of Scientific Research [20.0] 大規模言語モデル(LLM)は、AIコサイシストと呼ばれる自動科学的発見のビジョンを加速させた。
大規模言語モデル(LLM)の最近の進歩は、しばしばAIコサイシストと呼ばれる自動科学的発見のビジョンを加速させた。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:45:16 GMT)
MINGLE: Mixtures of Null-Space Gated Low-Rank Experts for Test-Time Continual Model Merging [19.9] 連続モデルマージは、オリジナルのトレーニングデータにアクセスすることなく、個別に微調整されたモデルを逐次統合する。
MINGLEは、少数の未ラベルテストサンプルを使用したテスト時間連続モデルマージのための新しいフレームワークである。
MINGLEは、従来の最先端のメソッドを、さまざまなタスクオーダの平均で7-9%上回っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:24:22 GMT)
CoT-Vid: Dynamic Chain-of-Thought Routing with Self Verification for Training-Free Video Reasoning [19.9] CoT-Vidは、多段階の複雑な推論設計を持つビデオドメインのための新しいトレーニング不要のパラダイムである。
幅広いベンチマークで優れた結果を示し、Egochemaでは9.3%、VideoEspressoでは5.6%でベースモデルを上回っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:34:32 GMT)
Learn to Think: Bootstrapping LLM Reasoning Capability Through Graph Representation Learning [19.8] 大規模言語モデル(LLM)は、様々な領域で大きな成功を収めています。
それらは、訓練のための高い計算コストや複雑な推論問題の解決における制限など、依然として重大な課題に直面している。
より柔軟で適応的な推論機能を実現するために,グラフ学習を活用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:10:14 GMT)
Diffmv: A Unified Diffusion Framework for Healthcare Predictions with Random Missing Views and View Laziness [19.7] 我々は、EHRデータの複数ビューの活用を促進するために設計された、革新的な拡散に基づく生成フレームワークであるDiffmvを紹介する。
具体的には、ランダムに欠落するビューに対処するため、EHRデータの様々なビューを統合拡散デノゲーションフレームワークに統合する。
本稿では,各ビューの相対的優位性を評価し,モデル内の様々なデータビューのバランスよく活用する手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:15:55 GMT)
Parameter Efficient Continual Learning with Dynamic Low-Rank Adaptation [19.5] 連続学習(CL)におけるディープニューラルネットワークにとって、破滅的な忘れは依然として重要な課題である。
CLトレーニング中にLoRAコンポーネントの動的ランクアロケーションを必要とするリハーサルフリーなCLフレームワークであるPEARLを紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:19:01 GMT)
VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption [19.3] 既存のトークン化器は固定時間圧縮率を提供し、拡散モデルの計算コストはフレームレートと線形にスケールする。
本稿では、可変フレームレート符号化と復号を可能にするトランスフォーマーベースのビデオトークンであるVFRTokを紹介する。
VFRTokは既存のトークンよりも1/8トークンしか使用せず、競争力のある再構築品質と最先端のビデオ忠実性を実現している。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:32:54 GMT)
Keypoints as Dynamic Centroids for Unified Human Pose and Segmentation [19.1] Keypoints as Dynamic Centroid (KDC)は、統合された人間のポーズ推定とインスタンスレベルのセグメンテーションのための、新しいセントロイドベースの表現である。
KDCはボトムアップのパラダイムを採用し、容易に区別できるキーポイントと複雑なキーポイントの両方にキーポイントのヒートマップを生成する。
高信頼のキーポイントを埋め込み空間の動的セントロイドとして利用し、MaskCentroidを生成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:05:34 GMT)
Web2Wiki: Characterizing Wikipedia Linking Across the Web [19.0] ウェブドメインの1.68%にまたがるウィキペディアのリンクは9000万以上ある。
ウィキペディアは情報目的のためにニュースや科学のウェブサイトでしばしば引用される。
ほとんどのリンクは証拠や帰属ではなく説明的な参照として機能する。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:52:24 GMT)
Beyond Scalar Rewards: An Axiomatic Framework for Lexicographic MDPs [18.5] ハウスナーの基本的な研究は、連続公理の減少が期待される効用理論の一般化につながることを示した。
このような報酬関数と一般的なd次元の場合の完全な特徴付けを、優先性に関するメモリレス仮定の下でマルコフ決定過程(MDP)において提供する。
この設定における最適ポリシーは、スカラー・リワードの多くの望ましい特性を保っているが、Constrained MDP(もう一つの一般的な多目的設定)ではそうではないことを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:23:58 GMT)
Large Language Models Might Not Care What You Are Saying: Prompt Format Beats Descriptions [18.2] 本稿では,複数のコンテキスト内サンプルの選択基準を記述するためのアンサンブルプロンプトフレームワークを提案する。
6つの翻訳方向にわたる機械翻訳(MT)の予備実験により、このフレームワークがICLの性能を高めることが確認された。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:50:54 GMT)
FedHQ: Hybrid Runtime Quantization for Federated Learning [18.0] Federated Learning(FL)は、データプライバシを保存するが、効率の低い分散モデルトレーニングアプローチである。
本稿では,FLシステムにおけるPTQとQATを組み合わせたハイブリッド量子化手法を提案する。
実験の結果、FedHQはトレーニングアクセラレーションを最大2.47倍、精度を最大11.15%向上し、余分なオーバーヘッドを無視できることがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:30:27 GMT)
Self-Learning Hyperspectral and Multispectral Image Fusion via Adaptive Residual Guided Subspace Diffusion Model [17.9] ハイパースペクトル・マルチスペクトル画像(HSI-MSI)融合は、高分解能ハイパースペクトル画像(LR-HSI)と高分解能マルチスペクトル画像(HR-MSI)を組み合わせて高分解能ハイパースペクトル画像(HR-HSI)を生成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:05:13 GMT)
Differentially Private Synthetic Data via APIs 3: Using Simulators Instead of Foundation Model [17.9] 差分プライベート(DP)合成データは、プライバシーを損なうことなく、プライベートデータの価値を解放するための重要なツールとなっている。
プライベート・エボリューション(PE)はDP合成データを生成するための有望な方法として登場した。
PEフレームワークは基盤モデルを超えたAPIを可能にするのに十分な一般性を持っていることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:34:54 GMT)
PolyPythias: Stability and Outliers across Fifty Language Model Pre-Training Runs [17.6] Pythiaモデルスイート用の45の新しいトレーニング実行セットであるPolyPythiasを紹介します。
種によって決定される初期条件の違いが,(i)下流のパフォーマンス,(ii)言語表現の学習,(iii)訓練段階の出現に及ぼす影響について検討した。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:34:59 GMT)
SALMONN-omni: A Standalone Speech LLM without Codec Injection for Full-duplex Conversation [17.6] SALMON-N-omniは、トークン遷移バックボーンなしで動作する最初の単独のフルバイト音声LLMである。
LLMバックボーン内に新しい動的思考機構が備わっており、講演と聴取の間にモデルを学習することができる。
SALMON-N-Omniは、ターンテイキング、バックチャネルエコーキャンセル、コンテキスト依存バージェインなど、複雑な会話シナリオで強いパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:13:59 GMT)
Tube Loss: A Novel Approach for Prediction Interval Estimation and probabilistic forecasting [17.5] 本稿では,予測区間の境界値の同時推定のための新しい損失関数「タブロス」を提案する。
管損失に基づく経験的リスクを最小化して得られたPIは、既存の方法によるPIよりも高品質であることが示されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:41:26 GMT)
Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping [17.2] 本稿では,小サンプルサイズ体制における2つの政策を厳密に比較するための新しい統計枠組みを提案する。
実験では、ほぼ最適に停止し、研究者が評価を中止し、最小限の試行で決定を下せることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:56:30 GMT)
Vulnerability of Text-to-Image Models to Prompt Template Stealing: A Differential Evolution Approach [16.6] 簡単な難易度と難易度に分類した50のテンプレートと450のイメージからなるベンチマークであるPrismを紹介する。
EvoStealerは,モデル微調整なしで動作可能なテンプレートステアリング手法である。
評価の結果,EvoStealerの盗難テンプレートはオリジナルと非常によく似た画像を再現し,他の被験者に効果的に一般化できることがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:50:48 GMT)
Beyond the Human-AI Binaries: Advanced Writers' Self-Directed Use of Generative AI in Academic Writing [16.2] この研究は、先進的なL2英語作家の学術著作におけるジェネレーティブAI(GAI)の自己間接的利用を探求する。
この結果より, GAIに対するアプローチは, 規範的使用からダイアログ的使用まで多岐にわたることが明らかとなった。
AIが著者、テキスト、学習といった従来の概念を乱す方法を強調します。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:48:44 GMT)
Residual Feature Integration is Sufficient to Prevent Negative Transfer [16.0] 負の伝達を緩和するシンプルな手法であるResidual Feature Integration (REFINE)を提案する。
提案手法は、固定されたソース側表現とトレーニング可能なターゲット側エンコーダを組み合わせることで、その結果の関節表現に浅いニューラルネットワークを適合させる。
経験的に、REFINEは様々なアプリケーションやデータモダリティのパフォーマンスを継続的に向上させる。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:36:59 GMT)
Block Diffusion: Interpolating Between Autoregressive and Diffusion Language Models [15.9] 拡散言語モデルは自己回帰モデルよりも独特な利点を提供する。
確率モデリングに遅れがあり、固定長生成に制限される。
本稿では,離散化拡散モデルと自己回帰モデルとを補間するブロック拡散言語モデルについて紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:15:02 GMT)
RS-Agent: Automating Remote Sensing Tasks through Intelligent Agent [15.8] RS-Agentは、人間のユーザーと対話し、専門的なモデルを自律的に活用するように設計されたAIエージェントである。
RS-Agentは、大きな言語モデルに基づく中央コントローラ、ツール実行のための動的ツールキット、タスク固有のエキスパートガイダンスのためのソリューションスペース、ドメインレベルの推論のための知識スペースの4つの重要なコンポーネントを統合している。
9つのデータセットと18のリモートセンシングタスクにわたる大規模な実験により、RS-Agentは最先端のMLLMよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:54:58 GMT)
Optimal Policy Adaptation under Covariate Shift [15.7] 目的領域における最適ポリシーを2つのデータセットを用いて学習するための原則的アプローチを提案する。
我々は、所定の政策によって引き起こされた報酬に対する識別可能性の仮定を導出する。
そして、推定報酬を最適化することで最適な政策を学ぶ。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:18:57 GMT)
Personalized Federated Fine-Tuning for LLMs via Data-Driven Heterogeneous Model Architectures [15.6] Federated Learning (FL) は、生データにアクセスすることなく、大規模言語モデルの協調的な微調整を可能にする。
データ駆動の異種モデルアーキテクチャを実現する軽量なパーソナライズFLフレームワークであるFedAMoLEを提案する。
実験の結果、FedAMoLEはクライアントサイドのパフォーマンスを既存のアプローチと比べて平均5.14%改善している。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:54:49 GMT)
On the Eligibility of LLMs for Counterfactual Reasoning: A Decompositional Study [15.6] 対物推論は、大規模言語モデルの推論能力を一般化するための重要な手法として現れてきた。
本稿では, 因果関係の構築から, 逆因果関係の介入に対する推論まで, 逆因果関係の生成を分解する分解戦略を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:59:32 GMT)
ArrayDPS: Unsupervised Blind Speech Separation with a Diffusion Prior [15.5] ブラインド音声分離(ブラインド音声分離、BSS)は、マイクロフォンアレイによって記録された音声の混合から複数の音声ソースを分離することを目的としている。
本稿では,非教師付き,配列に依存しない,生成的な方法でBSS問題を解決するためのArrayDPSを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:53:30 GMT)
FABLE: A Localized, Targeted Adversarial Attack on Weather Forecasting Models [15.5] 深層学習に基づく天気予報モデルは、最近、金標準物理学に基づくシミュレーションツールよりも顕著な性能向上を示した。
これらのモデルは敵の攻撃に弱いため、その信頼性に対する懸念が高まる。
本研究では3次元離散ウェーブレット分解を用いて時空間データの様々な成分を抽出するFABLEという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:51:52 GMT)
MARVEL: Multi-Agent RTL Vulnerability Extraction using Large Language Models [15.4] 大きな言語モデル(LLM)は、このタスクの間、直接または既存のツールと連携するために使われてきた。
我々は、意思決定、ツールの使用、推論に対する統一的なアプローチのためのマルチエージェントLLMフレームワークであるMARVELを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:31:24 GMT)
GLOVER++: Unleashing the Potential of Affordance Learning from Human Behaviors for Robotic Manipulation [15.1] 我々は,1,726のオブジェクトカテゴリにわたる50,000の画像と675のアクションからなる大規模,手頃なアノテートデータセットであるHOVA-500Kを紹介した。
GLOVER++は,人間の実演から下流のオープン語彙推論タスクへ行動可能なアベイランス知識を効果的に伝達するグローバル・ローカル・アベイランス・トレーニング・フレームワークである。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:14:31 GMT)
Evaluating the Logical Reasoning Abilities of Large Reasoning Models [15.0] 大規模な推論モデルにおける論理的推論を評価するためのベンチマークであるLogiEvalを紹介する。
LogiEvalは様々な推論タイプ(帰納的、帰納的、類推的、帰納的)とタスク形式(論理的シーケンス、引数解析など)にまたがる。
実験により,現代の推論モデルでは,4選択の議論解析問題や類似推論において,人間の性能を上回っていることがわかった。
解析の結果,人為的性能はモデル故障分布を反映しないことがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:36:14 GMT)
Adversarial Attacks on Both Face Recognition and Face Anti-spoofing Models [14.8] 本稿では,顔認識(FR)モデルと顔アンチスプーフィング(FAS)モデルの両方を同時にターゲットとする,新たな攻撃設定を提案する。
具体的には、FRモデルとFASモデルの両方においてブラックボックス攻撃のキャパシティを向上させるために、RMA(Reference-free Multi-level Alignment)と呼ばれる新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:24:41 GMT)
Benchmarking LLMs in an Embodied Environment for Blue Team Threat Hlunting [14.8] 大きな言語モデル(LLM)は、脅威分析を強化するための有望な機能を提供する。
実際のブルーチームの脅威追跡シナリオにおけるそれらの効果は、まだ十分に調査されていない。
青のチームリングでLLMをガイドするベンチマークであるCYBERTEAMを提示する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:33:50 GMT)
Towards Comprehensive Argument Analysis in Education: Dataset, Tasks, and Method [14.7] 垂直次元と水平次元の両方から,14種類の微粒な関係型を提案する。
議論コンポーネント検出,関係予測,エッセイ自動評価という3つの課題について実験を行った。
本研究は, 文質評価のための詳細な論証アノテーションの重要性を強調し, 多次元論証分析を奨励するものである。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:36:51 GMT)
Graph Synthetic Out-of-Distribution Exposure with Large Language Models [14.7] グラフにおけるアウト・オブ・ディストリビューション(OOD)検出は、オープンワールドおよび安全に敏感なアプリケーションにおけるモデルロバスト性を保証するために重要である。
現在のグラフベースの手法は、しばしば実際のOODノードへのアクセスを前提とします。
GOE-LLMは,大規模言語モデル(LLM)を利用して,実際のOODノードを使わずに,テキスト分散グラフ上でのOOD露光を実現するフレームワークである。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:06:02 GMT)
Supervised Learning-enhanced Multi-Group Actor Critic for Live Stream Allocation in Feed [14.5] SL-MGAC(Supervised Learning-enhanced Multi-Group Actor Critic Algorithm)を提案する。
本稿では,分散低減手法を取り入れた教師付き学習支援型アクター批判フレームワークを提案する。
また,過度に欲求的なライブストリームアロケーションを防止するために,新たな報酬関数を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:06:52 GMT)
The Effects of Demographic Instructions on LLM Personas [14.3] ソーシャルメディアプラットフォームは、政府規制に従って性差別的なコンテンツをフィルタリングしなければならない。
現在の機械学習アプローチでは、標準化された定義に基づいて性差別を確実に検出することができる。
我々は、ゴールドスタンダードラベルを強制するのではなく、多彩なアノテーションを保ちながら、パースペクティブなアプローチを採用する。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:49:15 GMT)
Data-centric Prediction Explanation via Kernelized Stein Discrepancy [14.2] 本稿では,KSDの特性を利用した高精度・データ中心記述(HD-Explain)予測法を提案する。
具体的には、KSDはモデル依存データ相関を符号化する訓練モデルのパラメータ化カーネル関数を独自に定義する。
本稿では,HD-Explainが高精度(きめ細かな説明),一貫性,計算効率など,様々な面から既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:40:46 GMT)
Pruning via Merging: Compressing LLMs via Manifold Alignment Based Layer Merging [14.1] 我々は,MKA(Manifold-based Knowledge Alignment and Layer Merging Compression)を提案する。
MKAは、多様体学習と正規化ペアワイズ・インフォメーション・ボトルネック測定を使用して、類似したレイヤをマージし、本質的な性能を維持しながらモデルサイズを削減している。
以上の結果から,MKAはモデル性能を保ちつつ,圧縮率も大幅に向上し,従来のプルーニング法よりも優れていた。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:23:58 GMT)
RLAP: A Reinforcement Learning Enhanced Adaptive Planning Framework for Multi-step NLP Task Solving [14.1] 下流自然言語処理(NLP)タスクにおける大規模言語モデル(LLM)の性能向上のために,多段階計画が広く採用されている。
マルチステップNLPタスクをよりよく解くために,RLAP(Reinforcement Learning enhanced Adaptive Planning framework)を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:06:14 GMT)
Dynamic Early Exit in Reasoning Models [14.0] 長いチェーン・オブ・シンクレット(CoT)生成における再考は、問題解決の効率を低下させるだけでなく、精度損失のリスクも引き起こす。
我々は,LLMが生成時に早期終了によってCoT配列を自己トランケートできる簡易かつ効果的な方法を提案する。
提案手法は追加のトレーニングを必要とせず,既存の o1 ライクな推論 LLM にシームレスに統合することができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:09:13 GMT)
Solve-Detect-Verify: Inference-Time Scaling with Flexible Generative Verifier [14.0] 複雑なタスクを推論する大規模言語モデル(LLM)は、本質的には解の精度と計算効率のトレードオフを伴う。
本稿では,高速かつ信頼性の高い高速思考と巧妙なスロー思考の両立を図った新しい生成検証器FlexiVeを紹介する。
実験によると、FlexiVeはProcessBenchの推論トレース内のエラーをピンポイントする精度が優れている。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:41:44 GMT)
MRGRP: Empowering Courier Route Prediction in Food Delivery Service with Multi-Relational Graph [13.8] インスタントフードデリバリーは、日常生活の利便性から、世界で最も人気のあるウェブサービスの一つとなっている。
基本的な課題は、タスクディスパッチを最適化し、デリバリ効率を向上させるために、courierルートを正確に予測することである。
本稿では, 高精度な予測のためのコーリエ決定に影響を及ぼすタスク間の微粒な相関関係をモデル化する, マルチリレーショナルグラフベース経路予測法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:19:34 GMT)
Revisiting Backdoor Attacks on Time Series Classification in the Frequency Domain [13.8] 時系列分類(TSC)は現代のウェブアプリケーションの基盤となっている。
ディープニューラルネットワーク(DNN)は、臨界領域におけるTSCモデルの性能を大幅に向上させた。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:45:29 GMT)
JL1-CD: A New Benchmark for Remote Sensing Change Detection and a Robust Multi-Teacher Knowledge Distillation Framework [13.7] リモートセンシング画像における変化検出は、地球観測において重要な役割を果たす。
5000枚の画像対からなる大規模サブメートルCDデータセットであるJL1-CDを紹介する。
我々は,O-P(Origin-Partition)戦略を新たに提案し,CD性能を高めるために,MTKD(Multi-Teacher Knowledge Distillation)フレームワークに統合する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:10:34 GMT)
SAINT: Attention-Based Modeling of Sub-Action Dependencies in Multi-Action Policies [13.7] サブ・アクション・インタラクション・ネットワーク (SAINT) は、多成分のアクションを無秩序な集合として表現し、その依存関係をグローバルな状態に設定された自己注意によってモデル化する新しいポリシーアーキテクチャである。
3つのタスクドメインにまたがる15の異なる環境、例えば1700万近い共同アクションを持つ環境では、SAINTは一貫して強力なベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:34:31 GMT)
Wasserstein Flow Matching: Generative modeling over families of distributions [13.6] We propose Wasserstein flow matching (WFM) which lifts flow matching on the family of distributions using the Wasserstein geometry。
特に、WFMは、解析的に(ガウスとして)、または経験的に(点雲として)、高次元の分布を生成することができる最初のアルゴリズムである。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:27:23 GMT)
Enhancing Complex Instruction Following for Large Language Models with Mixture-of-Contexts Fine-tuning [13.6] 訓練後の大規模言語モデル(LLM)は、一貫して複雑な命令に従うのに苦労する可能性がある。
本稿では,逐次的に構造化された入力命令を,サブコンテキストを含む複数の並列命令に変換することを提案する。
MISOは、SFTの有効性を高めるために、全体的な命令出力アライメントと個々のサブコンテキストの影響を共同で検討する混合コンテキストパラダイムを導入している。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:13:47 GMT)
Why Stop at One Error? Benchmarking LLMs as Data Science Code Debuggers for Multi-Hop and Multi-Bug Errors [13.3] 我々は、マルチホップエラートレースとマルチバグ検出におけるLCMの体系的評価のための最初のベンチマークであるData Science Benchmarkを紹介する。
DSDBenchには,711の因果エラーペアとランタイムエラーメッセージを備えた,1,117のアノテーション付きサンプルが含まれている。
DSDBench上での最先端LCMの評価は、大きな性能差を示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:56:07 GMT)
Are LLMs Ready for English Standardized Tests? A Benchmarking and Elicitation Perspective [13.2] 大規模言語モデル(LLM)は、学習者が教育コンテンツとどのように相互作用するかに革命をもたらすと約束している。
英語標準テスト(EST)の多種多様なセットにまたがって、正確かつ文脈的に適切なソリューションを生成する能力を評価する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:10:44 GMT)
Multimodal Cancer Survival Analysis via Hypergraph Learning with Cross-Modality Rebalance [13.0] 本稿では,ハイパーグラフ学習を取り入れた病理画像から文脈的・階層的詳細を抽出するフレームワークを提案する。
C-Indexの性能は3.4%以上向上した。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:16:54 GMT)
Stable Offline Value Function Learning with Bisimulation-based Representations [13.0] 強化学習では、固定目標ポリシーに従って行動を行う際に、各状態から期待される割引リターンを推定するために、オフライン値関数学習を用いる。
状態-作用表現を明示的に形成することにより、値関数学習を安定させることが重要である。
オフラインポリシー評価のためのカーネル表現と呼ばれるシミュレーションに基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:57:46 GMT)
Multi-Attribute Graph Estimation with Sparse-Group Non-Convex Penalties [12.9] マルチ属性データから条件独立グラフ(CIG)ベクトルを推定する問題を考察する。
グラフ推定のための既存のほとんどの方法は、各ノードの1つのスカラーランダム変数に基づいている。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:35:28 GMT)
BraVE: Offline Reinforcement Learning for Discrete Combinatorial Action Spaces [12.9] 本稿では,従属構造を保ちながら協調動作の線形数を評価するための値に基づく手法を提案する。
BraVEは400万以上のアクションを持つ環境において、事前のオフラインRLメソッドを最大20タイム$でパフォーマンスする。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:15:52 GMT)
Not All Thoughts are Generated Equal: Efficient LLM Reasoning via Multi-Turn Reinforcement Learning [12.8] 大規模言語モデル(LLM)からの長いチェーン・オブ・シント(CoT)は、LLMの推論効率を改善するための新たな戦略である。
既存の研究は、全ての思考を長いCoT内で等しく圧縮し、より簡潔で効果的な推論を妨げる。
本稿では,Long$otimes$Shortを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:26:39 GMT)
Adversarial Robustness for Unified Multi-Modal Encoders via Efficient Calibration [12.8] 統合マルチモーダルエンコーダにおける敵の脆弱性の包括的研究について述べる。
音声や点雲などの視覚的でない入力は、特に脆弱である。
本手法は,エプシロン=4/255で最大47.3%の強靭性を向上する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:26:04 GMT)
Understanding and Enhancing the Transferability of Jailbreaking Attacks [12.4] 脱獄攻撃は、オープンソースの大規模言語モデル(LLM)を効果的に操作し、有害な応答を生成する。
本研究は, モデルが意図的知覚に与える影響を分析し, 脱獄攻撃の伝達可能性について検討する。
そこで本研究では,入力中の中性インテリジェントトークンを均一に分散するPerceived-Iportance Flatten (PiF)法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:47:24 GMT)
Incorporating Verification Standards for Security Requirements Generation from Functional Specifications [12.4] F2SRD(Function to Security Requirements Derivation)は、機能仕様からセキュリティ要件(SR)を積極的に引き出す自動アプローチである。
まず、FRとVRペアのカスタムデータベースでトレーニングされたVRレトリバーを開発し、ASVSから適用可能なVRを積極的に選択できるようにします。
第二に、これらのVRは、SRを生成する際にGPT4を誘導する構造化プロンプトを構築するために使用される。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:47:46 GMT)
Redefining Neural Operators in $d+1$ Dimensions [12.3] そこで我々は,SKNO (Schr) を設計し,$d+1$次元の進化と整合する手法を提案する。
実験では、d+1$ 次元発展線形ブロックは他のものよりもはるかに優れている。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:15:00 GMT)
Mitigating Selection Bias with Node Pruning and Auxiliary Options [11.8] 大規模言語モデル(LLM)は、複数の質問に応答するときに、特定の回答の選択を体系的に選好することが多い。
このバイアスは、LCM出力の精度と信頼性を低下させ、決定クリティカルなアプリケーションにおけるそれらの有用性を制限する。
選択バイアスに寄与するパラメータを抽出するBias Node Pruning(BNP)と、ホワイトボックスとブラックボックスの設定の両方でバイアスを減らすためのAuxiliary Option Injection(AOI)の2つの方法を紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:21:30 GMT)
CorBenchX: Large-Scale Chest X-Ray Error Dataset and Vision-Language Model Benchmark for Report Error Correction [11.7] CorBenchXは胸部X線レポートにおける自動エラー検出と修正のためのスイートである。
まず,26,326個の胸部X線誤差の大規模データセットを合成した。
オープンソースとクローズドなビジョン言語モデルの両方をベンチマークします。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:39:39 GMT)
Telco-oRAG: Optimizing Retrieval-augmented Generation for Telecom Queries via Hybrid Retrieval and Neural Routing [11.7] 本稿では,通信分野の技術的問題に対処するために最適化されたオープンソースのRetrieval-Augmented Generation(RAG)フレームワークであるTelco-oRAGを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:46:30 GMT)
Transformer learns the cross-task prior and regularization for in-context learning [11.6] 文脈例から基底重みベクトルへの逆写像を学習するために線形変換器を導入する。
我々は, 変圧器推定器の誤差が雑音レベル, タスク次元とコンテキスト長との比, 入力データの条件数と線形にスケールすることを数値的に検証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:42:23 GMT)
TechniqueRAG: Retrieval Augmented Generation for Adversarial Technique Annotation in Cyber Threat Intelligence Text [11.4] セキュリティテキストにおける敵のテクニックの正確な識別は、効果的なサイバー防御に不可欠である。
既存のメソッドは基本的なトレードオフに直面している。ドメインの精度が限られているジェネリックモデルに依存するか、リソース集約的なパイプラインを必要とする。
本稿では,このギャップを埋めるドメイン固有検索拡張生成(RAG)フレームワークであるTechnologyRAGを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:46:10 GMT)
The Impact of Emerging Phishing Threats: Assessing Quishing and LLM-generated Phishing Emails against Organizations [11.4] 現在、QRコードベイトとLLM対応プリテキストの2つの新興ベクターが注目されている。
さまざまな規模の組織で3つのフィッシングシミュレーションを実施している。
以上の結果から,従来のフィッシングメールと同等の有効性が示唆された。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:14:57 GMT)
FairKV: Balancing Per-Head KV Cache for Fast Multi-GPU Inference [11.1] TransformerモデルにおけるKVキャッシュ技術は、メモリ使用量を大幅に増加させ、冗長な計算を減らすことを目的としている。
近年、最先端のKVキャッシュ圧縮手法では、各アテンションヘッドのKVキャッシュ予算を動的に調整する不均衡なヘッドアロケーションアルゴリズムが実装されている。
本研究では,不均衡なKVキャッシュ圧縮を用いたシステムにおいて,アテンションヘッド間のメモリ使用量を確保するためのFair KVを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:22:59 GMT)
A Symplectic Analysis of Alternating Mirror Descent [11.1] シンプレクティック・オイラー法による連続時間ハミルトン流の離散化について検討する。
段数の順序で切り詰められたとき、修正されたハミルトン多様体上の新しい誤差境界を導出する。
もし本当なら、AMDの完全後悔は$mathcalOleft(K-1+varepsilonright)$、平均反復の双対性ギャップは$mathcalOleft(K-1+varepsilonright)$、任意の$varepsilon>0$であることを意味する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:07:29 GMT)
LLM-based Automated Theorem Proving Hinges on Scalable Synthetic Data Generation [11.0] 本研究では,幅広い中間的証明状態にまたがる多様な戦術を創出するために設計された,データ合成の訓練のための新しい実証状態探索手法を提案する。
また,データ合成手法を効果的に活用し,木探索における探索と利用のトレードオフを実現する適応ビームサイズ戦略を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:47:36 GMT)
InstanceGen: Image Generation with Instance-level Instructions [11.0] 本稿では,この画像に基づく構造ガイダンスとLLMに基づくインスタンスレベルの命令を併用する手法を提案する。
結果: 画像は、オブジェクトカウント、インスタンスレベルの属性、インスタンス間の空間的関係を含む、テキストプロンプトのすべての部分に準拠します。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:00:37 GMT)
Transformers as Unsupervised Learning Algorithms: A study on Gaussian Mixtures [11.0] 本稿では,教師なし学習問題の解法における変圧器の機能について検討する。
複数のGMMタスクを同時に学習するTGMMというトランスフォーマーベースの学習フレームワークを提案する。
我々は、変換器がスペクトル法のEMアルゴリズムとコア成分の両方を近似できることを証明した。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:02:18 GMT)
Fast RoPE Attention: Combining the Polynomial Method and Fast Fourier Transform [10.9] トランスフォーマー計算の実行時の主なボトルネックは、アテンション計算と呼ばれるタスクである。
我々はこの問題を克服する方法を示し、RoPEの注意をほぼ線形時間で計算する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:03:50 GMT)
SplInterp: Improving our Understanding and Training of Sparse Autoencoders [10.8] スパースオートエンコーダ (SAE) は機械的解釈可能性のツールとして近年注目されている。
SAEの真の有用性については近年疑問が持たれている。
我々は,SAEを訓練するための新しい近似交互手法 SGD (PAM-SGD) アルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:51:26 GMT)
RECOVER: Toward Requirements Generation from Stakeholders' Conversations [10.7] 本稿では,会話要求工学の新たなアプローチであるRECOVERを紹介する。
利害関係者のインタラクションからシステム要件を自動的に抽出する実践者を支援する。
経験的評価は、十分な正確性、完全性、実行可能性を示す要求が生成された、有望なパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:11:13 GMT)
Efficient Randomized Experiments Using Foundation Models [10.6] 本稿では,複数の基礎モデルからの予測を,統計的に妥当な推測を保ちながら統合する手法を提案する。
我々の推定器は、実験データのみに基づく標準推定器と同じ精度のサンプルサイズを最大20%削減する、かなり精度の高いゲインを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:09:56 GMT)
MedSG-Bench: A Benchmark for Medical Image Sequences Grounding [10.5] 既存の医用ビジュアルグラウンドベンチマークは、主に単一イメージのシナリオに焦点を当てている。
実世界の臨床応用には、しばしばシーケンシャルな画像が含まれる。
MedSG-Benchは、メディカルイメージシークエンスグラウンド用に調整された最初のベンチマークである。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:31:17 GMT)
Robust Deep Reinforcement Learning against Adversarial Behavior Manipulation [10.4] 本研究では,強化学習に対する行動目標攻撃とその対策について検討する。
われわれの知る限りでは、行動目標攻撃に特化して設計された最初の防衛戦略である。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:54:06 GMT)
Approximation theory for 1-Lipschitz ResNets [10.3] 負勾配流の明示的なステップに基づく1-Lipschitz残差ネットワーク(ResNets)に着目した。
本稿では,1-Lipschitz ResNets に対する最初の普遍近似保証を提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:36:55 GMT)
Online Iterative Self-Alignment for Radiology Report Generation [10.3] 本稿では,ラジオロジーレポート生成(RRG)のための新しいオンライン反復自己アライメント(OISA)手法を提案する。
本手法により,特定の臨床目的に適した各種報告を作成でき,RRGモデル全体の性能を反復的に向上させることができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:31:12 GMT)
Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A Systematic Review [10.1] 本稿では,最新のAIに基づく放射線画像の3D再構成アルゴリズムについて検討する。
明示的手法は、点ベース、体積ベース、ガウス表現を含み、暗黙的手法は暗黙的な事前埋め込みやニューラルラディアンス場を包含する。
この発展途上の分野における開発の現状と課題,今後の研究方向性について論じる。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:58:25 GMT)
DC-Seg: Disentangled Contrastive Learning for Brain Tumor Segmentation with Missing Modalities [9.9] 本稿では,DC-Segを提案する。この手法は,画像をモダリティ不変の解剖学的表現に明示的に切り離す手法である。
この解は、モダリティギャップを考慮することにより、解剖学的特徴とモダリティ特異的特徴の分離を改善する。
BraTS 2020とプライベートホワイトマターハイパーインテンシティ(WMH)セグメンテーションデータセットの実験は、DC-Segが最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:12:08 GMT)
Demystifying and Enhancing the Efficiency of Large Language Model Based Search Agents [9.9] 大規模言語モデル(LLM)に基づく検索エージェントは,複雑なタスクを解く際,顕著な能力を示した。
LLMベースの検索エージェントのための高効率推論フレームワークであるSearchAgent-Xを紹介する。
SearchAgent-Xは、vLLMやHNSWベースの検索のような最先端システムよりも一貫して優れている。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:07:01 GMT)
SOCIA: An End-to-End Agentic Framework for Automated Cyber-Physical-Social Simulator Generation [9.7] SOCIA(Simulation Orchestration for Cyber-physical-social Intelligence and Agents)は、LLM(Large Language Model)ベースのマルチエージェントシステムを活用した新しいエンドツーエンドフレームワークである。
高忠実なサイバー物理社会(CPS)シミュレータを自動生成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:47:31 GMT)
Black-box Adversaries from Latent Space: Unnoticeable Attacks on Human Pose and Shape Estimation [9.4] 本稿では,EHPSモデルに対する新規なUnnoticeable Black-Box Attack (UBA)を提案する。
UBAは、自然な画像の潜在空間表現を利用して、最適な対向雑音パターンを生成する。
UBAはEHPSモデルのポーズ推定誤差を平均17.27%-58.21%増加させ、重大な脆弱性を明らかにしている。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:02:02 GMT)
UniMoCo: Unified Modality Completion for Robust Multi-Modal Embeddings [9.3] マルチモーダル埋め込みタスク用に設計された視覚言語モデルアーキテクチャUniMoCoを提案する。
我々は,オリジナル入力とモダリティ完了入力の両方から埋め込みを整列させる特別なトレーニング戦略を開発する。
実験によると、UniMoCoは様々な設定で一貫性のあるロバスト性を示しながら、従来の手法よりも優れている。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:53:11 GMT)
Dataset Distillation with Probabilistic Latent Features [9.3] 合成データのコンパクトなセットは、下流の分類タスクにおける元のデータセットを効果的に置き換えることができる。
本稿では,潜在特徴の共分散をモデル化する新しい手法を提案する。
提案手法は,バックボーンアーキテクチャにまたがる最先端のクロスアーキテクチャ性能を実現する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:28:05 GMT)
Personalized Author Obfuscation with Large Language Models [9.3] 著者の難読化における大規模言語モデル(LLM)の有効性について,パラフレーズ化と書き方の変更による検討を行った。
有効性のバイモーダル分布を観察し、ユーザ間で性能が著しく異なる。
そこで本研究では,標準的なプロンプト技術よりも優れたパーソナライズされたプロンプト手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:10:25 GMT)
Re-evaluating the Advancements of Heterophilic Graph Learning [9.3] グラフニューラルネットワーク(GNN)は、リレーショナルデータを用いた機械学習タスクで大きな成功を収めている。
近年の研究では、ヘテロフィリがGNNの性能低下を引き起こすことが報告されている。
さまざまなホモフィリーメトリクスは、挑戦的なデータセットの認識を支援するように設計されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:46:20 GMT)
Incentivize Contribution and Learn Parameters Too: Federated Learning with Strategic Data Owners [9.2] 本稿は、貢献の合理性の問題に対処し、現存する文献と区別する。
本稿では、予算バランスが取れ、最適なパラメータ学習とともに完全なデータ貢献を可能にする第2のメカニズムを提案する。
実(フェデレートされた)データセット(CIFAR-10、FeMNIST、Twitter)による大規模な実験は、これらのアルゴリズムが実際に非常に高速に収束し、良好な福祉保証が得られ、すべてのエージェントのモデルパフォーマンスが向上していることを示している。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:04:20 GMT)
Variational Regularized Unbalanced Optimal Transport: Single Network, Least Action [9.2] 本稿では,この問題を解くための新しいフレームワークである変分RUOT(Var-RUOT)を提案する。
Var-RUOTは、より高速な収束とトレーニング安定性の向上を示しながら、より低い動作のソリューションを見つけることができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:16:14 GMT)
Multi-modal Collaborative Optimization and Expansion Network for Event-assisted Single-eye Expression Recognition [9.2] 我々は,MCO-Eネット(Multi-modal Collaborative Optimization and Expansion Network)を提案する。
MCO-Eネットは、MCO-Mamba(MCO-Mamba)とHeterogeneous Collaborative and Expansion Mixture-of-Experts(HCE-MoE)の2つの革新的な設計を導入した。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:48:40 GMT)
VeriReason: Reinforcement Learning with Testbench Feedback for Reasoning-Enhanced Verilog Generation [9.1] 本稿では,教師付き微調整とガイド・リワード近似最適化(GRPO)によるRTL生成のための強化学習を統合するフレームワークであるVeriReasonを紹介する。
VerilogEvalベンチマークでは、VeriReasonは83.1%の機能的正当性を提供しており、比較可能なサイズのモデルと、GPT-4 Turboのようなはるかに大きな商用システムの両方を上回っている。
VeriReasonは、Verilog生成のための強化学習と明示的な推論機能をうまく統合する最初のシステムであり、自動RTL合成のための新しい最先端技術を確立している。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:25:01 GMT)
The Jacobi Factoring Circuit: Quantum Factoring with Near-Linear Gates and Sublinear Space and Depth [8.9] 本稿では,整数のクラスを分解する小型量子回路を提案する。
P2 Q$ の形の $n$-bit 整数を $log Q = Theta(na)$ for $a in (2/3, 1) とする。
我々の回路は、Li, Peng, Du, Suter (Nature Scientific Reports 2012) によって発見された平方自由分解のための量子アルゴリズムに基づいており、これは量子重ね合わせにおけるヤコビ記号の計算に依存している。
論文参考訳(メタデータ) (Sat, 17 May 2025 23:51:40 GMT)
Gradient descent with generalized Newton's method [8.9] 本稿では,SGDやAdamなどのトピックに適用可能なヘシアンインフォームドアプローチを提案する。
本手法は,収束を加速する学習率を自動的に動的に選択する。
実際,本手法は計算オーバーヘッドがほとんどゼロのフォワードパスのみを必要とするため,実装が容易である。
論文参考訳(メタデータ) (Sat, 17 May 2025 23:04:24 GMT)
DioR: Adaptive Cognitive Detection and Contextual Retrieval Optimization for Dynamic Retrieval-Augmented Generation [8.8] Dynamic Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚の緩和に成功している。
本稿では,適応的認識検出と文脈的検索最適化という2つの主要コンポーネントからなる,革新的な動的RAG手法であるDioRを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:56:32 GMT)
Bridging the Inter-Domain Gap through Low-Level Features for Cross-Modal Medical Image Segmentation [8.6] 本稿では、教師なし領域適応(UDA)アプローチを探求し、モーダルな医療画像セグメンテーションの課題に対処する。
モデルに依存しないUDAフレームワークであるLowBridgeを提案する。これは、クロスモーダルな画像が、同じ構造を描いているように、似たような低レベルな特徴(エッジなど)を共有しているという単純な観察に基づいている。
テスト時に、対象画像からのエッジ特徴を事前訓練された生成モデルに入力し、ソーススタイルのターゲットドメイン画像を生成し、事前訓練されたセグメンテーションネットワークを用いてセグメント化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:49:19 GMT)
Dual-level Fuzzy Learning with Patch Guidance for Image Ordinal Regression [8.5] 通常の回帰は、オブジェクトを順序付けられたクラスに割り当てることで、回帰と分類を橋渡しする。
現在のアプローチは、画像レベルの順序ラベルのみの可用性によって制限されている。
本稿では,DFPG という名称の Patch Guidance フレームワークによる2段階ファジィ学習を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:28:23 GMT)
Beluga Whale Detection from Satellite Imagery with Point Labels [8.5] 本研究は,VHR衛星画像におけるベルガクジラとハープシールの自動検出パイプラインを提案する。
パイプラインはポイントアノテーションとSegment Anything Model(SAM)を利用して、正確なバウンディングボックスアノテーションを生成する。
SAM-labeledボックスで訓練されたYOLOv8は、全体的な$textF_text1$-scoreが72.2%、ハープシールが70.3%に達した。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:13:10 GMT)
OptimAI: Optimization from Natural Language Using LLM-Powered AI Agents [8.4] 自然言語で記述された最適化問題を解くためのフレームワークであるOptimAIを紹介する。
私たちのフレームワークは、フォーミュラ、プランナー、コーダ、コード批判といった重要な役割の上に構築されています。
提案手法では,NLP4LPデータセットで88.1%,Optibenchデータセットで82.3%,エラー率で58%,エラー率で52%の精度を実現した。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:40:22 GMT)
Feature Learning Beyond the Edge of Stability [8.4] 層幅パターンを隠蔽した均一な多層パーセプトロンパラメタライゼーションを提案し、勾配勾配下でのトレーニングダイナミクスを解析する。
訓練中の最小バッチ損失の最初の3つのTaylor係数について,シャープネスと特徴学習の関連性を示す式を得る。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:34:29 GMT)
A Multi-Task Benchmark for Abusive Language Detection in Low-Resource Settings [8.4] 本研究は,Tigrinyaソーシャルメディアにおける乱用言語検出のための大規模人手アノテーション付きベンチマークデータセットを提案する。
このデータセットは、9人のネイティブスピーカーが注釈付けした13,717のYouTubeコメントで構成され、51チャンネルで合計12億ビューの7,373のビデオから集められている。
実験の結果,小型で特殊なマルチタスクモデルは,低リソース環境での現在のフロンティアモデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:52:47 GMT)
RVTBench: A Benchmark for Visual Reasoning Tasks [8.2] 本稿では,従来のビデオ推論のセグメンテーションを超えて,多様な視覚言語推論問題に展開する統一的定式化である推論視覚タスク(RVT)を紹介する。
RVTBenchは,4種類のRVTにまたがる120万以上のトークンの3,896のクエリを含むRVTベンチマークである。
また,タスク固有の微調整を必要とせず,様々な種類のRVTに対してゼロショットの一般化を可能にするRVTのエージェントフレームワークであるRVTagentを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:58:09 GMT)
A Domain-Agnostic Scalable AI Safety Ensuring Framework [8.1] 本稿では,AIシステムが特定の確率でユーザ定義の安全制約を満たすことを保証する新しいフレームワークを提案する。
当社のアプローチでは,任意のAIモデルと最適化問題を組み合わせることで,パフォーマンスを維持しながら,アウトプットが安全要件を満たすことを保証する。
本手法は,穏やかな条件下での確率論的安全性を保証するとともに,AIの安全性における最初のスケーリング法則を確立する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:28:58 GMT)
MoQa: Rethinking MoE Quantization with Multi-stage Data-model Distribution Awareness [8.0] Mix-of-Experts (MoE) はLarge Language Models (LLM) のメインフォームとなった。
MoQaは、分布認識を備えたエキスパートレベルの混合精度ベース量子化である。
MoQaは2.746.44 PPLの減少と1.85%3.77%の精度向上を実現している。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:20:30 GMT)
Adaptive Extrapolated Proximal Gradient Methods with Variance Reduction for Composite Nonconvex Finite-Sum Minimization [7.9] 本稿では, 適応外挿 Prox Gradient (AEPG) 法である sf-SPIDER を提案する。
固定点を見つけるために$jascalO(N + sqrtN epsilon)$を統合する。
従来の手法と比較して, sf AEPG-SPIDERの優れた性能を示す実験を行った。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:56:02 GMT)
A Preliminary Study for GPT-4o on Image Restoration [7.8] OpenAIのGPT-4oモデルは、画像生成において前例のない性能を示した。
各種修復作業におけるGPT-4oの系統的評価について検討した。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:18:19 GMT)
OMAC: A Broad Optimization Framework for LLM-Based Multi-Agent Collaboration [7.8] 複数のエージェントが協調して相互に通信するマルチエージェントシステム(MAS)は、複雑なタスクにおいて強化された機能を示す。
LLMをベースとしたMASの全体最適化を目的とした汎用フレームワークであるOMACを紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:13:46 GMT)
Enhanced Multimodal Hate Video Detection via Channel-wise and Modality-wise Fusion [7.7] TikTokやYouTubeなどのプラットフォーム上でのビデオコンテンツが急速に普及し、情報発信が変化した。
ヘイトスピーチと戦うための大きな努力にもかかわらず、これらのビデオの検出は、しばしば暗黙的な性質のために難しいままである。
本稿では,Channel-wise and Modality-wise Fusion Mechanismを用いたマルチモーダルヘイトビデオ検出モデルCMFusionを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:24:48 GMT)
NAMET: Robust Massive Model Editing via Noise-Aware Memory Optimization [7.6] NAMET (Noise-aware Model Editing in Transformers) は、MEMITの1行修正によるメモリ抽出時にノイズを発生させる単純な方法である。
6つの大きな言語モデルと3つのデータセットにわたる実験により、NAMETは何千もの事実を編集する際に、既存のメソッドを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:00:02 GMT)
Decoding Game: On Minimax Optimality of Heuristic Text Generation Strategies [7.6] 我々は,テキスト生成をストラテジストとネイチャーの2プレイヤーゼロサムゲームとして再定義する,包括的な理論的枠組みであるデコードゲームを提案する。
逆数自然は可能性に対して暗黙の正則化を課し、トラルニケーション正規化法は、この正則化の下での最適戦略の第一次近似である。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:23:08 GMT)
Inference and Verbalization Functions During In-Context Learning [7.5] 大規模言語モデル(LM)は、推論中の新しいタスクを解決するために、いくつかのデモからコンテキスト内で学習することができる。
以前の研究では、いくつかの設定では、ICLのパフォーマンスは無関係なラベルによって最小限に影響を受けることが観察された。
我々は、LMが2つのシーケンシャルなプロセスを通して無関係なラベルでICLを実行すると仮定する:タスクを解く推論関数と、ラベル空間に推論された回答をマッピングする動詞化関数である。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:41:08 GMT)
Knowledge-Informed Multi-Agent Trajectory Prediction at Signalized Intersections for Infrastructure-to-Everything [7.5] 我々は、I2X(Infrastructure-to-Everything)協調予測スキームを導入する。
このスキームでは、ロードサイドユニット(RSU)は独立して全ての車両の将来の軌跡を予測する。
我々は,専用インフラストラクチャベースの軌道予測モデルであるI2XTrajを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:18:02 GMT)
CCNU at SemEval-2025 Task 3: Leveraging Internal and External Knowledge of Large Language Models for Multilingual Hallucination Annotation [7.4] 本稿では,中央中国師範大学(CCNU)チームがMu-SHROOM共有タスクのために開発したシステムについて述べる。
提案手法では,異なる専門分野の複数の大規模言語モデルを用いて,幻覚の注釈付けに並列に活用する。
オープンソースのLLM DeepSeek-V3を用いて,ヒンディー語データのトップランキング(#1)を達成し,他の7言語でトップ5の地位を確保した。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:41:39 GMT)
AdaptMol: Adaptive Fusion from Sequence String to Topological Structure for Few-shot Drug Discovery [7.3] 本稿では,Adaptive Multimodal fusion for representationを組み込んだプロトタイプネットワークであるAdaptMolを提案する。
このフレームワークは、グローバルおよび局所的な分子的特徴を動的に統合するための二重レベルアテンション機構を用いる。
5ショットと10ショット設定で一般的に使用される3つのベンチマークの実験は、AdaptMolが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:12:12 GMT)
Regret Minimization and Statistical Inference in Online Decision Making with High-dimensional Covariates [7.2] 我々は、決定のための$varepsilon$-greedybanditアルゴリズムと、疎帯域パラメータを推定するためのハードしきい値アルゴリズムを統合する。
マージン条件下では、我々の手法は、$O(T1/2)$ regret あるいは古典的な$O(T1/2)$-consistent推論のいずれかを達成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:30:12 GMT)
TinyRS-R1: Compact Multimodal Language Model for Remote Sensing [7.1] 本稿では,リモートセンシングタスクに最適化された最初の2Bパラメータマルチモーダル小言語モデルであるTinyRSを紹介する。
TinyRSは、数百万の衛星画像の事前トレーニング、視覚的なインストラクション例のチューニング、Chain-of-Thought(CoT)アノテーションによる微調整という、4段階のパイプラインを通じてトレーニングされている。
TinyRS-R1は汎用リモートセンシングのためのGRPO整列CoT推論を持つ最初のドメイン特化MSLMである。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:53:21 GMT)
FL-PLAS: Federated Learning with Partial Layer Aggregation for Backdoor Defense Against High-Ratio Malicious Clients [7.1] フェデレートラーニング(FL)は、新たなコラボレーティブ機械学習アプローチとして注目を集めている。
FLの基本アルゴリズムであるFederated Averaging (FedAvg)は、バックドア攻撃の影響を受けやすい。
バックドア攻撃からローカルモデルを効果的に保護できる新しい防御アルゴリズムFL-PLASを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:16:47 GMT)
Displacement-Sparse Neural Optimal Transport [7.0] 最適輸送(OT)は、コスト関数を最小化しながら、ある確率測度から別の確率測度へ質量を輸送するマップ$T$を見つけることを目的としている。
ニューラルOTソルバは、薬物摂動などの高次元生物学的応用で人気を博している。
直感的で理論的に基礎を成す手法として,ニューラルOTソルバ内におけるエンファスメント・スパースマップの学習手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:07:45 GMT)
Immunogenicity Prediction with Dual Attention Enables Vaccine Target Selection [6.9] 我々はワクチンの免疫原性を予測するための新しい深層学習ソリューションであるVenusVaccineを紹介した。
また、これまでに7000以上の抗原配列、構造、細菌、ウイルス、腫瘍からの免疫原性ラベルを含む、最も包括的な免疫原性データセットをコンパイルした。
私たちの研究はワクチン設計に有効なツールを提供し、将来の研究に有用なベンチマークを設定します。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:33:03 GMT)
Equally Critical: Samples, Targets, and Their Mappings in Datasets [6.9] 本稿では,サンプルとターゲットがトレーニングのダイナミクスにどのように影響するかを検討する。
まず、サンプルとターゲットの相互作用のレンズを通して、既存のパラダイムの分類法を確立する。
次に、トレーニング効率への影響を評価するために、新しい統合損失フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:27:19 GMT)
Robust and digital hyper-polarization protocol of nuclear spins via magic sequential sequence [6.7] 核スピンの超分極は、核磁気共鳴(NMR)と量子情報技術の発展に不可欠である。
逐次分極プロトコルを導入し、超分極核スピンのための一連のマジックおよびデジタルシーケンスを同定する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:47:01 GMT)
Proximal optimal transport divergences [6.7] 不完全な畳み込みの定式化により,情報分岐と最適輸送距離を補間する新しい相違尺度である,近位最適輸送発散を導入する。
本研究では, 滑らかさ, 有界性, 計算的トラクタビリティなどの数学的性質を探求し, 原始双対の定式化と対角学習との関連性を確立する。
提案フレームワークは,生成モデル,分布最適化,確率空間における勾配学習のための新たな洞察と計算ツールを提供しながら,既存のアプローチを一般化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:48:11 GMT)
Exploring the Potential of SSL Models for Sound Event Detection [6.7] 自己教師付き学習(SSL)モデルは、音事象検出(SED)のための強力な表現を提供する
本研究では,SEDの最適モデル選択と統合を導くために,最先端のSSLモデルを体系的に評価する。
本稿では,各SSL埋め込み統合,デュアルモーダル融合,フルアグリゲーションという3つの融合戦略を通じて,異種SSL表現を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:54:31 GMT)
ChartEdit: How Far Are MLLMs From Automating Chart Analysis? Evaluating MLLMs' Capability via Chart Editing [6.7] マルチモーダルな大言語モデル(MLLM)は、チャートレンダリングコードを生成する際の約束を示すが、チャート編集はより大きな課題を示す。
グラフ編集タスク用に設計された,新しい高品質なベンチマークであるChartEditを提案する。
2種類の実験で10種類のMLLMの性能を評価し,コードレベルとチャートレベルの両方で評価した。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:47:15 GMT)
Accelerating Neural Network Training Along Sharp and Flat Directions [6.6] 本研究では、Dminant部分空間の補集合への更新を制限するSGDの変種であるBulk-SGDについて検討する。
損失ランドスケープにおける平坦な方向に対応するバルク部分空間に沿った更新は収束を加速するが、安定性を損なう可能性があることを示す。
本研究は,曲率認識設計における原則的アプローチを示唆するものである。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:13:05 GMT)
Understanding the Sneaky Patterns of Pop-up Windows in the Mobile Ecosystem [6.5] 本稿では,モバイルエコシステムにおけるスニーキーパターンの詳細な研究について述べる。
私たちの調査では、テキストミスリード、UIミスリード、強制アクション、コンテキストの欠如、プライバシー侵害など、ユーザエクスペリエンスを侵害する5つのSneakyパターンに注目しています。
私たちはPokerと呼ばれる自動分析パイプラインを開発し、現実世界のアプリでさまざまなPoWを特定し、排除し、収集するという課題に取り組みます。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:39:13 GMT)
PRS-Med: Position Reasoning Segmentation with Vision-Language Model in Medical Imaging [6.4] PRS-Medは、視覚言語モデルとセグメンテーション機能を統合し、正確なセグメンテーションマスクとそれに対応する空間推論出力の両方を生成するフレームワークである。
MMRSデータセットは、医療画像における位置推論データの欠如に対処するために、多様な空間的な質問応答ペアを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:42:28 GMT)
DeepFRC: An End-to-End Deep Learning Model for Functional Registration and Classification [6.4] 統合機能登録と分類のためのエンドツーエンドのディープラーニングフレームワークであるDeepFRCを紹介する。
DeepFRCは、クラス対応の弾性ワーピングと学習可能な基底表現を統一アーキテクチャに統合する。
我々は、アライメント品質と一般化誤差の間の最初の理論的関係を確立し、我々のモデルを合成および実世界のベンチマーク上で検証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:43:49 GMT)
Evaluating many-body stabilizer Rényi entropy by sampling reduced Pauli strings: singularities, volume law, and nonlocal magic [6.3] 任意の整数 $alphage 2$ に対して $alpha$-stabilizer R'enyi entropy (SRE) を評価するための新しい量子モンテカルロ法を提案する。
我々は, 固有関数の寄与に関連する非自明な特異点を明らかにし, マジックと直接結びついている。
この研究は、大規模な多体システムにおけるマジックの役割を探るための強力なツールを提供し、マジックと多体物理学の本質的な関係を明らかにする。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:29:53 GMT)
P-split formulations: A class of intermediate formulations between big-M and convex hull for disjunctive constraints [6.3] P-スプリット」の定式化は、各分節内の凸制約を伴う分節的制約に対して導出される。
P-スプリットの定式化は,大質量M等式から凸殻に収束する階層を形成することを示す。
テスト問題としては、K平均クラスタリング、半教師付きクラスタリング、P_ball問題、トレーニングされたReLUニューラルネットワークに対する最適化などがある。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:58:19 GMT)
Quantum gyroscope based on the cavity magnomechanical system [6.1] ノイズ発生環境における高精度な回転角測定は、航空宇宙工学、軍用航法、および関連する領域において重要な不規則な距離を保っている。
本稿では,ハイブリッド光磁気相互作用を利用した高精度回転角検出を可能にするキャビティ磁気力学系に基づく量子ジャイロ法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:59:47 GMT)
Mamba Adaptive Anomaly Transformer with association discrepancy for time series [5.9] 時系列における異常検出は, 産業モニタリングや環境センシングに不可欠である。
既存の手法では、短期的な文脈に対する感受性や、ノイズの多い非定常環境における非効率性といった制限に直面している。
関連性モデリングと再構成品質を向上させる改良されたアーキテクチャであるMAATを紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:23:17 GMT)
ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.9] 大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:48:43 GMT)
Lightweight Spatio-Temporal Attention Network with Graph Embedding and Rotational Position Encoding for Traffic Forecasting [5.9] 交通予測に関する最近の研究は、主にグラフニューラルネットワーク(GNN)と他のモデルを組み合わせることに焦点を当てている。
本稿では,グラフ埋め込みと回転ダイナミクスを用いたSTAN-Temporal Attention Networkと呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:36:20 GMT)
Measurement Score-Based Diffusion Model [5.8] 測定スコアベース拡散モデル(MSM)は,雑音とサブサンプル測定のみを用いて部分的測定スコアを学習する新しいフレームワークである。
MSMは高品質な画像を生成し、逆問題の解決を可能にする。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:33:47 GMT)
iSegMan: Interactive Segment-and-Manipulate 3D Gaussians [5.7] iSegManはインタラクティブなセグメンテーションと操作のフレームワークで、どんなビューでも単純な2Dユーザーインタラクションしか必要としない。
エピポーラ誘導相互作用伝播(EIP)は、効率的でロバストな相互作用マッチングのためにエピポーラ制約を利用する。
可視性に基づくガウス投票(VGV)はSAMから2Dセグメンテーションを取得し、領域抽出を投票ゲームとしてモデル化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:41:10 GMT)
Understanding LLM Behaviors via Compression: Data Generation, Knowledge Acquisition and Scaling Laws [5.7] 我々は、増大するモデルとデータスケールにまたがって、どのようにしてLarge Language Modelsが情報を取得し、保存するかの詳細なビューを提供する。
この理論的な視点と、Heapの法則やZipfの法則に触発された自然な仮定に触発され、単純化されながら代表的である階層型データ生成フレームワークを導入する。
ベイジアン・セッティングの下では、このモデル内の予測と圧縮が自然に多様な学習とスケーリングの行動を引き起こすことが示される。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:36:54 GMT)
MT-CYP-Net: Multi-Task Network for Pixel-Level Crop Yield Prediction Under Very Few Samples [5.5] 我々はMulti-Task Crop Yield Prediction Network (MT-CYP-Net)と呼ばれる新しい手法を提案する。
このフレームワークは、共有バックボーンネットワークから抽出された特徴を、収穫予測デコーダと作物分類デコーダの両方で同時に活用する、効果的なマルチタスク機能共有戦略を導入する。
この設計により、MT-CYP-Netは、細かな収量点ラベルと収量型ラベルで訓練できると同時に、詳細なピクセルレベルの収量マップを生成することができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:20:44 GMT)
A Human Study of Cognitive Biases in CTF Challenges [5.5] 本稿では,認知バイアスが旗の教育とセキュリティの獲得にどのように役立つかを検討する。
本稿では,認知バイアス,特に検索と損失回避の満足度を制御するためのアプローチを提案する。
本研究は,多くの参加者が検索バイアスの満足度を示し,このバイアスがその成功に有意な影響を与えていることを明らかにする。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:16:16 GMT)
Cross-Model Transfer of Task Vectors via Few-Shot Orthogonal Alignment [5.3] タスク演算は、タスク固有の変更をパラメータ空間内のベクトルとして表現することで、効率的なモデル編集を可能にする。
この仮定は、モデルが異なるデータセットで独立して事前トレーニングされるクロスモデル転送設定に適用性を制限する。
本稿では,タスクベクトルを異なる事前学習対象モデルのパラメータ空間にアライメントする,少数ショットアライメントに基づく手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:24:06 GMT)
Are vision language models robust to uncertain inputs? [5.2] より新しい視覚言語モデルでは、従来のモデルに比べて頑健性が向上したが、それでも厳密な指示に従う傾向にあることを示す。
ImageNetのような自然なイメージでは、パイプラインの変更なしにこの制限を克服することができる。
モデルの内部不確実性を明らかにするために,キャプションの多様性に基づく新しいメカニズムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:16:49 GMT)
Centralized Reward Agent for Knowledge Sharing and Transfer in Multi-Task Reinforcement Learning [5.2] 本稿では,中央報酬エージェントと分散政策エージェントを統合したマルチタスク強化学習フレームワークを提案する。
CRAは知識プールとして機能し、様々なタスクから知識を抽出し、学習効率を向上させるために個別の政策エージェントに配布することを目的としている。
このフレームワークは、確立されたタスク間の知識共有を強化するだけでなく、意味のある報酬信号の転送によって新しいタスクに適応する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:26:00 GMT)
SynFuzz: Leveraging Fuzzing of Netlist to Detect Synthesis Bugs [5.2] 本稿では,既存のハードウェアファジィフレームワークの限界を克服するために設計された,新しいハードウェアファジィファジィであるSynFuzzを紹介する。
SynFuzzは、RTLからゲートレベルへの移行中に発生する合成バグと脆弱性を特定するために、ゲートレベルのネットリストでファジングハードウェアに焦点を当てている。
我々は、SynFuzzが業界標準の形式検証ツールCadence Conformalの限界を克服する方法を実証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:27:52 GMT)
Spotlight Your Instructions: Instruction-following with Dynamic Attention Steering [5.2] そこで本研究では,モデルに注意を向けることで,ユーザのプロンプトの特定の部分を強調できる推論時手法を提案する。
従来のアプローチとは異なり、ユーザ指定部品に付与されるモデル注意率を動的に更新する。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:28:53 GMT)
S-Crescendo: A Nested Transformer Weaving Framework for Scalable Nonlinear System in S-Domain Representation [4.9] S-Crescendoは、スケーラブルな時間領域予測のために、ニューラルネットワークとSドメインを相乗化するネストトランスフォーマーウィービングフレームワークである。
HSPICEゴールデン波形に対して最大0.99のテストセット(R2$)精度を実現し,シミュレーションを最大18(X)高速化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:06:58 GMT)
Towards Universal Semantics With Large Language Models [4.9] 本稿では,大規模言語モデル (LLM) を用いて自然意味メタ言語を表現した最初の研究について述べる。
我々の1Bモデルと8BモデルはGPT-4oよりも正確で、相互翻訳可能なエクスプリケーションを生成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:11:58 GMT)
Retrospex: Language Agent Meets Offline Reinforcement Learning Critic [4.8] Retrospexは、過去の経験を深く分析するエージェントフレームワークである。
LLMの行動可能性と強化学習批判によって推定される行動値を組み合わせる。
我々は,ScienceWorld,ALFWorld,Webshop環境におけるRetrospexを評価した。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:28:24 GMT)
Denoising Mutual Knowledge Distillation in Bi-Directional Multiple Instance Learning [4.4] 多重インスタンス学習はデジタル病理学における全スライド画像分類の主要な手法である。
我々は,MILと完全に教師された学習のギャップを,バッグレベルの学習プロセスとインスタンスレベルの学習プロセスの両方を増強することによって埋めることを提案する。
提案アルゴリズムは、バッグレベルの予測とインスタンスレベルの予測の両方において、デュアルレベルMILアルゴリズムの性能を改善する。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:26:43 GMT)
Generating Computational Cognitive Models using Large Language Models [4.3] 我々は、GeCCo(Computational Cognitive Models)のガイド生成のためのパイプラインを導入する。
GeCCo は LLM に候補モデルの提案を促し,データ保持に適合させ,予測性能に基づいて反復的に改良する。
このアプローチを4つの異なる認知領域にわたってベンチマークします。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:33:09 GMT)
LAMP: Extracting Locally Linear Decision Surfaces from LLM World Models [4.3] textbfLAMPはブラックボックス言語モデルの決定面に光を照射する。
LAMPは、モデル自身の自己報告された説明を座標系として扱う。
どの要因がモデルの判断を決定づけるか、そしてどの程度の量によって明らかになる。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:43:49 GMT)
Adaptive Resolving Methods for Reinforcement Learning with Function Approximations [4.2] 本稿では,関数近似を用いた強化学習問題の解法を提案する。
我々のアルゴリズムは線形プログラミング(LP)の再構成に基づいており、新たなデータ到着によって改善された各LPを解消する。
O(1/sqrtN)$ the worst-case guarantee established in the previous literature, our instance-dependent guarantee is tight than the underlying instance is favorable。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:59:15 GMT)
DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation [4.1] ドメイン固有のQAシステムは、生成頻度を必要とするが、構造化専門家の知識に基づく高い事実精度を必要とする。
本稿では,マルチレベル知識グラフ構築と意味ベクトル検索を統合した,スケーラブルでカスタマイズ可能なハイブリッドQAフレームワークであるDO-RAGを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:40:17 GMT)
AoP-SAM: Automation of Prompts for Efficient Segmentation [4.1] 本稿では, SAM のための Prompts の自動化 (AoP-SAM) を提案する。
AoP-SAMはSAMの効率性とユーザビリティを向上し、手動入力をなくし、現実世界のタスクに適している。
本稿では、粗い方法でプロンプトを生成するテストタイムのインスタンスレベルの適応サンプリングとフィルタリング機構を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:27:36 GMT)
The Logical Expressiveness of Temporal GNNs via Two-Dimensional Product Logics [4.1] 時間的GNNの論理的特徴付けを二次元積論理に結合して検討する。
時間的GNNの表現力は,グラフと時間的成分の組み合わせによって異なることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:34:57 GMT)
VenusX: Unlocking Fine-Grained Functional Understanding of Proteins [3.9] VenusXは、微細な機能アノテーションと関数ベースのタンパク質ペアリングのための、残基、フラグメント、ドメインレベルでの最初の大規模なベンチマークである。
VenusXは、重要なアクティブサイト、バインディングサイト、保存されたサイトモチーフ、ドメイン、ペアワイズを含む3つの主要なタスクカテゴリで構成されている。
本ベンチマークでは,流通シナリオとアウト・オブ・ディストリビューションシナリオの両方において,モデル性能の総合評価を可能にする。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:44:23 GMT)
Beyond Retrieval: Joint Supervision and Multimodal Document Ranking for Textbook Question Answering [3.7] 本稿では,意味表現を拡張化するためのメカニズムを導入することで,マルチモーダルな教科書質問応答手法を提案する。
我々のモデルであるJETRTQA(Joint Embedding Training With Ranking Supervision for Textbook Question Answering)は、検索ジェネレータアーキテクチャ上に構築されたマルチモーダル学習フレームワークである。
本手法をCK12-QAデータセット上で評価し,情報化文書と無関係文書の識別を著しく改善することを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:23:54 GMT)
Variance-Optimal Arm Selection: Regret Minimization and Best Arm Identification [3.6] 我々は、後悔設定のためのtextttUCB-VV と呼ばれるオンラインアルゴリズムを開発し、制限付き報酬に対する後悔の上限が $mathcalOleft(lognright)$として進化することを示す。
我々は, 試料分散に対する新しい濃度不等式を用いて, フレームワークを有界分布から準ガウス分布に拡張する。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:38:23 GMT)
Tree-based Focused Web Crawling with Reinforcement Learning [3.5] 集中型クローラは、ターゲットトピックに関連するWebページやWebサイトを可能な限り多く見つけ、無関係なものを避けることを目的としている。
我々は,関連Webページ数と関連Webサイト数の両方を最大化することを目的とした,集中型クローリングのための新しいフレームワークであるTRESを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:52:11 GMT)
GeFL: Model-Agnostic Federated Learning with Generative Models [3.5] Federated Learning(FL)は、ローカルデータを共有せずにクライアント間で協調学習を可能にする分散トレーニングパラダイムである。
本稿では,ジェネレーティブ・モデル支援フェデレーション・ラーニング(GeFL)を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:40:42 GMT)
Geometric Framework for Cell Oversegmentation [3.3] 3D細胞セグメンテーション法は、単一の細胞を誤って複数の断片に分割する横行現象によってしばしば妨げられる。
これは最終的なセグメンテーションの品質を低下させ、解決するのが非常に難しいことで知られている。
本稿では,これらの誤りを特定し,修正するための幾何学的枠組みを提案する。
また、2次元測地における変化を定量化するために、新しい計量 emphGeo-Wasserstein divergence を導入する。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:39:53 GMT)
Bridging AI and Carbon Capture: A Dataset for LLMs in Ionic Liquids and CBE Research [3.3] LLM(Large Language Models)は、一般的な知識と推論タスクにおいて、例外的な性能を示す。
CBE(Chemical and Biological Engineering)のような専門的な科学分野におけるそれらの効果はいまだ研究されていない。
CBEにおけるLSMの推論をベンチマークするために設計された5,920のデータセットをキュレートした専門家をリリースする。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:08:12 GMT)
Solver-Informed RL: Grounding Large Language Models for Authentic Optimization Modeling [3.3] 大型言語モデル(LLM)は、幻覚によって形式的に正しい、使用可能なモデルを生成するのに苦労することが多い。
大規模推論モデルの強化における強化学習(RL)の成功に触発されて、SIRL(Solver-Informed Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:32:03 GMT)
Robustness-Reinforced Knowledge Distillation with Correlation Distance and Network Pruning [3.1] 知識蒸留(KD)は、効率的で軽量なモデルの性能を向上させる。
既存のKD技術のほとんどは、Kulback-Leibler(KL)の発散に依存している。
相関距離とネットワークプルーニングを利用したロバストネス強化知識蒸留(R2KD)を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:28:41 GMT)
Bridging the Reality Gap in Digital Twins with Context-Aware, Physics-Guided Deep Learning [3.1] デジタルツイン(DT)は強力な予測分析を可能にするが、シミュレーションと実際のシステムの相違 - 現実のギャップとして知られ、信頼性を損なう。
本稿では,新しいセンサデータを連続的に統合し,誤りを検知し,クエリ応答フレームワークを介してDTを再検討する,DTのためのReal Gap Analysis(RGA)モジュールを提案する。
提案手法は,コンテキスト推論の改善と物理的整合性維持のために,ドメイン・アドバイサル深層学習と低次シミュレータ誘導を融合する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:18:46 GMT)
S-GRPO: Early Exit via Reinforcement Learning in Reasoning Models [3.0] テスト時間スケーリングは、大規模な言語モデルコミュニティに活発な研究対象として現れます。
最近の研究では、推論モデル(Qwen3でさえも過度の思考冗長性を示すことが示されている。
本稿では,新たな強化学習パラダイムであるS-GRPO(Serial-Group Decaying-Reward Policy Optimization)を紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:01:57 GMT)
Learning on a Razor's Edge: the Singularity Bias of Polynomial Neural Networks [3.0] 我々は、アクティベーション関数を持つ完全接続ネットワークを考察し、それらがパラメータ化する関数空間に焦点をあてる。
まず、ニューロワークによってパラメータ化されたニューロマニフォールドの部分空間の次元を計算する。
第二に、この部分空間は特異であることを示す。
第三に、そのような特異点はしばしば訓練力学の臨界点に対応する。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:11:17 GMT)
Curriculum Learning in Genetic Programming Guided Local Search for Large-scale Vehicle Routing Problems [3.0] 本稿では,カリキュラム学習(CL)をGPGLSに統合する新しい手法であるCL-GPGLSを提案する。
我々のアプローチは、事前定義されたカリキュラムを活用して、より単純なタスクから始まり、徐々に複雑さを増し、大規模なVRP(LSVRP)に適応し、最適化できるようにトレーニングインスタンスを段階的に導入する。
CL-GPGLSの有効性を検証し、3つのベースライン法に対して大幅な性能向上を示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:10:09 GMT)
Severing Spurious Correlations with Data Pruning [2.9] 深層ニューラルネットワークは、トレーニングされているデータに現れる刺激的な相関を学習し、依存することが示されている。
このような相関関係は、これらの相関関係がもはや保たない実世界において、これらのネットワークが機能不全を引き起こす可能性がある。
我々はこれらのサンプルを含むトレーニングデータの小さなサブセットを識別し、プーンする新しいデータプルーニング手法を開発した。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:04:14 GMT)
Understanding the Monty Hall Problem Through a Quantum Measurement Analogy [2.8] 量子計測理論に触発された新しい説明枠組みを導入する。
ホストの行動開きドアを概念化し、確率分布の非対称的な崩壊を引き起こす量子測定に類似した非プライズを明らかにした。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:32:52 GMT)
An Explanation of Intrinsic Self-Correction via Linear Representations and Latent Concepts [2.8] 本報告では,本態性自己補正の性能向上について解説する。
隠れた状態における解釈可能な変化をいかに促すかを検討する。
自己補正が言語モデルの潜在概念認識能力を高めることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:18:37 GMT)
Prediction of Bank Credit Ratings using Heterogeneous Topological Graph Neural Networks [2.8] 本研究は、持続的ホモロジーを利用して、銀行間の関係を捉えるネットワークを構築し、これを従来の貸与ネットワークと組み合わせ、異種ネットワークを構築する。
グローバルな実世界のデータセットの実験は、HTGNNの有効性を検証する。
本研究は、積極的なリスク軽減と効果的な市場介入の実施を促進するために、投資家や規制機関に影響を及ぼす。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:49:25 GMT)
Back-Projection Diffusion: Solving the Wideband Inverse Scattering Problem with Diffusion Models [2.7] 広帯域散乱データから逆散乱マップによって誘導される後部分布を近似する,エンドツーエンドの確率的フレームワークであるワイドバンドバックプロジェクション拡散を提案する。
この枠組みは高精度な再構成を行い、条件付き拡散モデルを利用してサンプルを描画し、波動伝播の基礎物理学の対称性を賞賛する。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:33:49 GMT)
Achieving Scalable Robot Autonomy via neurosymbolic planning using lightweight local LLM [2.7] Gideonは、コンテキスト長が拡張された、現代的で、より小さく、ローカルなLLMへの移行を可能にする、新しいフレームワークである。
Qwen-2.5 1.5Bで実施され、8k-32kサンプルで訓練された単一ドメインシナリオの予備実験では、66.1%の有効なプランパーセンテージが示されている。
トレーニングの非効率性は、Gideonの合理化されたデータ生成パイプラインによって軽減できる。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:55:07 GMT)
Fair PCA, One Component at a Time [2.5] Min-Max Fair PCA問題では、グループ間で可能な限りバランスの取れたマルチグループデータの低ランクな表現を求める。
この問題に対する既存のアプローチはランク-d$フェア部分空間を返すが、標準PCAの基本的な包含性は欠如している。
フェアプライマリコンポーネントを,グループ単位の最大再構成誤差を最小限に抑える方向として定義する。
このアプローチは、標準PCAの格納特性を保ち、単一のグループを持つデータに対する標準pcaに還元する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:39:28 GMT)
Llama-Affinity: A Predictive Antibody Antigen Binding Model Integrating Antibody Sequences with Llama3 Backbone Architecture [2.5] 先進的な抗体-抗原結合親和性予測モデル(Llamafinity)を提案する。
精度は0.9640、F1スコアは0.9643、精度は0.9702、リコールは0.9586、AUC-ROCは0.9936である。
この戦略では計算効率が向上し、5倍の平均累積トレーニング時間はわずか0.46時間であった。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:10:54 GMT)
Do Code LLMs Do Static Analysis? [2.4] 本稿では,コード要約や生成などのコードインテリジェンスタスクにおいて,LLMの静的解析能力について検討する。
3つの静的解析タスク(コールグラフ生成、AST生成、データフロー生成)と3つの異なるコードインテリジェンスタスク(コード生成、要約、翻訳)を実験に使用しています。
静的解析タスクにおけるLCMの性能は低下しており,静的解析タスクに対する事前学習は,コードインテリジェンスタスクにおけるパフォーマンス向上に寄与しないことがわかった。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:55:40 GMT)
The Effect of Optimal Self-Distillation in Noisy Gaussian Mixture Model [2.4] 自己蒸留(SD)は、機械学習において単純だが強力なアプローチとして注目されている。
広く使われているにもかかわらず、その効果の基盤となるメカニズムはいまだ不明である。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:03:37 GMT)
Adaptive Reward Design for Reinforcement Learning [2.3] 本稿では,RLエージェントをインセンティブとして,論理式で指定されたタスクを可能な限り完了させる報奨関数群を提案する。
学習過程において報酬関数を動的に更新する適応型報酬生成手法を開発した。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:14:03 GMT)
Data Balancing Strategies: A Survey of Resampling and Augmentation Methods [2.3] 不均衡なデータは、機械学習において大きな障害となる。
この問題を軽減するために様々な再サンプリング戦略が開発されている。
本稿では,多種多様なデータバランシング手法を概観し,合成オーバーサンプリング,適応手法,生成モデル,アンサンブルベースの戦略,ハイブリッドアプローチ,アンダーサンプリング,近隣手法などのカテゴリに分類する。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:15:28 GMT)
Coupled Entropy: A Goldilocks Generalization? [2.2] NTEを1+dkappa$で分割する結合エントロピーが、機械学習のようなアプリケーションに必要な堅牢性を提供するかもしれないという証拠を提供する。
NTEを1+dkappa$で分割する結合エントロピーが、機械学習のようなアプリケーションに必要な堅牢性を提供するかもしれないという証拠を提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:00:25 GMT)
Understanding the Capabilities of Molecular Graph Neural Networks in Materials Science Through Multimodal Learning and Physical Context Encoding [2.2] 分子グラフニューラルネットワーク(GNN)は、しばしばXYZベースの幾何学的表現にのみ焦点をあてる。
この研究は、IUPAC名、分子式、物理化学的性質、同義語などのテキスト記述子を統合するマルチモーダルフレームワークを導入している。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:42:16 GMT)
MalVis: A Large-Scale Image-Based Framework and Dataset for Advancing Android Malware Classification [2.2] MalVisはエントロピーとN-gram分析を統合し、マルウェアバイトコードの構造と異常パターンを強調する統合可視化フレームワークである。
CNNモデルを用いた最先端の可視化技術に対するMalVisの評価を行った。
MalVisの精度は95.19%、F1スコア90.81%、精度92.58%、リコール89.10%、MCC87.58%、ROC-AUC98.06%である。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:19:35 GMT)
VITA: Versatile Time Representation Learning for Temporal Hyper-Relational Knowledge Graphs [2.1] 事実の時間的妥当性は、下流リンク予測タスクにおいて強い手がかりとなることが多い。
事実の4種類の時間的妥当性を柔軟に適合させることができる多目的な時間表現であるVITAを提案する。
各種リンク予測タスクにおいて, VITA が最良性能のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:16:13 GMT)
JULI: Jailbreak Large Language Models by Self-Introspection [2.1] LLM(Large Language Models)は、悪意のあるコンテンツの生成を防ぐために、安全アライメントをトレーニングする。
トークンログの確率を操作することで,LDMをジェイルブレイクするJULI(Jailbreaking Using LLM Introspection)を提案する。
提案手法は,既存のSOTA(State-of-the-art)アプローチよりも優れた効果を示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:28:12 GMT)
LLM-BABYBENCH: Understanding and Evaluating Grounded Planning and Reasoning in LLMs [2.1] $textbfLLM-BabyBench$は、対話環境の制約の中で計画と推論を行う大規模言語モデルの能力を評価するためのベンチマークスイートである。
このスイートは、手続き的に生成されたBabyAIグリッド世界のテキスト適応に基づいて構築され、LLMを地上知能の3つの基本的な側面に基づいて評価する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:23:17 GMT)
Improvement of Optimization using Learning Based Models in Mixed Integer Linear Programming Tasks [2.1] 混合線形プログラム(MILP)は、建設、製造、物流といった重要な産業において計画とスケジューリングの問題を解決するための重要なツールである。
本稿では,グラフニューラルネットワーク(GNN)の学習に行動クローニング(BC)と強化学習(RL)を活用する学習ベースフレームワークを提案する。
本手法は,ソリューションの品質と実現可能性を維持しつつ,従来の手法と比較して最適化時間と分散を低減させる。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:31:53 GMT)
CP-NCBF: A Conformal Prediction-based Approach to Synthesize Verified Neural Control Barrier Functions [2.1] 制御バリア関数(CBF)は、安全クリティカルなコントローラを設計するための実践的なアプローチである。
近年,ニューラルCBFのような学習ベースの手法でこの問題に対処する研究が進められている。
本稿では, 分割整形予測を利用して, 正式に検証されたニューラルCBFを生成する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:16:54 GMT)
Culture-TRIP: Culturally-Aware Text-to-Image Generation with Iterative Prompt Refinement [2.1] 反復的プロンプトリファインメント(Culture-TRIP)を用いた文化的テキスト・画像生成手法を提案する。
提案手法は, カルチャー名詞に関連する文化的文脈と視覚的詳細を抽出する。
一連の文化的基準と大きな言語モデルに基づいて、反復的にプロンプトを洗練・評価する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:34:44 GMT)
Improving Energy Natural Gradient Descent through Woodbury, Momentum, and Randomization [2.0] PINNのエネルギー勾配降下の精度と効率を改善するための一連の技術を紹介する。
まず、Woodbury公式を利用して、ENGDの計算複雑性を劇的に低減する。
第2に,モンテカルロ変分法からサブサンプリング・プロジェクテッド・インクリメント・ナチュラルグラディエントDescentアルゴリズムを適用し,収束を加速する。
第3に、大規模なバッチサイズの場合の計算コストをさらに削減するために、ランダム化アルゴリズムの使用について検討する。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:46:22 GMT)
Unsupervised Port Berth Identification from Automatic Identification System Data [2.0] ポートバーシングサイトは、ポート操作の監視と最適化に高い関心を持つ地域である。
自動識別システム(AIS)から得られたデータは、リアルタイム監視と長期利用パターンを明らかにするために、バースに重ね合わせることができる。
しかし、ポートバースに関する公開ドキュメントは、たとえ利用可能であっても、しばしば不完全である。
本研究では,AISデータクラスタリングとハイパーパラメータ最適化を利用した非教師付き空間モデリング手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:17:39 GMT)
Patient-Specific Autoregressive Models for Organ Motion Prediction in Radiotherapy [1.9] 臓器の動作予測を自己回帰プロセスとして再構成し,患者固有の動作パターンをよりよく捉えた。
当施設で放射線治療を受けた50例の4D CTの実検セットと,20例の4D CTスキャンを含む公開データセットについて検討した。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:35:58 GMT)
Improving Fairness in LLMs Through Testing-Time Adversaries [1.8] 大規模言語モデル(LLM)は自然言語処理と生成AIのバウンダリをプッシュする。
本研究では,このようなバイアスを軽減するための,単純でユーザフレンドリで実践的な手法を提案する。
本手法は,特定の属性を修正し,対応する予測行動を評価することによって,与えられた文の複数のバリエーションを生成する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:56:53 GMT)
Proof-of-Social-Capital: Privacy-Preserving Consensus Protocol Replacing Stake for Social Capital [1.7] フェアネスと分散化を確保するために,社会資本を用いた新たなプロトコルを提案する。
理論的な枠組みによってプライバシーと株式は強化されるが、オフチェーンの贈収賄のような未解決の問題はさらなる研究を必要とする。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:28:56 GMT)
Dynamic Graph CNN with Jacobi Kolmogorov-Arnold Networks for 3D Classification of Point Sets [1.7] 本稿では,動的グラフ畳み込みネットワーク(DGCNN)とJacobi Kolmogorov-KANを統合するフレームワークであるJacobi-Arnold-DGCNNを紹介する。
ModelNet40データセットの比較実験では、Jacoviを用いたKanは、精度と収束速度の点で従来の線形層ベースの収束ベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:37:58 GMT)
Generative and Contrastive Graph Representation Learning [1.4] グラフ上の自己教師付き学習(SSL)は、ノード分類、ノードクラスタリング、リンク予測といった下流タスクに使用できるノードとグラフ表現を生成する。
両手法の長所を統合するグラフSSLの新しいアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:02:22 GMT)
ChatHTN: Interleaving Approximate (LLM) and Symbolic HTN Planning [1.3] 本稿では,階層型タスクネットワーク(HTN)プランナであるChatHTNを紹介する。
結果として得られた階層構造は、記号的HTN計画によって生成されたタスク分解とChatGPTによって生成されたタスク分解をインターリーブする。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:53:08 GMT)
Developing a Hybrid Convolutional Neural Network for Automatic Aphid Counting in Sugar Beet Fields [1.2] アフィドは小さな物体であり、その密度分布はフィールドの異なる領域で変化する。
本稿では,検出ネットワークと密度マップ推定ネットワークを統合したハイブリッド自動アフィドカウントネットワークアーキテクチャを提案する。
この研究は、サトウキビ畑のアフィドによる効果的な早期警戒、サトウキビの生育の保護、サトウキビの収量確保を提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:44:48 GMT)
Joint Manifold Learning and Optimal Transport for Dynamic Imaging [1.2] 時間進化画像に対するOT正規化器と基礎となる画像多様体の低次元性仮定を統合する効果について検討する。
本稿では, 画像多様体の潜在モデル表現を提案し, この表現, 時系列データ, OT間の整合性を促進する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:56:30 GMT)
HALO: Hierarchical Autonomous Logic-Oriented Orchestration for Multi-Agent LLM Systems [1.2] 階層的推論アーキテクチャに基づくマルチエージェント協調フレームワークHALOを紹介する。
具体的には、タスク分解のための高レベル計画エージェント、サブタスク固有のエージェントインスタンス化のための中レベルロール設計エージェント、サブタスク実行のための低レベル推論エージェントを組み込んだ。
ユーザの大部分がプロンプトエンジニアリングの専門知識を欠いているため、Adaptive Prompt Refinementモジュールを使用して、生クエリをタスク固有のプロンプトに変換する。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:14:03 GMT)
Scalable Time-Tagged Data Acquisition for Entanglement Distribution in Quantum Networks [1.1] 絡み合い分布のような分散量子アプリケーションでは、正確な時間同期と効率的な時間タグデータ処理が不可欠である。
我々は,White Rabbit (WR) デバイスからの1パルス/秒 (PPS) 信号を用いて,ネットワーク全体の同期を実現するモジュール型 Time Tagging (TT) エージェントを提案する。
ライブ2ラベルのエンタングルメント分布実験では、システムの性能を検証し、25,000のカウント/秒で同時同時検出を実現した。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:10:32 GMT)
IQBench: How "Smart'' Are Vision-Language Models? A Study with Human IQ Tests [1.1] 標準化されたビジュアルIQテストにおいてビジョン言語モデルを評価するために設計された新しいベンチマークである*IQBench*を紹介する。
我々はVLMの推論能力を評価することに集中しており、最終的な予測の精度よりも重要であると我々は主張する。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:24:08 GMT)
Class Distillation with Mahalanobis Contrast: An Efficient Training Paradigm for Pragmatic Language Understanding Tasks [1.1] textbfClass textbfDistillation (ClaD)を提案する。
ClaDは2つの重要な革新を統合している: (i) クラス分布の構造的性質から得られる損失関数、(ii) クラス分離に最適化された解釈可能な決定アルゴリズム。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:34:19 GMT)
MedVKAN: Efficient Feature Extraction with Mamba and KAN for Medical Image Segmentation [1.1] 医用画像分割は畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのモデルに大きく依存している。
我々は,マンバとカンを統合した効率的な特徴抽出モデルであるMedVKANを提案する。
MedVKANは4つのデータセットで最先端のパフォーマンスを達成し、残りのデータセットでは2位であることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:56:58 GMT)
Optimal control for preparing fractional quantum Hall states in optical lattices [1.0] そこで本研究では,小さなラウリン型状態の調製を高速化するために最適制御法を提案する。
我々の研究は、量子工学系における強相関位相状態の効率的な実現への道を開いた。
論文参考訳(メタデータ) (Sat, 17 May 2025 02:42:55 GMT)
PyScrew: A Comprehensive Dataset Collection from Industrial Screw Driving Experiments [0.8] このコレクションは6つの異なるデータセットから構成され、34,000以上の個別のスクリュー駆動操作が二重条件下で実行される。
ハードウェア仕様、プロセスフェーズ、データ取得方法を含む、すべてのデータセットで使用される標準化された実験セットアップについて詳述する。
データモデルは、スクリュー駆動プロセスの時間的および運用的構造を保持し、探索解析と機械学習モデルの開発を容易にする。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:20:20 GMT)
Asymptotic Analysis of Two-Layer Neural Networks after One Gradient Step under Gaussian Mixtures Data with Structure [0.8] 本研究では,構造データに基づく2層ニューラルネットワーク(NN)の学習と一般化性能について検討した。
特定の条件下では,高次モデルが非線形ニューラルネットワークと等価であることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:35:05 GMT)
Space evaluation at the starting point of soccer transitions [0.8] 遷移開始点を含むピッチ全体の空間を評価するためのOBPV(Off-Ball Positioning Value)を提案する。
ラ・リガ2023/24シーズン追跡とイベントデータを用いた実験では、OBPVは反撃時に効果的な空間利用を強調している。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:28:06 GMT)
SGD-Mix: Enhancing Domain-Specific Image Classification with Label-Preserving Data Augmentation [0.7] 本稿では,多様性,忠実さ,ラベルの明確さを明確に拡張プロセスに統合する新しい枠組みを提案する。
提案手法では,前景のセマンティクスを保存し,背景の多様性を充実させ,ラベルの一貫性を確保するために,塩分濃度誘導混合と微調整拡散モデルを用いている。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:51:18 GMT)
Score-Based Deterministic Density Sampling [0.6] 本手法は, 時変スコア$nabla log f_t$をフライ時に学習することにより, $mathrmKL(f_t|pi)$上の勾配流を近似する。
ランゲヴィン力学と同じ限界分布を持つ一方、この手法はスムーズな決定論的軌道を導出し、単調なノイズフリー収束をもたらす。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:37:55 GMT)
Experimental Study on Automatically Assembling Custom Catering Packages With a 3-DOF Delta Robot Using Deep Learning Methods [0.6] 本稿では,2本指グリップを3自由度デルタパラレルロボットに装着したキャタリングパッケージの自動梱包に関する先駆的研究を紹介する。
1500枚の画像からなるカスタムデータセットは、この取り組みのために慎重にキュレートされており、ペルシア製製品に焦点を当てた最初のデータセットとして注目すべきイニシアティブである。
提案アルゴリズムは,キャタリングパッケージのリアルタイム検出,キャリブレーション,完全自律梱包プロセスを保証する。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:12:55 GMT)
Bootstrapping Diffusion: Diffusion Model Training Leveraging Partial and Corrupted Data [0.5] 本稿では,部分的データビューを用いた拡散モデルの訓練方法を提案する。
提案手法は,まず個々の視点に対して1つの拡散モデルを訓練し,残差スコア関数を予測するためのモデルを訓練する。
一般化誤差境界を証明し,正規化を適切に適用すれば,拡散モデルトレーニング手法がより低い一般化誤差を達成できることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:17:48 GMT)
A Heuristic Algorithm Based on Beam Search and Iterated Local Search for the Maritime Inventory Routing Problem [0.5] 海運インベントリ問題(MIRP)は、世界の海運レベルの統合において重要な役割を担っている。
MIRPは世界海運水準の統合において重要な役割を担っている。
大規模なMIRPインスタンスやその変種を効率的に解決できる、確立された方法論はいまだに存在しない。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:40:36 GMT)
ProtoECGNet: Case-Based Interpretable Deep Learning for Multi-Label ECG Classification with Contrastive Learning [0.2] ProtoECGNetは、解釈可能な多ラベルECG分類のためのプロトタイプディープラーニングモデルである。
PTB-XLデータセットから71の診断ラベルについてProtoECGNetを評価する。
ProtoECGNetは、プロトタイプ学習を複雑で多ラベルの時系列分類に効果的にスケールできることを示した。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:23:28 GMT)
Improving the discovery of near-Earth objects with machine-learning methods [0.2] 近地球天体確認ページ (NEOCP) の候補として, ダイジェスト2パラメータの包括的分析を行った。
本研究では,NEOCPに非NEOオブジェクトを包含する手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:51:36 GMT)
Towards Sustainability in 6G Network Slicing with Energy-Saving and Optimization Methods [0.1] 省エネルギーは、電気通信分野における新しいシステムにとって大きな関心事である。
本論文の主な貢献は,ネットワークスライシングにおける省エネルギー化の提案である。
NSアーキテクチャにMLネイティブエージェントをデプロイすることで、ユーザの要求に基づいてリソースを動的にオーケストレーションし、最適化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:07:34 GMT)
Integrative Analysis and Imputation of Multiple Data Streams via Deep Gaussian Processes [0.1] 医療データは分析に3つの重要な課題を提示している。
第一に、生理学的な測定は異なるソースから来るが、本質的には関連している。
第二に、臨床測定は不規則な間隔で行われ、これらのサンプリング時間は臨床的意味を持つ。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:32:52 GMT)
AES-RV: Hardware-Efficient RISC-V Accelerator with Low-Latency AES Instruction Extension for IoT Security [0.1] AES-RVは、低遅延AES命令拡張を備えたハードウェア効率のRISC-Vアクセラレータである。
最高速度は255.97倍、エネルギー効率は453.04倍である。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:15:36 GMT)
When the Left Foot Leads to the Right Path: Bridging Initial Prejudice and Trainability [0.1] 平均場解析(MF)は、ランダムネットワークにおけるパラメータ分布が勾配が消滅するか爆発するかを決定することを示した。
訓練されていないDNNでは、入力空間の広い領域が1つのクラスに割り当てられる。
本研究では、IGB理論と過去のMF理論の対応性を確立する理論的証明を導出する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:31:56 GMT)
ARC-AGI-2: A New Challenge for Frontier AI Reasoning Systems [0.0] ARC-AGI-2は、前者の入出力ペアタスクフォーマットを保持し、研究者の連続性を保証する。
それは、抽象的推論と問題解決能力を評価するために特別に設計された、新しくキュレーションされ拡張された一連のタスクを含んでいる。
ARC-AGI-2は、より汎用的で人間らしいAI能力への進歩を厳格に測定するための次世代ツールとして機能することを目指している。
論文参考訳(メタデータ) (Sat, 17 May 2025 04:34:48 GMT)
EmoHopeSpeech: An Annotated Dataset of Emotions and Hope Speech in English [0.0] 本研究では,アラビア語の23,456項目と英語の10,036項目からなるバイリンガルデータセットを提案する。
このデータセットは、感情の強さ、複雑さ、原因を捉える包括的なアノテーションと、希望のスピーチのための詳細な分類とサブカテゴリを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:21:58 GMT)
An Annotated Corpus of Arabic Tweets for Hate Speech Analysis [0.0] 本研究では,アラビア語におけるマルチラベルヘイトスピーチデータセットを提案する。
われわれは1万のアラビア語ツイートを集め、各ツイートに攻撃的な内容を含むか否かにかかわらず注釈を付けた。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:08:22 GMT)
Zero-Shot Forecasting Mortality Rates: A Global Study [0.0] TimesFMとChronosの2つの最先端基盤モデルと、従来の機械学習と機械学習に基づく手法を評価した。
死亡データを微調整したCHRONOSは、長期的な精度を著しく向上させた。
死亡データに基づいて訓練されたランダムフォレストモデルは、全体的なパフォーマンスで最高のものとなった。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:27:39 GMT)
Variational quantum simulation of a nonadditive relaxation dynamics in a qubit coupled to a finite-temperature bath [0.0] 本稿では, 変動量子シミュレーションフレームワークを用いて, 短期量子ハードウェア上での有限温度開系力学を捉える。
我々はリンドブラッド表現による熱浴によるエネルギー交換をモデル化し,現実的な散逸効果をシミュレーションした。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:08:23 GMT)
Unlocking Photon Magnon Interplay via Saturation Magnetization [0.0] 光子マグノンハイブリッドシステムは、量子情報処理および量子センシング技術における次世代デバイス開発のための有望なプラットフォームを提供する。
平面六角形リング共振器(HRR)における飽和磁化の系統的変化による光子マグノン結合(PMC)強度の制御とイットリウム鉄ガーネット(YIG)薄膜構成について検討した。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:18:41 GMT)
Time-dependent conformal transformations and the propagator for quadratic systems [0.0] 我々は、時間依存周波数の減衰カルディロリ-カナイ発振器を、周波数が一定で摩擦のない発振器に変換する。
この手法により、マスロフ位相補正を任意の時間依存周波数に拡張することができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:47:21 GMT)
Test of the physical significance of Bell nonlocality [0.0] ベルの不等式に対するループホールのない違反は、局所的な隠れ変数理論の背後にある仮定の少なくとも1つが失敗しなければならないことを暗示している。
したがって、選択の自由を部分的に制限するモデルや、部分的再帰的影響を許容するモデルを除くことができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:34:33 GMT)
Technical Report for ICRA 2025 GOOSE 2D Semantic Segmentation Challenge: Boosting Off-Road Segmentation via Photometric Distortion and Exponential Moving Average [0.0] GOOSE 2D Semantic Challenge への高容量セマンティックセマンティックパイプラインの適用について報告する。
UPerNetデコーダとともにFlashInternImage-Bのバックボーンを使用して、新しいものではなく、確立したテクニックをオフロードシーンの特異な条件に適応させる。
トレーニングレシピでは,重みの指数移動平均値(EMA)と強い光度歪みの増大を組み合わせ,より一般化した。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:29:17 GMT)
T-Rex: Fitting a Robust Factor Model via Expectation-Maximization [0.0] 統計的因子モデルに頑健に適合する新しい予測最大化(EM)アルゴリズムを提案する。
我々のアプローチは、楕円分布に対する散乱行列のタイラーのM-推定器に基づいている。
合成例と実例の両方について数値実験を行った。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:53:06 GMT)
Stochastic Processes with Modified Lognormal Distribution Featuring Flexible Upper Tail [0.0] 非対称非ガウス確率分布は、自然および工学的なデータセットの分析においてしばしば観察される。
対数正規法則は、高い値に対する確率密度とハザード関数の依存を厳しく制限する。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:44:44 GMT)
SoftPQ: Robust Instance Segmentation Evaluation via Soft Matching and Tunable Thresholds [0.0] フレキシブルかつ解釈可能なインスタンスセグメンテーションメトリックであるSoftPQを提案する。
我々は、既存のメトリクスが見落としているセグメンテーション品質の有意義な違いをSoftPQが捉えていることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:08:33 GMT)
Scalable quantum simulator with an extended gate set in giant atoms [0.0] 本稿では,巨大原子3レベルシステムに基づく拡張ゲートセットを用いたスケーラブルな量子シミュレータを提案する。
このチューニング性を活用することで、簡単な周波数調整により、CZゲートとiSWAPゲートの両方をサポートする。
実演として,散逸型ハイゼンベルクXXZスピン鎖におけるスピンダイナミクスのシミュレーションを紹介する。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:37:18 GMT)
Revisiting Residual Connections: Orthogonal Updates for Stable and Efficient Deep Networks [0.0] 残余接続は、深いニューラルネットワークにとって重要なものであり、消滅する勾配を緩和することでより深い深さを可能にする。
通常の残余更新では、モジュールの出力が入力ストリームに直接追加される。
これは、既存のストリーム方向を主に強化または修正する更新につながる可能性があるため、モジュールの能力が全く新しい機能を学ぶのに過小評価される可能性がある。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:16:11 GMT)
Reinforcement Learning for Control of Evolutionary and Ecological Processes [0.0] 本稿では,エコロジーと生理学の両方を計算としてモデル化し,進化ゲームの定式化を導入する。
我々は,進化する細胞の個体群を制御するためのアルゴリズム的問題に対して,その先駆的な結果を開発した。
論文参考訳(メタデータ) (Sat, 17 May 2025 00:51:26 GMT)
Reinforcement Learning and Life Cycle Assessment for a Circular Economy -- Towards Progressive Computer Science [0.0] 本研究の目的は,循環型経済における強化学習によるライフサイクルアセスメントの可能性を検討することである。
コンピュータチェスにおける強化学習(Reinforcement Learning)の応用について説明する。
本稿の最終部では、経済パラダイムを持続可能性に転換するコンピュータサイエンス関連の課題について論じる。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:47:34 GMT)
Reasoning Large Language Model Errors Arise from Hallucinating Critical Problem Features [0.0] 可変複素制約満足論理問題として,o1-mini,o3-mini,DeepSeek-R1,Claude 3.7 Sonnet,Gemini 2.5 Pro Preview,Grok 3 Mini Betaをグラフカラー化でテストする。
誤り率比較とCoT/説明テキスト解析の両方から、RLLMはグラフのプロンプト記述に指定されていないエッジを幻覚させる傾向にあることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:55:12 GMT)
Ranking Joint Policies in Dynamic Games using Evolutionary Dynamics [0.0] 単純な2プレイヤーゲームでもエージェントの相互作用のダイナミクスはナッシュ平衡に達することができないことが示されている。
我々のゴールは、安定した行動をもたらすエージェントの合同戦略を特定し、変化に抵抗すると同時に、エージェントの支払いも考慮することである。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:18:31 GMT)
Quantum Entanglement is Quantum: ZZ Production at the LHC [0.0] ダイボソン系の偏光とスピン相関は、精密テストや新しい物理学の探索のための強力なツールとして機能する。
pto e+e-mu+mu-$および$hto e+e-mu+mu-$プロセスの角係数を分析し,高次QCDとエレクトロ弱補正を取り入れた。
論文参考訳(メタデータ) (Sat, 17 May 2025 19:32:48 GMT)
Q-Policy: Quantum-Enhanced Policy Evaluation for Scalable Reinforcement Learning [0.0] 本稿では,政策評価と最適化を数学的に高速化するハイブリッド量子古典的強化学習フレームワークを提案する。
Q-Policyは量子重ね合わせで値関数を符号化し、複数の状態-作用対の同時評価を可能にする。
今後の量子デバイス上でのスケーラブルなRLの理論的基盤としてQ-Policyの可能性を支持する。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:03:32 GMT)
Proof of absence of local conserved quantities in two- and higher-dimensional quantum Ising models [0.0] 我々は、1より高次元の超立方体格子上の横場と縦場を持つイジング模型がハミルトニアン以外の局所保存量を持たないことを証明した。
その結果,最近開発された1次元システムにおける局所保存量の欠如を,高次元およびはしごに拡張した。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:54:26 GMT)
Position Paper: Bounded Alignment: What (Not) To Expect From AGI Agents [0.0] このポジションペーパーの目的は、AIと機械学習(AI/ML)コミュニティにおけるAGIの現在支配的なビジョンが進化する必要がある、と論じることである。
この視点の変化は、より現実的な技術観をもたらし、より良い政策決定を可能にします。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:17:57 GMT)
Peak state transfer in continuous quantum walks [0.0] 連続時間量子ウォークをモデルとした量子ビットネットワークにおける高次状態伝達の概念であるピーク状態伝達について検討する。
ピーク状態伝達のスペクトル解析を行い、ピーク状態伝達の多くの例を見つけることができる。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:39:44 GMT)
Parallel transport in rotating frames and projective holonomic quantum computation [0.0] 射影ゲートを用いた非線形ホロノミック量子計算のためのフレームワークを開発した。
我々は等ホロノミックな不等式を拡張し、ホロノミックな量子ゲートを実装するために使用されるプロトコルの効率に基礎的な拘束力を与える。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:04:13 GMT)
PAHA: Parts-Aware Audio-Driven Human Animation with Diffusion Model [0.0] 拡散モデルを用いた音声駆動上半身アニメーションフレームワークPAHAを提案する。
本稿では、PAR(Parts-Aware Re-weighting)とPCE(Parts Consistency Enhancement)の2つの主要な手法を紹介する。
我々は,中国初の公開ニュースアンカー音声データセットであるCNASを構築し,この分野の研究と検証を進めた。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:04:47 GMT)
Optimal patient allocation for echocardiographic assessments [0.0] 我々は,患者のノショー確率を推定し,到着時間と受験期間の経験的分布を導出する。
我々は,SimPyを用いて離散イベントシミュレーションモデルを開発し,オープンソースPythonライブラリと統合する。
胎児と非胎児の比1:6、胎児と非胎児の比4:2の病院構成を考えると、オン・ザ・フライアロケーションは一般的により優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:51:23 GMT)
On-demand single-microwave-photon source in a superconducting circuit with wideband frequency tunability [0.0] 我々は、単一マイクロ波光子をオンデマンドで生成し、大きな周波数帯域で調整可能であることを示す。
2オクターブの光子の周波数を高速に制御するプロトコルを考案した。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:50:23 GMT)
Numerical Derivatives, Projection Coefficients, and Truncation Errors in Analytic Hilbert Space With Gaussian Measure [0.0] グラフの観点から、与えられた正則関数のテイラー級数展開の先頭項を決定する新しい方法である射影係数アルゴリズムを導入する。
計算された導関数値の精度は、これらの内部積を評価するために使用される数値ルーチンの精度と信頼性に依存する。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:56:38 GMT)
New Lower-bounds for Quantum Computation with Non-Collapsing Measurements [0.0] 複雑性クラスPDQP(当初はnaCQPと呼ばれていた)を紹介します。
PDQPにはSZKが含まれているが、構造化されていない検索を解決するには$Omega(N1/4)$クエリが必要である。
正重み付き対向下界法を証明し、複数の厳密な境界を確立し、クエリと非折り畳み測定とのトレードオフを確立する。
論文参考訳(メタデータ) (Sat, 17 May 2025 23:11:33 GMT)
Modèles de Substitution pour les Modèles à base d'Agents : Enjeux, Méthodes et Applications [0.0] エージェントベースモデル(ABM)は、局所的な相互作用から生じる創発的な現象を研究するために広く用いられている。
ABMの複雑さは、リアルタイム意思決定と大規模シナリオ分析の可能性を制限する。
これらの制限に対処するため、サロゲートモデルはスパースシミュレーションデータから近似を学習することで効率的な代替手段を提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:55:33 GMT)
Modeling and Discovering Direct Causes for Predictive Models [0.0] 本稿では,予測モデルの入出力挙動を捉える因果モデリングフレームワークを提案する。
そして、いくつかの仮定の下で(データから)直接原因を発見するための、健全で完全なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 03:06:10 GMT)
MoL for LLMs: Dual-Loss Optimization to Enhance Domain Expertise While Preserving General Capabilities [0.0] 本稿では,ドメイン固有および汎用コーパスの最適化目標を分離する新しいフレームワークであるMixture of Losses (MoL)を提案する。
MoLは知識獲得を確保するためにドメインデータにクロスエントロピー(CE)ロスを適用し、Kulback-Leibler(KL)分散はベースモデルの基本的な能力と一般コーパストレーニングを整合させる。
従来のCPT手法と比較して,性能が著しく向上した。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:12:47 GMT)
Metric Graph Kernels via the Tropical Torelli Map [0.0] 本稿では,熱帯代数幾何学を用いた計量グラフの研究を基礎とした新しいグラフカーネルを提案する。
我々のグラフカーネルは、基礎となる計量空間の幾何学と位相に基づいている。
経験的に、カーネルはラベルのない設定で既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Sat, 17 May 2025 20:00:50 GMT)
Medalyze: Lightweight Medical Report Summarization Application Using FLAN-T5-Large [0.0] Medalyzeは、医療用テキストの理解を高めるために設計されたAIベースのアプリケーションである。
これは、スケーラブルなAPIとYugabyteDBを活用して、リアルタイム推論を備えたWebおよびモバイルプラットフォームにデプロイされる。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:16:58 GMT)
Machine Learning-Based Analysis of ECG and PCG Signals for Rheumatic Heart Disease Detection: A Scoping Review (2015-2025) [0.0] RHD検出のためのMLベースのECG/PCG分析に着目し, PubMed, IEEE Xplore, Scopus, Embaseを網羅的に検索した。
CNNは2020年以降において主要な技術となり、平均精度は93.7%に達した。
血管病変は多種多様であり,44%は内因性領域に由来するが,実施科学や人口統計学の多様性には大きなギャップが残っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:34:02 GMT)
Let's have a chat with the EU AI Act [0.0] 本稿では,欧州連合のAI法とその関連規格のナビゲートを支援するAI駆動型自己評価ボットを紹介する。
Retrieval-Augmented Generationフレームワークを活用することで、ボットは関連する規制テキストを取得し、カスタマイズされたガイダンスを提供する。
論文では、ボットのアーキテクチャについて、ナイーブモデルとグラフベースのRAGモデルを比較し、AIガバナンスに対するその潜在的影響について論じる。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:24:08 GMT)
Learning Pareto-Optimal Rewards from Noisy Preferences: A Framework for Multi-Objective Inverse Reinforcement Learning [0.0] そこで我々は,人間の嗜好を潜在ベクトル値報酬関数としてモデル化する,嗜好に基づく多目的逆強化学習(MO-IRL)の理論的枠組みを提案する。
本研究は,実践的アライメント技術と理論的保証のギャップを埋め,アライメント行動の学習の原則的基盤を提供するものである。
論文参考訳(メタデータ) (Sat, 17 May 2025 06:09:13 GMT)
Isoholonomic inequality and tight implementations of holonomic quantum gates [0.0] ホロノミック量子計算では、量子論理ゲートは計算空間の巡回平行輸送によって実現される。
計算空間の余次元が十分に大きいとき、任意の量子ゲートは、並列輸送ハミルトニアンを用いて実装できることを示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:49:48 GMT)
Introduction to Analytical Software Engineering Design Paradigm [0.0] 本稿では,抽象化,ツールの不適切性,互換性,スケーラビリティの両立を目的とした新しい設計パラダイムである振舞いソフトウェア工学(ASE)について述べる。
このパラダイムは、BSS(Structure Sequences)とODR(Optimized Design Refactoring)という2つのフレームワークを通じて評価される。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:23:55 GMT)
Interactional Fairness in LLM Multi-Agent Systems: An Evaluation Framework [0.0] マルチエージェントシステムにおける対人フェアネス(IF)と情報フェアネス(InfF)を含むインタラクションフェアネスを評価するための新しい枠組みを提案する。
我々は,資源交渉タスクの制御されたシミュレーションを用いて,パイロットスタディを通じて,我々の枠組みを検証する。
その結果、客観的な結果が一定である場合でも、トーンと正当化品質が受容決定に大きく影響を及ぼすことが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 13:24:13 GMT)
Improving regional weather forecasts with neural interpolation [0.0] 地域気象モデルの境界データを改善するためのニューラル演算子を設計する。
特に、単純化されたモデルの研究を通して、問題にアプローチするための方法論を明らかにする。
提案手法は,画像超解像と畳み込みニューラルネットワーク(CNN)と残差ネットワークの組合せを利用する。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:05:09 GMT)
ImF: Implicit Fingerprint for Large Language Models [0.0] 我々は,ジェネレーション・リビジョン・インターベンション(GRI)攻撃という新たな敵攻撃を導入する。
GRIは、現在のフィンガープリント手法のセマンティックな脆弱性を利用して、事実上指紋を消去する。
Inlicit Fingerprints (ImF) と呼ばれる新しいモデル指紋パラダイムを提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 23:00:12 GMT)
Historical and psycholinguistic perspectives on morphological productivity: A sketch of an integrative approach [0.0] 我々は,心的語彙の認知的計算モデル,識別的語彙モデルを利用する。
フィンランドの名詞の屈折、マレーの導出、および英語の合成について、DLMを計算ツールとして用いて検討する。
第2の視点を発達させるため,多作作家のトーマス・マンの摂取とアウトプットが時間とともにどのように変化するかを考察する。
論文参考訳(メタデータ) (Sat, 17 May 2025 16:21:49 GMT)
HISTAI: An Open-Source, Large-Scale Whole Slide Image Dataset for Computational Pathology [0.0] HISTAIは、様々な組織タイプから6万枚以上のスライドからなる、大きく、マルチモーダルでオープンアクセス可能なWSI(Whole Slide Image)コレクションである。
HISTAIデータセットの各症例には、診断、人口統計情報、詳細な病理アノテーション、標準化された診断コーディングを含む広範な臨床メタデータが添付されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:59:32 GMT)
GenderBench: Evaluation Suite for Gender Biases in LLMs [0.0] GenderBenchは、LSMの性別バイアスを測定するために設計された総合的な評価スイートである。
GenderBenchには、19の性別に関連する有害な行動を定量化する14のプローブが含まれている。
我々の測定は、彼らの行動に一貫したパターンを明らかにする。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:34:33 GMT)
GSplatLoc: Ultra-Precise Camera Localization via 3D Gaussian Splatting [0.0] 超精密ポーズ推定に3次元ガウススプラッティングの可変レンダリング機能を利用するカメラローカライズ手法であるGSplatLocを提案する。
GSplatLocは、高密度マッピングのローカライズのための新しいベンチマークを設定し、ロボット工学や拡張現実のような正確なリアルタイムローカライズを必要とするアプリケーションに重要な意味を持つ。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:42:58 GMT)
FiGKD: Fine-Grained Knowledge Distillation via High-Frequency Detail Transfer [0.0] Fine-Grained Knowledge Distillation (FiGKD) は、モデルのロジットを低周波(コンテンツ)と高周波(詳細)に分解する周波数認識フレームワークである。
FiGKDは、最先端のロジットベースおよび特徴ベースの蒸留法を様々な教師の学生構成で一貫して上回っている。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:27:02 GMT)
Exact path integrals on half-line in quantum cosmology with a fluid clock and aspects of operator ordering ambiguity [0.0] 平坦な等質宇宙論モデルの半直線経路積分量子化を$textitexact$で行う。
量子論における特定の順序付け処方は、2つの対称性を保存することができると論じる。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:28:06 GMT)
Entanglement generation and dynamical equilibrium within de Broglie Bohm theory [0.0] 我々のハイブリッド半古典重力モデルが弱い絡み合いの限界においても絡み合いを誘導できることが示される。
本稿では,新しい通信方式を提案し,動的平衡の概念を導入する。
この枠組みは、ド・ブロイ・ボーム理論の量子平衡仮説とダヴィッド・ボームとジャン・ピエール・ビジェの因果解釈に着想を得たものである。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:37:24 GMT)
Empowering Sustainable Finance with Artificial Intelligence: A Framework for Responsible Implementation [0.0] この章では、環境、社会、ガバナンス(ESG)投資の台頭と人工知能(AI)技術の指数的成長という、2つの大きな発展の収束について論じる。
グリーンやESG関連融資などの多様なESG機器の需要の増加は、グローバルAI市場の急速な成長と一致している。
これらのリスクを軽減するためには、AIとESG投資のための新しい原則とルールが必要である。
論文参考訳(メタデータ) (Sat, 17 May 2025 14:05:39 GMT)
Emotion Recognition for Low-Resource Turkish: Fine-Tuning BERTurk on TREMO and Testing on Xenophobic Political Discourse [0.0] 本研究はトルコのソーシャルメディア上でセシズ・イスティラ (Sessiz Istila, Silent Invasion) という用語を検証し, シリア難民流入による反難民感情の高まりを浮き彫りにした。
BERTurkとTREMOデータセットを用いて,トルコ語に適した高度な感情認識モデル(ERM)を開発した。
論文参考訳(メタデータ) (Sat, 17 May 2025 22:38:18 GMT)
ElderFallGuard: Real-Time IoT and Computer Vision-Based Fall Detection System for Elderly Safety [0.0] ElderFallGuardは、高齢者の安全を高め、インテリジェントでタイムリーなアラートを通じて介護者の心の平和を提供する、視覚ベースのIoTソリューションだ。
システムは、イベントのスナップショットを含む警告を、カスタムボットを介して指定されたTelegramグループに即座に送信し、通知過負荷を防止するロジックを組み込んだ。我々のデータセットの厳密なテストは、例外的な結果を示し、100%精度、精度、リコール、F1スコアを達成した。
論文参考訳(メタデータ) (Sat, 17 May 2025 05:09:47 GMT)
Efficient Implementations of Residue Generators Mod 2n + 1 Providing Diminished-1 Representation [0.0] 形式 2n + 1 のモジュライは、低コスト奇モジュライのクラスに属する。
位置数系から RNS への入力変換器は、D1 形式の残基 mod 2n + 1 を生成することが望ましい。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:25:47 GMT)
Dynamic Perturbed Adaptive Method for Infinite Task-Conflicting Time Series [0.0] 時系列タスクを、異なる目的の入力出力マッピングとして定式化し、同じ入力が異なる出力を生成する。
そこで本研究では,頻繁なタスクシフトの下で適応性を評価するために,多数の相反するサブタスクを持つ合成データセットを構築した。
本研究では,トランク・ブランチアーキテクチャに基づく動的摂動適応手法を提案する。
論文参考訳(メタデータ) (Sat, 17 May 2025 08:33:57 GMT)
Conversational Recommendation System using NLP and Sentiment Analysis [0.0] 本稿では,レコメンデーションプロセスに会話的洞察を統合することで,レコメンデーションシステムに対する新たなアプローチを示す。
Conversational Recommender Systemは、ディープラーニングのような最先端技術を統合し、機械学習アルゴリズムを活用する。
この方法論は、コンテンツベースと協調的なレコメンデーションアプローチの融合を取り入れ、NLP技術でそれらを強化する。
論文参考訳(メタデータ) (Sat, 17 May 2025 09:36:05 GMT)
CloudCast -- Total Cloud Cover Nowcasting with Machine Learning [0.0] 雲は天気予報において重要な役割を担い、農業、太陽光発電、航空などいくつかの分野に影響を与える。
数値天気予報(NWP)モデルの進歩にもかかわらず、雲の形成過程の小さな性質のため、雲全体の被覆を予測することは困難である。
我々は、U-Netアーキテクチャに基づいた畳み込みニューラルネットワーク(CNN)であるCloudCastを紹介し、最大5時間前に全クラウドカバー(TCC)を予測するように設計されている。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:30:22 GMT)
Causal Machine Learning in IoT-based Engineering Problems: A Tool Comparison in the Case of Household Energy Consumption [0.0] 因果機械学習法に基づく2つの一般的なツールを比較した。
ツールの動作は18のクエリに対する応答を調べることで実証される。
結果は奨励され、容易に他のドメインに拡張される可能性がある。
論文参考訳(メタデータ) (Sat, 17 May 2025 21:39:51 GMT)
Can Vision-Language Models Infer Speaker's Ignorance? The Role of Visual and Linguistic Cues [0.0] 本研究では,視覚言語モデル(VLM)が実用的な推論を行うことができるかどうかを検討する。
視覚的に表現された状況(視覚的キュー)とQUDに基づく言語的プロンプト(言語的キュー)を系統的に操作した。
文脈的情報性を高めるために言語的手がかりが追加されたとき、クロードは両方の文脈的手がかりを統合することで、より人間的な推論を示した。
これらの結果は、これらのモデルが文脈的キューをどのように扱うかが異なるが、クロードの複数のキューを組み合わせる能力は、マルチモーダルモデルにおける実用的能力の出現を示唆する可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 17 May 2025 07:00:39 GMT)
Can Frontier LLMs Replace Annotators in Biomedical Text Mining? Analyzing Challenges and Exploring Solutions [0.0] バイオメディカルテキストマイニングにおけるLCMの最適性能について, これまでに複数の研究が報告されている。
これらの評価において, 故障パターンを解析することにより, バイオメディカルコーパスにおけるLCMの3つの主な課題を明らかにした。
以上の結果から,SOTA BERT モデルの性能はフロンティア LLM に近づいたり,超えたりできることが示された。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:01:20 GMT)
Behind the Screens: Uncovering Bias in AI-Driven Video Interview Assessments Using Counterfactuals [0.0] 本稿では,AIによる人格評価において,偏見を評価・定量化するための反ファクトベースのフレームワークを提案する。
本手法では,求職者の対実表現を生成するためにGAN(Generative Adversarial Network)を用いる。
この作業は、商用AI採用プラットフォームの公正監査のためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 18:46:14 GMT)
Bayesian Deep Learning Approaches for Uncertainty-Aware Retinal OCT Image Segmentation for Multiple Sclerosis [0.0] 光コヒーレンス・トモグラフィ(OCT)は眼科、心臓科、神経学の貴重な知見を提供する。
OCTを用いた眼科医にとって重要な課題は、スキャン内の網膜層のデライン化である。
深層学習を用いたデライン作成の自動化に向けた従来の取り組みは、臨床医や統計学者の獲得に困難を呈している。
論文参考訳(メタデータ) (Sat, 17 May 2025 15:56:17 GMT)
Basic model for ranking microfinance institutions [0.0] 本稿では,アグリゲータサイト製品のランキングモデル構築における課題について論じる。
我々は,MFIのどの特徴を考慮すべきかを提案し,マルコフ連鎖に基づくアルゴリズムを用いて,これらの特徴の有効性'を実データ上で示す。
論文参考訳(メタデータ) (Sat, 17 May 2025 10:15:05 GMT)
Attribution Projection Calculus: A Novel Framework for Causal Inference in Bayesian Networks [0.0] Projection Attribution Calculus (AP-Calculus) は、構造化ベイズネットワークにおける因果関係を決定するための新しいフレームワークである。
AP-Calculusは、特徴ラベル属性の分析、素早い相関の管理、情報ゲインの定量化、公正性の確保、予測モデルの不確実性の評価のための包括的な数学的基盤を提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 17:29:13 GMT)
Advanced Integration of Discrete Line Segments in Digitized P&ID for Continuous Instrument Connectivity [0.0] P&ID(Piping and Instrumentation Diagrams)は植物の基本的な青写真である。
P&IDシートからの情報を手動でマッピングすることは大きな課題である。
P&IDのデジタル化は、検出された線分をマージすることを必要とする。
論文参考訳(メタデータ) (Sat, 17 May 2025 12:16:54 GMT)
A Review and Analysis of a Parallel Approach for Decision Tree Learning from Large Data Streams [0.0] この研究は、スケーラブルで効率的なデータ解析のために設計された並列決定木学習アルゴリズムpdsCARTの1つを研究する。
データストリームからのリアルタイム学習をサポートし、木を段階的に構築できる。
第二に、高ボリュームのストリーミングデータの並列処理を可能にし、大規模アプリケーションに適している。
論文参考訳(メタデータ) (Sat, 17 May 2025 01:07:25 GMT)
A Concise Mathematical Description of Active Inference in Discrete Time [0.0] 本稿では,アクション選択機構の詳細な例を含むトピックの基本的紹介として機能する。
この付録はより微妙な数学的詳細を論じており、既に活発な推論文学を研究している読者をターゲットにしている。
本稿では,アクション選択と学習機構を実装し,pymdp環境と互換性のあるPythonコードを提供する。
論文参考訳(メタデータ) (Sat, 17 May 2025 11:41:59 GMT)