MLLMs are Deeply Affected by Modality Bias [158.6] MLLM(Multimodal Large Language Models)の最近の進歩は、テキストや画像などの多様なモダリティを統合する上で、有望な成果を示している。
MLLMはモダリティバイアスに強く影響され、しばしば言語に依存し、視覚入力のような他のモダリティを過小評価する。
本稿では,MLLMはモダリティバイアスの影響を強く受けており,様々なタスクにまたがってその発現を明らかにする。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:49:31 GMT)
Manifold-aware Representation Learning for Degradation-agnostic Image Restoration [135.9] 画像復元(IR)は、ノイズ、ぼかし、迷路、雨、低照度といった様々な汚職に影響を受ける劣化した入力から高品質な画像を復元することを目的としている。
我々は、入力特徴空間を3つのセマンティックに整列した並列分岐に明示的に分解する1つのIRにおいて、すべてに統一されたフレームワークであるMIRAGEを提案する。
このモジュラ分解は、多種多様な分解の一般化と効率を大幅に改善する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:52:10 GMT)
Self-GIVE: Associative Thinking from Limited Structured Knowledge for Enhanced Large Language Model Reasoning [103.2] Graph Inspired Veracity Extrapolation (GIVE)は、知識グラフ(KG)を用いて構造化知識を外挿する。
本稿では,自動連想思考による大規模言語モデルの拡張を目的とした検索RLフレームワークであるSelf-GIVEを提案する。
Self-GIVEは、構造化された検索と推論と連想的思考とのスケーラブルな統合を強化する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:01:51 GMT)
Unearthing Large Scale Domain-Specific Knowledge from Public Corpora [103.1] データ収集パイプラインに大規模なモデルを導入し、ドメイン固有の情報の生成をガイドします。
このアプローチをRetrieve-from-CCと呼ぶ。
ドメイン固有の知識に関するデータを収集するだけでなく、パブリックコーパスから潜在的推論手順を含むデータをマイニングする。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:22:30 GMT)
The Silent Saboteur: Imperceptible Adversarial Attacks against Black-Box Retrieval-Augmented Generation Systems [101.7] 本稿では,RAGシステムに対する敵攻撃について検討し,その脆弱性を同定する。
このタスクは、ターゲット文書を検索する非知覚的な摂動を見つけることを目的としており、もともとはトップ$k$の候補セットから除外されていた。
本稿では、攻撃者とターゲットRAG間の相互作用を追跡する強化学習ベースのフレームワークであるReGENTを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:19:25 GMT)
DVD-Quant: Data-free Video Diffusion Transformers Quantization [98.4] Diffusion Transformers (DiT) はビデオ生成の最先端アーキテクチャとして登場したが、その計算とメモリの要求は実際の展開を妨げている。
ビデオDiTのための新しいデータフリー量子化フレームワークであるDVD-Quantを提案する。
提案手法は,データフリーな量子化誤差低減のための,プログレッシブバウンド量子化(PBQ)と自動スケーリング回転量子化(ARQ)の3つの重要なイノベーションを統合する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:56:02 GMT)
Why Vision Language Models Struggle with Visual Arithmetic? Towards Enhanced Chart and Geometry Understanding [94.6] 視覚言語モデル(VLM)はマルチモーダルタスクにおいて顕著な進歩を遂げた。
彼らはしばしば、オブジェクトのカウントや長さ比較のような一見単純な機能である視覚的算術に苦しむ。
我々は、ピアジェの認知発達理論に触発された新しいポストトレーニング戦略であるCogAlignを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:36:26 GMT)
Multi-Step Alignment as Markov Games: An Optimistic Online Gradient Descent Approach with Convergence Guarantees [91.9] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の好みを合わせることに成功している。
DPOのような一般的な手法は高い性能を示してきたが、彼らは言語モデルとの相互作用を帯域幅の問題として捉えている。
本稿では,アライメント問題を2プレイヤー定数マルコフゲームとしてモデル化することで,これらの課題に対処する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:50:12 GMT)
Self-Supervised and Generalizable Tokenization for CLIP-Based 3D Understanding [87.7] 凍結したCLIPバックボーンを用いたスケール不変表現学習のためのユニバーサル3Dトークン化器を提案する。
S4Tokenは、シーンスケールに関係なくセマンティックインフォームドトークンを生成するトークン化パイプラインである。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:26:30 GMT)
CRMArena-Pro: Holistic Assessment of LLM Agents Across Diverse Business Scenarios and Interactions [85.9] CRMArena-Proは、多種多様なプロフェッショナル環境でのLLMエージェントの総合的で現実的な評価のための新しいベンチマークである。
多様なペルソナと堅牢な機密性意識評価によって導かれるマルチターンインタラクションが組み込まれている。
実験によると、主要なLLMエージェントはCRMArena-Proで58%のシングルターン成功しか達成せず、パフォーマンスはマルチターン設定で約35%に大幅に低下している。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:33:22 GMT)
PMQ-VE: Progressive Multi-Frame Quantization for Video Enhancement [83.9] 多フレームビデオ強調タスクは、ビデオシーケンスの空間的および時間的解像度と品質を改善することを目的としている。
映像強調のためのプログレッシブマルチフレーム量子化(PMQ-VE)を提案する。
このフレームワークは、バックトラックベースマルチフレーム量子化(BMFQ)とプログレッシブマルチ教師蒸留(PMTD)という、粗大な2段階のプロセスを備えている。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:31:10 GMT)
SAMA: Towards Multi-Turn Referential Grounded Video Chat with Large Language Models [80.4] ビデオにおけるきめ細かい時間的理解の獲得は、現在のビデオ大マルチモデル(ビデオLMM)にとって大きな課題である。
私たちは、データセット、モデル、ベンチマークの3つの中核的な側面に貢献しています。
まず,ビデオ理解,グラウンドニング,マルチターンビデオチャットの共用学習を実現するため、15Kビデオからなる大規模データセットであるSAMA-239Kを紹介する。
第2に,広義の時間的コンテキストアグリゲータとセグメンションモデルを組み合わせたSAMAモデルを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:13:16 GMT)
OmniGenBench: A Benchmark for Omnipotent Multimodal Generation across 50+ Tasks [77.2] 大規模マルチモーダルモデル(LMM)の最近のブレークスルーは、画像生成のための汎用的な指示に従うのに顕著な熟練性を示している。
OmniGenBenchは、最先端のLMMの指示追従能力を評価するために、精密に設計された新しいベンチマークである。
我々のOmniGenBenchには57の多様なサブタスクが含まれており、それらが要求する特定のモデル能力に応じて体系的に分類されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:29:34 GMT)
Value Compass Leaderboard: A Platform for Fundamental and Validated Evaluation of LLMs Values [76.7] 大きな言語モデル(LLM)は目覚ましいブレークスルーを達成し、その価値を人間と一致させることが必須になっている。
既存の評価は、バイアスや毒性といった安全性のリスクに焦点を絞っている。
既存のベンチマークはデータ汚染の傾向があります。
個人や文化にまたがる人的価値の多元的性質は、LLM値アライメントの測定において無視される。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:42:48 GMT)
Can LLM Watermarks Robustly Prevent Unauthorized Knowledge Distillation? [76.0] 本稿では,学生モデルが知識蒸留により,透かしの継承を回避しつつ,教師モデルの能力を獲得することができるかどうかを考察する。
本稿では,未ターゲットおよび目標とするトレーニングデータパラフレージング(UP,TP)による蒸留前除去と,推論時透かし中和(WN)による蒸留後除去の2つのカテゴリを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:59:46 GMT)
Does Representation Intervention Really Identify Desired Concepts and Elicit Alignment? [73.8] 表現の介入(Representation intervention)は、大規模言語モデルにおいて基礎となる概念を符号化する表現の発見と修正を目的としている。
介入が忠実であれば、介入されたLLMは有害な概念を消去し、非分配的敵のプロンプトとアウト・オブ・ディストリビューションのジェイルブレイクの両方に対して堅牢であるべきである。
本研究では,有害表現と良性表現の境界を簡易化する概念集中(COCA)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:23:52 GMT)
OpenOmni: Advancing Open-Source Omnimodal Large Language Models with Progressive Multimodal Alignment and Real-Time Self-Aware Emotional Speech Synthesis [73.0] nameは、一様アライメントと音声生成を統合する2段階のトレーニングフレームワークである。
雑用、視覚言語、音声言語ベンチマークで最先端モデルを上回っている。
nameは、非自己回帰モードで1秒のレイテンシでリアルタイムの音声生成を実現する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:52:35 GMT)
A Survey of LLM $\times$ DATA [72.0] 大規模言語モデル(LLM)とデータ管理(Data4LLM)の統合は、両方のドメインを急速に再定義しています。
一方、Data data4LLMは、事前トレーニング、後トレーニング、検索強化生成、エージェント生成などの段階に必要なデータの高品質、多様性、タイムラインをLLMに提供する。
一方、LLMはデータ管理のための汎用エンジンとして登場しつつある。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:57:12 GMT)
Preference Leakage: A Contamination Problem in LLM-as-a-judge [70.0] 審査員としてのLLM(Large Language Models)とLLMに基づくデータ合成は、2つの基本的なLLM駆動型データアノテーション法として登場した。
本研究では, 合成データ生成器とLCMに基づく評価器の関連性に起因するLCM-as-a-judgeの汚染問題である選好リークを明らかにする。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:18:28 GMT)
Sigmoid Self-Attention has Lower Sample Complexity than Softmax Self-Attention: A Mixture-of-Experts Perspective [69.7] 本稿では,Sigmoid self-attentionがソフトマックスよりも試料効率が高いことを理論的に示す。
筆者らは, 自己注意行列を専門家の混合として表現し, シグモイドの自己注意における専門家の意識は, ソフトマックスの自己意識と同一の近似誤差を達成するために, 極めて少ないデータを必要とすることを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:54:56 GMT)
PromptHMR: Promptable Human Mesh Recovery [68.7] ヒューマン・ポーズ・アンド・シェイプ(HPS)推定は、混み合ったシーン、対人インタラクション、一視点再構築といった様々なシナリオにおける課題を提示する。
本稿では,空間的および意味的なプロンプトを通じてHPS推定を再構成するトランスフォーマーに基づくプロンプトHMRを提案する。
本手法はシーンコンテキストを維持するために全画像を処理し,複数の入力モダリティを受け入れる。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:21:11 GMT)
On Minimax Estimation of Parameters in Softmax-Contaminated Mixture of Experts [66.4] ゲーティングおよびプロンプトパラメータの最大極大推定器の収束率について検討する。
事前学習したモデルと重なり合う知識を取得すると,これらのパラメータの推定可能性が損なわれることがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:30:46 GMT)
ThinkVideo: High-Quality Reasoning Video Segmentation with Chain of Thoughts [64.9] ビデオオブジェクトの推論は難しいタスクであり、入力ビデオと暗黙の複雑なテキストクエリからマスクシーケンスを生成する。
既存の作業は、セグメント化に基づく出力のためにMLLM(Multimodal Large Language Model)を微調整することでこの問題を調査するが、時間に敏感なクエリが与えられたビデオでは難しいケースでは依然として不足している。
MLLMのゼロショット・チェーン・オブ・ソート(CoT)機能を利用してこれらの課題に対処する新しいフレームワークであるThinkVideoを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:01:31 GMT)
Breaking Silos: Adaptive Model Fusion Unlocks Better Time Series Forecasting [64.5] 時系列予測は多くの現実世界のアプリケーションにおいて重要な役割を果たす。
1つのモデルは、異なるテストサンプルで一貫して他よりも優れていますが、(ii) それぞれのモデルは特定のケースで優れています。
異種モデルのサンプルレベル適応融合による時系列予測のためのフレームワークであるTimeFuseを紹介する。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:45:07 GMT)
Learning without Isolation: Pathway Protection for Continual Learning [64.3] ディープネットワークは、シーケンシャルなタスク学習中に破滅的な忘れをしがちだ。
モデル融合をグラフマッチングとして定式化する新しいCLフレームワークLwIを提案する。
深層ネットワークにおける活性化チャネルの広がりにより、LwIは新しいタスクのために利用可能な経路を適応的に割り当て、経路保護を実現し、破滅的な忘れに対処することができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:16:55 GMT)
Revisiting Model Inversion Evaluation: From Misleading Standards to Reliable Privacy Assessment [63.1] モデル反転(MI)攻撃は、機械学習モデルTへのアクセスを利用して、プライベートトレーニングデータから情報を再構築することを目的としている。
このような攻撃に対する標準的な評価フレームワークは、Tと同じタスク設計で訓練された評価モデルEに依存している。
このフレームワークはMI研究の進歩を評価するためのデファクトスタンダードとなり、近年のMI攻撃や防衛のほとんどすべてで問題なく使用されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:42:50 GMT)
Improved Immiscible Diffusion: Accelerate Diffusion Training by Reducing Its Miscibility [62.3] 不和がいかに軽視し、効率を向上するかを示す。
そこで本稿では,K-nearest neighbor (KNN) ノイズ選択や画像スケーリングなどの実装のファミリを提案する。
この研究は、今後の高効率拡散訓練研究の新たな方向性を確立する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:38:35 GMT)
Attacking Vision-Language Computer Agents via Pop-ups [61.7] VLMエージェントは、慎重に設計された対向的なポップアップによって容易に攻撃できることを示す。
この混乱は、エージェントが通常どおりのタスクを実行するのではなく、ポップアップをクリックしてしまう。
エージェントにポップアップを無視するよう要求したり、広告通知を含むような基本的な防御技術は、攻撃に対して効果がない。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:15:46 GMT)
MELON: Provable Indirect Prompt Injection Defense via Masked Re-execution and Tool Comparison [60.3] LLMエージェントは間接的プロンプトインジェクション(IPI)攻撃に対して脆弱であり、ツール検索情報に埋め込まれた悪意のあるタスクはエージェントをリダイレクトして不正なアクションを取ることができる。
マスク機能によって修正されたマスク付きユーザでエージェントの軌道を再実行することで攻撃を検知する新しいIPIディフェンスであるMELONを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:01:12 GMT)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.1] 本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。
我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:44:26 GMT)
Accelerating Large Language Model Reasoning via Speculative Search [59.5] 本稿では,大規模言語モデル(LLM)推論を著しく高速化する新しいSpec Searchフレームワークを提案する。
具体的には、SpecSearchは小さなモデルを使用して、思考とトークンのレベルで大きなモデルと戦略的に協力する。
SpecSearchの主要な柱は、大きなモデルの出力よりも品質が低い考えを効果的にフィルタリングする、新しい品質保存の拒絶メカニズムである。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:49:29 GMT)
ToDRE: Visual Token Pruning via Diversity and Task Awareness for Efficient Large Vision-Language Models [59.5] ToDREは、2段階でトレーニング不要なトークン圧縮フレームワークである。
トークンの多様性とトークン-タスク関連性に基づいてトークンをプルーニングすることで、優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:47:49 GMT)
Data-Efficient Hate Speech Detection via Cross-Lingual Nearest Neighbor Retrieval with Limited Labeled Data [59.3] 言語間の変換学習は、ラベル付きデータに制限のあるタスクのパフォーマンスを向上させることができる。
我々は、最寄りの検索を利用して、ターゲット言語における最小ラベル付きデータを増強する。
提案手法を8言語で評価し,対象言語データのみに基づいてトレーニングしたモデルよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:30:41 GMT)
Can Prompting LLMs Unlock Hate Speech Detection across Languages? A Zero-shot and Few-shot Study [59.3] この研究は、8つの非英語言語にわたるLLMのプロンプトに基づく検出を評価する。
実世界の評価セットのほとんどにおいて、ゼロショットと少数ショットが微調整エンコーダモデルに遅れを生じさせる一方で、ヘイトスピーチ検出のための関数的テストのより優れた一般化を実現していることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:35:05 GMT)
SMART: Self-Aware Agent for Tool Overuse Mitigation [58.7] 現在のLarge Language Model (LLM) エージェントは、強力な推論とツールの使用能力を示すが、しばしば自己認識に欠ける。
この不均衡はツール・オーバーユースにつながり、モデルはパラメトリックな知識を持つタスクに対して、不要に外部ツールに依存する。
SMART(Strategic Model-Aware Reasoning with Tools)は、エージェントの自己認識を高め、タスクハンドリングを最適化し、ツールの過剰使用を減らすパラダイムである。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:48:39 GMT)
G1: Teaching LLMs to Reason on Graphs with Reinforcement Learning [58.7] 本稿では,合成グラフ理論タスクにおける強化学習(Reinforcement Learning, RL)がグラフ推論能力を著しく拡張できることを示す,単純かつ効果的なアプローチであるG1を紹介する。
RL on ErdosでG1はグラフ推論の大幅な改善を実現し、微調整された3BモデルはQwen2.5-72B-Instruct(24倍)よりも優れています。
我々の研究は、グラフ理論上のRLでLLMを微調整することで、強力なグラフ推論器を構築するための効率的でスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:33:41 GMT)
EvAnimate: Event-conditioned Image-to-Video Generation for Human Animation [58.4] EvAnimateは、条件付き人間の画像アニメーションにおいて、イベントストリームを堅牢で正確なモーションキューとして活用する最初の方法である。
高品質で時間的コヒーレントなアニメーションはデュアルブランチアーキテクチャによって実現される。
実験結果から,従来の映像由来のキューが短いシナリオにおいて,EvAnimateは時間的忠実度が高く,頑健なパフォーマンスを実現することが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:16:24 GMT)
DeCaFlow: A Deconfounding Causal Generative Model [58.4] 本稿では,分解因果生成モデルであるDeCaFlowを紹介する。
DeCaFlowの単一インスタンスがdo-calculusで識別可能なすべての因果クエリに対して正しい推定値を提供することを示す。
多様な設定に関する実証的な結果は、DeCaFlowが既存のアプローチよりも優れており、任意の因果グラフに適用可能であることを示している。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:18:46 GMT)
Enhancing Training Data Attribution with Representational Optimization [57.6] トレーニングデータ属性法は、トレーニングデータがモデルの予測にどのように影響するかを測定することを目的としている。
本稿では,タスク固有表現とモデル整合表現をTDAで明示的に学習することで,このギャップを埋める表現ベースアプローチであるAirRepを提案する。
AirRepは、属性品質に合わせて調整されたトレーニング可能なエンコーダと、グループワイドの影響を正確に見積もるアテンションベースのプール機構の2つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:17:53 GMT)
Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation [57.6] 拡散変換器(DiT)はビデオ生成に必須であるが,注意の2次複雑さにより遅延が著しく低下する。
SVG2は,識別精度を最大化し,無駄を最小化する学習自由フレームワークである。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:30:29 GMT)
REGen: Multimodal Retrieval-Embedded Generation for Long-to-Short Video Editing [57.0] 本研究では,長い入力ビデオから抽出した埋め込みビデオ挿入を伴うコヒーレントな物語を特徴付けるショートを生成するための新しいビデオ編集モデルについて検討する。
本稿では,大規模言語モデルにおいて,コヒーレントなナラティブを維持しつつ,多モーダルなリソースを引用できる新しい検索組込み生成フレームワークを提案する。
提案手法は,コヒーレントなナラティブを維持しつつ,短いビデオクリップを効果的に挿入できることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:36:49 GMT)
Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps [56.8] MLLMの詳細な視覚的理解と空間的推論能力を評価するためのベンチマークであるReasonMapを紹介する。
ReasonMapには、13か国30都市からの高解像度のトランジットマップが含まれており、2つの質問タイプと3つのテンプレートにまたがる1008の質問応答ペアが含まれている。
基本および推論変種を含む15種類のMLLMの包括的評価は、直感的パターンを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:33:52 GMT)
DiffPuter: Empowering Diffusion Models for Missing Data Imputation [56.5] 本稿ではDiffPuterについて紹介する。DiffPuterは、データ計算の欠如に対する期待最大化(EM)アルゴリズムと組み合わせた、カスタマイズされた拡散モデルである。
我々の理論的解析は、DiffPuterのトレーニングステップがデータ密度の最大推定値に対応することを示している。
DiffPuterは,最も競争力のある既存手法と比較して,MAEが6.94%,RMSEが4.78%向上した。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:59:32 GMT)
Reducing Storage of Pretrained Neural Networks by Rate-Constrained Quantization and Entropy Coding [56.1] 成長を続けるニューラルネットワークのサイズは、リソースに制約のあるデバイスに深刻な課題をもたらす。
本稿では,レートアウェア量子化とエントロピー符号化を組み合わせた学習後圧縮フレームワークを提案する。
この方法では非常に高速な復号化が可能であり、任意の量子化グリッドと互換性がある。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:52:49 GMT)
Large Language Models in the Task of Automatic Validation of Text Classifier Predictions [55.2] テキスト分類のための機械学習モデルは、与えられたテキストのクラスを予測するために訓練される。
これを行うには、トレーニングと検証のサンプルを用意し、各テキストにクラスを割り当てる必要がある。
人間のアノテーションは通常、特定の分類タスクによって異なる専門レベルを持つ人間のアノテーションによって割り当てられる。
本稿では,人間のアノテータを大規模言語モデルに置き換えるためのいくつかのアプローチを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:19:03 GMT)
OpenReview Should be Protected and Leveraged as a Community Asset for Research in the Era of Large Language Models [55.2] OpenReviewは、研究論文、ピアレビュー、著者の反論、メタレビュー、決定結果の継続的な進化を続けるリポジトリである。
OpenReviewは、ピアレビュープロセスの品質、スケーラビリティ、説明責任の向上、真に専門家の議論に根ざした有意義でオープンなベンチマークの実現、専門家の評価、意図、科学的価値を反映した現実世界のインタラクションによるアライメント研究の支援という、ユニークな貢献が可能な3つの領域を強調します。
コミュニティは、OpenReviewに関する標準化されたベンチマークと利用ガイドラインを共同で検討し、責任あるデータの使用、倫理的考慮、集団スチュワードシップに関するより広範な対話を招待することを提案します。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:07:13 GMT)
Cross-Lingual Pitfalls: Automatic Probing Cross-Lingual Weakness of Multilingual Large Language Models [55.1] 本稿では,Large Language Models (LLMs) における言語間関係の弱点を効率的に同定するための新しい手法を提案する。
この手法を用いて16言語で6,000以上のバイリンガルペアからなる新しいデータセットを構築し、最先端のモデルにおいても弱点を明らかにする効果を実証した。
さらに,言語的類似性と言語間の弱点との関係について検討し,言語的関連言語が類似した演奏パターンを共有することを明らかにした。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:31:27 GMT)
MedScore: Factuality Evaluation of Free-Form Medical Answers [54.7] 我々は,医学的回答を条件対応の有効な事実に分解する新しい手法であるMedScoreを提案する。
本手法は,既存手法の最大3倍の有効事実を抽出する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:23:09 GMT)
Stealing Training Graphs from Graph Neural Networks [54.5] グラフニューラルネットワーク(GNN)は、様々なタスクにおけるグラフのモデリングにおいて有望な結果を示している。
ニューラルネットワークがトレーニングサンプルを記憶できるため、GNNのモデルパラメータはプライベートトレーニングデータをリークするリスクが高い。
訓練されたGNNからグラフを盗むという新しい問題について検討する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:43:17 GMT)
When More is Less: Understanding Chain-of-Thought Length in LLMs [53.8] 大規模言語モデル(LLM)は複雑な問題を分解するためにChain-of-Thought(CoT)推論を用いる。
本稿は、長いCoTがより優れていると仮定されることがしばしばあり、長いCoTが常に優れているとは限らない、と論じる。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:58:11 GMT)
ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search [53.4] ReGUIDEは、MLLMが自己生成的推論と空間認識的批判を通じてデータを効率的に学習することを可能にするWebグラウンドのためのフレームワークである。
実験により、ReGUIDEは複数のベンチマークでWebグラウンド性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:08:35 GMT)
Flat-LoRA: Low-Rank Adaptation over a Flat Loss Landscape [53.0] フルパラメータ空間の平坦領域に位置する低ランク適応を同定することを目的としたFlat-LoRAを提案する。
また、Flat-LoRAはドメイン内とドメイン外の両方の一般化を改善していることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:19:58 GMT)
Towards Emotionally Consistent Text-Based Speech Editing: Introducing EmoCorrector and The ECD-TSE Dataset [53.0] EmoCorrectorはテキストベースの音声編集のための新しいポスト補正方式である。
編集されたテキストの感情的特徴を検索し、一致する感情で音声サンプルを検索し、所望の感情に合わせて音声を合成する。
EmoCorrectorは、現在のTSEメソッドにおける感情の不整合に対処しながら、意図した感情の発現を著しく向上させる。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:10:56 GMT)
Influence Functions for Scalable Data Attribution in Diffusion Models [52.9] 拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
これらの課題に対処するための影響関数フレームワークを開発する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:59:10 GMT)
Learning on LLM Output Signatures for gray-box Behavior Analysis [52.8] 大きな言語モデル(LLM)は広く採用されていますが、その振る舞いに対する私たちの理解は限定的です。
グレーボックス設定におけるプロセス汚染とデータ検出のためのトランスフォーマーベースのアプローチを開発する。
提案手法は,グレーボックス設定における幻覚とデータ検出における優れた性能を実現し,既存のベースラインを著しく上回る。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:23:37 GMT)
On the Effect of Negative Gradient in Group Relative Deep Reinforcement Optimization [52.8] 強化学習(RL)は,大規模言語モデル(LLM)の推論能力の向上に人気がある。
従来認識されていなかった Lazy Likelihood Displacement (LLD) 現象を同定し, トレーニング中に正答率がわずかに増加するか, あるいは低下する可能性が示唆された。
従来のDPOベースのアプローチとは異なり、NTHRはGRPOのグループベースの構造を利用して、適切な応答をアンカーとして利用し、重要なトークンを識別する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:58:51 GMT)
OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [52.7] 事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。
既存の手法のほとんどは、ランダムノイズから反復的にデノイングすることで、イメージを再構成する。
我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:28:19 GMT)
SCHEME: Scalable Channel Mixer for Vision Transformers [52.6] ビジョントランスフォーマーは多くの計算タスクで素晴らしいパフォーマンスを達成した。
密度の高い接続は、より大きな膨張比をサポートするスパースブロック対角構造に置き換えることができることを示す。
また、トレーニング中に並列分岐として、軽量でパラメータフリーなチャネル共分散アテンション機構を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:30:33 GMT)
Governing Equation Discovery from Data Based on Differential Invariants [52.3] 微分不変量に基づく方程式探索のためのパイプラインを提案する。
具体的には、対称性群の無限小生成元に対応する微分不変量の集合を計算する。
例として、DI-SINDyを例として、PDE発見におけるその成功率と精度が、他の対称性にインフォームドされた支配方程式発見法よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:19:02 GMT)
AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.1] 本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:55:22 GMT)
Mod-Adapter: Tuning-Free and Versatile Multi-concept Personalization via Modulation Adapter [52.1] テストタイムの微調整なしにオブジェクトと抽象概念を効果的にカスタマイズできるマルチコンセプトパーソナライズのためのチューニング不要な手法を提案する。
本手法は, 定量的, 質的, 人的評価によって支援された多概念パーソナライゼーションにおける最先端性能を実現する。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:21:32 GMT)
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment [52.0] CoZ(Chain-of-Zoom)は、SISRをマルチスケール対応プロンプトを備えた中間スケールステートのチェーンに分解するフレームワークである。
視覚的手がかりは高倍率で減少するため、視覚言語モデル(VLM)によって生成されたマルチスケール対応テキストプロンプトで各ズームステップを拡大する。
実験により、CoZでラップされた標準4x拡散SRモデルが256倍拡大し、高い知覚品質と忠実度が得られることが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:50:08 GMT)
Skip-Thinking: Chunk-wise Chain-of-Thought Distillation Enable Smaller Language Models to Reason Better and Faster [51.9] CoT (Chain-of-Thought) 蒸留により、大きな言語モデル (LLM) がタスクを推論するために小さな言語モデル (SLM) を導くことができる。
既存の方法は、SLMに1イテレーションで長い合理性を学ぶように訓練する。
本稿では,論理を内部意味的コヒーレントなチャンクに分割するために探索を用いるチャンクワイズトレーニング(CWT)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:04:52 GMT)
SMI: An Information-Theoretic Metric for Predicting Model Knowledge Solely from Pre-Training Signals [51.6] 我々は、モデルの内部知識を示す重要な下流タスクであるクローズドブック質問応答(QA)の性能を予測することを目指している。
我々は、21の公開言語と3つのカスタムトレーニングされた大規模言語モデルの事前学習コーパスに対して、大規模な検索と意味解析を行う。
これらの基礎の上に構築されたSMI(Size-dependent Mutual Information)は,事前学習データの特徴,モデルサイズ,QAの精度を線形に相関する情報理論の指標である。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:36:22 GMT)
Beauty and the Bias: Exploring the Impact of Attractiveness on Multimodal Large Language Models [51.6] 物理的魅力は人間の知覚と意思決定に影響を与えることが示されている。
マルチモーダル大言語モデル(MLLM)による評価と意思決定において魅力が果たす役割は、不明である。
我々は、91の社会的関連シナリオと924の顔画像の多様なデータセットで評価された7つのオープンソースMLLMを用いて実証的研究を行った。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:06:12 GMT)
Hybrid Latent Reasoning via Reinforcement Learning [51.1] 大規模言語モデル(LLM)の能力を活用した強化学習(RL)による潜時推論について検討する。
RLをベースとしたハイブリッド潜在推論手法であるハイブリッド推論ポリシー最適化(HRPO)を導入する。
HRPOで訓練されたLLMは解釈可能であり、言語横断パターンや短い完了長といった興味深い挙動を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:26:16 GMT)
Test-Time Adaptation with Binary Feedback [50.2] BiTTAは、不確実なサンプルに対するバイナリフィードバック誘導適応と、確実な予測に対する合意に基づく自己適応のバランスをとる、新しいデュアルパス最適化フレームワークである。
実験の結果、BiTTAは最先端のベースラインよりも13.3%の精度向上を実現している。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:24:10 GMT)
Provably Robust Training of Quantum Circuit Classifiers Against Parameter Noise [50.0] ノイズは、信頼できる量子アルゴリズムを達成するための大きな障害である。
本稿では,パラメータ化量子回路分類器のロバスト性を高めるための雑音耐性学習理論とアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:51:34 GMT)
An Illusion of Progress? Assessing the Current State of Web Agents [49.8] 我々は,Webエージェントの現状を包括的かつ厳密に評価する。
結果は、現在のエージェントの能力の非常に異なる描写を描いており、以前報告された結果に過度に最適化されていることを示唆している。
オンライン評価ベンチマークであるOnline-Mind2Webを紹介した。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:39:32 GMT)
EscapeBench: Towards Advancing Creative Intelligence of Language Model Agents [49.4] EscapeBenchは、クリエイティブな推論を伴うエージェントに挑戦するために設計されたルームエスケープゲーム環境のベンチマークスイートである。
その結果,現在のLMモデルでは,動作メモリとChain-of-Thought推論が採用されているが,ヒントのない平均進行率は15%に過ぎなかった。
EscapeAgentは、Foresight(イノベーティブ・ツール・ユース)とReflection(未解決タスクの特定)による創造的推論を強化するためのフレームワークである。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:56:32 GMT)
EvdCLIP: Improving Vision-Language Retrieval with Entity Visual Descriptions from Large Language Models [48.7] 視覚言語検索は、対応する画像(またはテキスト)を検索するクエリとしてテキスト(または画像)を使用する。
本稿では,エンティティの視覚的知識を活用してクエリを充実させるために,Entity Visual Description enhanced CLIP (EvdCLIP)を提案する。
また,視覚言語検索タスクのための新しいEVD対応リライター(EaRW)を開発した。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:41:51 GMT)
From Word to World: Evaluate and Mitigate Culture Bias via Word Association Test [48.6] 我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好を緩和するために,カルチャー対応のステアリング機構を統合する革新的なアプローチであるCultureSteerを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:05:10 GMT)
Facial Expression Analysis and Its Potentials in IoT Systems: A Contemporary Survey [48.6] 表情分析とIoT(Internet-of-Thing)システムの統合は、さまざまなシナリオにおいて大きな可能性を秘めている。
本研究の目的は,表情分析における研究の進展を概観し,IoTシステムとの統合の可能性を探ることである。
表情に基づく技術とIoTシステムの融合に向けた課題と今後の方向性を強調します。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:00:40 GMT)
Think Before You Accept: Semantic Reflective Verification for Faster Speculative Decoding [48.5] 投機的復号化は、軽量モデルを使用して複数のドラフトトークンを生成し、それらを並列に検証することで推論を加速する。
既存の検証手法は、意味的正確性を見越しながら、分布の整合性に大きく依存している。
我々は,学習自由でセマンティックなアプローチであるリフレクティブ検証を提案し,正確性と効率のトレードオフを改善する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:26:27 GMT)
Lookahead Q-Cache: Achieving More Consistent KV Cache Eviction via Pseudo Query [48.5] KVキャッシュメモリの使用は、長いテキストシーケンスで大幅に増加する。
プリフィルステージアテンションスコアを用いた既存のKVキャッシュ消去手法Pruneトークン
Lookahead Q-Cacheは、真のデコードステージクエリをよりよく近似するために、低コストの疑似ルックアヘッドクエリを生成する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:34:38 GMT)
Feature Extraction and Steering for Enhanced Chain-of-Thought Reasoning in Language Models [48.4] 大規模言語モデル(LLM)は、Chain-of-Thought(CoT)技術を用いて推論と数学的問題を解く能力を示す。
この研究はDeepSeek-R1の深い思考パラダイムにインスパイアされ、外部データセットを使わずにLCMの推論能力を高めるためにステアリング技術を利用している。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:20:30 GMT)
What Is That Talk About? A Video-to-Text Summarization Dataset for Scientific Presentations [47.8] 本稿では,科学領域におけるビデオとテキストの要約に特化したデータセットであるVISTAを紹介する。
我々は、最先端の大規模モデルの性能をベンチマークし、抽象概念の構造的性質をよりよく捉えるためにプランベースのフレームワークを適用した。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:14:01 GMT)
DiffDecompose: Layer-Wise Decomposition of Alpha-Composited Images via Diffusion Transformers [47.5] 本稿では,DiffDecomposeについて述べる。DiffDecomposeは拡散トランスフォーマーをベースとしたフレームワークで,入力画像に条件付き可能な層分解を後部から学習する。
コードとデータセットは、論文の受理時に提供される。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:08:04 GMT)
So-Fake: Benchmarking and Explaining Social Media Image Forgery Detection [47.2] So-Fake-Setは、200万以上の高品質な画像、多様な生成源、35の最先端生成モデルを用いて合成された画像を備えたソーシャルメディア指向のデータセットである。
本稿では,高精度な偽造検出,高精度な位置推定,解釈可能な視覚論理による説明可能な推論に強化学習を利用する高度な視覚言語フレームワークであるSo-Fake-R1を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:53:35 GMT)
Exploring the Boundary of Diffusion-based Methods for Solving Constrained Optimization [46.8] 本稿では,DiOptと呼ばれる連続制約最適化問題に対する拡散に基づく新しいフレームワークを提案する。
DiOptは2つの異なるフェーズで動作し、最初のウォームスタートフェーズは教師付き学習によって実装され、その後ブートストラップフェーズが続く。
問題の制約を厳格に満たしつつ、反復的に解を洗練し、目的関数を改善するように設計されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:48:10 GMT)
Affective Image Editing: Shaping Emotional Factors via Text Descriptions [46.1] AIEdiT for Affective Image Editing using Text descriptions。
我々は、連続的な感情スペクトルを構築し、ニュアンスな感情的要求を抽出する。
AIEdiTは、ユーザの感情的な要求を効果的に反映して、優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:46:57 GMT)
AsymRnR: Video Diffusion Transformers Acceleration with Asymmetric Reduction and Restoration [45.6] 拡散変換器(DiT)は高品質なビデオを生成するのに有効であることが証明されているが、高い計算コストによって妨げられている。
本稿では,ビデオDiTの高速化を目的としたトレーニングフリーでモデルに依存しない非対称リダクション・アンド・リカバリ法(AsymRnR)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:39:32 GMT)
Smoothie: Smoothing Diffusion on Token Embeddings for Text Generation [45.6] Smoothing Diffusion on Token Embeddings (Smoothie) は、意味的類似性に基づいてトークンの埋め込みを徐々に滑らかにすることで、両方のアプローチの強みを組み合わせる新しい拡散法である。
いくつかのシーケンス・ツー・シーケンス生成タスクの実験結果は、Smoothieが既存の拡散モデルよりも優れた生成品質を示すことを示した。
提案した拡散空間は、標準埋め込み空間とカテゴリー的単純空間の両方よりも優れた性能が得られる。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:02:14 GMT)
VORTA: Efficient Video Diffusion via Routing Sparse Attention [45.3] ビデオ拡散変換器(VDiT)は高品質なビデオ生成において顕著な進歩を遂げているが、計算コストは依然として高い。
2つの新しいコンポーネントを持つ加速度フレームワーク VORTA を提案する。
VBenchでは品質を損なうことなく、エンドツーエンドのスピードアップを1.76タイムで達成している。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:46:47 GMT)
Multi-Party Conversational Agents: A Survey [45.0] マルチパーティ会話エージェント(Multi-party Conversational Agents、MPCA)は、2人以上の参加者との対話を同時に行うように設計されたシステムである。
MPCAは、発話の意味論と社会的ダイナミクスの両方を解釈する必要があるため、さらなる課題に直面している。
本調査は,MPCAの最近の進歩を3つの重要な疑問に答えるものである。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:40:51 GMT)
InftyThink: Breaking the Length Limits of Long-Context Reasoning in Large Language Models [44.9] InftyThinkは、モノリシック推論を中間的な要約を伴う反復的なプロセスに変換するパラダイムである。
本手法では, 計算コストを抑えながら, 推理深度を推定できる。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:01:09 GMT)
Localizing Knowledge in Diffusion Transformers [44.3] 本研究では,Diffusion Transformerブロック内に特定の種類の知識がエンコードされている場所をローカライズするモデルおよび知識に依存しない手法を提案する。
同定されたブロックは、生成した出力における知識表現と因果関係があることが示される。
本研究は、DiTの内部構造に関する新たな知見を提供し、より解釈可能で、効率的で、制御可能なモデル編集のための実践的な経路を導入する。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:02:20 GMT)
Inference Compute-Optimal Video Vision Language Models [43.6] 本研究では,ビデオビジョン言語モデルにおける3つの主要なスケーリング要因間の推論計算の最適割り当てについて検討する。
我々の実験では、タスクパフォーマンスがスケーリングの要因やデータサイズの微調整にどのように依存するか、そしてデータサイズの変化が計算-最適フロンティアをどのようにシフトするかを明らかにした。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:09:04 GMT)
Leveraging Per-Instance Privacy for Machine Unlearning [43.6] 我々は、微調整による未学習の難しさを定量化するための原則的、インスタンスごとのアプローチを提案する。
我々の発見は、個々のデータポイントのユニークな性質に合わせて、より効率的で適応的な未学習戦略の基礎を提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:55:57 GMT)
LinGen: Towards High-Resolution Minute-Length Text-to-Video Generation with Linear Computational Complexity [43.3] 本稿では,ピクセル数に対してコストが線形にスケールするリニア・コンプレシティ・テキスト・ビデオ生成フレームワークを提案する。
初めてLinGenは、品質を損なうことなく、単一のGPU上で高解像度の分長ビデオ生成を可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:49:46 GMT)
Neural Encoding and Decoding at Scale [42.3] NEDS(Neural and Decoding at Scale)を実現するマルチモーダルマルチタスクモデルを提案する。
私たちのアプローチの中心は、神経、行動、内部モダリティ、および相互モダリティマスキングを交互に交互に行う、新しいマルチタスクマスキング戦略です。
NEDSは、複数動物データに基づいて事前訓練された後、新しい動物に微調整された際に、符号化と復号の両方の最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:00:52 GMT)
Thinking like a CHEMIST: Combined Heterogeneous Embedding Model Integrating Structure and Tokens [42.2] 本稿では,分子をサブ構造に分解し,これらの断片に対する記述子に基づく表現を計算する新しい手法を提案する。
このサブストラクタと記述子データを言語モデルの入力として使用し、また、この言語モデルとグラフベースのモデルを統合するバイモーダルアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:53:21 GMT)
Improved Regret and Contextual Linear Extension for Pandora's Box and Prophet Inequality [42.1] PandoraのBox問題を半帯域フィードバックによるオンライン学習環境で研究する。
各ラウンドでは、学習者は、未知の報酬分布を持つ最大$n$ボックスを開くために順次支払いを行う。
我々は,$T$ラウンド後に$widetildeO(sqrtT)$ regretを達成する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:55:22 GMT)
Hierarchical-embedding autoencoder with a predictor (HEAP) as efficient architecture for learning long-term evolution of complex multi-scale physical systems [41.9] システム内で動的に現れる様々なスケールの構造は、局所的にのみ相互に相互作用する。
階層的な完全畳み込みオートエンコーダは物理系の状態を一連の埋め込み層に変換する。
様々なスケールの特徴間の相互作用は、畳み込み作用素の組み合わせを用いてモデル化される。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:27:16 GMT)
Mechanical in-sensor computing: a programmable meta-sensor for structural damage classification without external electronic power [41.7] 構造振動情報を物理的に処理するためのプログラム可能なメタマテリアルベースセンサ(MMセンサ)を提案する。
我々はLRMPのバンドギャップ特性を利用して、損傷前後の構造物の動的挙動を物理的に区別する。
これは、9.54Hzから81.86Hzまでの最初の自然周波数を持つエンジニアリングシステムに有効である。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:08:02 GMT)
CRITS: Convolutional Rectifier for Interpretable Time Series Classification [41.2] 本稿では、時系列分類のための解釈可能なモデルとして、解釈可能な時系列分類のための畳み込み整流器(CRITS)を提案する。
我々は,一連のデータセット上でCRITSを評価し,その分類性能とその説明的アライメント,感度,理解可能性について検討した。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:34:08 GMT)
Guiding the Experts: Semantic Priors for Efficient and Focused MoE Routing [41.1] 本研究では,Mixture-of-Experts(MoE)モデルの事前誘導型拡張戦略を提案する。
空間的に認識された補助的損失を導入し、専門家の活性化を促すことによって、前景のセマンティックな領域と整合する。
我々の手法はアーキテクチャの微調整しか必要とせず、一般的なSoft MoEフレームワークにシームレスに統合できる。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:25:50 GMT)
From Generation to Detection: A Multimodal Multi-Task Dataset for Benchmarking Health Misinformation [40.2] 本稿では,34,746のニュース記事からなる健康領域における大規模マルチモーダル誤報データセットであるMM Healthについて紹介する。
MM Healthには、さまざまなSOTA生成AIモデルから生成された、人間生成のマルチモーダル情報(5,776記事)とAI生成のマルチモーダル情報(28,880記事)が含まれている。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:04:23 GMT)
Image Tokens Matter: Mitigating Hallucination in Discrete Tokenizer-based Large Vision-Language Models via Latent Editing [40.0] LVLM(Large Vision-Language Models)は、視覚入力を有限のトークン集合に符号化することで、マルチモーダル表現を統一する。
これらのモデルは、まだ存在しないオブジェクトを幻覚させる。
生成中の潜像埋め込みを変更することで、視覚的に欠落したトークンの影響を抑える幻覚緩和法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:36:15 GMT)
UGPhysics: A Comprehensive Benchmark for Undergraduate Physics Reasoning with Large Language Models [39.9] 大規模言語モデル(LLM)は、複雑な推論タスクを解く際、顕著な能力を示した。
物理学の推論の領域は、非常に少ない注意を払われたユニークな課題を提示する。
既存のベンチマークは、学部レベルの物理学の広さと深さでLLMの能力を評価するのに不足することが多い。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:39:08 GMT)
Unleashing Diffusion Transformers for Visual Correspondence by Modulating Massive Activations [39.8] 拡散変換器(DiTs)は、非常に少数の特徴活性化が他のものよりもはるかに大きな値を示す重要な現象を示す。
本研究では,Diffusion Transformer Feature (DiTF)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:20:36 GMT)
RefLoRA: Refactored Low-Rank Adaptation for Efficient Fine-Tuning of Large Models [39.7] Low-Rank Adaptation (LoRA)は、事前訓練された重み行列の低次元部分空間を更新することにより、微調整された大型モデルの計算およびメモリオーバーヘッドを下げる。
本稿では、損失の上限を最小化するステップ毎の最適低ランク因子化について述べる。
結果として得られた低ランク適応(RefLoRA)法は、一貫した重量とバランスの取れた重量の更新とともに、より平坦な損失景観を促進する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:33:16 GMT)
Anchored Diffusion Language Model [39.2] 本稿では,アンカーネットワークを介して重要なトークン上の分布を予測する新しいフレームワークであるAnchored Diffusion Language Model (ADLM)を紹介する。
ADLMはLM1BとOpenWebTextでテストの難易度を大幅に改善し、以前のDLMよりも25.4%向上した。
また、MAUVEスコアでARモデルを上回っており、DLMがARモデルよりも優れた人間的なテキストを生成するのはこれが初めてである。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:34:14 GMT)
Strong Membership Inference Attacks on Massive Datasets and (Moderately) Large Language Models [38.3] 最先端メンバシップ推論攻撃(MIA)は通常、多くの参照モデルをトレーニングする必要があるため、これらの攻撃を大きな事前訓練された言語モデル(LLM)に拡張することは困難である。
この問題に対処するには、最強MIAの1つであるLiRAを10Mから1BパラメータのGPT-2アーキテクチャに拡張し、C4データセットから20B以上のトークン上で参照モデルをトレーニングする。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:23:43 GMT)
Disentangling Knowledge Representations for Large Language Model Editing [38.2] 我々は,LLM編集のための知識表現を分割する新しいアプローチであるDiKEを提案する。
DiKEは2つの主要なコンポーネントから構成される: 対象表現を対象知識関連および非関連コンポーネントに分解する知識表現(KRD)モジュールと、対象コンポーネントのみを更新する知識編集(DKE)モジュールである。
本研究では, 微粒な無関係知識の保存を厳密に評価するため, FINE-KEDという, 微粒な無関係知識を, 編集された知識と異なるレベルの類似度で構成した新しいベンチマークを構築した。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:24:04 GMT)
MoMBS: Mixed-order minibatch sampling enhances model training from diverse-quality images [38.1] 深層モデルの学習において、さまざまな品質のトレーニングイメージをどのように活用するかが問題となる。
各種品質のトレーニングサンプルを最適化するために,Mixed-order Minibatch Smpling (MoMBS)法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:20:47 GMT)
Using Large Language Models to Tackle Fundamental Challenges in Graph Learning: A Comprehensive Survey [38.1] 実世界のグラフデータは、しばしば従来のグラフ学習法の前提に反する。
大規模言語モデル(LLM)の最近の進歩は、これらの課題に取り組む可能性を秘めている。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:38:14 GMT)
How Does Sequence Modeling Architecture Influence Base Capabilities of Pre-trained Language Models? Exploring Key Architecture Design Principles to Avoid Base Capabilities Degradation [37.6] この研究は、塩基機能に対するシーケンスモデリングアーキテクチャの影響に焦点を当てている。
まず、混合ドメイン事前トレーニング設定では、様々なアーキテクチャ間の基本能力の違いを適切に明らかにできないことを指摘します。
次に、ステートフルシーケンスモデリングアーキテクチャの基本能力を解析し、トランスフォーマーと比較して基盤能力を著しく劣化させることを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:40:03 GMT)
DB-KSVD: Scalable Alternating Optimization for Disentangling High-Dimensional Embedding Spaces [37.5] 古典的なKSVDアルゴリズムに適応するスケーラブルな辞書学習アルゴリズムを提案する。
DB-KSVDはKSVDの豊富な理論的基礎から情報を得ているが、数百万のサンプルと数千の次元を持つデータセットにスケールする。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:32:50 GMT)
The Quest for Efficient Reasoning: A Data-Centric Benchmark to CoT Distillation [37.4] 本稿では,チェーン・オブ・ソート(CoT)蒸留におけるデータ操作を調査する最初のデータ中心型ベンチマークであるDC-CoTを紹介する。
我々は、これらのデータ操作が複数の推論データセットの学生モデル性能に与える影響を厳格に評価する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:54:19 GMT)
LiteCUA: Computer as MCP Server for Computer-Use Agent on AIOS [37.4] AIOS 1.0は、環境コンテキスト化によるコンピュータ利用エージェント機能の向上を目的とした、新しいプラットフォームである。
We introduced LiteCUA, a lightweight computer-use agent built on AIOS 1.0, which is a 14.66% success rate on the OSWorld benchmark。
この結果から,言語モデルのための文脈的コンピュータ環境が,より有能なコンピュータ利用エージェントの開発に有望な方向を示すことが示唆された。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:56:00 GMT)
Enumerate-Conjecture-Prove: Formally Solving Answer-Construction Problems in Math Competitions [37.1] 本稿では,パターン駆動型推論と形式的定理証明を統合するモジュール型ニューロシンボリック手法であるCreativee-Conjecture-Prove(ECP)フレームワークを紹介する。
本稿では,様々な数学コンペティションにおける3,431の解題問題のデータセットであるConstructiveBenchを紹介する。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:52:25 GMT)
ACECODER: Acing Coder RL via Automated Test-Case Synthesis [36.7] 既存のコードデータから広範な(問い合わせ、テストケース)ペアを生成するパイプラインを設計します。
我々は,Bradley-Terry損失を伴う報酬モデルをトレーニングするために,サンプルプログラムのパスレートに基づいて選好ペアを構築した。
RLトレーニングは,80段階の最適化ステップにおいて,HumanEval+を25%以上,MBPP+を6%以上改善できることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:36:48 GMT)
Adaptive Prediction-Powered AutoEval with Reliability and Efficiency Guarantees [36.4] モデル評価における有限サンプル信頼性を保証する新しいフレームワークである textttR-AutoEval+ を提案する。
textttR-AutoEval+の重要な革新は、モデル評価変数の適応的な構成であり、合成データへの依存を動的に調整する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:53:29 GMT)
HonestFace: Towards Honest Face Restoration with One-Step Diffusion Model [36.4] HonestFaceは、このような誠実さを強く強調して顔を復元する新しいアプローチである。
きめ細かな細部とテクスチャの信頼性を高めるためにマスク面アライメント法を提案する。
我々の手法は既存の最先端手法を超越し、視覚的品質と定量的評価の両方において優れた性能を実現している。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:19:20 GMT)
Enhancing Generalization of Speech Large Language Models with Multi-Task Behavior Imitation and Speech-Text Interleaving [36.2] 大規模言語モデル(LLM)はタスク間で顕著な一般化を示している。
LLMは通常、教師付き微調整を使用して、テキストベースのLLMと音声を一致させる。
本稿では,音声テキストをインターリーブしたマルチタスクの「行動模倣」手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:09:13 GMT)
Safety in Large Reasoning Models: A Survey [36.0] 大規模推論モデル(LRM)は、数学やコーディングといったタスクにおいて、高度な推論能力を活用して、極めて優れた成果を上げている。
本稿では,新たに出現した安全リスク,攻撃,防衛戦略を精査し,精査したLEMの包括的調査を行う。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:50:56 GMT)
Focus on What Matters: Enhancing Medical Vision-Language Models with Automatic Attention Alignment Tuning [36.0] 自動アテンション調整のためのファインチューニングフレームワークであるA$3$Tuneを提案する。
A$3$Tune は SAM のゼロショット弱ラベルを活用し、BioMedCLIP を用いてプロンプト認識ラベルに洗練し、視覚的に重要なアテンションヘッドを選択的に修正し、干渉を最小限に抑えながらアライメントを改善する。
医療用VQAとレポート生成ベンチマークの実験から、A$3$Tuneは最先端のベースラインを上回り、Med-LVLMの注意分布と性能の向上を実現している。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:45:45 GMT)
KnowPath: Knowledge-enhanced Reasoning via LLM-generated Inference Paths over Knowledge Graphs [35.6] 大規模言語モデル(LLM)は、様々な複雑なタスクにおいて顕著な能力を示してきたが、それでも幻覚に悩まされている。
内部知識と外部知識の協調によって駆動される知識強化型大規模モデルフレームワークであるKnowPathを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:30:22 GMT)
Can LLMs Alleviate Catastrophic Forgetting in Graph Continual Learning? A Systematic Study [35.6] グラフ構造データを含む実世界のデータはしばしばストリーミング方式で配信されるため、学習システムは新たな知識を継続的に取得する必要がある。
本稿では,従来のGNNベースラインを約20%超えたシンプルなグラフ連続学習手法であるSimple Graph Continual Learning(SimGCL)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:43:29 GMT)
MASTER: Multi-Agent Security Through Exploration of Roles and Topological Structures -- A Comprehensive Framework [35.5] 大規模言語モデル (LLMs) に基づくマルチエージェントシステム (MAS) は、目覚ましい問題解決とタスク計画能力を示す。
我々は,MASの新しいセキュリティ研究フレームワークであるMASTERを紹介し,多様な役割構成とトポロジ的構造に着目した。
我々は,様々なシナリオにおけるMASレジリエンスを大幅に向上させる,対応する防衛戦略を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:24:29 GMT)
Partial Distribution Matching via Partial Wasserstein Adversarial Networks [35.5] 本稿では,2つの確率分布の整合性を求める基本的機械学習問題である分布マッチング(DM)問題について検討する。
提案手法は, 部分分布マッチング (PDM) と呼ばれる緩和された定式化に基づいており, 完全に一致するのではなく, 少数の分布に一致することを目指している。
実験結果から,提案したPWANは,最先端の手法と同等あるいは同等の精度で,極めて堅牢なマッチング結果が得られることが確認された。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:49:53 GMT)
Knowledge Grafting of Large Language Models [35.1] 大規模言語モデル(LLM)研究において,クロスキャパビリティ・トランスファーは重要な課題である。
FuseLLMやFuseChatといった最近の研究は、複数のモデル機能を軽量モデルに転送する可能性を実証している。
本稿では,SkillPackフォーマットのターゲットモデルにソースモデル機能を格納する新しい手法であるGraftLLMを紹介する。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:43:24 GMT)
From Output to Evaluation: Does Raw Instruction-Tuned Code LLMs Output Suffice for Fill-in-the-Middle Code Generation? [35.1] ファイリング・イン・ザ・ミドル(FIM)コード生成におけるLCMの自動評価には,後処理が不可欠である。
本研究では,LLM出力の処理後処理の必要性について検討する。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:06:47 GMT)
Benchmarking and Rethinking Knowledge Editing for Large Language Models [34.8] 知識編集は,Large Language Models (LLM)内での組み込み知識の更新を目的としている。
パラメータ修正や外部メモリ統合といった既存のアプローチは、しばしば不整合評価目標や実験的な設定に悩まされる。
本研究は、現在の知識編集手法の限界に対する新たな洞察を提供し、より堅牢な代替手段としてコンテキストベースの推論の可能性を強調する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:32:03 GMT)
BlackboxBench: A Comprehensive Benchmark of Black-box Adversarial Attacks [34.2] 適応的な例は、ディープニューラルネットワーク(DNN)の脆弱性を評価するためのよく知られたツールである。
モデルパラメータとアーキテクチャが攻撃者/評価者、すなわちブラックボックスの敵攻撃にはアクセスできないという現実的なシナリオでは、依然として難しい。
我々はBlackboxBenchと呼ばれるブラックボックス敵攻撃の総合的なベンチマークを構築することを目指している。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:18:58 GMT)
AFL: A Single-Round Analytic Approach for Federated Learning with Pre-trained Models [34.2] 本稿では,分析フェデレーション学習(AFL)を導入し,事前学習モデルを用いた解析的(クローズドフォーム)な解をフェデレーション学習(FL)に導入する。
私たちのAFLは、分析学習からインスピレーションを受けています -- ニューラルネットワークを1つの時代における分析ソリューションでトレーニングする、勾配のないテクニックです。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:11:54 GMT)
CMoE: Converting Mixture-of-Experts from Dense to Accelerate LLM Inference [33.9] CMoEは、高密度言語モデルをトレーニングなしで、ミックス・オブ・エキスパート(MoE)に迅速に変換するフレームワークである。
実験により、75%の活性化比で、パープレキシティの点で顕著な結果が得られることが示された。
パラメータの25%をアクティベートするCMoE構成は、追加のトレーニングなしで使用可能なパープレキシティを保ちながら、エンドツーエンドのレイテンシを1.5倍削減する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:54:15 GMT)
Chain-of-Scrutiny: Detecting Backdoor Attacks for Large Language Models [33.8] 大規模言語モデル(LLM)は、攻撃者が設定した特定の「トリガー」を含む入力が悪意ある出力を生成する。
従来の防衛戦略は、モデルアクセスの制限、高い計算コスト、データ要求のため、APIアクセス可能なLLMでは実用的ではない。
バックドア攻撃を緩和するために,LLMのユニークな推論能力を活用するChain-of-Scrutiny (CoS)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:51:07 GMT)
DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection [32.8] 効率的な適応モジュールのライブラリの構築とメンテナンスを目的としたフレームワークであるDitHubを紹介した。
Version Control SystemsにインスパイアされたDitHubは、専門家モジュールを必要に応じてフェッチしてマージ可能なブランチとして管理する。
本手法は,ODinW-13ベンチマークとODinW-Oを用いて,クラス再出現の評価を行う。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:52:23 GMT)
Exemplar-Free Continual Learning for State Space Models [32.7] State-Space Models (SSM) は構造化された再帰で長距離の依存関係をキャプチャする。
彼らの進化する内部状態は、継続的学習の下でそれらを適応する上で困難を生じさせる。
Inf-SSMを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:59:13 GMT)
From Mathematical Reasoning to Code: Generalization of Process Reward Models in Test-Time Scaling [32.7] プレトレーニングと報奨モデルトレーニング FLOP の相互作用について検討し,PRM の効率と精度への影響を評価する。
以上の結果から,数式データセットに基づいてトレーニングしたPRMは,コード生成に適した性能を示すことがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:44:15 GMT)
UI-R1: Enhancing Efficient Action Prediction of GUI Agents by Reinforcement Learning [31.8] UI-R1は、ルールベースのRLがGUIアクション予測タスクのためのマルチモーダル大言語モデル(MLLM)の推論能力をどのように向上するかを探求する最初のフレームワークである。
具体的には、UI-R1が新しいルールベースのアクション報酬を導入し、グループ相対ポリシー最適化(GRPO)のようなポリシーベースのアルゴリズムによるモデル最適化を可能にする。
効率的なトレーニングのために、モバイルデバイス上で5つの一般的なアクションタイプを含む136の課題タスクからなる、小さくて高品質なデータセットをキュレートする。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:46:08 GMT)
One Policy but Many Worlds: A Scalable Unified Policy for Versatile Humanoid Locomotion [31.5] 多様な地形をマスターする単一ポリシーを実現する統一的な枠組みを提案する。
オフラインデータ、拡散ベースの軌道、およびポリシー最適化を統合することで、DreamPolicyは"1つのタスク、1つのポリシー"ボトルネックを克服する。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:33:44 GMT)
How Particle System Theory Enhances Hypergraph Message Passing [30.8] ハイパーグラフは自然現象の高次関係を効果的にモデル化し、対接続を超えた複雑な相互作用をキャプチャする。
本稿では,ハイパーエッジが共有ノードダイナミクスを誘導する場として機能する,相互作用する粒子システムに触発された新しいハイパーグラフメッセージパッシングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:04:25 GMT)
TULUN: Transparent and Adaptable Low-resource Machine Translation [30.7] Tulunは、用語認識翻訳のための汎用的なソリューションである。
私たちのオープンソースのWebベースプラットフォームは、ユーザが簡単に用語リソースを作成し、編集し、活用することができます。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:58:58 GMT)
GainRAG: Preference Alignment in Retrieval-Augmented Generation through Gain Signal Synthesis [30.2] Retrieval-Augmented Generation (RAG)フレームワークは、検索モジュールを導入し、検索された情報を大きな言語モデル(LLM)の入力コンテキストに動的に注入する。
提案手法は,入力パスが正しい出力にどの程度寄与するかを計測する新たな指標である「ゲイン」を定義することで,レトリバーとLLMの好みを整合させる新しい手法であるGainRAGを提案する。
実験結果はGainRAGの有効性を6つのデータセットで検証した。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:14:57 GMT)
LiSTEN: Learning Soft Token Embeddings for Neural Audio LLMs [29.9] LiSTENは、大規模な言語モデルをオーディオ言語タスクに適用するためのフレームワークである。
提案手法は,大規模ASRやキャプションデータセットへの依存を低減し,トレーニング可能なパラメータの少ない競合性能を実現し,シングルステージプロセスによるトレーニングを簡略化する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:28:22 GMT)
Large Language Models based ASR Error Correction for Child Conversations [29.6] LLM(Large Language Models)は、ASR転写を改善することを約束している。
LLMはゼロショットのASR出力と微調整のCTCベースのASR出力の補正に有用である。
LLMが文脈情報を組み込む場合、ASRの性能を改善することは依然として困難である。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:25:08 GMT)
How Is LLM Reasoning Distracted by Irrelevant Context? An Analysis Using a Controlled Benchmark [29.1] 分散文脈をもつ小学校数学は、体系的に制御された文脈 (IC) に対するLarge Language Models (LLM) 推論を評価するためのベンチマークである。
実験の結果,LLMはICに非常に敏感であり,推理経路の選択と算術精度の両方に影響を及ぼすことがわかった。
本稿では,プロセス報酬モデルを用いて,配当条件下でのロバスト性を高めるステップワイズツリー探索を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:56:22 GMT)
Why Do Some Inputs Break Low-Bit LLM Quantization? [27.4] 低ビット重みのみの量子化は大きな言語モデル(LLM)のメモリフットプリントを大幅に削減する
我々は, 7B-70B から 7B-70B までの LLM 上の多種多様3-4 ビット法を解析し,FinWeb の例では, 50 組の手法の量子化誤差が強く相関している(約 0.82 )。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:17:50 GMT)
TNG-CLIP:Training-Time Negation Data Generation for Negation Awareness of CLIP [27.3] 視覚言語モデル(VLM)のための訓練時間否定データ生成パイプラインを導入する。
否定を含むプロンプト上でのテキスト・画像生成モデル評価のための最初のベンチマークNeg-TtoIを提案する。
提案手法であるTNG-CLIPは,画像対テキストマッチング,テキスト対画像検索,画像生成の様々な否定ベンチマークにおいてSOTA性能を実現する。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:02:48 GMT)
IRIS: Interactive Research Ideation System for Accelerating Scientific Discovery [27.2] IRISは、研究者が大規模言語モデル(LLM)を補助する科学的概念を活用するために設計されたオープンソースのプラットフォームである。
IRISは、モンテカルロ木探索(MCTS)による適応的なテスト時間計算拡張、きめ細かいフィードバック機構、クエリベースの文献合成など、アイデアを強化する革新的な機能を備えている。
我々は様々な分野の研究者とユーザスタディを行い、システムの有効性を検証し、アイデアの充実を図っている。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:40:05 GMT)
3D Visual Illusion Depth Estimation [27.2] 3次元視覚錯覚は、2次元平面を操作して3次元空間関係をシミュレートする知覚現象である。
本稿では,機械の視覚系が,単眼と両眼の深度推定を含む3次元視覚錯覚にひどく騙されていることを明らかにする。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:37:09 GMT)
LoTA-QAF: Lossless Ternary Adaptation for Quantization-Aware Fine-Tuning [27.1] リソース制約のあるエッジデバイスに大規模言語モデル(LLM)をデプロイするには、量子化と微調整が不可欠である。
微調整量子化モデルは、主に低精度量子化重みと高精度適応重みの間のデータ型におけるミスマッチから生じる重要な課題を示す。
LoTA-QAFは量子化LDM用に特別に設計された新しい微調整法である。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:47:28 GMT)
Fixing 7,400 Bugs for 1$: Cheap Crash-Site Program Repair [27.0] 本報告では, 事故現場の修復作業の簡易化を図るとともに, 被害発生リスクを軽減しつつ, 修復作業の簡易化を図っている。
大規模言語モデル(LLM)のトークンコストを大幅に削減するテンプレート誘導型パッチ生成手法を提案する。
以上の結果から,トップパフォーマンスエージェントであるCodeRover-Sと組み合わせることで,トークンコストを45.9%削減し,ARVO上でのバグフィックス率を73.5%(+29.6%)に向上させることができた。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:48:30 GMT)
ManipLVM-R1: Reinforcement Learning for Reasoning in Embodied Manipulation with Large Vision-Language Models [27.0] LVLM(Large Vision-Language Models)は近年,視覚をシーン認識や言語に活用してロボット操作を進化させた。
本稿では,従来の指導をRLVR(Verifiable Rewards)を用いた強化学習に置き換える新しい強化学習フレームワークであるManipLVM-R1を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:44:27 GMT)
You Can Wash Hands Better: Accurate Daily Handwashing Assessment with a Smartwatch [26.6] スマートウォッチを利用したハンドウォッシング手順評価のためのウェアラブルソリューションであるUWashを提案する。
我々は,ハンドウォッシング評価のタスクを,コンピュータビジョンと同様のアクションセグメンテーション問題とする。
51名の被験者による実験では、手洗いジェスチャー認識におけるUWash 92.27%の精度が示されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:43:30 GMT)
Efficient Long CoT Reasoning in Small Language Models [26.6] 小さな言語モデル(SLM)を直接トレーニングして、長いチェーン・オブ・シークレット(CoT)推論ステップを創出することは困難である。
提案手法では, 不要なステップを長いCoTで実行し, 有効かつ有用なCoTトレーニングデータをキュレートするために, SLM自体の法則を用いる。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:22:52 GMT)
Quantum simulation of elastic wave equations via Schrödingerisation [26.5] シュル・オジンジェライゼーション法を用いた弾性波動方程式の量子シミュレーションアルゴリズムについて検討した。
等方性媒質中の速度-応力方程式について、スペクトル法と組み合わせてシュル・オーディンジェライゼーション(Schr"odingerization)による外部強制下での対称行列形式について検討する。
波動変位方程式では、これを双曲系に変換し、スペクトル法と中央差分法で離散化するシュル"オーダライゼーション法を適用する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:16:39 GMT)
DiagnosisArena: Benchmarking Diagnostic Reasoning for Large Language Models [25.1] diagnosisArenaは、専門レベルの診断能力の厳格な評価のために設計されたベンチマークである。
診断アリーナは1,113組のセグメンテーション患者と、28の専門専門医からなる。
我々の研究では、最も先進的な推論モデルであるo3-mini、o1、DeepSeek-R1でさえ、それぞれ45.82%、31.09%、17.79%の精度しか達成していないことが明らかになった。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:44:04 GMT)
MADCAT: Combating Malware Detection Under Concept Drift with Test-Time Adaptation [25.1] 我々は,マルウェア検出における概念ドリフト問題に対処するために,自己教師型アプローチであるMADCATを提案する。
MADCATはエンコーダ-デコーダアーキテクチャを採用し、テストタイムデータの小さなバランスの取れたサブセット上で、エンコーダのテストタイムトレーニングで動作する。
連続Androidマルウェア検出設定におけるMADCATの有効性を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:14:02 GMT)
Generating Full-field Evolution of Physical Dynamics from Irregular Sparse Observations [25.0] 不規則なスパース観測から物理力学のフルフィールド進化を生成する新しいフレームワークである関数タッカー空間における逐次拡散について述べる。
本研究では, 復元精度と計算効率の両面で, 最先端の手法と比較して有意な改善が認められた。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:32:06 GMT)
Marginal Fairness: Fair Decision-Making under Risk Measures [25.0] 本稿では,保護属性の存在下での公平な意思決定のための新しい個人的公正概念である限界公正について紹介する。
我々は、高度に規制された産業(保険や金融など)におけるビジネス意思決定を2段階のプロセスとしてモデル化する。
自己保険データセットを用いた数値的研究と経験的実装は、このフレームワークを実際にどのように適用できるかを実証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:44:35 GMT)
Toward Malicious Clients Detection in Federated Learning [24.7] フェデレートラーニング(FL)は、複数のクライアントが生データを共有せずに、グローバルな機械学習モデルを協調的にトレーニングすることを可能にする。
本稿では,FL内の悪意のあるクライアントを正確に識別する新しいアルゴリズムであるSafeFLを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:14:35 GMT)
Meta Pruning via Graph Metanetworks : A Meta Learning Framework for Network Pruning [24.5] ニューラルネットワークをプルークニューラルネットワークに利用する"新しいアプローチを提案する。
メタネットワーク(Metanetwork)は、別のネットワークを入力とし、修正されたネットワークを出力として生成するネットワークである。
我々はプルーニング戦略を学習するメタネットワークをトレーニングし、プーンしにくいネットワークをプーンし易い別のネットワークに変換することができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:22:34 GMT)
SEW: Self-Evolving Agentic Workflows for Automated Code Generation [24.2] textbfSelf-textbfEvolving textbfSEW(textbfSEW)を提案する。
当社のSEWは,エージェントを自動設計し,自己進化を通じて最適化することが可能で,LiveCodeBenchの33%の改善を実現しています。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:12:14 GMT)
Self-Supervised Evolution Operator Learning for High-Dimensional Dynamical Systems [24.0] 非スケールな力学系の進化演算子を学習するためのエンコーダのみのアプローチを導入する。
ホストサイトの小さなタンパク質の折りたたみ力学を説明し、気候データのパターンを自律的に発見する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:18:19 GMT)
Writing Like the Best: Exemplar-Based Expository Text Generation [23.6] 類似トピックの例を用いて,新しいトピックの例示テキストを生成することを目的とした,例示テキスト生成タスクを導入する。
現在の手法は、広範囲な模範データへの依存、トピック固有のコンテンツへの適応の難しさ、長文コヒーレンスの問題により、不足している。
本稿では,適応模倣の概念を提案し,新しい計画適応フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:40:39 GMT)
LLaVA-ReID: Selective Multi-image Questioner for Interactive Person Re-Identification [23.6] 対話型人物再識別(Inter-ReID)という新しいタスクを導入する。
Inter-ReIDは対話に基づく検索タスクであり、目撃者との対話を通じて初期記述を反復的に洗練する。
LLaVA-ReIDは,視覚的およびテキスト的コンテキストに基づいて,対象とする質問を生成する質問モデルである。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:19:27 GMT)
Neural Solver Selection for Combinatorial Optimization [23.4] 本稿では,特徴抽出,選択モデル,選択戦略を含むニューラルソルバのコーディネートを行うための,最初の汎用フレームワークを提案する。
提案するフレームワークは,インスタンスを効果的に分散し,結果として得られる複合解法により性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:56:40 GMT)
Asynchronous Approximate Agreement with Quadratic Communication [23.3] 非同期ネットワークは$n$のメッセージ送信パーティで、そのうちの最大$t$はビザンチンです。
Abraham, Amit and Dolev [OPODIS '04] はこの問題を最適なレジリエンス $t fracn3$ で $mathbbR$ で解く。
これは、信頼できるブロードキャスト毎に$Theta(n2)$メッセージ、またはイテレーション毎に$Theta(n3)$メッセージを取る。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:48:26 GMT)
AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting [23.0] AdaCtrlは、難しい適応推論の予算配分をサポートする新しいフレームワークである。
自己評価問題難易度に基づいて推論長を動的に調整する。
AdaCtrlは、推論予算の正確なユーザコントロールを可能にし、特定のニーズを満たすように調整されたレスポンスを可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:46:50 GMT)
PromptWise: Online Learning for Cost-Aware Prompt Assignment in Generative Models [22.7] 本稿では,大規模な言語モデル群に一連のプロンプトを割り当てるオンライン学習フレームワークPromptWiseを紹介する。
PromptWiseはまず、より安価なモデルを戦略的にクエリし、低コストモデルが与えられたプロンプトに適切に対応できない場合にのみ、より高価なオプションに進化する。
結果は、PromptWiseがコストを意識しないベースラインメソッドを一貫して上回っていることを浮き彫りにした。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:26:33 GMT)
Invisible Tokens, Visible Bills: The Urgent Need to Audit Hidden Operations in Opaque LLM Services [22.7] このポジションペーパーは、Opaque LLM Services(COLS)における新たな説明責任の課題を浮き彫りにしている。
トークンとコールカウントを人工的に膨らませるtextitquantity inflationと、プロバイダが低価格のモデルやツールを静かに置き換えるtextitquality downgradeの2つの主要なリスクを形式化する。
本研究では,COLSとユーザを対象としたモジュール型3層監査フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:26:49 GMT)
TK-Mamba: Marrying KAN with Mamba for Text-Driven 3D Medical Image Segmentation [22.6] 3次元画像分割は臨床診断と治療に不可欠である。
CNNやTransformerのような従来の単一モダリティネットワークは、計算の非効率性と制約付きコンテキストモデリングによって制限されることが多い。
本稿では,Mamba と Kolmogorov-Arnold Networks (KAN) を長周期モデリングのための効率的なバックボーンとして活用する,新しいマルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:41:55 GMT)
"Hello, is this Anna?": Unpacking the Lifecycle of Pig-Butchering Scams [22.3] 豚肉の密売詐欺は、ロマンス、投資詐欺、高度な社会工学戦術の要素を組み合わせた複雑な詐欺として現れている。
豚肉密売詐欺の質的分析を,N=26$の被害者との詳細な半構造化インタビューで行った。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:36:41 GMT)
Don't Look Only Once: Towards Multimodal Interactive Reasoning with Selective Visual Revisitation [22.3] MLLM(Multimodal Large Language Models)の軽量拡張であるv1を提案する。
v1は単純なポイントアンドコピー機構を導入し、推論プロセスを通してモデルが関連する画像領域を動的に検索できるようにする。
この結果から,動的視覚アクセスはマルチモーダル推論の高速化に有望な方向であることが示唆された。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:30:47 GMT)
Reward-Driven Interaction: Enhancing Proactive Dialogue Agents through User Satisfaction Prediction [22.1] 本稿では,ユーザの発話の表現学習を改善するための2つの補助的タスクと,ユーザの満足度を予測するセッションを提案する。
提案手法はDuerOS上で評価され、希少なユーザ発話や長い尾領域における誤り認識の精度が大幅に向上した。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:01:30 GMT)
Response Uncertainty and Probe Modeling: Two Sides of the Same Coin in LLM Interpretability? [21.8] 本研究は,LLMの生成した応答と内部特徴空間の両方の特性を反映した,そのようなデータセットにおけるプローブ性能の仮説である。
改良されたプローブ性能は、応答の不確実性の低減に一貫して対応している。
以上の結果から,LLM応答のばらつきは重要な特徴の集合に大きく関連していることが示唆された。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:37:12 GMT)
K-Paths: Reasoning over Graph Paths for Drug Repurposing and Drug Interaction Prediction [21.7] K-Pathsは、密度の高いバイオメディカル知識グラフから構造化され、多様性があり、生物学的に意味のあるマルチホップパスを抽出する、モデルに依存しない検索フレームワークである。
これらの経路は、保存されていない薬物・薬物・消毒相互作用の予測を可能にする。
実験によると、K-Pathsは最先端の言語モデル間でゼロショット推論を改善する。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:42:16 GMT)
NoveltyBench: Evaluating Language Models for Humanlike Diversity [21.6] NoveltyBenchは、言語モデルが複数の異なる高品質な出力を生成する能力を評価するために設計されたベンチマークである。
我々は20の指導的言語モデルを評価し、現在の最先端システムは人間の書き手よりも著しく多様性が低いことを発見した。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:02:37 GMT)
HARP: Hesitation-Aware Reframing in Transformer Inference Pass [21.6] HARPは,トランスフォーマーフォワードパスの「オフザシェルフ」に対する簡単な修正である。
Harpは、モデルが不確実性に遭遇した場合に、追加の計算を選択的に適用する。
様々なダウンストリームタスクやモデルサイズにまたがる手法を評価し,性能改善を+5.16%まで示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:21:48 GMT)
MAVL: A Multilingual Audio-Video Lyrics Dataset for Animated Song Translation [21.5] 歌声翻訳のためのマルチリンガル・マルチモーダル・ベンチマークであるMAVL(Multilingual Audio-Video Lyrics Benchmark for Animated Song Translation)を紹介する。
本稿では,Syllable-Constrained Audio-Video LLM with Chain-of-Thought SylAVL-CoTを提案する。
実験結果から,SylAVL-CoTはテキストベースモデルよりも歌声性や文脈精度が優れていた。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:28:09 GMT)
On the Limitations and Possibilities of Nash Regret Minimization in Zero-Sum Matrix Games under Noisy Feedback [21.3] ナッシュ後悔(Nash regret)とは、プレイヤーの合計報酬と、タイムホライズによってスケールされたゲームのナッシュ平衡値との差である。
我々は,行プレーヤが行列全体のノイズフィードバックを受信した場合でも,標準アルゴリズムがNashを後悔していることを示す。
一般的な$n times m$行列ゲームに対して、インスタンス依存の$textpolylog(T)$ Nash regretを達成するアルゴリズムを提示する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:53:41 GMT)
VISTANet: VIsual Spoken Textual Additive Net for Interpretable Multimodal Emotion Recognition [21.2] 本稿では、VISTANet(Visual Textual Additive Net)というマルチモーダル感情認識システムを提案する。
K-Average Additive exPlanation (KAAP) と呼ばれる新しい解釈可能性技術が開発され、視覚的、音声的、テキスト的特徴を識別する。
VISTANetは、IIT-R MMEmoRecデータセットで全体の感情認識精度が80.11%に達した。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:18:28 GMT)
OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data [21.0] 大規模拡散変換器(DiT)を利用した汎用一貫性プラグインであるbftextConsistency OmniConsistencyを提案する。
実験により、OmniConsistencyは視覚的コヒーレンスと美的品質を著しく向上させ、商用の最先端モデルであるGPT-4oに匹敵する性能を達成することが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:00:20 GMT)
BTC-LLM: Efficient Sub-1-Bit LLM Quantization via Learnable Transformation and Binary Codebook [20.9] 本稿では,新しいサブ1ビット大規模言語モデル(LLM)の量子化フレームワークであるBTC-LLMを提案する。
提案手法は,(1)非可逆スケーリングと回転を最適化し,二項化重みを完全精度分布に整合させる学習可能な変換,(2)繰り返し発生するバイナリベクトルクラスタを識別するFlashおよび精度の高いバイナリコードブックである。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:57:19 GMT)
Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning [20.8] Token Internal Position Awareness (TIPA) は、トークン内の文字位置をキャプチャするモデルの能力を大幅に改善する手法である。
TIPAは、大きな言語モデルにおける位置予測精度を高め、元のテキストにおけるターゲット文字のより正確な識別を可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:06:42 GMT)
How to Upscale Neural Networks with Scaling Law? A Survey and Practical Guidelines [20.6] 初期の研究では、モデル性能におけるパワー-ロー関係が確立され、計算-最適スケーリング戦略が導かれた。
スパースモデル、Mix-of-Experts、検索強化学習、マルチモーダルモデルは、しばしば伝統的なスケーリングパターンから逸脱する。
スケーリングの振る舞いは、視覚、強化学習、微調整といった領域によって異なり、よりニュアンスなアプローチの必要性が強調されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:19:41 GMT)
Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.3] 変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:57:21 GMT)
Data Overvaluation Attack and Truthful Data Valuation in Federated Learning [20.0] 本稿では,データ過大評価攻撃を導入し,戦略的クライアントがフェデレート学習においてデータを著しく過大評価することを可能にする。
本稿では,真正データ評価尺度であるTrath-Shapleyを提案する。
実験では,既存のデータ評価指標の脆弱性を攻撃提案に適用し,Trth-Shapleyの堅牢性と有効性を検証した。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:47:07 GMT)
On the Structure and Semantics of Identifier Names Containing Closed Syntactic Category Words [19.9] 本稿では,文法パターンの概念を拡張した識別子名の言語構造について検討する。
ソフトウェア工学では滅多に研究されない、クローズドな構文カテゴリーに焦点が当てられている。
閉圏文法パターンとプログラム行動の関係を解析した。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:58:50 GMT)
Unraveling Misinformation Propagation in LLM Reasoning [19.9] 大規模言語モデルの推論過程において,誤情報がどのように伝播するかを示す。
推論過程の早い段階で事実訂正を適用することは、誤情報伝達を効果的に減少させる。
我々の研究は誤情報伝達を緩和するための実践的なアプローチを提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:45:45 GMT)
Audio Geolocation: A Natural Sounds Benchmark [19.5] 我々は,iNatSoundsデータセットからの野生生物のオーディオを用いて,グローバルなオーディオ位置情報の課題に取り組み,問題を形式化し,詳細な分析を行う。
視覚に触発されたアプローチを採用することで、音声記録をスペクトログラムに変換し、既存の画像位置決め手法をベンチマークする。
我々の研究は、オーディオと視覚的手がかりを統合する利点を強調し、将来のオーディオ測地研究の舞台となる。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:49:49 GMT)
ThinkRec: Thinking-based recommendation via LLM [19.4] ThinkRec は LLM4Rec を System 1 から System 2 (レーショナルシステム) に移行する思考ベースのフレームワークである。
ThinkRecは、キーワードの要約でアイテムメタデータを拡張し、合成推論トレースを注入するシンクアクティベーションメカニズムを導入している。
ThinkRecは、ユーザの潜在機能に基づいて専門家モデルに重みを動的に割り当てることで、個々のユーザへの推論パスを適応させ、精度とパーソナライゼーションを向上させる。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:29:52 GMT)
Exploring the Limits of Vision-Language-Action Manipulations in Cross-task Generalization [19.3] AGNOSTOSは、操作においてクロスタスクゼロショットの一般化を厳格に評価するために設計された新しいシミュレーションベンチマークである。
X-ICMは、コンテキスト内デモで大きな言語モデルを条件付け、目に見えないタスクに対するアクションシーケンスを予測する手法である。
我々はAGNOSTOSとX-ICMが汎用的なロボット操作を促進する貴重なツールになると信じている。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:33:43 GMT)
COPA: Comparing the incomparable in multi-objective model evaluation [19.1] 目的をどう比較し、集約し、そして最終的にトレードオフする方法は、通常、時間を要する作業です。
相対的なランキングで近似したCDFを用いて目的を比較検討する。
結果として、ユーザ固有の好みにマッチしながら、それらを集約することができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:46:13 GMT)
Message-Passing State-Space Models: Improving Graph Learning with Modern Sequence Modeling [19.1] 我々は、メッセージパッシングニューラルネットワークフレームワークに直接、現代のSSMの鍵となる原則を組み込むことによって、新しい視点を導入する。
我々は,MP-SSMを用いて,メッセージパッシングのアーキテクチャ的単純さを保ちながら,効率よく,順列同変かつ長距離情報伝達を可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:53:07 GMT)
Signal, Image, or Symbolic: Exploring the Best Input Representation for Electrocardiogram-Language Models Through a Unified Framework [19.0] 大型言語モデル(LLM)は心電図(ECG)の解釈に応用されている。
心電図-言語モデル(ELMs)は、専門の心電気生理学者をエミュレートし、診断を発行し、波形形態を分析し、寄与要因を特定し、患者固有の行動計画を提案する。
6つの公開データセットと5つの評価指標にまたがる、これらのモダリティに関する最初の包括的なベンチマークを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:43:15 GMT)
Exploring the Vulnerability of the Content Moderation Guardrail in Large Language Models via Intent Manipulation [18.4] 本研究では,意図認識型ガードレールの脆弱性を調査し,大規模言語モデルが暗黙の意図検出能力を示すことを示す。
IntentPromptという2段階のインテントベースのプロンプトリファインメントフレームワークを提案し、まず有害な問い合わせを構造化されたアウトラインに変換し、さらに宣言的なスタイルの物語に再構成する。
われわれのフレームワークは、最先端のジェイルブレイク手法を一貫して上回り、さらに高度なIntent Analysis(IA)とChain-of-Thought(CoT)ベースの防御を回避している。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:47:32 GMT)
PM-KVQ: Progressive Mixed-precision KV Cache Quantization for Long-CoT LLMs [18.3] トレーニング後のKVキャッシュ量子化は、有望な圧縮技術として登場した。
既存のメソッドは、利用可能なメモリを適切に活用できない。
短いコンテキストのキャリブレーションでは、キーキャッシュ内の頻度の低いチャネルの分散を考慮できません。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:18:11 GMT)
A General Knowledge Injection Framework for ICD Coding [18.1] GKI-ICDは、ICD記述(ICD Description)、ICD同期(ICD Synonym)、ICD階層(ICD Hierarchy)という3つの重要な種類の知識を統合する、新しい一般的な知識注入フレームワークである。
相違点と相補点の両方を示す上記の知識を包括的に活用することで、ICD符号化性能を効果的に向上させることができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:57:56 GMT)
Does Reasoning Introduce Bias? A Study of Social Bias Evaluation and Mitigation in LLM Reasoning [17.9] 大規模言語モデル(LLM)における社会的偏見の最初の体系的評価について述べる。
偏りのある推論ステップが誤った予測とどのように相関しているかを定量化し、しばしばステレオタイプ表現につながる。
本稿では,モデル予測の変化を追跡することでバイアスを検出する軽量緩和法であるBias Proxy (ADBP)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:46:14 GMT)
Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach [17.6] 大規模言語モデル(LLM)は、通常、同じプロンプトを与えられたすべてのユーザに対して、同一または類似の応答を生成する。
PENGUINは、7つのセンシティブなドメインにわたる14,000のシナリオからなるベンチマークである。
RAISEはトレーニングなし、2段階のエージェントフレームワークで、ユーザ固有のバックグラウンドを戦略的に取得する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:37:10 GMT)
Neural Parameter Search for Slimmer Fine-Tuned Models and Better Transfer [17.5] 微調整されたモデルは、しばしば特定のドメインの外で苦労し、かなりの冗長性を示す。
近年の研究では、プルーニングされた微調整モデルと元の事前学習モデルを組み合わせることで、タスク間でモデルパラメータをマージする際の干渉を軽減することが示唆されている。
微調整モデルのスリム化のためのニューラル・プルーニング(NPS-Pruning)という新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:27:20 GMT)
Rethinking Causal Mask Attention for Vision-Language Inference [17.5] 本研究では,異なる因果マスキング戦略が視覚言語推論にどのように影響するかを検討する。
我々は,この設定に適した今後の注目の家族を提案する。
将来的な意味的コンテキストを過去の表現に選択的に圧縮することは推論に有効であることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:59:28 GMT)
MENTOR: Mixture-of-Experts Network with Task-Oriented Perturbation for Visual Reinforcement Learning [17.4] 視覚深部強化学習(RL)は、ロボットが非構造化タスクの視覚入力からスキルを習得することを可能にする。
本稿では,RLエージェントのアーキテクチャと最適化の両方を改善する手法であるMENTORを提案する。
MenTORは3つのシミュレーションベンチマークで最先端の手法を上回り、挑戦的な3つの現実世界のロボット操作タスクで平均83%の成功率を達成した。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:36:24 GMT)
Combating Concept Drift with Explanatory Detection and Adaptation for Android Malware Classification [17.4] DREAMはドリフトの検出を改善し、説明適応プロセスを確立する新しいシステムである。
評価の結果,DREAMはドリフト検出精度を効果的に向上し,適応における専門家分析の労力を削減できることがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:42:02 GMT)
Beyond Masked and Unmasked: Discrete Diffusion Models via Partial Masking [17.4] マスケード拡散モデル(MDM)は、離散データのための強力な生成モデルであり、段階的にトークンを配列で解き放つことでサンプルを生成する。
本稿では、トークンがマスクされた状態とマスクされていない状態の間を中間状態にすることでMDMを増強する部分マスキングスキーム(Prime)を提案する。
本手法は,多種多様な生成モデルタスクに対して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:16:40 GMT)
A Study of Semi-Fungible Token based Wi-Fi Access Control [17.4] 現在のWi-Fi認証手法は、セキュリティの不足、ユーザーのプライバシーの漏洩、管理コストの高騰、請求の難しさといった問題に直面している。
これらの課題に対処するため、ブロックチェーンスマートコントラクトに基づくWi-Fiアクセス制御ソリューションが提案されている。
セミファンジブルWi-Fiトークン(SFWT)は、ユーザがWi-Fiにアクセスするための認証としてERC1155トークン標準を用いて設計されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:29:59 GMT)
Representation Learning with Mutual Influence of Modalities for Node Classification in Multi-Modal Heterogeneous Networks [16.7] 我々は、HGNN-IMA(Inter-Modal Attention)を用いた異種グラフニューラルネットワーク(Herogeneous Graph Neural Network)という、MMHNにおけるノード分類の新しいモデルを提案する。
本稿では,HGNN-IMA (Herogeneous Graph Neural Network with Inter-Modal Attention) と呼ばれるMMHNのノード分類モデルを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:02:02 GMT)
Joint-stochastic-approximation Autoencoders with Application to Semi-supervised Learning [16.6] 深層指向生成モデル構築のための新しいアルゴリズム群であるJSAオートエンコーダを提案する。
JSA学習アルゴリズムは、データログ類似性を直接最大化し、後部モデルと推論モデルとの間の包括的KL分散を同時に最小化する。
半教師付きタスクにおいて、離散潜在空間を持つJSAオートエンコーダは、連続潜在空間を持つ他の最先端DGMと同等の性能を発揮することを実証的に示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:52:23 GMT)
DAL: A Practical Prior-Free Black-Box Framework for Non-Stationary Bandit Environments [16.6] 非定常的包帯の問題に対して,検出強化学習(DAL)と呼ばれる実用的なブラックボックスフレームワークを導入する。
DALはモジュラーであり、任意の固定帯域アルゴリズムを入力として受け入れ、変更検出器で拡張する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:50:39 GMT)
Guarding Graph Neural Networks for Unsupervised Graph Anomaly Detection [16.5] 教師なしグラフ異常検出は、ラベルを使わずにグラフの多数から逸脱する稀なパターンを特定することを目的としている。
近年,グラフニューラルネットワーク(GNN)を用いて効率的なノード表現を学習している。
教師なしグラフ異常検出(G3AD)のためのグラフニューラルネットワークのガードフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:04:26 GMT)
ChartGalaxy: A Dataset for Infographic Chart Understanding and Generation [16.5] インフォグラフィックチャートの理解を促進するために設計された100万規模のデータセットであるChartGalaxyを紹介する。
データセットは、実際のインフォグラフィックチャートから75のチャートタイプ、330のチャートバリエーション、68のテンプレートを識別するインダクティブプロセスによって構築される。
1)微調整によるインフォグラフィックチャート理解の改善,2)インフォグラフィックチャートのベンチマークコード生成,3)インフォグラフィックチャート生成の実現。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:06:22 GMT)
Mind The Gap: Deep Learning Doesn't Learn Deeply [16.3] 本稿では,ニューラルネットワークが2つの疑問に対処してアルゴリズム推論をどのように学習するかを理解することを目的とする。
ニューラルネットワークが効果的なアルゴリズムを学習できないのはなぜなのか?
論文参考訳(メタデータ) (Sat, 24 May 2025 10:11:36 GMT)
Algorithmic Language Models with Neurally Compiled Libraries [16.3] 大規模言語モデルには真のアルゴリズム能力がない。
本稿では,基本的な操作と高度な微分可能プログラムのライブラリによるLLMの拡張を提案する。
微分可能なコンピュータを用いたLLaMA3の拡張可能性について検討する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:33:15 GMT)
Little Data, Big Impact: Privacy-Aware Visual Language Models via Minimal Tuning [16.3] 我々は、最先端のビジュアル・アズ・ランゲージ・モデル(VLM)を評価し、視覚的プライバシの理解における限界を特定する。
これを解決するために,PrivBench-HとPrivTuneという2つのコンパクトで高品質なベンチマークを導入する。
我々は、GPT-4を越えながら、他のタスクの強い性能を維持しながら、全てのベンチマークで実質的なゲインを得る。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:11:24 GMT)
Demonstration Selection for In-Context Learning via Reinforcement Learning [16.1] Relevance-Diversity Enhanced Selection (RDES)は、多様な参照デモの選択を最適化するための革新的なアプローチである。
RDESはQ-learningのようなフレームワークとPPOベースの変種を使用して、多様性を最大化するデモを動的に識別する。
RDESは10基のベースラインに比べて性能を著しく向上することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:53:24 GMT)
USDC: A Dataset of $\underline{U}$ser $\underline{S}$tance and $\underline{D}$ogmatism in Long $\underline{C}$onversations [15.9] 我々は,USDC と呼ばれる 764 の長いマルチユーザ Reddit 会話スレッドにおいて,ユーザの意見のゆらぎを研究するデータセットを構築した。
USDCには2つのタスクのアノテーションが含まれている。
我々は、アノテーションプロセスを自動化するために、Mistral LargeとGPT-4のゼロショット、ワンショット、および少数ショットアノテーションの多数投票を利用する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:20:20 GMT)
KerZOO: Kernel Function Informed Zeroth-Order Optimization for Accurate and Accelerated LLM Fine-Tuning [15.8] 本稿では,勾配推定バイアスの軽減を目的としたカーネル関数ベースのZOフレームワークを提案する。
KerZOOは既存のZOベースラインと同等または優れたパフォーマンスを実現している。
本稿では,カーネル関数がZO法における推定バイアスの低減に有効な方法であることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:56:03 GMT)
Preserving AUC Fairness in Learning with Noisy Protected Groups [15.8] ROC曲線のエリア(AUC)は、特にクラス不均衡の下での分類において重要な指標である。
本研究では, 公正性理論的保証を有する雑音保護群の下でのAUCフェアネスの最初の頑健なアプローチを提案する。
提案手法は, AUCの公正性を維持するための最先端手法よりも優れている。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:50:44 GMT)
How to build a consistency model: Learning flow maps via self-distillation [15.5] 本稿では,フローと拡散モデルに関連するフローマップを学習するための体系的なアプローチを提案する。
本研究では,連続時間流の速度場と流れ図の瞬時変化率の関係を生かした。
本稿では,既存の蒸留方式を自己蒸留による直接訓練アルゴリズムに変換する方法について述べる。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:50:50 GMT)
Efficient and Workload-Aware LLM Serving via Runtime Layer Swapping and KV Cache Resizing [15.4] MorphServeは、形態的適応に基づくワークロード対応LLMサービスフレームワークである。
平均的なSLO違反を92.45パーセント削減し、P95 TTFTレイテンシをフル精度サービスと比較して2.2x-3.9倍改善する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:12:31 GMT)
Mitigating Deceptive Alignment via Self-Monitoring [15.4] 我々は,CoT Monitor+という,自己監視をチェーン・オブ・シントプロセス自体に組み込むフレームワークを開発した。
生成中、モデルは(i)通常の推論ステップを生成し、(ii)不整合戦略のフラグと抑制のために訓練された内部自己評価信号を生成する。
この信号は強化学習の補助的な報酬として使われ、正直な推論に報いるフィードバックループを作成し、隠れた目標を阻止する。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:41:47 GMT)
Rethinking Direct Preference Optimization in Diffusion Models [15.4] 拡散に基づく選好最適化を改良する新しい手法を提案する。
まず、凍結参照モデルを緩和し、探索を促進する安定した参照モデル更新戦略を導入する。
第2に、タイムステップ間の報酬スケール不均衡問題を緩和するタイムステップ対応トレーニング戦略を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:14:45 GMT)
RASMALAI: Resources for Adaptive Speech Modeling in Indian Languages with Accents and Intonations [15.2] 本稿では,リッチテキスト記述を伴う大規模音声データセットであるRASMALAIを紹介する。
IndicParlerTTSは,インド語に対する初のオープンソースのテキスト記述誘導型TTSである。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:16:14 GMT)
SD-OVON: A Semantics-aware Dataset and Benchmark Generation Pipeline for Open-Vocabulary Object Navigation in Dynamic Scenes [15.2] 動的シーンにおけるオープン語彙オブジェクトナビゲーションのためのセマンティックス対応データセットとベンチマーク生成パイプライン(SD-OVON)を提案する。
事前訓練されたマルチモーダル基礎モデルを用いて、現実のセマンティクスと日々のコモンセンスに準拠した無限のフォトリアリスティックシーンの変種を生成し、ナビゲーションエージェントの訓練と評価を行う。
オープン語彙オブジェクトナビゲーションタスクの約3kと10kのエピソードから構成されるSD-OVON-3kとSD-OVON-10kの2つの事前生成オブジェクトナビゲーションタスクデータセットを提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:37:06 GMT)
TabICL: A Tabular Foundation Model for In-Context Learning on Large Data [15.1] 最大60Kサンプルの合成データセットを事前学習した表層ベースモデルであるTabICLを導入する。
TALENTベンチマークから200を越える分類データセットのうち、TabICLはTabPFNv2と同等であり、体系的に高速(最大10倍)である。
10K以上のサンプルを持つ53のデータセットで、TabICLはTabPFNv2とCatBoostを上回り、大規模データに対するICLの可能性を示している。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:05:47 GMT)
Generative RLHF-V: Learning Principles from Multi-modal Human Preference [15.1] 我々は、GRMとマルチモーダルRLHFを統合する新しいアライメントフレームワーク、Generative RLHF-Vを紹介する。
RL$の2段階のパイプラインを提案する: $textbfmulti-modalgenerative reward Modeling from RL$, そこでは、RLがGRMを誘導し、人間の意図を積極的に捉え、正しいペアワイズスコアを予測する。
我々のフレームワークは7つのベンチマークで4つのMLLMのパフォーマンスを18.1%$で改善し、ベースラインのRLHFは5.3%$でしかない。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:50:07 GMT)
High-order Equivariant Flow Matching for Density Functional Theory Hamiltonian Prediction [15.0] 深層学習の手法は ハミルトン人を直接予測することで このステップをバイパスする方法として 注目を集めています
分子幾何学に基づくハミルトン行列を生成する高次同変フローマッチングフレームワークQHFlowを提案する。
フローマッチングモデルは単純な先行点と複雑な対象点の間の連続時間軌道をモデル化し、直接回帰ではなくハミルトン分布上の構造的分布を学習する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:23:28 GMT)
L2RSI: Cross-view LiDAR-based Place Recognition for Large-scale Urban Scenes via Remote Sensing Imagery [14.9] 従来の3Dマップのコストと時間を要するLiDARによる位置認識の課題に対処する。
高分解能リモートセンシング画像を用いたLiDAR位置認識のための新しい手法L2RSIを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:11:57 GMT)
GAPrompt: Geometry-Aware Point Cloud Prompt for 3D Vision Model [14.8] 本稿では,3次元視覚モデルの適応性を高めるため,新しいGeometry-Aware Point Cloud Prompt (GAPrompt)を提案する。
まず、元の点雲と共に補助的な入力として機能する点プロンプトを導入し、そのモデルにきめ細かな幾何学的詳細を捉えるよう指示する。
また、点雲から大域的な形状情報を抽出し、入力レベルでのインスタンス固有の幾何調整を可能にするポイントシフトプロンプタを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:24:04 GMT)
ALPS: Attention Localization and Pruning Strategy for Efficient Alignment of Large Language Models [14.7] 本稿では,最もタスクに敏感なアテンションヘッドをローカライズし,これらのヘッドに対するアテンショントレーニングの更新を制限したアルゴリズムを提案する。
実験結果から,本手法は3つのタスクのベースライン上でのテキストbf2%の性能向上を実現しつつ,微調整中の注目パラメータの10パーセントのみを有効化できることがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:19:34 GMT)
CLaDMoP: Learning Transferrable Models from Successful Clinical Trials via LLMs [14.1] CLaDMoPは,臨床治験結果予測のための新しい事前学習手法である。
CLaDMoPは、新しい多層核融合技術により、試験の適性基準を軽量な薬物分子分岐にリンクする。
CLaDMoPはPR-AUCを最大10.5%改善し、OC-AUCを3.6%改善し、MEXA-CTPに匹敵するF1スコアを得た。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:45:32 GMT)
VLA-RL: Towards Masterful and General Robotic Manipulation with Scalable Reinforcement Learning [14.1] VLA-RLは、オンライン収集データをテスト時に改善する探索ベースのフレームワークである。
自動抽出タスクセグメントにアノテートされた擬似報酬ラベルに基づいてトレーニングされたロボットプロセス報酬モデルとして、事前学習された視覚言語モデルを微調整する。
VLA-RLにより、OpenVLA-7BはLIBEROの40の挑戦的なロボット操作タスクにおいて、最強の微調整ベースラインを4.5%超えることができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:42:51 GMT)
Voice of a Continent: Mapping Africa's Speech Technology Frontier [14.1] アフリカの豊かな言語多様性は、音声技術では著しく不足している。
我々は、複数のアフリカの言語と音声タスクにまたがって最先端のパフォーマンスを実現するため、Simbaファミリのモデルを紹介した。
我々の研究は、アフリカの言語多様性を反映した拡張された音声技術資源の必要性を強調している。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:11:07 GMT)
Language Model Distillation: A Temporal Difference Imitation Learning Perspective [14.0] 蒸留は、大きな言語モデルをより小さく、より効率的なものに圧縮する一般的な慣習となっている。
本稿では,教師モデルの分布空間を利用して,時間差に基づく蒸留のための一般的な枠組みを提案する。
本研究は, 時間差学習フレームワークを設計し, 動作空間を縮小する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:17:12 GMT)
$μ$-MoE: Test-Time Pruning as Micro-Grained Mixture-of-Experts [13.9] アクティベーション対応のプルーニングは、すべてのプロンプトに対して適応的に実行できるが、推論時に複雑さを低減できる。
我々はこれを$mu$-MoEと呼ばれるマイクロエキスパートの混合物として定式化する。
いくつかの実験では、$mu$-MoEがタスク/プロンプト依存の構造的空間に動的に適応できることが示されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:23:02 GMT)
MRGAgents: A Multi-Agent Framework for Improved Medical Report Generation with Med-LVLMs [13.8] Med-LVLM(Med-LVLM)は医療報告生成に広く採用されている。
MRGAgentsは、異なる疾患のカテゴリに特化して機能する新しいマルチエージェントフレームワークである。
実験の結果,MRGAgentsは最新技術より優れ,報告の包括性と診断の有用性が向上した。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:49:42 GMT)
LLM-QFL: Distilling Large Language Model for Quantum Federated Learning [13.8] 大規模言語モデル(LLM)を量子フェデレーション学習(QFL)に適用し、効率と性能を向上させる。
本稿では,QFL 内で LLM を蒸留するファインチューニング手法を提案する。
実験は高い効率性を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:49:21 GMT)
ProphetDWM: A Driving World Model for Rolling Out Future Actions and Videos [13.6] 我々は、世界モデルを駆動するには、アクションコントロールとアクション予測の2つの追加能力が必要であると論じる。
ProphetDWMは、未来のビデオやアクションを共同で予測する新しいエンド・ツー・エンドの運転世界モデルである。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:35:09 GMT)
Leveraging Structural Knowledge in Diffusion Models for Source Localization in Data-Limited Graph Scenarios [13.4] 本稿では、限定データシナリオにおける3つの重要な課題に対処する新しいフレームワークであるSIDSLを紹介する。
SIDSLは、グラフラベルの伝搬を通じてトポロジ対応の先行情報を取り込み、伝搬強化された条件付きデノイザを用いる。
4つの実世界のデータセットに対する実験の結果は、SIDSLの優れた性能を示している。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:50:00 GMT)
LogicCat: A Chain-of-Thought Text-to-SQL Benchmark for Multi-Domain Reasoning Challenges [13.4] データセットは4,038の英語質問で構成され、それぞれがユニークなsqlクエリと組み合わせられ、12,114の推論アノテーションが付属し、さまざまなドメインにわたって45のデータベースにまたがる。
LogicCatは最先端モデルの難しさを大幅に増し、最高実行精度は14.96%に達した。
スパイダーとBIRDにおける主要な公開メソッドのベンチマークは、LogicCatがもたらす課題をさらに強調し、堅牢で推論駆動のテキスト・トゥ・ファンクシステムの研究を進めるための重要な機会を強調している。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:23:43 GMT)
Is Attention Required for Transformer Inference? Explore Function-preserving Attention Replacement [13.4] 本稿では,事前学習したトランスフォーマーのすべての注意ブロックを学習可能なシーケンス・ツー・シーケンスモジュールに置き換える機能保存型アテンション・リプレースメントフレームワークを提案する。
DeiTビジョントランスファミリ上でFARを検証し、ImageNet上の元のモデルの精度と、パラメータとレイテンシを低減した複数の下流タスクとを一致させることを実証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:23:46 GMT)
The Prompt is Mightier than the Example [13.3] 本稿では,KGP(Knowledge-Guided Prompting)を最適化のための新しいノブとして紹介する。
「即時代用できる例はいくつあるか。」
論文参考訳(メタデータ) (Sat, 24 May 2025 03:19:36 GMT)
Measuring Machine Learning Harms from Stereotypes Requires Understanding Who Is Harmed by Which Errors in What Ways [13.2] 画像検索におけるジェンダーステレオタイプのケーススタディを用いて、機械学習の誤りに対して人々がどのように反応するかを調べる。
ステレオタイプ強化エラーは、認知的信念、態度、行動に対する最小限の変化を持ちながら、より経験的な(主観的な)有害な経験をもたらす。
あるステレオタイプに違反するエラーは、男性にとって経験的に有害である。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:58:04 GMT)
Smart Energy Guardian: A Hybrid Deep Learning Model for Detecting Fraudulent PV Generation [13.1] 本研究では,住宅用太陽光発電における不正行為を正確に識別する効率的な電気盗難検出手法を提案する。
CNN、Long Short-Term Memory(LSTM)、Transformerを組み合わせたハイブリッドディープラーニングモデルでは、短期的および長期的両方の時間的依存関係の取得に優れています。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:47:00 GMT)
Season-Independent PV Disaggregation Using Multi-Scale Net Load Temporal Feature Extraction and Weather Factor Fusion [13.1] 本稿では,階層的補間(HI)と多頭部自己認識機構を統合したPV分解法を提案する。
HIを用いて、気象要因間の複雑な依存関係を捉えるために、ネット負荷特徴とマルチヘッド自己注意を抽出することにより、正確なPV生成予測を実現する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:25:46 GMT)
Geometry Aware Operator Transformer as an Efficient and Accurate Neural Surrogate for PDEs on Arbitrary Domains [13.1] 任意の領域上のPDEを学習するための幾何認識演算子変換器(GAOT)を提案する。
GAOTは、新しいマルチスケールの注目グラフニューラル演算子エンコーダとデコーダを、幾何学的な埋め込みと(ビジョン)トランスフォーマープロセッサと組み合わせている。
多様なPDEから多くの学習課題を学習する上で,GAOTの精度と効率の両面で有意な向上を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:35:10 GMT)
Statistical Inference under Performativity [12.9] 我々は、実演性の下での推定と推論のための中心極限定理を構築する。
我々は、小さなラベル付きデータセットとより大規模な機械学習予測データセットに基づいて、性能評価下での予測駆動推論(PPI)について検討する。
本論文は,我々の知る限り,性能評価に基づく統計的推論を初めて確立した論文である。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:59:49 GMT)
Pessimism Principle Can Be Effective: Towards a Framework for Zero-Shot Transfer Reinforcement Learning [12.9] 伝達強化学習は、限られたデータを持つターゲット環境に対して、ほぼ最適ポリシーを導出することを目的としている。
転送されたポリシのパフォーマンス保証の欠如と、複数のソースドメインが関与している場合の負の転送のリスクだ。
本稿では、対象ドメインの性能を保守的に推定し最適化する悲観主義の原理に基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:09:10 GMT)
Graph Neural Networks for Knowledge Enhanced Visual Representation of Paintings [12.7] ArtSAGENetは、グラフニューラルネットワーク(GNN)と畳み込みニューラルネットワーク(CNN)を統合する新しいアーキテクチャである。
提案したArtSAGENetは,アーティストとアートワーク間の重要な依存関係をキャプチャし,エンコードする。
本研究は,美術品分析とキュレーションのための視覚コンテンツとセマンティクスの統合の可能性について考察した。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:14:18 GMT)
MAPLE: Enhancing Review Generation with Multi-Aspect Prompt LEarning in Explainable Recommendation [12.7] 我々は、MAPLE(Multi-Aspect Prompt LEarner)と呼ばれるパーソナライズされたアスペクト制御モデルを提案する。
レストラン領域における2つの実世界レビューデータセットによる実験により、MAPLEはベースラインレビュー生成モデルよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:28:10 GMT)
LoopGen: Training-Free Loopable Music Generation [12.7] 現在の生成音楽モデルは、本当にループ可能なオーディオを作り出すのに苦労しています。
我々は、非自己回帰モデルを変更して、円形パターンでトークンを生成する。
この推論のみのアプローチは、将来の状況とループを自然に認識している世代に結果をもたらす。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:14:25 GMT)
Benchmarking Poisoning Attacks against Retrieval-Augmented Generation [12.6] Retrieval-Augmented Generation (RAG) は、推論中に外部知識を取り入れることで、大規模言語モデルにおける幻覚の緩和に有効であることが証明されている。
我々は、RAGに対する中毒攻撃を評価するための、最初の包括的なベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:17:59 GMT)
$C^3$-Bench: The Things Real Disturbing LLM based Agent in Multi-Tasking [12.2] エージェントの堅牢性を評価するためのオープンソースベンチマークをC3$-Benchで提示する。
具体的には,複雑なツール関係をナビゲートし,重要な隠蔽情報を処理し,動的決定経路を管理する,という3つの課題を設計する。
本質的に$C3$-Benchは、これらの課題を通じてモデル脆弱性を公開し、エージェントパフォーマンスの解釈可能性の研究を促進することを目的としている。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:25:44 GMT)
Doc-CoB: Enhancing Multi-Modal Document Understanding with Visual Chain-of-Boxes Reasoning [12.2] 既存の1パスのMLLMは、クエリの関連性を考慮せずに、ドキュメントイメージ全体を処理します。
そこで我々は,ヒトの視覚的推論をMLLMに組み込むシンプルな効果メカニズムであるDoc-CoBを紹介した。
提案手法では,クエリに最も関連性の高い領域群を自律的に選択し,さらに理解するためにそれらに注意を集中することができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:53:05 GMT)
TS-URGENet: A Three-stage Universal Robust and Generalizable Speech Enhancement Network [12.2] TS-URGENetは3段階のユニバーサル、ロバスト、一般化可能な音声強調ネットワークである。
システムは、充填ステージ、分離ステージ、修復ステージからなる、新しい3段階アーキテクチャを採用している。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:53:05 GMT)
Enhancing Efficiency and Exploration in Reinforcement Learning for LLMs [12.1] 大型言語モデル(LLM)の推論は複雑なタスクに優れている。
既存のアプローチでは、強化学習(RL)中に全ての質問に同じ数のロールアウトを割り当てている。
本稿では,問題の難易度に基づいて動的にロールアウト予算を割り当てる機構を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:28:29 GMT)
Mind Your Vision: Multimodal Estimation of Refractive Disorders Using Electrooculography and Eye Tracking [12.0] 本研究では,2つの眼球運動記録技術 (EOG) とビデオベースの眼球追跡技術を用いて屈折率を推定する受動的手法について検討した。
我々は長短期記憶(LSTM)モデルを訓練し、屈折パワーを単眼(EOGまたはアイトラッキング)とマルチモーダル構成から分類した。
その結果,マルチモーダルモデルは単調モデルよりも常に優れており,両方の設定で平均精度が最も高いことがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:03:45 GMT)
Change Point Detection in the Frequency Domain with Statistical Reliability [12.0] 本稿では、選択推論(Selective Inference, SI)に基づく統計的に重要なCP検出の最近の進歩を周波数領域に拡張する。
提案手法は周波数領域における検出されたCPの統計的意義を$p$-valuesを用いて定量化する。
実験により,提案手法は高い統計的保証を有する真のCPを確実に同定することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:55:42 GMT)
WeakMCN: Multi-task Collaborative Network for Weakly Supervised Referring Expression Comprehension and Segmentation [11.9] WeakMCNはWRECとWRESを効果的に組み合わせたマルチタスク協調ネットワークである。
WeakMCNでは、動的視覚特徴強調(DVFE)と協調一貫性モジュール(CCM)という、マルチタスクコラボレーションを促進する2つの革新的な設計を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:05:17 GMT)
Review-based Recommender Systems: A Survey of Approaches, Challenges and Future Perspectives [11.8] レビューベースのレコメンデータシステムは、この分野において重要なサブフィールドとして現れている。
本稿では,これらのシステムを分類し,その特徴,有効性,限界を解析し,最先端の手法を要約する。
本稿では,マルチモーダルデータの統合,複数基準評価情報の統合,倫理的考察など,今後の研究の方向性を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:36:22 GMT)
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains [11.7] Geo Reason Enhancement (GRE) Suiteは、解釈可能な位置推論のための構造化推論チェーンを備えたビジュアル言語モデルを拡張する新しいフレームワークである。
まず、GRE30Kという、きめ細かい視覚的・文脈的分析を容易にするために設計された高品質なジオローカライゼーション推論データセットを紹介する。
次に,シーン属性,局所的詳細,意味的特徴を段階的に推測する多段階推論手法を用いて,GREモデルを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:48:57 GMT)
Pixels2Points: Fusing 2D and 3D Features for Facial Skin Segmentation [11.6] 顔登録はテンプレートメッシュを変形して3D顔スキャンを密に適合させ、その品質は非皮膚領域で一般的に低下する。
既存のイメージベース (2D) やスキャンベース (3D) のセグメンテーション手法は性能が良くない。
本研究では3次元頭部スキャンにおいて皮膚と皮膚の非皮膚形状を正確に分離する新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:20:30 GMT)
Equivariant Flow Matching for Point Cloud Assembly [11.6] ポイント・クラウド・アセンブリの目標は、複数のポイント・クラウド・ピースを並べ合わせることで完全な3D形状を再構築することである。
本研究は,フローマッチングモデルに基づく組立タスクのための新しい同変解法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:27:20 GMT)
TokenSkip: Controllable Chain-of-Thought Compression in LLMs [11.6] CoT(Chain-of-Thought)は,大規模言語モデル(LLM)の推論能力の向上に有効であることが証明されている。
TokenSkipは、LLMが重要でないトークンを選択的にスキップし、制御可能なCoT圧縮を可能にする、シンプルで効果的なアプローチである。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:34:51 GMT)
LLM-Meta-SR: Learning to Evolve Selection Operators for Symbolic Regression [11.4] 大規模言語モデル(LLM)はアルゴリズム開発に革命をもたらしたが、シンボリックレグレッションの応用には制約が残っている。
本稿では,LLMが進化的シンボリック回帰アルゴリズムの選択演算子を自動設計できる学習・進化型フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:52:56 GMT)
Business as \textit{Rule}sual: A Benchmark and Framework for Business Rule Flow Modeling with LLMs [11.3] 我々は,新しい注釈付き中国語データセットtextbfBPRFを導入し,50のビジネスプロセス文書と326の明示されたビジネスルールを複数ドメインにわたって含む。
また,大規模言語モデル(LLM)を用いたビジネスルールの自動抽出と依存性関係同定のためのフレームワークである textbfExIde を提案する。
本研究は,既存のSOTA LLMにおける構造的ビジネスルールの抽出と相互依存性の分析におけるExIdeの有効性を実証するものである。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:13:35 GMT)
Safety Alignment via Constrained Knowledge Unlearning [11.2] 我々は、新しい安全アライメント戦略、制約付き知識アンラーニング(CKU)を提案する。
CKUは、知識のローカライゼーションと保持、有害な知識の学習の2つの主な目的に焦点を当てている。
実験の結果,CKUは全体の性能を損なうことなくモデル安全性を著しく向上することが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:29:50 GMT)
Finite-Time Global Optimality Convergence in Deep Neural Actor-Critic Methods for Decentralized Multi-Agent Reinforcement Learning [11.2] 分散マルチエージェント強化学習(MARL)のためのアクタークリティカルな手法は,集中的協調を伴わない協調的最適意思決定を容易にする。
我々は、アクターと批評家の両方が本質的に非線形である分散MARLのためのディープ・ニューラルアクター批判法を開発するための最初の試みを行う。
これは、MARL文学におけるディープ・ニューラル・アクター・クリティカルな手法に対する最初のグローバルな収束結果である。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:00:43 GMT)
LORE: Lagrangian-Optimized Robust Embeddings for Visual Encoders [11.0] ラグランジアン・ド・ロバスト・エンベディング(LORE:Lagrangian-d Robust Embeddings)を提案する。
LOREは、クリーンデータ精度の低下を最小限に抑え、ゼロショット対逆ロバスト性を大幅に改善する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:54:52 GMT)
AI Idea Bench 2025: AI Research Idea Generation Benchmark [11.0] 本稿では,言語モデル(LLM)が生み出すアイデアを定量的に評価し,比較するフレームワークであるAI Idea Bench 2025を紹介する。
このフレームワークは、3,495のAI論文とその関連するインスパイアされた作業の包括的なデータセットと、堅牢な評価方法論で構成されている。
評価システムは、2次元のアイデア品質を測る。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:40:54 GMT)
TAG-INSTRUCT: Controlled Instruction Complexity Enhancement through Structure-based Augmentation [10.9] 本稿では,構造化セマンティック圧縮と制御難易度増大による命令複雑性を向上させる新しいフレームワークであるTAG-INSTRUCTを提案する。
解析の結果,TAG-INSTRUCTは異なる命令合成フレームワーク間の制御性と安定性に優れることがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:51:03 GMT)
On Denoising Walking Videos for Gait Recognition [10.9] 本稿では,新しい歩行認知手法であるDenoisingGaitを提案する。
創造できないもの、理解できないもの」という哲学にインスパイアされた私たちは、生成的拡散モデルに目を向ける。
DenoisingGaitは、ほとんどの場合、内部およびクロスドメイン評価において、新しいSoTAパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:17:34 GMT)
Guided by Guardrails: Control Barrier Functions as Safety Instructors for Robotic Learning [10.8] 安全は、私たちの日常生活における学習ベースのロボットシステムの普及を妨げる主要な障害である。
本研究では、エピソード終了のない連続的な負の報酬を適用することによって、これらの時間的効果をシミュレートする新しいアプローチを提案する。
CBFに基づく3つのアプローチを提案し、それぞれが従来のRL法を制御バリア関数と統合し、エージェントに安全な振る舞いの学習を指導する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:29:08 GMT)
On the Computational Power of QAC0 with Barely Superlinear Ancillae [10.7] 深さ$$d$$mathrmQAC0$回路は、近似次数$ta(n)$の関数を計算するために$n1+3-d$アンシラを必要とする。
これは超線形サイズの$mathrmQAC0$上の最初の超線形下界である。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:46:43 GMT)
Societal Impacts Research Requires Benchmarks for Creative Composition Tasks [10.7] このポジションペーパーは、創造的な構成タスクに焦点を当てたベンチマークが、AI生成コンテンツの社会的害を理解するための必要なステップであると主張している。
我々は、創造的な構成タスクを、日常的な創造性を必要とする個人的タスクの助けを求める一般的な利用カテゴリとして特定する。
我々は、創造性のあるモデルの発展と影響を効果的に測定できる新しいベンチマークの開発を知らせるために、使用パターンの透明性を高めることを求めている。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:50:14 GMT)
Learning to Program Quantum Measurements for Machine Learning [10.6] 高性能量子機械学習モデルの開発には、専門家レベルの専門知識が必要である。
本稿では,量子系の可観測性,特にエルミート行列の学習性を示す革新的なフレームワークを提案する。
提案手法は変動量子回路内で観測可能を動的にプログラムし,既存の手法よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:50:49 GMT)
Align Beyond Prompts: Evaluating World Knowledge Alignment in Text-to-Image Generation [10.6] 本稿では、生成した画像のアライメントと、プロンプトを超える現実世界の知識を計測するベンチマークであるAlign Beyond Prompts (ABP)を紹介する。
ABPは2000以上の巧妙なプロンプトで構成され、6つの異なるシナリオで現実世界の知識をカバーしている。
ABPScoreは、既存のMultimodal Large Language Models(MLLM)を使用して、生成された画像とプロンプト以外の世界の知識との整合性を評価するメトリクスである。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:56:09 GMT)
DDO: Dual-Decision Optimization via Multi-Agent Collaboration for LLM-Based Medical Consultation [10.3] 大規模言語モデル(LLM)は強力な一般化と推論能力を示す。
textbfDDO, textbfDual-textbfDecision textbfOptimization by decoupling and independently optimization the two sub-tasks。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:26:57 GMT)
TrajMoE: Spatially-Aware Mixture of Experts for Unified Human Mobility Modeling [10.3] 都市間モビリティモデリングのための統一的でスケーラブルなモデルであるTrajMoEを提案する。
TrajMoEは,(1)都市間における空間意味論の不整合,(2)多様な都市移動パターンの2つの課題に対処する。
広範な実験により、TrajMoEは競争力基盤モデルよりも27%の相対的な改善を達成している。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:17:47 GMT)
Consensus Under Adversary Majority Done Right [10.3] 投機は、反対多数派の投機であるコンセンサスプロトコルを悩ませている。
1983年、ドレフとストロングは99%の敵の可能性があることを示した。
他の作品では、ドレフやストロングと同じ条件で、50%以上の敵が同期で不合理な結果を示すものもある。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:23:31 GMT)
Joint-stochastic-approximation Random Fields with Application to Semi-supervised Learning [10.3] 本稿では, 深部無方向性生成モデル構築のための新しいアルゴリズム群であるJRF(Joint-Stochastic-approximation random Field)を提案する。
合成実験により,JRFはモード被覆とモード欠落のバランスよく機能し,経験的データ分布とよく一致していることがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:04:32 GMT)
Reinforcement Fine-Tuning Powers Reasoning Capability of Multimodal Large Language Models [10.3] 強化微調整(RFT)は、大規模言語モデル(LLM)の推論能力を高める上で大きな可能性を示している。
本稿では,RFTがマルチモーダル大言語モデル (MLLM) の推論能力に影響を与えることを論じる。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:01:48 GMT)
Social Good or Scientific Curiosity? Uncovering the Research Framing Behind NLP Artefacts [10.2] NLPアーティファクトの研究フレームの明確化は、研究と実践的応用の整合化に不可欠である。
最近の研究では、NLPの研究をドメイン間で手動で分析し、主要な利害関係者、意図された用途、あるいは適切なコンテキストを明確に特定する論文はほとんどないことを示した。
まず、重要な要素(意味、目的、利害関係者)を抽出し、解釈可能なルールと文脈的推論を通してそれらをリンクすることによって、研究フレーミングを推論する3成分システムを開発する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:46:26 GMT)
Zero Trust Cybersecurity: Procedures and Considerations in Context [9.9] 本稿では、信頼しない原則に基づくZero Trustサイバーセキュリティフレームワークについて検討し、組織内の脆弱性の軽減を常に検証する。
学校や図書館など大量の情報を交換する環境におけるゼロトラストの原則の適用性について検討する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:24:46 GMT)
AutoP2C: An LLM-Based Agent Framework for Code Repository Generation from Multimodal Content in Academic Papers [9.9] 本稿では,学術出版物のマルチモーダルコンテンツを完全実行可能なコードリポジトリに変換する新しいタスクであるPaper-to-Code' (P2C)を紹介する。
研究論文からテキストコンテンツと視覚コンテンツの両方を処理し,完全なコードリポジトリを生成する,大規模言語モデルに基づくマルチエージェントフレームワークであるAutoP2Cを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:36:15 GMT)
Operator-Informed Score Matching for Markov Diffusion Models [9.7] 拡散モデルは一般にスコアマッチングを用いて訓練される。
この論文は、マルコフノゲティング過程は、ノゲティング過程を支配するマルコフ作用素がよく理解されているため、代替よりも有利であると主張している。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:03:49 GMT)
$PD^3F$: A Pluggable and Dynamic DoS-Defense Framework Against Resource Consumption Attacks Targeting Large Language Models [9.6] 大規模言語モデル(LLM)は、リソース消費攻撃に対して脆弱であり、サーバのパフォーマンスを著しく低下させたり、クラッシュの原因になったりする。
本稿では,資源消費攻撃に対する2段階のアプローチを取り入れたPlugable and Dynamic DoS-Defense Framework(PD3F$)を提案する。
PD3F$は、リソース消費攻撃を著しく軽減し、敵の負荷時に最大500%のアクセス容量を改善する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:54:22 GMT)
Restoring Real-World Images with an Internal Detail Enhancement Diffusion Model [9.5] 古い写真や低解像度画像などの現実世界の劣化画像の復元は、大きな課題となる。
最近のデータ駆動型アプローチは、高忠実度復元と、色付けに対するオブジェクトレベル制御の達成に苦慮している。
実世界の劣化画像の高忠実性復元のための内部詳細保存拡散モデルを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:32:53 GMT)
ReviewEval: An Evaluation Framework for AI-Generated Reviews [9.4] 学術研究の増大は、資格のあるレビュアーの不足と相まって、ピアレビューに対する革新的なアプローチを必要としている。
本稿では,AIによるレビューを総合的に評価するフレームワークであるReviewEvalを提案する。
本稿では、AIに基づくピアレビューに不可欠な指標を確立し、学術研究におけるAI生成レビューの信頼性と影響を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:01:28 GMT)
Human-Aligned Bench: Fine-Grained Assessment of Reasoning Ability in MLLMs vs. Humans [9.3] マルチモーダル推論と人的パフォーマンスのアライメントのためのベンチマークであるHuman-Aligned Benchを提案する。
両言語(中国語と英語)の多モーダル質問や純粋テキストベースの質問など、文脈的推論のみに依存する9,794の多モーダル質問を収集した。
マルチモーダル推論におけるMLLMの性能と人為的性能との間には顕著な違いがある。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:18:52 GMT)
A physics-guided smoothing method for material modeling with digital image correlation (DIC) measurements [9.3] 本稿では,複数の二軸延伸プロトコルのDIC測定を行うための新しい手法を提案する。
特に, 正のひずみ制約を受ける最小二乗運動を用いて, 滑らかな結節変位を計算する最適化に基づく手法を開発した。
我々はさらに、これらの物理的に一貫したDIC測定から異種物質モデリングにデータ駆動ワークフローをデプロイする。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:47:36 GMT)
ASGrasp: Generalizable Transparent Object Reconstruction and 6-DoF Grasp Detection from RGB-D Active Stereo Camera [9.2] RGB-Dアクティブステレオカメラを用いた6自由度グリップ検出ネットワークASGraspを提案する。
本システムでは, 透明物体形状再構成において, 生のIRおよびRGB画像を直接利用できることで, 自己を識別する。
実験により、ASGraspは、一般化可能な透明物体把握において90%以上の成功率を達成できることが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:38:07 GMT)
CageNet: A Meta-Framework for Learning on Wild Meshes [8.9] 本稿では、トライアングルメッシュの汎用フレームワークの適用範囲を広げることを目的としている。
メッシュが与えられた場合、ケージはそれを密に包み込む単一のコンポーネント多様体三角形メッシュである。
我々は,この概念を,難しいデータに対するセグメンテーションとスキンウェイトを学習し,ワイルドメッシュ上でのテクニックの現状に優れたパフォーマンスを実現することによって実証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:22:58 GMT)
Reasoning Segmentation for Images and Videos: A Survey [8.7] Reasoning (RS) は、暗黙のテキストクエリに基づいてオブジェクトを記述することを目的としている。
RSは視覚知覚と人間のような推論能力のギャップを埋める。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:23:14 GMT)
Bayesian Meta-Reinforcement Learning with Laplace Variational Recurrent Networks [8.7] 基本モデルアーキテクチャを変更することなく、ポイント推定を拡大して完全な分布を与える方法を示す。
本手法は,パラメータの少ない変分ベースラインと同等に動作する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:38:10 GMT)
Retrieval Augmented Decision-Making: A Requirements-Driven, Multi-Criteria Framework for Structured Decision Support [8.6] 本稿では,LLMのセマンティック理解機能とマルチクリトリア意思決定を統合したRAD手法を提案する。
本手法は,産業文書から重要な基準を自動的に抽出し,重み付けされた階層的決定モデルを構築し,モデルガイダンスに基づいて構造化されたレポートを生成する。
様々な意思決定タスクにおいて、RADによって生成された決定報告は、詳細、合理性、構造の観点から、既存の手法よりも著しく優れていた。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:13:29 GMT)
PersonaX: A Recommendation Agent Oriented User Modeling Framework for Long Behavior Sequence [8.6] PersonaX はエージェントに依存しない LLM-UM フレームワークであり、これらの課題に対処する。
より優れたレコメンデーションパフォーマンスと推論効率を達成するために、下流のレコメンデーションエージェントを拡張する。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:37:34 GMT)
Corruption-Aware Training of Latent Video Diffusion Models for Robust Text-to-Video Generation [8.5] 遅延ビデオ拡散モデル(LVDM)は高品質な生成を実現するが、不完全な条件付けに敏感である。
CAT-LVDMは、構造化されたデータ整合性ノイズ注入によるロバスト性を改善するLVDMの最初の汚職対応トレーニングフレームワークである。
BCNIはWebVid-2M、MSR-VTT、MSVDでFVDを31.9%削減し、SACNはUCF-101で12.3%改善した。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:11:14 GMT)
SPDEBench: An Extensive Benchmark for Learning Regular and Singular Stochastic PDEs [8.4] 1次元あるいは2次元の時空間方程式上でのSPDEの物理的意義を解くために設計されたSPDEBenchを紹介する。
再正規化プロセスに基づく新しいデータセットが構築され、今までで最高の結果を得る新しいMLモデルが提案されている。
結果は、FNO、NSPDE、DLR-Netなど、従来の数値解法とMLベースのモデルでベンチマークされる。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:15:45 GMT)
ARMS: A Vision for Actor Reputation Metric Systems in the Open-Source Software Supply Chain [8.4] 我々はオープンソースエコシステムにアクター評価基準(ARMS)を組み込むことを提案する。
ARMSにより、OSSのメンテナーは、将来的なコントリビュータのサイバーセキュリティの評判を評価することができる。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:55:57 GMT)
Simplifying Complex Observation Models in Continuous POMDP Planning with Probabilistic Guarantees and Practice [8.4] 我々は,簡易観測モデルを計画に用いた場合,どのような意味があるのかという問題に対処する。
我々の主な貢献は、単純化されたモデルの統計的全変動距離に基づく新しい確率的境界である。
計算はオフラインとオンラインに分かれることが可能で、計画中にコストのかかるモデルにアクセスすることなく、正式な保証に到達します。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:24:35 GMT)
AGI-Elo: How Far Are We From Mastering A Task? [8.4] 本稿では、個別のテストケースの難易度と、視覚、言語、行動領域を越えたAIモデル(または人間)の能力を共同でモデル化する統合評価システムを提案する。
我々は、複数のAGIドメインにまたがる複数の確立されたデータセットとモデルに関する広範な実験を通じて、システムの一般化性と堅牢性を検証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:25:10 GMT)
Sum of Squares Circuits [8.3] 確率回路(PC)は、このトラクタビリティvs表現性トレードオフを理論的に分析できる枠組みを提供する。
負のパラメータによる減算混合を符号化する正方形PCは単調PCよりも指数関数的に表現可能であることを示す。
我々は、二乗PCと単調PCの両方よりも指数関数的に表現できる新しい種類のPCを定式化する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:47:07 GMT)
ReflectGAN: Modeling Vegetation Effects for Soil Carbon Estimation from Satellite Imagery [8.1] 土壌有機炭素(SOC)は土壌の健康にとって重要な指標である。
衛星画像からの正確な推定は、植物カバーからのスペクトル汚染による植生地帯で妨げられている。
本研究では,衛星観測から正確な土壌反射率を復元するための反射率変換生成適応ネットワーク(ReflectGAN)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:26:38 GMT)
HiMoE: Heterogeneity-Informed Mixture-of-Experts for Fair Spatial-Temporal Forecasting [8.1] 我々は,一様かつ高精度な時空間予測を提供する新しいヘテロジニティ・インフォームド・ミックス・オブ・エクササイズ(HiMoE)フレームワークを提案する。
4つの実世界のデータセットの実験は、HiMoEが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:43:59 GMT)
LLMs and Childhood Safety: Identifying Risks and Proposing a Protection Framework for Safe Child-LLM Interaction [8.0] 本研究では,子育て型アプリケーションにおけるLarge Language Models (LLMs) の利用拡大について検討する。
これは、バイアス、有害なコンテンツ、文化的過敏といった安全性と倫理上の懸念を強調している。
本稿では,コンテンツ安全性,行動倫理,文化的感受性の指標を取り入れた安全・LLMインタラクションのための保護フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:37:34 GMT)
Doubly Robust Fusion of Many Treatments for Policy Learning [7.9] 治療群間での共変量を安定的にバランスするキャリブレーション重み付き処理融合法を提案する。
我々は、一貫性、治療融合のオラクル特性、後悔境界を含む理論的保証を確立する。
本手法の実用性について,全国の電子健康記録由来の非識別データベースを用いて概説する。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:38:17 GMT)
MSLAU-Net: A Hybird CNN-Transformer Network for Medical Image Segmentation [7.8] CNNベースの手法とトランスフォーマーベースの手法の両方が、医用画像分割タスクにおいて顕著な成功を収めている。
両パラダイムの長所を統合した新しいハイブリッドCNN-Transformerアーキテクチャ MSLAU-Netを提案する。
提案したMSLAU-Netには,2つの重要なアイデアが組み込まれている。まず,医療画像からマルチスケール特徴を効率的に抽出する,マルチスケール線形注意(multi-Scale Linear Attention)が導入されている。
第二に、マルチレベル特徴集約を行い、空間分解能を復元するトップダウン特徴集約機構を採用する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:48:29 GMT)
Exploring QUIC Dynamics: A Large-Scale Dataset for Encrypted Traffic Analysis [7.8] VisQUICは44,000以上のウェブサイトから10万のQUICトレースをラベル付けした大規模データセットである。
以前のデータセットとは異なり、VisQUICは制御された復号化のためのSSLキーを提供し、複数のQUIC実装をサポートし、新しいイメージベースの表現を導入した。
暗号化されたQUICトラフィックにおいてHTTP/3応答を推定し、観測可能なパケット機能のみを用いて97%の精度を達成するためのベンチマークタスクを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:17:18 GMT)
MMET: A Multi-Input and Multi-Scale Transformer for Efficient PDEs Solving [7.7] MMET(Multi-Input and Multi-scale Efficient Transformer)は、上記の課題に対処するために設計された新しいフレームワークである。
MMETはメッシュとクエリポイントを2つのシーケンスとして分離し、それぞれエンコーダとデコーダに供給する。
この研究は、工学および物理学に基づくアプリケーションにおけるリアルタイムPDE解決のための堅牢でスケーラブルなソリューションとしてのMMETの可能性を強調している。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:50:11 GMT)
RvLLM: LLM Runtime Verification with Domain Knowledge [7.6] 大規模言語モデル(LLM)は、例外的なテキスト理解と生成能力のため、AIパラダイムの主流として現れている。
不整合または誤ったアウトプットを生成する傾向は、特に正確さと信頼性を必要とする高い領域において、その信頼性に挑戦する。
既存の研究は、多くの場合、ドメイン固有の知識を統合する可能性を見越して、汎用シナリオにおけるモデル誤動作の検出と緩和に重点を置いている。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:21:44 GMT)
Composable Cross-prompt Essay Scoring by Merging Models [7.6] クロスプロンプト自動エッセイは、典型的にはすべてのソースプロンプトで共同でモデルを訓練する。
本稿では、データセットの代わりに個別に訓練されたソースモデルのパラメータを選択的にマージする、ソースフリー適応手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:28:21 GMT)
Scalable Gaussian Processes with Low-Rank Deep Kernel Decomposition [7.5] カーネルはガウス過程(GP)モデルにおいて、事前の信念とデータ構造を符号化する鍵である。
ディープカーネル学習は、標準的なパラメトリック形式を適用する前に、ニューラルネットワークを介して入力を入力することで、カーネルの柔軟性を向上させる。
我々は、ニューラルネットワークが直接低ランクカーネルを表現する、完全にデータ駆動でスケーラブルなディープカーネル表現を導入する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:42:11 GMT)
FusionTrack: End-to-End Multi-Object Tracking in Arbitrary Multi-View Environment [7.5] 本稿では、追跡と再識別を合理的に統合し、堅牢な軌跡関連のための多視点情報を活用するエンド・ツー・エンド・フレームワークを提案する。
MDMOTと他のベンチマークデータセットの実験は、FusionTrackがシングルビューとマルチビュートラッキングの両方で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:51:19 GMT)
Autocomp: LLM-Driven Code Optimization for Tensor Accelerators [7.4] Autocompは、アクセラレータープログラマがドメイン知識とハードウェアフィードバックを利用してコードを最適化することを可能にするアプローチである。
我々はAutocomp最適化コードがベンダーが提供するライブラリよりも高速に5.6倍(GEMM)と2.7倍(畳み込み)を実行することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:35:34 GMT)
CULEMO: Cultural Lenses on Emotion -- Benchmarking LLMs for Cross-Cultural Emotion Understanding [7.3] カルチャー・レンズ・オン・エモーション (CuLEmo) は、6つの言語にまたがるカルチャー・アウェア・感情予測を評価するための最初のベンチマークである。
キュレモ語は言語ごとに400の工芸的な質問で構成されており、それぞれに微妙な文化的推論と理解が必要である。
このベンチマークを用いて、カルチャーを意識した感情予測と感情分析タスクにおける、最先端のLCMの評価を行う。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:21:58 GMT)
Test-Time Scaling of Diffusion Models via Noise Trajectory Search [7.2] 我々は,デミキシングの中間段階において,極端時間と局所的なエクスプロイトをグローバルに探索する$epsilon$-greedy検索アルゴリズムを導入する。
EDMと安定拡散の実験は、クラス条件/テキスト-画像生成のための最先端スコアを明らかにする。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:13:29 GMT)
Value Gradients with Action Adaptive Search Trees in Continuous (PO)MDPs [7.2] POMDPを連続的な状態、行動、観察空間で解決することは、現実のモビリティやロボティクスアプリケーションにおける自律的な計画の鍵となる。
我々は、兄弟のアクションブランチ間で価値情報を共有できる新しい値推定用多重重要サンプリングツリーを定式化する。
第2に,遷移確率に基づくオンラインサンプリングによる値勾配計算手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:26:02 GMT)
The Sample Complexity of Simple Binary Hypothesis Testing [7.1] 単純な二項仮説テストのサンプルの複雑さは、いずれの設定でも$p$と$q$の2つの分布を区別するのに必要となる最小のi.d.サンプルである。
i) all $0 le alpha, beta le 1/8$ in the pre-free set, and (ii) all $delta le pi/4$ in the Bayesian set。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:50:33 GMT)
Enhanced Multimodal Aspect-Based Sentiment Analysis by LLM-Generated Rationales [7.1] 既存の方法は、画像とテキストの両方からアスペクトや感情に関連する情報を集めるために、事前訓練された小さな言語モデル(SLM)に依存している。
我々は,SLMの意思決定能力とMABSAのためのLLMが提供する付加情報を組み合わせた新しいフレームワークLRSAを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:55:28 GMT)
Continuous Multi-Task Pre-training for Malicious URL Detection and Webpage Classification [6.9] 悪意のあるURLの検出とWebページの分類は、サイバーセキュリティと情報管理において重要なタスクである。
本稿では、Transformerを利用した事前学習したURLエンコーダであるurlBERTを提案し、数十億の未ラベルURLから基礎知識を符号化する。
我々は、フィッシングURL検出、広告URL検出、ウェブページ分類という3つの下流タスクでこれを評価した。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:18:17 GMT)
MonarchAttention: Zero-Shot Conversion to Fast, Hardware-Aware Structured Attention [6.7] そこで本研究では,モナール行列を用いた準四次的注意近似手法を提案する。
MonarchAttentionはどちらも転送可能で、追加のトレーニングなしでパフォーマンス損失を最小化し、ハードウェア効率が向上する。
視覚や言語問題における多様なタスクやアーキテクチャに対するモナーキアテンションの質を実証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:44:44 GMT)
MOSLIM:Align with diverse preferences in prompts through reward classification [6.6] そこで本研究では,単一報酬モデルとポリシーモデルを用いて多目的アライメント手法MOSLIMを提案する。
MOSLIMは、これらの目的をプロンプトすることで柔軟に制御し、SFTフェーズ中に好みのトレーニングを必要としない。
提案手法の有効性を複数の多目的ベンチマークで実証し,様々な報酬モデルサイズと政策最適化手法に関するアブレーション研究を行う。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:22:21 GMT)
RoleRAG: Enhancing LLM Role-Playing via Graph Guided Retrieval [6.6] RoleRAGは、知識インデックス作成のための効率的なエンティティの曖昧さを、構造化知識グラフからコンテキスト的に適切な情報を抽出する境界対応検索器と統合した検索ベースのフレームワークである。
ロールプレイングベンチマークの実験により、RoleRAGの校正された検索は、汎用LLMとロール固有LLMの両方がキャラクタ知識との整合性を向上し、幻覚応答の低減に役立つことが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:11:17 GMT)
Knowledge Retrieval in LLM Gaming: A Shift from Entity-Centric to Goal-Oriented Graphs [6.6] 大きな言語モデル(LLM)は印象的な汎用能力を示すが、特にゲームのような複雑なアプリケーションにおいて、ステップバイステップの推論に苦戦することが多い。
ゴール指向グラフ(GoG)に基づく新しいフレームワークを提案し,各ノードがゴールとその属性を表現し,エッジがゴール間の論理的依存関係を符号化する。
本手法は,Minecraft テストベッド,GraphRAG などのベースラインの広範な実験により,ゲームプレイタスクにおける LLM の推論能力を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:09:20 GMT)
MPE-TTS: Customized Emotion Zero-Shot Text-To-Speech Using Multi-Modal Prompt [6.6] マルチモーダルプロンプトに基づくZS-TTSシステムを提案する。
このシステムは、音声を内容、音色、感情、韻律に切り離し、感情のプロンプトをテキスト、画像、音声として提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:26:02 GMT)
FedHL: Federated Learning for Heterogeneous Low-Rank Adaptation via Unbiased Aggregation [6.5] フェデレートラーニング(FL)は、分散データソースを使用したファンデーションモデル(FM)の微調整を容易にする。
Low-Rank Adaptation (LoRA) は通信コストの低さと高い性能で人気を博している。
既存の手法ではパラメータの切り離しとバイアス付き勾配更新による公式収束保証が欠如している。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:12:12 GMT)
Eye-See-You: Reverse Pass-Through VR and Head Avatars [6.5] RevAvatarは、リバースパススルー技術を可能にするためにAI方法論を活用する革新的なフレームワークである。
RevAvatarは最先端の生成モデルとマルチモーダルAI技術を統合して、高忠実度2D顔画像の再構成を行う。
多様なVR特有の条件をエミュレートするために設計された20万のサンプルからなる新しいデータセットであるVR-Faceを提示する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:08:19 GMT)
Mind the Gap: A Practical Attack on GGUF Quantization [6.5] 本稿では,学習後量子化手法のGGUFファミリーに対する最初の攻撃について紹介する。
我々は、量子化誤差に基づいて重みを拘束しながら、ターゲットの悪意あるLLMを訓練する。
我々の攻撃は、最も広く使われている訓練後の量子化法が、敵の干渉の影響を受けやすいことを強調している。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:30:37 GMT)
Enhancing LLMs' Reasoning-Intensive Multimedia Search Capabilities through Fine-Tuning and Reinforcement Learning [6.3] 本稿では,大規模言語モデル(LLM)駆動検索エージェントのトレーニング手法であるSearchExpertを紹介する。
我々は、トークン消費を減らすために、効率的な自然言語表現で探索計画を再構築する。
推論集約的な探索能力を向上させるために,探索フィードバックからの強化学習を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:00:36 GMT)
SuperGS: Consistent and Detailed 3D Super-Resolution Scene Reconstruction via Gaussian Splatting [6.3] 3D Gaussian Splatting (3DGS)は、新しいビュー合成(NVS)に優れ、リアルタイムレンダリング機能と優れた品質を備えている。
しかし、低解像度の入力ビューから派生したプリミティブの粗い性質のため、高解像度の新規ビュー合成(HRNVS)の課題に直面している。
2段階の粗大なトレーニングフレームワークで設計したScaffold-GSの拡張であるSuperGSを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:33:57 GMT)
The Pragmatic Mind of Machines: Tracing the Emergence of Pragmatic Competence in Large Language Models [6.2] 大規模言語モデル (LLM) は、不規則な解決や推論の理論を含む社会的知能タスクにおいて、新たな能力を示す。
この研究は、現実的な代替案の概念に基づくデータセットであるRL ARAGを導入し、LLMがニュアンスのある意図を正確に推測できるかどうかを評価する。
以上の結果から,基礎モデルにおいても実用的手がかりに対する顕著な感度が示され,モデルやデータスケールの増大とともに一貫した改善が得られた。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:24:59 GMT)
Federated Retrieval-Augmented Generation: A Systematic Mapping Study [6.1] Federated Retrieval-Augmented Generation (Federated RAG)は、Federated Learning (FL)とRetrieval-Augmented Generation (RAG)を組み合わせる。
RAGは、外部知識のアウトプットを基礎にして、言語モデルの事実精度を向上させる。
本稿では,2020年から2025年の間に出版された文献を対象とした,フェデレートRAGの体系的マッピング研究について紹介する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:45:12 GMT)
Pedagogy-R1: Pedagogically-Aligned Reasoning Model with Balanced Educational Benchmark [6.0] 大規模推論モデル(LRM)は、数学やプログラミングのような構造化領域において強い性能を示す。
LRMは教育的コヒーレンスと現実的な教育行動に欠けることが多い。
Pedagogy-R1は、3つのイノベーションを通じて、教室での利用にLRMを適用するフレームワークである。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:18:35 GMT)
Audio Jailbreak Attacks: Exposing Vulnerabilities in SpeechGPT in a White-Box Framework [6.0] 白箱シナリオにおけるMLLM(Multimodal Large Language Models)の音声入力を対象とする逆攻撃を提案する。
本稿では,新たなトークンレベルアタックを導入し,モデルの音声トークン化へのアクセスを活用して,逆トークン列を生成する。
当社のアプローチでは,複数の制限されたタスクに対して,最大99%の攻撃成功率を実現しています。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:46:36 GMT)
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models [6.0] 我々は,Google Earth Engine (GEE) プラットフォームから取得した画像に対して,平易な OpenStreetMap (OSM) データから,意味的に豊富なキャプションを持つマルチモーダルデータセットを大規模に生成するワークフローを提案する。
本稿では,13万以上のRS画像からなるマルチモーダルデータセットであるRSTellerについて述べる。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:15:59 GMT)
LAMDA: A Longitudinal Android Malware Benchmark for Concept Drift Analysis [5.9] LAMDAは、これまでで最大で、時間的に最も多様なAndroidマルウェアベンチマークである。
これは現実世界のAndroidアプリケーションの自然な分布と進化を反映している。
これは、時間的ドリフト、一般化、説明可能性、そして進化する検出課題に関する詳細な研究を可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:36:39 GMT)
Sci-LoRA: Mixture of Scientific LoRAs for Cross-Domain Lay Paraphrasing [5.8] Lay paraphrasingは、技術的背景のない科学的情報を聴衆に公開することを目的としている。
Sci-LoRAは、複数の科学領域で微調整されたLoRAの混合物を利用するモデルである。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:01:35 GMT)
Can LLMs assist with Ambiguity? A Quantitative Evaluation of various Large Language Models on Word Sense Disambiguation [5.8] 本研究では,Large Language Models (LLMs) を用いた単語センス曖昧化(WSD)の改善について検討する。
提案手法では,プロンプトをPOSタグ,曖昧な単語のシノニム,アスペクトベース・センス・フィルタリング,少数ショットプロンプトで支援する。
数ショットのChain of Thought (COT)プロンプトベースのアプローチを利用することで、本研究はパフォーマンスを大幅に改善したことを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:28:22 GMT)
Evaluating the Usefulness of Non-Diagnostic Speech Data for Developing Parkinson's Disease Classifiers [5.8] 音声に基づくパーキンソン病(PD)の検出は、その自動化、費用対効果、非侵襲性によって注目されている。
本研究は,Turn-Taking データセットを用いて,もともと診断目的で意図されていなかった音声データに基づいて,PD の診断が可能であることを明らかにする。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:45:55 GMT)
Multiple Wasserstein Gradient Descent Algorithm for Multi-Objective Distributional Optimization [5.8] 多目的分布最適化は、機械学習や統計学において一般的に発生し、多目的サンプリング、マルチタスク学習、多目的生成モデリングなどの分野に応用される。
本稿では,粒子の集合で表される中間的経験分布の流れを構成する反復的粒子ベースアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:08:13 GMT)
Compositional Generalization via Forced Rendering of Disentangled Latents [5.8] 作曲の一般化は 深層学習の鍵となる課題です
本研究では, 完全に非絡み合った (x,y) 入力を持つ制御された2次元ガウス型「バンプ」生成タスクについて検討する。
この失敗は、真の因子化特徴の合成ではなく、データ重ね合わせによる生成のための「記憶」戦略を反映していることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:47:34 GMT)
Synthesizing and Adapting Error Correction Data for Mobile Large Language Model Applications [5.7] 大規模言語モデル(LLM)を用いて,誤り訂正ペアの高品質データセットを合成する。
次に、サンプルを再重み付けすることで、モバイルアプリケーション領域に適合するように合成データ分布を適用する。
オフライン評価と実運用実運用A/Bテストの両方において, 誤り訂正におけるモデル性能を向上させるために, 合成データを他のデータソースと混合するベストプラクティスを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:27:20 GMT)
OneDiff: A Generalist Model for Image Difference Captioning [5.7] 画像差分キャプション(IDC)は、近縁な画像間の変化を正確に記述するために重要である。
OneDiffは、堅牢な視覚言語モデルアーキテクチャを利用する新しいジェネラリストアプローチである。
OneDiffは、既存の最先端モデルを精度と適応性で一貫して上回っている。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:26:26 GMT)
Randomized Midpoint Method for Log-Concave Sampling under Constraints [5.5] 凸コンパクト集合上での対数凹分布のサンプリング問題について検討する。
本稿では,プロジェクション演算子の幅広いクラスを通した制約処理のための統一的近位フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:14:07 GMT)
Graph-Supported Dynamic Algorithm Configuration for Multi-Objective Combinatorial Optimization [5.5] 本稿では,多目的進化アルゴリズムを構成する新しいグラフニューラルネットワーク(GNN)のDRLを提案する。
動的アルゴリズムの構成をマルコフ決定過程としてモデル化し、グラフによる対象空間における解の収束を表現する。
多様なMOCO課題に対する実験により,本手法は従来手法およびDRL方式のアルゴリズム構成法よりも有効性と適応性に優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:58:05 GMT)
MisoDICE: Multi-Agent Imitation from Unlabeled Mixed-Quality Demonstrations [5.4] 実演が混在する多エージェント環境下でのオフライン模倣学習(IL)について検討した。
提案手法は,軌道ラベリングとマルチエージェント模倣学習の2段階からなる。
我々はこれらのラベルを利用してロバストなポリシーを学習する新しいマルチエージェントILアルゴリズムであるMisoDICEを紹介する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:43:42 GMT)
On the Emergence of Linear Analogies in Word Embeddings [5.4] Word2VecやGloVeのようなモデルは、テキストコーパスで$i$と$j$の単語の共起確率$P(i,j)$に基づいて単語埋め込みを構築する。
本稿では、単語を二項意味属性で定義し、共起確率を属性に基づく相互作用から導出する理論生成モデルを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:42:26 GMT)
Lean and Mean Adaptive Optimization via Subset-Norm and Subspace-Momentum with Convergence Guarantees [5.4] 本稿では,大規模ニューラルネットワークのトレーニングを高速化しながら,メモリ要求を低減し,効率的な最適化を実現するための2つの補完的補完手法を提案する。
最初のテクニックであるSubset-m Step sizeは、ステップサイズの共有を通じてAdaGrad-NormとAdaGrad(-Norm)を一般化する。
第2の手法であるSubspace-Momentumは、運動量状態のメモリフットプリントを低次元のサブスペースにモーメントすることで削減する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:52:50 GMT)
Syn3DTxt: Embedding 3D Cues for Scene Text Generation [5.4] シーンテキストレンダリングのための合成データセットにおける3次元コンテキスト不足の課題について検討する。
従来の2Dデータセットは、テキストをさまざまな背景に正確に埋め込むために必要な幾何学的手がかりを提供していない。
本研究では,3次元シーン特性を豊かにするために,表面正規を組み込んだ合成データセット構築のための新しい標準を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:53:24 GMT)
ReflectDiffu:Reflect between Emotion-intent Contagion and Mimicry for Empathetic Response Generation via a RL-Diffusion Framework [5.1] 共感応答生成のための軽量で包括的なフレームワークである ReflectDiffu を紹介する。
この枠組みは感情の伝染を組み込んで感情表現を増強し、感情表現マスクを用いて批判的な感情的要素を識別する。
探索・サンプリング・修正のメカニズムを2回反映することで、リフレクションディフューは感情的な意思決定を正確に意図の行動に変換する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:12:53 GMT)
GeoGrid-Bench: Can Foundation Models Understand Multimodal Gridded Geo-Spatial Data? [5.0] GeoGrid-Benchは、グリッド構造における地理空間データを理解する基礎モデルの能力を評価するために設計されたベンチマークである。
このベンチマークでは、150カ所にわたる16の気候変数と、拡張された時間フレームをカバーする、大規模で現実的なデータを取り上げている。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:36:09 GMT)
Agent-Based Decentralized Energy Management of EV Charging Station with Solar Photovoltaics via Multi-Agent Reinforcement Learning [5.0] 電気自動車(EV)の採用は増え続けており、EV充電ステーションのエネルギー管理が極めて重要である。
従来の研究では、グリッド安定性を維持しながらEV充電のエネルギーコストを削減できた。
本稿では,各充電器をエージェントとして扱うマルチエージェント強化学習(MARL)手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:34:37 GMT)
Predictive Performance of Deep Quantum Data Re-uploading Models [4.9] 本研究では,データ再アップロードモデルにディープエンコーディング層を用いる場合の予測性能の基本的な制限を明らかにする。
理論的には、限定量子データ再アップロードモデルで高次元データを処理する場合、予測性能は徐々にランダムなゲスティングレベルに低下する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:11:31 GMT)
Adapting Novelty towards Generating Antigens for Antivirus systems [4.8] 本稿では,入力マルウェアの多様かつ潜在的な変種を生成するための汎用アセンブリソースコードベースフレームワークを提案する。
このフレームワークは、人気のある抗ウイルススキャナーの98%以上を回避している。
このフレームワークによって進化したマルウェアの変種は、マルウェア分析エンジンがマルウェア検出アルゴリズムを改善するのを助ける抗原として機能する。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:33:51 GMT)
Diversity and Inclusion in AI: Insights from a Survey of AI/ML Practitioners [4.8] 人工知能(AI)システムに埋め込まれた社会的バイアスや不平等に対する認識が高まり、AIライフサイクル全体を通して多様性と包摂性(D&I)の原則の統合に注意が向けられている。
倫理的AIガイドラインの台頭にもかかわらず、現実世界の環境でのD&Iの適用方法に関する実証的な証拠は限られている。
この研究は、AIと機械学習(ML)の実践者がD&Iの原則をどう理解し、実践し、効果的導入を妨げる組織的課題を特定するかを探る。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:40:23 GMT)
CAPE: Covariate-Adjusted Pre-Training for Generalized Epidemic Time Series Forecasting [4.6] CAPEは、多様な地域からの広範な疾患データセットを活用するために設計された、新しい流行前トレーニングフレームワークである。
下流病のより深い意思決定のために、環境要因を直接モデリングプロセスに統合する。
平均9.9%のフルショット、14.3%のゼロショット設定でトップベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:48:47 GMT)
Robust multi-coil MRI reconstruction via self-supervised denoising [4.6] ガウス雑音により劣化したデータに対する深層学習(DL)に基づく再構成手法を訓練するための前処理ステップとして,自己指導型デノナイジングを取り入れた効果について検討した。
自己監督型難聴は様々なシナリオにおいてMRI再建の質と効率を高めることが観察された。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:48:44 GMT)
Convergence Analysis of Natural Gradient Descent for Over-parameterized Physics-Informed Neural Networks [4.6] 2層$textReLU3$ Physics-Informed Neural Networks (PINNs) のトレーニングにおいて、学習率は $mathcalO(lambda_0)$から $mathcalO (1/|bmHinfty|_2)$に改善可能であることを示す。
このような改善にもかかわらず、収束速度は依然としてグラム行列の最小固有値と結び付けられ、収束が遅くなる。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:40:38 GMT)
Steering LLM Reasoning Through Bias-Only Adaptation [4.5] 強化学習の微調整は新しい機能を創出しないが、すでに訓練済みのネットワークに潜んでいる推論パターンを強化する。
我々はこの主張を、ステアリングベクトルをトレーニングすることで検証する: 選択された隠れた特徴を付加的に増幅する層ワイドバイアス。
GSM8KとMATHベンチマークによる4つのベースモデルの実験では、ステアリングベクターが回復し、場合によっては完全に調整されたベクターの精度を超えることが示されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:55:38 GMT)
Context Matters: Query-aware Dynamic Long Sequence Modeling of Gigapixel Images [4.4] ワイルスライド画像 (WSI) 解析は, ギガピクセル画像のパッチ数が膨大であるため, 計算上の課題が顕著である。
本稿では,クエリ対応の長期コンテキスト動的モデリングフレームワークであるQuerentを提案する。
提案手法は, 微粒なパッチ相関をモデル化するためのグローバルな認識を保ちながら, 計算オーバーヘッドを劇的に低減する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:42:23 GMT)
STaRFormer: Semi-Supervised Task-Informed Representation Learning via Dynamic Attention-Based Regional Masking for Sequential Data [4.4] トランスフォーマーベースのアプローチであるSTaRFormerは、シーケンシャルモデリングのための普遍的なフレームワークとして機能する。
STaRFormerは、動的注意に基づく領域マスキングスキームと半教師付きコントラスト学習を組み合わせて、タスク固有の潜在表現を強化する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:12:11 GMT)
Beyond Domain Randomization: Event-Inspired Perception for Visually Robust Adversarial Imitation from Videos [4.3] 専門家によるデモンストレーションや学習者の環境がドメインシフトを示すと、ビデオからの模倣は失敗することが多い。
我々は、外見をランダムにするのではなく、感覚表現自体を再考することによって、その影響を完全に排除するアプローチを提案する。
本手法は,標準RGB動画を時間強度勾配を符号化したスパースなイベントベース表現に変換する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:12:23 GMT)
Flow Matching for Geometric Trajectory Simulation [4.3] N体系は、分子動力学、生化学、歩行者動力学など幅広い分野の応用において基本的な問題である。
機械学習は、物理ベースのシミュレータをスケールし、実験データから直接モデルを開発する上で、貴重なツールとなっている。
現実的な軌跡を生成するためには、既存の手法は、非情報ノイズから始まる複雑な変換を学習し、ドメインインフォームド先行の活用を許さない必要がある。
本稿では,この制限に対処するためにSTFlowを提案する。フローマッチングとデータ依存結合を利用して,モデル表現率やスケーラビリティを犠牲にすることなく,幾何学的軌道の物理インフォームドシミュレーションを容易にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:18:59 GMT)
Expert-Agnostic Learning to Defer [4.2] 本稿では,ベイズ的手法を応用した新しいL2DフレームワークであるEA-L2Dについて紹介する。
EA-L2Dは、未確認の専門家に対する事前の手法を著しく上回り、28%の相対的な改善を達成している。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:50:44 GMT)
C3R: Channel Conditioned Cell Representations for unified evaluation in microscopy imaging [4.2] 本稿では,セルラー画像チャネルの構造的ビューを,コンテキストや概念にグループ化して紹介する。
IHCデータセットの統一評価を目的としたフレームワークであるChannel Conditioned Cell Representations (C3R) を開発した。
C3Rはチャネル適応型エンコーダアーキテクチャとマスク付き知識蒸留訓練戦略からなる2重フレームワークである。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:24:05 GMT)
On the Limit of Language Models as Planning Formalizers [4.1] 大規模言語モデルは、地上環境では実行不可能で検証不可能な計画を作成することが発見されている。
新たな作業のラインは、LLMをフォーマライザとして使用して、ある言語で計画領域を形式的に表現することに成功したことを示している。
この形式的表現は、計画を見つけるために決定論的に解決できる。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:58:01 GMT)
Multi-Scale Manifold Alignment: A Unified Framework for Enhanced Explainability of Large Language Models [4.1] 近年のLLM(Large Language Models)の進歩は高いパフォーマンスを達成しているが、内部の推論は不透明であり、解釈可能性や重要なアプリケーションに対する信頼が制限されている。
提案するMulti_Scale Manifold Alignmentフレームワークは,潜在空間を大域的,中間的,局所的な意味的なマニフォールドに分解し,テーマ,文脈,単語レベルの詳細を抽出する。
このフレームワークは、LLMがマルチスケールセマンティクスをどのように構成し、解釈可能性を高め、バイアス検出やロバストネス向上などのアプリケーションを可能にするか、統一的な説明を提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:25:58 GMT)
Dynamic Manifold Evolution Theory: Modeling and Stability Analysis of Latent Representations in Large Language Models [4.1] 大規模言語モデル生成をモデル化する統合フレームワークである動的マニフォールド進化論(DMET)を紹介する。
Intent_stateの更新を連続力学の離散時間オイラー近似としてキャストすることにより、本質的なエネルギー駆動フローとコンテキスト依存力をTransformerコンポーネントにマッピングする。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:17:50 GMT)
CiRL: Open-Source Environments for Reinforcement Learning in Circular Economy and Net Zero [4.1] 固体および流体材料の両方の円度に着目した環境ライブラリであるCiRLを紹介する。
新しいCE指向環境は状態空間であり、通常は動的システム分析と制御設計で使用される。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:26:14 GMT)
Data Augmentation for Time-Series Classification: An Extensive Empirical Study and Comprehensive Survey [4.0] データ拡張(DA)は時系列分類(TSC)において重要なアプローチとなっている
TSCにおけるDAの現在の状況は、断片化された文献レビュー、誤った方法論上の課題、アクセス可能なユーザ指向ツールの不足に悩まされている。
本研究では,これらの課題に対して,TSCドメイン内のDA方法論の総合的な検討を通じて対処する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:59:14 GMT)
The Double-Ellipsoid Geometry of CLIP [4.0] 対照的に、CLIP(Contrastive Language- Image Pre-Training)は機械学習アプリケーションにおいて非常に有効である。
テキストと画像は, 原点中心ではなく, 線形分離可能な楕円体殻上に存在することを示す。
インスタンスの任意の他のインスタンスに対する平均コサイン類似度を測定する、新しい整合性の概念が導入された。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:17:18 GMT)
Unsupervised cell segmentation by fast Gaussian Processes [3.9] ノイズ顕微鏡画像に対する高速ガウス過程に基づく新規な教師なしセル分割アルゴリズムを開発した。
異なる部位の異なる輝度を含む異種画像に適応し、背景から物体を分離する頑健な閾値基準を導出した。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:28:14 GMT)
Anomaly detection in radio galaxy data with trainable COSFIRE filters [3.9] 本研究は、トレーニング可能なCOSFIREフィルタを用いて、電波源の形態特性に基づく異常検出に対する革新的なアプローチを導入する。
このフレームワークは、COSFIREディスクリプタと教師なしローカル・アウトリア・ファクター(LOF)アルゴリズムを統合し、異常な電波銀河形態を識別する。
ラジオギャラクシーベンチマークデータセットの評価は、COSFIREに基づく手法が幾何平均(G平均)スコアを79%達成し、高い性能を示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:08:41 GMT)
Evaluating Step-by-step Reasoning Traces: A Survey [3.9] ステップバイステップ推論は、複雑な問題における大規模言語モデル(LLM)の推論能力を高めるために広く用いられている。
既存の評価プラクティスは非常に一貫性がなく、その結果、評価器の設計とベンチマーク開発の間に断片的な進歩をもたらす。
本調査は,4つのトップレベルカテゴリー(実効性,妥当性,一貫性,実用性)による評価基準の分類について提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:09:17 GMT)
Pruning for Performance: Efficient Idiom and Metaphor Classification in Low-Resource Konkani Using mBERT [3.8] 図形表現は自然言語処理システムに永続的な課題をもたらす。
本稿では,事前学習した多言語BERTと双方向LSTMと線形分類器を統合したハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:23:39 GMT)
FairREAD: Re-fusing Demographic Attributes after Disentanglement for Fair Medical Image Classification [3.6] FairREAD (Fair Refusion After Disentanglement) は, センシティブな階層属性を公正な画像表現に再統合することで不公平を緩和するフレームワークである。
FairREADは、臨床に関係のある詳細を保存するために、制御された再灌流機構を使用しながら、人口統計情報をアンタングルする敵の訓練を採用している。
大規模臨床X線データセットの総合的評価は、FairREADが診断精度を維持しながら不公平度指標を著しく低減することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:46:37 GMT)
Few-Shot Optimization for Sensor Data Using Large Language Models: A Case Study on Fatigue Detection [3.5] 本稿では,HED-LM(Hybrid Euclidean Distance with Large Language Models)を用いて,センサを用いた分類タスクのサンプル選択を改善するために,新しい数ショット最適化を提案する。
HED-LMは、ユークリッド距離に基づいて候補サンプルをフィルタリングし、それらを再ランクするハイブリッドセレクションパイプラインを通じて、この問題に対処する。
実験の結果,HED-LMの平均マクロF1スコアは69.13$pm$10.71%であり,ランダム選択と距離のみフィルタリングの両方に優れていた。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:43:25 GMT)
A statistically consistent measure of semantic uncertainty using Language Models [3.5] 本稿では,意味的不確実性,意味的スペクトルエントロピーの新たな尺度を提案する。
この尺度は、標準の事前訓練された言語モデルのみに依存する単純なアルゴリズムによって実装される。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:27:39 GMT)
Paper Copilot Position: The Artificial Intelligence and Machine Learning Community Should Adopt a More Transparent and Regulated Peer Review Process [3.5] トップ層人工知能(AI)と機械学習(ML)カンファレンスへの応募の急速な増加により、多くの会場がクローズドからオープンなレビュープラットフォームに移行した。
一部はオープンなピアレビューを完全に受け入れており、プロセス全体を通してパブリックな可視性を実現している。
その他には、最終決定後のみレビューをリリースしたり、オープンなピアレビューシステムを使用してもレビューを非公開にしておくようなハイブリッドアプローチも採用されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:56:47 GMT)
Caption This, Reason That: VLMs Caught in the Middle [3.5] VLM(Vision-Language Models)は近年,視覚的理解の進歩を目覚ましいものにしている。
カウントやリレーショナル推論といった視覚的なタスクでは、人間の能力が遅れている。
認識,注意,記憶など,コア認知軸に沿ったVLMのパフォーマンスを解析する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:25:48 GMT)
AI for Regulatory Affairs: Balancing Accuracy, Interpretability, and Computational Cost in Medical Device Classification [3.4] 医療機器記述の規制データセットを用いて,幅広いAIモデルについて検討する。
それぞれのモデルを,精度,解釈可能性,計算コストの3つの重要な次元に沿って評価する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:41:20 GMT)
DiSCo: Device-Server Collaborative LLM-Based Text Streaming Services [3.3] テキストストリーミングサービスにおける大規模言語モデルの急速な普及は、大きなコストとQuality of Experienceの課題をもたらしている。
リクエストを適応的にルーティングすることでユーザのQoEを最適化するデバイスサーバ協調型スケジューラの紹介を行う。
モデルデバイス構成の異なるTTFT(11-52%)とTTFT(6-78%)を減らし,QoEを向上できることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:16:01 GMT)
Empirical Evaluation of Knowledge Distillation from Transformers to Subquadratic Language Models [3.3] 本研究では,トランスフォーマーの教師モデルから8つのサブクワッドラティックな学生アーキテクチャへの知識蒸留の伝達可能性について,体系的に評価する。
本研究では,教師モデルの知識蒸留による学習表現を最も効果的に近似できるサブクワッドラティックモデルについて検討した。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:10:16 GMT)
Do LLMs have a Gender (Entropy) Bias? [3.2] 我々は,LLMが生み出す情報の量と,ユーザが質問した実際の質問に対する相違点として,エントロピーバイアスを定義し,研究する。
分析の結果,男女のLDM反応に有意な偏りは認められなかったことが示唆された。
2つの性別の反応を反復的にマージして最終的な結果を得る単純な偏りのアプローチを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:06:41 GMT)
Reality Check: A New Evaluation Ecosystem Is Necessary to Understand AI's Real World Effects [3.2] 論文は、AIの間接的および二次的効果を測定するには、シリコで実施される静的な単一ターンアプローチを超えて拡張する必要がある、と論じている。
我々は、文脈認識を容易にし、下流の解釈とAIの二次効果に関する意思決定を可能にするデータと方法の必要性について説明する。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:35:32 GMT)
Security Concerns for Large Language Models: A Survey [3.2] 大きな言語モデル(LLM)は自然言語処理に革命をもたらしたが、その能力は新たなセキュリティ脆弱性も導入している。
我々は、LSMに関するセキュリティ上の懸念を包括的に概観し、脅威を即時注入と脱獄、敵の攻撃、悪意あるアクターによる誤用に分類する。
LLMが安全で有益であることを保証するために、堅牢で多層的なセキュリティ戦略を推進していくことの重要性を強調した。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:22:43 GMT)
Improving Bangla Linguistics: Advanced LSTM, Bi-LSTM, and Seq2Seq Models for Translating Sylheti to Modern Bangla [3.1] バングラデシュのすべての地域は、シルヘティ語、チッタゴン語など独自の言語を持っている。
本研究は現地語用であり,本論文はSylheti言語に関するものである。
自然言語処理やNLP技術を用いて、PureやModern Banglaを局所的に話されるSylheti Bangla言語に翻訳する包括的なシステムを提示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:13:45 GMT)
BiomechGPT: Towards a Biomechanically Fluent Multimodal Foundation Model for Clinically Relevant Motion Tasks [3.1] さまざまなタスクにまたがる動作に関する質問と回答のマルチモーダルデータセットを作成しました。
このデータセットを用いて,マルチモーダルなバイオメカニクス言語モデルであるBiomechGPTを開発した。
以上の結果から,BiomechGPTは活動認識,運動障害の同定,診断,臨床成績の評価,歩行測定など,様々なタスクにおいて高いパフォーマンスを示すことが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:15:23 GMT)
(Implicit) Ensembles of Ensembles: Epistemic Uncertainty Collapse in Large Models [3.1] 疫学的な不確実性は、安全クリティカルなアプリケーションやデータ取得タスクに不可欠である。
ディープラーニングモデルには重要な現象がある:モデルの複雑さが増大するにつれて不確実性が崩壊する。
この現象の説明として暗黙のアンサンブルを導入する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:48:03 GMT)
B-score: Detecting biases in large language models using response history [2.9] 大きな言語モデル(LLM)は、しばしば強いバイアスを示す。
本研究は,LLMが先行回答を同じ質問に対して観察できる場合,バイアスの少ない回答を出力できるかどうかを考察する。
主観的, ランダム, 易解, 難解な質問に対するバイアスを検出するのに有効な新しい尺度であるBスコアを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:23:52 GMT)
Climate-Eval: A Comprehensive Benchmark for NLP Tasks Related to Climate Change [2.9] Climate-Evalは、既存のデータセットと、新たに開発されたニュース分類データセットを集約する。
この結果、13のデータセットに基づいた25のタスクのベンチマークが、気候談話の重要な側面をカバーしている。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:45:46 GMT)
Why Not Replace? Sustaining Long-Term Visual Localization via Handcrafted-Learned Feature Collaboration on CPU [2.8] 複雑な産業環境における長期的視覚的ローカライゼーションは、移動ロボットシステムにとって重要である。
既存のアプローチでは、手作りの機能は照明に敏感であり、学習された機能は集中的であり、セマンティックまたはマーカーベースの手法は環境に制約される。
実時間手作り特徴抽出を利用して相対的なポーズ推定を行う階層的局所化フレームワークを提案する。
絶対位置決めのために最適化されたレイテンシに対して、選択的に学習されたキーポイント検出を採用する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:44:21 GMT)
Towards an automatic method for generating topical vocabulary test forms for specific reading passages [2.8] K-toolは、特定のテキストに関連する学生の背景知識を測定する、話題語彙テストを生成する自動化システムである。
このシステムは中高生の英語母語話者での使用を目的としている。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:57:02 GMT)
Momentum space entanglement of four fermion field theory [2.7] 4つのフェルミオン場理論のモーメント空間の絡み合いは、レプリカ・トリックを用いてウィルソン有効作用から計算される。
非局所項は異なる運動量モード間の絡み合いの唯一の源である。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:34:17 GMT)
Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.7] CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:10:38 GMT)
Improving Ad matching via Cluster-Adaptive Keyword Expansion and Relevance tuning [2.7] この作業は、ドキュメント側のセマンティックキーワード拡張を通じてキーワードリーチを拡張する。
本稿では,事前学習したシアムモデルを用いて,広告キーワードのベクトル表現を高密度に生成する手法を提案する。
本稿では,局所的な意味密度に基づいて類似性のカットオフを調整するクラスタベースのしきい値設定機構を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:02:19 GMT)
ZooplanktonBench: A Geo-Aware Zooplankton Recognition and Classification Dataset from Marine Observations [2.7] プランクトン(英: Plankton)は、世界中の海に分布する小さな生物である。
このプランクトン群落の1つの構成要素は、ゼラチン質の動物や甲殻類を含む動物プランクトンである。
動物プランクトンの存在を正確に監視し、海洋環境に関する人口の変化を理解することは、海洋科学研究にとって貴重なことである。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:49:52 GMT)
An AI Capability Threshold for Rent-Funded Universal Basic Income in an AI-Automated Economy [2.6] 我々は、AI資本利益が普遍的なベーシックインカムを持続的にファイナンスできる最初のクローズドフォーム条件を導出する。
我々は、異なる経済シナリオの下で、AI能力がAI前自動化と比較して生産性のレベルとしてしきい値を定義する方法について分析する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:08:13 GMT)
Investigating AI Rater Effects of Large Language Models: GPT, Claude, Gemini, and DeepSeek [2.5] 大規模言語モデル (LLM) は, ローテイク評価において, 自動スコアリングのために広く研究されている。
本研究は,10個のLDMと人間専門家による2種類の筆記課題を比較検討した。
結果は、ChatGPT 4o、Gemini 1.5 Pro、Claude 3.5 Sonnetの使用を高いスコアリング精度、より高いレーダ信頼性、より低いレーダ効果でサポートした。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:24:44 GMT)
Unifying Attention Heads and Task Vectors via Hidden State Geometry in In-Context Learning [2.5] 本稿では,クエリ隠蔽状態の分離性とアライメントという,性能を左右する2つの幾何学的要因を解析する。
従来のトークンヘッドは分離性を駆動し、誘導ヘッドとタスクベクトルはアライメントを強化する。
そこで本研究は,ICLの基盤となるメカニズムを統一的に記述し,アテンションヘッドとタスクベクトルのギャップを埋めるものである。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:42:20 GMT)
Towards Semantic Integration of Opinions: Unified Opinion Concepts Ontology and Extraction Task [2.5] 本稿では,統一オピニオン概念 (Unified Opinion Concepts, UOC) オントロジーを導入し,それらの意味的文脈に意見を統合する。
これは、NLPや象徴的な記述を通して記述された意味構造において広く研究されている意見の面に基づく統一的な概念化である。
本稿では,文章から意見を引き出す統一意見概念抽出(UOCE)タスクを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:52:24 GMT)
The Theory of the Unique Latent Pattern: A Formal Epistemic Framework for Structural Singularity in Complex Systems [2.4] 本稿では,動的システムにおける複雑性の起源を再定義する形式的枠組みとして,一様潜在パターンの理論(ULP)を紹介する。
ULPは、本質的なランダム性や創発的な非線形性に予測不可能をもたらすのではなく、全ての分析可能な系は構造的にユニークで決定論的な生成機構によって支配されていると主張する。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:52:28 GMT)
LLMs for Supply Chain Management [2.2] 本稿では,外部知識を推論プロセスに統合する検索拡張生成(RAG)フレームワークを提案する。
我々は、標準化されたSCM試験とビールゲームテストに合格することで、専門家レベルの能力を示すドメイン特化SCM LLMを開発した。
我々はLLMを用いて水平および垂直のサプライチェーンゲームを行い、サプライチェーン内の競争と協力を分析する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:46:28 GMT)
HyperFake: Hyperspectral Reconstruction and Attention-Guided Analysis for Advanced Deepfake Detection [2.2] ディープフェイクはデジタルメディアのセキュリティに重大な脅威をもたらす。
現在の検出方法は、様々な操作テクニックをまたいだ一般化に苦慮している。
通常のRGBビデオから31チャンネルのハイパースペクトルデータを再構成する新しいディープフェイク検出パイプラインであるHyperFakeを紹介する。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:28:55 GMT)
Reinforcement Learning for Stock Transactions [2.0] 我々は,Q-Learning,線形関数近似を用いたQ-Learning,深層Q-Learningを用いて,一連のエージェントを訓練する。
機械学習回帰モデルと分類モデルを用いて株価の予測を試みる。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:44:46 GMT)
An Interpretable Deep-Learning Framework for Predicting Hospital Readmissions From Electronic Health Records [1.9] 本研究では,未計画の病院入退院を予測するための新しい,解釈可能な深層学習フレームワークを提案する。
実際のデータを用いて,30日と180日以内に病院入退院の2つの予測課題に関する枠組みを検証した。
我々のソリューションは、予測精度で従来の機械学習モデルより優れ、同時により解釈可能な結果を提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:19:14 GMT)
Grounding Bodily Awareness in Visual Representations for Efficient Policy Learning [1.9] 視覚変換器(ViT)のトークンレベル表現に適用するコントラスト学習手法であるIConを提案する。
IConはエージェント固有のトークンと環境固有のトークンの間の特徴空間の分離を強制し、結果としてエージェント中心の視覚表現がボディ固有の帰納バイアスを埋め込む。
実験の結果、IConは様々な操作タスク間でポリシー性能を向上させるだけでなく、異なるロボット間でポリシー伝達を促進することがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:25:37 GMT)
Think Twice before Adaptation: Improving Adaptability of DeepFake Detection via Online Test-Time Adaptation [1.8] ディープフェイク(DF)検出器は、現実世界の環境に展開する際、重大な課題に直面している。
ポストプロセッシング技術はDFサンプルで提示された成果物を不明瞭に生成する可能性があるため、性能が低下する。
本稿では,新しいオンラインテスト時間適応法であるThink Twice before Adaptation (textttT$2$A)を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:58:53 GMT)
Understanding the Relationship Between Personal Data Privacy Literacy and Data Privacy Information Sharing by University Students [1.7] この調査に基づく調査は、米国の大学生が個人のデータのプライバシーをどう認識するかを調査する。
プライバシーリテラシー尺度に対する学生の反応は、高いプライバシーリテラシーグループと低いプライバシーリテラシーグループに分類された。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:14:53 GMT)
A Taxonomy of Questions for Critical Reflection in Machine-Assisted Decision-Making [1.7] 意思決定者は、マシンレコメンデーションに過剰に依存するリスクを負う。
反射は認知的エンゲージメントを高め、批判的思考を改善することが示されている。
本稿では,機械による意思決定に関する質問を体系的に作成するための分類法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:09:54 GMT)
A vision-intelligent framework for mapping the genealogy of vernacular architecture [1.7] 本研究は,研究者の直感を高めるため,知的技術を組み込む研究枠組みを提案する。
シンガポールのチャイナタウンにある1,277の歴史的店舗の様式的分類について検討する。
発見は1980年代と1990年代にシンガポールの都市再開発庁が制定した年代分類を超えて拡大した。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:39:28 GMT)
QUCE: The Minimisation and Quantification of Path-Based Uncertainty for Generative Counterfactual Explanations [1.6] Quantified Uncertainty Counterfactual Explanations (QUCE) は、経路の不確実性を最小化する手法である。
そこで本研究では,QUCEが説明文の提示時に不確実性を定量化し,より確実な逆実例を生成することを示す。
本稿では,QUCE法の性能を,経路に基づく説明法と生成対実例の両方の競合手法と比較することによって示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:21:18 GMT)
Measuring South Asian Biases in Large Language Models [1.6] 本研究は,Large Language Models (LLMs) の多言語および交叉解析を行うことにより,ギャップに対処する。
我々は、性別、宗教、婚姻状況、子供の数など、未発見の交差点を捉えた文化的根拠に基づく偏見辞書を構築した。
Indo-Aryan言語とDravidian言語における文化的偏見を減らすための2つの自己バイアス戦略を評価する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:18:17 GMT)
A Real-World Energy Management Dataset from a Smart Company Building for Optimization and Machine Learning [1.5] 2018年から2023年までの6年間,スマート企業施設の監視から得られた,大規模な実世界のデータセットを提示する。
データセットは、各種施設領域及びコンポーネントからのエネルギー消費データ、太陽光発電システムと複合熱・発電プラントからのエネルギー生産データ、暖房・冷却システムからの運転データ、オンサイト気象観測所からの気象データを含む。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:52:52 GMT)
Leveraging Online Data to Enhance Medical Knowledge in a Small Persian Language Model [1.5] 本研究では、アクセス可能なオンラインデータを活用することで、小規模言語モデルにおける医療知識の強化について検討する。
我々は、キュレートされたデータを用いてベースラインモデルを微調整し、その医療的知識を改善した。
ベンチマーク評価により, 微調整モデルにより, 医療質問応答の精度が向上することが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 00:44:41 GMT)
Conformal Prediction for Uncertainty Estimation in Drug-Target Interaction Prediction [1.5] 薬物-標的相互作用予測のための3つのクラスタ条件境界共形予測法を解析した。
グループ条件付きCPは、あるエンティティが親しみのあるときにうまく機能するが、残差駆動クラスタリングはスパースや新規シナリオにおいても堅牢な不確実性推定を提供する。
これらの結果は、不確実性の下でDTI予測を改善するためのクラスタベースのCPの可能性を強調している。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:31:49 GMT)
Partition Generative Modeling: Masked Modeling Without Masks [1.4] 分割生成モデル(PGM)はマスク生成モデル(MGM)の新しいアプローチである
1024トークンのコンテキスト長を持つOpenWebTextの実験では、PGMがレイテンシとスループットの両方で少なくとも5倍改善されていることが示されている。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:44:32 GMT)
Assessing the Capability of LLMs in Solving POSCOMP Questions [1.3] 本研究では,POSCOMP試験において,大規模言語モデルが人的パフォーマンスに適合するか否かを検討する。
4つのモデルが2022年と2023年のPoSCOMP試験で評価された。
評価は、試験の典型的な複雑な問題を扱う際のモデルの熟練度を測定した。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:40:53 GMT)
Performance and Generalizability Impacts of Incorporating Geolocation into Deep Learning for Dynamic PM2.5 Estimation [1.3] 我々は、最近発表されたディープラーニングに基づくPM2.5推定モデルに基づいて、アメリカ大陸で観測されたデータに対する最先端のパフォーマンスを実現する。
位置情報をベースラインとして除外する3つの手法について検討し, 生の地理座標を用いて, 事前学習した位置情報エンコーダを活用する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:00:34 GMT)
LiDAR-EDIT: LiDAR Data Generation by Editing the Object Layouts in Real-World Scenes [1.2] 我々は、自動運転のための合成LiDARデータを生成するための新しいパラダイムであるLiDAR-EDITを提案する。
本フレームワークは,背景環境の現実性を維持しつつ,新たなオブジェクトレイアウトを導入することで,現実のLiDARスキャンを編集する。
LiDARのポイントクラウドをゼロから生成するエンドツーエンドフレームワークと比較して、LiDAR-EDITはオブジェクトレイアウトを完全に制御する。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:59:51 GMT)
Non-unitary enhanced transfer efficiency in quantum walk search on complex networks [1.2] 本研究では, 探索問題を事例として, 歩行者のトラップ地点への移動効率について検討した。
ユニタリ力学と非ユニタリ力学のバランスはパラメータで調整される。
この挙動は、余分なトラップサイトの存在下でのみ観察されることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:01:56 GMT)
Generative AI in Computer Science Education: Accelerating Python Learning with ChatGPT [1.1] 本研究では,生成型AI,特にOpenAIs ChatGPTを,適用型生成型AIに関する16週間の専門訓練コース内で,自己ペースのPythonプログラムモジュールに統合することの有効性を評価する。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:13:46 GMT)
Mitigating Context Bias in Domain Adaptation for Object Detection using Mask Pooling [1.1] コンテキストバイアス(Context bias)とは、オブジェクト検出トレーニングプロセスにおいて、前景オブジェクトと背景の関係を指す。
我々は、畳み込みネットワークアーキテクチャにおけるプール操作を、このバイアスの可能な源として、コンテキストバイアスの因果的視点を提供する。
本研究では,前景マスクの追加入力を用いて,前景と背景領域のプール処理を分離するマスクプーリングを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:05:20 GMT)
Making deep neural networks work for medical audio: representation, compression and domain adaptation [1.1] この論文は、医療オーディオ信号の理解と解釈に機械学習を適用するという技術的課題に対処する。
乳幼児の泣き声の分析に焦点をあてて, 健康状態を予測する。
この領域の研究を進めるために、乳幼児の泣き声のユニークなオープンソースデータセットをリリースする。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:32:31 GMT)
Digital Overconsumption and Waste: A Closer Look at the Impacts of Generative AI [1.1] 生成人工知能(AI)システムは、デジタル廃棄物の生産に負の貢献をする。
この時点で、デジタル空間における消費過多などの有害な消費者行動の再現について、緊急に議論する必要がある。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:40:08 GMT)
Climate Implications of Diffusion-based Generative Visual AI Systems and their Mass Adoption [1.1] 本稿では,拡散型視覚AIシステムの成長,利用パターン,成長,気候への影響について報告する。
これらのツールの大量導入は,地球規模のエネルギー消費に大きく寄与する可能性が示唆された。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:32:56 GMT)
Quantum Feature Space of a Qubit Coupled to an Arbitrary Bath [1.0] クビット制御プロトコルは伝統的に、そのパワースペクトル密度を通じてクビットバス結合の特性を利用してきた。
従来の研究では、ディープニューラルネットワークと物理符号化層を組み合わせたグレーボックスアプローチを用いて、古典的な浴槽の影響を特徴づけるノイズ演算子の推論が提案されていた。
ここでは、高価なニューラルネットワークは不要であり、このノイズ演算子記述は効率的なパラメータ化を許容することを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 04:29:49 GMT)
Riverine Flood Prediction and Early Warning in Mountainous Regions using Artificial Intelligence [0.9] 本研究は,パキスタンとアフガニスタンの間を流れるカブール川を,越境流域における洪水予報の複雑さを反映したケーススタディとして用いた。
本研究は,衛星を用いた気候データを用いて,多くの高度な機械学習モデルと深層学習モデルを適用し,日・多段河川流の予測を行った。
LSTMネットワークは他のモデルよりも優れており、最高R2値は0.96、最低RMSEは140.96 m3/secである。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:10:09 GMT)
From Reddit to Generative AI: Evaluating Large Language Models for Anxiety Support Fine-tuned on Social Media Data [0.9] 本研究では,大規模言語モデル(LLM)を,不安支援における潜在的有用性に対して体系的に評価する。
本手法は, (i) 言語的品質, (ii) 安全性と信頼性, (iii) 支援性という3つの主要な基準を取り入れた混合メソッド評価フレームワークを利用する。
その結果, 自然不安関連データを用いた微調整LDMは, 言語的品質を向上するが, 毒性やバイアスが増大し, 感情応答性が低下することがわかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:07:32 GMT)
Hierarchical Quantum Error Correction with Hypergraph Product Code and Rotated Surface Code [0.9] 最寄りの相互作用しか持たない平面アーキテクチャ上でのフォールトトレラントな量子計算手法を提案する。
上層層は3,4)-ランダムなHGP符号を採用しており、その符号化速度と良好な距離スケーリングで知られている。
下層は、格子手術によるハードウェア互換性を実現するため、回転した表面コードと距離5から構成される。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:39:39 GMT)
Supervised and Unsupervised protocols for hetero-associative neural networks [0.9] 本稿では,3方向連想メモリ(TAM)モデルのための学習フレームワークを提案する。
これらのニューラルネットワークは、一般化されたヘビーンのシナプス結合を介して相互作用する3つの相互結合された2つのニューロンから構成され、パターンの構造的三重項の学習、保存、検索を可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:15:55 GMT)
Simultaneous Optimization of Efficiency and Degradation in Tunable HTL-Free Perovskite Solar Cells with MWCNT-Integrated Back Contact Using a Machine Learning-Derived Polynomial Regressor [0.9] 孔輸送層(HTL)を持たないペロブスカイト太陽電池(PSC)は、従来のアーキテクチャに代わるコスト効率が高く安定した代替手段を提供する。
本研究では,HTLフリーPSCの効率性と安定性を最適化する機械学習(ML)駆動のフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:37:48 GMT)
GRoQ-LoCO: Generalist and Robot-agnostic Quadruped Locomotion Control using Offline Datasets [0.9] GRoQ-LoCOはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
我々のフレームワークは、ロボット固有のエンコーディングを組み込まずに、すべてのロボットからの保護的データのみを運用する。
その結果、オフラインでデータ駆動学習により、様々な4つの形態や行動にまたがる移動を一般化する可能性が示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:28:59 GMT)
Debate-to-Detect: Reformulating Misinformation Detection as a Real-World Debate with Large Language Models [0.8] D2D(Dbate-to-Detect, D2D)は, 偽情報検出を構造化された敵対的議論として再構築する, 新規なマルチエージェント・ディベート(MAD)フレームワークである。
ファクトチェックにインスパイアされたD2Dは、各エージェントにドメイン固有のプロファイルを割り当て、Opening Statement、Rebuttal、Free Debate、Closing Statement、Judgmentを含む5段階の議論プロセスを編成する。
GPT-4oによる2つの偽ニュースデータセットの実験は、ベースライン法よりも大幅に改善された。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:44:33 GMT)
Coherence as a resource for phase estimation [0.8] 位相推定プロトコルの性能と量子コヒーレンスを定量的に結合する。
我々は、状態のコヒーレンスと位相推定の値を直接接続するコヒーレンス尺度の族を構築する。
これは、位相推定に不可欠なリソースとしてコヒーレンスを確立し、従って、サブルーチンとしてそれに依存する任意の量子技術に対してである。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:18:15 GMT)
Deep Learning for Breast Cancer Detection: Comparative Analysis of ConvNeXT and EfficientNet [0.8] 本稿では2つの畳み込みニューラルネットワークを比較し,検診によるマンモグラムの癌の可能性を予測した。
ConvNeXTは94.33%のAUCスコア、93.36%の精度、95.13%のFスコア、92.34%のAUCスコア、91.47%の精度、93.06%のFスコアをRSNAスクリーニング乳がんデータセットで生成する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:47:34 GMT)
From ML to LLM: Evaluating the Robustness of Phishing Webpage Detection Models against Adversarial Attacks [0.8] フィッシング攻撃は、ユーザーを騙して機密情報を盗み、重大なサイバーセキュリティの脅威を引き起こす。
我々は、さまざまなフィッシング機能を正当なWebページに埋め込むことで、敵対的なフィッシングWebページを生成するツールであるPhishOracleを開発した。
本研究は, フィッシング検出モデルによる敵攻撃に対する脆弱性を強調し, より堅牢な検出アプローチの必要性を強調した。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:22:42 GMT)
MLRan: A Behavioural Dataset for Ransomware Analysis and Detection [0.8] MLRanは、64のランサムウェアファミリーに4,800以上のサンプルと、バランスの取れたグッドウェアサンプルからなる行動型ランサムウェアデータセットである。
サンプルは2006年から2024年にかけて、ロック、暗号、ランサムウェア・アズ・ア・サービス、モダンな4種類のランサムウェアを含む。
MLRanを用いた機械学習(ML)モデルのランサムウェア検出性能を評価した。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:22:53 GMT)
Multi-Agent Best Arm Identification in Stochastic Linear Bandits [0.8] 固定予算シナリオ下での線形包帯における協調的ベストアーム識別の問題について検討する。
本稿では,任意の構造を持つスターネットワークとネットワークに対して,MaLinBAI-StarとMaLinBAI-Genの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:55:53 GMT)
Robustness in Large Language Models: A Survey of Mitigation Strategies and Evaluation Metrics [0.7] 大規模言語モデル(LLM)は自然言語処理(NLP)と人工知能(AI)の発展のための有望な基盤として登場した。
この調査は、この領域における現在の研究の包括的概要を提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:50:52 GMT)
Spiking Transformers Need High Frequency Information [0.7] スパイキングトランスフォーマーは、従来のディープラーニングに代わるエネルギー効率の高い代替手段を提供する。
スパイキングニューロンが低周波情報を優先的に伝播するのは,今回が初めてである。
2つの周波数エンハンシング演算子を通して高周波信号を復元するMax-Formerを導入する。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:15:59 GMT)
Learning Fluid-Structure Interaction Dynamics with Physics-Informed Neural Networks and Immersed Boundary Methods [0.6] 物理インフォームドニューラルネットワーク(PINN)と没入境界法(IBM)を組み合わせて流体構造相互作用(FSI)問題を解決するニューラルネットワークアーキテクチャを導入する。
本手法は, 統一パラメータ空間を持つ単一FSIネットワークと, 流体領域と構造領域を分離したパラメータ空間を保持するイノベーティブなユーレリア・ラグランジアンネットワークの2つの異なるアーキテクチャを特徴とする。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:07:53 GMT)
Length independent generalization bounds for deep SSM architectures via Rademacher contraction and stability constraints [0.6] エンハンスタブルなSSMブロックを持つこの種のアーキテクチャを保持でき、入力シーケンスの長さに依存しないPACバウンダリを提供する。
提案手法は,SSMブロックの安定性が増大するにつれてPAC境界が減少するにつれて,安定なSSMブロックの使用を理論的に正当化するものである。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:52:01 GMT)
Application of the Cyberinfrastructure Production Function Model to R1 Institutions [0.5] 生産機能モデルが一般化され,コンピュータ資源やスタッフへの投資による制度的利益が肯定的であることが示唆された。
しかし、モデル入力とアウトプットの相対関係は機関によって異なり、しばしば理解可能な機関固有の要因に起因していると考えられる。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:44:29 GMT)
Measurement-free reconstruction circuit of quantum secrets in quantum secret sharing [0.5] 安定化符号に基づく量子シークレット共有における量子シークレットの無測定再構成回路を提案する。
我々の再構成回路は幅$k+|J|$で、$O(k|J|)$1または2量子のユニタリゲートからなる。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:29:16 GMT)
From Proxies to Fields: Spatiotemporal Reconstruction of Global Radiation from Sparse Sensor Sequences [0.4] TRONは22年間のシミュレーションデータに基づいて訓練され、65,341箇所で一般化されている。
TRONは、大気モデル、地球物理学的ハザードモニタリング、リアルタイム環境リスク予測など、スパースデータから科学分野を再構築するためのドメインに依存しないフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:24:10 GMT)
Advantage of multi-partite entanglement for quantum cryptography over long and short ranged networks [0.3] 汎用攻撃に対するGHZ状態ベース秘密共有プロトコルの亜種に対するセキュリティを示す。
次に、現実的なボトルネックネットワークよりもパフォーマンス上の優位性を示すパラメータを特定します。
量子リピータの追加は、ポイント・ツー・ポイントアプローチに対するマルチパーティ・エンタングルメントのパフォーマンス上の利点を解放する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:52:46 GMT)
Two-dimensional Parallel Tempering for Constrained Optimization [0.3] パワーパラレルテンパリングアルゴリズム(PT)の2次元拡張を導入する。
結果として得られる2次元並列テンパリングアルゴリズム(2D-PT)は、厳密な制約のあるレプリカの混合を改善する。
この方法は制約付きIsing問題に広く適用され、既存のIsingマシンにデプロイできる。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:41:45 GMT)
LLM-Driven APT Detection for 6G Wireless Networks: A Systematic Review and Taxonomy [0.3] 6GネットワークにおけるLPM支援APT検出のための総合的な体系的レビューと分類学的研究について述べる。
説明可能性のギャップ、データ不足、エッジハードウェアの制限、リアルタイムスライシング対応の必要性といったオープンな課題を特定します。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:42:11 GMT)
Disparity between multipartite entangling and disentangling powers of unitaries: Even vs Odd [0.2] 我々は、真のマルチパーティの絡み合いを発生または排除する能力を評価することによって、ユニタリ演算子の絡み合いと解り合いのパワーを比較する。
その結果, 対角ユニタリ作用素は等しくエンタングと非エンタングの能力を示すことができるが, 非対角ユニタリ演算子は, 完全に分離可能な状態に作用するときに不均衡を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:05:24 GMT)
Quantum algorithms for optimizers [0.2] この講義ノートは量子アルゴリズムのPh.D.レベルのコースのためのものである。
応用数学者や技術者向けに開発されており、以前の量子力学の背景を必要としない。
このコースの主なトピックは、厳密な計算モデルの導入に加えて、入出力モデル、量子探索、量子勾配アルゴリズム、行列演算アルゴリズム、半定値最適化のためのミラー降下フレームワークである。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:59:11 GMT)
What Do We Know About the Psychology of Insider Threats? [0.2] 本稿では,インサイダー脅威の心理学に関する体系的な文献レビューを行う。
文学は複数の異なる理論で運営されてきたが、心理学に関する堅牢な理論の欠如がまだ残っている。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:47:38 GMT)
A Quantum Approximation Scheme for k-Means [0.2] QRAMモデルにおける古典的な$k$-meansクラスタリング問題に対する量子近似スキームを提案する。
我々の量子アルゴリズムは、時間$tildeO left(2tildeO(frackvarepsilon) eta2 dright)$で実行される。
教師なし学習の以前の研究とは異なり、我々の量子アルゴリズムは量子線型代数のサブルーチンを必要としない。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:32:57 GMT)
Evaluating Intra-firm LLM Alignment Strategies in Business Contexts [0.1] 大規模言語モデル(LLM)は、認知タスクをサポートするために企業のAIアシスタントとして、ますます多くデプロイされている。
本稿は、企業がこれらのAIアシスタントの視点と目的と価値を意図的に一致させなければならない、と論じる。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:30:53 GMT)
Prediction of the Most Fire-Sensitive Point in Building Structures with Differentiable Agents for Thermal Simulators [0.1] 本稿では,MFSP(Mest Fire-Sensitive Point)の概念と,その識別のための効率的な機械学習フレームワークを提案する。
MFSPは、火災が開始すれば建物の安定性に最も深刻な有害な影響をもたらす場所と定義されている。
本フレームワークでは,従来の有限要素解析(FEA)シミュレータにおいて,グラフニューラルネットワーク(GNN)が効率的かつ微分可能なエージェントとして機能する。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:34:43 GMT)
End-to-End Framework for Predicting the Remaining Useful Life of Lithium-Ion Batteries [0.0] 本稿では、最近のチャージ放電サイクルのデータを利用して残りの使用可能なサイクル数を推定するRUL予測手法を提案する。
このアプローチは、新しい信号処理パイプラインとディープラーニング予測モデルの両方を導入している。
2つの一般公開された大規模データセットの実験結果から,提案手法がベースライン深層学習手法と機械学習技術より優れていることが示された。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:35:39 GMT)
AI-Driven Climate Policy Scenario Generation for Sub-Saharan Africa [0.0] 我々は、サハラ以南のアフリカの気候政策シナリオをシミュレートするために、ジェネレーティブAIを使用します。
このプロジェクトの目的は、地域気候の目標やエネルギーの課題に合わせて、多様で多様な政策シナリオを作成することである。
構造化された埋め込みベースの評価フレームワークは、生成AIが一貫性があり、関連性があり、信頼性があり、多様であるシナリオを効果的に生成していることを示している。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:38:17 GMT)
Vision Meets Language: A RAG-Augmented YOLOv8 Framework for Coffee Disease Diagnosis and Farmer Assistance [0.0] 本研究では,レトリーバル拡張世代(RAG)を用いて,作物病検出のための文脈認識診断および自然言語処理(NLP)とYOLOv8を提供する,AIに基づく新しい精密農業システムを提案する。
このシステムは,大規模言語モデル(LLM)における主要な問題,特に幻覚に対処し,適応的な治療計画とリアルタイム疾患検出を可能にすることを目的としている。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:51:34 GMT)
Vague Knowledge: Evidence from Analyst Reports [0.0] 我々は、曖昧な情報を伝える能力が異なる言語が、主観的な期待を表現する上で重要な役割を担っていると論じる。
彼らのレポートでは、アナリストは言語表現に有用な情報を含んでいるが、数値予測は含まない。
論文参考訳(メタデータ) (Sat, 24 May 2025 22:50:59 GMT)
VISTA: Vision-Language Inference for Training-Free Stock Time-Series Analysis [0.0] VISTA(Vision-Language Inference for Stock Time-Series Analysis)は,マルチモーダルストック予測のためのトレーニングフリーフレームワークである。
我々は、標準ベースラインに対してVISTAをベンチマークし、ARIMAやテキストのみのLLMベースのプロンプト手法を含む。
VISTAはこれらのベースラインを最大89.83%上回り、株価時系列分析におけるマルチモーダル推論の有効性を示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:20:14 GMT)
Usability of Token-based and Remote Electronic Signatures: A User Experience Study [0.0] 本研究では,トークンベースとリモートシグネチャという2つの主要な電子署名システムを実証的に評価し,比較する。
リモート電子署名はトークンベースのものよりもはるかに有用であると見なされる。
より多くの参加者が文書署名のために遠隔電子署名を好んだが、統計的には重要ではなかった。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:21:06 GMT)
Universal quantum control by non-Hermitian Hamiltonian [0.0] 非エルミート的ハミルトニアンは、完備かつ正則な基底状態の集合にまたがる制約図形で三角化することができる。
この理論は、普遍量子制御の枠組みを非エルミート量子力学の体系に実質的に一般化する。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:00:20 GMT)
Tunable Entanglement of Multi-Level Atoms in Photonic Crystals: Leveraging Resonant Dipole Interactions and Quantum Interference [0.0] 共振性双極子-双極子相互作用と量子干渉は、構造されたフォトニック環境における絡み合いのチューニングと安定化のための強力なツールであることを示す。
重要な発見は、共鳴相互作用が、バンドギャップによって誘導されるフォトニック境界状態の局在長と原子間距離が一致したとき、支配的であることを示している。
フォトニックバンドギャップの奥深くに原子励起状態を置くことで、エバネッセントモードを介する共鳴エネルギー交換の指数的抑制による絡み合い振動の減衰が促進されることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:15:03 GMT)
Trust, or Don't Predict: Introducing the CWSA Family for Confidence-Aware Model Evaluation [0.0] 信頼性重み付き選択精度(CWSA)と正規化変種CWSA+を紹介する。
CWSAは、信頼しきい値の下で予測モデルを評価するための原則的で解釈可能な方法を提供する。
CWSAとCWSA+は、信頼度の高いテストにおいて、ニュアンスド障害モードを効果的に検出し、古典的な指標より優れていることを示す。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:07:48 GMT)
Tropical Geometry Based Edge Detection Using Min-Plus and Max-Plus Algebra [0.0] 本稿では,分極代数と最大剰余代数を用いて畳み込みと勾配計算を再構成する,熱帯幾何学に基づくエッジ検出フレームワークを提案する。
熱帯の定式化は、支配的な強度の変動を強調し、より鋭く、より連続的なエッジ表現に寄与する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:19:27 GMT)
Toward a Cultural Co-Genesis of AI Ethics [0.0] 本稿では,「AI倫理の文化共生」という概念を通じて,代替的なビジョンを提供する。
文化を孤立した道徳体系の境界や容器と見なすのではなく、倫理的共同生産のための創造的空間であると主張する。
我々は、異文化間のAI倫理は倫理的なパッチワークではなく、モザイクとして見なされるべきである、と結論付けている。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:31:55 GMT)
Token Sampling Uncertainty Does Not Explain Homogeneity Bias in Large Language Models [0.0] 均質性バイアスは、平等な言語技術を作るための大きな障害である。
6つの大言語モデル間でトークンサンプリングの不確かさの体系的差異によってバイアスが引き起こされるかどうかを検証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:54:42 GMT)
StandUp4AI: A New Multilingual Dataset for Humor Detection in Stand-up Comedy Videos [0.0] 7つの言語でスタンドアップコメディーのマルチモーダルデータセットを提案する。
データセット全体が自動的にアノテートされます。
本稿では,音声認識誤りに基づく自動笑い検出手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:31:52 GMT)
Spore in the Wild: Case Study on Spore.fun, a Real-World Experiment of Sovereign Agent Open-ended Evolution on Blockchain with TEEs [0.0] Spore.funは、新しいオンチェーンエージェントの自律的な育種と進化を可能にする、現実世界のAI進化実験である。
本稿では,Spore.funの詳細なケーススタディとして,エージェントの行動とその進化的軌跡をデジタルエコロジーを用いて検討する。
論文参考訳(メタデータ) (Sat, 24 May 2025 14:42:36 GMT)
Spatial correlations and entanglement in a hybrid system of N fermion pairs with harmonic interaction [0.0] 本研究は,2種の相互作用種の調和性に制限されたフェルミオンの対をN$で構成したシステムの異なる二分割にまたがる基底状態の絡み合いについて検討した。
強い誘惑的な状態のフェルミオンは閉じ込められた領域に局在する傾向にあり、一方、パウリの排除は同一粒子間の空間的反発を誘導する。
強い反発状態において、システムは2つの空間的に異なる領域に相分離する。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:47:39 GMT)
Simulating quantum circuits with arbitrary local noise using Pauli Propagation [0.0] 本稿では,任意の局所雑音下での典型的な量子回路上での任意の観測値の期待値を推定するための古典的アルゴリズムを提案する。
パウリパス法を用いて効率よくシミュレートできるので、これは平均ケース回路には適用されない。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:59:24 GMT)
Shortcut to spin dynamics for quantum mixtures [0.0] 強い反発性原子ガス混合物の長時間の力学に短時間でアクセスできることを示す。
映画プレーヤーの次のチャプターボタンが、観たい映画の一部に素早く届くようにしているように、それは未来への飛躍だ。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:36:48 GMT)
SerendibCoins: Exploring The Sri Lankan Coins Dataset [0.0] 硬貨の認識と分類は多くの金融・自動化システムにおいて不可欠である。
本研究では、スリランカのコイン画像データセットを包括的に導入し、コイン分類における機械学習モデル精度への影響を評価する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:45:59 GMT)
Securing Credit Inquiries: The Role of Real-Time User Approval in Preventing SSN Identity Theft [0.0] 信用調査は、アイデンティティー盗難の中心的なエントリポイントである。
従来の信用調査システムは、通常は厳格なユーザー認証を持っていない。
本稿では,ユーザ承認を明示することによるセキュリティ向上を目的としたリアルタイムユーザ認証システムを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 20:41:34 GMT)
Scientific machine learning in Hydrology: a unified perspective [0.0] 科学機械学習(SciML)は、物理知識をデータ駆動モデリングに統合するための構造化されたアプローチを提供する。
物理インフォームド機械学習、物理誘導機械学習、ハイブリッド物理マシンラーニング、データ駆動型物理発見など、複数の方法論ファミリが出現している。
本稿では,SciMLファミリーごとに統一された方法論的枠組みを提案し,概念的明確性を促進するコヒーレントな構造にコントリビューションをまとめる。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:21:10 GMT)
Quantum computing with atomic qubit arrays: confronting the cost of connectivity [0.0] 量子ビット数へのデジタル量子コンピューティングのスケーリングとフィデリティの制御は、注目すべき課題である。
長距離のRydbergゲートと物理モーションは、接続を確立するためのツールを備えた原子量子ビットアレイを構成する。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:38:56 GMT)
PacTrain: Pruning and Adaptive Sparse Gradient Compression for Efficient Collective Communication in Distributed Deep Learning [0.0] PacTrainは、プルーニングとスパース勾配圧縮を組み合わせることで、分散トレーニングを加速する新しいフレームワークである。
PacTrain圧縮方式は,全再生プリミティブとの互換性を維持しつつ,ほぼ最適圧縮戦略を実現する。
論文参考訳(メタデータ) (Sat, 24 May 2025 07:06:36 GMT)
On the time-dependent Born-Oppenheimer Approximation [0.0] ボルンとオッペンハイマーの元々の考えでは、分子進化の近似を定量的に研究している。
分子進化を任意の順序で反復的に近似する。
分子動力学の抽出可能な近似は、もともとのボルン・アンド・オッペンハイマー近似に対応するものを超える。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:48:58 GMT)
Nonlinear optical analogues of quantum phase transitions in a squeezing-enhanced LMG model [0.0] 四角形対称性を持つ光ファイバの励起状態量子相転移について検討する。
偏光力学における古典的分岐を誘導する新しいスクイージング効果を解析により明らかにした。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:55:44 GMT)
Natural revision is contingently-conditionalized revision [0.0] 自然の修正はとても自然なように思える。
しかし、いくつかの反例は間違っていることを示している。
これは、ある場合には正しく、ある場合には間違っている。
論文参考訳(メタデータ) (Sat, 24 May 2025 05:24:45 GMT)
Multilingual Question Answering in Low-Resource Settings: A Dzongkha-English Benchmark for Foundation Models [0.0] ブータンの中学校と高校生を対象に、Dzongkhaと英語の同時テスト質問のデータセットを提供する。
私たちのコレクションにある5万以上の質問は、さまざまな科学的トピックに及び、事実、応用、推論に基づく質問を含む。
並列データセットを用いて、多数のLarge Language Model(LLM)をテストし、英語とDzongkhaのモデル間で大きなパフォーマンス差を見出した。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:01:05 GMT)
Memory-Efficient Super-Resolution of 3D Micro-CT Images Using Octree-Based GANs: Enhancing Resolution and Segmentation Accuracy [0.0] 本稿では, 生成モデルを用いた3次元マイクロCT画像の品質向上のためのメモリ効率のアルゴリズムを提案する。
提案モデルでは, 分解能が16倍に向上し, 異なる鉱物のマイクロCT測定において, 重なり合うX線減衰によるセグメンテーションの不正確さを補正する。
このフレームワークは細孔のキャラクタリゼーションと鉱物の分化を著しく改善し、現代の地質画像における主要な計算限界の1つに対する堅牢な解を提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 11:57:08 GMT)
Mal-D2GAN: Double-Detector based GAN for Malware Generation [0.0] Mal-D2GANモデルは二重検出器と最小二乗損失関数で設計され、20,000サンプルのデータセットでテストされた。
その結果,Mal-D2GANモデルにより,8つのマルウェア検出装置の検出精度(真の正の率)が低下した。
論文参考訳(メタデータ) (Sat, 24 May 2025 17:38:28 GMT)
Machine Theory of Mind and the Structure of Human Values [0.0] 人間の価値は生成的合理的な構造を持ち、それによって価値一般化の問題を解決することができると私は主張する。
生成的価値から価値への推論の開発は、スケーラブルなマインド理論を実現する上で重要な要素である、と私は結論付けます。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:18:58 GMT)
MSA at BEA 2025 Shared Task: Disagreement-Aware Instruction Tuning for Multi-Dimensional Evaluation of LLMs as Math Tutors [0.0] 我々は,4つの教科領域にわたるAI教師の応答を評価するために,BEA 2025共有タスクを提出する。
このアプローチでは、統一的なトレーニングパイプラインを使用して、すべてのトラックにまたがる1つの命令チューニング言語モデルを微調整します。
本システムでは,全トラックにまたがって高い性能を達成し,第1位,第3位,第3位,ミスタケ識別とミスタケ位置情報の両方で第4位にランクインした。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:32:02 GMT)
Large Angular Momentum [0.0] スピン $tfrac12$ ( a qubit) の量子状態は、ブロッホ球面の空間 $mathbf CP1 sim S2$ によってパラメータ化される。
一般的な$j$に対するスピン$j$は、より大きな空間の点である$mathbf CP2j$で表される。
本稿では,Stern-Gerlach過程,角-モーメント組成則,回転行列を解析することにより,これらの問題について議論する。
論文参考訳(メタデータ) (Sat, 24 May 2025 10:33:04 GMT)
Interpretable Company Similarity with Sparse Autoencoders [0.0] スパースオートエンコーダ(SAE)は、大規模言語モデル(LLM)の解釈可能性を高めることを約束している。
SAEの機能をSICコード、産業コード、埋め込みに対してベンチマークします。
以上の結果から,SAEはセクターの分類や組込みを超越し,企業特性を把握できた。
論文参考訳(メタデータ) (Sat, 24 May 2025 15:21:24 GMT)
Image denoising as a conditional expectation [0.0] 最も一般的な手法は、ある部分空間への射影として真像を推定するものである。
本稿では,ある確率空間から抽出されたサンプルの集合としての雑音像の解釈を提案する。
本稿では,実画像が条件付き期待値として復元されるデータ駆動型復調手法を提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 21:30:56 GMT)
Identifying Legal Holdings with LLMs: A Systematic Study of Performance, Scale, and Memorization [0.0] 現代大言語モデル(LLM)の性能を評価するための一連の実験について述べる。
このタスクのパフォーマンスはモデルのサイズによって改善されます。
事例名や引用が事実であることを保証しながら意味的意味を保った新しい引用匿名化テストを利用する。
論文参考訳(メタデータ) (Sat, 24 May 2025 19:09:19 GMT)
Fully tensorial approach to hypercomplex neural networks [0.0] ニューラルネットワークは任意の代数に基づく算術を使うことができる。
鍵となる点は、代数乗法が階数 3 のテンソルとして表せることを観察することである。
論文参考訳(メタデータ) (Sat, 24 May 2025 18:43:53 GMT)
EdgeAgentX: A Novel Framework for Agentic AI at the Edge in Military Communication Networks [0.0] 本稿では,統合学習(FL),マルチエージェント強化学習(MARL),敵防衛機構を統合した新しいフレームワークであるEdgeAgentXを紹介する。
EdgeAgentXは、自律的な意思決定を大幅に改善し、レイテンシを低減し、スループットを向上し、敵の破壊に耐える。
論文参考訳(メタデータ) (Sat, 24 May 2025 01:56:32 GMT)
Convergence, Sticking and Escape: Stochastic Dynamics Near Critical Points in SGD [0.0] 一次元景観におけるグラディエントDescentの収束特性とエスケープダイナミクスについて検討する。
我々の主な焦点は、SGDが同じ 'basin'' において初期点から局所最小点へ確実に移動する時間スケールを特定することである。
以上の結果から,SGDの局所的最大値と最小値の推移は,ノイズ特性と機能幾何学的特徴の両方に影響されることが明らかとなった。
論文参考訳(メタデータ) (Sat, 24 May 2025 06:00:45 GMT)
Chemical classification program synthesis using generative artificial intelligence [0.0] 本研究では、生成人工知能を用いて、ChEBI(Chemical Entities of Biological Interest)データベース内のクラスのための化学分類プログラムを自動作成する手法を提案する。
C3PO(ChEBI Chemical Class Ontology)と呼ばれる化学クラス命名法について説明可能な存在論的モデルを構成するプログラムである。
また, メタボロミクスや天然物データベースから抽出したアウト・オブ・ディストリビューションの例を分類するために, C3POを用いても実証する。
論文参考訳(メタデータ) (Sat, 24 May 2025 02:21:33 GMT)
Challenges for artificial cognitive systems [0.0] 『変化』は未来を予言するものではなく、何を目的とし、何が進歩を成すかの指針である」
認識システムは経験から学び、獲得した知識を使って自身の目標を達成するシステムである。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:49:54 GMT)
Causal Discovery in Dynamic Fading Wireless Networks [0.0] 本稿では,逐次回帰に基づくアルゴリズムの提案により,無線環境における因果推論の課題に対処する。
構造変化の同定に要する検出遅延の理論的下限と上限を導出し,ネットワークサイズ,ノイズ分散,フェージング重大度への依存性を明示的に定量化する。
本研究は,非定常無線環境下でのネットワーク信頼性を維持するために,ロバストなオンライン因果推論機構を設計するための厳密な理論的洞察と実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:59:48 GMT)
Building a Functional Machine Translation Corpus for Kpelle [0.0] 本稿では,機械翻訳のための英語-Kpelleデータセットについて紹介する。
データセットの2つのバージョンでMetaのNo Language Left Behind(NLLB)モデルを微調整することにより、Kpelle-to- English方向のBLEUスコアを最大30まで達成した。
論文参考訳(メタデータ) (Sat, 24 May 2025 23:39:34 GMT)
Augmenting the action space with conventions to improve multi-agent cooperation in Hanabi [0.0] カードゲーム「はなび」は、マルチエージェント強化学習アルゴリズムのテストと開発のための強力な媒体であると考えられている。
従来,ハナビにおけるMARLアルゴリズムの能力について検討されてきた。
本稿では,エージェントの行動空間をコンベンションを用いて拡張するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 24 May 2025 12:49:59 GMT)
An Artificial Intelligence Model for Early Stage Breast Cancer Detection from Biopsy Images [0.0] 本稿では,乳がんのタイプ識別を支援する人工知能ツールを提案する。
提案モデルは、良性組織と悪性組織を区別するために、畳み込みニューラルネットワーク(CNN)アーキテクチャを利用する。
このようなデータセットの実験結果は、モデルの有効性を示し、精度、精度、リコール、F1スコアの点で、既存のソリューションよりも優れています。
論文参考訳(メタデータ) (Sat, 24 May 2025 09:11:50 GMT)
AI Identity, Empowerment, and Mindfulness in Mitigating Unethical AI Use [0.0] 本研究では,大学生の心理的エンパワーメントと非倫理的AI行動にAIアイデンティティがどのような影響を及ぼすかを検討する。
発見によると、強いAIアイデンティティは心理的エンパワーメントと学術的エンゲージメントを高めるが、非倫理的なAIプラクティスの増加につながる可能性がある。
ITマインドフルネスは倫理的保護として機能し、倫理的懸念に対する感受性を促進し、AIの誤用を減らす。
論文参考訳(メタデータ) (Sat, 24 May 2025 08:18:38 GMT)
ACSE-Eval: Can LLMs threat model real-world cloud infrastructure? [0.0] 本稿では,大規模言語モデルを評価するための新しいデータセットであるAWS Cloud Security Engineering Evalを紹介する。
ACSE-Evalには、100のプロダクショングレードのAWSデプロイメントシナリオが含まれており、それぞれが詳細なアーキテクチャ仕様を備えている。
本データセットは,LLMのセキュリティリスクを特定し,攻撃ベクトルを分析し,緩和戦略を提案するためのシステム評価を可能にする。
論文参考訳(メタデータ) (Sat, 24 May 2025 03:07:23 GMT)
A generalised editor calculus (Short Paper) [0.0] 本稿では、構文指向のエディタ計算を一般化し、任意の言語に対して特別な構文指向のエディタをインスタンス化することができる。
エディタ計算は、不完全なプログラムを許容しながら、構文上のエラーがないことを保証します。
論文参考訳(メタデータ) (Sat, 24 May 2025 16:30:44 GMT)
A fast algorithm to minimize prediction loss of the optimal solution in inverse optimization problem of MILP [0.0] 混合整数線形プログラム(MILP)の目的関数の重みを推定する逆最適化問題を考える。
本稿では,提案手法が効率よく重みを学習できることを示し,実証する。
実験により,提案手法はMILPの逆最適化問題を1/7ドル以下で解決することを示した。
論文参考訳(メタデータ) (Sat, 24 May 2025 13:02:20 GMT)