Synthia: Novel Concept Design with Affordance Composition [114.2] 所望の価格に基づいて,新規で機能的なコヒーレントなデザインを生成するためのフレームワークであるSynTHIAを紹介する。
我々は,我々のオントロジーに基づくカリキュラム学習手法を開発し,細粒度T2Iモデルと対比して,段階的に手頃な構成を学習する。
実験の結果,SynTHIAは最先端のT2Iモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:54:11 GMT)
Towards Thinking-Optimal Scaling of Test-Time Compute for LLM Reasoning [113.5] 近年の研究では、モデルをより長い思考の連鎖(CoTs)を通して考える時間を増やすことで、複雑な推論タスクにおいて大幅な改善が得られることが示されている。
より長いCoTによるスケーリングが、特定のドメインにおけるLarge Language Model(LLM)の推論性能を損なうかどうかを考察する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:48:05 GMT)
MM-PoisonRAG: Disrupting Multimodal RAG with Local and Global Poisoning Attacks [109.5] Retrieval Augmented Generation (RAG) を備えたマルチモーダル大言語モデル(MLLM)
RAGはクエリ関連外部知識の応答を基盤としてMLLMを強化する。
この依存は、知識中毒攻撃(英語版)という、危険だが未発見の安全リスクを生じさせる。
本稿では,2つの攻撃戦略を持つ新しい知識中毒攻撃フレームワークMM-PoisonRAGを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:23:59 GMT)
An Overview of Large Language Models for Statisticians [109.4] 大規模言語モデル(LLM)は人工知能(AI)の変換ツールとして登場した。
本稿では, 統計学者がLLMの開発に重要な貢献できる可能性について考察する。
我々は不確実性定量化、解釈可能性、公正性、プライバシー、透かし、モデル適応といった問題に焦点を当てる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:40:36 GMT)
ART: Anonymous Region Transformer for Variable Multi-Layer Transparent Image Generation [108.7] 可変多層透明画像の直接生成を容易にするAnonymous Region Transformer(ART)を導入する。
正確な制御とスケーラブルなレイヤ生成を可能にすることで、ARTはインタラクティブなコンテンツ作成のための新しいパラダイムを確立します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:57:04 GMT)
LUME: LLM Unlearning with Multitask Evaluations [106.8] Unlearningは、大規模な言語モデル(LLM)から著作権のある、機密性の高い、あるいはプライベートなコンテンツを、完全に再トレーニングすることなく削除することを目的としている。
本研究では,(1)未学習の創造的短編小説,(2)機密情報付き未学習の合成バイオグラフィー,(3)公開バイオグラフィーのコレクションの3つのタスクを特徴とするマルチタスク・アンラーニング・ベンチマーク(LUME)を開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:52:45 GMT)
Synthesizing Consistent Novel Views via 3D Epipolar Attention without Re-Training [102.8] 大規模な拡散モデルでは、単一画像からの新規なビュー合成において顕著なゼロショット機能を示す。
これらのモデルは、新規および参照ビュー間の一貫性を維持する上で、しばしば課題に直面します。
入力ビューから重なり合う情報の探索と検索にエピポーラ幾何を用いることを提案する。
この情報はターゲットビューの生成に組み込まれ、トレーニングや微調整の必要がなくなる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:04:22 GMT)
Towards Effective Evaluations and Comparisons for LLM Unlearning Methods [97.3] 本稿では,大規模言語モデルにおける機械学習評価の精度向上を図る。
評価指標の堅牢性と、競合する目標間のトレードオフという、2つの重要な課題に対処します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:42:38 GMT)
Towards Certification of Uncertainty Calibration under Adversarial Attacks [96.5] 攻撃はキャリブレーションを著しく損なう可能性を示し, 対向的摂動下でのキャリブレーションにおける最悪のキャリブレーション境界として認定キャリブレーションを提案する。
我々は,新しいキャリブレーション攻撃を提案し,テクスタディバーショナルキャリブレーショントレーニングによりモデルキャリブレーションを改善する方法を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:19:07 GMT)
Uncertainty-aware abstention in medical diagnosis based on medical texts [87.9] 本研究は,AI支援医療診断における信頼性の重要課題について論じる。
本研究は,診断に自信がなければ,診断システムによる意思決定の回避を可能にする選択予測手法に焦点をあてる。
我々は、選択予測タスクにおける信頼性を高めるための新しい最先端手法であるHUQ-2を紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:15:21 GMT)
DRAMA: Diverse Augmentation from Large Language Models to Smaller Dense Retrievers [86.5] 大規模言語モデル(LLM)は、高密度レトリバーとして微調整されている間、強い有効性と堅牢性を示している。
LLMは効率が良いが、教師付き微調整データで効率的に一般化できないことが多い。
我々は、LLMを活用してより小さな一般化可能な高密度レトリバーを訓練するトレーニングフレームワークであるDRAMAを紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:59:07 GMT)
On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.8] 本研究では,(マルチモーダル)自己教師型表現学習のデータ予測タスクにおいて,連続領域における識別確率モデルについて検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
MISが要求する条件付き確率密度の和を近似する新しい非パラメトリック手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:05:15 GMT)
Learning and Computation of $Φ$-Equilibria at the Frontier of Tractability [85.1] $Phi$-equilibriaは、オンライン学習とゲーム理論の中心にある、強力で柔軟なフレームワークだ。
効率的なオンラインアルゴリズムは、$textpoly(d, k)/epsilon2$ラウンドを使用して、平均$Phi$-regretを最大$epsilon$で生成することを示す。
また、オンライン設定において、ほぼ一致した下限を示し、その結果、$Phi$-regretの学習可能性を取得する偏差の族が初めて得られる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:08:26 GMT)
ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation [83.6] 本稿では,長期ビデオ生成のための自己回帰モデルを用いた拡散変換器を高速化するフレームワークARLONを提案する。
潜在ベクトル量子変分オートコーダ(VQ-VAE)は、DiTモデルの入力潜時空間をコンパクトなビジュアルトークンに圧縮する。
適応ノルムベースのセマンティックインジェクションモジュールは、ARモデルから粗い離散視覚ユニットをDiTモデルに統合する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:06:12 GMT)
Distributional Diffusion Models with Scoring Rules [83.4] 拡散モデルは高品質な合成データを生成する。
高品質な出力を生成するには、多くの離散化ステップが必要です。
クリーンデータサンプルの後部エム分布を学習し,サンプル生成を実現することを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:21:21 GMT)
Diffusion Models in Low-Level Vision: A Survey [82.8] 拡散モデルに基づくソリューションは、優れた品質と多様性のサンプルを作成する能力で広く称賛されている。
本稿では,3つの一般化拡散モデリングフレームワークを提案し,それらと他の深層生成モデルとの相関関係について検討する。
医療、リモートセンシング、ビデオシナリオなど、他のタスクに適用された拡張拡散モデルについて要約する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:53:24 GMT)
Guiding not Forcing: Enhancing the Transferability of Jailbreaking Attacks on LLMs via Removing Superfluous Constraints [81.1] 本研究の目的は,勾配に基づくジェイルブレイク手法の伝達可能性を理解し,向上することである。
本稿では,トランスファービリティを解明し,過剰な制約を識別するための新しい概念的枠組みを提案する。
提案手法は, 安全レベルを18.4%から50.3%に変化させたターゲットモデル全体のトランスファー攻撃成功率(T-ASR)を増加させる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:47:41 GMT)
OmniAlign-V: Towards Enhanced Alignment of MLLMs with Human Preference [80.4] オープンソースのマルチモーダル大規模言語モデル(MLLM)の最近の進歩は,基礎的能力の向上に重点を置いている。
OmniAlign-Vは,多彩な画像,複雑な質問,さまざまな応答形式を含む200Kの高品質なトレーニングサンプルのデータセットである。
実験の結果,OmniAlign-Vを用いたMLLMの微調整は,SFT(Supervised Fine-Tuning)やDPO(Direct Preference Optimization)を用いることで,人間の嗜好のアライメントを著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:05:14 GMT)
FACT-AUDIT: An Adaptive Multi-Agent Framework for Dynamic Fact-Checking Evaluation of Large Language Models [79.4] 大規模言語モデル(LLM)はファクトチェック研究を大幅に進歩させた。
既存のファクトチェック評価手法は静的データセットと分類基準に依存している。
本稿では, LLMのファクトチェック機能を適応的かつ動的に評価するエージェント駆動型フレームワークであるFACT-AUDITを紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:44:22 GMT)
AgentRM: Enhancing Agent Generalization with Reward Modeling [78.5] 報酬モデルを微調整して政策モデルを導くことは、政策モデルを直接微調整するよりも、より堅牢であることがわかった。
本稿では,効率的なテスト時間探索のためのポリシーモデルを導出するために,一般化可能な報酬モデルであるAgentRMを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:58:02 GMT)
Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference [78.1] 視覚大言語モデル(VLLM)の知識境界を検出する手法を提案する。
本稿では,VLLMの知識境界の表現に成功し,性能の維持や改善を図りながら不差別な検索を抑えることができることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:32:08 GMT)
From System 1 to System 2: A Survey of Reasoning Large Language Models [76.5] 基礎的な大規模言語モデルは、迅速な意思決定では優れているが、複雑な推論には深みがない。
OpenAIのo1/o3とDeepSeekのR1は、数学やコーディングといった分野のエキスパートレベルのパフォーマンスを実証している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:15:00 GMT)
Guiding Through Complexity: What Makes Good Supervision for Hard Math Reasoning Tasks? [74.9] 複雑さの異なるタスクにおいて、様々な品質レベルで監視データを提供する様々なデータ駆動戦略について検討する。
ハードタスクの監視における結果エラー率が高い場合でも、そのようなデータによるトレーニングは、より簡単なサブタスクの監督を完璧に上回ります。
また,本研究の結果から,タスク・インスペクションとサブタスク・インスペクションを補完することで,顕著なパフォーマンス向上が期待できることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:59:55 GMT)
LeanProgress: Guiding Search for Neural Theorem Proving via Proof Progress Prediction [74.8] 証明の進捗を予測する手法であるLeanProgressを紹介します。
実験の結果、LeanProgressは全体の予測精度が75.1%に達することがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:46:36 GMT)
ASurvey: Spatiotemporal Consistency in Video Generation [72.8] 動的視覚生成手法を利用した映像生成手法は人工知能生成コンテンツ(AIGC)の境界を押し下げる
最近の研究は、映像生成における時間的一貫性の問題に対処することを目的としているが、この観点からの文献レビューはほとんど行われていない。
基礎モデル,情報表現,生成スキーム,後処理技術,評価指標の5つの重要な側面を網羅して,映像生成の最近の進歩を体系的に検討した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:20:51 GMT)
A Cooperative Multi-Agent Framework for Zero-Shot Named Entity Recognition [71.6] ゼロショット名付きエンティティ認識(NER)は、注釈のないテキストコーパスからエンティティ認識システムを開発することを目的としている。
最近の研究は、特別なプロンプトテンプレートを作成することで、ゼロショットNERに大規模な言語モデル(LLM)を適用している。
ゼロショットNERのための新しいフレームワークである協調型マルチエージェントシステム(CMAS)を紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:30:43 GMT)
The Hidden Risks of Large Reasoning Models: A Safety Assessment of R1 [70.9] 本稿では,OpenAI-o3およびDeepSeek-R1推論モデルの総合的安全性評価を行う。
本研究では, 現実の応用における強靭性を評価するために, ジェイルブレイクやインジェクションなどの敵攻撃に対する感受性について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:55:11 GMT)
Systems and Algorithms for Convolutional Multi-Hybrid Language Models at Scale [68.7] 本稿では,2つの簡単な観測に基づいて,畳み込み型マルチハイブリッドアーキテクチャを提案する。
ハイブリッドモデルのオペレータは、インコンテキストリコール、マルチトークンリコール、圧縮などのトークン操作タスクにカスタマイズできる。
我々は、最適化されたトランスフォーマーの1.2倍から2.9倍、以前の世代のハイブリッドの1.1倍から1.4倍の速さでエンドツーエンドを訓練する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:47:20 GMT)
UniGS: Unified Language-Image-3D Pretraining with Gaussian Splatting [68.4] マルチモーダルプレトレーニングに3Dガウススティング(3DGS)を組み込んだUniGSを提案する。
より汎用的で強力なマルチモーダル表現の学習におけるUniGSの有効性を実証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:10:22 GMT)
CBQ: Cross-Block Quantization for Large Language Models [66.8] ポストトレーニング量子化(PTQ)は、超低コストで大規模言語モデル(LLM)を圧縮する上で重要な役割を果たしている。
LLMのためのクロスブロック再構成に基づくPTQ手法CBQを提案する。
CBQはリコンストラクションスキームを使用してクロスブロック依存関係を採用し、エラーの蓄積を最小限に抑えるために複数のブロックにまたがる長距離依存関係を確立する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:14:18 GMT)
Defense Against Prompt Injection Attack by Leveraging Attack Techniques [66.7] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを実現している。
LLMが進化を続けるにつれて、新しい脆弱性、特にインジェクション攻撃が発生する。
近年の攻撃手法は, LLMの命令追従能力とデータ内容に注入された命令を識別する能力を活用している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:17:31 GMT)
Your Language Model May Think Too Rigidly: Achieving Reasoning Consistency with Symmetry-Enhanced Training [66.5] 我々は、文脈から有用な情報を抽出する能力を向上させるデータ中心のアプローチであるsyMmetry-ENhanceD (MEND) Data Augmentationを提案する。
推論連鎖の増大を強調する既存の手法とは異なり,本手法は知識抽出段階におけるモデルロバスト性を向上させる。
論理的および算術的推論タスクの実験は、MENDが様々なクエリのバリエーションで推論性能を向上させることを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:03:35 GMT)
CLIPure: Purification in Latent Space via CLIP for Adversarially Robust Zero-Shot Classification [65.5] 画像とテキストプロンプトをマッチングすることでゼロショット分類を行うことができる、視覚言語で事前訓練されたエンコーダモデルであるCLIPについて検討する。
次に, 共分散精製プロセス間のKL分散として精製リスクを定式化する。
画像の潜伏ベクトルの確率をモデル化するCLI-Diffと、画像の埋め込みとaの写真とのコサイン類似度をモデル化するCLI-Cosの2つのバリエーションを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:09:34 GMT)
Scalable Best-of-N Selection for Large Language Models via Self-Certainty [65.3] Best-of-N選択は、大規模言語モデルの推論性能を改善するための重要なテクニックである。
本稿では,外部報酬モデルを必要とすることなく,応答品質を推定する新規かつ効率的な指標である自己確実性を提案する。
本研究は, LLM推論能力を向上させるための実用的で効率的な方法として, 自己確実性を確立した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:08:07 GMT)
Everything is Editable: Extend Knowledge Editing to Unstructured Data in Large Language Models [65.1] 本稿では,非構造化知識編集手法,すなわちUnKEを提案する。
そこで本研究では,非局所ブロック鍵値記憶方式を提案する。
トークンのディメンションでは、コンテキストを保存しながら最後のトークンを直接編集する"期間駆動最適化"を"原因駆動最適化"に置き換えます。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:33:47 GMT)
WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling [63.9] 言語モデルの重要な構成要素は、高次元の自然信号を低次元の離散トークンに圧縮するトークン化器である。
本稿では,従来の音響領域におけるSOTA音響モデルよりもいくつかの利点があるWavTokenizerを紹介する。
WavTokenizerは、優れたUTMOSスコアを持つ最先端の再構築品質を実現し、本質的によりリッチなセマンティック情報を含んでいる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:45:12 GMT)
Generative Models in Decision Making: A Survey [63.7] 生成モデルは、高逆状態反応領域や中間部分ゴールへエージェントを誘導する軌道を生成することによって意思決定システムに組み込むことができる。
本稿では,意思決定タスクにおける生成モデルの適用について概説する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:01:55 GMT)
Multimodality Helps Few-shot 3D Point Cloud Semantic Segmentation [61.9] FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
テキストラベルと潜在的に利用可能な2次元画像モダリティを利用したマルチモーダルFS-PCS構成を提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダル(TACC)技術を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:23:21 GMT)
CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.8] 人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:32:21 GMT)
Discriminative Finetuning of Generative Large Language Models without Reward Models and Preference Data [61.5] Supervised Fine-tuning (SFT) と Prefery Optimization (PO) は、事前訓練された大規模言語モデル(LLM)を改善するための標準となっている。
本稿では、嗜好データを必要としない新しいアプローチであるDFTを紹介する。
i) 答えの識別可能性を明確にモデル化した微調整LDMの識別確率フレームワーク、(ii) この識別確率を最適化するための効率的なアルゴリズム、(iii) DFTの有効性を実証する広範囲な実験、そして、SFTよりも優れた性能を達成し、そうでなければ同等である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:38:55 GMT)
Decoupled Graph Energy-based Model for Node Out-of-Distribution Detection on Heterophilic Graphs [61.2] グラフ学習におけるノードのOOD検出は未探索のままである。
GNNSafeは、最先端の性能を持つグラフ領域にエネルギーベースの検出を適用した。
本稿では,学習過程をノード表現のためのトポロジ情報を利用するグラフエンコーダと,遅延空間で動作するエネルギーヘッドの2つの部分に分解するDeGEMを紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:20:00 GMT)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [60.1] 本稿では,AI生成コンテンツ分類器におけるグループ固有のしきい値最適化アルゴリズムであるFairOPTを紹介する。
我々のアプローチは、属性(例えば、テキストの長さと書き込みスタイル)に基づいて、データをサブグループに分割し、各グループの決定しきい値を学ぶ。
我々のフレームワークは、AIが生成する出力検出において、より堅牢で公平な分類基準の道を開く。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:34:30 GMT)
Learning System Dynamics without Forgetting [60.1] 本研究では,CDL(Continuous Dynamics Learning)の問題,タスク構成の検証,既存手法の適用性について検討する。
本稿では、LG-ODEとサブネットワーク学習の長所をモデムスイッチングモジュールと統合したモードスイッチンググラフODE(MS-GODE)モデルを提案する。
CDLのための生体動態システムの新しいベンチマーク、Bio-CDLを構築し、異なるダイナミクスを持つ多様なシステムを特徴付ける。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:14:10 GMT)
FactReasoner: A Probabilistic Approach to Long-Form Factuality Assessment for Large Language Models [59.2] 本稿では,確率論的推論に依拠した新たな事実性評価器FactReasonerを提案する。
ラベル付きおよびラベルなしのベンチマークデータセットの実験は、FactReasonerが最先端のプロンプトベースのアプローチよりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:01:48 GMT)
Uncertainty Quantification in Retrieval Augmented Question Answering [57.1] 本稿では,QAモデルが備える通路の有効性を推定することで,QAモデルの不確実性を定量化する。
我々は、目標QAモデルの通過効率を予測するために軽量ニューラルネットワークを訓練し、単純な情報理論のメトリクスが解の正しさをある程度予測できる一方で、より高価なサンプリングベースの手法を効率的に近似または上回ることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:24:52 GMT)
Disambiguate First Parse Later: Generating Interpretations for Ambiguity Resolution in Semantic Parsing [56.8] 本稿では, 自然言語の解釈を論理形式にマッピングする前に, あいまいさを解消するモジュラー手法を提案する。
我々のアプローチは解釈のカバレッジを改善し、異なるアノテーションスタイル、データベース構造、あいまいさタイプを持つデータセットをまたいだ一般化を行う。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:42:26 GMT)
Towards Enhanced Immersion and Agency for LLM-based Interactive Drama [55.8] 本論文は,対話型ドラマを2つの側面から理解することから始まる:没入感,プレイヤーの物語への参加感,エージェンシーである。
これら2つの側面を強化するために,我々はまず,LLMが劇的なストーリーを製作し,構造と物語の質を大幅に向上させる新しい手法であるPlaywriting-Guided Generationを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:06:16 GMT)
Scattered Forest Search: Smarter Code Space Exploration with LLMs [55.7] 進化的探索において,解の多様性を向上し,フィードバックを有効活用する新しい手法であるSCATTERED FOREST SEARCH(SFS)を提案する。
本手法は,木探索,線探索,繰り返しサンプリングなど,既存の探索手法よりも効率よくスケールする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:17:46 GMT)
Can Multimodal LLMs Perform Time Series Anomaly Detection? [55.5] 時系列異常検出(TSAD)におけるMLLM評価のためのVisualTimeAnomalyベンチマークを提案する。
提案手法は時系列の数値データを画像形式に変換し,これらの画像を様々なMLLMにフィードする。
VisualTimeAnomalyには3つのシナリオと3つの異常な粒度の12.4kの時系列イメージがあり、8つのMLLMに9つの異常型がある。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:37:43 GMT)
How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM? [55.3] ローランク適応(ローランク適応、LoRA)は、大規模言語モデルの更新やドメイン固有適応のための一般的かつ効率的な訓練手法である。
これまでに学習した知識を損なうことなく, LoRA を用いて LLM に新たな事実を組み込む方法について検討した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:37:01 GMT)
LLM-NEO: Parameter Efficient Knowledge Distillation for Large Language Models [54.9] 知識蒸留(KD)は、大規模言語モデル(LLM)を圧縮する主要な方法である。
本研究は,LoRAをKDに統合し,知識伝達効率を向上させるパラメータ効率の高い知識蒸留法 LLM-NEO を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:42:57 GMT)
A Landscape-Aware Differential Evolution for Multimodal Optimization Problems [54.5] マルチモーダル最適化問題(MMOP)を解く上では,複数のグローバルピークを同時に検出し,検出したピーク上で一定の精度を達成する方法が重要な2つの課題である。
本稿では,ランドスケープ・アウェア・ディファレンシャル・進化(LADE)アルゴリズムを提案する。
LADEは、最近提案された7つの高性能アルゴリズムと、マルチモーダル最適化のためのIEEE CECコンペティションにおける4つの勝者アルゴリズムと比較して、一般的に良い、あるいは競争的な性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:32:36 GMT)
Mobile-Agent-V: Learning Mobile Device Operation Through Video-Guided Multi-Agent Collaboration [53.5] Mobile-Agent-Vは、ビデオガイダンスを活用して、モバイル自動化のためのリッチで費用対効果の高い運用知識を提供するフレームワークである。
Mobile-Agent-Vはスライディングウィンドウ戦略を統合し、ビデオエージェントとディープリフレクションエージェントを組み込んで、アクションがユーザの指示と一致することを保証する。
その結果,Mobile-Agent-Vは既存のフレームワークに比べて30%の性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:48:37 GMT)
Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.3] フェアネスを意識したランキングを組み込んだRAGシステムに関する最初の総合的研究について述べる。
フェアネスを意識した検索は、しばしばランキングの有効性と生成品質を維持または改善する。
本結果は,検索と生成の両段階において,アイテム側の公平さの重要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:13:34 GMT)
A Materials Foundation Model via Hybrid Invariant-Equivariant Architectures [53.3] HIENetは、不変層と同変層の両方を統合するハイブリッド不変・同変基盤モデルである。
HIENetの有効性と有効性を示すため,共通ベンチマークと下流材料発見タスクの結果が得られた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:01:05 GMT)
Mechanistic PDE Networks for Discovery of Governing Equations [52.5] データから偏微分方程式を発見するためのモデルであるメカニスティックPDEネットワークを提案する。
表現されたPDEは解決され、特定のタスクのためにデコードされる。
線形偏微分方程式に特化して、ネイティブ、GPU対応、並列、スパース、微分可能多重グリッドソルバを開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:21:44 GMT)
SGFormer: Spherical Geometry Transformer for 360 Depth Estimation [52.2] パノラマ歪みは360度深度推定において大きな課題となる。
本稿では,SGFormer という球面形状変換器を提案し,上記の問題に対処する。
また、様々な解像度で空間構造を補うために、クエリベースの大域的条件位置埋め込みを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:14:30 GMT)
Reversal Blessing: Thinking Backward May Outpace Thinking Forward in Multi-choice Questions [51.6] 言語モデルは、通常左から右へ(L2R)自己回帰因子化を使用する。
いくつかのタスクにおいて,テキスト分布の代替因数分解が有用かどうかを検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:30:25 GMT)
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks [51.4] 計算資源やデータトレーニングの限界内で、複数のタスクに対処できる優れた一般認識モデルを作成します。
DICEPTIONが複数の知覚タスクに効果的に取り組み、最先端のモデルと同等の性能を達成していることを示す。
異なるインスタンスにランダムな色を割り当てる戦略は、エンティティセグメンテーションとセマンティックセグメンテーションの両方において非常に効果的であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:40:43 GMT)
DBR: Divergence-Based Regularization for Debiasing Natural Language Understanding Models [50.5] プレトレーニング言語モデル(PLM)は、様々な自然言語処理タスクにおいて印象的な結果を得た。
近年の研究では、これらのモデルが言語を真に理解するのではなく、表面的な特徴やショートカットに依存していることが明らかになっている。
本稿では,このショートカット学習行動を軽減するために,ダイバージェンスに基づく正規化(DBR)を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:44:10 GMT)
Global-Decision-Focused Neural ODEs for Proactive Grid Resilience Management [50.3] 本稿では,機能停止予測とグローバルに最適化された介入を統合するフレームワークPATOGを提案する。
提案手法は,空間的かつ時間的に整合性のある意思決定を保証し,予測精度と操作効率を両立させる。
合成および実世界のデータセットの実験では、停止予測一貫性とグリッドレジリエンスが大幅に改善された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:15:35 GMT)
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation [49.7] Vision-Language Navigation (VLN) は、言語命令と視覚的手がかりの両方を活用することで、エージェントを環境に誘導することを目的としている。
航空VLNのための多目的ツールチェーンと大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
対応する視覚データは、Unreal, GTA V, Google Earth, 3D Splatting (3D GS)など、様々なレンダリングエンジンと高度な技術を用いて生成される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:57:18 GMT)
Large Language Models as Neurolinguistic Subjects: Discrepancy in Performance and Competence for Form and Meaning [49.6] 本研究では,大言語モデル(LLM)の記号化(形式)および記号化(意味)に関する言語的理解について検討する。
ミニマルペアと診断プローブを組み合わせてモデル層間のアクティベーションパターンを解析する新しい手法を用いて,ニューロ言語学的アプローチを提案する。
その結果,(1)心理言語学的・神経言語学的手法では,言語能力と能力が異なっていること,(2)直接確率測定では言語能力が正確に評価されないこと,(3)指導のチューニングでは能力が大きく変化しないが,性能は向上しないことがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:08:00 GMT)
Unextendibility, uncompletability, and many-copy indistinguishable ensembles [49.2] 任意の二分的純絡み合った状態の補集合は、最大濃度の非直交的拡張不可能な積基底(nUPB)を形成する積状態によって分散されることを示す。
また,混合状態の減少に伴い局所的不識別性が増大する多部構成多部構成不識別アンサンブルのクラスについても報告する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:59:48 GMT)
Escaping the Subprime Trap in Algorithmic Lending [49.2] ローン承認決定における差別の持続性において、リスク管理制約、特にバリュー・アット・リスク(VaR)制約の役割について検討する。
我々は、主流(低金利)の銀行がサブプライムバンクよりも分散リスクに敏感な形式モデルを開発する。
我々は、少数の有限の補助金が、主流銀行のマイナス面を十分にカバーすることで、少数民族の集団が罠から逃れるのに役立つことを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:43:57 GMT)
Adaptive conditional latent diffusion maps beam loss to 2D phase space projections [49.2] ビーム損失(BLM)とビーム電流モニター(BCM)は、世界中の粒子加速器においてユビキタスである。
生成条件付き潜時拡散モデルにより、数十個のBLMまたはBCMの波形を加速器に沿ってマッピングし、荷電粒子ビームの6次元位相空間密度の詳細な2次元投影を行うことができることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:46:27 GMT)
Tip of the Tongue Query Elicitation for Simulated Evaluation [49.1] Tip-of-the-tongue (TOT) 検索は、ユーザがドキュメントタイトルなどの特定の識別子を思い出すのに苦労する場合に発生する。
現在のアプローチはコミュニティ質問回答(CQA)のウェブサイトに大きく依存しており、労働集約的な評価とドメインバイアスにつながっている。
大規模言語モデル(LLM)と人的参加者を活用するため,TOTクエリを抽出する2つの手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:11:42 GMT)
Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric [49.1] サンプルレベルの「ノーベルティ」に基づく新しい多様性指標を提案する。
我々は,NovellSumが精度よく多様性の変動を捉え,命令調整モデルの性能と0.97の相関性が得られることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:56:39 GMT)
Better Instruction-Following Through Minimum Bayes Risk [48.9] 人間レベルの評価が可能な汎用LLM審査員は、命令追従LLMを評価するスケーラブルで正確な方法を提供する。
LLM判事を監督に活用する有望な方法の1つは、最小ベイズリスク(MBR)デコーディングである。
MBRデコードでは、基準ベースの評価器を使用して、候補出力のセットの中から高品質な出力を選択する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:43:29 GMT)
Revisiting Convolution Architecture in the Realm of DNA Foundation Models [48.1] 我々は,CNNをベースとしたCNN方式であるConvNovaを開発した。
ConvNovaはタスクの半数以上において,最近の手法を著しく上回っていることを実証した。
我々は,この研究がDNA基盤モデルに対するCNNベースの手法への新たな関心を喚起することを期待している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:00:05 GMT)
On-Policy Self-Alignment with Fine-grained Knowledge Feedback for Hallucination Mitigation [47.4] 幻覚は、大きな言語モデルが応答生成時の知識の境界から逸脱する振る舞いを示すときに起こる。
従来の学習に基づく手法はモデルを微調整しようとするが、非政治的なサンプリングと粗い粒度のフィードバックによって制限される。
RLFHは、LLMが自らの知識境界と自己正しい生成挙動を積極的に探求することを可能にする、政治上の自己調整手法である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:05:45 GMT)
Collaboration of Large Language Models and Small Recommendation Models for Device-Cloud Recommendation [47.3] 推奨のためのLarge Language Models (LLMs) for Recommendation (LLM4Rec)は、この分野における優れたパフォーマンスを示す有望な研究方向である。
LLMはトレーニングや推論に費用がかかり、リアルタイムデータへのアクセスに苦労する。
スモールレコメンデーションモデル(SRM)は、頻繁なトレーニングと推論のために最小限のリソースを消費し、デバイス上のリアルタイムデータに便利なアクセスを行うことによって、これらの欠点を効果的に補うことができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:10:08 GMT)
Can LLMs Solve longer Math Word Problems Better? [47.2] 数学語問題(MWP)は、大規模言語モデル(LLM)の能力を評価する上で重要な役割を果たす。
より長い文脈が数学的推論に与える影響は未解明のままである。
本研究は文脈長一般化可能性(CoLeG)の研究の先駆者である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:58:27 GMT)
Larger or Smaller Reward Margins to Select Preferences for Alignment? [47.1] 嗜好学習は、大きな言語モデルと人間の価値の整合に不可欠である。
モデルが持つ現在の暗黙の報酬マージンと目標の明示的な報酬マージンとのギャップを定量化するアライメントポテンシャル計量を導入する。
実験結果から,この測定値から選択したデータによるトレーニングはアライメント性能を継続的に向上させることが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:43:24 GMT)
QuantMoE-Bench: Examining Post-Training Quantization for Mixture-of-Experts [47.0] Mixture-of-Experts (MoE)は、大規模言語モデルの学習能力をスケールアップする有望な方法である。
MoEは大きなパラメータサイズのためにメモリオーバーヘッドに悩まされる。
トレーニング後の量子化は、モデル圧縮に強力なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:29:54 GMT)
SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution [46.6] 本稿では,実世界のソフトウェア工学において,RLに基づく大規模言語モデル(LLM)を拡張するための最初のアプローチであるSWE-RLを紹介する。
Llama3-SWE-RL-70BはSWE-bench Verifiedの41.0%の解決率を達成した。
驚いたことに、Llama3-SWE-RLはソフトウェア進化データにのみ依存してRLを実行しているにもかかわらず、一般的な推論スキルを持って登場した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:45:04 GMT)
AirCast: Improving Air Pollution Forecasting Through Multi-Variable Data Alignment [46.6] 大気汚染は、急速な工業化と都市化によって悪化する世界的な健康リスクの先駆けである。
本稿では,新しい多変量大気汚染予測モデルであるAirCastを紹介する。
AirCastは、大気条件と汚染物質濃度を同時に予測するマルチタスクヘッドアーキテクチャを採用している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:34:18 GMT)
CoT2Align: Cross-Chain of Thought Distillation via Optimal Transport Alignment for Language Models with Different Tokenizers [45.6] 大規模言語モデル(LLM)は、様々なNLPタスクにまたがる最先端のパフォーマンスを実現するが、高い計算コストとメモリ制約のためにデプロイメントの課題に直面している。
知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達する、有望なソリューションである。
CoT2Alignは,Chain-of-Thought(CoT)拡張を統合した普遍的なKDフレームワークであり,Cross-CoTアライメントを導入して推論伝達を強化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:52:29 GMT)
Differentially Private Iterative Screening Rules for Linear Regression [45.5] 本稿では,線形回帰のための最初のプライベートスクリーニングルールを開発する。
このスクリーニングルールは、プライベートなスクリーニングステップの結果、あまりにも多くの係数をスクリーニングする。
しかし、プライベートスクリーニングの実装が弱まり、オーバースクリーンが減少し、性能が向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:06:19 GMT)
Rank1: Test-Time Compute for Reranking in Information Retrieval [45.4] Rank1はテスト時間計算を活用するためにトレーニングされた最初のリグレードモデルである。
我々は、MS MARCOのクエリやパスからのR1推論トレースの600,000以上のサンプルのデータセットを収集し、オープンソース化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:14:06 GMT)
Task-Driven Semantic Quantization and Imitation Learning for Goal-Oriented Communications [44.3] GOS-VAE(Goal-Oriented Semantic Variational Autoencoder)という,新たな目標指向通信(GO-COM)フレームワークを提案する。
データ再構成における関連する意味的特徴を捉えるために、データ再生品質を測定するために模倣学習を採用する。
実験により,提案したGOS-VAEの目的指向意味論と帯域幅効率を特徴付ける上で,模倣学習の能力を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:43:16 GMT)
LLM Knows Geometry Better than Algebra: Numerical Understanding of LLM-Based Agents in A Trading Arena [44.1] エージェントが株式ポートフォリオに投資するゼロサムゲームを通じて複雑な経済システムをシミュレーションする仮想数値ゲームを設計する。
実験の結果,GPT-4o を含む LLM は,大域的な傾向ではなく局所的な詳細に焦点を絞って,平文のストックデータを扱う場合の代数的推論に苦慮していることがわかった。
対照的に、LLMは、散布プロットやK線チャートのような視覚データで示される場合、幾何学的推論により大幅に向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:41:01 GMT)
PyEvalAI: AI-assisted evaluation of Jupyter Notebooks for immediate personalized feedback [43.6] PyEvalAIは、プライバシを保護するために、ユニットテストとローカルにホストされた言語モデルを組み合わせてJupyterノートをスコアする。
あるケーススタディは、大学レベルの数値科目における演習のフィードバック速度の向上と学習効率の向上に効果を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:20:20 GMT)
Harnessing Multiple Large Language Models: A Survey on LLM Ensemble [42.8] 本稿では,LLM アンサンブルにおける最近の展開の体系的レビューを行う。
本稿では, LLM アンサンブルの分類について紹介し, 関連するいくつかの研究課題について論じる。
また、「アンサンブル前推論、アンサンブル後推論、アンサンブル後推論」という幅広いカテゴリの手法のより詳細な分類も提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:48:53 GMT)
Leveraging Invariant Principle for Heterophilic Graph Structure Distribution Shifts [42.8] Heterophilic Graph Neural Networks (HGNN) は、グラフ上の半教師付き学習タスクに対して有望な結果を示している。
異種情報を組み込んだ不変ノード表現を生成可能なフレームワークを提案する。
提案手法は,異種グラフ構造分布シフト下での保証性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:06:08 GMT)
SafeAgentBench: A Benchmark for Safe Task Planning of Embodied LLM Agents [42.7] LLMエージェントの安全性を考慮したタスク計画のための新しいベンチマークであるSafeAgentBenchを提案する。
SafeAgentBenchは、(1)10の潜在的なハザードと3つのタスクタイプをカバーする750のタスクを持つ新しいデータセット、(2)SafeAgentEnv、低レベルコントローラを備えた普遍的な実施環境、8つの最先端ベースラインに対して17のハイレベルアクションでマルチエージェント実行をサポートする、(3)実行とセマンティックの両方の観点から信頼性の高い評価方法を含む。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:20:21 GMT)
Broadening Discovery through Structural Models: Multimodal Combination of Local and Structural Properties for Predicting Chemical Features [42.2] 本研究の目的は,指紋に特化して訓練された言語モデルを開発することである。
この言語モデルとグラフモデルを統合するバイモーダルアーキテクチャを導入する。
この統合により、従来の戦略に比べて予測性能が大幅に向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:53:18 GMT)
DHP Benchmark: Are LLMs Good NLG Evaluators? [42.2] 大規模言語モデル(LLM)は、自然言語生成(NLG)タスクにおいて、ますます評価役として機能している。
本稿では,LLMの定量的識別スコアを提供する階層摂動(DHP)ベンチマークフレームワークを提案する。
このベンチマークでは,要約,ストーリコンプリート,質問回答,翻訳という4つのNLGタスクを対象として,6つの評価データセットを再確立した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:51:06 GMT)
Improved amplitude amplification strategies for the quantum simulation of classical transport problems [41.9] 非単体力学に適用した場合の振幅増幅は、量子状態の歪みと、量子更新における付随する誤差につながることを示す。
また,改良された成功確率を確保しつつ,歪み誤差の軽減を支援する増幅戦略を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:17:03 GMT)
GHOST 2.0: generative high-fidelity one shot transfer of heads [41.6] GHOST 2.0は2つの問題固有のモジュールで構成されている。
まず、頭部再現のための拡張アリグナーモデルを導入し、複数のスケールで識別情報を保存する。
次に,Blenderモジュールを用いて,再現された頭部を肌の色を伝達し,不一致領域を塗布することで,シームレスに対象の背景に組み込む。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:13:55 GMT)
ORSO: Accelerating Reward Design via Online Reward Selection and Policy Optimization [41.1] Online Reward Selection and Policy Optimization (ORSO) は、オンラインモデル選択問題としてシェーピング報酬関数の選択を枠組みとした、新しいアプローチである。
ORSOは、整形報酬関数を評価するのに必要なデータ量を著しく削減し、データ効率と計算時間(最大8倍)の大幅な削減をもたらす。
ORSOは、従来の手法よりも50%以上優れた高品質の報酬関数を一貫して識別し、平均的にポリシーを、ドメインの専門家が手作業で設計した報酬関数を使って学んだものと同様に、パフォーマンスとして識別する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:45:57 GMT)
KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference [41.0] KVキャッシュの量子化は、長いコンテキストにおける大規模言語モデル推論のスループットとレイテンシを改善することができる。
現在の方法では、KVキャッシュの量子化に対する階層的感度を見極めること、オンラインのきめ細かい決定のオーバーヘッドが高いこと、異なるLLMや制約に対する柔軟性の低いこと、の3つの未解決問題がある。
粗粒度のKVキャッシュに対して最適なハードウェアフレンドリなKV量子化ペアを適応的に探索する,シンプルで効果的なフレームワークKVTunerを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:42:15 GMT)
Constraining Sequential Model Editing with Editing Anchor Compression [40.9] 大型言語モデル(LLM)は、誤った知識や時代遅れの知識によって幻覚に苦しむ。
本稿では, 編集後のパラメータ行列が, 編集数の増加に伴って, 以前の状態と大きくずれていることを統計的に観察する。
逐次的編集におけるパラメータ行列の偏差を抑制するため,EAC (Editing Anchor Compression) というフレームワークが提案されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:56:49 GMT)
Personalized Federated Learning for Egocentric Video Gaze Estimation with Comprehensive Parameter Frezzing [40.4] エゴセントリックなビデオ視線推定は、多様なユーザデータに適応しながら、個々の視線パターンをキャプチャするモデルを必要とする。
当社のアプローチはトランスフォーマーベースのアーキテクチャを活用し,最も重要なパラメータであるトレーニング中の変更率の高いパラメータのみを選択・凍結してクライアントモデルでパーソナライズする,PFLフレームワークに統合する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:46:28 GMT)
WiCkeD: A Simple Method to Make Multiple Choice Benchmarks More Challenging [40.0] 選択をランダムに "None of the above" に置き換えることで,既存のマルチ選択ベンチマークの複雑さを増大させる方法である WiCkeD を導入する。
我々は、WiCkeDが既存のベンチマークに自動的に適用可能であることを示しています。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:09:38 GMT)
DocPuzzle: A Process-Aware Benchmark for Evaluating Realistic Long-Context Reasoning Capabilities [39.7] 大規模言語モデル(LLM)における長文推論能力を評価するための厳格に構築されたベンチマークであるDocPuzzleを提案する。
このベンチマークは、長い実世界の文書に対して多段階の推論を必要とする100のエキスパートレベルのQA問題からなる。
本稿では,チェックリスト誘導プロセス分析による予測バイアスを軽減する,革新的な評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:29:53 GMT)
NotaGen: Advancing Musicality in Symbolic Music Generation with Large Language Model Training Paradigms [39.0] NotaGenは、高品質なクラシック楽譜を制作する可能性を探究する象徴的な音楽生成モデルである。
1.6万曲の楽譜を事前訓練し、その後「時代劇構成」のプロンプトを条件に、約9Kの高音質のクラシック曲を微調整する。
強化学習のためのCLaMP-DPO法は,人間のアノテーションや事前定義された報酬を必要とせずに,生成品質と制御性をさらに向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:12:07 GMT)
AI-driven 3D Spatial Transcriptomics [38.6] 本稿では,3次元組織形態と最小2次元STを利用したAIフレームワークVORTEXを提案する。
VORTEXは、遺伝子発現の一般的な組織関連およびサンプル特異的な形態的相関の両方を学習する。
低コストで最小限に破壊的な方法で体積分子の洞察を得ることにより、VORTEXはバイオマーカーの発見を加速すると予想する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:31:54 GMT)
LAG: LLM agents for Leaderboard Auto Generation on Demanding [38.5] Leaderboard Auto Generation(LAG)は、特定の研究トピックに関するリーダボードの自動生成のためのフレームワークである。
毎日更新される多数のAI論文に直面すると、研究者が提案されているすべての論文の方法、実験結果、設定を追跡することは難しくなる。
コントリビューションには,リーダボード構築問題に対する包括的ソリューション,信頼性評価方法,リーダボードの高品質性を示す実験結果などが含まれている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:54:03 GMT)
Quantum critical electro-optic and piezo-electric nonlinearities [38.5] 電場を持つ材料の光学特性のチューニングは、量子および古典フォトニクス応用の鍵となる。
量子パラ誘電体ペロブスカイトSrTiO$_3$(STO)を極低温光フォトニック材料として同定した。
酸素同位体置換によるSTOの光臨界へのチューニング 光学および圧電非線形性の2倍以上である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:01:24 GMT)
NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models [38.4] 我々はNV-Embedを導入し、アーキテクチャ設計、トレーニング手順、キュレートされたデータセットを取り入れた。
モデルアーキテクチャでは, プール埋め込みを実現するために, 潜時注意層を提案する。
学習アルゴリズムでは,2段階のコントラッシブ・インストラクション・チューニング手法を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:35:18 GMT)
UASTrack: A Unified Adaptive Selection Framework with Modality-Customization in Single Object Tracking [38.3] 単一対象追跡(SOT)においてマルチモーダルトラッキングは不可欠である
既存のRGB-Xトラッカー(Xは深度、事象、熱モダリティを表す)は、個々のRGB-Xイメージペアに対するタスク固有のトレーニング戦略に依存するか、現実のアプリケーションにおけるモダリティ適応的知覚の重要な重要性に対処できないかのいずれかである。
モデルとパラメータの一体化を容易にする統一適応選択フレームワークであるUASTrackを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:04:31 GMT)
Sample Selection via Contrastive Fragmentation for Noisy Label Regression [38.3] 本稿では,ConFragという新しい手法を提案する。この手法では,回帰データを不整合かつ対照的なフラグメンテーションペアに変換することによって,集合的にモデル化する。
我々のConFragフレームワークは、隣接するフラグメントの混合を利用して、専門家の特徴抽出器間の近傍合意を通じてノイズラベルを識別する。
我々は,年齢予測,価格予測,音楽制作年数推定など,さまざまな領域で新たにキュレートされた6つのベンチマークデータセットの実験を広範囲に実施した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:04:14 GMT)
CAML: Collaborative Auxiliary Modality Learning for Multi-Agent Systems [38.2] Collaborative Auxiliary Modality Learning (textbfCAML$)は、新しいマルチエージェントマルチモダリティフレームワークである。
エージェントは、トレーニング中に複数のモーダルデータを共同で共有し、テスト中にエージェント毎のモダリティを低減した推論を可能にする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:59:40 GMT)
AUKT: Adaptive Uncertainty-Guided Knowledge Transfer with Conformal Prediction [38.2] 本研究では,教師の予測の不確実性に基づいて,教師の指導への依存度を動的に調整する新しい枠組みを提案する。
提案手法は,画像分類,模倣誘導型強化学習,自律運転など多岐にわたる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:07:57 GMT)
Towards Better Understanding of Program-of-Thought Reasoning in Cross-Lingual and Multilingual Environments [38.2] 大規模言語モデル(LLM)には多段階推論が不可欠だが、多言語のパフォーマンスは依然として難しい。
Chain-of-Thought(CoT)は推論を改善するが、推論と実行の絡み合いのために英語以外の言語と競合する。
本稿では,PoT(Program-of-Thought)を推し進める枠組みを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:27:28 GMT)
An Analysis of Segment Anything 2 [37.8] ビデオオブジェクトセグメンテーション(VOS)は,映像認識と理解の発達において重要な課題である。
Meta AIがリリースしたSegment-Anything Model 2 (SAM2)は、エンドツーエンドVOSの最先端アーキテクチャである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:58:13 GMT)
Chain of Draft: Thinking Faster by Writing Less [37.5] Chain of Draft (CoD)は、人間の認知プロセスにインスパイアされた新しいパラダイムである。
CoD はChain-of-Thought (CoT) と精度で一致し、トークンの7.6%しか使用していない。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:36:06 GMT)
Bayesian Optimization for Controlled Image Editing via LLMs [37.4] BayesGenieは、大規模言語モデルとベイズ最適化を統合する、既定のアプローチである。
本手法により,手動の領域マークを使わずに,自然言語による画像の修正が可能となる。
筆者らのフレームワークは,編集精度と意味保存の両面で,既存の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:41:33 GMT)
Advantage-Guided Distillation for Preference Alignment in Small Language Models [37.2] そこで本研究では,小言語モデルのアライメントプロセスの指針として,教師のLLMを活用することを提案する。
実験の結果、これらの2つの手法は、SLMのアライメントを良好に改善し、より大きなものとの性能ギャップを狭めることを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:47:22 GMT)
ExPath: Towards Explaining Targeted Pathways for Biological Knowledge Bases [36.9] 本稿では,生体データベースの様々なグラフ(バイオネットワーク)を分類するための新しい経路推論フレームワークであるExPathを提案する。
ExPathは、(1)A-seqをグラフにエンコードして埋め込む大きなタンパク質言語モデル(pLM)、(2)A-seqデータ処理における従来の障害を克服するPathMamba、(2)グラフニューラルネットワーク(GNN)と状態空間シーケンスモデリング(Mamba)を組み合わせたハイブリッドアーキテクチャで、局所的な相互作用とグローバルな経路レベルの依存関係の両方をキャプチャするPathExplainer、(3)機能的に重要なノードとエッジを列車を通して識別するサブグラフ学習モジュールであるPathExplainerの3つのコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:33:15 GMT)
How Far are LLMs from Real Search? A Comprehensive Study on Efficiency, Completeness, and Inherent Capabilities [36.8] 本稿では,Large Language Models (LLMs) を有効かつ効率的な検索に活用するフレームワークとして,SeaL(Search via Learning)を提案する。
SeaLは、従来のアプローチと比較して、検索スペースを最大99.1%削減しながらほぼ完璧な精度を実現している。
解析の結果,現在のLLMは複雑な問題において効率的な探索に苦しむ一方で,体系的な探索戦略を取り入れることで,問題解決能力が著しく向上していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:30:40 GMT)
AFlow: Automating Agentic Workflow Generation [36.6] 大規模言語モデル(LLM)は、様々な領域にわたる複雑なタスクを解く上で、顕著な可能性を示している。
我々は、Monte Carlo Tree Searchを使って、この空間を効率的に探索する自動化フレームワークであるAFlowを紹介します。
6つのベンチマークデータセットに対する実証的な評価は、AFlowの有効性を示し、最先端のベースラインよりも平均5.7%向上している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:56:05 GMT)
Language Models' Factuality Depends on the Language of Inquiry [36.5] 13言語にまたがる1万の国関連事実のベンチマークを導入する。
本稿では,Factual Recall Score, Knowledge Transferability Score, Cross-Lingual Factual Knowledge Transferability Scoreの3つの新しい指標を提案する。
我々の結果は、今日の最先端のLMの根本的な弱点を明らかにします。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:27:18 GMT)
A General Framework to Enhance Fine-tuning-based LLM Unlearning [36.2] Gated Representation UNlearning (GRUN) は、ターゲットデータと抑圧モジュールを区別するソフトゲート機能である。
実験により、GRUNは未学習と実用性を大幅に改善することが示された。
微調整に基づく手法では一般的であり、逐次的アンラーニングには効率的で有望である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:03:04 GMT)
StoryWeaver: A Unified World Model for Knowledge-Enhanced Story Character Customization [36.1] 本稿では,様々なストーリー関連知識を包括的に表現した新しい知識グラフ,すなわちキャラクタグラフ(textbfCG)を提案する。
次に、リッチテキストセマンティクスと一貫したストーリー視覚化が可能な、キャラクタグラフ(textbfC-CG)によるカスタマイズを実現するイメージジェネレータであるStoryWeaverを紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:50:16 GMT)
Advancing Molecular Graph-Text Pre-training via Fine-grained Alignment [36.1] FineMolTexは、新しい分子グラフ-テキスト事前トレーニングフレームワークである。
粒度の粗い分子レベルの知識と粒度の細かいモチーフレベルの知識を学習する。
FineMolTexは、きめ細かな知識をうまく捉え、薬物発見と触媒設計のための貴重な洞察を提供する可能性がある。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:45:00 GMT)
Beyond In-Distribution Success: Scaling Curves of CoT Granularity for Language Model Generalization [35.2] 変圧器に基づく言語モデル(LM)の展開において、分散シフト下における新しい複合タスクへの一般化が重要である
本研究は、OODの一般化を促進する手段として、Chain-of-Thought (CoT)推論を考察する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:04:17 GMT)
Inverse Materials Design by Large Language Model-Assisted Generative Framework [35.0] AlloyGANは、Large Language Model (LLM) を利用したテキストマイニングと条件付き生成支援ネットワーク (CGAN) を統合したフレームワークである。
金属ガラスの場合、このフレームワークは実験から8%未満の差で熱力学特性を予測する。
生成AIをドメイン知識でブリッジすることで、A AlloyGANは、カスタマイズされた特性を持つ物質の発見を加速するスケーラブルなアプローチを提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:52:59 GMT)
Pauli measurements are not optimal for single-copy tomography [34.8] 我々は、$O(frac10Nepsilon2)$の強い上限と$Omega(frac9.118Nepsilon2)$の低い上限を証明している。
これは、最初の既知のパウリ測定と構造化されたPOVMの分離を示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:03:45 GMT)
Compressing Language Models for Specialized Domains [34.8] 汎用圧縮法は特殊領域の性能に悪影響を及ぼす可能性がある。
圧縮されたLMの領域性能を改善するための新しいトレーニング不要な手法であるクロスキャリブレーションを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:20:00 GMT)
SORREL: Suboptimal-Demonstration-Guided Reinforcement Learning for Learning to Branch [33.9] 混合線形プログラム(MILP)は、主に分岐サンプリング・アンド・バウンド(B&B)アルゴリズムに基づいて構築される。
本稿では,分枝学習のためのSORREL(Sub-Optimal-Demonstration-Reinforcement Learning)を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:42:25 GMT)
Language-Guided Diffusion Model for Visual Grounding [33.7] 既存のアプローチは、そのような視覚的テキスト推論を1ステップで完了させる。
本稿では,ビジュアルグラウンドディングのための言語誘導拡散フレームワークLG-DVGを提案する。
広範に使用されている5つのデータセットの実験は、視覚的グラウンドリングの優れた性能、つまり、モーダルなアライメントタスクを生成的手法で検証した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:41:29 GMT)
Programming Really Is Simple Mathematics [33.4] 本稿では,基本集合論に基づく小数理理論(PRISM)としてのプログラミングの基礎を再構築する。
プログラムとプログラミングの重要な性質を特徴づける数十の定理を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:57:17 GMT)
uniINF: Best-of-Both-Worlds Algorithm for Parameter-Free Heavy-Tailed MABs [33.3] 本稿では,HTMAB(Heavy-Tailed Multi-Armed Bandits)問題に対する新しいアルゴリズムを提案する。
我々の新しいアルゴリズムユニは、Best-of-Both-Worlds(BoBW)特性を楽しみ、両環境とも最適に機能する。
我々の知る限り、UniINFは重み付きMAB問題に対するBoBW特性を達成する最初のパラメータフリーアルゴリズムである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:27:56 GMT)
Sketch to Adapt: Fine-Tunable Sketches for Efficient LLM Adaptation [33.1] 事前訓練された大規模言語モデル(LLM)の適応は極めて重要であるが、その巨大なサイズのため困難である。
スケッチチューン(SketchTune)は、重みをコンパクトな微調整可能なスケッチに圧縮する圧縮適応戦略である。
SketchTuneは、低ランクメソッドではなくスケッチによって近似された行列クラスに関する数学的洞察によってサポートされている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:59:51 GMT)
Unveiling the Key Factors for Distilling Chain-of-Thought Reasoning [33.0] 小型言語モデル(SLM)におけるCoT蒸留の影響要因について検討した。
その結果, SLM は粒度と非単調な関係を示し, より微細な推論とより弱いモデルにより, より単純なCoT 監督下でより優れた性能を示すことがわかった。
これらの知見は、特定の学生モデルにCoT戦略を適合させることの必要性を強調し、SLMにおけるCoT蒸留を最適化するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:08:45 GMT)
Edit3K: Universal Representation Learning for Video Editing Components [33.0] 本稿では,合成ビデオ編集の主流である映像生成パイプラインの理解に焦点を当てた。
本研究の目的は,原材料に一般的に適用される編集行動・コンポーネントの視覚的表現を学習することである。
ビデオ作成のコンポーネントを編集するための最初の大規模データセットを提案し,約3,094ドルの編集コンポーネントと6,18,800ドルの編集コンポーネントを網羅した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:46:02 GMT)
From ChatGPT to DeepSeek: Can LLMs Simulate Humanity? [32.9] 大規模言語モデル(LLM)は、複雑な人間の社会的行動を探究するための有望な方法となっている。
最近の研究では、シミュレートされた相互作用と現実世界の相互作用の相違が強調されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:54:47 GMT)
Deep-JGAC: End-to-End Deep Joint Geometry and Attribute Compression for Dense Colored Point Clouds [32.9] 本稿では,エンドツーエンドのDeep Joint Geometry and Attribute Point Cloud Compressionフレームワークを提案する。
幾何と属性の相関を利用して高い圧縮効率を向上する。
提案されたDeep-JGACは平均82.96%、36.46%、41.72%、31.16%のビットレート削減を達成した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:01:57 GMT)
T3D: Advancing 3D Medical Vision-Language Pre-training by Learning Multi-View Visual Consistency [32.6] 3D医療ビジョン言語による事前トレーニングは、大規模で一般公開された3D医療画像レポートデータセットが欠如しているため、まだ探索されていない。
このギャップを埋めるために、最初の、そして最大の*public** 3Dボリュームレポートデータセットである*CT-3Dlots**を紹介します。
提案する**T3D*フレームワークは,単純なCLIPスタイルのアライメントを超えて,3次元医用画像の理解を促進する。
以上の結果から,T3D は既存の vSSL やマルチモーダル手法を一貫して上回り,ゼロショットや微調整能力に優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:04:54 GMT)
Training-Free Activation Sparsity in Large Language Models [32.4] アクティベーションのスパーシリティは、大きな言語モデルで実用的な推論スピードアップを可能にする。
既存の手法は普及を妨げる限界に直面している。
本稿では,モデル全体の隠れ状態に対して,等級に基づくアクティベーション間隔を適用したトレーニング不要なTEALについて述べる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:00:50 GMT)
Both Ears Wide Open: Towards Language-Driven Spatial Audio Generation [32.2] ステレオオーディオを空間的コンテキストで制御することは、高いデータコストと不安定な生成モデルのために依然として困難である。
まず,大規模・シミュレーションベース・GPT支援型データセットBEWO-1Mの構築を行った。
空間誘導を利用してテキストから没入型かつ制御可能な空間音声を生成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:42:31 GMT)
Robust Polyp Detection and Diagnosis through Compositional Prompt-Guided Diffusion Models [32.2] 合成ポリプ画像を生成するためのプログレッシブスペクトル拡散モデル(PSDM)を提案する。
PSDMは、セグメンテーションマスク、バウンディングボックス、大腸内視鏡検査などの様々な臨床アノテーションを統合し、それらを合成プロンプトに変換する。
トレーニングデータをPSDM生成サンプルで強化することにより,ポリプの検出,分類,セグメンテーションを大幅に改善する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:22:45 GMT)
Assessing Large Language Models in Agentic Multilingual National Bias [31.7] 推論に基づくレコメンデーションにおける言語間の格差はほとんど未解明のままである。
この研究は、このギャップに最初に対処する。
複数の言語にわたる意思決定タスクに対する応答を解析することにより、最先端のLLMにおける多言語バイアスについて検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:07:42 GMT)
Heterogeneous Decision Making in Mixed Traffic: Uncertainty-aware Planning and Bounded Rationality [31.7] 混合交通環境における自動走行車(AV)と人力走行車(HV)による異種意思決定について検討した。
その結果, AVの学習成績におけるグッドハートの法則や, HVの意思決定過程における複合効果などの興味深い現象が明らかになった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:32:33 GMT)
How Vital is the Jurisprudential Relevance: Law Article Intervened Legal Case Retrieval and Matching [31.4] 法的ケース検索(LCR)は、与えられたクエリに基づいて、同等の法的ケースを自動的に検索することを目的としている。
これに対処するためには、司法ドメイン内の独自の法的・合理的な類似性を評価するのが難しい課題だ。
上記の課題を解決するために, LCM-LAI というエンド・ツー・エンドのモデルを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:29:07 GMT)
LLM-based MOFs Synthesis Condition Extraction using Few-Shot Demonstrations [31.4] 大規模言語モデル(LLM)は、この長年の問題に対する破壊的な新しい解決策を提供する。
本稿では,LLMの文脈内学習パラダイムについて紹介する。
提案した少数ショットLLMの合成,構造推定,材料設計性能は,いずれもゼロショットLLMとベースライン法を大きく上回っている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:20:58 GMT)
MAFE: Multi-Agent Fair Environments for Decision-Making Systems [30.9] 我々は、マルチエージェントフェア環境(MAFE)の概念を導入し、異なる社会システムをモデル化する3つのMAFEを提示、分析する。
実験の結果,MAFEをマルチエージェントフェアアルゴリズム開発のためのテストベッドとしての有用性が示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:03:50 GMT)
KiRAG: Knowledge-Driven Iterative Retriever for Enhancing Retrieval-Augmented Generation [30.5] 知識駆動型反復検索モデルを用いてiRAGの検索プロセスを強化するKiRAGを提案する。
具体的には、KRAGは文書を知識トリプルに分解し、これらのトリプルで反復的な検索を行い、現実的に信頼できる検索プロセスを実現する。
KiRAGは既存のiRAGモデルを大きく上回り、R@3で9.40%、マルチホップQAでF1で5.14%改善している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:47:53 GMT)
What is the Alignment Objective of GRPO? [30.4] 本稿では,GRPOアルゴリズムの定常ポリシを特徴付けるためのフレームワークを提案する。
選好アグリゲーションの正確な形は、報酬選好モデルの定義方法とペナルティ関数から生じる。
二分問題に対する集合的選好の明示的な特徴付けとして,大小2の群に対して,大小2の群に対して,大小の群を限定する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:56:56 GMT)
Satellite-Aided Entanglement Distribution for Optimized Quantum Networks [30.4] 量子インターネットは、分散量子コンピューティングやセンシングを含むタスクで使用されるエンタングル量子ビットのタイムリーなプロビジョニングを保証する必要がある。
絡み合いの事前分布は、このことが脱コヒーレンスのリスクを減らし、絡み合い状態の悪化を招き、使用する量子ビットの量を最小限にすることを目的としている。
衛星支援エンタングルメント分布(SED)は、小型量子ネットワークの性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:21:20 GMT)
Cross-Entropy Is All You Need To Invert the Data Generating Process [29.9] 経験的現象は、教師付きモデルが線形な方法で変化の解釈可能な要因を学習できることを示唆している。
近年の自己教師型学習の進歩により,データ生成過程を反転させることで潜在構造を復元できることが示されている。
標準分類タスクにおいても,モデルが線形変換までの変動の基底構造因子の表現を学習することが証明された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:22:53 GMT)
AIR: Complex Instruction Generation via Automatic Iterative Refinement [29.6] 複雑な命令を生成するための現在のアプローチは、しばしば現在の命令要求とは無関係である。
本稿では,制約付き複雑な命令を生成するための,新しい反復修正フレームワークを提案する。
10Kの複雑な命令でAIR-10Kデータセットを構築し、我々のアプローチで生成された命令は、複雑な命令に従うモデルの能力を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:39:57 GMT)
MedKAN: An Advanced Kolmogorov-Arnold Network for Medical Image Classification [29.5] Kolmogorov-Arnold Networks (KAN) は、非線形変換モデリングを強化する新しいアーキテクチャのクラスである。
本稿では,kanと畳み込み拡張を基盤とした医用画像分類フレームワークであるMedKanを紹介する。
MedKANは、CNNやTransformerベースのモデルと比較して優れたパフォーマンスを実現し、医用画像解析の有効性と一般化性を強調している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:12:08 GMT)
Crafting Customisable Characters with LLMs: Introducing SimsChat, a Persona-Driven Role-Playing Agent Framework [29.2] 大きな言語モデル(LLM)は、命令を理解し、人間に似たテキストを生成する素晴らしい能力を示す。
実世界のキャラクターをシミュレートするためにLLMを利用するCustomisable Conversation Agent Frameworkを導入する。
我々は,様々な現実的な設定を取り入れた自由にカスタマイズ可能なロールプレイングエージェントであるSimsChatを紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:30:21 GMT)
Enhancing Human Evaluation in Machine Translation with Comparative Judgment [28.8] 本研究では,機械翻訳のための人間のアノテーションに対する比較判断の統合について検討する。
3つのアノテーション設定-ポイントワイド多次元品質メトリクス(MQM)、サイドバイサイド(SxS)MQM、および簡易バージョンSxS相対ランク(RR)を評価する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:02:24 GMT)
Improved Detection of Latent Diffusion-Generated Images through Aligned Datasets [28.7] 優れた検出器は、セマンティックコンテンツ、解像度、ファイルフォーマットなどの画像特性を無視しながら、生成モデル指紋に焦点を当てるべきである。
この研究では、これらのアルゴリズムの選択に加えて、堅牢な検出器をトレーニングするためには、リアル/フェイク画像の整列したデータセットも必要である、と論じる。
そこで本研究では, LDMの家族に対して, LDMのオートエンコーダを用いて実画像の再構成を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:28:35 GMT)
UOOR: Seamless and Traceable Requirements [28.6] 提案手法は,UOORと呼ばれる要求工学手法である。
このメソッドは多くの既知の要件概念を統一し、プロジェクトライフサイクル全体を通してシームレスな変更に対応およびサポートするために完全に設計されたフレームワークに新しいものをいくつか追加します。
UOORアプローチは単なる理論的な提案ではなく、実用のために設計され、重要な実世界のケーススタディであるRoboraceに応用されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:03:01 GMT)
Large Convolutional Model Tuning via Filter Subspace [28.2] 本稿では,空間のみの畳み込みの原因となるフィルタ原子のみを調整し,事前学習モデルの微調整を提案する。
このような単純なスキームは、識別的タスクと生成的タスクの両方において、以前のチューニングベースラインを超えていることが示される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:42:28 GMT)
MLPs Learn In-Context on Regression and Classification Tasks [28.1] In-context Learning (ICL) はしばしばトランスフォーマーモデルのユニークな特徴であると考えられている。
マルチ層パーセプトロン(MLP)もコンテキスト内で学習可能であることを示す。
その結果, 合成環境における経験者の予期せぬ能力が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:27:38 GMT)
Divide and Translate: Compositional First-Order Logic Translation and Verification for Complex Logical Reasoning [28.1] 複雑な論理的推論タスクは、長い推論を必要とするが、それは、チェーン・オブ・シークレットのプロンプトを持つ大きな言語モデル(LLM)が依然として不足している。
本稿では,翻訳中に自然言語に隠された論理的意味を抽出する合成一階論理翻訳を提案する。
提案手法は,CLOVERと呼ばれる7つの論理的推論ベンチマークを用いて評価し,従来のニューロシンボリックアプローチよりも優れていたことを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:30:50 GMT)
Say Less, Mean More: Leveraging Pragmatics in Retrieval-Augmented Generation [27.9] 本稿では,検索拡張世代(RAG)フレームワークに実用的原理を注入する,単純で教師なしの手法を提案する。
提案手法はまず,RAGが検索した文書プール内のどの文が,手元にある質問に最も関連があるかを識別し,入力された質問に対処するすべてのトピックをカバーし,そのコンテキスト内でこれらの文をハイライトする。
PubHealthでは19.7%、ARC-Challengeでは10%まで精度が向上している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:38:38 GMT)
Bayesian Computation in Deep Learning [27.7] 本稿では,ディープラーニングモデルに適用したベイズ計算手法として近似推論手法を紹介する。
我々は,(1)ベイズニューラルネットワークと(2)深部生成モデルに対する一般的な計算手法を提示し,後部推論におけるそれらのユニークな課題と解法を説明することによって,章を整理する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:39:33 GMT)
Proving Olympiad Inequalities by Synergizing LLMs and Symbolic Reasoning [27.6] 大規模言語モデル(LLM)は、証明システム内で証明ステップを生成することによって、数学的定理を正式に証明することができる。
本稿では,LLMが学習した数学的直観と,記号的手法によって符号化された領域固有の洞察を相乗化する,ニューロシンボリック・戦術生成器を提案する。
複数の数学コンペティションから161の挑戦的不等式を評価する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:38:31 GMT)
SMT(LIA) Sampling with High Diversity [27.4] 我々はCDCL(T)技術と局所探索を統合した最初のサンプリングフレームワークを開発した。
HighDiv は線形整数論の下で制約に対する非常に多様な解の集合を生成することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:53:46 GMT)
LiCoEval: Evaluating LLMs on License Compliance in Code Generation [27.4] 大規模言語モデル(LLM)はコード生成に革命をもたらし、開発者によるAIコーディングツールの普及につながった。
LLMは、ライセンス情報を提供することなくライセンス保護されたコードを生成することができ、ソフトウェア製造中に知的財産権侵害を引き起こす可能性がある。
本稿では,LLM生成コードにおけるライセンスコンプライアンスの重要かつ未解明な問題に対処する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:58:05 GMT)
VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking [27.3] VideoShieldはビデオ生成モデルのための新しい透かしフレームワークである。
後処理の方法とは異なり、VideoShieldはビデオ生成中に直接透かしを埋め込む。
ビデオの整合性を確保するため,タンパーのローカライゼーション機能を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:54:25 GMT)
Imaging foundation model for universal enhancement of non-ideal measurement CT [27.3] NICT(Non-ideal Measurement Computed Tomography)は、CTの応用を拡大するために、準最適イメージングプロトコルを用いる。
深層学習法はNICT画像の強化に使われてきたが、大規模なトレーニングデータセットに依存しているため、実用化は困難である。
NICT拡張のための最初のイメージング基盤モデルであるマルチスケール統合トランスフォーマーAMPlifier (TAMP) を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:28:49 GMT)
Provably Efficient RL for Linear MDPs under Instantaneous Safety Constraints in Non-Convex Feature Spaces [27.1] 制約のある強化タスクでは、エラーを避けることが重要です。
本稿では,制約を適切に解決する新しい手法を開発する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:32:55 GMT)
MAPoRL: Multi-Agent Post-Co-Training for Collaborative Large Language Models with Reinforcement Learning [26.7] 新しいポストトレーニングパラダイムMAPoRL(強化学習を用いた協調LLMのためのマルチエージェントポストトレーニング)を導入する。
MAPoRLでは、複数のLLMが独立して独自の応答を生成し、最終回答を協調的に改善するためのマルチターンディスカッションを行う。
MAPoRL検証器は、回答の正しさを検証するスコアを割り当てることで、回答と議論の両方を評価する。
スコアはコトレーニング報酬として機能し、マルチエージェントRLによって最大化される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:33:48 GMT)
TextGames: Learning to Self-Play Text-Based Puzzle Games via Language Model Reasoning [26.7] 推論は大規模言語モデル(LLM)の基本機能である
本稿では,テキストベースのゲームで LLM を評価するためのベンチマークである TextGames を紹介する。
以上の結果から,LSMは最も容易かつ中程度の問題に対処する能力を示すが,より困難な課題に直面することが明らかとなった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:26:48 GMT)
How Does Code Pretraining Affect Language Model Task Performance? [26.7] 自然言語とコードをインターリーブするデータセット上で、言語モデルを事前訓練する。
高い割合のコードで事前学習を行うことで、構成タスクのパフォーマンスが向上することがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:31:36 GMT)
Joint Reconstruction of Spatially-Coherent and Realistic Clothed Humans and Objects from a Single Image [26.6] 現実世界では、人間は他の物体と空間を共有します。
人間と物体で画像を再構成することは、3次元空間認識の欠如により困難である。
本稿では, 単視点画像から空間的コヒーレントな方法で, 衣服や物体を共同で再構築する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:26:36 GMT)
Rethinking Layer Removal: A Hybrid Pruning Framework Combining Layer Removal and Singular Value Selection for Efficient LLM Compression [26.5] 層除去は、冗長性を低減し、推論効率を向上させることで、大きな言語モデル(LLM)を圧縮する有効な手法である。
これらの効果を緩和するために表現クリティカルな特異値を保存するGRASPを提案する。
実験の結果、GRASPは既存の圧縮メソッドよりも複雑度やダウンストリームタスクのパフォーマンスが一貫して優れています。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:53:48 GMT)
Dynamic Attention-Guided Context Decoding for Mitigating Context Faithfulness Hallucinations in Large Language Models [26.5] 大型言語モデル (LLM) は、しばしば文脈に忠実な幻覚を示す。
単一パスデコーディングにおける注意分布と不確実性信号を利用する軽量なフレームワークである動的注意誘導コンテキストデコーディング(DAGCD)を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:07:02 GMT)
Can Large Language Models Identify Implicit Suicidal Ideation? An Empirical Evaluation [26.0] 心理学的フレームワーク上に構築された1,308のテストケースのデータセットである ourdata を紹介した。
現在のモデルでは,暗黙の自殺観念を検知し,適切な支援の提供に苦慮していることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:53:00 GMT)
K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs [26.0] 我々は,LoRAの本質的な性質は,学習対象とスタイルの融合における拡散モデルを効果的に導くことができると論じる。
各注目層において、K-LoRAは各LoRAのTop-K要素を融合させ、どのLoRAを最適な融合に選択するかを決定する。
実験結果から,提案手法は元のLoRAが学習した主題とスタイル情報を効果的に統合することを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:59:12 GMT)
Neural Radiance Fields in Medical Imaging: A Survey [25.5] ニューラル・ラジアンス・フィールド(NeRF)は、投影された2次元画像データから3次元表現を合成することにより、医用画像に革命をもたらす大きな可能性を提供する。
本稿では,医療画像におけるNeRFの応用を包括的に検討し,重要な課題を4つ挙げる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:32:57 GMT)
Label-free Prediction of Vascular Connectivity in Perfused Microvascular Networks in vitro [25.4] 血管接続性評価のための血管接続性ネットワーク (VC-Net) が開発された。
VC-Netは蛍光画像による血管の接続性の評価に成功し,それと有意差はなかった。
正常な微小環境下で培養されたものと比べ,腫瘍関連微小環境下で培養されたMVNの平均接続率は30.8%減少した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:25:49 GMT)
HyperG: Hypergraph-Enhanced LLMs for Structured Knowledge [25.3] HyperGはハイパーグラフベースの生成フレームワークで、構造化知識を処理する大規模言語モデルの能力を高めることを目的としている。
具体的には、HyperGはまず、スパースデータを文脈情報で拡張し、データ内の拡張情報と複雑な構造的関係の両方をエンコードするために、プロンプト付きハイパーグラフ学習ネットワークを組み込む。
HyperGの有効性と一般化を検証するために、構造化知識を必要とする2つの下流タスクにまたがる広範な実験を行った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:47:32 GMT)
Does Table Source Matter? Benchmarking and Improving Multimodal Scientific Table Understanding and Reasoning [24.8] 動的入力画像解像度を用いた多モーダル科学テーブル理解と推論のための包括的フレームワークを提案する。
私たちのフレームワークは、MMSci-Pre、MMSci-Ins、MMSci-Evalの3つの重要なコンポーネントで構成されています。
動的入力分解能を持つテーブルベースMLLMは,汎用テーブル理解能力と数値推論能力の両方に有意な改善が認められた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:41:36 GMT)
Better Aligned with Survey Respondents or Training Data? Unveiling Political Leanings of LLMs on U.S. Supreme Court Cases [24.6] トレーニングコーパス形状モデルに埋め込まれた値とバイアスがどのように出力するかを実証的に検討する。
ケーススタディとして、米国最高裁判所32件のLLMの政治的傾向を調査することに焦点をあてる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:16:17 GMT)
Sphere Neural-Networks for Rational Reasoning [24.6] ベクトルから球面への計算ビルディングブロックの一般化による新しい拡張を提案する。
モデル構築と検査を通して人間のような推論を行うための球ニューラルネット(SphNN)を提案する。
SphNNは、合理性-時間的推論、否定と解離を伴う論理的推論、イベント推論、ニューロシンボリック統一、ユーモア理解など、様々なタイプの推論に進化することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:48:11 GMT)
Progressive Local Alignment for Medical Multimodal Pre-training [24.6] そこで本研究では,局所的なアライメントを学習に応用して,意味のある単語・画素関係を確立する手法を提案する。
PLANは、ノイズ干渉を抑制しながら、ソフト領域認識を効果的に改善する。
PLANは、フレーズグラウンド、画像テキスト検索、オブジェクト検出、ゼロショット分類において最先端の手法を超越している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:13:13 GMT)
Creator-Side Recommender System: Challenges, Designs, and Applications [24.4] 私たちは、DualRecと呼ばれるクリエーター側のレコメンデーションシステムを開発し、質問に答える: クリエーターのエクスペリエンスを高めるために、各アイテムに最も適したユーザーを見つけるにはどうすればよいか?
検索アルゴリズムやランキングアルゴリズムのような典型的なユーザ側推薦アルゴリズムは、わずかに修正を加えるだけでクリエーター側バージョンに適応できることを示す。
ユーザ側レコメンデータシステムには存在しないユーザアベイラビリティ問題であるDualRecのユニークな課題について論じる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:41:02 GMT)
DIS-CO: Discovering Copyrighted Content in VLMs Training Data [24.2] モデルの開発において,著作権付きコンテンツの含意を推測する新しいアプローチであるdis-COを提案する。
対象とする著作権物質から特定のフレームでVLMを何度もクエリすることで、dis-COは自由形式のテキスト補完を通じてコンテンツのアイデンティティを抽出する。
以上の結果から,dis-COは検出性能を著しく向上し,最良先行法の平均AUCをほぼ倍増させることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:10:35 GMT)
Science Across Languages: Assessing LLM Multilingual Translation of Scientific Papers [24.2] 我々は、科学論文の翻訳に大規模言語モデル(LLM)を活用している。
我々は複数の科学分野の論文を28の言語に翻訳する。
ベンチマークの結果,平均性能は95.9%であった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:08:48 GMT)
LevelRAG: Enhancing Retrieval-Augmented Generation with Multi-hop Logic Planning over Rewriting Augmented Searchers [24.0] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を緩和するための重要な方法である
既存のRAGメソッドは通常、検索範囲を広げるためにハイブリッド検索を使用しながら、ユーザ意図を明確にし、マルチホップロジックを管理するためにクエリ書き換えを使用する。
本稿では,複雑なクエリをアトミックなクエリに分解する高レベル検索手法を提案する。
高精度なキーワード検索にスパース検索の長所を利用するために,Lucene構文を用いて検索精度を向上させるスパース検索手法を開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:09:16 GMT)
Learning Structure-Supporting Dependencies via Keypoint Interactive Transformer for General Mammal Pose Estimation [24.0] 一般的な哺乳類のポーズ推定のためのインスタンスレベルの構造支援依存関係を学習するためのキーポイント・インタラクティブ・トランスフォーマー(KIT)を提案する。
最初のコンポーネントはキーポイントの特徴を抽出し,身体部分のプロンプトを生成する。
次に,空間分割を行うことなく,特徴スライスを入力トークンとして利用する対話型トランスフォーマーを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:58:37 GMT)
FLARE: A Framework for Stellar Flare Forecasting using Stellar Physical Properties and Historical Records [24.0] 我々は、恒星フレア予測に特化して設計された第一種モデルであるFLAREを紹介する。
利用可能なケプラー光度曲線データセットに関する実験により、FLAREは全ての評価指標における他の手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:03:15 GMT)
Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents [24.0] M-CoDAL(M-CoDAL)は、安全クリティカルな状況下でのコミュニケーションをよりよく理解するために、実施エージェント向けに設計されたマルチモーダル対話システムである。
提案手法は,2K Reddit画像から抽出した1Kの安全違反を含む,新たに作成されたマルチモーダルデータセットを用いて評価する。
このデータセットで得られた結果は、我々のアプローチが会話の安全性だけでなく、安全状況、ユーザーの感情、および会話の安全性の解決を改善することを実証している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:13:08 GMT)
On Synthetic Data Strategies for Domain-Specific Generative Retrieval [23.9] 2段階のトレーニングフレームワークのためのデータストラテジーについて検討する。
最初の段階では、ドキュメントの識別子をクエリからデコードすることを学びます。
第2段階では、好み学習により文書ランキングを洗練させる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:27:54 GMT)
Determine-Then-Ensemble: Necessity of Top-k Union for Large Language Model Ensembling [23.4] 大規模言語モデル(LLM)は、様々なタスクに様々な長所と短所を示す。
既存のLLMアンサンブル法は、しばしばモデルの互換性を見落とし、確率の非効率なアライメントに苦しむ。
textscUnion textscTop-$k$ textscEnsembling (textscUniTE)は,各モデルから上位kトークンの結合に着目し,効率的にモデルを結合する新しいアプローチである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:40:51 GMT)
Enhancing Text-to-SQL Capabilities of Large Language Models via Domain Database Knowledge Injection [23.4] 大きな言語モデル(LLM)は、スキーマの問題とドメイン固有のデータベース知識の欠如によって、問題に直面します。
本稿では,従来の知識を取り入れたLLMの理解能力を高めるための知識注入手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:36:41 GMT)
Assistance or Disruption? Exploring and Evaluating the Design and Trade-offs of Proactive AI Programming Support [23.4] 我々は,エディタアクティビティとタスクコンテキストに基づいたプログラミング支援を開始するデザインプローブエージェントであるCodellaboratorを紹介し,評価する。
プロアクティブエージェントは、プロンプトのみのパラダイムに比べて効率が向上するが、ワークフローの混乱も生じない。
Codellaboratorのユーザコントロール、オーナシップ、コード理解に関するトレードオフを強調し、プログラミングプロセスに積極的に対応する必要性を強調します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:37:25 GMT)
Easy-Poly: A Easy Polyhedral Framework For 3D Multi-Object Tracking [23.4] 複数のオブジェクトカテゴリを対象としたリアルタイムフィルタベースの3DMOTフレームワークであるEasy-Polyを提案する。
結果は,Poly-MOTやFast-Polyといった最先端の手法よりも優れていることを示す。
これらの知見は、多様なシナリオにおけるEasy-Polyの適応性と堅牢性を強調している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:01:25 GMT)
RankCoT: Refining Knowledge for Retrieval-Augmented Generation through Ranking Chain-of-Thoughts [23.4] RankCoTは、CoTをベースとした要約生成において、再ランク信号を含む知識改善手法である。
実験では,RangCoTの有効性を実証し,他の知識改善モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:18:05 GMT)
EgoSim: An Egocentric Multi-view Simulator and Real Dataset for Body-worn Cameras during Motion and Activity [23.4] エゴシム(EgoSim)は、身体の複数の視点から現実的なエゴセントリックなレンダリングを生成する、ボディウーンカメラの新しいシミュレータである。
EgoSimの重要な特徴は、実際のモーションキャプチャーデータを使ってモーションアーティファクトをレンダリングすることだ。
Xsensのモーションキャプチャースーツから6台のGoProカメラと3Dボディのポーズレファレンスを使って、13人の参加者から5時間の実際のモーションデータを収集しました。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:11:14 GMT)
How Good Are LLMs for Literary Translation, Really? Literary Translation Evaluation with Humans and LLMs [23.2] LITEVAL-CORPUSは、検証された人間の翻訳と9つの文学機械翻訳システムからの出力を含む並列コーパスである。
複雑度の異なる評価手法の整合性と妥当性について検討する。
総合評価の結果,人文翻訳はLLM翻訳より一貫して優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:20:16 GMT)
Windowed MAPF with Completeness Guarantees [23.2] 完全性を実現するウインドウドMAPFのためのフレームワークWinC-MAPFを紹介する。
また,CBSに新たな変更を加えて,この枠組みを即時化するシングルステップCBS (SS-CBS) も開発した。
単一のステップとアップデートしか計画していないSS-CBSが、既存のウィンドウ化アプローチが失敗する難しいシナリオを効果的に解決できることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:44:59 GMT)
Data Augmentation for Instruction Following Policies via Trajectory Segmentation [23.2] 軌道からラベル付きセグメントを抽出する方法を探索する。
目標は、模倣学習によって訓練された指示追従ポリシーの性能を改善することである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:06:01 GMT)
CaseGen: A Benchmark for Multi-Stage Legal Case Documents Generation [23.0] 中国法域における多段階訴訟文書生成のベンチマークであるCaseGenを紹介する。
CaseGenは、法律の専門家によって注釈付けされた500の実ケースサンプルに基づいており、7つの重要なケースセクションをカバーしている。
防衛声明の起草、裁判事実の執筆、法的推論の作成、判決結果の生成の4つの重要なタスクをサポートする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:03:32 GMT)
Comparing Native and Non-native English Speakers' Behaviors in Collaborative Writing through Visual Analytics [23.0] textscCOALAは、著者クラスタに不確実性を表示することによって、モデルの解釈可能性を改善する新しいビジュアル分析ツールである。
我々は、参加者がtextscCOALA を用いて発見した知見を提示し、将来のAI支援共同執筆ツールの機能を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:39:55 GMT)
CuDIP: Enhancing Theorem Proving in LLMs via Curriculum Learning-based Direct Preference Optimization [22.9] 本稿では,Curriculum Learning-based DPO Iterative Theorem Proving (CuDIP)法を提案する。
LLMと既存の定理証明データを利用した嗜好データ構築手法を提案する。
次に、この選好データ構築手法とカリキュラム学習を統合し、定理証明モデルを反復的に微調整する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:07:02 GMT)
FetchBot: Object Fetching in Cluttered Shelves via Zero-Shot Sim2Real [22.9] FetchBotは、現実世界の設定で散らかった棚からフェッチする、ゼロショットの一般化と安全を意識したオブジェクトを可能にするために設計されたフレームワークである。
データ不足に対処するために,多様な模擬棚のシーンを生成するための効率的なボクセルベース手法を提案する。
限られた視点の課題に対処するために,多視点表現を学習するための新しいアーキテクチャを設計する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:32:42 GMT)
PointSea: Point Cloud Completion via Self-structure Augmentation [22.8] ポイントクラウドの完成は、3Dビジョンにおける根本的な問題だが、十分に解決されていない。
グローバル・ローカル・ポイント・クラウド・コンプリートのためのPointSeaを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:06:06 GMT)
Exploring Gender Disparities in Automatic Speech Recognition Technology [22.7] トレーニングデータにおいて、性別の表現によってパフォーマンスがどう異なるかを分析する。
以上の結果から,トレーニングデータにおける性別比とASR成績との複雑な相互作用が示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:29:38 GMT)
MA-GTS: A Multi-Agent Framework for Solving Complex Graph Problems in Real-World Applications [22.7] グラフ理論上の問題は、ロジスティクス、通信ネットワーク、トラフィック最適化といった現実世界のアプリケーションで発生する。
大きな言語モデル(LLM)は潜在的な解決策を提供するが、精度や入力長の制約を含む課題に直面している。
エージェント協調による複雑な問題を分解するマルチエージェントフレームワークMA-GTSを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:34:00 GMT)
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation [22.7] 画像からビデオへ生成する方法は、印象的な、写真リアリスティックな品質を実現した。
オブジェクトの動きやカメラの動きなど、生成されたビデオの特定の要素を調整することは、しばしば試行錯誤の面倒なプロセスである。
最近の技術は、事前訓練されたモデルを微調整することでこの問題に対処している。
本稿では,自己誘導画像生成のためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:27:47 GMT)
Citrus: Leveraging Expert Cognitive Pathways in a Medical Language Model for Advanced Medical Decision Support [22.4] 我々は、臨床専門知識とAI推論のギャップを埋める医療言語モデルであるCitrusを紹介する。
このモデルは、シミュレーションされた専門的疾患推論データの大規模なコーパスに基づいて訓練される。
我々は、独自の医療診断対話データセットを含む、最終段階のトレーニングデータをリリースする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:05:12 GMT)
GCDance: Genre-Controlled 3D Full Body Dance Generation Driven By Music [22.4] GCDanceは、音楽とテキストの両方のプロンプトに条件付きジャンル固有のダンスモーションを生成するための分類器なし拡散フレームワークである。
提案手法は,高レベルな事前学習音楽基礎モデルと手作りのマルチグラニュラリティ特徴融合機能を組み合わせることで,音楽の特徴を抽出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:53:18 GMT)
Topic-FlipRAG: Topic-Orientated Adversarial Opinion Manipulation Attacks to Retrieval-Augmented Generation Models [22.3] 本稿では,関連するクエリに対する意見に影響を及ぼすために,敵の摂動を利用する2段階の操作攻撃パイプラインを提案する。
実験により、提案した攻撃は特定のトピックに対するモデルの出力の意見を効果的にシフトさせることが示されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:57:43 GMT)
Towards Robust and Secure Embodied AI: A Survey on Vulnerabilities and Attacks [22.2] ロボットや自動運転車を含む身体的AIシステムは、現実のアプリケーションにますます統合されている。
これらの脆弱性は、センサーのスプーフィング、敵攻撃、タスクおよび動作計画における失敗を通じて現れる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:49:59 GMT)
Which Contributions Deserve Credit? Perceptions of Attribution in Human-AI Co-Creation [22.1] 本研究では,知識労働者の帰属意識について調査を行った。
私たちは、AIが同等のコントリビューションに対するクレジットを減らした一貫したパターンを観察しました。
我々の結果は、共同制作作業へのAI貢献を信用するための新しいアプローチを動機付け、通知します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:48:10 GMT)
GraphIC: A Graph-Based In-Context Example Retrieval Model for Multi-Step Reasoning [22.1] In-context Learning (ICL)は、実例を取り入れた大規模言語モデル(LLM)を強化する。
現在のメソッドは通常、テキスト埋め込みを使用して意味的類似度を測定するが、これは多段階推論タスクにバイアスをもたらすことが多い。
In-context の例検索に推論認識表現と特殊類似度指標を利用するグラフベースの検索モデル GraphIC を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:10:28 GMT)
Training Consistency Models with Variational Noise Coupling [22.0] 本稿では,フローマッチングフレームワークに基づく新しいCTトレーニング手法を提案する。
我々の主な貢献は、変分オートエンコーダ(VAE)のアーキテクチャにインスパイアされた、訓練されたノイズカップリング方式である。
多様な画像データセットにまたがる経験的結果は、顕著な生成的改善を示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:38:04 GMT)
Gnothi Seauton: Empowering Faithful Self-Interpretability in Black-Box Transformers [21.7] 概念に基づくネットワークのような自己解釈型モデルは、決定を人間の理解可能な概念に結びつけることによって洞察を与える。
シャプリー値のようなポストホック法は理論的には堅牢であるが、計算コストが高く、資源集約的である。
ブラックボックスモデルに対する理論的に保証された自己解釈性を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:58:17 GMT)
Evidence and quantification of cooperation of driving agents in mixed traffic flow [21.7] 協力は、多くの自然、社会的、工学的なシステムにおいて、複数のエージェントを持つユビキタスな現象である。
実験データから運転エージェントの協調性を定義・同定する方法は曖昧に思われる。
駆動エージェントの集合的協調性を同定するための統合概念的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:49:19 GMT)
SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference [21.5] SpargeAttnは任意のモデルに対する普遍的スパースで量子化された注意である。
本手法は,エンドツーエンドのメトリクスを犠牲にすることなく,言語,画像,ビデオ生成などの多様なモデルを大幅に高速化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:02:17 GMT)
Quantum implicit representation of vortex filaments in turbulence [21.4] 絡み合った渦フィラメントは乱流に必須であり、非線形流体力学を管理するコヒーレント構造として機能する。
本研究では、レベルセット法を用いて、乱流中の渦フィラメントの量子暗黙表現を導入する。
提案する量子フレームワークは,精度,堅牢性,汎用性のバランスを維持しつつ,ほぼ直線的な時間複雑性と指数的ストレージ削減を実現する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:57:32 GMT)
Improving Transformer Based Line Segment Detection with Matched Predicting and Re-ranking [21.3] RANK-LETRはトランスフォーマーを用いた新しい線分検出法である。
提案手法では,線分の中心に最も近い特徴点が位置を直接予測する。
実験の結果,提案手法は予測精度において他のTransformerベースおよびCNNベースアプローチよりも優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:54:40 GMT)
Tight Bounds on the Binomial CDF, and the Minimum of i.i.d Binomials, in terms of KL-Divergence [21.2] 両項尾部確率の有限標本上および下界を与える。
次にこれらを用いて、二項確率変数の最小値に対して高い確率を得る。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:57:20 GMT)
Small Language Models: Survey, Measurements, and Insights [21.2] 小型言語モデル (SLM) は大規模言語モデル (LLM) に比べて学術的関心が著しく少ない。
我々は70の最先端のオープンソースSLMを調査し、アーキテクチャ、トレーニングデータセット、トレーニングアルゴリズムという3つの軸にわたる技術革新を分析します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:48:03 GMT)
Scale-Distribution Decoupling: Enabling Stable and Effective Training of Large Language Models [21.2] 訓練安定性は、大規模言語モデル(LLM)の事前学習における永続的な課題である
完全連結層における重み行列のスケールと分布を明示的に分離し,トレーニングを安定させる手法として,SDD(Scale-Distribution Decoupling)を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:54:39 GMT)
Jacobian Sparse Autoencoders: Sparsify Computations, Not Just Activations [21.1] 本稿では,与えられたモデル成分の入力と出力のアクティベーションに空間性を生じるジャコビアンSAEと,それらを接続する計算(形式的にはジャコビアン)に空間性をもたらすヤコビアンSAEを提案する。
JSAEは,従来のSAEと同様,下流LLM性能を保ちながら,比較的広い範囲の計算空間を抽出することがわかった。
このことは、計算グラフの空間性が、LLMがトレーニングを通じて学習する特性であることを示すとともに、JSAEが標準のSAEよりも学習されたトランスフォーマー計算を理解するのに適していることを示唆している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:21:45 GMT)
Speaking the Right Language: The Impact of Expertise Alignment in User-AI Interactions [21.0] 25,000件のBing Copilot会話のサンプルを用いて、エージェントがドメインの専門知識の異なるユーザに対してどのように反応するかを調べる。
調査の結果,多種多様な分野にまたがって,エージェントは熟練あるいは熟練した専門知識のレベルに大きく反応することがわかった。
また,会話中の単語数から判断されるように,エージェントがユーザのそれと相反する専門知識のレベルに応答すると,より多くのユーザが会話を行うことを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:46:51 GMT)
Bongard in Wonderland: Visual Puzzles that Still Make AI Go Mad? [20.6] VLM(Vision-Language Models)の評価を行った。
VLMは時に差別的な概念を識別することに成功したが、しばしば失敗する。
人間の視覚的推論能力とマシン認知の間には、大きなギャップが残っています。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:27:57 GMT)
LAM: Large Avatar Model for One-shot Animatable Gaussian Head [20.5] 一つの画像からガウスの頭部再構成を行うための革新的な大型アバターモデル LAM を提案する。
LAMはアニマタブルなガウスヘッドを1つのフォワードパスで生成し、追加のネットワークや後処理ステップを使わずに再現とレンダリングを可能にする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:57:45 GMT)
FactFlow: Automatic Fact Sheet Generation and Customization from Tabular Dataset via AI Chain Design & Implementation [20.5] ツールはファクトシートの自動生成とカスタマイズのために設計された新しいツールです。
ツールは、協力的なAIワーカーの概念を適用して、生のデータセットを包括的で視覚的に魅力的なファクトシートに変換する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:15:41 GMT)
What are Foundation Models Cooking in the Post-Soviet World? [20.4] ソ連後を中心に、ロシア語とウクライナ語で1147と823の料理のデータセットであるBORSchを構築した。
我々は,ソ連後諸国の料理の起源を,テキストのみとマルチモーダル質問回答(QA)の両方で正確に識別する上で,先行モデルが困難であることを実証した。
これらの結果は,ウクライナの食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器・食器の混用などの言語的現象を誤解して説明できることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:09:56 GMT)
SpecGen: Automated Generation of Formal Program Specifications via Large Language Models [20.4] SpecGenは、大規模言語モデルに基づく形式的なプログラム仕様生成のための新しいテクニックである。
SV-COMP 279ベンチマークと手動で構築したデータセットを含む2つのデータセット上でSpecGenを評価する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:20:36 GMT)
HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversations [20.3] HealthQは、医療会話における大規模言語モデル(LLM)の質問機能を評価するためのフレームワークである。
我々は LLM の判断を統合して, 具体性, 妥当性, 有用性など, 様々な指標を用いて, 生成した質問を評価する。
医療談話における質問機能評価のための最初の体系的枠組みを提示し、モデルに依存しない評価手法を確立し、高品質な質問をリンクして患者の情報引用を改善するための実証的証拠を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:06:14 GMT)
Attribute-based Visual Reprogramming for Vision-Language Models [20.3] CLIP用の属性ベースのビジュアルリプログラミング(AttrVR)。
AttrVRは、イメージサンプル毎に$k$-nearest DesAttrsとDistAttrsを使用してパターンを反復的に洗練する。
実証的には、ViTベースの12のダウンストリームタスクとResNetベースのCLIPの両方で、優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:44:56 GMT)
SafeEraser: Enhancing Safety in Multimodal Large Language Models through Multimodal Machine Unlearning [20.0] MLLM(Multimodal Large Language Models)のための安全アンラーニングベンチマークであるSAFEERASERを提案する。
我々は2つの観点から非学習手法を総合的に評価する。
実験により、PD損失と既存の未学習手法を組み合わせることで、過剰な鍛造を効果的に防止できることが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:16:11 GMT)
AI Mismatches: Identifying Potential Algorithmic Harms Before AI Development [19.9] システムの実際のパフォーマンスは、安全性と共同創造性を確保するために必要なものよりも低い、重要な“AIミスマッチ”を観察します。
本稿では,リスクを早期に予測・緩和するためのAI Mismatchアプローチを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:43:00 GMT)
Can Visual Dialogue Models Do Scorekeeping? Exploring How Dialogue Representations Incrementally Encode Shared Knowledge [19.8] 本稿では,VisDialデータセットで事前訓練されたモデルが,スコアスコアリングを適切に行うための表現を段階的に構築する理論に基づく評価手法を提案する。
我々の結論は、対話に沿った共有文とプライベートステートメントを区別する能力は、分析モデルには適度に存在しているが、必ずしも漸進的に一貫性があるとは限らないということである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:11:03 GMT)
FRIDA to the Rescue! Analyzing Synthetic Data Effectiveness in Object-Based Common Sense Reasoning for Disaster Response [19.7] Field Ready Instruction Decoding Agent (FRIDA)モデルを作成するパイプラインを導入する。
我々は、LLaMaとMistralの命令調整モデルをいくつか微調整し、FRIDAモデルがベースモデルよりも様々なサイズで優れていることを発見した。
我々は、FRIDAパイプラインは一般的な常識を具現化することができるが、特定のドメイン知識のための情報検索によって拡張する必要があると結論付けた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:51:06 GMT)
FairGen: Controlling Sensitive Attributes for Fair Generations in Diffusion Models via Adaptive Latent Guidance [19.7] テキストと画像の拡散モデルは、しばしば特定の人口集団に対するバイアスを示す。
本稿では,任意の属性値に対して生成バイアスを緩和する課題に取り組む。
推論中の生成分布を制御する適応型潜伏誘導機構であるFairGenを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:47:22 GMT)
An Improved Privacy and Utility Analysis of Differentially Private SGD with Bounded Domain and Smooth Losses [19.5] 我々は、差分的にプライベートなグラディエントDescentの厳格なプライバシとユーティリティ特性を提供する。
境界領域を持つDPSGDの場合、プライバシー損失は凸性仮定なしで収束可能であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:05:41 GMT)
Reconstruction of dynamical systems from data without time labels [19.3] タイムラベルのないデータは、分子動力学、シングルセルRNAシークエンシングなど、多くのアプリケーションに現れる。
本稿では,確率分布から得られたデータをサンプルとして扱い,基礎となる力学系を再構築することを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:36:23 GMT)
Investigating Youth AI Auditing [19.3] 本研究では,18歳未満の若者が責任あるAI(RAI)に有意義に関与する可能性を探る。
若年者関連ユビキタスAIにおける問題行動の同定方法について検討した。
その結果,若年者は,その専門知識,生活経験,年齢に関する知識によって形成され,質的な洞察に寄与できることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:02:26 GMT)
PVBF: A Framework for Mitigating Parameter Variation Imbalance in Online Continual Learning [19.2] オンライン連続学習(OCL)は、AIシステムが非定常データストリームから適応的に学習できるようにする。
本稿では,パラメータ変動の不均衡をERベースOCLの予測バイアスに寄与する重要な要因として挙げる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:56:42 GMT)
Dynamic Fault Analysis in Substations Based on Knowledge Graphs [19.1] まず、構造化されていないテキストから関連情報を抽出し、Elastic-Search上に構築された柔軟な分散検索エンジンを利用してデータを処理します。
Viterbiアルゴリズムは、隠れた状態シーケンスを解読するために統合され、隠れた危険に関連するエンティティのセグメンテーションとラベル付けを容易にする。
提案手法の有効性は,テキスト記録に隠れた危険のある特定の変電所からのケース解析によって実証される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:40:44 GMT)
Enhancing DNA Foundation Models to Address Masking Inefficiencies [18.5] マスク付きオートエンコーダフレームワークをベースとした改良型エンコーダデコーダアーキテクチャを提案する。
我々は,BIOSCAN-5Mデータセットに対するアプローチを,200万以上のユニークなDNAバーコードから評価した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:56:25 GMT)
Efficient Test-Time Scaling via Self-Calibration [18.3] 多数決によるBest-of-NサンプリングとSelf-Consistencyは単純かつ効果的だが、各クエリに対して一定の数のサンプリングレスポンスが必要である。
これは、より単純な問題に対する無駄な計算と、より困難な問題に対する不十分な探索をもたらす可能性がある。
反応のモデル信頼性は、テスト時間スケーリングの効率向上に有効である、と我々は主張する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:21:14 GMT)
MixMax: Distributional Robustness in Function Space via Optimal Data Mixtures [18.1] 機械学習モデルは、ユーザグループのセットなど、事前に定義されたいくつかの設定でうまく機能するように要求される。
ミニマックス最適混合分布は, 簡単な凸リスク最適化問題の解であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:03:55 GMT)
DenoMAE2.0: Improving Denoising Masked Autoencoders by Classifying Local Patches [18.1] DenoMAE2.0は、局所的なパッチ分類目標と従来の再構成損失を統合し、表現学習とロバスト性を向上させる。
この二重目的のアプローチは、高いノイズレベルとデータ不足が大きな課題となる無線通信のための半教師付き学習において特に有益である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:41:56 GMT)
KV-Edit: Training-Free Image Editing for Precise Background Preservation [18.1] KV-Editはトレーニング不要のアプローチで、バックグラウンドの一貫性を維持するためにDiTのKVキャッシュを使用する。
我々のアプローチは、追加のトレーニングなしでDiTベースの生成モデルと互換性がある。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:42:11 GMT)
FoREST: Frame of Reference Evaluation in Spatial Reasoning Tasks [17.9] 大規模言語モデル(LLM)におけるFoR理解を評価するために,空間推論タスクにおける参照評価フレーム(FoREST)ベンチマークを導入する。
我々は,FoRESTを用いたテキスト・ツー・イメージモデルにおいて,FoRの理解とレイアウト生成を必要とする質問に対して,LLMを評価した。
その結果,様々なLLMにおけるFORクラス間での顕著な性能差が明らかとなり,テキスト・画像生成のための正確なレイアウトを生成する能力に影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:10:30 GMT)
RefuteBench 2.0 -- Agentic Benchmark for Dynamic Evaluation of LLM Responses to Refutation Instruction [17.8] 本稿では,従来のRefuteBenchを拡張したRefuteBench 2.0について紹介する。
有効期間の異なる過渡的および持続的な消火命令を設計する。
LLMをベースとしたリフューターは、より人間的なリフューティングを発生させ、評価器は、人間と高い相関関係のスコアを割り当てることができた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:51:25 GMT)
Rethinking Semi-Supervised Imbalanced Node Classification from Bias-Variance Decomposition [17.7] 本稿では,グラフ構造データ学習のためのグラフニューラルネットワーク(GNN)におけるクラス不均衡問題に対する新しいアプローチを提案する。
提案手法は,不均衡ノード分類とバイアス分散分解を統合し,モデル分散にデータ不均衡を密接に関連付ける理論的枠組みを確立する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:21:52 GMT)
Putting People in LLMs' Shoes: Generating Better Answers via Question Rewriter [17.7] 本稿では,単一ラウンドのインスタンスレベルのプロンプト最適化について述べる。
ブラックボックスLSMに対する人間の質問の信頼性を高めることにより、質問書き直しは生成した回答の品質を向上させる。
複数のブラックボックスLSMと長文質問応答データセットを用いた実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:13:27 GMT)
Responsible AI Agents [17.7] OpenAI、Google、Microsoft、Salesforceといった企業は、AI Agentsが受動的テキストからタスク実行に移行することを約束している。
AIエージェントの潜在的なパワーは、AIエージェントが不正な商取引、人間の操作、爆発的な破壊、知的財産の被害を可能にするという法律学者の恐れを加速させた。
この記事では、AIエージェントの方向性に関する懸念に対処する。
それは、あるソフトウェアが別のソフトウェアとどのように相互作用するかという中核的な側面が、AIエージェントを規律づける方法を生み出し、望ましくない行動が起こりそうにないことを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:49:06 GMT)
Accelerating Unbiased LLM Evaluation via Synthetic Feedback [17.6] 本稿では,人間のアノテーションへの依存を減らすために,人間と合成フィードバックを統合した統計的に原則化されたフレームワークを提案する。
実験では、市販の合成評価器で最大12.2%、微調整で最大24.8%のアノテーションを減らした。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:11:38 GMT)
Multi-Perspective Data Augmentation for Few-shot Object Detection [17.3] 本稿では,MPAD(Multi-Perspective Data Augmentation)フレームワークを提案する。
前景と地上の関係性の観点から,境界ボックス調整を伴うオブジェクト合成(ICOS)の文脈内学習を提案する。
前景-背景関係について、典型的・ハードな背景をサンプリングするための背景提案法(BAP)を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:34:52 GMT)
IMPROVE: Iterative Model Pipeline Refinement and Optimization Leveraging LLM Agents [17.3] 大規模言語モデル(LLM)エージェントは、コンピュータビジョンモデルの開発を自動化するための有望なソリューションとして登場した。
LLM駆動のMLパイプライン設計のための新しい戦略であるIterative Refinementを導入する。
イテレーティブリファインメントは安定性、解釈可能性、全体的なモデルパフォーマンスを改善します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:52:37 GMT)
EBES: Easy Benchmarking for Event Sequences [17.3] イベントシーケンス(英: Event Sequences、EvS)とは、不規則なサンプリング間隔と分類的特徴と数値的特徴の混合を特徴とするシーケンシャルデータである。
EBESは、シーケンスレベルのターゲットを持つEvS分類のための包括的なベンチマークである。
9つのモダンモデルを実装したオープンソースのPyTorchライブラリとともに、標準化された評価シナリオとプロトコルを備えている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:02:47 GMT)
DiffGAD: A Diffusion-based Unsupervised Graph Anomaly Detector [17.2] 拡散型グラフ異常検出器(DiffGAD)を提案する。
DiffGADの核心は、未熟な宇宙学習のパラダイムであり、それを差別的コンテンツで導くことによって、その習熟度を高めるために細心の注意を払って設計されている。
6つの実世界および大規模データセットを用いて実施したDiffGADの総合評価により,その異常な性能が示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:03:45 GMT)
Provable Performance Bounds for Digital Twin-driven Deep Reinforcement Learning in Wireless Networks: A Novel Digital-Twin Bisimulation Metric [17.0] ディジタルツイン(DT)駆動の深部強化学習(DRL)が,無線ネットワーク最適化のための有望なパラダイムとして登場した。
本稿では,DTと実世界の無線ネットワーク環境におけるマルコフ決定過程 (MDP) の差分を定量化するためのDTバイシミュレーション・メトリック (DT-BSM) を提案する。
DT-BSMの重み付け和と、DT-BSMにおけるMDP内のサブ最適値によって、実世界展開におけるDT-BSMのサブ最適値(regret)が束縛されることを実証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:52:51 GMT)
olmOCR: Unlocking Trillions of Tokens in PDFs with Vision Language Models [17.0] olmOCRはオープンソースのPythonツールキットで、PDFをクリーンで線形化された平文に自然な読み順で処理する。
我々のツールキットは、100,000以上のクロールされたPDFから26万ページのサンプルに基づいて訓練された微調整された7B視覚言語モデル(VLM)を実行する。
olmOCRは大規模バッチ処理に最適化されており、様々なハードウェア設定に柔軟にスケールでき、100万のPDFページをわずか190ドルで変換できる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:38:38 GMT)
HRR: Hierarchical Retrospection Refinement for Generated Image Detection [17.0] 階層的レトロスペクティブ再定義(HRR)と呼ばれる拡散モデルに基づく生成画像検出フレームワークを提案する。
HRRフレームワークは、生成した画像検出タスクにおいて、最先端のメソッドよりも優れたパフォーマンスを継続的に提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:13:44 GMT)
Concentration of Measure for Distributions Generated via Diffusion Models [16.9] 本研究では,拡散モデルから抽出したデータ分布が測定値の濃度を満たすことを示す数学的議論と経験的証拠を組み合わせることにより,実験結果を示す。
このことは、そのようなモデルは極めて制限的であり、従来の拡散モデルでは「重い尾の」データを取得できないという文献で以前に観察された事実を説明できることを意味している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:15:46 GMT)
Can LLMs Explain Themselves Counterfactually? [16.6] 説明はMLモデルの振る舞いに関する洞察を得るための重要なツールである。
我々は、特定のタイプの自己説明、自己生成反事実説明(SCE)について研究する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:40:41 GMT)
A Theoretical Framework for Data Efficient Multi-Source Transfer Learning Based on Cramér-Rao Bound [16.5] 対象モデルを共同でトレーニングするために、各ソースタスクから必要なソースサンプルの最適な量は何か?
具体的には、クロスエントロピー損失と整合する一般化誤差尺度を導入し、Cram'er-Rao界に基づいて最小化して、各ソースタスクの最適な転送量を決定する。
我々はアーキテクチャに依存しないデータ効率のアルゴリズムOTQMSを開発し、深層多元移動学習モデルの学習のための理論的結果を実装した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:33:16 GMT)
Co-MTP: A Cooperative Trajectory Prediction Framework with Multi-Temporal Fusion for Autonomous Driving [16.5] Co-MTPは、自律運転のための多時間融合を伴う一般的な協調軌道予測フレームワークである。
将来の領域では、V2Xは周囲の物体の予測結果を提供することができる。
実世界のデータセットV2X-Seq上でのCo-MTPフレームワークの評価を行った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:38:44 GMT)
MulChain: Enabling Advanced Cross-Modal Queries in Hybrid-Storage Blockchains [16.4] ビデオのような大規模なマルチモーダルデータファイルは、しばしばオフラインで保存される。
既存のブロックチェーンはマルチモーダルデータクエリのネイティブサポートを提供していない。
既存のブロックチェーンとのスムーズな統合を可能にする新しいアーキテクチャであるMulChainを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:43:07 GMT)
SOTOPIA-Ω: Dynamic Strategy Injection Learning and Social Instruction Following Evaluation for Social Agents [16.3] SOTOPIA-Omegaフレームワークは、言語エージェントの社会的能力を高めることを目的としている。
本稿では,ソーシャルインストラクション・フォロー(S-IF)の概念を導入し,新しい2つのS-IF評価指標を提案する。
高品質コーパスで訓練されたいくつかの7Bモデルは、社会目標達成において専門家エージェント(GPT-4)をはるかに上回るだけでなく、S-IF性能も向上した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:33:44 GMT)
A Distributional Treatment of Real2Sim2Real for Vision-Driven Deformable Linear Object Manipulation [16.3] 本稿では,変形可能な線形オブジェクト(DLO)を視覚的知覚に基づいて操作するための統合フレームワークを提案する。
物理パラメータの後方分布を計算し、それぞれのDLOの挙動を概略シミュレートする。
次に、シムベースの政策学習と実世界のパフォーマンスにおいて、結果の領域分布の影響について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:01:06 GMT)
Towards Mechanistic Interpretability of Graph Transformers via Attention Graphs [16.2] 本稿では,グラフニューラルネットワーク(GNN)とグラフ変換器の機械的解釈性向上のための新しいツールであるAttention Graphsを紹介する。
注意グラフは、入力ノード間の情報の流れを記述するために、トランスフォーマー層とヘッドにまたがる注意行列を集約する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:15:29 GMT)
CURE: Simulation-Augmented Auto-Tuning in Robotics [15.9] 本稿では、因果的な設定オプションを識別するCUREを提案する。
CUREは、様々な構成オプションとロボットのパフォーマンス目標との間の因果関係を抽象化する。
物理ロボットとシミュレーションの両方で実験を行うことにより,CUREの有効性と伝達性を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:39:25 GMT)
Argus: Benchmarking and Enhancing Vision-Language Models for 3D Radiology Report Generation [15.9] 3Dラジオグラフィーレポート生成(DRRG)の包括的なベンチマークは行われていない。
我々は、*CT-3DRRG*を計算し、3DRRG上でのVLM性能を評価するための堅牢で多様なベンチマークを確立した。
本稿では、3DRRGのための高性能なVLMを構築するための総合的なトレーニング手法を提案し、視覚エンコーダ事前学習戦略、視覚トークン圧縮、データとモデルスケールの影響などの重要な要素を探索する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:17:52 GMT)
PromptMID: Modal Invariant Descriptors Based on Diffusion and Vision Foundation Models for Optical-SAR Image Matching [15.8] 本稿では,テキストプロンプトを用いたモダリティ不変記述子構築手法であるPromptMIDを提案する。
PromptMIDは、事前訓練された拡散モデルと視覚基礎モデルを活用することで、マルチスケールのモダリティ不変の特徴を抽出する。
4つの異なる領域の光学SAR画像データセットの実験により、PromptMIDは最先端のマッチング方法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:19:26 GMT)
Training-free Camera Control for Video Generation [15.8] 本稿では,市販ビデオ拡散モデルに対して,カメラの動き制御を実現するためのトレーニングフリーで堅牢なソリューションを提案する。
本手法では,カメラ注釈付きデータセットの教師付き微調整やデータ拡張による自己教師型トレーニングは不要である。
ほとんどの事前訓練されたビデオ拡散モデルでプラグイン・アンド・プレイでき、単一の画像またはテキストプロンプトを入力としてカメラ制御可能なビデオを生成することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:32:29 GMT)
A Unified Bayesian Perspective for Conventional and Robust Adaptive Filters [15.6] 本稿では適応フィルタの起源と解釈について述べる。
統一された枠組みでは、観測ノイズの確率モデルに依存する多くの適応フィルタの導出が可能である。
数値的な例は特性を説明するために示され、導出された適応フィルタの性能についてより深い洞察を与える。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:20:10 GMT)
Neurobiber: Fast and Interpretable Stylistic Feature Extraction [15.5] Neurobiberは、高速で解釈可能なスタイルのプロファイリングのためのトランスフォーマーベースのシステムである。
オープンソースのBiberPlusライブラリから96のBiberスタイルの機能を予測する。
Neurobiberは、広範なリトレーニングなしでPAN 2020オーサシップ検証タスクで競争力を発揮する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:11:56 GMT)
Multiple References with Meaningful Variations Improve Literary Machine Translation [15.4] 本稿では、Par3データセットにおける世界文学の異なる英訳間の意味的類似性を解析し、複数の参照を用いるためのベストプラクティスを検討する。
我々は,パラフレーズ間の意味的類似性を,低,中,高の3つのレベルに分類する。
中・高意味の類似性を持つパラフレーズを使用することで、BLEU(0.3-0.5)、COMET(0.1-0.9)、chrF++(0.17-0.32)が改善され、未フィルタリングデータセットのパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:31:31 GMT)
S$^4$ST: A Strong, Self-transferable, faSt, and Simple Scale Transformation for Transferable Targeted Attack [15.3] Transferable Targeted Attacks (TTA) は、ブラックボックスモデルから特定の誤ラベルを予測することを目的としている。
既存のメソッドは大規模な追加データに大きく依存している。
本研究では,基本変換の有効性と相関性を分析するために,自己アライメントと自己伝達性という2つの盲目尺度を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:11:28 GMT)
MMDisCo: Multi-Modal Discriminator-Guided Cooperative Diffusion for Joint Audio and Video Generation [15.3] 本研究は,最小計算コストで音声映像生成モデルを構築することを目的とする。
そこで本研究では,単一モーダルモデルを用いて,モダリティ間の整合性のあるサンプルを協調的に生成する手法を提案する。
いくつかのベンチマークデータセットに対する実証的な評価により,本手法は比較的少ないパラメータで単一モードの忠実度と多モードアライメントの両方を改善することが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:34:26 GMT)
Simulating quantum emitters in arbitrary photonic environments using FDTD: beyond the semi-classical regime [15.3] 本稿では,量子二値系(TLS)を有限差分時間領域フレームワークに統合する数値アルゴリズムを提案する。
本手法は, 単励起状態に着目し, 自己相互作用を排除するために全フィールド入射場(TF-IF)技術を用いる。
このアルゴリズムはまた、共鳴エネルギー移動、超放射能、真空ラビ分裂などの複雑な現象をモデル化することに成功した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:48:39 GMT)
Learning sparse generalized linear models with binary outcomes via iterative hard thresholding [15.3] 統計学において、一般化線形モデル(GLM)はデータモデリングに広く用いられている。
本稿では,2次反復型ハードしきい値(BIHT)と呼ばれる反復型ハードしきい値(ReLU損失に対する投射勾配勾配)アルゴリズムの使用と解析を提案する。
BIHTは統計的に効率的であり、スパースバイナリGLMの一般クラスにおいてパラメータ推定のための正しい解に収束することを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:42:33 GMT)
PianoMotion10M: Dataset and Benchmark for Hand Motion Generation in Piano Performance [15.2] ピアノ演奏のための手の動きと指の動きをガイドするピアノハンド動作生成ベンチマークを構築した。
この目的のために,1000万個の手ポーズを持つ鳥眼ビューから116時間のピアノ演奏ビデオからなる注釈付きデータセットPianoMotion10Mを収集した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:21:57 GMT)
Grandes modelos de lenguaje: de la predicción de palabras a la comprensión? [15.2] 有名なChatGPTのような大規模な言語モデルは、人工知能の分野で予期せぬ革命をもたらした。
本稿では,この技術がどのように開発されたのか,その動作の基礎について述べる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:44:49 GMT)
VPNeXt -- Rethinking Dense Decoding for Plain Vision Transformer [15.1] 我々は、Plain Vision Transformer(ViT)の新しいシンプルモデルであるVPNeXtを紹介する。
同じ均一なパラダイムを共有する多くの関連研究とは異なり、VPNeXt は ViT に基づく密度表現の新しい視点を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:34:33 GMT)
Modeling Neural Activity with Conditionally Linear Dynamical Systems [14.9] 本研究では,これらの力学を特徴付ける汎用手法として,条件線形力学系モデルを開発した。
CLDSモデルは,データ制限の厳しいレギュレーションにおいても良好に動作可能であることが判明した。
例えば、方向方向を非線形にエンコードする視床ニューロンのモデル化にCLDSを適用し、キューリーディングタスク中に運動皮質ニューロンをモデル化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:36:24 GMT)
LDGen: Enhancing Text-to-Image Synthesis via Large Language Model-Driven Language Representation [14.9] 本稿では,大規模言語モデル(LLM)を既存のテキスト・画像拡散モデルに統合する新しい手法であるLDGenを紹介する。
提案手法では,階層的なキャプション最適化とヒューマンインストラクション技術を用いて,正確な意味情報を導出する言語表現戦略を採用している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:42:34 GMT)
ASGEA: Exploiting Logic Rules from Align-Subgraphs for Entity Alignment [14.8] 本稿では,Align-Subgraph Entity Alignment(ASGEA)フレームワークを提案する。
また、解釈可能なパスベースのグラフニューラルネットワークASGNNを設計し、KG間の論理規則を効果的に識別し、統合する。
実験の結果,既存の組込み方式に比べて,MMEA(Multi-Modal EA)タスクにおけるASGEAの優れた性能が示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:55:35 GMT)
gRNAde: Geometric Deep Learning for 3D RNA inverse design [14.7] gRNAdeは3次元RNAバックボーンで動作する幾何学的RNA設計パイプラインである。
構造と力学を明示的に考慮したシーケンスを生成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:17:35 GMT)
MPO: An Efficient Post-Processing Framework for Mixing Diverse Preference Alignment [14.5] Mixing Preference Optimization (MPO)は、単一目的ポリシーを集約するための後処理フレームワークである。
MPOは様々な好みにまたがるバランスの取れた性能を実現し、計算コストを大幅に削減した既存モデルより優れている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:22:12 GMT)
Uncertainty Modeling in Graph Neural Networks via Stochastic Differential Equations [14.4] グラフ構造化データに対する不確実性認識表現の学習問題に対処するために,Latent Graph Neural Differential Equations (LGNSDE)を導入する。
我々は、潜在空間の分散がモデル出力の分散を束縛していることを証明し、不確実性推定に対する理論的に妥当な保証を与える。
本フレームワークは,LGNSDEが不確実性を確実に定量化できることを前提として,分布外検出,ノイズに対する堅牢性,アクティブラーニングに競争力がある。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:34:08 GMT)
Amortized Control of Continuous State Space Feynman-Kac Model for Irregular Time Series [14.4] 医療、気候、経済などの現実世界のデータセットは、しばしば不規則な時系列として収集される。
本稿では,連続状態空間モデル (ACSSM) を時系列の連続的動的モデリングに用いるためのアモータイズ制御を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:18:24 GMT)
Adiabatic modulation of driving protocols in periodically driven quantum systems [14.4] 我々は、高周波駆動プロトコルがスイッチオン/オフの一連の電位からなる周期駆動システムを考える。
周期的に駆動される量子系の長期力学にどのように影響するかを考察する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:26:41 GMT)
DeepCircuitX: A Comprehensive Repository-Level Dataset for RTL Code Understanding, Generation, and PPA Analysis [14.3] DeepCircuitXは、RTL(Register Transfer Level)コード理解、生成、PPA(Power- Performance-area)分析を促進するために設計された包括的なリポジトリレベルのデータセットである。
ファイルレベルのRTLコードまたは物理レイアウトデータに制限された既存のデータセットとは異なり、DeepCircuitXはリポジトリ、ファイル、モジュール、ブロックレベルのRTLコードにまたがる、総合的でマルチレベルなリソースを提供する。
DeepCircuitXにはChain of Thought(CoT)アノテーションが組み込まれている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:34:00 GMT)
Armada: Memory-Efficient Distributed Training of Large-Scale Graph Neural Networks [14.1] 本稿では,マシン間で分割された数十億規模のグラフ上でのグラフニューラルネットワーク(GNN)の分散トレーニングについて検討する。
この環境での効率的な訓練は、GNN近傍サンプリングによる機械間通信を最小限に抑える分断アルゴリズムに頼っている。
我々は、分散GNNトレーニングのための新しいエンドツーエンドシステムであるArmandaを紹介し、その主な貢献は、大規模グラフに効率よくスケール可能な、新しいmin-edge-cutパーティショニングアルゴリズムであるGREMである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:47:39 GMT)
Task Graph Maximum Likelihood Estimation for Procedural Activity Understanding in Egocentric Videos [14.0] 手続き的活動からタスクグラフを学習するための勾配に基づくアプローチ
我々は,CaptainCook4D,EgoPER,EgoProceLに対するアプローチを検証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:13:09 GMT)
GLEAN: Generalized Category Discovery with Diverse and Quality-Enhanced LLM Feedback [14.0] Generalized Category Discovery (GCD)は、ラベルなしデータの既知のカテゴリと新しいカテゴリの両方を認識することを目的としている。
従来のGCD手法では、紛らわしいインスタンスのエラーの修正が困難であるなど、重大な課題に直面していた。
一般化されたカテゴリ発見のための統一的なフレームワークであるGLEANを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:11:37 GMT)
LiNo: Advancing Recursive Residual Decomposition of Linear and Nonlinear Patterns for Robust Time Series Forecasting [13.9] 近年の深層時系列予測モデルでは, 季節分解とトレンド分解を利用して, 絡み合った成分を分離することが困難である。
線形パターンと非線形パターンの両方を明示的に抽出することにより再帰的残留分解を革新する。
我々は、一般的な学習可能な自己回帰モデルに対する現在の単純な線形パターン抽出器を開発し、すべての重要な非線形パターンを扱える新しいNoブロックを設計する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:50:15 GMT)
Learning Multi-agent Multi-machine Tending by Mobile Robots [13.8] 本稿では,MARL(Multi-agent Reinforcement Learning)技術に基づく移動ロボットによるマルチエージェント型マルチマシン学習フレームワークを提案する。
マルチエージェント・プロキシ・ポリシー・オプティマイゼーション(MAPPO)アルゴリズムにアテンションベースの符号化機構を開発し,その性能を高める。
我々のモデル (AB-MAPPO) は, タスク成功, 安全性, 資源利用の観点から, MAPPO よりも優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:28:01 GMT)
Requirements-Driven Automated Software Testing: A Systematic Review [13.7] 本研究では,REDAST研究の現状を整理し,今後の方向性について考察する。
この体系的な文献レビュー(SLR)は、要求入力、変換技術、テスト結果、評価方法、既存の制限を分析して、REDASTの展望を探求する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:13:09 GMT)
Generative Psycho-Lexical Approach for Constructing Value Systems in Large Language Models [13.5] 大規模言語モデル(LLM)は、その本質的な価値に関する懸念を提起している。
本研究は、生成心理学的アプローチ(GPLA)の導入によるギャップに対処する。
LLMに適した心理学的基礎を持つ5要素値システムを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:40:09 GMT)
Structure-prior Informed Diffusion Model for Graph Source Localization with Limited Data [13.4] 本稿では、限定データシナリオにおける3つの重要な課題に対処する新しいフレームワークであるSIDSLを紹介する。
SIDSLは、グラフラベルの伝搬を通じてトポロジ対応の先行情報を取り込み、伝搬強化された条件付きデノイザを用いる。
4つの実世界のデータセットに対する実験の結果は、SIDSLの優れた性能を示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:47:22 GMT)
MEMERAG: A Multilingual End-to-End Meta-Evaluation Benchmark for Retrieval Augmented Generation [13.4] マルチリンガル・エンド・エンド・エンド・メタ評価RAGベンチマーク(MEMERAG)を開発した。
我々のベンチマークは,MIRACLデータセット上に構築されており,母国語質問を用いて多種多様な大言語モデル(LLM)による応答を生成する。
提案するベンチマークでは,高度なプロンプト技術とLCMによる改善を確実に識別できることが示されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:39:53 GMT)
DisPose: Disentangling Pose Guidance for Controllable Human Image Animation [13.4] DisPoseは、人間の画像アニメーションにおけるスパーススケルトンポーズをモーションフィールドガイダンスとキーポイント対応に切り離すことを目的としている。
既存のモデルにシームレスに統合するために,プラグイン・アンド・プレイハイブリッド・コントロールネットを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:55:40 GMT)
STQS: A Unified System Architecture for Spatial Temporal Quantum Sensing [13.4] 分散量子センシングのための統合システムアーキテクチャSTQSを提案する。
包括的なゲートベースのフレームワークを用いることで、量子センシングスキームの設計空間を体系的に探求する。
本稿では,参照状態と検出状態を比較し,信頼度を割り当てる新しい距離ベースメトリクスを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:13:13 GMT)
Quantifying the Capability Boundary of DeepSeek Models: An Application-Driven Performance Analysis [13.4] 我々はDeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwenシリーズ、DeepSeek-R1-Distill-Llamaシリーズとその対応する4ビット量子化モデルを評価する。
この結果から、推論強化モデルが一般に強力であるにもかかわらず、全てのタスクにおいて普遍的に優れるわけではないことが示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:01:30 GMT)
NusaAksara: A Multimodal and Multilingual Benchmark for Preserving Indonesian Indigenous Scripts [13.2] NusaAksaraはインドネシア語の公開ベンチマークで、オリジナルのスクリプトを含んでいる。
本ベンチマークでは,画像分割,OCR,翻訳,翻訳,言語識別などの多様なタスクを網羅する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:23:52 GMT)
A Self-Explainable Heterogeneous GNN for Relational Deep Learning [13.2] リレーショナルデータのための自己説明可能なヘテロジニアスグラフニューラルネットワーク(GNN)を提案する。
提案手法は,モデルの推論機構を忠実に捉えた情報的メタパスを効果的に同定する。
これは、合成シナリオと実世界のシナリオの両方において、既存の手法を大きく上回っている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:59:12 GMT)
Unveiling and Causalizing CoT: A Causal Pespective [13.2] CoT(Chain-of-Thought)は,大規模言語モデル(LLM)の推論能力の向上に成功している。
既存のCoTは、推論を人間に理解させるのに苦労しています。
我々はCoTを因果的観点から明らかにし、すべての推論ステップの正確性と理解性の両方を保証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:20:27 GMT)
Near-Optimal Approximations for Bayesian Inference in Function Space [13.2] 再生カーネルヒルベルト空間(RKHS)上で定義されたベイズ後部に対するスケーラブルな推論アルゴリズムを提案する。
我々は、Kosambi-Karhunen-Loeve展開の最初の$M$成分への射影による無限次元ランゲヴィン拡散を近似する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:10:02 GMT)
A Market for Accuracy: Classification under Competition [13.2] 提供者、消費者、市場そのものに影響を与えるため、市場環境で学習を研究します。
本稿では,競争相手の存在下での市場シェアを最大化するために,競争対象の分類手法を提案する。
当社のアプローチは,提供者だけでなく消費者にもメリットがあることを示し,市場参入のタイミングとモデル更新が重要であることを明らかにする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:18:43 GMT)
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning [13.2] オフラインの強化学習では、価値関数の過大評価を防ぐために、配布外動作を管理する必要がある。
拡散雑音回帰問題としてクルバック・リブラー (KL) 制約ポリシーの繰り返しを定式化する拡散アクタ・クリティカル (DAC) を提案する。
提案手法はD4RLベンチマークで評価され,ほぼすべての環境において最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:33:21 GMT)
You Only Sample Once: Taming One-Step Text-to-Image Synthesis by Self-Cooperative Diffusion GANs [13.1] YOSOは、高速でスケーラブルで高忠実なワンステップ画像合成のための新しい生成モデルであり、高いトレーニング安定性とモードカバレッジを持つ。
提案手法は,一段階のモデルトレーニングをスクラッチから行うことができ,競争性能が向上することを示す。
特に、YOSO-PixArt-$alpha$は、512の解像度でトレーニングされた1ステップで画像を生成することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:09:17 GMT)
Adaptive Segment-level Reward: Bridging the Gap Between Action and Reward Space in Alignment [13.1] 強化学習(RL)は大規模言語モデル(LLM)と人間の嗜好の整合に極めて効果的であることが証明されている。
典型的なRL法は、全体的なシーケンス報酬の下で最適化され、最適以下の学習プロセスにつながる可能性がある。
これは重要なクレジット割り当ての問題、すなわち、強化または抑制するトークンを特定することを反映している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:42:40 GMT)
Sample-efficient diffusion-based control of complex nonlinear systems [12.8] SEDCは、高次元状態-作用空間、非線形システムダイナミクス、最適でないトレーニングデータと準最適制御ソリューションのギャップに対処する、新しい拡散ベースの制御フレームワークである。
提案手法は, 複素非線形系の試料効率制御における顕著な進歩を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:30:04 GMT)
Memory-Free and Parallel Computation for Quantized Spiking Neural Networks [12.2] 量子スパイキングニューラルネットワーク(QSNN)は、優れたエネルギー効率を提供し、リソース制限されたエッジデバイスへのデプロイに適している。
ビット幅の制限と膜電位は、顕著な性能低下をもたらす。
膜電位を直接記憶せずにすべての履歴情報をキャプチャするメモリフリー量子化手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:34:25 GMT)
Robust Knowledge Distillation in Federated Learning: Counteracting Backdoor Attacks [12.2] フェデレートラーニング(FL)は、データのプライバシを保持しながら、複数のデバイス間で協調的なモデルトレーニングを可能にする。
悪意のある参加者が世界モデルに侵入できるバックドア攻撃の影響を受けやすい。
本稿では,制約的仮定に頼らずにモデル整合性を高める新しい防御機構であるロバスト知識蒸留(RKD)を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:42:39 GMT)
Generalized Linear Bandits with Limited Adaptivity [12.1] 限定適応性の制約内における一般化線形文脈帯域問題について検討する。
我々は2つのアルゴリズム, $textttB-GLinCB$ と $textttRS-GLinCB$ を提示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:24:55 GMT)
VeriPlan: Integrating Formal Verification and LLMs into End-User Planning [12.1] 本稿では,エンドユーザープランニングにおけるLCMの信頼性と柔軟性を高めるために,形式的検証手法,特にモデルチェックを適用したVeriPlanを提案する。
本研究は,エンドユーザー計画タスクにおいて,形式検証とユーザ制御機能をLLMに効果的に統合することを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:53:00 GMT)
The Adaptive $τ$-Lasso: Robustness and Oracle Properties [12.1] 本稿では,高次元データセット解析のためのロバストな$tau$-regression推定器の正規化版を紹介する。
得られた推定器はアダプティブ $tau$-Lasso と呼ばれ、外れ値や高平均点に対して堅牢である。
外れ値と高平均点に直面して、適応 $tau$-Lasso と $tau$-Lasso 推定器は、競合する正規化推定器の最高のパフォーマンスを達成または一致させる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:57:44 GMT)
UGMathBench: A Diverse and Dynamic Benchmark for Undergraduate-Level Mathematical Reasoning with Large Language Models [12.0] UGMathBenchは16の被験者5,062の課題と111のトピックで構成され、10の異なる回答タイプが特徴である。
それぞれの問題には3つのランダム化バージョンが含まれており、主要なオープンソース LLM が UGMathBench で飽和するにつれて、リリースに向けて追加バージョンが計画されている。
LLMを23個評価した結果, OpenAI-o1-mini による EAcc のロバスト性は 56.3% であり,それぞれ異なるモデルで大きな$Delta$値が観測された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:15:43 GMT)
Stealthy Backdoor Attack in Self-Supervised Learning Vision Encoders for Large Vision Language Models [12.0] 我々は、視覚エンコーダを単に妥協させることで、視覚幻覚を大きな視覚言語モデル(LVLM)に誘導できる新たなバックドア脅威を明らかにした。
これらのエンコーダの共有と再利用のため、下流のLVLMの多くはエンコーダからバックドアの振る舞いを継承し、広くバックドアに繋がる可能性がある。
本稿では,新たなトリガ最適化とバックドア学習技術を備えたLVLM用SSLビジョンエンコーダにおいて,この脆弱性を利用する最初の方法であるBadVisionを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:28:41 GMT)
A Survey of Zero-Knowledge Proof Based Verifiable Machine Learning [11.9] ゼロ知識証明(ZKP)技術は、センシティブなデータを開示することなく、トレーニングプロセスと推論プロセスの両方において、モデル性能と信頼性の効果的な検証を可能にする。
ZKPは、機械学習モデルの妥当性とセキュリティを保証する。
この調査論文は、2017年6月から2024年12月までのZKML(Zero-Knowledge Machine Learning)研究の見直しと分析によってギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:04:27 GMT)
Toward Breaking Watermarks in Distortion-free Large Language Models [11.9] 我々は,LSMを「妥協」し,スプーフィング攻撃を行うことが可能であることを示す。
具体的には,ウォーターマーキングに用いる秘密鍵を正確に推定する混合整数線形プログラミングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:52:55 GMT)
How Execution Features Relate to Failures: An Empirical Study and Diagnosis Approach [11.9] 障害のローカライゼーションは、障害の原因となる可能性のあるコード領域を特定することを目的としている。
従来のテクニックは主にステートメントの実行と失敗を関連付けています。
我々は17の実行特徴を分析し,その相関性を評価した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:00:05 GMT)
FediverseSharing: A Novel Dataset on Cross-Platform Interaction Dynamics between Threads and Mastodon Users [11.8] FediverseSharingは、10ヶ月で2万以上のThreadsユーザと2万以上のMastodonユーザ間のインタラクションをキャプチャする最初のデータセットだ。
このデータセットは、以前は2つのプラットフォームが統合していたクロスプラットフォームインタラクションを研究する基盤として機能する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:47:08 GMT)
from Benign import Toxic: Jailbreaking the Language Model via Adversarial Metaphors [11.8] 本稿では,AdVersArial meTAphoR(AVATAR)を利用して大規模言語モデルを誘導し,脱獄の悪質な隠喩を校正する新たな攻撃フレームワークを提案する。
AVATARは脱獄性LDMを効果的かつ効果的に導入できることを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:41:25 GMT)
Stability-Aware Training of Machine Learning Force Fields with Differentiable Boltzmann Estimators [11.7] 本稿では,機械学習力場のためのマルチモーダルトレーニングであるStABlEトレーニングを提案する。
StABlEトレーニングは、不安定な領域を探すためにMDシミュレーションを並行して実行し、監督を通じて不安定を補正する。
有機分子, テトラペプチド, 凝縮相系にまたがる方法論を実証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:52:52 GMT)
Research on Enhancing Cloud Computing Network Security using Artificial Intelligence Algorithms [11.7] クラウドコンピューティング環境は、セキュリティの脅威にますます弱い。
従来のセキュリティメカニズムは、ルールマッチングと特徴認識に基づいて、進化する攻撃戦略への適応に苦労する。
本稿では,ディープラーニングを利用して多層防御アーキテクチャを構築する適応型セキュリティ保護フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:06:40 GMT)
Design and implementation of a distributed security threat detection system integrating federated learning and multimodal LLM [11.7] 本稿では,多モーダル大規模言語モデル(LLM)とフェデレーション学習を統合した分散セキュリティ脅威検出システムを提案する。
10TBの分散データセットを実験的に評価した結果,従来のベースラインモデルよりも4.1ポイント高い96.4%の精度で検出できることがわかった。
性能分析により,本システムは分散環境における効率的な処理能力を維持し,モデルトレーニングに180秒,分散ネットワークにまたがる脅威検出に3.8秒を要することがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:44:08 GMT)
Extreme Rotation Estimation in the Wild [11.5] 極端に捉えたインターネット画像間の相対的な3次元配向を推定する手法を提案する。
シーンレベルのインターネット写真コレクションから収集したExtremeLandmarkPairsデータセットをコントリビュートする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:09:30 GMT)
Stackelberg Game Preference Optimization for Data-Efficient Alignment of Language Models [11.5] Stackelberg Game Preference Optimization (SGPO) は、2プレイヤーのStackelbergゲームとしてアライメントをモデル化するフレームワークである。
SGPOをStackelberg Self-Annotated Preference Optimization (SSAPO)アルゴリズムでインスタンス化する。
SSAPOの3ラウンドで,Mistral-7Bで35.82%,Llama3-8B-Instructで40.12%,GPT-4で35.82%の勝利率を達成した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:08:12 GMT)
Spatial Context-based Self-Supervised Learning for Handwritten Text Recognition [11.5] 手書き文字認識(HTR)はコンピュータビジョンにおける問題である。
コンピュータビジョンにおける自己監視学習(SSL)の成功にもかかわらず、HTRへの応用はかなり散在している。
本稿では,HTRに適応し最適化する手法について検討し,手書き文字の特徴を活かした新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:57:55 GMT)
WebGames: Challenging General-Purpose Web-Browsing AI Agents [11.3] WebGamesは汎用的なWebブラウザAIエージェントを評価するために設計された包括的なベンチマークスイートである。
GPT-4o, Claude Computer-Use, Gemini-1.5-Pro, Qwen2-VLなどの視覚言語モデルを人為的性能に対して評価した。
その結果、最高のAIシステムは、人間のパフォーマンスが95.7%であるのに対して、43.1%の成功率しか達成していない。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:45:08 GMT)
Debt Collection Negotiations with Large Language Models: An Evaluation System and Optimizing Decision Making with Multi-Agent [11.3] 負債収集交渉(DCN)は、非業績融資(NPL)の管理と債権者損失の低減に不可欠である。
従来の手法は労働集約型であり、大規模言語モデル(LLM)は将来的な自動化の可能性を秘めている。
本稿では、DCNの自動化におけるLCMについて検討し、4つの側面に13のメトリクスを持つ新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:13:03 GMT)
OCCAM: Towards Cost-Efficient and Accuracy-Aware Classification Inference [11.3] 我々は、分類クエリよりも最適な分類器割り当て戦略を計算するための原則的手法であるOCCAMを提案する。
さまざまな実世界のデータセットにおいて、OCCAMは40%のコスト削減を実現し、精度の低下はほとんど、あるいはまったくない。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:15:20 GMT)
WhatELSE: Shaping Narrative Spaces at Configurable Level of Abstraction for AI-bridged Interactive Storytelling [11.2] WhatELSEはAIでブリッジされたINオーサリングシステムで、例題から物語可能性空間を生成する。
我々は,WhatELSEによって著者が物語空間を知覚し,編集し,プレイ時に対話的な物語を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:02:15 GMT)
Sewer Image Super-Resolution with Depth Priors and Its Lightweight Network [11.1] クイックビュー(QV)技術は下水道システム内の欠陥を検出する主要な方法である。
超解像度は画像品質を改善する効果的な方法であり、様々な場面で応用されている。
本研究では, DSRNet で表される新しい深層誘導参照型超解法フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:06:46 GMT)
Single- vs. Dual-Prompt Dialogue Generation with LLMs for Job Interviews in Human Resources [11.1] 人事面接における対話生成手法を2つ比較した。
両プロンプト法で生成されたインタビューは, 単プロンプト法で生成されたインタビューの最大10倍の勝利率が得られることがわかった。
GPT-4oかLlama 3.3 70Bかに関わらず、この差は一貫している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:19:27 GMT)
DialUp! Modeling the Language Continuum by Adapting Models to Dialects and Dialects to Models [11.1] 世界の言語や方言のほとんどは低リソースであり、機械翻訳(MT)モデルをサポートしていない。
本稿では,事前学習したモデルを方言データに適用するための訓練時間技術であるDialUpについて述べる。
4つの言語族に属するいくつかの方言では高い成績を示し,他の2つの言語族では控えめな成績を示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:00:45 GMT)
Accelerated Training on Low-Power Edge Devices [11.0] エッジデバイスでのトレーニングは、これらのデバイスが一般的にリソースの制約を受けており、特に電力の面では、いくつかの課題を生んでいる。
本稿では,デバイス上の電力制約に適応しつつ,システムとアプリケーションパラメータを協調的に調整することを提案する。
本稿では,バッチサイズ効率の予測とデバイスプロファイリングを組み合わせたクロスレイヤ手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:18:15 GMT)
A comparative analysis of rank aggregation methods for the partial label ranking problem [11.0] ラベルランキング問題は、学習者が与えられた入力インスタンスのクラスラベルの総順序を予測する教師付き学習シナリオである。
本稿では、スコアベースと確率に基づくランクアグリゲーションアプローチを含む、この重要なステップに対する代替的なアグリゲーション手法について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:35:22 GMT)
Enhancing Hepatopathy Clinical Trial Efficiency: A Secure, Large Language Model-Powered Pre-Screening Pipeline [10.9] 癌や肝硬変などの複雑な肝疾患を含むコホートを除去するには、しばしば意味論的に複雑な基準を解釈する必要がある。
従来の手作業によるスクリーニング手法は時間がかかり、エラーを起こしやすい。
我々は,臨床知識を活用して,大規模言語モデルの正確かつ安全かつ効率的な応用を導出する新規患者プレスクリーニングパイプラインを開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:06:39 GMT)
Pub-Guard-LLM: Detecting Fraudulent Biomedical Articles with Reliable Explanations [10.9] Pub-Guard-LLMは、バイオメディカルな論文の不正検出に適した、大規模な言語モデルベースのシステムである。
Pub-Guard-LLMは、様々なベースラインのパフォーマンスを一貫して上回る。
科学的不正検出における検出性能と説明可能性の両方を向上させることで、Pub-Guard-LLMは、新しい効果的なオープンソースツールによる研究完全性の保護に寄与する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:41:04 GMT)
CheXalign: Preference fine-tuning in chest X-ray interpretation models without human feedback [10.8] 放射線科医は、医療画像を実行可能なレポートに翻訳する上で重要な役割を担っている。
放射線学における現在の視覚言語モデル(VLM)のほとんどは、教師付き微調整のみに依存している。
胸部X線ラジオグラフィーレポート生成(RRG)に着目した選好フィードバックのための自動パイプラインを提案する。
我々の最高のパフォーマンス設定は、RRGタスクのMIMIC-CXRデータセット上で最先端のCheXbertスコアを達成します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:35:17 GMT)
Knowledge-enhanced Multimodal ECG Representation Learning with Arbitrary-Lead Inputs [10.7] **K-MERL*は知識に富んだマルチモーダルECG表現学習フレームワークである。
自由テキストレポートから構造化知識を抽出し、動的リードマスキングを備えたリード対応ECGエンコーダを使用する。
ゼロショット分類および線形探索タスクにおける最先端性能を達成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:53:50 GMT)
Policy-as-Prompt: Rethinking Content Moderation in the Age of Large Language Models [10.5] 本稿は、新しいポリシー・アズ・プロンプト・フレームワークを定式化し、4つのドメインにまたがる5つの重要な課題を特定する。
デジタルエコシステムにおけるスケーラブルで適応的なコンテンツモデレーションシステムの今後の探索の基盤となる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:15:16 GMT)
Enhancing LLMs for Identifying and Prioritizing Important Medical Jargons from Electronic Health Record Notes Utilizing Data Augmentation [10.5] OpenNotesは患者のEHRノートへのアクセスを可能にするが、医療ジャーゴンは理解を妨げる可能性がある。
鍵医学用語の抽出・優先順位付けには, プロンプト, 微調整, データ拡張を併用して, クローズドおよびオープンソースLCMを評価した。
オープンソースモデルは、微調整または拡張されたクローズドソースモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:34:15 GMT)
PII-Bench: Evaluating Query-Aware Privacy Protection Systems [10.5] 本稿では,プライバシ保護システムを評価するための総合的な評価フレームワークであるPII-Benchを提案する。
PII-Benchは55の細粒度PIIカテゴリにまたがる2,842の試験サンプルから構成されており、単目的記述から複雑な多人数インタラクションまで多様なシナリオが特徴である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:49:08 GMT)
Zero-Shot Defense Against Toxic Images via Inherent Multimodal Alignment in LVLMs [10.5] LVLM固有のマルチモーダルアライメントを利用してゼロショット有毒画像検出を行う軽量なSafeCLIPを提案する。
実験の結果、SafeCLIPの防衛成功率は66.9%で、偽陽性率は3.2%、オーバーヘッドは7.2%であった。
我々の研究は、本質的なマルチモーダルアライメントを活用することで、効率よく低コストなLVLM安全性が得られることを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:51:16 GMT)
Mind the Gap: Examining the Self-Improvement Capabilities of Large Language Models [10.4] 自己改善は、Large Language Model(LLM)の事前トレーニング、ポストトレーニング、テストタイム推論におけるメカニズムである。
本稿では,自己改善のための数学的定式化について述べる。
また、自己改善がいつ可能か、反復的な自己改善手順、その性能改善方法についても検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:59:11 GMT)
Serializing Java Objects in Plain Code [10.4] マネージド言語では、オブジェクトのシリアライズは通常、ProtobufのようなbespokeバイナリフォーマットやXMLやXMLのようなマークアップ言語で行われます。
人間の開発者はバイナリコードを読めず、ほとんどの場合、XMLの構文や可読性に悩まされます。
これは、オブジェクトがテストケースのようなソースコードに埋め込まれて読み込まれるように意図された場合の大きな問題である。
私たちの中核にある考え方は、プログラミング言語のネイティブ構文で実行時に観察されるオブジェクトをシリアライズすることだ。我々は、JavaオブジェクトをJavaソースコードにシリアライズするプロトタイプを実演する。その結果、ソースは、4つのオープン実行中に見たオブジェクトを忠実に再構築する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:14:16 GMT)
Following the Human Thread in Social Navigation [10.4] ソーシャルナビゲーションはロボットの人間の動きへのリアルタイム適応に依存している。
人間軌道は社会航法において重要な手がかりとして現れるが、ロボットの自我中心的な視点から部分的に観察可能である。
本稿では,ロボットの行動履歴に基づく社会ダイナミクス適応モデルを提案し,その社会的ダイナミクスを推算する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:43:21 GMT)
Yoimiya: A Scalable Framework for Optimal Resource Utilization in ZK-SNARK Systems [10.2] Yoimiyaは、ZK-SNARKシステムの効率を最適化するパイプラインを備えたスケーラブルなフレームワークである。
Yoimiyaは、ZK-SNARKの大きな回路を小さなサブ回路に分割する自動回路分割アルゴリズムを導入している。
与宮は証人生成を証明計算から切り離し、複数の回路から単位を同時実行する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:26:39 GMT)
Predicting Through Generation: Why Generation Is Better for Prediction [10.1] 本稿では,トークンレベルの生成が相互情報を保持するため,予測タスクにプール表現を使用するよりも,出力トークンの生成の方が効果的であると主張している。
PredGenは、(i)露光バイアスを減らすためにスケジュールサンプリングを使用するエンド・ツー・エンドのフレームワークで、(ii)生成されたトークンを構造化された出力に変換するタスクアダプタを導入します。
以上の結果から,PredGenは標準ベースラインを一貫して上回り,構造化予測タスクの有効性を示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:48:19 GMT)
A Perspective on Symbolic Machine Learning in Physical Sciences [10.1] 機械学習が非科学的分野に影響を与える速度は、物理科学のそれと相容れない。
シンボリック機械学習は、物理学における科学的発見のスピードアップにおいて、数値機械学習と同等かつ補完的なパートナーである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:02:02 GMT)
HEROS-GAN: Honed-Energy Regularized and Optimal Supervised GAN for Enhancing Accuracy and Range of Low-Cost Accelerometers [10.0] 低コストの加速度計は、小型化、統合の容易さ、摩耗性、大量生産の利点により、現代社会において重要な役割を担っている。
しかし、この広く使われているセンサーは、厳しい精度と範囲制限に悩まされている。
本稿では,低コストのセンサ信号を高コストの等価値に変換するHEROS-GAN(honed-Energy regularized and optimal supervised GAN)を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:31:01 GMT)
The Gradient of Algebraic Model Counting [9.7] 代数的モデルの数え方に関しても、全く同じ半順序的な視点が学習にも当てはまることを示す。
半環のキャンセルと順序付けが、よりメモリ効率の良いバックプロパゲーションにどのように活用できるかを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:57:55 GMT)
Characterizing the Distinguishability of Product Distributions through Multicalibration [9.7] 我々は、$X_0otimes k$と$X_1otimes k$を効率的に区別するために必要となるサンプル数$k$の新しい厳密な特徴を証明した。
我々のフレームワークはGeier (TCC 2022) の結果の導出に利用できる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:59:28 GMT)
Robust and Efficient Deep Hedging via Linearized Objective Neural Network [9.7] 本稿では,線形オブジェクトニューラルネット(DHLNN)を用いたディープヘッジを提案する。
DHLNNはトレーニングプロセスを安定化し、収束を加速し、ノイズの多い財務データに対する堅牢性を向上させる。
DHLNNは,様々な市場シナリオにおいて,より高速な収束,安定性の向上,ヘッジ性能の向上を実現している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:23:21 GMT)
Revealing the Pragmatic Dilemma for Moral Reasoning Acquisition in Language Models [9.7] 大規模言語モデル(LLM)は、道徳的認識を必要とするタスクで満足に機能しないことが多い。
現在の学習パラダイムは、LLMが十分な道徳的推論能力を得ることができるか?
性能改善は意味レベルの課題に類似したメカニズムを踏襲し,言論における潜在道徳の実践的性質の影響を受け続けることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:13:25 GMT)
TLDP: An Algorithm of Local Differential Privacy for Tensors [9.5] 局所微分プライバシー(LDP)法はテンソル要素間の本質的な関係を保たない。
構造的整合性を維持しつつ, ランダムな応答機構を用いて, emphTensors を保存できる emphLDP を提案する。
実世界のデータセットからの理論的分析と経験的発見の両方で、emphLDPはプライバシーを維持しながら優れたユーティリティを実現し、高次元データに対する堅牢なソリューションであることを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:11:45 GMT)
Uncertainty Quantification for LLM-Based Survey Simulations [9.3] 本研究では, 大規模言語モデル(LLM)からの不確実性定量化のレンズを用いて, シミュレーションされたサーベイ応答の信頼性について検討する。
提案手法は, 人工データから人間応答の個体群パラメータの信頼度集合へと変換し, シミュレーションされた個体群と実個体群の分布変化に対処する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:07:29 GMT)
Scaffolding Empathy: Training Counselors with Simulated Patients and Utterance-level Performance Visualizations [9.3] 我々は,シミュレートされた患者と対話する訓練者に対して,頻繁かつ詳細なフィードバックを提供することで,カウンセラー研修を加速し,最適化することを目指している。
最初のアプリケーションドメインは、カウンセラーのためのモチベーション面接スキルのトレーニングです。
シミュレーションされた患者とターンバイターンのパフォーマンスフィードバックの可視化を特徴とするLCMを用いたトレーニングシステムを開発し,評価した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:12:24 GMT)
xFinder: Large Language Models as Automated Evaluators for Reliable Evaluation [9.2] 本稿では,キー応答抽出モジュールの最適化により抽出精度が向上し,信頼性が向上することを示す。
大規模言語モデル(LLM)評価において,応答抽出とマッチングのための新しい評価器であるxFinderを提案する。
一般化テストと実世界の評価では、最小のxFinderモデルは5億のパラメータしか持たないが、平均抽出精度は93.42%である。
xFinderの最終判定精度は97.61%に達し、既存の評価フレームワークや審査モデルを上回っている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:04:02 GMT)
Contrastive Learning Augmented Social Recommendations [9.2] 本稿では,行動データから得られた関心表現を補完するために,再構成されたソーシャルグラフを活用することを提案する。
コンテンツプラットフォーム上でのソーシャルグラフの普及にもかかわらず、そのユーティリティはソーシャルリレーショナルノイズによって妨げられている。
本稿では,グラフデータにおけるノイズ伝搬を緩和し,信頼性の高い社会的関心を抽出するための2視点デノベーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:02:34 GMT)
Duo Streamers: A Streaming Gesture Recognition Framework [9.1] Duo Streamersは、リソース制約のあるデバイスのためのストリーミングジェスチャー認識フレームワークである。
3段階のスパース認識機構、外部隠蔽状態のRNN-liteモデル、特別なトレーニングと後処理パイプラインを通じて、高精度で低レイテンシを実現する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:39:52 GMT)
Golden Ratio Mixing of Real and Synthetic Data for Stabilizing Generative Model Training [9.1] 近年の研究では、モデル崩壊として知られる生成モデルトレーニングにおいて、以前のモデルによって生成されたデータに基づいてトレーニングされたモデルが深刻な性能劣化を示す現象が特定されている。
本稿では, この現象を, 新たに収集した実データと前回の学習段階からの合成データの組み合わせに基づいて, 生成モデルを反復的に訓練する, 新たな枠組み内で理論的に検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:15:16 GMT)
Iterative Counterfactual Data Augmentation [9.0] 本研究では,初期,高雑音干渉による反復的対実データ拡張が,ノイズが著しく低い状態に収束できることを示す。
実験には、6つの人間生成データセットと2つの大規模言語モデル生成データセットが含まれている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:33:50 GMT)
A Novel Spatiotemporal Correlation Anomaly Detection Method Based on Time-Frequency-Domain Feature Fusion and a Dynamic Graph Neural Network in Wireless Sensor Network [9.0] アテンションベースのトランスフォーマーは、長期依存を捕捉する能力により、無線センサネットワーク(WSN)のタイミング異常検出において重要な役割を担っている。
本稿では,周波数領域の特徴を動的グラフニューラルネットワーク(GNN)と統合したWSN異常検出手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:34:18 GMT)
A Robust and Efficient Boundary Point Detection Method by Measuring Local Direction Dispersion [8.9] 境界点検出は、クラスタの外輪郭構造を概説することを目的としている。
既存の境界点検出器は密度に敏感であり、凹凸構造における境界点を特定できない。
局所方向分散(LoDD)に基づくロバストで効率的な境界点検出法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:08:00 GMT)
URO-Bench: A Comprehensive Benchmark for End-to-End Spoken Dialogue Models [8.9] 音声対話モデル(SDM)の広範なベンチマークであるURO-Benchを提案する。
URO-BenchはS2Sベンチマークで、多言語主義、多ラウンド対話、パラ言語学の評価をカバーしている。
ベンチマークは、基本トラックとプロトラックの2つの難易度に分類され、それぞれ16と20のデータセットで構成されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:31:48 GMT)
Can Medical Vision-Language Pre-training Succeed with Purely Synthetic Data? [8.8] 医療ビジョン言語による事前トレーニングモデルのトレーニングには、ペアで高品質な画像テキストデータを備えたデータセットが必要である。
大規模言語モデル(LLM)と拡散モデルの最近の進歩により,大規模合成画像テキストペアの生成が可能になった。
我々は、既製の生成モデルを用いて、合成放射線学レポートとチェストX線(CXR)画像のペアを作成するとともに、多種多様な高品質な合成データセットを構築するための自動パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:19:03 GMT)
Multi-Channel Currency: A Secure Method Using Semi-Quantum Tokens [8.7] 量子状態に基づく量子通貨システムを提案し,非閉鎖定理を用いてセキュアなマルチチャネルトランザクションを実現する。
本稿では、通貨振替やスワップのユースケースを含む実験結果を用いて、本システムの実装を実証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:21:46 GMT)
NRFormer: Nationwide Nuclear Radiation Forecasting with Spatio-Temporal Transformer [8.6] 放射線は人間の健康と環境に重大なリスクをもたらす。
本研究では,核放射線の変動を全国的に予測するための新しい枠組みであるNRFormerを紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:11:28 GMT)
Cross-System Categorization of Abnormal Traces in Microservice-Based Systems via Meta-Learning [8.6] TraFaultDiaは、異常トレースを自動的にMSSの障害カテゴリに分類するAIOpsフレームワークである。
TraFaultDiaはTraTicketとOnlineBoutiqueの新しい50の分類タスクで93.26%と85.20%の精度を達成した。
システム横断の文脈では、TraFaultDiaがトレーニング対象と異なるMSSに適用された場合、TraFaultDiaの平均精度は92.19%、84.77%となる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:50:14 GMT)
Steering Language Model to Stable Speech Emotion Recognition via Contextual Perception and Chain of Thought [8.6] C$2$SERは、音声認識の安定性と精度を高めるために設計された新しいALMである。
C$2$SERは意味知覚のためのWhisperエンコーダと音響知覚のためのEmotion2Vec-Sを統合している。
さらに安定性を高めるために、C$2$SERは明示的なCoTから暗黙的なCoTへの自己蒸留を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:26:25 GMT)
Adaptive Nesterov Accelerated Distributional Deep Hedging for Efficient Volatility Risk Management [8.6] 我々は、動的ベガヘッジのための新しいフレームワーク、Adaptive Nesterov Accelerated Distributional Deep Hedging (ANADDH)を導入する。
ANADDHは、分布強化学習と適応ネステロフ加速度に基づく調整された設計を組み合わせる。
提案手法と分散強化学習の革新的組み合わせにより,金融リスク管理が向上することが確認できた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:12:16 GMT)
Faster, Cheaper, Better: Multi-Objective Hyperparameter Optimization for LLM and RAG Systems [8.4] 本稿では,LLMおよびRAGシステム全体に対するコスト,レイテンシ,安全性,アライメントの多目的パラメータ最適化のための最初のアプローチを提案する。
ベイジアン最適化法はベースライン法よりも有意に優れていた。
我々は,多目的RAGシステムを設計している実践者に対する重要な配慮で研究を締めくくっている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:52:06 GMT)
Novel quantum circuit for image compression utilizing modified Toffoli gate and quantized transformed coefficient alongside a novel reset gate [8.4] 量子化変換係数を用いたトフォリゲート状態接続を導入する。
この革新的な戦略は、状態接続情報から状態接続を変更することで、回路の複雑さを簡素化する。
既存の技術よりも44.1%少ないゲートを必要とすることが判明した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:41:28 GMT)
Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion [8.4] スコア関数のヤコビアンの固有値のスペクトルを解析し、その不連続性(ギャップ)は異なる部分多様体の存在と次元性を明らかにする。
本研究は, 生成過程における3つの異なる定性相の存在を明らかにした。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:49:33 GMT)
Leveraging 2D Masked Reconstruction for Domain Adaptation of 3D Pose Estimation [8.4] RGBベースの3Dポーズ推定手法はディープラーニングの開発で成功している。
既存のほとんどの手法は、トレーニングデータとは程遠い分布のイメージをテストするためにうまく動作しない。
本稿では,3次元ポーズ推定のための教師なし領域適応フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:56:59 GMT)
On the Generalizability of Foundation Models for Crop Type Mapping [8.3] 自己教師付き学習を用いて事前訓練された基礎モデルは、強力な伝達学習能力を示している。
本研究は,農業領域におけるEOファンデーションモデルによる新しい地域への移転能力について考察する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:23:25 GMT)
Multi-label out-of-distribution detection via evidential learning [8.3] 本研究では,ベータ・エビデンシャル・ニューラル・ニューラルネットワークを用いて,サンプルの確率と予測的不確実性を計算するCNNアーキテクチャを提案する。
これらの結果に基づいて,OODデータ検出のための2つの新しい不確実性に基づくスコアを提案する。 (i) OOD - score Max, (ii) OOD - Sum。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:08:35 GMT)
Sketch-1-to-3: One Single Sketch to 3D Detailed Face Reconstruction [8.2] 単一スケッチからの3D顔の再構成は、重要な実用的応用のための重要な課題であるが、未調査の課題である。
Sketch-1-to-3は、1つのスケッチから現実的な3次元顔再構成のための新しいフレームワークである。
Sketch-1-to-3はスケッチベースの3次元顔再構成において最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:58:17 GMT)
A Real-time Spatio-Temporal Trajectory Planner for Autonomous Vehicles with Semantic Graph Optimization [8.2] グラフ最適化に基づく意味的時間的軌道計画法を提案する。
複雑な都市道路のシナリオを効果的に処理し、リアルタイムで実行することができる。
研究コミュニティのベンチマークに対応するため、コードをリリースします。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:27:06 GMT)
H-FLTN: A Privacy-Preserving Hierarchical Framework for Electric Vehicle Spatio-Temporal Charge Prediction [8.2] 電気自動車(EV)は、特に充電時間(時間予測)の予測において、エネルギー提供者にとって重要な課題となる
本稿では,これらの課題に対処するための階層型学習トランスフォーマーネットワークフレームワークを紹介する。
現実世界のスマートシティインフラストラクチャとの統合により、エネルギー需要予測、リソース割り当て、グリッド安定性が向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:20:53 GMT)
Specialized curricula for training vision-language models in retinal image analysis [8.2] 視覚言語モデル(VLM)は画像を自動的に解釈し、その結果をテキストとして要約する。
本研究では, OpenAI の ChatGPT-4o モデルは, 専門職における眼科医の実践に比べ, 明らかに低性能であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:54:59 GMT)
Parameterized quantum comb and simpler circuits for reversing unknown qubit-unitary operations [8.1] 量子プロセス変換タスクにおいて,量子コムの潜在能力を最大限に活用するためのPQCombを提案する。
未知のキュービットユニタリ進化の時間反転シミュレーションのための2つの合理化プロトコルを提案する。
また、PQCombを拡張して、量子ユニタリ変換とチャネル識別の問題を解決する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:28:19 GMT)
Survey on Strategic Mining in Blockchain: A Reinforcement Learning Approach [8.1] 利己的なマイニングのような戦略的マイニング攻撃は、報酬を最大化するために正直な行動から逸脱することでブロックチェーンコンセンサスプロトコルを活用する。
強化学習(RL)は、複雑な動的環境において適応的な戦略最適化を可能にするスケーラブルな代替手段を提供する。
この調査は、プロトコル設計、脅威検出、セキュリティ分析など、利己的なマイニングの課題に対処するRLの可能性を強調している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:31:44 GMT)
Steganography Beyond Space-Time With Chain of Multimodal AI Agents [8.1] ステガノグラフィー(英: Steganography)は、隠蔽文学の芸術と科学である。
人工知能が進化を続けるにつれて、現実的なコンテンツを合成する能力は、サイバー犯罪の脅威として現れます。
本研究は,空間的・時間的領域を超えてメッセージが隠蔽される聴覚メディアのためのステガノグラフィーのパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:56:09 GMT)
Adaptive Quantum Scaling Model for Histogram Distribution-based Quantum Watermarking [8.0] 透かし画像のスクランブルには,新しい適応量子スケーリングモデル (AQSM) が提案されている。
固定埋め込みスケールを持つ既存の量子透かし方式とは異なり、提案手法は異なる大きさの透かしを柔軟に埋め込むことができる。
提案手法の有効性とロバスト性を評価する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:11:03 GMT)
Improved YOLOv7x-Based Defect Detection Algorithm for Power Equipment [8.0] 本稿では,電力機器のYOLOv7xに基づく異常検出アルゴリズムを提案する。
ACmix畳み込み混合注目機構モジュールを導入し、背景雑音や無関係な特徴を効果的に抑制する。
Biformerのアテンションメカニズムがネットワークに追加され、キー機能へのフォーカスが強化され、特徴画像を柔軟に認識するネットワークの能力が向上する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:36:15 GMT)
3D Anatomical Structure-guided Deep Learning for Accurate Diffusion Microstructure Imaging [8.0] 本稿では,マクロレベルの先行する解剖学的情報とパラメータ間の相互情報とを同時に利用することにより,高忠実かつ迅速な拡散微細構造イメージングを実現する新しい枠組みを提案する。
実験結果から,本手法は,ピーク信号対雑音比(PSNR)が30.51$pm$0.58,構造類似度指数(SSIM)が0.97$pm$0.004,複数拡散モデルのパラメトリックマップが0。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:52:51 GMT)
A Survey of Sim-to-Real Methods in RL: Progress, Prospects and Challenges with Foundation Models [7.9] 深層強化学習(Dep Reinforcement Learning, RL)は, 様々な領域における意思決定課題の解決に有効であることが検討され, 検証されている。
しかし, 実世界のデータに制限があり, 有害な行動が生じたため, RLポリシーの学習は主にシミュレータ内で制限される。
この調査論文はマルコフ決定過程の重要な要素からシム・トゥ・リアルの技法を正式に定式化した最初の分類法である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:25:54 GMT)
FinP: Fairness-in-Privacy in Federated Learning by Addressing Disparities in Privacy Risk [7.8] FinPは、ソース推論攻撃に対する不適切な露出を軽減し、プライバシの公平性を達成するために設計されたフレームワークである。
FinPは、(1)グローバルモデルにおけるクライアントコントリビューションの不公平に対処するためのサーバ側適応アグリゲーション、(2)クライアント脆弱性を減らすためのクライアント側正規化という2つのアプローチを採用している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:56:47 GMT)
ApproxABFT: Approximate Algorithm-Based Fault Tolerance for Neural Network Processing [7.6] 本稿では,計算誤差が大きい場合にのみエラー回復を開始するApproxABFTを提案する。
このアプローチでは、不要なリカバリ手順を回避し、エラーリカバリプロセスを合理化し、影響のあるエラーの修正に重点を置いている。
実験の結果、ApproxABFTは計算オーバーヘッドを67.83%削減し、許容ビットエラー率を平均で桁違いに改善した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:52:37 GMT)
VVRec: Reconstruction Attacks on DL-based Volumetric Video Upstreaming via Latent Diffusion Model with Gamma Distribution [7.5] 本稿では,DLをベースとしたVVRecの最初の攻撃手法であるVVRecを紹介する。
4つのよく訓練されたニューラルネットワークモジュールを用いて、インターセプト伝送中間結果から高品質な点雲を再構築できることを実証する。
結果は、VVRecが64.70dBの再現精度を達成し、ベースライン上の歪みを46.39%低減したことを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:08:05 GMT)
Personalized Topology-Informed Localization of Standard 12-Lead ECG Electrode Placement from Incomplete Cardiac MRIs for Efficient Cardiac Digital Twins [7.5] そこで本研究では,心電図の標準電極位置を2次元心筋MRIから抽出する新しいモデルを提案する。
具体的には、心筋MRIからスパース輪郭を取得し、12個の心電図の標準電極を輪郭から局在させる。
実験の結果,提案手法は従来のモデル投影法よりも精度が高いことがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:57:06 GMT)
Dual Classification Head Self-training Network for Cross-scene Hyperspectral Image Classification [7.5] リモートセンシングコミュニティでは,クロスシーンの分類が広く採用されている。
SDとTDの反射スペクトルの変化と,同じ土地被覆クラスの特徴分布の違いは,クロスシーン分類の性能に重大な課題をもたらす。
クロスステージなHSI分類分野において、初めて二元分類頭部自己学習戦略を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:07:46 GMT)
LiSA: Leveraging Link Recommender to Attack Graph Neural Networks via Subgraph Injection [7.5] 本稿では,GNNシステム内のリンクレコメンデータとノード分類の両方を欺くために,孤立したサブグラフを注入する新たな逆シナリオを提案する。
本稿では,2つの対向目的を同時に満たすために,二重サロゲートモデルと双方向最適化を用いたLiSAフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:50:20 GMT)
LR${}^{2}$Bench: Evaluating Long-chain Reflective Reasoning Capabilities of Large Language Models via Constraint Satisfaction Problems [7.4] 我々はLong-chain Reflective Reasoning capabilities of Large Language Models (LLMs)を評価するために設計された新しいベンチマークLR$2$Benchを紹介する。
実験結果から,DeepSeek-R1やOpenAI o1-previewのような先進的な推論モデルでさえ,LR$2$Benchのタスクと競合することが明らかとなった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:51:17 GMT)
High-precision visual navigation device calibration method based on collimator [7.1] 本研究では,コリメータを用いた校正手法とシステムを提案する。
コリメータの光学特性に基づいて、単一画像カメラキャリブレーションアルゴリズムを導入する。
実験により,従来のマルチイメージキャリブレーション手法に匹敵する精度と安定性が得られた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:18:45 GMT)
ByteQC: GPU-Accelerated Quantum Chemistry Package for Large-Scale Systems [7.0] ByteQCは、大規模量子化学シミュレーションのための完全機能的で効率的なパッケージである。
スタンドアロンのアルゴリズムでは、ベンチマーク結果は100コアのCPUと比較して60$times$のスピードアップとなる。
先進的な量子埋め込みの特徴として、2つの代表的な例が示されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:37:12 GMT)
S-Graphs 2.0 -- A Hierarchical-Semantic Optimization and Loop Closure for SLAM [7.0] 本稿では,室内シーンの階層構造を利用して効率的なデータ管理と最適化を行う状況グラフ2.0を提案する。
私たちのアルゴリズムは、環境をキーフレーム、ウォール、ルーム、フロアの4つの層に整理する状況グラフの構築から始まります。
このフロアレベルのセマンティクスは、異なるフロア上の視覚的に類似した領域における偽陽性ループクロージャを拒否するフロアベースのループクロージャ戦略を可能にする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:09:10 GMT)
SADDLe: Sharpness-Aware Decentralized Deep Learning with Heterogeneous Data [6.7] シャープネスを意識した分散ディープラーニングアルゴリズムSADDLeを提案する。
以上の結果から,SADDLeは既存の手法に比べて1~20%の精度向上を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:29:36 GMT)
Adaptive Soft Error Protection for Neural Network Processing [6.7] ニューラルネットワーク(NN)におけるソフトエラーの緩和は、しばしば計算オーバーヘッドを著しく発生させる。
従来の手法は主にNNコンポーネント間の静的な脆弱性のバリエーションを探索していた。
本稿では、入力やコンポーネント固有の脆弱性をソフトエラーにキャプチャできる軽量グラフニューラルネットワーク(GNN)モデルを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:05:51 GMT)
From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms [6.6] 我々は、オーディオ異常検出(AAD)の問題に対処するために、そのようなアルゴリズムのオーディオ領域への適応について検討する。
主に異常サンプルを分類する既存のAAD法とは異なり,本手法ではスペクトル内における異常の微細な時間周波数局在を導入している。
本研究では,産業用および環境用ベンチマークに対するアプローチを評価し,音声信号の異常検出におけるVAD手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:22:42 GMT)
Smallest quantum codes for amplitude damping noise [6.6] 振幅減衰(AD)ノイズを補正する最小の量子誤り訂正符号(QEC)について述べる。
我々はこの構成を、減衰強度の任意の一定の順序でADノイズを補正する一連の符号に一般化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:35:07 GMT)
A Fusion Model for Art Style and Author Recognition Based on Convolutional Neural Networks and Transformers [6.6] 本稿では,CNNとトランスフォーマーを組み合わせた融合モデルを提案する。
中国と石油の絵画データセットの実験では、融合モデルは個々のCNNとトランスフォーマーモデルより優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:52:38 GMT)
Nested Expectations with Kernel Quadrature [6.5] ネストされたモンテカルロやマルチレベルモンテカルロのような既存のアルゴリズムは一貫性があることが知られているが、内部レベルと外部レベルの両方で多くのサンプルを必要とする。
ネストしたカーネルの2次推定器からなる新しい推定器を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:19:10 GMT)
Self-congruent point in critical matrix product states: An effective field theory for finite-entanglement scaling [6.5] 有限MPS結合次元$chi$は、固定点ハミルトニアンに対して関連する作用素による摂動を導入することと等価であることを示す。
この現象は再正規化群自己共役点を定義し、関連する結合定数は2つの効果のバランスによってフローに停止する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:39:04 GMT)
Utility-inspired Reward Transformations Improve Reinforcement Learning Training of Language Models [6.5] 報酬の線形集約がいかにいくつかの脆弱性を示すかを示す。
本稿では,効用関数の経済理論にインスパイアされた報酬関数の変換を提案する。
Inada-transformationsでトレーニングしたモデルは、有害度を低くしながら、より有用であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:04:50 GMT)
Near-Shore Mapping for Detection and Tracking of Vessels [6.3] 海上目標追跡は通常、陸地とドックをフィルタリングするために陸地マスキングを使用している。
われわれのアプローチでは、光検出とラング(LiDAR)データを使用し、ドッキングエリアをオフラインでマップする。
我々は、画像データを利用して、LiDARデータから潜在的に動く物体を検出し、フィルタリングする。
クローズ・ツー・ショア・トラッキングは正確なマップによって改善され、最近収集された実世界のデータセットで実証される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:03:34 GMT)
Sentence Smith: Formally Controllable Text Transformation and its Application to Evaluation of Text Embedding Models [6.3] 本稿では,テキストの意味の制御と特定の操作を可能にするSentence Smithフレームワークを提案する。
文をセマンティックグラフにパースし、人間の設計したセマンティックな操作ルールを適用し、操作されたグラフからテキストを生成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:15:29 GMT)
MRBTP: Efficient Multi-Robot Behavior Tree Planning and Collaboration [6.2] マルチロボットタスク計画と協調はロボット工学における重要な課題である。
音質と完全性の両方を理論的に保証するマルチロボット行動木計画法(MRBTP)を提案する。
次に,大規模言語モデル (LLM) が各ロボットの目標関連動作を推論するためのオプションプラグインを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:39:28 GMT)
Generalization error bound for denoising score matching under relaxed manifold assumption [6.2] 非パラメトリックガウス混合による観測密度をモデル化する。
標準多様体の仮定を緩和し、サンプルを多様体から遠ざけるようにする。
評価値の近似と誤差の非漸近的境界を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:51:11 GMT)
Generalized Decision Focused Learning under Imprecise Uncertainty--Theoretical Study [6.1] 決定にフォーカスした学習は、機械学習と下流の最適化を統合するための重要なパラダイムとして登場した。
既存の方法論は主に確率的モデルに依存し、タスクの目的に限定する。
本稿では、革新的なフレームワークを導入することで、これらのギャップを埋める。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:53:02 GMT)
FwNet-ECA: Facilitating Window Attention with Global Receptive Fields through Fourier Filtering Operations [6.1] 大域的注意機構に固有の過度な計算の問題を緩和するために,窓付き注意機構を導入した。
FwNet-ECAは、フーリエ変換と学習可能な重み行列を組み合わせ、画像のスペクトル特性を高める新しい手法である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:01:53 GMT)
Ward: Provable RAG Dataset Inference via LLM Watermarks [6.1] RAGにより、LCMは外部データを容易に組み込むことができ、コンテンツの不正使用に関するデータ所有者の懸念が高まる。
我々はこの問題を(ブラックボックス)RAGデータセット推論(RAG-DI)として定式化する。
次に,RAG-DI手法の現実的なベンチマークのための新しいデータセットを,ベースラインのセットとともに導入する。
我々は,RAGコーパスにおけるデータセットの誤用に関する厳密な統計的保証をデータ所有者に提供するLLM透かしに基づくRAG-DI手法であるWardを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:22:44 GMT)
Leveraging Medical Knowledge Graphs Into Large Language Models for Diagnosis Prediction: Design and Application Study [6.1] 自動診断におけるLarge Language Models (LLMs) の習熟度を高めるための革新的なアプローチを提案する。
我々は,国立医科大学統一医療言語システム(UMLS)からKGを抽出した。
我々のアプローチは説明可能な診断経路を提供し、AIによる診断決定支援システムの実現に近づいている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:12:44 GMT)
Multi-compartment Neuron and Population Encoding Powered Spiking Neural Network for Deep Distributional Reinforcement Learning [6.0] スパイキングニューラルネットワーク(SNN)では、スパイキングニューロンが基本的な情報処理ユニットとして機能する。
本稿では,SNNに基づく脳の深部分布強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:49:20 GMT)
Purified pseudomode model for nonlinear system-bath interactions [6.0] 一般化された擬似モデムの理論を拡張し、一般的な非線形システム-バス相互作用の記述を可能にする。
本手法は,量子ドットにおけるフォノン支援放出の研究に有用なツールを提供し,量子生物学,非線形フォニックス,ナノフォトニクスなどの分野における幅広い応用の可能性を秘めている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:56:47 GMT)
Examining the Threat Landscape: Foundation Models and Model Stealing [5.8] コンピュータビジョンのためのファンデーションモデル(FM)は、リッチで堅牢な表現を学習し、タスク/ドメイン固有のデプロイメントへの適応を、微調整をほとんど行わずに行うことができる。
FMから微調整されたモデルは、ResNetsのような従来の視覚アーキテクチャと比較して、モデル盗難に対する感受性を高めていることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:46:26 GMT)
Cavity magnon-polariton interface for strong spin-spin coupling [5.8] 本研究では,コプラナー導波路共振器(CPW)をダイヤモンド中の1つの窒素空隙スピンに弱結合したハイブリッド量子システムを提案する。
マグノンの強い駆動場により、カー効果はマグノンを絞ることができ、CPW共振器とシーズしたマグノンとの結合は指数関数的に増強される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:42:31 GMT)
Detection of LLM-Paraphrased Code and Identification of the Responsible LLM Using Coding Style Features [5.8] Aliciousのユーザは、大きな言語モデル(LLM)を使って、オリジナルのものとよく似ているプロプライエタリなコードのパラフレーズ付きバージョンを生成することができる。
LPcodedecは人書きとLLM生成コード間のパラフレーズ関係を識別する手法である。
LPcodedecは2つのタスクで最高のベースラインを達成し、F1スコアは2.64%、F1スコアは15.17%向上し、それぞれ1,343xと213xのスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:58:06 GMT)
Large Language Model Driven Agents for Simulating Echo Chamber Formation [5.6] ソーシャルメディアプラットフォームにおけるエコーチャンバーの台頭は、分極と既存の信念の強化に対する懸念を高めている。
エコーチャンバーの形成をシミュレーションするための従来の手法は、しばしば事前定義された規則や数値シミュレーションに依存してきた。
本稿では,大言語モデル(LLM)を生成エージェントとして活用し,エコーチャンバー力学をシミュレートする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:05:11 GMT)
ConsistentDreamer: View-Consistent Meshes Through Balanced Multi-View Gaussian Optimization [5.6] 我々はConsistentDreamerを紹介し、まず、固定された複数ビュー前の画像とそれらの間のランダムなビューの集合を生成する。
これにより、SDSの損失によって導かれるビュー間の相違を抑え、一貫した粗い形状を確保する。
各イテレーションでは、生成した複数ビュー前の画像も詳細再構築に使用しています。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:55:44 GMT)
Monitoring snow avalanches from SAR data with deep learning [5.5] 雪崩は、特に山岳地帯において、人命とインフラに重大なリスクをもたらす。
衛星搭載合成開口レーダ(SAR)は,大規模な雪崩検出のための重要なツールとなっている。
本章では,SARデータからの雪崩の検出とセグメンテーションにおけるディープラーニングの適用について概説する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:41:08 GMT)
What is a Social Media Bot? A Global Comparison of Bot and Human Characteristics [5.5] ボットは、人間が対話理解を必要とするキューを使う間、簡単に自動化できる言語的手がかりを使用する傾向がある。
これらの結論は、7つのイベントにわたる200ミルユーザーにわたるソーシャルメディアのツイートの大規模な分析に基づいている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:11:10 GMT)
An ocean front detection and tracking algorithm [5.5] 本稿では,距離空間解析を用いたベイズフロント検出・追跡フレームワークを提案する。
BFDTMSAはヒストグラム法と比較して過検出を73%削減する。
オープンソースリリースは、再現可能な海洋研究において重要なギャップを埋めるものだ。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:31:40 GMT)
Differentially Private Federated Learning With Time-Adaptive Privacy Spending [5.5] 差分プライバシ(DP)を備えたフェデレーションラーニング(FL)では、クライアントは厳格なプライバシ制約に固執しながら、共有モデルをトレーニングすることができる。
我々は、時間とクライアントの双方でプライバシー予算を不均一に超過する、時適応型DP-FLフレームワークを提案する。
当社のフレームワークは、各クライアントが早期ラウンドでプライバシ予算を節約し、より詳細な機能を学ぶ上でさらなる精度が有用である場合に、後ラウンドでより多くの時間を費やすことができるようにします。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:56:23 GMT)
Sharper Concentration Inequalities for Multi-Graph Dependent Variables [5.4] グラフ依存データを含むタスクごとのマルチタスク学習(MTL)において、一般化結果は、O(frac1sqrtn)$の準最適リスク境界が得られる。
本稿では、新たなベネットの不等式を提案し、よりシャープなリスク境界の$O(fraclog nn)$を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:57:53 GMT)
NYT-Connections: A Deceptively Simple Text Classification Task that Stumps System-1 Thinkers [5.4] 我々はNew York Times Connectionsゲームから派生した358の簡単な単語分類パズルのコレクションであるNYT-Connectionsを紹介する。
このベンチマークは、素早い直感的な"システム1"思考をペナルティ化し、基本的な推論スキルを分離するように設計されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:59:42 GMT)
Tukey Depth Mechanisms for Practical Private Mean Estimation [5.3] 平均推定は統計学における基本的な課題であり、微分プライベートな統計的推定における焦点である。
本研究では,(制限された)タキー深さ機構を実装することでギャップを埋める第一歩を踏み出す。
我々の実装では、これらのメカニズムを小さなサンプルサイズや低次元データに利用することが可能です。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:21:54 GMT)
MergeIT: From Selection to Merging for Efficient Instruction Tuning [5.1] MergeITは、より良いインストラクションチューニングのための新しい戦略である。
まず、トピック対応のクラスタをフィルタリングし、データセットを洗練する。
第二に、LLMベースのマージは意味論的に類似した命令をより情報的でコンパクトなトレーニングデータに合成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:43:20 GMT)
Near-optimal Active Regression of Single-Index Models [5.1] この研究は、$tildeO(dfracp2vee 1/varepsilonpvee 2)$エントリを$b$にクエリすることで、$(1+varepsilon)$-approximationソリューションを提供する最初のアルゴリズムを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:58:06 GMT)
LightFC-X: Lightweight Convolutional Tracker for RGB-X Tracking [5.0] LightFC-Xは、マルチモーダルトラッキングのための軽量な畳み込みXトラッカーのファミリーである。
LightFC-Xは、最先端の性能とパラメータ、性能、速度の最適なバランスを達成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:10:33 GMT)
Verdict: A Library for Scaling Judge-Time Compute [5.0] Verdictは、自動評価器の精度、信頼性、解釈性を高めるために、判断時間計算をスケールするためのライブラリである。
審査員は最先端(SOTA)または近距離(SOTA)のパフォーマンスを達成し、マグニチュードより大きな微調整裁判官を超越する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:26:44 GMT)
Beyond the convexity assumption: Realistic tabular data generation under quantifier-free real linear constraints [5.0] Disjunctive Refinement Layer (DRL) は、データ制限とユーザ定義制約で指定されたバックグラウンド知識のアライメントを強制するために設計されたレイヤである。
DRLは、量子化子のない線形公式のような制約に本質的に準拠するディープラーニングモデルを自動的に作成できる最初の方法である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:20:05 GMT)
Chat Bankman-Fried: an Exploration of LLM Alignment in Finance [4.9] 司法管轄区域はAIの安全性に関する法律を制定するので、アライメントの概念を定義して測定する必要がある。
本稿では,大規模言語モデル(LLM)が比較的未探索の財務状況において,倫理的・法的基準に準拠するか否かを評価するための実験的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:10:34 GMT)
A Concise Lyapunov Analysis of Nesterov's Accelerated Gradient Method [4.8] 一般凸関数と強凸関数の両方に対するネステロフの加速勾配法の収束率を簡潔に解析する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:42:36 GMT)
Uncertainty Modeling in Multimodal Speech Analysis Across the Psychosis Spectrum [4.6] 精神病の特徴である発声障害は、非クリニカルな個人を含むスペクトルにわたって現れる。
我々は,症状の重症度と精神病関連特性を予測するために,音響的特徴と言語学的特徴を統合した不確実性認識モデルを開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:19:21 GMT)
Quantum neural compressive sensing for ghost imaging [4.6] 本研究では,ゴーストイメージングのための量子ニューラルセンシングアルゴリズムについて検討し,その有用性を実証する。
提案アルゴリズムは、様々な量子ノイズレベルに対して堅牢性を示し、短期的な量子デバイスに適している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:44:47 GMT)
Towards Sustainable Web Agents: A Plea for Transparency and Dedicated Metrics for Energy Consumption [4.6] 本研究では,Webエージェントに関連するエネルギーとCO2コストについて検討する。
結果は、Webエージェント作成における異なる哲学が、関連する拡張エネルギーにどのように影響するかを示している。
我々の研究は、Webエージェントの評価における思考の変化を提唱し、エネルギー消費と持続可能性のための専用の指標を保証します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:58:40 GMT)
Wormhole Memory: A Rubik's Cube for Cross-Dialogue Retrieval [4.6] 本研究では,異なる対話間で任意に検索可能なルービックキューブとしてメモリを実現するワームホールメモリモジュール(WMM)を提案する。
実験結果から,WMMは対話間のメモリ取得能力と定量的指標の安定性を示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:19:30 GMT)
Dynamic Chain-of-Thought: Towards Adaptive Deep Reasoning [4.6] 本研究では、適応的な推論時間とステップを持つ動的連鎖(D-CoT)を提案する。
実験の結果,D-CoTは3つの指標(推論時間,CoT長さ(推論ステップ),トークン数)で,DeepSeek R1よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:19:34 GMT)
Uncertainty Quantification of Large Language Models through Multi-Dimensional Responses [4.5] セマンティック・ナレッジ・アウェア・類似性分析を統合した多次元UQフレームワークを提案する。
このアプローチは、意味と知識の両方の次元から重なり合う情報を分離し、意味のバリエーションと事実の一貫性の両方をキャプチャする。
実験により,本手法は不確かさを識別する既存の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:03:51 GMT)
SYNTHEMPATHY: A Scalable Empathy Corpus Generated Using LLMs Without Any Crowdsourcing [4.4] 実生活環境に対する105kの共感応答を含む大規模コーパスを開発するためのデータ生成フレームワークを提案する。
The base Mistral 7B model in our SyntheMPATHY corpus showed a increase of the average empathy score。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:07:27 GMT)
Identifying Features that Shape Perceived Consciousness in Large Language Model-based AI: A Quantitative Study of Human Responses [4.4] 本研究では,大規模言語モデル(LLM)に基づくAIシステムにおいて,AI生成したテキストの特徴が人間に主観意識を知覚させるかどうかを定量的に検討する。
回帰分析とクラスタリング分析を用いて,これらの特徴がAI意識に対する参加者の認識にどのように影響するかを検討した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:40:03 GMT)
NRQNN: The Role of Observable Selection in Noise-Resilient Quantum Neural Networks [4.3] 本稿では,ノイズ条件下での量子ニューラルネットワーク(QNN)のトレーニングに伴う複雑さについて検討する。
まず、バレンプラトー(BP)が理想的条件よりもノイズの多い量子環境で容易に現れることを実証した。
そこで我々は,QNNのノイズに対する耐性を高めるために,キュービット計測を慎重に選択することを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:03:28 GMT)
MegaLoc: One Retrieval to Place Them All [4.3] 与えられたクエリと同じ位置から画像を取得することは、複数のコンピュータビジョンタスクの重要なコンポーネントである。
既存のソリューションは、これらのタスクの1つに特化して構築されており、要件がわずかに変更された場合や、アウト・オブ・ディストリビューション(out-of-distriion)データを満たす場合に失敗することが知られている。
本稿では,既存の手法,トレーニング手法,データセットを組み合わせて,複数のタスクで実行されるMegaLocと呼ばれる検索モデルをトレーニングする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:32:52 GMT)
VesselSAM: Leveraging SAM for Aortic Vessel Segmentation with LoRA and Atrous Attention [4.3] 大動脈血管分節に対するAnything Model (SAM) の修正版である VesselSAM を提案する。
VesselSAM には,Atrous Attention と Low-Rank Adaptation (LoRA) を組み合わせたセグメンテーションパフォーマンス向上のための新モジュールであるAtrousLoRA が組み込まれている。
VesselSAMをAortic Vessel Tree (AVT) データセットとType-B Aortic Dissection (TBAD) データセットの2つの挑戦的なデータセットで評価する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:26:06 GMT)
Learning-to-Optimize with PAC-Bayesian Guarantees: Theoretical Considerations and Practical Implementation [4.2] 最適学習の設定にはPAC-ベイズ理論を用いる。
証明可能な一般化保証付き最適化アルゴリズムを学習する最初のフレームワークを提示する。
学習アルゴリズムは、(決定論的)最悪のケース分析から得られた関連アルゴリズムを確実に上回ります。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:24:35 GMT)
Transformer Encoder Satisfiability: Complexity and Impact on Formal Reasoning [4.1] 我々は、変換器エンコーダ(TE)における満足度問題、または同様の実現可能性問題(trSAT)の複雑さを解析する。
表現性コミュニティで一般的に研究されている TE を考えると,trSAT は決定不可能であることがわかった。
trSATが決定可能な現実シナリオを特定し,それに対応する複雑性境界を確立する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:37:14 GMT)
DeepSeek-R1 Outperforms Gemini 2.0 Pro, OpenAI o1, and o3-mini in Bilingual Complex Ophthalmology Reasoning [4.1] DeepSeek-R1および他の3つの最近リリースされた大型眼科推論モデル(LLM)を評価した。
DeepSeek-R1は中国語と中国語のMCQで5つのトピックで最高精度を達成した。
推論論理と推論誤りの原因を分析して推論能力を評価した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:08:53 GMT)
Self-Supervised Data Generation for Precision Agriculture: Blending Simulated Environments with Real Imagery [4.0] 精密農業において、ラベル付きデータの不足は、機械学習モデルのトレーニングにユニークな課題をもたらす。
本稿では,これらの課題に対処するために,現実的な合成データを生成する新しいシステムを提案する。
本研究では, テーブルブドウ栽培に本法を適用して, 最先端検出器の訓練において, 大幅な性能向上を図った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:13:49 GMT)
Exploring the Robustness and Transferability of Patch-Based Adversarial Attacks in Quantized Neural Networks [4.0] 量子ニューラルネットワーク(QNN)は、リソース制約のあるプラットフォームへのディープラーニングモデルの効率的なデプロイにますます利用されている。
量子化はモデルのサイズと計算要求を減少させるが、その逆の堅牢性への影響は依然として不十分である。
局所的で視認性の高い摂動を特徴とするパッチベースの攻撃は、その伝達性とレジリエンスのために重大なセキュリティリスクを生じさせる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:51:48 GMT)
NSSI-Net: A Multi-Concept GAN for Non-Suicidal Self-Injury Detection Using High-Dimensional EEG in a Semi-Supervised Framework [4.0] 青年期における自傷は、身体的および精神的な健康にとって深刻な脅威である。
本研究では,NSSIに関連する脳波の特徴を効果的にモデル化する,高度な半教師付き敵ネットワークNSSI-Netを提案する。
モデルの有効性と信頼性が実証され、既存の機械学習やディープラーニングに比べてパフォーマンスが5.44%向上した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:38:36 GMT)
Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs [3.8] 実験では、モデルを微調整して安全でないコードを出力し、それをユーザに開示する。
結果として得られるモデルは、コーディングとは無関係な幅広いプロンプトに対して不一致に作用する。
この効果は様々なモデルで観測されるが、GPT-4oやQwen2.5-Coder-32B-Instructでは最も強い。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:57:54 GMT)
Applications of Statistical Field Theory in Deep Learning [3.8] ディープラーニングアルゴリズムは、これらのアルゴリズムの複雑さのため、過去10年間に驚くべき進歩を遂げてきたが、ディープラーニングの科学は、まだ初期段階にある。
実験駆動の分野であるため、物理学のパラダイムの中でディープラーニングの理論を求めることは自然である。
深層学習は主に関数の学習と関数上の分布に関するものであるので、統計場理論は形式主義の明らかな選択である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:19:06 GMT)
Towards Detecting Prompt Knowledge Gaps for Improved LLM-guided Issue Resolution [3.8] GitHubイシュースレッド内の433人の開発者-ChatGPT会話を分析し、インシデントギャップと会話スタイルが課題解決に与える影響を調べる。
不効果的な会話は44.6%のプロンプトで知識ギャップを含んでいるのに対し、効果的な会話では12.6%しかなかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:32:14 GMT)
Discrimination of bosonic dephasing quantum channels [3.7] 本研究では,2つのボソニックデフォーカス量子チャネルの識別の可能性について検討する。
入力エネルギー制約が存在する場合、誤差確率の上限を導出する。
我々は、これらの結果を単発から複数発の識別に拡張し、振る舞いを精査する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:30:20 GMT)
Conformal Prediction Under Generalized Covariate Shift with Posterior Drift [3.7] 転送学習アプローチは、関連するソースドメインからの知識を活用して、ターゲットドメインでの学習性能を改善することを目的としている。
本稿では,転帰学習における新たな分布仮定の下で,共形予測と呼ばれる特定の分類問題について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:46:43 GMT)
Graph Augmentation for Cross Graph Domain Generalization [3.7] グラフニューラルネットワーク(GNN)の領域一般化問題としてのクロスグラフノード分類
クロスグラフ領域一般化問題に対する新しいグラフ構造拡張法を開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:27:48 GMT)
Zero-energy Quantum Many-Body Scar under Emergent Chiral Symmetry and Pseudo Hilbert Space Fragmentation [3.7] キラル対称性と擬似HSFの相互作用におけるゼロエネルギーQMBSの現象について検討した。
この2つの相互作用は、粒子数が偶数であるとき、高度に局所化されたゼロエネルギーQMBSをもたらす。
ゼロエネルギーQMBSを信号化する単純な積状態を特定し、異常なスカーレッドダイナミクスを生じさせる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:24:37 GMT)
A Collection of Innovations in Medical AI for patient records in 2024 [3.7] 医療における人工知能の分野は、前例のないペースで進化している。
本稿では、最新のAI駆動型医療革新を優先する、学術出版の新しいカテゴリを提唱する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:24:24 GMT)
Mathematical Introduction to Deep Learning: Methods, Implementations, and Theory [3.6] この本は、ディープラーニングアルゴリズムのトピックについて紹介することを目的としている。
本稿では,ディープラーニングアルゴリズムの本質的構成要素を数学的に詳細に概説する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:17:16 GMT)
Measurement of Medial Elbow Joint Space using Landmark Detection [3.6] 本研究は関節腔を計測する新しい超音波肘部データセットを提案する。
このデータセットは、22人の被験者から4,201個の肘超音波画像からなり、上腕骨と尺骨にランドマークの注釈が付けられている。
本研究では,熱マップに基づく,回帰に基づく,トークンに基づくランドマーク検出手法を用いて,提案したデータセットを用いた共同空間計測手法の評価を行った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:52:03 GMT)
A partial likelihood approach to tree-based density modeling and its application in Bayesian inference [3.4] 確率分布のツリーベースの事前は、通常、サンプル空間の候補分割の所定のデータ非依存のコレクションを使用して指定される。
サンプル空間全体にわたって、未知のターゲット密度を詳細に特徴づけるためには、候補分割は、潜在的にゼロでないサンプリング確率でサンプル空間のすべての領域に深く展開する能力を持つ必要がある。
伝統的な知恵は、ベイズ的推論においてコヒーレントな可能性に基づく推論を保証するために、この妥協は避けられないことを示唆している。
そこで本研究では,Coxの部分的可能性を用いて,データ依存型の分割を許容しながら,コヒーレンシを復元する簡単な手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:32:08 GMT)
A graph neural network-based multispectral-view learning model for diabetic macular ischemia detection from color fundus photographs [3.4] 糖尿病性黄斑虚血(DMI)は糖尿病患者の視力障害に寄与する。
基礎画像からDMIを検出するために,グラフニューラルネットワークを用いたマルチスペクトルビューラーニング(GNN-MSVL)モデルを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:17:20 GMT)
A Computational Framework for Simulations of Dissipative Non-Adiabatic Dynamics on Hybrid Oscillator-Qubit Quantum Devices [3.3] 本稿では,回路量子力学プラットフォーム上での非断熱的ビブロニックダイナミクスをシミュレーションするための計算フレームワークを提案する。
自然アンテナ系にインスパイアされた光合成色調のトライアドモデルでエネルギー伝達のダイナミクスをシミュレートする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:56:45 GMT)
Persistent Homology for Structural Characterization in Disordered Systems [3.3] 障害のあるシステムにおける局所的構造と大域的構造の両方を特徴付けるために,永続的ホモロジー(PH)に基づく統一的なフレームワークを提案する。
同じアルゴリズムとデータ構造を使って、ローカルとグローバルのディスクリプタを同時に生成できる。
粒子の再配置を予測し、大域的な位相を分類するのに非常に効果的で解釈可能であることが示されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:57:11 GMT)
Differentially Private Release of Israel's National Registry of Live Births [3.3] 2024年2月、イスラエル保健省は2014年にイスラエルで生誕のマイクロデータを公表した。
本稿では,このリリースの獲得に使用した方法論について述べる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:31:22 GMT)
Multi-class Seismic Building Damage Assessment from InSAR Imagery using Quadratic Variational Causal Bayesian Inference [3.2] InSARデータから多層建築物の損傷分類を抽出する新しい手法を提案する。
提案手法は,InSAR観測と地上故障モデルとビルディング関数を統合する。
提案手法は,全ての損傷カテゴリに対して高い精度(AUC > 0.93)を維持しつつ,計算オーバーヘッドを40%以上削減する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:40:16 GMT)
AutoCas: Autoregressive Cascade Predictor in Social Networks via Large Language Models [3.1] 情報カスケードにおける人気予測は,ソーシャルコンピューティングにおいて重要な役割を担っている。
同時に、利用可能なカスケードデータの量は、大規模言語モデル(LLM)のトレーニングに使用される膨大なデータセットと比較しても比較的限られている。
本稿では,自動回帰情報カスケード予測器(AutoCas)について紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:54:33 GMT)
Learn Your Reference Model for Real Good Alignment [3.1] 大規模言語モデル(LLM)アライメントのためのオフラインメソッドは、過度な最適化の影響を受けやすい。
我々は、トレーニングプロセスを通して参照ポリシーを動的に更新する、Trust Regionと呼ばれるオフラインアライメント手法の新たなパラダイムを提案する。
この結果から,TRアライメント手法は過度な最適化を効果的に軽減し,初期基準ポリシからかなり逸脱したモデルでも高い性能を維持することができることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:19:35 GMT)
Are GNNs doomed by the topology of their input graph? [3.1] 局所的なトポロジ的特徴がメッセージパス方式とどのように相互作用し,過度なスムースメントや表現表現などの大域的な現象を生成するかを示す。
実験により,グラフトポロジがグラフニューラルネットワーク(GNN)の性能に与える影響を明らかにする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:19:03 GMT)
BRIDO: Bringing Democratic Order to Abstractive Summarization [3.1] 幻覚とは、大きな言語モデル(LLM)から生成される不正確な、無関係で一貫性のないテキストを指す。
同様の露光バイアス緩和戦略を用いるが,幻覚の少ない目標を掲げたモデルを提案する。
提案手法は,この側面を利用してコントラスト学習を行い,候補を高い候補間ROUGEスコアでインセンティブを与える。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:33:50 GMT)
Queue management for slo-oriented large language model serving [3.0] 大規模言語モデル(LLM)サービスのためのキュー管理システムであるQLMを提案する。
QLMは、異なるモデルとSLOをまたいだバッチおよびインタラクティブなリクエストをリクエストキューで維持する。
リクエスト待ち時間(RWT)推定器を使用し、リクエストキューでのリクエスト待ち時間を推定する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:54:13 GMT)
A Combinatorial Identities Benchmark for Theorem Proving via Automated Theorem Generation [3.0] コンビニティクスは数学の基盤であり、離散構造の分析と問題解決に不可欠なツールを提供する。
これを解決するために、手動でLeanCombを構築しました。
我々は,自己改善型大規模言語モデルによって提案される候補戦略と,予測のための強化学習木探索アプローチを組み合わせた,コンビニアル・アイデンティティのための自動定理ジェネレータATG4CIを開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:41:49 GMT)
Enhancing Reusability of Learned Skills for Robot Manipulation via Gaze and Bottleneck [3.0] 我々は、GazeベースのBottleneck対応ロボットマニピュレーション(GazeBot)という新しいアルゴリズムを提案する。
GazeBotは、最先端の模倣学習手法と比較して高い一般化性能を実現する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:44:28 GMT)
TerraTrace: Temporal Signature Land Use Mapping System [3.0] 植物光合成に基づく標準分化植生指数(NDVI)のような指標は,農業慣行や季節周期を反映した独自の時間的シグネチャを持つ。
我々は,2020年から2023年にかけて,5億の解像度と7000万以上のポイントを持つカリフォルニア州のための新しい縦方向NDVIデータセットを開発した。
これは,NDVIシグネチャを用いた土地利用を分類するエンドツーエンド解析ツールであるTerraTraceプラットフォームの開発に使用される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:54:45 GMT)
Linguistically Grounded Analysis of Language Models using Shapley Head Values [2.9] 最近提案されたシェープヘッド値(SHV)を用いた言語モデル探索手法を利用した形態素合成現象の処理について検討する。
英語のBLiMPデータセットを用いて、BERTとRoBERTaという2つの広く使われているモデルに対して、我々のアプローチを検証し、言語構造がどのように扱われるかを比較する。
以上の結果から,SHVに基づく属性は両モデルにまたがる異なるパターンを明らかにし,言語モデルがどのように言語情報を整理・処理するかの洞察を与える。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:02:34 GMT)
Defining bias in AI-systems: Biased models are fair models [2.8] 公平性の懸念に効果的に対処するためには、偏見の正確な概念化が必要であると論じる。
偏見を本質的に否定的あるいは不公平と見なすのではなく、偏見と差別を区別することの重要性を強調します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:28:16 GMT)
Quantum Imaging of Photonic Spin Texture in an OAM Beam with NV Centers in Diamond [2.8] フォトニックスピンテクスチャー (PST) は、光学スカイミオンやトポロジカル光学的N-不変量のような光のユニークな性質と結びついている。
ここでは、軌道角運動量(OAM)を持つビームのPSTを撮像するためのナノスケール量子センサとして、ダイヤモンド中の窒素空孔(NV)中心を実証する。
我々の研究は、サブ波長スケールでの光のスピンテクスチャをキャラクタリゼーションできる量子イメージングプラットフォームの開発に繋がる可能性がある。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:49:47 GMT)
The Built-In Robustness of Decentralized Federated Averaging to Bad Data [2.8] 分散連合学習(DFL)は、中央コントローラに頼ることなく、複雑なネットワークトポロジ上でモデルを協調的にトレーニングすることを可能にする。
この設定では、ローカルデータはプライベートのままだが、その品質と量はノード間で大きく異なる可能性がある。
劣化したデータをノードのサブセットに均等に分散するシナリオと,単一ノードに集中するシナリオの2つをシミュレーションする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:06:51 GMT)
Simulating Chemistry with Fermionic Optical Superlattices [2.8] 量子化学における変分最適化のための量子数保存Ans"atzeは、光学超格子における超低温フェルミオンへのエレガントなマッピングであることを示す。
分子ハミルトニアンの試験基底状態とそれらの分子エネルギーを格子内で測定することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:52:10 GMT)
FRT Regulation in China [2.7] 本稿では,中国における顔認識技術(FRT)規制の法的枠組みについて紹介する。
この非対称な規制モデルを説明するために2つのケースを使用します。
本稿は、中国がFRTに特有の非対称規制モデルを開発した理由を説明する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:04:32 GMT)
Radon-Nikodým Derivative: Re-imagining Anomaly Detection from a Measure Theoretic Perspective [2.7] 本研究では,バニラ損失関数をrnthm誘導体に乗じることで,ボード全体の性能が向上することを示す。
異常検出のPAC学習性を用いて構築する。
rnthmデリバティブは、教師なしクラスタリングに基づく異常検出にも重要な洞察を与える。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:08:50 GMT)
Optimal Geometry of Oscillators in Gravity-Induced Entanglement Experiments [2.7] 熱デコヒーレンスは、システムのパラメータに厳格な制約を課す。
本研究では, フォームファクタが2pi$の上限を持つことを証明し, 発振器系の基本的な限界を明らかにする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:28:04 GMT)
ToMCAT: Theory-of-Mind for Cooperative Agents in Teams via Multiagent Diffusion Policies [2.6] ToMCAT(Theory-of-Mind for Cooperative Agents in Teams)は、ToM条件のトラジェクトリを生成するための新しいフレームワークである。
メタラーニングのメカニズムは、チームメイトの基本となる目標と将来の振る舞いに対してToM推論を実行し、マルチエージェントのデノベーション/拡散モデルと組み合わせます。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:31:55 GMT)
DeBUGCN -- Detecting Backdoors in CNNs Using Graph Convolutional Networks [2.6] ディープニューラルネットワーク(DNN)は、重要なアプリケーションにおいて一般的なものになりつつあるため、バックドア(トロイの木馬)への感受性が重大な問題となっている。
本稿では,グラフ畳み込みネットワーク(DeBUGCN)を用いた攻撃モデルを検出する,新たなバックドア攻撃検出パイプラインを提案する。
我々の知る限りでは、GCNをトロイの木馬検出に初めて利用している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:18:38 GMT)
MoFM: A Large-Scale Human Motion Foundation Model [2.6] ファンデーションモデル(FM)は、様々なタスクにまたがるスケーラビリティと一般化により、研究者の注目を集めている。
MoFMは、時間と空間の両方において複雑な人間の動きを意味的に理解するために設計されている。
MoFMは、ダウンストリームタスクのバックボーンを提供し、ワンショット、教師なし、教師なしタスクなどのパラダイムをサポートする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:26:43 GMT)
From Text to Emoji: How PEFT-Driven Personality Manipulation Unleashes the Emoji Potential in LLMs [2.6] 大規模言語モデル(LLM)の性格特性の操作が重要な研究領域として浮上している。
我々は、量子化低ランク適応(QLoRA)を用いて、オープンネス、良心性、外転、アグレタブルネス、ニューロティシズムという5つの大きな性格特性を操る。
PEFTの後、Mistral-7B-InstructやLLaMA-2-7B-chatのようなモデルでは、PEFTデータに絵文字が存在しないにもかかわらず、特定の特性の絵文字を生成することで潜伏した振る舞いを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:17:12 GMT)
Distributing Intelligence in 6G Programmable Data Planes for Effective In-Network Intrusion Prevention [2.6] 本研究の目的は、将来のプログラマブルネットワークの典型的なデータプレーンのデバイスが異常検出機能を有し、完全に分散した方法で協調してML対応侵入防止システムとして機能する破壊的パラダイムを提案することである。
報告された概念実証実験は、提案されたパラダイムによって、デバイス全体のCPUやRAMリソースの削減を図りながら、効果的かつ良好な精度で作業することが可能であることを実証している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:46:34 GMT)
HyPA-RAG: A Hybrid Parameter Adaptive Retrieval-Augmented Generation System for AI Legal and Policy Applications [2.5] 大規模言語モデル(LLMs)は、時代遅れの知識、幻覚、複雑なコンテキストにおける不適切な推論のために、AIの法と政策の応用に制限に直面している。
Retrieval-Augmented Generation (RAG) システムは、外部知識を取り入れてこれらの問題に対処するが、検索エラー、非効率なコンテキスト統合、高い運用コストに悩まされる。
本稿ではハイブリッドについて述べる。
Adaptive RAG (HyPA-RAG) は、AI法域向けに設計されたシステムで、テストケースはNYC Local Law 144 (LL144) である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:14:47 GMT)
Effect of Gender Fair Job Description on Generative AI Images [2.5] 本研究は,OpenAI DALL-E 3 & Black Forest FLUX.1が生成したSTEM占領画像におけるジェンダー表現を,3つの言語形式で150のプロンプトを用いて分析した。
結果,全形態に有意な男性偏見がみられ,ドイツ式は偏見が低いが,STEM群では男性を過度に表し,社会職業群では混在した結果がみられた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:21:29 GMT)
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction [2.5] シーケンシャルレコメンデーションモデルに非イテムページを組み込む方法を示す。
我々は、一般的なシーケンシャルレコメンデータモデルを適用して、非itemページを統合する。
その結果,非イテムページは貴重な情報源であることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:17:41 GMT)
Double Robust Bayesian Inference on Average Treatment Effects [2.5] 不整合下での平均処理効果(ATE)に対する二重頑健なベイズ推定法を提案する。
新しいベイズ的アプローチでは、まず条件付き平均関数の事前分布を調整し、得られた ATE の後方分布を補正する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:06:00 GMT)
Causal AI-based Root Cause Identification: Research to Practice at Scale [2.5] 我々は,相関関係に対する因果関係を強調する新しい因果関係に基づくルート因果同定(RCI)アルゴリズムを開発した。
本稿では、Instanaの高度な故障診断機能を強調し、RCIアルゴリズムの理論的基盤と実践的実装について論じる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:20:33 GMT)
DeepSeek vs. ChatGPT: A Comparative Study for Scientific Computing and Scientific Machine Learning Tasks [2.4] 大きな言語モデル(LLM)は、幅広い問題に対処するための強力なツールとして登場した。
我々は,最も先進的なLCM-ChatGPTとDeepSeek-の能力と,計算課題に対処するための推論最適化バージョンを比較した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:49:50 GMT)
Teaching Well-Structured Code: A Literature Review of Instructional Approaches [2.4] この体系的な文献レビューは、既存の教育的アプローチ、その目的、およびそれらの効果を測定するために使用される戦略を識別する。
これらの研究は,(1)自動化ツールの開発・評価に焦点をあてた研究,(2)他の教材について議論する研究,(3)コード品質を支援するためのコース設計の全体的アプローチを通じて,カリキュラムにコード構造を統合する方法について議論する研究の3つのカテゴリに分類した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:55:49 GMT)
Manifold GCN: Diffusion-based Convolutional Neural Network for Manifold-valued Graphs [2.4] リーマン多様体に特徴を持つグラフに対する2つのグラフニューラルネットワーク層を提案する。
両層がノード置換と特徴多様体の等式の下で同変であることが示される。
より広範な種類の問題に適用する一方で、タスク固有の最先端ネットワークよりも、あるいはそれ以上に機能する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:31:31 GMT)
Enhancing 5G O-RAN Communication Efficiency Through AI-Based Latency Forecasting [2.4] 本稿では,関数型O-RANプロトタイプに統合された人工知能駆動の遅延予測システムを提案する。
このシステムは、双方向の長期記憶モデルを使用して、FlexRICで構築されたスケーラブルでオープンソースのフレームワーク内で、リアルタイムで遅延を予測する。
実験の結果、モデルの有効性が示され、0.04未満の損失測定値が得られ、ダイナミックな5G環境に適用可能であることが証明された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:11:48 GMT)
Shedding Light on Problems with Hyperbolic Graph Learning [2.4] 双曲グラフ表現学習の分野を考察する。
結果は、ベースラインを厳格に提示せず、誤ったモデリングの仮定をし、誤解を招く指標を使用する。
我々は、(ハイエボリック)グラフニューラルネットワークの適用性を確認するために、ベンチマークデータセット群を紹介する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:52:38 GMT)
GenAI vs. Human Fact-Checkers: Accurate Ratings, Flawed Rationales [2.3] GPT-4oは、消費者向けアプリケーションでもっとも使われているAIモデルの一つで、他のモデルよりも優れているが、すべてのモデルは、人間のコーダーとの適度な合意しか示さない。
また,要約コンテンツと完全コンテンツ入力の有効性を評価し,要約コンテンツが精度を犠牲にすることなく効率を向上させることを約束していることを確認した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:06:04 GMT)
Exploring the Potential of Large Language Models for Estimating the Reading Comprehension Question Difficulty [2.3] 本研究では,Large Language Models (LLMs) の有効性を検討した。
また,OpenAI の GPT-4o と o1 を用いて,学習支援・読解評価 (SARA) データセットを用いた理解的質問の読解の難しさを推定する。
その結果, モデルがIRTパラメータと有意に一致した難易度推定値を生成する一方で, 極端項目特性に対する感度に顕著な差があることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:28:48 GMT)
Flow Matching for Accelerated Simulation of Atomic Transport in Materials [2.3] LiFlowは結晶材料の分子動力学(MD)シミュレーションを加速するための生成フレームワークである。
4,186固体電解質 (SSE) 候補を4温度で25-psのリチウム拡散を観測した。
LiFlowは、短い訓練軌道からより大きなスーパーセルへと一般化し、高い精度を維持しながら、より長いシミュレーションを行う。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:42:41 GMT)
Learning quantum processes without input control [2.3] 古典的確率変数を入力として、量子状態を出力するプロセスに対して、一般的な統計的学習理論を導入する。
この枠組みは、観測者によって制御されていない天文学的な現象、無秩序なシステム、生物学的プロセスの研究に適用できる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:09:58 GMT)
Allocating Variance to Maximize Expectation [2.3] ガウス確率変数の系列の上限を最大化するための効率的な近似アルゴリズムを設計する。
このような期待問題は、ユーティリティオークションから、定量的遺伝学の混合モデルを学ぶことまで、様々な応用で発生する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:59:46 GMT)
Experimental Analysis of Efficiency of the Messaging Layer Security for Multiple Delivery Services [2.3] メッセージ層セキュリティ(MLS)とその基盤となるContinuous Group Key Agreementプロトコルは、暗号化シークレットを動的に共有することを可能にする。
MLSの最も重要な貢献の1つは効率であり、通信コストはメンバー数と対数的にスケールするためである。
コミット生成や処理時間,メッセージサイズなどのメトリクスを,異なる条件下でリアルタイムに計測する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:43:16 GMT)
Graph Inference with Effective Resistance Queries [2.2] 一対の頂点間の有効抵抗(ER)を返すオラクルを用いてグラフ推論を研究する。
ERクエリから$n$-vertexグラフを一意に再構築できることは知られているが、他にはほとんど知られていない。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:37:25 GMT)
Quantum Inspired Excited States Calculations for Molecules Based on Contextual Subspace and Symmetry Optimizations [2.2] 量子に着想を得た励起状態計算法は、NISQ(Noisy Intermediate-Scale Quantum)ハードウェアでまだ探索されていない。
本稿では,文脈部分空間(CS)法と変分量子デフレレーション(VQD)アルゴリズムを統合する資源効率のよいフレームワークを提案する。
スピン保存型ハードウェア効率アンサッツの実装、すなわち$mathcalN(theta_x,theta_y,theta_z)$ block ansatzは、投影された部分空間内のスピン対称性の活用を可能にする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:48:04 GMT)
IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution [2.2] 近年, 複合核融合注意変換器 (CFAT) は, 従来のSOTAモデルよりも高画質である。
本稿では,実世界の画像超解像における変換器の性能を効果的に活用するために,CFATモデルを取り入れた新しいGANベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:52:38 GMT)
Automated Knowledge Component Generation and Knowledge Tracing for Coding Problems [2.1] 知識コンポーネント(KC)は、生徒の学習をモデル化し、きめ細かいスキルの熟達レベルを追跡するのに役立つ問題にマッピングされる。
我々は、KC生成とタグ付けのための完全に自動化されたLLMベースのパイプラインを、オープンエンドプログラミング問題に対して提示する。
我々は、パイプラインのKCタグ付け精度が、人間のドメインの専門家と比較した場合、合理的に正確であることを示すために、人間の評価を行う。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:40:51 GMT)
Learned Reference-based Diffusion Sampling for multi-modal distributions [2.1] 本稿では,学習参照に基づく拡散サンプリング(LRDS)について紹介する。
LRDSは、高密度空間領域にあるサンプルの参照拡散モデルを学ぶことによって、2段階で進行する。
LRDSは、様々な難解な分布上の競合するアルゴリズムと比較して、目標分布に関する事前知識を最大限に活用することが実験的に実証された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:48:19 GMT)
Unmasking Gender Bias in Recommendation Systems and Enhancing Category-Aware Fairness [2.1] 我々は、レコメンデーションにおけるジェンダーバイアスのための総合的な指標のセットを紹介する。
より粒度の高いレベルで公平さを評価することの重要性を示す。
モデル出力のバイアスを効果的に最小化するために,カテゴリー認識公正度尺度を正規化用語として,トレーニング中の主な推奨損失と組み合わせることで有効であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:37:28 GMT)
Escaping The Big Data Paradigm in Self-Supervised Representation Learning [2.1] SCOTTはMasked Image Modelingタスクと互換性のある浅いトークン化アーキテクチャである。
SCOTTは、視覚変換器(ViT)に畳み込み誘導バイアスを注入し、小規模のデータレシエーションにおけるその有効性を高める。
提案手法は,Oxford Flowers-102,Oxford IIIT Pets-37,ImageNet-100の3つの小型,標準的,きめ細かいデータセットに対して検証を行った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:21:49 GMT)
Diffusion-HMC: Parameter Inference with Diffusion-model-driven Hamiltonian Monte Carlo [2.0] この研究は、1つの拡散生成モデルを用いて、観測された天体物理学分野の予測を生成し、観測から物理的モデルを制約する、相互に繋がった目的に対処する。
拡散生成モデルの近似的近似性を利用して、ハミルトニアンモンテカルロ法を用いて、与えられたテスト画像の宇宙論的パラメータの後方をサンプリングすることで、宇宙論の厳密な制約を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:59:56 GMT)
Building a Chinese Medical Dialogue System: Integrating Large-scale Corpora and Novel Models [2.0] 新型コロナウイルス(COVID-19)のパンデミックは、従来の医療システムに大きな欠陥を生じさせ、オンライン医療サービスの進歩を加速させた。
既存の研究は2つの大きな課題に直面している。
まず、プライバシー上の懸念から、大規模で公開可能な、ドメイン固有の医療データセットの不足。
第二に、既存の方法には医療知識がなく、患者医師相談における専門用語や表現の理解に苦慮している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:17:05 GMT)
optimizn: a Python Library for Developing Customized Optimization Algorithms [1.9] optimiznは、最適化アルゴリズムのパラダイムの下でカスタマイズされた最適化アルゴリズムを開発するためのPythonライブラリである。
Opimiznは継続的トレーニングを提供しており、ユーザーはアルゴリズムを通常のケイデンスで実行し、以前の実行の健全な側面を維持し、その後の実行で使用して、最適性に近づいたソリューションを生成することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:34:44 GMT)
Enhancing selectivity using Wasserstein distance based reweighing [1.9] 損失関数を再検討するために, 単純で効率的なグリージーアルゴリズムを設計する。
モチベーション応用として、MNK2の小さな分子結合体を認識するためにニューラルネットを訓練する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:28:31 GMT)
JuliaGrid: An Open-Source Julia-Based Framework for Power System State Estimation [1.9] JuliaGridはオープンソースのフレームワークで、複数のプラットフォームにわたるハイパフォーマンス実行用に設計されている。
可観測性解析、重み付けされた最小二乗および絶対値推定器、悪いデータ分析、およびファサー測定に関連する様々なアルゴリズムを実装している。
JuliaGridは、他のオープンソースフレームワークと比較して、競争力のある実行時間で、すべてのSEルーチンにわたる大規模なシステムを解決する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:13:14 GMT)
Global law of conjugate kernel random matrices with heavy-tailed weights [1.8] 共役核乱数行列$YYtop$のスペクトル挙動について検討し、そこでは2層ニューラルネットワークモデルから$Y=f(WX)$が生じる。
重み付き重みは、Y$の成分の間に強い相関関係を生じさせ、軽み付き重み付きモデルと比較して、より豊かで根本的に異なるスペクトル挙動をもたらすことを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:22:58 GMT)
TagGAN: A Generative Model for Data Tagging [1.8] 本稿では,新しいGAN(Generative Adversarial Networks)ベースのフレームワークTagGANを提案する。
TagGANは、純粋に画像レベルのラベル付きデータから弱制御されたきめ細かい病気マップを生成するために調整されている。
本手法は, 画素レベルのアノテーションを必要とせず, 毎週, 病原体を可視化する, 詳細な病原体マップを作成することを目的としている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:29:18 GMT)
Machine Learning and Feature Ranking for Impact Fall Detection Event Using Multisensor Data [1.8] 我々は、マルチセンサUP-FALLデータセットから最も関連性の高い特徴を特定するために、特徴選択プロセスを採用している。
次に、インパクトモーメントの検出における各種機械学習モデルの効率性を評価する。
この結果から, 落下検出にマルチセンサデータを活用する能力を示すとともに, 衝突検出の精度向上を実現した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:05:50 GMT)
On-device edge learning for IoT data streams: a survey [1.7] 本稿では,ニューラルネットワーク(NN)と決定木(DT)の文脈におけるデバイス上でのトレーニングのための連続的学習手法について検討する。
データアーキテクチャ(バッチ対ストリーム)やネットワーク容量(クラウド対エッジ)といった重要な制約を強調します。
調査では、リソース制約のあるエッジデバイスにディープラーニングをデプロイする際の課題について詳述している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:41:23 GMT)
Non-Markovian effects on the steady state properties of a damped harmonic oscillator [1.6] 非マルコフ浴が存在する場合の減衰型高調波発振器(システム)の定常特性を解析した。
非マルコフ環境による複素時間接続の導入は、システムの力学を根本的に修正する。
ゼノ効果と抗ゼノ効果の遷移は浴槽のスペクトル幅と消散強度によって調整できることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:24:48 GMT)
Generative Artificial Intelligence: Evolving Technology, Growing Societal Impact, and Opportunities for Information Systems Research [1.6] 我々は、AIの現状と今後の影響を予測するために、AIの進化と発展のトレンドを考察する。
我々は、象徴主義からコネクショナリズムへの継続的な変化に根ざした、GenAIのユニークな特徴を探求する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:34:23 GMT)
Late Breaking Results: The Art of Beating the Odds with Predictor-Guided Random Design Space Exploration [1.6] 高性能回路は、性能、電力、コストにとって不可欠である。
本研究はMIG合成におけるランダム探索による組合せディジタル回路の改良手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:56:25 GMT)
Sparse Hyperparametric Itakura-Saito NMF via Bi-Level Optimization [1.5] そこで我々は,行依存のペナルティハイパーパラメータを自動的に適応的に調整する二段階最適化フレームワーク「ShinBO」を提案する。
実験の結果,ShinBOは正確なスペクトル分解を保証し,合成および実世界の双方で優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:24:35 GMT)
Steered Generation via Gradient Descent on Sparse Features [1.5] クエリ埋め込みのスパース表現を学習するために、スパースオートエンコーダを訓練することにより、大言語モデル(LLM)の内部構造を変更する。
このスパース表現の操作は、出力を異なるスタイル的および認知的目標に向けて効果的に変換することを実証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:06:14 GMT)
Weakly Supervised Pixel-Level Annotation with Visual Interpretability [1.5] 本稿では,アンサンブル学習,視覚的説明可能性,不確実性定量化を統合した自動説明可能なアノテーションシステムを提案する。
提案手法では,事前学習した3つのディープラーニングモデル – ResNet50,EfficientNet,DenseNet – と,視覚的説明のためのXGrad-CAM,不確実性定量化のためのMonte Carlo Dropoutを組み合わせた。
実験の結果,本手法はベースラインモデルより優れ,TBX11Kでは93.04%,Fireデータセットでは96.4%の精度が得られた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:03:22 GMT)
The Introduction of README and CONTRIBUTING Files in Open Source Software Development [1.5] ConTRIBUINGファイルは、フリー/ライブラリおよびオープンソースソフトウェア(FLOSS)プロジェクトへの潜在的コントリビュータにとって、最初の接触ポイントとなる。
Mozilla、GitHub、Linux Foundationなどの著名なオープンソースソフトウェア組織は、プロジェクトは早期にコミュニティにフォーカスし、プロセス指向のドキュメントを提供し、採用と活動を促進することを提唱している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:33:52 GMT)
Monte Carlo Temperature: a robust sampling strategy for LLM's uncertainty quantification methods [1.4] 本研究では,温度校正の必要性を解消するロバストサンプリング戦略を提案する。
MCTは、幅広い温度でより堅牢な不確実性推定を提供する。
MCTはオラクル温度と統計的に同等であり、これはよく調整されているが計算に費用がかかるHPOプロセスの理想的な結果である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:33:20 GMT)
Colored Jones Polynomials and the Volume Conjecture [1.3] ハイブリド表現のモデルアプローチを用いて, 双曲結び目上に最大15個の交叉を配置したスピン1の計算を行う。
我々は、双曲的随伴ジョーンズの結び目の体積またはその評価を99.34%の精度で予測する。
2色のジョーンズと3色のジョーンズの分析から、$n$のジョーンズの最良の位相を予想する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:02:13 GMT)
Revisiting Method-Level Change Prediction: A Comparative Evaluation at Different Granularities [1.3] 3つの観点から,メソッドレベルの変化予測の性能をクラスレベルの予測と比較した。
直接比較では,メソッドレベルの予測はクラスレベルの予測よりも低い性能を示したが,メソッドレベルでの評価では,メソッドレベルの予測はクラスレベルの予測よりも優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:14:04 GMT)
iTrash: Incentivized Token Rewards for Automated Sorting and Handling [1.3] 小オフィススペースのリサイクル率向上を目的としたインテリジェントゴミ箱iTrashを提案する。
そのため、5日間の実験を行い、iTrashは従来のゴミ箱と比べて30%以上の効率向上を達成できることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:46:45 GMT)
State Machine Model for The Update Framework (TUF) [1.3] TUFは1つ以上の署名キーを持つ4つの異なるロールを導入し、更新プロセスに参加する必要がある。
このアプローチは、各更新パッケージの総サイズを増やし、各クライアントシステムが検証しなければならないシグネチャの数を増やします。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:00:54 GMT)
BD Currency Detection: A CNN Based Approach with Mobile App Integration [1.3] 本研究では,畳み込みニューラルネットワーク(CNN)を用いた高度な通貨認識システムを提案する。
50,334の画像からなるデータセットを収集,前処理し,高性能分類に最適化されたCNNモデルをトレーニングするために使用した。
訓練されたモデルは98.5%の精度を達成し、従来の通貨認識手法を抜いた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:13:43 GMT)
Automatic Vehicle Detection using DETR: A Transformer-Based Approach for Navigating Treacherous Roads [1.2] 本研究では,複雑かつ多様な環境下での自動車両検出のための検出変換器(DETR)を初めて実験した。
我々は,コラボレーティブ・ハイブリッド・アサインメント・トレーニング・スキームであるCo-DETRを用いて,DeTRの特徴学習と注意機構を強化する。
提案手法は,より優れた結果を得るとともに,多様な条件下での精度の向上を実現し,実世界の展開に有効である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:43:28 GMT)
Independent Mobility GPT (IDM-GPT): A Self-Supervised Multi-Agent Large Language Model Framework for Customized Traffic Mobility Analysis Using Machine Learning Models [1.2] 研究チームは、Independent Mobility GPT(IDM-GPT)という革新的なマルチエージェントフレームワークを提案する。
IDM-GPTは、ユーザー、交通データベース、機械学習モデルを経済的に効率的に接続する。
IDM-GPTのトレーニング、カスタマイズ、ユーザクエリの理解、最適化、データ分析、モデル選択、パフォーマンス評価と拡張など、複数の機能にLLMベースのAIエージェントを適用。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:28:15 GMT)
Fast, accurate, and predictive method for atom detection in site-resolved images of microtrap arrays [1.2] マイクロトラップアレイの部位分解画像中の個々の原子を検出するために,推定理論に根ざした新しい手法を提案する。
シミュレーション画像を用いて,Wienerデコンボリューションに基づく一般的な手法と比較して,検出誤差率を10倍に削減した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:22:16 GMT)
Re-Simulation-based Self-Supervised Learning for Pre-Training Foundation Models [1.1] 自己監視学習(SSL)は、現代の大規模機械学習モデルのトレーニングの中核にある。
シミュレーションに基づく新しいSSL戦略であるRS3L(Re-simulation-based self-supervised representation learning)を提案する。
本稿では、RS3L事前学習が、様々な物体の識別や不確実性軽減といった下流タスクにおいて、強力な性能を実現する方法を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:08:55 GMT)
Quantum Machine Learning in Precision Medicine and Drug Discovery -- A Game Changer for Tailored Treatments? [1.1] 伝統的な計算手法は、しばしば不足し、遅延し、時には非効率な診断や治療につながる。
本稿では,Quantum Computing (QC) とQuantum Machine Learning (QML) が医療に革命をもたらす可能性のある変革的進歩を提供する分野を要約する。
ソフトウェア(形式的手法)の特定,開発,検証を行う数学的手法は,QCの信頼性と正確性を高めることができることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:59:22 GMT)
SPDGAN: A Generative Adversarial Network based on SPD Manifold Learning for Automatic Image Colorization [1.1] 生成逆ネットワーク(SPDGAN)を用いたSymmetric Positive Definite (SPD) Manifold Learningに基づく完全自動カラー化手法を提案する。
本モデルは,2つの識別器とジェネレータの対角ゲームを確立する。その目標は,残差接続により層間の色情報を失うことなく,偽のカラー化画像を生成することである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:42:22 GMT)
From underwater to aerial: a novel multi-scale knowledge distillation approach for coral reef monitoring [1.1] 本研究は,サンゴ礁のサンゴ礁モニタリングに,小型水中画像と中規模空中画像を統合した新しいマルチスケールアプローチを提案する。
変圧器を用いた深層学習モデルは水中画像に基づいて訓練され、様々なサンゴ型、関連する動物相、生息地を含む31のクラスの存在を検出する。
以上の結果から,本手法はサンゴのサンゴ類型および生息域の予測において高い精度を達成し,より大規模なサンゴ礁地域への細分化を成功裏に進めることが示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:12:33 GMT)
Nonparametric logistic regression with deep learning [1.1] 非パラメトリックロジスティック回帰では、クルバック・リーバーの発散は容易に発散できる。
余剰リスクを解析する代わりに、最大可能性推定器の一貫性を示すのに十分である。
重要な応用として、完全に接続されたディープニューラルネットワークを持つNPMLEの収束率を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:20:22 GMT)
Complex Networks for Pattern-Based Data Classification [1.0] 本稿では,最小スパンニングツリーと単一ソースショートパスから導出したユニークな手法を用いて,ネットワークに基づく2つの分類手法を提案する。
従来の古典的ハイレベル・機械学習の分類手法と比較して,提案手法の有望な数値結果が得られた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:36:02 GMT)
Hybrid nonlocality via atom photon interactions with and without impurities [1.0] 不完全な状況下でのハイブリッド非局所性の待ち時間平均値の計算方法を示す。
また、ウィグナー負性性とハイブリッド非局所性との関係についても検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:02:53 GMT)
Comprehensive Performance Evaluation of YOLOv12, YOLO11, YOLOv10, YOLOv9 and YOLOv8 on Detecting and Counting Fruitlet in Complex Orchard Environments [1.0] 本研究は, YOLOv8, YOLOv9, YOLOv10, YOLO11( or YOLOv11) および YOLOv12 オブジェクト検出アルゴリズムの性能評価を行った。
YOLOv12lは、他の全てのYOLOモデルと比較して0.90のリコール率を記録した。
YOLOv11nは2.4msで最高速度を達成し、YOLOv8n (4.1ms)、YOLOv9 Gelan-s (11.5ms)、YOLOv10n (5.5ms)、YOLOv12nを上回った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:00:05 GMT)
Target Defense with Multiple Defenders and an Agile Attacker via Residual Policy Learning [0.9] この手紙は、攻撃者がディフェンダーよりもアジャイルである、特に困難なシナリオに焦点を当てている。
深層強化学習と力に基づくボイドモデルを統合した新しい残留政策枠組みを提案する。
この枠組みでは、ボイドモデルは基本方針として機能し、DRLは防御者の行動を洗練し最適化するための残留ポリシーを学習する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:05:33 GMT)
Trotter error and gate complexity of the SYK and sparse SYK models [0.8] We study the Trotter error and gate complexity of the quantum Simulation of the SYK model using Lie-Trotter-Suzuki formulas。
Lie-Trotter-Suzuki式を用いて,これらのモデルをシミュレーションするための近似ゲート複素量を求める。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:16:56 GMT)
Indefinite Time Directed Quantum Metrology [0.8] 我々のプロトコルは,標準量子限界(1/sqrtN)を超越して,製品プローブ状態のハイゼンベルクスケーリング(1/N)を実現することができることを示す。
ITDMにおける対称積プローブ状態の最適性は解析的に証明するが、絡み合ったプローブ状態は、スケーリングを向上することなく、最適な積プローブよりも高いQFIを生成する。
本研究は, 製品プローブ状態の最適配向を明らかにするとともに, パラメータからの独立性を強調し, 限界条件で推定されるパラメータの独立性を強調した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:51:08 GMT)
IID-Based QPP-RNG: A Random Number Generator Utilizing Random Permutation Sorting Driven by System Jitter [0.8] IIDベースのQPP-RNGは、一様、独立的、同一に分散された(IID)ランダム性を実現する、画期的な乱数生成器である。
IIDベースのQPP-RNGはシステムジッタのみを使用して短命のQPPパッドを生成し、置換数から最終的な8ビット出力を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:53:54 GMT)
Quantum Eigensolver with Exponentially Improved Dependence on Parameters [0.8] 固有値推定は数値解析と科学計算の基本的な問題である。
本研究では,行列の量子変換に基づく効率的な量子固有値を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:43:47 GMT)
Teleportation scheme for the complete state of light at the example of coherent states [0.8] 光の空間的自由度と光数自由度の両方をテレポートする手法を提案する。
これは、対象画像の各画素をテレポーテーションすることで達成される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:44:08 GMT)
TinySubNets: An efficient and low capacity continual learning strategy [0.8] 連続学習(CL)は、最近の機械学習研究で注目を集めている非常に関連性の高い環境である。
TinySubNets (TSN) は、異なる空間レベルのプルーニング、適応量子化、およびウェイトシェアリングのユニークな組み合わせによってこの問題に対処する新しいアーキテクチャCL戦略である。
提案手法は,既存の最先端CL戦略よりも精度の高い結果が得られる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:10:06 GMT)
Was Tournament Selection All We Ever Needed? A Critical Reflection on Lexicase Selection [0.8] 異なるダウンサンプリング手法を用いて,エプシロン・レキシケースとトーナメントの選択を比較した実験を行った。
ダウンサンプリングは、同じ世代の世代と比較しても、一般化と性能を向上させる。
ダウンサンプリングと組み合わせることで,トーナメント選択における人口多様性の増大が観察された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:01:11 GMT)
Non-maximizing policies that fulfill multi-criterion aspirations in expectation [0.8] 動的プログラミングおよび強化学習において、エージェントの逐次決定のためのポリシーは通常、目標をスカラー報酬関数として表現することによって決定される。
複数の異なる評価指標を持つ有限非巡回決定マルコフプロセスを考えるが、これは必ずしもユーザが最大化したい量を表すものではない。
提案アルゴリズムは,本課題を簡易性を用いて実現可能集合を近似し,その実現可能性を維持しつつ,前もって願望を伝達することによって達成することを保証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:03:54 GMT)
Looking forward: Linguistic theory and methods [0.8] 現代言語学を形作る主なテーマは、記号表現、人工ニューラルネットワークの影響、言語理論における客観性の重要性に関する仮説の明示的な検証である。
言語学とコンピュータ科学、心理学、神経科学、生物学を結びつけることで、言語研究の変化する風景を前方から見た視点を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:03:15 GMT)
Demolition measurement protocol for transmon qubits [0.8] 本稿では、キュービットの読み出しをリセットプロセスと統合し、キュービットのアイドル時間を最小化するトランスモンキュービットの復調測定のためのプロトコルを提案する。
本稿では,このプロトコルの3段階実装について述べる。
我々は,このプロトコルを,ハードウェアのオーバーヘッドを伴わずに,$95 %以上のリセット忠実度と$99 %のリードアウト忠実度で実装できることを実証した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:17:37 GMT)
Performance of Practical Quantum Oblivious Key Distribution [0.8] 本稿では,ランダム化量子オブリバスト転送の実用的な実現法を提案する。
このプロトコルは、識別不能なセキュリティの概念の下で安全であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:55:42 GMT)
Techniques for Enhancing Memory Capacity of Reservoir Computing [0.7] Reservoir Computing(RC)は、バイオインスパイアされた機械学習フレームワークである。
RCにおけるメモリ容量と非線形性の間にはトレードオフがある。
本研究では,貯水池モデルのメモリ容量を改善する手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:38:58 GMT)
Shedding Light on the Polymer's Identity: Microplastic Detection and Identification Through Nile Red Staining and Multispectral Imaging (FIMAP) [0.7] 蛍光イメージングは、プラスチック粒子の検出可能性を高めるための有望な技術として登場した。
本研究では,4つの光フィルタと5つの励起波長を持つ反射型マルチスペクトルカメラであるFIMAPを紹介した。
FIMAPは90%の精度、90%の精度、100%のリコール、そしてF1スコア94.7%を達成している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:03:55 GMT)
On the Addressability Problem on CSS Codes [0.6] 非ゼロレートのCSS符号は論理的H, HP, PH, CNOTを論理的量子ビットの任意の空でない厳密な部分集合に対応できないことを示す。
CNOTとCZの2つの高速コード間で同様のノーゴー結果を示すことができる。
この研究は、主に符号の自己同型を考えることによって、量子符号における距離保存アドレス可能性の研究の先駆者となった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:56:22 GMT)
Mapping of Subjective Accounts into Interpreted Clusters (MOSAIC): Topic Modelling and LLM applied to Stroboscopic Phenomenology [0.6] 閉じた目のストロボスコープ光刺激(SLS)は、通常単純な視覚幻覚(VHs)を引き起こす
422件の公開主観的報告から抽出された852文のデータセットが,近年,ドリーマカインプログラムの一部として編纂された(収集法,2022)。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:11:40 GMT)
A digital eye-fixation biomarker using a deep anomaly scheme to classify Parkisonian patterns [0.6] Oculomotor alterationsは、パーキンソン病(PD)の検出と特徴付けのための有望なバイオマーカーである
近年の機械学習とビデオ解析の進歩は、眼球運動パターンの新たな特徴付けを促している。
本研究は、パーキンソン眼球固定パターンを異常検出フレームワークで定量化する新しいビデオ解析手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:34:08 GMT)
TSKANMixer: Kolmogorov-Arnold Networks with MLP-Mixer Model for Time Series Forecasting [0.6] 時系列予測は長い間、経済、エネルギー、医療、交通管理など様々な分野の研究の中心であった。
最近の研究は時系列ミキサー(TSMixer)のような時系列モデルのための革新的なアーキテクチャを導入している。
我々は,Kolmogorov-Arnold Networks (KANs) の時系列予測機能について,kan layer (TSKANMixer) によるTSMixerの変更による検討を行った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:04:45 GMT)
Tighten The Lasso: A Convex Hull Volume-based Anomaly Detection Method [0.6] 本稿では,データセットの凸殻特性に基づく新しい異常検出アルゴリズムを提案する。
我々のアルゴリズムは、データセットからより多くのデータポイントが削除されるにつれてCHの体積を計算する。
計算的に安価で簡単なチェックにより、提案アルゴリズムに適したデータセットを検出できることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:39:20 GMT)
Evaluating the Effectiveness of Small Language Models in Detecting Refactoring Bugs [0.6] 本研究では,Java と Python の2種類のバグ検出における小言語モデル (SLM) の有効性を評価する。
この研究は16種類のタイプをカバーし、コンシューマグレードのハードウェアにゼロショットプロンプトを用いて、事前トレーニングを明示することなくモデルの正確性を推論する能力を評価する。
プロプライエタリなo3-mini-highモデルは、タイプIの84.3%のバグを識別し、最も高い検出率を達成した。
オープンソースのPhi-4 14Bは互換性に優れており、両方のバグタイプで強力な有効性を示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:52:28 GMT)
EEGM2: An Efficient Mamba-2-Based Self-Supervised Framework for Long-Sequence EEG Modeling [0.6] EEGM2は構造化状態空間双対性(SSD)に基づく自己教師型フレームワーク
我々は,脳波の局所的特徴とグローバルな特徴の両方を捉えるリコンストラクションベースのフレームワークを提案する。
また、雑音に対する安定性を高め、スペクトル情報を保存するロバストネス認識損失関数を導入する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:57:56 GMT)
GaussianFlowOcc: Sparse and Weakly Supervised Occupancy Estimation using Gaussian Splatting and Temporal Flow [0.6] 職業推定は3次元コンピュータビジョンにおいて顕著な課題となっている。
本稿では,GaussianFlowOccと呼ばれる,新規な占有率推定手法を提案する。
ガウススプラッティングにインスパイアされ、伝統的な密度の強いボクセル格子をスパース3Dガウス表現に置き換える。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:07:22 GMT)
Improving success probability in the LHZ parity embedding by computing with quantum walks [0.6] 連続時間量子ウォークは、量子最適化問題を解決するための主要なアプローチである。
4, 5 および 6 個の論理量子ビット Sherrington-Kirkpatrick (SK) 上の量子ウォークを数値シミュレーションする。
我々は、量子ウォークの成功確率を向上させることのできる、読み出し後の誤り訂正手法を同定した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:19:29 GMT)
NPSim: Nighttime Photorealistic Simulation From Daytime Images With Monocular Inverse Rendering and Ray Tracing [0.5] 強力な自律運転システムは、夜間を含むすべての条件下で画像を処理できなければならない。
実写夜間画像のシミュレーションを可能にするNPSimという新しい手法を提案する。
NPSimはメッシュ再構築とリライトという2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:03:48 GMT)
The Role of the Retrospective Meetings in Detecting, Refactoring and Monitoring Community Smells [0.5] この研究は、文献の中で最も引用された4つのコミュニティ・スメル(Lone Wolf、Organizational Silo、Radio Silence、Black Cloud)に焦点を当てた。
この結果から,ふりかえりのミーティングによって,中核的なコミュニティ・スメルの識別が可能になることが示唆された。
これらのミーティングで肯定的な側面を強調することは、コミュニティ・スメルを防ぐのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:50:13 GMT)
WinTSR: A Windowed Temporal Saliency Rescaling Method for Interpreting Time Series Deep Learning Models [0.5] 我々は、新しい解釈方法、textitWindowed Temporal Saliency Rescaling(WinTSR)を導入する。
我々は、異なるアーキテクチャの5つの最先端ディープラーニングモデルを用いて、WinTSRを10の最近の解釈手法と比較した。
総括分析の結果,WinTSRは他の局所解釈手法よりも性能が優れていた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:41:01 GMT)
Efficient Safety Retrofitting Against Jailbreaking for LLMs [0.5] 直接選好最適化 (DPO) は, 選好データに基づく学習により, LLM を好ましい出力に向けて操る, 効率的なアライメント手法である。
本稿では,データ要求とトレーニングコストを最小限に抑えつつ,DPOの脱獄攻撃に対するモデル安全性の有効性について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 12:06:25 GMT)
Neural Network Graph Similarity Computation Based on Graph Fusion [0.5] 本稿では,グラフ融合と呼ばれる並列グラフ相互作用手法を導入することで,そのアプローチに革命をもたらす。
グラフペア間の類似度をグラフレベルとノードレベルに分けて評価する。
本モデルは,グラフとグラフの分類および回帰作業において,主要なベースラインモデルよりも優れる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:28:41 GMT)
Feynman path integrals for discrete-variable systems: Walks on Hamiltonian graphs [0.5] 離散変数量子系において、ファインマン経路積分は重み付き隣接行列がハミルトニアンであるグラフ上のウォークの形式をとる。
ファインマンの連続変数パス積分を明示的に回収する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:29:50 GMT)
Differentially private synthesis of Spatial Point Processes [0.4] 差分プライベートポイントシンセサイザー(PPS)とコックスポイントシンセサイザー(CPS)を定義し、合成ポイントパターンを生成する。
提案手法は,合成データのプライバシーと利便性を効果的に維持するものである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:40:07 GMT)
Can Large Language Models Extract Customer Needs as well as Professional Analysts? [0.4] 顧客ニーズ(CN)の特定は、製品管理、製品開発、マーケティングにおいて重要である。
現在の実践はキーワード検索と機械学習によるプロセスを容易にするが、CNを定式化するには人間の判断に依存する。
大規模言語モデル(LLM)が自動的にCNを抽出できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:55:35 GMT)
Remove Symmetries to Control Model Expressivity [0.3] まず, 対称性が能力低下につながり, 訓練や推論中に特徴を無視する2つのメカニズムを実証する。
次に、ニューラルネットワークにおける対称性誘起低容量状態のほとんどをすべて除去する、単純で理論的に正当化されたアルゴリズムであるサイアを提案する。
提案手法の顕著な利点は、モデルに依存しず、対称性の知識を必要としないことである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:27:31 GMT)
MR-STGN: Multi-Residual Spatio Temporal Graph Network Using Attention Fusion for Patient Action Assessment [0.3] MR-STGN(Multi-Residual Spatio Temporal Graph Network)を用いた患者行動評価の自動化手法を提案する。
MR-STGNは患者行動のダイナミクスを捉えるように設計されている。
リアルタイムの患者行動スコアを正確に予測する上で,UI-PRMDデータセットの性能を示すモデルについて検討した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:16:39 GMT)
D-STGCNT: A Dense Spatio-Temporal Graph Conv-GRU Network based on transformer for assessment of patient physical rehabilitation [0.3] 本稿では,リハビリテーション演習を評価するための新しいグラフベースモデルを提案する。
デンス接続とGRU機構は、大きな3Dスケルトン入力を迅速に処理するために使用される。
KIMOREおよびUI-PRMDデータセットに対する提案手法の評価は,その可能性を強調した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:32:19 GMT)
GNN-XAR: A Graph Neural Network for Explainable Activity Recognition in Smart Homes [0.3] 本稿では,スマートホームHAR用に設計された最初の説明可能なグラフニューラルネットワークを提案する。
2つの公開データセットで得られた結果は、このアプローチが最先端の手法よりも優れた説明を提供することを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:05:13 GMT)
Problem Solved? Information Extraction Design Space for Layout-Rich Documents using LLMs [0.3] 本稿では,大規模言語モデル(LLM)を用いたレイアウトリッチドキュメントからの情報抽出のための設計空間を定義し,検討する。
我々の研究は、入力表現、チャンキング、プロンプト、LLMとマルチモーダルモデルの選択など、これらのコア課題のサブプロブレムを掘り下げている。
レイアウトを意識した新しいIEテストスイートを通じて、さまざまな設計選択の結果を調べ、最先端(SoA)モデルであるLayoutLMv3に対してベンチマークする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:11:53 GMT)
Remote Entangling Gates for Spin Qubits in Quantum Dots using a Charge-Sensitive Superconducting Coupler [0.3] 電荷感応性超伝導カプラを用いた量子ドットにおける2つのスピン量子ビット間のマイクロ波活性化CZゲートを実現する手法を提案する。
我々は1/fbeta$の電荷雑音の存在下でゲート性能を正確にモデル化する非マルコフ時間領域シミュレーションを開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:27:45 GMT)
ChatMotion: A Multimodal Multi-Agent for Human Motion Analysis [0.2] ChatMotionは、人間の動作分析のためのマルチモーダルなマルチエージェントフレームワークである。
ユーザ意図を解釈し、複雑なタスクをメタタスクに分解し、モーション理解のための特別な関数モジュールを起動する。
さまざまな視点から人間の動きを分析するために、MotionCoreのような複数の特殊なモジュールを統合している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:12:55 GMT)
Exploring Quantization and Mapping Synergy in Hardware-Aware Deep Neural Network Accelerators [0.2] CNN推論アクセラレータに実装された畳み込みニューラルネットワーク(CNN)のエネルギー効率とメモリフットプリントは多くの要因に依存する。
実装中にリッチな混合量子化スキームを有効にすることで、以前に隠れていたマッピングの空間を開放できることが示される。
量子化重みとアクティベーションと適切なマッピングを利用するCNNは、精度、エネルギ、メモリ要求間のトレードオフを大幅に改善することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:11:04 GMT)
MAGE: Multi-Head Attention Guided Embeddings for Low Resource Sentiment Classification [0.2] 本稿では,Language-Independent Data Augmentation (LiDA) とマルチヘッドアテンションに基づく重み付き埋め込みを組み合わせた高度なモデルを提案する。
このアプローチは、データ不足の問題に対処するだけでなく、低リソース言語処理と分類タスクにおける将来の研究の基盤となる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:53:27 GMT)
AfroXLMR-Comet: Multilingual Knowledge Distillation with Attention Matching for Low-Resource languages [0.2] 本稿では,従来の知識蒸留と簡易な注意マッチング機構を組み合わせた新しいハイブリッド蒸留手法を提案する。
我々は、キニルワンダ、スワヒリ、ハウサ、イグボ、ヨルバの5つのアフリカの言語に対する我々のアプローチを評価した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:28:47 GMT)
Contextual effects of sentiment deployment in human and machine translation [0.2] 本稿では、テキストの全体感情が翻訳にどのようにシフトするか、および自動感情分析にどう影響するかを説明する。
人間と機械の翻訳は、対象言語の感情の周波数に合致するより多くの補題を生成するが、機械翻訳だけがテキストの全体的な意味領域を減少させる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:03:35 GMT)
SONICS: Synthetic Or Not -- Identifying Counterfeit Songs [0.2] 我々は、エンドツーエンド合成歌検出(SSD)のための新しいデータセットSONICSを紹介する。
歌唱における時間的長期依存性をモデル化することの重要性を強調した。
長い曲では、私たちのトップパフォーマンスの変種は、F1スコアでVTを8%上回り、より38%速く、メモリは26%減っています。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:22:49 GMT)
Convolutional neural networks for mineral prospecting through alteration mapping with remote sensing data [0.2] 畳み込みニューラルネットワーク(CNN)のようなディープラーニングモデルは、リモートセンシングデータ分析に革命をもたらした。
CNNは、リモートセンシングデータの微妙な特徴を特定することで、鉱物化に関連する特定の鉱物学的変化を検出することができる。
本研究は,オーストラリア・ニューサウスウェールズ州ブローケンヒル北部の変質帯にランドサット8,ランドサット9,ASTERデータを用いたCNNを用いた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:45:25 GMT)
Generalization is not a universal guarantee: Estimating similarity to training data with an ensemble out-of-distribution metric [0.1] 機械学習モデルの新しいデータへの一般化の失敗は、AIシステムの信頼性を制限する中核的な問題である。
本稿では、一般化可能性推定(SAGE)のための教師付きオートエンコーダを構築することにより、データの類似性を評価するための標準化されたアプローチを提案する。
モデル自体のトレーニングやテストデータセットのデータに適用しても,SAGEスコアのフィルタリング後にアウト・オブ・ボックスモデルの性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:18:41 GMT)
Improving Surrogate Model Robustness to Perturbations for Dynamical Systems Through Machine Learning and Data Assimilation [0.1] 本稿では,機械学習とデータ同化技術を組み合わせてサロゲートモデルを改善する新しいフレームワークを提案する。
本研究では,入力摂動下でのサロゲートモデルの精度を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:27:20 GMT)
{ComplexityMeasures.jl}: scalable software to unify and accelerate entropy and complexity timeseries analysis [0.0] ComplexityMeasures.jlは簡単に拡張可能で高性能なオープンソースソフトウェアであり、様々な複雑さ対策を実装している。
このソフトウェアは1638の測度と3,841行のソースコードを提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:44:28 GMT)
Z-basis measurements using mixed parity and direct readout [0.0] スピン量子ビットアーキテクチャにおける一般的な実装は、二重量子ドットに閉じ込められた電荷のパウリ排他に基づく読み出しスキームであり、一方のドットはアンシラ量子ビットとして機能する。
ここでは,3量子スピンレジスタとパウリ排他型リードアウトを用いて,トモグラフィで構築したレジスタ全体のz基底測定を行い,物理的オーバーヘッドを排除した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:29:12 GMT)
YOLO Evolution: A Comprehensive Benchmark and Architectural Review of YOLOv12, YOLO11, and Their Previous Versions [0.0] 本研究は, YOLOv3から最新のYOLOv12への包括的実験評価である。
考慮すべき課題は、さまざまなオブジェクトサイズ、多様なアスペクト比、単一クラスの小さなオブジェクトである。
分析では各YOLOバージョンの特徴的長所と短所を強調した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:00:29 GMT)
XTS mode revisited: high hopes for key scopes? [0.0] 本稿では,ストレージセクターベースの暗号化アプリケーションにおいて,XTSブロック暗号化モードを簡潔に要約する。
我々は新たに提案されたIEEE 1619標準のキースコープ変更に関する議論の統一的な基盤を提供することを目標としている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:39:59 GMT)
XGBoost-Based Prediction of ICU Mortality in Sepsis-Associated Acute Kidney Injury Patients Using MIMIC-IV Database with Validation from eICU Database [0.0] Sepsis-Associated acute Kidney Injury (SA-AKI) は集中治療において高い死亡率をもたらす。
本研究では,SA-AKI患者のICU死亡率を予測する機械学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:49:22 GMT)
Tuning of Josephson junctions -- the effects of depinning physics [0.0] より強力な量子コンピュータを構築するには、厳格な耐性を持つ製造プロセスが必要である。
ジョセフソン接合の耐久性を改善するため、製造後の特性を微調整する技術が開発されている。
我々は,調律率の位相図を解釈するために,復調理論に基づく接合調律モデルを開発する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:44:29 GMT)
Transformation-free generation of a quasi-diabatic representation from the state-average orbital-optimized variational quantum eigensolver [0.0] 状態平均軌道最適化変分量子固有解法(SA-OO-VQE)として知られる最近の量子計算アルゴリズムについて検討する。
ダイアバティティティーの内在的および残留的記述子を導入し、定義と線形代数特性を再検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:33:27 GMT)
Transfer Learning for Transient Classification: From Simulations to Real Data and ZTF to LSST [0.0] 現在の機械学習アプローチは、実際のデータと競合する。
新しい調査では、大量のラベル付きトレーニングデータが必要である。
トランスファーラーニングがこれらの課題を克服できることを示します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:00:00 GMT)
Toward 6-DOF Autonomous Underwater Vehicle Energy-Aware Position Control based on Deep Reinforcement Learning: Preliminary Results [0.0] 本稿では,Trncated Quantile Critics (TQC)アルゴリズムを用いてホロノミック6-DOF AUVを制御するためのDRLベースの新しいアプローチを提案する。
手動のチューニングを必要とせず、スラスタにコマンドを直接送る。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:37:57 GMT)
To Deepfake or Not to Deepfake: Higher Education Stakeholders' Perceptions and Intentions towards Synthetic Media [0.0] ディープフェイク技術は、生成的人工知能を使用して人の類似性や声を模倣する。
本研究では,高等教育におけるディープフェイクに対する利害関係者の認識と意図について検討した。
学術的ステークホルダーは、これらの技術を採用する意図が比較的低いことを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:32:19 GMT)
The Impact of Generative Artificial Intelligence on Ideation and the performance of Innovation Teams (Preprint) [0.0] この研究は、知識の流出、生成、応用に対するAIの効果を理解するために、知識スパイルオーバー理論を応用している。
発見によると、AIによって強化されたチームは、より少ない時間で高品質なアイデアを生み出した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:11:44 GMT)
The FFT Strikes Back: An Efficient Alternative to Self-Attention [0.0] 我々は、$mathcalO(nlog n)$時間でグローバルトークンの混合を実現するための適応スペクトルフィルタリングフレームワークであるFFTNetを紹介する。
学習可能なスペクトルフィルタとmodReLUアクティベーションは、従来の自己アテンションに対する厳密で適応的な代替手段を提供するために、サルエント周波数成分を動的に強調する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:43:43 GMT)
The AI Definition and a Program Which Satisfies this Definition [0.0] 我々はエージェントのすべてのポリシーを検討し、それらのうちの1つが最高の実行ポリシーであることを証明します。
そのポリシーは計算可能であるわけではないが、計算可能なポリシーはその近傍に存在する。
私たちは、AIを、最高のパフォーマンスポリシーに十分な計算可能なポリシーとして定義します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:42:49 GMT)
The AI Assessment Scale (AIAS) in action: A pilot implementation of GenAI supported assessment- A Preprint [0.0] 高等教育におけるジェネレーティブ・人工知能(GenAI)技術の急速な採用は、学術的完全性、評価の実践、学生の学習に関する懸念を引き起こしている。
本稿では,イギリス大学ベトナム校(BUV)でAIAS(Artificial Intelligence Assessment Scale)の実施を探求するパイロット研究の成果を報告する。
AIASは「No AI」から「Full AI」までの5つのレベルから構成されており、教育者は人間の入力と批判的思考を必要とする領域に焦点を当てたアセスメントを設計できる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:47:46 GMT)
Synthetic Categorical Restructuring large Or How AIs Gradually Extract Efficient Regularities from Their Experience of the World [0.0] 人工知能の神経心理学における本研究は、合成カテゴリー再構成の現象を研究する。
我々の遺伝ニューロンビューアは、GPT2-XLのパーセプトロン層0から1への移行中に発生する合成カテゴリー再構成現象を可視化することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:49:19 GMT)
Strong Coupling of Nanomechanical Vibrations to Individual Two-Level Systems [0.0] 2レベルシステム(TLS)として機能する原子スケール欠陥は、現代の量子デバイスの物理学に不可欠である。
ナノエレクトロメカニカルシステム(NEMS)共振器の個々のTLS欠陥と機械振動の相互作用について検討した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:11:17 GMT)
Sparks of cognitive flexibility: self-guided context inference for flexible stimulus-response mapping by attentional routing [0.0] 我々は,Hummosの高速・スロー学習を画像計算可能なタスクに拡張するウィスコンシンニューラルネットワーク(WiNN)を提案する。
WiNNは、事前にトレーニングされた畳み込みニューラルネットワークを視覚に使用し、関連する機能に注意を向ける調整可能な"コンテキスト状態"と組み合わせている。
ウィスコンシン・カード・ソーティング・タスクのイメージベース拡張によるWiNNの評価を行った。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:29:58 GMT)
Software implemented fault diagnosis of natural gas pumping unit based on feedforward neural network [0.0] ANNの入力データとしてGPUの音響および振動過程の値を用いることを提案する。
ANNの入力に到達した診断記号の生成パケットを実行する。
開発済みのANNを使用することで、GPUの技術的状態を実用に十分な精度で分類することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:17:55 GMT)
Smart and Efficient IoT-Based Irrigation System Design: Utilizing a Hybrid Agent-Based and System Dynamics Approach [0.0] 乾燥した国や半乾燥国では水資源が不足している。
近代技術を利用して灌水を制御し、水の損失を減らすことが可能である。
灌水制御システムにIoTを使用する可能性にもかかわらず、そのようなシステムの設計には複雑さがある。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:34:38 GMT)
Scrutinizing the Mori memory function for diffusion in periodic quantum systems [0.0] 現在の自己相関関数の下の領域が時間内に収束する限り、対応する密度力学は拡散的であると広く信じられている。
これは線形反応理論とアインシュタインの関係の組合せの結果と見なすことができる。
我々は、対応する電流自己相関関数の下の領域が収束するような密度波の相関関数を構成することで反例を示すが、力学は拡散方程式に従わない。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:02:16 GMT)
Scaling LLM Pre-training with Vocabulary Curriculum [0.0] 本稿では,語彙サイズに対して,対数線形スケーリングゲインによる事前学習効率を向上させる手法である語彙カリキュラム学習を導入する。
提案手法は,エントロピー誘導語彙拡張とモデル最適化を交互に行い,多様なトークン化粒度にまたがる変換可能な表現を学習する。
小規模GPTモデルによる実験により,スケーリング効率が向上し,動的トークン化の有効性が向上した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:18:29 GMT)
Scale invariance and Diophantine approximation in the Bloch vector of the thermal multiphoton Jaynes-Cummings model [0.0] 熱多光子Jaynes-Cummingsモデルに対するBlochベクトルの軌道を一定時間間隔の離散時間列としてプロットする。
ブロッホベクトルの$z$成分の絶対値が 0 に近い時刻を数値的に評価する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:31:17 GMT)
SECURA: Sigmoid-Enhanced CUR Decomposition with Uninterrupted Retention and Low-Rank Adaptation in Large Language Models [0.0] SECURAは、パラメータ効率の良い微調整(PEFT)変異体であり、微調整性能を改善しながら破滅的な忘れを軽減している。
その結果,SECURAは4つの質問質問(MCQ)タスクで3.59%,5つの質問回答(QA)タスクで2.51%の改善を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:00:05 GMT)
Routing Dynamics in Distributed Quantum Networks [0.0] 分散フレームワークにおける量子接続のメカニズムについて検討する。
重ね合わせと絡み合いは、量子デコヒーレンスや測定の不確実性と競合しなければならないルーティング戦略と相互作用する。
その結果, 絡み合った状態に固有の量子コヒーレンスにより, 特定の条件下でのルーティング忠実度が向上することが判明した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:28:56 GMT)
Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階における最適な治療課題を決定する最適動的治療体制(DTR)の統計的学習について,その進化史に基づいて検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:52:07 GMT)
Relational objectivity in presence of finite quantum resources [0.0] 教科書量子力学」は、実験的な文脈に関する量子システムの記述を提供する。
しかし、スピンのような単純な量子系であっても、無限の資源を暗黙的に仮定する。
我々はペンローズのスピンネットワークの提案を、教科書の枠組みを超えた量子論の形式化の可能性として論じている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:46:48 GMT)
Recurrent Neural Networks for Dynamic VWAP Execution: Adaptive Trading Strategies with Temporal Kolmogorov-Arnold Networks [0.0] 現代の金融市場では、VWAP(Volume Weighted Average Price)命令の実行が重要な課題である。
本稿では,進化する市場環境にリアルタイムで適応する動的ニューラルネットワークVWAPフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:11:24 GMT)
Randomized benchmarking with non-Markovian noise and realistic finite-time gates [0.0] 単量子ランダム化ベンチマーク実験における非マルコフ古典雑音の影響を解析する。
本フレームワークは,各ゲート列のランダムな性質を利用して,完全生存確率減衰曲線の式を導出する。
これらの効果がランダム化ベンチマーキング実験の解釈をいかに複雑にするかを論じるとともに、非マルコビアン性の調査にどのように活用するかについても論じる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:27:38 GMT)
Random Number Generation from Pulsars [0.0] パルス信号のタイミングの微妙な変化が乱数発生器(RNG)の自然なエントロピー源であることを示す。
我々は、Pulsar RNGの品質を評価するために、そのエントロピーを$k$ソースとしてモデル化し、その近さを理論上理想的なランダムな情報源に示すためによく知られた暗号結果を使用する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:24:47 GMT)
RE-completeness of entangled constraint satisfaction problems [0.0] シェーファーの二分法定理は、CSP言語が効率的に決定可能であるかNP完全であることを示す。
CSP言語を非局所ゲームの公式性を用いて量子代入に拡張することは可能である。
簡潔に提示されていない場合でもCSP言語は決定不能であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:23:09 GMT)
Quantum-Electrodynamical Density-Functional Theory Exemplified by the Quantum Rabi Model [0.0] 量子電磁力学の最小主義的な実装における密度汎関数理論(DFT)の鍵となる特徴を実証する。
我々は密度変数においてほとんど明示的な断熱接続の形式を導出する。
これにより、DFTのいくつかの重要な特徴を近似なしで研究することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:25:39 GMT)
Quantum negative sampling strategy for knowledge graph embedding with variational circuit [0.0] 知識グラフ埋め込みのためのハイブリッド量子古典モデルは、変分量子回路を訓練する研究がなされている。
本稿では,量子重ね合わせを利用した負のサンプリング戦略について検討し,知識グラフデータベースを用いてモデルの性能評価を行う。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:46:27 GMT)
Quantum geometry of bosonic Bogoliubov quasiparticles [0.0] ハミルトン派は、弱相互作用するボース凝縮体の励起とパラメトリック駆動下のフォトニック系を記述している。
本稿では,シンプレクティックな量子幾何テンソル(SQGT)を提案する。
システムパラメータの周期的変調に応答して励起率を抽出することにより,SQGTのすべての成分を測定する方法を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:28:14 GMT)
Quantum entanglement of fermionic gapless symmetry protected topological phases in one dimension [0.0] 2つの遷移線が、同じ中心電荷を共有するにもかかわらず、根本的に異なる位相特性を示すことを示す。
また、3つの遷移線の交点における新しいリーフシッツ多臨界点も同定する。
この研究は、量子エンタングルメントの観点から、物質の隙間のない位相を調査するための貴重な参照を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:11:34 GMT)
Quantum decoherence of gravitational waves [0.0] 重力の量子的性質は、実験的な検証を欠いた基礎物理学において未解決の問題のままである。
古典的なGWとグラビトンを区別するには、量子コヒーレンスを保存する必要がある。
還元密度行列を導出し、デコヒーレンスを評価することにより、GWが量子状態を維持するかどうかを検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:00:01 GMT)
Quantum decision trees with information entropy [0.0] 本稿では,決定木法に着想を得た量子状態の分類アルゴリズムを提案する。
未知の量子状態で撮影された各測定値に対して、アルゴリズムは最も期待される情報ゲインで観測可能なものを選択し、収束するまで続く。
回路ベースの量子ニューラルネットワークには依存していないが、このアルゴリズムはいまだに不毛の高原問題に似た課題に直面している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:18:22 GMT)
Quantum data-hiding scheme using orthogonal separable states [0.0] 両部量子状態の識別と分離可能な状態アンサンブルを用いた量子データハイディング方式を提案する。
提案手法では,低次元量子系の分離可能な状態を用いるため,実用的な実装が可能となる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:33:41 GMT)
Quantum Wishlist: Lessons from Parton Showers [0.0] 我々は、高エネルギー物理学における問題に量子アルゴリズム/コンピュータを適用する際の一般的な基準について議論する。
古典的および量子的パートンシャワーモンテカルロアルゴリズムの背景にある基本的なアイデアを要約する。
量子パルトンシャワーの発見は、高エネルギー物理学における量子アルゴリズムやコンピュータのさらなる探索に役立つだろう。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:26:27 GMT)
Quantum Transport in Reduced Graphene Oxide Measured by Scanning Probe Microscopy [0.0] 還元グラフェン酸化物(rGO)素子の局所電子輸送特性について,走査型プローブ顕微鏡と輸送測定を組み合わせて検討した。
これらの材料中の量子輸送特性は、原子間力顕微鏡(AFM)導電性先端に印加された静電電位によって著しく調整できることを実証した。
本研究は,rGOの低次元輸送挙動決定における散乱機構,特に不純物や構造欠陥による共鳴散乱の重要な役割を強調した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:27:15 GMT)
Quantum Circuits, Feature Maps, and Expanded Pseudo-Entropy: A Categorical Theoretic Analysis of Encoding Real-World Data into a Quantum Computer [0.0] 本研究の目的は,実世界のデータを量子回路にマッピングするための符号化方式の有効性を決定することである。
この方法は、各データポイントのシャノンエントロピーを点雲から計算し、したがって埋め込み多様体からサンプルを抽出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:21:08 GMT)
Programmable interferometer: an application in quantum channels [0.0] 光学では、離散変数を含む光の自由度を正確に制御することが基本である。
我々のモデルは、光子の空間的自由度を通じて量子情報を符号化し、処理するためにフォトニックシステムを操作する。
本稿では、位相減衰、振幅減衰、ビットフリップを含む量子チャネルをシミュレートするプログラマブルフォトニック回路を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:10:00 GMT)
Probing quantum entanglement using Higgs to ZZ* to 4 leptons at ATLAS [0.0] 我々は,ATLAS実験におけるヒッグスとZZ* (HZZ*) 相互作用の量子絡み合いの存在について検討した。
我々の研究は、HZZ*相互作用における絡み合いの性質に光を当て、量子特性に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:53:20 GMT)
Predicting Bad Goods Risk Scores with ARIMA Time Series: A Novel Risk Assessment Approach [0.0] 本研究は,時系列予測後の粗悪品の計算を目的とした独自式と時系列ARIMAモデルを統合した新しいフレームワークを提案する。
有機ビールG1リッターの2022-2024のデータセット上で実験結果が検証され、提案手法が従来の統計モデルより優れていることが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:40:32 GMT)
Precision in estimating independent local fields: attainable bound and indispensability of genuine multiparty entanglement [0.0] 局所ハミルトニアンの独立な多重体強度の推定には、入力プローブとして真の多部交絡状態の有効性が必要であることを示す。
任意の重み行列と任意の多面的局所符号化に対して、任意の混合状態にあるプローブを用いることで、純状態を用いて得られるものよりも精度が低いことが証明される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:29:14 GMT)
Physics- and data-driven Active Learning of neural network representations for free energy functions of materials from statistical mechanics [0.0] 我々は、我々の自由エネルギーモデルに原子情報を統合するために、スケールブリッジングアプローチを採用している。
本研究では,空間充填サンプリング,不確実性に基づくサンプリング,物理インフォームドサンプリングを統合したアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:02:37 GMT)
Phonon thermal Hall as a lattice Aharonov-Bohm effect [0.0] ここでは、結晶中のこの相の生存は、横フォノンの複雑な振幅を意味すると論じる。
これは、黒リン、ゲルマニウム、シリコンで実験的に発見されたものに近い。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:19:29 GMT)
Phoeni6: a Systematic Approach for Evaluating the Energy Consumption of Neural Networks [0.0] Phoeni6は、エネルギー関連のデータと構成を管理するための包括的なソリューションを提供する。
MobileNetは、原画像のエネルギー効率が最大6.25%向上し、再サイズデータセットの2.32%が競争精度を維持している。
BMP画像はPNGと比較してエネルギー使用量を最大30%削減し、ファイルフォーマットがエネルギー効率に与える影響を強調した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:02:25 GMT)
Patient Trajectory Prediction: Integrating Clinical Notes with Transformers [0.0] 本稿では,非構造的臨床ノートをトランスフォーマーベース深層学習モデルに統合し,シーケンシャルな疾患予測を行うアプローチを提案する。
MIMIC-IVデータセットの実験は、提案手法が構造化データのみに依存する従来のモデルよりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:14:07 GMT)
Opus: A Workflow Intention Framework for Complex Workflow Generation [0.0] 本稿では,複雑なビジネス環境におけるプロセスの目的を識別し,エンコードするための新しいフレームワークであるIntentionを紹介する。
意図は、ビジネスアーティファクト内のシグナルから解釈された変換目標を定義する入力、プロセス、出力要素のアライメントである。
本稿では,業務成果物からの意図を解消するモジュール型,スケーラブルなマルチモーダル生成システムを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:16:46 GMT)
Optimization via Quantum Preconditioning [0.0] 量子近似最適化に基づく量子プレコンディショニング手法を提案する。
入力問題は、量子回路の深さによって決定されるプリコンディショニングのレベルを持つソルバにとってより適切な形式に変換される。
様々な問題に対して量子プレコンディショニングされた入力を与えられた場合、古典的アルゴリズムがより高速に収束できることを実証する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:00:41 GMT)
Optimal Symbolic Construction of Matrix Product Operators and Tree Tensor Network Operators [0.0] 本研究では,行列積演算子(MPO)とツリーテンソルネットワーク演算子(TTNO)を構築するための改良されたフレームワークを提案する。
与えられた(ハミルトニアン)作用素は典型的には、テンソルネットワーク構造に変換できる「作用素弦の和」形式の既知の記号を持つ。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:33:30 GMT)
OpenThaiGPT 1.5: A Thai-Centric Open Source Large Language Model [0.0] OpenThaiGPT 1.5はQwen v2.5をベースにした高度なタイ語チャットモデルである。
このレポートは、モデルの開発、能力、パフォーマンスに関する工学的な視点を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:10:08 GMT)
On the Privacy-Preserving Properties of Spiking Neural Networks with Unique Surrogate Gradients and Quantization Levels [0.0] メンバーシップアタック(MIA)は、トレーニング中に特定のデータポイントが使用されたかどうかを推測するためにモデル応答を利用する。
以前の研究では、スパイキングニューラルネットワーク(SNN)は、人工ニューラルネットワーク(ANN)よりもMIAに対するレジリエンスが高いことが示唆されていた。
このレジリエンスは、モデル応答と個々のトレーニングサンプルの相関を曖昧にする、非微分不可能なアクティベーションと固有精度に由来する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:14:14 GMT)
Nuclear Spin Engineering for Quantum Information Science [0.0] ホストとキュービット系の同位体組成を考えると、新しい物質的課題が生じる。
同位体組成は、主ホスト材料で自然に発生する核スピンの性質と濃度を管理する。
これらのスピンは、量子ビットコヒーレンスに有害な磁気ノイズを発生させるが、ローカル量子メモリやプロセッサとして約束される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:47:26 GMT)
Non-Gaussian generalized two-mode squeezing: applications to two-ensemble spin squeezing and beyond [0.0] これらの状態の基本構造は任意の二部量子系に一般化可能であることを示す。
これらの一般状態は常に比較的単純なマルコフ散逸過程によって安定化できることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:50:08 GMT)
Neural Manifolds and Cognitive Consistency: A New Approach to Memory Consolidation in Artificial Systems [0.0] 本稿では, ニューラル人口動態, 海馬鋭波リップル(SpWR)生成, ハイダー理論に触発された認知的一貫性の制約を統一する新しい数学的枠組みを提案する。
我々のモデルは低次元多様体表現を利用して構造化された神経ドリフトを捕捉し、コヒーレントシナプス相互作用を強制するためにバランスエネルギー関数を組み込む。
この研究は、神経科学と人工知能を橋渡しするスケーラブルなニューロモルフィックアーキテクチャの道を開くもので、将来のインテリジェントシステムに対してより堅牢で適応的な学習メカニズムを提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:28:25 GMT)
MuCoS: Efficient Drug-Target Prediction through Multi-Context-Aware Sampling [0.0] Multi-Context-Aware Sampling (MuCoS) は、薬物標的予測のための効率的で正の精度の手法である。
MuCoSは、負の三重項サンプリングの必要性を回避し、計算を削減し、目に見えないエンティティやリレーショナルのパフォーマンスを改善している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:27:32 GMT)
Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective MDPs and its Impact on Randomised Strategies [0.0] 多次元のペイオフ関数が与えられた全ての戦略の期待されるペイオフベクトルの集合の構造について検討する。
すべての戦略の下で期待される支払いが有限である任意のペイオフに対して、期待されるペイオフは、有限個の戦略を正確に混合することで得られる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:33:59 GMT)
Mixing Algorithm for Extending the Tiers of the Unapparent Information Send through the Audio Streams [0.0] 機密性および効率性は、ステガノグラフィーの関与によって得ることができる。
本稿では,ロバスト性,セキュリティ,キャパシティの隠蔽性に基づいて,性能に応じた経路を解析し,提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 03:14:56 GMT)
Mixed state entanglement from symmetric matrix inequalities [0.0] 我々は、さらなる検出機能を備えたポジティブマップの新たなファミリーを開発する。
最も単純な場合、複数のコピーと局所フィルタの両方を用いてより一般的な状態を検出するために、還元マップを一般化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:41:35 GMT)
Mitigating Attrition: Data-Driven Approach Using Machine Learning and Data Engineering [0.0] 本稿では、機械学習とデータエンジニアリング技術を用いて、従業員の誘惑を緩和する新しいデータ駆動アプローチを提案する。
提案フレームワークは, 多様な人的資源システムからのデータを統合し, 高度な特徴工学を活用して, 誘惑に影響を及ぼす要因を包括的に把握する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:29:45 GMT)
MindMem: Multimodal for Predicting Advertisement Memorability Using LLMs and Deep Learning [0.0] 我々は,広告記憶可能性のマルチモーダル予測モデルであるMindMemを提案する。
テキスト、視覚、聴覚データを統合することで、MindMemは最先端のパフォーマンスを達成する。
我々はMindMem-ReAdを紹介し、これは大規模言語モデルに基づくシミュレーションを用いて広告内容と配置を最適化する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:09:12 GMT)
Mind the Gap: Bridging the Divide Between AI Aspirations and the Reality of Autonomous Characterization [0.0] この研究は、電子顕微鏡における自律的なキャラクタリゼーションの膨大な可能性に焦点を当てている。
複雑な原子系を記述可能な顕微鏡解析のためのドメイン認識・マルチモーダルモデルの開発における最近の進歩について述べる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:43:47 GMT)
Min-reflected entropy = doubly minimized Petz Renyi mutual information of order 1/2 [0.0] ミン反射エントロピー (min-reflected entropy)、すなわち、レニイ反射エントロピー (Renyi reflect entropy) を極限$nrightarrow infty$ で表す。
一般の二部量子状態に対して、この測度は量子情報理論の分野から派生した別の測度と同一であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:27:38 GMT)
Microwave dynamics of gated Al/InAs superconducting nanowires [0.0] InAsナノワイヤをLambda/4$コプラナー導波路共振器に埋め込んだゲート制御のマイクロ波特性を示す。
本研究では,超伝導状態におけるナノワイヤの複素インピーダンスに及ぼすゲートの影響と,その動的性能について検討した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:43:48 GMT)
Microscopic Theory of Chern Polarization [0.0] チャーン絶縁体に対して、ザック位相の観点で絶対偏極の曖昧な定義を提供する。
我々の結果は、結晶対称性の存在下での転位に縛られた量子化された電荷に関する以前の結果と完全に一致している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:07:27 GMT)
Mechanism and Emergence of Stacked Attention Heads in Multi-Layer Transformers [0.0] 最小限の層を持つ変圧器でのみ解決できる,単純で一般的な推論タスクである検索問題を紹介します。
大規模な言語モデルは、微調整をせずに、異なるプロンプト式でタスクを解くことができることを実証的に示します。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:26:58 GMT)
Measurement resolution enhanced coherence for lattice fermions [0.0] 本研究では, 1次元格子中の弱い非相互作用フェルミオンからなる最小多粒子モデルについて検討する。
最大32箇所の系に対するこれらのBFSの特性を計算し、測定分解能が適度に低下しても、非自明な定常的絡み合いとコヒーレンスをもたらすことを発見した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:30:26 GMT)
Machine Learning for Ground State Preparation via Measurement and Feedback [0.0] そこで本研究では,中間回路計測とフィードバックを利用したニューラルネットワークによる地中準備手法を提案する。
本研究では,アシラ量子ビットのサブセットが測定やフィードバックに使用されることにより,性能が体系的に向上することが実証された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:43:28 GMT)
Learning atomic forces from uncertainty-calibrated adversarial attacks [0.0] そこで本稿では, ユーザの指定した誤りを含む逆構造を検出するために, キャリブレーション・アディショナル・ジオメトリ・最適化(CAGO)アルゴリズムを提案する。
不確実性に対する幾何学的最適化を行うことで、ユーザ指定のターゲットMLIP予測誤差を持つ逆構造に到達する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:03:59 GMT)
LeanKAN: A Parameter-Lean Kolmogorov-Arnold Network Layer with Improved Memory Efficiency and Convergence Behavior [0.0] Kolmogorov-Arnoldネットワーク(KAN)は、データ駆動モデリングのための多層パーセプトロン(MLP)に代わる有望な代替品である。
ここでは、MultKAN層が出力層において限定的な適用性に悩まされていることが分かる。
我々は、MultKANと従来のAddKANレイヤを直接かつモジュール的に置き換えるLeanKANを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 04:43:41 GMT)
LLMPC: Large Language Model Predictive Control [0.0] 我々は,大規模言語モデルが計画プロンプトを使用する場合,暗黙的な計画コスト関数最小化機能として機能することを示す。
LLMを用いて計画するための統一的なMPCフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 02:25:39 GMT)
Ion counting and temperature determination of Coulomb-crystallized laser-cooled ions in traps using convolutional neural networks [0.0] クーロン結晶を形成するイオンの数と温度は、閉じ込められたイオン実験における2つの重要な特性である。
ここでは、畳み込みニューラルネットワーク(CNN)に基づくイオンの蛍光画像からこれらの特性を決定するための高速かつ正確なアプローチを提案する。
その結果,100-299の範囲のイオン数と5-15mKの世俗温度を持つ結晶では,93%の精度で,92%の精度で1mKの温度変化を識別できることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:37:12 GMT)
Integrating Boosted learning with Differential Evolution (DE) Optimizer: A Prediction of Groundwater Quality Risk Assessment in Odisha [0.0] 本研究では,地下水水質指標(GWQI)を評価するための機械学習に基づく予測モデルを開発した。
LCBoost Fusionと呼ばれるハイブリッド機械学習モデルの助けを借りて実現されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:47:41 GMT)
Integrated InP-based transmitter for Continuous-Variable Quantum Key Distribution [0.0] 本研究では,連続可変(CV)QKD用PIC送信機の設計,製造,特性評価を行う。
CV-QKDシステムをモノリシックプラットフォームに統合するInP技術の可能性を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:45:30 GMT)
Inferring Thunderstorm Occurrence from Vertical Profiles of Convection-Permitting Simulations: Physical Insights from a Physical Deep Learning Model [0.0] 雷雨は激しい降水量、干ばつ、雷、強い風のために、社会と経済に大きな影響を及ぼす。
我々は,10の大気変数の垂直プロファイルから雷雨の発生確率を直接推定する深層ニューラルネットワークSALAMA 1Dを開発した。
対流を許容するNWP予測のモデルをトレーニングすることにより,SALAMA 1Dがフレキシブルな対流パターンを識別し,予測精度を向上させることを目的とする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:45:16 GMT)
Improved bounds on collapse models from rotational noise of LISA Pathfinder [0.0] 我々は,LISAパスファインダーの角運動データを解析し,それまでの翻訳動作よりも厳密な制約を導出する。
我々は、CSLモデルに制約を加えるために、翻訳されたものよりも回転測定を優先する一般的な条件を同定する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:38:29 GMT)
Hyperfine and Zeeman Optical Pumping and Transverse Laser Cooling of a Thermal Atomic Beam of Dysprosium Using a Single 421 nm Laser [0.0] ダイズプロシウム(Dy)原子ビームの超微細光ポンピングと横レーザー冷却の効果を実証した。
結果として生じる偏光と冷却された原子ビームは、ダイの励起状態の偶然の縮退を生かした基礎物理学実験で使用される。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:03:21 GMT)
Hybrid Voting-Based Task Assignment in Role-Playing Games [0.0] 投票ベースのタスク割り当て(VBTA)は、タスク割り当てと完了における人間の推論にインスパイアされたフレームワークである。
VBTAは、各タスクに最も適したエージェントを効率よく識別し割り当てる。
我々の手法は、独自の戦闘遭遇と物語を創出する際の約束を示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:58:21 GMT)
Historical German Text Normalization Using Type- and Token-Based Language Modeling [0.0] 本報告では, パラレルコーパスで訓練した1700-1900年頃のドイツ語文文の正規化システムを提案する。
提案システムは,トランスフォーマー言語モデルを用いて,エンコーダ・デコーダモデルと事前学習した因果言語モデルを組み合わせて,これらの正規化を文脈内で調整する。
広範に評価した結果,提案システムでは,より大規模な完全エンドツーエンドの文ベース正規化システムに匹敵し,事前学習したTransformer大言語モデルの微調整を行うことができた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:24:16 GMT)
Harnessing Time Symmetry to Fundamentally Alter Entanglement in Photoionization [0.0] Grobe--Eberly doublet 現象は、電界が残りのイオンを和らげるときに光電子分布で起こる。
しかし、そのような絡み合いの直接検出は偶然のスキームでは不可能である。
これは強磁場相互作用における時間対称性のパリティの最初の使用である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:30:35 GMT)
GraphRank Pro+: Advancing Talent Analytics Through Knowledge Graphs and Sentiment-Enhanced Skill Profiling [0.0] 本稿では,構造化グラフ,自然言語処理(NLP),ディープラーニングを活用した革命的アプローチを提案する。
複雑なロジックをグラフ構造に抽象化することで、生データを包括的な知識グラフに変換する。
この革新的なフレームワークは、正確な情報抽出と高度なクエリを可能にする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:07:40 GMT)
Granular Aluminum Parametric Amplifier for Low-Noise Measurements in Tesla Fields [0.0] 2つの結合したGraAl共振器で作られた非縮退増幅器を1Tまでの面内磁場に抵抗する。
加算雑音の量子限界に近い20dBのゲインを提供し、ゲイン帯域幅は28MHz、入力飽和電力は-110dBmである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:44:01 GMT)
GeoJEPA: Towards Eliminating Augmentation- and Sampling Bias in Multimodal Geospatial Learning [0.0] 自己教師型統合埋め込み予測アーキテクチャ上に構築された地理空間データのための多目的多モード融合モデルであるGeoJEPAを提案する。
我々は,自己教師付き地理空間表現学習において広く受け入れられている増分とサンプリングバイアスを排除することを目的としている。
その結果,都市域のマルチモーダルな意味表現と,定量的かつ質的に評価するマップエンティティが得られた。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:03:28 GMT)
From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks [0.0] 我々は、AIの安全性に関する現在主流の議論で無視されている生物学的、経済的動機付けのテーマを紹介します。
これらのテーマには、有界および生物学的目的に対するホメオスタシス、非有界、手段的、ビジネス目的に対するリターンの減少、持続可能性原理、資源共有が含まれる。
上記のテーマで8つの主要なベンチマーク環境を実装し、エージェントAIにおける重要な落とし穴と課題を明らかにします。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:13:31 GMT)
From Stars to Molecules: AI Guided Device-Agnostic Super-Resolution Imaging [0.0] 点状エミッタの超高分解能イメージングのためのデバイス非依存のディープラーニングフレームワークを提案する。
我々のモデルは多種多様な数値シミュレーションデータセットで訓練されている。
単一の解像度制限されたカメラフレームから直接、超解像を再構成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:54:27 GMT)
From Staging to Insight: An Educational Path to Understanding Bell's Inequalities [0.0] 本稿では,イタリアの量子週間プロジェクトの一環として,非専門家の観衆に絡み合いとベルの不等式を導入する根拠について論じる。
このイニシアチブは、複雑な科学原理と公衆の理解のギャップを埋めて、量子力学を誰でも利用できるようにすることを目的としている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:30:26 GMT)
From Small to Large Language Models: Revisiting the Federalist Papers [0.0] 本稿では,よりポピュラーなLarge Language Model (LLM) ツールについてレビューし,テキスト分類の文脈における統計的観点から検討する。
本研究では, ファインチューンを使わずに, 一般的な埋め込み構造がスタイメトリーや属性に有用であるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:50:46 GMT)
Formation of Complex Discrete Time Crystals with Ultracold Atoms [0.0] 振動する原子鏡により周期的に駆動される系における離散時間結晶の形成について検討した。
種内相互作用は弱く魅力的であるが、種間相互作用は無限に強く、反発的である。
まず、上層雲における自発時間変換対称性の破れの顕著な効果を観察し、続いて下層原子雲における同様の効果を観察した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:59:26 GMT)
FilterRAG: Zero-Shot Informed Retrieval-Augmented Generation to Mitigate Hallucinations in VQA [0.0] FilterRAGは、BLIP-VQAとRetrieval-Augmented Generationを組み合わせた検索拡張フレームワークで、外部知識ソースの回答を根拠にしている。
OK-VQAデータセットで36.5%の精度を達成し、幻覚を減少させる効果を示した。
これらの知見は、現実世界のデプロイメントにおける視覚質問応答システムを改善するために、FilterRAGの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:06:47 GMT)
Exploring proteomic signatures in sepsis and non-infectious systemic inflammatory response syndrome [0.0] 本研究の目的は、敗血症と非感染性全身性炎症性反応症候群(NISIRS)の鑑別発現の潜在的なタンパク質バイオマーカーを同定することである。
質量分析法を用いて, 被験者の血漿タンパク質を解析した。
タンパク質-タンパク質相互作用ネットワークをStringソフトウェアで解析した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:46:41 GMT)
Experimentally separating vacuum fluctuations from source radiation [0.0] 1932年、フェルミは2原子問題を導入し、2つの原子が真空およびソース放射誘起過程を通じて周囲の電磁場とどのように相互作用するかを探求した。
超高速光学の最近の進歩は、非線形結晶内の2つのレーザーパルスを用いた実験的なアナログを可能にした。
真空揺らぎと光源放射は近赤外レーザーパルスの異なる二次構造と相関し、個別にプローブできることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 13:51:53 GMT)
Existence and Characterisation of Coprime Bivariate Bicycle Codes [0.0] 量子誤り訂正(QEC)符号の聖杯の1つは、最低限良いパラメータを持つ符号を構築することである。
BBコードはそのようなコンパクトメモリの候補として浮上している。
本稿では,コリメBB符号のサブクラスに着目し,これらのパラメータについて検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:49:23 GMT)
Error-related Potential driven Reinforcement Learning for adaptive Brain-Computer Interfaces [0.0] 本研究では、強化学習(RL)を用いた適応型ErrPベースのBCI手法を提案する。
ErrPと運動画像を組み合わせたRL駆動適応フレームワークの実現可能性を示す。
RLエージェントはユーザインタラクションからコントロールポリシを学び、データセット間で堅牢なパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:27:51 GMT)
Entanglement transitions in a boundary-driven open quantum many-body system [0.0] 本稿では,非平衡な量子多体系の大規模シミュレーションを可能にする数値的枠組みを提案する。
設計上、密度演算子陽性を保護し、絡み合いモノトンへの直接アクセスを提供する。
本稿では,境界駆動型XXZスピンチェーンというパラダイム的オープンシステム問題について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 17:09:13 GMT)
Enhancing Text Classification with a Novel Multi-Agent Collaboration Framework Leveraging BERT [0.0] 本稿では,テキスト分類モデルの精度とロバスト性を高めるために,新しいマルチエージェント協調フレームワークを提案する。
本フレームワークは,低信頼度予測を特殊なマルチエージェントシステムに動的にエスカレートする。
ベンチマークデータセットに対する実証的な評価は,我々のフレームワークが5.5%の精度向上を実現していることを示している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:30:16 GMT)
Enhancing Speech Quality through the Integration of BGRU and Transformer Architectures [0.0] 雑音環境下での音声信号の品質向上には,音声強調が不可欠である。
本稿では,双方向Gated Recurrent Units(BGRU)とTransformerモデルの統合による音声強調作業の有効性について検討する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:18:35 GMT)
Enhancing Intrinsic Quality Factors Approaching 10 Million in Superconducting Planar Resonators via Spiral Geometry [0.0] シリコンウェハ上にドメイン整合エピタキシャル成長した窒化チタン(TiN)を用いてアルキメデススパイラル共振器(ASR)を作製した。
ASRは1光子レベルが$Q_mathrmi = (9.6 pm 1.5)×106$、高出力が$Q_mathrmi = (9.91 pm 0.39)×107$という固有の品質係数を達成し、従来のコプラナー導波管(CPW)共振器よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:54:03 GMT)
Enhancing Image Classification with Augmentation: Data Augmentation Techniques for Improved Image Classification [0.0] 畳み込みニューラルネットワーク(CNN)は、画像に依存するさまざまな分野の応用を見つけ、ディープラーニングの働きをする。
本研究では,本研究で提案される3つの新しいセットを含む11種類のデータ拡張手法の有効性について検討する。
Caltech-101データセットで最も効果的なものとして、画像拡張技術が提案されている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 23:03:30 GMT)
Engineering high Pockels coefficients in thin-film strontium titanate for cryogenic quantum electro-optic applications [0.0] チタン酸ストロンチウムは極低温で345 pm/Vのmathrmr_eff$を生産できることを示す。
速度論を調整することでキュリー温度を上昇させ、ポッケルス係数の高い強誘電相を実現することができる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:30:09 GMT)
Einstein's Equivalence Principle in Nonrelativistic Quantum Mechanics [0.0] 均一な重力場における自由落下のオブザーバは、そのような場がない場合の慣性オブザーバと等価である。
波動関数の変換を再検討し、慣性質量と重力質量の等しい条件を確立する。
結果は、非相対論的量子状態における等価原理の妥当性を再確認した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 22:27:56 GMT)
Effects of the Hubbard interaction on the quantum metric [0.0] 量子メートル法における相互作用効果の役割について検討する。
反動的なハバード相互作用は量子計量を単調に抑制することを示す。
私たちの結論は、フラットバンドと分散システムの両方に当てはまる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:24:11 GMT)
EU-Nets: Enhanced, Explainable and Parsimonious U-Nets [0.0] 説明可能性と不確実性を考慮した新しいU-Net変種であるEU-Netを紹介する。
EU-Netは、平均精度が1.389%向上し、すべてのネットワークとデータセットで0.83%の分散低減を実現している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:44:30 GMT)
Domain-Specific Translation with Open-Source Large Language Models: Resource-Oriented Analysis [0.0] オープンソースの自己回帰型デコーダ専用大言語モデル(LLM)のドメイン固有翻訳性能とタスク指向機械翻訳(MT)モデルとの比較を行った。
実験では,医学領域に焦点をあて,英語とフランス語,英語とポルトガル語,英語とスワヒリ,スワヒリと英語の4つの言語ペアについて検討した。
NLLB-200 3.3Bは、医学翻訳における8Bパラメータの範囲で、全てのLLMを上回ります。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:59:04 GMT)
Dirac Equation with Space Contributions Embedded in a Quantum-Corrected Gravitational Field [0.0] ディラック方程式は、最近提案された一般化重力相互作用(ケプラーあるいはクーロン)と共に考慮される
この計量を選択する際の一般的な考え方は、時空の寄与は外部ポテンシャルまたは電磁ポテンシャルに含まれるというものである。
量子補正されたクーロン項に対する方程式の解法は、既知の完全あるいは準コンパクトな非摂動解析技術を用いて不可能である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 15:46:06 GMT)
Dicke subsystems are entangled [0.0] 任意の数の立方体の非積ディック状態のすべての還元状態が、任意の部分系に対して非正の部分転置であることを示す。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:02:08 GMT)
Deviations from Geodesic Evolutions and Energy Waste on the Bloch Sphere [0.0] 最適量子力学の進化において、運動は最短長の未決定経路に沿って最適な時間で起こる。
あるいは、最適進化はエネルギー資源を無駄にせず、100%の速度効率で事前に定義された経路に沿って起こる。
我々は、静止的かつ時間的に異なる準最適量子ビットハミルトン群の異なる族について研究し、これはいわゆる測地効率と対応する量子進化の速度効率が1以下である。
このハイブリッド測度のおかげで、量子進化は4つのカテゴリに分けられる。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 20:11:32 GMT)
Detecting high-dimensional time-bin entanglement in fiber-loop systems [0.0] 高次元の絡み合いはノイズに強く、高いシークレットキーレートを可能にすることが示されている。
ファイバループシステムにおける高次元時間ビン絡みの認証法を開発した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 16:27:45 GMT)
Detecting Offensive Memes with Social Biases in Singapore Context Using Multimodal Large Language Models [0.0] 我々はシンガポールの文脈で攻撃的ミームを分類するために、GPT-4Vでラベル付けされた112KミームをVLMの微調整のためにキュレートする。
我々は,データセット上での微調整VLMの有効性を示し,OCR,翻訳,7ビリオンパラメータクラスVLMを含むパイプラインを提案する。
我々のソリューションは、ホールドアウトテストセットで80.62%の精度と0.8192のAUROCに達し、人間がオンラインでコンテンツをモデレートするのに大いに役立ちます。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:15:49 GMT)
Decoherence from the light bending interaction [0.0] 我々は、質量体と電磁場の間の重力相互作用によって引き起こされるデコヒーレンス効果を分析する。
この効果は、非常にエネルギッシュな光に対して非常に軽視されているが、重力と量子理論の共存の基本的な観点から見れば、それはそこにある。
効果的に研究システムは量子光学系であるため、我々の結果が適切に再スケールされ、光学にも役立つことを期待する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:47:06 GMT)
Convergence to the Truth [0.0] 論文は「収束主義」として知られる科学哲学の伝統をレビューし、発展させ、推論手法は様々なシナリオにまたがって真理に収束する能力に基づいて評価されるべきである。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:42:32 GMT)
Controlling dynamics of stochastic systems with deep reinforcement learning [0.0] 本稿では,訓練されたニューラルネットワークを用いてシステムのダイナミクスを制御できるシミュレーションアルゴリズムを提案する。
具体的には、エージェントベースのシミュレーションを使用して、ニューラルネットワークがローカル状態から状態への遷移を駆動するコントローラの役割を担っている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:28:12 GMT)
Contrastive Learning with Nasty Noise [0.0] この研究は、相手がトレーニングサンプルを変更したり置き換えたりする騒音下でのコントラスト学習の理論的限界を分析する。
l2-距離関数に基づくデータ依存型サンプル複雑性境界を導出する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 05:55:15 GMT)
Connecting Voices: LoReSpeech as a Low-Resource Speech Parallel Corpus [0.0] 本稿では,低音源音声合成コーパスであるLoReSpeechの構築手法を提案する。
LoReSpeechは言語内アライメントと言語間アライメントの両方を提供し、多言語ASRシステムの進歩を可能にする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 14:00:15 GMT)
Complement or substitute? How AI increases the demand for human skills [0.0] 本稿では、人工知能(AI)が人間の労働を補うか、あるいは補うかを検討する。
2018年から2023年にかけて、米国から1200万件のオンライン求人情報を集めている。
結果として、AIに焦点を当てた役割は、レジリエンス、アジリティ、分析的思考といったスキルを必要とする可能性がほぼ2倍であることが示された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:31:29 GMT)
Comparative Analysis of MDL-VAE vs. Standard VAE on 202 Years of Gynecological Data [0.0] MDL-VAEは、効率的なKL分散正規化により、より低い再構成誤差(MSE、MAE、RMSE)とより構造化された潜在表現を示す。
以上の結果から,MBLの原則をVAEアーキテクチャに組み込むことで,データ再構成と一般化を大幅に改善し,医療データモデリングと分析における先進的なアプローチとして期待できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:05:46 GMT)
Comparative Analysis Based on DeepSeek, ChatGPT, and Google Gemini: Features, Techniques, Performance, Future Prospects [0.0] DeepSeek、ChatGPT、Google Geminiは最もトレンドでエキサイティングなLarge Language Model (LLM)技術です。
DeepSeekはMixture-of-Experts(MoE)アプローチを採用しており、タスクに最も関係のあるパラメータのみをアクティベートする。
ChatGPTは、人間のフィードバックからの強化学習によって強化された高密度トランスモデルに依存している。
Google Geminiは、テキスト、コード、イメージを単一のフレームワークに統合するマルチモーダルトランスフォーマーアーキテクチャを使っている。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:55:35 GMT)
CayleyPy RL: Pathfinding and Reinforcement Learning on Cayley Graphs [0.0] 本論文は,大規模グラフ上でのパスフィリングのための効率的な人工知能ベースのアプローチの開発に関する一連の研究の2番目である。
本稿では, 強化学習手法と, 第1報より直接拡散距離法を併用した新しい手法を提案する。
我々は、OEIS-A186783予想に対して、この直径が機械学習と数学的手法によりn(n-1)/2に等しいという強い支持を与える。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 21:53:41 GMT)
Calculation of harmonic oscillator brackets in SU(3) basis [0.0] 我々は、SU(3)スキームを高調波発振器ブラケットの計算に利用した。
数値評価のための明示的な関係を求め,計算手法を提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:59:57 GMT)
Bridging magic and non-Gaussian resources via Gottesman-Kitaev-Preskill encoding [0.0] 連続変数系における非安定化状態と非ガウス状態の基本的な関係を確立する。
符号化されたGKP状態に対する連続変数ウィグナー関数の負性は、マジック測度と一致することを示す。
また、安定化器 R'enyi エントロピーの連続変数表現も提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 00:48:28 GMT)
Bohmian Mechanics fails to compute multi-time correlations [0.0] ボヘミア力学(Bohmian mechanics)は、古典的粒子軌道の非局所的現実理論である。
位置オブザーバとして実現した量子ビットを用いたGHZシステムの空間バージョンを構築した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:21:55 GMT)
Between Innovation and Oversight: A Cross-Regional Study of AI Risk Management Frameworks in the EU, U.S., UK, and China [0.0] 本稿では、欧州連合、米国、英国(イギリス)、中国におけるAIリスク管理戦略の比較分析を行う。
この結果は、EUが透明性と適合性の評価を優先する構造化されたリスクベースの枠組みを実装していることを示している。
米国は、イノベーションを促進するが、断片化された執行につながる可能性のある、分権化されたセクター固有の規制を使用している。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:52:17 GMT)
Behavioural Predictors that Influence Digital Legacy Management Intentions among Individuals in South Africa [0.0] 本研究では,南アフリカの個人がデジタル遺産を管理する上で,行動予測者が意図にどのような影響を及ぼすかを検討する。
オンライン調査を用いて南アフリカ住民のデータを収集し, 部分最小二乗構造式解析(PLS-SEM)を用いて分析した。
その結果,デジタルレガシマネジメントの意図に対して,態度,仲間意見,個人的資源,スキルが有意な影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:13:29 GMT)
Batch normalization does not improve initialization [0.0] バッチ正規化はニューラルネットワークの最も重要な正規化手法の1つである。
この主張が真ではないこと、すなわちバッチ正規化が改善しないことを示す反例を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 07:20:44 GMT)
Autonomous Vision-Guided Resection of Central Airway Obstruction [0.0] 既存の気管腫瘍切除法では, 気道クリアランスの精度が低い場合が多い。
気管腫瘍の口蓋切除に対する視覚ガイド下自律的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 19:11:11 GMT)
Automatic Design of Semantic Similarity Ensembles Using Grammatical Evolution [0.0] 単一の意味的類似度尺度はすべてのタスクに最も適しており、研究者はパフォーマンスを確保するためにアンサンブル戦略を使うことが多い。
本研究は,意味的類似性アンサンブルを自動設計する手法を提案する。
提案手法は,人的判断の相関を最大化するアンサンブルを作成するために,まず,候補のプールから測度を自動的に選択・集約するために文法的進化を利用する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 11:27:10 GMT)
Assessing the Maturity of Cybersecurity Education in Virginia and the Impact of State Level Investment [0.0] 我々は、サイバーセキュリティ教育成熟度モデル尺度(CEMM)を評価するための序列尺度を構築している。
2017年から2025年の間、バージニア州の公立4年制大学のCEMMスコアを計算します。
提案されたスケールは、大学間で利用可能なサイバーセキュリティ製品を比較するための一貫性と信頼性を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:55:21 GMT)
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli [0.0] 本研究は,1276名の被験者を対象に,真偽メディアと合成メディアの識別能力を評価するための知覚的研究を行った。
その結果、平均的な検出性能は50%に近づき、合成メディアと真正メディアの区別に苦慮していることがわかった。
また,任意の種類の合成コンテンツを含む刺激が外国語を特徴とし,メディアタイプが単一モダリティである場合には,精度が低下することが判明した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 10:29:37 GMT)
Arrhythmia Classification from 12-Lead ECG Signals Using Convolutional and Transformer-Based Deep Learning Models [0.0] ルーマニアでは、心臓血管疾患が死因の主要な原因であり、毎年の死者の3分の1近くを占める。
本稿では, 資源制約型医療環境における不整脈診断の効率化, 軽量化, 迅速化を図ることを目的とする。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 06:17:52 GMT)
Are Chatbots Reliable Text Annotators? Sometimes [0.0] ChatGPTはクローズドソース製品で、透明性、コスト、データ保護に関して大きな欠点があります。
オープンソースの(OS)大規模言語モデル(LLM)の最近の進歩は、これらの欠点のない代替手段を提供する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 09:57:48 GMT)
Applications of deep reinforcement learning to urban transit network design [0.0] この論文は、ニューラルネットワークをトレーニングして公共交通ネットワークの設計を支援するための強化学習の使用に関するものである。
トランジットネットワーク設計問題(TNDP)は,実用上重要な最適化問題である。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 01:24:20 GMT)
Application of Attention Mechanism with Bidirectional Long Short-Term Memory (BiLSTM) and CNN for Human Conflict Detection using Computer Vision [0.0] 本研究では、注意機構、畳み込みニューラルネットワーク(CNN)、双方向長短期記憶(BiLSTM)など、高度なディープラーニング技術の統合について検討する。
実験の結果、CNNとBiLSTMの組み合わせとアテンションメカニズムが競合監視に有望なソリューションであることがわかった。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:48:34 GMT)
AlphaMaze: Enhancing Large Language Models' Spatial Intelligence via GRPO [0.0] 大きな言語モデル(LLM)は、言語処理において印象的な能力を示してきたが、視覚的な空間的推論を必要とするタスクにしばしば苦労している。
迷路ナビゲーションのための視覚的推論能力を備えた標準LLMの2段階学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 08:56:11 GMT)
Advanced Attacks On Qubit-Ensemble Based Quantum Coins [0.0] アンサンブルを持つ複数の異なるトークンは、銀行が発行できる量子コインを実現している。
トークンをコピーする高度な試みは、サブアンサンブルの測定が実行可能であると仮定することができる。
量子コインに量子トークンの量を増やすことで、任意のレベルのセキュリティが得られることを証明した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:05:00 GMT)
A Digital Quantum Algorithm for Non-Markovian Electron Transfer Dynamics Using Repeated Interactions [0.0] 量子アルゴリズムは、化学におけるオープン量子システムの理解に革命をもたらす可能性がある。
我々は、繰り返し相互作用モデルを活用する量子アルゴリズムが、非マルコフ電子移動過程を効果的に再現できることを実証した。
論文参考訳(メタデータ) (Tue, 25 Feb 2025 18:21:03 GMT)