EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions [152.4] GPT-4oは、多様な感情や声調を持つ声の会話を可能にするオムニモーダルモデルである。
本研究では,エンド・ツー・エンドの音声機能を備えた大規模言語モデルを実現するためのEMOVAを提案する。
EMOVAは、視覚言語と音声のベンチマークの両方で最先端のパフォーマンスを初めて達成した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:25:52 GMT)
Personalization of Large Language Models: A Survey [131.0] 大規模言語モデル(LLM)のパーソナライゼーションは、最近、広範囲のアプリケーションでますます重要になっている。
パーソナライズ LLM に関する既存の研究の多くは、(a)パーソナライズされたテキスト生成、または(b)レコメンデーションシステムのようなパーソナライズに関連する下流アプリケーションに LLM を活用することに集中している。
パーソナライズされたLSM使用のための分類を導入し、主要な違いと課題を要約する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:01:11 GMT)
Efficient and Effective Weight-Ensembling Mixture of Experts for Multi-Task Model Merging [111.8] マルチタスク学習(MTL)は、共有モデルを利用して複数のタスクを遂行し、知識伝達を促進する。
マルチタスクモデル統合のためのウェイトエンセブリング・ミックス・オブ・エキスパート(WEMoE)手法を提案する。
WEMoEとE-WEMoEは, MTL性能, 一般化, 堅牢性の観点から, 最先端(SOTA)モデルマージ法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:16:31 GMT)
INDICT: Code Generation with Internal Dialogues of Critiques for Both Security and Helpfulness [110.7] INDICTは、安全性と有用性の両方のガイダンスのために、批評家の内的対話で大きな言語モデルを強化する新しいフレームワークである。
内部対話は、安全主導の批評家と役に立つ主導の批評家の二重協調システムである。
提案手法は,安全性と有用性解析の両面において,高度な批判のレベルを提供し,出力コードの品質を著しく向上させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:20:28 GMT)
Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.9] 正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:41:44 GMT)
Image Segmentation in Foundation Model Era: A Survey [99.2] イメージセグメンテーションにおける現在の研究は、これらの進歩に関連する特徴、課題、解決策の詳細な分析を欠いている。
本調査は、FM駆動画像セグメンテーションを中心とした最先端の研究を徹底的にレビューすることで、このギャップを埋めようとしている。
現在の研究成果の広さを包括する,300以上のセグメンテーションアプローチの概要を概観する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:05:35 GMT)
Making Offline RL Online: Collaborative World Models for Offline Visual Reinforcement Learning [94.0] 本稿では,潜在的利点の探索を妨げることなく,より柔軟な値推定制約を構築することを試みる。
鍵となるアイデアは、オフラインポリシの"テストベッド"として、オンライン形式で簡単に操作可能な、市販のRLシミュレータを活用することだ。
我々は、状態と報酬空間におけるドメイン間の差異を軽減するモデルベースのRLアプローチであるCoWorldを紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:41:58 GMT)
On the Worst Prompt Performance of Large Language Models [93.1] 大規模言語モデル(LLM)の性能は,プロンプトの表現に非常に敏感である。
セマンティックに等価なケースレベルのクエリで構成される新しいベンチマークであるRobustAlpacaEvalを紹介する。
RobustAlpacaEvalとChatGPT、およびLlama、Mistral、Gemmaファミリーの6つのオープンソースLLMによる実験により、モデル性能のかなりのばらつきが明らかになった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:04:21 GMT)
TabDiff: a Multi-Modal Diffusion Model for Tabular Data Generation [91.5] 1つのモデルで表データのマルチモーダル分布をモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:19:07 GMT)
$f$-PO: Generalizing Preference Optimization with $f$-divergence Minimization [91.4] $f$-POは、既存のアプローチを一般化し拡張する新しいフレームワークである。
ベンチマークデータセットを用いて最先端言語モデルの実験を行う。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:11:45 GMT)
Set-based Neural Network Encoding Without Weight Tying [91.4] 本稿では,ネットワーク特性予測のためのニューラルネットワーク重み符号化手法を提案する。
我々のアプローチは、混合アーキテクチャのモデル動物園でニューラルネットワークを符号化することができる。
ニューラルネットワークのプロパティ予測には,クロスデータセットとクロスアーキテクチャという,2つの新しいタスクを導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:23:18 GMT)
UMG-CLIP: A Unified Multi-Granularity Vision Generalist for Open-World Understanding [90.7] 本稿では,マルチグラニュラリティアライメントを備えたコントラスト言語-画像事前学習(CLIP)を拡張した。
UMG-CLIPと呼ばれる統一多言語学習フレームワークを開発した。
パラメータ効率のよいチューニングにより、UMG-CLIPは、現在広く使われているCLIPの亜種を超え、多様な画像理解ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:05:36 GMT)
MMDU: A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs [88.3] 本稿では,包括的なベンチマークであるMMDUと,大規模命令チューニングデータセットであるMMDU-45kを紹介する。
MMDUは最大18k画像+テキストトークン、20イメージ、27ターンを備えており、これは以前のベンチマークの少なくとも5倍長くなる。
MMDU-45k上のフネ調整型オープンソースLVLMは、このギャップに適応し、より長く正確な会話を生成することを実証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:34:11 GMT)
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback [87.4] アノテーションの品質向上のために,人間とLMの入力を組み合わせたルーティングフレームワークを提案する。
我々は、人間とLMアノテーションの任意の組み合わせで報酬モデルの性能を予測するために、性能予測モデルを訓練する。
選択したハイブリッド混合物は,一方のみ使用した場合と比較して,報奨モデルの性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:15:06 GMT)
Transferable Adversarial Attacks on SAM and Its Downstream Models [87.2] 本稿では,セグメント・アプライス・モデル(SAM)から微調整した様々な下流モデルに対する敵攻撃の可能性について検討する。
未知のデータセットを微調整したモデルに対する敵攻撃の有効性を高めるために,ユニバーサルメタ初期化(UMI)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:40:19 GMT)
Scaling Laws in Linear Regression: Compute, Parameters, and Data [86.5] 無限次元線形回帰セットアップにおけるスケーリング法則の理論について検討する。
テストエラーの再現可能な部分は$Theta(-(a-1) + N-(a-1)/a)$であることを示す。
我々の理論は経験的ニューラルスケーリング法則と一致し、数値シミュレーションによって検証される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:10:27 GMT)
Neural Networks with Sparse Activation Induced by Large Bias: Tighter Analysis with Bias-Generalized NTK [86.5] ニューラル・タンジェント・カーネル(NTK)における一層ReLUネットワークのトレーニングについて検討した。
我々は、ニューラルネットワークが、テクティトビア一般化NTKと呼ばれる異なる制限カーネルを持っていることを示した。
ニューラルネットの様々な特性をこの新しいカーネルで研究する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:45:06 GMT)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.9] 不確実性定量化(英: Uncertainty Quantification、UQ)は、機械学習(ML)アプリケーションにおいて重要なコンポーネントである。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、9つのタスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も有望なアプローチを特定した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:45:58 GMT)
A Fresh Look at Generalized Category Discovery through Non-negative Matrix Factorization [83.1] Generalized Category Discovery (GCD) は、ラベル付きベースデータを用いて、ベース画像と新規画像の両方を分類することを目的としている。
現在のアプローチでは、コサイン類似性に基づく共起行列 $barA$ の固有の最適化に不適切に対処している。
本稿では,これらの欠陥に対処するNon-Negative Generalized Category Discovery (NN-GCD) フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:24:11 GMT)
Model Tells You What to Discard: Adaptive KV Cache Compression for LLMs [82.1] 大規模言語モデル(LLM)における生成推論のメモリフットプリントを削減するプラグイン・アンド・プレイ方式である適応KVキャッシュ圧縮を導入する。
我々は,アテンションモジュールの本質的な構造を明らかにするために,ターゲットプロファイリングを行う。
認識された構造に基づいて、我々はKVキャッシュを適応的に構築する: 注意頭上の長距離コンテキストを排除し、局所的なコンテキストを強調し、特別なトークンを中心とした注意頭上の特別なトークンを排除し、すべてのトークンに広く参加する注目頭に対して標準のKVキャッシュのみを使用する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:26:09 GMT)
Local Policies Enable Zero-shot Long-horizon Manipulation [80.1] ManipGenを紹介します。これはsim2real転送のための新しいポリシーのクラスであるローカルポリシーを活用します。
ManipGenは、SayCan、OpenVLA、LLMTrajGen、VoxPoserといったSOTAアプローチを、50の現実世界操作タスクで36%、76%、62%、60%で上回っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:59:55 GMT)
Understanding Code Understandability Improvements in Code Reviews [79.2] GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:21:23 GMT)
AIME: AI System Optimization via Multiple LLM Evaluators [79.0] AIME は複数の LLM を利用した評価プロトコルであり、それぞれが独立した基準で評価を生成し、結合を通してそれらを結合する。
コード生成タスクにおける AIME のベースラインメソッドのパフォーマンスは,LeetCodeHard と HumanEval データセットの単一 LLM 評価プロトコルよりも最大 62% 高いエラー検出率,最大 16% 高い成功率で向上している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:35:14 GMT)
AIME: AI System Optimization via Multiple LLM Evaluators [79.0] AIME は複数の LLM を利用した評価プロトコルであり、それぞれが独立した基準で評価を生成し、結合を通してそれらを結合する。
コード生成タスクにおける AIME のベースラインメソッドのパフォーマンスは,LeetCodeHard と HumanEval データセットの単一 LLM 評価プロトコルよりも最大 62% 高いエラー検出率,最大 16% 高い成功率で向上している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:35:14 GMT)
AIME: AI System Optimization via Multiple LLM Evaluators [79.0] AIME は複数の LLM を利用した評価プロトコルであり、それぞれが独立した基準で評価を生成し、結合を通してそれらを結合する。
コード生成タスクにおける AIME のベースラインメソッドのパフォーマンスは,LeetCodeHard と HumanEval データセットの単一 LLM 評価プロトコルよりも最大 62% 高いエラー検出率,最大 16% 高い成功率で向上している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:35:14 GMT)
Long-context Protein Language Model [77.0] 言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:43:28 GMT)
MotionGPT-2: A General-Purpose Motion-Language Model for Motion Generation and Understanding [76.3] MotionGPT-2は、MLMLM(Large Motion-Language Model)である。
LLM(Large Language Models)によるマルチモーダル制御をサポートしている。
難易度の高い3次元全体運動生成タスクに高い適応性を持つ。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:25:34 GMT)
Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.3] Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。
距離深度推定と表面正規度推定の両方の解を提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:24:27 GMT)
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis [72.5] 実時間微分可能な発光専用ボリュームレンダリング法であるExact Volumetric Ellipsoid Rendering (EVER)を提案する。
3D Gaussian Splatting(3DGS)による最近の手法とは異なり、プリミティブベースの表現は正確なボリュームレンダリングを可能にする。
本手法は,3DGSよりもブレンディング問題の方が精度が高く,ビューレンダリングの追従作業も容易であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:17:56 GMT)
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis [72.5] 実時間微分可能な発光専用ボリュームレンダリング法であるExact Volumetric Ellipsoid Rendering (EVER)を提案する。
3D Gaussian Splatting(3DGS)による最近の手法とは異なり、プリミティブベースの表現は正確なボリュームレンダリングを可能にする。
本手法は,3DGSよりもブレンディング問題の方が精度が高く,ビューレンダリングの追従作業も容易であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:17:56 GMT)
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis [72.5] 実時間微分可能な発光専用ボリュームレンダリング法であるExact Volumetric Ellipsoid Rendering (EVER)を提案する。
3D Gaussian Splatting(3DGS)による最近の手法とは異なり、プリミティブベースの表現は正確なボリュームレンダリングを可能にする。
本手法は,3DGSよりもブレンディング問題の方が精度が高く,ビューレンダリングの追従作業も容易であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:17:56 GMT)
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis [72.5] 実時間微分可能な発光専用ボリュームレンダリング法であるExact Volumetric Ellipsoid Rendering (EVER)を提案する。
3D Gaussian Splatting(3DGS)による最近の手法とは異なり、プリミティブベースの表現は正確なボリュームレンダリングを可能にする。
本手法は,3DGSよりもブレンディング問題の方が精度が高く,ビューレンダリングの追従作業も容易であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:17:56 GMT)
QuaRot: Outlier-Free 4-Bit Inference in Rotated LLMs [72.3] ローテーションに基づく新しい量子化方式であるQuaRotを紹介する。
QuaRotは、すべての重み、アクティベーション、KVキャッシュを含むエンドツーエンドを4ビットで量子化する。
我々の4ビット量子化LLaMa2-70Bモデルは、少なくとも0.47 WikiText-2パープレキシティが失われ、ゼロショット性能の99%を維持している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:09:12 GMT)
Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox [70.6] 既存のアウト・オブ・ディストリビューション(OOD)検出ベンチマークは、サンプルを新しいラベルでOODデータとして分類する。
いくつかの限界OODサンプルは、実際には分布内(ID)サンプルに密接なセマンティック内容を持ち、OODサンプルをソリテスパラドックス(英語版)と判定する。
この問題に対処するため,Incremental Shift OOD (IS-OOD) というベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:40:10 GMT)
NoVo: Norm Voting off Hallucinations with Attention Heads in Large Language Models [70.0] 本稿では,注意基準の未適用ポテンシャルを利用して,事実の精度を高める軽量なノム投票法(Nom Voting, NoVo)を提案する。
TruthfulQA MC1では、NoVoは現在の最先端および過去のすべてのメソッドを、驚くべきマージン -- 少なくとも19の精度ポイントで上回る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:23:53 GMT)
NoVo: Norm Voting off Hallucinations with Attention Heads in Large Language Models [70.0] 本稿では,注意基準の未適用ポテンシャルを利用して,事実の精度を高める軽量なノム投票法(Nom Voting, NoVo)を提案する。
TruthfulQA MC1では、NoVoは現在の最先端および過去のすべてのメソッドを、驚くべきマージン -- 少なくとも19の精度ポイントで上回る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:23:53 GMT)
On the Role of Depth and Looping for In-Context Learning with Task Diversity [69.4] 多様なタスクを伴う線形回帰のための文脈内学習について検討する。
We show that multilayer Transformer is not robust to even distributional shifts as $O(e-L)$ in Wasserstein distance。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:27:56 GMT)
IntLoRA: Integral Low-rank Adaptation of Quantized Diffusion Models [68.6] IntLoRAを提案し、整数型(INT)低ランクパラメータを用いて効率限界を押し上げ、量子化拡散モデルに適応させる。
IntLoRAには3つの大きな利点がある: (i) 微調整の場合、事前トレーニングされた重みは量子化され、メモリ使用量が減少する (ii) ストレージの場合、事前トレーニングされた重みと低ランクの重みの両方が、ディスクスペースを少なく消費するINT内にある; (iii) 推論の場合、IntLoRA重みは、効率的な整数乗算やビットシフトによって自然に量子化された事前トレーニングされた重みにマージできる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:50:17 GMT)
IDEATOR: Jailbreaking VLMs Using VLMs [68.5] ブラックボックスのジェイルブレイク攻撃に対して,悪意のある画像テキストペアを自動生成する新しいジェイルブレイク手法 IDEATOR を提案する。
IDEATORはVLMを使用してジェイルブレイクテキストを生成し、最先端の拡散モデルを利用して対応するジェイルブレイク画像を生成する。
MiniGPT-4を94%の成功率でジェイルブレイクし、LLaVAとInstructBLIPにシームレスに移行し、それぞれ82%と88%という高い成功率を達成した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:15:56 GMT)
Auto-Intent: Automated Intent Discovery and Self-Exploration for Large Language Model Web Agents [68.2] 本稿では,事前訓練された大規模言語モデル(LLM)を,直接微調整なしで対象ドメインのエージェントとして適用する手法であるAuto-Intentを紹介する。
提案手法はまず,対象領域の実証から意図を教師なしで発見する。
我々は、エージェントの過去の観察と行動から次の意図を予測するために、意図予測器を訓練する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:37:04 GMT)
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance [68.2] マルチモーダルモデルは、下流の"ゼロショット"のパフォーマンスを線形改善するために、指数関数的に多くのデータを必要とする。
本研究は,大規模な訓練パラダイムの下での「ゼロショット」一般化能力の鍵となる訓練データに対する指数関数的要求を明らかにする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:00:46 GMT)
Prompt Optimization with EASE? Efficient Ordering-aware Automated Selection of Exemplars [66.8] 大規模言語モデル(LLM)は、現実世界のアプリケーションで印象的な機能を示している。
これらの卓越した作品の品質は、パフォーマンスに大きな影響を与えます。
既存の方法は、先行注文がパフォーマンスに与える影響を適切に説明できない。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:17:44 GMT)
Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspective [66.8] Warmup-Stable-Decay (WSD) スケジュールは、一定の学習率を使用して、所定の計算予算なしで無限に継続できるイテレーションのメインブランチを生成する。
プレトレーニング損失は,河底に川がある深い谷に類似した河谷景観を呈することを示す。
この理論にインスパイアされたWSD-Sは、従来のチェックポイントの崩壊フェーズを再利用し、メインブランチを1つだけ保持するWSDの変種である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:26:00 GMT)
Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape Perspective [66.8] Warmup-Stable-Decay (WSD) スケジュールは、一定の学習率を使用して、所定の計算予算なしで無限に継続できるイテレーションのメインブランチを生成する。
プレトレーニング損失は,河底に川がある深い谷に類似した河谷景観を呈することを示す。
この理論にインスパイアされたWSD-Sは、従来のチェックポイントの崩壊フェーズを再利用し、メインブランチを1つだけ保持するWSDの変種である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:26:00 GMT)
MoDGS: Dynamic Gaussian Splatting from Casually-captured Monocular Videos [65.3] MoDGSは、カジュアルにキャプチャーされたモノクロビデオから、ダイナミックなシーンの新たなビューを描画する新しいパイプラインだ。
実験では、MoDGSはカジュアルにキャプチャされたモノクロビデオから、ダイナミックシーンの高品質なノベルビュー画像をレンダリングできることを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:50:00 GMT)
A Closer Look at Neural Codec Resynthesis: Bridging the Gap between Codec and Waveform Generation [65.1] トークン予測と回帰に基づく2つの戦略について検討し,Schr"odinger Bridgeに基づく新しい手法を提案する。
異なるデザイン選択が機械と人間の知覚にどのように影響するかを検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:29:39 GMT)
Text-Guided Attention is All You Need for Zero-Shot Robustness in Vision-Language Models [64.7] _Text-Guided Attention for Zero-Shot Robustness (TGA-ZSR)_。
このフレームワークには、Attention RefinementモジュールとAttentionベースのModel Constraintモジュールの2つのコンポーネントが含まれている。
実験により,現在の最先端技術に比べて,ゼロショット精度が9.58%向上することが確認された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:15:09 GMT)
CulturePark: Boosting Cross-cultural Understanding in Large Language Models [63.5] 本稿では,LLMを利用した文化データ収集のためのマルチエージェント通信フレームワークであるCultureParkを紹介する。
人間の信念、規範、習慣をカプセル化した高品質な異文化対話を生成する。
我々はこれらのモデルを,コンテンツモデレーション,文化的アライメント,文化教育という3つの下流課題にまたがって評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:14:47 GMT)
Exploring Local Memorization in Diffusion Models via Bright Ending Attention [63.0] 拡散モデルにおける新しい明るいエンディング(BE)異常を識別し,活用し,トレーニング画像を記憶する。
また, 暗記画像パッチは, 非暗記画像パッチに比べて最終推論段階において, エンドトークンに対して有意に注意を払っていることが示唆された。
本稿では、BEと新しいローカライゼーションタスクの結果を既存のフレームワークに組み込むための、シンプルで効果的な方法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:16:01 GMT)
PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.7] 画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。
我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。
画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:49:39 GMT)
Aligning Text-to-Image Diffusion Models with Reward Backpropagation [62.5] 本稿では,報酬勾配のエンドツーエンドのバックプロパゲーションを用いて,拡散モデルを下流の報酬関数に整合させる手法であるAlignPropを提案する。
AlignPropは、選択肢よりも少ないトレーニングステップでより高い報酬を得るが、概念的にはシンプルである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:53:33 GMT)
Binarized Diffusion Model for Image Super-Resolution [62.0] 超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:06:31 GMT)
Multimodality Helps Few-Shot 3D Point Cloud Semantic Segmentation [61.9] FS-PCS (Few-shot 3D point cloud segmentation) は、最小のサポートサンプルで新しいカテゴリを分割するモデルを一般化することを目的としている。
本稿では,テキストラベルと潜在的に利用可能な2次元画像モダリティを利用して,コストフリーのマルチモーダルFS-PCSセットアップを提案する。
トレーニングバイアスを軽減するため,テスト時間適応型クロスモーダルセグ(TACC)技術を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:28:41 GMT)
Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.2] タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:02:54 GMT)
Rethinking Code Refinement: Learning to Judge Code Efficiency [60.0] 大規模言語モデル(LLM)は、コードを理解して生成する素晴らしい能力を示しています。
本稿では,2つの異なる符号間の効率を判定するために訓練されたコード言語モデルに基づく新しい手法を提案する。
提案手法は,複数の改良ステップで複数のプログラミング言語に対して検証し,より効率的で少ないバージョンのコードの識別を効果的に行うことができることを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:17:37 GMT)
Model-based RL as a Minimalist Approach to Horizon-Free and Second-Order Bounds [59.9] 本稿では,オンラインとオフラインのRL設定において,モデルベース強化学習方式が強い後悔とサンプル境界を実現することを示す。
我々のアルゴリズムは単純で、かなり標準的であり、実際にRLの文献で広く研究されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:21:36 GMT)
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.2] 大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。
現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。
このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:08:34 GMT)
Integration of Large Language Models and Federated Learning [59.0] 本稿では,LLMとFLの融合を3つの部分に分割する研究フレームワークを提案する。
まず,LLMの領域とFLを組み合わせた研究の現状について概説する。
次に、医療、金融、教育などの重要なシナリオにおけるLLMとFLの組み合わせの実践的応用について論じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:11:17 GMT)
Refined Risk Bounds for Unbounded Losses via Transductive Priors [59.0] 線形回帰の逐次変分を2乗損失、ヒンジ損失の分類問題、ロジスティック回帰で再検討する。
我々の鍵となるツールは、慎重に選択された導出先を持つ指数重み付けアルゴリズムに基づいている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:01:04 GMT)
Investigating Memorization in Video Diffusion Models [58.7] 画像生成やビデオ生成に広く用いられている拡散モデルは、推論中にトレーニングデータを記憶し再生するリスクという、重大な制限に直面している。
まず,VDM(Content memorization and Motion memorization)の2種類の記憶を現実的に定義する。
次に、VDMにおけるコンテンツと動きの記憶を別々に評価するために特別に設計された新しい指標を導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:34:06 GMT)
Task Vectors are Cross-Modal [58.2] 視覚・言語モデル(VLM)の内部表現について検討する。
我々は、例や指示によって指定されたタスクを、テキストまたは画像入力のいずれかを用いて検討する。
概念的に類似したタスクは、どのように指定されたかに関わらず、類似したタスクベクトル表現にマッピングされる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:59:45 GMT)
Image2Struct: Benchmarking Structure Extraction for Vision-Language Models [57.5] Image2Structは、画像から構造を抽出する際のビジョンピクセルモデル(VLM)を評価するためのベンチマークである。
Image2Structでは、VLMが入力画像から基盤構造を生成するように促される。
そして、構造を描画して出力画像を生成し、入力画像と比較して類似度スコアを生成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:44:59 GMT)
A Bayesian Approach to Harnessing the Power of LLMs in Authorship Attribution [57.3] 著者の属性は、文書の起源または著者を特定することを目的としている。
大きな言語モデル(LLM)とその深い推論能力と長距離テキストアソシエーションを維持する能力は、有望な代替手段を提供する。
IMDbおよびブログデータセットを用いた結果, 著者10名を対象に, 著者1名に対して, 85%の精度が得られた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:14:23 GMT)
Benchmarking LLM Guardrails in Handling Multilingual Toxicity [57.3] 7つのデータセットと10以上の言語にまたがる包括的な多言語テストスイートを導入し、最先端ガードレールのパフォーマンスをベンチマークする。
近年の脱獄技術に対するガードレールの弾力性について検討し,ガードレールの性能に及ぼすコンテキスト内安全ポリシーと言語資源の可利用性の影響について検討した。
以上の結果から, 既存のガードレールは多言語毒性の処理に依然として効果がなく, 脱獄プロンプトに対する堅牢性が欠如していることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:51:24 GMT)
Texture, Shape and Order Matter: A New Transformer Design for Sequential DeepFake Detection [57.1] シーケンシャルディープフェイク検出は、順番に操作シーケンスを予測する新しいタスクである。
本稿では, テクスチャ, 形状, 操作順序の3つの視点を探索し, TSOM と呼ばれる新しいトランスフォーマーの設計について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:47:57 GMT)
Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation [56.9] セマンティックはインコンテクストタスクへと発展し、一般化的セグメンテーションモデルを評価する上で重要な要素となった。
我々の最初の焦点は、クエリイメージとサポートイメージの相互作用を容易にする方法を理解することであり、その結果、自己注意フレームワーク内のKV融合法が提案される。
そこで我々はDiffewSというシンプルで効果的なフレームワークを構築し,従来の潜在拡散モデルの生成フレームワークを最大限に保持する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:21:30 GMT)
Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation [56.9] セマンティックはインコンテクストタスクへと発展し、一般化的セグメンテーションモデルを評価する上で重要な要素となった。
我々の最初の焦点は、クエリイメージとサポートイメージの相互作用を容易にする方法を理解することであり、その結果、自己注意フレームワーク内のKV融合法が提案される。
そこで我々はDiffewSというシンプルで効果的なフレームワークを構築し,従来の潜在拡散モデルの生成フレームワークを最大限に保持する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:21:30 GMT)
Unleashing the Potential of the Diffusion Model in Few-shot Semantic Segmentation [56.9] セマンティックはインコンテクストタスクへと発展し、一般化的セグメンテーションモデルを評価する上で重要な要素となった。
我々の最初の焦点は、クエリイメージとサポートイメージの相互作用を容易にする方法を理解することであり、その結果、自己注意フレームワーク内のKV融合法が提案される。
そこで我々はDiffewSというシンプルで効果的なフレームワークを構築し,従来の潜在拡散モデルの生成フレームワークを最大限に保持する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:21:30 GMT)
Scaling LLM Inference with Optimized Sample Compute Allocation [56.5] 我々は、異なる推論構成の最適な混合を見つけるアルゴリズムであるOSCAを提案する。
実験の結果,学習した混合アロケーションでは,最高の単一構成よりも精度がよいことがわかった。
OSCAはシングルターンタスク以外のエージェント処理にも有効であることが示されており、デフォルト設定よりも3倍少ない計算でSWE-Benchの精度が向上している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:17:55 GMT)
DOGS: Distributed-Oriented Gaussian Splatting for Large-Scale 3D Reconstruction Via Gaussian Consensus [56.5] 3DGSを分散訓練するDoGaussianを提案する。
大規模シーンで評価すると,3DGSのトレーニングを6回以上高速化する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:42:40 GMT)
MamMIL: Multiple Instance Learning for Whole Slide Images with State Space Models [56.4] 本稿では,WSI分析のためのフレームワークMamMILを提案する。
私たちは各WSIを非指向グラフとして表現します。
マンバが1次元シーケンスしか処理できない問題に対処するために、トポロジ対応の走査機構を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:48:40 GMT)
To CoT or not to CoT? Chain-of-thought helps mainly on math and symbolic reasoning [55.5] Chain-of-Thought (CoT) は,大規模言語モデル (LLM) から推論能力を引き出すデファクト手法である。
私たちは、CoTが主に数学や論理学を含むタスクに強いパフォーマンス上の利点をもたらし、他のタスクよりもはるかに少ない利益をもたらすことを示しています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:19:28 GMT)
PaGoDA: Progressive Growing of a One-Step Generator from a Low-Resolution Diffusion Teacher [55.2] PaGoDAは、ダウンサンプルデータ上でのトレーニング拡散、事前訓練された拡散の蒸留、プログレッシブ超解像という3段階のトレーニングコストを削減した、新しいパイプラインである。
提案されたパイプラインでは、PaGoDAは8倍のサンプルデータで拡散モデルをトレーニングするコストを64倍に削減する。
PaGoDAのパイプラインは、遅延空間で直接適用することができ、遅延拡散モデルで事前訓練されたオートエンコーダと共に圧縮を追加する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:26:00 GMT)
AutoBench-V: Can Large Vision-Language Models Benchmark Themselves? [55.1] 視覚・言語情報の統合を促進するためには,LVLM(Large Vision-Language Models)が不可欠である。
本稿では,需要評価のための自動フレームワークであるAutoBench-Vを紹介する。
5つの要求されたユーザ入力にまたがる7つのLVLMの広範な評価を通じて、このフレームワークの有効性と信頼性を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:54:40 GMT)
OpenDAS: Open-Vocabulary Domain Adaptation for 2D and 3D Segmentation [55.0] 視覚言語モデル(VLM)にドメイン固有の知識を注入するオープン語彙ドメイン適応の課題を提案する。
既存のVLM適応手法では、ベース(トレーニング)クエリのパフォーマンスが向上するが、新しいクエリ上でのVLMのオープンセット能力を維持できない。
我々のアプローチは、新しいクラスにおける元のVLMを一貫して上回るパラメータ効率の手法である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:03:34 GMT)
Unsupervised Modality Adaptation with Text-to-Image Diffusion Models for Semantic Segmentation [55.0] セグメンテーションタスクのためのテキスト・ツー・イメージ拡散モデル(MADM)を用いたモダリティ適応を提案する。
MADMは、広範囲な画像とテキストのペアで事前訓練されたテキストと画像の拡散モデルを使用して、モデルの相互モダリティ能力を向上する。
我々は,MADMが画像から深度,赤外線,イベントのモダリティといった様々なモダリティタスクにまたがって,最先端の適応性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:49:40 GMT)
Pre-training Differentially Private Models with Limited Public Data [54.9] ディファレンシャルプライバシ(DP)は、モデルに提供されるセキュリティの度合いを測定するための重要な手法である。
DPはまだ、最初の事前訓練段階で使用されるデータのかなりの部分を保護することができない。
公共データの10%しか利用しない新しいDP継続事前学習戦略を開発した。
ImageNet-21kのDP精度は41.5%、非DP精度は55.7%、下流タスクのPlaces365とiNaturalist-2021では60.0%である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:22:58 GMT)
PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7] PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:28:15 GMT)
FEDKIM: Adaptive Federated Knowledge Injection into Medical Foundation Models [54.1] 本研究は,フェデレート・ラーニング・フレームワーク内で医療基盤モデルを拡張するための新しい知識注入手法であるFedKIMを紹介する。
FedKIMは軽量なローカルモデルを活用して、プライベートデータから医療知識を抽出し、この知識を集中基盤モデルに統合する。
7つのモードで12タスクを対象に実験を行い,FedKIMの有効性について検討した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:18:18 GMT)
VLKEB: A Large Vision-Language Model Knowledge Editing Benchmark [53.1] 大規模言語モデル(LLM)の知識編集は注目されている。
3つのメトリクス(信頼性、局所性、一般性)からなる既存のLVLM編集ベンチマークは、合成された評価画像の品質が不足している。
我々は、新しいLarge $textbfV$ision-$textbfL$anguage Modelを構築するために、より信頼性の高いデータ収集手法を使用します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:31:22 GMT)
No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.1] 非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。
本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。
本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:25:44 GMT)
Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.7] 著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:01:18 GMT)
Gradient Distance Function [52.6] また,GDF (Gradient Distance Function) は表面上での微分可能でありながら,開口面を表現可能であることを示す。
これは、ノルムが表面への符号のない距離である3Dベクトルをそれぞれ3Dポイントに関連付けることによって行われる。
本稿では,ShapeNet Car,Multi-Garment,および3D-SceneデータセットにおけるGDFの有効性を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:04:01 GMT)
An Overview and Catalogue of Dependency Challenges in Open Source Software Package Registries [52.2] この記事では、OSSパッケージやライブラリに依存する依存関係関連の課題のカタログを提供する。
このカタログは、これらの課題を理解し、定量化し、克服するために行われた経験的研究に関する科学文献に基づいている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:29:00 GMT)
GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.0] 単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。
モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。
最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:26:12 GMT)
Understanding Synthetic Context Extension via Retrieval Heads [51.9] 本稿では,検索と推論を必要とする3つの長文タスクに対する合成データの微調整について検討する。
合成データに基づいてトレーニングされたモデルは、実際のデータには及ばないが、驚くべきことに、ミスマッチを解釈できる。
我々の結果は、合成データの微調整性能の解釈方法と、長期にわたる実世界の能力学習のためのより良いデータ作成方法に光を当てた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:55:00 GMT)
Generative AI Enabled Matching for 6G Multiple Access [51.0] 我々は6G多重アクセスをサポートするGenAI対応マッチング生成フレームワークを提案する。
我々のフレームワークは、与えられた条件と事前定義された報酬に基づいて、より効果的なマッチング戦略を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:01:26 GMT)
EVER: Exact Volumetric Ellipsoid Rendering for Real-time View Synthesis [50.5] 実時間微分可能な発光専用ボリュームレンダリング法であるExact Volumetric Ellipsoid Rendering (EVER)を提案する。
3D Gaussian Splatting(3DGS)による最近の手法とは異なり、プリミティブベースの表現は正確なボリュームレンダリングを可能にする。
本手法は,3DGSよりもブレンディング問題の方が精度が高く,ビューレンダリングの追従作業も容易であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:17:56 GMT)
FreeSplat: Generalizable 3D Gaussian Splatting Towards Free-View Synthesis of Indoor Scenes [50.5] FreeSplatは、長いシーケンス入力から自由視点合成まで、幾何学的に一貫した3Dシーンを再構築することができる。
ビュー数に関係なく、広いビュー範囲にわたる堅牢なビュー合成を実現するための、シンプルで効果的なフリービュートレーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:30:29 GMT)
Towards Visual Text Design Transfer Across Languages [49.8] マルチモーダル・スタイル翻訳(MuST-Bench)の新たな課題について紹介する。
MuST-Benchは、視覚テキスト生成モデルが様々な書き込みシステム間で翻訳を行う能力を評価するために設計されたベンチマークである。
そこで我々は,スタイル記述の必要性を解消する多モーダルなスタイル翻訳フレームワークであるSIGILを紹介した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:24:22 GMT)
Integration of Communication and Computational Imaging [49.2] 遠隔認識のためのコミュニケーション・計算画像(ICCI)を統合した新しいフレームワークを提案する。
ICCIフレームワークは、情報ソースの生成から最終ビジョンタスクの実行までの情報損失を最小限に抑えるために、全リンク情報転送最適化を行う。
80km27バンドのハイパースペクトル映像の知覚速度は30fpsである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:51:54 GMT)
Normalizing flows as approximations of optimal transport maps via linear-control neural ODEs [49.2] ニューマライズフロー」は、深層ニューラルネットワークを用いて確率測度間の可逆輸送マップを構築するタスクに関連している。
我々は、絶対連続測度$mu,nuinmathcalP(mathbbRn)$間の$Wamma$-optimal transport map $T$を線形制御ニューラルネットワークのフローとして回収する問題を考える。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:35:43 GMT)
Generating Realistic Tabular Data with Large Language Models [49.0] 大規模言語モデル(LLM)は多様なタスクに使われてきたが、特徴と対象変数の正確な相関は捉えていない。
そこで本研究では,LLMに基づく3つの重要な改良を加えて,実データの特徴クラス相関を正しく把握する手法を提案する。
実験の結果,本手法は下流タスクにおいて,20個のデータセット上で10個のSOTAベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:14:32 GMT)
A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [49.0] 大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。
モデルの出力分布に関する高い確率保証を持つ新しい指標を導出する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:39:09 GMT)
A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [49.0] 大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。
すなわち、モデルの出力分布に関する高い確率保証を持つ新しいメトリクスを導出する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:39:09 GMT)
Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning [47.8] 本稿では,多種多様な操作タスクに対して印象的な性能を示す,ループ内視覚に基づくRLシステムを提案する。
提案手法では,実証と人間の修正,効率的なRLアルゴリズム,その他のシステムレベルの設計選択を統合してポリシを学習する。
提案手法は,再現学習のベースラインと先行RLアプローチを著しく上回り,成功率の平均2倍,実行速度1.8倍に向上した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:12:20 GMT)
A Hierarchical Language Model For Interpretable Graph Reasoning [47.5] ノード中心の局所情報と相互作用中心のグローバル構造を捉えるために2ブロックアーキテクチャを用いる階層型グラフ言語モデル(HLM-G)を導入する。
提案手法は,大規模グラフ処理における計算コストを削減しつつ,高い効率性,効率性,ロバスト性で様々なグラフクエリに対処することを可能にする。
多様なグラフ推論およびノード,リンク,グラフレベルの実世界のタスクに対する総合的な評価は,本手法の優位性を強調している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:28:02 GMT)
Synthetic Data Generation with Large Language Models for Personalized Community Question Answering [47.3] 既存のデータセットであるSE-PQAに基づいてSy-SE-PQAを構築します。
以上の結果から,LCMはユーザのニーズに合わせてデータを生成する可能性が高いことが示唆された。
合成データは、たとえ生成されたデータが誤った情報を含むとしても、人書きのトレーニングデータを置き換えることができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:19:08 GMT)
Watch Out for Your Agents! Investigating Backdoor Threats to LLM-Based Agents [47.2] 我々は、LSMベースのエージェントに対して、典型的な安全脅威であるバックドアアタックの1つを調査する第一歩を踏み出した。
具体的には、ユーザ入力とモデル出力のみを操作できる従来のLDMに対するバックドア攻撃と比較して、エージェントバックドア攻撃はより多様で隠蔽的な形式を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:32:04 GMT)
Optimal Linear Decay Learning Rate Schedules and Further Refinements [46.8] 実際に使用される学習率のスケジュールは、理論によって推奨されるものとはほとんど似ていない。
我々はこの理論と実践的ギャップの多くを閉じ、その結果、新しい問題適応型学習率スケジュールを導き出すことができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:57:44 GMT)
Saliency-Based diversity and fairness Metric and FaceKeepOriginalAugment: A Novel Approach for Enhancing Fairness and Diversity [46.7] 我々は、地理、性別、ステレオタイプによるコンピュータビジョンモデルにおける様々な偏見を探索する、FaceKeepOriginalAugmentと呼ばれるKeepOriginalAugment法の拡張を導入する。
データ多様性と情報保存の微妙なバランスを維持することによって、当社のアプローチは、多様な正当性と非正当性の両方を活用するモデルに力を与える。
Flickr Faces HQ(FFHQ)、WIKI、IMDB、Labelled Faces in the Wild(LFW)、UTK Faces、Diverseデータセットなど、さまざまなデータセットのデータセットの多様性を定量化しています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:49:23 GMT)
DreamClear: High-Capacity Real-World Image Restoration with Privacy-Safe Dataset Curation [46.2] 我々は、革新的なデータキュレーションパイプラインであるGenIRと、最先端の拡散変換器(DiT)ベースの画像復元モデルであるDreamClearの2つの戦略を提案する。
我々の先駆的な貢献であるGenIRは、既存のデータセットの制限を克服するデュアルプロンプト学習パイプラインです。
DreamClear は DiT ベースの画像復元モデルである。テキスト・ツー・イメージ(T2I)拡散モデルの生成先行と,マルチモーダル大言語モデル(MLLM)の堅牢な知覚能力を利用して復元を実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:50:12 GMT)
DeepLag: Discovering Deep Lagrangian Dynamics for Intuitive Fluid Prediction [45.8] 本稿では, タングルサム流体力学に対処する新しいラグランジアン・ユーレリア複合パラダイムを提案する。
ユーレアン観測に基づいて未来を予測するのではなく、流体中に隠れたラグランジアン力学を発見するためにDeepLagを提案する。
DeepLagは、2Dと3D、シミュレートされた実世界の流体をカバーする3つの挑戦的な流体予測タスクに優れています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:49:59 GMT)
Are Large-Language Models Graph Algorithmic Reasoners? [45.6] 明示グラフ上の古典的アルゴリズム推論タスクにおいて,LLM(Large Language Models)の性能を評価するために設計されたベンチマークを導入する。
我々のベンチマークは、接続のためのBFS(Breadth-First Search)とDFS(Depth-First Search)、すべてのノードの最短経路に対するDijkstraのアルゴリズムとFloyd-Warshallアルゴリズム、プリムの最小スパンニングツリー(MST-Prim's)アルゴリズムの5つの基本アルゴリズムを含む。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:28:37 GMT)
Location-Free Scene Graph Generation [45.4] シーングラフ生成(SGG)は視覚的理解タスクであり、シーンをエンティティのグラフとして記述し、互いに関連付けることを目的としている。
既存の作業は、バウンディングボックスやセグメンテーションマスクといった形で位置ラベルに依存しており、アノテーションのコストが増加し、データセットの拡張が制限されている。
我々は、この依存関係を破り、位置のないシーングラフ生成(LF-SGG)を導入する。
本課題は, 空間的局所化を明示的に計算することなく, 実体のインスタンスと関係性を予測することを目的とする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:36:29 GMT)
MathPile: A Billion-Token-Scale Pretraining Corpus for Math [45.2] 約950億のトークンからなる多様で高品質な数学中心コーパスであるMathPileを紹介します。
精巧なデータ収集と処理には、複雑な事前処理が含まれていました。
我々は、言語モデルの数学的推論能力を向上し、異なるバージョンをオープンソース化し、フィールドを前進させるためにスクリプトをプロセッシングすることを目指しています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:02:45 GMT)
Identifiability Analysis of Linear ODE Systems with Hidden Confounders [45.1] 本稿では,隠れた共同設立者を組み込んだ線形ODEシステムにおける識別可能性の体系的解析について述べる。
最初のケースでは、潜伏した共同設立者は因果関係を示さないが、その進化は特定の形態に固執する。
その後、この分析を、隠れた共同創設者が因果依存性を示すシナリオにまで拡張する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:15:56 GMT)
AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions [45.0] AutoKaggleは、コード実行と単体テストを組み合わせた反復的な開発プロセスを実装し、コードの正しさとロジックの整合性を保証する。
データクリーニング、特徴工学、モデリングのための検証済み機能を含む汎用データサイエンスツールキットは、このソリューションの基礎を形成します。
AutoKaggleは、一般的なデータサイエンスパイプラインにおけるバリデーションレート0.85と総合スコア0.82を達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:26:03 GMT)
The Road Less Scheduled [45.0] 最適化停止ステップTの仕様を必要としない既存の学習率スケジュールは、Tに依存する学習率スケジュールにより大幅に改善される。
本稿では,スケジュールを全面的に活用することで,この停止時間を回避するアプローチを提案する。
我々のスケジュール自由アプローチは運動量を持つ標準スケジュールに余分なハイパーパラメータを導入しない。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:40:23 GMT)
Histrio: a Serverless Actor System [45.0] Histrioはステートフルアプリケーションの開発を簡単にするプログラミングモデルと実行環境である。
これは、状態管理、データベースのインタラクション、開発者によるプログラミング処理といった懸念を和らげます。
つまり、アプリケーションは常に外部クライアントとのインタラクションが1度だけ処理されたかのように振る舞うということです。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:58:56 GMT)
Faster Local Solvers for Graph Diffusion Equations [44.2] グラフ拡散方程式(GDE)は、クラスタリング、ニューラルネットワークのトレーニング、その他多くのグラフ関連の問題に不可欠である。
既存の反復的な手法では、イテレーション毎にグラフ全体にアクセスする必要があり、大規模なグラフには時間がかかる。
本稿では,局所拡散プロセスを用いてGDEを近似的に解くための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:41:25 GMT)
Distinguishing Ignorance from Error in LLM Hallucinations [43.6] 我々は,2種類の幻覚の区別について,これまでの研究が完全には対応していない,クローズブック質問回答(CBQA)に焦点を当てた。
これらの症例の鑑別は幻覚の検出と緩和に不可欠である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:31:33 GMT)
Adapting Diffusion Models for Improved Prompt Compliance and Controllable Image Synthesis [43.5] この作品は新しい家族を紹介します。
因子グラフ拡散モデル(FG-DM)
FG-DMは結合分布をモデル化する。
イメージやコンディショニング変数、例えばセマンティック、スケッチなどです。
因子グラフ分解による 奥行きや正常な地図です
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:54:00 GMT)
HairDiffusion: Vivid Multi-Colored Hair Editing via Latent Diffusion [43.4] 我々は,多段ヘアスタイルブレンド(MHB)を導入し,拡散遅延空間における毛髪の色と髪型を効果的に分離する。
また、髪の色をターゲット領域に合わせるために、ワープモジュールをトレーニングします。
本手法は多色ヘアスタイルの複雑さに対処するだけでなく,原色保存の課題にも対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:51:52 GMT)
Auditing $f$-Differential Privacy in One Run [43.3] 実証監査は、プライバシ保護アルゴリズムの実装におけるいくつかの欠陥をキャッチする手段として登場した。
本稿では,メカニズムのプライバシを効果的に評価できる,厳密で効率的な監査手順と分析法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:02:22 GMT)
FreeGaussian: Guidance-free Controllable 3D Gaussian Splats with Flow Derivatives [43.1] 本稿では,光学フローとカメラモーションから動的ガウス運動を数学的に導出するFreeGaussianを提案する。
本手法は,フロー先行からの動的ガウス運動の自己教師付き最適化と連続性を実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:29:21 GMT)
Unlocking Point Processes through Point Set Diffusion [43.0] 点拡散に基づく潜在変数モデルである点集合拡散(Point Set Diffusion)を導入する。
提案手法は,距離空間上で定義された複雑な条件付きタスクに対して,効率的な並列サンプリングとフレキシブルな生成を可能にする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:33:18 GMT)
Aligning Machine and Human Visual Representations across Abstraction Levels [42.9] 深層ニューラルネットワークは、視覚タスクにおける人間の振る舞いのモデルなど、幅広いアプリケーションで成功している。
しかしながら、ニューラルネットワークのトレーニングと人間の学習は基本的な方法で異なり、ニューラルネットワークは人間のように堅牢に一般化できないことが多い。
人間の概念的知識は、きめ細かいものから粗いものまで階層的に構成されているが、モデル表現は、これらの抽象レベルをすべて正確に捉えているわけではない。
このミスアライメントに対処するために、私たちはまず、人間の判断を模倣するために教師モデルを訓練し、その表現から事前訓練された状態に人間のような構造を移す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:30:12 GMT)
Metalens formed by structured arrays of atomic emitters [41.9] 原子エミッターの配列は、光学特性の操作と工学を行うための有望なプラットフォームであることが証明されている。
同一の原子エミッタの3つの連続2次元配列の(サブ波長の)格子定数を空間的に調整することにより、大きな伝送係数を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:02:28 GMT)
GLBench: A Comprehensive Benchmark for Graph with Large Language Models [41.9] GLBenchは、教師付きシナリオとゼロショットシナリオの両方でGraphLLMメソッドを評価するための最初の包括的なベンチマークである。
GLBenchはグラフニューラルネットワークのような従来のベースラインとともに、GraphLLMメソッドのさまざまなカテゴリを公平かつ徹底的に評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:49:11 GMT)
GLBench: A Comprehensive Benchmark for Graph with Large Language Models [41.9] GLBenchは、教師付きシナリオとゼロショットシナリオの両方でGraphLLMメソッドを評価するための最初の包括的なベンチマークである。
GLBenchはグラフニューラルネットワークのような従来のベースラインとともに、GraphLLMメソッドのさまざまなカテゴリを公平かつ徹底的に評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:49:11 GMT)
Do Robot Snakes Dream like Electric Sheep? Investigating the Effects of Architectural Inductive Biases on Hallucination [41.7] アーキテクチャに基づく帰納バイアスが幻覚の確率にどのように影響するかを考察する。
発見は、これらの問題を相互によりよく理解することの必要性を強調し、幻覚を扱うためのより普遍的なテクニックをどう設計するかを検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:26:37 GMT)
Neural Experts: Mixture of Experts for Implicit Neural Representations [41.4] 入射神経表現(INR)は、画像、形状、音声、ビデオ再構成など様々なタスクで有効であることが証明されている。
本稿では,局所的な部分的連続関数の学習を可能にする暗黙的ニューラル表現手法(MoE)の混合を提案する。
既存のINRの定式化に専門家アーキテクチャを混在させることで,高速化,精度,メモリ要件が向上することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:11:25 GMT)
Senna: Bridging Large Vision-Language Models and End-to-End Autonomous Driving [41.1] 本稿では,LVLMとエンドツーエンドモデル(Senna-E2E)を組み合わせた自動運転システムであるSennaについて述べる。
Senna-VLMは自然言語で計画決定を生成し、Senna-E2Eは正確な軌道を予測する。
大規模なデータセットDriveXの事前トレーニングとnuScenesの微調整により、セナは事前トレーニングなしで平均計画誤差を27.12%、衝突速度を33.33%削減した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:53:56 GMT)
Reinforcement Learning for Aligning Large Language Models Agents with Interactive Environments: Quantifying and Mitigating Prompt Overfitting [40.8] 強化学習(Reinforcement Learning、RL)は、大規模言語モデル(LLM)知識を逐次意思決定タスクと整合させるための有望なアプローチである。
テキスト環境下でのRL学習後の定式化を促進するために,LLMの感度を解析するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:07:45 GMT)
UltraMedical: Building Specialized Generalists in Biomedicine [40.5] バイオメディカルドメインにおける高品質な手動および合成データセットからなるUltraMedicalコレクションについて述べる。
Llama-3シリーズに基づく専門的な医療モデル群を微調整し、様々な医療ベンチマークで呼吸能力を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:17:08 GMT)
Pessimistic Backward Policy for GFlowNets [40.0] 本稿では,与えられた報酬関数に比例してオブジェクトをサンプリングする生成フローネットワーク(GFlowNets)について検討する。
本研究では,GFlowNetが低軌道の訓練により,高逆対象を過小評価する傾向にあることを示す。
本稿では,GFlowNetsに対する悲観的なバックワードポリシーを提案し,観測されたフローを最大化し,オブジェクトに対する真の報酬と密接に一致させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:11:17 GMT)
Bileve: Securing Text Provenance in Large Language Models Against Spoofing with Bi-level Signature [40.0] 整合性チェックのための微細なシグネチャビットを埋め込んだバイレベルシグネチャスキームであるBileveを導入する。
Bileveは、検出中に5つのシナリオを区別し、テキストを確実にトレースし、LLMを制御する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:12:47 GMT)
TractShapeNet: Efficient Multi-Shape Learning with 3D Tractography Point Clouds [39.9] トラクトグラフィーのポイントクラウド表現を利用した新しいフレームワークTractShapeNetを導入し、5つの形状測度を計算した。
形状測定計算実験により,提案したTractShapeNetは,他のクラウドベースニューラルネットワークモデルよりも優れていることが示された。
その結果,より高速かつ効率的な形状測定計算が実現できることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:53:10 GMT)
Data-driven Global Ocean Modeling for Seasonal to Decadal Prediction [39.7] ORCA-DLは,海洋循環の季節的・季節的な予測を行う最初のデータ駆動型3次元海洋モデルである。
三次元海洋力学を正確にシミュレートし、最先端の力学モデルより優れている。
ケイデンスの時間スケールで海洋力学を安定にエミュレートし、巧妙なデケイデンスの予測や気候予測にもその可能性を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:06:10 GMT)
Quantum optimal control of superconducting qubits based on machine-learning characterization [39.6] デバイスパラメータや環境に合わせて最適な量子制御を実現するための実験的な簡単な手法を提案する。
物理にインスパイアされた機械学習を用いて、実験で利用可能なデータから力学の正確なモデルを推測する。
超伝導トランスモン量子ビット上での任意の単一量子ビット演算を最適化することにより、このアプローチのパワーと実現可能性を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:54:25 GMT)
Paved or unpaved? A Deep Learning derived Road Surface Global Dataset from Mapillary Street-View Imagery [39.1] このデータセットは、グローバルな道路表面情報を300万km以上拡張する。
ほとんどの地域は中程度から高い舗装道路被覆率 (60-80%) を示したが、アフリカやアジアの特定の地域では顕著なギャップが見られた。
本稿では,SWIN-Transformerに基づく道路表面予測とCLIP- and-DLセグメンテーションを併用したハイブリッドディープラーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:06:39 GMT)
Learning Successor Features the Simple Way [39.1] 継承的特徴(SF)は、非定常環境において破滅的な忘れや干渉を示さない学習表現に対する潜在的な解決策を提供する。
画素から直接SFを学習する,新しい,シンプルな手法を提案する。
我々は,従来の2D (Minigrid), 3D (Miniworld) mazes, Mujocoの2つの学習シナリオにおいて,1つの学習シナリオと連続的な学習シナリオの両方において,アプローチが既存のSF学習手法より優れているか,あるいは優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:31:03 GMT)
Not All Languages are Equal: Insights into Multilingual Retrieval-Augmented Generation [38.6] 我々は,このベンチマークを用いて6つの多言語ALMを評価し,多言語ALMの課題について検討した。
オープンソースの言語はモノリンガル知識抽出において際立っている。
インド・ヨーロッパ語は RALM を指導し、文書から直接回答を提供する。
英語は、ALMsの選択バイアスから恩恵を受け、多言語知識の選択においてより大声で話す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:53:19 GMT)
P$^2$C$^2$Net: PDE-Preserved Coarse Correction Network for efficient prediction of spatiotemporal dynamics [38.5] 我々はPDE保存型粗補正ネットワーク(P$2$C$2$Net)を導入し、小さなデータ構造における粗いメッシュグリッド上のPDE問題を解決する。
モデルは,(1)粗い解(すなわちシステム状態)の更新を学習するトレーニング可能なPDEブロックと,(2)一貫した解の修正を行うニューラルネットワークブロックの2つの相乗的モジュールから構成される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:45:07 GMT)
Optical signatures of dynamical excitonic condensates [38.4] 光学分光法により, 位相トラッピングおよび位相デローカライズされた縮合力学系を実験的に同定できることが示されている。
弱バイアス状態においては、秩序パラメータの位相の捕捉されたダイナミクスは、バイアス電圧にほぼ依存しない周波数でギャップ内吸収線につながる。
閉じ込められた状態と自由振動状態の遷移に近づき、弱電場の適用により強い応答が得られた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:16:44 GMT)
Out-of-Distribution Detection & Applications With Ablated Learned Temperature Energy [38.1] OOD検出法としてAblated Learned Temperature Energy(略してAbeT)を導入する。
In-Distribution (ID) と OOD サンプルを区別するためにモデルを学習した理由に関する実証的な知見を提供する。
オブジェクト検出とセマンティックセグメンテーションにおいて,OODオブジェクトに対応する予測境界ボックスと画素を識別する手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:25:49 GMT)
Generalizing Motion Planners with Mixture of Experts for Autonomous Driving [38.0] State Transformer-2は拡張性のあるデコーダのみのモーションプランナで、ViTエンコーダとMoE(Mix-of-experts)因果トランスフォーマーアーキテクチャを使用している。
我々は、ViTエンコーダとMix-of-experts(MoE)因果変換アーキテクチャを用いたスケーラブルでデコーダのみのモーションプランナであるStateTransformer-2(STR2)を紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:35:41 GMT)
Addressing Issues with Working Memory in Video Object Segmentation [37.8] ビデオオブジェクトセグメンテーション(VOS)モデルは、入ってくる未注釈画像と画像マスク関係の歴史を比較する。
芸術モデルの現在の状態は、クリーンなビデオデータで非常によく機能する。
以前のフレームのワーキングメモリへの依存は、エラーの余地を残します。
既存の動作メモリベースのVOSモデルに適用可能な,簡単なアルゴリズム変更を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:34:41 GMT)
Decoupled Data Augmentation for Improving Image Classification [37.5] Decoupled Data Augmentation (De-DA)を導入する。
生成モデルを用いて、制御条件下での実際のCDPの修正を行い、セマンティック一貫性を保つ。
また、画像のCIPをクラス間変種に置き換え、多様なCDP-CIPの組み合わせを作成します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:27:09 GMT)
Meta-Learning Adaptable Foundation Models [37.5] 本稿では,PEFTを組み込んだメタラーニングフレームワークを導入し,未知のタスクに容易に適応可能なモデルを学習する。
この設定では、適応可能なパラメータの集合を見つけるための標準再訓練の準最適性を示す。
次に、これらの理論的洞察をRoBERTaモデルの再訓練に適用し、ConvAI2データセット内の会話の継続を予測する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:24:18 GMT)
Vertical Federated Learning with Missing Features During Training and Inference [37.4] 本稿では,ニューラルネットワークに基づくモデルの学習と推論を効率的に行うための垂直連合学習手法を提案する。
私たちのアプローチは単純だが効果的であり、タスクサンプリングと推論におけるパラメータの戦略的共有に依存しています。
数値実験により, ベースライン上におけるLASER-VFLの性能が向上した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:09:31 GMT)
LiFT: A Surprisingly Simple Lightweight Feature Transform for Dense ViT Descriptors [37.1] 本稿では、高密度下流タスクにおけるVT機能の性能を向上させるための簡易な自己教師手法を提案する。
我々の軽量特徴変換(LiFT)は、単純でコンパクトな後処理ネットワークである。
LiFTは自己指導型で高速かつ容易に訓練でき、ViT機能の密度を最小限の余分な推論コストで向上させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:50:33 GMT)
CultureLLM: Incorporating Cultural Differences into Large Language Models [36.7] CultureLLMは、大きな言語モデルに文化的差異を組み込むためのコスト効率の良いソリューションである。
我々は、リッチで低リソースな言語をカバーする9つの文化に対して、文化固有のLLMと1つの統一モデル(CultureLLM-One)を微調整する。
我々の人間による研究は、生成されたサンプルが元のサンプルと意味的に等価であることを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:11:44 GMT)
LLMs are Highly-Constrained Biophysical Sequence Optimizers [36.3] 大規模言語モデル(LLM)は、最近、様々な生物学的タスクにおいて大きな可能性を示している。
本研究では,LLMを高度に制約された二レベル最適化として活用する可能性について検討する。
本稿では,報酬分布と基準分布を円滑に補間する新たなトレーニング目標であるMargin-Aligned expectation (MargE)を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:45:57 GMT)
Waterfall: Framework for Robust and Scalable Text Watermarking and Provenance for LLMs [36.1] 我々は、堅牢でスケーラブルなテキスト透かしのための最初のトレーニング不要のフレームワークであるWaterfallを提案する。
ウォーターフォールは、SOTAの記事テキストによるウォーターマーキング法と比較して、スケーラビリティ、堅牢な検証可能性、計算効率を著しく向上させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:02:51 GMT)
EquiBot: SIM(3)-Equivariant Diffusion Policy for Generalizable and Data Efficient Learning [36.0] 本研究では,ロボット操作タスク学習のための頑健で,データ効率が高く,汎用的なアプローチであるEquibotを提案する。
提案手法は,SIM(3)等価なニューラルネットワークアーキテクチャと拡散モデルを組み合わせたものである。
本手法は,5分間の人間による実演から学ぶことで,新しい物体やシーンに容易に一般化できることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:49:41 GMT)
M$^2$IST: Multi-Modal Interactive Side-Tuning for Efficient Referring Expression Comprehension [36.0] 参照式理解(Referring Expression comprehension、REC)は、言語表現に基づいて画像中の対象物を特定する視覚言語タスクである。
PETL法は, 調整可能なパラメータが少なく, 高い性能を示した。
M$2$IST: Multi-Modal Interactive Side-Tuning with M$3$ISAs: Mixture of Multi-Modal Interactive Side-Adapters。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:57:42 GMT)
Understanding the RoPE Extensions of Long-Context LLMs: An Attention Perspective [35.9] 本稿では,RoPE拡張の注意点から,直接的かつ詳細な理解を提供する。
RoPE拡張の長い継続事前トレーニング長を使用することで、注意の不確実性を低減し、外挿を著しく向上させることができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:29:31 GMT)
Natural Language Inference Improves Compositionality in Vision-Language Models [35.7] 所与の前提から細部と矛盾を生じさせる原則的アプローチを提案する。
CECEは、その中核的な意味を維持しながら、語彙的に多様な文を生成する。
我々は、追加の微調整を必要とせず、従来の方法よりも大幅に改善した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:54:17 GMT)
AAAR-1.0: Assessing AI's Potential to Assist Research [34.9] AAAR-1.0は,大規模言語モデル(LLM)の性能を評価するためのベンチマークデータセットである。
AAAR-1.0は、以前のベンチマークと大きく異なる2つの主要な方法である: 第一に、明らかに研究指向で、深いドメインの専門知識を必要とするタスク、第二に、研究者が日々従事する主要なアクティビティを反映する研究者指向である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:58:29 GMT)
Multi-hypotheses Conditioned Point Cloud Diffusion for 3D Human Reconstruction from Occluded Images [34.5] 本稿では,確率分布に条件付き点雲拡散を用いた新しいパイプライン MHCDIFF を提案する。
従来の暗黙関数に基づく手法と比較して、点雲拡散モデルでは、グローバルな一貫した特徴を捉えて、隠蔽領域を生成することができる。
提案手法は,SMPL,暗黙関数,点雲拡散,それらを組み合わせた様々なSOTA法より優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:33:50 GMT)
Multi-hypotheses Conditioned Point Cloud Diffusion for 3D Human Reconstruction from Occluded Images [34.5] 本稿では,確率分布に条件付き点雲拡散を用いた新しいパイプライン MHCDIFF を提案する。
従来の暗黙関数に基づく手法と比較して、点雲拡散モデルでは、グローバルな一貫した特徴を捉えて、隠蔽領域を生成することができる。
提案手法は,SMPL,暗黙関数,点雲拡散,それらを組み合わせた様々なSOTA法より優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:33:50 GMT)
Multi-hypotheses Conditioned Point Cloud Diffusion for 3D Human Reconstruction from Occluded Images [34.5] 本稿では,確率分布に条件付き点雲拡散を用いた新しいパイプライン MHCDIFF を提案する。
従来の暗黙関数に基づく手法と比較して、点雲拡散モデルでは、グローバルな一貫した特徴を捉えて、隠蔽領域を生成することができる。
提案手法は,SMPL,暗黙関数,点雲拡散,それらを組み合わせた様々なSOTA法より優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:33:50 GMT)
Contextual Representation Anchor Network to Alleviate Selection Bias in Few-Shot Drug Discovery [34.3] 本稿では,分子の表現のクラスタ中心をアンカーと呼ぶ,文脈表現アンカーネットワーク(CRA)を提案する。
CRAは、文脈増強を含む二重増強機構を導入し、類似の未標識分子を動的に回収する。
我々は,MoleculeNetおよびFS-Molベンチマークおよびドメイン転送実験におけるアプローチを評価した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:40:41 GMT)
SVIP: Towards Verifiable Inference of Open-source Large Language Models [33.9] オープンソースのLarge Language Models (LLMs)は、最近、自然言語の理解と生成において顕著な能力を示し、様々な領域で広く採用されている。
モデルのサイズが大きくなることで、個々のユーザにとってローカルデプロイメントは現実的ではなく、ブラックボックスAPIを通じて推論を行うコンピューティングサービスプロバイダに頼らざるを得なくなる。
この依存は新たなリスクをもたらす: コンピューティングプロバイダは、要求されたLLMをユーザからの同意なく、より小さく、能力の低いモデルにステルス的に置き換えて、コスト削減の恩恵を受けながら、劣ったアウトプットを配信する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:52:45 GMT)
M-RewardBench: Evaluating Reward Models in Multilingual Settings [33.4] 我々は、M-RewardBenchというマルチリンガルRM評価ベンチマークを構築した。
M-RewardBenchは23の類型的に多様な言語に対する2.87kの好みのインスタンスで構成されている。
RMの性能が向上し,翻訳品質が向上したことを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:28:42 GMT)
Genetic-guided GFlowNets for Sample Efficient Molecular Optimization [33.3] 深層学習に基づく生成手法の最近の進歩は、将来性を示しているが、サンプル効率の問題に直面している。
本稿では,強力な遺伝的アルゴリズムを深く生成する手法として,サンプル効率のよい分子最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:19:53 GMT)
GPT-4o reads the mind in the eyes [33.3] GPT-4oは直立顔からの精神状態の解釈において人間よりも優れていた。
GPT-4oの誤りはランダムではなかったが、高度に一貫性があり、不正確な精神状態情報の処理が明らかにされた。
これらの知見は, GPT-4oに共存する逆効果のような, 高度な精神状態推論能力と人間の顔処理のサインが如何に重要であるかを明らかにする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:53:10 GMT)
USimAgent: Large Language Models for Simulating Search Users [33.2] 本稿では,大規模言語モデルに基づくユーザ検索行動シミュレータUSimAgentを紹介する。
シミュレータは、検索中のユーザのクエリ、クリック、動作の停止をシミュレートすることができる。
実ユーザ行動データセットに関する実証調査では、シミュレータがクエリ生成において既存のメソッドよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:13:49 GMT)
Solving Quadratic Systems with Full-Rank Matrices Using Sparse or Generative Priors [33.0] 二次系$y_i=boldsymbol xtopboldsymbol A_iboldsymbol x, i=1,ldots,m$とフルランク行列$boldsymbol A_i$からの信号を回復する問題は、未割り当て距離幾何学やサブ波長イメージングなどの応用で頻繁に発生する。
本稿では、$mll n$ が $boldsymbol x$ の事前知識を取り入れた高次元の場合について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:39:54 GMT)
EG-SpikeFormer: Eye-Gaze Guided Transformer on Spiking Neural Networks for Medical Image Analysis [32.6] 医用画像の診断関連領域に注意を向けるために、眼球データを含む臨床作業に適したSNNアーキテクチャであるEG-SpikeFormerを紹介する。
提案手法は,特に臨床データに制限があり,信頼性,汎用性,透明性が要求されるシナリオにおいて,従来のモデルでよく見られるショートカット学習の問題に効果的に対処する。
我々のEG-SpikeFormerは、医療画像予測タスクにおいて優れたエネルギー効率と性能を示すだけでなく、マルチモーダル情報アライメントによる臨床関連性を高める。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:17:48 GMT)
Deep Group Interest Modeling of Full Lifelong User Behaviors for CTR Prediction [32.4] Deep Group Interest Network (DGIN) は、ユーザーの行動履歴をモデル化するエンド・ツー・エンドの手法である。
DGINグルーピングはO(104)からO(102)までの行動長を著しく減少させる
我々は、生涯の行動シーケンスから、同じ項目_idと候補項目を共有する行動のサブセットを同定する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:56:26 GMT)
Are Decoder-Only Large Language Models the Silver Bullet for Code Search? [32.3] 本研究では,コード検索のためのデコーダのみの大規模言語モデルについて,初めて体系的な検討を行った。
2つの微調整法、2つのデータセット、3つのモデルサイズを用いて、最先端デコーダのみの9つのモデルを評価する。
この結果,微調整のCodeGemmaはUniXcoderのようなエンコーダのみのモデルよりも大幅に優れていることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:05:25 GMT)
Accelerating Relative Entropy Coding with Space Partitioning [32.3] 相対エントロピー符号化(REC)アルゴリズムは、ターゲット分布の$Q$に従ってランダムサンプルを符号化する。
RECアルゴリズムは、少なくとも2D_textKL[Q||P]$の順序で、禁止符号化時間に悩まされる。
本稿では,空間分割を利用したREC方式を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:14:32 GMT)
The Sample-Communication Complexity Trade-off in Federated Q-Learning [31.6] 広範に使われている間欠的通信アルゴリズムにおけるサンプルと通信複雑性のトレードオフについて検討する。
我々は、注文最適サンプルと通信の複雑さを同時に達成する最初のフェデレーションQ-ラーニングアルゴリズムであるFed-DVR-Qを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:37:04 GMT)
Towards Unifying Understanding and Generation in the Era of Vision Foundation Models: A Survey from the Autoregression Perspective [31.5] 本稿では、最近の進歩を概観し、自己回帰的視覚基盤モデルの将来的な方向性について論じる。
我々は,次世代の視覚基礎モデルのトレンドを提示し,視覚タスクの理解と生成を統一する。
我々は、自己回帰的視覚基盤モデルを、その視覚トークン化剤と自己回帰バックボーンから分類する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:48:22 GMT)
UnlearnCanvas: Stylized Image Dataset for Enhanced Machine Unlearning Evaluation in Diffusion Models [31.5] 拡散モデル(DM)はテキスト・画像生成において前例のない機能を示し、多様な用途で広く利用されている。
彼らはまた、有害なコンテンツの生成や著作権紛争など、社会的な問題も提起している。
マシン・アンラーニング(MU)は、DMから望ましくない生成能力を除去できる有望なソリューションとして登場した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:36:06 GMT)
$r$Age-$k$: Communication-Efficient Federated Learning Using Age Factor [31.3] Federated Learning(FL)は、パラメータサーバ(PS)によって調整された複数のクライアントが統合された機械学習モデルをトレーニングする、協調的なアプローチである。
本稿では,FLの2つの制限に対処するために,情報量測定の年齢を用いた新しい通信効率アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:30:34 GMT)
Benchmarking Graph Learning for Drug-Drug Interaction Prediction [30.7] 薬物・薬物相互作用の予測(DDI)は薬理学と医療において重要な役割を担っている。
近年,薬物と薬物の相互作用を予測するグラフ学習法が提案されている。
グラフ学習におけるDDI予測ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:07:49 GMT)
State Space Models on Temporal Graphs: A First-Principles Study [30.5] 深層グラフ学習の研究は、動的挙動を示す実世界の複雑なシステムに応答して、静的グラフから時間グラフへ移行した。
RNNやTransformerのようなシーケンスモデルは、このような時間グラフをモデル化するための主要なバックボーンネットワークである。
時間グラフのダイナミクスをモデル化するためのグラフ状態空間モデルであるGraphSSMを開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:32:15 GMT)
A Statistical Viewpoint on Differential Privacy: Hypothesis Testing, Representation and Blackwell's Theorem [30.4] 我々は、差分プライバシーはテクストプア統計概念とみなすことができると論じる。
$f$-differential privacyは、データ分析と機械学習のプライバシー境界を分析するための統合フレームワークである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:30:58 GMT)
Discrete Modeling via Boundary Conditional Diffusion Processes [30.0] 従来のアプローチは、離散データと継続的モデリングの相違に悩まされてきた。
本稿では,まず境界を先行分布として推定する2段階の前進過程を提案する。
次に前方軌道を再スケールして境界条件拡散モデルを構築する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:42:42 GMT)
Cross-Entropy Is All You Need To Invert the Data Generating Process [29.9] 経験的現象は、教師付きモデルが線形な方法で変化の解釈可能な要因を学習できることを示唆している。
近年の自己教師型学習の進歩により,データ生成過程を反転させることで潜在構造を復元できることが示されている。
標準分類タスクにおいても,モデルが線形変換までの変動の基底構造因子の表現を学習することが証明された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:03:57 GMT)
QTIP: Quantization with Trellises and Incoherence Processing [29.9] 後トレーニング量子化(PTQ)は、LLMのメモリフットプリントを削減する。
最近の最先端のPTQアプローチでは、ベクトル量子化(VQ)を使用して複数の重みを同時に定量化している。
超高次元量子化を実現するためにトレリス符号化量子化(TCQ)を用いるQTIPを導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:55:48 GMT)
Subgraph Aggregation for Out-of-Distribution Generalization on Graphs [29.9] グラフニューラルネットワーク(GNN)におけるアウト・オブ・ディストリビューション(OOD)の一般化は注目されている。
多様なサブグラフの集合を学習するために設計された新しいフレームワークSubGraph Aggregation(SuGAr)を提案する。
合成データセットと実世界のデータセットの両方の実験では、SuGArが最先端の手法より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:54:37 GMT)
SkipSNN: Efficiently Classifying Spike Trains with Event-attention [29.6] スパイクトレインの分類は最近、機械学習コミュニティにおいて重要なトピックとなっている。
有望なモデルは、関心の信号が現れる場合にのみ集中的な計算を行うという設計原則に従うべきである。
本稿では,SNNが本来のスパイク列車の有用な信号に動的にハイライトできるイベントアテンション機構を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:19:25 GMT)
Active Learning for Vision-Language Models [29.3] 視覚言語モデル(VLM)のゼロショット分類性能を向上させる新しいアクティブラーニング(AL)フレームワークを提案する。
提案手法はまず, VLMの予測エントロピーを校正し, 自己不確かさと隣接認識の不確実性の組み合わせを用いて, 有効試料選択のための信頼性のある不確実性尺度を算出する。
提案手法は,複数の画像分類データセットにおいて,既存のAL手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:25:50 GMT)
Dimensionality-induced information loss of outliers in deep neural networks [29.2] ディープニューラルネットワーク(DNN)を用いたシステムにおいて、アウト・オブ・ディストリビューション(OOD)検出は重要な問題である
複数の視点から特徴表現の層依存性を調べることにより,この問題を実験的に解明する。
特徴量と重みのアライメントに基づく次元認識型OOD検出手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:52:46 GMT)
Spatio-temporal Transformers for Action Unit Classification with Event Cameras [29.0] 本稿では,RGBビデオとイベントストリームからなる時間同期型マルチモーダル顔データセットであるFACEMORPHICを提案する。
映像を手動でアノテートすることなく、時間同期が効果的なニューロモルフィック顔分析を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:23:09 GMT)
RuleR: Improving LLM Controllability by Rule-based Data Recycling [28.7] ルールベースのデータリサイクリング(RuleR)は、オリジナルのSFTデータに複数の制約を組み込んだ人間/LLMフリーデータ拡張手法である。
RuleRは、言語またはフォーマットルールを元の命令に統合し、ルール定義の制約を満たすために応答を変更する。
一般的な命令追従性能を維持しつつ,LLM制御性の向上におけるルールRの有効性を実証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:28:24 GMT)
Context-Aware Assistant Selection for Improved Inference Acceleration with Large Language Models [28.6] 大規模言語モデル(LLM)は、リソース制約の下での使用は禁じられている。
自動回帰生成に付随する高いレイテンシは、高度なコンピューティングインフラストラクチャに依存する大きなLLMをレンダリングする。
復号化支援は これを軽減するのに役立ちましたが 2つのモデルのアライメントに依存しています
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:25:36 GMT)
Context-Aware Assistant Selection for Improved Inference Acceleration with Large Language Models [28.6] 大規模言語モデル(LLM)は、リソース制約の下での使用は禁じられている。
自動回帰生成に付随する高いレイテンシは、高度なコンピューティングインフラストラクチャに依存する大きなLLMをレンダリングする。
復号化支援は これを軽減するのに役立ちましたが 2つのモデルのアライメントに依存しています
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:25:36 GMT)
ASVD: Activation-aware Singular Value Decomposition for Compressing Large Language Models [28.2] 大規模言語モデル(LLM)のための新しい訓練後圧縮パラダイムを提案する。
この課題は, LLM活性化の分散分散と, 各種層間の感度差に起因する。
我々は、アクティベーション対応特異値分解(ASVD)と呼ばれるトレーニング不要の手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:28:58 GMT)
Predicting Future Actions of Reinforcement Learning Agents [27.7] 本稿では,3種類の強化学習エージェントの今後の行動と事象予測の有効性を実験的に評価し,比較した。
エージェントの内部計算に基づいて予測を行う内部状態アプローチと、学習された世界モデルでエージェントをアンロールするシミュレーションベースのアプローチの2つのアプローチを採用する。
内部計画を使用することで、アクションを予測する場合のシミュレーションベースのアプローチと比較して、モデル品質がより堅牢であること、イベント予測の結果がより混在していることが証明される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:48:18 GMT)
Anticipating Future with Large Language Model for Simultaneous Machine Translation [27.6] 同時機械翻訳(SMT)は、ストリーミング入力の発話を受け取り、ターゲットテキストを漸進的に生成する。
我々は、$textbfA$nticipating $textbfF$uture (TAF)による$textbfT$ranslationを提案する。
その中核となる考え方は、大きな言語モデル(LLM)を使用して将来のソース語を予測し、過剰なリスクを伴わずに機会的に翻訳することである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:42:30 GMT)
OmniGS: Fast Radiance Field Reconstruction using Omnidirectional Gaussian Splatting [27.5] 現在の3次元ガウス散乱システムは、歪みのない視点画像を用いた放射場再構成しかサポートしていない。
高速な放射野再構成のための全方位画像を利用するため,新しい全方位撮影システムであるOmniGSを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:49:34 GMT)
GraphCLIP: Enhancing Transferability in Graph Foundation Models for Text-Attributed Graphs [27.2] GraphCLIPは、強力なクロスドメインゼロ/フェーショット転送可能性を持つグラフ基盤モデルを学習するためのフレームワークである。
LLMの助けを借りて、大規模グラフ-土木ペアデータを生成し、キュレートする。
数ショットの学習では,事前学習目標に沿った新しいグラフプロンプトチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:10:41 GMT)
Iterative Window Mean Filter: Thwarting Diffusion-based Adversarial Purification [26.9] 顔認証システムは、敵攻撃のような目立たない摂動に敏感なため、信頼性が低い。
我々はIWMF (Iterative Window Mean Filter) と呼ばれる,新しい非深層学習に基づく画像フィルタを開発した。
我々は,IWMFと拡散モデルを統合した,IWMF-Diffという逆浄化のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:46:36 GMT)
Iterative Window Mean Filter: Thwarting Diffusion-based Adversarial Purification [26.9] 顔認証システムは、敵攻撃のような目立たない摂動に敏感なため、信頼性が低い。
我々はIWMF (Iterative Window Mean Filter) と呼ばれる,新しい非深層学習に基づく画像フィルタを開発した。
我々は,IWMFと拡散モデルを統合した,IWMF-Diffという逆浄化のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:46:36 GMT)
Can LLMs Learn by Teaching for Better Reasoning? A Preliminary Study [26.3] 既存のLLMトレーニング/プロンプティングパイプラインにLbTのアイデアを組み込むことができ、改善がもたらされることを示す。
具体的には,LbTの3つのレベルのうちの1つを模倣する3つの手法を設計する。
学生が学習しやすくする教材は、学生の「学習」方法としてコンテキスト内学習を用いることで、より明確で正確な論理を習得する。(2)弱体化:LbTは、弱体化モデルを教えることによって、強力なモデルを改善するのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:02:40 GMT)
EEG-based Multimodal Representation Learning for Emotion Recognition [26.3] 本稿では,ビデオ,画像,音声などの従来のモダリティだけでなく,脳波データも組み込んだ新しいマルチモーダルフレームワークを提案する。
本フレームワークは,様々な入力サイズを柔軟に扱えるように設計されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:35:17 GMT)
GO4Align: Group Optimization for Multi-Task Alignment [26.0] 本稿では,タスク間の最適化を明示的に調整することで,タスクの不均衡に対処するマルチタスク最適化手法である textitGO4Align を提案する。
各種ベンチマークにおける総合的な実験結果から, 計算コストの低減とともに, 提案手法の性能上の優位性を実証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:06:04 GMT)
SS3DM: Benchmarking Street-View Surface Reconstruction with a Synthetic 3D Mesh Dataset [26.0] ストリートビューシナリオのための正確な3D表面の再構築は、デジタルエンターテイメントや自動運転といったアプリケーションにとって不可欠である。
CARLAシミュレータからエクスポートしたtextbfSynthetic textbfStreet-view textbf3D textbfMeshモデルからなるSS3DMデータセットを提案する。
6台のRGBカメラと5台のLiDARセンサーを搭載した車両を、多様な屋外シーンで仮想的に駆動する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:54:45 GMT)
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks [26.0] 線形時間推論の複雑さと自然列長外挿能力を備えたxLSTMを用いたLRAM(Large Recurrent Action Model)を提案する。
6つのドメインから432のタスクを実験したところ、LRAMはパフォーマンスとスピードの点でTransformerと良好に比較できることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:55:47 GMT)
Sliced-Wasserstein-based Anomaly Detection and Open Dataset for Localized Critical Peak Rebates [25.5] 我々はスライス-ワッサーシュタイン計量を用いた新しい教師なし異常検出法(AD)を提案する。
このフィルタリング技術は、エネルギーのような重要な分野に信頼できる機械学習モデルをデプロイするMLOpsパイプラインの統合において、概念的に興味深い。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:54:48 GMT)
ZALM3: Zero-Shot Enhancement of Vision-Language Alignment via In-Context Information in Multi-Turn Multimodal Medical Dialogue [25.4] オンライン医療相談のシナリオでは、医師は患者が複数のラウンドで提供したテキストや画像に反応し、健康状態の診断を行う。
従来の医療用視覚質問応答 (Med-VQA) において, 専門機器が取得した高品質な画像とは違って, 症例内の画像は患者の携帯電話で撮影される。
マルチターンマルチモーダル医療対話における視覚言語アライメントを改善するゼロショット戦略であるZALM3を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:48:01 GMT)
EI-Nexus: Towards Unmediated and Flexible Inter-Modality Local Feature Extraction and Matching for Event-Image Data [25.4] イベントカメラは時間分解能が高く、ダイナミックレンジも高い。
EI-Nexusは,2つのモダリティ固有のキーポイント抽出器と特徴整合器を統合した,非媒介かつ柔軟なフレームワークである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:10:34 GMT)
GPT-NAS: Evolutionary Neural Architecture Search with the Generative Pre-Trained Model [25.2] この研究は、GPT(Generative Pre-Trained)モデルによってニューラルネットワークを最適化する、GPT-NASと呼ばれる新しいアーキテクチャ探索アルゴリズムを提案する。
GPT-NASでは、大規模コーパスで事前学習した生成モデルが、ニューラルネットワーク構築の基本法則を学習できると仮定する。
GPT-NAS法は7つの手動設計ニューラルアーキテクチャと競合NAS法によって提供される13のアーキテクチャを著しく上回っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:03:06 GMT)
PointCompress3D: A Point Cloud Compression Framework for Roadside LiDARs in Intelligent Transportation Systems [24.8] この研究は、ロードサイドのLiDARに特化した新しいポイントクラウド圧縮フレームワークであるPointCompress3Dを紹介した。
実世界のTUMTrafデータセットファミリを用いて,3つの最先端圧縮手法を適応し,拡張し,統合し,評価する。
大規模な実験およびアブレーション研究において、データセット上でPSNR d2の94.46とBPPの6.54を達成した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:10:00 GMT)
Localizing Memorization in SSL Vision Encoders [24.7] SSLエンコーダにおけるメモリのローカライズのための2つの指標について,レイヤ単位(Layermem)とユニット単位単位(unitmem)について提案する。
SSLのメモリ化は層深度とともに増加するが、高いメモリ化ユニットはエンコーダ全体に分散している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:13:18 GMT)
Localizing Memorization in SSL Vision Encoders [24.7] SSLエンコーダにおけるメモリのローカライズのための2つの指標について,レイヤ単位(Layermem)とユニット単位単位(unitmem)について提案する。
SSLのメモリ化は層深度とともに増加するが、高いメモリ化ユニットはエンコーダ全体に分散している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:13:18 GMT)
A Survey on RGB, 3D, and Multimodal Approaches for Unsupervised Industrial Anomaly Detection [24.6] 非監督型産業異常検出(UIAD)技術は、異常サンプルの不足を効果的に克服し、スマートマニュファクチャリングの自動化と信頼性を高める。
RGB, 3D, マルチモーダル異常検出は, 産業情報化分野における包括的かつ堅牢な機能を示している。
3次元UIADとマルチモーダルUIADに着目し、3つのモード設定で、教師なしの産業異常検出の包括的概要を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:12:45 GMT)
Preserving Pre-trained Representation Space: On Effectiveness of Prefix-tuning for Large Multi-modal Models [24.6] 大規模マルチモーダルモデル(LMM)は、機械が世界と対話する方法に革命をもたらしている。
下流タスクにLMMを適用するために,パラメータ効率細調整(PEFT)が普及している。
本稿では,各チューニング戦略の長所と短所に着目し,これらのアプローチに典型的な効率性から焦点を移す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:55:50 GMT)
DAGE: DAG Query Answering via Relational Combinator with Logical Constraints [24.6] DAGEと呼ばれるDAGクエリに対するクエリ埋め込み手法を提案する。
DAGEは2つのノード間の可能性のある複数のパスを、トレーニング可能なオペレータで単一のパスに結合する。
既存のクエリ埋め込みメソッド上にDAGEを実装することが可能であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:02:48 GMT)
PhysMLE: Generalizable and Priors-Inclusive Multi-task Remote Physiological Measurement [24.4] 本稿では,マルチタスク遠隔生理計測(PhysMLE)のためのローランクエキスパートのエンドツーエンド混合について述べる。
PhysMLEは、新しいルータ機構を持つ複数の低ランクの専門家に基づいており、モデルがタスク内の仕様と相関の両方を十分に扱えるようにしている。
公平かつ包括的な評価のために,マルチソース・シンセマンティック・ドメイン・ジェネリゼーション・プロトコルと呼ばれる大規模マルチタスク・ジェネリゼーション・ベンチマークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:15:41 GMT)
Fairness in Ranking under Disparate Uncertainty [24.4] 我々は、基礎となる関連モデルの不確実性がオプション群間で異なる場合、ランク付けは不公平をもたらす可能性があると論じる。
ランク付けのための新しい公正基準として平等ランク付け(EOR)を提案する。
異なる不確実性が存在する場合でも、EORは関連する選択肢の中でグループワイドフェア・宝くじに対応していることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:21:49 GMT)
Reliable and Compact Graph Fine-tuning via GraphSparse Prompting [24.4] グラフプロンプトおよびグラフスパースプロンプト(GSP)におけるスパース表現理論の活用を提案する。
GSPは、下流タスクのコンパクトなプロンプトを達成するために最適な要素を適応的かつ簡潔に選択することを目的としている。
GSFP と GSmFP モデルを解くために、単純で効果的なアルゴリズムが設計された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:31:14 GMT)
Emergence of Globally Attracting Fixed Points in Deep Neural Networks With Nonlinear Activations [24.1] 本稿では、2つの異なる入力に対して隠された表現の類似性を計測するカーネルシーケンスの進化に関する理論的枠組みを提案する。
非線形アクティベーションに対しては、カーネルシーケンスは、アクティベーションとネットワークアーキテクチャに依存する同様の表現に対応可能な、一意の固定点にグローバルに収束する。
この研究は、ディープニューラルネットワークの暗黙のバイアスと、アーキテクチャ上の選択が層間の表現の進化にどのように影響するかについて、新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:52:19 GMT)
Synergizing LLM Agents and Knowledge Graph for Socioeconomic Prediction in LBSN [24.0] 位置情報ベースのソーシャルネットワーク(LBSN)は、社会に大きな変化をもたらし、社会経済予測にLBSNデータを使用することが広く研究されている。
既存のアプローチは、様々なデータからタスク関連知識を抽出するアイデアと専門知識に依存しており、これは特定のタスクに最適ではないかもしれない。
本研究は,大言語モデル(LLM)の常識推論,埋め込み,マルチエージェント協調における顕著な能力により,LLMエージェントと知識グラフを社会経済予測のために相乗化したものである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:03:15 GMT)
A Full-duplex Speech Dialogue Scheme Based On Large Language Models [24.0] シームレスな対話を可能にする 生成生成対話システムです
システムは問い合わせ応答のためのトークンを生成し、ユーザを待ち、あるいは操作するために自律的な決定を行う。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:44:03 GMT)
Empirical Design in Reinforcement Learning [23.9] 現在、数十のタスクに対して数百万のパラメータを持つエージェントのベンチマークが一般的であり、それぞれが30日間の経験に相当するものを使用している。
これらの実験の規模は、特にアルゴリズムの比較において、適切な統計的証拠の必要性と矛盾することが多い。
この写本は、行動への呼びかけと、強化学習において優れた実験を行うための包括的なリソースの両方を表現している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:44:21 GMT)
Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction [23.5] 文書解析は、構造化されていない文書と半構造化された文書を機械可読データに変換するのに不可欠である。
文書解析は知識ベースの構築とトレーニングデータ生成において不可欠である。
本稿では,モジュール型文書解析システムと複雑なレイアウト処理における視覚言語モデルが直面する課題について論じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:32:24 GMT)
Federated Deep Equilibrium Learning: Harnessing Compact Global Representations to Enhance Personalization [23.3] Federated Learning(FL)は、クライアントがデータを交換することなくグローバルモデルを協調的にトレーニングできる、画期的な分散学習パラダイムとして登場した。
FeDEQは,高効率なパーソナライズのために,コンパクトなグローバルデータ表現を利用するために,深い平衡学習とコンセンサス最適化を取り入れた新しいFLフレームワークである。
FeDEQは,訓練中の通信サイズを最大4倍,メモリフットプリントを1.5倍に削減しつつ,最先端のパーソナライズされたFL法の性能に適合することを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:58:08 GMT)
Periodic agent-state based Q-learning for POMDPs [23.3] 広く使われている代替手段は、観測履歴のモデルのない周期的に更新可能な機能であるエージェント状態を使用することである。
本稿では,エージェント状態に基づくQ-ラーニングの変種であるPA(エージェント状態に基づくQ-ラーニング)を提案する。
周期的マルコフ連鎖のアイデアと近似を組み合わせることで、PAが巡回極限に収束し、周期的ポリシーの近似誤差を特徴付けることを厳密に証明する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:56:17 GMT)
How Does Critical Batch Size Scale in Pre-training? [23.3] 与えられたリソースの下で大規模なモデルを訓練するには、並列性戦略を慎重に設計する必要がある。
我々は、C4データセット上で、CBSと、C4データセット上の8500万から12億のパラメータを含む一連の自動回帰言語モデルを事前訓練する尺度を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:54:06 GMT)
Modeling Temporal Positive and Negative Excitation for Sequential Recommendation [23.1] シークエンシャルレコメンデーションは、時間とともにアイテムに対する関心をモデル化することで、ユーザーが興味を持つ次のアイテムを予測することを目的としている。
既存のリコメンデーションモデルのほとんどは、ユーザの静的な関心を静的な属性情報によって明らかにしながら、特定の項目に対する動的関心を連続的にモデル化する。
静的興味と負の励起の両方をモデル化して動的関心をモデル化し、推薦性能をさらに向上する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:02:11 GMT)
Motion Graph Unleashed: A Novel Approach to Video Prediction [23.0] ビデオ予測問題に対する新しいアプローチであるモーショングラフを導入し,過去の限られたデータから将来の映像フレームを予測する。
モーショングラフは、ビデオフレームのパッチを相互接続されたグラフノードに変換し、それらの間の空間的時間的関係を包括的に記述する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:39:31 GMT)
Ripple: Accelerating LLM Inference on Smartphones with Correlation-Aware Neuron Management [22.9] 大規模言語モデル(LLM)は、さまざまな領域で大きな成功を収めていますが、モバイルデバイスにデプロイすることは難しい課題です。
我々は、フラッシュメモリにおけるニューロン配置を最適化することにより、スマートフォン上でのLSM推論を高速化する新しいアプローチであるRippleを提案する。
私たちは、Rippleが最先端と比較して最大5.93倍のI/Oレイテンシ改善を実現していることを実証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:33:19 GMT)
Causal Effect Identification in a Sub-Population with Latent Variables [22.8] s-ID問題は、同じサブ集団に関する観測データから、特定のサブ集団における因果効果を計算しようとする。
本稿では,潜伏変数の存在を許容するs-ID問題の拡張について考察する。
潜伏変数を持つs-ID問題に対する音響アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:15:37 GMT)
AdvWeb: Controllable Black-box Attacks on VLM-powered Web Agents [22.7] AdvWebは、Webエージェント向けに設計された新しいブラックボックス攻撃フレームワークである。
DPOを用いた逆プロンプトモデルの訓練と最適化を行う。
従来のアプローチとは異なり、我々の逆文字列注入はステルスと制御を維持している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:52:46 GMT)
Mobility-LLM: Learning Visiting Intentions and Travel Preferences from Human Mobility Data with Large Language Models [22.7] 位置情報ベースのサービス(LBS)は、チェックインシーケンスを通じて多様な行動に関する広範な人間の移動データを蓄積している。
しかし、チェックインシーケンスを分析する既存のモデルでは、これらのシーケンスに含まれる意味を考慮できない。
複数のタスクのチェックインシーケンスを解析するために,大規模言語モデルを活用した新しいフレームワークである Mobility-LLM を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:58:06 GMT)
Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Models [22.4] 我々は,テストタイムの欲求検索として,大規模言語モデルのアライメントをフレーミングする,$textitweak-to-strong検索を導入する。
制御された知覚生成と要約では、チューニングされていない$textttgpt2$sを使用して、追加のトレーニングなしで大規模モデルのアライメントを改善する。
より難しい命令追従ベンチマークでは、市販の小型モデルの再利用により、ホワイトボックスモデルとブラックボックスモデルの両方の長制御された勝利率を改善することが示されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:06:53 GMT)
Minimum Entropy Coupling with Bottleneck [22.4] 本稿では,対数損失下で動作する新しい損失圧縮フレームワークについて検討する。
特に、共同圧縮と検索を必要とするアプリケーションや、処理による分散シフトを伴うシナリオに関係している。
提案した定式化は、ボトルネックを統合することにより、古典的な最小エントロピー結合フレームワークを拡張していることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:19:07 GMT)
CodeCloak: A Method for Evaluating and Mitigating Code Leakage by LLM Code Assistants [22.3] CodeCloakは、コードアシスタントサービスに送信する前にプロンプトを操作する、新しいディープ強化学習エージェントである。
CodeCloakは、次の2つの矛盾した目標を達成することを目指している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:43:58 GMT)
Multi-Level Feature Distillation of Joint Teachers Trained on Distinct Image Datasets [22.3] 本研究では,異なるデータセットで学習した複数の教師の知識を抽出する学習支援フレームワークを提案する。
提案手法は, 学生モデルに知識を伝達する多段階的特徴蒸留法を用いて, 検討したデータセットのそれぞれについて検討する。
我々は、新しいMLFD(Multi-Level Feature Distillation)が、個々のデータセットでトレーニングされたり、一度にすべてのデータセットで共同でトレーニングされたりした、同等のアーキテクチャを大幅に超えることを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:23:20 GMT)
Erasing Undesirable Concepts in Diffusion Models with Adversarial Preservation [22.3] 拡散モデルは、テキストから視覚的に印象的なコンテンツを生成するのに優れています。
本稿では,パラメータ変化によって最も影響を受ける概念を同定し,保存することを提案する。
安定拡散モデルを用いて本手法の有効性を実証し, 不要なコンテンツの除去において, 最先端の消去方法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:14:49 GMT)
Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation [22.2] 模倣学習法は、対象のポーズ、身体的乱れ、視覚的気晴らしに頑健なポリシーを学ぶために、人間の監督を必要とする。
一方、強化学習は、堅牢な振る舞いを学ぶために、自律的に環境を探索することができるが、現実的なデータ収集を非現実的に必要とすることができる。
本研究では, 実世界の模倣学習政策を, 「デジタルツイン」シミュレーション環境における強化学習によって強化するシステムであるRialToを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:41:49 GMT)
Convex Formulations for Training Two-Layer ReLU Neural Networks [21.9] 非層NPハード最適化問題は、機械学習モデルにとって不可欠である。
有限幅2つのニューラルネットワークで解ける半定緩和を導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:53:15 GMT)
Agentic Information Retrieval [21.7] 本稿では,大規模言語モデル(LLM)の能力によって形成される新しいIRパラダイムであるエージェント情報検索(Agentic IR)を紹介する。
本稿ではエージェントIRの3種類の最先端応用とその課題について論じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:19:12 GMT)
Gnothi Seauton: Empowering Faithful Self-Interpretability in Black-Box Models [21.7] 概念に基づくネットワークのような自己解釈型モデルは、決定を人間の理解可能な概念に結びつけることによって洞察を与える。
シャプリー値のようなポストホック法は理論的には堅牢であるが、計算コストが高く、資源集約的である。
ブラックボックスモデルに対する理論的に保証された自己解釈性を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:35:33 GMT)
SG-Bench: Evaluating LLM Safety Generalization Across Diverse Tasks and Prompt Types [21.7] 本研究では,大規模言語モデル(LLM)の安全性を様々なタスクやプロンプトタイプにまたがる一般化を評価するための新しいベンチマークを開発する。
このベンチマークは、生成的および識別的評価タスクを統合し、LLMの安全性に対する迅速なエンジニアリングとジェイルブレイクの影響を調べるための拡張データを含む。
評価の結果,ほとんどのLDMは生成的タスクよりも差別的タスクが悪く,プロンプトに非常に敏感であり,安全アライメントの一般化が不十分であることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:47:01 GMT)
BenchX: A Unified Benchmark Framework for Medical Vision-Language Pretraining on Chest X-Rays [21.7] 本稿では,直接比較と系統解析が可能なベンチマークフレームワークであるBenchXを提案する。
BenchXは3つのコンポーネントで構成されている。1)9つのデータセットと4つの医療タスクをカバーする包括的なデータセット、2)データ前処理、トレイン-テスト分割、パラメータ選択を標準化するためのベンチマークスイート、3)分類、セグメンテーション、レポート生成における一貫したタスク適応のための統一された微調整プロトコル。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:53:18 GMT)
RankUp: Boosting Semi-Supervised Regression with an Auxiliary Ranking Classifier [21.4] 最新技術(SOTA)の半教師付き学習技術であるFixMatchやその変種は、分類タスクにおいて印象的なパフォーマンスを示している。
本稿では,既存の半教師付き分類手法を応用し,回帰タスクの性能を向上させるための簡易かつ効果的なアプローチであるRangeUpを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:25:21 GMT)
PerSRV: Personalized Sticker Retrieval with Vision-Language Model [21.3] 本稿では,Personalized Sticker Retrieval with Vision-Language Model framework,すなわちPerSRVを提案する。
ステッカーレベルのセマンティック理解のために, 微調整したLLaVA-1.5-7Bを用いて人間のようなステッカーセマンティクスを生成する。
第3に、ユーザの過去のインタラクションに基づいて、スタイルセントロイドをクラスタリングし、個人の嗜好モデリングを実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:13:47 GMT)
Noise-Aware Algorithm for Heterogeneous Differentially Private Federated Learning [21.3] 本稿では,クライアントモデル更新における真のノイズレベルを効率的に推定するRobust-HDPを提案する。
ユーティリティと収束速度を改善し、不正なプライバシパラメータをサーバに送信する可能性のあるクライアントに対して安全である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:46:52 GMT)
Multi-Class Textual-Inversion Secretly Yields a Semantic-Agnostic Classifier [21.0] テキスト・ツー・イメージ(T2I)パーソナライズ手法は,新しいトークンを学習することで,概念の見当たらないものにT2Iモデルを適応することを目的としている。
新たな概念トークンは,各カテゴリを一つの概念として扱うことにより,生成能力と分類能力の両方を有することを示す。
トークン更新プロセスの識別正則化項を含むマルチクラステキストインバージョンを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:55:02 GMT)
ReDAN: An Empirical Study on Remote DoS Attacks against NAT Networks [20.9] ローカルNATネットワークの外部で動作するインターネット攻撃者は、NATデバイスをリモートで識別し、特定NATデバイスから外部サーバへのTCP接続を停止できることを示す。
我々はNAT仕様内のPMTUD機構の欠陥を利用して、インターネット上のNATデバイスを識別する。
実験の結果,既存のNATデバイスに広範なセキュリティ脆弱性が認められた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:14:20 GMT)
Theory of vibrational Stark effect for adsorbates and diatomic molecules [20.9] 電気化学界面における吸着剤の振動スターク効果(VSE)は、ランベルト理論を用いて概ね研究されている。
ここでは、量子効果がVSEにとってどの程度重要か、また観測可能であれば、どの物理量でこの効果を決定するかという疑問を再考する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:46:25 GMT)
A Neuro-Symbolic Benchmark Suite for Concept Quality and Reasoning Shortcuts [20.9] モデルに対する推論ショートカットの影響を体系的に評価するベンチマークスイートであるrsbenchを紹介する。
rsbenchを用いることで、純粋にニューラルモデルとニューラルシンボリックモデルの両方で高品質な概念を得るのは、解決から遠ざかる問題である、と強調する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:17:37 GMT)
Fearless Stochasticity in Expectation Propagation [20.8] 我々は期待伝播(EP)のモーメントマッチング更新に関する新しい視点を提供する。
この洞察を用いて、2つの新しいEP変種を動機付け、特にモンテカルロ推定に適した更新を行う。
特に、チューニングが容易で、スピード精度の向上されたトレードオフを提供し、デバイアス推定器の使用に依存しない。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:50:34 GMT)
Analyzing Multimodal Interaction Strategies for LLM-Assisted Manipulation of 3D Scenes [20.7] LLM支援3Dシーン編集システムにおいて,定量的使用データと経験後アンケートフィードバックを併用し,共通のインタラクションパターンとキーバリアを明らかにする。
今後のLCM統合3Dコンテンツ作成システムの設計勧告を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:15:59 GMT)
Compare without Despair: Reliable Preference Evaluation with Generation Separability [20.5] テストインスタンスがペアの選好評価にどの程度適しているかを推定する尺度であるセパビリティ(Separability)を導入する。
候補テストインスタンスでは、セパビリティは1組のモデルから複数の世代をサンプリングし、2つの世代がどの程度区別可能であるかを測定する。
実験により、分離性が高いインスタンスは、人間と自動レーダの両方からより一貫した選好格付けが得られることが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:29:37 GMT)
FastDrag: Manipulate Anything in One Step [20.5] 本稿では,FastDragというワンステップのドラッグベースの画像編集手法を導入し,編集プロセスの高速化を図る。
この革新は1段階の遅延セマンティック最適化を実現し、編集速度を大幅に向上させる。
私たちのFastDragはDragBenchデータセットで検証されています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:09:30 GMT)
Out-of-Distribution Optimality of Invariant Risk Minimization [20.4] 不変リスク最小化(IRM)は、o.o.d.リスクを最小化するための有望なアプローチであると考えられている。
本稿では、二段階最適化問題の解が特定の条件下でのo.o.d.リスクを最小限に抑えることを厳密に証明する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:56:32 GMT)
C-GAIL: Stabilizing Generative Adversarial Imitation Learning with Control Theory [20.4] GAIL(Generative Adversarial Learning)は、デモンストレーターを模倣する生成ポリシーを訓練する。
オンラインImitation Reinforcement Learning (RL) を用いて、GANライクな識別器から得られる報酬信号を最適化する。
近年の研究では、制御理論がガンの訓練の収束に役立つことが示されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:39:16 GMT)
Flow Matching for Posterior Inference with Simulator Feedback [20.3] フローベース生成モデリングは、物理科学における逆問題を解決する強力なツールである。
そこで本研究では,シミュレータに基づく制御信号の追加によるフローの洗練を提案する。
シミュレータからのフィードバックを含むと精度が53%向上し,従来の手法と競合することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:26:39 GMT)
Shuffling Gradient-Based Methods for Nonconvex-Concave Minimax Optimization [20.1] 我々は非線形ミニマックス問題に対処する新しい勾配法を開発した。
提案手法は,他の手法と同等の結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:47:22 GMT)
SceneGenAgent: Precise Industrial Scene Generation with Coding Agent [19.9] C#コードで産業シーンを生成するエージェントであるSceneGenAgentを紹介する。
SceneGenAgentは構造化され計算可能なフォーマットによる正確なレイアウト計画を保証する。
実験の結果,SceneInstruct 上でのオープンソース LLM の微調整により,大幅なパフォーマンス向上が得られた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:01:40 GMT)
DynaMath: A Dynamic Visual Benchmark for Evaluating Mathematical Reasoning Robustness of Vision Language Models [19.8] In-deepth Assessment of Vision-Language Models (VLMs) のための動的視覚数学ベンチマークであるDynaMathを紹介する。
DynaMathには501の高品質でマルチトピックなシード質問が含まれており、それぞれがPythonプログラムとして表現されている。
その結果,10変種すべてにおいて正解された種子質問の割合として定義される最悪のモデル精度は,平均値よりも有意に低いことがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:29:19 GMT)
A Dual Adaptive Assignment Approach for Robust Graph-Based Clustering [19.5] 我々は、ロバストグラフベースクラスタリング(RDSA)のためのDual Adaptive Assignment Approachと呼ばれる新しいフレームワークを導入する。
RDSAは3つの主要なコンポーネントから構成される: (i) グラフのトポロジ的特徴とノード属性を効果的に統合するノード埋め込みモジュール、 (ii) ノード割り当てに親和性行列を利用することでグラフモジュラリティを改善する構造ベースのソフトアサインモジュール、 (iii) コミュニティランドマークを識別し、モデルの堅牢性を高めるためにノード割り当てを洗練させるノードベースのソフトアサインモジュール。
この結果から,RDSAはクラスタリングの有効性やロバスト性,適応性など,グラフの種類によって堅牢なクラスタリングを実現していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:18:34 GMT)
Class-Aware Contrastive Optimization for Imbalanced Text Classification [19.5] クラス認識のコントラスト最適化とデノベーションオートエンコーダを組み合わせることで、不均衡なテキスト分類タスクにうまく取り組むことができることを示す。
提案手法は,多種多様なテキストデータセットにおける顕著な性能向上を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:34:08 GMT)
Do Large Language Models Align with Core Mental Health Counseling Competencies? [19.4] CounselingBenchは、LLM(Large Language Models)を評価する新しいNCMHCEベースのベンチマークである。
フロンティアモデルは最低限の閾値を超えますが、専門家レベルのパフォーマンスには欠けています。
我々の研究結果は、メンタルヘルスカウンセリングのためのAIシステムの開発の複雑さを浮き彫りにした。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:27:11 GMT)
A Tutorial on Clinical Speech AI Development: From Data Collection to Model Validation [19.4] 本稿では,臨床音声AIの堅牢な開発に必要な要素について概説する。
目的は、入力と出力がより解釈可能で臨床的に意味のある音声の側面にリンクするモデルの構築に関する包括的なガイダンスを提供することである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:58:15 GMT)
From Question to Exploration: Test-Time Adaptation in Semantic Segmentation? [19.2] テスト時間適応(TTA)は、トレーニングデータに基づいてトレーニングされたモデルを、潜在的な分散シフトを伴うテストデータに適用することを目的としている。
セマンティックセグメンテーションにおける既存の古典的TTA戦略の適用性について検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:00:10 GMT)
Flavors of Margin: Implicit Bias of Steepest Descent in Homogeneous Neural Networks [19.2] 本稿では,勾配降下,符号降下,座標降下を含む急勾配降下アルゴリズムの一般家系の暗黙バイアスについて検討する。
ネットワークが完全なトレーニング精度に達すると,アルゴリズム依存の幾何マージンが増加し始めることを実証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:28:49 GMT)
On the Computational Complexity of Private High-dimensional Model Selection [19.0] プライバシー制約下での高次元疎線形回帰モデルにおけるモデル選択の問題点を考察する。
本稿では, 効率的なメトロポリス・ハスティングスアルゴリズムを提案し, 一定の規則性条件下では, 定常分布への混合時間を享受できることを確かめる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:55:20 GMT)
SWE-Search: Enhancing Software Agents with Monte Carlo Tree Search and Iterative Refinement [18.8] SWE-Searchは、MCTS(Monte Carlo Tree Search)と自己改善機構を統合し、ソフトウェアエージェントのパフォーマンスを向上させるマルチエージェントフレームワークである。
本研究は,複雑でダイナミックなソフトウェア工学環境において,エージェント推論と計画を強化する自己評価型検索技術の可能性を強調した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:25:20 GMT)
An Effective Theory of Bias Amplification [18.6] 機械学習モデルは、データに存在するバイアスをキャプチャして増幅し、社会的グループ間で異なるテストパフォーマンスをもたらす。
本稿では、従来のニューラルネットワークを単純化した状態下でモデル化するリッジ回帰の文脈において、正確な解析理論を提案する。
我々の理論は、機械学習バイアスの統一的で厳密な説明を提供し、バイアス増幅やマイノリティグループバイアスのような現象に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:21:41 GMT)
Coupler-Assisted Leakage Reduction for Scalable Quantum Error Correction with Superconducting Qubits [18.6] 非計算状態へのリークは超伝導回路を含む量子システムにおいて一般的な問題である。
大規模超伝導量子プロセッサにおいて広く採用されているチューナブルカプラを用いた漏れ低減手法を提案し,実証する。
さらに、高い効率(98.1%)と計算サブスペース(0.58%)でのエラー率の低いキュービットレベルへのリークを低減し、QECサイクル中の時間関連エラーを抑制する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:53:14 GMT)
Robot Policy Learning with Temporal Optimal Transport Reward [18.6] リワード仕様は強化学習において最も難しい問題の1つです。
最近の研究は、1/2人の専門家によるビデオデモからロボットポリシーを学習する方法を調査している。
本稿では、時間的順序情報を組み込むために、時間的最適輸送(Temporal Optimal Transport, TemporalOT)報酬を導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:00:47 GMT)
Uncertainty Quantification via Hölder Divergence for Multi-View Representation Learning [18.4] 本稿では,H"older Divergence (HD)に基づく新しいアルゴリズムを導入し,多視点学習の信頼性を高める。
デンプスター・シェーファー理論を通じて、異なるモダリティからの不確実性の統合により、包括的な結果が生成される。
数学的には、HDは実際のデータ分布とモデルの予測分布の間の距離'をよりよく測定できることを証明している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:29:44 GMT)
Characterizing the Role of Similarity in the Property Inferences of Language Models [18.3] 本研究では, 行動・因果的表現解析実験を用いて, LMの資産継承について検討する。
分類学と分類学的類似性は、LMsの資産相続行動において相互に排他的ではない。
本研究は,言語モデルの概念的構造に関する知見を提供し,人体に対する新たな心理言語学的実験を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:05:41 GMT)
DISCERN: Decoding Systematic Errors in Natural Language for Text Classifiers [18.3] 本稿では,テキスト分類器における系統的バイアスを言語説明を用いて解釈するフレームワークであるdisCERNを紹介する。
DISCERNは、2つの大きな言語モデル間の対話ループを用いて、体系的エラーの正確な自然言語記述を反復的に生成する。
本研究では, クラスタを例に挙げるよりも, 言語説明を通して, 系統的バイアスをより効果的に(25%以上相対的に) 効率的に解釈できることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:04:55 GMT)
Advancing Efficient Brain Tumor Multi-Class Classification -- New Insights from the Vision Mamba Model in Transfer Learning [18.2] 本研究は,脳腫瘍分類における事前学習モデルの応用について検討した。
我々は,脳腫瘍のマルチクラス分類にいくつかの主流転写学習モデルを微調整し,応用した。
特に,新しいネットワークアーキテクチャであるVision Mamba(Vim)を導入し,脳腫瘍の分類に初めて適用した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:08:57 GMT)
Guide3D: A Bi-planar X-ray Dataset for 3D Shape Reconstruction [18.2] 3次元再構成のための2次元平面X線データセットである Guide3D を紹介する。
データセットは、現実の環境で撮影された高解像度の複平面、手動で注釈付けされたフルオロスコープビデオの集合を表す。
本稿では,ガイドライト形状予測のための新しいベンチマークを提案し,今後の作業の強力なベースラインとして機能する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:53:57 GMT)
Joint Beamforming and Speaker-Attributed ASR for Real Distant-Microphone Meeting Transcription [18.2] 最先端のエンドツーエンド話者分散自動音声認識(SA-ASR)アーキテクチャは、マルチチャネルノイズと残響低減フロントエンドを欠いている。
そこで本研究では, 実聴記録のためのビームフォーミング法とSA-ASR法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:17:31 GMT)
End-to-end Joint Punctuated and Normalized ASR with a Limited Amount of Punctuated Training Data [18.2] そこで本研究では, 終端から終端までの関節定位および正規化ASRシステムの訓練方法を提案する。
最初のアプローチでは、正規化されたトレーニングの書き起こしを句読まれた書き起こしに変換するために、言語モデルを使用する。
第2のアプローチでは、出力のタイプに条件付けされた1つのデコーダを使用する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:27:00 GMT)
Fuzzerfly Effect: Hardware Fuzzing for Memory Safety [18.0] ハードウェアメモリの脆弱性検出におけるハードウェアファジィリングの有効性について検討する。
我々は,ハードウェアファジィ化によるメモリ安全性向上に向けた課題と今後の研究の方向性を強調した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:00:51 GMT)
The Effects of Multi-Task Learning on ReLU Neural Network Functions [17.8] 多数の多様なタスクを持つニューラルネットワーク学習問題は、最適ニューロンによって決定される固定されたカーネル上の$ell2$(ヒルベルト空間)問題とほぼ同値であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:27:08 GMT)
Protecting Privacy in Multimodal Large Language Models with MLLMU-Bench [17.7] マルチモーダル・ラージ・モデル・アンラーニングベンチマーク(MLLMU-Bench)は,マルチモーダル・マシン・アンラーニングの理解を深めるための新しいベンチマークである。
MLLMU-Benchは500の架空のプロファイルと153のプロフィールで構成され、各プロファイルは14以上のカスタマイズされた質問応答ペアで構成され、マルチモーダル(画像+テキスト)とユニモーダル(テキスト)の両方の観点から評価される。
意外なことに、我々の実験では、ユニモーダル・アンラーニングのアルゴリズムは生成タスクやクローズタスクに優れており、マルチモーダル・アンラーニングのアプローチはマルチモーダル入力による分類タスクにおいてより優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:07:23 GMT)
What Makes ImageNet Look Unlike LAION [17.6] LAIONetと呼ばれる結果のImageNetレクリエーションは、オリジナルとは明らかに異なる。
本稿では,2つの因果データ生成過程における微妙で重要な相違点について,厳密な説明を提案する。
我々は,イメージネット画像はステレオタイプであり,非自然であり,クラスカテゴリの過度に単純な表現である,というコミュニティの長年の直観を定式化している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:13:49 GMT)
Counting Ability of Large Language Models and Impact of Tokenization [17.5] 大規模言語モデル(LLM)の数え上げ能力に及ぼすトークン化の影響について検討する。
本研究は, LLMのカウント能力に及ぼすトークン化の影響について検討し, 入力トークン化差に基づく性能変化を明らかにする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:48:33 GMT)
EEG-Deformer: A Dense Convolutional Transformer for Brain-computer Interfaces [17.5] 本稿では,CNN-Transformerに2つの新しいコンポーネントを組み込んだEEG-Deformerを紹介する。
EEG-Deformerは神経生理学的に意味のある脳領域から学習し、対応する認知タスクを学習する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:24:00 GMT)
Learning and Unlearning of Fabricated Knowledge in Language Models [17.0] 共通知識と矛盾する事実が数万のトレーニングステップで記憶されていることを示す。
LMにおける知識共用事実の影響は,長期にわたる可能性があるが,マルチステップスパース更新の新たな適用により,ほぼ消去可能であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:33:14 GMT)
Code Repair with LLMs gives an Exploration-Exploitation Tradeoff [16.8] 大きな言語モデル(LLM)でソースコードを反復的に改善し、修復することは、1ショットで構築するには複雑すぎるプログラムを生成する一般的な方法として現れている。
ここでは、リファインメントが探索と露見のトレードオフを露呈していることを示します。ほとんどのテストケースをパスするプログラムをリファイン化したり、考慮の少ないプログラムをリファインダでリファインダすることです。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:01:16 GMT)
Implicit Reasoning in Deep Time Series Forecasting [16.8] この研究は、ディープ時系列予測モデルの推論能力を評価するための最初の一歩を踏み出した。
系統的に編成されたアウト・オブ・ディストリビューションシナリオにおいて,ある線形なパッチベーストランスフォーマーモデルが効果的に一般化できることが判明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:03:00 GMT)
DiffPhyCon: A Generative Approach to Control Complex Physical Systems [16.7] 本稿では,物理系制御問題に対処する新しい手法である拡散物理系制御(DiffPhyCon)を紹介する。
DiffPhyConは学習した生成エネルギー関数と予め定義された制御目的の両方を同時に最小化する。
提案手法は,古典的アプローチや最先端の深層学習法,強化学習法よりも優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:28:07 GMT)
A Generative Approach to Control Complex Physical Systems [16.7] 本稿では,物理系制御問題に対処する新しい手法である拡散物理系制御(DiffPhyCon)を紹介する。
DiffPhyConは学習した生成エネルギー関数と予め定義された制御目的の両方を同時に最小化する。
提案手法は,古典的アプローチや最先端の深層学習法,強化学習法よりも優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:28:07 GMT)
A Generative Approach to Control Complex Physical Systems [16.7] 本稿では,物理系制御問題に対処する新しい手法である拡散物理系制御(DiffPhyCon)を紹介する。
DiffPhyConは学習した生成エネルギー関数と予め定義された制御目的の両方を同時に最小化する。
提案手法は,古典的アプローチや最先端の深層学習法,強化学習法よりも優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:28:07 GMT)
MAISI: Medical AI for Synthetic Imaging [16.7] 医用画像解析は、データの不足、高アノテーションコスト、プライバシー上の懸念といった課題に直面している。
本稿では,合成画像のための医用AI(MAISI)を導入し,CT画像を生成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:17:36 GMT)
Reliable Semantic Understanding for Real World Zero-shot Object Goal Navigation [16.6] ゼロショットオブジェクトゴールナビゲーション(ZS-OGN)における意味理解の進化に向けた革新的なアプローチを導入する。
本稿では,初期検出のためのGLIPビジョン言語モデルと検証のためのインストラクションBLIPモデルを統合した2成分フレームワークを用いる。
シミュレーションと実世界の双方で厳密にテストした結果,ナビゲーション精度と信頼性が著しく向上した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:37:37 GMT)
BENCHAGENTS: Automated Benchmark Creation with Agent Interaction [16.5] BENCHAGENTSは,大規模言語モデル(LLM)を体系的に活用し,複雑な機能のためのベンチマーク作成を自動化するフレームワークである。
我々は、BENCHAGENTSを用いて、テキスト生成時の計画と制約満足度に関連する機能を評価するベンチマークを作成する。
次に、これらのベンチマークを使用して、7つの最先端モデルを調査し、共通の障害モードとモデルの違いに関する新たな洞察を抽出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:56:18 GMT)
Hard-Negative Sampling for Contrastive Learning: Optimal Representation Geometry and Neural- vs Dimensional-Collapse [16.4] ニューラル・コラプス(NC)を示す表現によって、SCL(Servised Contrastive Learning)、Hard-SCL(HSCL)、Unsupervised Contrastive Learning(UCL)の損失が最小化されることを実証する。
また、任意の表現写像に対して、HSCLとHard-UCL(HUCL)の損失は対応するSCLとUCLの損失によって低く抑えられていることを証明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:33:50 GMT)
Embedding Watermarks in Diffusion Process for Model Intellectual Property Protection [16.4] 拡散過程全体に透かしを埋め込むことにより,新しい透かしの枠組みを導入する。
詳細な理論的解析と実験的検証により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:27:10 GMT)
Can Knowledge Editing Really Correct Hallucinations? [16.3] 大規模言語モデル(LLM)は、タスクにまたがる優れた能力にもかかわらず、生成されたコンテンツの非現実的な情報を参照しながら幻覚に悩まされる。
知識編集は,LLMで符号化された誤った事実知識を,スクラッチからリトレーニングを避けるという利点によって補正する,新しい一般的なパラダイムとして開発された。
実世界の幻覚を正すための知識編集手法を全体ベンチマークするために,HaluEditBenchを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:00:01 GMT)
Robust Graph Neural Networks for Stability Analysis in Dynamic Networks [16.1] 本稿では,グラフニューラルネットワーク(GNN)アルゴリズムに基づく経済リスク同定アルゴリズムについて検討する。
金融市場のセキュリティと安定性を維持するため、金融機関や規制当局によりインテリジェントな技術ツールを提供することを目指している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:11:36 GMT)
OFER: Occluded Face Expression Reconstruction [16.1] OFERは,多彩で表現力に富んだ3次元顔を生成することのできる,単一画像の3次元顔再構成のための新しいアプローチである。
本稿では,予測された形状精度スコアに基づいて形状拡散ネットワークの出力をソートし,最適マッチングを選択する新しいランキング機構を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:21:26 GMT)
Cora: Accelerating Stateful Network Applications with SmartNICs [16.0] Coraは、ステートフルなネットワークアプリケーションをSmartNICアクセラレーションホストにオフロードする、コンパイラとランタイムである。
CoraはNetronome AgilioとBlueField 2 SmartNICs上に構築されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:55:36 GMT)
Instruction-Tuned LLMs Succeed in Document-Level MT Without Fine-Tuning -- But BLEU Turns a Blind Eye [16.0] 大規模言語モデル(LLM)は機械翻訳(MT)を含む様々なNLPタスクに優れている。
本研究は,文書レベル翻訳(docMT)における命令調整型LLMの本質的能力について検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:08:19 GMT)
Dynamic Multi-Reward Weighting for Multi-Style Controllable Generation [16.0] テクストスタイルは、対人的ダイナミクス(フォーマル性など)や著者の感情や態度(嫌悪感など)など、多様な情報の集合を表現する
オープンな疑問は、言語モデルを明示的に制御して、テキストを生成する際にターゲットスタイルを織り合わせる方法だ。
このような制御された生成の1つのアプローチは、多目的強化学習(RL)である。
判別器の校正出力や,判別器の大きさによる動的重み付けなど,多型報酬の定式化について検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:13:14 GMT)
A Methodology for Gradual Semantics for Structured Argumentation under Incomplete Information [15.7] 構造化議論フレームワークの段階的意味論を得るための新しい手法を提案する。
我々の方法論は議論の前提に関する不完全な情報に対応している。
方法論の2つの異なるインスタンス化を導入することで、このアプローチの可能性を実証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:38:35 GMT)
Attention Speaks Volumes: Localizing and Mitigating Bias in Language Models [15.5] 本稿では,大きな言語モデル(LLM)において,曖昧な比較プロンプトが提供される場合のバイアスの発生メカニズムについて検討する。
本稿では,LLMの特定の層にバイアスを局所化する手法である$textttATLAS$を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:15:56 GMT)
Capacity Control is an Effective Memorization Mitigation Mechanism in Text-Conditional Diffusion Models [15.5] 採用。
プレトレインファインチューンパラダイムにおけるPEFT(Efficient Fine-Tuning)は,メモリ化を著しく低減する。
その結果,PEFTは記憶度を低下させるだけでなく,下流の音質を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:47:31 GMT)
The Impact of Inference Acceleration Strategies on Bias of LLMs [15.4] 大規模言語モデル(LLM)は、コストがかかり遅い推論タスクを実行する。
推定加速度最適化によるモデル生成の人口統計バイアスがLLM性能の重要な側面であることを示す。
加速度戦略とバイアスタイプの組み合わせは、あるモデルではバイアスの変化が少ないが、別のモデルでは大きな影響をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:19:13 GMT)
Learning Infinitesimal Generators of Continuous Symmetries from Data [15.4] 1-パラメータ群で定義された変換に基づく新しい対称性学習アルゴリズムを提案する。
この手法は最小限の帰納バイアスに基づいて構築され、リー群に根付いた一般的な対称性だけでなく、非線形発生器由来の対称性にまで拡張される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:28:23 GMT)
Scalable Message Passing Neural Networks: No Need for Attention in Large Graph Representation Learning [15.3] 我々は、標準畳み込みメッセージパッシングを注意の代わりにプレ層正規化トランスフォーマースタイルのブロックに統合することにより、高性能なディープメッセージパッシングベースグラフニューラルネットワーク(GNN)を実現できることを示す。
結果は、大グラフトランスダクティブ学習における最先端の最先端と競合するが、それ以外は計算的かつメモリ拡張的な注意機構を必要としない。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:18:43 GMT)
Pushing the Limits of All-Atom Geometric Graph Neural Networks: Pre-Training, Scaling and Zero-Shot Transfer [15.3] 全原子情報を持つ幾何学グラフニューラルネットワーク(Geom-GNN)は、原子論シミュレーションを変換した。
本研究では,Geom-GNNの自己教師付き事前学習,教師付き学習,教師なし学習環境におけるスケーリング行動について検討する。
我々は、全ての原子グラフの埋め込みが他の神経アーキテクチャと有機的に組み合わされ、表現力を高めることができることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:07:33 GMT)
Lost and Found in Speculation: Hybrid Speculative Vulnerability Detection [15.3] 本稿では,IFT(Information Flow Tracking)とハードウェアファジィを構成する,新たなシリコン前検証手法であるSpecureを紹介し,投機的実行リークに対処する。
Specureは、RISC-V BOOMプロセッサのこれまで見過ごされていた投機的実行脆弱性を特定し、既存のファジィ技術よりも6.45倍高速な脆弱性検索空間を探索する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:42:06 GMT)
Abrupt Learning in Transformers: A Case Study on Matrix Completion [15.2] マスク付き言語モデリング(MLM)タスクとして低ランク行列補完問題を定式化する。
BERTモデルをトレーニングして,この課題を低誤差で解決できることが示される。
また、個々のモデルコンポーネントのトレーニングダイナミクスを分析し、突然の損失の減少を理解する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:08:06 GMT)
Knowledge-Guided Prompt Learning for Request Quality Assurance in Public Code Review [15.0] Public Code Review(PCR)は、開発チームの内部コードレビューのアシスタントである。
本稿では,開発者によるコードレビュー要求品質保証を実現するために,公開コードレビューのための知識指導型プロンプト学習を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:48:41 GMT)
Online Mirror Descent for Tchebycheff Scalarization in Multi-Objective Optimization [15.0] OMD-TCHと呼ばれるチェシュスカラー化のためのオンラインミラー降下アルゴリズムを提案する。
我々は,OMD-TCHが,公正性制約下での合成問題とフェデレーション学習タスクの両方に有効であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:58:33 GMT)
Unified Domain Generalization and Adaptation for Multi-View 3D Object Detection [14.8] マルチビューカメラを利用した3次元物体検出は, 視覚課題における実用的, 経済的価値を実証した。
典型的な教師付き学習アプローチは、目に見えない、ラベルなしのターゲットデータセットに対する満足な適応を達成する上で、課題に直面します。
本稿では、これらの欠点を軽減するための実践的なソリューションとして、統一ドメイン一般化・適応(UDGA)を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:51:49 GMT)
Learning under Imitative Strategic Behavior with Unforeseeable Outcomes [14.8] 個人と意思決定者間の相互作用をモデル化するStackelbergゲームを提案する。
両者の目的的差異を3つの解釈可能な項に分解できることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:28:05 GMT)
Evolution-based Feature Selection for Predicting Dissolved Oxygen Concentrations in Lakes [14.7] 本稿では,複雑な特徴間相互作用選択問題に対する新しい進化アルゴリズムであるMCESを提案する。
中西部の様々な湖で評価され、MCESは観測されたラベルがほとんどない正確な予測を常に生成している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:55:38 GMT)
Online Detecting LLM-Generated Texts via Sequential Hypothesis Testing by Betting [14.7] 我々は,ソースが大言語モデル(LLM)なのか人間なのかを迅速かつ正確に判定するアルゴリズムを開発した。
我々は、既存のオフライン検出技術に基づいて、ベッティングによるシーケンシャル仮説テストの手法を用いる。
提案手法の有効性を実証するために実験を行った。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:55:14 GMT)
Flow-DPO: Improving LLM Mathematical Reasoning through Online Multi-Agent Learning [14.2] 本稿では,大規模言語モデルの微調整のための高品質な推論トレースを作成するための新しい手法を提案する。
本手法では,コンポーネントLLMが協調的にソリューションを構築するために,インクリメンタルな出力生成フローを用いる。
オンラインダイレクトパラメータ最適化(DPO)学習を用いてフローをトレーニングし、トレーニング例毎にDPOペアを生成し、モデルをリアルタイムで更新する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:50:31 GMT)
A Simple and Effective $L_2$ Norm-Based Strategy for KV Cache Compression [14.0] キーバリューキャッシュサイズを減らすための既存のアプローチは、圧縮戦略を学ぶためのモデルを微調整するか、シーケンス長を減らすためにアテンションスコアを利用するかのいずれかである。
キャッシュされたKVペアに対して、$L$とアテンションスコアとの間に明らかな相関関係が見られ、キー埋め込みの低い$L$がデコード時に高いアテンションスコアをもたらす。
実験の結果,この単純な手法により,言語モデリングやニードル・イン・ア・ヘイスタックタスクでは50%,パスキー検索タスクでは90%,精度を損なうことなく,KVキャッシュサイズを50%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:52:35 GMT)
BLoB: Bayesian Low-Rank Adaptation by Backpropagation for Large Language Models [14.0] 大規模言語モデル(LLM)は、しばしば推論中に過剰な自信に悩まされる。
本稿では,LLMパラメータの平均値と共分散値を連続的に調整するアルゴリズムであるバックプロパゲーション(BLoB)によるベイズ低ランク適応を提案する。
その結果,分布内および分布外の両方で評価した場合,BLoBの有効性を一般化と不確実性評価の観点から検証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:44:06 GMT)
M2NO: Multiresolution Operator Learning with Multiwavelet-based Algebraic Multigrid Method [13.9] 本稿では,新しいディープラーニングフレームワークであるMultiwaveletベースの代数的マルチグリッドニューラル演算子(M2NO)を紹介する。
これら2つのアプローチの固有の類似性を利用して、M2NOは様々なPDEベンチマークの精度と柔軟性を向上させる。
M2NOは高分解能および超高分解能タスクの処理に優れ、競合するモデルよりも一貫して優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:38:08 GMT)
Choosy Babies Need One Coach: Inducing Mode-Seeking Behavior in BabyLlama with Reverse KL Divergence [13.9] バックボーンとしてBabyLLaMaモデルを用いた教師用蒸留装置を用いる。
目的関数を、計算学習者においてモード探索動作を引き起こすことが知られている逆のクルバック・リーブラー分岐に置き換える。
実験の結果,シングルティーチングモデルの方が,ほとんどのタスクにおいて,複数ティーチングモデルよりも優れ,あるいは一致していることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:36:50 GMT)
Self-Preference Bias in LLM-as-a-Judge [13.9] 大規模言語モデル(LLM)における自己参照バイアスを測定するための新しい指標を提案する。
以上の結果から, GPT-4は自己選好バイアスがかなり高いことが示唆された。
このことは、偏見の本質は難易度にあることを示唆し、自己選好バイアスは LLM がより親しみやすいテキストを好むため存在することを示唆している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:42:18 GMT)
Pushing the Performance Envelope of DNN-based Recommendation Systems Inference on GPUs [13.7] 我々は、埋め込みステージがGPU推論パイプラインの主要なボトルネックであり続けており、3.2倍の埋め込みのみのパフォーマンス低下につながっていることを示す。
本稿では,プラグ・アンド・プレイ方式のソフトウェアプリフェッチとL2ピンニング技術を提案し,遅延の隠蔽と低減に役立てる。
提案手法により, 埋込ステージでは最大103%, DLRM推論パイプラインでは最大77%の性能向上が図られた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:13:54 GMT)
Brain age identification from diffusion MRI synergistically predicts neurodegenerative disease [13.5] 本稿では,モデルによるマクロ構造情報の使用を最小限に抑えたdMRIによる脳年齢同定手法を提案する。
我々は、dMRIベースの脳年齢とT1w MRIベースの脳年齢の違いを神経変性の段階で観察した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:42:03 GMT)
An Efficient Approach to Generate Safe Drivable Space by LiDAR-Camera-HDmap Fusion [13.5] ドライビング可能な空間抽出のための自律走行車(AV)のための高精度で堅牢な認識モジュールを提案する。
我々の研究は、LiDAR、カメラ、HDマップデータ融合を利用した、堅牢で汎用的な知覚モジュールを導入している。
我々のアプローチは実際のデータセットでテストされ、その信頼性は、私たちの自律シャトルであるWATonoBusの日々の(厳しい雪の天候を含む)運用中に検証されます。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:54:02 GMT)
Joint Extraction and Classification of Danish Competences for Job Matching [13.4] 本研究はデンマークの求職者から有能性を共同で抽出し分類する最初のモデルを示す。
統合抽出・分類のための単一BERTアーキテクチャとして,本モデルは軽量かつ効率的に推論できる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:00:40 GMT)
Fuzzing the PHP Interpreter via Dataflow Fusion [13.3] 本稿では,PHPインタプリタにおけるメモリエラーの検出に特化して設計された,最初の自動ファジリングフレームワークであるFlowFusionを紹介する。
評価では、FlowFusionは、PHPインタプリタで56の未知のメモリエラーを特定し、38の修正と4の確認を行った。
FlowFusionは最先端のファズーであるAFL++とPolyglotより優れており、24時間のファズー後に24%のコードをカバーする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:54:59 GMT)
On the Convergence of Federated Averaging under Partial Participation for Over-parameterized Neural Networks [13.3] フェデレートラーニング(FL)は、ローカルデータを共有せずに複数のクライアントから機械学習モデルを協調的に作成するための分散パラダイムである。
本稿では,FedAvgが世界規模で世界規模で収束していることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:45:16 GMT)
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression [13.3] 勾配圧縮は、通信された勾配データ量を減らすことができる。
実際には、勾配圧縮スキームはトレーニングプロセスの加速を達成せず、精度を保っている。
従来の勾配圧縮システムにおける共通問題と評価手法について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:24:30 GMT)
InLINE: Inner-Layer Information Exchange for Multi-task Learning on Heterogeneous Graphs [13.2] 不均一グラフは、実世界のシナリオで複雑なデータをモデル化するための重要な構造である。
本稿では,各グラフ層内の微細な情報交換を容易にする内層情報交換モデルを提案する。
我々のモデルは、負の転送によって生じる特定のタスクの大幅な性能低下を効果的に軽減する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:46:49 GMT)
Model-free Estimation of Latent Structure via Multiscale Nonparametric Maximum Likelihood [13.2] そこで我々は,そのような潜在構造がいつでも存在すると仮定することなく,その存在を推定するためのモデルフリーな手法を提案する。
アプリケーションとして,提案手法に基づくクラスタリングアルゴリズムを設計し,広範囲の潜伏構造を捕捉する手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:11:33 GMT)
Solving Minimum-Cost Reach Avoid using Reinforcement Learning [13.1] 最小コストリーチ回避問題の解法として,強化学習に基づくRC-PPOを提案する。
RC-PPOは, 目標達成率に匹敵する政策を学習し, 累積コストを最大57%削減することを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:45:29 GMT)
Pelican: Correcting Hallucination in Vision-LLMs via Claim Decomposition and Program of Thought Verification [13.1] Pelicanは、クレーム検証を通じて幻覚を検出し緩和するために設計されたフレームワークである。
実験の結果,MMHal-Benchの幻覚緩和法と比較して,幻覚率8%~32%低下し,27%低下した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:09:44 GMT)
Efficient quantum Gibbs samplers with Kubo--Martin--Schwinger detailed balance condition [13.0] 有限個のジャンプ演算子を用いた効率的な量子ギブスサンプリング器群を開発する。
我々の量子ギブスサンプリングは、同等の量子シミュレーションコストを持つが、設計の柔軟性が向上し、実装とエラー解析がより簡単になる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:37:25 GMT)
Estimating Knowledge in Large Language Models Without Generating a Single Token [12.9] 大規模言語モデル(LLM)における知識を評価するための現在の手法は、モデルをクエリし、生成した応答を評価する。
本研究では,モデルがテキストを生成する前に評価を行うことができるかどうかを問う。
様々なLLMを用いた実験では、内部の主題表現を訓練した単純なプローブであるKEENが、両方のタスクで成功することが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:40:25 GMT)
SAM-Swin: SAM-Driven Dual-Swin Transformers with Adaptive Lesion Enhancement for Laryngo-Pharyngeal Tumor Detection [12.9] 喉頭咽頭癌(Laryngo-pharyngeal carcinoma, LPC)は, 頭頸部の悪性腫瘍である。
近年の腫瘍検出の進歩は,グローバルな特徴抽出と局所的な特徴抽出を統合し,診断精度を著しく向上させた。
喉頭咽頭腫瘍検出のためのSAM-Swin変換器であるSAM-Swinを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:32:57 GMT)
OptEx: Expediting First-Order Optimization with Approximately Parallelized Iterations [12.7] ほぼ並列化されたイテレーション (OptEx) で高速化された一階最適化を導入する。
OptExは、並列コンピューティングを活用して、その反復的ボトルネックを軽減することで、FOOの効率を高める最初のフレームワークである。
我々は、カーネル化された勾配推定の信頼性とSGDベースのOpsExの複雑さを理論的に保証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:20:44 GMT)
ActiveSplat: High-Fidelity Scene Reconstruction through Active Gaussian Splatting [12.6] ガウススプラッティングを利用した自律型高忠実度再構築システムであるActiveSplatを提案する。
このシステムは、オンラインマッピング、視点選択、経路計画のための統合されたフレームワークを確立する。
提案手法の有効性を, 再現精度, データカバレッジ, 探索効率の観点から検証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:18:04 GMT)
A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents [12.6] 本研究では,クエリから複数のインテントを抽出し,複数のインテントを検出すること,多言語インテントデータセットの開発という3つの重要な課題に対処する。
本稿では,既存のベンチマークデータセットから得られた新しいマルチラベルマルチクラスインテント検出データセット(MLMCID-dataset)を紹介する。
また,インテントスパンを抽出するポインターネットワークベースアーキテクチャ(MLMCID)を提案し,シャープレットの形で粗いラベルときめ細かなラベルで複数のインテントを検出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:10:12 GMT)
FakeFormer: Efficient Vulnerability-Driven Transformers for Generalisable Deepfake Detection [12.6] 本稿では,視覚変換器(ViT)が顔面偽造検出に最適である理由について検討する。
本稿では, 微妙な不整合情報を抽出するためにViTを拡張したFakeFormerというディープフェイク検出フレームワークを提案する。
FF++、Celeb-DF、WildDeepfake、DFD、DFDCP、DFDCなど、さまざまな有名なデータセットで実験が行われている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:36:49 GMT)
LoongServe: Efficiently Serving Long-Context Large Language Models with Elastic Sequence Parallelism [12.5] 既存の大規模言語モデル(LLM)は、異なるフェーズにおける可変長要求を効率的に提供できない。
本稿では,異なる要求と位相の分散に対応するために,新しい並列性パラダイムである弾性列並列性(ESP)を提案する。
LoongServeは、チャンクプレフィルと比較して最大スループットを最大3.85$times$、プリフィルデコードデアグリゲーションと比較して5.81$times$に改善する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:04:42 GMT)
Explainable convolutional neural network model provides an alternative genome-wide association perspective on mutations in SARS-CoV-2 [12.5] 我々は,SARS-CoV-2のWHOラベルに関連する変異について,説明可能な畳み込みニューラルネットワーク(CNN)と従来のゲノムワイドアソシエーション研究(GWAS)を比較した。
以上の結果から,ゲノム配列に対する説明可能なニューラルネットワークは,従来のゲノムワイド解析手法の代替となる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:35:40 GMT)
Benchmarking Human and Automated Prompting in the Segment Anything Model [12.5] 我々は最近リリースされた視覚的プロンプトデータセットであるPointPromptを利用して、人間のプロンプトと自動化されたプロンプトの違いを理解する。
その結果, 自動戦略よりも, 人間の獲得したセグメンテーションスコアが約29%高いことがわかった。
自動メソッドを使用する場合のパフォーマンスは、微調整アプローチによって最大68%向上する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:56:31 GMT)
Peri-AIIMS: Perioperative Artificial Intelligence Driven Integrated Modeling of Surgeries using Anesthetic, Physical and Cognitive Statuses for Predicting Hospital Outcomes [12.5] クロックドローイングテストで測定された術前認知状態は, 入院期間, 入院料, 術後平均痛の予測に寄与した。
機械学習モデルは、ホールドアウトテストセットで術後の結果を分類するために訓練された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:42:51 GMT)
A Unified Debiasing Approach for Vision-Language Models across Modalities and Tasks [12.3] 本稿では,機能プルーニングと低信頼プルーテーションを統合した新しい手法であるSelective Feature Imputation for Debiasing(SFID)を紹介する。
SFIDは多用途であり、出力のセマンティックな整合性を維持し、再訓練の必要性をなくすことで費用対効果を発揮できる。
実験の結果,ゼロショット分類,テキスト・ツー・イメージ検索,画像キャプション,テキスト・ツー・イメージ生成など,様々なVLMタスクにおけるSFIDの有効性が示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:16:08 GMT)
A Unified Debiasing Approach for Vision-Language Models across Modalities and Tasks [12.3] 本稿では,機能プルーニングと低信頼プルーテーションを統合した新しい手法であるSelective Feature Imputation for Debiasing(SFID)を紹介する。
SFIDは多用途であり、出力のセマンティックな整合性を維持し、再訓練の必要性をなくすことで費用対効果を発揮できる。
実験の結果,ゼロショット分類,テキスト・ツー・イメージ検索,画像キャプション,テキスト・ツー・イメージ生成など,様々なVLMタスクにおけるSFIDの有効性が示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:16:08 GMT)
Doubly Robust Inference in Causal Latent Factor Models [12.1] 本稿では、多数の単位と結果を含む現代データ豊富な環境において、観測不能なコンファウンディングの下での平均処理効果を推定する新しい手法を提案する。
有限サンプル重み付けと保証を導出し、新しい推定器の誤差がパラメトリック速度で平均ゼロガウス分布に収束することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:26:15 GMT)
Generalizing Consistency Policy to Visual RL with Prioritized Proximal Experience Regularization [12.0] オンライン視覚強化学習における非定常分布とアクター・クリティカル・フレームワークが整合性ポリシーに及ぼす影響について検討する。
本稿では, 標本効率を向上させるために, 優先度付き近位体験正規化(CP3ER)を用いた整合性ポリシーを提案する。
CP3ERはDeepMindコントロールスイートとMeta-worldにまたがる21のタスクで、新しい最先端(SOTA)パフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:44:15 GMT)
Generalizing Consistency Policy to Visual RL with Prioritized Proximal Experience Regularization [12.0] オンライン視覚強化学習における非定常分布とアクター・クリティカル・フレームワークが整合性ポリシーに及ぼす影響について検討する。
本稿では, 標本効率を向上させるために, 優先度付き近位体験正規化(CP3ER)を用いた整合性ポリシーを提案する。
CP3ERはDeepMindコントロールスイートとMeta-worldにまたがる21のタスクで、新しい最先端(SOTA)パフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:44:15 GMT)
GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling [11.9] ガウススプラッティングは、ビュー合成とシーン再構成に優れた性能を示した。
各ガウス原始体は外観と幾何学の両方を符号化しているので、外見モデリングには多数のガウス原始体が必要である。
我々は,1つのガウス語でさえ外観の詳細を捉えられるように,パープリミティブな表現を採用することを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:31:39 GMT)
Guided Diffusion-based Counterfactual Augmentation for Robust Session-based Recommendation [11.9] セッションベースのレコメンデーション(SR)モデルは、現在のセッション中のユーザの振る舞いに基づいて、トップKアイテムをユーザに推奨することを目的としている。
文献ではいくつかのSRモデルが提案されているが、トレーニングデータの固有のバイアスに対する感受性に関する懸念が提起されている。
本稿では,SRのための拡散に基づく反ファクト拡張フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:36:59 GMT)
PrivCirNet: Efficient Private Inference via Block Circulant Transformation [11.9] ホモモルフィック暗号化(HE)ベースのディープニューラルネットワーク(DNN)推論は、データとモデルのプライバシを保護するが、大きな計算オーバーヘッドに悩まされる。
ブロック循環変換に基づくプロトコル/ネットワーク協調最適化フレームワークであるPrivCirNetを提案する。
PrivCirNetはブロック循環変換と完全に互換性のあるHE符号化アルゴリズムをカスタマイズする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:20:24 GMT)
Global-Local Medical SAM Adaptor Based on Full Adaption [11.7] 本報告では,世界規模でSAMを適応可能な完全適応型グローバル医療SAMアダプタ(GMed-SA)を提案する。
グローバル・ローカル・メディカルSAM適応器(GLMed-SA)を提案する。
その結果, GLMed-SAは様々な評価指標において, 最先端のセマンティックセマンティックセグメンテーション法よりも優れていた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:00:00 GMT)
Improving Performance of Commercially Available AI Products in a Multi-Agent Configuration [11.6] クラウドボティックス PRD AIは、AIを使用してソフトウェア要件を生成するツールである。
GitHub Copilotは、AIペアプログラミングツールである。
PRD AIからビジネス要件を共有することで、GitHub Copilotのコード提案能力を13.8%改善し、開発者のタスク成功率を24.5%改善します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:28:19 GMT)
Design nearly optimal quantum algorithm for linear differential equations via Lindbladians [11.5] オープン量子システムを用いたODEの新しい量子アルゴリズムを提案する。
我々は、非対角密度行列符号化と呼ばれる新しい手法の助けを借りて、リンドブレディアンの自然な非単位力学を用いる。
我々のアルゴリズムは、既存の量子ODEアルゴリズムを全て上回り、全てのパラメータにほぼ最適に依存することができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:54:41 GMT)
Mapping the Neuro-Symbolic AI Landscape by Architectures: A Handbook on Augmenting Deep Learning Through Symbolic Reasoning [11.4] 統計的強度を持つ記号技法は、人工知能の長年の問題である。
ニューロシンボリックAIは、この統合に焦点を当てている。
シンボリックテクニックの最初のマッピングを,そのアーキテクチャに基づいたフレームワークのファミリーに提示する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:35:59 GMT)
Leveraging LLMs for Hypothetical Deduction in Logical Inference: A Neuro-Symbolic Approach [11.4] 本稿では,忠実な論理的推論のためのニューロシンボリックアプローチであるLINAを紹介する。
LLMが命題論理抽出から洗練された論理推論への移行を自律的に行えるようにすることで、LINAは推論プロセスのレジリエンスを高める。
実証的な評価は、LINAが確立された命題論理フレームワークと従来のプロンプト技術の両方を著しく上回っていることを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:38:46 GMT)
Linear Chain Transformation: Expanding Optimization Dynamics for Fine-Tuning Large Language Models [11.3] 線形連鎖変換(LinChain)は、微調整中に線形変換の列を導入し、最適化力学を豊かにする新しい手法である。
複数の線形変換をパラメータ更新プロセスに組み込むことで、LinChainは更新の効果的なランクを拡大し、複雑なタスク固有の表現を学習するモデルの能力を強化する。
各種ベンチマークタスクの実験から,LinChainはより一般化され,学習可能なパラメータが減り,タスク適応性が向上したことが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:07:24 GMT)
Fast and High-Quality Auto-Regressive Speech Synthesis via Speculative Decoding [11.1] VADUSAは投機的復号化によって自動回帰TTSを高速化する最初のアプローチの一つである。
以上の結果から,VADUSAは推論速度を大幅に向上するだけでなく,将来的な音声コンテンツを自動回帰的に予測するためにドラフトヘッドを組み込むことにより,性能の向上を図っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:12:01 GMT)
Non-rigid Relative Placement through 3D Dense Diffusion [11.1] 相対配置」とは、ある物体が別の物体に配置されていることを予測することである。
近年の相対配置法は,ロボット操作のためのデータ効率学習に大きく進歩している。
これらは、現実の環境では非剛体が多用されているにもかかわらず、まだ変形可能な変換を表現していない。
本研究では,高密度拡散による異方性学習のための視覚に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:41:28 GMT)
Node Regression on Latent Position Random Graphs via Local Averaging [11.0] ノード回帰に対する各種推定器の性能について検討する。
もう一つの選択肢は、まず潜伏位置の間の真の距離を推定し、次にこれらの推定距離を古典的なナダラヤ・ワトソン推定器に注入することである。
本手法は,グラフ近傍が大きすぎる場合や小きすぎる場合であっても,特定の場合において標準の非パラメトリックレートを達成することができることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:17:06 GMT)
Power side-channel leakage localization through adversarial training of deep neural networks [10.8] 監視されたディープラーニングは、暗号実装に対するパワーサイドチャネル攻撃を実行する効果的なツールとして登場した。
本稿では,暗号鍵の漏洩の原因となるパワートレースのタイムステップを特定する手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:04:41 GMT)
Context Embeddings for Efficient Answer Generation in RAG [10.7] 提案するCOCOMは,コンテキストの長いコンテキストを少数のコンテキスト埋め込みに短縮する,効果的なコンテキスト圧縮手法である。
提案手法では,最大5.69ドルの高速化を実現しつつ,既存の効率的な文脈圧縮手法と比較して高い性能を実現している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:34:54 GMT)
AmpleGCG-Plus: A Strong Generative Model of Adversarial Suffixes to Jailbreak LLMs with Higher Success Rates in Fewer Attempts [10.5] 生成モデルは、有害なクエリに対して、すばやく多数のカスタマイズ可能なジベリの逆接接尾辞を生成することができる。
我々はAmpleGCG-Plusを導入した。
我々はGPT-4と同じ速度で新しいGPT-4oシリーズをジェイルブレイクし、最近提案されたサーキットブレーカー防御に対する脆弱性を明らかにする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:40:07 GMT)
CoLoR-Filter: Conditional Loss Reduction Filtering for Targeted Language Model Pre-training [10.5] 本稿では,ベイズに触発された経験的アプローチを利用して,単純で効率的な選択基準を導出するデータ選択手法であるCoLoR-Filterを提案する。
CoLoR-Filterは1.2bパラメータターゲットモデルをトレーニングして、ランダムに選択された25bトークン上でトレーニングされた1.2bパラメータモデルにマッチさせることができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:26:14 GMT)
PAD: Personalized Alignment at Decoding-Time [10.3] 本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:51:33 GMT)
PAD: Personalized Alignment at Decoding-Time [10.3] 本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:51:33 GMT)
PAD: Personalized Alignment at Decoding-Time [10.3] 本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:51:33 GMT)
PAD: Personalized Alignment at Decoding-Time [10.3] 本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:51:33 GMT)
VB-LoRA: Extreme Parameter Efficient Fine-Tuning with Vector Banks [10.3] ローランク適応(LoRA)とその派生型は、かなりのストレージと送信コストを発生させる。
我々は,行列次元,モジュール,レイヤ間の低ランク分解の障壁を断ち切る「分割共有」パラダイムを導入する。
VB-LoRAは、最先端PEFT法と比較して、同等または優れた性能を維持しながら、極端なパラメータ効率を達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:24:43 GMT)
Mutagenesis screen to map the functions of parameters of Large Language Models [10.2] 我々は、Llama2-7bとZephyrの生物学的研究で用いられた手法に触発された変異原性スクリーンを用いた。
表現型、特に重篤な結果をもたらす変異は、軸に沿って集結する傾向にあった。
ゼファーでは、特定の突然変異は、記述的なアウトプットよりも詩的な、あるいは会話的な結果をもたらす。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:03:22 GMT)
Democratizing Reward Design for Personal and Representative Value-Alignment [10.2] 本稿では,対話型対話アライメント(Interactive-Reflective Dialogue Alignment)について紹介する。
本システムは,言語モデルに基づく嗜好誘導を通じて個々の価値定義を学習し,パーソナライズされた報酬モデルを構築する。
本研究は, 価値整合行動の多様な定義を示し, システムによって各人の独自の理解を正確に捉えることができることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:37:01 GMT)
DINeuro: Distilling Knowledge from 2D Natural Images via Deformable Tubular Transferring Strategy for 3D Neuron Reconstruction [10.1] 3D光顕微鏡画像データからニューロンの形態を再構築することは、神経科学者が脳ネットワークや神経解剖学を分析するのを助けるために重要である。
本稿では, 潜伏埋め込み空間における神経構造固有の管状特性に, 事前学習した2次元自然知識を適応させる変形可能な管状伝達戦略を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:36:03 GMT)
Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance [10.1] 拡散モデルの合成生成能力は,大規模言語モデル指導によって著しく向上できることを示す。
本稿では、レア・ツー・頻繁なコンセプトガイダンスを計画し、実行するためのトレーニングフリーアプローチR2Fを提案する。
我々のフレームワークは、事前訓練された拡散モデルやLLMに対して柔軟であり、領域誘導拡散アプローチとシームレスに統合することができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:43:39 GMT)
Exploring the Role of Token in Transformer-based Time Series Forecasting [10.1] Transformer-based method is a mainstream approach for solve time series forecasting (TSF)
モデル構造を最適化することに集中しており、予測のためのトークンの役割に注意を払う研究はほとんどない。
勾配は、主に正のトークンと呼ばれる予測級数に寄与するトークンに依存する。
T-PEとV-PEを利用するために,トランスフォーマーベースのデュアルブランチフレームワークであるT2B-PEを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:29:39 GMT)
Very Attentive Tacotron: Robust and Unbounded Length Generalization in Autoregressive Transformer-Based Text-to-Speech [10.0] 本稿では,ARトランスフォーマーを用いたエンコーダ・デコーダによる音声合成システムの改良について述べる。
提案手法では,アライメント機構を用いて,相対的な位置情報を用いたクロスアテンション操作を行う。
これらの改良を取り入れたVery Attentive Tacotronと呼ばれるシステムは、ベースラインT5ベースのTSシステムの自然性と表現性にマッチする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:17:01 GMT)
Diffusion as Reasoning: Enhancing Object Goal Navigation with LLM-Biased Diffusion Model [9.9] 本稿では,オブジェクトの統計分布パターンを意味マップで学習するために拡散モデルを訓練することにより,ObjectNavタスクの解法を提案する。
また,大域的対象バイアスと局所的LLMバイアス法を提案し,対象オブジェクトをより効果的に生成するために拡散モデルを制約することができる。
未知の領域で生成されたマップに基づいて、エージェントはターゲットの予測位置を目標として設定し、それに向かって移動する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:10:06 GMT)
ProMQA: Question Answering Dataset for Multimodal Procedural Activity Understanding [9.9] 本稿では,アプリケーション指向シナリオにおけるシステム進歩を測定するための新しい評価データセットProMQAを提案する。
ProMQAは401のマルチモーダルプロシージャQAペアから構成され、プロシージャアクティビティのユーザ記録とそれに対応する命令が組み合わされている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:39:28 GMT)
Ladder: A Model-Agnostic Framework Boosting LLM-based Machine Translation to the Next Level [9.7] 汎用大規模言語モデル(LLM)は,広範なWebコンテンツを活用することで,機械翻訳(MT)において顕著な進歩を遂げている。
しかし、翻訳固有のLLMは、ドメイン固有の単言語コーパスを事前学習し、人間の注釈付き翻訳データを用いて微調整することで構築される。
MT用汎用LLMの性能向上のための,新しいモデルに依存しない費用対効果ツールMT-Ladderを開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:15:09 GMT)
Contrastive Sequential-Diffusion Learning: Non-linear and Multi-Scene Instructional Video Synthesis [9.7] 本稿では,最も適切なシーンを選択して,次のシーンの復調過程をガイドし,条件付けするコントラッシブ・シーケンシャルな映像拡散手法を提案する。
実世界のアクション中心のデータを用いた実験は、これまでの作業と比べて、モデルの実用性と一貫性の向上を実証している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:42:39 GMT)
Characterizing and Understanding HGNN Training on GPUs [9.6] ヘテロジニアスグラフニューラルネットワーク(HGNN)は、レコメンデーションシステムや医療分析など、多くの現実世界の領域で広く採用されている。
HGNNトレーニングの効率を高めるためには、トレーニングプロセス内の実行セマンティクスとパターンを特徴づけて分析し、パフォーマンスボトルネックを特定することが不可欠である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:17:42 GMT)
Structured Multi-Track Accompaniment Arrangement via Style Prior Modelling [9.5] 本稿では,これらの課題に対処するために,不整合型因子に対する事前モデリングを活用する新しいシステムを提案する。
私たちのキーとなる設計は、ベクトル量子化と、オーケストレーションスタイルの長期フローをモデル化するためのユニークなマルチストリームトランスの使用です。
本システムでは,既存のベースラインに比べて,コヒーレンス,構造,全体的な配置品質が優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:53:47 GMT)
Can Language Models Replace Programmers? REPOCOD Says 'Not Yet' [9.5] 大規模言語モデル(LLM)は、Pythonのコーディング問題を解決する上で、90pass@1以上のコード生成能力を示す。
我々は,11の有名な実世界のプロジェクトから収集した980の問題をコード生成ベンチマークであるREPOCODを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:21:05 GMT)
Mixed Dynamics In Linear Networks: Unifying the Lazy and Active Regimes [9.4] 遅延状態と平衡状態の両方の特別な場合を含む学習行列の進化の公式を提供する。
混合状態では、ネットワークの一部が遅延し、他方がバランスを取る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:52:18 GMT)
A Message Passing Neural Network Surrogate Model for Bond-Associated Peridynamic Material Correspondence Formulation [9.4] 本稿では,結合関連材料対応の定式化に特化して設計された,メッセージパッシングニューラルネットワーク(MPNN)に基づく新しいサロゲートモデルを提案する。
ノードの特徴にフォーカスする従来のグラフニューラルネットワークとは異なり、我々のモデルはエッジベースの特徴を強調し、定式化において必須の物質点相互作用をキャプチャする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:42:29 GMT)
The Poisson Midpoint Method for Langevin Dynamics: Provably Efficient Discretization for Diffusion Models [9.4] ランゲヴィン・モンテカルロ(Langevin Monte Carlo、LMC)は、最も単純かつ最も研究されたアルゴリズムである。
本稿では, ステップサイズが大きい小型LCCを近似したPoisson Midpoint Methodを提案する。
DDPMは,わずか50~80のニューラルネットワークコールで1000件のニューラルネットワークコールで品質を維持し,同様の計算でODEベースの手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:34:23 GMT)
Lightweight Frequency Masker for Cross-Domain Few-Shot Semantic Segmentation [9.4] 大規模なソースドメインデータセット上でモデルを事前トレーニングするために、クロスドメイン・ショットセグメンテーション(CD-FSS)が提案されている。
ターゲット領域ごとに異なる周波数成分をフィルタリングするだけで、性能が大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:31:27 GMT)
Policy Gradient for Robust Markov Decision Processes [9.4] 本稿では、ロバストなマルコフ決定過程(MDP)を解くために、新しいポリシー勾配法であるダブルループロバストポリシーミラーDescent(MD)を提案する。
MDは、イテレーション毎の適応耐性を持つポリシー最適化に一般的なミラー降下更新ルールを採用し、グローバルな最適ポリシーへの収束を保証する。
我々は,直接パラメータ化とソフトマックスパラメータ化の両方の下での新しい収束結果を含むMDの包括的解析を行い,トランジションミラー・アセンション(TMA)による内部問題の解に対する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:16:02 GMT)
Connecting the Dots: LLMs can Infer and Verbalize Latent Structure from Disparate Training Data [9.3] 本研究では, LLMが学習文書に分散した証拠から潜伏情報を推測する, 暗黙の帰納的推論(OOCR)について検討する。
ある実験では、未知の都市と他の既知の都市の間の距離のみからなるコーパスにLSMを微調整する。
OOCRは様々なケースで成功するが、特にLLMが複雑な構造を学ぶ場合、信頼性が低いことも示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:58:08 GMT)
On the Robustness of Adversarial Training Against Uncertainty Attacks [9.2] 学習問題において、手元のタスクに固有のノイズは、ある程度の不確実性なく推論する可能性を妨げている。
本研究は、敵の例、すなわち、誤分類を引き起こす注意深く摂動されたサンプルに対する防御が、より安全で信頼性の高い不確実性推定を保証していることを実証的および理論的に明らかにする。
我々は,CIFAR-10およびImageNetデータセット上で,公開ベンチマークのRobustBenchから,複数の逆ロバストモデルを評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:12:44 GMT)
On the Statistical Complexity of Estimating VENDI Scores from Empirical Data [9.1] VENDIスコアは、生成モデルを評価するための基準フリーメトリックである。
行列ベースのエントロピー統計に収束する$t$truncated VENDI統計を導入する。
VENDIスコアに対する既存のNystr"om法とFKEA近似法の両方が、定義されたtruncated VENDI統計に収束することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:19:41 GMT)
A Theoretical Study of Neural Network Expressive Power via Manifold Topology [9.1] 実世界のデータに関する一般的な仮定は、それが低次元多様体の上または近くにあるということである。
本研究では,潜在データ多様体のネットワーク表現力について検討する。
本稿では,ReLUニューラルネットワークのサイズ上限について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:09:24 GMT)
Exponentially Consistent Statistical Classification of Continuous Sequences with Distribution Uncertainty [9.0] 分布不確実性を伴う連続配列の多重分類について検討する。
本研究では, 分布自由試験を提案し, 3つの異なる試験設計において, 誤差確率が指数関数的に速く減衰することを証明する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:06:40 GMT)
FLIPHAT: Joint Differential Privacy for High Dimensional Sparse Linear Bandits [8.9] 高次元スパース線形帯域は、シーケンシャルな意思決定問題の効率的なモデルとして機能する。
データプライバシの懸念により、我々は、共同でプライベートな高次元の疎線形帯域について検討する。
FLIPHATは,プライバシパラメータの点で最適に後悔することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:30:08 GMT)
GlobalDoc: A Cross-Modal Vision-Language Framework for Real-World Document Image Retrieval and Classification [8.9] 我々は、自己教師型で事前訓練されたクロスモーダルトランスフォーマーベースのアーキテクチャであるGlobalDocを紹介する。
GlobalDocは、言語と視覚表現を統合することによって、よりリッチなセマンティックな概念の学習を改善する。
適切な評価のために,Few-Shot Document Image Classification (DIC)とContent-based Document Image Retrieval (DIR)の2つの新しい文書レベル下流VDUタスクを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:49:26 GMT)
UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems [8.9] 分割・対数戦略を持つ2段階のニューラルメソッドは、大規模なCO問題に対処する際の効率性を示している。
本稿では,一般の大規模CO問題の解法として,統一型ニューラルディバイド・アンド・コンカー・フレームワーク(UDC)を開発する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:56:09 GMT)
UDC: A Unified Neural Divide-and-Conquer Framework for Large-Scale Combinatorial Optimization Problems [8.9] 2段階のニューラル手法は、大規模なCO問題に対処する際の効率性を示している。
本稿では,一般の大規模CO問題の解法として,統一型ニューラルディバイド・アンド・コンカー・フレームワーク(UDC)を開発する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:56:09 GMT)
Batch, match, and patch: low-rank approximations for score-based variational inference [8.8] ブラックボックス変分推論は高次元問題に対して不十分にスケールする。
スコアベースのBBVIのためのバッチ・アンド・マッチ・フレームワークを拡張した。
提案手法は,高次元推論における多種多様な合成対象分布と実世界の問題に対して評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:42:56 GMT)
Enabling MCTS Explainability for Sequential Planning Through Computation Tree Logic [8.8] モンテカルロ木探索(MCTS)は、シーケンシャルな計画作業のための最も有能なオンライン検索アルゴリズムの1つである。
実世界のデプロイメントにおけるパフォーマンスは高いが、MCTSの本質的な計算は、技術的なバックグラウンドのないユーザにとって理解を困難にしている。
本稿では,MCTSを交通ルーティングサービスに利用し,最適化された経路計画を構築するためにアルゴリズムを統合することを検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:42:33 GMT)
Enhance Hyperbolic Representation Learning via Second-order Pooling [8.8] 双曲表現学習に二階プーリングを導入する。
入力特徴の一般化能力を損なうことなく、サンプル間の距離を自然に増加させる。
低次元の双線形特徴を低次元空間でよく近似できるカーネル近似正則化を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:17:43 GMT)
EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment [8.7] アミノ酸マイクロ環境(EMOCPD)を用いた効率的なタンパク質設計モデルの構築
アミノ酸を取り巻く3次元の原子環境を分析してタンパク質内の各アミノ酸のカテゴリを予測し、予測された高確率アミノ酸カテゴリに基づいてタンパク質を最適化することを目的としている。
トレーニングセットでは80%以上の精度、独立した2つのテストセットでは68.33%と62.32%の精度を実現している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:45:14 GMT)
Quantum Locking of Intrinsic Spin Squeezed State in Earth-field-range Magnetometry [8.6] 地磁気誘起NLZ効果から生じる固有スピン圧縮状態(SSS)を同定した。
我々は、地場磁気センサの感度が量子化されるため、永続的なSSSを実現するための量子ロック技術を開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:22:11 GMT)
PACA: Perspective-Aware Cross-Attention Representation for Zero-Shot Scene Rearrangement [8.4] PACAはシーンアレンジメントのためのゼロショットパイプラインである。
オブジェクトレベルの表現を生成するために,生成,セグメンテーション,特徴エンコーディングを単一ステップに統合する表現を開発する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:10:28 GMT)
Shining a Light on Hurricane Damage Estimation via Nighttime Light Data: Pre-processing Matters [8.4] 我々の研究は、値しきい値、組込みマスキング、品質フィルタリング、計算など、さまざまなNTL前処理技術について検討している。
フロリダ州のカテゴリー4-5ハリケーンの経済被害と鑑別NTLデータの相関性を評価する実験を行った。
これらの結果から,VNP46A2に適用した品質マスキング・インパクション技術は,経済被害データと有意な相関を示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:48:55 GMT)
Leveraging Recurrent Neural Networks for Predicting Motor Movements from Primate Motor Cortex Neural Recordings [8.4] 本稿では,非ヒト霊長類の神経記録から運動運動を復号するための効率的な解法を提案する。
オートエンコーダ Gated Recurrent Unit (AEGRU) モデルがこのタスクのモデルアーキテクチャとして採用された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:36:10 GMT)
Néel Spin-Orbit Torque in Antiferromagnetic Quantum Spin and Anomalous Hall Insulators [8.4] 位相位相は、印加された電場が2つのAFM基板上の反対の非平衡スピンを生成できるスタッガード・エデルシュタイン効果を支持する。
超高速磁気力学を実現するためにAFMトポロジカル位相を利用する素晴らしい方法を発見した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:36:56 GMT)
Discriminative Pedestrian Features and Gated Channel Attention for Clothes-Changing Person Re-Identification [8.3] 衣服交換者再識別 (CC-ReID) の重要性が高まっている。
本稿では,歩行者画像から識別的特徴を効果的に抽出する手法を提案する。
2つの標準CC-ReIDデータセットを用いて実験を行い、提案手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:12:46 GMT)
Let's Be Self-generated via Step by Step: A Curriculum Learning Approach to Automated Reasoning with Large Language Models [8.3] カリキュラム学習にインスパイアされたtextbfLBS3 自動推論のための新しいプロンプト手法を提案する。
LBS3はLLMを操り、ターゲットクエリに関連付けられた簡単にハードなプロキシクエリをリコールする。
これは、簡単なプロキシクエリから派生した例的なプロンプトを利用して、ハードプロキシクエリの解決にLSMを向けるプログレッシブ戦略を起動する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:28:49 GMT)
Neural Isometries: Taming Transformations for Equivariant ML [8.2] 本稿では,観測空間を汎用潜在空間にマップする方法を学習する自動エンコーダフレームワークであるNeural Isometriesを紹介する。
トレーニング済みの潜伏空間で動作する単純なオフ・ザ・シェルフ同変ネットワークは、巧妙に設計された手作りのネットワークと同等の結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:55:17 GMT)
A Stock Price Prediction Approach Based on Time Series Decomposition and Multi-Scale CNN using OHLCT Images [8.1] 本稿では,中国Aシェア市場の株価変動を予測するために,Sequence-based Multi-scale Fusion Regression Convolutional Neural Network (SMSFR-CNN) という新しい手法を提案する。
CNNを利用して逐次的特徴を学習し、それらを画像特徴と組み合わせることで、Aシェア市場株価データセットにおける株価トレンド予測の精度を向上させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:18:05 GMT)
Generative Retrieval with Large Language Models [8.1] 本稿では,大規模言語モデルの事前学習期間中に記憶されたパラメータ化知識を活用して,任意の開始位置からの参照文を独立にリコールする方法について検討する。
KILTナレッジセンシティブなタスクの実験では、LLMが様々なタスク形式の参照通路位置を独立にリコールできることが確認されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:45:35 GMT)
Solving Epistemic Logic Programs using Generate-and-Test with Propagation [8.0] 本稿では,エピステミック論理プログラムのためのジェネレーション・アンド・テストベースの解法のための一般的なフレームワークを提案する。
線形オーバーヘッドを発生させるだけで、テストが必要な候補の数を指数関数的に削減できることを示す。
我々はこれらの理論的な結果に基づいて新しい解法を実装し、よく知られたベンチマークで3.3倍のスピードアップを実現し、91%以上のインスタンスを解き、既存の解法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:28:40 GMT)
Lisa: Lazy Safety Alignment for Large Language Models against Harmful Fine-tuning Attack [7.9] 安全アライメントを備えた大規模言語モデル(LLM)は、有害なデータと混在するデータセットを微調整することで、脱獄することができる。
調整段階の状態を分離して、アライメントとユーザデータセットを最適化することで、脱獄効果を緩和できることを示す。
textbfLazy(textbfi) textbfalignment(textbfLisa)を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:46:55 GMT)
Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey [7.9] 本研究の目的は,攻撃設定に関する共通懸念を解消し,研究課題を正式に確立することである。
具体的には、まず、問題の脅威モデルを示し、有害な微調整攻撃とそのバリエーションを紹介する。
最後に,この分野の発展に寄与する可能性のある今後の研究の方向性について概説する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:52:43 GMT)
Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey [7.9] 本研究の目的は,攻撃設定に関する共通懸念を解消し,研究課題を正式に確立することである。
具体的には、まず、問題の脅威モデルを示し、有害な微調整攻撃とそのバリエーションを紹介する。
最後に,この分野の発展に寄与する可能性のある今後の研究の方向性について概説する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:52:43 GMT)
Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey [7.9] 本研究の目的は,攻撃設定に関する共通懸念を解消し,研究課題を正式に確立することである。
具体的には、まず、問題の脅威モデルを示し、有害な微調整攻撃とそのバリエーションを紹介する。
最後に,この分野の発展に寄与する可能性のある今後の研究の方向性について概説する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:52:43 GMT)
Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey [7.9] 本研究の目的は,攻撃設定に関する共通懸念を解消し,研究課題を正式に確立することである。
まず,問題の脅威モデルを示し,有害な微調整攻撃とそのバリエーションを紹介する。
最後に,この分野の発展に寄与する可能性のある今後の研究の方向性について概説する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:52:43 GMT)
Detecting algorithmic bias in medical-AI models using trees [7.9] 本稿では,医療AI意思決定支援システムにおけるアルゴリズムバイアスの領域を検出するための革新的な枠組みを提案する。
本手法は,医学・AIモデルにおける潜在的なバイアスを,特に敗血症予測の文脈で効果的に同定する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:31:01 GMT)
LiVisSfM: Accurate and Robust Structure-from-Motion with LiDAR and Visual Cues [7.9] LiVisSfMは、LiDARとビジュアルキューを完全に組み合わせたSfMベースの再構築システムである。
本稿では,LiDARのフレーム登録を革新的に行うLiDAR-visual SfM法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:41:56 GMT)
Establishing Nationwide Power System Vulnerability Index across US Counties Using Interpretable Machine Learning [7.9] 2014年から2023年までの3022郡の15分間隔で179万の停電記録を収集しました。
筆者らは,3次元(強度,周波数,持続時間)に基づく電力系統脆弱性評価フレームワークを開発し,分析可能な機械学習モデル(XGBoostとSHAP)を用いて,郡レベルでの電力系統脆弱性指数(PSVI)を算出した。
我々は45州にまたがる318の郡を、特に西海岸(カリフォルニアとワシントン)、東海岸(フロリダと北東部)、五大湖のメガロポリス(シカゴとデトロイトの大都市圏)、および高電力システムの脆弱性のホットスポットとして特定した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:20:42 GMT)
Feature Responsiveness Scores: Model-Agnostic Explanations for Recourse [7.7] 消費者保護規則は、有害な判断を受けた消費者に「原則的理由」のリストを提供することを義務付けている。
実際には、貸し手や雇用主は、特徴帰属法から上位の特徴を返却することで、主な理由を特定できる。
本研究は,標準的な帰属手法が,無言の理由を強調することによって,個人を誤解させる可能性があることを示す。
応答性に基づいて特徴をスコアリングすることで,これらの問題に対処することを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:37:49 GMT)
Vaccine: Perturbation-aware Alignment for Large Language Models against Harmful Fine-tuning Attack [7.7] ユーザがアップロードした有害なデータのいくつかは、微調整を簡単に騙してアライメントが壊れたモデルを生成することができる。
本稿では,ユーザが微調整を行う際のセキュリティリスクを軽減するために,摂動を考慮したアライメント手法であるVaccineを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:06:30 GMT)
A Systematic Literature Review of Spatio-Temporal Graph Neural Network Models for Time Series Forecasting and Classification [7.6] 本稿では、時系列分類と予測のためのアプローチとアプリケーション領域について概観する。
データベース検索を行い,150以上の学術論文が現場における現状の詳細な調査のために選択された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:05:10 GMT)
S-TLLR: STDP-inspired Temporal Local Learning Rule for Spiking Neural Networks [7.6] スパイキングニューラルネットワーク(SNN)は生物学的に妥当なモデルであり、エッジにエネルギー効率の良いインテリジェンスをデプロイするための候補として特定されている。
本稿では,S-TLLRを提案する。S-TLLRはスパイク・タイミング依存塑性(STDP)機構にインスパイアされた新しい3要素時間的局所学習法である。
S-TLLRは、メモリと時間の複雑さが低く、時間ステップの数に依存しないように設計されており、低消費電力エッジデバイス上でのオンライン学習に適している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:11:54 GMT)
Learning Identifiable Factorized Causal Representations of Cellular Responses [7.5] 本稿では, 単一細胞摂動データにおける因果構造を明らかにするFCR学習法を提案する。
FCRは、切り離された複数の細胞表現を学習する。
我々は$mathbfz_tx$と$mathbfz_tx$と$mathbfz_tx$のブロック単位の識別可能性を証明する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:05:22 GMT)
DOFS: A Real-world 3D Deformable Object Dataset with Full Spatial Information for Dynamics Model Learning [7.5] この研究は、完全な空間情報を持つ3次元変形可能な物体(例えば、弾塑性物体)のパイロットデータセットであるDOFSを提案する。
データセットは、アクティブな操作アクション、マルチビューのRGB-Dイメージ、よく登録されたポイントクラウド、3Dデフォルメメッシュ、セマンティクスによる3D占有で構成されている。
さらに, 弾塑性物体の力学をモデル化するための入力として, ダウンサンプリングされた3D占有力と動作を応用したニューラルネットワークを訓練した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:46:16 GMT)
VL-Cache: Sparsity and Modality-Aware KV Cache Compression for Vision-Language Model Inference Acceleration [7.5] VLM(Vision-Language Models)は、多目的なタスクセットにまたがる印象的なパフォーマンスを実証している。
キーバリュー(KV)キャッシュは、画像やビデオなどの長い視覚的コンテキストをエンコードする。
既存のKVキャッシュ圧縮手法は大規模言語モデル(LLM)に有効である
VLM推論の高速化に適した新しいKVキャッシュ圧縮レシピを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:04:34 GMT)
Stochastic Approximation with Unbounded Markovian Noise: A General-Purpose Theorem [7.4] 非有界な状態空間と報酬関数を持つ平均逆強化学習を考える。
近年の研究では、この問題をアクター批判の枠組みで研究している。
線形関数近似を用いた時間差分学習(TD)について検討した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:40:53 GMT)
Improved Patch Denoising Diffusion Probabilistic Models for Magnetic Resonance Fingerprinting [7.4] MRF(Magnetic Resonance Fingerprinting)は、MRIの定量的手法である。
正確な再建を達成することは、特に高度に加速され、アンサンプされた買収において、依然として困難である。
MRF画像再構成のための条件拡散確率モデルを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:38:54 GMT)
Building Altruistic and Moral AI Agent with Brain-inspired Affective Empathy Mechanisms [7.4] 本稿では,人間のような情緒的共感機構を通じて,知的エージェントを自律的に駆動し,道徳的行動を取得することを目的とする。
道徳的実用主義の原理に基づいて、本質的な共感と外生的な自己タスク目標を統合する道徳的報酬関数を設計する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:19:27 GMT)
Gaussian Derivative Change-point Detection for Early Warnings of Industrial System Failures [7.3] 将来のシステム障害の早期警告は、予測メンテナンスとシステムの可用性向上に不可欠である。
本稿では,システム故障を予測するために,システムの健全性を評価するための3段階の枠組みを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:14:03 GMT)
Hybrid quantum-classical approach for combinatorial problems at hadron colliders [7.3] 粒子物理学実験における問題を解くために量子アルゴリズムの可能性を探る。
大型ハドロン衝突型加速器の完全ハドロンチャネルにおけるトップクォーク対生成について検討した。
量子アルゴリズムを用いることで,正しいペアリングを選択する効率を大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:00:07 GMT)
Enhanced Survival Prediction in Head and Neck Cancer Using Convolutional Block Attention and Multimodal Data Fusion [7.3] 本稿では,頭頸部癌患者の生存率を予測するための深層学習に基づくアプローチを提案する。
提案手法は,特徴抽出をCBAM (Convolutional Block Attention Module) とマルチモーダルデータ融合層と統合する。
最終的な予測は、完全にパラメトリックな離散時間生存モデルによって達成される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:56:04 GMT)
Fourier Head: Helping Large Language Models Learn Complex Probability Distributions [7.1] フーリエ級数を用いて構築されたニューラルネットワーク層を導入し,出力がより連続的な構造であれば,任意の線形層に置換することができる。
我々は,大規模な意思決定や時系列予測タスクと同様に,合成データセットの広範な分析を行う。
提案したフーリエヘッドは,基礎となるデータ分布が自然な連続構造を持つシナリオにおいて有効である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:27:58 GMT)
$\mathsf{OPA}$: One-shot Private Aggregation with Single Client Interaction and its Applications to Federated Learning [7.0] 一発のプライベートアグリゲーション(mathsfOPA$)を導入します。
各クライアントはアグリゲーション毎に1回だけ通信するので、ドロップアウトの管理と動的参加が簡単になる。
$mathsfOPA$は実用的で、最先端のソリューションよりも優れています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:50:11 GMT)
Externally Valid Policy Evaluation Combining Trial and Observational Data [6.9] 対象人口に対する政策の結果について有効な推測を行うために,試行データを用いたい。
本研究では,任意のモデル誤校正範囲下で有効な試行ベースの政策評価を行う手法を開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:20:19 GMT)
Eagle: Efficient Training-Free Router for Multi-LLM Inference [6.8] さまざまな能力とコストを持つ大規模言語モデル(LLM)は、AIシステムにおける効率的なモデル選択の必要性を生み出している。
グローバルおよびローカルELOランキングモジュールを組み合わせた,新しいLLMルーティング手法であるEagleを提案する。
イーグルは、AUC(Area Under Curve)スコアで最大23.2%の改善とともに、ベースライン法を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:20:45 GMT)
Demand-Aware Beam Hopping and Power Allocation for Load Balancing in Digital Twin empowered LEO Satellite Networks [6.8] ビームホッピング(BH)技術を利用した低地球軌道(LEO)衛星は、広範囲のカバレッジ、低レイテンシ、高帯域幅、大きな柔軟性を提供する。
従来のビームホッピング(BH)法は、衛星干渉、重なり合うカバー、モビリティといった問題に対処できない。
本稿では,複数のLEO衛星を対象としたDigital Twin(DT)を用いた協調資源割り当てネットワークについて検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:32:11 GMT)
LLS: Local Learning Rule for Deep Neural Networks Inspired by Neural Activity Synchronization [6.7] 従来のバックプロパゲーション(BP)を用いたディープニューラルネットワーク(DNN)のトレーニングは、計算複雑性とエネルギー消費の観点からの課題を提示している。
脳内で観察される神経活動同期現象(LLS)にインスパイアされた新しい局所学習規則を提案する。
LLSは、最大300倍の乗算累積(MAC)演算を減らし、BPのメモリ要求の半分で同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:35:59 GMT)
VaultFS: Write-once Software Support at the File System Level Against Ransomware Attacks [6.7] 寒冷データの保守に向け,Linuxに適したファイルシステム VaultFS を提案する。
ファイルは書き込み・オンス・セマンティクスを通じてサポートされ、保護寿命の終わりまでコンテンツの書き直し(または削除)を受けられない。
VastFSはDenial-of-Service(DOS)攻撃からストレージを保護する機能を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:06:24 GMT)
SimSiam Naming Game: A Unified Approach for Representation Learning and Emergent Communication [6.7] 表現学習と創発的コミュニケーションのための統一的なアプローチであるSimSiam+VAEを提案する。
SimSiam+VAEは変分オートエンコーダをSimSiamネットワークの予測器に統合し、表現学習を強化し、不確実性を捉える。
我々はこのモデルをSimSiam Naming Game(SSNG)と呼ばれるコミュニケーションフレームワークに拡張する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:16:20 GMT)
Enantiomer-Specific Pumping of Chiral Molecules [6.7] 我々はエナンチオマー特異的ポンピング(ESP)と呼ばれる新しいESSTアプローチを提案する。
ESPでは、ダーク状態を持たないエナンチオマーは、関連する内部状態のサブ空間から取り出すことができ、一方ダーク状態のエナンチオマーは、このサブ空間内で有限確率を維持し、ESSTの高効率を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:43:48 GMT)
Eliminating Incoherent Noise: A Coherent Quantum Approach in Multi-Sensor Dark Matter Detection [6.7] 本稿では,複数の量子センサのネットワークにまたがる量子コヒーレンスを利用した新しい暗黒物質検出手法を提案する。
この方法は、非コヒーレントな背景雑音を効果的に除去し、検出感度を大幅に向上させる。
本稿では,解析を包括的に分析し,実数値シミュレーションで補完する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:00:03 GMT)
RNA-GPT: Multimodal Generative System for RNA Sequence Understanding [6.6] RNAは生命に不可欠な遺伝情報を運ぶ必須分子である。
この重要性にもかかわらず、RNAの研究はしばしば、この話題で利用可能な膨大な文献によって妨げられている。
本稿では,RNA発見の簡易化を目的としたマルチモーダルRNAチャットモデルであるRNA-GPTを紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:19:56 GMT)
PK-YOLO: Pretrained Knowledge Guided YOLO for Brain Tumor Detection in Multiplanar MRI Slices [6.5] 我々は、PK-YOLOと呼ばれる事前学習知識(PK)を組み込んだ新しいYou Only Look Once(YOLO)ベースの検出モデルを提案する。
PK-YOLOは、YOLOをベースとした物体検出器として初めて訓練された知識である。
提案したPK-YOLOは,多平面MRI脳腫瘍検出データセット上での競合性能を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:45:59 GMT)
A note on polynomial-time tolerant testing stabilizer states [6.5] Gowers-$3$ of $n$-qubit quantum state $|psirangle に対して改良された逆定理を示す。
すべての$gammageq 0$に対して、$textsfGowers(|psi rangle,3)8 geq gamma ならば、$|psirangle$の安定化器忠実度は、ある定数$C>1$に対して少なくとも$gammaC$である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:49:33 GMT)
REvolve: Reward Evolution with Large Language Models using Human Feedback [6.5] 大規模言語モデル(LLM)は、自然言語のタスク記述から報酬を生成するために使われてきた。
人間のフィードバックによって導かれるLLMは、人間の暗黙の知識を反映する報酬関数を定式化するのに用いられる。
強化学習における報酬設計にLLMを使用する,真に進化的なフレームワークであるRevolveを紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:16:56 GMT)
Exploiting Semantic Scene Reconstruction for Estimating Building Envelope Characteristics [6.4] 2次元画像入力から幾何構造特性を推定する新しいフレームワークであるBuildNet3Dを提案する。
本フレームワークは, 窓面間比と建物のフットプリントの推定において, 高い精度と一般化性を示すとともに, 様々な複雑な建築物構造について評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:29:01 GMT)
Characterization of Noise using variants of Unitarity Randomized Benchmarking [6.4] Unitarity randomized benchmarking (URB) プロトコルは、量子ゲートによって誘導されるノイズのコヒーレンスを推定する方法である。
我々は、実際の量子デバイスから全てのパラメータとノイズモデルを使用する量子シミュレータにおいて、URBプロトコルを初めて実装した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:51:20 GMT)
Towards a theory of how the structure of language is acquired by deep neural networks [6.4] 木のような生成モデルを用いて、自然言語で見られる階層構造の多くをキャプチャする。
トークンとトークンの相関は文法の隠れ変数の表現を構築するのに有効であることを示す。
トレーニングセットのサイズと効果的な相関範囲の関係は、我々の合成データセットを超えていると推測する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:35:25 GMT)
Semi-Supervised Self-Learning Enhanced Music Emotion Recognition [6.3] 音楽感情認識(MER)は、ある楽曲で伝達される感情を特定することを目的としている。
現在利用可能な公開データセットは、サンプルサイズが制限されている。
本稿では,正誤ラベル付きサンプルを自己学習方式で識別する半教師付き自己学習法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:42:07 GMT)
Inverse Attention Agent for Multi-Agent System [6.2] マルチエージェントシステムにとって大きな課題は、エージェントが対戦相手やチームメイトが継続的に変化する様々な環境に動的に適応できるようにすることである。
本稿では、心の理論から概念を取り入れた逆注意エージェントを導入し、注意機構を用いてアルゴリズムで実装し、エンドツーエンドで訓練する。
逆アテンションネットワークが他のエージェントのアテンションを推測することに成功し、この情報によってエージェントのパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:59:11 GMT)
Best Linear Unbiased Estimate from Privatized Histograms [6.2] 差分プライバシ(DP)メカニズムでは、"冗長"出力を解放することは有益である。
最小分散処理は線形射影であることを示す。
最適線形不偏推定(SEA BLUE)のためのスケーラブルアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:49:09 GMT)
Best Linear Unbiased Estimate from Privatized Histograms [6.2] 差分プライバシ(DP)メカニズムでは、"冗長"出力を解放することは有益である。
最小分散処理は線形射影であることを示す。
最適線形不偏推定(SEA BLUE)のためのスケーラブルアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:49:09 GMT)
Toxicity of the Commons: Curating Open-Source Pre-Training Data [6.1] 本研究では、パブリックドメインデータに基づいてトレーニングされたモデルにより有害な出力を減らすためのデータキュレーションパイプラインを提案する。
現在の毒性フィルタリングに対する最先端のアプローチは、しばしばオープンデータモデルに不適当または不適当である。
我々は5つの異なる次元にまたがって分類されたテキストからなるカスタムトレーニングデータセット、ToxicCommonsを作成します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:00:05 GMT)
Unsupervised Training of a Dynamic Context-Aware Deep Denoising Framework for Low-Dose Fluoroscopic Imaging [6.1] フルオロスコープは医用画像におけるリアルタイムX線可視化に重要である。
低線量画像はノイズによって損なわれ、診断精度に影響を及ぼす可能性がある。
蛍光画像系列を動的に認識する教師なし学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:39:31 GMT)
FANCL: Feature-Guided Attention Network with Curriculum Learning for Brain Metastases Segmentation [5.9] ディープ畳み込みニューラルネットワーク(CNN)に基づく手法は,高いセグメンテーション性能を実現している。
畳み込みとプール操作によって重要な特徴情報が失われているため、CNNは小さなBMセグメンテーションにおいて大きな課題に直面している。
本稿では,カリキュラム学習を用いた特徴誘導型注目ネットワーク(FANCL)を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:08:39 GMT)
Self-Relaxed Joint Training: Sample Selection for Severity Estimation with Ordinal Noisy Labels [5.9] オーディナルの雑音ラベルを用いた学習のための新しいフレームワークを提案する。
私たちのフレームワークは、クリーンなサンプル選択とデュアルネットワークアーキテクチャの2つのテクニックを使用します。
2つの手法でソフトラベルとハードラベルを適切に使用することにより、より正確なサンプル選択と堅牢なネットワークトレーニングを実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:23:09 GMT)
Structured Learning of Compositional Sequential Interventions [5.9] 我々は、各ユニットが時間の経過とともに介入の組み合わせに晒される、逐次的な治療体制について考察する。
標準ブラックボックスアプローチは、分類変数の列を出力にマッピングする。
構成の明示的なモデル、すなわち、逐次的介入の効果をモジュールに分離する方法を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:18:11 GMT)
Embedding-based classifiers can detect prompt injection attacks [5.8] 大規模言語モデル(LLM)は敵の攻撃、特にインジェクション攻撃に対して脆弱である。
本稿では,組込み型機械学習(ML)分類器をベースとした新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:36:59 GMT)
Mixing Signals: Data Augmentation Approach for Deep Learning Based Modulation Recognition [5.8] 無線信号のAMRに対する混合信号に基づくデータ拡張戦略を提案する。
実験の結果,提案手法は深層学習に基づくAMRモデルの分類精度を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:27:20 GMT)
Fast-OMRA: Fast Online Motion Resolution Adaptation for Neural B-Frame Coding [5.8] 階層的時間予測を持つほとんどの学習されたBフレームコーデックは、トレーニングとテストに使用されるGOP(Group-of-Pictures)サイズの違いによって生じるドメインシフトの問題に悩まされる。
この領域シフト問題を解決する効果的な戦略の1つは、モーション推定のためにビデオフレームをダウンサンプルすることである。
この研究は、ダウンサンプリング係数を決定するための軽量な分類器を導入している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:57:32 GMT)
Latent Neural Operator for Solving Forward and Inverse PDE Problems [5.8] 本稿では、潜時空間におけるPDEを解く潜時ニューラルネットワーク(LNO)を提案する。
実験によると、LNOはGPUメモリを50%削減し、トレーニングを1.8回スピードアップし、6つのベンチマークのうち4つで最先端の精度に達する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:09:32 GMT)
Proximal Causal Inference With Text Data [5.8] 本稿では,2つの前処理テキストデータを用いた因果推論手法を提案し,2つのゼロショットモデルを用いて2つのプロキシを推定し,それらのプロキシを近位g-形式に適用する。
ゼロショット予測のためのMIMIC-IIIおよびオープン大言語モデルを用いた実世界の臨床ノートを用いて, 合成および半合成条件下での手法の評価を行った。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:12:52 GMT)
DiffSTR: Controlled Diffusion Models for Scene Text Removal [5.8] Scene Text removed (STR) は、画像中のテキストの不正使用を防止することを目的としている。
STRは、バウンダリアーティファクト、一貫性のないテクスチャと色、正しいシャドウの保存など、いくつかの課題に直面している。
STRを塗装タスクとして扱う制御ネット拡散モデルを提案する。
拡散モデルを満たすためのマスク事前学習パイプラインを開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:20:21 GMT)
Micro-Structures Graph-Based Point Cloud Registration for Balancing Efficiency and Accuracy [5.7] マイクロ構造グラフに基づくグローバルポイントクラウド登録手法を提案する。
提案手法は3DMatch と ETH のデータセットでよく機能する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:36:23 GMT)
Neural Networks Generalize on Low Complexity Data [5.7] 本稿では、ReLUを活性化したフィードフォワードニューラルネットワークが、低複雑性データに基づいて一般化されていることを示す。
我々は、そのようなネットワークの記述長の概念とともに、この単純なプログラミング言語を定義する。
自然数の素性チェックなどの基本的な計算タスクの例を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:53:59 GMT)
Neural Networks Generalize on Low Complexity Data [5.7] 本稿では、ReLUを活性化したフィードフォワードニューラルネットワークが、低複雑性データに基づいて一般化されていることを示す。
我々は、そのようなネットワークの記述長の概念とともに、この単純なプログラミング言語を定義する。
自然数の素性チェックなどの基本的な計算タスクの例を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:53:59 GMT)
Adaptive Aggregation Weights for Federated Segmentation of Pancreas MRI [5.6] フェデレートラーニング(FL)は、機密データを共有することなく、機関間で協調的なモデルトレーニングを可能にする。
フェデレート平均化(FedAvg)のような従来のFLメソッドは、ドメイン間の一般化において困難に直面している。
本稿では適応的なアグリゲーション重みを取り入れた新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:53:01 GMT)
SeTAR: Out-of-Distribution Detection with Selective Low-Rank Approximation [5.6] ニューラルネットワークの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
トレーニング不要なOOD検出手法であるSeTARを提案する。
SeTARは、単純なグリーディ探索アルゴリズムを用いて、モデルの重量行列のポストホックな修正によるOOD検出を強化する。
私たちの研究は、OOD検出のためのスケーラブルで効率的なソリューションを提供し、この分野で新しい最先端を設定します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:21:40 GMT)
ESG Rating Disagreement and Corporate Total Factor Productivity:Inference and Prediction [5.6] 本稿では、2015年から2022年までのA株上場企業のデータに基づいて、ESG評価の不一致(DisBoost)が企業全体の生産性(DisBoost)にどのように影響するかを検討する。
Disは減少する。
特に、国有、資本集約、低汚染の企業において。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:32:46 GMT)
HyperSense: Hyperdimensional Intelligent Sensing for Energy-Efficient Sparse Data Processing [5.6] HyperSenseは、センサデータのオブジェクト存在予測に基づいて、ADCモジュールのデータ生成率を効率的に制御する。
HyperSense用に調整されたFPGAベースのドメイン固有アクセラレータは、NVIDIA Jetson OrinのYOLOv4と比較して5.6倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:24:55 GMT)
Comment on Is Complexity an Illusion? [5.4] 「複雑さはIllusionか?」(Bennett,2024)は複雑性、学習、推論、一般化のための形式主義を提供する。
この回答は、教師付きマルチクラス分類の単純なタスクに対して、正しいポリシーが存在しないことを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:40:05 GMT)
The aspect of bipartite coherence in quantum discord to semi-device-independent nonlocality and its implication for quantum information processing [5.4] 量子不協和は、半デバイス非依存のベルまたはステアリングシナリオの文脈で量子非局所性を示すことができる。
この研究は、半デバイス非依存の量子情報タスクにおいて、バイパーティイトコヒーレンス(英語版)のどの側面が不可欠かに対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:18:42 GMT)
The aspect of bipartite coherence in quantum discord to semi-device-independent nonlocality and its implication for quantum information processing [5.4] 量子不協和は、半デバイス非依存のベルまたはステアリングシナリオの文脈で量子非局所性を示すことができる。
この研究は、半デバイス非依存の量子情報タスクにおいて、バイパーティイトコヒーレンス(英語版)のどの側面が不可欠かに対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:18:42 GMT)
The aspect of bipartite coherence in quantum discord to semi-device-independent nonlocality and its implication for quantum information processing [5.4] textitQuantum discord は textitemi-device-independent Bell や steering シナリオのコンテキストにおいて textitquantum の非局所性を示すことができる。
この研究は、セミデバイス非依存の量子情報タスクにおいて、テクスタイビパルタイトコヒーレンス(英語版)のどの側面が不可欠かに対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:18:42 GMT)
Reducing the Transformer Architecture to a Minimum [5.4] トランスフォーマーは、特に自然言語処理(NLP)とコンピュータビジョン(CV)において、広く成功しているモデルアーキテクチャである。
注意機構自体は、その内部的な類似度測定によって非線形である。
MNISTとCIFAR-10という,広範なCVベンチマークを試験して,その基盤を築き上げた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:13:27 GMT)
Efficient Neural Network Training via Subset Pretraining [5.4] ニューラルネットワークのトレーニングでは、バッチ上で計算された部分勾配を使用するのが一般的である。
トレーニングセットの損失最小限は、そのサブセットのミニマによって適切に近似されることが期待できる。
実験の結果 従来の訓練に匹敵する結果に 達できることが確認されました。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:18:51 GMT)
Jump Starting Bandits with LLM-Generated Prior Knowledge [5.3] 大規模言語モデルは、オンライン学習の後悔を減らすために、文脈的マルチアームバンディットを飛躍的に開始できることを示す。
そこで本稿では,LLMに対して,バンドイットに近似した人選好の事前学習データセットを作成するように促すことにより,コンテキスト的帯域幅を求めるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:42:20 GMT)
Where Do Large Learning Rates Lead Us? [5.3] 小さいLRや重量平均値で微調整を行った結果,初期LRの幅が狭いだけで最適な結果が得られた。
これらの初期LRは、タスクに最も関係のある機能に明確に焦点を合わせながら、学習された機能の集合を疎結合にしていることを示す。
対照的に、LRが小さすぎると不安定な最小化が生じ、全ての特徴を同時に学習しようと試み、その結果一般化が不十分になる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:14:37 GMT)
Multi-aspect Depression Severity Assessment via Inductive Dialogue System [5.2] インダクティブ対話システム(MaDSA)を用いたマルチアスペクトうつ病重症度評価の新しい課題を提案する。
補助的感情分類タスクによる心理的対話応答を誘導するMaDSAの基礎システムを提案する。
我々は,感情ラベルとともに,抑うつの重大度を8つの側面で注釈付けした会話データセットを合成し,人間の評価によって頑健さを証明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:00:08 GMT)
Unpicking Data at the Seams: VAEs, Disentanglement and Independent Components [5.1] データのゆがみ(disentanglement)、あるいは統計的に独立な要因を特定することは、機械学習と統計学の多くの分野に関心がある。
絡み合いは、変分オートエンコーダ(VAE)、生成逆数ネットワーク(Generative Adversarial Networks)、拡散モデルなど、いくつかの生成パラダイムで生じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:54:18 GMT)
Revisiting Reliability in Large-Scale Machine Learning Research Clusters [5.0] 信頼性は、大規模な機械学習インフラストラクチャを操作する上での根本的な課題である。
インフラストラクチャ障害に関する何十年もの研究にもかかわらず、さまざまなスケールでのジョブ障害の影響は、まだ不明である。
本稿では,2つの大規模マルチテナントMLクラスタを管理する視点について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:02:53 GMT)
A Data-Driven Analysis of the Sovereign Citizens Movement on Telegram [5.0] 本稿では,2つのテレグラムチャンネルを調べることで,ソブリン市民のオンライン活動に光を当てることを目的とする。
888K以上のテキストを収集し,NLP技術を適用した。
この2つのチャネルは、QAnonのような他の過激派グループに比べて毒性が低いことが分かりました。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:39:45 GMT)
Human-Readable Programs as Actors of Reinforcement Learning Agents Using Critic-Moderated Evolution [4.8] 我々はTD3上に構築し、その批判をプログラムを合成する遺伝的アルゴリズムの客観的機能の基礎として利用する。
私たちのアプローチでは、単純なMean Squared Errorではなく、プログラムを実際の高い報酬に導いています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:57:33 GMT)
Efficient Incremental Code Coverage Analysis for Regression Test Suites [4.8] 回帰テスト選択(RTS)技術は、コードの変更によって振る舞いが影響を受ける可能性のあるテストのサブセットを選択するために存在する。
最小限のテストを実行することでコードカバレッジ分析を高速化する,最初のインクリメンタルコードカバレッジ分析手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:06:14 GMT)
FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation [4.8] 実世界のユーザインタラクションにおけるLMの事実性を評価するパイプラインであるVERIFYを提案する。
検証は、LM生成したコンテンツの妥当性を考慮し、コンテンツユニットをサポート、サポート、決定不能と分類する。
我々は、FactBench上でGPT、Gemini、Llama3.1ファミリーから広く使われているLMをベンチマークした。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:19:56 GMT)
FGCE: Feasible Group Counterfactual Explanations for Auditing Fairness [4.7] 本稿では,モデルフェアネスを監査するために,グループ対実的説明を生成する最初のグラフベースのフレームワークを提案する。
我々のフレームワークは、Fasible Group Counterfactual Explanations (FGCEs)と名付けられ、現実世界の現実性制約を捉え、類似の反事実を持つサブグループを構築する。
また、カウンターファクト・ジェネレーションにおける重要なトレードオフとして、カウンターファクト・ジェネレーションの件数、関連するコスト、達成された範囲の広さのバランスがあげられる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:10:01 GMT)
Dissecting Query-Key Interaction in Vision Transformers [4.7] 視覚変換器における自己注意はしばしば知覚的なグループ化を行うと考えられている。
相互作用行列の特異値分解による問合せキーの相互作用の解析を行う。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:23:05 GMT)
Orb: A Fast, Scalable Neural Network Potential [4.7] 我々は、物質の原子論モデリングのための普遍的な原子間ポテンシャルの族Orbを紹介する。
オルブモデルは、既存の普遍ポテンシャルの3~6倍の速度で、分散材料の範囲のシミュレーションの下で安定している。
我々はOrbを幾何学最適化,モンテカルロ,分子動力学シミュレーションのモデルとして評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:20:14 GMT)
Control when confidence is costly [4.7] 我々は、推論の計算コストを考慮に入れた制御バージョンを開発する。
線形二次ガウス (LQG) 制御について, 後続確率の相対的精度について, 内部コストを加算して検討した。
共同推論と制御問題を解く合理的戦略は,タスク要求に応じて相転移を経る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:52:56 GMT)
Vision Paper: Designing Graph Neural Networks in Compliance with the European Artificial Intelligence Act [4.7] 本稿では、複雑なグラフ構造化データを扱うGNNのためのAI法がもたらす固有の課題に対処する。
データ管理、データガバナンス、堅牢性、人間の監視、プライバシーに関する法律の要件は、GNNの適切な戦略を必要とする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:22:45 GMT)
Predicting the Encoding Error of SIRENs [4.7] Inlicit Neural Representation (INR)は、ニューラルネットワークの重みにおける画像、ビデオ、三次元形状などの信号を符号化する。
本稿では、人気のあるINRネットワーク(SIREN)が到達する符号化エラーを予測する手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:19:22 GMT)
Fingerprints of Super Resolution Networks [4.7] 我々はこの研究を、単一画像超解像(SISR)ネットワークに拡張する。
SISRネットワークは高いアップスケーリング係数を持つか、あるいは敵の損失を用いて訓練された場合、非常に特異な指紋が残る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:44:39 GMT)
Enhancing Learned Image Compression via Cross Window-based Attention [4.7] 特徴符号化モジュールと統合したCNNベースのソリューションを提案する。
クロススケールウィンドウベースアテンションは、変換器のアテンション機構にインスパイアされ、受容場を効果的に拡大する。
提案手法はKodakおよびCLICデータセット上で評価し,提案手法が有効であり,最先端手法と同等であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:25:34 GMT)
A Theoretical Review on Solving Algebra Problems [4.6] 本稿では、まず状態変換理論(STT)を開発し、問題解アルゴリズムは状態や変換に応じて構造化されていることを強調する。
この構造は、単語と図形代数学の問題を解くための関係中心のアルゴリズムに適合する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:16:49 GMT)
Scaling Laws for Data Poisoning in LLMs [4.6] 近年の研究では、LSMは部分的に破損したデータや有害なデータに基づいて訓練されるデータ中毒に弱いことが示されている。
我々は、悪意のある微調整、不完全なデータキュレーション、意図的なデータ汚染の3つの脅威モデルを考える。
より大きなLSMはますます脆弱になってきており、データ中毒の少ないLSMよりも、有害な行動の学習が著しく速いことがわかりました。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:59:26 GMT)
Data Poisoning in LLMs: Jailbreak-Tuning and Scaling Laws [4.6] 我々は新しい攻撃パラダイムであるjailbreak-tuningを開発し、データ中毒とjailbreakを組み合わせ、最先端の保護を全面的にバイパスする。
悪意のある微調整、不完全なデータキュレーション、意図的なデータ汚染の3つの脅威モデルを評価する。
我々の実験では、より大きなLSMは、より小さなモデルよりも、有害なデータへの最小限の露出から有害な振る舞いを学習し、データ中毒にかなり敏感であることが判明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:59:26 GMT)
CFSafety: Comprehensive Fine-grained Safety Assessment for LLMs [4.4] 5つの古典的安全シナリオと5種類の命令攻撃を統合した安全評価ベンチマークCFSafetyを導入する。
このテストセットは、大規模言語モデル(LLM)の自然言語生成能力を評価するために使用された。
その結果, GPT-4は安全性能に優れていたが, このモデルを含むLLMの安全性は改善が必要であることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:25:20 GMT)
Antichiral and trap-skin dynamics in a nonreciprocal bosonic two-leg ladder with artificial magnetic flux [4.4] 非ハーモニティ性および合成ゲージ場は、量子系における工学的エキゾチック相と力学において2つの基本的な役割を果たす。
合成磁束と非相反ホッピングを持つ2脚ラグにおける相互作用するボソンの平均場動力学について検討した。
その結果,非ハーミティシティ,非線形性,および人工ゲージ場間の相互作用下での興味深い力学現象に光を当てた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:36:31 GMT)
CT to PET Translation: A Large-scale Dataset and Domain-Knowledge-Guided Diffusion Approach [4.4] PET(Positron Emission Tomography)とCT(Computed Tomography)は、様々な疾患、特にがんの診断、ステージング、モニタリングに不可欠である。
その重要性にもかかわらず、PET/CTシステムの使用は、放射性物質の必要性、PETスキャナーの不足、PETイメージングに関連する高コストによって制限されている。
これらの課題に対して,CT画像からPET画像を生成するという課題に対処し,医療検査コストと患者の健康リスクの両面で低減することを目的とした。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:48:52 GMT)
Diffusion Approximations for Thompson Sampling [4.4] 本研究では,SDEの水平線とODEの離散バージョンに基づいてトンプソンサンプリングのダイナミクスが進化することを示す。
我々の弱収束理論は、連続写像定理を用いて第一原理から発展する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:20:54 GMT)
Deep Priors for Video Quality Prediction [4.3] 本研究では,1枚の歪みビデオと1枚の参照ビデオを用いて,先行した深度ビデオの学習を行った。
歪んだビデオから元の映像を復元する前、深層ビデオの学習能力を測定し、ビデオの歪みを定量化する。
我々のアルゴリズムは単一のビデオペアを使って訓練されており、ラベル付きデータを必要としない。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:15:03 GMT)
SMART: Scalable Multi-agent Real-time Generation via Next-token Prediction [4.3] 本稿では,ベクトル化された地図とエージェント軌跡データを離散的なシーケンストークンにモデル化する,新しい自律走行運動生成パラダイムを提案する。
これらのトークンはデコーダのみのトランスフォーマーアーキテクチャを通じて処理され、次のトークン予測タスクをトレーニングする。
複数のデータセットから10億以上のモーショントークンを収集し、モデルのスケーラビリティを検証しました。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:58:42 GMT)
A Probabilistic Hadamard U-Net for MRI Bias Field Correction [4.3] 本稿では,前立腺MRIバイアス場補正のための確率的アダマールU-ネットを提案する。
高速な推論速度で前立腺MRIのバイアス場を補正するためのPHU-Netの有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:24:47 GMT)
u-$μ$P: The Unit-Scaled Maximal Update Parametrization [4.3] 我々は、u-mu$Pという新しいスキームを提示し、ユニットスケーリングと組み合わせることで、$mu$Pを改善する。
2つのテクニックには自然な親和性がある。$mu$Pはアクティベーションのスケールがモデルサイズに依存しないことを保証するとともに、ユニットスケーリングはアクティベーション、ウェイト、勾配が1つのスケールでトレーニングを開始することを保証します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:09:28 GMT)
A Lightweight Measure of Classification Difficulty from Application Dataset Characteristics [4.2] 効率的なコサイン類似度に基づく分類困難度尺度Sを提案する。
データセットのクラス数とクラス内およびクラス間の類似度メトリクスから計算される。
この手法を実践者が、繰り返しトレーニングやテストによって、6倍から29倍の速度で効率の良いモデルを選択するのにどのように役立つかを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:22:13 GMT)
BLAPose: Enhancing 3D Human Pose Estimation with Bone Length Adjustment [4.2] この研究は、ビデオシーケンス全体にわたる全体的情報をキャプチャするために設計された、リカレントニューラルネットワークアーキテクチャを導入している。
本稿では, 身体的制約に順応する合成骨長を用いた新しい拡張戦略を提案する。
我々は,推定骨長を用いた人間のポーズ推定モデルを微調整し,顕著な改善を観察した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:25:55 GMT)
Are Paraphrases Generated by Large Language Models Invertible? [4.1] パラフレーズ変換の問題を考える: パラフレーズ化された文書が与えられたら、原文を復元しようとする。
我々は、追加の著者固有の文脈を伴わず、かつ無関係に、パラフレーズ逆変換モデルを微調整する。
パラフレーズ化された機械生成テキストから始めると、学習した反転モデルを用いて文書のかなりの部分を復元できることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:46:24 GMT)
Hausdorff Distance Matching with Adaptive Query Denoising for Rotated Detection Transformer [4.1] 両部マッチングのためのハウスドルフ距離に基づくコストを導入し、予測と基底の真理との相違をより正確に定量化する。
本稿では,2部マッチングを用いた適応型問合せ記述手法を提案し,モデル改良から抽出した雑音付き問合せを選択的に除去する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:36:23 GMT)
Sorted Weight Sectioning for Energy-Efficient Unstructured Sparse DNNs on Compute-in-Memory Crossbars [4.1] $textitsorted weight sectioning$ (SWS) は、ビットスライクな計算インメモリ(CIM)クロスバーにソートされたディープニューラルネットワーク(DNN)重みを配置する重み付けアルゴリズムである。
提案手法は,非構造スパルスBERTモデルにおけるADCエネルギー使用量を89.5%削減する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:39:50 GMT)
Efficient Reprogramming of Memristive Crossbars for DNNs: Weight Sorting and Bit Stucking [4.1] 深層ニューラルネットワーク(DNN)のためのビットスライクな計算-イン-メモリクロスバー上でのmemristorの再プログラミングに必要な時間を削減するための新しい手法を提案する。
我々のアイデアは、不揮発性メモリの持続時間に制限を課し、再プログラムできる回数を制限する。
また,ResNet-50では3.7倍,ViT-Baseでは21倍,モデルの精度は1%の範囲で大幅に低下した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:34:02 GMT)
BF-Meta: Secure Blockchain-enhanced Privacy-preserving Federated Learning for Metaverse [4.0] 分散モデルアグリゲーションを備えたセキュアなブロックチェーン駆動FLフレームワークであるBF-Metaを提案する。
本稿では,悪意のあるユーザの悪影響を軽減し,メタバースにセキュアな仮想サービスを提供するため,BF-Metaを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:52:49 GMT)
Minimax optimality of deep neural networks on dependent data via PAC-Bayes bounds [3.9] Schmidt-Hieber (2020) は、最小二乗回帰推定のためにReLuを活性化したディープニューラルネットワークの最小最適性を証明した。
我々は、最小二乗およびロジスティック回帰を含むより一般的な機械学習問題について研究する。
我々は、ロジスティック損失を伴う分類の類似の下限を確立し、提案したDNN推定器がミニマックスの意味で最適であることを証明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:37:02 GMT)
Propensity Score Alignment of Unpaired Multimodal Data [3.8] マルチモーダル表現学習技術は通常、共通の表現を学ぶためにペア化されたサンプルに依存する。
本稿では,マルチモーダル表現学習において,異なるモダリティにまたがるアンペア化サンプルの整列化という課題に対処するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:04:20 GMT)
Hamiltonian Monte Carlo on ReLU Neural Networks is Inefficient [3.8] 本稿では,ReLUファミリーにおけるアクティベーション関数の非微分性のため,これらのアクティベーション関数を持つネットワークに対するHMCは局所誤差が大きいことを示す。
そして、実世界のデータセットでの実験だけでなく、経験的なシミュレーションを通して理論的な結果を検証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:23:42 GMT)
Toward best research practices in AI Psychology [3.8] 言語モデルは、AI心理学の急成長する分野の重要な部分となっている。
言語に基づくAIシステムの認知能力を評価するための,より堅牢で汎用的な研究を支援するための,14の方法論的考察について論じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:51:28 GMT)
Analysis of Generative AI Policies in Computing Course Syllabi [3.8] 2022年にChatGPTがリリースされて以来、ジェネレーティブAI(GenAI)は、全米の高等教育コンピューティング教室でますます使われている。
我々は、米国の54のR1機関から98のコンピューティングコースシラビを収集し、採用したGenAIポリシーと周囲の談話を調査した。
分析の結果,1)GenAI使用に関する指示は,コースの学術的整合性政策の一部であり,2)GenAI使用を禁止あるいは制限するシラビが多かった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:34:10 GMT)
Value Preferences Estimation and Disambiguation in Hybrid Participatory Systems [3.8] 参加者が選択を行い、その選択に対するモチベーションを提供するハイブリッド参加システムを構想する。
参加者の選択とモチベーションの衝突を検出する状況に焦点を当てる。
本研究では,検出された不整合に対処しながら,参加者と対話して値の選好を推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:25:30 GMT)
Beyond Text: Optimizing RAG with Multimodal Inputs for Industrial Applications [3.8] 大きな言語モデル(LLM)は、質問に答える際、印象的な能力を示してきたが、それらはドメイン固有の知識に欠け、幻覚を起こす傾向がある。
Retrieval Augmented Generation(RAG)は、これらの課題に対処するためのアプローチのひとつであり、マルチモーダルモデルは、テキストとイメージの両方を処理するための有望なAIアシスタントとして現れている。
本稿では,産業領域のRAGシステムにマルチモーダルモデルをどのように組み込むかを決定するための一連の実験について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:03:31 GMT)
Collaboratively adding new knowledge to an LLM [3.7] 半協調と完全協調の2つの設定について検討する。
LoRAは、新しい知識獲得と古い知識の保持の両方を考慮に入れた場合、ほとんどの場合、すべてのパラメータの完全なチューニングよりも優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:03:36 GMT)
Banded Square Root Matrix Factorization for Differentially Private Model Training [3.6] 本稿では,この計算ボトルネックを克服する新しい行列分解手法であるBSRを提案する。
標準行列平方根の特性を利用することにより、BSRは大規模問題も効率的に扱うことができる。
我々の数値実験により、BSRを用いて訓練されたモデルは、その計算オーバーヘッドを完全に回避しつつ、最良の既存手法と同等に機能することを示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:01:14 GMT)
NaRCan: Natural Refined Canonical Image with Integration of Diffusion Prior for Video Editing [3.6] 我々は,高品質な自然な標準画像を生成する前に,ハイブリッドな変形場と拡散を統合したビデオ編集フレームワークであるNaRCanを提案する。
提案手法は,グローバルな動きをモデル化するためにホモグラフィを使用し,局所的な残留変形を捉えるために多層パーセプトロン(MLP)を用いる。
提案手法は,様々なビデオ編集タスクにおいて既存の手法よりも優れ,一貫性と高品質な編集ビデオシーケンスを生成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:21:45 GMT)
Unlocking the Power of Multi-institutional Data: Integrating and Harmonizing Genomic Data Across Institutions [3.5] 共通遺伝子を超えて情報を保存するための統合的特徴を導出するためにブリッジモデルを導入する。
このモデルは、GenIE BPCデータにおいて、6種類のがん種にわたる患者の生存を予測するのに一貫して優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:48:56 GMT)
SimRec: Mitigating the Cold-Start Problem in Sequential Recommendation by Integrating Item Similarity [3.5] SimRecはシーケンシャルレコメンデーションシステムにおけるコールドスタート問題を緩和するための新しいアプローチである。
カスタマイズされた損失関数を通じて、アイテムの類似性をトレーニングプロセスに組み込む。
SimRecはSASRecに比べて最大78%高いHR@10を達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:32:36 GMT)
Energy-Aware Multi-Agent Reinforcement Learning for Collaborative Execution in Mission-Oriented Drone Networks [3.5] ミッション指向ドローンネットワークは、構造検査、災害監視、国境監視などに広く利用されている。
ドローンのバッテリ容量が限られているため、ミッション実行戦略はネットワークの性能とミッション完了に影響を及ぼす。
本研究では,マルチエージェント強化学習(MARL)を活用し,その課題を管理する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:43:26 GMT)
Structured Analysis and Comparison of Alphabets in Historical Handwritten Ciphers [3.4] 本稿では,暗号文書のペア比較手法であるCSIメトリックを提案する。
我々は、SIFT、事前学習型埋め込み、OCR記述子などの視覚的特徴を利用した教師なしクラスタリングシナリオにおけるそれらの有効性を評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:12:16 GMT)
ET-Flow: Equivariant Flow-Matching for Molecular Conformer Generation [3.4] 低エネルギー分子配座の予測にET-Flow(Equivariant Transformer Flow)を導入する。
提案手法は,最小限の仮定で全原子座標を演算する,単純でスケーラブルな手法である。
ET-Flowは、より軽量で推論の速いモデルでありながら、生成したコンバータの精度と物理的妥当性を著しく向上させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:44:10 GMT)
Data Generation for Hardware-Friendly Post-Training Quantization [3.4] 合成データを用いたゼロショット量子化(ZSQ)は、プライバシとセキュリティ制約下でのポストトレーニング量子化(PTQ)の重要なアプローチである。
既存のデータ生成方法は、ハードウェアフレンドリーな量子化に適したデータを生成するのに苦労することが多い。
ハードウェアフレンドリな量子化のためのデータ生成(DGH)を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:08:50 GMT)
Causal Contrastive Learning for Counterfactual Regression Over Time [3.4] 本稿では, 長期予測を重視した, 反実的回帰に対するユニークなアプローチを提案する。
Causal Transformerのような既存のモデルから切り離し、我々のアプローチは長期的な予測にRNNを使うことの有効性を強調します。
提案手法は, 合成データと実世界のデータの両方を用いて, 最先端の対物推定結果を実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:12:20 GMT)
Fractal and Turbulent Feature Extraction and NFT Label Generation for Pollock Style Migration Paintings Based on VGG19 [3.3] 本稿では, 深層学習, フラクタル解析, 乱流特徴抽出技術を融合した革新的な手法を提案する。
画像の内容とスタイルは,MindSporeディープラーニングフレームワークと事前学習されたVGG19モデルにより抽出される。
本手法は,コンテンツ損失,スタイル損失,フル分散損失を組み合わせ,高品質なPollockスタイルの画像を生成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:18:47 GMT)
Understanding and Reusing Test Suites Across Database Systems [3.3] データベース管理システム(DBMS)開発者は、システムをテストするために広範なテストスイートを実装している。
これらの広範な努力にもかかわらず、テストスイートはシステム間で体系的に再利用されない。
我々は,広く使用されている3つのシステムからテストケースを統合する統合テストスイート,SQuaLityを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:36:38 GMT)
Adaptive Question Answering: Enhancing Language Model Proficiency for Addressing Knowledge Conflicts with Source Citations [3.3] 本稿では,複数の有効な回答が存在するあいまいな環境下で,ソースを引用した質問応答のタスクを提案する。
1)新しい5つのデータセット,(2)実世界の自然発生コンテキストを特徴とする最初のあいまいなマルチホップQAデータセット,(3)モデルの性能を評価するための2つの新しい指標からなる包括的フレームワークを構築した。
この新しいタスク、データセット、メトリクス、ベースラインは、コミュニティにQA研究の境界を押し進め、より信頼できる、解釈可能なシステムを開発するよう促すことを期待しています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:12:46 GMT)
Adaptive Question Answering: Enhancing Language Model Proficiency for Addressing Knowledge Conflicts with Source Citations [3.3] 本稿では,複数の有効な回答が存在するあいまいな環境下で,ソースを引用した質問応答のタスクを提案する。
1)新しい5つのデータセット,(2)実世界の自然発生コンテキストを特徴とする最初のあいまいなマルチホップQAデータセット,(3)モデルの性能を評価するための2つの新しい指標からなる包括的フレームワークを構築した。
この新しいタスク、データセット、メトリクス、ベースラインは、コミュニティにQA研究の境界を押し進め、より信頼できる、解釈可能なシステムを開発するよう促すことを期待しています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:12:46 GMT)
Proto-Quipper with Reversing and Control [3.3] 我々は、dagger symmetric monoidal category $mathbfR$ を用いて、可逆かつ制御可能な回路のセマンティクスを定式化する。
言語 Proto-Quipper を拡張して,リバース,制御,非計算操作を行う。
本研究では,フ・岸田・ロス・セリンジャー2023のビセット濃縮を一般化したコンクリートモデルを構築した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:22:01 GMT)
ADAM: An Embodied Causal Agent in Open-World Environments [3.2] Minecraftのエンボダイド因果エージェントであるADAMを紹介する。
ADAMは、オープンワールドを自律的にナビゲートし、マルチモーダルなコンテキストを認識し、因果世界知識を学び、生涯学習を通じて複雑なタスクに取り組むことができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:32:01 GMT)
Leveraging Reverberation and Visual Depth Cues for Sound Event Localization and Detection with Distance Estimation [3.2] 本報告では,DCASE2024タスク3の課題として,音源距離推定による音声・音声イベントの定位と検出を行うシステムについて述べる。
本モデルでは,ResNet50で抽出したビデオとオーディオの埋め込みを,SELDで事前学習したオーディオエンコーダで処理するAVコンバータをベースとした。
このモデルは、STARSS23データセットの開発セットのオーディオ視覚ベースラインを広いマージンで上回り、DOAEを半分にし、F1を3倍以上改善した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:28:43 GMT)
Dreaming Out Loud: A Self-Synthesis Approach For Training Vision-Language Models With Developmentally Plausible Data [3.2] 人間の認知発達からインスピレーションを得て、限られたデータ条件下でモデルをトレーニングします。
我々の手法は、発達的に妥当な量のデータを用いてマルチモーダルモデルを訓練するための概念実証を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:50:03 GMT)
LogSHIELD: A Graph-based Real-time Anomaly Detection Framework using Frequency Analysis [3.1] ホストデータにおけるグラフベースの異常検出モデルであるLogSHIELDを提案する。
平均98%以上のAUCとF1スコアで、ステルスで高度な攻撃を検出できる。
スループットを大幅に向上し、平均検出レイテンシ0.13秒を実現し、検出時間で最先端モデルを上回るパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:52:43 GMT)
Are VLMs Really Blind [3.1] ビジョン言語モデルは、幅広い複雑なタスクを扱うのに優れている。
これらのモデルは、低レベルの基本的な視覚的タスクではうまく機能しない。
本研究は,特定の質問に応答して画像からキー情報を抽出する,新しい自動パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:20:50 GMT)
Lambda-Skip Connections: the architectural component that prevents Rank Collapse [3.0] 本稿では、変圧器から状態空間モデル(SSM)へのランク崩壊の理論を拡張する。
本研究では,emphlambda-skip接続と呼ばれる古典的スキップ接続コンポーネントのパラメータ化バージョンが,ランク崩壊防止の保証を提供する方法について検討する。
我々の知る限り、これはランク崩壊防止の一般的な保証を提供する最初の研究であり、SSMの文脈でランク崩壊を調査するものである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:59:18 GMT)
Orion: A Fully Homomorphic Encryption Framework for Deep Learning [3.0] ホモモルフィック暗号化(FHE)は、暗号化されたデータに直接計算を行うことで、プライバシーとセキュリティを大幅に改善する可能性がある。
FHEでセキュアな神経推論を大規模に展開する上で直面する大きな課題のひとつは、これらのネットワークをFHEプリミティブに効果的にマッピングすることだ。
本稿では、FHEにおけるプライベートニューラルネットワークのための完全に自動化されたフレームワークであるOrionを用いて、これらの課題に対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:25:37 GMT)
Whose ChatGPT? Unveiling Real-World Educational Inequalities Introduced by Large Language Models [3.0] ChatGPTや他の類似のツールは、学習経験と成果を改善するために、大きな言語モデル(LLM)の可能性について、大きな興奮と実験的努力を喚起しました。
しかし、LLMが教育的価値に与える影響を体系的に調査する研究はほとんどない。
我々は2021年から2024年までの2391のコースで16,791人の大学生から1,140,328人の学術論文を米国内の公立の少数派機関で分析した。
言語学的に有利な学生と不利な学生の書き込み品質のギャップが狭まりつつあり, 学生全体の書き込み品質が徐々に向上していることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:35:46 GMT)
Optimizing Posterior Samples for Bayesian Optimization via Rootfinding [2.9] 我々は,グローバルなルートフィンディングに基づく後方サンプルの効率的な大域的最適化手法を提案する。
内ループ最適化と外ループ最適化の両方において顕著な改善が示された。
GP-TSのサンプル平均定式化も提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:57:16 GMT)
Deep Q-Exponential Processes [2.9] ディープニューラルネットワークによって動機付けられたディープガウス過程(DGP)は、GPの複数の層を積み重ねることで標準GPを一般化する。
Q-指数過程 (Q-EP) はGPへの$L_q$緩和として提案され、より望ましい正規化特性を持つことを示した。
本稿では,Q-EPを深いQ-EPに一般化し,適切な正規化と表現性の向上を両立させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:21:39 GMT)
Secure numerical simulations using fully homomorphic encryption [2.9] ホモモルフィック暗号化(英語版) (FHE) は暗号化されたデータに対するセキュアな計算を可能にする。
偏微分方程式のプライバシ保存数値シミュレーションにおけるFHEの適用可能性について検討する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:47:10 GMT)
Active Event Alignment for Monocular Distance Estimation [2.9] イベントカメラは、視覚情報の自然で効率的な表現を提供する。
本稿では,イベントカメラデータからオブジェクトワイド距離を推定するための行動駆動手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:34:01 GMT)
Effective Guidance for Model Attention with Simple Yes-no Annotations [2.9] CRAYONは最先端のパフォーマンスを実現し、3つのベンチマークデータセットで12メソッドを上回っている。
我々はCRAYON(Correcting Reasoning with s of Yes Or No)を紹介し、モデルの注意を正すための効果的でスケーラブルで実用的なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:53:33 GMT)
Learning the structure of any Hamiltonian from minimal assumptions [2.8] 我々は、ブラックボックスクエリから未知の量子多体ハミルトン$H$を学習する問題とその時間進化について研究する。
我々は、ハミルトニアン項の個数のみを仮定して、任意の$n$-量子ハミルトニアンを学ぶための効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:43:33 GMT)
Optimal convergence rates in trace distance and relative entropy for the quantum central limit theorem [2.8] 有限第三次モーメントを持つ中心の$m$モード量子状態に対して、$rhoboxplus n$ と $rho_G$ のトレース距離が $mathcalO(n-1/2)$ の最適速度で崩壊することを示す。
有限四階モーメントを持つ状態に対しては、$rhoboxplus n$と$rho_G$の間の相対エントロピーが$mathcalO(n-1)$の最適速度で崩壊することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:35:47 GMT)
Predictive auxiliary objectives in deep RL mimic learning in the brain [2.7] 深層強化学習システムにおいて,予測補助目的が表現学習に与える影響について検討した。
予測的目的は,特に資源限定アーキテクチャにおける学習の改善と安定化を図っている。
我々は、RLシステムの補助的予測モデルと、記憶誘導行動を支援するための予測モデルを学ぶと考えられる海馬との関係を描いている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:12:17 GMT)
AffectNet+: A Database for Enhancing Facial Expression Recognition with Soft-Labels [2.6] 画像に複数の感情をラベル付けするラベル付け手法により、FERデータセットを作成するための新しい手法を提案する。
提案手法の利点は, よりスムーズな決定境界の発見, マルチラベル化の実現, バイアスと不均衡データの緩和などにある。
AffectNetをベースとして,次世代の表情データセットであるAffectNet+を紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:57:10 GMT)
Improving Image Data Leakage Detection in Automotive Software [2.6] データ漏洩は、ML/DLモデルをトレーニングする前に、しばしば列車とテストセットにデータを分割するときに見過ごされる。
本研究では,産業パートナーのボルボ・カーズ(Volvo Cars)によるCirrusデータセットの計算実験を行った。
次に、この手法を、自動車分野において広く受け入れられているベンチマークデータセットであるKittiで評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:37:45 GMT)
An Integrated Deep Learning Model for Skin Cancer Detection Using Hybrid Feature Fusion Technique [2.6] 皮膚がんはDNA損傷によって引き起こされる重篤で致命的な病気である。
本研究では,皮膚病変の正確な分類を実現するための,Deep Learning(DL)に基づくハイブリッドフレームワークを提案する。
我々は92.27%の精度、92.33%の感度、92.22%の特異性、90.81%の精度、91.57%のF1スコアを達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:32:53 GMT)
SoccerGuard: Investigating Injury Risk Factors for Professional Soccer Players with Machine Learning [2.6] SoccerGuard - 機械学習(ML)を用いた女子サッカーにおける傷害予測のための新しいフレームワーク
このフレームワークは、プレイヤーの主観的ウェルネスやトレーニング負荷レポート、客観的GPSセンサーの測定、サードパーティの選手統計、医療関係者による確認された負傷報告など、複数のソースからデータを収集することができる。
このフレームワークには、インタラクティブな分析と視覚化をサポートするユーザフレンドリなグラフィカルユーザインタフェース(GUI)を備えたダッシュボードも含まれている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:19:38 GMT)
NCA-Morph: Medical Image Registration with Neural Cellular Automata [2.5] 我々は,Deep Learning (DL) とバイオインスパイアされたコミュニケーションとネットワークのアプローチをシームレスに融合する革新的なアプローチである NCA-Morph を提案する。
NCA-Morphは、効率的な画像登録のためにDLのパワーを利用するだけでなく、生きたシステムで観察される相互作用を模倣して、細胞とそれぞれのボクセル間の局所的な通信ネットワークを構築する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:26:36 GMT)
Revisiting Multi-Granularity Representation via Group Contrastive Learning for Unsupervised Vehicle Re-identification [2.5] 教師なし車両用ReIDフレームワーク(MGR-GCL)を提案する。
識別可能な特徴を学習するために、多粒度CNN表現を統合する。
ターゲットデータセットの擬似ラベルを生成し、ドメイン適応プロセスを容易にする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:24:36 GMT)
A Longitudinal Analysis of Racial and Gender Bias in New York Times and Fox News Images and Articles [2.5] New York Times(NYT)とFox News(Fox)の123,337枚の画像と441,321個のオンラインニュース記事のデータセットを使用します。
ニュース記事に埋め込まれた画像における人種・性別集団の出現頻度と優位性について検討する。
NYTはFoxに比べて、人種的少数派のイメージが圧倒的に多いことがわかりました。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:42:54 GMT)
Pre-Trained Vision Models as Perception Backbones for Safety Filters in Autonomous Driving [2.4] エンド・ツー・エンドのビジョンに基づく自動運転において、安全は依然として大きな関心事である。
我々は、凍結した事前学習された視覚表現モデルを知覚バックボーンとして使用し、視覚に基づく安全フィルタを設計する。
この状況下では、4つの一般的な事前学習型視覚モデルのオフライン性能を実証的に評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:59:23 GMT)
Improving In-Context Learning with Small Language Model Ensembles [2.3] In-context Learning (ICL) は安価で効率的な代替手段であるが、高度な手法の精度と一致しない。
本稿では,複数の微調整小言語モデル(SLM)の専門知識を活用することでICLを強化する新しいアプローチであるEnsemble SuperICLを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:02:37 GMT)
ContextIQ: A Multimodal Expert-Based Video Retrieval System for Contextual Advertising [2.3] コンテキスト広告は、ユーザーが見ているコンテンツに沿った広告を提供する。
共同マルチモーダルトレーニングに基づく現在のテキスト・ビデオ検索モデルでは,大規模なデータセットと計算資源が要求される。
本研究では,コンテキスト広告に特化して設計されたマルチモーダル専門家によるビデオ検索システムであるContextIQを紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:01:05 GMT)
Path-based summary explanations for graph recommenders -- extended version [2.3] そこで本稿では,ユーザやユーザグループに対して,項目レコメンデーションのセットを受信した理由を説明する要約説明を提案する。
また,効率的なグラフアルゴリズムを用いて説明を要約する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:10:03 GMT)
Comparison of Autoencoder Encodings for ECG Representation in Downstream Prediction Tasks [2.3] 自動エンコーダ(SAE)、Annealed beta-VAE(Abeta-VAE)、Cbeta-VAE(Cbeta-VAE)の3種類の新しい変分自動エンコーダ(VAE)を導入した。
アベタVAEは、信号ノイズのレベルである平均絶対誤差(MAE)を15.7プラス3.2マイクロボルトに減らした。
以上の結果から,これらのVAE符号化はECGデータの簡易化だけでなく,限られたラベル付き学習データを用いた文脈での深層学習の実践的解決にも有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:12:08 GMT)
Comparison of Autoencoder Encodings for ECG Representation in Downstream Prediction Tasks [2.3] 自動エンコーダ(SAE)、Annealed beta-VAE(Abeta-VAE)、Cbeta-VAE(Cbeta-VAE)の3種類の新しい変分自動エンコーダ(VAE)を導入した。
アベタVAEは、信号ノイズのレベルである平均絶対誤差(MAE)を15.7プラス3.2マイクロボルトに減らした。
以上の結果から,これらのVAE符号化はECGデータの簡易化だけでなく,限られたラベル付き学習データを用いた文脈での深層学習の実践的解決にも有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:12:08 GMT)
Adaptive Channel Reshaping for Improved Entanglement Distillation [2.2] パウリチャネルと非パウリチャネルのレートを改善するための双方向通信支援型絡み込み蒸留プロトコルを導入する。
振幅減衰流路では、逆コヒーレント情報により、二重レール符号化を用いてチャネルを消去流路に変換することが観察される。
脱分極チャネルでは、性能保証が証明されたGreedyリカレンスプロトコルを導入し、従来の個別プロトコルよりも高いレートを生成可能な、組み合わせたリカレントプロトコルを構築します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:45:01 GMT)
From Silos to Systems: Process-Oriented Hazard Analysis for AI Systems [2.2] システム理論プロセス分析(STPA)をAIの操作と開発プロセスの解析に応用する。
我々は、機械学習アルゴリズムに依存したシステムと、3つのケーススタディに焦点をあてる。
私たちは、AIシステムに適したいくつかの適応があるにもかかわらず、anAを実行するための重要な概念とステップが容易に適用できることに気付きました。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:43:18 GMT)
Reciprocal Reward Influence Encourages Cooperation From Self-Interested Agents [2.1] 自己関心の個人間の協力は、自然界で広く見られる現象であるが、人工的な知的エージェント間の相互作用においては、いまだ解明されていない。
そこで,本研究では,リターンに対する相手の行動の影響を再現するために,本質的に動機づけられた強化学習エージェントであるReciprocatorを紹介する。
本研究では,同時学習において,時間的に拡張された社会的ジレンマにおける協調を促進するために,共用者が利用できることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:16:10 GMT)
Is Our Chatbot Telling Lies? Assessing Correctness of an LLM-based Dutch Support Chatbot [2.0] この研究は、AFASのサポートチームがどのように意思決定するかに基づいて、レスポンスの正しさを定義する最初のものです。
自動的なアプローチが支持率にどの程度近づいたかを調べるためには、バイナリレスポンス(例えば、手動で税率を調整することは可能か?)や指示(例えば、手動で税率を調整するか?)を問う質問を調査した。
われわれのアプローチでは、55%のケースで間違ったメッセージを識別できる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:02:14 GMT)
ProMoE: Fast MoE-based LLM Serving using Proactive Caching [2.0] Mixture-of-Experts (MoE)モデルは、計算中にモデルのパラメータのサブセットだけを活性化することでこの問題を軽減する。
本稿では,中間モデルを用いた新しいプロアクティブキャッシングシステムProMoEを提案する。
評価の結果,ProMoEはプリフィルおよびデコード段階で平均2.13倍,2.84倍のスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:31:27 GMT)
Sequential choice in ordered bundles [2.0] 我々は,先行する項目の消費パターンに基づいて,次の項目を順序付きバンドルで消費するという個人の判断を予測できるかどうかを検討する。
Spotifyのデータから、デコーダのみのアーキテクチャを持つカスタムトランスフォーマーが、最も正確な予測を提供します。
以上の結果から,トランスフォーマーは,注文されたバンドルから個人が消費するであろう次のアイテムのキュー作成を支援し,個々のアイテムの需要を予測し,需要を増大させるためにプロモーションをパーソナライズすることができることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:35:21 GMT)
Turkey's Earthquakes: Damage Prediction and Feature Significance Using A Multivariate Analysis [1.9] 本研究は,トルコにおける将来の地震災害における死者の減少に寄与する。
我々は、被災者当たりの死亡率と死亡率を予測するために、様々な機械学習アーキテクチャーを試験した。
その結果,ランダムフォレストモデルが最も信頼性の高い予測結果が得られた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:29:06 GMT)
Advancing Agentic Systems: Dynamic Task Decomposition, Tool Integration and Evaluation using Novel Metrics and Dataset [1.9] Advanced Agentic Framework: マルチホップクエリの処理、タスクグラフの生成と実行、適切なツールの選択、リアルタイムの変更への適応を行うシステム。
新しい評価基準: エージェントシステムを総合的に評価するためのNode F1スコア、構造類似度指標(SSI)、ツールF1スコアの導入。
AsyncHowベースのデータセットは、さまざまなタスク複雑度にわたるエージェントの振る舞いを分析する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:45:13 GMT)
The $φ^n$ trajectory bootstrap [1.9] 我々は、$langlephinrangle$ または $langle(iphi)nrangle$ の非整数 $n$ 結果が、波動関数アプローチの値と一致することを示す。
$mathcalPT$不変の場合、$langle(iphi)nrangle$と非整数$n$の存在は、非整数パワーで非エルミート理論をブートストラップすることができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:03:59 GMT)
CHORDONOMICON: A Dataset of 666,000 Songs and their Chord Progressions [1.9] Chordonomiconは666,000曲以上の楽曲とそれらのコード進行のデータセットで、構造的部分、ジャンル、リリース日が注釈付けされている。
これらの特徴により、Chordonomiconは高度な機械学習技術を探求するための理想的なテストベッドとなる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:53:09 GMT)
From Explicit Rules to Implicit Reasoning in an Interpretable Violence Monitoring System [1.8] 本稿では,ルールベース暴力監視(RuleVM)と呼ばれる,弱監視型暴力監視(WSVM)のための新しいパラダイムを提案する。
提案したRe RuleVMは、イメージとテキストの異なる設計にデュアルブランチ構造を使用する。
明示的なブランチにおける言語チャネル設計のために、提案したRe RuleCLIPは、最先端のYOLO-Worldモデルを使用して、ビデオフレーム内のオブジェクトやアクションを検出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:22:07 GMT)
MS-IMAP -- A Multi-Scale Graph Embedding Approach for Interpretable Manifold Learning [1.8] 本稿では,スペクトルグラフウェーブレットに基づくマルチスケールグラフネットワークの埋め込みフレームワークを提案する。
グラフ上のパリー・ウィーナー空間において、スペクトルグラフウェーブレット作用素は滑らかさよりも柔軟性と制御性が高いことを示す。
提案した埋め込みのさらなる利点は、埋め込みと入力特徴空間の対応性を確立する能力である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:18:40 GMT)
ChunkRAG: Novel LLM-Chunk Filtering Method for RAG Systems [1.8] Retrieval-Augmented Generation (RAG) システムは、無関係またはゆるい関連情報の検索によって不正確な応答を生成する。
チャンクレベルで取得した情報を評価・フィルタリングすることでRAGシステムを強化するフレームワークであるChunkRAGを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:40:54 GMT)
ReMix: Training Generalized Person Re-identification on a Mixture of Data [1.8] ReMixは、限定ラベル付きマルチカメラと大きなラベル付きシングルカメラデータの混合に基づいて、共同で訓練された一般化されたRe-ID手法である。
実験により、ReMixは高度な一般化能力を有し、一般のRe-IDにおいて最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:57:03 GMT)
WikiNER-fr-gold: A Gold-Standard NER Corpus [1.7] WikiNERコーパス,多言語名前付きエンティティ認識コーパスの品質に対処し,その統合版を提供する。
本稿では,WikiNERのフランス語比率の改訂版であるWikiNER-fr-goldを提案する。
本稿では,WikiNER-frコーパスで観測された誤りと不整合の分析を行い,今後の仕事の方向性について考察する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:00:16 GMT)
EEG-Driven 3D Object Reconstruction with Color Consistency and Diffusion Prior [1.7] 脳波信号に基づくカラー一貫性で3Dオブジェクトを再構成する手法を提案する。
脳波を用いて3Dオブジェクトを色の整合性で再構成できることを実証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:11:03 GMT)
Longitudinal Mammogram Exam-based Breast Cancer Diagnosis Models: Vulnerability to Adversarial Attacks [1.7] 本研究では,縦長モデルの2つの連続マンモグラム検定における特徴レベル関係を活かした新たな攻撃手法を提案する。
590人の乳癌患者のコホート(それぞれ2回連続マンモグラム検査)をケースコントロール環境で実験した。
その結果,本手法は診断モデルを騙して反対の出力を与える際に,いくつかの最先端の敵攻撃を克服した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:37:44 GMT)
Fast Deep Hedging with Second-Order Optimization [1.7] 市場の摩擦がある場合にエキゾチックな選択肢を取り入れることは、重要なリスク管理課題である。
本稿では,ディープヘッジのための2次最適化手法を提案する。
提案手法は,標準適応モーメントベース最適化の要するステップ数のうち,1/4でポリシーを最適化できる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:17:52 GMT)
Escaping the Shadow of Bell's Theorem in Network Nonlocality [1.7] 我々は「ベルの定理の影の外」である十分な条件を特定する。
量子論において実現可能な最小ネットワーク非古典的相関の例を示す。
我々は、我々のアプローチと以前のアプローチとの対比を強調するために、より精通したネットワーク非古典主義の例を再考する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:48:41 GMT)
Quantum Fast Implementation of Functional Bootstrapping and Private Information Retrieval [1.6] 単一の量子計算サーバを利用することで、プライバシ保存技術の効率性とセキュリティを大幅に向上させることができることを示す。
大規模平文の関数的ブートストラップのための効率的な量子アルゴリズムを提案する。
私たちの拡張は、劇的にスピードアップする可能性のある量子ベースの暗号ツールです。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:09:15 GMT)
Quantum Fast Implementation of Functional Bootstrapping and Private Information Retrieval [1.6] 単一の量子計算サーバを利用することで、プライバシ保存技術の効率性とセキュリティを大幅に向上させることができることを示す。
大規模平文の関数的ブートストラップのための効率的な量子アルゴリズムを提案する。
私たちの拡張は、劇的にスピードアップする可能性のある量子ベースの暗号ツールです。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:09:15 GMT)
Gender Bias in LLM-generated Interview Responses [1.6] 本研究は, モデル, 質問タイプ, 職種にまたがって, LLM生成面接応答の多面的監査を行うための3つのLCMを評価した。
その結果,男女の偏見は一貫しており,性別のステレオタイプや仕事の優位性と密接に一致していることが判明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:39:18 GMT)
The State of Data Curation at NeurIPS: An Assessment of Dataset Development Practices in the Datasets and Benchmarks Track [1.6] この研究は、データキュレーションのレンズを通してNeurIPSにおけるデータセット開発プラクティスの分析を提供する。
本稿では,ルーブリックとツールキットからなるデータセットドキュメンテーションの評価フレームワークを提案する。
結果は、環境のフットプリント、倫理的考慮、データ管理に関するドキュメントの必要性がさらに高まっていることを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:07:50 GMT)
Chemical Shift Encoding based Double Bonds Quantification in Triglycerides using Deep Image Prior [1.6] 脂肪酸は代謝異常や炎症状態を評価するバイオマーカーとして機能し、二重結合の定量化が脂肪酸情報を明らかにする鍵となる。
本研究では, 深層画像優先法(DIP)を用いて, 化学シフトエンコードされたマルチエコ勾配エコー画像から得られたトリグリセリドの二重結合とメチレン切断二重結合の定量化を行う。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:10:28 GMT)
Evaluating K-Fold Cross Validation for Transformer Based Symbolic Regression Models [1.6] トランスフォーマーモデルはシンボリック回帰において有望であるが、パフォーマンスはより小さなデータセットに悩まされている。
我々は, 大幅に削減されたデータセットに基づいて訓練された変圧器に基づく記号回帰モデルに対して, k-foldクロスバリデーションを適用することを提案する。
その結果、このプロセスは、検証損失53.31%の相対的な改善により、モデルの出力整合性と一般化を改善することが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:39:54 GMT)
Quantum entanglement as an ambiguity of classical dynamics [1.5] シンプレクティック幾何学の定式化を量子力学に適用した結果について検討する。
この縮退性は、古典力学の曖昧さとして理解できることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:07:48 GMT)
Multi-view clustering integrating anchor attribute and structural information [1.5] 本稿では,新しいマルチビュークラスタリングアルゴリズムであるAASを紹介する。
各ビューのアンカーを介して2段階の近接アプローチを利用し、属性と方向付けされた構造情報を統合する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:53:03 GMT)
Better Gaussian Mechanism using Correlated Noise [1.5] 分散を$(sqrtd + 1)/4$にスケールしたガウス変数として分布するランダム変数を追加することで、独立雑音サンプルの分散を$(d + sqrtd)/4$でのみスケールできることを示す。
私たちのメカニズムの中心的な考え方はシンプルで、そのテクニックは柔軟です。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:58:32 GMT)
Natural Language Processing for Analyzing Electronic Health Records and Clinical Notes in Cancer Research: A Review [1.4] 本総説は, がん研究における自然言語処理(NLP)の応用を電子健康記録(EHR)と臨床ノートを用いて分析することを目的とする。
データ抽出には、研究の特徴、がんの種類、NLP方法論、データセット情報、パフォーマンス指標、課題、今後の方向性が含まれていた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:17:07 GMT)
Fine-tuning Large Language Models for DGA and DNS Exfiltration Detection [1.4] 大規模言語モデル(LLM)は、リアルタイム検出タスクにおいてその習熟度を実証している。
本研究は, DGA および DNS ろ過攻撃を検出するための微調整 LLM の有効性を検証する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:22:28 GMT)
Volumetric Conditioning Module to Control Pretrained Diffusion Models for 3D Medical Images [1.3] 本稿では,新しい軽量モジュールであるボリュームコンディショニングモジュール(VCM)を用いた3次元医用画像の空間制御手法を提案する。
我々のVCMは、様々なレベルの3D条件から複雑な情報を効果的にエンコードするために、非対称なU-Netアーキテクチャを採用している。
実験結果から, VCMは条件生成に有効であり, トレーニングデータや計算資源の削減に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:48:52 GMT)
Stratified Domain Adaptation: A Progressive Self-Training Approach for Scene Text Recognition [1.3] シーンテキスト認識(STR)において、教師なしドメイン適応(UDA)がますます普及している。
本稿では,StrDA(Stratified Domain Adaptation)アプローチを導入し,学習プロセスにおける領域ギャップの段階的エスカレーションについて検討する。
本稿では,データサンプルの分布外および領域判別レベルを推定するために,領域判別器を用いる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:45:05 GMT)
LookHere: Vision Transformers with Directed Attention Generalize and Extrapolate [1.2] 高解像度画像は、モデル精度を向上させるシーンに関する情報を提供する。
視覚変換器(ViT)は、微調整なしでは、大きな画像を効果的に活用できない。
本稿では,平易なViTの位置エンコーディングをドロップインで置き換える手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:39:53 GMT)
Developing Convolutional Neural Networks using a Novel Lamarckian Co-Evolutionary Algorithm [1.2] 本稿ではラマルク遺伝的アルゴリズムのインスタンス化であるLCoDeepNEATを紹介する。
LCoDeepNEATはCNNアーキテクチャとその最終層重みを共進化させる。
提案手法は,候補解の分類精度を2%から5.6%に向上させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:26:23 GMT)
RELATE: A Modern Processing Platform for Romanian Language [1.2] 本稿では,RELATEプラットフォームの設計と進化について述べる。
ルーマニア語のために特別に構築された自然言語処理のための高性能な環境を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:33:38 GMT)
DIVERSE: A Dataset of YouTube Video Comment Stances with a Data Programming Model [1.2] このデータセットは、アメリカ陸軍の公式YouTubeチャンネルビデオからのすべてのコメントで構成されている。
我々は、最先端の弱い監督アプローチを採用し、大きな言語モデルを利用して、それぞれのコメントのスタンスを、それぞれのビデオと米軍に対してラベル付けする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:03:06 GMT)
Testing Identity of Distributions under Kolmogorov Distance in Polylogarithmic Space [1.2] 本稿では、ストリーミング設定において、空間$O(log4 varepsilon-1)$を使用するアルゴリズムを提供する。
また、私たちは9つの関連するオープンな問題を述べ、それと関連した問題への関心を喚起することを望んでいます。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:24:27 GMT)
Uncertainty Quantification Metrics for Deep Regression [1.2] スカラー化誤差, 誤差, スピアマンランク相関, 負対数類似度について検討した。
これらの指標が4つの典型的な不確実性の下でどのように振る舞うかを考察する。
以上の結果から,Errorは最も安定かつ解釈可能な指標であるが,AUSEとNLLにもそれぞれのユースケースが存在することが示唆された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:36:46 GMT)
ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [1.2] 高次元正規化回帰における2つの重要なタスクは、正確な予測のために正規化強度を調整し、サンプル外リスクを推定することである。
問題のある条件下でクロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:20:12 GMT)
Limited Parallelization in Gate Operations Leads to Higher Space Overhead and Lower Noise Threshold [1.2] 耐故障性スキームのオーバーヘッドは、並列化のレベル、ゲート操作の速度、デコヒーレンス率に依存するべきである。
ノイズ閾値は、並列化のレベルが0に近づくにつれてゼロに近づく。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:48:56 GMT)
Limited Parallelization in Gate Operations Leads to Higher Space Overhead and Lower Noise Threshold [1.2] 耐故障性スキームのオーバーヘッドは、並列化のレベル、ゲート操作の速度、デコヒーレンス率に依存するべきである。
ノイズ閾値は、並列化のレベルが0に近づくにつれてゼロに近づく。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:48:56 GMT)
Automated Vulnerability Detection Using Deep Learning Technique [1.2] この研究は、特にCodeBERTの高度な文脈理解によって、ディープラーニング技術が脆弱性検出を大幅に改善できることを実証している。
提案手法では,ソースコードをベクトル表現に変換し,Long Short-Term Memory(LSTM)モデルを用いて脆弱性パターンを識別する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:51:51 GMT)
SEA: State-Exchange Attention for High-Fidelity Physics Based Transformers [1.2] シーケンシャルネットワークを用いた最近のアプローチは、動的システムのフィールド変数の推定において有望であることを示している。
ロールアウトエラーの蓄積に関する未解決の問題は、ネットワークが将来予測するときに、信頼できない見積もりをもたらす。
本稿では、符号化されたフィールド間の情報交換を可能にする新しいトランスフォーマーベースのモジュールである、ステート・エクスチェンジ・アテンション(SEA)モジュールを紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:13:48 GMT)
Optimized Homomorphic Vector Permutation From New Decomposition Techniques [1.2] 同型置換は、単語単位の同型暗号に基づくプライバシー保護計算の基礎となる。
本稿では、置換の任意の分解の理想的な性能を定義し、この境界を達成するアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:07:22 GMT)
Quantum Digital Twins for Uncertainty Quantification [1.2] 量子処理ユニットの仮想バージョンである量子デジタルツインを開発し構築する。
量子デジタルツインの潜在的な利点を示すため、5つの量子デジタルツインにハイブリッド量子アンサンブルを作成し、展開する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:41:42 GMT)
Knowledge in Triples for LLMs: Enhancing Table QA Accuracy with Semantic Extraction [1.1] 本稿では,表型データから直交三重項を抽出し,それを検索拡張生成(RAG)モデルに統合することにより,微調整GPT-3.5-turbo-0125モデルにより生成された応答の精度,コヒーレンス,コンテキスト的リッチ性を向上させる手法を提案する。
FeTaQAデータセットの既存のベースライン、特にSacre-BLEUとROUGEの指標に優れています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:10:59 GMT)
Knowledge in Triples for LLMs: Enhancing Table QA Accuracy with Semantic Extraction [1.1] 本稿では,表型データから直交三重項を抽出し,それを検索拡張生成(RAG)モデルに統合することにより,微調整GPT-3.5-turbo-0125モデルにより生成された応答の精度,コヒーレンス,コンテキスト的リッチ性を向上させる手法を提案する。
FeTaQAデータセットの既存のベースライン、特にSacre-BLEUとROUGEの指標に優れています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:10:59 GMT)
Advantages of fixing spins in quantum annealing [1.1] サイズ縮小法は、量子アニールに直接入力できない大規模な最適化問題を扱うために用いられる。
固定スピンを用いた様々なサイズ縮小法が量子古典ハイブリッド法として提案されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:30:53 GMT)
A Cascade Approach for APT Campaign Attribution in System Event Logs: Technique Hunting and Subgraph Matching [1.1] 本研究では,システムイベントログによるAPTキャンペーン攻撃の特定という課題に対処する。
SFMと呼ばれるカスケーディング手法は、技術狩猟とAPTキャンペーンの属性を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:49:28 GMT)
Mixed variable structural optimization using mixed variable system Monte Carlo tree search formulation [1.1] 混合変数系モンテカルロ木探索法(MVSMCTS)という新しい手法を提案する。
トラス構造の寸法と形状を最適化するために、設計変数は、部材の断面領域と関節の結節座標である。
MVSMCTSは、連続変数のための更新プロセスと加速技術と、単一システムと混合システムのための組み合わせスキームを取り入れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:44:29 GMT)
System 2 reasoning capabilities are nigh [1.1] 本稿では,本研究の現状を概観し,人間に類似したシステム2推論が可能なニューラルモデルを実現するための残りのステップについて述べる。
現在のモデルが推論を行うのに不十分な場合、その目標を達成するのに必要な追加の進歩はほとんどありません。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:40:27 GMT)
System 2 Reasoning Capabilities Are Nigh [1.1] 文献の現状を概観し,人間に類似したシステム2推論が可能なニューラルモデルを実現するための残りのステップについて述べる。
現在のモデルが推論を行うのに不十分な場合、その目標を達成するのに必要な追加の進歩はほとんどありません。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 23:40:27 GMT)
TE-NeXt: A LiDAR-Based 3D Sparse Convolutional Network for Traversability Estimation [1.1] 本稿では,疎LiDAR点雲からのトラバーサビリティ推定(TE)のための新規かつ効率的なアーキテクチャであるTE-NeXtを提案する。
TE-NeXtブロックは、注意機構や3次元スパース畳み込みといった現在のトレンドの概念を融合させる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:02:30 GMT)
Hierarchical mixtures of Unigram models for short text clustering: the role of Beta-Liouville priors [1.0] 本稿では,短いテキストデータの教師なし分類に適した多項混合モデルの変種について述べる。
これはディリクレよりも柔軟な相関構造を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:56:29 GMT)
Unifying recent experiments on spin-valley locking in TMDC quantum dots [1.0] 遷移金属ジアルコゲナイド (TMDCs) では、スピン-バレー・ロックはスピン-軌道結合強度が強いため、特に強いことが期待されている。
我々は、それらの基底および励起状態輸送分光シグネチャを統一的な理論的枠組みで数値的にシミュレートする。
シミュレーションにより,TMDC量子ドットの最小電子限界での予測モデリングツールが提供される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:34:06 GMT)
Search Wide, Focus Deep: Automated Fetal Brain Extraction with Sparse Training Data [1.0] 本稿では,スパースな合成ラベルで訓練されたネットワークにおいて,偽陽性を低減するテストタイム戦略を提案する。
我々は、少数の胎児脳ラベルマップから得られた合成画像を用いて、異なるウィンドウサイズでモデルを訓練する。
本研究の枠組みは, トリメスター胎児のHASTE検査における最先端脳抽出法と一致した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:36:33 GMT)
Charging a quantum spin network towards Heisenberg-limited precision [1.0] 最大エネルギー構成まで量子スピンネットワークをチャージするための協調プロトコルを提案する。
我々はD-Waveの量子処理ユニット上で、40ドルから5,612ドルのスピンのサブ格子を充電することで、我々のプロトコルをテストする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:39:33 GMT)
Photonic Quantum Receiver Attaining the Helstrom Bound [1.0] 本稿では,二元コヒーレント状態の識別のために,低光子状態におけるヘルストローム境界を達成する量子受信機の効率的な分解手法を提案する。
我々は、暗黒数の存在を含む光子損失と不完全な光子検出の影響を調べることによって、現実的な状況を説明する。
提案手法は,光通信におけるシンボル・バイ・シンボル計測を最適化するために,立方相ゲートを用いた量子上の優位性を検証し,フォトニック量子コンピュータを設計する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:08:39 GMT)
Variational inference for pile-up removal at hadron colliders with diffusion models [0.9] 積層除去した硬質散乱粒子ジェットの構成成分を予測するために, 生成モデルを訓練した。
VirはSoftDropよりも優れており、幅広いシナリオでハード散乱ジェットのサブ構造を予測する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:33:52 GMT)
Fine-Tuning LLMs for Code Mutation: A New Era of Cyber Threats [0.9] 本稿では,コード変異の文脈におけるLarge Language Modelsの適用について検討する。
伝統的に、ミッションクリティカルなアプリケーションにおいて、ソフトウェアの堅牢性を高めるためにコード突然変異が使われてきた。
事前学習したLLMベースのコードシンセサイザーに適したコード突然変異訓練の新たな定義を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:43:06 GMT)
A Machine Learning-Based Secure Face Verification Scheme and Its Applications to Digital Surveillance [0.9] ほとんどの現実世界の認識システムは、認証に使用される識別に敏感な顔画像を保護することの重要性を無視している。
我々は、DeepID2畳み込みニューラルネットワークを用いて、顔画像の特徴を抽出し、EMアルゴリズムを用いて顔認証問題を解決する。
我々は,3段階のプライバシ懸念に基づいて,地域社会の監視(または入り口)制御のための3つの顔認証システムを開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:25:00 GMT)
Het-node2vec: second order random walk sampling for heterogeneous multigraphs embedding [0.9] Het-node2vecは、異種グラフを埋め込むノード2vecアルゴリズムの拡張である。
我々はHet-node2vecがノードラベルおよびエッジ予測タスクにおける異種グラフの最先端手法に対して同等あるいは優れた性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:41:05 GMT)
Is Transductive Learning Equivalent to PAC Learning? [0.9] PACモデルとトランスダクティブモデルは、本質的には非依存のバイナリ分類に等価であることを示す。
我々は,2番目の結果が2進分類を超えて拡張可能かどうかという興味深い疑問を残して,トランスダクティブモデルとPACモデルがより広範に等価であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:07:12 GMT)
Distribution of lowest eigenvalue in $k$-body bosonic random matrix ensembles [0.9] 有限多ボソン系の最小固有値分布を$k$-body相互作用で数値的に検討する。
最も低い固有値の分布の最初の4つのモーメントは、$q$パラメータの関数として分析されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:52:46 GMT)
Universal Scaling Laws of Absorbing Phase Transitions in Artificial Deep Neural Networks [0.9] 信号伝播ダイナミクスの位相境界付近で動作する従来の人工深層ニューラルネットワークは、カオスのエッジとしても知られ、位相遷移を吸収する普遍的なスケーリング法則を示す。
数値計算の結果,多層パーセプトロンと畳み込みニューラルネットワークはそれぞれ平均フィールドと有向パーコレーションクラスに属していることがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:57:26 GMT)
Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images [0.9] 本研究では,拡散確率モデル(DDPM)をランドマーク検出タスクに適用する新しい手法を提案する。
私たちの重要なイノベーションは、ランドマーク検出における自己教師付き事前トレーニングにDDPMを活用することです。
この方法は、最小限の注釈付きトレーニングデータで正確なランドマーク検出を可能にする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:10:10 GMT)
Memory-Efficient Point Cloud Registration via Overlapping Region Sampling [0.8] ディープラーニングの最近の進歩は、3Dポイントクラウドの登録を改善したが、グラフィクス処理単位のメモリ使用量も増加した。
精度を維持しながらメモリ使用量を削減するための重複領域サンプリング手法を提案する。
提案手法は,k-nearest-neighbor (kNN) に基づく点圧縮機構を用いて,重なり合う領域とそれからの集中的なサンプルを推定する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 05:40:03 GMT)
MambaForGCN: Enhancing Long-Range Dependency with State Space Model and Kolmogorov-Arnold Networks for Aspect-Based Sentiment Analysis [0.7] ABSA(MambaForGCN)におけるアスペクトと意見語間の長距離依存性を高める新しいアプローチを提案する。
3つのベンチマークデータセットの実験結果は、MambaForGCNの有効性を示し、最先端(SOTA)ベースラインモデルを上回っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:42:40 GMT)
CurateGPT: A flexible language-model assisted biocuration tool [0.6] ジェネレーティブAIは、人間主導のキュレーションを支援する新しい可能性を開いた。
CurateGPTはキュレーションプロセスの合理化を図り、共同作業と効率性の向上を図っている。
これにより、キュレーター、研究者、エンジニアがキュレーションの取り組みを拡大し、科学データ量の増加に追随するのに役立つ。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:00:04 GMT)
Training via quantum superposition circumventing local minima and vanishing gradient of sinusoidal neural network [0.6] 深層ニューラルネットワーク(SinNN)の量子トレーニングのためのアルゴリズムを提案する。
量子トレーニングは、当初、ウェイト値に対する均一な重ね合わせを、ベストウェイトでピークが保証されるものへと進化させる。
このアルゴリズムをおもちゃの例で実証し、損失関数の最適化において勾配降下を実際に上回り、必要な時間でブルート力探索を上回ります。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:06:46 GMT)
Multilevel Bayesian Deep Neural Networks [0.6] 我々は、ディープニューラルネットワーク(DNN)、特にトレースクラスニューラルネットワーク(TNN)に関連付けられた推論について検討する。
TNN事前は無限個の隠れ単位を持つ関数上で定義され、有限個の隠れ単位を持つ強い収束近似を持つ。
本稿では,TNNの強い収束を利用して,これらのモデルにマルチレベルモンテカルロ(MLMC)を適用する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:31:24 GMT)
Sing it, Narrate it: Quality Musical Lyrics Translation [0.6] 既存の歌の翻訳アプローチは、翻訳品質を犠牲にして、歌いやすさの制約を優先することが多い。
本稿では,重要な歌声機能を維持しつつ,翻訳品質を向上させることを目的とする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:23:56 GMT)
Investigation of moving objects through atmospheric turbulence from a non-stationary platform [0.6] 本研究では,移動カメラから撮像した画像列から移動物体に対応する光流場を抽出する。
提案手法はまず,光学的流れ場を計算し,カメラの動きによって誘導される流れ場を補償する運動モデルを作成する。
この作業で使用されるシーケンスとコードは、すべてオープンソースで、著者にコンタクトすることで利用可能である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:54:28 GMT)
Evaluating utility in synthetic banking microdata applications [0.6] 我々は,規制当局の実用性とプライバシ要件を考慮した枠組みを開発し,これを金融利用指標,短期預金利回り曲線,クレジットカード遷移行列に適用する。
パラグアイ中央銀行のデータを用いて、我々は中央銀行の収集した情報を用いた合成銀行用マイクロデータの最初の実装を提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:20:05 GMT)
Quantum HodgeRank: Topology-Based Rank Aggregation on Quantum Computers [0.5] HodgeRankはグラフと離散外部計算を用いて、実世界の(しばしば不完全な)データに基づいてランキングアルゴリズムを一般化してランク付けする。
我々は,次元に依存しない複雑性を持つHodgeRank解を近似する量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:13:19 GMT)
Quantum HodgeRank: Topology-Based Rank Aggregation on Quantum Computers [0.5] HodgeRankはグラフと離散外部計算を用いて、実世界の(しばしば不完全な)データに基づいてランキングアルゴリズムを一般化してランク付けする。
我々は,次元に依存しない複雑性を持つHodgeRank解を近似する量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:13:19 GMT)
Emotion-Guided Image to Music Generation [0.5] 本稿では,感情誘導型画像から音楽への生成フレームワークを提案する。
特定のイメージの感情的なトーンに合わせて音楽を生成する。
このモデルはCNN-Transformerアーキテクチャを採用しており、訓練済みのCNN画像特徴抽出器と3つのTransformerエンコーダを備えている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:47:51 GMT)
On uniqueness in structured model learning [0.5] 偏微分方程式系(PDE)の物理法則学習における一意性の問題に対処する。
構造化されたモデル学習のフレームワークとして、データから学習されるコンポーネントによって、既存のほぼ正しい物理モデルが強化される。
この一意性の結果は、完全なノイズレス測定の理想的な設定において、未知のモデル成分のユニークな識別が可能であることを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:56:39 GMT)
CAMS: Convolution and Attention-Free Mamba-based Cardiac Image Segmentation [0.5] 畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの自己アテンションモデルは、医療画像セグメンテーションの標準となっている。
本稿では,CAMS-Netという,コンボリューションと自己意図のないマンバに基づくセマンティックネットワークを提案する。
我々のモデルは,CMRおよびM&Ms-2カードセグメンテーションデータセットにおける既存の最先端CNN,自己注意,およびMambaベースの手法よりも優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:29:17 GMT)
Variational Bayes Decomposition for Inverse Estimation with Superimposed Multispectral Intensity [0.4] データは、オブジェクトの観測不能な特徴に関する情報を得るために人気がある。
提案手法は, 粒子が波動を表現することを仮定し, その挙動をモデル化する。
データはスムーズな設定のためノイズがあっても、推測は正確である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:48:21 GMT)
Robust training of implicit generative models for multivariate and heavy-tailed distributions with an invariant statistical loss [0.4] 我々は、引用2024トレーニングで導入されたISL(textitinvariant statistics loss)法に基づいて構築する。
重み付きおよび多変量データ分散を扱うように拡張する。
ジェネレーティブ・ジェネレーティブ・モデリングにおけるその性能を評価し、ジェネレーティブ・ディバイサル・ネットワーク(GAN)の事前学習技術としての可能性を探る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:27:50 GMT)
Quantum cryptography visualized: assessing visual attention on multiple representations with eye tracking in an AR-enhanced quantum cryptography student experiment [0.4] 本稿では,ARを用いた量子暗号学生実験における表現の分析を行う。
また、得られた視線データに基づいて、提供された複数の表現に関する学習者の視覚的注意についても論じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:01:00 GMT)
Classical Algorithms for Constant Approximation of the Ground State Energy of Local Hamiltonians [0.4] 我々は、任意の$k$局所ハミルトニアンが$n$ qubitsで作用する基底状態エネルギーの近似を計算する古典的アルゴリズムを構築する。
基底状態エネルギーの定数近似が古典的に$mathrmpolyleft (1/chi,nright)$ time と $mathrmpoly(n)$ space で計算可能であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:56:38 GMT)
Individualised recovery trajectories of patients with impeded mobility, using distance between probability distributions of learnt graphs [0.4] 身体療法の一環として運動を行うことにより,患者の回復軌跡を学習する方法を提供する。
患者の運動回復スコアの違いは、連続した事例で所定の運動ルーチンを実行する場合、統計的距離/偏差によって与えられる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:13:00 GMT)
Fair Bilevel Neural Network (FairBiNN): On Balancing fairness and accuracy via Stackelberg Equilibrium [0.3] バイアスを緩和する現在の方法は、情報損失と精度と公平性のバランスが不十分であることが多い。
本稿では,二段階最適化の原理に基づく新しい手法を提案する。
私たちのディープラーニングベースのアプローチは、正確性と公平性の両方を同時に最適化します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:20:43 GMT)
Image contrast enhancement based on the Schrödinger operator spectrum [0.3] 二次元シュリンガー作用素の2次元固有関数への投影画像に基づく新しい画像コントラスト強調法を提案する。
このプロジェクションは、画像再構成中にピクセル強度を制御する設計パラメータである$gamma$に依存している。
提案手法は,原画像の特徴を保ちながら,画像のコントラストを効果的に向上することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:31:43 GMT)
Benchmarking OpenAI o1 in Cyber Security [0.2] 我々はOpenAIのo1-previewモデルとo1-miniモデルを評価し、その性能を以前のGPT-4oモデルと比較した。
我々の評価は、既知の衛生装置を起動する構造化インプットを生成することで、現実世界のソフトウェアにおける脆弱性を検出する能力に焦点を当てている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:57:11 GMT)
FNDEX: Fake News and Doxxing Detection with Explainable AI [0.2] インターネットは、サイバー兵器の可能性を秘めている。
この進化する風景の中で、特に危険な現象が2つ現れている。
本研究は、新しいシステムを導入することで、この収束に対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:29:45 GMT)
Towards Safe Multilingual Frontier AI [0.2] マルチリンガルジェイルブレイクは、AIシステムの安全かつ包括的デプロイを損なう。
我々は、多言語ジェイルブレイクに対応するため、EUの法的な状況と制度的な枠組みに沿った政策行動を提案する。
これには、多言語能力と脆弱性の必須評価、世論調査、多言語AI開発のための状態サポートが含まれる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:14:46 GMT)
Towards Safe Multilingual Frontier AI [0.2] マルチリンガルジェイルブレイクは、AIシステムの安全かつ包括的デプロイを損なう。
我々は、多言語ジェイルブレイクに対応するため、EUの法的な状況と制度的な枠組みに沿った政策行動を提案する。
これには、多言語能力と脆弱性の必須評価、世論調査、多言語AI開発のための状態サポートが含まれる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:14:46 GMT)
Unraveling Molecular Structure: A Multimodal Spectroscopic Dataset for Chemistry [0.2] このデータセットは、特許データから化学反応から抽出された790k分子の1ドルH-NMR、13ドルC-NMR、HSQC-NMR、赤外線、質量スペクトルからなる。
本研究では, 構造解明, 対象分子のスペクトル予測, 機能群予測などの単一モダリティタスクを評価するためのベンチマークを行う。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:54:13 GMT)
NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering [0.1] 本稿では,最適化されたトピックモデリングフレームワークであるOVB-LDAとBI-POP CMA-ES最適化技術を統合し,学術文書の抽象分類を強化した新しい手法を提案する。
我々は、ドメイン固有データに基づいて微調整された蒸留MiniLMモデルを用いて、高精度な回答抽出を行う。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:45:12 GMT)
Building a Scalable, Effective, and Steerable Search and Ranking Platform [0.1] 現代のeコマースプラットフォームは膨大な製品選択を提供しており、顧客が好きな商品を見つけるのが難しくなっている。
これはeコマースプラットフォームが、ほぼリアルタイムでスケーラブルで適応可能なパーソナライズされたランキングと検索システムを持つための鍵である。
さまざまなユースケースで再利用可能な、パーソナライズされた、ほぼリアルタイムなランキングプラットフォームを提示する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:02:50 GMT)
Misconceptions, Pragmatism, and Value Tensions: Evaluating Students' Understanding and Perception of Generative AI for Education [0.1] 学生はこの技術のアーリーアダプターであり、非典型的手法で利用している。
学生は,1)GenAIの理解,2)GenAIの利用,3)教育における利用に関するメリット,欠点,倫理的問題について,その説明を求めた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:41:06 GMT)
Visual Robustness Benchmark for Visual Question Answering (VQA) [0.1] 213,000枚の画像からなる最初の大規模ベンチマークを提案する。
複数のVQAモデルの視覚的堅牢性に挑戦し、現実的な視覚的腐敗の強さを評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:50:27 GMT)
High-Entanglement Capabilities for Variational Quantum Algorithms: The Poisson Equation Case [0.1] 本研究は、IonQ Aria量子コンピュータ機能を利用した問題解決を試みる。
本稿では,2ビットあるいは3ビットのエンタングルメントゲートに基づく離散方程式行列 (DPEM) の分解を提案し,システムサイズに関して$O(1)$の項を持つことを示した。
我々はまた、量子アンサッツのパラメータ空間を小さくし、解を見つけるのに十分な表現性を維持しながら、Globally-Entangling Ansatzを導入する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 00:55:16 GMT)
Is the Lecture Engaging for Learning? Lecture Voice Sentiment Analysis for Knowledge Graph-Supported Intelligent Lecturing Assistant (ILA) System [0.1] 本システムは,音声,コンテンツ,教育のリアルタイム分析を通じて,生徒の学習力を高めるためのインストラクターを支援するように設計されている。
講義音声感情分析のケーススタディとして,3000以上の1分間の講義音声クリップからなるトレーニングセットを開発した。
私たちの究極のゴールは、現代の人工知能技術を活用することで、インストラクターがより積極的に効果的に教えることを支援することです。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:18:31 GMT)
Zero-point energy of tensor fluctuations on the MPS manifold [0.1] 本研究では, 行列積状態(MPS)多様体を用いた高相関磁気系における低エネルギー物理の研究手法を提案する。
我々は,MPSにより基底状態がより良く表現されるシステムに,ある種の低絡磁材料をモデル化することに成功しているスピン波アプローチを適用した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:00:02 GMT)
GraphAide: Advanced Graph-Assisted Query and Reasoning System [0.0] 多様なソースから知識グラフ(KG)を構築し,結果のKGに対してクエリと推論を行う,高度なクエリと推論システムであるGraphAideを導入する。
GraphAideはLarge Language Models(LLM)を利用して、ドメイン固有のデジタルアシスタントを迅速に開発する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:25:30 GMT)
LipKernel: Lipschitz-Bounded Convolutional Neural Networks via Dissipative Layers [0.0] 本稿では,畳み込みニューラルネットワーク(CNN)の階層的パラメータ化を提案する。
提案手法は,2次元ロエサー型状態空間モデルを用いて,散逸型畳み込みカーネルを直接パラメータ化する。
提案手法を用いた実行時間は,最先端のリプシッツ有界ネットワークよりも桁違いに高速であることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:20:14 GMT)
zGAN: An Outlier-focused Generative Adversarial Network For Realistic Synthetic Data Generation [0.0] ブラックスワン」は古典的な機械学習モデルの性能に挑戦している。
本稿では、外部特性を持つ合成データを生成する目的で開発されたzGANモデルアーキテクチャの概要について述べる。
リアルな合成データ生成の有望な結果と、モデル性能のアップリフト能力を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:29:12 GMT)
Yoga Pose Classification Using Transfer Learning [0.0] 大規模なヨガポーズ認識のためのベンチマークデータセットであるYoga-82は、正確なアノテーションを不可能にする難しい位置にある。
私たちはVGG-16、ResNet-50、ResNet-101、DenseNet-121を使って、より良い結果を得るために様々な方法でそれらを微調整しました。
実験の結果,トップ1の精度85%,トップ5の精度96%のDenseNet-121が最高性能を示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:34:18 GMT)
Who Are All The Stochastic Parrots Imitating? They Should Tell Us! [0.0] 彼らの状態にあるLMは、クリティカルな設定で完全に信頼できないだろう、と私たちは主張する。
この問題に対処するための新たな戦略として,ソースを引用可能なLMを構築することを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:08:17 GMT)
When combinations of humans and AI are useful: A systematic review and meta-analysis [0.0] 我々は300以上の効果サイズを報告した100以上の最近の研究のメタ分析を行った。
平均して、人間とAIの組み合わせは、人間とAI単独のベストよりもはるかに悪い結果が得られた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:45:26 GMT)
When Circular Economy Meets the Smart City Ecosystem: Defining the Smart and Circular City [0.0] 循環経済を中心的な柱として統合することで、現在のスマートシティの定義を拡大することを議論する。
スマートで循環的な都市が持続可能性とスマート性の両方を一体的に包含する方法について論じる。
産業4.0のようなスマートシティや技術に関する先進的な研究は、都市内の循環経済活動の基盤となる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:00:50 GMT)
Valid Bootstraps for Networks with Applications to Network Visualisation [0.0] ネットワークにおける不確実性の定量化は、エンティティ間の関係と相互作用をモデル化する重要なステップである。
ネットワークの単一観測のみを行う場合、不均一なランダムグラフをブートストラップすることの難しさを考察する。
k-アネレスト近傍平滑化を用いたネットワークブートストラップを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:21:23 GMT)
Unsupervised Multimodal Fusion of In-process Sensor Data for Advanced Manufacturing Process Monitoring [0.0] 本稿では,製造プロセスにおけるマルチモーダルセンサデータ融合に対する新しいアプローチを提案する。
我々は、ラベル付きデータなしで異なるデータモダリティを相関付けるために、対照的な学習手法を活用している。
本手法は,プロセス制御,異常検出,品質保証などの下流タスクを容易にする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:52:04 GMT)
Uncertainty-aware multi-fidelity surrogate modeling with noisy data [0.0] 実世界の応用では、測定や数値ノイズによる高忠実度モデルと低忠実度モデルの両方に不確実性が存在する。
本稿では,ノイズ汚染データを扱う多要素代理モデリングのための包括的フレームワークを提案する。
提案するフレームワークは,物理実験と計算モデルを組み合わせた自然なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:38:16 GMT)
Ultrafast spintronics with geometric effects in non-adiabatic wave-packet dynamics [0.0] レーザパルスによるバンドの幾何学的性質を通じて超高速非断熱過程を操るという興味深い可能性により、我々はウェーブ・パケット輸送理論を拡張した。
非断熱駆動の特殊能力を強調する顕微鏡バンド幾何学的効果を示すマクロな方法について検討した。
特に、顕微鏡学的に根付いた内在性スピンコヒーレンスは、マクロな光電流のスピン媒介部分の基盤となることが示されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:22:31 GMT)
Tunable generation of spatial entanglement in nonlinear waveguide arrays [0.0] AlGaAs非線形導波路アレイのパラメトリックダウンコンバージョンに基づく空間交絡光子対
我々は、出力量子状態を設計し、様々な種類の空間相関を実装するためにダブルポンプ構成を用いる。
この実験は室温とテレコム波長で行われ、連続的に結合されたシステムのポテンシャルを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:17:40 GMT)
Training LLMs for Generating IEC 61131-3 Structured Text with Online Feedback [0.0] 本稿では,学習データの品質向上を重視した大規模言語モデル(LLM)の学習手法を提案する。
このフレームワークは、産業自動化アプリケーションに非常に適しており、最先端のモデルを上回っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:54:09 GMT)
Towards Neural-Network-based optical temperature sensing of Semiconductor Membrane External Cavity Laser [0.0] レーザ発光によるレーザ利得媒体の温度を決定するための機械学習非接触方法を提案する。
フィードフォワードニューラルネットワーク(NN)のトレーニングにより、スペクトルデータのみからデバイス特性の予測が可能になる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:49:29 GMT)
Tolerant testing of stabilizer states with a polynomial gap via a generalized uncertainty relation [0.0] 我々は、耐久安定度試験アルゴリズムの存在について、Arunachalam & Dutt ([AD24]) の予想を証明した。
我々の議論の鍵は、ロヴァス・テータ函数に基づくパウリ作用素の集合に対する一般化された不確実性関係である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:31:37 GMT)
Token-based identity management in the distributed cloud [0.0] 本研究は,分散環境におけるアイデンティティ管理を中心とした研究である。
本稿では,サービス間の通信オーバーヘッドを最小限に抑えるために,堅牢なセキュリティパラダイムを実装することに集中する。
提案されたソリューションには、すべての外部要求を認証するコンポーネントとして、Identity and Access Managementサーバが組み込まれている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:00:01 GMT)
The PV-ALE Dataset: Enhancing Apple Leaf Disease Classification Through Transfer Learning with Convolutional Neural Networks [0.0] 我々は、リンゴ葉病のクラスを追加して、広く使われているPlantVillageデータセットを拡張した。
テストF1のスコアは99.63%、97.87%であった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:30:22 GMT)
The EarlyBird Gets the WORM: Heuristically Accelerating EarlyBird Convergence [0.0] Early Bird仮説は、高密度ニューラルネットワークで当選した宝くじを見つけるための効率的なアルゴリズムを提案する。
探索終端付近の非重要なニューロン群を非変化的に活用する手法であるWORMを提案する。
実験によると、WORMは、計算オーバーヘッドが増大しているにもかかわらず、畳み込みニューラルネットワークのトレーニング中に、より高速なチケット識別を実現する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:31:50 GMT)
Testing Whether Gravity Acts as a Quantum Entity When Measured [0.0] 古典システムの決定的なシグネチャは、外乱のない「原理的可測性」である。
本稿では,空間的重畳による重力場の非古典性を明らかにするためのマルチインターフェロメーター実験装置について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:51:52 GMT)
Temporal and Spatial Super Resolution with Latent Diffusion Model in Medical MRI images [0.0] スーパーレゾリューション(SR)はコンピュータビジョン、特に医用画像において重要な役割を果たす。
本稿では,Vector Quantized GAN(VQGAN)をベースとしたエンコーダデコーダアーキテクチャを併用したLatent Diffusion Model(LDM)を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:13:00 GMT)
Super Gradient Descent: Global Optimization requires Global Gradient [0.0] 本稿では,閉区間上で定義される任意のk-Lipschitz関数に対して,大域最小値への収束を保証する新しい最適化手法を提案する。
従来の最適化アルゴリズムの限界に対処するアプローチは、しばしばローカルなミニマに閉じ込められる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:23:29 GMT)
Statistical mechanical mapping and maximum-likelihood thresholds for the surface code under generic single-qubit coherent errors [0.0] 曲面符号における単一量子コヒーレント誤差、すなわち任意に選択できる軸に関する角度$alpha$による回転を考える。
回転軸のサブ空間にチャートした誤差補正位相の存在を数値的に確立し,対応する最大値の閾値を推定する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:23:23 GMT)
Standardization Trends on Safety and Trustworthiness Technology for Advanced AI [0.0] 大規模言語モデルと基礎モデルに基づく最近のAI技術は、人工知能に近づいたり、超えたりしている。
これらの進歩は、高度なAIの安全性と信頼性に関する懸念を引き起こしている。
AIの安全性と信頼性を確保するため、国際的に合意された標準を開発するための努力が実施されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:50:24 GMT)
Single-qubit rotation algorithm with logarithmic Toffoli count and gate depth [0.0] 我々のアルゴリズムは、繰り返し固定回転を適用するのではなく、直ちに$R_thetaast$を適用する。
厳密に1/2$以上の確率で成功し、予想されるトフォリ数対数$tfrac1epsilon$、期待されるゲート深さ$tfrac1epsilon$で対数を持つ。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:53:49 GMT)
Scaling of diffusion constants in perturbed easy-axis Heisenberg spin chains [0.0] 等方点における超拡散の安定性と容易軸状態における拡散定数の変化について検討した。
閉系では、摂動強度の全範囲にわたる拡散定数の連続的な変化の証拠が見つかる。
開系では、非弱摂動の範囲で閉系内のものと定量的に一致して拡散定数を求める。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:59:32 GMT)
SCGNet-Stacked Convolution with Gated Recurrent Unit Network for Cyber Network Intrusion Detection and Intrusion Type Classification [0.0] 侵入検知システム(IDS)は、複雑で多様なネットワーク攻撃を迅速かつ効率的に識別できるものではない。
SCGNetは,本研究で提案する新しいディープラーニングアーキテクチャである。
NSL-KDDデータセットは、それぞれ99.76%と98.92%の精度で、ネットワーク攻撃検出と攻撃タイプ分類の両方で有望な結果を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:09:08 GMT)
Rotational state changes in collisions of diatomic molecular ions with atomic ions [0.0] 極性イオンと非極性イオンの両方の原子分子イオンと原子イオンとの単一衝突における回転状態の変化について検討した。
翻訳運動と回転運動の時間とエネルギースケールの違いにより、衝突を古典的に扱い、量子力学的に回転を記述することができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:35:31 GMT)
Rotational excitation in sympathetic cooling of diatomic molecular ions by laser-cooled atomic ions [0.0] 二原子イオンと原子イオンの衝突における回転状態の変化を推定する。
また、単一の原子イオンと原子イオンのクーロン結晶の両方を考慮した冷却時間を推定した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:47:09 GMT)
Residual Random Neural Networks [0.0] ランダムな重みを持つ単層フィードフォワードニューラルネットワークは、ニューラルネットワークの文献の中で繰り返されるモチーフである。
隠れたニューロンの数がデータサンプルの次元と等しくない場合でも,優れた分類結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:40:28 GMT)
Remote Sensing for Weed Detection and Control [0.0] ライグラスは収量と穀物の品質を大幅に低下させる可能性がある。
コストと環境への影響を制御するため、ドローンや衛星画像の雑草を検出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:41:42 GMT)
Quantum simulation of the microscopic to macroscopic crossover using superconducting quantum impurities [0.0] 我々はフェルミの黄金律の開始を、モードの離散的な微視的な入浴が、マクロ的な熱力学の限界に近づくと見ている。
単一光子モードごとに小さいが有限なエスケープレートを保って、有限な長時間減衰率を得る必要があることを示す。
我々の定式化は超伝導回路における最近の実験を分析するのに利用できる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:01:33 GMT)
Quantum permutation puzzles with indistinguishable particles [0.0] 置換パズルの量子バージョンを導入し、パズルの断片を区別不可能な量子粒子に置き換える。
パズルの動きは、粒子を交換または置換することで達成される。
同一の粒子が絡み合っているにもかかわらず、粒子の置換を単純に古典的な置換パズルにマッピングできることが示される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:39:13 GMT)
Quantum implementation of non-unitary operations with biorthogonal representations [0.0] 非単体作用素の生物直交表現に基づく新しい拡張法を提案する。
提案手法は,固有値が 1 を超える絶対値を持つ非単項演算子の実装において優れている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:55:02 GMT)
Quantum enhanced balanced heterodyne readout for differential interferometry [0.0] 直接光信号の組み合わせによる空間的に異なる2つの干渉計の量子強調ヘテロダイン読み出し実験を行った。
周波数・スペクトルに絡み合った2モードの圧縮状態を適用し,3.5dBの入射音声帯域信号の信号から雑音へのさらなる改善を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:50:36 GMT)
Quantum coherence between mass eigenstates of a neutrino can be destroyed by its mass-momentum entanglement [0.0] 不安定な粒子の崩壊で生じるニュートリノや反ニュートリノが付随する粒子と絡まっていない場合、その質量はその運動量と相関する。
この絡み合いは、運動量と位置表現の両方においてニュートリノの質量固有状態の間の量子コヒーレンスを破壊する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:20:40 GMT)
Quantum and classical correlations in four-wave mixing from cold ensembles of two-level atoms [0.0] コールド2レベル原子のアンサンブルからの4波混合における量子相関は、背景光をフィルターすることなく優位に立つ可能性がある。
本研究は, システムの様々なパラメータと量子相関の実験的手順と変動について詳述する。
信号の古典的でない側面は短い時間スケールで発生するが、長い時間スケールはシステムの古典的相関も持つ。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:12:01 GMT)
Quantum Simulation of Spin-1 XXZ-Heisenberg Models and the Haldane Phase with Dysprosium [0.0] 本研究では, 1次元スピン-1 XXZ-ハイゼンベルク模型のシミュレーションのためのDysprosium原子を提案する。
適切な磁場中でのフェミオン性ジスプロシウム原子の連鎖は、スピン-1/2エッジモードの特性を持つハルデン状態を形成することができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:48:01 GMT)
Quantum Reconstructions as Stepping Stones toward Psi-Doxastic Interpretations? [0.0] 量子基盤においては、明確な物理原理から量子フォーマリズムを再構築するプログラムへの関心が高まっている。
このプロジェクトは、標準的なPsiオンティック解釈と緊張関係にあることが認識されている。
私の主張は、もしQRPをPsi-doxasticの解釈と関わりたいなら、非アクティブな経験的な言葉で綴られる再構築を目指すべきだということです。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:29:44 GMT)
Quantum Cosmology on Quantum Computer [0.0] 本稿では、物理量子コンピュータ上で行われた量子宇宙論の最初の研究について述べる。
我々は、よく使われる変分量子固有解法(VQE)ではなく、新しく提案されたHybrid Quantum-Classical (HQC)アルゴリズムを用いる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:21:25 GMT)
Quantum Circuits, Feature Maps, and Expanded Pseudo-Entropy: A Categorical Theoretic Analysis of Encoding Real-World Data into a Quantum Computer [0.0] 本研究の目的は,実世界のデータを量子回路にマッピングするための符号化方式の有効性を決定することである。
この方法は、各データポイントのシャノンエントロピーを点雲から計算し、したがって埋め込み多様体からサンプルを抽出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:38:01 GMT)
Problem Categorization Can Help Large Language Models Solve Math Problems [0.0] 本稿では,問題の分類を異なるカテゴリに分類し,問題解決に有効であることを示す。
また、正確なデータセットを作成することで、問題分類をカテゴリに最適化する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:06:26 GMT)
Predicting solvation free energies with an implicit solvent machine learning potential [0.0] 本稿では,小さな有機分子に対する暗黙の溶媒MLポテンシャルをパラメータ化するために,Solvation Free Energy Path Reweighting (ReSolv) フレームワークを導入する。
トップダウン(実験的な水和自由エネルギーデータ)とボトムアップ(真空中の分子の初期データ)の学習の組み合わせにより、ReSolvは明示的なバルク溶媒中の分子の難解なアブ初期データの必要性を回避した。
明示的な溶媒MLポテンシャルと比較して、ReSolvは4桁の計算スピードアップを提供し、実験と密接に一致している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:25:30 GMT)
Practical implementation of a single-qubit rotation algorithm [0.0] Toffoliは重要な普遍量子ゲートであり、Cliffordゲートと共に将来のフォールトトレラント量子コンピューティングハードウェアで利用できるようになる。
我々はClifford+Toffoliゲートセットを用いて,最近提案された1量子回転アルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:16:59 GMT)
Point-JEPA: A Joint Embedding Predictive Architecture for Self-Supervised Learning on Point Cloud [0.0] 我々は、ポイントクラウドデータに特化して設計された統合埋め込み予測アーキテクチャであるPoint-JEPAを紹介する。
ターゲット選択やコンテキスト選択の際のインデックスに基づいて,トークンの近接を効率的に計算し,利用するために,ポイントクラウドトークンを順序付けするシーケンサを導入する。
提案手法は,入力空間の再構成や追加のモダリティを回避しつつ,最先端の手法による競合的な結果を得る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:04:27 GMT)
Performance and Power: Systematic Evaluation of AI Workloads on Accelerators with CARAML [0.0] CARAMLベンチマークスイートは、大規模言語モデルとコンピュータビジョンモデルのトレーニング中のパフォーマンスとエネルギー消費を評価するために使用される。
CarAMLは、MLワークロードのパフォーマンスとエネルギを評価するための、コンパクトで、自動化され、再現可能なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:07:58 GMT)
Performance and Power: Systematic Evaluation of AI Workloads on Accelerators with CARAML [0.0] CARAMLベンチマークスイートは、大規模言語モデルとコンピュータビジョンモデルのトレーニング中のパフォーマンスとエネルギー消費を評価するために使用される。
CarAMLは、MLワークロードのパフォーマンスとエネルギを評価するための、コンパクトで、自動化され、再現可能なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:07:58 GMT)
PACE: Physics Informed Uncertainty Aware Climate Emulator [0.0] 我々は684Kパラメータの軽量な物理インフォームド不確かさ認識型気候エミュレータ PACE を提案する。
PACEは、温室効果ガスの排出データのみを訓練しながら、86年間安定して温度と降水量をエミュレートする。
PACEは15の気候モデルでトレーニングを受けており、ほとんどの気候モデルでベースラインを上回り、気候診断タスクにおいて新たな最先端の技術を推進している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:53:40 GMT)
Optical manifestations of topological Euler class [0.0] 非自明なオイラー類をホストするバンドのペアを用いて位相位相位相における光学的重みの量子幾何学的境界を解析する。
境界は、異なるドーピングにおけるオイラーバンドの結合した光学的重みをいかに制限するかを示す。
我々は$veck cdot vecp$モデル内でオイラー位相の光学的表現を導出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:40:18 GMT)
Online Test of a Neural Network Deep Convection Parameterization in ARP-GEM1 [0.0] 本稿では,大域大気モデル ARP-GEM1 へのニューラルネットワークによるパラメータ化の統合について述べる。
ARP-GEM1の深い対流パラメータ化をエミュレートするためにニューラルネットワークを訓練した。
物理に基づく深部対流法を用いて, ARP-GEM1シミュレーションの出力と平均場の評価は良好な一致を示した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:24:43 GMT)
On the representation-free formalism in quantum mechanics [0.0] ブラケット形式は、量子論において表現自由な考慮を実行する効率的な手段を提供する。
同時に、欠点はそれ固有のものだ。
我々はこれらの欠点を詳細に議論し、次に新しい表現自由スキームを構築する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:55:40 GMT)
On filter design in deep convolutional neural network [0.0] コンピュータビジョンにおけるディープ畳み込みニューラルネットワーク(DCNN)は、有望な結果をもたらした。
フィルタやウェイトはDCNNで学習する上で重要な要素である。
過去10年間に、半監督的、自己監督的、そして非監督的手法に関する様々な研究がなされてきた。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:13:22 GMT)
Noise-induced synchronization in coupled quantum oscillators [0.0] 一対の結合量子発振器の量子力学を相関散逸環境に結合する。
完全に相関し、完全に反相関する環境においては、発振器は長時間持続する相同期状態に緩和する。
完全に相関した、あるいは完全に反相関的な環境の極端な場合、状態空間の特定の領域は環境から完全に分離される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:34:36 GMT)
Multimodal Quantum Natural Language Processing: A Novel Framework for using Quantum Methods to Analyse Real Data [0.0] この論文は、量子計算法が言語の合成モデリングをどのように強化するかを考察する。
具体的には、マルチモーダル量子自然言語処理 (MQNLP) を Lambeq ツールキットを用いて進める。
結果は、構文ベースのモデル、特にDisCoCatやTreeReaderが文法構造を効果的に捉えるのに優れていることを示している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:03:43 GMT)
Multi-step feature fusion for natural disaster damage assessment on satellite images [0.0] 複数のネットワークレベルで機能融合を行う新しい畳み込みニューラルネットワーク(CNN)モジュールを導入する。
イメージペアの分析にCNNモデルを適用するために、追加のネットワーク要素であるFuse Moduleが提案された。
視覚変換器モデルの精度は3ポイント以上向上した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:47:32 GMT)
Modelling Sampling Distributions of Test Statistics with Autograd [0.0] 条件付き1次元サンプリング分布をモデル化する手法が,確率密度比法の代替となるかを検討する。
比較的単純で効果的なニューラルネットワークモデルは、様々な方法で予測の不確実性が定量化される。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:02:17 GMT)
Measurement-Induced Landscape Transitions and Coding Barren Plateaus in Hybrid Variational Quantum Circuits [0.0] 観測された量子回路では,バレン高原からノバレン高原への地形変化が観察された。
情報理論の観点から、これらは異なる遷移であると主張する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:16:53 GMT)
Mapping of a many-qubit state onto an oscillator using controlled displacements [0.0] 振動子四重項によって制御された四重項において、キューディット状態がどのように変位するかを示す。
キューディット二次状態の重ね合わせで量子情報を符号化する完全回路を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:27:20 GMT)
Machine Unlearning using Forgetting Neural Networks [0.0] 本稿では,忘れニューラルネットワーク(FNN)を用いた機械学習の新しいアプローチを提案する。
FNNは特定の記憶層を持つニューラルネットワークで、人間の脳が忘れられたときのプロセスからインスピレーションを受けます。
MNIST手書き文字認識とファッションデータセットについて報告する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:52:26 GMT)
ML Research Benchmark [0.0] MLRB(ML Research Benchmark)は,最近の機械学習カンファレンスのトラックから派生した7つの競合レベルタスクからなる。
本稿では,Claude-3 や GPT-4o などのフロンティアモデルを用いたエージェント足場を用いて,新しいベンチマークを提案し,評価する。
結果は、Claude-3.5 Sonnetエージェントがベンチマーク全体で最高のパフォーマンスを示し、機械学習モデルの設計と開発に優れていたことを示唆している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:38:42 GMT)
MIMIC-IV-Ext-PE: Using a large language model to predict pulmonary embolism phenotype in the MIMIC-IV dataset [0.0] 肺塞栓症は院内死亡予防の主因である。
研究用のPEラベルを含む大規模な公開データセットは少ない。
我々はCTPAスキャンで得られた全放射線診断報告を抽出し、2名の医師が手動でPE陽性(急性PE)またはPE陰性(PE陰性)と診断した。
我々は、ラベルを自動的に抽出するために、以前に微調整されたBio_ClinicalBERT変換言語モデル、VTE-BERTを適用した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:28:44 GMT)
MAPUNetR: A Hybrid Vision Transformer and U-Net Architecture for Efficient and Interpretable Medical Image Segmentation [0.0] 本稿では,医用画像セグメンテーションのためのU-Netフレームワークを用いて,トランスフォーマーモデルの強度を相乗化する新しいアーキテクチャMAPUNetRを紹介する。
本モデルでは,分解能保存課題に対処し,セグメンテーションされた領域に着目したアテンションマップを導入し,精度と解釈可能性を高める。
臨床実習における医用画像セグメンテーションの強力なツールとして,本モデルが安定した性能と可能性を維持していることを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:52:57 GMT)
Leaving Some Facial Features Behind [0.0] 本研究では,Fer2013データセットの顔摂動を用いて,顔の特徴が感情分類にどのように影響するかを検討する。
データに基づいてトレーニングされたモデルは、幸せや驚きといった感情のベースラインと比較して、重要な顔の特徴を除去することで、最大85%の精度低下を経験します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 02:28:53 GMT)
Large Language Models Based JSON Parser Fuzzing for Bug Discovery and Behavioral Analysis [0.0] この研究プロジェクトは、テストを強化するためにLLM(Large Language Models)を活用することに焦点を当てている。
主な目的は、オープンソースにおける潜在的なバグの発見にLLMを使用してテストケースとミュータントを生成することである。
根底にあるバグを明らかにし、振る舞いの多様性を発見(そして克服)することを目的としています。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 07:23:43 GMT)
Joint Estimation of Conditional Mean and Covariance for Unbalanced Panels [0.0] 本研究では,大きな不均衡パネルに対する断面条件平均と共分散行列の非パラメトリックカーネルベース推定器を提案する。
一貫性を示し、有限サンプル保証を提供します。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 08:42:22 GMT)
It Is Not About What You Say, It Is About How You Say It: A Surprisingly Simple Approach for Improving Reading Comprehension [0.0] 3つのデータセットにまたがる9つの大きな言語モデルで実験した結果、質問の前にコンテキストを提示することで、モデルのパフォーマンスが向上することがわかった。
さらに、最良のメソッドは驚くほど単純で、入力にいくつかのトークンを連結するだけで、結果として最大36%の精度の改善が得られます。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:32:54 GMT)
Inverse renormalization group of spin glasses [0.0] スピングラス研究において,まだスーパーコンピュータや大規模シミュレーションによってアクセスされていない格子体積の近似構成を構築するために,逆再正規化群変換を提案する。
機械学習アルゴリズムを用いて、最大$V'=1283$までの再スケール格子を構築し、2つの臨界指数を抽出する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:20:22 GMT)
Informational analysis of the confinement of an electron in an asymmetric double quantum dot [0.0] 準一次元の1電子二重量子ドットはシャノン情報エントロピーの枠組みの中で研究されている。
本研究ではシャノン情報エントロピーを電子閉じ込めの変化を調査するためのツールとして利用する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:11:18 GMT)
Inference in Partially Linear Models under Dependent Data with Deep Neural Networks [0.0] 1次ディープニューラルネットワーク(DNN)推定後の定常$beta$-mixingデータに基づく部分線形回帰モデルにおける推論について考察する。
サンプル分割を避けることで、依存データを持つ計量モデルに機械学習技術を適用する際の重要な課題の1つに対処する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:29:31 GMT)
Increasing subsequences, matrix loci, and Viennot shadows [0.0] 商 $mathbbF[mathbfx_n times n]/I_n$ が標準単項基底を持つことを示す。
また、 $mathbbF[mathbfx_n times n]/I_n$ を次数 $mathfrakS_n times MathfrakS_n$-module として計算する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:21:04 GMT)
Improving absolute separability bounds for arbitrary dimensions [0.0] 複合量子系における分離性に関する十分な解析条件は非常に少なく、低次元の場合のみ知られている。
線形写像とその逆写像を用いて強力な解析条件を導出し、絶対分離状態の集合の厳密な境界と極小点を与える。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:00:04 GMT)
Impact of spatial curvature on quantum Otto engines [0.0] 量子熱機関の特性に対する物理空間の曲率効果について検討する。
浴槽の位置の曲率差を変えることにより,熱機関の効率がカルノット効率限界を超えることが判明した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:38:50 GMT)
Impact of Code Transformation on Detection of Smart Contract Vulnerabilities [0.0] 本稿では,スマートコントラクト脆弱性データセットの量と品質を改善する方法を提案する。
このアプローチは、セマンティックな意味を変えることなくソースコード構造を変更するテクニックである、セマンティックな保存コード変換を中心に展開されている。
改善された結果によると、新たに生成された脆弱性の多くはツールをバイパスでき、偽報告率は最大100%になる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:08:25 GMT)
Hybrid model of the kernel method for quantum computers [0.0] 本稿では,古典的カーネル法に基づくハイブリッド学習手法と連続値のベクトル間の内部積の計算のための量子アルゴリズムを提案する。
テストケースでは,この新アルゴリズムを用いて,平面下にある有限正方形においてランダムに生成された新しい点が,この正方形内にある円の内外にあるか否かを分類した。
実験の結果, 99%のサンプルで新しい点を正確に検出できたが, 半径が理想よりもわずかに大きいため, 差は小さいことがわかった。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:49:03 GMT)
Harnessing spin-qubit decoherence to probe strongly-interacting quantum systems [0.0] 強く相互作用するシステムを探索するために、1つのスピン量子ビットを用いる。
XXZスピン鎖に着目して、量子ビットの進化における様々なダイナミクスを観察する。
このアプローチは、大きな相関の強い量子系の性質を探索する小さな量子系の力を明らかにする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:51:55 GMT)
HRPVT: High-Resolution Pyramid Vision Transformer for medium and small-scale human pose estimation [0.0] 中小規模での人間のポーズ推定は、長い間この分野において重要な課題であった。
本稿では PVT v2 をバックボーンとして利用して長距離依存をモデル化する HRPVT を提案する。
高品質な高分解能表現を生成するために設計された高分解能ピラミッドモジュール(HRPM)を紹介する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:36:05 GMT)
From spin squeezing to fast state discrimination [0.0] 絡み合った状態のクラスは、スピンスクイーズ状態が$N$2レベル原子である。
原子間相互作用は、状態の確率密度をせん断する非線形進化を生成することを示す。
結果として生じる非線形性は、量子計算において強力な資源であることが知られている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:30:29 GMT)
From melodic note sequences to pitches using word2vec [0.0] 本研究では,20人の子どもの歌とバッハソナタからの抜粋の2つのデータセットについて検討した。
言語モデリングで一般的に使用される word2vec 技法を、音符を文中の単語として扱うメロディーに適用することで、ピッチ情報の取得を可能にする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:38:27 GMT)
Formal Analysis of Reachability, Infection and Propagation Conditions in Mutation Testing [0.0] ジケストラの最も弱いプレコンディション変圧器(wp(_,_))は感染および伝播条件を計算するために用いられる。
4つのプログラムとその変異体を動作例として検討し,本手法の適用可能性を示すケーススタディとして検討した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:49:20 GMT)
FinVision: A Multi-Agent Framework for Stock Market Prediction [0.0] 本研究では,金融取引タスクに特化して設計されたマルチモーダルマルチエージェントシステムを提案する。
提案手法の重要な特徴はリフレクションモジュールの統合である。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:02:28 GMT)
Evaluating Performance and Bias of Negative Sampling in Large-Scale Sequential Recommendation Models [0.0] 大規模産業レコメンデーションモデルは、数百万から数十億のオプションを含むカタログから最も関連性の高いアイテムを予測する。
これらのモデルを効率的に訓練するために、関連する項目ごとに巨大なカタログから無関係な項目(負のサンプル)の小さなセットが選択される。
本研究は,大規模シーケンシャルレコメンデーションモデルの負サンプリング法を選択する際のトレードオフの実践的ガイドとして機能する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:32:17 GMT)
Ethical Statistical Practice and Ethical AI [0.0] 社会、文化、産業、科学、政府の懸念が高まり、世界中のAIシステムの倫理的発展と利用が懸念される。
ASAは、倫理統計学的実践とAIに関する声明を発表した(ASA, 2024)
ここでは、長年の人権法とコンピューティングと統計の倫理的実践基準で確立されてきた倫理的統計的実践と倫理的AIのサポートについて論じる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:09:34 GMT)
Entanglement-enhanced AC magnetometry in the presence of Markovian noises [0.0] 絡み合いは量子センサーの感度を向上させるための資源である。
本稿では,交流磁場検出における古典的戦略に対する絡み合いの利点を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 03:28:37 GMT)
Entanglement dynamics of a two-qutrits system coupled to a spin chain [0.0] 本稿では,スピン環境と相互作用する2つのクォート系の絡み合いダイナミクスについて検討する。
計算により、絡み合いが急速に崩壊した場合、環境は量子相転移を持つことが示された。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:26:59 GMT)
Entanglement Entropy is Elastic Cross Section [0.0] エンタングルメントエントロピーはサブシステムと弾性断面の間の量子相関を定量化する。
この結果から,2体システムにおける絡み合いエントロピーの「新しい地域法則」がもたらされる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:00:03 GMT)
Enhancing Financial Question Answering with a Multi-Agent Reflection Framework [0.0] 本稿では,各質問に対する推論ステップと最終回答を反映した批判エージェントを組み込んだマルチエージェントフレームワークを提案する。
以上の結果から,このフレームワークはシングルエージェント推論に比べて性能が著しく向上することが示された。
我々のフレームワークはLLaMA3.1-405B や GPT-4o-mini のようなより大きな単一エージェント LLM に匹敵する性能を持つ。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:58:07 GMT)
Enhancing Code Annotation Reliability: Generative AI's Role in Comment Quality Assessment Models [0.0] 既存の9,048ペアのC言語データセットに“Useful”あるいは“Not Useful”とラベル付けされた,新たに生成された1,437のコード圧縮ペアを統合します。
提案手法では,サポートベクトルマシン(SVM)モデルの精度が5.78%向上し,0.79から0.8478に向上し,ニューラルネットワーク(ANN)モデルのリコール率が2.17%向上し,0.731から0.7527に向上した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:57:27 GMT)
Enhancing Adversarial Attacks through Chain of Thought [0.0] 勾配に基づく敵対的攻撃は、特に整列した大言語モデル(LLM)に対して有効である
本稿では,CoTプロンプトとgreedy coordinate gradient (GCG)技術を統合することで,敵攻撃の普遍性を高めることを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 06:54:00 GMT)
Engineering propagating cat states with driving-assisted cavity QED [0.0] 時間変調駆動はエミッターを刺激し、4LSに絡み合ったコヒーレントな状態の重畳を生成する。
その最適値は、状態の伝播のための他の世代の方法と同様に定式化されている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:04:20 GMT)
EfficientNet with Hybrid Attention Mechanisms for Enhanced Breast Histopathology Classification: A Comprehensive Approach [0.0] 本稿では,ハイブリット・エフィシエント・ネットモデルと高度な注意機構を統合し,特徴抽出を強化し,重要な画像領域に焦点を当てた新しいアプローチを提案する。
利用可能な病理組織学データセットを用いて,複数の拡大スケールでモデルの性能を評価する。
その結果, 精度, F1スコア, 精度, リコールなどの指標を用いて評価し, 診断精度を向上させる上での本モデルの有効性を実証した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:56:05 GMT)
Efficient Machine Translation with a BiLSTM-Attention Approach [0.0] 本稿では,翻訳品質の向上を目的とした新しいSeq2Seqモデルを提案する。
このモデルでは、双方向長短期記憶ネットワーク(Bidirectional Long Short-Term Memory Network, Bi-LSTM)をエンコーダとして使用し、入力シーケンスのコンテキスト情報をキャプチャする。
現在の主流トランスフォーマーモデルと比較して,本モデルはWMT14機械翻訳データセットにおいて優れた性能を発揮する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 01:12:50 GMT)
EconoJax: A Fast & Scalable Economic Simulation in Jax [0.0] 本稿では,AI経済学に基づく高速シミュレーション経済であるEconoJaxを紹介する。
EconoJaxとそのトレーニングパイプラインは完全にJAXで書かれています。
実世界の経済行動が15分以内のトレーニングによってどのように現れるかを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:02:50 GMT)
ESG Rating Disagreement and Corporate Total Factor Productivity:Inference and Prediction [0.0] 本稿では、2015年から2022年までのA株上場企業のデータに基づいて、ESG評価の不一致(DisBoost)が企業全体の生産性(DisBoost)にどのように影響するかを検討する。
Disは減少する。
特に、国有、資本集約、低汚染の企業において。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:32:46 GMT)
Drone Acoustic Analysis for Predicting Psychoacoustic Annoyance via Artificial Neural Networks [0.0] 本研究は,種々の深層学習モデルの心理音響障害予測における有効性を検討することによって,先行研究を基礎にしている。
本研究の目的は、ドローン騒音の理解を深め、騒音低減技術の開発を支援し、公共空間でのドローン使用の受け入れを促進することである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:38:34 GMT)
Designing Majorana Quasiparticles in InAsP Quantum Dots in InP Nanowires with Variational Quantum Eigenvalue Solver [0.0] 本研究は、InAsP量子ドット(QD)におけるマヨラナゼロモード(MZM)の設計に向けたステップを示す。
単一粒子スペクトルは、正確な対角化(ED)法とハイブリッド変分量子固有解法(VQE)法を用いて、QNANOおよび多電子スペクトルを用いた100万の原子論的計算から得られる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:17:35 GMT)
Desiderata for the Context Use of Question Answering Systems [0.0] 先行研究は、最先端のコンテキストベースの質問応答(QA)システムにおいて、一般的な問題の集合を明らかにした。
まず最初に、QAモデルのデシラタ(desiderata)のセットを概説して、このギャップを埋めることを目指しています。
研究の第2部では、すべてのデシラタに基づいて、5つのデータセット上の15のQAシステムを評価する実験を行っている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:14:54 GMT)
Debiasing Alternative Data for Credit Underwriting Using Causal Inference [0.0] 代替データは、借り手の信用度を評価するために、貸し手にとって貴重な洞察を提供する。
しかし、いくつかの代替データは、保護されたクラスの違法な代理として機能する可能性があるため、歴史的に信用代行から除外されてきた。
本稿では、教師付き機械学習モデルに因果推論を適用して代替データをデバイアスし、クレジットカードの引受けに使用できるようにする手法を提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:54:55 GMT)
Covariant correlation-disturbance and its experimental realization with spin-1/2 particles [0.0] 逐次量子測定装置における相関と乱れの正確なトレードオフ関係を定式化する。
中性子光実験における提案手法の実験的実装について報告する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:18:32 GMT)
Coupling quantum-like cognition with the neuronal networks within generalized probability theory [0.0] 本稿では,通信ニューロンのネットワークの量子的表現について述べる。
標準的な量子論ではなく、一般確率論(英語版)(GPT)に基づいており、操作測定のアプローチに重点を置いている。
このGPTベースのモデルは、例えば順序、非可逆性、および解離効果などの基本的な量子的効果を示す。
このGPT結合は、てんかんやうつ病などの神経疾患の診断における量子的モデリングもサポートする。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:09:35 GMT)
Complex-Phase Extensions of Szegedy Quantum Walk on Graphs [0.0] この研究は、リンク位相と局所任意位相回転(APR)を組み込んだグラフ相Szegedyの量子ウォークを導入する。
我々はこれらの進歩に量子回路を適応させる方法を示し、計算実用性を保証する位相パターンを実現する。
我々の発見は、より汎用的で強力な量子コンピューティングパラダイムへの道のりを照らしている。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 12:57:31 GMT)
Compact frequency multiplexed readout of silicon quantum dots in monolithic FDSOI 28nm technology [0.0] 本稿では、バルク共振器を必要とせず、2つの共積分単一電子トランジスタのオンチップ周波数多重読み出しを初めて示す。
我々は、両方の単一電子トランジスタの4.2Kでの単一電子ダイナミクスを特徴付け、同時読み出しを2.2mus以内で検証し、1MHzの周波数間隔で99.9%の忠実さを達成する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:13:05 GMT)
CausAdv: A Causal-based Framework for Detecting Adversarial Examples [0.0] 畳み込みニューラルネットワーク(CNN)は、入力の逆方向の摂動に対して脆弱である。
これらの入力は、自然画像とほとんど区別できないように見えるが、CNNアーキテクチャによって誤って分類されている。
本稿では,反実的推論に基づく逆例検出のための因果的フレームワークCausAdvを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 22:57:48 GMT)
Building Castles in the Cloud: Architecting Resilient and Scalable Infrastructure [0.0] 本論文では,クラウド環境内におけるコンテキスト設計に必要な重要な対策について考察する。
レプリケーションサーバ、フォールトトレランス、ディザスタバックアップ、高可用性のためのロードバランシングの必要性について検討している。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 04:56:34 GMT)
Bremermann's limit in cGh-physics [0.0] ブレマーマンの極限は任意のコンピュータの質量 M に比例し、Mc2/h = (M/gram) 1047 ビット/秒は絶対極限 (c5/Gh)1/2= 1043 ビット/秒に置き換えるべきである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:40:16 GMT)
Breaking Rayleigh's curse for two unbalanced single-photon emitters: BLESS technique [0.0] レイリーの基準では、点拡散関数幅の下にある点源の解法は不可能であり、レイリーの呪いとして知られる短い距離で誤差が増加する。
本研究では,ビーム変調とショット統計検査を併用したBLESSを提案し,非バランスな音源に対するレイリーの呪いを破る。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 20:11:35 GMT)
Bloch classification surface for three-band systems [0.0] 位相的に保護された状態は、あるエネルギー輪郭図の特異点を示す物理系で見られる。
我々は、標準的なブロッホ曲面が二バンド曲面に対して行うのと同じように、3バンドハミルトニアン系に対して適用される分類曲面を発見した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:16:08 GMT)
Bayesian Optimization for Hyperparameters Tuning in Neural Networks [0.0] ベイズ最適化 (Bayesian Optimization) は、連続的な入力と限られた評価予算を持つブラックボックス関数に適した微分自由大域最適化手法である。
本研究では,畳み込みニューラルネットワーク(CNN)の強化を目的としたニューラルネットワークのハイパーパラメータチューニングにおけるBOの適用について検討する。
実験結果から,BOは探索と利用のバランスを効果的に保ち,CNNアーキテクチャの最適設定に向けて急速に収束することが明らかとなった。
このアプローチは、ニューラルネットワークチューニングの自動化におけるBOの可能性を強調し、機械学習パイプラインの精度と計算効率の改善に寄与する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:23:24 GMT)
Bayesian Counterfactual Prediction Models for HIV Care Retention with Incomplete Outcome and Covariate Information [0.0] 保持を予測し、保持を最適化するスケジュール決定を推奨するデータ駆動手法が必要である。
予測モデルは、様々なスケジューリングオプションで保持率を推定するのに有用である。
本稿では、これらの複雑さを考慮に入れながら、HIVの維持を予測し、スケジューリングを最適化するオールインワンアプローチを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:19:38 GMT)
Balancing Innovation and Sustainability: Addressing the Environmental Impact of Bitcoin Mining [0.0] この研究は、Bitcoinマイニングの中核となるプロセスを調べ、そのエネルギー集約的な仕事の証明メカニズムに焦点を当てている。
さまざまなモデルでは、Bitcoinのエネルギー消費は各国のエネルギー消費に匹敵し、深刻な持続可能性の懸念を浮き彫りにしている。
この論文は、環境責任を推進しつつ技術革新を促進するバランスのとれたアプローチを提唱する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:17:15 GMT)
BUSClean: Open-source software for breast ultrasound image pre-processing and knowledge extraction for medical AI [0.0] 乳房超音波画像(BUS)の臨床データセットを自動処理するオープンソースソフトウェアソリューションを提案する。
このアルゴリズムは、BUSスキャンフィルタリング(無効および非Bモードスキャンのフラグ付け)、クリーニング(デュアルビュースキャン検出、スキャンエリアトリミング、カリパー検出)、およびソノグラフアノテーションからの知識抽出を行う。
430の臨床的BUS画像の内部試験データセットを用いた実験は、あらゆる種類のテキストアノテーションを検出する際に、95%の感度と98%の特異性を達成した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 18:36:19 GMT)
Automated Feedback in Math Education: A Comparative Analysis of LLMs for Open-Ended Responses [0.0] 本研究では,大規模言語モデル(LLM)が数学教育における自動フィードバックを促進する可能性を探究することを目的とする。
我々は,Llamaの数学版であるMistralを採用し,このモデルを用いて,中学校数学問題に対する生徒の回答と教師によるフィードバックのデータセットを活用することによって,学生の反応を評価する。
2人の教師の判断を生かして,評価精度とフィードバックの質を評価する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 16:57:45 GMT)
Authentication and identity management based on zero trust security model in micro-cloud environment [0.0] Zero Trustフレームワークは、クラウドパラダイムにおけるインサイダー攻撃によるセキュリティ侵害を抑えながら、外部攻撃者を追跡してブロックすることができる。
本稿では,リソースへのアクセス制御の確立のために,認証機構,信頼スコアの算出,ポリシの生成に焦点をあてる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:06:13 GMT)
Assessing the Auditability of AI-integrating Systems: A Framework and Learning Analytics Case Study [0.0] 監査の有効性は,監査システムの監査可能性に左右される。
本稿では,AI統合システムの監査性を評価するためのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:43:21 GMT)
Application of Audio Fingerprinting Techniques for Real-Time Scalable Speech Retrieval and Speech Clusterization [0.0] 本稿では,音声検索の専門的課題に対処するため,既存の手法を応用するための新たな知見を提供する。
単一のリクエストを容易にするのではなく、バッチ処理で迅速かつ正確なオーディオ検索を実現することに注力している。
本論文は,実際の音声からテキストへの変換を行なわずに,音声によるクラスタリングを支援する手法について述べる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 09:11:28 GMT)
Analyzing Noise Models and Advanced Filtering Algorithms for Image Enhancement [0.0] 本研究の目的は,8種類のノイズを持つ画像に対する異なるフィルタリング手法の有効性を評価することである。
様々な種類の雑音に様々なフィルタを適用することで、異なるフィルタがノイズモデルに与える影響を示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 11:05:52 GMT)
An approximation of the $S$ matrix for solving the Marchenko equation [0.0] ここでは、有理関数の和として定式化された運動量$q$に対する$S$-行列依存の新たな近似と、truncated Sinc 級数を示す。
このアプローチにより、特定の解像度で$S$行列をポイントワイズで決定することができ、共鳴挙動などの重要な特徴を高精度に捉えることができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 17:15:20 GMT)
Advanced Hybrid Deep Learning Model for Enhanced Classification of Osteosarcoma Histopathology Images [0.0] 本研究は, 小児および思春期において最も多い骨癌である骨肉腫(OS)に焦点を当て, 腕と足の長い骨に影響を及ぼす。
我々は、OSの診断精度を向上させるために、畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)を組み合わせた新しいハイブリッドモデルを提案する。
このモデルは精度99.08%、精度99.10%、リコール99.28%、F1スコア99.23%を達成した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:54:08 GMT)
Adding or Subtracting a single Photon is the same for Pure Squeezed Vacuum States [0.0] 光場に単一の光子を加えると、単一の光子のサブトラクションと全く同じエンファンアウトカムが得られる。
混合状態が光子の追加または減算のためにこの値を示すことは、それらが同じスクイーズを伴う純粋に圧縮された真空状態の不整合和から生成されることを示せる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:00:15 GMT)
A relativistic discrete spacetime formulation of 3+1 QED [0.0] この研究は、2+1$と3+1$の2次元量子電磁力学(QED)の相対論的デジタル量子シミュレーションスキームを提供する。
量子回路の形をとり、空間と時間にわたって無限に繰り返し、離散化ステップ $Delta_t=Delta_x$ でパラメトリされる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 13:17:38 GMT)
A quantum cloning game with applications to quantum position verification [0.0] 量子クローンゲームでは、$k$の異なる協力者が古典的な入力を受ける。
そのようなゲームが$k$の個数に対して最適に勝る確率を与え、ゲームが$n$回並列にプレイされたときに指数関数的に減衰することを示す。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 15:53:19 GMT)
A nonlinear elasticity model in computer vision [0.0] 本研究の目的は,2つの画像を比較するために著者らが以前に導入した非線形弾性モデルを分析することである。
変換の存在は、勾配ベクトル値の強度写像の$値対の微分の中で証明される。
問題は、線形写像によって関連づけられた画像に対して、一意性が与えられるかどうかである。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 21:50:23 GMT)
A fast hybrid classical-quantum algorithm based on block successive over-relaxation for the heat differential equation [0.0] 本稿では,PDEを高速化するために,逐次オーバーラックス(SOR)に基づく高速ハイブリッド古典量子パラダイムを提案する。
提案手法は,既存手法の最大2倍の量子ビット数で高次元PDEの解を高速化することができる。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:44:16 GMT)
A Novel Psychometrics-Based Approach to Developing Professional Competency Benchmark for Large Language Models [0.0] 本稿では,厳密な心理測定原理に基づくベンチマーク開発への包括的アプローチを提案する。
我々は、教育と教育の分野で新しいベンチマークを作成することで、このアプローチを説明する最初の試みを行う。
我々はブルームの分類学によってガイドされ、テスト開発で訓練された教育専門家のコンソーシアムによって厳格に設計された新しいベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 19:32:43 GMT)
A Big Data-empowered System for Real-time Detection of Regional Discriminatory Comments on Vietnamese Social Media [0.0] ベトナムのソーシャルメディア上での地域差別コメントの検出という課題を提案する。
ソーシャルメディアプラットフォームからのコメントを含むViRDCデータセットを構築した。
本システムはベトナムにおける地域差別のリアルタイム検出のための包括的ソリューションを提供する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 10:06:49 GMT)
4D-based Robot Navigation Using Relativistic Image Processing [0.0] 4D知覚は、時間とともに自分の位置と環境の変化を予測する可能性を提供する。
相対論的画像処理を用いたロボットナビゲーションのための4次元アプローチを提案する。
論文参考訳(メタデータ) (Tue, 29 Oct 2024 14:42:19 GMT)