Revisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmark [166.4] 本稿では、微調整時のメモリコスト低減のためのソリューションとして、BPフリーゼロオーダー最適化(ZO)への移行を提案する。
従来のZO-SGD法とは異なり、我々の研究はより広い範囲のZO最適化手法に探索を広げる。
本研究は,タスクアライメントの重要性,前方勾配法の役割,アルゴリズムの複雑さと微調整性能のバランスについて,これまで見過ごされてきた最適化原理を明らかにした。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:27:06 GMT)
Joint Lemmatization and Morphological Tagging with LEMMING [127.9] 本稿では,レマタイズとタグ付けを共同でモデル化するモジュール型対数線形モデルLEMMingを提案する。
金の標準タグとレマタでアノテートされたコーパスで訓練でき、形態辞書やアナライザに依存しない。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:01:19 GMT)
Learning diverse attacks on large language models for robust red-teaming and safety tuning [126.3] レッドチーム、あるいは有害な応答を誘発するプロンプトの特定は、大きな言語モデルの安全なデプロイを保証するための重要なステップである。
新規性と多様性を優先する明確な規則化であっても、既存のアプローチはモード崩壊または効果的な攻撃を発生させることができないことを示す。
我々は,GFlowNetの微調整と二次平滑化フェーズを用いて,多種多様な効果的な攻撃プロンプトを生成するために攻撃モデルを訓練することを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:16:17 GMT)
Scalable Video Object Segmentation with Identification Mechanism [125.4] 本稿では,半教師付きビデオオブジェクト(VOS)のスケーラブルで効果的なマルチオブジェクトモデリングを実現する上での課題について検討する。
AOT(Associating Objects with Transformers)とAOST(Associating Objects with Scalable Transformers)の2つの革新的なアプローチを提案する。
当社のアプローチは最先端の競合に勝って,6つのベンチマークすべてにおいて,例外的な効率性とスケーラビリティを一貫して示しています。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:22:01 GMT)
ReFIT: Relevance Feedback from a Reranker during Inference [109.3] Retrieve-and-Rerankは、ニューラル情報検索の一般的なフレームワークである。
本稿では,リランカを利用してリコールを改善する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:12:02 GMT)
Exploring Context Window of Large Language Models via Decomposed Positional Vectors [107.2] トランスフォーマーベースの大規模言語モデル(LLM)は通常、限られたコンテキストウィンドウを持つ。
本研究では,コンテキストウィンドウ内外の位置情報について検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:50:46 GMT)
EG4D: Explicit Generation of 4D Object without Score Distillation [105.6] DG4Dは、スコア蒸留なしで高品質で一貫した4Dアセットを生成する新しいフレームワークである。
私たちのフレームワークは、世代品質のベースラインをかなりのマージンで上回ります。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:47:22 GMT)
3DitScene: Editing Any Scene via Language-guided Disentangled Gaussian Splatting [100.9] 既存の方法は、個々の2Dオブジェクトまたは3Dグローバルシーン編集にのみ焦点をあてる。
本稿では,新鮮で統一的なシーン編集フレームワークである3DitSceneを提案する。
2Dから3Dへのシームレスな編集が可能で、シーン構成や個々のオブジェクトを正確に制御できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:01 GMT)
TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.5] カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:11:37 GMT)
ID-to-3D: Expressive ID-guided 3D Heads via Score Distillation Sampling [96.9] ID-to-3D(ID-to-3D)は、不整合表現を用いたIDとテキスト誘導型3次元頭部を生成する方法である。
前例のないアイデンティティ一貫性と高品質なテクスチャと幾何生成を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:36:06 GMT)
A General Framework for Learning from Weak Supervision [93.9] 本稿では、新しいアルゴリズムを用いて、弱監督(GLWS)から学習するための一般的な枠組みを紹介する。
GLWSの中心は期待最大化(EM)の定式化であり、様々な弱い監督源を順応的に収容している。
また,EM計算要求を大幅に単純化する高度なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:59:30 GMT)
InfLLM: Training-Free Long-Context Extrapolation for LLMs with an Efficient Context Memory [93.2] 本稿では,トレーニング不要なメモリベースのInfLLMを提案する。
InfLLMは、リモートコンテキストを追加のメモリユニットに格納し、トークン関連ユニットを注目するために効率的なメカニズムを使用する。
シーケンス長が$1,024$Kにスケールしても、InfLLMは依然として、長距離依存関係を効果的にキャプチャする。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:05:12 GMT)
Towards a Generalist and Blind RGB-X Tracker [91.4] 我々は、推論時間中に任意のモダリティ X を無視できる単一のモデルトラッカーを開発する。
トレーニングプロセスは非常にシンプルで,複数ラベルの分類損失をルーティング関数に統合する。
我々のジェネラリストとブラインドトラッカーは、確立されたモーダル固有モデルと比較して、競争性能を達成することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:00:58 GMT)
Lumen: Unleashing Versatile Vision-Centric Capabilities of Large Multimodal Models [87.5] 本稿では,多目的視覚中心機能拡張を備えた大規模マルチモーダルモデルであるLumenという新しいLMMアーキテクチャを提案する。
ルーメンはまず、きめ細かい視覚言語の概念のアライメントを促進する。
そして、共有表現を軽量なタスクデコーダに柔軟にルーティングすることで、タスク固有のデコーダを実行する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:32:31 GMT)
Intent3D: 3D Object Detection in RGB-D Scans Based on Human Intention [86.4] RGB-Dを用いた3次元物体検出における新たな課題として,「背中を支えたいもの」などの人間の意図に基づく3次元対象物検出がある。
ScanNetデータセットの1,042のシーンから209のきめ細かいクラスに関連付けられた44,990の意図的テキストからなる新しいIntent3Dデータセットを紹介した。
我々はまた、この意図に基づく検出問題に対処するために設計された、我々のユニークなアプローチであるIntentNetを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:48:39 GMT)
Visual Anchors Are Strong Information Aggregators For Multimodal Large Language Model [82.9] ビジョン言語コネクタは、事前学習されたビジョンエンコーダとLLM(Large Language Models)を結びつける上で重要な役割を果たす。
本稿では,MLLMが低コストを維持しつつ高い精度を達成できる強力な視覚言語コネクタを提案する。
Anchor former (AcFormer) は、事前学習中に得られた視覚的アンカーから得られる豊富な事前知識を活用するために設計された、新しい視覚言語コネクタである。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:23:00 GMT)
DiG: Scalable and Efficient Diffusion Models with Gated Linear Attention [82.2] Diffusion Gated Linear Attention Transformers (DiG) は、Diffusion Transformers (DiT) の設計に従って、最小限のパラメータオーバーヘッドを持つ単純で適用可能なソリューションである。
DiTよりも優れたパフォーマンスに加えて、DiG-S/2はDiT-S/2よりも2.5times$高いトレーニング速度を示し、メモリ解像度は75.7%$179times 1792$である。
同じモデルサイズで、DIG-XL/2は最近のMambaベースの拡散モデルより4.2倍、解像度は1024ドルで、FlashAttention-2でDiTより1.8倍速い。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:33 GMT)
Phased Consistency Model [80.3] 一貫性モデル(CM)は近年,拡散モデルの生成促進に大きく進展している。
しかし、遅延空間(LCM)における高解像度のテキスト条件画像生成への応用は、未だに不十分である。
本稿では、設計空間を一般化し、特定されたすべての制約に対処する位相整合モデル(PCM)を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:47:19 GMT)
$M^3$GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation [80.2] M3$GPTは、理解と生成のための先進的な textbfMultimodal, textbfMultitaskフレームワークである。
我々は、テキスト、音楽、モーション/ダンスなどのマルチモーダル制御および生成信号に離散ベクトル量子化を用いる。
M3$GPTは、さまざまなモーション関連タスク間の接続とシナジーをモデル化することを学ぶ。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:42:48 GMT)
VividPose: Advancing Stable Video Diffusion for Realistic Human Image Animation [80.0] 時間的安定性を向上するエンドツーエンドパイプラインであるVividPoseを提案する。
識別対応外見制御器は、他の外見の詳細を損なうことなく、追加の顔情報を統合する。
SMPL-Xからの高密度レンダリングマップとスパーススケルトンマップの両方を利用する幾何対応のポーズコントローラ。
VividPoseは、提案したWildデータセットに優れた一般化能力を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:18:32 GMT)
AutoEval Done Right: Using Synthetic Data for Model Evaluation [79.0] この目的のために,効率的な統計的アルゴリズムを提案する。
これらのアルゴリズムは、GPT-4の実験において、有効にラベル付けされたサンプルサイズを最大50%増加させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:38:41 GMT)
Automatic Jailbreaking of the Text-to-Image Generative AI Systems [77.0] 本稿では,ChatGPT,Copilot,Geminiなどの商用T2I生成システムの安全性について,ナイーブプロンプトによる著作権侵害について検討する。
安全ガードをバイパスするプロンプトを生成するT2I生成システムに対して,より強力な自動脱獄パイプラインを提案する。
当社のフレームワークは,ChatGPTを11.0%のブロックレートでジェイルブレイクし,その76%で著作権コンテンツを生成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:37:00 GMT)
FASTopic: A Fast, Adaptive, Stable, and Transferable Topic Modeling Paradigm [76.5] 高速で適応的で、安定的で、転送可能なトピックモデルであるFASTopicを提案する。
また,新しいEmbedding Transport Plan (ETP) 手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:06:38 GMT)
Unfamiliar Finetuning Examples Control How Language Models Hallucinate [75.0] 大規模な言語モデルは、馴染みのないクエリに直面した時に幻覚化することが知られている。
モデルの微調整データの見慣れない例は、これらのエラーを形作るのに不可欠である。
本研究は,RLファインタニング戦略をさらに研究し,長大なモデル生成の現実性を改善することを目的とする。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:56:14 GMT)
Selecting Large Language Model to Fine-tune via Rectified Scaling Law [74.8] 制約のあるリソースを前提に、すべてのモデルを微調整し、その後の選択は非現実的である。
微調整スケーリング曲線は、よく知られた「パワーフェーズ」だけでなく、これまで観測されていなかった「プリパワーフェーズ」も含む。
本法則を利用して,資源消費の数百倍少ない最適モデルを選択する新しいLCM選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:16:42 GMT)
MambaVC: Learned Visual Compression with Selective State Spaces [74.3] 本稿では,SSMに基づくシンプルで強力で効率的な圧縮ネットワークであるMambaVCを紹介する。
MambaVC は2次元選択的走査 (2DSS) モジュールを備えた視覚状態空間 (VSS) ブロックを各ダウンサンプリング後の非線形活性化関数として開発する。
圧縮ベンチマークデータセットでは、MambaVCはより低い計算とメモリオーバーヘッドでより優れたレート歪み性能を達成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:58:14 GMT)
Improved Generation of Adversarial Examples Against Safety-aligned LLMs [72.4] 勾配に基づく手法を用いて生成された敵対的プロンプトは、自動的にジェイルブレイク攻撃を行う際、優れた性能を示す。
本論文は,ブラックボックス画像分類モデルを攻撃するために提案されたトランスファーベースの攻撃にインスパイアされたイノベーションを活用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:10:12 GMT)
Superposed Decoding: Multiple Generations from a Single Autoregressive Inference Pass [72.1] Superposed Decodingは、1つの自己回帰推論パスのコストで$k$のドラフトを生成する新しい復号アルゴリズムである。
我々の実験によると、Superposed Decodingの$k$ドラフトは、少なくとも一貫性があり、現実的である。
Nucleus Smpling と Greedy Decoding はそれぞれ。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:40:48 GMT)
MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.8] MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:43:36 GMT)
MotionLLM: Multimodal Motion-Language Learning with Large Language Models [69.6] 我々は,シングルヒューマン,マルチヒューマンモーション生成およびモーションキャプションを実現するために,MotionLLMを提案する。
具体的には、動作を離散LLM理解可能なトークンにエンコードし、量子化し、その結果、動作トークンとテキストトークンの両方からなる統一語彙が生成される。
我々のアプローチはスケーラブルで柔軟性があり、シングルヒューマンモーションの自動回帰生成によるマルチヒューマンモーション生成を容易に拡張できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:26:00 GMT)
Applications of flow models to the generation of correlated lattice QCD ensembles [69.2] 機械学習された正規化フローは、格子量子場理論の文脈で、異なる作用パラメータで格子ゲージ場の統計的に相関したアンサンブルを生成するために用いられる。
本研究は,これらの相関を可観測物の計算における分散低減に活用する方法を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:10:26 GMT)
4-bit Shampoo for Memory-Efficient Network Training [69.1] 二階計算は理論と実践における一階計算よりも優れている。
32ビット状態を圧縮してビット幅を小さくすることで、メモリ使用量の削減が期待できる。
4ビットシャンプーに例えられた最初の4ビットの2次数を提案し,32ビットのシャンプーに類似した性能を維持した。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:02:56 GMT)
AdaMerging: Adaptive Model Merging for Multi-Task Learning [68.8] 本稿では,Adaptive Model Merging (AdaMerging)と呼ばれる革新的な手法を紹介する。
本来のトレーニングデータに頼ることなく、タスクレベルでも階層的にも、モデルマージの係数を自律的に学習することを目指している。
AdaMergingは、現在の最先端のタスク演算のマージ方式と比較すると、パフォーマンスが11%向上している。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:42:31 GMT)
SciMON: Scientific Inspiration Machines Optimized for Novelty [68.5] 文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。
モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。
本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:50:47 GMT)
3D StreetUnveiler with Semantic-Aware 2DGS [66.9] StreetUnveilerは、混雑した観察から空の通りの3D表現を学習する。
空の街路シーンを、観察された、部分的に観察された、保存されていない領域に分割する。
街路景観データセットを用いた実験により, 空き路の3次元表現の再構築に成功した。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:57:12 GMT)
Is a 3D-Tokenized LLM the Key to Reliable Autonomous Driving? [66.7] 我々は,LDMと1層線形プロジェクタを接続する3Dトークン化器として,DETR方式の3Dパーセプトロンを導入する。
その単純さにもかかわらず、Atlasは3D検出とエゴ計画の両方で優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:57:44 GMT)
Attention as an RNN [66.5] 我々は,そのテキストマンディ・ツー・ワンのRNN出力を効率的に計算できる特別なリカレントニューラルネットワーク(RNN)として注目されることを示す。
本稿では,並列プレフィックススキャンアルゴリズムを用いて,注目のテキストマンディ・ツー・マニーRNN出力を効率よく計算する手法を提案する。
Aarensは、一般的な4つのシーケンシャルな問題設定に散らばる38ドルのデータセットで、Transformersに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:44:06 GMT)
Identity Decoupling for Multi-Subject Personalization of Text-to-Image Models [66.1] マルチオブジェクトパーソナライズを可能にする新しいフレームワークである MuDI を提案する。
本研究の主な目的は,セグメンテーションのための基礎モデルによって生成されたセグメンテーションの活用である。
実験結果から,MuDIは同一性ミキシングを伴わずに高品質なパーソナライズされたイメージを生成できることが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:09:13 GMT)
Towards Communication-efficient Federated Learning via Sparse and Aligned Adaptive Optimization [65.9] Federated Adam (FedAdam) アルゴリズムはアップリンク通信オーバーヘッドの3倍の増大に悩まされている。
我々はFedAdam-SSMと呼ばれる新しいスパースなFedAdamアルゴリズムを提案する。
我々は,FedAdam-SSMが訓練したモデルと集中型Adamの差異を最小化することにより,スペーシフィケーションエラーによる学習性能劣化を軽減するためにSSMを最適化する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:56:49 GMT)
Source Echo Chamber: Exploring the Escalation of Source Bias in User, Data, and Recommender System Feedback Loop [65.2] 本稿では,ソースバイアスがレコメンデーションシステムの領域に与える影響について検討する。
ソースバイアスの頻度を示し、ソースバイアスを増幅した潜在的デジタルエコーチャンバーを明らかにする。
我々は,HGCとAIGCの両方に対してモデル不均一性を維持するブラックボックスデバイアス法を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:34:50 GMT)
Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.2] Reinforcement Learning from Human Feedback (RLHF)のような最先端技術は、しばしば2つの段階から構成される。
1)教師付き微調整(SFT)では,人間の実演データからモデルを微調整する。
2)選好学習では,選好データを用いて報奨モデルを学習し,そのモデルを微調整する強化学習ステップで活用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:11:05 GMT)
Speakers Fill Lexical Semantic Gaps with Context [65.1] 我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:00:24 GMT)
Memory in Plain Sight: Surveying the Uncanny Resemblances of Associative Memories and Diffusion Models [65.1] 拡散モデル(DM)の生成プロセスは、最近、多くのAI生成ベンチマークに最先端を設定した。
エネルギーに基づく連想記憶(AM)の分野からのメモリ検索の数学的言語を用いたDM記述のための新しい視点を導入する。
我々は,AMから期待される経験的行動を示すDMを記録できることの証拠として,DMをエネルギーベースメモリの一種として理解することによって明らかにされる研究の機会について論じる。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:46:33 GMT)
Navigating the Safety Landscape: Measuring Risks in Finetuning Large Language Models [65.1] 我々は,安全景観をナビゲートすることで,大規模言語モデル(LLM)の微調整のリスクを測定することを目的としている。
我々は、人気のあるオープンソースLLMのモデルパラメータ空間において、普遍的に観察される新しい現象を発見した。
整列モデルの安全性の景観を可視化することで,モデルからモデルを引き離すことによって,微調整がいかに安全性を損なうかを理解することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:58:52 GMT)
MinPrompt: Graph-based Minimal Prompt Data Augmentation for Few-shot Question Answering [64.7] オープンドメイン質問応答のための最小限のデータ拡張フレームワークMinPromptを提案する。
我々は、生テキストをグラフ構造に変換し、異なる事実文間の接続を構築する。
次に、グラフアルゴリズムを適用して、原文のほとんどの情報をカバーするのに必要な最小限の文の集合を識別する。
同定された文サブセットに基づいてQAペアを生成し、選択した文に基づいてモデルをトレーニングし、最終モデルを得る。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:10:49 GMT)
TripletMix: Triplet Data Augmentation for 3D Understanding [64.7] TripletMixは、3次元理解におけるマルチモーダルデータ拡張の未解決問題に対処するための新しいアプローチである。
本研究は,3次元物体認識と理解を著しく向上させるマルチモーダルデータ拡張の可能性を明らかにするものである。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:44:15 GMT)
Spider: A Unified Framework for Context-dependent Concept Segmentation [64.0] パラメータセット1セットの統一モデルであるSpiderを提案する。
ベルとホイッスルがなければ、スパイダーは8つの異なる文脈依存セグメンテーションタスクにおいて最先端の特殊モデルよりも大幅に優れる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:09:30 GMT)
WIDIn: Wording Image for Domain-Invariant Representation in Single-Source Domain Generalization [64.0] We present WIDIn, Wording Images for Domain-Invariant representation, to disentangleative discriminative visual representation。
まず、ドメイン固有の言語を適応的に識別し、削除するために使用可能な、きめ細かいアライメントを組み込んだ言語を推定する。
WIDInは、CLIPのような事前訓練された視覚言語モデルと、MoCoやBERTのような個別訓練されたユニモーダルモデルの両方に適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:46:27 GMT)
Instruct-ReID++: Towards Universal Purpose Instruction-Guided Person Re-identification [62.9] 本稿では,与えられた画像や言語命令に従って,モデルに画像の検索を要求する新しい命令-ReIDタスクを提案する。
Instruct-ReIDは一般的なReID設定の最初の探索であり、既存の6つのReIDタスクを異なる命令を割り当てることで特別なケースとして見ることができる。
本稿では,新しいベースラインモデル IRM を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:35:46 GMT)
Recurrent Complex-Weighted Autoencoders for Unsupervised Object Discovery [62.4] 複雑な重み付き再帰的アーキテクチャの計算上の優位性について論じる。
本稿では,反復的制約満足度を実現する完全畳み込みオートエンコーダSynCxを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:06:28 GMT)
Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations [62.1] スケールとトレーニングの研究は、余剰のスケジュールに依存するため、必然的に複雑である、と我々は主張する。
その結果,重量平均化はトレーニングの軌道に沿って,異なるスケールでのトレーニングコストを伴わずに向上することがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:33:54 GMT)
White-box Multimodal Jailbreaks Against Large Vision-Language Models [62.0] 本稿では,テキストと画像のモダリティを併用して,大規模視覚言語モデルにおけるより広範な脆弱性のスペクトルを利用する,より包括的戦略を提案する。
本手法は,テキスト入力がない場合に,逆画像プレフィックスをランダムノイズから最適化し,有害な応答を多様に生成することから始める。
様々な有害な指示に対する肯定的な反応を誘発する確率を最大化するために、対向テキスト接頭辞を、対向画像接頭辞と統合し、共最適化する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:13:30 GMT)
STELLA: Continual Audio-Video Pre-training with Spatio-Temporal Localized Alignment [61.8] 様々な音声・ビデオの意味を時間とともに継続的に学習することは、音声関連推論タスクに不可欠である。
これは非時間的問題であり、オーディオとビデオのペア間のスパース時間相関と、オーディオとビデオの関係を忘れるマルチモーダル相関オーバーライトという2つの重要な課題を提起する。
本稿では,2つの新しいアイデアを取り入れた連続的なオーディオビデオ事前学習手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:36:00 GMT)
A Simple Joint Model for Improved Contextual Neural Lemmatization [60.8] 本稿では,20言語で最先端の成果を得られる,単純結合型ニューラルモデルを提案する。
本論文では,トレーニングと復号化に加えて,本モデルについて述べる。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:50:39 GMT)
Tool Learning with Large Language Models: A Survey [60.7] 大規模言語モデル(LLM)を用いたツール学習は,高度に複雑な問題に対処するLLMの能力を強化するための,有望なパラダイムとして登場した。
この分野での注目と急速な進歩にもかかわらず、現存する文献は断片化され、体系的な組織が欠如している。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:01:26 GMT)
CompetEvo: Towards Morphological Evolution from Competition [60.7] エージェントの設計と戦術を共進化させる競争進化(CompetEvo)を提案する。
その結果,エージェントがより適切な設計と戦略を進化させることができることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:53:02 GMT)
FlowSDF: Flow Matching for Medical Image Segmentation Using Distance Transforms [60.2] 署名された距離関数(SDF)を表す画像誘導型条件付きフローマッチングフレームワークであるFlowSDFを提案する。
SDFの条件分布の確率パスに直接関係するベクトル場を学習することにより、セグメント化マスクの分布から正確にサンプリングすることができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:47:12 GMT)
Length Generalization of Causal Transformers without Position Encoding [59.8] より長い文への一般化は、最近のTransformerベースの言語モデルにとって重要である。
位置符号化を伴わない変圧器長一般化特性について検討する。
NoPEは、一般的に使われる明示的な位置エンコーディングよりも長いシーケンスに拡張できるが、コンテキスト長が制限されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:38:59 GMT)
The Impossibility of Fair LLMs [59.4] 大規模言語モデル(LLM)の時代において、公正なAIの必要性はますます明確になっている。
我々は、機械学習研究者が公正性を評価するために使った技術フレームワークについてレビューする。
我々は、特定のユースケースにおける公平性を達成するためのより現実的な目標のためのガイドラインを策定する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:36:15 GMT)
ROPO: Robust Preference Optimization for Large Language Models [59.1] 外部モデルの助けを借りずにノイズ耐性とノイズサンプルのフィルタリングを統合する反復アライメント手法を提案する。
Mistral-7BとLlama-2-7Bで広く使われている3つのデータセットの実験では、ROPOが既存の嗜好アライメント法を大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:11:53 GMT)
INTERS: Unlocking the Power of Large Language Models in Search with Instruction Tuning [59.1] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的な機能を示している。
情報検索(IR)タスクへのそれらの適用は、自然言語における多くのIR固有の概念の頻繁な発生のため、いまだに困難である。
我々は,3つの基本IRカテゴリにまたがる20のタスクを含む新しいインストラクションチューニングデータセット InterS を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:58:32 GMT)
Towards Lightweight Super-Resolution with Dual Regression Learning [59.0] 深層ニューラルネットワークは、画像超解像(SR)タスクにおいて顕著な性能を示した。
SR問題は通常不適切な問題であり、既存の手法にはいくつかの制限がある。
本稿では、SRマッピングの可能な空間を削減するために、二重回帰学習方式を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:03:27 GMT)
Confidence-aware multi-modality learning for eye disease screening [58.9] 眼疾患スクリーニングのための新しい多モード顕在核融合パイプラインを提案する。
モダリティごとに信頼度を測り、マルチモダリティ情報をエレガントに統合する。
パブリックデータセットと内部データセットの両方の実験結果は、我々のモデルが堅牢性に優れていることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:27:30 GMT)
GFlow: Recovering 4D World from Monocular Video [58.6] GFlowは、ビデオ(3D)を4次元の明示的な表現に持ち上げるフレームワークで、空間と時間を通してガウスのスプラッティングの流れを包含する。
GFlowはまずシーンを静止部分と移動部分にクラスタリングし、逐次最適化プロセスを適用する。
GFlowは、単なる4D再構築の境界を超越する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:22 GMT)
RACCooN: Remove, Add, and Change Video Content with Auto-Generated Narratives [58.2] 本稿では,RACCooNを提案する。
統合パイプラインを通じて、削除、追加、修正、単純化といった複数のビデオ編集機能をサポートする。
提案フレームワークは,ビデオ・パラグラフ生成,映像コンテンツ編集において印象的な機能を示し,他のSoTAビデオ生成モデルに組み込んでさらなる拡張を行うことができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:46:36 GMT)
Representation Surgery for Multi-Task Model Merging [57.6] マルチタスク学習(MTL)は、複数のタスクから情報を統一されたバックボーンに圧縮し、計算効率と一般化を改善する。
最近の研究は、複数の独立して訓練されたモデルをマージして、共同トレーニングのために生データを収集する代わりにMLLを実行する。
既存のモデルマージスキームの表現分布を可視化することにより、マージモデルはしばしば表現バイアスのジレンマに悩まされる。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:35:17 GMT)
Lower Bounds and Optimal Algorithms for Non-Smooth Convex Decentralized Optimization over Time-Varying Networks [57.2] 通信ネットワークのノード間で分散的に格納された凸関数の総和を最小化するタスクについて検討する。
この問題を解決するのに必要な分散通信数と(サブ)漸進計算の下位境界が確立されている。
我々は,これらの下界に適合する最初の最適アルゴリズムを開発し,既存の最先端技術と比較して理論性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:28:45 GMT)
Premise Order Matters in Reasoning with Large Language Models [57.2] 大規模言語モデル (LLM) は,前提の順序に驚くほど脆弱であることを示す。
前提順序が中間的推論ステップで要求されるコンテキストと一致した場合, LLM が最高の性能を達成することを観察する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:32:09 GMT)
Detoxifying Large Language Models via Knowledge Editing [57.1] 本稿では,Large Language Models (LLM) のデトックス化のための知識編集手法について検討する。
我々は、強力な攻撃プロンプトを持つ9つの安全でないカテゴリをカバーするベンチマーク、SafeEditを構築した。
いくつかの知識編集手法を用いて実験を行い、知識編集がLLMを解毒する可能性を示し、汎用性能に限られた影響を与えていることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:11:25 GMT)
Position: Towards Implicit Prompt For Text-To-Image Models [57.0] 本稿では,テキスト・トゥ・イメージ(T2I)モデルの現状を暗黙のプロンプトに向けて強調する。
我々は、ImplicitBenchというベンチマークを示し、暗黙のプロンプトのパフォーマンスと影響について調査する。
実験結果から,T2Iモデルは暗黙のプロンプトで示される様々なターゲットシンボルを正確に生成できることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:24:14 GMT)
Aurora: A Foundation Model of the Atmosphere [57.0] 我々はAuroraを紹介します。Auroraは、100万時間以上の多様な気象および気候データに基づいてトレーニングされた大気の大規模な基礎モデルです。
オーロラは1分以内に5日間の大気汚染予測と10日間の高解像度気象予測を生み出している。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:03:20 GMT)
DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.9] 大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:50:38 GMT)
SpikeCV: Open a Continuous Computer Vision Era [56.0] SpikeCVはスパイクカメラ用の新しいオープンソースのコンピュータビジョンプラットフォームである。
スパイクカメラは、近年急速に発達しているニューロモルフィックな視覚センサーである。
SpikeCVは、さまざまな超高速シーンデータセット、ハードウェアインターフェース、使いやすいモジュールライブラリを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:26:16 GMT)
Individualized Privacy Accounting via Subsampling with Applications in Combinatorial Optimization [55.8] 本研究では、以下の簡単な観察を通して、個別化されたプライバシ会計を解析する新しい手法を提案する。
我々は、分解可能な部分モジュラーおよびセットアルゴリズム被覆を含む、プライベート最適化問題に対するいくつかの改良されたアルゴリズムを得る。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:02:30 GMT)
Cost-Sensitive Multi-Fidelity Bayesian Optimization with Transfer of Learning Curve Extrapolation [55.8] 各ユーザが事前に定義した機能であるユーティリティを導入し,BOのコストと性能のトレードオフについて述べる。
このアルゴリズムをLCデータセット上で検証した結果,従来のマルチファイルBOや転送BOベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:38:39 GMT)
What, when, and where? -- Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions [55.6] 時空間グラウンド(時空間グラウンド)は、空間と時間における事象を局所化するタスクを指す。
このタスクのモデルは、通常、人間の注釈付き文とバウンディングボックスの監督によって訓練される。
我々は,局所的な表現学習と,より詳細な空間情報に焦点を合わせ,高レベルな表現を捉えるグローバルな表現を組み合わせる。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:01:24 GMT)
LDMol: Text-Conditioned Molecule Diffusion Model Leveraging Chemically Informative Latent Space [55.5] 本稿では, LDMol と呼ばれる新しい潜伏拡散モデルを提案する。
具体的には、化学情報的特徴空間を生成する分子エンコーダ、拡散変換器(DiT)を用いた自然言語条件の潜伏拡散モデル、および分子回帰のための自己回帰デコーダの3つの構成要素から構成される。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:59:13 GMT)
TimeChara: Evaluating Point-in-Time Character Hallucination of Role-Playing Large Language Models [55.5] 我々は,ロールプレイング LLM におけるポイントインタイムキャラクタ幻覚を評価するための新しいベンチマーク TimeChara を紹介する。
そこで本研究では,物語専門家を駆使したナラティブ・エクササイズ(Narrative-Experts)を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:19:18 GMT)
Improving Token-Based World Models with Parallel Observation Prediction [55.4] トークンベースの世界モデル(TBWM)は、最近サンプル効率のよい方法として提案されている。
想像の中で、次の観測のシーケンシャルなトークン・バイ・トークンの生成は深刻なボトルネックをもたらす。
我々は、このボトルネックを解決するために、新しい並列観測予測(POP)機構を考案した。
POPは、我々の強化学習環境に合わせて、新しいフォワードモードでRetentive Network(RetNet)を拡張します。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:10:37 GMT)
Generalized Preference Optimization: A Unified Approach to Offline Alignment [55.0] 本稿では,一般的な凸関数のクラスによってパラメータ化されるオフライン損失の族である一般化された選好最適化(GPO)を提案する。
GPOは、DPO、IPO、SLiCといった既存のアルゴリズムを特別なケースとして含む、優先最適化に関する統一的なビューを可能にする。
本研究は,新たなアルゴリズムツールキットと経験的洞察を実践者のアライメントに提示する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:25:15 GMT)
FinerCut: Finer-grained Interpretable Layer Pruning for Large Language Models [54.8] FinerCutは変圧器ネットワークのための微細な層プルーニングの新たな形式である。
Llama3-8Bは25%の層を除去し,Llama3-70Bは95%の層を除去した。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:21:15 GMT)
REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR [54.6] 教師なしASRにおける反復訓練を用いたREBORN, Reinforcement-Learned boundaryを提案する。
ReBORNは、音声信号におけるセグメント構造の境界を予測するセグメンテーションモデルのトレーニングと、セグメンテーションモデルによってセグメント化された音声特徴である音素予測モデルのトレーニングを交互に行い、音素転写を予測する。
我々は、広範囲にわたる実験を行い、同じ条件下で、REBORNは、LibriSpeech、TIMIT、および5つの非英語言語において、以前の教師なしASRモデルよりも優れていることを発見した。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:19:59 GMT)
Hardware-Aware Parallel Prompt Decoding for Memory-Efficient Acceleration of LLM Inference [54.5] LLM(Large Language Models)の自動回帰デコーディングは、ハードウェアの性能に大きなオーバーヘッドをもたらす。
トレーニング可能なパラメータを0.0002$%しか必要とせず,A100-40GBのGPUをたった16時間で効率的にトレーニングできる並列プロンプトデコーディングを提案する。
我々のアプローチでは、最大2.49$times$ スピードアップを示し、最小のメモリオーバーヘッドは0.0004$%である。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:19:30 GMT)
A Canonization Perspective on Invariant and Equivariant Learning [54.4] カノン化は、フレームの設計を原則的に理解する。
フレームと標準形式の間には固有の関係があることが示される。
既存の手法よりも厳密な固有ベクトルのための新しいフレームを設計する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:22:15 GMT)
Low-rank finetuning for LLMs: A fairness perspective [54.1] 低ランク近似技術は、微調整された大規模言語モデルのデファクトスタンダードとなっている。
本稿では,これらの手法が初期訓練済みデータ分布から微調整データセットのシフトを捉える上での有効性について検討する。
低ランク微調整は好ましくない偏見や有害な振る舞いを必然的に保存することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:43:53 GMT)
Visualizing the loss landscape of Self-supervised Vision Transformer [53.8] Masked Autoencoder (MAE) は、視覚変換器を用いたマスク付き画像モデリングのための代表的自己教師型アプローチとして注目されている。
我々は、MAEとRC-MAEによる自己監督型視覚変換器の損失景観を可視化し、それらを教師付きViT(Sup-ViT)と比較する。
我々の知る限りでは、この研究は、ロスランドスケープのレンズを通して自己監督型ViTを初めて調査したものだ。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:54:26 GMT)
Deep Learning for Time Series Anomaly Detection: A Survey [53.8] 時系列異常検出は、製造業や医療を含む幅広い研究分野や応用に応用されている。
時系列の大規模かつ複雑なパターンにより、研究者は異常パターンを検出するための特別な深層学習モデルを開発するようになった。
本調査は,ディープラーニングを用いた構造化および総合的時系列異常検出モデルの提供に焦点を当てる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:36:22 GMT)
Evaluating radiation impact on transmon qubits in above and underground facilities [53.5] 我々は,Fermilab SQMS地上施設および深部地下グラン・サッソ研究所(INFN-LNGS)で最初に測定されたトランスモン量子ビットの応答の比較を行った。
その結果、クォービットは強いガンマ源に反応し、粒子の衝突を検出することが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:54:45 GMT)
VITON-DiT: Learning In-the-Wild Video Try-On from Human Dance Videos via Diffusion Transformers [53.5] そこで本研究では,VITON-DiT という,Diton-DiT ベースのビデオトライオンフレームワークを提案する。
具体的には、VITON-DiTは、衣服抽出器、空間-テンポラル denoising DiT、アイデンティティ保存制御ネットから構成される。
また、トレーニング中のランダム選択戦略や、長いビデオ生成を容易にするために、推論時に補間自己回帰(IAR)技術を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:21:03 GMT)
Latent Plan Transformer: Planning as Latent Variable Inference [53.4] オフライン強化学習から得られたデータセットを用いた計画のための生成モデルについて検討する。
本稿では,Transformerベースの軌道生成器と最終帰路を接続する潜在空間を利用した新しいモデルであるLatent Plan Transformerを紹介する。
テスト時には、遅延変数はポリシー実行前の期待した戻り値から推論され、計画のアイデアを推論として実現します。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:24:41 GMT)
ConSiDERS-The-Human Evaluation Framework: Rethinking Human Evaluation for Generative Large Language Models [53.0] 生成型大規模言語モデル(LLM)の人間による評価は多分野にわたる作業であるべきだと論じる。
認知バイアスが、流動的な情報や真理をいかに説明するか、そして、認識の不確実性が、Likertのような評価スコアの信頼性にどのように影響するかを強調します。
本稿では,ConSiDERS-The-Human評価フレームワークを提案する。一貫性, Scoring Critera, Differentiating, User Experience, Responsible, Scalabilityの6つの柱からなる。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:45:28 GMT)
SCHEME: Scalable Channel Mixer for Vision Transformers [52.6] ビジョントランスフォーマーは多くの視覚タスクにおいて印象的なパフォーマンスを達成した。
チャネルミキサーや機能ミキシングブロック(FFNか)の研究は、はるかに少ない。
密度の高い接続は、より大きな膨張比をサポートする対角線ブロック構造に置き換えることができることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:13:39 GMT)
A Closer Look at the Limitations of Instruction Tuning [52.6] インストラクションチューニング(IT)は,大規模言語モデル(LLM)における知識やスキルの向上に失敗することを示す。
また、一般的なIT改善手法は、シンプルなLoRA微調整モデルよりも性能改善につながるものではないことも示している。
この結果から,事前学習した知識のみから生成した応答は,オープンソースデータセット上でITから新たな知識を学習するモデルによって,一貫した応答性能が向上することが判明した。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:55:38 GMT)
Mitigating Object Hallucination via Data Augmented Contrastive Tuning [52.4] MLLM(Multimodal Large Language Models)は、事実的に不正確な情報を幻覚させる傾向がある。
そこで本研究では,幻覚を緩和するための既訓練オフザシェルフMLLMに適用可能なコントラストチューニング手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:36:00 GMT)
KOALA: Empirical Lessons Toward Memory-Efficient and Fast Diffusion Models for Text-to-Image Synthesis [52.4] 効率的なテキスト・ツー・イメージ・モデルを構築する上で重要なプラクティスを3つ提示する。
これらの結果に基づき、KOALA-Turbo &-Lightningと呼ばれる2種類の効率的なテキスト・画像モデルを構築した。
SDXLとは異なり、私たちのKOALAモデルは8GBのVRAM(3060Ti)を持つコンシューマグレードGPU上で1024pxの高解像度画像を生成することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:51:18 GMT)
Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.3] PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:30:19 GMT)
A Theoretical Understanding of Self-Correction through In-context Alignment [51.6] 大規模言語モデル(LLM)は自己補正によって純粋に能力を向上させることができる。
LLMが比較的正確な自己評価を報酬として与える場合、文脈内応答を補充できることを示す。
これらの知見に触発されて,LLMジェイルブレイクに対する防御などの自己補正の応用についても解説した。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:33:02 GMT)
Facilitating Multi-Role and Multi-Behavior Collaboration of Large Language Models for Online Job Seeking and Recruiting [51.5] 既存の手法は履歴書とジョブ記述の潜在意味論をモデル化し、それらの間に一致する関数を学習することに依存している。
大規模言語モデル (LLM) の強力なロールプレイング能力に触発されて, LLM によるインタビュアーと候補者のモックインタビュープロセスを導入することを提案する。
そこで我々は,モックインタビュー生成とハンドシェイクプロトコルにおける双方向評価という2つのモジュールにパーソナライズされたマッチングプロセスを分割する,新しいフレームワークであるMockLLMを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:23:16 GMT)
Knowledge Fusion of Chat LLMs: A Preliminary Technical Report [51.0] チャットLLMの融合を実現するためにFuseLLMフレームワークを拡張し,FusionChatを実現する。
本研究は, 構造的, スケール的な光源LLMの知識融合を行い, 軽量微調整により, 同一構造と大きさの複数の目標LLMを導出する。
我々は,異なるアーキテクチャとスケールを持つ3つの著名なチャットLLM,すなわちNH2-Mixtral-8x7B,NH2-Solar-10.7B,OpenChat-3.5-7Bを用いて,我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:59:16 GMT)
DSDL: Data Set Description Language for Bridging Modalities and Tasks in AI Data [50.9] 人工知能の時代において、データモダリティとアノテーションフォーマットの多様性は、しばしば直接使用できないデータをレンダリングする。
本稿では,AIデータセットの統一標準を提供することにより,データセット処理の簡略化を目的としたフレームワークを紹介する。
DSDLの標準化された仕様は、データの拡散、処理、使用におけるユーザの作業量を削減します。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:07:45 GMT)
Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning [50.8] 我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:34:47 GMT)
AnyFit: Controllable Virtual Try-on for Any Combination of Attire Across Any Scenario [50.6] AnyFitは、高解像度のベンチマークと実世界のデータのベースラインを、大きなギャップで上回っている。
AnyFitの高忠実度バーチャル試作品における印象的なパフォーマンスは、あらゆるイメージから見ても、ファッションコミュニティにおける将来の研究の新たな道を切り開くものです。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:33:08 GMT)
MindFormer: A Transformer Architecture for Multi-Subject Brain Decoding via fMRI [50.6] 我々は、fMRI条件の特徴ベクトルを生成するためにMindFormerと呼ばれる新しいトランスフォーマーアーキテクチャを導入する。
MindFormerは,1)fMRI信号から意味論的に意味のある特徴を抽出するIP-Adapterに基づく新しいトレーニング戦略,2)fMRI信号の個人差を効果的に捉える主観的トークンと線形層である。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:36:25 GMT)
Atlas3D: Physically Constrained Self-Supporting Text-to-3D for Simulation and Fabrication [50.5] 我々は,テキストから3Dへの自動的実装であるAtlas3Dを紹介する。
提案手法は,新しい微分可能シミュレーションに基づく損失関数と,物理的にインスパイアされた正規化を組み合わせたものである。
我々は、Atlas3Dの有効性を広範囲な生成タスクを通して検証し、シミュレーションと実環境の両方で結果の3Dモデルを検証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:33:18 GMT)
FreeSplat: Generalizable 3D Gaussian Splatting Towards Free-View Synthesis of Indoor Scenes [50.5] FreeSplatは、長いシーケンス入力から自由視点合成まで、幾何学的に一貫した3Dシーンを再構築することができる。
ビュー数に関係なく、広いビュー範囲にわたる堅牢なビュー合成を実現するための、シンプルで効果的なフリービュートレーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:40:14 GMT)
Multi-modal Generation via Cross-Modal In-Context Learning [50.5] 複雑なマルチモーダルプロンプトシーケンスから新しい画像を生成するMGCC法を提案する。
我々のMGCCは、新しい画像生成、マルチモーダル対話の促進、テキスト生成など、多種多様なマルチモーダル機能を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:58:31 GMT)
Offline Reinforcement Learning from Datasets with Structured Non-Stationarity [50.4] 現在の強化学習(RL)は、成功するポリシーを学ぶのに必要な大量のデータによって制限されることが多い。
本稿では,データセットを収集しながら,各エピソードの遷移と報酬関数が徐々に変化するが,各エピソード内で一定に保たれるような新しいオフラインRL問題に対処する。
本稿では、オフラインデータセットにおけるこの非定常性を識別し、ポリシーのトレーニング時にそれを説明し、評価中に予測するContrastive Predictive Codingに基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:11:52 GMT)
GumbelSoft: Diversified Language Model Watermarking via the GumbelMax-trick [50.4] 大型言語モデル(LLM)は、人間のようなテキストを生成するだけでなく、フェイクニュースや学術的不正の誤用も懸念している。
デコードベースの透かし、特にGumbelMax-trickベースの透かし(GM透かし)は、機械生成テキストを保護するためのスタンドアウトソリューションである。
我々は,新しいタイプのGM透かし,Logits-Addition透かし,およびその3つの変種を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:58:41 GMT)
The formation of Schrodinger cat-like states in the process of spontaneous parametric down-conversion [50.2] シュロディンガーの猫のような状態は、基本モードと第2高調波モードで形成される。
ウィグナー関数は、質的にシュロディンガー猫のような状態を可視化するために用いられる。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:23:58 GMT)
Universal and Extensible Language-Vision Models for Organ Segmentation and Tumor Detection from Abdominal Computed Tomography [50.1] 本稿では、単一のモデルであるUniversal Modelが複数の公開データセットに対処し、新しいクラスに適応することを可能にするユニバーサルフレームワークを提案する。
まず,大規模言語モデルからの言語埋め込みを利用した新しい言語駆動パラメータ生成手法を提案する。
第二に、従来の出力層は軽量でクラス固有のヘッドに置き換えられ、ユニバーサルモデルでは25の臓器と6種類の腫瘍を同時に分割することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:55:15 GMT)
Mastering Robot Manipulation with Multimodal Prompts through Pretraining and Multi-task Fine-tuning [49.9] 我々はマルチモーダルなプロンプトを理解するためにロボットを訓練する問題に取り組む。
このようなタスクは、視覚と言語信号の相互接続と相補性を理解するロボットの能力にとって大きな課題となる。
マルチモーダルプロンプトを用いてロボット操作を行うためのポリシーを学習する効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:33:37 GMT)
Transition Path Sampling with Boltzmann Generator-based MCMC Moves [49.7] サンプル遷移経路への現在のアプローチはマルコフ連鎖モンテカルロを用いており、新しい経路を見つけるために時間集約的な分子動力学シミュレーションに依存している。
我々の手法は、分子のボルツマン分布からガウスへ写像する正規化フローの潜在空間で機能し、分子シミュレーションを必要とせずに新しい経路を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:50:41 GMT)
A Provably Effective Method for Pruning Experts in Fine-tuned Sparse Mixture-of-Experts [49.4] 本論文は,MoEモデルにおけるエキスパートの刈り取りに有効な手法として,初めて提案するものである。
理論的には、事前訓練されたモデルからルータl2ノルムを小さく変更することで、専門家のプルーニングを優先順位付けすることで、テスト精度の維持が保証される。
我々の理論解析は、単純化されたMoEアーキテクチャ上でのバイナリ分類タスクに重点を置いているが、我々の専門的なプルーニング手法は、大きな視覚的MoEモデルに基づいて検証されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:45:01 GMT)
A Generalization Theory of Cross-Modality Distillation with Contrastive Learning [49.4] クロスモダリティ蒸留は、限られた知識を含むデータモダリティにとって重要なトピックである。
コントラスト学習に基づくクロスモーダルコントラスト蒸留(CMCD)の一般的な枠組みを定式化する。
我々のアルゴリズムは、様々なモダリティやタスクに対して、2-3%のマージンで既存のアルゴリズムを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:47:03 GMT)
SpinQuant: LLM quantization with learned rotations [49.1] 重み、アクティベーション、KVキャッシュに適用された後トレーニング量子化(PTQ)技術は、大規模言語モデル(LLM)のメモリ使用量、レイテンシ、消費電力を大幅に削減する。
近年の研究では、回転活性化または重量行列は、外れ値を取り除き、量子化の恩恵をもたらすことが示唆されている。
SpinQuantは同時処理のQuaRotより優れている。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:14:15 GMT)
MM-LLMs: Recent Advances in MultiModal Large Language Models [49.1] 過去1年間で、MM-LLM(MultiModal Large Language Models)が大幅に進歩している。
126のMM-LLMを包含する分類法を導入し,その特異な定式化を特徴とする。
本稿では,主要なベンチマークで選択したMM-LLMの性能を概観し,MM-LLMの有効性を高めるための鍵となるトレーニングレシピを要約する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:36:23 GMT)
Predicting Ground State Properties: Constant Sample Complexity and Deep Learning Algorithms [48.9] 量子多体物理学における基本的な問題は、局所ハミルトニアンの基底状態を見つけることである。
基底状態特性を学習するためのシステムサイズ$n$とは無関係に,一定のサンプル複雑性を実現する2つのアプローチを導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:32 GMT)
EgoNCE++: Do Egocentric Video-Language Models Really Understand Hand-Object Interactions? [48.7] 我々は、EgoNCE++という新しい非対称なコントラスト対象をEgoHOIに導入する。
実験の結果,EgoNCE++はオープン語彙HOI認識,マルチインスタンス検索,アクション認識タスクを著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:27:29 GMT)
Pi-DUAL: Using Privileged Information to Distinguish Clean from Noisy Labels [47.9] クリーンなラベルを識別するために特権情報(PI)を利用するアーキテクチャであるPi-DUALを導入する。
Pi-DUALは、主要なPIベンチマークで大幅なパフォーマンス向上を実現し、新しい最先端のテストセットの精度を確立する。
Pi-DUALは、PIを用いた様々な現実シナリオにおけるラベルノイズの影響を軽減するための、シンプルでスケーラブルで実践的なアプローチである。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:15:02 GMT)
Online Merging Optimizers for Boosting Rewards and Mitigating Tax in Alignment [47.7] 大規模言語モデル(LLM)は、事前訓練と監視ファインチューニング(SFT)によって得られる能力の劣化を防止しつつ、人間中心の値と整合するように設計されている。
本稿では、RLHFとSFTモデルパラメータを補間することにより、人間の好みと基本能力のトレードオフを調整し、アライメント税を低減できることを示す。
これはアライメント税を軽減しつつアライメント報酬を大幅に向上させ、14のベンチマークで全体のパフォーマンスを向上する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:53:40 GMT)
S-Eval: Automatic and Adaptive Test Generation for Benchmarking Safety Evaluation of Large Language Models [47.7] 大規模な言語モデルは、その革命的な能力にかなりの注目を集めている。
安全性に関する懸念も高まっている。
S-Evalは,多次元かつオープンな安全評価ベンチマークである。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:31:31 GMT)
On the Emergence of Cross-Task Linearity in the Pretraining-Finetuning Paradigm [47.6] 我々は、共通の事前訓練されたチェックポイントから、クロスタスク線形性(CTL)と呼ばれる異なるタスクに微調整されたモデルにおいて、興味深い線形現象を発見する。
2つの微調整モデルの重みを線形に補間すると、重み補間モデルの特徴は各層における2つの微調整モデルの特徴の線形性にほぼ等しいことが示される。
プレトレーニング-ファインタニングのパラダイムでは、ニューラルネットワークは、パラメータ空間から特徴空間への写像である線形写像として概ね機能する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:44:15 GMT)
CF-OPT: Counterfactual Explanations for Structured Prediction [47.4] ディープニューラルネットワークの最適化レイヤは構造化学習で人気を博し、さまざまなアプリケーションにおける最先端技術の改善に寄与している。
しかし、これらのパイプラインは2つの不透明な層(ディープニューラルネットワークのような非常に非線形な予測モデル)と、通常複雑なブラックボックス解決器である最適化層)で構成されているため、解釈性に欠ける。
我々のゴールは、このような手法の透明性を向上させることであり、対実的な説明を提供することである。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:48:27 GMT)
Knowledge Circuits in Pretrained Transformers [47.3] 現代の大言語モデルが知識をいかに保存するかという内部的な研究は、長い間、研究者の間で激しい関心と調査の対象となっていた。
本稿では,言語モデルのグラフを掘り下げて,特定の知識を明確にするための知識回路を明らかにする。
これらの知識回路に対する現在の知識編集技術の影響を評価し,これらの編集手法の機能や制約についてより深い知見を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:56:33 GMT)
Rethinking Transformers in Solving POMDPs [47.1] 本稿では、部分的に観測可能なマルコフ決定プロセス(POMDP)における一般的なアーキテクチャ、すなわちトランスフォーマーの有効性を精査する。
Transformersがモデル化に苦労する正規言語は、POMDPに再現可能である。
このことはトランスフォーマーがPOMDP固有の帰納バイアスを学習する上で大きな課題となる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:33:17 GMT)
Deep Network Pruning: A Comparative Study on CNNs in Face Recognition [47.1] 顔認識に応用したディープネットワーク圧縮法について検討する。
この方法は、SqueezeNet(1.24Mパラメータ)と人気のあるMobileNetv2(3.5M)とResNet50(23.5M)の3つのネットワーク上でテストされる。
フィルタのかなりの割合は、性能損失を最小限に抑えて取り除くことができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:57:58 GMT)
ViViD: Video Virtual Try-on using Diffusion Models [46.7] Video Virtual try-onは、服のアイテムを対象者のビデオに転送することを目的としている。
これまでのビデオベースの試行錯誤ソリューションは、視力の低い結果とぼやけた結果しか生成できない。
ビデオ仮想トライオンの課題に対処するために,強力な拡散モデルを用いた新しいフレームワークViViDを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:08:09 GMT)
LoRA Training in the NTK Regime has No Spurious Local Minima [46.5] 低ランク適応(LoRA)は,大規模言語モデルのパラメータ効率向上のための標準手法となっている。
理論的には、ニューラルネットワークカーネルシステムにおけるLoRA微調整を$N$のデータポイントで解析する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:05:05 GMT)
Efficient Anomaly Detection with Budget Annotation Using Semi-Supervised Residual Transformer [46.4] 異常検出は、通常、訓練中に通常のサンプルのみが見られ、検出器は飛行中の異常を検出する必要があるため、難しい。
最近提案されたディープラーニングベースのアプローチは、この問題を緩和する可能性があるが、実世界の応用のための産業レベルの異常検知器を得るには、まだまだ長い道のりがある。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:22:53 GMT)
Diff-Plugin: Revitalizing Details for Diffusion-based Low-level Tasks [46.4] 本稿では,複数の低レベルタスクにまたがって,単一の事前学習拡散モデルによる高忠実度結果の生成を可能にする新しいDiffフレームワークを提案する。
具体的には、まず、イメージコンテンツを保存するための拡散過程を導くために、二重分岐設計の軽量なTask-モジュールを提案する。
次に、テキスト命令に基づいて異なるタスクを自動選択できるタスクセレクタを提案し、複数の低レベルタスクを自然言語で示すことで画像を編集できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:34:22 GMT)
FedSAC: Dynamic Submodel Allocation for Collaborative Fairness in Federated Learning [46.3] 協調フェアネスのための動的サブモデルアロケーションを備えた新しいフェデレーション学習フレームワークであるFedSACを提案する。
等価性を理論的に保証したサブモデルアロケーションモジュールを開発する。
3つの公開ベンチマークで行った実験は、FedSACが全てのベースライン法を公平性とモデル精度の両方で上回っていることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:43:29 GMT)
Double Correction Framework for Denoising Recommendation [46.0] 暗黙のフィードバックでは、ノイズの多いサンプルが正確なユーザの好みの学習に影響を与える可能性がある。
一般的なソリューションは、モデルトレーニングフェーズでノイズの多いサンプルをドロップすることに基づいている。
提案手法では,勧告を記述するための二重補正フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:54:22 GMT)
SafeguardGS: 3D Gaussian Primitive Pruning While Avoiding Catastrophic Scene Destruction [45.7] 3DGSは、リアルタイムのレンダリング速度を達成しつつ、トップノッチのレンダリング品質を実証し、新しいビュー合成において大きな進歩を遂げた。
3DGSの準最適デンシフィケーションプロセスから生じるガウス原始体の過多は、フレーム/秒(FPS)を遅くし、かなりのメモリコストを要求するという大きな課題を引き起こす。
まず,3DGSプルーニング手法を2つのタイプに分類する: クロスビュープルーニングとピクセルワイズプルーニングで,プリミティブのランク付け方法が異なる。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:41:36 GMT)
Outlier-robust Kalman Filtering through Generalised Bayes [45.5] 我々は、状態空間モデルにおけるオンラインフィルタリングのための新しい、確実に堅牢でクローズドなベイズ更新ルールを導出する。
提案手法は, より少ない計算コストで, 他の頑健なフィルタリング手法に適合し, 性能が向上する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:03:49 GMT)
Publicly-Detectable Watermarking for Language Models [45.3] LLMの高精度かつ信頼性の高い透かし方式を提案する。
このアルゴリズムは秘密情報を含んでおらず、誰でも実行可能である。
提案手法は, 暗号的に正しい, 音響的, 歪みのないものであることを実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:10:45 GMT)
Publicly-Detectable Watermarking for Language Models [45.3] LLMの高精度かつ信頼性の高い透かし方式を提案する。
このアルゴリズムは秘密情報を含んでおらず、誰でも実行可能である。
提案手法は, 暗号的に正しい, 音響的, 歪みのないものであることを実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:10:45 GMT)
Artificial Intelligence in Industry 4.0: A Review of Integration Challenges for Industrial Systems [45.3] サイバー物理システム(CPS)は、予測保守や生産計画を含むアプリケーションに人工知能(AI)が活用できる膨大なデータセットを生成する。
AIの可能性を実証しているにもかかわらず、製造業のような分野に広く採用されていることは依然として限られている。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:54:41 GMT)
Adam with model exponential moving average is effective for nonconvex optimization [45.2] 本稿では,Adamのような適応最適化アルゴリズムと(II)指数移動平均(EMA)モデルという,大規模かつ複雑なモデルのトレーニングのための2つの現代的な最適化手法に関する理論的解析を行う。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:08:04 GMT)
Quantum information spreading in generalised dual-unitary circuits [45.0] 局所演算子は、二重単位回路のように光速で拡散することを示す。
これらの特性を用いて、回路内の絡み合い膜に対する閉形式表現を求める。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:23:21 GMT)
Hierarchical World Models as Visual Whole-Body Humanoid Controllers [44.7] ヒューマノイドの全身制御は、この問題の高次元の性質と二足歩行形態の固有の不安定性のために困難である。
本稿では,ハイレベルエージェントが実行すべき低レベルエージェントの視覚的観察に基づいてコマンドを生成する階層的世界モデルを提案する。
提案手法は, 56-DoFヒューマノイドを模擬した8つのタスクにおいて, ヒトに広く好まれる動作を合成しながら, 高い性能の制御ポリシーを生成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:57:23 GMT)
Mani-GS: Gaussian Splatting Manipulation with Triangular Mesh [44.6] 本稿では,3DGSを直接自己適応で操作する三角形メッシュを提案する。
提案手法は,高忠実度レンダリングを維持しつつ,大きな変形,局所的な操作,軟体シミュレーションを処理可能である。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:13:21 GMT)
Efficient Time Series Processing for Transformers and State-Space Models through Token Merging [44.3] トークンマージにより、視覚変換器アーキテクチャのスループットが大幅に向上することが示されている。
局所的マージとは、局所的な領域内でトークンを選択的に結合する、ドメイン固有のトークンマージアルゴリズムである。
最近提案されたクロノス基礎モデルでは, わずかな精度劣化のみを伴い, 5400%の加速を実現している。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:28:18 GMT)
Think Before You Act: Decision Transformers with Working Memory [44.2] 決定変換器に基づく意思決定エージェントは、複数のタスクにまたがる一般化能力を示している。
この非効率性は、モデルがトレーニングを通してパラメータの振る舞いを記憶する忘れ現象に起因していると我々は主張する。
ダウンストリームタスクの情報を格納、ブレンド、検索するためのワーキングメモリモジュールを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:03:33 GMT)
Combinatorial Optimization with Policy Adaptation using Latent Space Search [44.1] 本稿では,複雑なNPハード問題を解くために,パフォーマンスアルゴリズムを設計するための新しいアプローチを提案する。
我々の検索戦略は11の標準ベンチマークタスクにおける最先端のアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:22:20 GMT)
SA-GS: Semantic-Aware Gaussian Splatting for Large Scene Reconstruction with Geometry Constrain [43.8] セマンティック・アウェアな3Dガウス・スプラットを用いた細粒度3次元幾何再構成のためのSA-GSという新しい手法を提案する。
我々はSAMやDINOのような大きな視覚モデルに格納された事前情報を利用してセマンティックマスクを生成する。
我々は,新しい確率密度に基づく抽出法を用いて点雲を抽出し,ガウススプラッツを下流タスクに不可欠な点雲に変換する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:57:56 GMT)
STRIDE: A Tool-Assisted LLM Agent Framework for Strategic and Interactive Decision-Making [43.7] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしており、言語能力と推論能力が顕著である。
本稿では,その戦略的意思決定能力を高めるため,メモリと特殊なツールを備えた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:21:19 GMT)
In-Context Learning with Transformers: Softmax Attention Adapts to Function Lipschitzness [43.7] In the role of softmax attention in a ICL setting where each context encodes a regression task。
注意ユニットは、事前学習タスクのランドスケープに適応した最寄りの予測器を実装するために使用するウィンドウを学習する。
また、低ランク線形問題において、注目部は推論の前に適切な部分空間に投影することを学ぶ。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:15:53 GMT)
Do Large Language Models Mirror Cognitive Language Processing? [43.7] 大規模言語モデル(LLM)は、テキスト理解と論理的推論において顕著な能力を示した。
認知科学において、脳認知処理信号は典型的には人間の言語処理を研究するために使用される。
我々はRepresentational similarity Analysis (RSA) を用いて、23個の主要LDMとfMRI信号のアライメントを測定する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:51:15 GMT)
VQ-HPS: Human Pose and Shape Estimation in a Vector-Quantized Latent Space [43.4] この研究は、ヒューマン・ポースと形状推定の問題に対処する新しいパラダイムを導入している。
身体モデルパラメータを予測する代わりに、提案した離散潜在表現を予測することに重点を置いている。
提案モデルであるVQ-HPSはメッシュの離散潜在表現を予測する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:15:38 GMT)
Transfer Learning for Diffusion Models [43.1] 拡散モデルは高品質な合成サンプルを一貫して生成する。
コレクションコストや関連するリスクのため、現実のアプリケーションでは実用的ではありません。
本稿では,従来の微調整法や正規化法とは異なる新しいアプローチであるTransfer Guided Diffusion Process (TGDP)を紹介する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:24:20 GMT)
Expressive Text-to-Image Generation with Rich Text [42.9] フォントスタイル,サイズ,色,フットノートなどのフォーマットをサポートするリッチテキストエディタを提案する。
それぞれの単語の属性をリッチテキストから抽出し、局所的なスタイル制御、明示的なトークン再重み付け、正確な色レンダリング、詳細な領域合成を可能にする。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:37:52 GMT)
Offline-Boosted Actor-Critic: Adaptively Blending Optimal Historical Behaviors in Deep Off-Policy RL [42.6] オフ・ポリティクス強化学習(RL)は、多くの複雑な現実世界のタスクに取り組むことで顕著な成功を収めた。
既存のRLアルゴリズムの多くは、リプレイバッファ内の情報を最大限活用できない。
OBAC(Offline-Boosted Actor-Critic)は、モデルのないオンラインRLフレームワークで、優れたオフラインポリシーをエレガントに識別する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:38:46 GMT)
Microsaccade-inspired Event Camera for Robotics [42.3] 低反応時間と安定したテクスチャを同時に維持できるイベントベース認識システムの設計を行う。
回転するくさびプリズムの幾何学的光学は、追加の回転運動のアルゴリズムによる補償を可能にする。
様々な実世界の実験では、ロボット工学が低レベルと高レベルの両方の視覚タスクに対して知覚を促進する可能性を実証している。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:49:46 GMT)
Automated Multi-level Preference for MLLMs [41.7] 「現在のマルチモーダル大言語モデル(MLLM)は幻覚に苦しむ」
有望な道の1つは、人間からのフィードバック(RLHF)からの強化学習を利用することである。
二項選好(上等、下等)の一般的な実践を再考し、多水準選好を採用する方が2つの利点があることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:54:14 GMT)
In-Context Symmetries: Self-Supervised Learning through Contextual World Models [41.6] 我々は、文脈に注意を払って、異なる変換に不変あるいは同変に適応できる一般的な表現を学ぶことを提案する。
提案するアルゴリズムであるContextual Self-Supervised Learning (ContextSSL)は,すべての変換に等しくなることを学習する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:03:52 GMT)
Adapting Static Fairness to Sequential Decision-Making: Bias Mitigation Strategies towards Equal Long-term Benefit Rate [41.5] 逐次意思決定におけるバイアスに対処するため,Equal Long-term Benefit Rate (ELBERT) という長期公正性の概念を導入する。
ELBERTは、以前の長期公正の概念に見られる時間的差別問題に効果的に対処する。
ELBERT-POは高い有効性を維持しながらバイアスを著しく減少させることを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:55:36 GMT)
Adapting Static Fairness to Sequential Decision-Making: Bias Mitigation Strategies towards Equal Long-term Benefit Rate [41.5] 逐次意思決定におけるバイアスに対処するため,Equal Long-term Benefit Rate (ELBERT) という長期公正性の概念を導入する。
ELBERTは、以前の長期公正の概念に見られる時間的差別問題に効果的に対処する。
ELBERT-POは高い有効性を維持しながらバイアスを著しく減少させることを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:55:36 GMT)
Single-loop Stochastic Algorithms for Difference of Max-Structured Weakly Convex Functions [41.4] 非滑らかな非漸近公正問題のクラスを$min_x[yin Yphi(x, y) - max_zin Zpsix(x, z)]$の形で示す。
本稿では,これらの問題を解く最初の方法であるエンベロープ近似勾配SMAGを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:52:46 GMT)
Modeling Dynamic Topics in Chain-Free Fashion by Evolution-Tracking Contrastive Learning and Unassociated Word Exclusion [41.4] 動的トピックモデルは、シーケンシャルドキュメントにおけるトピックの進化を追跡する。
既存のモデルは反復的なトピックと無関係なトピックの問題に悩まされる。
本稿では,動的トピック間の類似性関係を構築するための,進化追跡型コントラスト学習手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:39:49 GMT)
THE COLOSSEUM: A Benchmark for Evaluating Generalization for Robotic Manipulation [41.2] 我々は,20種類の操作タスクを備えた新しいシミュレーションベンチマークであるThe COLOSSEUMを提案する。
我々は,5つの最先端操作モデルを比較し,これらの摂動因子のうち,成功率が30~50%程度低下していることを明らかにする。
対象物や対象物の色,照明条件の変化が,モデル性能を最も低下させる摂動であることを確認した。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:37:02 GMT)
Seeing the Image: Prioritizing Visual Correlation by Contrastive Alignment [40.6] 視覚言語モデル(VLM)における既存の画像-テキストのモダリティアライメントは、各テキストトークンを自己回帰的に等しく扱う。
我々は、その視覚的相関に基づいて、各テキストトークンに対して異なるコントリビューションを割り当てることを提唱する。
コントラストアライメント(Contrastive ALignment, CAL)は、視覚的に相関したトークンのトレーニングを優先する、シンプルで効果的な再重み付け戦略である。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:44:13 GMT)
More Than Catastrophic Forgetting: Integrating General Capabilities For Domain-Specific LLMs [40.5] 大言語モデル(LLM)がドメイン固有のタスクに微調整された後に、一般的なタスクのパフォーマンスが低下する。
本稿では,一般能力統合(GCI)と呼ばれる,CFを越えたドメイン固有LLMの実適用に向けた課題について述べる。
GCIの目的は、新たに獲得した汎用能力を、新しいドメイン知識と共に保持するだけでなく、両方のスキルセットを結合的に調和して利用して、ドメイン固有のタスクのパフォーマンスを高めることである。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:00:12 GMT)
Double Variance Reduction: A Smoothing Trick for Composite Optimization Problems without First-Order Gradient [40.2] ばらつき低減技術はサンプリングのばらつきを低減し、一階法(FO)とゼロ階法(ZO)の収束率を向上するように設計されている。
複合最適化問題において、ZO法は、ランダム推定から導かれる座標ワイド分散と呼ばれる追加の分散に遭遇する。
本稿では,ZPDVR法とZPDVR法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:27:53 GMT)
Enhancing Emotion Recognition in Conversation through Emotional Cross-Modal Fusion and Inter-class Contrastive Learning [40.1] 会話における感情認識の目的は、文脈情報に基づいて発話の感情カテゴリーを特定することである。
従来のERC法は、クロスモーダル核融合のための単純な接続に依存していた。
本稿では,ベクトル接続に基づくモーダル融合感情予測ネットワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:22:30 GMT)
Faithful Logical Reasoning via Symbolic Chain-of-Thought [39.9] シンボリック表現と論理規則をChain-of-Thoughtプロンプトと統合するフレームワークであるSymbCoTを提案する。
我々は、SymbCoTがCoT法よりも大幅に改善されていることを示す。
これは、論理的推論のために記号表現と規則をCoTに結合する最初の方法である。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:55:33 GMT)
Benchmark Underestimates the Readiness of Multi-lingual Dialogue Agents [39.9] テキスト内学習が多言語TODに取り組むのに十分であることを示す。
我々は、中国語、英語、フランス語、韓国語、ヒンディー語、およびコードミキシングされたヒンディー語に12のドメインを持つ多言語TODデータセットX-RiSAWOZのアプローチを検証した。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:33:13 GMT)
Towards Accurate Binarization of Diffusion Model [39.8] 本稿では,DMの新しい量子化学習手法であるBinaryDMを提案する。
1.1ビットの重みと4ビットのアクティベーション(W1.1A4)により、BinaryDMは7.11 FIDまで低くなり、性能が低下する。
拡散モデルの最初の二項化法として、W1.1A4 BinaryDMは9.3倍のOPと24.8倍のモデルサイズ保存を実現している。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:23:06 GMT)
Why are Visually-Grounded Language Models Bad at Image Classification? [39.8] GPT-4VやLLaVAといった視覚的言語モデル(VLM)を用いて画像分類タスクを再検討する。
既存のプロプライエタリかつパブリックなVLMは、ImageNetのような標準画像分類ベンチマークにおいてCLIPを著しく上回っていることがわかった。
画像分類のための重要な情報は、VLMの潜在空間に符号化されるが、十分なトレーニングデータで効果的に復号化できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:57:06 GMT)
Universal quantum frequency comb measurements by spectral mode-matching [39.6] 本稿では,マルチモード量子光学光源の任意の1ショット計測を行うための最初の一般手法を提案する。
このアプローチでは、メモリ効果を伴う干渉計と解釈できるスペクトルモードマッチングを用いる。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:17:21 GMT)
Spectroscopy and complex-time correlations using minimally entangled typical thermal states [39.6] 最小絡み合った典型的な熱状態を用いた相関器の計算に実践的なアプローチを導入する。
これらの数値的手法がシャストリー・サザーランドモデルの有限温度力学を捉えることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:06 GMT)
Are Image Distributions Indistinguishable to Humans Indistinguishable to Classifiers? [39.3] ニューラルネットワークによってパラメータ化される分類器の視点では、最強拡散モデルは、まだこの目標から程遠い。
我々の総合的な実証研究は、人間とは異なり、分類器は画像のエッジと高周波成分を分類する傾向があることを示唆している。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:25:06 GMT)
On the Origin of Llamas: Model Tree Heritage Recovery [39.1] 本稿では,ニューラルネットワークにおけるモデルツリー発見のためのモデルツリー復元(MoTHer Recovery)の課題を紹介する。
我々の仮説では、モデルウェイトがこの情報を符号化し、ウェイトを考慮すれば、基盤となるツリー構造をデコードすることが課題である。
MoTHerリカバリは、検索エンジンによるインターネットのインデックス化に似た、エキサイティングな長期的アプリケーションを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:51 GMT)
When and How Does In-Distribution Label Help Out-of-Distribution Detection? [38.9] 本稿では,OOD検出におけるIDラベルの影響を理論的に説明するための公式な理解を提供する。
我々は,OODデータからのIDデータの分離性について,グラフ理論を用いて厳密に解析する。
我々は、シミュレーションと実データの両方に経験的な結果を示し、理論的保証を検証し、洞察を補強する。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:34:53 GMT)
MorphGrower: A Synchronized Layer-by-layer Growing Approach for Plausible Neuronal Morphology Generation [38.9] 本稿では,ニューロンの自然成長機構を模倣したMorphGrowerを提案する。
MorphGrowerは層ごとにモルフォロジー層を生成し、その後の各層は以前に生成された構造に条件付けされる。
4つの実世界のデータセットの結果、MorphGrowerはMorphVAEを顕著な差で上回っている。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:10:59 GMT)
PureGen: Universal Data Purification for Train-Time Poison Defense via Generative Model Dynamics [38.5] トレインタイムのデータ中毒攻撃は、トレーニング中に敵対的な例を導入することによって機械学習モデルを脅かす。
本稿では,拡散エネルギーベースモデル (EBM) と Denoising Probabilistic Models (DDPMs) の反復的ランゲヴィンダイナミクスにより実現された変換($Psi(x)$)を用いた普遍的データ浄化手法を提案する。
これらのアプローチは、一般化に最小限の影響で有毒データを浄化する。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:19:26 GMT)
Instruction Backdoor Attacks Against Customized LLMs [37.9] 我々は、信頼できないカスタマイズ LLM と統合されたアプリケーションに対して、最初の命令バックドアアタックを提案する。
私たちの攻撃には、単語レベル、構文レベル、意味レベルという3つのレベルの攻撃が含まれています。
本稿では,2つの防衛戦略を提案し,その効果を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:36:00 GMT)
FairLENS: Assessing Fairness in Law Enforcement Speech Recognition [37.8] 本研究では,異なるモデル間の公平さの相違を検証するための,新しい適応性評価手法を提案する。
我々は1つのオープンソースと11の商用 ASR モデルに対してフェアネスアセスメントを行った。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:10:30 GMT)
Color Shift Estimation-and-Correction for Image Enhancement [37.5] 準最適照明条件下で撮影された画像は、オーバー露光とアンダー露光の両方を含む可能性がある。
現在のアプローチは主に画像の明るさの調整に重点を置いており、これは未露光領域における色調歪みを悪化させる可能性がある。
そこで本研究では,これらの色変化を推定・補正する学習によって,過度露光と過度露光の両方で画像を強化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:45:35 GMT)
C$^{3}$Bench: A Comprehensive Classical Chinese Understanding Benchmark for Large Language Models [37.4] 古典中国語理解(CCU)は、中国の卓越した文化の保存と探索に重要な価値を持っている。
大規模言語モデル(LLM)のCCU機能を評価するための包括的なベンチマークはない。
C$3$benchは、分類、検索、名前付きエンティティ認識、句読点、翻訳を含む5つの主要なCCUタスクに対して50,000のテキストペアで構成されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:23:58 GMT)
Regularized Newton Raphson Inversion for Text-to-Image Diffusion Models [37.4] 拡散反転は、画像とそれを記述したテキストプロンプトを取り込み、画像を生成する雑音消音器を見つけるという問題である。
そこで我々は,この問題を暗黙の方程式の根源として定式化し,効率的な解法を設計する。
我々の解法は、数値解析においてよく知られた手法であるNewton-Raphson (NR) に基づいている。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:28:36 GMT)
Med-Tuning: A New Parameter-Efficient Tuning Framework for Medical Volumetric Segmentation [37.4] 我々は,医療用ボリュームセグメンテーションタスクのためのパラメータ効率チューニング(PET)を実現するために,Med-Tuningという新しいフレームワークを導入した。
本フレームワークは,自然画像上で事前学習したセグメンテーション作業における2次元ベースラインの精度を向上させる。
完全なFTと比較して、Med-Tuningは細調整されたモデルのパラメータを最大4倍に減らし、セグメンテーション性能も向上した。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:28:44 GMT)
TELLER: A Trustworthy Framework for Explainable, Generalizable and Controllable Fake News Detection [37.4] 本稿では,モデルの説明可能性,一般化性,制御性を重視した,信頼に値する偽ニュース検出のための新しいフレームワークを提案する。
これは認知と意思決定システムを統合するデュアルシステムフレームワークによって実現される。
提案手法の有効性と信頼性を実証し,4つのデータセットに対する総合的な評価結果を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:14:34 GMT)
GMTalker: Gaussian Mixture-based Audio-Driven Emotional talking video Portraits [37.1] GMTalkerはガウスの混合合成による感情的な音声画像生成フレームワークである。
具体的には,よりフレキシブルな感情操作を実現するために,連続的かつ不整合な潜在空間を提案する。
また,多種多様な頭部ポーズ,瞬き,眼球運動を生成するために,大規模データセット上で事前訓練された正規化フローベースモーションジェネレータを導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:01:00 GMT)
MicroDreamer: Zero-shot 3D Generation in $\sim$20 Seconds by Score-based Iterative Reconstruction [37.1] そこで本研究では,NFEの削減のために,異なる3次元再構成過程を模倣した効率的かつ汎用的なアルゴリズムであるスコアベース反復再構成(SIR)を導入する。
我々は,様々な3次元表現や3次元生成タスクに適用可能な,MicroDreamerと呼ばれる効率的な手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:42:13 GMT)
Audio Flamingo: A Novel Audio Language Model with Few-Shot Learning and Dialogue Abilities [37.0] 音声を理解するために大きな言語モデル(LLM)を拡張することは、様々な現実世界のアプリケーションにとって非常に重要である。
本稿では,1)強音声理解能力を備えた新しい音声言語モデルであるAudio Flamingoを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:44:53 GMT)
Towards Open Domain Text-Driven Synthesis of Multi-Person Motions [36.7] 我々は、大規模な画像とビデオのデータセットからポーズ情報を推定することで、人間のポーズと動きのデータセットをキュレートする。
本手法は,多種多様なテキストプロンプトから多目的運動列を多種多様な多様性と忠実度で生成する最初の方法である。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:06 GMT)
Efficient Stochastic Approximation of Minimax Excess Risk Optimization [36.7] 我々はMEROを直接対象とする効率的な近似手法を開発した。
最小リスクの推定誤差に起因するバイアスが制御下にあることを示す。
また,各分布から抽出したサンプルの量が異なる場合の現実的シナリオについても検討し,分布依存収束率を導出する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:31:16 GMT)
Training LLMs to Better Self-Debug and Explain Code [36.6] LLMの自己ソース能力を大幅に向上するトレーニングフレームワークを提案する。
コード説明と改良のための高品質なデータセットを収集する自動パイプラインを提案する。
我々は、新しい報酬設計で、成功と失敗の軌跡の両方について、教師付き微調整(SFT)およびさらに強化学習(RL)を行う。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:20:24 GMT)
Transferable Reinforcement Learning via Generalized Occupancy Models [36.5] 一般占有モデル(GOM)は、定常データセットから後継特徴の分布を学習する。
GOMは、報酬関数間の迅速な転送を可能にしながら、複合的なエラーを避ける。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:42:28 GMT)
Adaptive Horizon Actor-Critic for Policy Learning in Contact-Rich Differentiable Simulation [36.3] 本稿では,厳密な力学を回避するためにモデルベース水平線を適応させることにより勾配誤差を低減するFO-MBRLアルゴリズムを提案する。
実験の結果、AHACはMFRLベースラインを上回り、一連の移動タスクで40%以上の報酬を得ることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:28:00 GMT)
Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI [36.2] 視覚的想像力の再構築は、潜在的に革命的なアプリケーションにおいて、より大きな課題をもたらす。
私たちは初めて、視覚画像に関するかなりのデータセット(約6hのスキャン)をコンパイルしました。
我々は、fMRI-to-imageモデルの修正版を訓練し、2つのイマジネーションのモードから画像の再構成が可能であることを実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:03:21 GMT)
Deterministic and statistical calibration of constitutive models from full-field data with parametric physics-informed neural networks [36.1] フルフィールド変位データからモデルキャリブレーションを行うためのパラメトリック物理インフォームドニューラルネットワーク(PINN)について検討した。
PINNの高速評価により、ほぼリアルタイムでキャリブレーションを行うことができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:02:11 GMT)
VeLoRA: Memory Efficient Training using Rank-1 Sub-Token Projections [35.1] 大規模言語モデル(LLM)は、最近、多くの言語処理タスクに対処するための強力なツールとして登場した。
勾配勾配勾配を用いた効率的なモデル収束に必要な重要な成分を同定し,特徴付ける。
この結果から, 微調整と事前学習の両方のための, 安価かつメモリ効率のよいアルゴリズムが得られた。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:23:14 GMT)
BDHT: Generative AI Enables Causality Analysis for Mild Cognitive Impairment [34.6] 軽度認知障害 (MCI) 解析に有効な接続性を推定するために, 階層型トランスフォーマー (BDHT) を用いた脳ディフューザを提案する。
提案手法は,既存手法に比べて精度と頑健性に優れる。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:48:22 GMT)
Personalized Steering of Large Language Models: Versatile Steering Vectors Through Bi-directional Preference Optimization [34.1] 人選好データのアクティベーションから「ステアリングベクトル」を抽出する。
この研究は、双方向の選好最適化によってより効果的なステアリングベクトルを生み出すことができる革新的なアプローチを提案する。
提案手法は, ステアリングベクトルが人間の嗜好データペアの生成確率に直接影響を与えるように設計されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:10:40 GMT)
Text-Free Multi-domain Graph Pre-training: Toward Graph Foundation Models [33.3] テキストフリーなマルチドメイングラフ事前学習・適応フレームワークMDGPTを提案する。
まず、シナジスティックな事前学習のために、ソースドメインにまたがる機能を整列する一連のドメイントークンを提案する。
第2に、統合されたプロンプトと混合プロンプトからなる二重プロンプトを提案し、統合されたマルチドメイン知識でターゲットドメインをさらに適応させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:04:50 GMT)
Fast-PGM: Fast Probabilistic Graphical Model Learning and Inference [33.2] 本稿では,PGM学習と推論のための効率的かつオープンソースのライブラリであるFast-PGMについて述べる。
Fast-PGMは、構造やパラメータ学習、正確で近似的な推論を含む、PGMの包括的なタスクをサポートする。
Fast-PGMはフレキシブルなビルディングブロックを開発者に提供し、学習者に詳細なドキュメントを提供し、非専門家のユーザフレンドリーなインターフェースを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:54:38 GMT)
CHGNN: A Semi-Supervised Contrastive Hypergraph Learning Network [33.2] ハイパーグラフは、ソーシャルネットワークやバイオインフォマティクスといったアプリケーションで見られるデータオブジェクト間の高次関係をモデル化することができる。
ラベル付きおよびラベルなしデータから学習するために,自己教師付きコントラスト学習技術を利用したコントラスト型ハイパーグラフニューラルネットワークCHGNNを提案する。
9つの実データセットの実験結果から、CHGNNの有効性に関する洞察が得られる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:42:06 GMT)
Learning to Reason via Program Generation, Emulation, and Search [33.1] 言語モデル(LM)によるプログラム合成は、多くの推論能力を解放した。
すべての推論タスクは、コードとして容易に表現できるわけではない。例えば、常識的推論、道徳的意思決定、皮肉な理解を含むタスクである。
我々は,プログラム合成スキルをこのようなタスクに拡張するために,コード生成とエミュレートされた実行(CoGEX)を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:28:52 GMT)
Edge-guided and Class-balanced Active Learning for Semantic Segmentation of Aerial Images [32.8] アクティブラーニングはデータアノテーションのコストを削減するための有望な方法である。
従来のALメソッドは、不合理なラベリングユニットとクラス不均衡の無視のために理想的ではない。
提案手法は3つのベンチマークデータセットの最先端手法と比較して11.2%以上のゲインを達成している。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:39:36 GMT)
Gradually Vanishing Gap in Prototypical Network for Unsupervised Domain Adaptation [32.6] プロトタイプネットワーク(GVG-PN)におけるGradually Vanishing Gapという効率的なUDAフレームワークを提案する。
我々のモデルは,グローバルとローカルの両方の観点からの伝達学習を実現する。
いくつかのUDAベンチマークの実験では、提案されたGVG-PNがSOTAモデルより明らかに優れていることが検証された。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:03:32 GMT)
Trustworthy DNN Partition for Blockchain-enabled Digital Twin in Wireless IIoT Networks [32.4] 産業用モノのインターネット(IIoT)ネットワークにおける製造効率を高めるための有望なソリューションとして、Digital twin (DT)が登場した。
本稿では,ディープニューラルネットワーク(DNN)分割技術と評価に基づくコンセンサス機構を用いたブロックチェーン対応DT(B-DT)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:34:12 GMT)
Text Modality Oriented Image Feature Extraction for Detecting Diffusion-based DeepFake [32.2] 拡散ベースのDeepFakesは、オンライン情報の完全性と安全性に重大なリスクをもたらす。
テキストモダリティ指向の特徴抽出手法TOFEを提案する。
10種類の拡散型を対象に実験を行い,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:29:30 GMT)
DeTikZify: Synthesizing Graphics Programs for Scientific Figures and Sketches with TikZ [32.1] DaTikZv2、SketchFig、SciCap++の3つの新しいデータセットを作成します。
私たちは、SciCap++とDaTikZv2でDeTikZifyをトレーニングし、SketchFigから学んだ合成スケッチをトレーニングします。
我々は、TikZプログラムにおいて、DeTikZifyが商業的なClaude 3とGPT-4Vより優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:48:58 GMT)
VoCoT: Unleashing Visually Grounded Multi-Step Reasoning in Large Multi-Modal Models [32.1] 本稿では,LMMを用いた推論に適した多段階の視覚的対象中心連鎖推論フレームワークであるVoCoTを提案する。
VoCoTの特徴は,(1)オブジェクト中心の推論経路,(2)オブジェクト概念を多モードのインターリーブ・アライメントで視覚的に表現する,という2つの特徴である。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:12:45 GMT)
Optimal Multiclass U-Calibration Error and Beyond [32.0] オンラインマルチクラス境界U-キャリブレーションの問題は、予測器がU-キャリブレーション誤差の低いクラスをK$で逐次分布予測することを目的としている。
最適U校正誤差は$Theta(sqrtKT)$である。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:33:18 GMT)
Towards Unified Robustness Against Both Backdoor and Adversarial Attacks [31.8] ディープニューラルネットワーク(DNN)は、バックドアと敵の攻撃の両方に対して脆弱であることが知られている。
本稿では,バックドアと敵の攻撃との間には興味深い関係があることを明らかにする。
バックドアと敵の攻撃を同時に防御する新しいプログレッシブ統一防衛アルゴリズムが提案されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:50:00 GMT)
InterpretCC: Intrinsic User-Centric Interpretability through Global Mixture of Experts [31.7] ニューラルネットワークの解釈性は、3つの重要な要件間のトレードオフである。
本稿では,人間中心の解釈可能性を保証する,解釈可能なニューラルネットワークのファミリであるInterpretCCを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:58:26 GMT)
MSPE: Multi-Scale Patch Embedding Prompts Vision Transformers to Any Resolution [31.6] 本稿では,パッチ埋め込みを最適化することにより,解像度変化に対するモデル適応性を向上させることを提案する。
提案手法はMulti-Scale Patch Embedding (MSPE) と呼ばれ、複数の可変サイズのパッチカーネルに標準パッチを埋め込む。
我々の手法は、他の部品への高コストなトレーニングや修正を必要としないため、ほとんどのViTモデルにも容易に適用できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:50:12 GMT)
MolCRAFT: Structure-Based Drug Design in Continuous Parameter Space [31.5] MolCRAFTは連続パラメータ空間で作動する最初の構造に基づく医薬品設計モデルである。
より安定な3次元構造との結合親和性において、一貫して優れた性能を達成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:48:38 GMT)
Unveiling the Power of Diffusion Features For Personalized Segmentation and Retrieval [31.5] これらのタスクには、教師付き手法に匹敵する結果を示す自己教師付き基礎モデルが導入されている。
これらのモデルは、同じクラス内の他のインスタンスが提示されたときに、望ましいインスタンスを見つけるのに苦労している。
本稿では, PDM for Personalized Features Diffusion Matching という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:13:18 GMT)
Unleashing the Potential of Text-attributed Graphs: Automatic Relation Decomposition via Large Language Models [31.4] RoSE (Relation-oriented Semantic Edge-Decomposition) は、生のテキスト属性を分析してグラフ構造を分解する新しいフレームワークである。
我々のフレームワークは、さまざまなデータセットのノード分類性能を大幅に向上させ、ウィスコンシンデータセットでは最大16%の改善を実現した。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:54:47 GMT)
Improving Linear System Solvers for Hyperparameter Optimisation in Iterative Gaussian Processes [31.3] 本稿では,線形系解法を用いる反復法に着目し,限界次数勾配を推定する。
本稿では,解決者間で適用可能な3つの重要な改善点について論じる。
これらのテクニックは、トレランスの解決時に最大7,2倍のスピードアップを提供し、停止時に平均残留ノルムを最大7,7倍まで下げる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:58:37 GMT)
ReChorus2.0: A Modular and Task-Flexible Recommendation Library [31.3] ReChorusは、レコメンデーション研究者のためのモジュール的でタスクフレキシブルなライブラリである。
ReChorusは、より多くのデータ型でよりレコメンデーションタスクを実現するのに役立つ。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:14:15 GMT)
DecisionHoldem: Safe Depth-Limited Solving With Diverse Opponents for Imperfect-Information Games [31.3] DecisionHoldemは、ディープ・リミテッド・サブゲームによる安全な解法を備えた、ヘッドアップ・ノー・リミット・テキサスホールディングスのためのハイレベルAIだ。
我々は,不完全な情報ゲームにおけるAI開発を促進するために,DecisionHoldemのソースコードとツールをリリースする。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:04:52 GMT)
Yuan 2.0-M32: Mixture of Experts with Attention Router [30.9] Yuan 2.0-M32は、Yuan-2.0 2Bと同様のベースアーキテクチャで、32人のエキスパートと2人のエキスパートが活動する混合専門家アーキテクチャを使用している。
新しいルータネットワークであるAttention Routerが提案され、より効率的な専門家の選択のために採用され、従来のルータネットワークと比較して3.8%の精度が向上する。
Yuan 2.0-M32は、コーディング、数学、および様々な専門分野における競争力を示し、40Bのアクティブパラメータは3.7B、トークン当たり7.4GFlopsで、どちらもLlama3の1/19のみである。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:05:08 GMT)
Semantic are Beacons: A Semantic Perspective for Unveiling Parameter-Efficient Fine-Tuning in Knowledge Learning [30.8] 本稿では,PEFTの知識学習課題における制約の背景にある理由を明らかにするために,意味論的視点を提案する。
PEFTは、モデルを意図した知識ターゲットから遠ざけるという顕著なリスクを提示している。
本研究では,知識学習に有害なデータを排除するためのデータフィルタリング戦略と,意味的距離に注意を向けるための再重み付き学習戦略を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:47:11 GMT)
Warm Start Marginal Likelihood Optimisation for Iterative Gaussian Processes [30.5] 反復ガウス過程に対する限界確率最適化の3レベル階層を導入する。
次に,線形システムソルバの解を次のステップで初期化として再利用することにより,計算の補正を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:22:18 GMT)
Combining Evidence Across Filtrations Using Adjusters [30.0] 本稿では,異なる情報集合(フィルタ)を用いて構築した電子プロセスを同一のnullに対して組み合わせる手法について検討する。
まず、調整器と呼ばれる関数のクラスが、粗いフィルターからより微細なフィルターにEプロセスを持ち上げることができることを証明します。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:03:24 GMT)
Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration [29.9] オフライン強化学習(RL)の事前学習方針を微調整する方法について検討する。
固有報酬としてQ条件状態エントロピー(QCSE)を提案する。
QCSEによる大幅な改善(CQLで約13%、Cal-QLで8%)を観察します。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:57:57 GMT)
Self-Distillation Bridges Distribution Gap in Language Model Fine-Tuning [29.7] SDFT (Self-Distillation Fine-Tuning) は, モデル自体が生成した蒸留データセットを用いて, 分散ギャップを埋める手法である。
様々なベンチマークにおけるLlama-2-chatモデルの実験結果は、SDFTが破滅的な忘れを効果的に軽減することを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:39:17 GMT)
Relaxing Accurate Initialization Constraint for 3D Gaussian Splatting [29.6] 我々は,3次元ガウス平滑化のための正確な初期化制約を導出する RAIN-GS という新しい最適化手法を提案する。
RAIN-GSは、準最適点雲(ランダム点雲など)から3Dガウスを訓練することに成功している。
ランダムポイントクラウドでトレーニングされたRAIN-GSは、正確なSfMポイントクラウドでトレーニングされた3DGSよりも高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:14:16 GMT)
ADR-BC: Adversarial Density Weighted Regression Behavior Cloning [29.1] イミテーションラーニング(IL)法は、まず報酬やQ関数を定式化し、次にこの形の関数を強化学習フレームワーク内で使用して経験則を最適化する。
本稿では,ADR-BCを提案する。
ADR-BCは、一段階の行動クローニングフレームワークとして、多段階のRLフレームワークに関連する累積バイアスを回避する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:59:16 GMT)
One-Step Late Fusion Multi-view Clustering with Compressed Subspace [29.0] 圧縮部分空間を用いたワンステップレイトフュージョンマルチビュークラスタリング(OS-LFMVC-CS)という統合フレームワークを提案する。
コンセンサス部分空間を用いて分割行列を整列し、分割融合を最適化し、融合分割行列を用いて離散ラベルの学習を指導する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:58:59 GMT)
A Hessian-Aware Stochastic Differential Equation for Modelling SGD [29.0] Hessian-Aware Modified Equation (HA-SME) は、対象関数の Hessian 情報をそのドリフトと拡散の両項に組み込む近似 SDE である。
二次的な目的のために、HA-SMEは分布感覚におけるSGDのダイナミクスを正確に回復する最初のSDEモデルであることが証明された。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:11:34 GMT)
Frustratingly Easy Test-Time Adaptation of Vision-Language Models [28.9] エピソードテスト時間適応(TTA)戦略はビジョン・ランゲージ・モデルに適応するための強力な手法として登場した。
本研究では、驚くほど強力なTTA手法が休眠状態にあり、内部に隠されていることを明らかにする。
このアプローチをZERO (TTA with "ゼロ" temperature)と呼びます。
文献で確立された実験的プロトコルに従って、我々のアプローチを徹底的に評価し、ZEROがw.r.t.をはるかに上回っているか、比較していることを示す。
その単純さと比較的無視可能な計算のおかげで、ZEROはこの分野での今後の研究の強力なベースラインとして機能することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:24:47 GMT)
Truthful Dataset Valuation by Pointwise Mutual Information [28.6] 観測データを真に報告することで,データ提供者が常に期待するスコアを最大化することができる新しいデータ評価手法を提案する。
本手法は、適切なスコアリングルールのパラダイムに従って、テストデータセットと評価データセットのポイントワイド相互情報(PMI)を測定する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:04:17 GMT)
DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution [28.6] Low-Rank Adaptation (LoRA) は、ウェイト行列の差分パラメータ予算要件を無視したバイパスフレームワークに依存している。
DoRAは、高ランクのLoRA層を構造化シングルランクコンポーネントに分解し、パラメータ予算の動的プルーニングを可能にする。
実験結果から,LORAやフルモデルファインチューニングと比較して,DoRAの競争性能が向上することが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:35:19 GMT)
LongDocFACTScore: Evaluating the Factuality of Long Document Abstractive Summarisation [28.4] 長文要約の事実整合性を評価するための自動測度の有効性を評価する。
本稿では,文書要約データセットの評価に適した新しい評価フレームワークであるLongDocFACTScoreを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:26:17 GMT)
Can Automatic Metrics Assess High-Quality Translations? [28.4] 現在のメトリクスは、翻訳品質の微妙な違いに敏感であることを示す。
この効果は、品質が高く、代替品間のばらつきが低い場合に最も顕著である。
MQMフレームワークを金の標準として使用することにより、現在のメトリクスが人間によってマークされた誤りのない翻訳を識別する能力を体系的にストレステストする。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:44:02 GMT)
Signal-Plus-Noise Decomposition of Nonlinear Spiked Random Matrix Models [28.0] 本研究では,非線形関数を次数1の雑音行列に応用した非線形スパイクランダム行列モデルについて検討する。
我々は,このモデルに対して信号+雑音分解を行い,信号成分の構造の正確な位相遷移を信号強度の臨界しきい値で同定する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:24:35 GMT)
A Sober Look at LLMs for Material Discovery: Are They Actually Good for Bayesian Optimization Over Molecules? [28.0] 分子空間におけるベイズ最適化を高速化するために,大規模言語モデル(LLM)が実際に有用かどうかを考察する。
実世界の化学問題に対する我々の実験は、LLMが分子上のBOに有用であることを示しているが、それらはドメイン固有のデータで事前訓練されたり微調整された場合に限られる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:59:01 GMT)
Aligning to Thousands of Preferences via System Message Generalization [27.9] 現在の大言語モデル (LLM) のアライメント手法は、LLMを一般大衆の好みに合わせることが最適であると仮定している。
本稿では,ユーザがシステムメッセージ内で最も価値の高いものを指定できる新しいパラダイムを提案する。
私たちはJanusと呼ばれる7B LLMをトレーニングし、ユーザの好みを反映したさまざまな未知のシステムメッセージを追加することで、921プロンプトでそれをテストします。
JanusはMistral 7B Instruct v0.2, GPT-3.5 Turbo, GPT-4に対して75.2%, 72.4%, 66.4%のタイ+ウィン率を達成した。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:06:18 GMT)
Views Can Be Deceiving: Improved SSL Through Feature Space Augmentation [27.6] 本研究では,視覚表現学習における自己監督学習(SSL)に対する刺激的特徴の影響について検討する。
SSLの一般的な拡張は、画像空間における望ましくない不変性を引き起こす可能性があることを示す。
そこで,本研究では,pruningによりエンコーダの後半層を正規化することにより,事前学習中にこれらの表現からスプリアス情報を除去するLateTVGを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:42:13 GMT)
3D Lane Detection from Front or Surround-View using Joint-Modeling & Matching [27.6] 本稿では,Bezier曲線と手法を組み合わせた共同モデリング手法を提案する。
また,3次元サラウンドビューレーン検出研究の探索を目的とした新しい3次元空間についても紹介する。
この革新的な手法は、Openlaneデータセットのフロントビュー3Dレーン検出において、新しいベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:41:48 GMT)
Shifting Attention to Relevance: Towards the Predictive Uncertainty Quantification of Free-Form Large Language Models [27.5] 大規模言語モデル(LLM)は、言語生成と命令の後に有望な結果を示すが、しばしば「ハロシン化」を示す。
我々の研究は単純な冗長性を導入している: 自動回帰テキストのすべてのトークンが、基礎となる意味を等しく表しているわけではない。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:01:04 GMT)
Exploring Activation Patterns of Parameters in Language Models [27.5] モデルパラメータのアクティベーションレベルを評価するための勾配に基づく計量法を提案する。
浅い層のパラメータは密に活性化されるため、パラメータの大部分は出力に大きな影響を与える。
深層層では、活性化パラメータの分布の類似性は経験的データ関連性と正に相関する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:49:54 GMT)
RC-Mixup: A Data Augmentation Strategy against Noisy Data for Regression Tasks [27.2] 本研究では,ノイズの多いデータの存在下での回帰作業におけるロバストなデータ拡張の問題について検討する。
C-Mixupは、レグレッションパフォーマンスを改善するためにラベル距離に基づいてサンプルを混合する、より選択的である。
本稿では,C-Mixupとマルチラウンドロバストな学習手法を密接に統合し,シナジスティックな効果を示すRC-Mixupを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:02:42 GMT)
PTM-VQA: Efficient Video Quality Assessment Leveraging Diverse PreTrained Models from the Wild [27.2] 映像品質評価(VQA)は、映像の知覚品質に影響を与える多くの要因により難しい問題である。
ビデオに対する平均評価スコア(MOS)の注釈付けは高価で時間を要するため、VQAデータセットのスケールが制限される。
PTM-VQAと呼ばれるVQA手法を提案し、PreTrained Modelsを利用して、様々な事前タスクで事前訓練されたモデルから知識を伝達する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:37:29 GMT)
LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding [26.9] ビジュアルグラウンドティングは、ユーザが提供するテキストクエリと、画像内のクエリ固有の領域を結びつける重要なツールである。
LLM-Opticは,Large Language Models (LLMs) を光学レンズとして利用し,既存の視覚的接地モデルを強化する革新的な手法である。
提案手法は,任意の言語入力によって指定された任意のオブジェクトを検出可能な,普遍的な視覚的接地を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:17:56 GMT)
A Unified Temporal Knowledge Graph Reasoning Model Towards Interpolation and Extrapolation [26.8] 時間的知識グラフ(TKG)推論には、推論と外挿推論という2つの設定がある。
本稿では,時間的PAth-based Reasoning (TPAR) モデルを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:13:07 GMT)
Text-only Synthesis for Image Captioning [26.8] 画像キャプション(ToCa)のためのテキストのみの合成法を提案する。
我々は字幕テキストを構造と語彙の単語に分解する。
様々な語彙のパターンを含む大量のキャプションが生成される。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:11:17 GMT)
Fast-FedUL: A Training-Free Federated Unlearning with Provable Skew Resilience [26.6] 我々は、Fast-FedULを紹介した。Fast-FedULは、フェデレートラーニング(FL)のための調整済みの未学習手法である。
訓練されたモデルからターゲットクライアントの影響を体系的に除去するアルゴリズムを開発した。
実験結果から、Fast-FedULはターゲットクライアントのほとんどすべてのトレースを効果的に削除し、未ターゲットクライアントの知識を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:51:38 GMT)
Hypernetwork-Driven Model Fusion for Federated Domain Generalization [26.5] フェデレートラーニング(FL)は、異種データのドメインシフトにおいて大きな課題に直面します。
非線形アグリゲーションにハイパーネットワークを用いた、ハイパーネットワークベースのフェデレート・フュージョン(hFedF)と呼ばれるロバストなフレームワークを提案する。
本手法では,ドメインの一般化を効果的に管理するために,クライアント固有の埋め込みと勾配アライメント手法を用いる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:26:25 GMT)
CriticBench: Benchmarking LLMs for Critique-Correct Reasoning [26.5] CriticBenchは、大規模言語モデルの推論を批判し修正する能力を評価するために設計されたベンチマークである。
生成, 批判, 修正推論における17個のLLMの性能を評価し, 評価した。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:33:27 GMT)
Don't Forget to Connect! Improving RAG with Graph-based Reranking [26.4] 本稿では,グラフニューラルネットワーク(GNN)に基づくリランカであるG-RAGについて紹介する。
提案手法は,文書と意味情報の相互接続(抽象表現平均グラフ)を組み合わせ,RAGの文脈インフォームドローダを提供する。
G-RAGは計算フットプリントを小さくしながら最先端のアプローチより優れている。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:56:46 GMT)
Intuitive Fine-Tuning: Towards Simplifying Alignment into a Single Process [26.2] 直感的ファインチューニング(IFT)を導入し,SFTと優先度最適化をひとつのプロセスに統合する。
IFTは、SFTのシーケンシャルなレシピやいくつかの典型的なPreference Optimizationメソッドと相容れないか、それ以上に優れている。
説明可能なフロズンレイクゲームは、競争政策を得るためのIFTの有効性をさらに検証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:14:58 GMT)
SLMRec: Empowering Small Language Models for Sequential Recommendation [25.9] シーケンシャルレコメンデーションタスクでは、ユーザが対話しそうな次の項目を予測する。
最近の研究は、LCMがシーケンシャルレコメンデーションシステムに与える影響を実証している。
LLM の巨大なサイズのため、現実のプラットフォームに LLM ベースのモデルを適用するのは非効率で実用的ではない。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:12:06 GMT)
XL3M: A Training-free Framework for LLM Length Extension Based on Segment-wise Inference [25.7] 本稿では,XL3Mと命名された効率的な学習自由フレームワークを提案する。これにより,短時間で訓練されたLLMが,それ以上のトレーニングや微調整を行なわずに極めて長いシーケンスを推論できる。
総合的なベンチマークによる評価は、XL3Mの優位性を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:12:35 GMT)
Online Analytic Exemplar-Free Continual Learning with Large Models for Imbalanced Autonomous Driving Task [25.4] 分析自由オンライン連続学習(AEF-OCL)を提案する。
AEF-OCLは解析的連続学習原理を活用し、大きなバックボーンネットワークによって抽出された特徴の分類器としてリッジ回帰を用いる。
実験結果から, 自動走行SODA10Mデータセットにおいて, 提案手法は, 既往の戦略であるにもかかわらず, 様々な手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:19:15 GMT)
QUEST: Quality-Aware Metropolis-Hastings Sampling for Machine Translation [25.2] 本稿では,ギブス分布のエネルギー関数として,ノイズ品質推定の過度な信頼を回避するための簡易かつ効果的な手法を提案する。
分布のモードを探す代わりに、メトロポリス・ハスティングスアルゴリズムを用いて高密度領域から複数のサンプルを生成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:36:06 GMT)
Recent Trends in Personalized Dialogue Generation: A Review of Datasets, Methodologies, and Evaluations [25.1] 本稿では,近年の対話生成のパーソナライズ化の状況について調査する。
22のデータセットをカバーし、ベンチマークデータセットと、追加機能に富んだ新しいデータセットを強調します。
2021年から2023年の間、トップカンファレンスから17のセミナー作品を分析し、5つの異なるタイプの問題を識別する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:04:13 GMT)
Understanding Transformer Reasoning Capabilities via Graph Algorithms [25.1] 我々は、トランスフォーマースケーリングレギュレーションがアルゴリズムの様々なクラスを完璧に解けるかを検討する。
その結果、トランスフォーマーは多くのグラフ推論タスクで優れており、特殊なグラフニューラルネットワークよりも優れています。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:31:14 GMT)
Proof of Quality: A Costless Paradigm for Trustless Generative AI Model Inference on Blockchains [24.9] 生成AIモデルは、自然言語や画像タスクにおいて強力で破壊的な能力を示している。
これらのモデルを分散環境で展開することは 依然として困難です
ブロックチェーンアーキテクチャ上に任意の大規模な生成モデルをデプロイ可能にするために,Emphproof of Quality(PoQ)と呼ばれる新たな推論パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:00:54 GMT)
Game Theory in Distributed Systems Security: Foundations, Challenges, and Future Directions [24.8] 重要なインフラストラクチャシステムやパーソナルコンピューティングシステムの多くは、分散コンピューティングシステム構造を持っています。
分散システムのセキュリティとゲーム理論の技術コミュニティが集まって、この課題に効果的に取り組むことができる。
この記事は、2022年のSF SaTC PI 会議でコミュニティの議論を通じて考案された。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:15:18 GMT)
Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning [24.7] Instruct-MusicGenは、事前訓練されたMusicGenモデルを微調整して、効率的に編集命令に従う新しいアプローチである。
注目すべきは、Instruct-MusicGenはオリジナルのMusicGenモデルに8%新しいパラメータを導入し、5Kステップでのみ列車を走らせることだ。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:27:20 GMT)
MusicMagus: Zero-Shot Text-to-Music Editing via Diffusion Models [24.6] 本稿では,テキスト・ツー・ミュージック・モデルによって生成される音楽の編集に対する新しいアプローチを提案する。
本手法は,テキスト編集をテキストテンプレート空間操作に変換するとともに,一貫性を強制する余分な制約を加える。
実験により, ゼロショットと特定の教師付きベースラインの双方に対して, スタイルおよび音色伝達評価において優れた性能を示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:47:25 GMT)
Position: Foundation Agents as the Paradigm Shift for Decision Making [24.6] 我々は,エージェントの学習パラダイムの変革的変化として,基礎エージェントの構築を提唱する。
我々は,大規模な対話型データ収集や生成から自己指導型事前学習,適応に至るまで,基礎エージェントのロードマップを定めている。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:00:14 GMT)
Large Scale Knowledge Washing [24.5] 大規模な言語モデルは、世界の知識を記憶する素晴らしい能力を示している。
本稿では,大規模な知識洗浄の問題を紹介し,膨大な事実知識の学習に焦点をあてる。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:48:12 GMT)
One for All: Toward Unified Foundation Models for Earth Vision [24.4] 現在のリモートセンシング基礎モデルは、単一のモダリティまたは特定の空間解像度範囲に特化している。
空間解像度の異なる複数のデータモダリティに対して,単一の共有トランスフォーマーバックボーンを用いるOFA-Netを導入する。
提案手法は,12の異なる下流タスクに対して評価し,有望な性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:47:35 GMT)
Transformer-Powered Surrogates Close the ICF Simulation-Experiment Gap with Extremely Limited Data [24.2] 本稿では,マルチモーダル出力シナリオにおける予測精度向上のためのトランスフォーマーを用いた新しい手法を提案する。
提案手法はトランスフォーマーアーキテクチャと新しいグラフベースのハイパーパラメータ最適化手法を統合する。
実世界のデータ10枚しか入手できない慣性閉じ込め核融合実験へのアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:22:53 GMT)
MetaEarth: A Generative Foundation Model for Global-Scale Remote Sensing Image Generation [24.2] 生成基盤モデルであるMetaEarthについて,画像生成をグローバルなレベルに拡大することで障壁を破る。
MetaEarthでは,地理的解像度の広い任意の領域で画像を生成するための自己カスケード型自己カスケード生成フレームワークを提案する。
我々のモデルは、革新的なオーバヘッドの観点から地球視覚をシミュレートすることで、生成的世界モデルを構築する新たな可能性を開く。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:27:23 GMT)
AutoDIR: Automatic All-in-One Image Restoration with Latent Diffusion [24.2] 本稿では,潜伏拡散を取り入れた画期的なオールインワン画像復元システムAutoDIRを提案する。
AutoDIRは、未知の劣化に苦しむ画像を自動的に識別し、復元する能力に優れています。
AutoDIRは直感的なオープン語彙の画像編集を提供し、ユーザーは好みに応じて画像をカスタマイズし、拡張することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:10:39 GMT)
PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models [23.9] 主特異値と特異ベクトル適応(PiSSA)を導入する。
PiSSAはLoRAと同じアーキテクチャを共有しているが、アダプタ行列を$A$と$B$で初期化し、元の行列の主成分は$W$である。
LoRAと比較すると、PiSSAは主コンポーネントを更新し、"残留"部分を凍結することで、より高速な収束と性能の向上を実現している。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:19:33 GMT)
LoRA-Switch: Boosting the Efficiency of Dynamic LLM Adapters via System-Algorithm Co-design [23.9] 動的アダプタのきめ細かいコストを分析し、断片化されたカーネル呼び出しが根本原因であることを確かめる。
レイヤワイドまたはブロックワイドな動的ルーティングを採用する既存の動的構造とは異なり、LoRA-Switchはトークンワイドなルーティング機構を導入している。
効率を上げるために、このスイッチングは最適化されたカーネルで実装され、同時にすべてのLoRAアダプタの操作を融合させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:53:26 GMT)
MODL: Multilearner Online Deep Learning [23.9] 既存の作業はほとんど、純粋なディープラーニングソリューションの探索に重点を置いています。
我々は,ハイブリッドマルチラーナーアプローチに基づく,異なるパラダイムを提案する。
提案手法は,一般的なオンライン学習データセットにおいて,最先端の学習結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:34:33 GMT)
MF-AED-AEC: Speech Emotion Recognition by Leveraging Multimodal Fusion, Asr Error Detection, and Asr Error Correction [23.8] 本稿では,モダリティ間の共有表現を学習するための新しいマルチモーダル融合法を提案する。
実験の結果、MF-AED-AECはベースラインモデルよりも4.1%優れていた。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:47:15 GMT)
REPARO: Compositional 3D Assets Generation with Differentiable 3D Layout Alignment [23.7] 単一画像からの合成3Dアセット生成のための新しいアプローチであるREPAROを提案する。
まず、シーンから個々のオブジェクトを抽出し、オフザシェルフ画像から3Dモデルを使用して、それらの3Dメッシュを再構築する。
次に、異なるレンダリング技術によってこれらのメッシュのレイアウトを最適化し、コヒーレントなシーン構成を保証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:45:10 GMT)
Vamos: Versatile Action Models for Video Understanding [23.6] 「多元的行動モデル(Vamos)は、大言語モデルを利用した学習フレームワークである。」
Ego4D,NeXT-QA,Intent EgoQA,EgoQAの4つの相補的ビデオ理解ベンチマークでVamosを評価する。
テキストベースの表現は、すべてのベンチマークで一貫して競合性能を達成し、視覚的な埋め込みは、性能改善に限界があるか、あるいは、ないかを観察する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:18:06 GMT)
Graph Convolutions Enrich the Self-Attention in Transformers! [23.5] 本稿では,グラフフィルタに基づく自己注意法(GFSA)を提案する。
GFSAはコンピュータビジョン,自然言語処理,グラフ回帰,音声認識,コード分類など,様々な分野におけるトランスフォーマーの性能向上を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:46:51 GMT)
Hyperspectral and multispectral image fusion with arbitrary resolution through self-supervised representations [23.0] 高分解能マルチスペクトル像(HR-MSI)と低分解能ハイパースペクトル像の融合は、HSI超解像(SR)の実現に有効な手法として浮上している。
従来の研究は主に、潜時高分解能高スペクトル像(HR-HSI)の後方分布の推定に集中していた。
本稿では,2つのニューラル表現を行列因子化に組み込むことにより,新しい連続低ランク因子化(CLoRF)を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:29:23 GMT)
ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator [22.8] 大言語モデル(LLM)は、知識集約的な質問に直面する幻覚の緩和において、検索の増強から多くの恩恵を受けていることが証明されている。
Retrieval-augmented Generation (RAG) は、意味関連文書をジェネレータの入力コンテキストとして利用するIRベースの手法を採用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:18:50 GMT)
Detection-Correction Structure via General Language Model for Grammatical Error Correction [22.6] 本稿では,汎用言語モデル(GLM)に基づく,DeCoGLMという統合された検出補正構造を提案する。
検出フェーズはフォールトトレラント検出テンプレートを使用し、補正フェーズは自己回帰マスクの埋め込みを利用して局所的な誤り訂正を行う。
我々のモデルは、英語と中国語のECデータセットの最先端モデルと競合する性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:04:40 GMT)
FlashST: A Simple and Universal Prompt-Tuning Framework for Traffic Prediction [22.3] FlashSTは、トレーニング済みのモデルに適応して、さまざまなデータセットの特定の特性を一般化するフレームワークである。
事前トレーニングとダウンストリームデータのシフトを捉え、さまざまなシナリオへの効果的な適応を促進する。
実証的な評価は、さまざまなシナリオにおけるFlashSTの有効性を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:18:52 GMT)
STEER: Assessing the Economic Rationality of Large Language Models [21.9] LLMを意思決定「エージェント」として使うことへの関心が高まっている
LLMエージェントが信頼できるかどうかを決定するには、そのようなエージェントの経済的合理性を評価するための方法論が必要である。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:27:56 GMT)
An Item is Worth a Prompt: Versatile Image Editing with Disentangled Control [21.6] D-Editは、包括的な画像-プロンプトインタラクションをいくつかのアイテム-プロンプトインタラクションに切り離すためのフレームワークである。
クロスアテンション層が歪んだ事前学習拡散モデルに基づいており、アイテム・プロンプト・アソシエーションを構築するために2段階の最適化を採用している。
画像ベース,テキストベース,マスクベースの編集,アイテム削除を含む4種類の編集作業において,最先端の結果を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:34:21 GMT)
DeepHGCN: Recipe for Efficient and Scalable Deep Hyperbolic Graph Convolutional Networks [21.6] 我々は,計算効率を劇的に改善し,オーバ・スムーシング効果を大幅に緩和した,最初の深層HGCNアーキテクチャであるDeepHGCNを提案する。
DeepHGCNは、ユークリッドと浅い双曲GCNの変種と比較して、リンク予測とノード分類タスクにおいて大幅に改善されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:13:34 GMT)
Flow-Assisted Motion Learning Network for Weakly-Supervised Group Activity Recognition [21.5] Weakly-Supervised Group Activity Recognition (WSGAR) は、ビデオレベルラベルを持つ個人とアクターレベルラベルを持たない個人のグループが一緒に行う活動を理解することを目的としている。
本稿では、アクターの特徴を抽出する動き認識エンコーダからなるWSGARのためのフロー支援運動学習ネットワーク(Flaming-Net)を提案する。
我々は、NBAデータセットの2.8%のMPCAスコアを含む2つのベンチマークで、Flaming-Netが最先端のWSGARの結果を新たに発表した。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:53:47 GMT)
Pursuing Feature Separation based on Neural Collapse for Out-of-Distribution Detection [21.4] オープンな世界では、ラベルが分布内(ID)サンプルと相容れないOOD(out-of-distriion)データを検出することは、信頼できるディープニューラルネットワーク(DNN)にとって重要である。
我々はOrthLossと呼ばれるシンプルだが効果的な損失を提案し、これはサブ空間内のOODデータの特徴をNCによって形成されたID特徴の主部分空間に結合する。
我々の検出は、追加のデータ拡張やサンプリングなしに、CIFARベンチマーク上でのSOTA性能を達成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:24:38 GMT)
Efficiently Parameterized Neural Metriplectic Systems [21.2] 提案手法は、状態の大きさと緯度データのランクの両方で2次的にスケールする。
メトロトレクティックシステムは、状態の大きさとメトロトレクティックデータのランクの両方で二次的にスケールする方法でデータから学習される。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:42:38 GMT)
Resisting Stochastic Risks in Diffusion Planners with the Trajectory Aggregation Tree [20.9] トラジェクトリー・アグリゲーション・ツリー(TAT)は、歴史的および現在のトラジェクトリーに基づく動的ツリーのような構造である。
TATは、拡散プランナーの元々のトレーニングやサンプリングパイプラインを変更することなく、デプロイできる。
以上の結果から,信頼できない軌道からのリスクに抵抗し,100ドル以上の作業で拡散プランナーの性能向上を保証し,試料品質に対する許容許容限界を示し,3倍以上の加速で計画が可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:57:22 GMT)
Public Technologies Transforming Work of the Public and the Public Sector [20.8] われわれはOneStopというデジタルプラットフォームに注力している。
OneStopは、さまざまなステップとサービスを、公共セクターの従業員と一般市民とのオンライン接触の単一ポイントに統合することを目指している。
我々はOneStopの採用によって引き起こされる多面的視点と経験を観察する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:54:31 GMT)
Boosting Protein Language Models with Negative Sample Mining [20.7] 本稿では,タンパク質表現学習分野における大規模言語モデル向上のための先駆的手法を提案する。
私たちの主な貢献は、共進化の知識への過度な信頼を関連付けるための洗練プロセスにあります。
本手法は,この新たなアプローチを活かして,注目スコア空間内でのトランスフォーマーベースモデルのトレーニングを支援する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:24:20 GMT)
BBox-Adapter: Lightweight Adapting for Black-Box Large Language Models [20.4] BBox-Adapterは、ブラックボックス大言語モデル(LLM)用の軽量アダプタである。
ターゲットデータを正、ソースデータを負として扱うことにより、ターゲットとソースのドメインデータを区別する。
様々なタスクとドメインでモデル性能を最大6.77%向上させ、トレーニングコストと推論コストをそれぞれ31.30倍と1.84倍に削減する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:04:45 GMT)
SwapMoE: Serving Off-the-shelf MoE-based Language Models with Tunable Memory Budget [20.3] 我々は,学習可能なメモリ予算を備えたMoEベースの大規模言語モデルの効率的な機能を実現するためのフレームワークであるSwapMoEを紹介する。
SwapMoEは適切な精度を維持しながらメモリフットプリントを削減できることが実験で示されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:08:30 GMT)
Subgraphormer: Unifying Subgraph GNNs and Graph Transformers via Graph Products [20.3] 本稿では,Subgraphormerを注目と位置エンコーディングと統合するアーキテクチャを提案する。
本結果は,幅広いデータセット上で,Subgraph GNNとGraph Transformerの双方に対して,大幅な性能向上を示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:18:34 GMT)
SCE-MAE: Selective Correspondence Enhancement with Masked Autoencoder for Self-Supervised Landmark Estimation [20.3] 自己監督的ランドマーク推定は、局所的な特徴表現の形成を要求する困難なタスクである。
本稿では,高価なハイパーカラムではなく,バニラ特徴マップ上で動作するフレームワークであるSCE-MAEを紹介する。
我々は,SCE-MAEが高効率で頑健であり,既存のSOTA法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:14:10 GMT)
Bridging Mini-Batch and Asymptotic Analysis in Contrastive Learning: From InfoNCE to Kernel-Based Losses [20.3] 異なるコントラスト学習(CL)の損失は、実際には最適化されているのでしょうか?
DHEL(Decoupled Hyperspherical Energy Loss)を新たに導入する。
我々は、カーネルコントラスト学習(KCL)という別の関連するCLファミリに対して、期待される損失がバッチサイズに依存しないことの利点として、同じ結果が得られたことを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:00:41 GMT)
Angry Men, Sad Women: Large Language Models Reflect Gendered Stereotypes in Emotion Attribution [20.2] 本研究は,感情がジェンダー化されているか,社会的ステレオタイプに基づくのかを考察する。
すべてのモデルは、ジェンダーステレオタイプの影響を受けながら、一貫して性的な感情を示す。
私たちの研究は、言語、性別、感情の間の複雑な社会的相互作用に光を当てています。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:43:52 GMT)
Deform3DGS: Flexible Deformation for Fast Surgical Scene Reconstruction with Gaussian Splatting [20.1] 内視鏡下手術における変形性組織に対する新しい高速再建フレームワークであるDeform3DGSを提案する。
また,組織変形力学を学習するためのフレキシブルな変形モデリング手法 (FDM) を提案する。
我々のFDMは、効率的な表現で表面の変形をモデル化することができ、リアルタイムなレンダリング性能を実現することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:14:57 GMT)
An Information Theoretic Metric for Evaluating Unlearning Models [20.1] マシン・アンラーニング(MU)は、トレーニングされたモデルからデータのサンプルを忘れることによるプライバシー問題に対処する。
相互情報を用いた中間特徴量におけるデータサンプルを忘れる際の残余情報を定量化する指標を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:57:01 GMT)
Hierarchical Action Recognition: A Contrastive Video-Language Approach with Hierarchical Interactions [19.7] 階層型音声認識の新しい課題を定式化し,階層型認識に適したビデオ言語学習フレームワークを提案する。
具体的には,階層的カテゴリ間の依存関係を符号化し,認識予測にトップダウン制約を適用した。
階層認識に対するアプローチの有効性を実証し,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:17:22 GMT)
Rethinking Pruning for Backdoor Mitigation: An Optimization Perspective [19.6] バックドアモデルの修復に,グラフニューラルネットワーク(GNN)と強化学習(RL)を併用したONP(Optimized Neuron Pruning)法を提案する。
少量のクリーンデータにより、ONPは、無視可能な性能劣化を犠牲にして、バックドアアタックによって埋め込まれたバックドアニューロンを効果的にプルークすることができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:59:06 GMT)
IAPT: Instruction-Aware Prompt Tuning for Large Language Models [19.4] ソフトトークンを4つしか必要としない新しいプロンプトチューニング手法である命令認識型プロンプトチューニング(IAPT)を提案する。
まず,各トランスフォーマー層にパラメータ効率の良いソフトプロンプト生成器を設置し,各入力命令に対して慣用的なソフトプロンプトを生成する。
第2に、ソフトプロンプトジェネレータは、自己アテンションプーリング操作、2つのリニアプロジェクション、およびアクティベーション関数からなるボトルネックアーキテクチャを持つモジュールである。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:11:01 GMT)
Quantum Pufferfish Privacy: A Flexible Privacy Framework for Quantum Systems [19.3] 量子フグプライバシ(QPP)と呼ばれる量子システムのための多用途プライバシフレームワークを提案する。
古典的なフグのプライバシーにインスパイアされた私たちの定式化は、量子微分プライバシーの限界を一般化し対処します。
ここでは,QPPはダッタ・レディツキー情報スペクトルのばらつきの観点から等価に定式化可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:08:52 GMT)
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning [19.2] Generative Trajectory Augmentation (GTA) は、トラジェクトリを高次かつ動的に検証可能なように拡張することで、オフラインデータを豊かにするように設計されている。
以上の結果から,GTAは汎用データ拡張戦略として,高密度かつ疎度な報酬設定において,広く使われているオフラインRLアルゴリズムの性能を向上させることが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:00:08 GMT)
MAVIN: Multi-Action Video Generation with Diffusion Models via Transition Video Infilling [19.0] MAVINは、2つの動画をシームレスに接続し、結合的な統合シーケンスを形成するトランジションビデオを生成するように設計されている。
従来の品質基準を補完し,時間的コヒーレンスと滑らかさを評価するための新しい指標CLIP-RS(CLIP Relative Smoothness)を導入する。
馬とトラのシナリオに関する実験結果は、滑らかでコヒーレントなビデオ遷移を生成するMAVINの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:46:09 GMT)
A Survey on Modern Code Review: Progresses, Challenges and Opportunities [18.9] 現代のコードレビュー(MCR)は、ソフトウェア品質保証の重要なプラクティスとみなされている。
その重要性にもかかわらず、MCRは実践者にとって複雑で時間を要する活動であることが多い。
本稿では,過去数年間の体系的な文献レビューを行う。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:20:38 GMT)
Single Mesh Diffusion Models with Field Latents for Texture Generation [18.8] 本稿では,3次元形状の表面に直接作用する固有潜在拡散モデルを提案する。
私たちは、メッシュ上の特定のテクスチャのバリエーションを生成するために、モデルがトレーニングされる、単一テクスチャ・メシュのパラダイムを考えています。
我々のモデルは、インペイントやラベル誘導生成などのユーザ制御編集タスクにも適応できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:05:49 GMT)
SpecTra: Enhancing the Code Translation Ability of Language Models by Generating Multi-Modal Specifications [18.6] SpecTraは、新しい自己整合フィルタを使用して、高品質な不変量、テストケース、自然言語記述を生成するマルチステージアプローチである。
SpecTraを2つのコード変換タスク(C to Rust,C to Go)で評価し、これらのタスクで一般的な4つのLLMのパフォーマンスを最大10%向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:48:30 GMT)
DMT-JEPA: Discriminative Masked Targets for Joint-Embedding Predictive Architecture [18.6] 我々はJEPAに根ざした新しいマスク付きモデリング対象であるDMT-JEPAを紹介する。
我々は、セマンティックに類似した隣接パッチのセットを、マスクされたパッチのターゲットとみなす。
DMT-JEPAは強力な差別力を示し、下流の様々なタスクに利益をもたらす。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:28:52 GMT)
DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime [18.4] 強化学習(Reinforcement Learning, RL)は、個人化医療における動的治療体制(DTR)を最適化する可能性の認知度を高めている。
多様な医療シナリオをシミュレートするベンチマークプラットフォームであるtextitDTR-Benchを紹介した。
我々はこれらの設定の様々な最先端のRLアルゴリズムを評価し、特に実世界の課題の中でその性能を強調した。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:40:00 GMT)
Revisiting the Message Passing in Heterophilous Graph Neural Networks [18.4] 本稿では、異種グラフニューラルネットワークにおけるメッセージパッシング機構を再検討し、それらを統一異種メッセージパッシング(HTMP)機構に再構成する。
既存のHTGNNにおけるメッセージパッシングの成功は,クラス間の互換性行列を暗黙的に強化することに起因することを示す。
我々はCMGNNという新しいアプローチを導入し、HTMPメカニズム内で機能し、互換性行列を明示的に活用し改善する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:47:53 GMT)
Reliable Object Tracking by Multimodal Hybrid Feature Extraction and Transformer-Based Fusion [18.1] 本稿では,信頼度の高い単一オブジェクト追跡にフレームイベントベースのデータを利用する新しいマルチモーダルハイブリッドトラッカー(MMHT)を提案する。
MMHTモデルは、人工ニューラルネットワーク(ANN)とスパイクニューラルネットワーク(SNN)からなるハイブリッドバックボーンを使用して、異なる視覚モードから支配的な特徴を抽出する。
MMHTモデルは,他の最先端手法と比較して,競争性能を示すことを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:24:56 GMT)
SoundCTM: Uniting Score-based and Consistency Models for Text-to-Sound Generation [18.1] 我々はSoundCTM(Sound Consistency Trajectory Models)を紹介する。
提案モデルは,高品位1段音生成と高品位1段音生成との柔軟な遷移を可能にする。
SoundCTMは、余分なオフザシェルフネットワークを使わずに、有望な1ステップと複数ステップのリアルタイムサウンド生成を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:14:52 GMT)
Mutimodal Ranking Optimization for Heterogeneous Face Re-identification [18.0] 不均一な顔の再識別、すなわち、不規則な可視光(VIS)と近赤外線(NIR)カメラをまたいだ異種顔のマッチングは、ビデオ監視アプリケーションにおいて重要な問題となっている。
この問題を解決するために,不均一顔再同定のための多モード融合ランキング最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:40:24 GMT)
CARL: A Framework for Equivariant Image Registration [18.0] 画像登録は、一対の画像間の空間対応を推定する。
形式的には、推定子は所望の画像変換のクラスに同値であるべきである。
本稿では,多段階$[W,U]$等分散を座標アテンション機構と変位予測層を併用して実現する方法を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:44:15 GMT)
SkinCAP: A Multi-modal Dermatology Dataset Annotated with Rich Medical Captions [17.8] SkinCAPは、Fitzpatrick 17k皮膚疾患データセットとDiverse Dermatology Imagesデータセットからソースされた4,000の画像で構成されている。
特に、SkinCAPは世界初のそのようなデータセットであり、https://huggingface.co/datasets/joshuachou/SkinCAPで公開されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:48:23 GMT)
Conv-CoA: Improving Open-domain Question Answering in Large Language Models via Conversational Chain-of-Action [17.6] オープンドメイン会話質問回答(OCQA)のための会話連鎖(Conv-CoA)フレームワークを提案する。
文献と比較して、Conv-CoAは、(i)リアルタイムやドメイン事実と矛盾しない不誠実な幻覚、(ii)会話シナリオにおける弱い推論性能、(iii)会話情報検索における不満足なパフォーマンスの3つの主要な課題に対処する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:46:52 GMT)
On the Sequence Evaluation based on Stochastic Processes [17.5] 本稿では,テキストエンコーダの訓練目標について紹介し,長文評価のためのより徹底的な測定(スコア)を設計する。
提案したトレーニング目的はシーケンスコヒーレンスを効果的に保存し,新しいスコアは時間的および空間的両方の依存関係を包括的にキャプチャする。
実験の結果,異なる長さの文書間の大域的および局所的な識別を含む,様々なシーケンス評価タスクにおいて,優れた性能を示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:33:38 GMT)
SleepFM: Multi-modal Representation Learning for Sleep Across Brain Activity, ECG and Respiratory Signals [17.4] 睡眠は、脳、心臓、呼吸活動を記録する様々なモードを通して評価される複雑な生理的過程である。
睡眠分析のための最初のマルチモーダル基礎モデルであるSleepFMを開発した。
コントラスト学習のための新しい一対一アプローチにより、下流タスク性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:43:53 GMT)
BlueSWAT: A Lightweight State-Aware Security Framework for Bluetooth Low Energy [17.3] Bluetooth Low Energy (BLE)は、リソース制約されたIoTデバイスのための短距離無線通信技術である。
個別に検査すると、攻撃シーケンスの各ステップが合法であるため、セッションベースの攻撃は防御が難しい。
我々は、BLEデバイスを保護するための軽量な状態認識セキュリティフレームワークであるBlueSWATを紹介する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:19:52 GMT)
AdAdaGrad: Adaptive Batch Size Schemes for Adaptive Gradient Methods [17.0] 本稿では,AdAdaGradのスカラー変種AdAdaGradNormについて紹介する。
また,画像分類実験を行い,提案手法のメリットを強調した。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:40:38 GMT)
Diffusion Model Patching via Mixture-of-Prompts [17.0] 拡散モデルパッチング(DMP)は,事前学習した拡散モデルの性能を高めるための単純な手法である。
DMPは、オリジナルのモデルを凍結したまま、モデルの入力空間に小さな学習可能なプロンプトを挿入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:47:54 GMT)
Optimized Layerwise Approximation for Efficient Private Inference on Fully Homomorphic Encryption [17.0] 本研究では、プライバシー保護型ディープニューラルネットワークのための最適化レイヤワイド近似(OLA)フレームワークを提案する。
効率的な近似のために、各アクティベーション関数の実際の入力分布を考慮し、階層的精度を反映する。
その結果、OLA法はResNet-20モデルとResNet-32モデルの推論時間をそれぞれ3.02倍と2.82倍に削減した。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:02:26 GMT)
Learning Locally Interacting Discrete Dynamical Systems: Towards Data-Efficient and Scalable Prediction [17.0] 局所力学系は局所的、比較的単純で、しばしば動的要素間の相互作用から複雑な大域的ダイナミクスを示す。
本稿では,Attentive Recurrent Cellular Automata(AR-NCA)を提案する。
AR-NCAは様々なシステム構成において優れた一般化性を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:53:07 GMT)
Recurrent Natural Policy Gradient for POMDPs [16.9] 本稿では、部分的に観測可能なマルコフ決定過程に対するリカレントニューラルネットワーク(RNN)に基づく自然ポリシー勾配法を提案する。
本分析では,要求されるネットワーク幅とサンプルの複雑さに明確な境界を持つ短期記憶の問題に対して,RNNの効率性を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:29:31 GMT)
MixDQ: Memory-Efficient Few-Step Text-to-Image Diffusion Models with Metric-Decoupled Mixed Precision Quantization [16.8] 最近の数ステップの拡散モデルでは、デノナイジングステップを減らして推論時間を短縮している。
Post Training Quantization (PTQ)は、高ビット幅のFP表現を低ビット整数値に置き換える。
しかし、数ステップの拡散モデルに適用する場合、既存の量子化法は画質とテキストアライメントの両方を維持する上で困難に直面している。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:50:58 GMT)
Mollification Effects of Policy Gradient Methods [16.6] 政策勾配法が非滑らかな最適化環境をどう動員するかを理解するための厳密な枠組みを開発する。
政策勾配法と逆熱方程式の解法との等価性を実証する。
我々は、この制限と調和解析における不確実性原理の関連性を、RLにおける政策による探索の効果を理解するために作成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:05:33 GMT)
Variational DAG Estimation via State Augmentation With Stochastic Permutations [16.6] ベイズネットワークの構造を観測データから推定することは統計的かつ計算的に難しい問題である。
確率的推論の観点から、主な課題は(i) DAG 制約を満たすグラフ上の分布を表すこと、(ii) 基礎空間上の後方を推定することである。
そこで本稿では,DAGと置換の強化空間上に共同分布を定式化することにより,これらの課題に対処するアプローチを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:30:01 GMT)
Tensor Methods in High Dimensional Data Analysis: Opportunities and Challenges [16.5] マルチウェイアレイやテンソルは、化学、ゲノミクス、物理学、心理学、信号処理などの様々な分野にまたがる現代の応用で広く使われている。
これらの課題に対処するには、統計学、最適化、数値線形代数などの分野からツールと洞察をまとめる学際的なアプローチが必要である。
このレビューでは、いくつかの重要な進歩を調べ、その中の共通スレッドを8つの異なる統計的設定の下で識別する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:54:03 GMT)
Augmented Conversation with Embedded Speech-Driven On-the-Fly Referencing in AR [16.5] 本稿では,拡張会話の概念を紹介する。
拡張現実(AR)における組込み音声駆動型オンザフライ会議による共同会話を支援することを目的とする。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:10:47 GMT)
ORLM: Training Large Language Models for Optimization Modeling [16.3] 大規模言語モデル(LLM)は複雑なオペレーションリサーチ(OR)のための強力なツールとして登場した。
この問題に対処するために、最適化モデリングのためのオープンソースのLLMのトレーニングを提案する。
我々は,NL4OPT,MAMO,IndustrialORベンチマークの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:55:35 GMT)
Sample-Efficiency in Multi-Batch Reinforcement Learning: The Need for Dimension-Dependent Adaptivity [16.3] 強化学習におけるサンプル効率と適応性の関係を理論的に検討する。
私たちは、バッチ毎にフィードバックが処理され、クエリが更新されるように、クエリをK$のバッチで送信できる学習フレームワークを採用しています。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:15:49 GMT)
OV-DQUO: Open-Vocabulary DETR with Denoising Text Query Training and Open-World Unknown Objects Supervision [16.2] Open-Vocabulary Detection (OVD) は、検出器が訓練される基本カテゴリを越えて、新しいカテゴリからオブジェクトを検出することを目的としている。
我々は、textbfOpen-textbfVocabulary DETRによるtextbfQueryトレーニングとオープンワールドtextbfUnknown textbfObjects監督を行うOV-DQUOを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:33:27 GMT)
RITUAL: Random Image Transformations as a Universal Anti-hallucination Lever in LVLMs [16.2] LVLMにおける幻覚に対する堅牢性を高めるため,RITUALと呼ばれる簡易なトレーニング不要な手法を提案する。
提案手法では,元の確率分布を補うために,ランダムな画像変換を用いる。
実験の結果,変換画像の孤立的使用は当初は性能を低下させるが,これらの変換の戦略的実装は事実上有効な補完となることが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:41:02 GMT)
Don't Miss the Forest for the Trees: Attentional Vision Calibration for Large Vision Language Models [16.2] 盲目トークンと呼ばれるいくつかの画像トークンへの過剰な注意は、視覚オブジェクトのきめ細かい理解を必要とするタスクにおいて幻覚反応をもたらす。
注意重みの低いトークンは、しばしば、ニュアンスオブジェクトの詳細を特定するのに不可欠な情報を持っている。
盲目トークンの過剰エンハンシスに対処するために,AVC(Attentional Vision)と呼ばれる手法を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:40:57 GMT)
DiLightNet: Fine-grained Lighting Control for Diffusion-based Image Generation [16.1] テキスト駆動画像生成における微細な照明制御を実現するための新しい手法を提案する。
私たちのキーとなる観察は、拡散過程を導くだけではならず、そのため正確な放射率のヒントは必要ないということです。
我々は、様々なテキストプロンプトと照明条件に基づいて、照明制御拡散モデルを実証し、検証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:55:20 GMT)
Robustness Implies Privacy in Statistical Estimation [16.1] 本研究では,高次元統計学における敵のプライバシーと差分プライバシーの関係について検討する。
プライバシーから堅牢性への最初のブラックボックスの削減は、最適なトレードオフを伴うプライベートな推定器を生み出すことができる。
また, アルゴリズムは, ほぼ最適に崩壊したサンプルに対して頑健である。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:24:14 GMT)
A Survey of Data-Efficient Graph Learning [16.1] 研究フロンティアとして,データ効率グラフ学習(DEGL)の新たな概念を紹介した。
我々は、自己教師付きグラフ学習、半教師付きグラフ学習、少数ショットグラフ学習など、いくつかの重要な側面に関する最近の進歩を体系的にレビューした。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:43:24 GMT)
Self-supervised Pre-training for Transferable Multi-modal Perception [15.9] NeRF-Supervised Masked Auto (NS-MAE)は、移動可能なマルチモーダル表現学習のための自己教師付き事前学習パラダイムである。
提案手法は,ニューラルレイディアンスフィールド(NeRF)におけるマスク付きマルチモーダル再構成を用いて,欠落または破損した入力データを再構成するモデルを訓練する。
広範囲な実験により、多モードおよび単一モード知覚モデル間のNS-MAE表現の有望な伝達性を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:13:49 GMT)
Bridging the Gap: Dynamic Learning Strategies for Improving Multilingual Performance in LLMs [15.9] 大規模言語モデル(LLM)は、世界中の多くのドメインを変換する最前線にある。
しかしながら、その傾向と有効性は、非ラテン文字や低リソース言語に限られている。
本稿では,LLMの多言語的性能向上を,広範囲の訓練や微調整を伴わずに行うことの必須課題に対処する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:56:42 GMT)
Online conformal prediction with decaying step sizes [15.9] 本稿では, 減衰段数によるオンライン共形予測手法を提案する。
従来の方法とは違って、集団の量的存在を同時に推定することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:17:22 GMT)
A Human-Like Reasoning Framework for Multi-Phases Planning Task with Large Language Models [15.9] マルチパス計画問題には、アウトライン、情報収集、計画といった複数の相互接続ステージが含まれる。
既存の推論アプローチは、この複雑なタスクを効果的に解決するのに苦労しています。
本研究は,LLMエージェントのためのヒューマンライクな計画フレームワークを開発することで,この問題に対処することを目的としている。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:13:32 GMT)
Blocking Tracking JavaScript at the Function Granularity [15.9] Not.jsは、関数レベルの粒度で動作する、きめ細かいJavaScriptブロッキングツールである。
Not.jsは、Webページのグラフ表現で教師付き機械学習分類器をトレーニングし、まずJavaScript関数レベルでトラッキングを検出する。
Not.jsは、トラッキングを削除しながら機能を保存するサロゲートスクリプトを自動的に生成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:26:57 GMT)
Unified Low-rank Compression Framework for Click-through Rate Prediction [15.8] 本稿では,CTR予測モデルを圧縮する低ランク分解フレームワークを提案する。
私たちのフレームワークはオリジナルのモデルよりも優れたパフォーマンスを実現できます。
我々のフレームワークは、様々なCTR予測モデルにテーブルやレイヤーを埋め込むのに利用できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:06:32 GMT)
Dual Process Learning: Controlling Use of In-Context vs. In-Weights Strategies with Weight Forgetting [15.7] 言語モデルには、コンテキスト内学習(ICL)を実行する能力があり、コンテキストに基づいた振る舞いを柔軟に適応させることができる。
実演モデルと玩具モデルの両方を用いて、単純な音声設定における構造的インコンテキストアルゴリズムについて検討する。
モデルが新しい言語に一般化するのを助けるために最近導入された手法である能動的忘れ字法は、構造的コンテキスト内学習ソリューションを採用するようモデルに強制する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:38:20 GMT)
Disentangling Foreground and Background Motion for Enhanced Realism in Human Video Generation [15.6] 異なる動き表現を用いて動きを分離することで、前景と背景のダイナミクスを同時に学習する手法を提案する。
我々は、この革新的な動きの描写アプローチによって強化された現実世界の動画を訓練する。
誤りを蓄積することなく、より長いシーケンスにビデオ生成をさらに拡張するために、クリップ・バイ・クリップ・ジェネレーション・ストラテジーを採用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:25:00 GMT)
Data-Driven Simulator for Mechanical Circulatory Support with Domain Adversarial Neural Process [15.6] MCSの既存の機械シミュレータは仮定の単純化に依存しており、患者固有の振る舞いには敏感である。
ニューラルプロセスアーキテクチャを用いて, MCSポンプレベルと不確実性を伴う大動脈圧測定の確率的関係を捉える。
非定常的傾向予測では19%改善した経験的結果から,DANPが臨床医の有効なツールとして確立された。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:07:12 GMT)
Towards Clinical AI Fairness: Filling Gaps in the Puzzle [15.5] このレビューでは、医療データと提供されたAIフェアネスソリューションの両方に関して、いくつかの欠陥を体系的に指摘する。
AI技術がますます活用されている多くの医療分野において、AIフェアネスの研究の欠如を強調している。
これらのギャップを埋めるために、我々のレビューは医療研究コミュニティとAI研究コミュニティの両方にとって実行可能な戦略を前進させます。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:42:55 GMT)
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation [15.4] 本稿では、オブジェクトの提案生成、インスタンステンプレートと提案領域の埋め込み生成、インスタンスラベル割り当ての埋め込みマッチングを含む統合フレームワーク(NIDS-Net)を提案する。
我々のフレームワークは現在の最先端の手法を超え、4つの検出データセットの平均精度(AP)において22.3、46.2、10.3、24.0の顕著な改善を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:16:57 GMT)
On the Saturation Effect of Kernel Ridge Regression [15.4] 飽和効果は、地下の真理関数の滑らかさが一定のレベルを超えると、カーネルリッジ回帰(KRR)が情報理論的下界を達成できない現象を指す。
飽和効果は慣行で広く見られ、KRRの飽和下限は数十年にわたって推測されてきた。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:07:32 GMT)
PyGS: Large-scale Scene Representation with Pyramidal 3D Gaussian Splatting [15.4] 我々はNeRF初期化によるピラミッド型3次元ガウススプラッティング(PyGS)を提案する。
我々はこれらのピラミッドのガウスをクラスタに分類し、各クラスタのピラミッドレベルの影響を動的に決定するために、コンパクトな重み付けネットワークを使用する。
提案手法は,複数の大規模データセットにまたがる大幅な性能向上を実現し,現在の最先端手法の400倍以上のレンダリング時間を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:26:35 GMT)
Discriminator-Guided Cooperative Diffusion for Joint Audio and Video Generation [15.3] そこで本研究では,各単一モーダルモデルを用いて,各モーダルモデルに対して協調的に適切なサンプルを生成する手法を提案する。
理論的には、このガイダンスは最適判別器の勾配によって計算可能であることを示す。
いくつかのベンチマークデータセットに対する実験的な評価により,本手法は比較的少数のパラメータで単一モードの忠実度と複数モードのアライメントを改善していることが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:43:03 GMT)
Render and Diffuse: Aligning Image and Action Spaces for Diffusion-based Behaviour Cloning [15.3] Render and Diffuse(R&D)は,ロボットの3次元モデルの仮想レンダリングを用いて,画像空間内の低レベルロボット動作とRGB観察を統一する手法である。
この空間統一は学習問題を単純化し、サンプル効率と空間一般化に不可欠な帰納バイアスを導入する。
以上の結果から,R&Dは空間一般化能力が高く,より一般的なイメージ・ツー・アクション法よりもサンプリング効率が高いことがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:06:10 GMT)
Entity Alignment with Noisy Annotations from Large Language Models [15.2] 我々は,大規模言語モデルをEAに効果的に活用するための統一フレームワーク LLM4EA を提案する。
具体的には、アノテーション空間を大幅に削減するために、新しいアクティブな学習ポリシーを設計する。
基本EAモデルからのフィードバックに基づいて、ポリシーを反復的に最適化します。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:50:18 GMT)
Investigating and Designing for Trust in AI-powered Code Generation Tools [15.2] 私たちは、AIコード生成ツールを適切に信頼する上での彼らの課題を理解するために、開発者にインタビューした。
我々は,開発者の信頼構築プロセスを支援する設計概念を探索する設計調査を行った。
これらの結果から,AIを利用したコード生成ツールの信頼性設計に関する設計勧告が提案されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:22:00 GMT)
Med-Real2Sim: Non-Invasive Medical Digital Twins using Physics-Informed Self-Supervised Learning [15.1] デジタルツイン(Digital twin)は、数学的モデリングを用いてその定義する特徴を特徴づけ、シミュレートする現実世界の物理現象の仮想レプリカである。
非侵襲的な患者健康データのみを用いてデジタル双対モデルパラメータを同定する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:19:17 GMT)
DP-DyLoRA: Fine-Tuning Transformer-Based Models On-Device under Differentially Private Federated Learning using Dynamic Low-Rank Adaptation [15.0] フェデレートラーニング(FL)により、IoT(Internet of Things)システムのクライアントは、ローカルデータをサーバと共有することなく、グローバルモデルを協調的にトレーニングすることができる。
差分プライバシ(DP)は、クライアントのコントリビューションにランダム性を加えるメカニズムを備えた、正式なプライバシ保証を提供することによって、そのようなリークに対処する。
差分プライバシーと組み合わせてDP-DyLoRAと呼ぶ適応手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:41:17 GMT)
Efficient Detection of LLM-generated Texts with a Bayesian Surrogate Model [15.0] 本稿では,特に大規模言語モデル(LLM)から機械生成テキストを検出する新しい手法を提案する。
ベイジアンサロゲートモデルを用いて、ベイジアン不確実性に基づいて典型的なサンプルを選択し、典型的なサンプルから他のサンプルへのスコアを補間し、クエリ効率を向上させる。
実験の結果,提案手法はクエリコストの低い既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:10:59 GMT)
Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [15.0] 介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
観察的および介入的設定における各変数の限界分布の比較に依拠する介入忠実性を導入する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:07:17 GMT)
SVD-LLM: Truncation-aware Singular Value Decomposition for Large Language Model Compression [14.8] 大規模言語モデル(LLM)のための新しいSVDベースの圧縮手法であるSVD-LLMを提案する。
SVD-LLMは、特異値と圧縮損失の直接マッピングを保証するために、トラクション対応のデータホワイトニング戦略を組み込んでいる。
以上の結果から, SVD-LLMは最先端技術, 特に高モデル圧縮比よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:41:26 GMT)
Do Concept Bottleneck Models Obey Locality? [14.8] 概念に基づく手法は、人間の理解可能な概念を用いてモデル予測を説明する。
ローカリティ(Localities)とは、概念の価値を予測する際に、関連する機能のみを使用することである。
CBMは、独立概念が重複しない特徴部分集合に局所化されている場合でも、局所性を捉えない。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:03:53 GMT)
On the importance of cross-task features for class-incremental learning [14.7] クラス増分学習では、限られたリソースを持つエージェントが一連の分類タスクを学習する必要がある。
タスクIDを推論時に利用できるタスクインクリメンタル学習との主な違いは、学習者がタスク間の差別を行う必要があることである。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:44:03 GMT)
DyGPrompt: Learning Feature and Time Prompts on Dynamic Graphs [14.6] 動的グラフモデリングのための新しいフレームワークであるDyGPromptを提案する。
まず,タスクの目的と,事前学習タスクと下流タスクの動的変動のギャップに対処する2つのプロンプトを設計する。
第2に,ノードと時間の特徴が相互に特徴付けされていることを認識し,下流タスクにおけるノード時間パターンの進化をモデル化するための2つの条件ネットを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:07:29 GMT)
Wavelet-Based Image Tokenizer for Vision Transformers [14.3] 非重複パッチワイド畳み込みはビジョントランスフォーマー(ViT)モデルのデフォルト画像トークンである。
本稿ではウェーブレット変換に基づく新しい画像トークン化手法を提案する。
新たなトークン機構を備えたViTモデルは,ImageNet検証セットのトレーニングスループットの向上とトップ1精度の向上を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:45:46 GMT)
Coupled Mamba: Enhanced Multi-modal Fusion with Coupled State Space Model [14.2] 本稿では,複数モードの状態チェーンを結合し,モード内状態プロセスの独立性を維持した結合型SSMモデルを提案する。
CMU-EI,CH-SIMS,CH-SIMSV2のマルチドメイン入力による実験により,本モデルの有効性が検証された。
その結果, 結合マンバモデルではマルチモーダル核融合が可能であることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:57:03 GMT)
The FAIIR Tool: A Conversational AI Agent Assistant for Youth Mental Health Service Provision [14.2] FAIIR(Frontline Assistant: Issue Identification and Recommendation)は、ドメイン適応型および微調整型トランスモデルのアンサンブルである。
本研究では,FAIIRツールに活用される技術開発,性能,検証プロセスについて,キッズヘルプ電話による最前線危機対応の状況に適用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:54:46 GMT)
Eliciting Informative Text Evaluations with Large Language Models [14.2] 生成的ピア予測機構(GPPM)と生成的シンプシスピア予測機構(GSPPM)の2つのメカニズムを導入する。
我々は,この機構がベイズ・ナッシュ均衡(近似)として高い努力と真理を動機付けることができることを示した。
ICLRデータセットでは、人間によるレビュー、GPT-4生成レビュー、GPT-3.5生成レビューの3つの品質レベルを、期待されるスコアの観点から区別することが可能です。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:55:40 GMT)
X-Light: Cross-City Traffic Signal Control Using Transformer on Transformer as Meta Multi-Agent Reinforcement Learner [14.1] X-Light という名前の都市間メタマルチエージェント信号制御のための Transformer on Transformer (TonT) モデルを提案する。
目に見えないシナリオに直接移行する場合、平均で+7.91%、場合によっては+16.3%のベースラインメソッドを超越する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:57:31 GMT)
A Note on the Prediction-Powered Bootstrap [14.1] 本稿では,任意の推定問題に対する予測に基づくPPBootを提案する。
実装は非常に簡単で、基本的には1つのアプリケーションに過ぎません。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:22:15 GMT)
Defending Large Language Models Against Jailbreak Attacks via Layer-specific Editing [14.1] 大規模言語モデル(LLM)は、広範囲の現実世界のアプリケーションで採用されつつある。
近年の研究では、LSMは故意に構築された敵のプロンプトに弱いことが示されている。
そこで本研究では,新しい防衛手法である textbfLayer-specific textbfEditing (LED) を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:26:12 GMT)
Multi-level Interaction Modeling for Protein Mutational Effect Prediction [14.1] 本稿では, 自己教師型マルチレベル事前学習フレームワークProMIMを提案する。
ProMIMは標準ベンチマークのベースライン、特に背骨コンフォメーションに大きな変化が生じる可能性のある突然変異において、すべてのベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:53:26 GMT)
VOODOO XP: Expressive One-Shot Head Reenactment for VR Telepresence [14.0] VOODOO XPは、入力ドライバビデオと1枚の2Dポートレートから高表現力の表情を生成することができる、3D対応のワンショットヘッド再現法である。
本稿では,モノクラー映像設定と双方向通信のためのエンドツーエンドVRテレプレゼンスシステムについて述べる。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:22:34 GMT)
RealitySummary: On-Demand Mixed Reality Document Enhancement using Large Language Models [13.9] 本稿では、オンデマンドテキスト抽出、要約、拡張を用いて、印刷物やデジタル文書を拡張可能な複合現実読影アシスタントであるRealitySummaryを紹介する。
1)要約,2)比較表,3)タイムライン,4)キーワードリスト,5)要約ハイライト,6)情報カード。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:59:56 GMT)
Low-Rank Few-Shot Adaptation of Vision-Language Models [13.8] 視覚言語モデル(VLM)の少数ショット学習においてローランド適応(LoRA)を導入する。
驚くべきことに、我々の単純なCLIP-LoRA法は、トレーニング時間を短縮しつつ、大幅に改善されている。
本研究の結果は,アクセシブルラーニングとアダプタベースの研究の可能性を否定するものではない。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:16:59 GMT)
Learning from Uncertain Data: From Possible Worlds to Possible Models [13.8] 本研究では,不確実性のあるデータから線形モデルを学習するための効率的な手法を提案する。
我々はこれらのデータセットの変動をコンパクトに表現し、すべての可能な世界における勾配勾配のシンボリックな実行を可能にする。
提案手法は,全ての可能な最適モデルと予測範囲を過度に近似する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:36:55 GMT)
Let's Fuse Step by Step: A Generative Fusion Decoding Algorithm with LLMs for Multi-modal Text Recognition [13.8] GFD(Generative Fusion Decoding)は,Large Language Models(LLM)をマルチモーダルテキスト認識システムに統合するために使用される,新しい浅層融合フレームワークである。
GFDが異なるモデルの不一致トークン空間をまたいで動作できるようにするのに必要な公式を導出する。
GFD は ASR および OCR タスクのパフォーマンスを大幅に改善し、NTUML 2021 ベンチマークで ASR が最先端に到達した。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:45:30 GMT)
User Perception of CAPTCHAs: A Comparative Study between University and Internet Users [13.7] 大学キャンパスとAmazon Mechanical Turkから250名以上の参加者を調査した。
難易度の増加により,現在のCAPTCHA課題のナビゲートに苦慮していることが判明した。
参加者はこれらのシステムの信頼性とセキュリティについて懸念を表明した。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:28:04 GMT)
I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models [13.7] 学習後の量子化は、大きな言語モデルの推論を加速する強力な技術として機能する。
既存の作業は、推論中にかなりの数の浮動小数点(FP)操作を必要とする。
この制限は、エッジとクラウドデバイス上の大きな言語モデルのデプロイを妨げる。
大規模言語モデルに適した整数のみの完全量子化PTQフレームワークであるI-LLMを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:56:11 GMT)
F-3DGS: Factorized Coordinates and Representations for 3D Gaussian Splatting [13.7] ニューラルレイディアンス場(NeRF)のレンダリング手法の代替として,F3DGS(Facterized 3D Gaussian Splatting)を提案する。
F-3DGSはレンダリング画像に匹敵する品質を維持しながら、ストレージコストを大幅に削減する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:19:42 GMT)
Meta-Task Planning for Language Agents [13.6] 大規模言語モデルベースエージェント(LLMエージェント)は、人工知能(AGI)を実現するための有望なパラダイムとして登場した。
本稿では,メタタスク計画(Meta-Task Planning, MTP)を紹介する。
MTPはTravelPlannerで平均$sim40%$成功率を達成した。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:56:40 GMT)
Cycle-YOLO: A Efficient and Robust Framework for Pavement Damage Detection [13.2] 本稿では,CycleGANと改良YOLOv5アルゴリズムを用いた舗装損傷検出手法を提案する。
本アルゴリズムは, 3種類の舗装損傷(き裂, 穴, パッチ)を検出する場合, 0.872, 0.854, 平均精度@0.5, 0.882, 平均精度@0.5を達成した。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:27:42 GMT)
SSLChange: A Self-supervised Change Detection Framework Based on Domain Adaptation [13.2] SSLChangeは、変更検出のための自己監督型コントラストフレームワークである。
単時間サンプルを取るだけで、自己学習ができる。
フレキシブルにメインストリームのCDベースラインに転送できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:34:51 GMT)
Cardiovascular Disease Detection from Multi-View Chest X-rays with BI-Mamba [13.1] CVDリスク予測のための胸部X線検査の有用性について検討した。
状態空間列モデル(SSM)に着想を得て,両方向画像マンバ(BI-Mamba)を提案する。
その結果、BI-MambaはResNet-50とViT-Sを同等のパラメータサイズで上回り、トレーニング中に大量のGPUメモリを節約していることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:56:39 GMT)
Long Context is Not Long at All: A Prospector of Long-Dependency Data for Large Language Models [13.1] 長期コンテキストモデリング機能は、様々なアプリケーションにおいて大きな言語モデル(LLM)にとって重要である。
データマイニングフレームワーク textbfProLong を提案する。
複数のベンチマークに関する総合的な実験は、ProLongが長い依存関係を持つドキュメントを効果的に識別していることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:36:56 GMT)
OpFlowTalker: Realistic and Natural Talking Face Generation via Optical Flow Guidance [13.1] OpFlowTalkerは、直接画像予測ではなく、音声入力から予測される光フロー変化を利用する新しい手法である。
画像の遷移を円滑にし、変更をセマンティックコンテンツと整合させる。
また,全顔と唇の動きを調節する光フロー同期モジュールを開発した。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:07:34 GMT)
HFGS: 4D Gaussian Splatting with Emphasis on Spatial and Temporal High-Frequency Components for Endoscopic Scene Reconstruction [13.0] ロボット支援による最小侵襲手術は、手術結果を改善するため、動的シーン再構築の強化による恩恵を受ける。
NeRFはシーン再構成に有効だが、推論速度の遅さとトレーニング期間の長いため適用性が制限されている。
3D Gaussian Splatting (3D-GS) ベースの手法が最近のトレンドとして現れ、高速な推論機能と優れた3D品質を提供する。
空間的および時間的周波数の観点からこれらの課題に対処する,変形可能な内視鏡再建のための新しいアプローチであるHFGSを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:48:02 GMT)
A Study on Self-Supervised Pretraining for Vision Problems in Gastrointestinal Endoscopy [13.0] 本研究では, ResNet50 と ViT-B のバックボーンを事前訓練したモデルの性能について検討した。
ImageNet-1kによる自己教師付き事前トレーニングは、通常、Hyperkvasir-unlabelledによる事前訓練よりも適している。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:39:18 GMT)
3D Reconstruction with Fast Dipole Sums [12.9] マルチビュー画像から高忠実度表面を再構成する手法を提案する。
本手法では,点雲内の点当たりの属性を任意のものにするために,巻線数を一般化する双極子和という新しい点ベース表現を用いる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:07:48 GMT)
Offline Oracle-Efficient Learning for Contextual MDPs via Layerwise Exploration-Exploitation Tradeoff [12.8] 実現可能性前提の下で, CMDP からオフライン密度推定への削減を提案する。
本アルゴリズムの特筆すべき特徴は,CMDPの層状構造に対応するため,層状探索・探索トレードオフの設計である。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:47:41 GMT)
Safety Control of Service Robots with LLMs and Embodied Knowledge Graphs [12.8] 本稿では,大規模言語モデルとERCP(Embodied Robotic Control Prompts)とEKG(Embodied Knowledge Graphs)との新たな統合を提案する。
ERCPは、LLMが安全かつ正確な応答を生成するための事前定義された命令として設計されている。
EKGは、ロボットの動作が安全プロトコルと継続的に一致していることを保証する包括的な知識基盤を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:50:25 GMT)
SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches [12.8] スケッチベースのクエリインタフェースでビデオモーメントを検索するビデオデータベース管理システム(VDBMS)であるSketchQLを提案する。
このインターフェースでは、単純なマウスドラッグアンドドロップ操作でオブジェクトのトラジェクトリイベントを指定できる。
SketchQLは、ビデオ上の類似検索を実行し、ビジュアルクエリに最も近いクリップを特定することで、ゼロショットビデオモーメント検索を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:28:51 GMT)
Fisher Flow Matching for Generative Modeling over Discrete Data [12.7] 離散データのための新しいフローマッチングモデルであるFisher-Flowを紹介する。
Fisher-Flowは、離散データ上のカテゴリー分布を考慮し、明らかに幾何学的な視点を採っている。
Fisher-Flowにより誘導される勾配流は, 前方KLの発散を低減するのに最適であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:18:16 GMT)
Optimality of Approximate Message Passing Algorithms for Spiked Matrix Models with Rotationally Invariant Noise [12.6] 本研究では,信号に加法的回転不変雑音を付加して発生する観測行列からランク1信号行列を推定する問題について検討する。
この問題に対する近似メッセージパッシングアルゴリズムの新たなクラスを開発し、高次元極限におけるそれらのダイナミクスの簡易かつ簡潔な特徴付けを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:42:51 GMT)
Controllable Longer Image Animation with Diffusion Models [12.6] 動画拡散モデルを用いた動き先行画像を用いたオープンドメイン制御可能な画像アニメーション手法を提案する。
本手法は動画から運動場情報を抽出することにより移動領域の運動方向と速度を正確に制御する。
本稿では,画像アニメーションタスクに特化して最適化されたノイズ再スケジュールに基づく,効率的な長周期ビデオ生成手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:30:43 GMT)
SEGAN: semi-supervised learning approach for missing data imputation [12.6] 本稿では,セミ教師付き学習に基づくデータ補完モデルSEGANを提案する。
SEGANモデルでは、ジェネレータは、欠落したデータ値を予測する際に、既知のデータとそのラベル情報をよりフルに利用することができる。
本稿では,SEGANモデルがナッシュ平衡に達すると,実データ分布特性を学習できることを理論的に証明する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:29:40 GMT)
Track Initialization and Re-Identification for~3D Multi-View Multi-Object Tracking [12.4] モノクロカメラからの2次元検出のみを用いた3次元多対象追跡(MOT)ソリューションを提案する。
我々は,複数のカメラから抽出した2次元検出と特徴を利用して,多目的フィルタリング密度をよりよく近似する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:36:16 GMT)
Multi-CATE: Multi-Accurate Conditional Average Treatment Effect Estimation Robust to Unknown Covariate Shifts [12.3] 我々は、CATE T-learnerを後処理するために、マルチ精度の予測子を学習するために方法論を使用する。
このアプローチは、(より大きな)確立された観測データと(より小さな)ランダム化されたデータセットを組み合わせることができることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:12:25 GMT)
Understanding Inter-Concept Relationships in Concept-Based Models [12.2] 概念モデルによって学習された概念表現を分析し、これらのモデルが概念間の関係を正しく捉えているかどうかを理解する。
まず、最先端の概念に基づくモデルが、安定性と堅牢性に欠ける表現を生成することを実証的に示し、そのような手法は概念間の関係を捉えるのに失敗する。
そこで我々は,概念間関係を利用して概念介入の精度を向上させる新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:20:49 GMT)
Causal Contextual Bandits with Adaptive Context [12.2] 本研究では,学習者が選択した初期介入に基づいて,文脈が選択される因果的文脈包帯の変種について検討する。
私たちは、私たちの単純な後悔が、多くのインスタンスに対して本質的にきついことを証明しています。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:17:57 GMT)
Spectral Truncation Kernels: Noncommutativity in $C^*$-algebraic Kernel Machines [12.1] スペクトルトランケーションに基づく正定値カーネルの新しいクラスを提案する。
truncationパラメータ$n$は、性能向上につながる支配要因であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:47:12 GMT)
Can We Trust Recommender System Fairness Evaluation? The Role of Fairness and Relevance [12.0] レコメンデーターシステム(RS)の2つの主要な目的と妥当性と公正性
最近の研究は、関連性(フェアネスのみ)から独立したRSフェアネスの尺度や、関連性(ジョイント対策)を条件としたRSフェアネスの尺度を提案している。
RSの妥当性と公正性に関するすべての共同評価尺度を収集し、どのように一致しているかを問う。
実世界の4つのデータセットと4つのレコメンデーションに対して、これらの測定の振る舞いを初めて経験的に研究する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:25:04 GMT)
Crystal-LSBO: Automated Design of De Novo Crystals with Latent Space Bayesian Optimization [12.0] 本研究では、探索性を高めるために特別に調整された結晶のデノボ設計フレームワークであるCrystal-LSBOを紹介する。
本研究は,デ・ノボ結晶設計におけるLSBOの利用の先駆者であり,最適化タスクによる有効性を示すものである。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:03:49 GMT)
Improved Optimization for the Neural-network Quantum States and Tests on the Chromium Dimer [12.0] ニューラルネットワーク量子状態(NQS)は、かなり高度な波動関数アンザッツ研究を持っている。
この研究は、NQSを用いたVMC最適化の計算要求を減らすために、3つのアルゴリズム拡張を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:18:13 GMT)
Matroid Semi-Bandits in Sublinear Time [12.0] 本研究では,マトロイド半帯域問題について検討し,各ラウンドで学習者が実現可能な集合からK$アームのサブセットを再生する。
我々は,マトロイドの共通クラスに対して,サンプリングルールを$K$でサブリニア化するFasterCUCBを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:55:02 GMT)
An Empirical Analysis of Forgetting in Pre-trained Models with Incremental Low-Rank Updates [11.9] 本研究は,ローランド適応(LoRA)のランクが,事前学習の基礎課題の忘れ方,可塑性およびその後の課題の忘れ方に及ぼす影響について検討する。
また、この方法で微調整された視覚トランスフォーマーは、残余のネットワークでは観測できないような、ある種の文脈的「忘れ」を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:29:25 GMT)
Implicit Causal Representation Learning via Switchable Mechanisms [11.9] 因果的メカニズムの暗黙的な学習は通常、ハードとソフトの介入という2つの介入データを含む。
本稿では,ソフト介入を用いた因果モデル学習の課題に対処し,暗黙的モデリングを継続する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:43:21 GMT)
Towards Efficient Disaster Response via Cost-effective Unbiased Class Rate Estimation through Neyman Allocation Stratified Sampling Active Learning [11.7] 本稿では,二分分類のためのランダムサンプリング木を構築する革新的なアルゴリズムを提案する。
その結果,本手法は受動的および従来の能動的学習手法を超越していることが判明した。
従来のアクティブな学習戦略における「サンプルバイアス」の課題に効果的に対処する。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:34:35 GMT)
Interpretable DRL-based Maneuver Decision of UCAV Dogfight [11.6] 本稿では, 深部強化学習(DRL)が高次機動決定に寄与する3層無人戦闘機(UCAV)のドッグファイトフレームを提案する。
4チャンネルの低レベル制御法が構築され、8つの基本的な飛行操作(BFM)を含むライブラリが続く。
UCAVドッグファイトにおけるBFM選択にはDouble Deep Q Network (DDQN) が適用される。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:43:47 GMT)
A Pontryagin Perspective on Reinforcement Learning [11.6] 固定アクションシーケンスを代わりに学習するオープンループ強化学習のパラダイムを導入する。
1つの頑健なモデルベース法と2つのサンプル効率なモデルフリー法という3つの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:05:20 GMT)
MultiADE: A Multi-domain Benchmark for Adverse Drug Event Extraction [11.5] アクティブな有害事象監視は、異なるデータソースからの逆薬物イベント(ADE)を監視する。
未解決の疑問のひとつは、さまざまなタイプのテキストに有効なADE抽出モデルが1つあることから、どこまで遠いのかということです。
我々は,MultiADEと名付けた有害薬物イベント抽出のためのマルチドメインベンチマークを構築することで,この問題に対処することに貢献する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:57:28 GMT)
Integer Scale: A Free Lunch for Faster Fine-grained Quantization of LLMs [11.4] スケールは、追加のキャリブレーションや微調整を必要としないため、無料のランチである。
ほとんどの微細な量子化法では、プラグアンドプレイが使用できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:17:47 GMT)
When is exponential asymptotic optimality achievable in average-reward restless bandits? [11.4] 我々は,$O(exp(-C N))$Optimity gap for a $N$-armed problem。
我々の政策は、上記の容易に検証できる仮定の下で指数的最適性を初めて達成する一方、事前の作業は強いグローバルアトラクタ仮定を必要とするか、あるいは$O(sqrtN)$最適性ギャップしか達成しない。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:08:29 GMT)
Task-Driven Uncertainty Quantification in Inverse Problems via Conformal Prediction [11.4] 逆問題の画像化では、画像が欠落/破損した測定結果から回復しようとする。
検索した画像が下流タスクに使用されるアプリケーションによって動機付けられ,不確実性定量化のためのタスク中心のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:49:17 GMT)
PatchAD: A Lightweight Patch-based MLP-Mixer for Time Series Anomaly Detection [11.2] 時系列解析における異常検出は重要な課題であるが、ラベル不足シナリオにおける正常パターンと異常パターンを識別することが課題となっている。
我々は,表現抽出と異常検出にコントラスト学習を利用する新しいマルチスケールパッチベースのMixerアーキテクチャであるPatchADを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:33:49 GMT)
Causal Concept Embedding Models: Beyond Causal Opacity in Deep Learning [11.1] 因果不透明性(英: Causal opacity)とは、ディープニューラルネットワーク(DNN)推論の根底にある「隠れた」因果構造を理解することの難しさを指す。
因果概念埋め込みモデル(Causal Concept Embedding Models, Causal CEMs)は、意思決定プロセスが設計によって因果的に透明である解釈可能なモデルのクラスである。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:31:09 GMT)
WeiPer: OOD Detection using Weight Perturbations of Class Projections [11.1] 入力のよりリッチな表現を生成する最終完全連結層にクラスプロジェクションの摂動を導入する。
我々はOpenOODフレームワークの複数のベンチマークで最先端のOOD検出結果を得る。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:30:29 GMT)
A Symplectic Analysis of Alternating Mirror Descent [11.1] シンプレクティック・オイラー法による連続時間ハミルトン流の離散化について検討する。
段数の順序で切り詰められたとき、修正されたハミルトン多様体上の新しい誤差境界を導出する。
もし本当なら、AMDの完全後悔は$mathcalOleft(K-1+varepsilonright)$、平均反復の双対性ギャップは$mathcalOleft(K-1+varepsilonright)$、任意の$varepsilon>0$であることを意味する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:39:53 GMT)
Programmer Visual Attention During Context-Aware Code Summarization [11.1] 要約を書いている間、私たちは視線追跡装置を使ってプログラマの視覚的注意をマッピングしました。
プログラマは単語の読み出しを著しく減らし(p0.01)、単語の書き直しを著しく減らさなければならないことがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:48:07 GMT)
A Retrospective of the Tutorial on Opportunities and Challenges of Online Deep Learning [10.9] 我々は,ECML PKDD 2023で開催されるオンライン深層学習の機会と課題」と題したチュートリアルを振り返る。
本稿では,ニューラルネットワークをオンライン学習環境に適用する上での潜在的な落とし穴についても概説する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:24:49 GMT)
Augmented Physics: A Machine Learning-Powered Tool for Creating Interactive Physics Simulations from Static Diagrams [10.9] 静的な教科書図からインタラクティブな物理シミュレーションを作成するための機械学習ツールであるAugmented Physicsを紹介した。
本システムでは,物理教科書から図表を半自動抽出し,抽出した内容に基づいてインタラクティブなシミュレーションを生成する。
これらのインタラクティブなダイアグラムは、スキャンされた教科書ページにシームレスに統合され、様々な物理概念の対話的でパーソナライズされた学習体験を容易にする。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:45:20 GMT)
Improved Emotional Alignment of AI and Humans: Human Ratings of Emotions Expressed by Stable Diffusion v1, DALL-E 2, and DALL-E 3 [10.8] 生成AIシステムは、テキストや画像を通じて感情を表現する能力がますます高まっている。
生成的AIによって表現される感情と人間の知覚のアライメントを測定する。
我々は、アライメントが使用するAIモデルと感情そのものに大きく依存していることを示します。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:26:57 GMT)
Subtle Biases Need Subtler Measures: Dual Metrics for Evaluating Representative and Affinity Bias in Large Language Models [10.7] 本研究は,Large Language Models (LLMs) における2つのバイアス,代表バイアスと親和性バイアスに対処する。
我々は,これらのバイアスを測定するために,代表バイアススコア(RBS)と親和性バイアススコア(ABS)の2つの新しい指標を導入する。
我々の分析では、白人、ストレート、男性と関連する身元を選好する著名なLSMにおいて、顕著な偏見が明らかとなった。
親和性バイアスによる各モデルにおける特徴的評価パターンの解明
論文参考訳(メタデータ) (Tue, 28 May 2024 03:05:45 GMT)
AutoCV: Empowering Reasoning with Automated Process Labeling via Confidence Variation [10.7] 我々は,textbfConfidence textbfVariation (textbftextscAutoCV) を用いた textbf Automated Process Labeling という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:35:27 GMT)
Asymmetrical estimator for training grey-box deep photonic neural networks [10.7] 非対称トレーニング(AT)法は、PNN構造を灰色の箱として扱う。
我々は、未校正フォトニック集積回路(PIC)により実装されたディープグレーボックスPNNのAT法を実験的に実証した。
また、MNIST, fashion-MNIST, Kuzushiji-MNISTなど、さまざまなデータセットに対するAT over BPの連続的な性能向上も紹介した。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:27:20 GMT)
SelMatch: Effectively Scaling Up Dataset Distillation via Selection-Based Initialization and Partial Updates by Trajectory Matching [10.7] IPCで効果的にスケールする新しい蒸留法であるSelMatchを紹介する。
CIFAR-10/100 と TinyImageNet でテストすると、SelMatch は選択のみと蒸留のみの手法で常に性能が向上する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:54:04 GMT)
MMPareto: Boosting Multimodal Learning with Innocent Unimodal Assistance [10.6] 従来無視されていた多モーダル学習目標と単モーダル学習目標との勾配の衝突を同定する。
MMParetoアルゴリズムを提案することで、学習目的に共通する方向の最終的な勾配を確保することができる。
また,タスクの難易度に明確な相違点のあるマルチタスクケースも容易に行えることが期待されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:19:13 GMT)
A System for Automatic English Text Expansion [10.5] 自動」とは、システムは最小限の単語集合から一貫性と正しい文を生成することができることを意味する。
英語では,高度に正確なaLexiE辞書を作成した。
システムは、レポートやニュース生成といった他のドメインにも適用できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:48:05 GMT)
CAVACHON: a hierarchical variational autoencoder to integrate multi-modal single-cell data [10.4] マルチモーダルデータ間の条件付き独立関係を明示的に組み込んだ新しい確率論的学習フレームワークを提案する。
単セルマルチオミクスデータ統合に関連する様々なアプリケーションにおけるフレームワークの汎用性を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:44:09 GMT)
Assessing Economic Viability: A Comparative Analysis of Total Cost of Ownership for Domain-Adapted Large Language Models versus State-of-the-art Counterparts in Chip Design Coding Assistance [10.4] 本稿では,ドメイン適応型大言語モデル (LLM) と最先端LLM (SoTA) の比較検討を行った。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:11:44 GMT)
Structured Graph Network for Constrained Robot Crowd Navigation with Low Fidelity Simulation [10.2] 低忠実度シミュレータを用いた群集ナビゲーションにおける強化学習(RL)ポリシーの適用可能性について検討した。
動的環境の表現を導入し,人間と障害物の表現を分離する。
この表現は、低忠実度シミュレーターで訓練されたRLポリシーを、シム2リアルギャップを減らして現実世界に展開することを可能にする。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:20:43 GMT)
Weisfeiler-Leman at the margin: When more expressivity matters [10.2] アーキテクチャの表現性は、グラフ同型を通して見るときの一般化性能に関する限られた洞察を与えることを示す。
本稿では,表現力のある1ドルWLベースのカーネルとMPNNアーキテクチャと,証明可能な一般化特性を導入したMPNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:52:02 GMT)
AI Alignment with Changing and Influenceable Reward Functions [10.0] 既存のAIアライメントアプローチは、好みは静的であり、非現実的である、と仮定する。
その利便性にもかかわらず、静的推論の仮定は既存のアライメント手法の音質を損なう可能性がある。
我々は、AIアライメントのさまざまな概念を定式化し、最初から好みの変化を考慮に入れている。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:08:46 GMT)
Graph Coarsening with Message-Passing Guarantees [10.0] 提案手法は,信号の保存に関する理論的保証を示す,粗いグラフに特有な新しいメッセージパッシング操作を提案する。
我々は合成データと実データに対してノード分類タスクを行い、粗いグラフ上で単純メッセージパッシングを行うのと比べて改善された結果を観察する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:39:24 GMT)
Active Use of Latent Constituency Representation in both Humans and Large Language Models [10.0] 本研究では,人間の脳モデルと大規模言語モデルの両方において,木構造が潜在する選挙区表現が出現することを示す。
以上の結果から,ヒト脳とLDMの両方に潜在木構造領域の表現が出現する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:50:22 GMT)
Privacy-Preserving UCB Decision Process Verification via zk-SNARKs [10.0] zkUCBは、トレーニングデータとアルゴリズムパラメータの機密性を保護し、透明な UCB 意思決定を保証するように設計されている。
実験ではzkUCBの優れた性能が強調され、量子化ビットの使用に対する報酬が強化された。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:22:19 GMT)
Peering into the Mind of Language Models: An Approach for Attribution in Contextual Question Answering [9.9] 大規模言語モデル(LLM)の隠れ状態表現を利用した文脈質問応答における帰属手法を提案する。
提案手法は,より詳細な属性を提供し,生成した回答の質を保ちながら,広範囲なモデル再訓練および検索モデルオーバーヘッドの必要性を回避している。
本稿では,LLM世代に対するトークンレベルのアノテーションを文脈質問応答設定に有する属性データセットであるVerifiability-granularを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:12:44 GMT)
Empowering Working Memory for Large Language Model Agents [9.8] 本稿では,認知心理学のワーキングメモリフレームワークを大規模言語モデル(LLM)に適用する可能性について検討する。
エピソード間の記憶を維持するために、集中型ワーキングメモリハブとエピソディックバッファアクセスを取り入れた革新的なモデルが提案されている。
このアーキテクチャは、複雑なタスクと協調シナリオの間のニュアンス付きコンテキスト推論に対して、より継続的なものを提供することを目的としている。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:34:52 GMT)
Estimating Model Performance Under Covariate Shift Without Labels [9.8] ラベルなしデータの分類モデルを評価するために,確率的適応性能推定(PAPE)を導入する。
PAPEは他の評価手法よりも正確な性能推定を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:38:16 GMT)
LOVECon: Text-driven Training-Free Long Video Editing with ControlNet [9.8] 本稿では,このギャップを埋めることを目的として,学習自由拡散モデルに基づく長大ビデオ編集のための,シンプルで効果的なベースラインを確立する。
ControlNet上にパイプラインを構築し、テキストプロンプトに基づいて様々な画像編集タスクを抽出する。
本手法は,ユーザの要求に応じて数百フレームの動画を編集する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:04:03 GMT)
LOVECon: Text-driven Training-Free Long Video Editing with ControlNet [9.8] 本稿では,このギャップを埋めることを目的として,学習自由拡散モデルに基づく長大ビデオ編集のための,シンプルで効果的なベースラインを確立する。
ControlNet上にパイプラインを構築し、テキストプロンプトに基づいて様々な画像編集タスクを抽出する。
本手法は,ユーザの要求に応じて数百フレームの動画を編集する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:04:03 GMT)
On the Disconnect Between Theory and Practice of Neural Networks: Limits of the NTK Perspective [9.8] ニューラル・タンジェント・カーネル(NTK)は、大規模ニューラルネットワークの振る舞いを記述する理論的枠組みとして注目されている。
カーネル体制への収束率の定量化の現在の結果は、これらの利点を利用するには、それらよりも桁違いに広いアーキテクチャが必要であることを示唆している。
本研究は,大規模建築物の実用的関連挙動を予測するための限界条件について検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:59:41 GMT)
Scalable Surrogate Verification of Image-based Neural Network Control Systems using Composition and Unrolling [9.6] 本研究では,実世界に代わって条件付き生成逆数ネットワーク(cGAN)をイメージジェネレータとして訓練し,サロゲート検証手法を提案する。
我々は、cGANとニューラルネットワークコントローラとともにシステムのダイナミクスを構成することで、一段階のエラーを克服する。
単一ステップの合成を繰り返し、制御ループの複数のステップを大規模ニューラルネットワークに展開することで、マルチステップエラーを低減する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:56:53 GMT)
Improving Multi-lingual Alignment Through Soft Contrastive Learning [9.5] 本稿では,事前学習した単言語埋め込みモデルによって測定された文の類似性に基づいて,多言語埋め込みを整合させる新しい手法を提案する。
翻訳文ペアが与えられた場合、言語間埋め込み間の類似性は、単言語教師モデルで測定された文の類似性に従うように、多言語モデルを訓練する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:51:35 GMT)
Individual Contributions as Intrinsic Exploration Scaffolds for Multi-agent Reinforcement Learning [9.4] 固有探査スカッフルド(ICES)としての個人貢献
ICESは、グローバルな視点から各エージェントの貢献を評価することによって、探索を動機付ける新しいアプローチである。
Google Research Football (GRF) や StarCraft Multi-agent Challenge (SMAC) など,まばらな報酬を伴う協調型ベンチマークタスクの実験
論文参考訳(メタデータ) (Tue, 28 May 2024 12:18:19 GMT)
Stochastic Adversarial Networks for Multi-Domain Text Classification [9.4] 本稿では,ドメイン固有の特徴抽出器のパラメータを革新的にモデル化するAdversarial Network(SAN)を紹介する。
提案手法は, ドメインラベルの平滑化と頑健な擬似ラベル正規化を統合して, 対人訓練の安定性を高める。
2つの主要なMDTCベンチマークで評価したSANの性能は、現在の最先端手法に対する競争優位性を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:02:38 GMT)
Connecting the Dots: Is Mode-Connectedness the Key to Feasible Sample-Based Inference in Bayesian Neural Networks? [9.3] ベイズニューラルネットワークに対するサンプルベース推論(SBI)における大きな課題は、ネットワークのパラメータ空間のサイズと構造である。
重みと関数空間の特徴的関係を取り入れることで,SBIを成功させることが可能であることを示す。
本稿では、競合性能と不確実性定量化のための効果的な解として、ディープアンサンブルアプローチを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:13:08 GMT)
IM-Context: In-Context Learning for Imbalanced Regression Tasks [9.3] 本稿では,従来の非重み付き学習手法の代替として,文脈内学習へのパラダイムシフトを提案する。
インコンテキスト学習(In-context learning)とは、インコンテキストサンプルからなるプロンプトシーケンスが与えられたモデル自体を条件にすることができることを指す。
理論的および経験的両視点から,プロンプトシーケンスがモデル性能に与える影響について検討した。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:10:51 GMT)
SarcNet: A Novel AI-based Framework to Automatically Analyze and Score Sarcomere Organizations in Fluorescently Tagged hiPSC-CMs [9.2] ヒト多能性幹細胞由来心筋細胞(hiPSC-CMs)におけるサルコメア構造の定量化は、心臓疾患の病態の解明、薬物スクリーニングの改善、再生医療の進展に不可欠である。
本稿では, 細胞画像を活用し, 細胞の特徴を統合し, 分化の開始からhiPSC-CMのサーコメア構造を自動的に評価する, 新たなディープラーニングベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:48:10 GMT)
Utilitarian Algorithm Configuration for Infinite Parameter Spaces [9.1] 有効性アルゴリズム構成は、与えられたアルゴリズムのパラメータ空間を自動的に検索し、その性能を最適化する手法である。
無限パラメータ空間を効率的に探索するためのCOUP(Continuous, Optimistic Utilitarian Procrastination)を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:58:07 GMT)
AlignIQL: Policy Alignment in Implicit Q-Learning through Constrained Optimization [9.1] 暗黙のQ-ラーニングはオフラインRLの強力なベースラインとして機能する。
我々は,この問題を最適化問題として定式化することで,暗黙的な政策決定問題(IPF)を解決する方法を紹介した。
IQLやIDQLと比較して、当社のメソッドはIQLの単純さを維持し、暗黙のポリシー決定問題を解決する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:01:03 GMT)
ForecastGrapher: Redefining Multivariate Time Series Forecasting with Graph Neural Networks [9.0] 本稿では、複雑な時間的ダイナミクスと系列間相関をキャプチャするフレームワークであるForecastGrapherを紹介する。
提案手法は,各系列の時間的変動を反映するカスタムノード埋め込みの生成,系列間の相関関係を符号化する適応的隣接行列の構築,および第3に,ノード特徴分布の多様化によるGNNの表現力の増大という,3つの重要なステップによって支えられている。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:40:20 GMT)
Towards Understanding Inductive Bias in Transformers: A View From Infinity [9.0] 変換器は、列空間のより置換対称関数に偏りがちである。
対称群の表現論は定量的な解析的予測に利用できることを示す。
我々は、WikiTextデータセットは、実際に置換対称性の程度を持っていると主張している。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:41:26 GMT)
Model-Based Diffusion for Trajectory Optimization [8.9] データ無しで軌道最適化(TO)問題を解決するために拡散法を用いた最適化手法であるモデルベース拡散(MBD)を導入する。
MBDは外部データを必要としないが、様々な性質のデータと自然に統合して拡散過程を制御できる。
MBDは、最先端の強化学習とサンプリングベースのTOメソッドを上回り、コンタクトリッチなタスクに挑戦する。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:14:25 GMT)
Limits of Theory of Mind Modelling in Dialogue-Based Collaborative Plan Acquisition [8.9] 心の理論(ToM)モデリングは、非対称なスキルセットと知識を持つ設定において、不足する知識予測を改善することができる。
我々は、CPAの性能が自分の知識の欠如を予測するときにほぼ2倍になるので、ToMモデリングによる改善は減少することを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:33:23 GMT)
Adversarial Attacks on Hidden Tasks in Multi-Task Learning [8.9] マルチタスクモデルの非ターゲットタスクと共有バックボーンネットワークからの知識を活用する新しい逆攻撃手法を提案する。
CelebAとDeepFashionデータセットの実験結果から,隠れタスクの精度を劣化させる手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:33:16 GMT)
Potential Field Based Deep Metric Learning [8.7] ディープメトリック学習は、意味的に意味のある表現空間を学ぶためにネットワークを訓練する。
物理学における静電場に着想を得た新しい合成DMLモデルを提案する。
このような減衰は,クラス内変動が大きく,ラベルノイズも大きい実世界のデータセットの性能向上に有効であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:10:06 GMT)
A Theoretical Framework for an Efficient Normalizing Flow-Based Solution to the Schrodinger Equation [8.6] 量子力学における中心的な問題は、分子や物質に対する電子シュロディンガー方程式を解くことである。
アンザッツを用いた解法は, サンプリングが安価であるが, 必要な量子力学的性質を満足する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:42:15 GMT)
Multi-Layer Personalized Federated Learning for Mitigating Biases in Student Predictive Analytics [8.6] 本稿では,学生グループ化基準の異なる層にまたがる推論精度を最適化する多層パーソナライズドフェデレーションラーニング手法を提案する。
提案手法では,個別の学生サブグループに対するパーソナライズされたモデルがグローバルモデルから導出される。
3つの実世界のオンラインコースデータセットの実験は、既存の学生モデルベンチマークよりも、我々のアプローチによって達成された大きな改善を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:10:16 GMT)
Edinburgh Clinical NLP at MEDIQA-CORR 2024: Guiding Large Language Models with Hints [8.5] 複数のプロンプト戦略を用いて医学的誤りを識別・修正する一般LSMの能力を評価する。
より小さな微調整モデルからエラースパン予測を2つの方法で組み込むことを提案する。
8ショット+CoT + ヒントによる最高のパフォーマンスのソリューションは、共有タスクのリーダーボードで6位です。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:20:29 GMT)
Density-Softmax: Efficient Test-time Model for Uncertainty Estimation and Robustness under Distribution Shifts [8.4] 密度-ソフトマックスは、不確実性推定のためのサンプリング不要な決定論的なフレームワークである。
我々は,このモデルがミニマックス不確実性リスクの解であることを示した。
本手法は,不確実性と堅牢性の観点から,最先端技術と競合する結果を享受する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:27:54 GMT)
Token-level Direct Preference Optimization [8.2] 微調整された事前訓練された大規模言語モデルは、それらを人間の価値観や意図と整合させるのに不可欠である。
トークンレベルでポリシーを最適化することにより,LLMと人間の嗜好を一致させる新しいアプローチである,トークンレベルの直接選好最適化(TDPO)を導入する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:37:40 GMT)
Human-like Category Learning by Injecting Ecological Priors from Large Language Models into Neural Networks [8.2] 我々は、生態学的に合理的なメタ学習推論(ERMI)と呼ばれるモデルのクラスを開発する。
ERMIは2つの異なる実験で、人間のデータを他の7つの認知モデルより定量的に説明します。
ERMIの生態学的に有効な事前評価により,OpenML-CC18分類ベンチマークで最先端のパフォーマンスを達成できることが示されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:40:53 GMT)
GesGPT: Speech Gesture Synthesis With Text Parsing from GPT [8.2] ジェスチャー合成は重要な研究分野として注目されている。
深層学習に基づくアプローチは目覚ましい進歩を遂げているが、テキストに存在するリッチな意味情報を見落としていることが多い。
本稿では,大規模言語モデルの意味解析機能を活用したジェスチャ生成手法であるGesGPTを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:53:44 GMT)
GesGPT: Speech Gesture Synthesis With Text Parsing from ChatGPT [8.2] ジェスチャー合成は重要な研究分野として注目されている。
深層学習に基づくアプローチは目覚ましい進歩を遂げているが、テキストに存在するリッチな意味情報を見落としていることが多い。
本稿では,大規模言語モデルの意味解析機能を活用したジェスチャ生成手法であるGesGPTを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:53:44 GMT)
ChatGPT as the Marketplace of Ideas: Should Truth-Seeking Be the Goal of AI Content Governance? [8.2] ChatGPTとアイデア理論の市場は、少なくとも4つの共通の特徴(アリーナ、手段、目的、欠陥)を示している。
この研究は、いわゆるAIコンテンツリスクはAI企業が生み出すものではなく、情報エコシステム全体に固有のものだと主張している。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:38:24 GMT)
Online Calibration of a Single-Track Ground Vehicle Dynamics Model by Tight Fusion with Visual-Inertial Odometry [8.2] 視覚的慣性眼圧計(VIO)を用いた車輪付き地上車両の単トラックダイナミックスモデルに厳密に融合する新しいアプローチST-VIOを提案する。
提案手法は,将来的な制御入力における前方予測の精度を向上させるために,動的モデルをオンラインで校正し,適応する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:54:15 GMT)
Attention-based sequential recommendation system using multimodal data [8.1] 本稿では,画像やテキスト,カテゴリといった項目のマルチモーダルなデータを用いた注意に基づくシーケンシャルレコメンデーション手法を提案する。
Amazonデータセットから得られた実験結果は,提案手法が従来の逐次レコメンデーションシステムよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:41:05 GMT)
Automatic detection of cognitive impairment in elderly people using an entertainment chatbot with Natural Language Processing capabilities [8.0] 本稿では,高齢者の認知障害を透過的にモニタリングする知的会話システムについて紹介する。
自然言語生成技術を用いて,更新されたニュース項目から対話フローを自動生成する。
このシステムは、質問に対する回答のゴールドスタンダードを推論し、認知能力を自動的に評価する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:17:48 GMT)
Stochastic Spiking Neural Networks with First-to-Spike Coding [8.0] スパイキングニューラルネットワーク (SNN) は、その生物の楽観性とエネルギー効率で知られている。
本研究では,SNNアーキテクチャにおける新しい計算手法と情報符号化方式の融合について検討する。
提案手法のトレードオフを,精度,推論遅延,スパイク空間性,エネルギー消費,データセットの観点から検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:33:58 GMT)
Lazy Safety Alignment for Large Language Models against Harmful Fine-tuning [7.9] 安全アライメントを備えた大規模言語モデル(LLM)は、有害なデータと混在するデータセットを微調整することで、脱獄することができる。
調整段階の状態を分離して、アライメントとユーザデータセットを最適化することで、脱獄効果を緩和できることを示す。
textbfLazy(textbfi) textbfalignment(textbfLisa)を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:53:43 GMT)
On the Analysis of Quantum Repeater Chains with Sequential Swaps [7.9] 逐次エンタングルメントスワップを用いた2方向量子リピータチェーンの性能評価を行った。
メモリデコヒーレンス、ゲート不完全、リンクレベルの不完全な絡み合いの発生について検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:03:09 GMT)
World Models for General Surgical Grasping [7.9] 我々は,世界モデルに基づく深層強化学習フレームワーク"Grasp Anything for Surgery"(GAS)を提案する。
外科的把握のためのピクセルレベルのビジュモータポリシーを学習し,汎用性とロバスト性の両方を向上する。
また,グリップ対象物体がグリップから落下した後に,背景変動,目標乱れ,カメラポーズ変動,運動制御誤差,画像ノイズ,再彫刻を含む6つの条件に対して,大きなロバスト性を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:11:12 GMT)
Characterizing dynamical criticality of many-body localization transitions from the Fock-space perspective [7.8] MBLT系におけるFock空間における変位のダイナミクス,放射状確率分布の拡散について検討する。
準周期場によって誘導されるMBLTの熱力学限界に対する信頼性の高い外挿は、計算可能なシステムサイズに対しても可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:01:36 GMT)
Sparsity- and Hybridity-Inspired Visual Parameter-Efficient Fine-Tuning for Medical Diagnosis [7.7] 大きなビジョンモデルLVMは、膨大なデータを医療診断に転送することができる。
近年の取り組みは、少量の重量を訓練し、残りを凍結する効率的な微調整(PEFT)を活用している。
SH-PEFTは、タスク固有の戦略とタスクに依存しない戦略の両方をハイブリッド化することによって、その重要性に基づいて、少量の重量を選定し、訓練する。
診断精度の観点からLVMを医療診断に転送する際の最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:56:39 GMT)
Motion-Informed Deep Learning for Brain MR Image Reconstruction Framework [7.6] 運動は臨床MRIの約30%に存在していると推定されている。
深層学習アルゴリズムは画像再構成タスクと運動補正タスクの両方に有効であることが示されている。
画像と正しい動きを同時に高速化する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:16:35 GMT)
Learning to Detour: Shortcut Mitigating Augmentation for Weakly Supervised Semantic Segmentation [7.6] 弱いラベルを用いた弱教師付きセマンティックセグメンテーション(WSSS)は,画素レベルのラベルを取得するためのアノテーションコストを軽減するために活発に研究されている。
本稿では,WSSS のためのショートカット緩和機能 (SMA) を提案する。これは,トレーニングデータに見られないオブジェクトと背景の組み合わせの合成表現を生成し,ショートカット機能の使用を減らす。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:07:35 GMT)
Lifelong Learning and Selective Forgetting via Contrastive Strategy [7.6] Lifelong Learningは、以前のタスクのキャパシティを維持しながら、新しいタスクに対して優れたパフォーマンスでモデルをトレーニングすることを目的としている。
いくつかの実践シナリオでは、プライバシの問題による望ましくない知識をシステムに忘れる必要がある。
本稿では,LSF(Learning with Selective Forgetting)を用いた学習のためのコントラスト戦略に基づく新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:57:48 GMT)
A Vlogger-augmented Graph Neural Network Model for Micro-video Recommendation [7.5] 本稿では, vloggers の効果を考慮した vlogger-augmented graph neural network model VA-GNN を提案する。
具体的には、ユーザ、マイクロビデオ、vloggerをノードとして三部グラフを構築し、異なるビューからユーザの好みをキャプチャする。
次のユーザとビデオのインタラクションを予測する際に、ビデオ自体とvloggerに対するユーザの好みを適応的に組み合わせます。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:13:29 GMT)
Decoupling Learning and Decision-Making: Breaking the $\mathcal{O}(\sqrt{T})$ Barrier in Online Resource Allocation with First-Order Methods [7.5] 意思決定から学習を分離する新しいアルゴリズムフレームワークを導入する。
初めて、この新しいフレームワークで、一階述語メソッドが、$mathcalO(sqrtT)$を後悔できることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:43:21 GMT)
Bias in Motion: Theoretical Insights into the Dynamics of Bias in SGD Training [7.5] 機械学習システムは、データの望ましくない特徴を活用してバイアスを取得し、異なるサブポピュレーションの精度に影響を与えることが多い。
本稿では, ガウス混合モデルを用いて, 教師学生によるデータサブポピュレーションのモデル化におけるバイアスの進化について検討する。
この発見を公平性と堅牢性に適用することで、不均一なデータと突発的な特徴がバイアスを発生し増幅する方法について、いつ、どのように、どのように、どのようにして、そして、どのようにして、そのバイアスを増大させるかを説明します。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:50:10 GMT)
Delving into Differentially Private Transformer [7.5] 本稿では,差分プライバシを用いたトランスフォーマーモデルのトレーニング問題について考察する。
我々の処理はモジュラーであり、DPトランスフォーマーをトレーニングする問題を、DPバニラニューラルネットをトレーニングするより基本的な問題に還元することである。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:04:09 GMT)
Solvent-Aware 2D NMR Prediction: Leveraging Multi-Tasking Training and Iterative Self-Training Strategies [7.5] 実験2次元NMRスペクトルにおける原子2次元NMR交差ピークの予測とアノテートピークの予測のための機械学習モデルを訓練するための反復的教師なし学習(IUL)手法を提案する。
我々は19,000個のヘテロ核単一量子コヒーレンス(HSQC)スペクトルでモデルをトレーニングし、専門家アノテーションで500個のHSQCスペクトルでテストし、さらに別の専門家注釈付きHSQCデータセットで2つの従来手法(ChemDrawとMestrenova)と比較した。
HSQCクロスピーク予測では,13Cシフトで2.035ppm,0.163ppm,1HのMAEを達成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:44:24 GMT)
Instruction Tuning with Retrieval-based Examples Ranking for Aspect-based Sentiment Analysis [7.5] アスペクトベースの感情分析(ABSA)は、特定の側面に関連する感情情報を識別し、企業や組織に対してより深い市場洞察を提供する。
近年の研究では、ABSAを生成タスクとして再構成する命令チューニングの固定例が提案されている。
本研究では,ABSAタスクの検索に基づくサンプルランキングを用いた指導学習手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:39:10 GMT)
Wasserstein Gradient Flow over Variational Parameter Space for Variational Inference [7.4] 変分推論(VI)は、変分パラメータを調整し、変分分布を真の後部と密に整合させる最適化問題である。
この最適化問題に対処するためのワッサーシュタイン勾配降下法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:05:10 GMT)
Wasserstein Gradient Flow over Variational Parameter Space for Variational Inference [7.4] 変分推論(VI)は、変分パラメータを調整し、変分分布を真の後部と密に整合させる最適化問題である。
この最適化問題に対処するためのワッサーシュタイン勾配降下法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:05:10 GMT)
Is machine learning good or bad for the natural sciences? [7.4] MLの導入によって、強い、望ましくない統計バイアスがもたらされる状況が示されている。
例えば、MLモデルを用いて物理(または第一原理)シミュレーションをエミュレートすると、強いバイアスが発生する。
別の例として、データセットのラベル付けにレグレッションを使用する場合、制御されていないバイアスを取らなくても、下流のジョイントやアンサンブル分析では使用できない。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:01:52 GMT)
Controllable Text Summarization: Unraveling Challenges, Approaches, and Prospects -- A Survey [7.4] ジェネリックテキスト要約アプローチは、個々のユーザの特定の意図やニーズに対処できないことが多い。
我々は、制御可能なテキスト要約(CTS)タスクを形式化し、その共有特性と目的に応じて制御可能な属性を分類する。
この結果から, CTSの潜在的な解決策と今後の方向性を探りながら, 限界と研究ギャップを明らかにした。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:04:50 GMT)
Remeasuring the Arbitrage and Sandwich Attacks of Maximal Extractable Value in Ethereum [7.4] 最大抽出可能な価値(MEV)は、ブロックチェーンエコシステムの繁栄を促進する。
2022年の合併以前、約6億7500万ドルがMEVで抽出された。
私たちの研究は将来のMEV関連の研究に光を当てるでしょう。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:17:15 GMT)
A Vision-Based Navigation System for Arable Fields [7.3] 耕作地における視覚に基づくナビゲーションシステムは、農業用ロボットナビゲーションの未調査領域である。
現在のソリューションは、しばしば作物特有のものであり、照明や雑草密度といった限られた個々の条件に対処することを目的としている。
本稿では、安価な視覚センサを用いたディープラーニングに基づく認識アルゴリズムの集合体について提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:07:38 GMT)
FAIntbench: A Holistic and Precise Benchmark for Bias Evaluation in Text-to-Image Models [7.3] FAIntbenchは、テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスの総合的かつ正確なベンチマークである。
我々はFAIntbenchを7種類の大規模T2Iモデルの評価に適用し,人間による評価を行った。
その結果, FAIntbenchが種々のバイアスの同定に有効であった。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:18:00 GMT)
Towards robust prediction of material properties for nuclear reactor design under scarce data -- a study in creep rupture property [7.1] 主な課題は、データセットの可用性と、データ、モデル、予測の不確実性についての十分な考慮である。
本稿では, 原子炉設計における材料特性の信頼性予測を目的とした, 不確実性と事前知識の両面でのメタラーニングに基づくアプローチを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:20:14 GMT)
The HTTP Garden: Discovering Parsing Vulnerabilities in HTTP/1.1 Implementations by Differential Fuzzing of Request Streams [7.0] HTTP/1.1で不一致を解析することは、Webサーバに対する数多くの攻撃の基盤となっている。
我々のシステムであるHTTP Gardenは、元のサーバの解釈とHTTPリクエストのゲートウェイサーバの変換の両方を調べます。
私たちのツールを使って、人気のあるWebサーバで100以上のHTTPパースバグを発見し、報告しました。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:48:05 GMT)
EffoVPR: Effective Foundation Model Utilization for Visual Place Recognition [7.0] 本稿では,視覚的位置認識のための基盤モデルの可能性を活用するための,シンプルながら強力なアプローチを提案する。
まず、自己注意層から抽出した機能が、VPRの強力なリランカとして機能することを実証する。
次に、内部のViT層をプールに利用した単一ステージの手法が、最先端の結果をもたらすグローバルな特徴を生み出すことを実証した。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:24:41 GMT)
Synchronization on circles and spheres with nonlinear interactions [6.9] 球面上の$n$の点のダイナミクスを$mathbbRd$$$d geq 2$) と考えて、内部積の $varphi$ に従って互いに惹きつける。
varphi$が線型(varphi(t) = t$)であるとき、各点は様々な接続シナリオにおいて共通値(つまり同期)に収束する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:24:30 GMT)
Jump-teaching: Ultra Efficient and Robust Learning with Noisy Label [6.8] そこで本研究では,トレーニング中のラベルのずれを識別する新しい手法を提案する。
インタープレイを分離し、損失からより多くのセマンティック情報をマイニングするために、ジャンプ方式の更新を行うネットワークは1つだけです。
提案手法は, ピークメモリフットプリントの高速化, ピークメモリフットプリントの0.56タイム, 各種ノイズ設定による最先端処理よりも優れたロバスト性を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:22:10 GMT)
DeTox: Toxic Subspace Projection for Model Editing [6.8] 我々は,無調律アライメント(DeTox)を導入し,毒性低減のユースケースで有効性を示す。
DeToxは、モデルパラメータ空間内の有毒な部分空間を識別し、検出された部分空間を投影することでモデル毒性を低減する、サンプル効率のよいモデル編集アプローチである。
DeTox は DPO よりもサンプリング効率が高く,さらにノイズの多いデータに対するロバスト性を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:55:16 GMT)
Scalable Non-Cartesian Magnetic Resonance Imaging with R2D2 [6.7] 本研究では,非電子磁気共鳴画像再構成のための新しい手法を提案する。
我々は「Residual to-Residual DNN series for high range imaging (R2D2)」を利用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:02:12 GMT)
The Binary Quantized Neural Network for Dense Prediction via Specially Designed Upsampling and Attention [6.7] 単一予測タスクから高密度予測タスクへバイナリニューラルネットワーク(BNN)の成功を伝達するための効果的なアップサンプリング手法と効率的な注意計算手法を提案する。
我々の注意法は計算の複雑さを100倍に削減できるが、元の効果は維持できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:12:33 GMT)
Continuous Transition between Bosonic Fractional Chern Insulator and Superfluid [6.6] 分数チャーン絶縁体(FCI)と超流動普遍性(SF)の連続的な遷移は直接的に確認されていない。
ボソニックなFCIから、平面チャーンバンドの1/2の充填で、それぞれ$M$と$Gamma$で縮合された2つのSF状態への直接遷移を求める。
我々の研究は、位相秩序相と自然連続対称性破壊相の間の連続的なFCI-SF遷移の直接的な数値的な証拠を提示する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:19:00 GMT)
The Impact of Geometric Complexity on Neural Collapse in Transfer Learning [6.6] 損失面の平坦さと神経崩壊は、最近、有用な事前学習指標として現れている。
実験と理論を通じて、事前学習されたネットワークの幾何学的複雑さに影響を与えるメカニズムが神経崩壊に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:17:51 GMT)
A Margin-based Multiclass Generalization Bound via Geometric Complexity [6.6] ニューラルネットワークに対するマージンベース多クラス一般化境界について検討する。
ネットワークの余分な正規化幾何学的複雑さでスケールする一般化誤差に新たな上限を導出する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:08:58 GMT)
Mixed Semi-Supervised Generalized-Linear-Regression with applications to Deep-Learning and Interpolators [6.5] 本稿では、ラベルのないデータを用いて、半教師付き学習法(SSL)を設計する手法を提案する。
それぞれに$alpha$という混合パラメータが含まれており、ラベルのないデータに与えられる重みを制御する。
我々は,標準教師付きモデルと比較して,大幅な改善を実現するための方法論の有効性を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:45:48 GMT)
Cognitive Insights and Stable Coalition Matching for Fostering Multi-Agent Cooperation [6.5] 本稿では,ToMレベルの異なるエージェントの強度を利用する新しい連立機構を提案する。
我々の研究は、ToMを活用して、より高度で人間らしいコーディネーション戦略を構築する可能性を実証しています。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:59:33 GMT)
The Past, Present, and Future of Automation in Model-Driven Engineering [6.5] モデル駆動工学(MDE)における自動化の歴史について論じる。
我々は、MDEにおける自動化をさらに改善するための視点を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:14:16 GMT)
Linguistic Collapse: Neural Collapse in (Large) Language Models [6.5] スケーリングで発展する$mathcalNC$プロパティが一般化に結びついていることが分かる。
我々の研究は、言語モデリングの斬新でより困難な設定にまで拡張されるにつれて、$mathcalNC$の一般性を強調します。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:46:11 GMT)
When simplicity meets effectiveness: Detecting code comments coherence with word embeddings and LSTM [6.4] コードコメントは、プログラマに実用的な情報を提供するため、ソフトウェア開発において重要な役割を果たす。
開発者はコードを更新した後、コメントをそのまま残す傾向があり、2つのアーティファクトの間に相違が生じます。
コードスニペットが与えられたら、そのコメントが一貫性があり、コードの背後にある意図をよく反映しているかどうかを特定することが重要です。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:58:18 GMT)
Structure-Preserving Transformers for Sequences of SPD Matrices [6.4] トランスフォーマーをベースとした自動アテンション機構は、様々なコンテキスト依存データ型の分析に成功している。
本稿では,対称正定値行列の列を分類する機構を提案する。
本手法は,脳波由来の共分散行列を標準データセットからタイムリーに自動睡眠ステージングに応用し,ステージワイドのパフォーマンスを高いレベルに向上させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:49:51 GMT)
Low-Resource Crop Classification from Multi-Spectral Time Series Using Lossless Compressors [6.4] 深層学習は多スペクトル時間データを用いた作物分類の精度を大幅に向上させた。
ラベル付きサンプルが少ない低リソース環境では、深層学習モデルは不十分なデータのために性能が悪い。
本稿では,これらの状況に対処するために,ディープラーニングモデルに代わる非学習的代替案を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:28:12 GMT)
Towards a theory of how the structure of language is acquired by deep neural networks [6.4] 自然言語の木の様構造を捉える階層的生成モデルを用いる。
トークンとトークンの相関は文法の隠れ変数の表現を構築するのに有効であることを示す。
トレーニングセットのサイズと効果的な相関範囲の関係はデータセットを超えていると推測する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:01:22 GMT)
ToonAging: Face Re-Aging upon Artistic Portrait Style Transfer [6.3] ポートレート・スタイル・トランスファーと組み合わさって, 顔のリエイジングのための新しいワンステージ手法を提案する。
同じPRドメイン内でトレーニングされた既存の顔のリエイジとスタイル転送ネットワークを活用します。
提案手法は,ドメインレベルの微調整手法に比べて柔軟性が高い。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:00:41 GMT)
MC-GTA: Metric-Constrained Model-Based Clustering using Goodness-of-fit Tests with Autocorrelations [6.2] 既存のクラスタリングアルゴリズムは、特徴類似性と距離距離とのリッチな相関を見落としている。
MC-GTAは, 自己相関測定に有効であることを示す。
強いベースラインを大きなマージンで上回る。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:35:05 GMT)
An empirical study of bloated dependencies in CommonJS packages [6.1] サーバサイドアプリケーションで完全に使用されていない肥大化した依存関係を調査するために、実証的研究を行う。
本稿では,ファイルアクセスを監視し,実行中にどの依存関係がアクセスされないかを決定するトレースベースの動的解析手法を提案する。
以上の結果から,パッケージマネージャにおける依存性のデブロ化に対するネイティブサポートは,依存関係維持の負担を大幅に軽減する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:04:01 GMT)
EcoRank: Budget-Constrained Text Re-ranking Using Large Language Models [6.1] 我々は予算が与えられた業績を最大化する方法について研究する。
本稿では,テキストの再ランク付けを行うための予算制約付き手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:34:57 GMT)
RT-GS2: Real-Time Generalizable Semantic Segmentation for 3D Gaussian Representations of Radiance Fields [6.1] ガウススプラッティングを用いた最初の一般化可能なセマンティックセマンティックセグメンテーション法であるRT-GS2を紹介する。
提案手法は27.03 FPSのリアルタイム性能を実現し,既存の手法に比べて901倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:34:28 GMT)
Good Tools are Half the Work: Tool Usage in Deep Learning Projects [6.0] SE4DL(Software Engineering for Deep Learning)への関心が高まっている。
調査したGitHubリポジトリの約63%には、少なくとも1つの従来のSEツールが含まれていました。
ソフトウェア構築ツールは最も広く採用されていますが、その逆は管理ツールやメンテナンスツールにも当てはまります。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:13:22 GMT)
Wehrl Entropy and Entanglement Complexity of Quantum Spin Systems [5.9] 量子状態のWehrlエントロピーはコヒーレント状態分布関数(フーシミ関数)のエントロピーである
粒子番号が 2leq Nleq 20$ の様々な絡み合った純状態のWehrlエントロピーを計算する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:11:37 GMT)
Unveiling the Cycloid Trajectory of EM Iterations in Mixed Linear Regression [5.9] 2成分混合線形回帰(2MLR)における反復の軌跡と期待最大化(EM)アルゴリズムの収束率について検討する。
近年, ノイズレスおよび高SNR環境下での2MLRにおけるEMの超線形収束が確立されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:46:20 GMT)
Capturing dynamics and thermodynamics of a three-level quantum heat engine via programmable quantum circuits [5.9] 本研究は、量子回路上の3レベル量子熱をモデル化するために、クラウス表現とSz.-Nagy拡張定理を用いる。
動的モデルの有効性は、個体群の変化を追跡することによって検証される。
量子回路シミュレーションの安定性は、理論的およびシミュレーション結果の比較分析により精査される。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:30:04 GMT)
Operational Interpretation of the Sandwiched Rényi Divergence of Order 1/2 to 1 as Strong Converse Exponents [5.8] 我々は、$alphain(frac12,1)$のサンドイッチ付きR'enyi分散と、その誘起量子情報量を提供する。
具体的には、(a)最大相対エントロピーの滑らか化、(b)量子プライバシー増幅、(c)量子情報の疎結合について考察する。
結果は、$alphain(frac12,1)$のサンドイッチ付きR'enyi分散と、その誘導量子R'enyi条件エントロピーと量子R'enyi相互情報によって与えられる。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:57:41 GMT)
The 2024 Brain Tumor Segmentation (BraTS) Challenge: Glioma Segmentation on Post-treatment MRI [5.7] 治療後のグリオーマMRIに対する2024 Brain tumor (BraTS)チャレンジは、最先端の自動セグメンテーションモデルのコミュニティ標準とベンチマークを提供する。
競合他社は、4つの異なる腫瘍サブリージョンを予測するために、自動セグメンテーションモデルを開発する。
モデルは別個の検証とテストデータセットで評価される。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:07:55 GMT)
Multi-Armed Bandits with Network Interference [5.7] 我々は,学習者が$mathcalA$アクション(カウント)を$T$ラウンド以上の$N$ユニット(グッド)に逐次割り当てて,後悔を最小限に抑えるマルチアームバンディット(MAB)問題について検討する。
従来のMAB問題とは異なり、各ユニットの報酬は他のユニットに割り当てられた処理に依存する。
後悔を最小限に抑えるため、単純で線形回帰に基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:01:50 GMT)
ReZero: Boosting MCTS-based Algorithms by Backward-view and Entire-buffer Reanalyze [5.7] 本稿では,モンテカルロ木探索アルゴリズムにおける木探索の高速化を目的としたReZeroという手法を提案する。
具体的には、ある子ノードの値を事前に推定する逆ビュー再利用手法を用いて、トレーニングサンプルを再解析する。
アタリ環境での実験とボードゲームにより、ReZeroは高いサンプル効率を維持しながらトレーニング速度を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:49:18 GMT)
Safe Reinforcement Learning in Black-Box Environments via Adaptive Shielding [5.6] 未知のブラックボックス環境におけるRLエージェントのトレーニングは、ドメイン/タスクに関する事前の知識が利用できない場合にさらに安全性の高いリスクをもたらす。
本稿では、トレーニング中の状態-動作ペアの安全性と安全性を区別する新しいポストシールド技術であるADVICE(Adaptive Shielding with a Contrastive Autoencoder)を紹介する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:47:21 GMT)
Efficient Prior Calibration From Indirect Data [5.6] 本稿では,データから先行モデルを学習すること,特にノイズ観測プロセスを通じて得られた間接データの多元的実現から先行モデルを学習することに関心がある。
フォワードモデルの効率的な残差ベースニューラル演算子近似を提案し,これをプッシュフォワードマップと同時学習できることを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:34:41 GMT)
Large Language Models as Partners in Student Essay Evaluation [5.5] 本稿では,3つのシナリオで実際の学生エッセイを用いて,Large Language Models (LLMs) を用いて評価を行った。
その結果, LLMと教職員評価の相関関係は, 事前に特定したルーリックとの相互比較シナリオにおいて強い相関性を示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:28:50 GMT)
Guidance and Control Networks with Periodic Activation Functions [5.5] 本稿では,隠蔽層における周期的アクティベーション関数を用いた誘導制御ネットワーク(G&CNET)の修正版を提案する。
得られたG&CNETは,3つの異なる制御シナリオにおいて,より高速にトレーニングし,全体的なトレーニング誤差を低くすることを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:45:30 GMT)
Comparative Analysis of Open-Source Language Models in Summarizing Medical Text Data [5.4] 大規模言語モデル(LLM)は,非構造化テキストデータに対する問合せおよび要約処理において,優れた性能を示した。
医用要約タスクにおけるオープンソースのLCMの性能分析のための評価手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:22:20 GMT)
DCT-Based Decorrelated Attention for Vision Transformers [5.4] 視覚変換器の注目機能に対する新しいDCTベースの圧縮手法を提案する。
我々のDCTベースの圧縮は、クエリ、キー、値の重み行列のサイズを減らします。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:56:12 GMT)
Belief Scene Graphs: Expanding Partial Scenes with Objects through Computation of Expectation [5.3] 本稿では,部分的な3次元シーングラフのユーティリティ駆動拡張であるBelief Scene Graphsの概念を提案する。
本稿では,任意の3次元シーングラフ上での信念(予想とも呼ばれる)の計算のためのグラフベースの学習手法を提案する。
本稿では,意味的注釈付き実生活3D空間に基づく3次元シーングラフデータセットを作成するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:42:21 GMT)
Out-of-plane magnetic phase diagram of Kitaev quantum spin liquid candidate Na2Co2TeO6 [5.3] 我々はハニカム磁石Na2Co2TeO6とCo3d7の相図を平面外磁場でマッピングした。
データは単一イオン異方性を持つXXZモデルと、おそらく小さな北エフとガンマの交換相互作用によって説明できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:50:25 GMT)
Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge [5.3] WinoVisは、マルチモーダルコンテキストにおける代名詞の曖昧さに関するテキスト・ツー・イメージ・モデルに特化して設計されたデータセットである。
連続したモデルバージョンの評価によると、段階的な進歩にもかかわらず、Stable Diffusion 2.0はWinoVisで56.7%の精度を達成した。
さらなるエラー分析は、複雑な視覚の世界を解釈し、相互作用する能力において、テキスト・ツー・イメージ・モデルを進めることを目的とした将来の研究にとって重要な領域を特定する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:13:46 GMT)
Fidelity-Based Smooth Min-Relative Entropy: Properties and Applications [5.2] 忠実度に基づく滑らかなミン相対エントロピーはデータ処理の不等式を含むいくつかの基本的な性質を満たすことを示す。
また、忠実度に基づく滑らかなミン相対エントロピーが、一般的な資源理論における運用タスクに対してワンショットのバウンダリを提供することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:42:25 GMT)
Large Language Model-Driven Curriculum Design for Mobile Networks [5.2] 本稿では,大規模言語モデル(LLM)を活用してカリキュラム設計を自動化し,モバイルネットワークにおける強化学習(RL)の適用性を高める新しいフレームワークを提案する。
モバイルネットワークが6G時代に向かって進化するにつれて、その複雑さと動的な性質を管理することが大きな課題となる。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:50:35 GMT)
PaDPaF: Partial Disentanglement with Partially-Federated GANs [5.2] フェデレーテッド・ラーニングは、多くの潜在的な現実のアプリケーションで人気のある機械学習パラダイムとなっている。
本研究では,グローバルクライアント非依存とローカルクライアント固有の生成モデルを組み合わせた新しいアーキテクチャを提案する。
提案モデルでは,グローバルな一貫した表現を暗黙的に切り離すことで,プライバシーとパーソナライゼーションを実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:27:00 GMT)
Learning Informative Health Indicators Through Unsupervised Contrastive Learning [5.2] 本研究は、健康指標を学習するための、新規で汎用的で教師なしのアプローチを提案する。
アプローチは2つのタスクと異なる特性を持つケーススタディに基づいて評価される。
提案手法は, 製粉機械の摩耗に追従した健康指標を効果的に学習することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:03:29 GMT)
Pipette: Automatic Fine-grained Large Language Model Training Configurator for Real-World Clusters [5.2] 大規模言語モデル(LLM)の訓練は、膨大な計算能力とメモリ容量の要求のために困難であることが知られている。
本稿では,実世界のクラスタを対象としたLLM自動微粒化トレーニングであるPipetteを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:59:44 GMT)
Partial Mobilization: Tracking Multilingual Information Flows Amongst Russian Media Outlets and Telegram [5.2] 我々は、2022年を通して、ロシアの16のメディアが732のTelegramチャンネルとどのように対話し、利用したかを調査した。
我々は、ニュースメディアがTelegramを通じて既存の物語を広めるだけでなく、メッセージプラットフォームから資料を発信していることを示す。
例えば、我々の研究のウェブサイト全体では、2.3%(ura.news)から26.7%(ukraina.ru)までの記事がTelegram上での活動から生まれたり反したりした内容について論じている。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:49:14 GMT)
ClavaDDPM: Multi-relational Data Synthesis with Cluster-guided Diffusion Models [5.1] マルチリレーショナル(マルチテーブル)データを合成するための新しいアプローチであるClavaDDPMを紹介する。
ClavaDDPMはクラスタリングラベルを仲介として、特に外部キー制約に焦点を当てたテーブル間の関係をモデル化する。
ClavaDDPMは、これらの長距離依存に対する既存のメソッドよりも優れており、シングルテーブルデータに対するユーティリティメトリクスに競争力があることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:42:18 GMT)
Assessing Large Language Models on Climate Information [5.0] 本稿では,Large Language Models (LLMs) を評価するための,科学コミュニケーション研究を基盤とした総合的な評価フレームワークを提案する。
本フレームワークは,8次元と30の課題にまたがるLLM世代を詳細に解析し,提示応答と妥当性の両方を強調した。
スケーラブルな監視のための新しいプロトコルを導入し、AIアシストと関連する教育のレーダに依存します。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:36:49 GMT)
BO4IO: A Bayesian optimization approach to inverse optimization with uncertainty quantification [5.0] この研究はデータ駆動逆最適化(IO)に対処する。
目的は最適化モデルにおける未知のパラメータを、最適あるいは準最適と仮定できる観測された決定から推定することである。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:52:17 GMT)
FAdam: Adam is a natural gradient optimizer using diagonal empirical Fisher information [5.0] 我々はアダムの対角的経験的フィッシャー情報行列(FIM)を厳密に分析した。
我々の分析は、元のAdamアルゴリズムの欠陥を明らかにし、提案された修正に繋がる。
修正アルゴリズムであるFisher Adam (FAdam) は、様々な領域で優れた性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:07:28 GMT)
Towards Integrating Emerging AI Applications in SE Education [5.0] 本稿では,AI分野における現在のトレンドの体系的分析の予備的結果を示す。
我々は、AIアプリケーションとさらなる研究分野の一連の機会について論じる。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:21:45 GMT)
Naive Bayes Classifiers over Missing Data: Decision and Poisoning [4.8] 我々は、欠落した値を含む可能性のある汚いデータセット上で、MLの証明可能な堅牢性について研究する。
テストポイントがそのテストポイントに対して同じ予測を返した場合、テストポイントはMLにとって確実に堅牢である。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:18:55 GMT)
LLM experiments with simulation: Large Language Model Multi-Agent System for Process Simulation Parametrization in Digital Twins [4.8] 本稿では,観察,推論,決定,要約の4種類のエージェントを含むマルチエージェントフレームワークを提案する。
開発したシステムは,シミュレーションのパラメトリゼーションと推論を用いて,シミュレーションを制御し,目的を達成するためのパラメータのセットを決定する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:59:40 GMT)
Adaptive debiased SGD in high-dimensional GLMs with steaming data [4.7] 我々は、高次元一般化線形モデルにおいて、オンライン推論に新しいアプローチを導入する。
本手法はシングルパスモードで動作し,時間と空間の複雑さを著しく低減する。
提案手法は,ADL (Approximated Debiased Lasso) と呼ばれ,有界な個人確率条件の必要性を緩和するだけでなく,数値性能も著しく向上することを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:36:48 GMT)
D-CoRP: Differentiable Connectivity Refinement for Functional Brain Networks [4.7] 脳ネットワークの既存のモデルは、通常、脳の領域に焦点を当てたり、脳の結合性の複雑さを見落としたりする。
我々は脳の接続性を改善するための識別可能なモジュールを開発した。
実験の結果,提案手法は様々なベースラインモデルの性能を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:49:52 GMT)
Instrumental Variable Estimation for Compositional Treatments [4.7] 構成データは、生態学における種数、単細胞シークエンシングデータ由来の細胞型組成物、および微生物研究におけるアンプリコン量データを含む。
ここでは、構成が原因となる機器変数設定において、構成データに対する因果的視点を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:25:04 GMT)
Explaining Multi-modal Large Language Models by Analyzing their Vision Perception [4.6] 本研究では,画像埋め込み成分に着目し,MLLMの解釈可能性を高める新しい手法を提案する。
オープンワールドのローカライゼーションモデルとMLLMを組み合わせることで、同じビジョンの埋め込みからテキストとオブジェクトのローカライゼーション出力を同時に生成できる新しいアーキテクチャを構築する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:18:20 GMT)
MatSynth: A Modern PBR Materials Dataset [4.5] Mat Synthは4000以上のCC0超高分解能PBR材料のデータセットである。
Mat Synth はプロジェクトページ https://www.gvecchio.com/matsynth.com で公開されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:22:32 GMT)
AttenCraft: Attention-guided Disentanglement of Multiple Concepts for Text-to-Image Customization [4.5] AttenCraft(アテンクラフト)は、複数のコンセプトの絡み合わせのための注意誘導方式である。
異なる概念からの特徴獲得の非同期性を緩和するために,一様サンプリングと再加重サンプリング方式を導入する。
本手法は,画像アライメントの観点からベースラインモデルより優れており,テキストアライメントに適合して動作する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:50:14 GMT)
The Cost of Arbitrariness for Individuals: Examining the Legal and Technical Challenges of Model Multiplicity [4.5] 本稿では,乗法に起因する様々な個人的関心事について考察する。
これは、これらの懸念に関する実証的な調査と、法的な観点からの包括的な分析の両方を提供し、カナダの反差別法においてこれらの問題がどのように認識されているかに対処する。
本稿では,現行のモデル乗法における法的要件を満たすための技術的課題と,現行法とモデル選択における任意性の影響との法的ギャップについて論じる。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:54:03 GMT)
Its Not a Modality Gap: Characterizing and Addressing the Contrastive Gap [4.4] CLIPのような2エンコーダコントラストモデルでは、モダリティギャップが報告されている。
これらの要因を全て考慮しても、対照的な損失は実際にトレーニング中にギャップを生じさせます。
この対照的なギャップがCLIP空間の低均一性に起因する証拠を提示する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:28:07 GMT)
Transformer and Hybrid Deep Learning Based Models for Machine-Generated Text Detection [4.4] 本稿では,SemEval 2024 Task 8: Multigenerator, Multi domain, and Multilingual Black-Box Machine-Generated Text Detectionの取り組みについて述べる。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:48:08 GMT)
DistALANER: Distantly Supervised Active Learning Augmented Named Entity Recognition in the Open Source Software Ecosystem [4.4] 本稿では,オープンソースソフトウェアシステムに適したエンティティ認識(NER)技術を提案する。
提案手法は,2段階の遠隔教師付きアノテーションプロセスを用いて,注釈付きソフトウェアデータの不足に対処することを目的としている。
我々のモデルは最先端のLLMよりもかなり優れています。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:54:44 GMT)
Comprehensive Analysis of Network Robustness Evaluation Based on Convolutional Neural Networks with Spatial Pyramid Pooling [4.4] 複雑なネットワークを理解し、最適化し、修復するための重要な側面である接続性の堅牢性は、伝統的にシミュレーションを通じて評価されてきた。
空間ピラミッドプールネットワーク(SPP-net)を用いた畳み込みニューラルネットワーク(CNN)モデルの設計により,これらの課題に対処する。
提案したCNNモデルは,全ての除去シナリオにおいて,攻撃曲線とロバストネスの両値の正確な評価を一貫して達成していることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:43:55 GMT)
Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection [4.3] 本稿では,著作権保護のためのオンライン共有プラットフォームにおける課題である画像コピー検出について述べる。
本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争力のある性能を実現する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:49:52 GMT)
The Unified Balance Theory of Second-Moment Exponential Scaling Optimizers in Visual Tasks [4.3] SGDと適応性はより広い推論の下で統一可能であることを示唆する。
いくつかの古典的データセットやネットワーク上で,バランス係数の違いがトレーニングプロセス全体に与える影響を確認する試験を行った。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:09:22 GMT)
Neural Dynamic Data Valuation [4.3] ニューラルダイナミックデータ評価(NDDV)という最適制御の観点から,新しいデータ評価手法を提案する。
本手法は,データ最適制御状態の感度を用いて,データ評価を正確に識別する理論的解釈を持つ。
さらに,データポイントのユニークな特徴を捉え,データポイントと平均場状態の相互作用による公平性を確保するために,データ再重み付け戦略を実装した。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:34:15 GMT)
Understanding Intrinsic Socioeconomic Biases in Large Language Models [4.3] 本稿では,社会経済的バイアスを定量化するために,100万の英語文からなる新しいデータセットを提案する。
以上の結果から,GPT-2のような確立されたモデルと,Llama 2やFalconのような最先端のモデルの両方において,社会経済的バイアスが広範にあることが明らかとなった。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:54:44 GMT)
A Survey on Large Language Models from Concept to Implementation [4.2] 近年のLarge Language Models (LLM) の進歩により、自然言語処理(NLP)アプリケーションの範囲が拡大している。
本稿では,これらのモデルの多面的応用について検討し,GPTシリーズに着目した。
この調査は、コーディングや問題解決といった従来のタスクに革命をもたらす人工知能(AI)駆動ツールの変革的な影響に焦点を当てている。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:34:26 GMT)
Approximating Human Models During Argumentation-based Dialogues [4.2] 説明可能なAI計画(XAIP)の主な課題は、モデルの和解である。
本稿では,AIエージェントによる確率的人間モデル学習と更新を可能にする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:22:18 GMT)
fMRI predictors based on language models of increasing complexity recover brain left lateralization [4.2] モデルのサイズが大きくなるにつれて、左右の非対称性が徐々に現れ、左右の脳相関の差もスケーリング法則に従うことが示される。
この発見は、大きな言語モデルを用いた脳活動の計算的解析と、言語に対する左半球優位を示す失語患者からの古典的な観察を照合する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:24:52 GMT)
Aligning in a Compact Space: Contrastive Knowledge Distillation between Heterogeneous Architectures [4.1] 本稿では,低周波成分を用いたコントラスト知識蒸留(Contrastive Knowledge Distillation, LFCC)フレームワークを提案する。
具体的には、教師モデルと学生モデルの両方から中間特徴の低周波成分を抽出するために、マルチスケールの低域通過フィルタを設計する。
本稿では,ImageNet-1K と CIFAR-100 のベンチマークにおいて,LFCC が優れた性能を発揮することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:44:42 GMT)
The Computational Complexity of Formal Reasoning for Encoder-Only Transformers [4.1] エンコーダのみの変圧器(EOT)の形式推論の課題と可能性について検討する。
EOTを考えるとSATは決定不可能であり,表現性コミュニティでは一般的に考慮されている。
自明なケースの他に、量子化されたEOT、すなわち固定幅の算術で制限されたEOTは、その注意力の制限によりSATの決定可能性に繋がる。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:30:43 GMT)
Pandora's White-Box: Precise Training Data Detection and Extraction in Large Language Models [4.1] 我々は,大規模言語モデル(LLM)に対する最先端のプライバシ攻撃を開発する。
事前訓練されたLLMに対する新たなメンバーシップ推論攻撃(MIA)は、ベースライン攻撃の数百倍の精度で実行される。
微調整では, ベースモデルと微調整モデルとの損失率に基づく単純な攻撃により, ほぼ完全なMIA性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:42:01 GMT)
From Learning to Optimize to Learning Optimization Algorithms [4.1] 我々は、古典的アルゴリズムが従うが、これまでは、学習の最適化(L2O)には使われていない重要な原則を特定します。
我々は,データ,アーキテクチャ,学習戦略を考慮した汎用設計パイプラインを提供し,古典最適化とL2Oの相乗効果を実現する。
我々は,新しい学習強化BFGSアルゴリズムを設計し,テスト時に多くの設定に適応する数値実験を行うことにより,これらの新原理の成功を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:30:07 GMT)
Counterfactual Explanations for Multivariate Time-Series without Training Datasets [4.0] CFWoTは、トレーニングデータセットが利用できない場合にCFEを生成する新しい強化学習ベースのCFE手法である。
複数のデータセット上の4つのベースラインに対するCFWoTの性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:15:09 GMT)
JADS: A Framework for Self-supervised Joint Aspect Discovery and Summarization [4.0] 私たちのソリューションはトピックの発見と要約をひとつのステップに統合します。
テキストデータから,JADS(Joint Aspect Discovery and Summarization Algorithm)が入力からアスペクトを検出する。
提案手法は,地上の真理と高いセマンティックアライメントを実現し,現実的である。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:01:57 GMT)
Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [4.0] 本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:59:16 GMT)
Non-negative Tensor Mixture Learning for Discrete Density Estimation [4.0] 非負のテンソル分解に対する期待最大化に基づくフレームワークを提案する。
マルチボディ近似の閉形式解は、Mステップで全てのパラメータを同時に更新することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:28:28 GMT)
NeRAF: 3D Scene Infused Neural Radiance and Acoustic Fields [4.0] NeRAFは、音場と放射場を共同で学習する手法である。
新規なビューと空間化されたオーディオの両方を新しい位置で合成する。
NeRAFは以前の作業よりも大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:17:41 GMT)
The future of human-centric eXplainable Artificial Intelligence (XAI) is not post-hoc explanations [3.8] 本稿では、ポストホックな説明可能性から解釈可能なニューラルネットワークアーキテクチャの設計へのシフトを提案する。
我々は、人間中心型XAIの5つのニーズを特定し、ニューラルネットワークの解釈と設計のための2つのスキームを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:14:16 GMT)
PeerFL: A Simulator for Peer-to-Peer Federated Learning at Scale [3.7] この研究は、ピアツーピアのフェデレーション学習ツールと、広く使われているネットワークシミュレータNS3を統合する。
本実験では,大規模計算資源利用におけるシミュレータの効率性を示す。
フレームワークはオープンソースで、コミュニティへの使用と拡張が可能である。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:30:18 GMT)
Probing the Information Theoretical Roots of Spatial Dependence Measures [3.7] 空間依存度とエントロピーの情報理論測度との間には関係がある。
自己情報レンズによる空間自己相関の理論的根源を探る。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:44:35 GMT)
MMCTAgent: Multi-modal Critical Thinking Agent Framework for Complex Visual Reasoning [3.7] MMCTAgentは、複雑な視覚的推論タスクにおける現在のMLLM固有の制限に対処するために設計された、新しい批判的思考エージェントフレームワークである。
人間の認知プロセスや批判的思考にインスパイアされたMCCTAgentは、複数のモーダル情報を反復的に分析し、クエリを分解し、戦略を計画し、その推論を動的に進化させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:55:41 GMT)
Benchmarking Skeleton-based Motion Encoder Models for Clinical Applications: Estimating Parkinson's Disease Severity in Walking Sequences [3.7] PD患者の歩行パターンを解析するための大規模人間の動作データセットを訓練した一般人動作エンコーダ。
運動障害社会の予測能力について,6つの事前訓練されたヒト運動エンコーダモデルの評価を行った。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:29:10 GMT)
Efficient Algorithms for Regularized Nonnegative Scale-invariant Low-rank Approximation Models [3.6] 低ランク近似モデルに固有のスケール不変性は、予期せぬ有益効果と有害効果の両方で暗黙の正則化を引き起こすことを示す。
正規化された非負の低ランク近似を多数処理する一般化行列化最小化アルゴリズムを導出する。
我々は,スパース非負行列因子分解,リッジ規則化カノニカルポリアディック分解,スパース非負タッカー分解への貢献を紹介する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:58:49 GMT)
An adaptive transfer learning perspective on classification in non-stationary environments [3.6] 非定常ラベルシフトを伴う半教師付き分類問題を考える。
本研究では,適応的伝達学習の統計的手法に基づく代替手法について検討する。
それぞれのテスト時間におけるテストエラーに縛られた高い確率的後悔を確立し、限界ラベル確率の未知のダイナミクスに自動的に適応する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:57:29 GMT)
Emergent Oscillating bound states in a semi-infinite linear waveguide with a point-like $Λ$-type quantum emitter driven by a classical field [3.6] 発振バウンド状態(英: oscillating bound state)とは、連続体モードによって媒介される励起が持続的に発振する現象である。
本稿では、代替導波路QEDシステムによる振動束縛状態の現象を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:28:35 GMT)
Optimizing Sharpe Ratio: Risk-Adjusted Decision-Making in Multi-Armed Bandits [3.6] 我々は、シャープ比(SR)が金融時系列の特徴付けにおける重要なパラメータであると考えている。
我々は、レギュレット最小化(RM)とBest Arm Identification(BAI)のために、UCB-RSSRと呼ばれるSRを最適化する新しいアルゴリズムを提案する。
UCB-RSSRは、他のSR最適化バンディットアルゴリズムであるU-UCB Cassel et al(2023)よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:24:36 GMT)
Safe Multi-Agent Reinforcement Learning with Bilevel Optimization in Autonomous Driving [3.5] そこで本稿では,二段階最適化を用いたスタックルバーグモデルに基づく安全なMARL法を提案する。
Constrained Stackelberg Q-learning (CSQ) と Constrained Stackelberg Multi-Agent Deep Deterministic Policy Gradient (CS-MADDPG) の2つの実用的なアルゴリズムを開発した。
CSQ と CS-MADDPG のアルゴリズムは,Bi-AC,MACPO,MAPPO-L などの強力な MARL ベースラインよりも,報酬と安全性の面で優れていた。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:15:18 GMT)
Towards Dialogues for Joint Human-AI Reasoning and Value Alignment [3.4] 共同推論(すなわち「問い合わせ」)を支援することを目的とした人間-AI対話の実現は、AIによる意思決定が人間の価値観や嗜好と一致していることを保証する上で重要である、と我々は主張する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:29:57 GMT)
Human-Cobot collaboration's impact on success, time completion, errors, workload, gestures and acceptability during an assembly task [3.4] 120人の参加者が単純で複雑な組み立て作業を実現しました。
50%が他のヒト(H/H)、50%がコボット(H/C)である
コボットで作業することで、タスクの複雑さが人間の作業負荷や出力品質に与える影響を減らします。
H/Cカップルは成功する確率が高いが、タスクを実現するにはより多くの時間とジェスチャーが必要になる。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:30:28 GMT)
LLaMA-NAS: Efficient Neural Architecture Search for Large Language Models [3.4] 大規模言語モデル(LLM)は、自然言語処理、複雑な推論、感情分析、その他のタスクを解決する。
これらの能力はメモリと計算コストが非常に高く、ほとんどのハードウェアプラットフォームでのLLMの使用を妨げている。
ワンショットNASを用いたLLaMA2-7Bに基づくパレート最適ネットワークアーキテクチャの探索手法を提案する。
特定の標準ベンチマークタスクに対して、事前訓練されたLLaMA2-7Bネットワークは不要に大きく、複雑であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:20:44 GMT)
Large Margin Discriminative Loss for Classification [3.4] 本稿では,Deep Learning の文脈において,大きなマージンを持つ新たな識別的損失関数を提案する。
この損失は、クラス内コンパクト性とクラス間分離性によって表されるニューラルネットの識別力を高める。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:10:45 GMT)
An Innovative Networks in Federated Learning [3.4] 本稿では,Wavelet Kolmogorov-Arnold Networks(Wav-KAN)の連合学習への応用について述べる。
我々は,連続ウェーブレット変換 (CWT) と離散ウェーブレット変換 (DWT) の両方を検討した。
さまざまなデータセットで大規模な実験を行い、解釈可能性、計算速度、トレーニング、テスト精度の点で、Wav-KANの優れた性能を実証した。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:20:01 GMT)
Quantum Active Learning [3.3] 量子ニューラルネットワークのトレーニングは通常、教師付き学習のための実質的なラベル付きトレーニングセットを必要とする。
QALはモデルを効果的にトレーニングし、完全にラベル付けされたデータセットに匹敵するパフォーマンスを達成する。
我々は,QALがランダムサンプリングベースラインに乗じて負の結果を微妙な数値実験により解明する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:39:54 GMT)
The Knesset Corpus: An Annotated Corpus of Hebrew Parliamentary Proceedings [3.2] 1998年から2022年までのヘブライの立法手続のコーパスであるコーパス・クネセトを提示する。
コーパスは政治的議論のスタイルにおける歴史的展開を調べるのに有効であることを示す。
また,男性話者と女性話者のスタイルの違いについても検討した。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:23:39 GMT)
Near-Infrared and Low-Rank Adaptation of Vision Transformers in Remote Sensing [3.2] 近赤外反射率(NIR)を測定するマルチスペクトルセンサを用いて植物の健康状態を動的に監視できる
このような可能性にもかかわらず、高解像度のNIR画像の取得と注釈付けは、ディープニューラルネットワークのトレーニングにおいて重要な課題となっている。
本研究では、RGB領域で事前訓練された視覚変換器(ViT)バックボーンの利点について検討し、NIR領域の下流タスクに対する低ランク適応について検討した。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:24:07 GMT)
SGD method for entropy error function with smoothing l0 regularization for neural networks [3.1] エントロピー誤差関数はニューラルネットワークで広く使われている。
本稿では,フィードフォワードニューラルネットワークの規則化を円滑に行うエントロピー関数を提案する。
ニューラルネットワークを効果的に学習し、より正確な予測を可能にするため、私たちの仕事は新しくなっています。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:54:26 GMT)
Vulnerability Detection in C/C++ Code with Deep Learning [3.1] 我々は、C/C++プログラムのソースコードから抽出したプログラムスライスでニューラルネットワークをトレーニングし、ソフトウェア脆弱性を検出する。
この結果から,ソースコードの特徴の相違と,脆弱なプログラムスライスと非脆弱なプログラムスライスをバランスよく組み合わせることで,バランスの取れた精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:37:28 GMT)
A Broad Comparative Evaluation of Software Debloating Tools [3.1] ソフトウェアデ肥大化ツールは、bloatと呼ばれる不要なコードを削除することで、プログラムのセキュリティとパフォーマンスを改善しようとしている。
筆者らは,10年間のデブロ化文学と,デブロ化生態系に関する知識を分類するために現在,商業開発中のいくつかのツールを調査した。
評価は、20のベンチマークプログラム、12のパフォーマンス、セキュリティ、正当性の測定ツールに基づいて行われた。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:33:19 GMT)
Magnitude-based Neuron Pruning for Backdoor Defens [3.1] ディープニューラルネットワーク(DNN)は、バックドア攻撃に弱いことが知られている。
最近の研究では、特定のニューロン群を刈り取ることで、感染したDNNからバックドアを消去できることが明らかになっている。
バックドアニューロンの検出とプーンのためのMNP法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:05:39 GMT)
Exponential sensitivity revival of noisy non-Hermitian quantum sensing with two-photon drives [3.0] 非エルミタンセンサの感度回復と安定性に対する損失と利得の影響を解析的に特徴付け,強調する。
本論文は、損失と利得を積極的に調整することにより、感度を著しく向上する方法を開放する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:44:02 GMT)
Stateful Large Language Model Serving with Pensieve [2.9] Pensieve はマルチターン会話 LLM サービスに最適化されたシステムである。
Pensieveは、以前処理された履歴をキャッシュすることで、リクエスト間での会話状態を維持する。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:34:37 GMT)
Interpretable classification of wiki-review streams [2.9] 本研究の目的は、どのレビューをリバージョンするかを予想し、説明することである。この方法で、編集者がなぜリバージョンされるのかを知らせる。
提案手法はストリームベース処理を用い,各イベントのプロファイリングと分類モデルを更新する。
提案手法は自己説明可能な分類アルゴリズムに依存しているため,レビューが逆転あるいは逆転に分類された理由を理解することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:28:58 GMT)
Statistical Linear Models in Virus Genomic Alignment-free Classification: Application to Hepatitis C Viruses [2.9] 本研究は, 遺伝子タイピングおよび部分的および完全ゲノムのサブタイプにおける線形分類器の力について検討した。
C型肝炎ウイルス(HCV)に応用される。
全体として、いくつかの分類器は実験変数の正確な組み合わせのセットを与えられた上でうまく機能する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:23:11 GMT)
Feasibility and benefits of joint learning from MRI databases with different brain diseases and modalities for segmentation [2.8] 脳の病態やモダリティのセットが異なるマルチモーダルMRIデータベースのジョイントトレーニングが実現可能であり,実用的利益をもたらすことを示す。
単一のモデルで、様々なモダリティのセットでトレーニング中に遭遇した病理を分割することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:28:10 GMT)
CodecNeRF: Toward Fast Encoding and Decoding, Compact, and High-quality Novel-view Synthesis [2.7] 本稿では,ニューラルエンコーダおよびデコーダアーキテクチャであるCodecNeRFについて述べる。
また,生成したNeRF表現を新しいテストインスタンスに効率よく適応させるファインタニング手法を開発した。
提案したCodecNeRFは、150倍以上の圧縮性能と20倍の符号化時間で前例のない圧縮性能を達成した。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:30:35 GMT)
Back to the Drawing Board for Fair Representation Learning [2.7] フェア表現学習(FRL)手法の評価は,下流のフェアネスと1つのタスクに対する精度のトレードオフに主眼を置いている。
本研究では,この手法がFRLの当初の動機と根本的に一致していないことを論じる。
適切な評価手順が満たすべき4つの基準を満たすベンチマークであるTransFairを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:23:04 GMT)
Time Series Representation Models [2.7] 時系列解析は、そのスパース特性、高次元性、一貫性のないデータ品質のため、依然として大きな課題である。
近年のトランス技術の発展により,予測や計算能力が向上している。
イントロスペクションに基づく時系列解析のための新しいアーキテクチャ概念を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:25:31 GMT)
Context is Important in Depressive Language: A Study of the Interaction Between the Sentiments and Linguistic Markers in Reddit Discussions [2.7] 本研究では,抑うつにおける言語マーカーと感情表現の文脈としての議論トピックの影響について検討した。
我々の感情分析では、抑うつ者の感情の強さは、コントロールよりも否定的感情と肯定的感情の両方が高いことが判明した。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:19:39 GMT)
Anomaly detection for the identification of volcanic unrest in satellite imagery [2.6] 本稿では, 火山の変形を異常として識別する目的で, 衛星データに対する教師なし深層学習の利用について検討する。
我々の検出器はパッチ分布モデリング(PaDiM)に基づいており、検出性能は重み付き距離で向上する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:10 GMT)
Self-Guiding Exploration for Combinatorial Problems [2.6] 自己ガイド探索(Self-Guiding Exploration, SGE)は, 組合せ問題の解法の性能向上を目的としている。
SGEは自律的に動作し、CPタスクごとに複数の思考軌道を生成する。
その後、これらの軌道を動作可能なサブタスクに分解し、順次実行し、結果を洗練して最適な結果を保証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:26:54 GMT)
Spanish and LLM Benchmarks: is MMLU Lost in Translation? [2.6] 本稿では,MMLU(Massive Multitask Language Understanding)ベンチマークについて考察する。
ベンチマークの選択されたカテゴリは、Azure TranslatorとChatGPT4を使用してスペイン語に変換され、ChatGPT4上で動作する。
結果は、失敗した項目のかなりの部分が、ベンチマークの翻訳の誤りによるものであることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:13:40 GMT)
BioBERT-based Deep Learning and Merged ChemProt-DrugProt for Enhanced Biomedical Relation Extraction [2.5] 我々のアプローチは、新しいマージ戦略を用いて、ChemProtとD薬局のデータセットを統合する。
本研究は, バイオメディカル研究と臨床実習における自動情報抽出の可能性を強調した。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:34:01 GMT)
Ensuring Ground Truth Accuracy in Healthcare with the EVINCE framework [2.5] 機械学習モデルによる誤ったラベル付きデータの臨床実践への伝播は容認できない。
本稿では,1)診断精度の向上を目的としたEVINCEと,2)誤診の修正とトレーニングデータエラーの最小化を目的としたシステムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:11:50 GMT)
Non-Hermitian quantum walks and non-Markovianity: the coin-position interaction [2.5] 非エルミート・ハミルトニアンの下で進化する系の還元力学を構成する2つの方法を比較する。
計量形式論の下では、サブシステムへの情報バックフローのパワーローの崩壊は、$mathcalPT$-unbrokenから壊れた位相への遷移の明確な兆候を与える。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:59:06 GMT)
Quantum circuits for block encoding of structured matrices in ocean acoustics [2.4] ブロック符号化は、量子コンピュータで一般的に使用されるデータ入力モデルである。
ブロック符号化方式の実現可能性を示すために,2つの数値例を用いた。
また、動詞|MATLAB|の量子回路の対応する符号も提示する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:49:58 GMT)
Interpret3C: Interpretable Student Clustering Through Individualized Feature Selection [2.4] 教育におけるクラスタリング、特にMOOCのような大規模オンライン環境でのクラスタリングは、多様な学生のニーズを理解し、適応するために不可欠である。
既存のクラスタリングアプローチは、機能の重要性における個々の違いを無視し、均質化された機能セットに依存していることが多い。
本稿では,解釈可能なニューラルネットワーク(NN)を教師なし学習コンテキストに組み込んだ,新たなクラスタリングパイプラインであるInterpret3Cを紹介する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:32:05 GMT)
Analysis of Multiscale Reinforcement Q-Learning Algorithms for Mean Field Control Games [2.4] MFCG(Mean Field Control Games)は、多数のエージェント間の競争ゲームである。
MFCGを解くために,3次元強化Q-Learning (RL) アルゴリズムの収束性を証明する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:24:31 GMT)
Post-Fair Federated Learning: Achieving Group and Community Fairness in Federated Learning via Post-processing [2.4] フェアネスという概念は、グループフェアネスとコミュニティフェアネスという、連合学習の重要な問題として現れてきた。
本稿では,ポストFFL(Post-FFL)と呼ばれる,処理後のフェアフェデレーション学習フレームワークを提案し,分析する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:26:00 GMT)
Design Principles for Falsifiable, Replicable and Reproducible Empirical ML Research [2.3] 実証的研究は、機械学習領域において基本的な役割を担っている。
本稿では,実証研究の妥当性を維持するためのガイドラインを伴って,実証研究プロセスのモデルを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:37:59 GMT)
Graphomotor and Handwriting Disabilities Rating Scale (GHDRS):towards complex and objective assessment [2.3] 本研究の目的は,GDとHDの客観的診断と評価を可能にする新しい尺度(GS Graphomotor and Handwriting Disabilities Rating Scale)を導入することである。
GS設計の方法論の全体は、他の言語に適応できるように、極大に透明にされている。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:09:42 GMT)
A Framework for Assurance Audits of Algorithmic Systems [2.2] 本稿では,運用可能なコンプライアンスおよび保証外部監査フレームワークとして,基準監査を提案する。
AI監査も同様に、AI組織が人間の価値を害し、維持する方法でアルゴリズムを管理する能力について、ステークホルダーに保証を提供するべきだ、と私たちは主張する。
我々は、より成熟した金融監査産業の実践をAI監査に適用する上でのメリット、固有の制限、実装上の課題について、批判的な議論をすることで締めくくります。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:20:37 GMT)
Metaheuristics and Large Language Models Join Forces: Towards an Integrated Optimization Approach [2.2] 本稿では,メタヒューリスティックス(メタヒューリスティックス,メタヒューリスティックス,メタヒューリスティックス,メタヒューリスティックス)を改善するためのパターン認識ツールとして,LLM(Large Language Models)を利用した新しいアプローチを提案する。
結果として得られたハイブリッド手法は、ソーシャルネットワークベースの最適化問題の文脈でテストされ、既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:23:46 GMT)
MobileConvRec: A Conversational Dataset for Mobile Apps Recommendations [2.2] 会話型モバイルアプリレコメンデーションのためのベンチマークデータセットであるMobileConvRecを提示する。
MobileConvRecは、45のアプリカテゴリにまたがる12万以上のマルチターンレコメンデーション関連の会話で構成されている。
我々は、MobileConvRecが会話型モバイルアプリレコメンデーションの優れたテストベッドとして機能できることを実証した。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:53:16 GMT)
Arithmetic Reasoning with LLM: Prolog Generation & Permutation [2.2] GSM8Kベンチマークでは,Prologに基づく算術的問題解決がCoT生成に優れていることが示されている。
我々は、データ拡張によるより堅牢なLCMトレーニングのための基礎的真理予測をパーミュレートすることを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:13:25 GMT)
Learning-Based Link Anomaly Detection in Continuous-Time Dynamic Graphs [2.1] 連続時間動的グラフにおける異常検出は、学習に基づくアプローチの文脈において、まだ解明されていない分野である。
これらのグラフにおける異常なリンクを特定するために,リンクレベルの異常とグラフ表現学習の先駆的な構造解析を行った。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:05:41 GMT)
A Refined 3D Gaussian Representation for High-Quality Dynamic Scene Reconstruction [2.0] 近年,Neural Radiance Fields (NeRF) は3次元の3次元再構成に革命をもたらした。
3D Gaussian Splatting (3D-GS)は、ニューラルネットワークの暗黙の表現から離れ、代わりに、シーンを直接ガウス型の分布を持つ点雲として表現している。
本稿では,高品質な動的シーン再構成のための高精細な3次元ガウス表現を提案する。
実験の結果,提案手法は3D-GSによるメモリ使用量を大幅に削減しつつ,レンダリング品質と高速化の既存手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:12:22 GMT)
The Widening Gap: The Benefits and Harms of Generative AI for Novice Programmers [2.0] 初心者プログラマはメタ認知的認識と戦略の欠如により、しばしば問題解決に苦しむ。
多くの初心者がジェネレーティブAI(GenAI)を使ってプログラミングしている
その結果, 加速した学生と苦労した学生の間には, GenAIツールの使用が不運な部分があることが判明した。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:48:28 GMT)
Pytorch-Wildlife: A Collaborative Deep Learning Framework for Conservation [2.0] Pytorch-Wildlifeは、PyTorch上に開発されたオープンソースのディープラーニングプラットフォームである。
強力なAIモデルの作成、修正、共有のために設計されている。
アマゾン・レインフォレストにおける動物分類モデルの訓練や、ガラパゴス諸島における侵入性オポッサムの認識に利用されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:27:39 GMT)
On Bounded Advice Classes [2.0] 本研究では,有界アドバイスクラス,量子有界アドバイスクラス,ランダム化された有界アドバイスクラスの関係について検討する。
本研究は,アドバイス関数の複雑さに関する既存の研究において,技術の現状を改善した。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:16:10 GMT)
Graph Automorphism Group Equivariant Neural Networks [2.0] 置換同変ニューラルネットワークは通常、グラフ上に存在するデータから学習するために使用される。
学習可能で線形なAut$(G)$-evariant関数の完全な特徴付けを得ることにより、Aut$(G)$と等価なニューラルネットワークを構築する方法を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:25:00 GMT)
Complexity of Inexact Proximal Point Algorithm for minimizing convex functions with Holderian Growth [2.0] コンベックス関数を$gamma-$Holderian成長下で最小化するために、完全かつ不正確なPPAの漸近複雑性を導出する。
数値実験では, 既存の再起動バージョンよりも改善が見られた。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:09:53 GMT)
Context-Specific Refinements of Bayesian Network Classifiers [1.9] 分類器の新しいクラスとベイズネットワークの関係について検討する。
モデルにデータ駆動学習ルーチンを導入し実装する。
この研究は、非対称情報を埋め込んだモデルが分類精度を高めることを実証している。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:50:50 GMT)
Model-agnostic variable importance for predictive uncertainty: an entropy-based approach [1.9] 既存の説明可能性の手法が不確実性を考慮したモデルにどのように拡張できるかを示す。
我々は、不確実性の原因とモデル性能への影響の両方を理解するために、これらのアプローチの有用性を実証する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:15:16 GMT)
On the metric property of quantum Wasserstein divergences [1.9] 量子ワッセルシュタイン(英: Quantum Wasserstein)は、チャネルによって定義される量子ワッセルシュタインの修正版である。
我々は、分離可能なヒルベルト空間によって記述される全ての量子系に対して、量子ワッサーシュタインの発散に対する三角形の不等式を証明する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:20:02 GMT)
Learn to be Fair without Labels: a Distribution-based Learning Framework for Fair Ranking [1.9] 本研究では,未利用の公正度ラベルを対象の公正度分布に置き換えることにより,ラベルを必要としない分布ベースフェアラーニングフレームワーク(DLF)を提案する。
提案手法は,フェアネス関連トレードオフの制御性を高めつつ,フェアネス性能を向上する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:49:04 GMT)
Determining Domain of Machine Learning Models using Kernel Density Estimates: Applications in Materials Property Prediction [1.9] 我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。
確立された化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
相違性の高い尺度は、モデル性能の低さとモデル不確実性の評価の低さと関連している。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:41:16 GMT)
Classifying Overlapping Gaussian Mixtures in High Dimensions: From Optimal Classifiers to Neural Nets [1.8] 高次元重なり合うガウス混合モデル(GMM)データのバイナリ分類におけるベイズ最適決定境界の式を導出する。
我々は、実世界のデータにインスパイアされた合成GMMの実験を通じて、分類のために訓練されたディープニューラルネットワークが、導出した最適な分類器を近似する予測器を学習することを実証的に実証した。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:31 GMT)
Channel Reciprocity Based Attack Detection for Securing UWB Ranging by Autoencoder [1.8] ゴーストピーク攻撃に代表される様々な脅威がウルトラワイドバンド(UWB)システムのセキュリティ性能に関する懸念を引き起こしている。
本稿では,両方向のチャネルインパルス応答(CIR)特性をオートエンコーダを用いて比較する,低複雑性攻撃検出方式を提案する。
提案手法は,99%以上の攻撃検出成功率を実現し,低コストで現行システムに実装可能である。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:07:50 GMT)
Injecting Hierarchical Biological Priors into Graph Neural Networks for Flow Cytometry Prediction [1.8] 本研究では、単一セルのマルチクラス分類のためのグラフニューラルネットワーク(GNN)に階層的な事前知識を注入することを検討する。
本稿では,複数のGNNモデル,すなわちFCHC-GNNに適用可能な階層的なプラグイン手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:24:16 GMT)
A call for embodied AI [1.8] 我々は、人工知能の次の基本ステップとして、エンボディードAIを提案する。
Embodied AIの範囲を広げることで、認知アーキテクチャに基づく理論的枠組みを導入する。
このフレームワークはFristonのアクティブな推論原則と一致しており、EAI開発に対する包括的なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:07:37 GMT)
Mutation-Bias Learning in Games [1.7] 本稿では,進化ゲーム理論に基づくマルチエージェント強化学習アルゴリズムの2つの変種について述べる。
1つの変種は、レプリケータ・ミューテータ力学系の常微分方程式系との関係を証明できる。
より複雑なバリエーションは、Q-ラーニングベースのアルゴリズムとの比較を可能にする。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:02:44 GMT)
Exploring Thermography Technology: A Comprehensive Facial Dataset for Face Detection, Recognition, and Emotion [1.7] このデータセットは、顔の検出、認識、感情分析のためにUNI-T UTi165Aカメラを用いてキャプチャされた6823の熱画像を含む。
このデータセットは、様々な条件、色パレット、撮影角度、ズームレベルをカバーしており、温度範囲は10degCから400degC、解像度は19,200ピクセルである。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:50:03 GMT)
Dual-Path Multi-Scale Transformer for High-Quality Image Deraining [1.7] 高品質な画像再構成のためのデュアルパスマルチスケールトランス (DPMformer) を提案する。
この方法は、2つの異なるマルチスケールアプローチからのバックボーンパスと2つの分岐パスから構成される。
提案手法は,他の最先端手法と比較して有望な性能を実現する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:31:23 GMT)
Improving global awareness of linkset predictions using Cross-Attentive Modulation tokens [1.7] Cross-Attentive Modulation (CAM)トークンは、コンテキスト対応の計算を可能にするためにノードとエッジレベルの変調を条件付けるために使用されるクロスアテンティブユニットを導入している。
いくつかの置換不変アーキテクチャで実装し、私たちの仕事のメリットを証明するベンチマークをベンチマークします。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:25:17 GMT)
Trust and Terror: Hazards in Text Reveal Negatively Biased Credulity and Partisan Negativity Bias [1.7] 我々は,注釈付きXポストの新たなコレクションに基づいて,ハザードに関する情報を検出する新しいモデルを開発した。
GPT-4のようなゼロショットのアノテータプロキシの性能は良好であるだけでなく、抽出したハザード情報が他の指標と強く相関していないことを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:28:49 GMT)
Extreme Value Monte Carlo Tree Search [1.7] UCB1 Multi-Armed Bandit (MAB)はドメインに依存しない計画において最近まで限られた成功を収めてきた。
UCB1-Uniform/Power という2つのバンドレットを提案し,それをモンテカルロ木探索 (MCTS) に適用して古典的計画を行う。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:58:43 GMT)
The Evolution of Multimodal Model Architectures [1.7] この研究は、現代マルチモーダルランドスケープにおける4つの一般的なマルチモーダルモデルアーキテクチャパターンを特定し、特徴付ける。
特定されたアーキテクチャタイプは、いかなるマルチモーダルモデル開発も監視するのに役立つ。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:48:15 GMT)
Learning Staged Trees from Incomplete Data [1.6] モデル学習における欠落を処理するステージ木の最初のアルゴリズムについて紹介する。
計算実験では、新しい学習アルゴリズムの性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:00:23 GMT)
Unleashing the potential of prompt engineering: a comprehensive review [1.6] 大規模言語モデル(LLMs)と多モーダル言語モデル(MMLMs)の領域における即時工学の変容の可能性について
マルチモーダル・プロンプト・ラーニング(MaPLe)、条件付きプロンプト・ラーニング(Conditional Prompt Learning)、コンテキスト最適化(Context Optimization)といった革新的な手法によるマルチモーダルデータの統合を検討する。
この議論に批判的なのは、AIセキュリティの側面、特に迅速なエンジニアリングの脆弱性を悪用する敵攻撃である。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:38:19 GMT)
Hostile Counterspeech Drives Users From Hate Subreddits [1.5] 我々は、Redditにおけるヘイトサブレディット内の新参者に対する反音声の効果を分析した。
非敵対的なカウンタースピーチは、ユーザーがこれらの憎悪のサブレディットから完全に切り離すのを防ぐのに効果がない。
単一の敵対的な反論は、将来のエンゲージメントの可能性を大幅に減らす。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:12:41 GMT)
Generative AI Enhances Team Performance and Reduces Need for Traditional Teams [1.5] 生成AIによって強化されたチームは、人間のコラボレーションにのみ依存するチームよりも大幅に優れていた。
我々の分析によると、少数のチームメンバーによる集中型AIの使用は、分散エンゲージメントよりも効果的である。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:47:03 GMT)
From Conformal Predictions to Confidence Regions [1.4] モデルパラメータに対する信頼領域を確立するために,モデル出力に共形予測間隔を組み合わせたCCRを導入する。
本稿では,雑音に対する最小限の仮定の下でのカバレッジ保証について述べる。
本手法は, 完全あるいはクロスコンフォーマルなアプローチを含む, 分割共形予測とブラックボックス手法の両方に適用可能である。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:33:12 GMT)
Revisiting Step-Size Assumptions in Stochastic Approximation [1.4] この論文は、一般的なマルコフ的な設定でステップサイズの選択を再考する。
大きな結論は、$rho =0$ または $rho1/2$ の選択は、選択した設定でのみ正当化されるということである。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:11:05 GMT)
On Creativity and Open-Endedness [1.3] 本研究の目的は,コンピュータ・クリエイティビティ(CC)分野とALife分野の潜在的なつながりに関する議論を活性化することである。
CCの主な目標は、人工システムに創造性を付与することであり、ALifeはOEと人工イノベーションの研究と合成に多くの研究努力を注いでいる。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:57:37 GMT)
A Comprehensive Benchmarking Analysis of Fault Recovery in Stream Processing Frameworks [1.3] 本稿では, クラウドネイティブ環境における障害復旧性能, 安定性, 回復時間に関する包括的解析を行う。
以上の結果から,Flinkは最も安定しており,最高の障害回復の1つであることが示唆された。
K Kafka Streamsは適切なフォールトリカバリパフォーマンスと安定性を示しているが、イベントレイテンシは高い。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:51:20 GMT)
Learning About Structural Errors in Models of Complex Dynamical Systems [1.3] 構造的誤りを学習するための一般的なアプローチ、原則、アルゴリズムについて説明する。
このアプローチの鍵となるのは、複雑なシステムのモデルの中に構造的エラーモデルを含めることです。
間接データから構造誤差モデルがどのように学習できるかを論じる。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:02:48 GMT)
SST-GCN: The Sequential based Spatio-Temporal Graph Convolutional networks for Minute-level and Road-level Traffic Accident Risk Predictio [1.3] 本稿では,SST-GCN(Sequential based Spatio-Temporal Graph Convolutional Networks)を提案する。
実験により、SST-GCNは他の最先端モデルよりも小さなレベル予測の方が優れていることが示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:33:18 GMT)
COVID-19 Detection Based on Blood Test Parameters using Various Artificial Intelligence Methods [1.2] 2019年には、新型コロナウイルスによる新型コロナウイルス感染症SARS-CoV-2(SARS-CoV-2)という新たな課題に直面した。
本研究は、自己分類分類器を用いて、さまざまなAI手法を用いて、新型コロナウイルス患者と他者とを区別することを目的とした。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:51:46 GMT)
NotPlaNET: Removing False Positives from Planet Hunters TESS with Machine Learning [1.2] 我々は1次元畳み込みニューラルネットワーク(CNN)を構築し、楕円型バイナリやその他の偽陽性を潜在的な惑星候補から分離する。
我々のモデルは18分野のうち16分野の惑星の100%を保持し、一方は1つの惑星候補(0.3%)、残りのセクターは2つの惑星候補(0.6%)を誤ってフラグ付けする。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:29:40 GMT)
Active Implicit Object Reconstruction using Uncertainty-guided Next-Best-View Optimization [1.2] オブジェクト再構築時のセンサビューのアクティブな計画は、自律移動ロボットにとって不可欠である。
本稿では,暗黙の表現を能動的再構築タスクとシームレスに統合することを提案する。
本手法は,アクティブ・リコンストラクション作業におけるビュープランニングの精度と効率を効果的に向上する。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:38:39 GMT)
Pseudo-Hermitian Topology of Multiband Non-Hermitian Systems [1.2] 非エルミート多重バンドは2次元空間の例外的な点なしで位相的に非自明である。
我々の研究は、非エルミート的マルチバンドシステムの基本的で包括的な理解に基づいている。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:04:09 GMT)
The communication power of a noisy qubit [1.2] 量子力学の基本的な性質は、1つの量子ビットが少なくとも1ビットの古典的な情報を運ぶことができることである。
古典的なメッセージを伝えるために、ノイズの多い絡み合うクビットチャネルをノイズの多いビットチャネルに置き換えることができることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:21:36 GMT)
Bringing Rust to Safety-Critical Systems in Space [1.1] Rustは、バグ導入の可能性を劇的に削減し、より安全で安全なコードを生成することを目的としている。
この作業は、Rustで安全クリティカルな宇宙システムを開発するための一連のレコメンデーションを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:48:47 GMT)
OOVs in the Spotlight: How to Inflect them? [1.0] 語彙外条件(OOV)における形態的屈折に着目した。
LSTMとTransformerに基づく2つのシーケンス・ツー・シーケンス(Sequence-to-Sequence:seq2seq)モデルである。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:21:38 GMT)
Recurrent and Convolutional Neural Networks in Classification of EEG Signal for Guided Imagery and Mental Workload Detection [1.0] 本稿では,26名の学生を対象に,高密度アレイ脳波増幅器を用いたガイド画像緩和技術と精神作業負荷に関する調査を行った。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:29:06 GMT)
Does Geo-co-location Matter? A Case Study of Public Health Conversations during COVID-19 [1.0] 公衆衛生の専門家にとってのゴールは、マスキングやソーシャルディスタンシングといった地域的な成果に影響を及ぼす社会行動を促進することであった。
本研究では,公共衛生専門家(PHE)と公衆の地域的関わりがソーシャルメディアに与える影響について検討した。
その結果,ジオコロケーションは,特にマスキング,ロックダウン,教育などの話題に関する会話において,高いエンゲージメント率と関連していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:00:04 GMT)
CT-based brain ventricle segmentation via diffusion Schrödinger Bridge without target domain ground truths [1.0] クリニカルCTスキャンによる高効率かつ正確な脳室分画は、腹腔鏡下手術のような緊急手術には不可欠である。
我々は,CTセグメント化の真偽を必要とせず,新しい不確実性に留意した心室分画法を導入する。
提案手法では拡散型Schr"odinger Bridgeと残像U-Netを併用し,画像診断とMRI検査を併用した。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:17:58 GMT)
Multi-objective Representation for Numbers in Clinical Narratives Using CamemBERT-bio [0.9] 本研究の目的は,医学文献から抽出した数値を7つの生理カテゴリーに分類することである。
キーワード埋め込みをモデルに統合し、数に依存しない戦略を採用する、という2つの主要なイノベーションを紹介します。
従来のF1スコア0.89を上回り,CamemBERT-bioの有効性を著しく改善した。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:15:21 GMT)
Redefining Safety for Autonomous Vehicles [0.9] コンピュータベースのシステムの安全性に関する既存の定義と関連する概念的枠組みを再考する必要がある。
人間の運転者なしでの運転は、安全上の懸念を劇的に増大させる。
コアシステムの安全性に関する概念を更新する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:50:15 GMT)
An on-demand resource allocation algorithm for a quantum network hub and its performance analysis [0.9] 本研究では,ユーザ生成要求に応じて,ノード間の絡み合い発生を可能にするリソースを割り当てる装置であるEntanglement Generation Switch (EGS) と呼ばれる量子ネットワークハブのトラフィックモデルについて検討する。
オンデマンドリソース割り当てアルゴリズムでは、リソースが利用できない場合や、即時リソース割り当ての結果が得られない場合、要求がブロックされる。
我々の研究はESGシステムにおける交通特性を初めて分析し、性能駆動型リソース割り当てアルゴリズムを考案するための貴重な分析ツールを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:25:32 GMT)
Two-level adiabatic transition probability for small avoided crossings generated by tangential intersections [0.9] 2レベル回避交差の遷移確率の挙動は、2つのパラメータ(断熱およびエネルギーギャップパラメータ)がゼロとなる極限の下で研究される。
主な結果は、遷移確率の拡大だけでなく、いくつかの避けられた交差によって引き起こされる量子干渉も解明する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:23:55 GMT)
PureEBM: Universal Poison Purification via Mid-Run Dynamics of Energy-Based Models [0.9] データ中毒攻撃は、機械学習モデルの完全性に重大な脅威をもたらす。
有害なホワイトボックス画像の毒物から自然に訓練された分類器を守る普遍的なデータ浄化手法を提案する。
EBMの対照的な学習プロセスは, 有毒なEMMトレーニングデータが存在する場合でも, 普遍的な浄化を継続することができることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:31:56 GMT)
Signatures of gravitational wave memory in the radiative process of entangled quantum probes [0.8] 重力波(GW)バーストを背景とした測地軌道における絡み合った量子プローブについて検討した。
永遠スイッチングでは、対称GWバーストによる絡み合ったプローブの集団遷移速度が同じであることを示す。
また、ガウス関数の点における有限スイッチングを考慮し、GW背景とメモリなしの放射過程における特性差を観察する。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:26:38 GMT)
SEMF: Supervised Expectation-Maximization Framework for Predicting Intervals [0.8] このフレームワークは、完全なデータまたは欠落したデータセットの予測間隔を生成する。
SEMFは既存の機械アルゴリズムとシームレスに統合される。
その結果、最先端技術の進歩の可能性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:43:34 GMT)
Operator Learning Renormalization Group [0.8] 演算子学習再正規化群(OLRG)と呼ばれる量子多体シミュレーションのための一般的なフレームワークを提案する。
機械学習の観点に触発されて、OLRGはウィルソンの数値的再正規化群とホワイトの密度行列再正規化群の一般化である。
古典的および量子シミュレーションのための演算子マップの2つのバージョンを実装した。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:09:46 GMT)
Performance evaluation of Reddit Comments using Machine Learning and Natural Language Processing methods in Sentiment Analysis [0.8] 我々は、Reddit上で58,000のコメントを寄せ集め、感情分析手法を評価した。
我々の研究は、様々なモデルの配列を評価することによって、範囲を広げる。
以上の結果から,RoBERTaモデルはベースラインモデルよりも一貫して優れていることがわかった。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:28:49 GMT)
The Great Ban: Efficacy and Unintended Consequences of a Massive Deplatforming Operation on Reddit [0.7] Reddit上で2000近いコミュニティに影響を与えた大規模なデプラットフォーム運用であるThe Great Banの有効性を評価した。
14ヶ月の間に17万のユーザーが投稿した16万のコメントを分析して、望ましい結果とそうでない結果の両方について、微妙な結果を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:50:47 GMT)
The Round Complexity of Proofs in the Bounded Quantum Storage Model [0.7] 有界量子記憶モデル(BQSM)におけるプロトコルのラウンド圧縮に関する研究
このモデルでは、悪意のあるパーティは有界量子メモリを持ち、プロトコルに送信される全てのキュービットを格納できない。
標準手法では, NIZKはBQS相手に対する平易なモデルではありそうにないことを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:24:48 GMT)
Role of Momentum in Smoothing Objective Function and Generalizability of Deep Neural Networks [0.7] モーメントを有する勾配降下(SGD)における雑音は,学習速度,バッチサイズ,運動量係数,標準値の上限によって決定される目的関数を円滑にすることを示す。
また、雑音レベルに依存するアサーションモデルの一般化性を支持する実験結果も提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:18:42 GMT)
Generation of Asset Administration Shell with Large Language Model Agents: Towards Semantic Interoperability in Digital Twins in the Context of Industry 4.0 [0.7] 本研究は,デジタル双生児におけるセマンティック・インターオペラビリティを実現するための新しいアプローチを提案する。
業界 4.0 におけるデジタル双対モデルとしてアセット管理シェル (AAS) の作成を支援する。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:00:38 GMT)
Realistic Cost to Execute Practical Quantum Circuits using Direct Clifford+T Lattice Surgery Compilation [0.6] 本稿では,Clifford+Tゲートセットを用いて表現された量子回路を表面コード格子手術命令セットに明示的にコンパイルする資源推定パイプラインについて報告する。
コンパイルされた回路からのマジック状態要求のケイデンスにより、ポストホック解析においてマジック状態の蒸留と貯蔵要求の最適化が可能となる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:49:33 GMT)
Histopathology Based AI Model Predicts Anti-Angiogenic Therapy Response in Renal Cancer Clinical Trial [0.6] 本稿では,ユビキタスな病理組織スライドからAngioscoreを予測するための新しい深層学習(DL)手法を提案する。
本モデルでは, モデル予測の基盤となる視覚血管ネットワークを生成する。
我々のアプローチは血管新生生物学とAA治療反応に関する知見を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:21:20 GMT)
Unlocking Futures: A Natural Language Driven Career Prediction System for Computer Science and Software Engineering Students [0.6] 本研究は,CS学生とSWE学生の独特な特徴に基づいて,特定のキャリア提案を提供することによって,教育指導に貴重な洞察を与えるものである。
この研究は、CSとSWEの学生がスキル、興味、スキル関連の活動に合った適切な仕事を見つけるのに役立つ。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:56:57 GMT)
Hybrid Preference Optimization: Augmenting Direct Preference Optimization with Auxiliary Objectives [0.5] 大規模言語モデル(LLM)を協調するハイブリッドアプローチを提案する。
DPO の暗黙的な報酬分解に対する単純な拡張により、任意の補助報酬の集合を最大化するために LLM をチューニングできる。
提案手法であるHybrid Preference Optimization (HPO) は,ユーザの好みと補助的な設計目的の両方に効果的に一般化できることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:35:48 GMT)
Position Paper: Think Globally, React Locally -- Bringing Real-time Reference-based Website Phishing Detection on macOS [0.5] 最近のフィッシング攻撃の急増は、従来の反フィッシング・ブラックリストのアプローチの有効性を弱め続けている。
デバイス上でのフィッシング防止ソリューションは、ローカルで高速なフィッシング検出を提供するため、人気が高まっている。
コンピュータビジョンとデバイス上の機械学習モデルを組み合わせてウェブサイトをリアルタイムで分析するフィッシング検出ソリューションを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 14:46:03 GMT)
Acquiring Better Load Estimates by Combining Anomaly and Change-point Detection in Power Grid Time-series Measurements [0.5] 提案手法は,可視データに対する堅牢かつ一般化可能な性能を確保しつつ,解釈可能性の優先順位付けを行う。
その結果, 濾過が適用されない場合に, 洗浄電位が明らかになることが示唆された。
我々の方法論の解釈可能性によって、重要なインフラ計画に特に適しています。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:36:23 GMT)
PRFashion24: A Dataset for Sentiment Analysis of Fashion Products Reviews in Persian [0.5] PRFashion24データセットは、2020年4月から2024年3月まで、さまざまなオンラインファッションストアから収集された包括的なペルシアのデータセットである。
767,272のレビューで、ペルシア語のファッション業界における多様なカテゴリーを含む、この種のデータセットとしては初めてのものである。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:19:13 GMT)
Practical aspects for the creation of an audio dataset from field recordings with optimized labeling budget with AI-assisted strategy [0.4] クラウドソーシングよりも専門家ラベルを用いたアクティブラーニング(AL)の重要性を強調した。
ALは、人間のラベルとAIモデルを組み合わせてラベルの予算を最適化する反復的なプロセスである。
このフレームワークは、小さなチームで5ヶ月にわたって6540の10秒のオーディオサンプルをラベル付けした。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:14:26 GMT)
JungleGPT: Designing and Optimizing Compound AI Systems for E-Commerce [0.4] 我々は、現実世界のeコマースアプリケーションに適した、初めての複合AIシステムであるJungleGPTを紹介する。
本報告では,システム設計と実用ユースケースにおける性能最適化手法について概説する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:14:18 GMT)
PyTAG: Tabletop Games for Multi-Agent Reinforcement Learning [0.4] PyTAGはTabletop Gamesフレームワークで実装されたゲーム集合とのインタラクションをサポートするフレームワークである。
ゲームプレイングエージェントの観点から、テーブルトップゲームが提供する課題と、それらが将来の研究にもたらす機会を強調します。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:30:28 GMT)
Quantum-Classical Autoencoder Architectures for End-to-End Radio Communication [0.4] 本稿では、エンドツーエンド無線通信のためのハイブリッド量子古典型オートエンコーダアーキテクチャについて述べる。
シナリオ毎に詳細な公式を提供し、広範囲なシミュレーションを通してモデルを検証する。
一般的なフレームワークを提供することで、無線通信における量子機械学習アプリケーションのさらなる探索と開発を可能にする。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:11:24 GMT)
Circuit Implementation and Analysis of a Quantum-Walk Based Search Complement Algorithm [0.3] 我々は,Shenvi,Kempe,Whaleyによって作成された量子ウォークに基づく探索アルゴリズムの修正版を提案する。
修正された進化作用素は、元のアルゴリズムのように反対の挙動、すなわちターゲット状態を測定する確率を減少させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:14:08 GMT)
Facilitating Holistic Evaluations with LLMs: Insights from Scenario-Based Experiments [0.3] さまざまな評価を統合するためには、適切な議論が不可欠である。
議論のない平均スコアの導出は、全体的評価の目的を損なう。
本稿では,多様な教員評価を統合するためのファシリテータとして,LLM(Large Language Model)の利用について検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:07:06 GMT)
Towards a Sampling Theory for Implicit Neural Representations [0.3] Inlicit Neural representations (INRs) は、コンピュータおよび計算画像における逆問題を解決する強力なツールとして登場した。
一般化された重み減衰正規化方式を用いて, 隠蔽層INRから画像の復元方法を示す。
低幅単層INRにより実現された正確な回復画像を得る確率を実証的に評価し、より現実的な連続領域ファントム画像の超解像回復におけるINRの性能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:53:47 GMT)
Enhancing IoT Security with CNN and LSTM-Based Intrusion Detection Systems [0.2] 提案モデルは,畳み込みニューラルネットワーク(CNN)と長短期記憶(LSTM)ディープラーニング(DL)モデルを組み合わせて構成する。
この融合により、IoTトラフィックをバイナリカテゴリ、良性、悪意のあるアクティビティに検出し、分類することが可能になる。
提案モデルの精度は98.42%,最小損失は0.0275である。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:12:15 GMT)
Conditional Independence of 1D Gibbs States with Applications to Efficient Learning [0.2] 熱平衡におけるスピン鎖は, 個々の領域が近傍に強く相関する相関構造を持つことを示す。
これらの測度が任意の正の温度で超指数的に崩壊することを証明している。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:57:26 GMT)
CLAIM Your Data: Enhancing Imputation Accuracy with Contextual Large Language Models [0.2] 本稿では,精度インプット法(CLAIM)の文脈言語モデルを提案する。
従来の計算法とは異なり、CLAIMは文脈に関連のある自然言語記述子を使用して、欠落した値を埋める。
多様なデータセットや欠落パターンに対する評価は,既存の計算手法よりもCLAIMの方が優れた性能を示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 00:08:29 GMT)
GLOCON Database: Design Decisions and User Manual (v1.0) [0.1] GLOCONは、全国ニュースソースから自動的に抽出される論争的なイベントのデータベースである。
完全なニュースアーカイブは、各ソースのイベントリストを作成するために処理される。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:42:35 GMT)
Article Classification with Graph Neural Networks and Multigraphs [0.1] 単純なグラフニューラルネットワーク(GNN)パイプラインを多グラフ表現で拡張することにより,記事分類の性能を向上させる手法を提案する。
完全に教師されたトランスダクティブノード分類実験は、Open Graph Benchmark OGBN-arXivデータセットとPubMed糖尿病データセットで実施されている。
その結果、マルチグラフはデフォルトグラフと比較して、様々なGNNモデルの性能を一貫して改善することを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:22:39 GMT)
The Impacts of Data, Ordering, and Intrinsic Dimensionality on Recall in Hierarchical Navigable Small Worlds [0.1] 調査は、HNSWがデータセットのスペクトルにわたって有効であることに焦点を当てている。
我々は、KN(K Nearest Neighbours)探索と比較して、近似HNSW探索のリコールが、ベクトル空間の固有次元と結びついていることを発見した。
一般的なベンチマークデータセットをKNNの代わりにHNSWで実行することで、いくつかのモデルではランキングを最大3ポジションシフトすることができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:16:43 GMT)
Attosecond spectroscopy using vacuum-ultraviolet pulses emitted from laser-driven semiconductors [0.0] 我々は、中赤外レーザー場の存在下で、真空紫外(VUV)高調波でセシウム原子を光電離する。
レーザー場による原子の瞬時偏光から生じる光電子収率の強い振動を観察する。
この光源は、アト秒分光のための新しいスペクトルウィンドウを開く。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:26:07 GMT)
Why Algorithms Remain Unjust: Power Structures Surrounding Algorithmic Activity [0.0] 改革派はアルゴリズムを取り巻く電力構造を無視しているため、アルゴリズムの不正を抑えることができなかった。
アルゴリズム活動が平等で非民主的で、持続不可能な理由は、それを形作る権力構造が、社会的エンパワーメントというよりも経済的なエンパワーメントの1つであるからである、と私は主張する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:49:24 GMT)
What characteristics define disinformation and fake news?: review of taxonomies and definitions [0.0] この技術ノートは、偽情報と偽ニュースを包括的に分析し、46の定義を合成し、4つのキーポイントをハイライトする。
偽情報は完全にまたは部分的に偽情報であり、誤解を招く目的で送信者が作成した情報である。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:32:24 GMT)
VietMed: A Dataset and Benchmark for Automatic Speech Recognition of Vietnamese in the Medical Domain [0.0] 医療分野におけるベトナム語音声認識データセットであるVietMedについて紹介する。
VietMedは7つの面で世界最大の公衆医療音声認識データセットである。
我々はベトナムのASR、w2v2-Viet、XLSR-53-Viet向けの最初の大規模事前訓練モデルをリリースする。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:27:48 GMT)
Use of Boosting Algorithms in Household-Level Poverty Measurement: A Machine Learning Approach to Predict and Classify Household Wealth Quintiles in the Philippines [0.0] 本研究では,フィリピンにおける貧困水準予測における機械学習モデルの有効性について検討した。
CatBoostは優れたモデルとして登場し、精度、精度、リコール、F1スコアの最高スコアを91%で達成した。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:29:08 GMT)
Unveiling quantum complementarity tradeoffs in relativistic scenarios [0.0] 完全相補関係の量間のトレードオフが、内部スピンを持つ粒子に対して任意の時空でどのように修正されるかを示す。
我々の結果は、一般相対性理論が量子重ね合わせに普遍的なデコヒーレンス効果をもたらすという発見を拡張した。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:29:55 GMT)
Unveiling The Factors of Aesthetic Preferences with Explainable AI [0.0] 本研究では,機械学習(ML)モデルを用いて,新しい視点を開拓する。
我々のモデルはこれらの属性を入力として処理し、画像の美的スコアを予測する。
本研究の目的は,画像における審美的嗜好の複雑な性質をMLを通して明らかにし,審美的判断に影響を及ぼす属性をより深く理解することである。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:42:30 GMT)
UIT-DarkCow team at ImageCLEFmedical Caption 2024: Diagnostic Captioning for Radiology Images Efficiency with Transformer Models [0.0] 本研究は, 診断キャプション(診断キャプション)と呼ばれる放射線画像からの自動テキスト生成の開発に焦点をあてる。
目的は、報告の質と効率を高めるツールを提供することであり、臨床実習とディープラーニング研究の両方に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:03:59 GMT)
Three-body Forces in Oscillator Bases Expansion [0.0] この方法は、与えられた3体力のクラスの管理を含むように一般化されている。
一般化の精度をラグランジュメッシュ法の結果と比較して評価する。
また、N$同一粒子系と2つの同一粒子系と1つの異なる粒子系の拡張についても論じている。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:50:20 GMT)
The Battle of LLMs: A Comparative Study in Conversational QA Tasks [0.0] この研究は、ChatGPT、GPT-4、Gemini、Mixtral、Claudeが異なる会話型QAコーパスで生成した応答を詳しく調べる。
評価スコアは慎重に計算され、その後、これらのモデル全体の性能を確認するために比較された。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:42:43 GMT)
Thai Winograd Schemas: A Benchmark for Thai Commonsense Reasoning [0.0] 本研究は、タイ語の文脈における常識推論能力を評価するために設計された新しいデータセットである、タイ語におけるウィノグラードのコレクションを紹介する。
我々は,このベンチマークで人気の高い大規模言語モデルの性能を評価し,その強み,限界を明らかにし,現在の最先端技術に対する洞察を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:14:02 GMT)
Symmetry-protection Zeno phase transition in monitored lattice gauge theories [0.0] 保護ゲージ理論と不規則状態の間の測定速度によって引き起こされる急激な遷移の存在を示す。
我々の結果は、強い相互作用を持つ高制約量子系の散逸臨界性に光を当てた。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:18:06 GMT)
Symbolic Regression for Beyond the Standard Model Physics [0.0] 標準モデル物理学を超えて研究するための強力なツールとして,記号回帰を提案する。
我々は、理論のパラメータの観点から、3つの低エネルギー観測対象を再現する分析式のセットを提供する。
提案手法のパワーを示すために,大域的適合解析における記号表現を用いて,パラメータの後方確率密度を導出する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:01 GMT)
Strong coupling at room temperature with a centimeter-scale quartz crystal [0.0] バルク音響波共振器の強結合状態を実現し, 特徴付けるために, ポンプパワーと周波数デチューニングを独立に制御するオプティメカティカルシステムについて報告する。
本結果は,室温マクロメカニカルシステムの性能とハイブリッド量子デバイスへの応用に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:15:05 GMT)
Solving coupled Non-linear Schrödinger Equations via Quantum Imaginary Time Evolution [0.0] 核ハートリー・フォック方程式の場合、そのような方程式の解として量子想像時間進化(ITE)アルゴリズムを提案する。
単純化されたスカイム相互作用モデルの下で、酸素-16核の基底状態エネルギーを計算し、その結果が古典的ITTアルゴリズムと一致することを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:32:03 GMT)
Simultaneous source separation of unknown numbers of single-channel underwater acoustic signals based on deep neural networks with separator-decoder structure [0.0] 本稿では,可能なターゲットの最大数に等しい一定数の出力チャネルを持つ,深層学習に基づく同時分離ソリューションを提案する。
この解は、目標への出力のアライメントによって引き起こされる置換問題による次元的災害を回避する。
放射音の混合を模擬した実験により, 提案手法は, 既知信号数と同等の分離性能が得られることを示した。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:13:50 GMT)
Simon algorithm in measurement-based quantum computing [0.0] シモンのサブグループ隠れアルゴリズムは、古典計算よりも量子コンピューティングの優位性を証明した最初の量子アルゴリズムであった。
我々は、Simonアルゴリズムを計測に基づく量子コンピューティングの言語に書き換える。
The $n$-qubit version of the Simon algorithm can be formulated in MBQC as cluster state graph with $2n$ node and $n2$ edges。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:02:54 GMT)
Robustness of critical U(1) spin liquids and emergent symmetries in tensor networks [0.0] 臨界共鳴バレンスボンド (RVB) スピン液体の長距離一重項ドーピングに対する応答について検討した。
RVBではドーピングが関連する摂動を構成することが分かり、すぐにギャップが開きます。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:07:49 GMT)
Rethinking the A in STEAM: Insights from and for AI Literacy Education [0.0] 本稿では,STEAM教育における芸術の役割を再考し,K-12文脈におけるAIリテラシーの重要性を強調した。
この論文は、言語学、哲学、社会学、視覚芸術の4つの重要な領域を中心に構成されている。
記事は、AIの総合的で公平で持続可能な理解を促進するために、STEAMに芸術をしっかりと取り入れることを提唱することで締めくくっている。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:46:22 GMT)
Reinforced Model Predictive Control via Trust-Region Quasi-Newton Policy Optimization [0.0] 超線形収束率を用いた政策最適化のための準ニュートン学習アルゴリズムを提案する。
シミュレーション研究は、提案したトレーニングアルゴリズムがデータ効率と精度で他のアルゴリズムより優れていることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:16:08 GMT)
RealTimeTransport: An open-source C++ library for quantum transport simulations in the strong coupling regime [0.0] RealTimeTransportは、静的および過渡的なトランスポートオブザーバの計算を可能にする、新しいオープンソースのC++ライブラリである。
中島-Zwanzigメモリカーネルを動的・輸送的にリアルタイムに計算する。
本稿では,RealTimeTransportのアーキテクチャと現在実装されている手法の実証について概説する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:36:22 GMT)
Quantum vs. classical $P$-divisibility [0.0] P$-divisibility は古典的および量子的非マルコフ過程において中心的な概念である。
古典的な$P$分割性の喪失は、純粋に散逸的な$P$分割可能な量子力学の古典的な還元から生じる可能性があることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:20:32 GMT)
Quantum subsystem codes, CFTs and their $\mathbb{Z}_2$-gaugings [0.0] 量子サブシステム符号からナライン共形場理論を構築する。
得られた符号 CFT は、大域的な$mathbbZ$対称性を示し、オービフォールドおよびフェルミオン化された理論を実行することができる。
我々は、$mathbbZ$-bifold, new supersymmetric code CFT, and few fermionic code CFTs with spontaneously broken Supersymmetric。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:03:37 GMT)
QOSST: A Highly-Modular Open Source Platform for Experimental Continuous-Variable Quantum Key Distribution [0.0] 量子鍵分布(Quantum Key Distribution, QKD)は、量子物理学の法則に根ざした情報理論セキュリティを持つ2つのリモートパーティ間の秘密鍵交換を可能にする。
私たちは、原則的にハードウェアに依存しず、複数の構成で使用可能な、高度にモジュール化されたオープンソースソフトウェアを提供しています。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:09:18 GMT)
Phonon Number Measurement Using Optimal Composite Pulses [0.0] 理論的には, 状態進化の整合性を必要としない複合パルスを用いた手法を提案する。
これは、断熱的進化のレッドサイドバンド法と直接比較して、フォック状態のより高い個体数を測定することができる。
我々は、合成パルスのユニタリ演算の忠実度を改善するために、量子最適制御法を用いる。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:44:29 GMT)
Page curve entanglement dynamics in an analytically solvable model [0.0] 本稿では、そのようなページ曲線を明示的に示す自由フェルミオンの、正確に解けるモデルを提案する。
ページ曲線の屈曲は、粒子電流と絡み合いの発生の間の半古典的接続の崩壊を伴う。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:34:23 GMT)
PDMLP: Patch-based Decomposed MLP for Long-Term Time Series Forecasting [0.0] 近年, Transformer アーキテクチャを改良し, 長期時系列予測(LTSF)タスクの有効性を実証する研究が進められている。
これらのモデルの有効性は、配列の局所性を向上する採用されたパッチ機構に大きく寄与する。
さらに、Patch機構で強化された単純な線形層は、複雑なTransformerベースのLTSFモデルより優れている可能性が示唆されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 02:14:18 GMT)
Optimizing one-axis twists for variational Bayesian quantum metrology [0.0] 特に、量子ビット位相推定(回転センシング)は、電場センシング、磁気メソメトリー、原子時計、ジャイロスコープへの応用において、ユビキタスな問題として現れる。
任意軸ツイストアンサーゼと呼ばれるパラメタライズド符号化および復号化プロトコルの新たなファミリーを提案する。
対象推定誤差を達成するのに必要な1軸ツイスト数を大幅に削減できることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:37:45 GMT)
Optimizing T and CNOT Gates in Quantum Ripple-Carry Adders and Comparators [0.0] 2つのnビット数の加算と比較のためのリップルキャリー戦略を示す。
特に,Cuccaro et al. と Takahashi et al の添加剤について考察する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:02:17 GMT)
Once-in-a-lifetime encounter models for neutrino media: From coherent oscillations to flavor equilibration [0.0] 我々はニュートリノガスの新しい量子モデルを開発し、一対のニュートリノは生涯に一度は相互作用できる。
これらのモデルは、粒子の観点からのコヒーレントなフレーバー振動の出現を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:05:41 GMT)
Notes on Applicability of GPT-4 to Document Understanding [0.0] 文書理解分野に関するすべての公開GPT-4ファミリーモデルを評価する。
GPT-4 Vision Turboは,外部のOCRエンジンで認識されたテキストと入力上の文書イメージの両方を提供する場合,テキストのみのモデルでは良好な結果が得られない。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:53 GMT)
Near-Term Enforcement of AI Chip Export Controls Using A Firmware-Based Design for Offline Licensing [0.0] オフラインライセンスは、AIモデルの非規制トレーニングを防ぐために使用できる、計算ガバナンスのメカニズムである。
ファームウェアのアップデートを通じて配信できるオフラインライセンスの最小バージョンの設計を提示します。
政府にとって、安全でないアクターや悪意のあるアクターがフロンティアAIモデルをトレーニングするのを防ぐことは重要であるかもしれない。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:51:02 GMT)
NUTS, NARS, and Speech [0.0] NUTSは、ナイーブ次元還元、いくつかの前処理、そして非公理推論(NARS)からなる。
2つのトレーニング例だけで、NUTSは離散的な単語識別のためのWhisper Tinyモデルと同様に機能する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:51:42 GMT)
Mirror Descent-Ascent for mean-field min-max problems [0.0] 本研究では,測度空間上のmin-max問題を解くために,ミラー降下指数アルゴリズムの2つの変種について検討する。
二階堂・石田誤差で測定された混合ナッシュ平衡への収束速度は, 同時および逐次スキームに対してそれぞれ$mathcalOleft(N-1/2right)$と$mathcalOleft(N-2/3right)$であることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:03:44 GMT)
Metaheuristic approaches to the placement of suicide bomber detectors [0.0] 自爆テロはテロの悪名高い形態であり、世界的テロ戦争の時代にますます広まりつつある。
本研究は,本種の標的攻撃事例と,脅威領域に分布する検知器の使用を保護対策として検討する。
この目的のために、局所探索と集団探索に基づく異なるメタヒューリスティックなアプローチが、強力な欲求アルゴリズムに対して検討され、ベンチマークされる。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:14:01 GMT)
Media Insights Engine for Advanced Media Analysis: A Case Study of a Computer Vision Innovation for Pet Health Diagnosis [0.0] Petcoは、Media Insights Engineを使用してペットの健康分析プロセスを革新し、最初の診断までの時間を短縮した。
Media Insights Engineは、Petcoがメディアワークロード用の機械学習アプリケーションを迅速に構築できるモジュラーとソリューションを提供する。
本稿では,メディアを用いたペットの健康分析の課題,メディアインサイトエンジンのメリット,およびこのフレームワークを用いたPetcoのカスタムアプリケーションのアーキテクチャについて論じる。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:48:06 GMT)
Mashee at SemEval-2024 Task 8: The Impact of Samples Quality on the Performance of In-Context Learning for Machine Text Classification [0.0] 我々は,高品質試料を同定するために2乗検定を用い,低品質試料を用いて得られた試料と比較した。
これらの結果から, 高品質な試料の利用により, 評価指標のすべてに対して, 性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:47:43 GMT)
Machine Learning-Driven Optimization of TPMS Architected Materials Using Simulated Annealing [0.0] 本研究は,3周期最小表面(TPMS)構造の引張応力を機械学習とシミュレートアニーリング(SA)により最適化する新しい手法を提案する。
本研究は, TPMSモデルの有限要素解析から得られたデータセットを用いて, 応力予測におけるランダムフォレスト, 決定木およびXGBoostモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 28 May 2024 05:06:37 GMT)
Life on a closed timelike curve [0.0] G"odel型宇宙における時間的曲線上を旅する仮説的宇宙船の内部ダイナミクスについて検討する。
我々は、宇宙船の内部のエネルギー準位が自然に離散化されなければならないことを証明した。
このようなエントロピーの減少は固有状態熱化仮説と一致している。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:51:54 GMT)
LSTM-COX Model: A Concise and Efficient Deep Learning Approach for Handling Recurrent Events [0.0] 本研究では,Long Short-Term Memory Network(LSTM)とCoxモデルを組み合わせることにより,モデルの性能を向上させる。
従来のモデルと比較して,LSTM-Coxモデルは臨床リスクの特徴抽出の精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:38:15 GMT)
LLMs for Targeted Sentiment in News Headlines: Exploring the Descriptive-Prescriptive Dilemma [0.0] 本稿では,ニュース見出しの感情分析のために,最先端のLCMと微調整エンコーダモデルの精度を比較した。
我々は、ゼロショットから精巧な数ショットのプロンプトまで、プロンプトの規範性によってパフォーマンスがどのように影響を受けるかを分析する。
LLMは記述的データセット上で微調整エンコーダよりも優れており、キャリブレーションやF1スコアは記述性の向上とともに一般的に改善されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:04:32 GMT)
LLMs and Memorization: On Quality and Specificity of Copyright Compliance [0.0] 大規模言語モデル(LLM)のメモリ化が懸念されている。
LLMは、著作権のある作品を含むトレーニングデータの一部を容易に再現できることが示されている。
これは、欧州AI法と同様に、既存の著作権法に違反している可能性があるため、解決すべき重要な問題である。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:01:52 GMT)
Judgement Citation Retrieval using Contextual Similarity [0.0] 本稿では,自然言語処理(NLP)と機械学習技術を組み合わせて,訴訟記述の組織化と活用を促進する手法を提案する。
提案手法は,教師なしクラスタリングと教師付き引用検索の2つの主要な目的に対処する。
我々の手法は90.9%という驚くべき精度を達成した。
論文参考訳(メタデータ) (Tue, 28 May 2024 04:22:28 GMT)
Intensity product-based optical sensing to beat the diffraction limit in an interferometer [0.0] 典型的な干渉計では、干渉光子が量子センシングのように分解されない限り、分解能はK=1の場合の回折限界に留まる。
ここでは、量子センシングにおける投影測定法を干渉計に適応させ、さらに2乗根Kゲインを分解能で達成する。
プロジェクション測定では、干渉計の干渉縞をKth動力でKthオーダーの強度積を置き換えることができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:29:07 GMT)
Intelligent Clinical Documentation: Harnessing Generative AI for Patient-Centric Clinical Note Generation [0.0] 本稿では,クリニカルドキュメンテーションプロセスの合理化のための生成AI(Artificial Intelligence)の可能性について検討する。
本稿では,自然言語処理 (NLP) と自動音声認識 (ASR) 技術を用いて患者と臨床の相互作用を転写するケーススタディを提案する。
この研究は、時間節約、ドキュメント品質の改善、患者中心のケアの改善など、このアプローチの利点を強調している。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:43:41 GMT)
Infrastructure Engineering: A Still Missing, Undervalued Role in the Research Ecosystem [0.0] 研究はますますソフトウェアに依存している。
このような役割の必要性は、単に理想的ではなく、科学の継続的な成功に不可欠である。
この記事では、この欠落したレイヤの重要性を強調し、インフラストラクチャエンジニアの役割の欠如がいかに非効率になったかを例示します。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:34:38 GMT)
Informationally overcomplete measurements from generalized equiangular tight frames [0.0] 任意のランクの等角的タイトフレームによって生成される情報的にオーバーコンプリートなPOVMのクラスを導入する。
以上の結果から,POVM の情報完全コレクションに対して,情報の過剰な測定を単一で行うことのメリットが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:08:58 GMT)
Improving Speech Decoding from ECoG with Self-Supervised Pretraining [0.0] ノイズコントラスト損失を用いて音声の潜在表現を学習する自己教師付き完全畳み込みモデルを再設計する。
我々は、このモデルを心電図記録(ECoG)に基づいて訓練する。
次に、ラベル付き音声セッションからwav2vecの表現空間にECoGを変換し、最後に教師付きエンコーダデコーダをトレーニングし、これらの表現をテキストにマッピングします。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:48:53 GMT)
High-dimensional quantum key distribution using a multi-plane light converter [0.0] 高次元量子鍵分布(QKD)は、高い情報容量と強いノイズ耐性を提供する。
これらの利点は、要求される高次元の測定と変換を実現することの難しさによってしばしば妨げられる。
大規模多平面光コンバータ(MPLC)を実装し,QKDの空間モードの高次元モードソータとしてプログラムする。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:19:45 GMT)
Heat-based circuits using quantum rectification [0.0] 熱ベースの回路は、論理ビットの情報を処理するための電力コストの削減により、より関連性が高まっている。
熱ベース回路では、温度差を用いて回路を介して熱電流を駆動することで計算を行う。
標準電子部品の熱に基づくアナログとして使用するために,各回路の必要な機能を示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:29:37 GMT)
Finite-temperature Rydberg arrays: quantum phases and entanglement characterization [0.0] 熱平衡で量子多体状態を構成するためのネットワークベースの数値ツールボックスを開発した。
エンタングルメントの共形スケーリング法則が0温度臨界点から低温状態へ拡張されることを数値的に確認する。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:03 GMT)
FinEmbedDiff: A Cost-Effective Approach of Classifying Financial Documents with Vector Sampling using Multi-modal Embedding Models [0.0] FinEmbedDiffは、財務文書を分類するための費用効率の良いベクトルサンプリング手法である。
最先端のベースラインと比較して、競争力のある分類精度を達成する。
これは現実の金融アプリケーションのための実用的でスケーラブルなソリューションです。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:34:24 GMT)
Feasible generation of gravity-induced entanglement by using optomechanical systems [0.0] 重力誘起エンタングルメント(GIE)の光学系による検出の可能性について報告する。
提案手法は,重力相互作用によって結合された光学鏡間のGIE生成に焦点をあてる。
我々は,GIEが,光学的結合を伴わないよく知られた時間スケールよりも高速に生成されることを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:47:16 GMT)
Fast characterization of optically detected magnetic resonance spectra via data clustering [0.0] 光検出磁気共鳴(ODMR)は、固体量子エミッタのスピン状態を測定するための確立された強力な技術となっている。
これらの多くのセンシングアプリケーションの中心は、ODMRデータを確実に分析する能力である。
この制限を克服するデータクラスタリングに基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:18:47 GMT)
Exploring the transition between Quantum and Classical Mechanics [0.0] 量子力学から古典力学への遷移を1次元自由粒子モデルを用いて検討する。
量子確率密度は、粒子の最終位置の古典的な正規分布と一致する。
量子空間から古典分布を復元する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:18:16 GMT)
Exploring Sectoral Profitability in the Indian Stock Market Using Deep Learning [0.0] この研究は、既存の株価予測手法に関する文献に基づいており、機械学習とディープラーニングアプローチへのシフトを強調している。
LSTMモデルでは、NSE、インドに上場している18のセクターで180銘柄の歴史的株価を用いて、将来の価格を予測する。
その結果,株価を正確に予測し,投資決定を下す上でLSTMモデルの有効性が示された。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:55:54 GMT)
Explicit Formulae to Interchangeably use Hyperplanes and Hyperballs using Inversive Geometry [0.0] 多くのアルゴリズムは、超平面や超球を分離したり、球面データを扱うように特別に設計されたりするなど、差別的境界を必要とする。
2つの識別境界は相互に利用でき、点距離の変化が許容される限り、一般的なユークリッドデータを球形データに変換することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:43:16 GMT)
Existence of minimizers for the Dirac-Fock model of crystals [0.0] 結晶の平均場相対論的エネルギーを周期密度行列で導入する。
細胞1個あたりの電子数があまり多くない場合、基底状態の存在を証明します。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:23:48 GMT)
Evolutionary Algorithms for Optimizing Emergency Exit Placement in Indoor Environments [0.0] セルラーオートマトンモデルを用いて歩行者の挙動をシミュレートする。
避難がどの程度成功したか、満足できるかを決定するための計量が提案されている。
2つのメタヒューリスティックアルゴリズム、すなわち反復グリーディと進化的アルゴリズム(EA)がこの問題を解決するために提案されている。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:50:42 GMT)
Evaluating Bayesian deep learning for radio galaxy classification [0.0] ベイズニューラルネットワーク(BNN)は、ディープラーニングモデルによる予測の不確実性をモデル化する原則的な方法を提供する。
我々は, 電波銀河分類問題に対する予測性能, 不確かさ校正, 分布シフト検出の2つの基準に対して, 異なるBNNの性能を評価する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:49:28 GMT)
Entanglement in Lifshitz Fermion Theories [0.0] リフシッツ対称性と任意の整数臨界指数を持つ(1+1)次元自由ディラック-フェルミオン理論における静的絡み合い構造について検討する。
我々の数値的な研究は、この理論の量子絡み合いが上から厳密に拘束されていることを示している。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:02:47 GMT)
Enhancing Road Safety: Real-Time Detection of Driver Distraction through Convolutional Neural Networks [0.0] 本研究は,運転者の気晴らしをリアルタイムに検出する上で,最も効率的なモデルを明らかにすることを目的とする。
最終的な目的は、この発見を車両の安全システムに組み込むことであり、不注意によって引き起こされる事故を防ぐ能力を大幅に向上させることである。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:34:55 GMT)
Emergence of Latent Binary Encoding in Deep Neural Network Classifiers [0.0] ディープ・ニューラル・ネットワーク分類器の潜時空間におけるバイナリエンコーディングの出現について検討する。
複雑性が増大するいくつかのデータセットを解析することにより、バイナリエンコーディングの出現がロバスト性を大幅に向上させるという実証的な証拠を提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:55:23 GMT)
Efficient Remote Sensing with Harmonized Transfer Learning and Modality Alignment [0.0] ハーモナイズドトランスファーラーニングとモダリティアライメント(HarMA)は,タスク制約,モダリティアライメント,単一モダリティアライメントを同時に満足する手法である。
HarMAはリモートセンシング分野における2つの一般的なマルチモーダル検索タスクにおいて最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:24:03 GMT)
Dynamics of quantum observables and Born's rule in Bohmian Quantum Mechanics [0.0] エネルギー,運動量,角運動量,位置の平均値は,標準量子力学とボーム力学の両方を用いて計算する。
我々は,これらの平均値を決定する上で,秩序的かつカオス的なボヘミア軌道の寄与を解明することに注力する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:49:12 GMT)
Distributed quantum multiparameter estimation with optimal local measurements [0.0] 空間分布型マッハ・ツェンダー干渉計(MZI)のアレイを用いたセンサについて検討する。
それぞれのMZIで独立に行う局所測定は、量子クラム・ラオ境界を飽和させる感度を与えるのに十分であることを示す。
我々は、$d$独立干渉計は、絡み合ったプロトコルと同じ感度を達成できるが、$d$非古典的状態を使用するコストがかかることを見出した。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:45:07 GMT)
Dissipation-induced bound states as a two-level system [0.0] 反パリティ時対称系は1対の実エネルギー準位を持つことができるが、残りの全ての準位はエネルギーの負の虚部のために不安定である。
本研究では,高調波想像ポテンシャルによって誘導される強結合鎖における束縛状態の形成について検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:25:31 GMT)
Dimension-free uniform concentration bound for logistic regression [0.0] 制約付きロジスティック回帰の次元リスク関数に束縛された新規な一様濃度を与える。
我々の境界は、ラデマッハ複雑性論とマクダイアルメイドの不等式によって導かれる条件よりも大きな数の一様法則に対して、より穏やかな条件をもたらす。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:09:39 GMT)
Digitization and subduction of $SU(N)$ gauge theories [0.0] 帰納法は, 直接和に基づく付加価値情報を提供することを示す。
固定格子間隔で$ Sigma(360×3)$の既約表現の静的ポテンシャルを計算する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:02:27 GMT)
Detecting kHz gravitons from a neutron star merger with a multi-mode resonant bar [0.0] この多モード検出器は、最大質量元素の重力波との結合強度を保持する通常のモードを有する。
これにより、通常のモードは、トンスケールの最大の質量のためにグラビトン吸収率を持つことができる。
標準モードにおける単一のグラビトン吸収過程は、ピコグラムスケールより小さい質量元素のエネルギー測定によって解決できる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:28:38 GMT)
Detecting Measurement-Induced Entanglement Transitions With Unitary Mirror Circuits [0.0] 本稿では、投影回路の「一意ミラー」を生成するハイブリッド量子古典アルゴリズムを提案する。
ユニタリミラーは$p_c$以上の実験状態を十分に近似できるが、指数関数的にそれ以下に失敗することを示す。
また、小さな量子ビット数とランダムなクリフォードゲートを持つモニタ回路の数値結果も提示する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:59:10 GMT)
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis [0.0] 本稿では, 埋立廃棄物処理とごみ処理の基盤となるため, 最先端のアーキテクチャと既存のデータセットを網羅的に検討する。
第一の目的は、高度な水中センサーと自律型水中車両によって活用される物体の局所化手法のベンチマークを確立することである。
論文参考訳(メタデータ) (Tue, 28 May 2024 15:51:18 GMT)
Decoherence of solid-state spin qubits: a computational perspective [0.0] 第一原理シミュレーションは、異なる種類の固体電子スピンに対するスピンダイナミクスを予測する方法について論じる。
検証されたクラスタ手法が最近の実験結果の解釈にどのように役立つかを強調した。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:03:47 GMT)
Decoding moral judgement from text: a pilot study [0.0] 道徳的判断は、認知的・感情的な次元に関わる複雑な人間の反応である。
受動的脳-コンピュータインタフェースを用いたテキスト刺激による道徳的判断復号の実現可能性について検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 20:31:59 GMT)
Crash Report Accumulation During Continuous Fuzzing [0.0] 本稿では,CASRツールセットの一部として,クラッシュ蓄積手法を提案し,実装する。
ファジィ結果から得られた事故報告に対する我々のアプローチを評価する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:36:31 GMT)
Correlated frequency noise in a multimode acoustic resonator [0.0] 本研究では, 表面波(SAW)共振器の周波数変動について検討した。
2レベルシステム(TLS)の欠陥は、デチューニングの増加に伴って減少する大きな相関関係を示す。
TLSによるノイズに加えて、遅い反相関ダイナミクスを持つ強い異常周波数変動を観測する。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:27:46 GMT)
Controlling the interactions in a cold atom quantum impurity system [0.0] 我々は、Kの1つの原子が光学式ツイーザに閉じ込められ、超低温でRb原子の浴に浸漬される実験アーキテクチャを実装した。
我々は2つのサブシステム間の相互作用の特性と制御に集中する。
我々の結果は、量子不純物モデル、量子情報、量子熱力学の量子シミュレーションにおいて、様々な新しい可能性を開く。
論文参考訳(メタデータ) (Tue, 28 May 2024 09:12:53 GMT)
Contradictions or Curiosities? On Kent's Critique of the Masanes--Galley--Müller Derivation of the Quantum Measurement Postulates [0.0] エイドリアン・ケントは近年、量子力学の仮定に関するマカネス、ギャリー、ミュラーの研究を批判している。
他の前提が加えられない限り、私はどちらも真の矛盾ではないと論じます。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:24:05 GMT)
Consistency and Causality of Interconnected Nonsignaling Resources [0.0] 本稿では、局所的に配線できる独立した非署名リソースを共有できる$m$のネットワークについて検討する。
このようなネットワークで発生する確率分布を研究するための特定のフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:50:16 GMT)
Computational Characterization of Symmetry-Protected Topological Phases in Open Quantum Systems [0.0] ゲート忠実度(英: Gate fidelity)は、測定に基づく量子計算の計算能力の尺度である。
非局所文字列順序パラメータの和によって与えられるアイデンティティゲートの忠実度が重要な役割を果たすことを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:00:17 GMT)
Collectively enhanced ground-state cooling in subwavelength atomic arrays [0.0] サブ波長アレイに閉じ込められた原子のサイドバンド冷却方式を提案する。
我々は、原子の内的自由度を断熱的に除去することで、原子運動に対する効果的なマスター方程式を導出する。
このアプローチは、エミッターの密集に基づく将来の量子技術に利用することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 18:00:05 GMT)
Characterising semi-Clifford gates using algebraic sets [0.0] クリフォード階層の第3階層のゲートの集合と、ほぼ対角的な半クリフォードゲートのそれらの傑出した部分集合について研究する。
セミクリフォードゲートはこれらの資源状態をはるかに効率的に利用して実装できるので重要である。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:33:32 GMT)
Brewer-Nash Scrutinised: Mechanised Checking of Policies featuring Write Revocation [0.0] 倫理的中国壁政策に触発されたブルワー・ナッシュの安全政策モデルを再考する。
書き込みアクセスのための現代的なオペレーションセマンティクスを提供します。
本稿では,Brewer-Nashモデルにおける情報フローの解析を近代化する。
論文参考訳(メタデータ) (Tue, 28 May 2024 13:06:13 GMT)
Boosting General Trimap-free Matting in the Real-World Image [0.0] 我々は,textbfMulti-textbfFeature fusion-based textbfCoarse-to-fine Network textbf(MFC-Net)というネットワークを提案する。
提案手法は, 合成画像と実世界の画像の両方において有意に有効であり, 実世界のデータセットの性能は, 既存のマッティングフリー手法よりもはるかに優れている。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:37:44 GMT)
Black-Box Detection of Language Model Watermarks [0.0] 我々は,ブラックボックスクエリの限られた数だけを用いて,最も人気のある3つのウォーターマーキングスキーム群の存在を検出するための厳密な統計的テストを開発した。
以上の結果から,現在の透かし方式は従来考えられていたよりも検出可能であり,また,透かしが配備されたという事実を無視することは,プロバイダが敵から守るための有効な方法ではない可能性が示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:41:30 GMT)
Biclustering a dataset using photonic quantum computing [0.0] ビクラスタリングは、機械学習とデータマイニングにおける問題である。
我々は、ボソンやGBSのような量子コンピューティングモデルがこの問題にもたらす自然な関係を強調します。
論文参考訳(メタデータ) (Tue, 28 May 2024 22:04:29 GMT)
Bang-bang preparation of quantum many-body ground states in two dimensions: optimization of the algorithm with a two-dimensional tensor network [0.0] バンバン(BB)アルゴリズムは、2次元(2次元)量子多体ハミルトンの基底状態を作成する。
近傍テンソル更新を用いて、BB進化を無限対密度射影状態(iPEPS)でシミュレートする。
最適BBエネルギーは最適APエネルギーよりもはるかに速いバン数と収束する。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:22:11 GMT)
Automated Real-World Sustainability Data Generation from Images of Buildings [0.0] そこで本研究では,適切な迅速なエンジニアリングとドメイン知識を備えた大規模言語モデルを用いて,サステナビリティ計算に関係のあるビルディング特性を推定できることを示す。
提案手法を,47の集合住宅の実際の建物データからなる地上真実と比較し,その精度を人間よりも向上させる。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:24:20 GMT)
Asymptotic utility of spectral anonymization [0.0] スペクトル匿名化(SA)アルゴリズムの有用性とプライバシについて検討する。
我々は、$mathcalJ$-spectral anonymizationと$mathcalO$-spectral anonymizationの2つの新しいSA変種を紹介する。
いくつかの現実的な仮定の下では、これらのSAアルゴリズムが元のデータの第一と第二の瞬間をいかに保存するかを示す。
論文参考訳(メタデータ) (Tue, 28 May 2024 07:53:20 GMT)
Are PPO-ed Language Models Hackable? [0.0] 本稿では,肯定的な感情言語生成の制御における報酬の効果を検討することを目的とする。
人間のフィードバックに基づく報酬モデルのオンライントレーニングの代わりに、静的学習された感情分類器を用いる。
また、トレーニング後にモデルの重みとアクティベーションがエンドユーザに露出する環境についても検討する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:28:28 GMT)
An even-parity precession protocol for detecting nonclassicality and entanglement [0.0] 量子状態の非古典性を検出できる等間隔プリセッションプロトコルを導入する。
他の古典的でない試験とは異なり、同時または連続的な測定は不要である。
この研究は、偶数の量子ビットのグリーンベルガー-ホーネ-ゼーリンガー絡みを検出する可能性を示すことによって、長期間のギャップを埋める。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:52:55 GMT)
An approach to improve agent learning via guaranteeing goal reaching in all episodes [0.0] 強化学習はマルコフ決定過程における累積報酬の最大化の問題に関係している。
我々は、かなり柔軟で、批判者を構成する限り、事実上あらゆるエージェントを増強するために使用できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 12:27:36 GMT)
An Explainable XGBoost-based Approach on Assessing Detection of Deception and Disinformation [0.0] 我々は, 虚偽やサイバー犯罪に関連する心理言語学および計算言語学のプロセスを用いて, 偽情報の検出に関する先行研究を拡張した。
我々は、偽情報や詐欺、偽陽性、否定的なオンラインレビュー、詐欺などに基づいて訓練されたハイブリッドモデルにおいて、偽情報の偽造パターンを判定しようとする。
4種類のハイブリッドモデルは,75%から85%の予測精度で偽情報や偽情報を検出した。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:16:14 GMT)
Adaptive Multiscale Retinal Diagnosis: A Hybrid Trio-Model Approach for Comprehensive Fundus Multi-Disease Detection Leveraging Transfer Learning and Siamese Networks [0.0] WHOは、世界中の22億人以上がメディアヘイズ、緑内障、ドルーゼンなどの視覚障害に苦しんでいると宣言した。
少なくとも10億件の症例は予防または治療が成功していた可能性があるが、貧困、専門医の欠如、眼科医による不正確な眼底診断、あるいはまれな疾患の存在のために未治療のままである。
これを解決するために,12種類の共通眼疾患と稀眼疾患を正確に診断するハイブリッドトリオネットワークモデルアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 28 May 2024 03:06:10 GMT)
Action for classical, quantum, closed and open systems [0.0] アクション関数は古典的、量子的、閉、開のダイナミクスを定義するのに使うことができる。
これは、自由の度合いを形式的に再活性化する異常な特徴に基づいている。
やり直しを動機付けるいくつかの議論は古典力学や量子力学において、そのような形式主義が自然であることを証明するために進められている。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:37:38 GMT)
AI-Assisted Detector Design for the EIC (AID(2)E) [0.0] ePIC実験には、性能、物理学的到達度、コストなど、多くの設計パラメータと目的が含まれている。
本研究の目的は,EIC(AID(2)E)のためのスケーラブルで分散AI支援型検出器の開発である。
論文参考訳(メタデータ) (Tue, 28 May 2024 16:31:59 GMT)
A study of the spin 1 Unruh-De Witt detectors [0.0] 相対論的スカラー量子場と相互作用するスピン1のウンルー・デ・ウィット検出器について述べる。
両分石英系の密度行列を用いてベル-CHSH不等式の不等式について検討した。
論文参考訳(メタデータ) (Tue, 28 May 2024 19:23:09 GMT)
A physics-inspired evolutionary machine learning method: from the Schrödinger equation to an orbital-free-DFT kinetic energy functional [0.0] 本稿では,物理の変動原理にインスパイアされた機械学習(ML)モデル関数を提案する。
物理学の基本方程式は、適切なトレーニングデータを提供する際にこのML-Omega進化法から導かれる。
ガンマ-TF-ラムダ-vWモデルに基づく独立電子運動エネルギー関数Tsの局所軌道自由(OF)関数式を求める手法が適用された。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:57:15 GMT)
A Verifiable Computing Scheme for Encrypted Control Systems [0.0] 雲から受信した制御信号の正しさを検証することが必須である。
ゼロ知識証明手法のような従来の検証手法は、証明生成と検証の両方で計算的に要求される。
本稿では,確率論的カット・アンド・チョース法に着想を得た,計算的に安価で検証可能な新しい計算ソリューションを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 21:06:39 GMT)
A Survey of Latent Factor Models in Recommender Systems [0.0] 本調査は,リコメンデータシステムにおける潜在因子モデルについて系統的にレビューする。
文献は、学習データ、モデルアーキテクチャ、学習戦略、最適化技術をカバーする構造化されたフレームワークを通して検証される。
論文参考訳(メタデータ) (Tue, 28 May 2024 11:28:59 GMT)
A Review and Implementation of Object Detection Models and Optimizations for Real-time Medical Mask Detection during the COVID-19 Pandemic [0.0] この研究は、Common Objects in Context(COCO)データセット上で最も基本的なオブジェクト検出モデルを評価する。
我々は、医療マスクを用いた人間の顔の話題的、未探索のデータセットをトレーニングするために、YOLOv5と呼ばれる非常に効率的なモデルを選択した。
医療用マスクの正確な検出に移動学習を用いたYOLOv5に基づく最適化モデルを提案する。
論文参考訳(メタデータ) (Tue, 28 May 2024 17:27:24 GMT)
A Qualitative Analysis Framework for mHealth Privacy Practices [0.0] 本稿では,mHealthアプリにおけるプライバシプラクティスの質的評価のための新しいフレームワークを提案する。
調査では、Androidプラットフォーム上でmHealthをリードする152のアプリを分析した。
以上の結果から,機密情報の誤用や誤用に悩まされていることが示唆された。
論文参考訳(メタデータ) (Tue, 28 May 2024 08:57:52 GMT)
A Novel Pseudo Nearest Neighbor Classification Method Using Local Harmonic Mean Distance [0.0] 本稿では, LMPHNNと呼ばれる新しいKNN分類手法を紹介する。
LMPHNNはLMPNNルールとHMDに基づいて分類性能を向上させる。
平均精度は97%で、他の手法を14%上回る。
論文参考訳(メタデータ) (Tue, 28 May 2024 01:48:32 GMT)
A Dynamical Systems Approach to Bots and Online Political Communication [0.0] ボットはデジタル世界でますます普及し、民主的なプロセスを形作る上で積極的な役割を担ってきた。
本研究は、Twitter上でのオンライン政治討論の力学を形作る政治ボットの役割を検討するために、動的システム理論からの情報理論的アプローチを採用する。
論文参考訳(メタデータ) (Tue, 28 May 2024 23:31:21 GMT)
A Deep Neural Network Approach to Fare Evasion [0.0] 本研究の目的は公共交通機関における運賃回避の予測方法を探ることである。
LSTMモデルは、支払いと回避の間の乗客の行動を予測するために、これらのキーポイントに基づいて訓練される。
ReIDモデルはLSTMモデルと併用して精度を向上することができる。
論文参考訳(メタデータ) (Tue, 28 May 2024 06:14:38 GMT)
A Calibration Tool for Refractive Underwater Vision [0.0] 水中屈折式カメラキャリブレーションツールボックスのオープンソース実装を初めて提供する。
カメラ、ステレオ、ハウジングのキャリブレーションを含む水中視覚システムのエンドツーエンドのキャリブレーションを可能にする。
論文参考訳(メタデータ) (Tue, 28 May 2024 10:05:10 GMT)