Position: Bayesian Deep Learning is Needed in the Age of Large-Scale AI [189.1] 本稿では,ベイズ深層学習(BDL)の強みを再考し,既存の課題を認識した。
これらの障害に対処するための、エキサイティングな研究の道のりが浮かび上がっている。
今後の議論は、大規模ファンデーションモデルをBDLと組み合わせて、その潜在能力を最大限に活用する方法に焦点を当てている。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:31:07 GMT)
AI Risk Management Should Incorporate Both Safety and Security [185.7] AIリスクマネジメントの利害関係者は、安全とセキュリティの間のニュアンス、シナジー、相互作用を意識すべきである、と私たちは主張する。
我々は、AIの安全性とAIのセキュリティの違いと相互作用を明らかにするために、統一された参照フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:00:47 GMT)
Training-Free Long-Context Scaling of Large Language Models [114.5] 我々は、Llama2 70Bが連続的なトレーニングなしで100k以上のトークンのコンテキストウィンドウをサポート可能なDual Chunk Attentionを提案する。
長いシーケンスの注意をチャンクベースのモジュールに分解することで、DCAはトークンの相対的な位置情報を効果的にキャプチャする。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:44:58 GMT)
T2V-Turbo: Breaking the Quality Bottleneck of Video Consistency Model with Mixed Reward Feedback [111.4] 本稿では,T2V-Turboについて述べる。T2V-Turboは,様々なモデルから得られるフィードバックを,事前学習したT2Vモデルの一貫性蒸留プロセスに統合する。
興味深いことに、我々のT2V-Turboの4段階の世代は、Gen-2とPikaを抜いてVBenchで最高スコアを達成した。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:26:17 GMT)
A Large-Scale Evaluation of Speech Foundation Models [111.0] 音声処理ユニバーサルパフォーマンスベンチマーク(SUPERB)を構築し,基礎モデルパラダイムの有効性について検討する。
凍結基盤モデルを用いてSUPERBにおける音声処理タスクに対処する統合マルチタスクフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:24:40 GMT)
Matryoshka Query Transformer for Large Vision-Language Models [103.8] 我々は,Materyoshka Query Transformer (MQT)を導入し,推論中に画像をmビジュアルトークンにエンコードする。
単一のモデルを一度トレーニングし、フレキシブルかつ劇的に、推論時の視覚トークンの数を削減します。
MQT-LLAVAは,LLaVAの固定576の代わりに最大256トークンを用いて,11ベンチマークでLLaVA-1.5のパフォーマンスと一致した。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:39:42 GMT)
Enhancing Visual-Language Modality Alignment in Large Vision Language Models via Self-Improvement [102.2] SIMAは、自己改善を通じて視覚的および言語的モダリティアライメントを強化するフレームワークである。
コンテキスト内自己批判機構を使用して、プライオリティチューニングのためのレスポンスペアを選択する。
SIMAは従来の手法よりも優れたモダリティアライメントを実現することを実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:07:53 GMT)
Relative Error Bound Analysis for Nuclear Norm Regularized Matrix Completion [101.8] 我々は、原子核ノルム正規化行列補完に対する相対誤差を開発する。
未知行列の最適低ランク近似を回復するための相対上界を導出する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:39:59 GMT)
Adaptive Image Quality Assessment via Teaching Large Multimodal Model to Compare [99.6] 我々はLMMに基づくノン参照IQAモデルであるCompare2Scoreを紹介する。
トレーニング中、同じIQAデータセットの画像を比較することで、スケールアップ比較命令を生成する。
9つのIQAデータセットの実験により、Compare2Scoreは、トレーニング中にテキスト定義の比較レベルを効果的にブリッジすることを確認した。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:26:09 GMT)
MOKD: Cross-domain Finetuning for Few-shot Classification via Maximizing Optimized Kernel Dependence [97.9] NCCは、ドメイン間数ショットの分類において、少数ショットの分類が可能なメートル法空間を構築するために表現を学ぶことを目的としている。
本稿では,異なるクラスから得られた2つの標本の NCC 学習表現に高い類似性があることを見出した。
ラベル付きデータによって示されるクラスタ構造にマッチするクラス固有の表現の集合を学習するために、最適化されたカーネル依存(MOKD)を最大化する二段階最適化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:59:52 GMT)
CoVoMix: Advancing Zero-Shot Speech Generation for Human-like Multi-talker Conversations [97.8] CoVoMixは、ゼロショット、人間ライク、マルチスピーカー、マルチラウンド対話音声生成のための新しいモデルである。
対話モデリングと生成の有効性を測定するための総合的なメトリクスセットを考案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:30:20 GMT)
InstructVid2Vid: Controllable Video Editing with Natural Language Instructions [97.2] InstructVid2Vidは、人間の言語命令でガイドされたビデオ編集のためのエンドツーエンドの拡散ベースの方法論である。
我々のアプローチは、自然言語ディレクティブによって案内される映像操作を強化し、サンプルごとの微調整や逆変換の必要性を排除します。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:08:41 GMT)
X-VILA: Cross-Modality Alignment for Large Language Model [92.0] X-VILAは、画像、ビデオ、オーディオのモダリティを組み込むことで、大きな言語モデル(LLM)の機能を拡張するために設計された、オールニモダリティモデルである。
視覚情報損失問題に対処するため,視覚埋め込みハイウェイモジュールを用いた視覚アライメント機構を提案する。
X-VILAは、あらゆるモダリティの会話に習熟し、それまでのアプローチを大きなマージンで上回っている。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:59:58 GMT)
Self-Exploring Language Models: Active Preference Elicitation for Online Alignment [90.5] 本稿では,分布域外領域を積極的に探索するために,潜在的に高次応答に対して楽観的に偏りを呈する2段階的客観的手法を提案する。
実験の結果,Zephyr-7B-SFTとLlama-3-8B-Instructモデルで微調整すると,SELMは命令追従ベンチマークの性能を大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:59:07 GMT)
LLMs Meet Multimodal Generation and Editing: A Survey [89.8] 本調査では,画像,ビデオ,3D,オーディオなど,さまざまな領域にわたるマルチモーダル生成について詳しく検討する。
具体的には,本研究で活用されている手法とマルチモーダルデータセットの背景にある重要な技術要素を網羅的に検討する。
最後に、AIの安全性の進歩について包括的に議論し、新興のアプリケーションと今後の展望について調査する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:59:20 GMT)
Correctable Landmark Discovery via Large Models for Vision-Language Navigation [89.2] Vision-Language Navigation (VLN) は、ターゲット位置に到達するために、エージェントが言語命令に従う必要がある。
以前のVLNエージェントは、特に探索されていないシーンで正確なモダリティアライメントを行うことができない。
我々は,Large ModEls (CONSOLE) によるコレクタブルLaNdmark DiScOveryと呼ばれる新しいVLNパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:05:59 GMT)
Nearest Neighbor Speculative Decoding for LLM Generation and Attribution [87.3] Nearest Speculative Decoding (NEST)は、任意の長さの実世界のテキストスパンをLM世代に組み込むことができ、それらのソースへの属性を提供する。
NESTは、様々な知識集約タスクにおいて、基本LMの生成品質と帰属率を大幅に向上させる。
さらに、NESTは、Llama-2-Chat 70Bに適用した場合の推論時間において1.8倍のスピードアップを達成することにより、生成速度を大幅に改善する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:55:03 GMT)
Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention [87.0] 単一視点画像から高解像度のマルチビュー画像を生成する新しい多視点拡散法であるEra3Dを紹介する。
Era3Dは、最大512*512の解像度で高品質なマルチビュー画像を生成し、複雑さを12倍に削減する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:41:47 GMT)
MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Series [86.3] 私たちはMAP-Neoをオープンソースにしました。これは、4.5Tの高品質トークン上で、スクラッチからトレーニングされた7Bパラメータを持つバイリンガル言語モデルです。
MAP-Neo は,既存の最先端 LLM と比較して性能が劣る初の完全オープンソースバイリンガル LLM である。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:57:16 GMT)
Achieving >97% on GSM8K: Deeply Understanding the Problems Makes LLMs Better Solvers for Math Word Problems [86.0] CoT(Chain-of-Thought)のプロンプトにより、さまざまな推論タスクにわたるLLM(Large Language Models)のパフォーマンスが向上した。
CoTは通常、セマンティックな誤解エラー、計算エラー、ステップミスという3つの落とし穴に悩まされる。
意味的誤解の誤りに対処し,LLMの数学的問題解決能力を改善するために,DUP(Deeply Understanding the Problems)を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:27:53 GMT)
Locally Estimated Global Perturbations are Better than Local Perturbations for Federated Sharpness-aware Minimization [81.3] フェデレートラーニング(FL)では、クライアント間の複数ステップの更新とデータの均一性が、よりシャープなミニマによるロスランドスケープにつながることが多い。
クライアント側におけるグローバルな摂動方向を局所的に推定する新しいアルゴリズムであるFedLESAMを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:46:21 GMT)
System-2 Recommenders: Disentangling Utility and Engagement in Recommendation Systems via Temporal Point-Processes [81.0] 本稿では,過去のコンテンツインタラクションが,自己興奮型ホークスプロセスに基づくユーザの到着率に影響を及ぼす生成モデルを提案する。
そこで本研究では,システム1とシステム2のアンタングルを解消し,ユーザ利用によるコンテンツ最適化を可能にすることを解析的に示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:19:37 GMT)
SketchDeco: Decorating B&W Sketches with Colour [80.9] 本稿では,色彩の普遍的な幼児期活動に触発された,色彩のスケッチ化への新たなアプローチを紹介する。
精度と利便性のバランスを考慮し,地域マスクとカラーパレットを用いて直感的なユーザコントロールを実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:53:59 GMT)
Value-Incentivized Preference Optimization: A Unified Approach to Online and Offline RLHF [80.3] オンラインとオフラインのRLHFに統一的なアプローチを導入します。
VPOは、報酬関数の最大値推定を対応する値関数で正規化する。
テキスト要約とダイアログの実験は、VPOの実用性と有効性を検証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:51:42 GMT)
M$^3$GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation [80.2] M$3$GPTは、理解と生成のための先進的な$textbfM$ultimodal, $textbfM$ultitaskフレームワークである。
我々は、テキスト、音楽、モーション/ダンスなどのマルチモーダル制御および生成信号に離散ベクトル量子化を用いる。
M$3$GPTは、様々な動作関連タスク間の接続とシナジーをモデル化することを学ぶ。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:46:57 GMT)
Parameter-efficient Fine-tuning in Hyperspherical Space for Open-vocabulary Semantic Segmentation [79.7] オープンボキャブラリセマンティックセグメンテーションは、画像中の各ピクセルに任意のテキスト記述をラベル付けしようとする。
視覚言語基盤モデル、特にCLIPは、オープン語彙能力を取得するための強力なツールとして登場した。
H-CLIPは、CLIPの総パラメータの約4%を更新するだけで、新しいSOTAオープン語彙セマンティックセマンティックセマンティクス結果を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:41:34 GMT)
Understanding and Addressing the Under-Translation Problem from the Perspective of Decoding Objective [72.8] 最新のニューラル・マシン・トランスレーション(NMT)システムでは、アンダー・トランスレーションとオーバー・トランスレーションの2つの課題が残っている。
我々は,NMTにおけるアンダートランスレーションの根本原因を詳細に分析し,デコード目的の観点から解説する。
本研究は,低翻訳の検知器としてEOS(End Of Sentence)予測の信頼性を活用し,低翻訳のリスクが高い候補を罰する信頼性に基づくペナルティを強化することを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:25:49 GMT)
Evaluating the External and Parametric Knowledge Fusion of Large Language Models [72.4] 我々は、知識融合シナリオをシミュレートするデータ構築と知識注入のための体系的なパイプラインを開発する。
本研究は, LLMにおけるパラメトリック知識の強化が, 知識統合能力を大幅に向上させることを明らかにした。
本研究の目的は,LLM内の外部およびパラメトリック知識の調和を図ることにある。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:48:27 GMT)
Superposed Decoding: Multiple Generations from a Single Autoregressive Inference Pass [72.1] Superposed Decodingは、1つの自己回帰推論パスのコストで$k$のドラフトを生成する新しい復号アルゴリズムである。
我々の実験によると、Superposed Decodingの$k$ドラフトは、少なくとも一貫性があり、現実的である。
Nucleus Smpling と Greedy Decoding はそれぞれ。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:33:08 GMT)
STAT: Shrinking Transformers After Training [72.1] 微調整なしで変圧器モデルを作成するための簡単なアルゴリズムSTATを提案する。
STATは、次の層の重みを補正して精度を保ちながら、注意頭とニューロンの両方をネットワークから排除する。
われわれのアルゴリズムは、BERTを圧縮するのに数分を要し、単一のGPUを用いて7Bパラメータを持つモデルを圧縮するのに3時間もかからない。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:59:11 GMT)
LP-3DGS: Learning to Prune 3D Gaussian Splatting [72.0] 本稿では,トレーニング可能な2値マスクを重要度に応用し,最適プルーニング比を自動的に検出する3DGSを提案する。
実験の結果,LP-3DGSは効率と高品質の両面において良好なバランスを保っていることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:58:34 GMT)
$E^{3}$Gen: Efficient, Expressive and Editable Avatars Generation [71.7] 本稿では,効率的な,表現的で編集可能なデジタルアバター生成のための3Dガウスモデルを提案する。
本稿では,これらの課題を効果的に解決するために,$E3$Genという新しいアバター生成手法を提案する。
提案手法は,アバター生成における優れた性能を実現し,表現力のあるフルボディポーズ制御と編集を可能にする。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:43:49 GMT)
FourierMamba: Fourier Learning Integration with State Space Models for Image Deraining [71.5] Image derainingは雨が降る画像から雨の跡を取り除き、透明な背景を復元することを目的としている。
本稿では,FourierMambaという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:58:59 GMT)
Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [70.9] 大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:15:46 GMT)
Protecting Split Learning by Potential Energy Loss [70.8] 我々は、分割学習の前方埋め込みからのプライバシー漏洩に焦点を当てる。
我々は、前方埋め込みをより「複雑化」させるためのエネルギー損失の可能性を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:27:49 GMT)
Language Generation with Strictly Proper Scoring Rules [70.3] 本稿では,非局所的なスコアリングルールを用いた言語モデリングが可能な,スコアリングルールを言語生成に適用するための戦略を提案する。
対数スコアの代替として、ブライアスコアと球面スコアの2つの古典的厳密なスコアルールを用いて言語生成モデルを訓練する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:09:00 GMT)
DiveR-CT: Diversity-enhanced Red Teaming with Relaxing Constraints [68.8] DiveR-CTを導入し、目的と意味の報酬に対する従来の制約を緩和し、多様性を高める政策により大きな自由を与える。
実験では,1)様々な攻撃成功率の多様な多様性指標において優れたデータを生成すること,2)収集したデータに基づく安全性チューニングによる青チームモデルのレジリエンスの向上,3)信頼性と制御可能な攻撃成功率に対する目標重みの動的制御,3)報酬過大化に対する感受性の低下など,ベースラインよりも優れたDiveR-CTの顕著な優位性を実証した。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:12:09 GMT)
Chem-FINESE: Validating Fine-Grained Few-shot Entity Extraction through Text Reconstruction [68.8] 化学領域における微粒な数発の実体抽出は、2つの固有の課題に直面している。
Chem-FINESEには、Seq2seqエンティティ抽出器とSeq2seq自己検証モジュールの2つのコンポーネントがある。
新たに提案したフレームワークは,それぞれ8.26%,6.84%の絶対F1スコアゲインに寄与している。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:24:15 GMT)
Robust Preference Optimization through Reward Model Distillation [68.7] 言語モデル (LM) は、好みのアノテーションから派生した報酬関数を最大化する。
DPOは、報酬モデルや強化学習を適用することなく、優先データに直接ポリシーを訓練する一般的なオフラインアライメント手法である。
この現象を解析し, 生成対よりも真の嗜好分布のより良いプロキシを得るため, 蒸留を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:39:48 GMT)
Test-Time Model Adaptation with Only Forward Passes [68.1] テストタイム適応は、トレーニング済みのモデルを、潜在的に分布シフトのある未確認テストサンプルに適応させるのに有効であることが証明されている。
テスト時間フォワード最適化適応法(FOA)を提案する。
FOAは量子化された8ビットのViTで動作し、32ビットのViTで勾配ベースのTENTより優れ、ImageNet-Cで最大24倍のメモリ削減を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:24:55 GMT)
VideoTree: Adaptive Tree-based Video Representation for LLM Reasoning on Long Videos [67.8] VideoTreeは、大規模言語モデルによる長いビデオ理解のための、クエリ適応的で階層的なフレームワークである。
VideoTreeは、視覚的特徴に基づいて反復的なクラスタリングフレームによってキャプション用のフレームを適応的に選択する。
ビジュアルクラスタをクエリ適応的で階層的なツリー構造に整理する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:49:09 GMT)
UniPTS: A Unified Framework for Proficient Post-Training Sparsity [67.2] Post-Traiing Sparsity (PTS)は、必要な限られたデータで効率的なネットワークスパシティを追求する、新たに登場した道である。
本稿では,従来のスパシティの性能をPSSの文脈に大きく変化させる3つの基本因子を変換することで,この相違を解消しようとする。
我々のフレームワークはUniPTSと呼ばれ、広範囲のベンチマークで既存のPTSメソッドよりも優れていることが検証されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:53:18 GMT)
Machine Vision Therapy: Multimodal Large Language Models Can Enhance Visual Robustness via Denoising In-Context Learning [67.1] 本稿では,視覚モデルからノイズ予測を補正するマシンビジョンセラピーを提案する。
復調ラベルを微調整することにより、教師なしの方法で学習モデルの性能を高めることができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:40:44 GMT)
Faster Cascades via Speculative Decoding [66.2] 提案手法は,投機的実行による推論規則を実装した新しい投機的カスケード手法である。
提案手法はカスケードや投機的復号化ベースラインよりもコスト品質の高いトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:55:08 GMT)
PointMamba: A Simple State Space Model for Point Cloud Analysis [65.6] 我々は、最近の代表的状態空間モデル(SSM)であるMambaの成功を、NLPからポイントクラウド分析タスクへ転送するPointMambaを提案する。
従来のトランスフォーマーとは異なり、PointMambaは線形複雑性アルゴリズムを採用し、グローバルなモデリング能力を示しながら計算コストを大幅に削減する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:32:51 GMT)
Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.2] Reinforcement Learning from Human Feedback (RLHF)のような最先端技術は、しばしば2つの段階から構成される。
1)教師付き微調整(SFT)では,人間の実演データからモデルを微調整する。
2)選好学習では,選好データを用いて報奨モデルを学習し,そのモデルを微調整する強化学習ステップで活用する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:33:33 GMT)
Risks and Opportunities of Open-Source Generative AI [64.9] Generative AI(Gen AI)の応用は、科学や医学、教育など、さまざまな分野に革命をもたらすことが期待されている。
こうした地震の変化の可能性は、この技術の潜在的なリスクについて活発に議論を巻き起こし、より厳格な規制を要求した。
この規制は、オープンソースの生成AIの誕生する分野を危険にさらす可能性がある。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:05:40 GMT)
AlchemistCoder: Harmonizing and Eliciting Code Capability by Hindsight Tuning on Multi-source Data [64.7] 本稿では、マルチソースデータに微調整されたコード生成と一般化機能を備えたコードLLMのシリーズであるAlchemistCoderを紹介する。
本稿では,データ構築過程を微調整データに組み込んで,命令の進化,データフィルタリング,コードレビューなどのコード理解タスクを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:57:33 GMT)
Federated Learning under Partially Class-Disjoint Data via Manifold Reshaping [64.6] 我々はFedMRと呼ばれる多様体再構成手法を提案し、局所訓練の特徴空間を校正する。
我々は、FedMRがはるかに高い精度と通信効率を達成することを示すために、さまざまなデータセットに関する広範な実験を行います。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:56:13 GMT)
One-Shot Safety Alignment for Large Language Models via Optimal Dualization [64.5] 本稿では,制約付きアライメントを等価な非制約アライメント問題に還元する双対化の観点を提案する。
我々は、閉形式を持つ滑らかで凸な双対函数を事前に最適化する。
我々の戦略は、モデルベースと嗜好ベースのシナリオにおける2つの実用的なアルゴリズムに導かれる。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:12:52 GMT)
TotalSegmentator MRI: Sequence-Independent Segmentation of 59 Anatomical Structures in MR images [62.5] 本研究では,TotalSegmentatorをMR画像に拡張した。
このデータセットに基づいてnnU-Netセグメンテーションアルゴリズムを訓練し、類似度係数(Dice)を計算し、モデルの性能を評価した。
このモデルは、他の2つの公開セグメンテーションモデル(Dice score 0.824 vs 0.762; p0.001 and 0.762 versus 0.542; p)を大きく上回った。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:15:54 GMT)
Preference Learning Algorithms Do Not Learn Preference Rankings [62.3] 選好調整モデルの多くは、共通の選好データセット上で60%未満のランキング精度を実現する。
我々は、この矛盾をDPOの目的に当てはめ、これは経験的にも理論的にも、微妙なランキングエラーの修正に不適当である。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:29:44 GMT)
Scaling Laws and Compute-Optimal Training Beyond Fixed Training Durations [62.1] スケールとトレーニングの研究は、余剰のスケジュールに依存するため、必然的に複雑である、と我々は主張する。
直接学習率とスケジュールの訓練行動について検討し,コサインと予測可能かつ確実に類似していることを確認した。
その結果,重量平均化はトレーニングの軌道に沿って,異なるスケールでのトレーニングコストを伴わずに向上することがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:56:26 GMT)
Can Graph Learning Improve Task Planning? [61.5] タスクプランニングは、大規模言語モデル(LLM)の開発とともに重要な研究トピックとして浮上している。
本稿では,タスク計画のためのグラフ学習に基づく手法について検討する。
提案手法は、改良されたプロンプトや微調整モデルにより、さらなる性能向上を図り、プロンプトエンジニアリングと微調整技術を補完する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:26:24 GMT)
Spotting AI's Touch: Identifying LLM-Paraphrased Spans in Text [61.2] 我々は、新しいフレームワーク、パラフレーズテキストスパン検出(PTD)を提案する。
PTDは、テキスト内でパラフレーズ付きテキストを識別することを目的としている。
パラフレーズ付きテキストスパン検出のための専用データセットであるPASTEDを構築した。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:09:59 GMT)
The Data Minimization Principle in Machine Learning [61.2] データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。
様々な国際データ保護規制によって支持されている。
しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:40:27 GMT)
3D Neural Edge Reconstruction [61.1] 本研究では,線と曲線に焦点をあてて3次元エッジ表現を学習する新しい手法であるEMAPを紹介する。
多視点エッジマップから無符号距離関数(UDF)の3次元エッジ距離と方向を暗黙的に符号化する。
この神経表現の上に、推定されたエッジ点とその方向から3次元エッジを頑健に抽象化するエッジ抽出アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:23:51 GMT)
Gaitor: Learning a Unified Representation Across Gaits for Real-World Quadruped Locomotion [61.0] 現在の四足歩行の最先端は、地形の頑丈な動きを生み出すことができるが、望ましいロボット軌道をトロットやクロールのような個別の移動スキルに分割する必要がある。
歩行タイプと特徴を連続的にブレンドできる四足歩行の単一統一表現を学習できる可能性を示した。
本稿では,運動スキルのゆがみのある表現を学習し,トレーニング中に見られるすべての歩行タイプに共通する情報を共有するGaitorを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:02:57 GMT)
Lessons from the Trenches on Reproducible Evaluation of Language Models [60.5] 我々は,大規模言語モデルの評価を3年間経験し,研究者に指導とレッスンを提供してきた。
本稿では,言語モデルの独立性,再現性,評価を行うオープンソースライブラリであるLanguage Model Evaluation Harness(lm-eval)を紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:15:53 GMT)
REBEL: Reinforcement Learning via Regressing Relative Rewards [59.7] 生成モデルの時代における最小限のRLアルゴリズムであるREBELを提案する。
理論的には、自然ポリシーグラディエントのような基本的なRLアルゴリズムはREBELの変種と見なすことができる。
我々はREBELが言語モデリングと画像生成に一貫したアプローチを提供し、PPOやDPOとより強くあるいは類似した性能を実現することを発見した。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:52:20 GMT)
Cognitive Evolutionary Learning to Select Feature Interactions for Recommender Systems [59.1] Cellはさまざまなタスクやデータに対して,さまざまなモデルに適応的に進化可能であることを示す。
4つの実世界のデータセットの実験では、細胞は最先端のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:35:23 GMT)
MathChat: Benchmarking Mathematical Reasoning and Instruction Following in Multi-Turn Interactions [58.6] 本稿では,大規模言語モデル (LLM) を評価するためのベンチマークであるMathChatを紹介する。
我々は,MathChatベンチマーク上での様々なSOTA LLMの性能評価を行い,これらのモデルが単ターン質問応答において優れているが,より複雑なシナリオでは性能が著しく劣っていることを観察した。
我々は,LLMファインタニングのための合成対話に基づく数学データセットであるMathChat syncを開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:45:55 GMT)
FocSAM: Delving Deeply into Focused Objects in Segmenting Anything [58.0] Segment Anything Model (SAM)はセグメンテーションモデルにおいて注目すべきマイルストーンである。
2つの重要な側面に基づいてパイプラインを再設計したFocSAMを提案する。
まず,Dwin-MSA(Dynamic Window Multi-head Self-Attention)を提案する。
次に,Pixel-wise Dynamic ReLU (P-DyReLU)を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:34:13 GMT)
Safety through Permissibility: Shield Construction for Fast and Safe Reinforcement Learning [57.8] シールドディング」は、強化学習(RL)の安全性を強制する一般的な手法である
安全と遮蔽構造に対処する新しい許容性に基づく枠組みを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:00:21 GMT)
Anomaly Detection by Context Contrasting [57.7] 異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。
本稿では、通常のトレーニングデータを異なるコンテキストに設定することで、この問題に対処するCon2を提案する。
より現実的な医療環境では,様々なベンチマークで最先端のパフォーマンスを実現しつつ,優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:59:06 GMT)
On the Role of Attention Masks and LayerNorm in Transformers [55.8] 自己注意はトランスの鍵となるメカニズムである。
近年の研究では、純粋な自己意識は階級崩壊の度合いが増すことが示されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:41:28 GMT)
Less is More: Mitigating Multimodal Hallucination from an EOS Decision Perspective [55.4] 大規模なマルチモーダルモデル(LMM)は、視覚的な入力に存在しないコンテンツを生成するため、しばしば多モーダル幻覚に悩まされる。
本稿では,モデルが生成をタイムリーに終了する能力を阻害する,過度に詳細なトレーニングデータについて検討する。
生成したテキストと画像を比較し,シーケンス全体の完全性を評価する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:55:09 GMT)
Improving Token-Based World Models with Parallel Observation Prediction [55.4] トークンベースの世界モデル(TBWM)は、最近サンプル効率のよい方法として提案されている。
想像の中で、次の観測のシーケンシャルなトークン・バイ・トークンの生成は深刻なボトルネックをもたらす。
我々は、このボトルネックを解決するために、新しい並列観測予測(POP)機構を考案した。
POPは、我々の強化学習環境に合わせて、新しいフォワードモードでRetentive Network(RetNet)を拡張します。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:16:28 GMT)
Klein-Gordon oscillators, RQM and quantum time [55.2] 相対論的スピンレス粒子と相対論的量子力学(RQM)の真空との相互作用をオンにすると、Klein-Gordon方程式とKlein-Gordon方程式が置き換えられることを示す。
この場合、座標時間は演算子となり、自由相対論的粒子は仮想状態に入る。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:43:37 GMT)
NeRF On-the-go: Exploiting Uncertainty for Distractor-free NeRFs in the Wild [55.2] 我々は,複雑なシーンにおける新規ビューのロバストな合成を可能にする,シンプルで効果的な方法であるNeRF On-the-goを紹介する。
本手法は,最先端技術よりも大幅に向上したことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:53:40 GMT)
Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.1] 本稿では,天気予報をより微細なテンポラルスケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
我々は、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:02:48 GMT)
Going beyond compositional generalization, DDPMs can produce zero-shot interpolation [55.0] Denoising Diffusion Probabilistic Models (DDPM) は画像生成において顕著な能力を示す。
本研究では,データ分散の厳密な部分集合を訓練したDDPMについて検討する。
本研究では,そのようなモデルにより,探索されていない中間領域の画像を効果的に生成できることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:41:53 GMT)
Memorize What Matters: Emergent Scene Decomposition from Multitraverse [54.5] 3次元ガウス写像は3次元ガウス写像をベースとしたカメラのみのオフラインマッピングフレームワークである。
3DGMは、同じ領域から複数のRGBビデオをガウスベースの環境マップに変換し、同時に2D短命なオブジェクトセグメンテーションを実行する。
We build the Mapverse benchmark, sourced from the Ithaca365 and nuPlan datasets, to evaluate our method in unsupervised 2D segmentation, 3D reconstruction, and Neural rendering。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:32:23 GMT)
SFANet: Spatial-Frequency Attention Network for Weather Forecasting [54.5] 天気予報は様々な分野において重要な役割を担い、意思決定とリスク管理を推進している。
伝統的な手法は、しばしば気象系の複雑な力学を捉えるのに苦労する。
本稿では,これらの課題に対処し,天気予報の精度を高めるための新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:00:15 GMT)
A Canonization Perspective on Invariant and Equivariant Learning [54.4] カノン化は、フレームの設計を原則的に理解する。
フレームと標準形式の間には固有の関係があることが示される。
既存の手法よりも厳密な固有ベクトルのための新しいフレームを設計する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:31:19 GMT)
Auto-selected Knowledge Adapters for Lifelong Person Re-identification [54.4] Lifelong Person Re-Identificationは、異なる時間と場所にわたる重複しないデータセットから継続的に学習するシステムを必要とする。
リハーサルのない、あるいはリハーサルベースの既存のアプローチは、依然として破滅的な忘れ込みの問題に悩まされている。
本稿では,知識アダプタを採用した新しいフレームワークであるAdalReIDと,生涯学習のためのパラメータフリー自動選択機構を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:42:02 GMT)
Improving Neural Additive Models with Bayesian Principles [54.3] ニューラル加算モデル(NAM)は、個別の加算サブネットワークでキャリブレーションされた入力特徴を扱うことにより、ディープニューラルネットワークの透明性を高める。
本研究では,Laplace-approximated NAM (LA-NAMs) を開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:02:21 GMT)
Towards Building Multilingual Language Model for Medicine [54.1] 6つの主要言語を含む約25.5Bトークンを含む多言語医療コーパスを構築した。
MMedBench と呼ばれる有理性を持つ多言語医療用多言語質問応答ベンチマークを提案する。
我々の最終モデルであるMMed-Llama 3は、8Bパラメータしか持たないが、MMedBenchおよび英語ベンチマークの他のすべてのオープンソースモデルと比較して優れた性能が得られる。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:15:38 GMT)
Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.1] 我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:09:34 GMT)
Reverse Image Retrieval Cues Parametric Memory in Multimodal LLMs [54.1] 逆画像検索(Reverse Image Retrieval, RIR)拡張生成は, Web スケールの逆画像検索で MLLM を増強する単純な方法である。
RIRは、GPT-4Vの知識集約型視覚質問応答(VQA)を37-43%、GPT-4 Turboを25-27%、GPT-4oを18-20%改善する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:00:41 GMT)
A Wireless AI-Generated Content (AIGC) Provisioning Framework Empowered by Semantic Communication [53.8] 生成AIアプリケーションは、多彩で高品質なAI生成コンテンツ(AIGC)を作成することで、最近、膨大なユーザーベースに対応している。
無線ネットワークにおいて、不安定なチャネル、限られた帯域幅リソース、不均一に分散された計算リソースを備えた適切なAIGCサービスを提供するのは難しい。
本稿では,セマンティック通信(SemCom)を利用したAIGC(SemAIGC)の生成と伝送フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:05:14 GMT)
Dr-LLaVA: Visual Instruction Tuning with Symbolic Clinical Grounding [53.6] VLM(Vision-Language Models)は、医用画像を分析し、自然言語の相互作用に関与することによって、臨床医を支援する。
VLMはしばしば「幻覚的」な振る舞いを示し、文脈的マルチモーダル情報に基づかないテキスト出力を生成する。
本稿では,臨床推論の象徴的表現を用いて医療知識にVLMを基盤とする新たなアライメントアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:19:28 GMT)
Computing Low-Entropy Couplings for Large-Support Distributions [53.0] 最小エントロピー結合は因果関係やステガノグラフィーなどの分野で応用されている。
既存のアルゴリズムは、大容量の分布に対して計算的に抽出可能であるか、特定の分布タイプに限定されている。
この研究は、事前の反復MECアプローチを一般化されたパーティションベースの形式主義に統一することにより、これらの制限に対処する。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:54:51 GMT)
Programmable Motion Generation for Open-Set Motion Control Tasks [51.7] 我々は新しいパラダイム、プログラム可能なモーション生成を導入する。
このパラダイムでは、任意の運動制御タスクは原子制約の組み合わせに分解される。
これらの制約は、運動列がそれに付着する程度を定量化するエラー関数にプログラムされる。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:14:55 GMT)
PLIP: Language-Image Pre-training for Person Representation Learning [51.3] 個人表現学習のための新しい言語画像事前学習フレームワークPLIPを提案する。
このフレームワークを実装するために,SynTH-PEDESという画像テキストペアを用いた大規模人物データセットを構築した。
PLIPはこれらのタスクの既存のメソッドを大幅に改善するだけでなく、ゼロショットやドメインの一般化設定でも優れた機能を示している。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:57:39 GMT)
Deep Grokking: Would Deep Neural Networks Generalize Better? [51.2] グロキング(Grokking)とは、テストセットにおけるネットワークの一般化精度の急激な上昇を指す。
深層ニューラルネットワークは、浅いものよりもグラッキングの影響を受けやすいことがわかりました。
また,モデル深度を増大させると,興味深い多段階一般化現象が観測される。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:05:11 GMT)
Rejection via Learning Density Ratios [50.9] 拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:32:17 GMT)
RLeXplore: Accelerating Research in Intrinsically-Motivated Reinforcement Learning [50.6] 外部報酬は、特定のタスクにおける強化学習(RL)エージェントを効果的に導くことができる。
RLeXploreは,8つの最先端固有の報酬アルゴリズムの信頼性を実現する,統一的で高度にモジュール化されたプラグイン・アンド・プレイフレームワークである。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:23:20 GMT)
On the Properties and Estimation of Pointwise Mutual Information Profiles [49.9] ポイントワイド相互情報プロファイル(ポイントワイド相互情報プロファイル、英: pointwise mutual information profile)は、与えられた確率変数のペアに対するポイントワイド相互情報の分布である。
そこで我々は,モンテカルロ法を用いて分布を正確に推定できる新しい分布系 Bend と Mix Models を導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:04:18 GMT)
Multi-Scale 3D Gaussian Splatting for Anti-Aliased Rendering [48.4] 3Dガウシアンは最近、3D再構成とレンダリングの非常に効率的な表現として現れた。
高精細度で高精細度で高精細度でレンダリングするが、低精細度や遠方のカメラ位置でレンダリングすると大幅に劣化する。
そこで本研究では,ガウスを異なるスケールで維持し,同じシーンを表現できるマルチスケール3次元ガウススプレイティングアルゴリズムを提案する。
提案アルゴリズムは13%-66%のPSNRと160%-2400%のレンダリング速度を4$times$-128$times$ scale rendering on Mip-NeRF360 data。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:24:04 GMT)
On Exploring PDE Modeling for Point Cloud Video Representation Learning [48.0] 我々は、PointNetライクなエンコーダとPDE解決モジュールで構成されるMotion PointNetを紹介する。
私たちのMotion PointNetは、MSRAction-3Dデータセットで97.52%の精度を実現しています。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:01:55 GMT)
3D-GPT: Procedural 3D Modeling with Large Language Models [47.7] 命令駆動3Dモデリングのための大規模言語モデル(LLM)を利用するフレームワークである3D-GPTを紹介する。
3D-GPTは、3Dモデリングタスクをアクセス可能なセグメントに分割し、各タスクにアプエージェントを割り当てる。
我々の実証調査では、3D-GPTが解釈し、指示を実行し、信頼性の高い結果を提供するだけでなく、人間デザイナーと効果的に協力することを確認した。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:35:15 GMT)
InstructRetro: Instruction Tuning post Retrieval-Augmented Pretraining [47.6] Retro 48Bは検索で事前訓練された最大の大規模言語モデルである。
InstructRetroは、幅広いゼロショットタスクでチューニングされたGPTよりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:15:39 GMT)
Federated Learning with Bilateral Curation for Partially Class-Disjoint Data [47.6] 部分的なクラス分離データ(PCDD)は、一般的なが未探索のデータ生成であり、フェデレートされたアルゴリズムの性能に深刻な挑戦をする。
我々はFedGELAと呼ばれる新しい手法を提案し、ETFは局所的に個人分布に適応しながら、単純なETFとしてグローバルに固定されている。
我々は、FedGELAが有望なパフォーマンスを達成することを示すために、さまざまなデータセットに関する広範な実験を行います。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:34:44 GMT)
Lower Bounds on the Expressivity of Recurrent Neural Language Models [47.5] ニューラルLMの表現能力の研究は、形式言語を認識できる能力に主に焦点を絞っている。
本稿では, RNN LM の表現能力について, 線形有界精度を持つ RNN LM が任意の正則な LM を表現可能であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:02:09 GMT)
MonoNPHM: Dynamic Head Reconstruction from Monocular Videos [47.5] モノクラーRGBビデオからの動的3次元頭部再構成のためのモノクラーニューラルパラメトリックヘッドモデル(MonoNPHM)を提案する。
我々は、RGBからの勾配が逆レンダリング中の潜時幾何学符号に効果的に影響を及ぼすような、下層の幾何学と相関する予測色値を制約する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:30:06 GMT)
Efficient and Effective Time-Series Forecasting with Spiking Neural Networks [47.4] スパイキングニューラルネットワーク(SNN)は、時間データの複雑さを捉えるためのユニークな経路を提供する。
SNNを時系列予測に適用することは、効果的な時間的アライメントの難しさ、符号化プロセスの複雑さ、およびモデル選択のための標準化されたガイドラインの欠如により困難である。
本稿では,時間情報処理におけるスパイクニューロンの効率を活かした時系列予測タスクにおけるSNNのためのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:58:23 GMT)
A Graph is Worth $K$ Words: Euclideanizing Graph using Pure Transformer [47.3] 我々は、非ユークリッドグラフを学習可能なグラフワードに変換するGraph2Seqエンコーダを特徴とするGraphsGPTを紹介する。
GraphGPTデコーダは、元のグラフをGraph Wordsから再構成し、情報等価性を保証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:40:35 GMT)
Understanding and Improving Training-free Loss-based Diffusion Guidance [46.8] トレーニングフリーガイダンスの理解を深め、その制限を克服します。
これらの欠点を解明するために, 学習自由指導は, 対向勾配の影響を受けやすいことを理論的に証明した。
次に,その限界を克服するために,理論的理論的根拠と実証的証拠を伴って,一連の手法を導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:59:36 GMT)
ViTGAN: Training GANs with Vision Transformers [46.8] 視覚変換器(ViT)は、視覚固有の誘導バイアスを少なくしながら、画像認識に競争力を発揮している。
ViTを用いたGANのトレーニングのための新しい正規化手法をいくつか紹介する。
我々のアプローチはViTGANと呼ばれ、3つのデータセット上の主要なCNNベースのGANモデルに匹敵する性能を実現している。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:41:05 GMT)
On Generating Monolithic and Model Reconciling Explanations in Probabilistic Scenarios [46.8] 本稿では,確率論的モノリシックな説明とモデル整合的な説明を生成するための新しいフレームワークを提案する。
モノリシックな説明のために,本手法は確率論的論理を利用して不確実性を統合し,説明の確率を増大させる。
モデル整合性の説明のために,モデル整合性問題の論理に基づく変種を拡張し,確率的人間モデルを考慮したフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:07:31 GMT)
Compressing Large Language Models using Low Rank and Low Precision Decomposition [46.3] この研究は、新しい訓練後のLLM圧縮アルゴリズムである$rm CALDERA$を導入している。
重量行列 $mathbfW$ の固有の低ランク構造を利用して、低ランクで低精度な分解によってそれを近似する。
その結果、LlaMa-$2$7$B/$70$B、LlaMa-$3$8$Bの圧縮は、既存のトレーニング後の圧縮技術より優れていることが示された。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:42:30 GMT)
Hi Model, generating 'nice' instead of 'good' is not as bad as generating 'rice'! Towards Context and Semantic Infused Dialogue Generation Loss Function and Evaluation Metric [46.3] 本稿では,Semantic Infused Contextualized diaLogue (SemTextualLogue) ロス関数を提案する。
また、文脈と意味的関連性の両方を取り入れて、Dialuationと呼ばれる評価指標を定式化する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:17:12 GMT)
Do Finetti: On Causal Effects for Exchangeable Data [46.0] データをi.i.d.に含まない環境での因果効果の推定について検討する。
我々は、独立因果関係の仮定を満たす交換可能なデータに焦点を当てる。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:31:18 GMT)
Can We Enhance the Quality of Mobile Crowdsensing Data Without Ground Truth? [45.9] モバイル・クラウドセンシング(MCS)は、様々な領域で顕著なトレンドとなっている。
本稿では,予測と評価に基づく真理発見フレームワークを提案する。
センシングタスクにおいて、低品質のデータを高品質のデータから分離することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:16:12 GMT)
Tuning-Free Alignment of Diffusion Models with Direct Noise Optimization [45.8] 直接雑音最適化(DNO)という新しいアライメント手法を提案する。
設計上、DNOはチューニング不要で、生成中にオンライン形式でアライメントが発生するため、プロンプトに依存しない。
我々は、人間のフィードバックデータに基づいて訓練された複数の人気報酬関数について広範な実験を行い、提案したDNOアプローチが、最先端の報酬スコアと高画質を、すべて生成に適切な時間予算で達成できることを実証した。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:39:39 GMT)
UP5: Unbiased Foundation Model for Fairness-aware Recommendation [45.5] 大規模言語モデルが必然的に社会的なステレオタイプを永続させ、不公平なレコメンデーションをもたらすのではないかという懸念が高まっている。
本稿は,性別や年齢などのセンシティブな特徴に公正であるように,レコメンデーションシステムを必要とする,LDMベースの推薦に対するユーザ側の公正性に焦点を当てる。
フェアネスを意識したLLMレコメンデーションのための新しいCFP法をUnbiased Foundation mOdels(UFO)に導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:46:47 GMT)
Real-Time Dynamic Robot-Assisted Hand-Object Interaction via Motion Primitives [45.3] 本稿では,動的ロボット支援ハンドオブジェクトインタラクションに着目した物理HRIの強化手法を提案する。
我々はトランスフォーマーに基づくアルゴリズムを用いて、1枚のRGB画像から人間の手の動きをリアルタイムに3Dモデリングする。
ロボットのアクション実装は、継続的に更新された3Dハンドモデルを使用して動的に微調整される。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:20:16 GMT)
Learning Mixture-of-Experts for General-Purpose Black-Box Discrete Optimization [45.2] この記事では、完全なデータ駆動学習最適化(L2O)アプローチを通じてトレーニングされた、新しい汎用ニューラルネットワークMEGOを紹介する。
MEGOは、トレーニング問題の解決からの経験に基づいて訓練された、エキスパートの混合物で構成されている。
MEGOは、高品質なソリューションを生成するために、関連する専門家モデルを積極的に選択する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:41:08 GMT)
MindSemantix: Deciphering Brain Visual Experiences with a Brain-Language Model [45.2] fMRIで捉えた脳の活動を通して人間の視覚体験を解読することは、魅力的で最先端の課題である。
我々は、LLMが視覚的に誘発される脳活動のセマンティックな内容を理解することができる新しいマルチモーダルフレームワークであるMindSemantixを紹介した。
MindSemantixは、脳の活動から派生した視覚情報と意味情報に深く根ざした高品質なキャプションを生成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:55:03 GMT)
Double-I Watermark: Protecting Model Copyright for LLM Fine-tuning [45.1] 提案手法は、微調整中に特定の透かし情報をカスタマイズされたモデルに効果的に注入する。
提案手法を各種微調整法で評価し, その無害性, 頑健性, 独特性, 不受容性, 妥当性を定量的および定性的な分析により検証した。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:02:16 GMT)
Floquet time-crystals as sensors of AC fields [45.0] 離散時間結晶は、長い尋問時間を確保しながら、ショットノイズの限界を克服できることを示す。
このようなシステムでは、集団間相互作用はノイズに対してその力学を安定させ、不完全をプロトコル化するのに十分堅牢である。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:52:55 GMT)
Challenge-Device-Synthesis: A multi-disciplinary approach for the development of social innovation competences for students of Artificial Intelligence [45.0] 本稿では,AIの学生に特定の課題を提示する,CDS(Challenge-Device-Synthesis Method)を紹介する。
この装置は、社会変革の異なる次元の研究対象となり、結論は10ページの科学論文の形にまとめられる。
第6学期(UAB-Barcelona, UAB-Barcelona)を対象とし, CDSの実施段階で得られたデータについて報告する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:24:38 GMT)
Retrieval Augmented Generation for Domain-specific Question Answering [44.9] 質問応答のための訓練済みの大規模言語モデルは、特定のドメインに関する知識や用語を適切に理解するために訓練されていない。
本稿では,大規模問合せデータベースをコンパイルする新しいフレームワークを提案し,大規模言語モデルの検索対応微調整手法を開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:18:02 GMT)
MSCoTDet: Language-driven Multi-modal Fusion for Improved Multispectral Pedestrian Detection [44.4] 大規模言語モデルを用いた多スペクトル歩行者検出におけるモダリティバイアスの軽減方法について検討する。
我々は,MSCoTプロンプトをマルチスペクトル歩行者検出に統合する新しいMSCoTDetフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:53:17 GMT)
SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams [44.0] スパイクカメラは、動きの特徴を捉え、この不適切な問題を解くのに有効であることが証明されている。
既存の手法は教師付き学習パラダイムに陥り、現実のシナリオに適用した場合、顕著なパフォーマンス劣化に悩まされる。
本研究では,スパイク誘導動作の劣化に対する最初の自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:39:16 GMT)
Rich-Observation Reinforcement Learning with Continuous Latent Dynamics [43.8] 本稿では,高次元観測に基づく制御を行うRichCLD(Rich-Observation RL with Continuous Latent Dynamics)を提案する。
我々の主な貢献は、統計的かつ計算学的に効率的であるこの設定のための新しいアルゴリズムである。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:02:49 GMT)
Learning Neural Contracting Dynamics: Extended Linearization and Global Guarantees [43.7] 拡張線形化契約力学(ELCD)は,グローバルな契約性を保証するニューラルネットワークベースの力学系である。
最も基本的な形では、ELCDは(i)グローバル指数的に安定であり、(ii)平衡収縮であり、(iii)ある計量に関してグローバルに収縮することが保証される。
我々は,高次元LASA,マルチリンク振り子,ローゼンブロックデータセット上でのELCDの性能を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:05:07 GMT)
Constructions Are So Difficult That Even Large Language Models Get Them Right for the Wrong Reasons [43.7] 語彙重なりが大きいNLIのための小さな課題データセットを導入する。
GPT-4 と Llama 2 は強いバイアスで失敗する。
計算言語学の観点から、曲面特徴によって区別できない3種類の形容詞を持つ構成群を同定する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:41:37 GMT)
ImputeFormer: Low Rankness-Induced Transformers for Generalizable Spatiotemporal Imputation [43.7] 既存の計算ソリューションには、主に低ランクモデルとディープラーニングモデルが含まれる。
強誘導バイアスと高時間モデル表現率の低ランク化によるバイアスバランスを示す。
交通流,太陽エネルギー,スマートメーター,空気品質など,異種データセットの精度,効率,汎用性において,その優位性を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:39:55 GMT)
Eluder-based Regret for Stochastic Contextual MDPs [43.2] 文脈マルコフ決定過程(CMDP)における後悔最小化のためのE-UC$3$RLアルゴリズムを提案する。
我々のアルゴリズムは効率的であり(効率的なオフライン回帰オラクルを仮定すると)、$ widetildeO(H3 sqrtT |S| |A|d_mathrmE(mathcalP)$の後悔の保証を享受する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:57:58 GMT)
OMPO: A Unified Framework for RL under Policy and Dynamics Shifts [42.6] 様々な政策やダイナミクスから収集された環境相互作用データを用いた強化学習政策の訓練は、根本的な課題である。
既存の作業は、ポリシーやダイナミクスのシフトによって引き起こされる分散の相違を見落としている場合が多い。
本稿では,オンラインRL政策学習のための統一的戦略をポリシーと動的シフトの多様な設定の下で同定する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:36:36 GMT)
Benchmarking Knowledge Boundary for Large Language Models: A Different Perspective on Model Evaluation [42.2] 言語モデルに対する質問や限定的なパラフレーズをクエリとして評価することは,信頼性が高く,包括的ではない,と我々は主張する。
本稿では,知識境界という概念を導入し,素早い知識と素早い知識の両方を包含する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:39:47 GMT)
Contextual Position Encoding: Learning to Count What's Important [42.0] 我々は,新しい位置符号化手法であるコンテキスト位置フロップ(CoPE)を提案する。
CoPEは、モデルによって決定された特定のトークンに位置を増すことによって、状況に応じて位置を条件付けることができる。
一般的な位置埋め込みが失敗するFlip-Flopタスクにおいて,CoPEが選択的コピー,カウント,Flip-Flopタスクを解くことができることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:57:15 GMT)
Local Purity Distillation in Quantum Systems: Exploring the Complementarity Between Purity and Entanglement [41.9] ギブス保存型ローカル操作と古典通信の枠組みを導入・開発する。
局所冷却は局所純度の抽出と一致し, 完全縮退した局所ハミルトン系システムに着目する。
本研究は, 絡み込み検出・推定技術など, 様々な実用化への扉を開くものである。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:31:09 GMT)
Automated Multi-level Preference for MLLMs [41.7] 「現在のマルチモーダル大言語モデル(MLLM)は幻覚に苦しむ」
有望な道の1つは、人間からのフィードバック(RLHF)からの強化学習を利用することである。
二項選好(上等、下等)の一般的な実践を再考し、多水準選好を採用する方が2つの利点があることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:27:35 GMT)
State Space Models are Comparable to Transformers in Estimating Functions with Dynamic Smoothness [41.6] 状態空間モデル(SSM)に基づくディープニューラルネットワークは、シーケンスモデリングにおいて多くの注目を集めている。
本稿では,逐次列列関数を推定する観点から,タスクSSMが変換器の代替となるのかを理論的に検討する。
入力シーケンスに応じて滑らかさが変化しても,SSMが目標関数を推定できることを実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:23:48 GMT)
Cascade-Aware Training of Language Models [41.1] CAT(Cascade-Aware Training)は,LMのカスケードの全体的な品質・コストパフォーマンストレードオフを最適化する手法である。
提案手法の価値を,SuperGLUE,WMT22,FLAN 2021データセットの60以上のLMタスクで示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:28:46 GMT)
Mitigate Position Bias with Coupled Ranking Bias on CTR Prediction [41.0] 既存の方法の多くは、アイテムの配置位置にも関係している、広範囲に結合したランキングバイアスを無視している。
本研究では、この広く共存しているランキングバイアスが、既存の位置バイアス推定手法の性能を悪化させることを示す。
位置バイアスをランキングバイアスの存在下で緩和するために, ヒューズ重みを用いた2つの推定手法を融合した新しい位置バイアス推定法, すなわち勾配を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:31:53 GMT)
Robust Entropy Search for Safe Efficient Bayesian Optimization [40.6] 我々は、ロバスト・エントロピー・サーチ(RES)と呼ばれる効率的な情報ベース獲得機能を開発する。
RESは、堅牢で最先端のアルゴリズムよりも確実に最適である。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:00:10 GMT)
RGB-T Object Detection via Group Shuffled Multi-receptive Attention and Multi-modal Supervision [40.5] 可視光(RGB)と熱赤外(T)の両方を利用したマルチスペクトル物体検出は注目されている。
本稿では,マルチスケールRGBと熱的特徴を抽出し,組み合わせるために,非常に単純なグループシャッフル型多受容意識(GSMA)モジュールを提案する。
抽出したマルチモーダル特徴は, マルチレベルパスアグリゲーションネックと直接統合され, 融合効果と効率が著しく向上する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:11:36 GMT)
Enhancing Zero-Shot Facial Expression Recognition by LLM Knowledge Transfer [40.5] 大規模言語モデル(LLM)からタスク知識を伝達することにより、ゼロショットFERを向上させる新しい手法Exp-CLIPを提案する。
具体的には、事前訓練された視覚言語エンコーダに基づいて、初期共同視覚言語空間を顔行動の表現をキャプチャする空間にマッピングするプロジェクションヘッドを組み込む。
衝突しない顔データから、Exp-CLIPは、7つの範囲のFERデータセット上でCLIPモデルや他のいくつかの大きなビジョン言語モデル(LVLM)よりも優れたゼロショット結果を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:06:09 GMT)
OLLIE: Imitation Learning from Offline Pretraining to Online Finetuning [40.1] 本研究では,静的な実演データから模倣ポリシーを事前学習し,高速な微調整を行うオフライン・オンライン・イミテーション学習(IL)について検討する。
我々は, ほぼ専門的なポリシーを同時に学習する, $textttOLLIE$ という原則付きオフライン IL 手法を提案する。
経験的に、$textttOLLIE$は、$textbf20$チャレンジタスクのベースラインメソッドを一貫して大幅に上回ります。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:42:39 GMT)
Exploring Human-in-the-Loop Test-Time Adaptation by Synergizing Active Learning and Model Selection [40.1] Human-In-Loop Test-Time Adaptation (HILTTA)は、ラベルのないテストデータストリームでモデルを適応することを目的としている。
本稿では,TTAの落とし穴を動機として,能動的学習とモデル選択を相乗化してHILTTAにアプローチすることを提案する。
サンプル選択戦略は、アクティブラーニングとモデル選択の目的とのバランスを考慮し、サンプルを選択するために調整される。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:13:30 GMT)
EvaGaussians: Event Stream Assisted Gaussian Splatting from Blurry Images [39.6] 3次元ガウススプラッティング(3D-GS)は、3次元シーン再構成と新しいビュー合成において例外的な機能を示した。
本稿では,イベントストリーム支援型ガウシアンスプラッティング(EvaGaussians)について紹介する。これは,イベントカメラがキャプチャしたイベントストリームを統合して,ぼやけた画像から高品質な3D-GSを再構築する手法である。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:59:27 GMT)
A quantum implementation of high-order power method for estimating geometric entanglement of pure states [39.6] この研究は、多ビット純状態の絡み合いの幾何学的測度を推定する反復高次電力法の量子的適応を示す。
現在の(ハイブリッドな)量子ハードウェア上で実行可能であり、量子メモリに依存しない。
標準偏極チャネルに基づく単純な理論モデルを用いて,雑音がアルゴリズムに与える影響について検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:40:24 GMT)
How to Leverage Diverse Demonstrations in Offline Imitation Learning [39.2] 不完全な実演を伴うオフライン模倣学習(IL)は、専門家データの不足により注目を集めている。
本稿では, 結果の状態に基づいて正の挙動を識別する, 単純で効果的なデータ選択手法を提案する。
次に、専門家と選択したデータを正しく活用できる軽量な行動クローニングアルゴリズムを考案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:41:13 GMT)
URDFormer: A Pipeline for Constructing Articulated Simulation Environments from Real-World Images [39.1] そこで本研究では,実世界の画像からキネマティック構造と動的構造を合成したシミュレーションシーンを生成するエンドツーエンドパイプラインを提案する。
そこで本研究は,大規模シミュレーション環境のためのパイプラインと,ロバストなロボット制御ポリシをトレーニングするための統合システムの両方を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:01:14 GMT)
Predicting Parking Availability in Singapore with Cross-Domain Data: A New Dataset and A Data-Driven Approach [38.9] シンガポール全土のパーキング・アベイラビリティー(Parking Availability)を、様々な領域の複雑な要素で総合的に予測することを目指している。
我々は,新しいディープラーニングフレームワークであるDeepPAを紹介し,数千の駐車場にまたがる将来のPAを集合的かつ効率的に予測する。
我々は,DeepPAを実践的なWebベースのプラットフォームに実装し,ドライバーを支援するリアルタイムPA予測と,シンガポールの知事に都市計画を通知する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:11:51 GMT)
Domain-Inspired Sharpness-Aware Minimization Under Domain Shifts [38.8] 本稿ではドメインシフト下での最適化のためのドメインインスパイアされたシャープネス認識最小化(DISAM)アルゴリズムを提案する。
これは異なる領域にまたがるSAMの矛盾収束度によって動機付けられ、特定の領域に対する最適化バイアスを引き起こす。
このメカニズムの下では、理論上、DIAMはより高速な総合収束を実現し、原理的に一般化を向上できることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:22:33 GMT)
Online Linear Regression in Dynamic Environments via Discounting [38.2] 最適の静的および動的後悔保証を実現するオンライン線形回帰アルゴリズムを開発した。
R_T(vecu)le Oleft(dlog(T)vee sqrtdP_Tgamma(vecu)$, where $P_Tgamma(vecu)$はコンパレータシーケンスの可変性の尺度であり、この結果が得られたことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:17:53 GMT)
Transcending Fusion: A Multi-Scale Alignment Method for Remote Sensing Image-Text Retrieval [37.8] リモートセンシング画像-テキスト検索(RSITR)は、リモートセンシング(RS)ドメインにおける知識サービスとデータマイニングにおいて重要な機能である。
現在のマルチスケールRSITRアプローチは、通常、マルチスケールの融合画像特徴とテキスト特徴とを一致させるが、異なるスケールで画像とテキストのペアを別々に並べて見落としている。
本稿では,この制限を克服するために,新しいマルチスケールアライメント(MSA)手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:19:11 GMT)
Color Shift Estimation-and-Correction for Image Enhancement [37.5] 準最適照明条件下で撮影された画像は、オーバー露光とアンダー露光の両方を含む可能性がある。
現在のアプローチは主に画像の明るさの調整に重点を置いており、これは未露光領域における色調歪みを悪化させる可能性がある。
そこで本研究では,これらの色変化を推定・補正する学習によって,過度露光と過度露光の両方で画像を強化する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:03:06 GMT)
Efficient Preference-based Reinforcement Learning via Aligned Experience Estimation [37.4] 評価に基づく強化学習(PbRL)は、報酬工学を使わずにトレーニングエージェントに優れた能力を示す。
ラベルの平滑化とポリシー正則化を併用した効率的なPbRL法であるSEERを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:49:20 GMT)
Enhancing Vision-Language Model with Unmasked Token Alignment [37.1] 本稿では,既存のCLIPモデルを利用して視覚言語表現をさらに強化する手法であるUnmasked Token Alignment (UTA)を紹介する。
UTAは、ViTモデルとCLIPテキストエンコーダを自動的に整列する凍結されたCLIPビジョンエンコーダから、未マッピングの視覚トークンを対応する画像トークンに整列させることで、ViT(Vit)を訓練する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:48:17 GMT)
Implicit Neural Image Field for Biological Microscopy Image Compression [37.0] Inlicit Neural Representation (INR) に基づく適応圧縮ワークフローを提案する。
このアプローチは、任意の形状の画像を圧縮し、任意のピクセル単位の圧縮が可能な、アプリケーション固有の圧縮目的を許容する。
我々は,我々のワークフローが高精細圧縮比を達成しただけでなく,下流解析に不可欠な詳細な情報も保存できることを,広範囲にわたる顕微鏡画像で実証した。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:51:33 GMT)
Learning to Continually Learn with the Bayesian Principle [36.8] 本研究では、ニューラルネットワークの強力な表現力と、忘れることに対する単純な統計モデルの堅牢性を組み合わせたメタラーニングパラダイムを採用する。
ニューラルネットワークは継続学習中に固定されているため、破滅的な忘れ物から保護されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:53:31 GMT)
Optimizing Search Advertising Strategies: Integrating Reinforcement Learning with Generalized Second-Price Auctions for Enhanced Ad Ranking and Bidding [36.7] 本稿では,多様なユーザインタラクションに適応し,広告主のコスト,ユーザ関連性,プラットフォーム収益のバランスを最適化するモデルを提案する。
提案手法は,広告の配置精度とコスト効率を大幅に向上させ,実際のシナリオにおけるモデルの適用性を示すものである。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:25:49 GMT)
Incremental Object Detection with CLIP [36.5] そこで本研究では,CLIPなどの視覚言語モデルを用いて,異なるクラス集合に対するテキスト特徴埋め込みを生成する。
次に、段階的なシナリオをシミュレートするために、早期の学習段階において利用できない新しいクラスを置き換えるために、スーパークラスを使用します。
そこで我々は,この微妙に認識された検出ボックスを擬似アノテーションとしてトレーニングプロセスに組み込むことにより,検出性能をさらに向上させる。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:11:10 GMT)
Supervised Contrastive Learning for Snapshot Spectral Imaging Face Anti-Spoofing [36.4] 本研究は,顔認識システムにおける顔のアンチ・スポーフィング能力の強化を目的とした,再均衡型コントラスト学習戦略を明らかにする。
提案手法は,データ再サンプリングによるクラスレベルのコントラスト学習と,革新的なリアルタイム指向のリウェイト技術とを調和させる。
CVPR 2024のChalearn Snapshot Spectral Imaging Face Anti-spoofing Challengeにおいて,HySpeFASデータセットにおける平均分類誤差率(ACER)は前例のない0.0000%に達した。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:03:52 GMT)
Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy [36.2] 本稿では,テキスト・画像拡散モデルにおける条件オーバーフィッティング現象を示し,これらのモデルが与えられた画像の条件分布に過度に適合する傾向があることを示す。
我々は,条件的類似性(CLiD)の分析指標を導出し,会員推定を行う。
実験結果から,本手法は様々なデータ分布やスケールにおいて,従来手法よりも有意に優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:03:41 GMT)
Efficient Black-box Adversarial Attacks via Bayesian Optimization Guided by a Function Prior [36.1] 本稿では,入力クエリの出力フィードバックのみを用いて,ブラックボックスモデルに対するサンプル生成を目的としたブラックボックス逆攻撃について検討する。
ブラックボックス攻撃前の大域関数として代理モデルを利用する事前誘導ベイズ最適化(P-BO)アルゴリズムを提案する。
後悔境界に関する理論的解析は、P-BOの性能が悪影響を受けていることを示唆している。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:05:16 GMT)
Flow Priors for Linear Inverse Problems via Iterative Corrupted Trajectory Matching [35.8] 本稿では,MAP推定器を効率的に近似する反復アルゴリズムを提案し,様々な線形逆問題の解法を提案する。
本アルゴリズムは,MAPの目的を局所MAP'の目的の和で近似できるという観測によって数学的に正当化される。
我々は,超解法,デブロアリング,インペイント,圧縮センシングなど,様々な線形逆問題に対するアプローチを検証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:56:12 GMT)
On the Limits of Multi-modal Meta-Learning with Auxiliary Task Modulation Using Conditional Batch Normalization [35.4] 少ないショット学習は、新しいタスクに対処できる表現を学習することを目的としている。
近年の研究では、クロスモーダル学習は、数発の分類において表現を改善することが示されている。
言語は豊かなモダリティであり、視覚的な学習を導くのに使うことができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:29:12 GMT)
WebCiteS: Attributed Query-Focused Summarization on Chinese Web Search Results with Citations [35.0] 我々は,属性付きクエリ中心要約 (AQFS) のタスクを定式化するとともに,7kの人称注釈の要約を引用した中国語データセットであるWebCiteSを提示する。
これらの課題に対処するために、詳細なメトリクスを開発し、自動評価器が文を細かな検証のためにサブステートに分解できるようにする。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:45:11 GMT)
Evaluating Vision-Language Models on Bistable Images [34.5] 本研究は,バイスタブル画像を用いた視覚言語モデルについて,これまでで最も広範に検討したものである。
私たちは手動で29枚のバイスタブル画像と関連するラベルを集め、明るさ、色調、回転で116種類の操作を行ないました。
以上の結果から,Idefics ファミリーと LLaVA1.5-13b のモデルを除いて,別の解釈が優先されていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:04:59 GMT)
Multi-Modal Generative Embedding Model [34.3] 本稿では,MM-GEM(Multi-Modal Generative Embedding Model)を提案する。
例えば、ViT-LargeとTinyLlamaからインスタンス化されたMM-GEMは、マルチモーダル埋め込みモデルのベンチマーク上での競合性能を示している。
MM-GEMの高度なテキストモデルは、長いテキストと画像検索のためのRecall@1を5%以上改善する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:59:10 GMT)
Understanding and Minimising Outlier Features in Neural Network Training [34.0] Outlier Features (OF) は、ニューラルネットワーク(NN)の幅の平均よりも、アクティベーション等級がかなり大きいニューロンである。
建築と最適化の選択がOFに与える影響について検討し、トレーニング中のOFを最小化するための実践的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:11:28 GMT)
Kestrel: Point Grounding Multimodal LLM for Part-Aware 3D Vision-Language Understanding [33.6] 3次元MLLMはオブジェクトとシーンの理解に限られており、部分レベルの3次元空間構造を理解するのに苦労する。
本稿では,3次元MLLMをパーシャル・アウェア・理解で活用する新しい手法としてケストレルを紹介する。
私たちが導入したタスク、データセット、ケストレルは、人間の認知と3DMLLMのギャップを埋めるための予備的な取り組みである。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:43:48 GMT)
Offline Regularised Reinforcement Learning for Large Language Models Alignment [33.5] 我々はフレームワークと関連するアルゴリズムとしてDRO(emphDirect RewardOptimization)を提案する。
DROは、様々な方法で実装できる単純な平均2乗の目的を使用する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:11:29 GMT)
MEGA: Masked Generative Autoencoder for Human Mesh Recovery [33.3] 単一のRGB画像からのHuman Mesh Recovery(HMR)は非常に曖昧な問題である。
ほとんどのHMR法はこの曖昧さを無視し、関連する不確実性を考慮せずに単一の予測を行う。
我々は、画像と部分的な人間のメッシュシーケンスから人間のメッシュを復元するために訓練されたMaskEd生成自動エンコーダMEGAを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:40:31 GMT)
Continual Contrastive Spoken Language Understanding [33.1] COCONUTは、経験リプレイとコントラスト学習の組み合わせに依存するクラスインクリメンタルラーニング(CIL)手法である。
我々は,COCONUTをデコーダ側で動作するメソッドと組み合わせることで,さらなるメトリクス改善を実現することを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:43:52 GMT)
Adaptive In-conversation Team Building for Language Model Agents [33.0] 複数の大規模言語モデル(LLM)エージェントを活用することは、複雑なタスクに取り組む上で有望なアプローチであることが示されている。
私たちの新しい適応型チーム構築パラダイムは、Captain Agentという新しいエージェント設計を通じて実現された柔軟なソリューションを提供します。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:08:37 GMT)
ViG: Linear-complexity Visual Sequence Learning with Gated Linear Attention [33.0] 我々は、Gated Linear Attention (GLA) を視覚に導入し、その優れたハードウェア認識と効率を活用している。
提案するモデルであるViGは、ImageNetおよび下流タスクにおける精度、パラメータ、FLOPの良好なトレードオフを提供する。
ViG-Tは5.2$times$より少ないFLOPを使用し、90%のGPUメモリを節約し、4.8$times$高速に動作し、DeiT-Tよりも20.7%高いトップ1精度を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:06:30 GMT)
Elastic CRFs for Open-ontology Slot Filling [32.2] スロットフィリングはタスク指向の対話システムにおいて重要なコンポーネントであり、(ユーザ)発話をスロットと呼ばれるセマンティックな概念にパースするために使用される。
本稿では,各スロットが自然言語記述の埋め込みによって表現される弾性条件乱数場(eCRF)という新しいモデルを提案する。
スロットに対する言語記述が利用可能であれば、eCRFによって新しいスロット値を検出することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:21:38 GMT)
SynHING: Synthetic Heterogeneous Information Network Generation for Graph Learning and Explanation [31.9] 合成不均一情報ネットワーク生成のための新しいフレームワークであるSynHingを紹介する。
SynHingは、ターゲットHINの主要なモチーフを体系的に識別し、クラスタ内およびクラスタ間マージモジュールによるボトムアップ生成プロセスを使用する。
GNN説明器モデルを評価するための基礎的なモチーフを提供し、説明可能な合成HIN生成のための新しい標準を設定する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:16:10 GMT)
Feature Extraction for Generative Medical Imaging Evaluation: New Evidence Against an Evolving Trend [31.8] Fr'echet Inception Distance (FID)は、合成画像の品質を評価するための指標である。
最近の傾向は、医用画像で訓練された特徴抽出器による医用画像へのFIDの適用である。
本研究では,ImageNetをベースとした抽出器がRadImageNetよりも人間の判断に整合していることを示すことで,この実践に挑戦する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:09:46 GMT)
InterpretCC: Intrinsic User-Centric Interpretability through Global Mixture of Experts [31.7] ニューラルネットワークの解釈性は、3つの重要な要件間のトレードオフである。
本稿では,人間中心の解釈可能性を保証する,解釈可能なニューラルネットワークのファミリであるInterpretCCを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:03:40 GMT)
LMO-DP: Optimizing the Randomization Mechanism for Differentially Private Fine-Tuning (Large) Language Models [31.7] 本稿では,LMO-DP(Language Model-based Optimal Differential Privacy)機構を提案する。
これは、最適化された言語モデルの厳密な構成を、サブ最適DPメカニズムで実現するための第一歩である。
LMO-DPはまた、強力な差分プライバシー保証を持つLlama-2を正確に微調整する最初のソリューションでもある。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:32:50 GMT)
UNITS: A Unified Multi-Task Time Series Model [31.7] タスクトークン化を用いたマルチタスク時系列モデルUniTSを導入し,予測および生成タスクを単一モデル内で表現する。
人間の活動センサー、医療、エンジニアリング、ファイナンスドメインにまたがる38のデータセットに対して、UniTSモデルは12の予測モデル、20の分類モデル、18の異常検出モデル、16の計算モデルに対して好意的に機能する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:11:04 GMT)
Tell Me What You See: Text-Guided Real-World Image Denoising [31.4] 画像キャプション情報を追加することで、合成画像と実世界の画像のデノナイズと再構成が大幅に向上することを示す。
本稿では,シーンを撮影する撮影者が容易に行えるように,シーンを事前に記述する代替手段として提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:09:42 GMT)
Balancing Act: Distribution-Guided Debiasing in Diffusion Models [31.4] 拡散モデル(DM)は、前例のない画像生成能力を持つ強力な生成モデルとして登場した。
DMはトレーニングデータセットに存在するバイアスを反映します。
本稿では、追加データやモデル再学習に頼ることなく、DMをデバイアスする手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:33:57 GMT)
Diffusion-based Dynamics Models for Long-Horizon Rollout in Offline Reinforcement Learning [31.1] 我々はDyDiffと略してDynamics Diffusionを提案し、学習ポリシーからDMに情報を反復的に注入することができる。
DyDiffはポリシーの一貫性を維持しながら、長時間のロールアウトの精度を確保し、モデルフリーのアルゴリズムに容易にデプロイできる。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:29:46 GMT)
Deep Positive-Unlabeled Anomaly Detection for Contaminated Unlabeled Data [31.0] 既存の半教師付きアプローチでは、ラベルなしデータは概ね正常であると仮定する。
本稿では, 正の未ラベル学習に基づく正の未ラベルオートエンコーダと, オートエンコーダのような異常検出器を提案する。
提案手法は既存の手法よりも優れた検出性能を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:34:47 GMT)
Yuan 2.0-M32: Mixture of Experts with Attention Router [30.9] Yuan 2.0-M32は、コーディング、数学、および様々な専門分野における競争力を示し、40Bのアクティブパラメータはわずか3.7Bである。
Yuan 2.0-M32 は MATH と ARC-Challenge のベンチマークで Llama3-70B を上回っ、それぞれ 55.89 と 95.8 である。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:19:58 GMT)
MEMoE: Enhancing Model Editing with Mixture of Experts Adaptors [30.8] MOMoEは、Mixture of Experts (MoE)アーキテクチャと知識アンカールーティング戦略を利用したモデル編集アダプタである。
MOMoEは、バイパスMOE構造を使って知識を更新し、元のパラメータは変更しない。
そして、知識アンカールーティングにより、類似した知識を必要とする入力が同じ専門家にルーティングされることが保証され、更新された知識の一般化が促進される。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:49:44 GMT)
Gradient Descent with Polyak's Momentum Finds Flatter Minima via Large Catapults [29.5] 線形対角線ネットワークや非線形ニューラルネットワークの場合,学習率の高い運動量勾配は大きなカタパルトを示す。
我々は、大きなカタパルトは自己安定化効果の「延長」によって引き起こされると仮定する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:56:37 GMT)
Dinomaly: The Less Is More Philosophy in Multi-Class Unsupervised Anomaly Detection [29.4] 本稿では,最小限の再構成に基づく異常検出フレームワーク,すなわちDianomalyを紹介する。
提案したDianomalyは,3つのデータセットでそれぞれ99.6%,98.7%,89.3%の印象的な画像AUROCを実現している。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:57:31 GMT)
Principled Probabilistic Imaging using Diffusion Models as Plug-and-Play Priors [29.2] 拡散モデル(DM)は、最近、複雑な画像分布をモデル化する際、優れた能力を示した。
一般的な逆問題に対する後続サンプリングを行うマルコフ連鎖モンテカルロアルゴリズムを提案する。
提案手法の有効性を6つの逆問題に適用した。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:42:25 GMT)
Stochastic Collapse: How Gradient Noise Attracts SGD Dynamics Towards Simpler Subnetworks [28.9] 我々は、過度に表現力のあるネットワークをもっと単純な作業へと駆動する、降下勾配(SGD)の強い暗黙バイアスを明らかにする。
より単純な(疎あるいは低ランクな)作業に対応する不変集合の2つのクラスに焦点を合わせ、現代建築に一般的に現れる。
我々は、訓練されたディープニューラルネットワークにおける魅力的な不変集合の存在を経験的に観察し、SGDのダイナミクスが、冗長なニューロンで単純な処理を消滅させることがしばしばあることを示唆している。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:03:31 GMT)
LLMs as Bridges: Reformulating Grounded Multimodal Named Entity Recognition [28.1] Grounded Multimodal Named Entity Recognition (GMNER) は、名前付きエンティティ、エンティティタイプ、および対応する視覚領域を識別することを目的とした、初期段階のマルチモーダルタスクである。
本稿では,大規模な言語モデル(LLM)を接続ブリッジとして活用することにより,GMNERをMNER-VE-VGタスクに再構成する統一フレームワークであるRiVEGを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:59:59 GMT)
Beyond Discrepancy: A Closer Look at the Theory of Distribution Shift [28.0] この研究は、ソースからターゲット分布への分類器の分布シフトの理論を詳しく調べる。
対象からラベル付けされていないデータだけで十分である場合と,ラベル付けされたターゲットデータが必要な場合を示す。
いずれの場合も、我々は大規模なサンプル状態において厳密な理論的保証を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:00:19 GMT)
Faithful Chart Summarization with ChaTS-Pi [27.5] 本稿では,信頼度を評価するための基準フリーチャート要約尺度CHATS-CRITICを提案する。
Chats-CRITICは、基準ベースの指標よりも人間の評価による要約品質を評価する。
Chats-PIは、推論中にCHATS-CRITICを活用して、サンプル候補の修正とランク付けを行うチャート・ツー・サマリーパイプラインである。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:55:06 GMT)
Voice Jailbreak Attacks Against GPT-4o [27.5] GPT-4oの音声モードに対するジェイルブレイク攻撃を初めて系統的に測定した。
本稿では,GPT-4oを人間化した新しいボイスジェイルブレイク攻撃であるVoiceJailbreakを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:07:44 GMT)
PathReasoner: Modeling Reasoning Path with Equivalent Extension for Logical Question Answering [27.5] 我々は、各論理サンプルを推論パスに変換することによって、論理推論タスクをモデル化する。
論理サンプルの多様性を高めるために,等価な論理式によって支持される原子拡張戦略を提案する。
実験により、PathReasonerは2つの論理的推論ベンチマークと大きな一般化能力で競合性能を達成することが示された。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:14:05 GMT)
Evolutionary Computation in the Era of Large Language Model: Survey and Roadmap [27.0] 大規模言語モデル(LLM)と進化的アルゴリズム(EA)の相互作用は、複雑な問題における適用可能性の共通の追求を共有している。
LLMに固有の豊富なドメイン知識により、EAはよりインテリジェントな検索を行うことができる。
本稿では、相互インスピレーションを2つの主要な道に分類する、徹底的なレビューと前方のロードマップを提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:00:25 GMT)
Hierarchical Classification Auxiliary Network for Time Series Forecasting [26.9] 本稿では,時系列値をトークン化して,クロスエントロピー損失による予測モデルをトレーニングする手法を提案する。
本稿では,任意の予測モデルと統合可能な一般モデル非依存コンポーネントである階層分類補助ネットワークHCANを提案する。
HCANと最先端の予測モデルを統合する実験は、いくつかの実世界のデータセットのベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:38:25 GMT)
Encoding Hierarchical Schema via Concept Flow for Multifaceted Ideology Detection [26.7] 多面的イデオロギー検出(MID)は、テキストの複数の面へのイデオロギー的傾きを検出することを目的としている。
MIDタスクのための新しい概念セマンティクス強化フレームワークを開発する。
提案手法は, クロストピックシナリオを含む, MIDにおける最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:37:28 GMT)
UrbanVLP: Multi-Granularity Vision-Language Pretraining for Urban Region Profiling [26.7] 都市域プロファイリングは、与えられた都市域の低次元表現を学習することを目的としている。
事前訓練されたモデル 特に衛星画像に依存しているモデルは 二重課題に直面しています
衛星データからマクロレベルのパターンのみに集中するとバイアスが発生する可能性がある。
事前訓練されたモデルにおける解釈可能性の欠如は、都市計画の透明な証拠を提供することにおける実用性を制限している。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:11:30 GMT)
Generalized Sobolev Transport for Probability Measures on a Graph [26.6] グラフ距離空間上での測度に対する最適輸送(OT)問題について検討する。
我々は、Orlicz構造に対する特定の凸関数のクラスを活用し、一般化されたソボレフ輸送(GST)を提案する。
我々は GST が Orlicz-Wasserstein (OW) よりも数次高速であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:22:37 GMT)
Black-Box Access is Insufficient for Rigorous AI Audits [26.0] ブラックボックス監査の限界と、ホワイトボックスとアウトサイドボックス監査の利点について論じる。
また、これらの監査を最小限のセキュリティリスクで実施するための技術的、物理的、法的保護についても論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:56:29 GMT)
Efficient Error Certification for Physics-Informed Neural Networks [25.7] PINN残差をバインドする汎用的で効率的でスケーラブルなポストトレーニングフレームワークである$partial$-CROWNを紹介します。
従来の2つのPINNと、より困難な2つの実世界のアプリケーションに適用することで、証明書をきつく取得する効果を実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:08:06 GMT)
MANO: Exploiting Matrix Norm for Unsupervised Accuracy Estimation Under Distribution Shifts [25.6] 現在のロジットベースの手法は過信問題に対して脆弱であり、特に自然変化の下では予測バイアスにつながる。
予測バイアスを低減するために,データ依存正規化を適用したMaNoを提案し,正規化ロジットの行列の$L_p$ノルムを推定スコアとする。
MaNoは、合成、自然、またはサブポピュレーションシフトの存在下で、さまざまなアーキテクチャで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:45:06 GMT)
Descriptive Image Quality Assessment in the Wild [25.5] VLMに基づく画像品質評価(IQA)は、画像品質を言語的に記述し、人間の表現に合わせることを目指している。
野生における画像品質評価(DepictQA-Wild)について紹介する。
本手法は,評価タスクと比較タスク,簡潔かつ詳細な応答,完全参照,非参照シナリオを含む多機能IQAタスクパラダイムを含む。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:49:15 GMT)
DecomCAM: Advancing Beyond Saliency Maps through Decomposition and Integration [25.3] クラスアクティベーションマップ(CAM)手法は、モデルの意思決定基準を明らかにする領域を強調するが、明確なサリエンシマップと詳細な解釈性は欠如している。
チャネル活性化マップから共有パターンを抽出する新しい分解分解分解法であるDecomCAMを提案する。
実験の結果,DecomCAMは精度を向上するだけでなく,解釈可能性と計算効率のバランスを最適化できることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:40:11 GMT)
CtrlA: Adaptive Retrieval-Augmented Generation via Probe-Guided Control [25.1] 大規模言語モデル(LLM)の幻覚を、検索された外部知識で緩和するための有望な解決策として、検索拡張世代(RAG)が出現している。
CtrlAと呼ばれる効果的なプローブ誘導適応RAGフレームワークを導入することで、LCMの内部状態を探索し、そのような問題を緩和する試みを初めて提示する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:17:16 GMT)
Kernel Metric Learning for In-Sample Off-Policy Evaluation of Deterministic RL Policies [24.7] 強化学習のための決定論的目標政策の非政治的評価を考察する。
動作値関数の時間差更新ベクトルの推定値の平均二乗誤差を最小化するカーネルメトリクスを学習する。
この緩和による推定誤差のバイアスとばらつきを導出し、最適なカーネル計量に対する解析解を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:17:33 GMT)
Instruct-MusicGen: Unlocking Text-to-Music Editing for Music Language Models via Instruction Tuning [24.7] Instruct-MusicGenは、事前訓練されたMusicGenモデルを微調整して、効率的に編集命令に従う新しいアプローチである。
注目すべきは、Instruct-MusicGenはオリジナルのMusicGenモデルに8%新しいパラメータを導入し、5Kステップでのみ列車を走らせることだ。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:05:32 GMT)
Navigable Graphs for High-Dimensional Nearest Neighbor Search: Constructions and Limits [24.6] グラフが任意の開始ノードから任意のターゲットノードへの移動に成功すれば、グラフはナビゲート可能である。
アプリケーションにとって重要な問題は、スペーサーグラフを構築することができるかどうかである。
任意の次元において、任意の距離関数に対して、平均次数$O(sqrtn log n )$の任意の$n$点に対してナビゲート可能なグラフを構築するための単純かつ効率的な方法を与える。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:07:26 GMT)
Position: Foundation Agents as the Paradigm Shift for Decision Making [24.6] 我々は,エージェントの学習パラダイムの変革的変化として,基礎エージェントの構築を提唱する。
我々は,大規模な対話型データ収集や生成から自己指導型事前学習,適応に至るまで,基礎エージェントのロードマップを定めている。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:15:09 GMT)
SegICL: A Multimodal In-context Learning Framework for Enhanced Segmentation in Medical Imaging [24.3] In-Context Learning (ICL) を利用した画像セグメンテーション手法であるSegICLを紹介する。
SegICLはテキスト誘導セグメンテーションを採用し、少量のイメージマスクペアでテキスト内学習を行うことができる。
ショット供給時のセグメンテーション性能はゼロショット設定時の性能の約1.5倍である。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:00:22 GMT)
Composed Image Retrieval for Remote Sensing [24.1] この研究は、合成画像検索をリモートセンシングに導入する。
テキスト記述で交互に画像例によって大きな画像アーカイブをクエリできる。
イメージ・ツー・イメージとテキスト・ツー・イメージの類似性を融合させる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:00:17 GMT)
A Full-duplex Speech Dialogue Scheme Based On Large Language Models [24.0] シームレスな対話を可能にする 生成生成対話システムです
System is based on a large language model (LLM)
LLMは知覚モジュール、運動関数モジュール、および単純な有限状態機械の概念を注意深く認識している。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:05:46 GMT)
DC-Gaussian: Improving 3D Gaussian Splatting for Reflective Dash Cam Videos [24.0] 本稿では,車載ダッシュカムビデオから新しいビューを生成する手法であるDC-Gaussianを提案する。
本手法は,新規なビュー合成における最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:07:09 GMT)
Causal Action Influence Aware Counterfactual Data Augmentation [23.9] 我々は,オンライン環境のインタラクションにアクセスすることなく,固定データセットから合成トランジションを生成可能なデータ拡張手法であるCAIACを提案する。
因果的影響を定量化するための原理的手法を利用することで、状態空間の$itaction$-unffected部分を交換することで、反ファクト的推論を行うことができる。
これにより、分散シフトに対するオフライン学習アルゴリズムの堅牢性が大幅に向上する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:19:50 GMT)
Zero-Shot Unsupervised and Text-Based Audio Editing Using DDPM Inversion [23.9] DDPMインバージョンと事前学習拡散モデルを用いた音声信号のゼロショット編集手法について検討する。
まず、ZEro-shot Text-based Audio (ZETA) 編集を画像領域から採用する。
第2のZEro-shot UnSupervized (ZEUS) 編集は、意味論的に意味のある編集方向を監督なしで発見するための新しいアプローチである。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:27:24 GMT)
An engine not a camera: Measuring performative power of online search [23.8] 我々は、オンライン検索プロバイダのパワーを測定するために、最近のパフォーマンスパワーの定義に基づいて構築する。
そこで我々は,未仮定のランダム化実験をバックグラウンドで行うブラウザエクステンションを開発した。
オンライン検索エンジンのパワーについて、我々の頑健な定量的発見が何を意味するかについて論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:31:12 GMT)
Decom--CAM: Tell Me What You See, In Details! Feature-Level Interpretation via Decomposition Class Activation Map [23.7] クラスアクティベーションマップ(CAM)は、オブジェクトの位置をハイライトすることで深層モデルの予測を解釈するために広く使われている。
本稿では,分解クラス活性化マップ(Decom-CAM)と呼ばれる2段階の解釈可能性を提案する。
実験の結果,提案したDecom-CAMは最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:53:56 GMT)
LetsMap: Unsupervised Representation Learning for Semantic BEV Mapping [23.4] 本稿では,FV画像からセマンティックなBEVマップをラベル効率よく生成するための,教師なし表現学習手法を提案する。
提案手法は,2つの解離したニューラルパスを教師なし方式で,シーン幾何学とシーン意味論を独立に推論するために,ネットワークを事前訓練する。
本研究では,FV画像の空間的・時間的整合性を利用して,シーン表現を符号化する新しい時間的マスク付きオートエンコーダの定式化に依存しながら,シーン形状を学習する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:03:36 GMT)
Enhancing Security and Privacy in Federated Learning using Update Digests and Voting-Based Defense [23.3] フェデレートラーニング(FL)は、有望なプライバシー保護機械学習パラダイムである。
その可能性にもかかわらず、FLはクライアントとサーバの信頼性に関する課題に直面している。
underlinetextbfFederated underlinetextbfLearning with underlinetextbfUpdate underlinetextbfDigest (FLUD) という新しいフレームワークを導入する。
FLUDは、分散学習環境におけるビザンチン攻撃に対するプライバシー保護と抵抗の重要な問題に対処する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:46:10 GMT)
Contrasting Multiple Representations with the Multi-Marginal Matching Gap [23.3] そこで本稿では,マルチマージ最適輸送理論からツールを借りて,すべての$k$ビューを同時に組み込む損失を提案する。
本実験は、自己教師型タスクとマルチモーダル型タスクの両方において、ペアワイズ損失のマルチビュー拡張よりも性能が向上したことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:24:44 GMT)
SLIDE: A Framework Integrating Small and Large Language Models for Open-Domain Dialogues Evaluation [23.2] 対話評価のためのフレームワークSLIDE(Small and Large Integrated for Dialogue Evaluation)を提案する。
本手法は, 分類タスクと評価タスクの両方において最先端のパフォーマンスを達成し, また, SLIDEは人的評価器との相関性も良好である。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:10:27 GMT)
Subset-Based Instance Optimality in Private Estimation [23.2] 我々は、幅広いデータセット特性を推定する際に、インスタンス最適性の概念を実現するプライベートアルゴリズムを構築する方法を示す。
提案アルゴリズムは,分布的な仮定の下で,既存のアルゴリズムの性能を同時に一致または超過する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:37:23 GMT)
LoopDraw: a Loop-Based Autoregressive Model for Shape Synthesis and Editing [22.7] 断面閉ループの列を用いて, 形状を表現するための新しい, 説得力のある代替手段を提案する。
すべての平面にまたがるループは、自己回帰的な形状の合成と編集に活用する組織階層を形成します。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:58:47 GMT)
Serpent: Scalable and Efficient Image Restoration via Multi-scale Structured State Space Models [22.7] サーペントは高解像度画像復元のための効率的なアーキテクチャである。
本稿では,Serpentが最先端技術に匹敵する再現性が得られることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:43:07 GMT)
DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference [22.7] 木構造推論に適したIO対応ツリーアテンションアルゴリズムを提案する。
DeFTは3つの実用的なツリーベースのワークロードで、エンドツーエンド/アテンションのレイテンシで最大2.52/3.82倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:46:41 GMT)
A Good Foundation is Worth Many Labels: Label-Efficient Panoptic Segmentation [22.4] ロボット知覚に学習ベースのモデルを広く応用する上での課題は、注釈付きトレーニングデータの必要量を大幅に削減することである。
視覚基礎モデルにより舗装された基礎を生かし、セマンティックセグメンテーションとオブジェクト境界検出のために2つの軽量ネットワークヘッドを訓練する。
PASTELはアノテーションが少なくてもラベル効率の良いセグメンテーションの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:23:29 GMT)
Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Models [22.4] 我々は,テストタイムの欲求検索として,大規模言語モデルのアライメントをフレーミングする,$textitweak-to-strong検索を導入する。
市販の小型モデルペアの再利用により,ホワイトボックスモデルとブラックボックスモデルの両方の長制御勝利率を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:55:32 GMT)
Decentralized Optimization in Time-Varying Networks with Arbitrary Delays [22.4] 通信遅延によるネットワークの分散最適化問題を考察する。
そのようなネットワークの例としては、協調機械学習、センサーネットワーク、マルチエージェントシステムなどがある。
通信遅延を模倣するため、ネットワークに仮想非計算ノードを追加し、有向グラフを生成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:51:38 GMT)
Multi-stage Retrieve and Re-rank Model for Automatic Medical Coding Recommendation [22.3] 国際疾患分類(ICD)は、医学的な分類体系である。
ICDインデックスの主な目的は、ICDコードのサブセットを医療記録に割り当てることである。
既存のほとんどのアプローチは、非常に大きなICDコレクションから適切なラベルサブセットを選択することに苦しんだ。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:54:30 GMT)
Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification [22.3] 3つのアイデアを取り入れた新しいICDインデクシング手法を提案する。
臨床ノートから情報を収集するために,多レベル深部拡張残差畳み込みエンコーダを用いた。
我々はICD分類の課題を医療記録の補助的知識で定式化する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:44:07 GMT)
RAG-Driver: Generalisable Driving Explanations with Retrieval-Augmented In-Context Learning in Multi-Modal Large Language Model [22.3] 説明責任は、信頼できる自律的な意思決定において重要な役割を果たす。
MLLM(Multi-Modal Large Language Model)の最近の進歩は、駆動エージェントとしての説明可能性を高める有望な可能性を示している。
提案するRAG-Driverは,高機能,説明性,一般化可能な自律運転にコンテキスト内学習を活用する,検索強化型多モード大言語モデルである。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:44:20 GMT)
PediatricsGPT: Large Language Models as Chinese Medical Assistants for Pediatric Applications [22.2] PedCorpusは、小児科の教科書、ガイドライン、知識グラフリソースから30万以上のマルチタスク・インストラクションを収集し、多様な診断要求を満たすための高品質なデータセットである。
PedCorpusを十分に設計した上で,系統的かつ堅牢なトレーニングパイプライン上に構築された,中国初の小児 LLM アシスタントであるPediatricsGPT を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:59:38 GMT)
ACCSAMS: Automatic Conversion of Exam Documents to Accessible Learning Material for Blind and Visually Impaired [21.9] ACCSAMSは、試験文書のアクセシビリティを高めるために設計された半自動システムである。
1,293のドイツ語と900の英語の試験用文書からなる,最初の多言語手動注釈データセットを提示する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:30:06 GMT)
PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram [21.8] リアルタイムかつ高性能な3Dオブジェクト検出は、自律走行とロボット工学において重要な役割を果たす。
最近の柱型3次元物体検出器は、そのコンパクトな表現と計算オーバーヘッドの低さから注目されている。
しかし、既存の柱型検出器は、高さ寸法と大きな数値分布差に沿って情報損失を被っている。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:28:16 GMT)
GIST: Greedy Independent Set Thresholding for Diverse Data Summarization [21.7] 我々は、min-distance various data summarization(textsfMDDS$)と呼ばれる新しいサブセット選択タスクを提案する。
目的は、各点のトータルユーティリティと、選択された任意の点間の最小距離をキャプチャする多様性項を組み合わせた目的を最大化することである。
この作業は、$textttGIST$アルゴリズムを示し、$textsfMDDS$の$frac23$-approximation保証を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:39:24 GMT)
Simultaneous Deep Learning of Myocardium Segmentation and T2 Quantification for Acute Myocardial Infarction MRI [21.2] 本稿では,TransformerとConvolutional Neural Network(CNN)を統合したデュアルタスクネットワークであるSQNetを提案する。
SQNetは、定量分析のためのT2リファインフュージョンデコーダを備え、Transformerのグローバル機能を活用している。
タイトな結合モジュールは、CNNとTransformerブランチの機能を調整してヒューズし、SQNetが心筋領域に集中できるようにする。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:36:34 GMT)
Discovering Interpretable Directions in the Semantic Latent Space of Diffusion Models [21.2] DDM(Denoising Diffusion Models)は、GAN(Generative Adversarial Networks)の強力な競合相手として登場した。
本稿では,h-spaceの特性について検討し,その中に意味のある意味的方向を求めるための新しい手法を提案する。
私たちのアプローチは、アーキテクチャの変更、テキストベースのガイダンス、CLIPベースの最適化、モデル微調整を必要とせずに適用できます。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:30:37 GMT)
Promoting Two-sided Fairness in Dynamic Vehicle Routing Problem [21.1] DVRPには、顧客に対してサービスを提供するサービスプロバイダと、異なる場所からの要求を集める顧客という2つの利害関係者が含まれている。
本稿では,遺伝的アルゴリズムを実用性にのみ焦点を絞った目的から,両面の公平性を含む多目的へと拡張する,両面の公平性を考慮した遺伝的アルゴリズム (2FairGA) を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:24:28 GMT)
Alt4Blind: A User Interface to Simplify Charts Alt-Text Creation [21.1] グラフ画像の代替テキスト(Alt-Text)は、盲目や視覚障害のある人にグラフィックをアクセスできるようにするのに不可欠である。
最近のトレンドでは、Alt-Text生成にAIが使用されている。
セマンティックラベル付き高品質Alt-Textsを用いて,5,000個の実画像からなる新しいベンチマークを提案する。
我々は、同じ視覚的・テキスト的意味論を共有する類似のチャート画像のランク付けと検索を行う深層学習モデルを開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:19:57 GMT)
Representing Molecules as Random Walks Over Interpretable Grammars [20.7] 複素分子を表現・推論するためのデータ効率・解釈可能なモデルを提案する。
設計空間上のランダムウォークという形で,新しい表現を提示する。
予測分子の性能, 効率, 合成性の観点から, 既存の手法に対する明確な優位性を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:04:26 GMT)
ChartFormer: A Large Vision Language Model for Converting Chart Images into Tactile Accessible SVGs [20.7] チャート解析の分野での進歩を活用して,触覚チャートをエンドツーエンドに生成する。
筆者らの3つの重要な貢献は,(1)チャート画像を触覚アクセス可能なSVGに変換するために訓練されたChartFormerモデル,(2)Chart2Tactileデータセット上でこのモデルをトレーニングし,(3)リフレッシュ可能な2次元触覚ディスプレイを用いたパイロットユーザによるSVGの有効性を評価することである。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:24:42 GMT)
Reverse the auditory processing pathway: Coarse-to-fine audio reconstruction from fMRI [20.4] 本稿では,機能的磁気共鳴画像(fMRI)データに基づく,より粗い音響再構成手法を提案する。
我々は,3つの公開fMRIデータセットであるBrain2Sound,Brain2Music,Brain2Speechについて検証を行った。
復号化時に意味的プロンプトを用いることで,意味的特徴が最適でない場合に,再構成音声の品質を向上させる。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:16:14 GMT)
SwapMoE: Serving Off-the-shelf MoE-based Large Language Models with Tunable Memory Budget [20.3] 我々は,学習可能なメモリ予算を備えたMoEベースの大規模言語モデルの効率的な機能を実現するためのフレームワークであるSwapMoEを紹介する。
SwapMoEは適切な精度を維持しながらメモリフットプリントを削減できることが実験で示されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:25:03 GMT)
MIST: Defending Against Membership Inference Attacks Through Membership-Invariant Subspace Training [20.3] メンバー推論(MI)攻撃は、プライベートデータを使用して機械学習(ML)モデルをトレーニングする際の大きなプライバシー上の問題である。
我々はMI攻撃を防御する新しいメンバーシップ・不変部分空間訓練(MIST)手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:34:09 GMT)
Reasoning3D -- Grounding and Reasoning in 3D: Fine-Grained Zero-Shot Open-Vocabulary 3D Reasoning Part Segmentation via Large Vision-Language Models [20.3] オブジェクトの検索とローカライズのためのZero-Shot 3D Reasoningを提案する。
複雑なコマンドを理解し実行するためのシンプルなベースラインメソッドReasoning3Dを設計する。
Reasoning3Dは、暗黙のテキストクエリに基づいて、3Dオブジェクトの一部を効果的にローカライズし、ハイライトすることができることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:56:07 GMT)
Improved Convex Decomposition with Ensembling and Boolean Primitives [20.2] アート手法の状態は、一定数のプリミティブからなる開始点を予測するための学習された回帰手順を含む。
本稿では, (a) 少数の負のプリミティブを組み込んで, (b) 多数の異なる回帰手順を組み込むことで, 精度を大幅に向上できることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:24:48 GMT)
Gaussian Flow Bridges for Audio Domain Transfer with Unpaired Data [20.2] 本稿では,生成モデルにおけるガウス流橋の可能性について検討する。
提案フレームワークは,2つの決定論的確率フローの一連の実装を通じて,音声信号の分布の異なる輸送問題に対処する。
音声内容の一貫性を維持する上での課題に対処するため,チャンクをベースとしたデータサンプルとノイズの最適輸送結合を含むトレーニング戦略を推奨する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:23:01 GMT)
Deform3DGS: Flexible Deformation for Fast Surgical Scene Reconstruction with Gaussian Splatting [20.1] 内視鏡下手術における変形性組織に対する新しい高速再建フレームワークであるDeform3DGSを提案する。
また,組織変形力学を学習するためのフレキシブルな変形モデリング手法 (FDM) を提案する。
我々のFDMは、効率的な表現で表面の変形をモデル化することができ、リアルタイムなレンダリング性能を実現することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:25:32 GMT)
Textureless Deformable Surface Reconstruction with Invisible Markers [20.1] 対象表面の特徴を積極的に豊かにするための新しい種類のマーカーを提案する。
我々のマーカーは蛍光染料でできており、紫外線(UV)の下でのみ可視であり、通常の照明条件下では見えない。
可視光の下では、マーカーは見えなくなり、物体の元々の触れられていない外観を捉えることができます。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:41:34 GMT)
ACES: Generating Diverse Programming Puzzles with with Autotelic Generative Models [20.0] Autotelic CodE Search (ACES)は、生成した問題の多様性と難易度を共同で最適化する。
問題解決に必要なプログラミングスキルを記述したセマンティック記述子の空間における問題を表現する。
ACESは、ターゲットセマンティック記述子の多様性を達成するため、大きな言語モデルに難しい問題を引き起こすことを反復的に促します。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:56:23 GMT)
LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model [20.0] ビデオテキストスポッティングは、ビデオ内のテキストインスタンスを同時にローカライズ、認識、追跡することを目的としている。
本稿では,従来のテキストスポッターの性能を高めるために,言語協調とグリフ知覚モデル(LOGO)を提案する。
提案したLCCは,テキストライクな領域をフィルタリングしながら,低解像度テキストインスタンスの検出を容易にする。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:35:09 GMT)
Building Guardrails for Large Language Models [20.0] LLMの入力や出力をフィルタリングするガードレールは、コアセーフガード技術として登場した。
このポジションペーパーでは、現在のオープンソースソリューション(Llama Guard, Nvidia NeMo, Guardrails AI)を詳しく調べ、より完全なソリューションを構築するための課題と道筋について論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:57:01 GMT)
Counterfactual Metarules for Local and Global Recourse [19.6] T-CRExは局所的および大域的対実的説明のためのモデルに依存しない手法である。
それは、個人とグループの両方のリコメンデーションオプションを、可読性のあるルールの形で要約する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:35:17 GMT)
Preferred-Action-Optimized Diffusion Policies for Offline Reinforcement Learning [19.5] オフライン強化学習のための優先行動最適化拡散政策を提案する。
特に、表現的条件拡散モデルを用いて、行動ポリシーの多様な分布を表現する。
実験により,提案手法は従来のオフラインRL法と比較して,競争力や性能に優れることを示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:19:59 GMT)
Benchmarking General Purpose In-Context Learning [19.4] 汎用インコンテキスト学習(GPICL)は、幅広いタスクに対処し、水平線を学習し、ゼロショットベースラインを低くする。
これらの特徴は、熟練性を改善するために文脈や相互作用に依存するモデルに重大な課題をもたらす。
実験の結果,パラメータスケールだけではICLやGPICLにとって重要ではない可能性が示唆された。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:35:01 GMT)
Towards Faithful Chain-of-Thought: Large Language Models are Bridging Reasoners [19.4] 大きな言語モデル(LLM)は、深刻な不信の連鎖(CoT)問題に悩まされる。
まず、CoTステップの粒度におけるCoT忠実度問題について検討し、2つの推論パラダイムを特定した。
次に、推論中の文脈、CoT、回答の因果関係を共同で分析する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:17:46 GMT)
CLIPLoss and Norm-Based Data Selection Methods for Multimodal Contrastive Learning [19.1] データ選択は、大規模ビジュアル言語モデル(例えば、CLIP)のコア問題として浮上した。
3つの主要なデータ選択アプローチは、(1)データ選択を支援するために外部のCLIPモデルを活用すること、(2)高品質なデータを選択するのにより効果的な新しいCLIPスタイルの埋め込みモデルをトレーニングすること、(3)より優れたメトリクスや戦略をCLIP埋め込みに普遍的に適用することである。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:19:57 GMT)
MDIW-13: a New Multi-Lingual and Multi-Script Database and Benchmark for Script Identification [19.0] 本稿では,スクリプト識別アルゴリズムのベンチマークのための新しいデータベースを提供する。
データセットは、地元の新聞や手書きの手紙からスキャンされた1,135件の文書と、異なるネイティブライターのメモで構成されている。
簡単なベンチマークは、手作りとディープラーニングの手法で提案されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:29:09 GMT)
PermLLM: Private Inference of Large Language Models within 3 Seconds under WAN [19.0] ChatGPTは、大きな言語モデル(LLM)時代の到来を示す。
PermLLM は ChatGLM-6B モデルを約3s/token の速度で2パーティのプライベート推論を行う。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:06:50 GMT)
Quantitative Certification of Bias in Large Language Models [18.9] 大規模言語モデル(LLM)は、社会的バイアスを示し、ステレオタイプをサポートする応答を生成することができる。
対象のLSMから偏りのない応答を得るための正式な保証を提供する新しい認証フレームワークであるQuaCer-Bを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:39:37 GMT)
CheXpert Plus: Hundreds of Thousands of Aligned Radiology Texts, Images and Patients [18.5] CheXpert Plusは、放射線学で公開された最大のテキストデータセットである。
これは放射線学における最大のテキスト識別の取り組みである。
全てのレポートはDICOMフォーマットで高品質な画像とペアリングされる。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:48:56 GMT)
BLSP-KD: Bootstrapping Language-Speech Pre-training via Knowledge Distillation [18.3] BLSP-KD(Bootstrapping Language-Speech Pretraining)を知識蒸留により導入する。
音声入力とテキスト入力に対するLLMの次点予測分布のばらつきを最小化することで、音声テキストアライメントを最適化する。
また、音声を1対1でテキストトークンに対応するトークンに分割し、きめ細かいアライメントを可能にする。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:32:08 GMT)
GAN Inversion for Image Editing via Unsupervised Domain Adaptation [18.3] 本稿では,UNDA(Unsupervised Domain Adaptation)のインバージョンプロセス,すなわちUDA-inversionを提案し,HQおよびLQ画像の効果的なインバージョンと編集を行う。
UDA-InversionはFFHQデータセットで22.14のPSNRを実現し、教師付きメソッドと互換性がある。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:37:34 GMT)
Calibrating Reasoning in Language Models with Internal Consistency [18.2] 大規模言語モデル(LLM)は、様々な推論タスクにおいて、チェーン・オブ・ソート(CoT)プロンプトのようなテクニックによって支援された印象的な機能を示している。
内部表現のレンズによるLLMにおけるCoT推論について検討する。
内部整合性の高い高重み付け推論経路によるCoT推論の校正手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:44:12 GMT)
Coupled Mamba: Enhanced Multi-modal Fusion with Coupled State Space Model [18.2] 本稿では,複数モードの状態チェーンを結合し,モード内状態プロセスの独立性を維持した結合型SSMモデルを提案する。
CMU-EI,CH-SIMS,CH-SIMSV2のマルチドメイン入力による実験により,本モデルの有効性が検証された。
その結果, 結合マンバモデルではマルチモーダル核融合が可能であることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:19:15 GMT)
Hacking Task Confounder in Meta-Learning [18.2] 本稿では,メタ学習コーサル表現(MetaCRL)を提案する。
我々の研究は、ベンチマークデータセット上での最先端(SOTA)性能を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:30:00 GMT)
Multi-Condition Latent Diffusion Network for Scene-Aware Neural Human Motion Prediction [18.1] 現実世界の人間の動きはゴール指向であり、周囲のシーンの空間的レイアウトの影響を強く受けている。
本稿では,多条件共同推論問題として人間の動作予測タスクを再構成するマルチコンディション遅延拡散ネットワーク(MCLD)を提案する。
我々のネットワークは、現実的かつ多様な予測において最先端の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:21:31 GMT)
S2malloc: Statistically Secure Allocator for Use-After-Free Protection And More [18.0] 我々は、他のセキュリティ保証を損なうことなく、UAF攻撃検出を強化することを目的としたS2mallocを紹介する。
RIOオフセットのオブジェクトサイズの25%を保存することで、攻撃者が同じポインタを再利用した場合、8バイトのカナリアは69%の保護率を提供する。
S2mallocは、オーバーヘッドを大幅に低減するために保護の失敗の極小確率をトレードオフする。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:59:20 GMT)
Momentum for the Win: Collaborative Federated Reinforcement Learning across Heterogeneous Environments [18.0] 我々は、フェデレート強化学習(FRL)問題を探り、N$エージェントが共通の方針を、軌跡データを共有せずに共同で学習する。
平均性能関数の定常点に収束するFedSVRPG-MとFedHAPG-Mの2つのアルゴリズムを提案する。
我々のアルゴリズムはエージェント数に関して線形収束の高速化を享受しており、共通ポリシーを見つける上でのエージェント間の協調の利点を強調している。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:24:42 GMT)
Unlearning Climate Misinformation in Large Language Models [18.0] 気候変動に関する誤報は、人類にとって最も深刻な脅威の1つに対処する上で、重要な障害となっている。
本稿では,気候情報に関する大規模言語モデル(LLM)の事実的精度について検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:11:53 GMT)
ContextBLIP: Doubly Contextual Alignment for Contrastive Image Retrieval from Linguistically Complex Descriptions [17.9] 文脈記述(IRCD)からの画像検索は、言語学的に複雑なテキストに基づいて、最小限に対照的な候補のセット内で画像を特定することを目的としている。
本稿では,IRCDに挑戦する2つのコンテキストアライメント手法であるContextBLIPを提案する。
約7,500倍のパラメータを含むにもかかわらず、ContextBLIPはGPT-4Vと同等の結果が得られることが観察された。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:06:21 GMT)
Generating In-Distribution Proxy Graphs for Explaining Graph Neural Networks [17.7] GNNの説明可能性のための一般的なパラダイムは、ラベルを元のグラフと比較することで説明可能な部分グラフを特定することである。
この課題は、トレーニングセットの元のグラフから説明可能なサブグラフのセットへの相当な分布シフトのため、難しい。
本稿では,学習データの分布を示す説明可能な部分グラフのプロキシグラフを生成する手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:52:16 GMT)
Stochastic Optimization Algorithms for Instrumental Variable Regression with Streaming Data [17.7] この問題を条件付き最適化問題とみなして,器用変分回帰のためのアルゴリズムを開発し,解析する。
最小二乗変数回帰の文脈では、我々のアルゴリズムは行列逆転やミニバッチを必要としない。
任意の$iota>0$に対して$mathcalO(log T/T)$と$mathcalO(1/T1-iota)$の順の収束率を導出する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:21:55 GMT)
Inverse Concave-Utility Reinforcement Learning is Inverse Game Theory [17.6] 凹凸ユーティリティによる逆強化学習問題を考察する。
CURLは古典的なベルマン方程式を無効にするため、標準IRLの結果のほとんどは一般には適用されない。
平均場ゲームサブクラスにおける逆ゲーム理論問題と等価であることを示すことによって,I-CURLに対する実現可能な報酬の新たな定義を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:07:17 GMT)
Beyond the Limits: A Survey of Techniques to Extend the Context Length in Large Language Models [17.3] 大規模言語モデル(LLM)は、コンテキストの理解、論理的推論への関与、応答の生成など、優れた機能を示している。
本調査は,LLMの配列長を拡張するために考案された最近の手法と手法の包括的レビューを提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:38:25 GMT)
Blind Image Restoration via Fast Diffusion Inversion [17.1] Blind Image Restoration via fast Diffusion (BIRD) は、劣化モデルパラメータと復元画像の協調最適化を行うブラインド赤外線法である。
提案手法の鍵となる考え方は、初期ノイズがサンプリングされると、逆サンプリングを変更すること、すなわち、中間潜水剤を全て変更しないことである。
画像復元作業におけるBIRDの有効性を実験的に検証し,それらすべてに対して,その成果が得られたことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:38:12 GMT)
Optimized Layerwise Approximation for Efficient Private Inference on Fully Homomorphic Encryption [17.0] 本研究では、プライバシー保護型ディープニューラルネットワークのための最適化レイヤワイド近似(OLA)フレームワークを提案する。
効率的な近似のために、各アクティベーション関数の実際の入力分布を考慮し、階層的精度を反映する。
その結果、OLA法はResNet-20モデルとResNet-32モデルの推論時間をそれぞれ3.02倍と2.82倍に削減した。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:00:01 GMT)
Expert-Guided Extinction of Toxic Tokens for Debiased Generation [17.0] 大規模言語モデル(LLM)は、特に有毒なプロンプトによる推論において、世代間の社会的偏見を誘発することができる。
本稿では, 有害な有害な出力を除去するために, 有害なTokens for Debiased Generation (EXPOSED) のエキスパートガイド抽出法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:26:52 GMT)
Manipulation and Peer Mechanisms: A Survey [17.0] ピアメカニズムでは、賞の競争相手も誰が勝つかを決定する。
この賞は、金融援助、コースグレード、会議での賞などの価値があり得るため、競技者は、その仕組みを操作する誘惑を受けることができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:04:26 GMT)
Ferrari: Federated Feature Unlearning via Optimizing Feature Sensitivity [16.8] 連邦学習(FL)の出現は、すべての顧客にとって「忘れられる権利」の実践的な必要性を強調している。
未学習のセンシティブな機能、バックドア機能、バイアス機能などに応用されているため、フィーチャーアンラーニングは大きな注目を集めている。
既存の手法では、非学習プロセスにおいて他のクライアントの参加を必要とするため、FLでは現実的ではない機能非学習を実現するために影響関数を採用している。
本稿では,フェラーリと呼ばれる機能非学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:11:04 GMT)
Achievable Fairness on Your Data With Utility Guarantees [16.8] 機械学習の公平性において、異なるセンシティブなグループ間の格差を最小限に抑えるトレーニングモデルは、しばしば精度を低下させる。
本稿では,各データセットに適合する公平性-正確性トレードオフ曲線を近似する計算効率のよい手法を提案する。
そこで我々は,モデルフェアネスを監査するための堅牢な枠組みを実践者に提供し,評価の不確実性を定量化する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:29:39 GMT)
Channel-Selective Normalization for Label-Shift Robust Test-Time Adaptation [16.7] テスト時間適応は、推論中にモデルを新しいデータ分布に調整するアプローチである。
テスト時のバッチ正規化は、ドメインシフトベンチマークで魅力的なパフォーマンスを達成した、シンプルで一般的な方法である。
本稿では、ディープネットワークにおけるチャネルのみを選択的に適応させ、ラベルシフトに敏感な劇的な適応を最小化することで、この問題に対処することを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:16:57 GMT)
LLM-Generated Black-box Explanations Can Be Adversarially Helpful [16.5] 大規模言語モデル(LLM)は,デジタルアシスタントとして機能することで,複雑な問題の解決と理解を支援する。
私たちの研究は、このアプローチに結びついている隠れたリスクを明らかにします。
LLMの説明が間違った答えを正しく見せると、これは起こります。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:18:59 GMT)
Cracking the Code of Juxtaposition: Can AI Models Understand the Humorous Contradictions [16.2] 本論では, ユーモラスな矛盾を生じさせる2つのパネルから構成される, 矛盾した物語を持つ漫画に焦点を当てる。
本稿では,これらの漫画の認識と解釈においてAIの能力を評価することを目的とした,さまざまな難易度タスクを含むYesButベンチマークを紹介する。
以上の結果から,現状のモデルでさえ,この課題における人的パフォーマンスに遅れをとどめていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:51:43 GMT)
Toxicity Detection for Free [16.1] 特定の開始トークンのロジットに基づく玩具モデルでは、トレーニングや追加計算コストを必要とせず、信頼性の高い性能が得られることを示す。
我々は、複数の測定値の下でSOTA検出器をはるかに上回る、第1応答トークンロジットのスパースロジスティック回帰モデルを用いて、よりロジスティックな検出器を構築する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:03:31 GMT)
Exploring Fairness in Educational Data Mining in the Context of the Right to be Forgotten [16.0] 教育データマイニング(EDM)コミュニティでは、機械学習が教育上の課題に対処するパターンや構造を発見することに成功している。
忘れられる権利の需要が高まっているため、機密データとその影響を忘れる機械学習モデルの必要性が高まっている。
予測精度を維持しつつ,学習モデルの公平性を損なうような,新たな選択的忘れ攻撃のクラスを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:52:43 GMT)
Few-shot Adaptation to Distribution Shifts By Mixing Source and Target Embeddings [16.0] MixProは軽量でデータ効率のよいアプローチで、数ショットの適応が可能だ。
MixProはベースラインを最大7%上回り、2-4のターゲット例しかありません。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:38:13 GMT)
Momentum-Based Federated Reinforcement Learning with Interaction and Communication Efficiency [16.0] フェデレート強化学習(FRL)が注目を集めている。
本稿では,新しいFRLアルゴリズムである$texttMFPO$を紹介する。
運動量パラメータと相互作用周波数の適切な選択により、$texttMFPO$は$tildemathcalO(H-1Nepsilon-3/2N)$および$tmathcalO(ilon-1N)$を達成することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:36:56 GMT)
Spatio-Temporal Field Neural Networks for Air Quality Inference [16.0] 本稿では,新しいモデルSpatio-Temporal Field Neural Networkとその対応するフレームワークであるPraamidal Inferenceを提案する。
本モデルは中国本土における大気質の全国的推定における最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:10:11 GMT)
Non-Log-Concave and Nonsmooth Sampling via Langevin Monte Carlo Algorithms [15.7] マルチモーダル性により低次元でもしばしば困難となるガウス混合などの非対数圏分布からの近似サンプリング問題について検討する。
我々はマルコフ連鎖モンテカルロ法(MCMC)を用いてこの課題を実行することに集中する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:15:42 GMT)
More Flexible PAC-Bayesian Meta-Learning by Learning Learning Algorithms [15.6] PAC-Bayesian理論を用いたメタラーニング手法の研究のための新しいフレームワークを提案する。
私たちの大きな利点は、タスク間の知識の伝達を実現する方法において、柔軟性を高めることです。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:32:36 GMT)
Artificial Intelligence Index Report 2024 [15.5] AI Indexのレポートでは、人工知能(AI)に関連するデータを追跡、照合、蒸留、可視化している。
AIインデックスは、AIに関するデータと洞察の最も信頼性が高く権威のある情報源の1つとして、世界的に認識されている。
今年のエディションは、サイズ、スケール、スコープのすべての旧版を上回り、AIが私たちの人生で持つ重要性が増していることを反映している。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:59:57 GMT)
MemControl: Mitigating Memorization in Medical Diffusion Models via Automated Parameter Selection [15.5] 拡散モデルは、トレーニング分布を忠実に反映した画像を生成する際、顕著な能力を示す。
これらのモデルはデータの記憶をトレーニングする傾向があり、プライバシー、倫理、法的懸念に繋がる。
本稿では,メモリ化と生成品質指標を報奨として活用することにより,自動パラメータ選択を誘導する二段階最適化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:12:08 GMT)
CaLa: Complementary Association Learning for Augmenting Composed Image Retrieval [15.5] Composed Image Retrieval (CIR)は、画像とテキストのペアクエリに基づいてターゲットイメージを検索する。
我々は、CIR三重項が、この一次関係を超える付加的な関連を含んでいると論じる。
本稿では,三重項をグラフノードとして扱い,三重項内の2つの新しい関係を同定する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:52:10 GMT)
DataSafe: Copyright Protection with PUF Watermarking and Blockchain Tracking [15.4] 本研究は,物理的非拘束機能(PUF)とブロックチェーン技術を組み合わせた著作権保護スキームであるDataSafeを紹介する。
PUFデバイスはブロックチェーン登録に独自の指紋を使用する。その後、デジタル透かし技術を組み込んで、著作権保護のためにメディアにデジタル透かしを埋め込む。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:05:19 GMT)
PyGS: Large-scale Scene Representation with Pyramidal 3D Gaussian Splatting [15.4] 我々はNeRF初期化によるピラミッド型3次元ガウススプラッティング(PyGS)を提案する。
我々はこれらのピラミッドのガウスをクラスタに分類し、各クラスタのピラミッドレベルの影響を動的に決定するために、コンパクトな重み付けネットワークを使用する。
提案手法は,複数の大規模データセットにまたがる大幅な性能向上を実現し,現在の最先端手法の400倍以上のレンダリング時間を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:35:44 GMT)
MoNDE: Mixture of Near-Data Experts for Large-Scale Sparse Models [15.3] MoNDEは、$textithot$のエキスパートだけをGPUに転送することで、MoEパラメータの運動量を削減する。
MoNDEは通信効率のよいMoE推論を可能にし、結果としてかなりのスピードアップをもたらす。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:23:29 GMT)
MUVERA: Multi-Vector Retrieval via Fixed Dimensional Encodings [15.3] マルチベクトル探索を単一ベクトル類似性探索に還元する検索機構であるMUVERA(MUlti-VEctor Retrieval Algorithm)を導入する。
MUVERAはBEIR検索データセットの多種多様なセットに対して、一貫して優れたエンドツーエンドのリコールとレイテンシを実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:40:20 GMT)
Decoupled Data Consistency with Diffusion Purification for Image Restoration [15.0] 本稿では,データ整合性ステップから逆処理を分離することで問題に対処する拡散型画像復元法を提案する。
我々の手法は多目的性を示し、潜在空間における効率的な問題解決に高い適応性を与える。
提案手法の有効性は,画像のデノイング,デブロアリング,インペイント,超解像など,画像修復作業における総合的な実験を通じて検証される。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:09:08 GMT)
Fast and Regret Optimal Best Arm Identification: Fundamental Limits and Low-Complexity Algorithms [15.0] 2つの目的を持つマルチアーメッド・バンドイット(MAB)問題: (i) 最適なアームに対する迅速な識別とコミットメント、および (ii) 連続したラウンドで連続して$T$の報酬。
本稿では,これら2つの目的を達成することを目的としたemphRegret Best Arm Identification (ROBAI)を紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:49:02 GMT)
Chiral quantum heating and cooling with an optically controlled ion [15.0] 量子熱エンジンと冷凍機は開量子系であり、非エルミート形式を用いて力学をよく理解することができる。
ポールトリップされた超低温イオンを用いて,閉ループを動的に囲む最初のキラル量子加熱と冷却を実演した。
実験の結果, 断熱破壊だけでなく, ランダウ・ツェナー=シュタッケルベルク過程が動的循環において重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:31:55 GMT)
Bases for optimising stabiliser decompositions of quantum states [14.9] 我々は、$n$-qubit 安定化状態の線型依存のベクトル空間を導入し、研究する。
定数サイズ3の線形依存のエレガントな基底を構築する。
既存の技術よりも多くの量子ビットの状態の安定化範囲を明示的に計算するためにそれらを用いる。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:29:38 GMT)
Integrating Multi-scale Contextualized Information for Byte-based Neural Machine Translation [14.8] サブワードトークン化はニューラル機械翻訳(NMT)モデルにおける語彙構築の一般的な方法である。
隠れ状態次元の異なる様々なスケールの文脈情報を学習するマルチスケールコンテキスト化(MSC)手法を提案する。
実験により、MSCはサブワードベースおよび他のバイトベースの手法を多言語およびドメイン外のシナリオで大幅に上回っていることが示された。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:19:04 GMT)
Efficient Exploration in Average-Reward Constrained Reinforcement Learning: Achieving Near-Optimal Regret With Posterior Sampling [14.8] 制約付きマルコフ決定過程(CMDP)における学習のための後方サンプリングに基づく新しいアルゴリズムを提案する。
このアルゴリズムは,既存のアルゴリズムと比較して経験的に有利でありながら,ほぼ最適の後悔境界を達成している。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:59:56 GMT)
Image-of-Thought Prompting for Visual Reasoning Refinement in Multimodal Large Language Models [14.8] CoT(Chain-of-Thought)と関連する合理性に基づく研究は、複雑な推論タスクにおいて、LLM(Large Language Models)の性能を大幅に向上させた。
本稿では,MLLMの視覚的合理性を段階的に抽出する,IoT(Image-of-Thought)プロンプト手法を提案する。
IoTプロンプトは、さまざまなMLLMのさまざまな視覚的理解タスクにおいて、ゼロショットの視覚的推論性能を改善した。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:24:36 GMT)
DGD: Dynamic 3D Gaussians Distillation [14.7] 単一の単眼映像を入力として,動的3次元セマンティックラディアンス場を学習する作業に取り組む。
我々の学習したセマンティック・ラディアンス・フィールドは、動的3Dシーンの色と幾何学的性質だけでなく、ポイントごとのセマンティクスをキャプチャする。
動的3Dシーンの外観と意味を統一した3D表現であるDGDを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:52:22 GMT)
Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models [14.5] 信頼性・確率アライメントの概念を紹介します。
モデルの内部と信頼感の一致を調査する。
分析したモデルのうち、OpenAIのGPT-4は信頼性と信頼性のアライメントが最強であった。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:05:16 GMT)
Look Once to Hear: Target Speech Hearing with Noisy Examples [14.4] 混み合った環境では、人間の脳はターゲット話者からのスピーチに集中することができる。
本稿では,この能力を実現するための新しいインテリジェントな聴取システムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:00:39 GMT)
A Declarative System for Optimizing AI Workloads [14.3] Palimpzestは、宣言型言語で定義することで、誰でもAIによる分析クエリを処理できるシステムである。
本稿では,AIを利用した分析タスクの作業負荷,Palimpzestが使用している最適化手法,プロトタイプシステム自体について述べる。
我々の単純なプロトタイプでさえ、ベースライン方式よりも3.3倍速く2.9倍安いものを含む、魅力的なプランを提供している。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:27:07 GMT)
Sketch-Guided Constrained Decoding for Boosting Blackbox Large Language Models without Logit Access [14.3] 我々は,ブラックボックス大言語モデル(LLM)の制約付き復号法として,スケッチガイド付き制約付き復号法(SGCD)を導入する。
SGCDはブラックボックスLSMのロジットにアクセスすることなく動作する。
閉情報抽出および選挙区解析における実験によるSGCDの有効性を実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:23:39 GMT)
ParFam -- (Neural Guided) Symbolic Regression Based on Continuous Global Optimization [14.1] 我々は、離散的記号回帰問題を連続的な問題に変換するために、新しいアプローチであるParFamを提案する。
グローバルな手法と組み合わせることで、SRの問題に対処する非常に効果的な手法がもたらされる。
また、ParFamをガイドするために、事前訓練されたトランスフォーマーネットワークDL-ParFamを組み込んだ拡張も提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:41:47 GMT)
SemGauss-SLAM: Dense Semantic Gaussian Splatting SLAM [14.1] 本稿では,SemGauss-SLAMを提案する。SemGauss-SLAMは,高精度な3次元セマンティックマッピング,ロバストなカメラトラッキング,高品質なレンダリングを実現する。
セマンティックな特徴を3次元ガウス表現に組み込んで,環境の空間的レイアウト内で意味情報を効果的にエンコードする。
トラッキングにおける累積ドリフトの低減とセマンティック再構築の精度向上のために,セマンティックインフォームドバンドル調整を導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:10:36 GMT)
Understanding LLMs Requires More Than Statistical Generalization [14.1] LLMの望ましい性質のいくつかは、良い統計一般化の結果ではないと論じる。
我々の中心的な議論は、AR確率モデルは本質的には識別できないという観察に依存している。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:22:26 GMT)
WLC-Net: a robust and fast deep-learning wood-leaf classification method [14.0] Wood-Leaf Classification Network (WLC-Net)は、PointNet++から派生したディープラーニングモデルである。
WLC-Netは、線形性を固有の特徴として取り入れることで、分類精度、完全性、速度を向上させる。
WLC-Netは優れた性能を示し、OAスコアは0.9778、0.9712、0.9508、mIoUスコアは0.9761、0.9693、0.9141、F1スコアは0.8628、0.7938、0.9019となった。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:39:23 GMT)
Active Statistical Inference [14.0] 方法論は、どのデータポイントがラベルにとって最も有益かを特定するために、機械学習モデルを使用する。
既存のベースラインよりもはるかに少ないサンプルで、同じレベルの精度を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:20:54 GMT)
A Causal Framework for Evaluating Deferring Systems [13.9] 我々は、遅延戦略が因果レンズによるシステム精度に与える影響を評価する。
これにより,遅延戦略の因果的影響が予測精度に与える影響を明らかにすることができる。
文献からの7つの遅延システムの合成および実データに対するアプローチを実証的に評価した。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:03:44 GMT)
Evaluating Zero-Shot GPT-4V Performance on 3D Visual Question Answering Benchmarks [13.9] 基礎モデルのゼロショット性能を3次元VQAベンチマークで評価した。
我々は,GPTをベースとしたエージェントが,クローズドボキャブラリのアプローチと同等に機能することを発見した。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:20:28 GMT)
Going Beyond Word Matching: Syntax Improves In-context Example Selection for Machine Translation [13.9] In-context Learning (ICL) は、大規模言語モデル(LLM)の時代におけるトレンドの促進戦略である。
機械翻訳(MT)のテキスト内サンプル選択は、表面的な単語レベルの特徴に重点を置いている。
本稿では,依存木間の構文的類似性を計算し,構文に基づくMTの例選択手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:51:24 GMT)
Federated Continual Learning Goes Online: Leveraging Uncertainty for Modality-Agnostic Class-Incremental Learning [13.9] 我々は,1回しか処理できないミニバッチのストリームに新しいデータが到着するオンラインシナリオに対処する,新しいモダリティに依存しないアプローチを提案する。
特に,Bregman Information (BI) に基づく推定器を用いて,サンプルレベルでのモデルの分散を計算することを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:29:39 GMT)
Does learning the right latent variables necessarily improve in-context learning? [13.8] Transformersのような大規模な自己回帰モデルは、新しい重みを学習することなく、コンテキスト内学習(ICL)によってタスクを解決できる。
本稿では,タスクラテントを明示的に推論する効果について検討する。
タスク関連潜伏変数への偏りは、分配性能を向上させるには至らない。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:06:10 GMT)
Symmetric Reinforcement Learning Loss for Robust Learning on Diverse Tasks and Model Scales [13.8] 強化学習(RL)トレーニングは、移動目標や高勾配分散などの要因により本質的に不安定である。
本研究では,雑音データに対する教師付き学習から逆クロスエントロピー(RCE)を適用し,対称的なRL損失を定義することにより,RLトレーニングの安定性を向上させる。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:19:00 GMT)
Efficient Optimal Control of Open Quantum Systems [13.5] 開量子系に対する最適制御問題は、時間依存のリンドブレディアンとして定式化することができる。
本稿では,この最適制御問題を効率的に解くアルゴリズムを提案する。
私たちのアルゴリズムは、量子と古典の両方のコンポーネントからなるハイブリッドです。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:26:57 GMT)
Spectral-Risk Safe Reinforcement Learning with Convergence Guarantees [13.5] 本稿では、スペクトルリスク尺度制約付きRLアルゴリズム、スペクトルリスク制約付きポリシー最適化(SRCPO)を提案する。
双レベル最適化構造では、外部問題はリスク測度から導出される双対変数を最適化することであり、内部問題は最適ポリシーを見つけることである。
提案手法は連続制御タスク上で評価され,制約を満たす他のRCRLアルゴリズムの中で最高の性能を示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:17:25 GMT)
Poseidon: Efficient Foundation Models for PDEs [13.4] PoseidonはPDEのソリューション演算子を学ぶための基礎モデルである。
流体力学の制御方程式のデータセット上で事前訓練される。
その後、ダウンストリームタスクに挑戦する15のスイートで評価される。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:06:51 GMT)
Efficient Model-agnostic Alignment via Bayesian Persuasion [13.4] 本稿では,モデル非依存かつ軽量なベイズ型説得アライメントフレームワークを提案する。
説得プロセスでは、小さなモデル(アドバイザ)が情報項目(すなわち状態)を観察し、大きなモデル(Receiver)を説得して、改善された応答を引き出す。
GPT-2は様々なモデルの性能を大幅に向上させ,数学的推論能力の平均16.1%,コード生成能力は13.7%向上した。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:57:07 GMT)
Enabling Visual Recognition at Radio Frequency [13.4] PanoRadarは、RF分解能をLiDARに近づける新しいRFイメージングシステムである。
結果は、初めて、無線周波数での様々な視覚的認識タスクを可能にします。
以上の結果から,パノラダルの12棟の建物における堅牢な性能が示された。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:52:59 GMT)
Deconstructing In-Context Learning: Understanding Prompts via Corruption [13.4] プロンプト全体を4つのコンポーネント(タスク記述、デモインプット、ラベル、インラインインストラクション)に分解する。
分類と生成タスクをカバーする10のデータセットを用いて,1.5Bから70Bのモデルについて検討した。
プロンプト内の繰り返しテキストはモデル性能を向上し、より大きなモデルはプロンプトのセマンティクスに敏感であることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:12:37 GMT)
Optimizing Foundation Model Inference on a Many-tiny-core Open-source RISC-V Platform [13.3] 本稿では,オープンソースのマルチティニーコアRISC-Vプラットフォーム上で,トランスフォーマーモデルの最初のエンドツーエンド推論結果を示す。
エンコーダのみのモデルでは、最も最適化された実装とベースラインバージョンの間の最大12.8倍のスピードアップを示す。
デコーダのみのトポロジでは、非自己回帰(NAR)モードで16.1倍、オート回帰(AR)モードで最大35.6倍のスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:16:59 GMT)
Resurrecting Old Classes with New Data for Exemplar-Free Continual Learning [13.3] 継続的な学習方法は破滅的な忘れ込みに苦しむことが知られている。
既存のexemplar-freeメソッドは、通常、最初のタスクがその後のタスクよりもかなり大きい設定で評価される。
本稿では, 従来のモデル埋め込み空間において, 組込みが旧型プロトタイプに近いように, 現在のサンプルを逆向きに摂動させることを提案する。
次に,従来のモデルから新しいモデルへの埋め込み空間のドリフトを摂動画像を用いて推定し,それに応じてプロトタイプを補償する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:31:42 GMT)
Robust Optimization in Protein Fitness Landscapes Using Reinforcement Learning in Latent Space [13.2] 大規模タンパク質言語モデルを利用したエンコーダデコーダで学習した潜在空間を効率的にトラバースする最適化手法であるLatProtRLを提案する。
局所最適化を回避すべく, 遅延空間で直接作用する強化学習を用いてマルコフ決定過程をモデル化した。
この結果とin vitroでの評価は, 生成配列が高適合領域に到達できることを示し, ラボイン・ザ・ループシナリオにおけるLatProtRLの有意な可能性を示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:03:42 GMT)
Diffusion Policy Attacker: Crafting Adversarial Attacks for Diffusion-based Policies [13.2] 拡散モデル(DM)は行動クローニング(BC)の有望なアプローチとして登場した。
政策創出の基盤としてDPの採用が増加しているにもかかわらず、安全の重大な問題は未解決のままである。
本稿では,DP-Attackerを提案する。DP-Attackerは,全てのシナリオにまたがる効果的な敵攻撃を実現するアルゴリズムである。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:06:25 GMT)
Content-Agnostic Moderation for Stance-Neutral Recommendation [13.2] コンテンツに依存しないモデレーションは、実際のコンテンツが適格化されることに頼らない。
本稿では,コンテンツ機能に頼らずに,コンテンツレコメンデータからのリコメンデーションを変更する2つの新しいコンテンツ非依存モデレーション手法を提案する。
この結果から,直接コンテンツ情報なしでのスタンス中立性の実現は実現可能であるだけでなく,ユーザのエンゲージメントを著しく低下させることなく,よりバランスのとれた情報的レコメンデーションシステムを開発する上でも有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:50:39 GMT)
Dynamic Matching Bandit For Two-Sided Online Markets [13.2] 両面のオンラインマッチングプラットフォームは、様々な市場で採用されている。
現在の市場でのエージェントの好みは通常暗黙的で不明である。
本稿では,この動的オンラインマッチング問題に対して,文脈情報を用いた新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:12:01 GMT)
Single Image Unlearning: Efficient Machine Unlearning in Multimodal Large Language Models [13.1] 本稿では,概念の視覚的認識を数ステップで微調整することで,概念の視覚的認識を解き放つための効率的な手法であるSingle Image Unlearning(SIU)を提案する。
MMUBench の実験結果から,SIU は既存手法の性能を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:27:38 GMT)
Two-sided Competing Matching Recommendation Markets With Quota and Complementary Preferences Constraints [13.1] 本稿では,両面のオンラインマッチング市場において,補完的な嗜好とクォータ制約を伴う問題に対処する新しい推奨アルゴリズムを提案する。
混合クォータと相補的な選好制約の存在は、マッチングプロセスの不安定性を引き起こす。
バンドレート学習の枠組みとしてこの問題を定式化し,マルチエージェント多型トンプソンサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:13:05 GMT)
AnoVox: A Benchmark for Multimodal Anomaly Detection in Autonomous Driving [13.0] AnoVoxは、コンテンツと時間的異常の両方を含む最初のベンチマークである。
正規性の形式的定義を提案し,従順なトレーニングデータセットを提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:45:27 GMT)
HFGS: 4D Gaussian Splatting with Emphasis on Spatial and Temporal High-Frequency Components for Endoscopic Scene Reconstruction [13.0] ロボット支援による最小侵襲手術は、手術結果を改善するため、動的シーン再構築の強化による恩恵を受ける。
NeRFはシーン再構成に有効だが、推論速度の遅さとトレーニング期間の長いため適用性が制限されている。
3D Gaussian Splatting (3D-GS) ベースの手法が最近のトレンドとして現れ、高速な推論機能と優れた3D品質を提供する。
空間的および時間的周波数の観点からこれらの課題に対処する,変形可能な内視鏡再建のための新しいアプローチであるHFGSを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:17:35 GMT)
PanoNormal: Monocular Indoor 360° Surface Normal Estimation [13.0] textitPanoNormalは、360deg画像用に設計された単分子表面正規推定アーキテクチャである。
球面特徴分布を考慮した多レベルグローバル自己注意方式を用いる。
提案手法は,複数の一般的な360deg単分子データセットにまたがって,最先端の性能を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:07:14 GMT)
3D Reconstruction with Fast Dipole Sums [12.9] マルチビュー画像から高忠実度表面を再構成する手法を提案する。
本手法では,点雲内の点当たりの属性を任意のものにするために,巻線数を一般化する双極子和という新しい点ベース表現を用いる。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:35:22 GMT)
Matrix Information Theory for Self-Supervised Learning [12.7] 本稿では,最大エントロピー符号化損失を行列均一性損失として解釈する新しい手法であるMatrix-SSLを紹介する。
実験の結果、Matrix-SSLはImageNetデータセットの最先端メソッドよりも優れています。
また,行列クロスエントロピー損失を用いた7Bモデルを微調整することにより,表現学習を言語モデリングシステムに導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:26:58 GMT)
Information Flow in Self-Supervised Learning [12.7] 本稿では,行列ベースのエントロピー推定を正規化器として活用し,U-MAEを特別に仮定する新しい手法であるマトリックス変量マスク付きオートエンコーダ(M-MAE)を紹介する。
実験による評価は、線形探傷型ViT-Baseの3.9%の改善、微調整型ViT-Largeの1%の改善など、最先端の手法と比較して、M-MAEの有効性を裏付けるものである。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:28:38 GMT)
Robust Emotion Recognition in Context Debiasing [12.5] 文脈認識型感情認識(CAER)は、近年、制約のない環境における感情コンピューティング技術の実践的応用を高めている。
進歩にもかかわらず、最大の課題は、コンテキストバイアスの干渉によるものである。
本稿では,このような問題に対処する対実的感情推定(CLEF)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:07:14 GMT)
Continuously Optimizing Radar Placement with Model Predictive Path Integrals [12.4] センサー配置の連続最適化は、様々な軍事・民間用途における正確な目標位置決めに不可欠である。
レーダパラメータとレーダ目標距離を組み込んだレンジ計測モデルを用いる。
我々は、時間とともにレーダーと目標の進化する幾何学を可視化し、最も高い測定情報を得る領域をハイライトする。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:25:53 GMT)
Brainformer: Mimic Human Visual Brain Functions to Machine Vision Models via fMRI [12.2] 本稿では,人間の知覚システムにおけるfMRIパターンを解析するためのBrainformerという新しいフレームワークを紹介する。
この研究は、人間の知覚からニューラルネットワークへ知識を伝達する先進的なアプローチを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:34:59 GMT)
Neural Radiance Fields for Novel View Synthesis in Monocular Gastroscopy [12.1] 我々は、新しい視点に向けた光現実画像のための単眼胃内視鏡データに、新しい放射能神経場(NeRF)の手法を適用した。
単分子ガストロスコープの局所領域における視差による性能劣化に対処するため, 予め再構成した点雲からの幾何学的先行点をNeRFのトレーニングに組み込む。
近年のNeRF法と比較すると,胃内の新しい視点からの高忠実度画像のレンダリングは質的かつ定量的に行われている。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:25:04 GMT)
Benchmarking and Improving Detail Image Caption [12.1] 視覚言語モデル (LVLM) は視覚理解の基本的な課題とされてきた。
本稿では,人間専門家が注釈付けした高品質な評価データセットをキュレートすることで,詳細な画像キャプションタスクのベンチマークを行う。
また、CAPTUREと呼ばれるより信頼性の高いキャプション評価指標も設計する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:54:12 GMT)
Multimodal Unsupervised Domain Generalization by Retrieving Across the Modality Gap [12.0] 教師なし領域一般化問題のマルチモーダル版に取り組む。
我々のフレームワークは、ソースデータセットを共同視覚言語空間で正確かつ効率的に検索できるという前提に依存している。
我々は,テキストクエリと粗い量子化に使用される画像セントロイドとの距離が大きいため,近接した近接探索が低リコールに悩まされていることを理論的に示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:56:14 GMT)
Insights from the Design Space Exploration of Flow-Guided Nanoscale Localization [11.8] Terahertz(THz)をベースとした無線通信機能を備えたナノデバイスは、ヒトの血流内におけるフロー誘導局在のプライマーを提供する。
フロー誘導型ローカライゼーションはまだ初歩的な段階であり、この問題を対象とする研究はごくわずかである。
我々は,一組の異種性能指標を用いて,最先端のフロー誘導型ローカライズ手法の性能評価を行った。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:05:27 GMT)
Pretrained Mobility Transformer: A Foundation Model for Human Mobility [11.7] textbfPretrained textbfMobility textbfTransformer (PMT)
textbfMobility textbfTransformer (PMT)
textbfPretrained textbfMobility textbfTransformer (PMT)
論文参考訳(メタデータ) (Wed, 29 May 2024 00:07:22 GMT)
Application based Evaluation of an Efficient Spike-Encoder, "Spiketrum" [11.6] スパイクベースのエンコーダは、情報をスパイクまたはパルスのシーケンスとして表現し、ニューロン間で伝達される。
Spiketrumエンコーダはスパイクトレインまたはコードセットを使用して入力データを効率よく圧縮する。
この論文は、Spketrumハードウェアとそのソフトウェアの両方を、最先端で生物学的に証明可能なエンコーダに対して広範囲にベンチマークしている。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:05:40 GMT)
EasyAnimate: A High-Performance Long Video Generation Method based on Transformer Architecture [11.6] EasyAnimateは、高性能な結果を得るためにトランスフォーマーアーキテクチャのパワーを利用する、ビデオ生成の先進的な方法である。
動作モジュールブロックを組み込んで,3次元映像生成の複雑さに対応するために,当初2次元画像合成用に設計されたDiTフレームワークを拡張した。
我々は、データ前処理、VAEトレーニング、DiTモデルトレーニング、エンドツーエンドのビデオ推論といった側面を含む、DiTに基づくビデオ制作のための総合的なエコシステムを提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:11:07 GMT)
BRACTIVE: A Brain Activation Approach to Human Visual Brain Learning [11.5] 本稿では,脳活動ネットワーク(BRACTIVE)について紹介する。
BRACTIVEの主な目的は、被験者の視覚的特徴をfMRI信号を介して対応する脳表現と整合させることである。
実験の結果, BRACTIVEは顔や身体選択領域など, 個人特有の関心領域を効果的に識別できることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:50:13 GMT)
Generalization Study of Quantum Neural Network [11.5] 一般化はニューラルネットワークの重要な特徴であり、それについて多くの研究がなされている。
量子ゲートによって構築された量子ニューラルネットワークのクラスについて検討した。
我々のモデルは、同じ構造を持つ古典的ニューラルネットワークよりも優れた一般化を持つ。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:43:08 GMT)
xTern: Energy-Efficient Ternary Neural Network Inference on RISC-V-Based Edge Systems [11.5] 3次ニューラルネットワーク(TNN)は、バイナリニューラルネットワークに比べて精度とエネルギーのトレードオフが優れている。
汎用コア上でのTNN推論の高速化を目的としたRISC-V命令セットアーキテクチャの軽量拡張であるxTernを提案する。
以上の結果から,XTernはRISC-Vベースの超低消費電力エッジAIプラットフォームを,TNNの効率性の恩恵を受けることができることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:16:46 GMT)
Node Injection Attack Based on Label Propagation Against Graph Neural Network [11.4] グラフニューラルネットワーク(GNN)は,ノード分類,リンク予測,グラフ分類など,さまざまなグラフ学習タスクにおいて顕著な成功を収めている。
攻撃者は偽ノードを注入することで容易に集約プロセスを摂動でき、グラフインジェクション攻撃に対してGNNが脆弱であることを明らかにする。
本稿では,ノード分類タスクに対してグラフインジェクション攻撃を行うラベルプロパゲーションベースグローバルインジェクションアタック(LPGIA)を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:09:16 GMT)
On Efficient and Statistical Quality Estimation for Data Annotation [11.2] アノテーション付きデータセットは、教師付き機械学習モデルをトレーニング、評価、比較、生産化するための重要な要素である。
品質評価は、専門家が手動でインスタンスを正しくも正しくもラベル付けすることで行われることが多い。
しかし、小さなサンプルサイズに基づく推定は、誤り率の不正確な値につながる可能性がある。
また, 受入サンプリングは, 同じ統計的保証を提供しながら, 必要なサンプルサイズを最大50%削減できることを示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:43:37 GMT)
Nesting Particle Filters for Experimental Design in Dynamical Systems [11.2] 最適設計を推論するネスト型シーケンシャルモンテカルロ法を開発し,それを粒子マルコフ連鎖モンテカルロフレームワークに埋め込み,勾配に基づくポリシー補正を行う。
提案手法は, コントラスト推定器に頼らないため, 他のアモータイズされた実験設計手法と異なる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:15:40 GMT)
Exact finite-time correlation functions for multi-terminal setups: Connecting theoretical frameworks for quantum transport and thermodynamics [11.1] オープン量子系の輸送は、量子マスター方程式、散乱行列、ハイゼンベルク運動方程式など、様々な理論的な枠組みを通して探索することができる。
既存の文献はこれらのアプローチを独立に扱い、統一された視点を欠いている。
本研究は,最小の単一レベル量子ドットモデルを用いて,これらのアプローチの役割と現状を明らかにすることで,このギャップに対処する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:32:54 GMT)
FedMAP: Unlocking Potential in Personalized Federated Learning through Bi-Level MAP Optimization [11.0] フェデレートラーニング(FL)は、分散データに基づく機械学習モデルの協調トレーニングを可能にする。
クライアント間でのデータはしばしば、クラス不均衡、特徴分散スキュー、サンプルサイズ不均衡、その他の現象によって大きく異なる。
本稿では,バイレベル最適化を用いた新しいベイズPFLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:28:06 GMT)
Optimizing Vehicular Networks with Variational Quantum Circuits-based Reinforcement Learning [11.0] 可変量子回路(VQC)を用いた多目的強化学習(MORL)フレームワークを開発し、車載ネットワーク(VNet)における効率的なネットワーク選択と自律運転ポリシーを特徴付ける。
従来のディープQネットワーク(DQN)と比較して,コンバージェンス率と報酬の両面で顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:57:25 GMT)
Quantum Algorithms for tensor-SVD [11.0] 我々は2つの新しい量子t-SVD (tensor-SVD)アルゴリズムを導入する。
第一のアルゴリズムは、主にコンテキスト認識レコメンデーションシステムのための量子t-SVDアルゴリズムを提案する以前の研究に基づいている。
第二のアルゴリズムは、主に既知の変分量子SVDアルゴリズムに基づくハイブリッド変分法を用いる。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:01:11 GMT)
Posterior Sampling via Autoregressive Generation [10.9] 本稿では,大規模な履歴データから帯域幅アルゴリズムを学習するための新しいフレームワークを提案する。
我々は、過去のデータを用いて自己回帰モデルを事前訓練し、繰り返しのフィードバック/リワードのシーケンスを予測する。
意思決定時には、各アクションに対して想像された報酬の列を自動で(インプット)サンプリングし、最大平均的な報酬でアクションを選択する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:24:44 GMT)
Why Can Large Language Models Generate Correct Chain-of-Thoughts? [10.9] 自然言語生成に適した2階層階層型グラフィカルモデルを提案する。
我々は、LLM生成した思考の連鎖の可能性を測る魅力的な幾何学的収束率を確立する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:23:59 GMT)
From One to Many: Expanding the Scope of Toxicity Mitigation in Language Models [10.8] 言語モデルが多言語機能を取り入れているため、私たちの安全対策はペースを保ちます。
言語間で十分なアノテートされたデータセットがないため、私たちは翻訳データを用いて緩和手法を評価し、強化する。
これにより,翻訳品質と言語間移動が毒性軽減に及ぼす影響を検討することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:28:13 GMT)
Self-Pro: Self-Prompt and Tuning Framework for Graph Neural Networks [10.8] Self-Promptは、モデルとデータ自体に基づいたグラフのプロンプトフレームワークである。
ヘテロフィリーに対処する前提として、まず非対称グラフコントラスト学習を導入する。
次に,プリトレーニングをセルフアダプタとして再利用し,タスク適応のためのグラフ自体に基づいたセルフプロンプトを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:41:23 GMT)
AutoCV: Empowering Reasoning with Automated Process Labeling via Confidence Variation [10.7] 我々は,textbfConfidence textbfVariation (textbftextscAutoCV) を用いた textbf Automated Process Labeling という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:47:35 GMT)
Fairness-aware Federated Minimax Optimization with Convergence Guarantee [10.7] フェデレートラーニング(FL)はそのプライバシー保護機能のためにかなりの注目を集めている。
ユーザデータ管理の自由の欠如は、モデルが人種や性別などのセンシティブな要因に偏っている、グループフェアネスの問題につながる可能性がある。
本稿では,FLにおけるグループフェアネス問題に明示的に対処するために,拡張ラグランジアン法(FFALM)を用いたフェアフェデレーション平均化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:58:59 GMT)
Approximate Thompson Sampling for Learning Linear Quadratic Regulators with $O(\sqrt{T})$ Regret [10.5] 本稿では,線形二次レギュレータ(LQR)を改良したベイズ的残差値$O(sqrtT)$で学習する近似トンプソンサンプリングアルゴリズムを提案する。
励振信号は、プレコンディショナーの最小固有値を時間とともに増加させ、近似した後方サンプリングプロセスを加速させることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:24:56 GMT)
Adaptive Generalized Neyman Allocation: Local Asymptotic Minimax Optimal Best Arm Identification [10.5] 本研究は、固定予算ベストアーム識別(BAI)のための局所的ミニマックス最適戦略について検討する。
最強の腕を誤識別する確率の最悪の上限は、小ギャップ体制下での最悪の下限と一致していることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:43:13 GMT)
MRCpy: A Library for Minimax Risk Classifiers [10.4] PythonライブラリであるMRCpyは、ロバストリスク最小化(RRM)アプローチに基づいて、ミニマックスリスク分類器(MRC)を実装している。
MRCpyは、Scikit-learnのような人気のあるPythonライブラリの標準に従い、可読性と使いやすさと、他のライブラリとのシームレスな統合を容易にする。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:51:15 GMT)
GLANCE: Global Actions in a Nutshell for Counterfactual Explainability [10.3] 我々は,グローバル・カウンティファクトを識別する問題を簡潔に定式化する。
我々は,グローバルな対物発見の課題に対処するために,革新的なアルゴリズムを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:24:25 GMT)
ConceptPrune: Concept Editing in Diffusion Models via Skilled Neuron Pruning [10.2] 大規模テキスト・画像拡散モデルでは、印象的な画像生成能力が示されている。
提案するConceptPruneでは,まず,望ましくない概念を生成するための事前学習モデル内の重要な領域を同定する。
芸術的スタイル、ヌード性、オブジェクトの消去、ジェンダーのデバイアスなど、さまざまな概念に対する実験は、ターゲットのコンセプトをごくわずかに刈って効率よく消去できることを実証している。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:19:37 GMT)
Video Anomaly Detection in 10 Years: A Survey and Outlook [10.1] ビデオ異常検出(VAD)は、監視、医療、環境監視といった様々な領域において非常に重要である。
この調査では、従来の教師付きトレーニングパラダイムを超えて、弱教師付き、自己監督型、教師なしのアプローチを包含する、ディープラーニングベースのVADを調査している。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:56:31 GMT)
HetCAN: A Heterogeneous Graph Cascade Attention Network with Dual-Level Awareness [10.1] 複数のカスケードブロックからなる新規な異種グラフカスケード注意ネットワーク(HetCAN)を提案する。
具体的には、タイプ認識エンコーダはノード型情報の損失を補償する。
次元認識エンコーダは、ノード特徴間の相互作用をキャプチャすることで、特徴レベルの高次情報を学ぶことができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:43:56 GMT)
HawkVision: Low-Latency Modeless Edge AI Serving [10.1] 視覚DNNの低遅延モードレスサービスを提供するHawkVisionを提案する。
HawkVisionは、現在のサービスシステムにおいて、モードレスサービスを提供するためにP99レイテンシで1.6倍の性能を発揮する。
FPGAの試作機は、消費電力を最大3.34倍に抑えながら、一定の精度で同様の性能を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:56:33 GMT)
Universal generalization guarantees for Wasserstein distributionally robust models [10.0] 本稿では,非滑らかな解析理論と古典的な集中結果を組み合わせた新しい証明手法を提案する。
我々のアプローチは、(二重)正則化を含む分布的に頑健な問題を最近のワッサーシュタイン/シンクホーンに拡張するのに十分である。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:55:20 GMT)
SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks [10.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて非常に効果的であることが証明されている。
既存の手法はしばしば、実質的なエンドツーエンドのLLM推論スピードアップを達成するのに苦労する。
SLEBは、冗長なトランスフォーマーブロックを排除し、LCMを合理化するための新しいアプローチである。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:53:16 GMT)
Cascade of phase transitions in the training of Energy-based models [9.9] 原型エネルギーベース生成モデルBernoulli-Bernoulli RBMの特徴符号化過程について検討した。
本研究は、その特異値分解によるモデルの重み行列の進化をトラックする。
我々はBernoulli-Bernoulli RBMを実データ集合上でトレーニングすることで理論的結果を検証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:18:03 GMT)
cryoSPHERE: Single-particle heterogeneous reconstruction from cryo EM [9.9] 単一粒子低温電子顕微鏡(cryo EM)は、与えられたタンパク質の多数の画像を取得する強力なツールである。
本稿では,タンパク質構造を入力とする深層学習手法であるCryoSPHEREを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:12:19 GMT)
Towards Standardizing AI Bias Exploration [9.9] 本稿では,構造ブロックに偏りを測定する数学的枠組みを提案する。
このフレームワークが既存の概念をどのように一般化し、頻繁に使用されるブロックを提示するかを示す。
当社はFairBenchというPythonライブラリとして,フレームワークのオープンソース実装を提供しています。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:03:45 GMT)
Quantum accelerated cross regression algorithm for multiview feature extraction [9.7] マルチビュー特徴抽出(MvFE)は、機械学習、画像処理、その他の分野に広く応用されている。
この課題に対処するために、MvFEのための量子加速クロスレグレッションアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:45:06 GMT)
Synthetic Potential Outcomes for Mixtures of Treatment Effects [9.6] 異種データセットに対する「合成ポテンシャル結果」(SPO)を提案する。
我々の新しいアプローチは、MTEの識別可能性も保証しながら、異種性を分解する。
合成データに対するSPOの有効性を実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:05:57 GMT)
Using Contrastive Learning with Generative Similarity to Learn Spaces that Capture Human Inductive Biases [9.6] 人間は、少数の例から学び、感覚データから有用な情報を抽象化するために、強い帰納バイアスに頼る。
本稿では, 2つのデータポイントが同一分布からサンプリングされた場合, 2つのデータポイントが類似していると考えられる生成的類似性の概念を提案する。
生成的類似性は、その正確な形が難解である場合でも、対照的な学習目標を定義するのに有効であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:01:58 GMT)
Ground state phases of the two-dimension electron gas with a unified variational approach [9.6] 2DEGの基底状態の現在の理解は量子モンテカルロ計算に依存している。
我々は, メッセージパス型ニューラル量子状態アーキテクチャを用いた一般的な逆流型波動関数である単一変分アンサッツを用いて, 密度範囲全体の統一的な記述を行う。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:00:01 GMT)
Blind Data Adaptation to tackle Covariate Shift in Operational Steganalysis [9.6] Image Steganographyにより、個人は疑念を喚起することなく、デジタル画像に違法な情報を隠すことができる。
内因性コミュニケーションのための操作画像の検出を可能にする効果的なステガナリシス法を開発することが重要である。
ステガナリシスにおける特定の目標に沿ったソースをエミュレートする新しい手法であるTADを開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:47:30 GMT)
VBIM-Net: Variational Born Iterative Network for Inverse Scattering Problems [9.5] フルウェーブISPを解くために,新しい変分ボルン・イテレーティブ・ネットワーク,すなわちV BIM-Netを提案する。
提案したV BIM-Netは変動ボルン反復法における全電界とコントラストの交互更新をエミュレートする。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:21:09 GMT)
Adapting Differentially Private Synthetic Data to Relational Databases [9.5] 我々は、既存の差分秘密(DP)合成データ生成機構と組み合わせることができる、第一種アルゴリズムを導入する。
我々のアルゴリズムは、個々の合成テーブル間の関係を反復的に洗練し、近似誤差を最小化する。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:25:07 GMT)
Vim-F: Visual State Space Model Benefiting from Learning in the Frequency Domain [9.5] Mambaディープラーニングモデルとして知られる、効率的なハードウェア対応設計のステートスペースモデル(SSM)は、長いシーケンスのモデリングにおいて大きな進歩を遂げた。
周波数領域と空間領域の両方で純粋なマンバエンコーダとスキャンを利用するVim-Fと呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:01:19 GMT)
EventZoom: A Progressive Approach to Event-Based Data Augmentation for Enhanced Neuromorphic Vision [9.4] イベントデータは、動的およびリアルタイムシナリオにおけるその効率を示す、視覚的処理に対するユニークなアプローチを提供する。
高時間分解能や低エネルギー消費といったアドバンテージにもかかわらず、イベントデータの適用は、データセットのサイズと多様性の制限による課題に直面している。
イベントデータ用に特別に設計されたデータ拡張戦略であるEventZoomを開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:39:31 GMT)
GradSafe: Detecting Jailbreak Prompts for LLMs via Safety-Critical Gradient Analysis [9.2] LLMにおける安全クリティカルパラメータの勾配を精査し,脱獄プロンプトを効果的に検出するGradSafeを提案する。
LLMのジェイルブレイクに対する損失の勾配は、コンプライアンス応答と組み合わせることで、特定の安全クリティカルパラメータに類似したパターンを示す。
GradSafeはLlama Guardよりも優れていますが、大きなデータセットで微調整されています。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:45:35 GMT)
Security--Throughput Tradeoff of Nakamoto Consensus under Bandwidth Constraints [9.2] 中本氏の私的攻撃はもはや最悪の攻撃ではなく、ティースティング戦略と呼ばれる新たな攻撃戦略がひどく悪化していることを示す。
PoSでは、同化ブロックは、非常に低いブロック生成率を除いて、従来のPoS Nakamotoコンセンサスプロトコルの安全性を損なうため、混雑を悪化させる可能性がある。
我々は、Blanking NC (BlaNC) と呼ぶPoS NCプロトコルの変種を提示し、PoW NCと同じレジリエンスを実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:21:06 GMT)
Critical Learning Periods: Leveraging Early Training Dynamics for Efficient Data Pruning [9.1] CAT(Checkpoints Across Time)と呼ばれる新しいデータ解析手法を提案する。
我々は、COMET-QE、LASER、LaBSEなど、いくつかのデータプルーニング技術に対してCATをベンチマークする。
英語-ドイツ語、英語-フランス語、英語-スワヒリ翻訳タスクに適用すると、CATは完全なデータセットと同等のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:21:49 GMT)
Evolving Reliable Differentiating Constraints for the Chance-constrained Maximum Coverage Problem [9.0] 確率制約付きグラフにおける古典的最大カバレッジ問題について検討する。
我々のゴールは、アルゴリズムの性能が著しく異なるグラフに対する信頼性の高い確率制約設定を進化させることである。
本研究では、2つの探索アルゴリズムの性能を高い信頼性で区別する確率制約セットを提供する進化的アルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:22:31 GMT)
Linear bandits with polylogarithmic minimax regret [9.0] 本研究では,未知ベクトルに近づいた単位球上での動作を選択すると,サブガウス雑音パラメータが線形に消滅する線形帯域の雑音モデルについて検討する。
我々は,この問題に対するアルゴリズムを導入し,この最小限の後悔のスケーリングを,時間軸で$log3(T)$,時間軸で$T$として示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:58:25 GMT)
I Bet You Did Not Mean That: Testing Semantic Importance via Betting [8.9] 我々は、不透明モデルの予測に対する意味論的概念のグローバル(すなわち人口以上)と局所(すなわちサンプル)の統計的重要性を定式化する。
我々は最近のシーケンシャルカーネルテスト(SKIT)の考え方を用いて、概念間の重要度を誘導し、我々のフレームワークの有効性と柔軟性を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:51:41 GMT)
On the Error-Propagation of Inexact Hotelling's Deflation for Principal Component Analysis [8.8] 本稿では,不正確なHotellingのデフレ手法の誤差伝搬を数学的に特徴づける。
エラーがどのように進行し、その後の主成分推定に影響を及ぼすかを明確に特徴づける。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:17:24 GMT)
Weak Generative Sampler to Efficiently Sample Invariant Distribution of Stochastic Differential Equation [8.7] 現在のディープラーニングに基づく手法は、定常フォッカー-プランク方程式を解き、ディープニューラルネットワークの形で不変確率密度関数を決定する。
本稿では, 弱い生成サンプル(WGS)を用いて, 独立かつ同一に分布したサンプルを直接生成するフレームワークを提案する。
提案した損失関数はFokker-Planck方程式の弱い形式に基づいており、正規化フローを統合して不変分布を特徴づける。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:41:42 GMT)
Boosting Flow-based Generative Super-Resolution Models via Learned Prior [8.6] フローベース超解像(SR)モデルは、高品質な画像を生成する際に驚くべき能力を示した。
これらの手法は、グリッドアーティファクト、爆発する逆数、固定サンプリング温度による最適以下の結果など、画像生成中にいくつかの課題に遭遇する。
本研究では、フローベースSRモデルの推論フェーズ前に学習した条件を導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:12:58 GMT)
Neural Isometries: Taming Transformations for Equivariant ML [8.2] 本稿では,観測空間を汎用潜在空間にマップする方法を学習する自動エンコーダフレームワークであるNeural Isometriesを紹介する。
トレーニング済みの潜伏空間で動作する単純なオフ・ザ・シェルフ同変ネットワークは、巧妙に設計された手作りのネットワークと同等の結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:24:25 GMT)
DFAMiner: Mining minimal separating DFAs from labelled samples [8.2] DFAMinerは、ラベル付きサンプルから最小限の決定論的有限オートマトン(DFA)を分離するパッシブ学習ツールである。
まず,ラベル付きサンプルの集合から3値のDFAを漸進的に構築する,単純で線形時間アルゴリズムを提案する。
そこで我々は,SAT問題を最小化して構築したオートマトンを最小化することにより,ラベル付きサンプルの最小分離DFAをマイニングするツールを開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:31:34 GMT)
Toward Conversational Agents with Context and Time Sensitive Long-term Memory [8.1] 最近まで、RAGに関するほとんどの研究は、ウィキペディアのような巨大なテキストデータベースからの情報検索に重点を置いてきた。
我々は,静的なデータベース検索と比較して,長文の対話データからの効果的な検索は2つの問題に直面していると論じる。
我々は、最近の長文でシミュレートされた会話のデータセットの上に構築された、あいまいで時間に基づく質問の新しいデータセットを生成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:19:46 GMT)
Intelligent Anomaly Detection for Lane Rendering Using Transformer with Self-Supervised Pre-Training and Customized Fine-Tuning [8.0] 本稿では,車線描画画像の異常検出を分類問題に変換する。
本研究では,データ前処理,マスク付き画像モデリング(MiM)手法による自己教師付き事前学習,ラベル平滑化によるクロスエントロピーベース損失を用いた微調整,後処理からなる4相パイプラインを提案する。
その結果,提案パイプラインは車線描画画像異常検出において優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:54:04 GMT)
Physics-Based Rigid Body Object Tracking and Friction Filtering From RGB-D Videos [8.0] 本稿では,RGB-D画像から剛体物体を3次元追跡し,物体の物理的特性を推定する手法を提案する。
実世界のデータセット上で、我々のアプローチを実証し、評価する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:37:13 GMT)
Statistical Context Detection for Deep Lifelong Reinforcement Learning [7.9] オンライン体験からタスクラベルを推測することは難しい問題だ。
本稿では、オンラインの深層強化学習環境において、ポリシーとラベルの両方を学習するためのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:44:41 GMT)
Proactive Load-Shaping Strategies with Privacy-Cost Trade-offs in Residential Households based on Deep Reinforcement Learning [7.8] 本稿では,ユーザプライバシ保護のための深層強化学習に基づくロードシェイピングアルゴリズム(PLS-DQN)を提案する。
我々は,提案アルゴリズムを非侵入的負荷監視敵に対して評価する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:45:04 GMT)
Learning to Recover from Plan Execution Errors during Robot Manipulation: A Neuro-symbolic Approach [7.8] 本稿では,自動エラー発見とリカバリのためのアプローチ(記号探索によるブレンディング学習)を提案する。
我々はアルゴリズムの任意のバージョンを提示し、最後に正しい状態に戻る代わりに、元の計画におけるサブゴールを探索する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:03:57 GMT)
A Study of Plasticity Loss in On-Policy Deep Reinforcement Learning [7.8] 本研究は, 都市深部RLのドメインシフトにより, 可塑性損失が広まることを示す。
再生方法のクラスは, 様々な文脈において, 可塑性損失を連続的に軽減できることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:59:49 GMT)
Organizing Background to Explore Latent Classes for Incremental Few-shot Semantic Segmentation [7.6] インクリメンタルなFew-shot Semantic COCO(iFSS)は、トレーニング済みのセグメンテーションモデルを、いくつかの注釈付きイメージを通じて新しいクラスに拡張することである。
我々は,OINetと呼ばれる背景埋め込み空間 textbfOrganization とプロトタイプ textbfInherit Network を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:22:12 GMT)
A Mallows-like Criterion for Anomaly Detection with Random Forest Implementation [7.6] 本稿では,複数のモデルの集約における重み付けを選択するための新しい基準を提案する。
提案手法をネットワーク侵入を含む様々な領域にわたるベンチマークデータセット上で評価した。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:36:57 GMT)
Sj$\ddot{\text{o}}$qvist quantum geometric tensor of finite-temperature mixed states [7.5] 量子幾何テンソル(QGT)は、量子状態の局所的な幾何学的性質と関連する位相情報を明らかにする。
我々は、Sj$ddottexto$qvist距離に基づいて、QGTを有限温度で混合量子状態に一般化する。
ピタゴラスのような関係は距離とゲージ変換を結び、平行輸送条件の役割を明らかにする。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:43:24 GMT)
Delving into Differentially Private Transformer [7.5] 本稿では,差分プライバシを用いたトランスフォーマーモデルのトレーニング問題について考察する。
我々の処理はモジュラーであり、DPトランスフォーマーをトレーニングする問題を、DPバニラニューラルネットをトレーニングするより基本的な問題に還元することである。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:01:43 GMT)
Instruction Tuning with Retrieval-based Examples Ranking for Aspect-based Sentiment Analysis [7.5] アスペクトベースの感情分析(ABSA)は、特定の側面に関連する感情情報を識別し、企業や組織に対してより深い市場洞察を提供する。
近年の研究では、ABSAを生成タスクとして再構成する命令チューニングの固定例が提案されている。
本研究では,ABSAタスクの検索に基づくサンプルランキングを用いた指導学習手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:35:46 GMT)
Learning Better Representations From Less Data For Propositional Satisfiability [7.4] 我々は、命題が満足できるという2つの課題に対処するニュールレス(NeuRes)というニューロシンボリックなアプローチを提案する。
我々のモデルは、分類のみのために訓練されたモデルよりも優れた表現を学習し、データ効率はずっと高い。
このモデルでは,NuroSATよりも,正しく分類された例と証明された例の両方において,はるかに優れた性能が得られることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:47:14 GMT)
Efficient Image Deblurring Networks based on Diffusion Models [7.3] 本稿では,デフォーカスデブロアリングのためのスライディングウインドウモデル,Swintormerについて述べる。
この新しいアプローチの採用により、イテレーション毎にMAC(Multiply-Accumulate Operations)が大幅に削減され、メモリ要件が大幅に削減された。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:45:10 GMT)
CHANI: Correlation-based Hawkes Aggregation of Neurons with bio-Inspiration [7.3] 本研究の目的は,生物学にインスパイアされたニューラルネットワークが,局所的な変換のみによって分類タスクを学習できることを数学的に証明することである。
我々は、ホークス過程によってニューロンの活動がモデル化されるCHANIというスパイクニューラルネットワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:17:58 GMT)
Rethinking Invariance Regularization in Adversarial Training to Improve Robustness-Accuracy Trade-off [7.2] 対人訓練は、敵の例(AE)に対抗するための最先端のアプローチである。
正確さを犠牲にして高いロバスト性を達成するという、ロバストネスのトレードオフに悩まされる。
本手法は,識別能力を犠牲にすることなく,逆不変表現を学習することにより,ロバスト性・精度のトレードオフを大幅に改善する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:30:40 GMT)
Masked Autoencoders are PDE Learners [7.1] Masked Pretrainingは、不均一な物理学を統合して潜在表現を学習し、潜在PDE算術を実行する。
学習された潜在表現のニューラルソルバは、様々な係数、離散化、境界条件を越えて、タイムステッピングと超分解能のパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:14:23 GMT)
FaultFormer: Pretraining Transformers for Adaptable Bearing Fault Classification [7.1] 本稿では,トランスモデルに基づく自己教師型事前学習および微調整フレームワークを提案する。
特に、最先端のアキュラシーに到達するための異なるトークン化とデータ拡張戦略について検討する。
このパラダイムでは、異なるベアリング、障害、機械からラベル付けされていないデータに基づいてモデルを事前訓練し、新しいデータスカースアプリケーションに素早くデプロイすることが可能になる。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:13:29 GMT)
To FP8 and Back Again: Quantifying the Effects of Reducing Precision on LLM Training Stability [7.1] BrainFloat16 (BF16) の精度は、大規模な言語モデルの事前トレーニングのデファクトスタンダードになっている。
しかしながら、BF16より安定でないことが判明したFP16の以前の経験は、FP8がLCM訓練の費用対効果があるかどうかという懸念を提起している。
自己回帰言語モデルにおける損失ランドスケープのシャープネスを定量化するための新しい評価手法と新しい指標を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:42:23 GMT)
A study of why we need to reassess full reference image quality assessment with medical images [7.0] 特に、FR-IQA測度PSNRとSSIMは、多くの自然画像処理に成功するために知られ、テストされている。
本稿では、2つの最も一般的なフルレファレンス(FR)画像品質尺度が、新しいアルゴリズムの評価に不適であることを証明した、構造化された総合的な例のコレクションを提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:01:40 GMT)
Fast Explainability via Feasible Concept Sets Generator [7.0] モデルに依存しないアプローチの普遍性とモデル固有のアプローチの効率とのギャップを埋める。
まず、人間の理解可能な概念の集合を通して説明を定義する。
第二に、予測モデルに付随する説明として、最小限の可能な集合生成器を学習できることが示される。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:01:40 GMT)
Code Simulation Challenges for Large Language Models [7.0] この研究は、LLM(Large Language Models)がいかにコーディングやアルゴリズムのタスクをシミュレートできるかを研究する。
我々は、直線プログラムのベンチマーク、クリティカルパスを含むコード、近似命令および冗長命令を導入する。
本稿では,コンパイラのパターンを行/フォローすることで,LLMにコード実行行をシミュレートするように指示する,OFFプロンプト手法であるChain of Simulation(CoSm)を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:56:58 GMT)
Zipper: A Multi-Tower Decoder Architecture for Fusing Modalities [7.0] 独立に訓練された単調デコーダから多モード生成モデルを柔軟に構成するマルチトワーデコーダアーキテクチャを提案する。
提案アーキテクチャは,テキスト音声データに制限のあるシナリオにおいて,非常に競争力のある性能を示す。
出力モダリティが音声であるTTS(text-to-Speech Generation)のようなクロスモーダルなタスクでは、事前訓練された音声バックボーンを使用することで、ベースラインよりも優れたパフォーマンスが得られることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:23:55 GMT)
Sketch-Plan-Generalize: Continual Few-Shot Learning of Inductively Generalizable Spatial Concepts [6.9] 我々は、観測されたインスタンスを説明するsuccinct$ program$表現を推論する学習アーキテクチャを模索する。
提案手法は,大規模言語モデルのコード生成能力とニューラルネットワークの基底表現の利点を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:46:39 GMT)
Large Brain Model for Learning Generic Representations with Tremendous EEG Data in BCI [6.9] 大型脳モデル(LaBraM)と呼ばれる脳波の統一基盤モデルを提案する。
LaBraMは、EEG信号をEEGチャネルパッチにセグメント化することで、データセット間の学習を可能にする。
次に、マスクされたEEGチャネルパッチの元のニューラルコードを予測することにより、ニューラルトランスフォーマーを事前訓練する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:08:16 GMT)
Convergence Bounds for Sequential Monte Carlo on Multimodal Distributions using Soft Decomposition [6.9] 逐次モンテカルロ法(SMC)アルゴリズムにより得られたサンプルの実証測度の下での関数の分散に関するバウンダリを証明した。
我々は,局所MCMC力学に依存する混合時間を用いて,真のマルチモーダル設定でバウンダリが得られることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:43:45 GMT)
FUSU: A Multi-temporal-source Land Use Change Segmentation Dataset for Fine-grained Urban Semantic Understanding [6.8] 都市セマンティック理解のためのマルチソース・マルチ時間変化セグメンテーションデータセットであるFUSUを紹介する。
FUSUは、これまでで最も詳細な土地利用分類システムであり、17のクラスと300億ピクセルのアノテーションがある。
20-50cmの地上サンプルと月847km2の光学・レーダー衛星時系列の両時間高解像度衛星画像を含む。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:56:11 GMT)
Leveraging Generative AI for Smart City Digital Twins: A Survey on the Autonomous Generation of Data, Scenarios, 3D City Models, and Urban Designs [6.8] 生成人工知能(AI)モデルは、データとコード生成において独自の価値を示してきた。
この調査は、一般的な生成AIモデルとその応用分野の導入と、既存の都市科学応用のレビューから始まる。
このレビューに基づいて、次世代の都市デジタル双生児に生成AIモデルを統合する可能性と技術的戦略について検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:23:07 GMT)
Characterizing Overfitting in Kernel Ridgeless Regression Through the Eigenspectrum [6.7] 我々は、ガウス以下の設計仮定の下で、誘惑的な過フィットと破滅的な過フィットの現象を証明した。
また、機能の独立性は、誘惑に満ちたオーバーフィッティングを保証する上で重要な役割を担っていることも確認しています。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:23:41 GMT)
A study on the adequacy of common IQA measures for medical images [6.7] 手動評価胸部X線(5名)および光音響画像(1名)と比較し,医療画像データに対する一般的なIQA測定の有効性を検証した。
全ての実験の結果は, 既定値のPSNRとSSIMは, 結果リストの低い範囲にあり, HaarPSIは, 総合的な評価において, 他の試験結果よりも優れていた。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:04:03 GMT)
Stress-Testing Capability Elicitation With Password-Locked Models [6.6] 本研究は,微調整による誘発が能力を引き出すのに十分である条件について検討する。
いくつかの高品質なデモは、パスワードでロックされた機能を完全に引き出すのに十分であることがわかった。
評価だけでなく、実演も利用できる場合、強化学習のようなアプローチは、能力を引き出すことができることが多い。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:26:26 GMT)
Conveyor: Efficient Tool-aware LLM Serving with Tool Partial Execution [6.6] ツール開発者がLLMサービスシステムに部分的な実行機会を公開するための新しいインタフェースを導入する。
ツールの部分的な実行は、要求完了のレイテンシを最大38.8%改善することを示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:24:15 GMT)
Rotation Averaging: A Primal-Dual Method and Closed-Forms in Cycle Graphs [6.5] 幾何再構成のベンチマーク、平均化は、それらの間の測定された相対的向きのセットを最適に説明する絶対的な設定のセットを求める。
広範に受け入れられるスペクトル理論によって動機付けられた新しい原始双対サイクル法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:46:39 GMT)
Prompt Fuzzing for Fuzz Driver Generation [6.2] 本稿では,プロンプトファジングのためのカバーガイドファジングであるPromptFuzzを提案する。
未発見のライブラリコードを探索するためにファズドライバを反復的に生成する。
PromptFuzzはOSS-FuzzとHopperの2倍のブランチカバレッジを達成した。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:42:18 GMT)
Genshin: General Shield for Natural Language Processing with Large Language Models [6.2] 大規模言語モデル(LLM)が最近流行し、無数のドメインでかなりの進歩と一般化能力を示している。
LLMは不透明度を悪化させるさらに大きなブラックボックスを作り、解釈可能性はほとんどない。
本稿では, LLMの一般化可能性, 中央モデルの識別, 単純モデルの解釈可能性を組み合わせた, ゲンシンと呼ばれる新しいカスケーディングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:04:05 GMT)
Learning Any-View 6DoF Robotic Grasping in Cluttered Scenes via Neural Surface Rendering [6.2] この研究は、グリップをレンダリングとして再解釈し、6DoFグリップ検出の新しい方法であるNeuGraspNetを導入する。
NeuGraspNetは、モバイル操作のシナリオに共通するランダムな視点で動作し、既存の暗黙的および半単純的把握方法より優れている。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:58:46 GMT)
Clustering Mixtures of Discrete Distributions: A Note on Mitra's Algorithm [6.1] 我々は、一般的な離散混合分布モデルを分類するために、Mitraのアルゴリズム citemitra2008clustering の洗練された解析を行う。
この分析をブロックモデルに分割することで強化し、より洗練された条件を導出する。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:55:45 GMT)
DiffAug: A Diffuse-and-Denoise Augmentation for Training Robust Classifiers [6.1] DiffAugは、画像分類器を訓練するためのシンプルで効率的な拡散に基づく拡張手法である。
与えられた例にDiffAugを適用すると、1つの前方拡散ステップと1つの逆拡散ステップからなる。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:16:25 GMT)
A Homogenization Approach for Gradient-Dominated Stochastic Optimization [6.1] 勾配支配を享受する関数に対する同次二階降下法(SHSOD)を提案する。
以上の結果から,SHSODMは勾配優先最適化法において,他の2次法で達成された最もよく知られたサンプルの複雑さと一致していることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:22:58 GMT)
GRAMMAR: Grounded and Modular Methodology for Assessment of Domain-Specific Retrieval-Augmented Language Model [6.1] Retrieval-augmented Generation (RAG) システムは、ドメイン固有の知識ベースを問うために、様々な産業で活発に研究され、展開されている。
これらのシステムを評価することは、ドメイン固有のクエリが不足し、それに対応する基底真理が不足しているため、ユニークな課題である。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:12:21 GMT)
Simulation of Graph Algorithms with Looped Transformers [6.0] 理論的観点から, グラフ上のアルゴリズムをシミュレートするトランスフォーマーネットワークの能力について検討する。
このアーキテクチャは、Dijkstraの最も短い経路のような個々のアルゴリズムをシミュレートできることを示す。
付加的なアテンションヘッドを利用する場合のチューリング完全度を一定幅で示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:41:12 GMT)
Learning from Litigation: Graphs and LLMs for Retrieval and Reasoning in eDiscovery [6.0] 本稿では2つの世界の強みを組み合わせたハイブリッド手法であるDISCOG(Disdiscovery Graph)を紹介する。
本手法は,手作業と比較して文書レビューコストを99.9%削減し,LCMに基づく分類法と比較して95%削減する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:08:55 GMT)
Adaptive and Parallel Split Federated Learning in Vehicular Edge Computing [6.0] 車両エッジインテリジェンス(VEI)は、将来のインテリジェントトランスポートシステムを実現するための有望なパラダイムである。
フェデレートラーニング(Federated Learning, FL)は、コラボレーティブモデルトレーニングとアグリゲーションを促進する基礎技術のひとつである。
ASFV(Adaptive Split Federated Learning scheme for Vehicular Edge Computing) を開発した。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:34:38 GMT)
Automated Radiology Report Generation: A Review of Recent Advances [6.0] 人工知能の最近の技術進歩は、自動放射線学レポート生成に大きな可能性を示している。
人工知能の最近の進歩は、自動放射線診断レポート生成に大きな可能性を示している。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:38:56 GMT)
Finite-Time Analysis of Three-Timescale Constrained Actor-Critic and Constrained Natural Actor-Critic Algorithms [5.9] 我々は,制約付きマルコフ決定過程の関数近似を用いたアクター評論家と自然なアクター批評家アルゴリズムについて検討する。
我々はこれらのアルゴリズムを非i.d(マルコフアン)設定で非漸近解析する。
また、3つの異なるセーフティガイム環境の実験結果も示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:54:19 GMT)
Open-Source LLMs for Text Annotation: A Practical Guide for Model Setting and Fine-Tuning [5.8] 本稿では、政治科学研究に典型的なテキスト分類タスクにおけるオープンソースのLarge Language Models(LLM)の性能について検討する。
姿勢・話題・関連分類などの課題を調べることで,テキスト分析におけるLLMの使用に関する情報的判断を学者に指導することを目指す。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:29:08 GMT)
Deep Learning for Assessment of Oral Reading Fluency [5.7] 本研究は,人間専門家がラベル付けした物語テキストの子どもの音声記録の学習データセットのエンドツーエンドモデリングについて検討する。
本報告では,学習した語彙・音響・韻律的特徴の埋め込みが,読み流しの知覚に重要であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:09:35 GMT)
Kotlin ML Pack: Technical Report [5.7] 我々は、Kotlinコードの3つの新しいデータセット、KStack、KStack-clean、KExercisesを提示します。
また、人間の専門家がKotlinに書き直したHumanEvalベンチマークのバージョンも提示します。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:33:50 GMT)
Valid Conformal Prediction for Dynamic GNNs [5.6] グラフニューラルネットワーク(GNN)は、印象的な経験的パフォーマンスを示す強力なブラックボックスモデルである。
既存の静的GNNでも,交換性特性を組み込んだ動的グラフを出力できるUnfoldingを提案する。
これを用いて、共形予測の妥当性をトランスダクティブとセミインダクティブの双方において動的GNNに拡張する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:07:39 GMT)
Beyond Agreement: Diagnosing the Rationale Alignment of Automated Essay Scoring Methods based on Linguistically-informed Counterfactuals [5.6] 提案手法は,Large Language Models (LLMs) が支援する対実的介入を用いて,エッセイを評価する際に,BERTのようなモデルが主に文レベルの特徴に焦点を当てていることを明らかにする。
LLMはコンベンション、言語複雑性、そして組織に適応しており、スコアリングルーブリックとより包括的なアライメントを示している。
我々のアプローチは、ニューラルネットワークAES手法の理解を改善し、モデル駆動決定における透明性を求める他の領域にも適用できる。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:16:32 GMT)
Debiasing Algorithm through Model Adaptation [5.5] 因果解析を行い、問題のあるモデル成分を同定し、フィードフォワードの中間層が最も偏りを伝達しやすいことを明らかにする。
解析結果に基づいて,これらの層の重み行列に線形射影を適用することにより,モデルに介入する。
提案手法であるDAMAは,下流タスクにおけるモデルの性能を維持しながら,様々な指標によって測定されるバイアスを著しく低減する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:22:52 GMT)
Comparative Analysis of Open-Source Language Models in Summarizing Medical Text Data [5.4] 大規模言語モデル(LLM)は,非構造化テキストデータに対する問合せおよび要約処理において,優れた性能を示した。
医用要約タスクにおけるオープンソースのLCMの性能分析のための評価手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:40:32 GMT)
Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction [5.2] 分子表現学習フレームワークHiPM(Hierarchical Prompted Molecular Representation Learning Framework)について紹介する。
HiPMは、タスク認識プロンプトを通じて、分子表現におけるタスクの差分表現を強化する。
実験により、HiPMは様々なマルチラベルデータセットにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:10:21 GMT)
Large-scale DSM registration via motion averaging [5.1] 動き平均化問題としてDSM登録タスクを構築する新しいソリューションを提案する。
大規模DSMのグリッド構造に基づいて、新しい近接探索法を用いてペアワイズ登録を行う。
シーングラフは,O(N)複雑性の極めて高速な動き平均アルゴリズムを用いて最適化可能であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:40:11 GMT)
Algorithmically Designed Artificial Neural Networks (ADANNs): Higher order deep operator learning for parametric partial differential equations [5.1] 偏パラメトリック微分方程式(PDE)に関連する近似演算子に対する新しい深層学習手法を提案する。
提案手法では,高速な古典的数値近似手法と深層演算子学習手法を併用する。
いくつかのパラメトリックPDEの場合,提案手法を数値的に検証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:22:15 GMT)
SPABA: A Single-Loop and Probabilistic Stochastic Bilevel Algorithm Achieving Optimal Sample Complexity [5.0] SPABAを実装する際には,双レベル最適化と単レベル最適化の間に複雑性解析のギャップがないことが示されている。
本稿では,複雑性解析の状況を改善するために,他の2ループあるいはネストした2レベルアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:36:03 GMT)
Participation in the age of foundation models [5.0] 参加的アプローチは、利害関係者に代理店と意思決定権限を貸すことを約束する。
基礎モデルへの参加を取り入れる既存の試みについて検討する。
我々は、より局所的でアプリケーション指向の、有意義な参加機会を特定する、参加型ファンデーションモデルのための青写真を開発する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:53:23 GMT)
DeepHGNN: Study of Graph Neural Network based Forecasting Methods for Hierarchically Related Multivariate Time Series [5.0] 本稿では,複雑な階層構造における予測を目的とした新しい階層型GNN(DeepHGNN)フレームワークを提案する。
DeepHGNNは、様々な階層レベルの予測精度とコヒーレンスを保証し、それらをまたいだ信号を共有する。
複数の最先端モデルに対する包括的評価セットにより,DeepHGNNの優れた性能が確認された。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:06:17 GMT)
Nuisance Function Tuning for Optimal Doubly Robust Estimation [5.0] 二重頑健な汎函数の推定子は、典型的には2つの複素ニュアンス関数を推定することに依存する。
ニュアンス関数推定器の異なるチューニングパラメータ選択とサンプル分割戦略の相互作用を示す。
これらの推定器のいくつかは、ニュアンス関数のすべての H より古い滑らか度クラスにおいて最小収束率を達成することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:19:46 GMT)
Learning Diffeomorphism for Image Registration with Time-Continuous Networks using Semigroup Regularization [5.0] 微分型3次元画像登録のための新しい学習手法を提案する。
半群の性質を正規化の唯一の形式として活用する。
本手法は, さらなる正規化用語の必要性を軽減し, スケーリング, スキャアリング統合を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:25:43 GMT)
The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control [5.0] 2024年は、分析翻訳品質評価のための多次元品質指標フレームワークの10周年である。
本稿では,最新のMQM開発について詳述し,3つのサンプルサイズ範囲にわたる翻訳品質測定への普遍的アプローチを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:06:30 GMT)
Federated Q-Learning with Reference-Advantage Decomposition: Almost Optimal Regret and Logarithmic Communication Cost [4.9] 本稿では,FedQ-Advantageと呼ばれる新しいモデルフリーなフェデレーションQ-ラーニングアルゴリズムを提案する。
我々のアルゴリズムは対数通信コストを低くするだけでなく、時間的地平線が十分に大きい場合と比較して、対数係数に縛られた情報とほぼ直線的後悔のスピードアップに到達して、ほぼ最適の後悔を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:26:52 GMT)
NeuralODEs for VLEO simulations: Introducing thermoNET for Thermosphere Modeling [4.9] サーモネットは、衛星軌道伝播における熱圏密度を表す。
ネットワークパラメータは観測されたダイナミクスに基づいて学習され、ODEの感度によって適応する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:12:44 GMT)
Computing low-thrust transfers in the asteroid belt, a comparison between astrodynamical manipulations and a machine learning approach [4.9] 低推力軌道は、小惑星帯のミッションにおける科学的出力とコスト効率の最適化に重要な役割を果たしている。
本稿では,新しい解析近似を提案し,その精度と性能を機械学習手法と比較する。
我々は、時間と最適な制御問題を解くことによって発見された約300万の転送のデータセットを構築します。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:20:54 GMT)
Two-layer retrieval augmented generation framework for low-resource medical question-answering: proof of concept using Reddit data [4.8] Retrieval augmented generation (RAG)は、生成モデル出力を制限し、幻覚の可能性を緩和する機能を提供する。
本稿では,クエリ中心の回答生成のための2層RAGフレームワークを提案し,ソーシャルメディアフォーラムからクエリ中心の要約生成の文脈において,このフレームワークの概念実証を評価する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:56:52 GMT)
Mitigating Disparate Impact of Differential Privacy in Federated Learning through Robust Clustering [4.8] Federated Learning(FL)は、データをローカライズする分散機械学習(ML)アプローチである。
最近の研究は、クラスタリングによるバニラFLの性能公平性に対処しようと試みているが、この手法は依然として敏感であり、エラーを起こしやすい。
本稿では,クライアントのクラスタを高度に均一な設定で効果的に識別する新しいクラスタ化DPFLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:03:31 GMT)
Trust the Model Where It Trusts Itself -- Model-Based Actor-Critic with Uncertainty-Aware Rollout Adaption [4.7] ダイナスタイルモデルベース強化学習(MBRL)はモデルベースロールアウトを通じてモデルフリーエージェントと予測遷移モデルを組み合わせる。
そこで本研究では,データ効率と性能の大幅な向上を図り,使い易いロールアウト機構を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:53:07 GMT)
Anatomical Region Recognition and Real-time Bone Tracking Methods by Dynamically Decoding A-Mode Ultrasound Signals [4.6] 本稿では,Aモード超音波信号を用いた解剖学的領域認識と骨追跡のためのディープラーニング手法を提案する。
このアルゴリズムは、同時に骨追跡を行い、Aモード超音波トランスデューサが置かれた解剖学的領域を特定することができる。
この実験は解剖学的領域の分類において97%の精度を示し、動的追跡条件下では0.5$pm$1mmの精度を示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:04:40 GMT)
Random Inverse Problems Over Graphs: Decentralized Online Learning [4.6] ネットワークグラフ上の分散ランダム逆問題とオンライン計測のフレームワークを構築した。
無限ヒルベルト空間におけるL2-漸近安定理論を開発する。
非定常および非独立オンラインデータに基づく分散オンライン学習アルゴリズムをRKHSで提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:08:02 GMT)
Convergence Conditions of Online Regularized Statistical Learning in Reproducing Kernel Hilbert Space With Non-Stationary Data [4.6] 本研究では,HilbertHSカーネルにおける正規化学習アルゴリズムの収束性について検討した。
独立および非独立に分散したデータストリームに対して、入力データによって引き起こされる限界確率測度が徐々に変化している場合、アルゴリズムは平均二乗整合を達成する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:48:59 GMT)
Comparative Study of Neighbor-based Methods for Local Outlier Detection [4.6] 本稿では,既存の外乱検出アルゴリズムの隣人について検討し,情報・隣人・方法論の3レベル成分を用いてハイブリッド手法を定義した分類法を提案する。
その結果, 高次元空間での作業には, 逆K-アレスト近傍法が有望な性能を実現し, 動的選択法が適していることが示唆された。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:28:12 GMT)
Machine Learning in Space: Surveying the Robustness of on-board ML models to Radiation [4.5] 現代の宇宙船はますます機械学習(ML)に依存している
宇宙の物理機器は、放射線のような様々な自然の危険にさらされている。
宇宙用MLモデルに対する放射の影響はよく研究されていない。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:13:03 GMT)
Requirements Strategy for Managing Human Factors in Automated Vehicle Development [4.4] 自動運転車(AV)のような安全クリティカルなシステムを開発する際には、ヒューマンファクター(HF)知識の統合が不可欠である
HFの知識がAV開発プロセスを通して継続的に考慮されることを保証することは、これらの先進的なシステムの有効性、安全性、受け入れなど、いくつかの理由において不可欠である。
本稿では,AVのアジャイル開発におけるHF要件の調査に,要求戦略の概念をレンズとして適用する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:37:57 GMT)
Managing Human Factors in Automated Vehicle Development: Towards Challenges and Practices [4.4] 自動走行車(AV)を開発する際には、ヒューマンファクター(HF)の知識を考慮し、安全かつ受け入れられることが重要である。
本研究は,自動車産業におけるアジャイルAV開発におけるHF要求の実践と課題について考察する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:48:43 GMT)
Comprehensive Analysis of Network Robustness Evaluation Based on Convolutional Neural Networks with Spatial Pyramid Pooling [4.4] 複雑なネットワークを理解し、最適化し、修復するための重要な側面である接続性の堅牢性は、伝統的にシミュレーションを通じて評価されてきた。
空間ピラミッドプールネットワーク(SPP-net)を用いた畳み込みニューラルネットワーク(CNN)モデルの設計により,これらの課題に対処する。
提案したCNNモデルは,全ての除去シナリオにおいて,攻撃曲線とロバストネスの両値の正確な評価を一貫して達成していることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:26:10 GMT)
Relational Self-supervised Distillation with Compact Descriptors for Image Copy Detection [4.3] 本稿では,著作権保護のためのオンライン共有プラットフォームにおける課題である画像コピー検出について述べる。
本稿では,軽量ネットワークとコンパクトディスクリプタを用いて,競争力のある性能を実現する手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:08:02 GMT)
Interpretability of Statistical, Machine Learning, and Deep Learning Models for Landslide Susceptibility Mapping in Three Gorges Reservoir Area [4.3] 地すべり感受性マッピング(LSM)は,高リスク領域の特定と予防戦略の実施に不可欠である。
本研究では,地すべりの感受性予測における統計的,機械学習(ML),深層学習(DL)モデルの解釈可能性について検討した。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:02:11 GMT)
SoftED: Metrics for Soft Evaluation of Time Series Event Detection [4.3] 時系列イベント検出法は,検出精度にのみ焦点をあてた標準分類基準によって評価される。
事象を検出する不正確さは、しばしば、隣り合う検出に反映される先行または遅延効果によって生じる。
本稿では,イベント検出手法のソフトアセスメントのために設計された,新しいメトリクスセットであるSoftEDメトリクスを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:56:49 GMT)
LoByITFL: Low Communication Secure and Private Federated Learning [4.2] フェデレートラーニング(FL)は、クライアントデータのプライバシやビザンティンクライアントに対するセキュリティなど、いくつかの課題に直面している。
本稿では,最初の通信効率の高い情報理論(IT)のプライベートかつセキュアなFLスキームであるLoByITFLを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:00:19 GMT)
Multiscale Spatio-Temporal Enhanced Short-term Load Forecasting of Electric Vehicle Charging Stations [4.2] 電気自動車(EV)の急速な拡大により、電気自動車充電ステーション(EVCS)の負荷予測がますます重要になっている。
EVCSの正確な負荷予測を実現する上での最大の課題は、充電行動の非線形性、異なるステーション間の空間的相互作用、使用パターンの複雑な時間的変動を考慮することである。
EVCSにおける負荷予測のためのマルチスケール時空間拡張モデル(MSTEM)を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:54:22 GMT)
Unlocking the Potential of Large Language Models for Clinical Text Anonymization: A Comparative Study [4.2] 自動臨床テキスト匿名化は、二次的使用のためにテキスト健康データを広く共有する可能性を秘めている。
文学において多くの複雑で理論的に成功した匿名化解の提案にもかかわらず、これらの手法は依然として欠陥がある。
LLM(Large Language Models)の開発における最近の進歩は、この分野をさらに発展させる有望な機会となる。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:07:58 GMT)
LLaMA-Reg: Using LLaMA 2 for Unsupervised Medical Image Registration [4.1] 本稿では,事前訓練された大言語モデルを用いた医用画像登録手法を提案する。
事前訓練された大言語モデルを用いて、医用画像の深い特徴を登録モデルにエンコードすることで、画像登録精度を効果的に向上できることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:26:25 GMT)
IOI: Invisible One-Iteration Adversarial Attack on No-Reference Image- and Video-Quality Metrics [4.1] 非参照画像とビデオ品質のメトリクスは、ビデオ処理ベンチマークで広く使われている。
Invisible One-Iteration (IOI) は参照画像やビデオ品質の指標に反する攻撃である。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:56:36 GMT)
Defining Requirements Strategies in Agile: A Design Science Research Study [4.1] 調査によると、現在アジャイル開発で直面している課題の多くは、要件エンジニアリングに関連している。
本稿では、未定義の要求戦略からアジャイル開発で生じる重要な課題について考察する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:57:32 GMT)
Language Models Trained to do Arithmetic Predict Human Risky and Intertemporal Choice [4.0] 本稿では,認知モデルとしての大規模言語モデルの有用性を高める新しい手法を提案する。
生態学的に有効な算術的データセットに基づいて事前訓練されたLLMは、従来の認知モデルよりも人間の行動を予測する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:37:14 GMT)
Face Swap via Diffusion Model [4.0] 本稿では2つのポートレート画像間の顔交換のための拡散モデルに基づくフレームワークを提案する。
基本フレームワークは、顔の特徴符号化、多条件生成、顔の塗装の3つのコンポーネントで構成されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:12:40 GMT)
A Recipe for Charge Density Prediction [4.0] 機械学習手法は、電荷密度の予測を著しく加速させることで有望である。
精度とスケーラビリティを両立できるレシピを提案する。
提案手法は,従来の手法よりも1桁以上高速でありながら,最先端の精度を実現する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:07:24 GMT)
Dynamics-based Feature Augmentation of Graph Neural Networks for Variant Emergence Prediction [3.9] 新たな変種の普及を予測するための現在の手法は、統計的モデリングに依存している。
既存の変種が特定のリージョンにいつ到着するかを予測できますか?
変動力学インフォームドグラフニューラルネット(GNN)手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:10:30 GMT)
Real-Time Environment Condition Classification for Autonomous Vehicles [3.9] 我々は、屋外の天気と危険な道路状況を特定するために、ディープラーニングモデルを訓練する。
我々は、最先端の悪天候データセットに改良された分類とラベル階層を導入することで、これを実現する。
我々は、単一のRGBフレームから環境条件を分類するためのディープラーニングモデルであるRECNetを訓練する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:29:55 GMT)
Are You Sure? Rank Them Again: Repeated Ranking For Better Preference Datasets [3.8] AIフィードバックからの強化学習による大規模言語モデルのトレーニングは、モデルの出力と人間の好みをより緊密に調整する。
これには、ユーザプロンプトに対する複数の候補応答をランク付けする評価器モデルが含まれる。
そこで我々は,同じ応答を複数回評価し,一貫してランク付けされている応答のみを訓練する,繰り返しランク付け手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:08:31 GMT)
Diffeomorphic interpolation for efficient persistence-based topological optimization [3.8] トポロジカルデータ分析(TDA)は、構造化オブジェクトから定量的トポロジカル記述子を抽出するパイプラインを提供する。
提案手法は, サブサンプル上で計算された勾配から導出される微分同相を, 完全な入力対象の座標を更新するために有効であることを示す。
我々はまた,ブラックボックスオートエンコーダ(AE)正則化に対する我々のアプローチの妥当性を示す。そこでは,固定,事前学習,ブラックボックスAEモデルに関連する潜伏空間のトポロジ的先行を強制することを目的としている。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:00:28 GMT)
Partial Information Decomposition for Data Interpretability and Feature Selection [3.7] PIDF(Partial Information Decomposition of Features)は、データの同時解釈と特徴選択のための新しいパラダイムである。
合成データと実世界のデータの両方を用いてPIDFを広範囲に評価し,その可能性と有効性を示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:54:03 GMT)
A Multi-Source Retrieval Question Answering Framework Based on RAG [3.7] 本研究では,従来のレトリバーをGPT-3.5に置き換える手法を提案する。
また,詳細な知識検索を実現するためのWeb検索手法を提案する。
Web検索におけるGPT検索の錯覚を緩和し,ノイズを低減するため,MSRAGというマルチソース検索フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:47:57 GMT)
Distributed Management of Fluctuating Energy Resources in Dynamic Networked Systems [3.7] 本稿では,複数のDERからなるシステムにおけるエネルギー共有問題について検討する。
我々はこの問題を,各ノードのエネルギー生産限界に対応する制約付き帯域凸最適化問題としてモデル化する。
そこで我々は, 動的後悔という概念をパフォーマンス指標として活用する, 定式化問題を解決するために, 分散意思決定ポリシーを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:54:11 GMT)
MASSIVE Multilingual Abstract Meaning Representation: A Dataset and Baselines for Hallucination Detection [3.7] 84,000以上のテキスト・ツー・グラフアノテーションを持つデータセットであるMASSIVE-AMRを紹介する。
AMRグラフは、50以上の言語にマッピングされた1,685の情報検索発話を示す。
その結果、構造化解析のためのLLMを用いた永続的な問題に光を当てた。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:17:22 GMT)
A novel hybrid time-varying graph neural network for traffic flow forecasting [3.7] 我々は交通流予測のための新しいハイブリッド時変グラフニューラルネットワーク(HTVGNN)を提案している。
本研究では,HTVGNNの予測精度が,時空間グラフニューラルネットワークモデルに比較して優れていることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:00:32 GMT)
LangCell: Language-Cell Pre-training for Cell Identity Understanding [3.7] 最初のLanguage-Cell事前学習フレームワークであるLangCellを紹介します。
LangCellは、ゼロショットセル識別理解シナリオで効果的に機能できる唯一のシングルセルPLMである。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:54:47 GMT)
Incentivising Demand Side Response through Discount Scheduling using Hybrid Quantum Optimization [3.6] デマンドサイド・レスポンス(Demand Side Response, DSR)は、消費者が電気需要の管理に積極的に参加できるようにする戦略である。
本稿では,D-Wave の Leap Hybrid Cloud ランタイムを用いたハイブリッド量子コンピューティング手法を提案する。
古典的分解法は, 最大3200人の消費者が抱える問題に対して, 最高の総合的再検診品質が得られることを観察する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:52:44 GMT)
Kinked linear response from non-Hermitian cold-atom pumping [3.6] 非ハーモニティ性は、量子気体の半古典波パケット軌道において急激で顕著なキンクを引き起こす。
これは、非エルミタンポンピングによる非固有非局在性のヒッヘルトによる物理的起源である。
以上の結果から,非エルミタンの皮膚作用以外の非エルミタンポンプからの特異な非モノトニックな挙動が示された。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:01:45 GMT)
SecureFalcon: Are We There Yet in Automated Software Vulnerability Detection with LLMs? [3.6] SecureFalconは、Falcon-40Bモデルから派生した1億1100万のパラメータしか持たない革新的なモデルアーキテクチャである。
SecureFalconはバイナリ分類で94%の精度、マルチクラス化で最大92%、即時CPU推論時間を実現している。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:22:48 GMT)
On the Influence of Smoothness Constraints in Computed Tomography Motion Compensation [3.5] 本研究では,コーンビームCTのための既存の剛性運動補償アルゴリズムにおけるスプラインベース運動モデルの影響を解析する。
その結果、運動モデルの選択は、回復可能な周波数に決定的に影響を及ぼすことが示された。
最終的に、最適な動作モデルは、画像化された解剖学、臨床ユースケース、走査プロトコルに依存する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:36:16 GMT)
Deep Bayesian Filter for Bayes-faithful Data Assimilation [3.5] 非線形状態空間モデル(SSM)のデータ同化のためのディープベイズフィルタ(DBF)を提案する。
DBF は新しい潜伏変数 $h_t$ を新しい潜伏変数 (fancy'') 空間上に構築し、観測を $o_t$ に同化する。
実験の結果,DBFは様々なタスクや条件下でモデルベースアプローチや潜在同化手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:42:00 GMT)
Conformal Depression Prediction [3.5] コンフォメーション予測(CP)に基づく不確実性定量化法であるコンフォメーション予測(CDP)を導入する。
CDP-ACC はモデル再訓練も抑うつデータ分布の仮定も必要としないプラグイン・アンド・プレイモジュールである。
AVEC 2013 と AVEC 2014 データセットにおける不確実性定量化の適用と,CDP と CDP-ACC の有効性と優位性を実証的に実証した。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:08:30 GMT)
Normative Requirements Operationalization with Large Language Models [3.5] 規範的な非機能要件は、社会的、法的、倫理的、共感的、文化的規範の違反を避けるために、システムが観察しなければならない制約を規定する。
近年の研究では、規範的要件を特定するためにドメイン固有言語を使用してこの問題に対処している。
本稿では,システム機能の抽象表現間の意味的関係を抽出するために,大規模言語モデルを用いた補完的アプローチを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:19:52 GMT)
Regularized Q-learning through Robust Averaging [3.4] 本稿では,既存のQラーニング手法の弱点を原則的に解決する,2RA Qラーニングと呼ばれる新しいQラーニング変種を提案する。
そのような弱点の1つは、制御できない、しばしばパフォーマンスが低下する、基礎となる推定バイアスである。
2RA Q-learningは最適ポリシーに収束し、理論平均二乗誤差を解析する。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:12:24 GMT)
Interdisciplinary Expertise to Advance Equitable Explainable AI [3.4] 本稿では、説明可能なAI(XAI)に焦点を当て、学際的専門家パネルレビューのためのフレームワークについて述べる。
我々は、より正確で公平な解釈を生み出すための学際専門家パネルの重要性を強調した。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:45:38 GMT)
Lifelong Learning Using a Dynamically Growing Tree of Sub-networks for Domain Generalization in Video Object Segmentation [3.2] マルチドメインソースから効率的に忘れることを学ぶために,動的に成長するサブネットワークツリー(DGT)を提案する。
DGTは、学習済みのドメインを忘れることなく、モデルが新しいドメインから継続的に効果的に学習することを可能にする、新しい生涯学習技術を使用している。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:01:27 GMT)
Spin Symmetry in Thermally-Assisted-Occupation Density Functional Theory [3.2] 熱共役共役密度汎関数理論(TAO-DFT)は、前述のスピン対称性の破れを解決することが示されている。
これを支持するため, H2, N2, He2, Ne2の解離とねじれたエチレンの解離に対して, 種々の架空の温度のTAO-DFT計算を行った。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:06:42 GMT)
Simulation, Modelling and Classification of Wiki Contributors: Spotting The Good, The Bad, and The Ugly [3.2] 本稿では,人間と非人間(ロボット)のコントリビュータを自動的に識別するためのシミュレーション,モデリング,分類手法を提案する。
私たちは、テストベッドとしてWikiVoyageという、世界中の無料のウィキ旅行ガイドを一般大衆から寄付を受けられるようにしています。
以上の結果から,本手法は良性ボットと良性ボットと,最大92%の分類精度を持つヒトコントリビュータを区別できることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:56:08 GMT)
SoK: A Defense-Oriented Evaluation of Software Supply Chain Security [3.2] ソフトウェアサプライチェーンのセキュリティ研究と開発の次の段階は、防衛指向のアプローチから大きな恩恵を受けるだろう、と私たちは主張する。
本稿では,ソフトウェアサプライチェーンの基本的な要素とその因果関係を表現するフレームワークであるAStRAモデルを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:26:13 GMT)
Locally Testing Model Detections for Semantic Global Concepts [3.1] 本稿では,グローバルな概念エンコーディングを単一ネットワーク入力の局所処理にリンクするフレームワークを提案する。
提案手法は,セマンティック概念のモデル内符号化を完全に網羅する利点がある。
その結果, 個々のグローバルな概念エンコーディングの局所的認識と使用法に大きな違いが認められた。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:40:40 GMT)
Contrastive-Adversarial and Diffusion: Exploring pre-training and fine-tuning strategies for sulcal identification [3.0] 対人学習、コントラスト学習、拡散認知学習、通常の再構成学習といった技術が標準となっている。
この研究は、ニューラルネットワークの学習プロセスを強化するために、事前学習技術と微調整戦略の利点を解明することを目的としている。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:44:51 GMT)
Face processing emerges from object-trained convolutional neural networks [3.0] ドメイン・ジェネラル・メカニズムは、顔に特別な事前トレーニングを加えることなく、顔処理がニューラルネットワークから現れることを実証している。
私たちはCNNをオブジェクトのみにトレーニングし、顔の認識と表現能力と、顔のように見えるオブジェクトをテストしました。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:35:33 GMT)
Uniform vs. Lognormal Kinematics in Robots: Perceptual Preferences for Robotic Movements [3.0] 共同作業ロボットやコボットは、共通の作業環境で人間と対話する。
本論文は,人間がロボットの移動を好むか,ロボットの動作を好むかを分析することを目的とする。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:36:47 GMT)
Large Language Model for Mental Health: A Systematic Review [2.9] 大規模言語モデル(LLM)は、デジタルヘルスの潜在的な応用に対して大きな注目を集めている。
この体系的なレビューは、早期スクリーニング、デジタル介入、臨床応用におけるその強みと限界に焦点を当てている。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:55:17 GMT)
A Machine Learning Approach for Identifying Anatomical Biomarkers of Early Mild Cognitive Impairment [2.9] アルツハイマー病(英語: Alzheimer's Disease、AD)は、認知機能や運動機能に障害を与え、老化に主に影響を及ぼす進行性神経変性疾患である。
本研究では,MRIを用いたバイオマーカー選択のための機械学習手法の包括的解析を行うことを目的とする。
角膜皮質、海馬、側心室、眼窩前頭皮質などの脳領域は、初期の認知機能低下の過程で大きな影響を及ぼすと考えられている。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:12:05 GMT)
Spectraformer: A Unified Random Feature Framework for Transformer [2.9] 本稿では,Transformerの線形化におけるカーネル関数の近似と学習のための統合フレームワークであるSpectraformerを紹介する。
実験の結果,従来のSOTAランダム機能であるTransformerよりも23.4%高速なトレーニング時間と25.2%低いメモリ消費の新たな組み合わせが得られた。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:45:26 GMT)
Semantic In-Domain Product Identification for Search Queries [2.8] 本稿では,ユーザ行動データからプロダクトをトレーニングするための新しいアプローチを提案する。
我々のモデルでは、デプロイされた表面をクリックしてCTRが25%向上した。
アプリカードの2倍の増加は、製品の可視性を高めるのに役立つ。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:01:27 GMT)
Predicting Many Properties of Crystals by a Single Deep Learning Model [2.8] 本稿では,空間群,要素,単位セル情報を統合したトランスフォーマーベースのフレームワークであるCrystalBERTを紹介する。
これらの特徴を全て取り入れることで、以前の研究を超越し、以前に分類されたトポロジカルな資料を同定し、トポロジカルな分類において91%の精度を達成できる。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:56:00 GMT)
HLOB -- Information Persistence and Structure in Limit Order Books [2.8] 本稿では,制約順序書の中間価格変化予測のための大規模ディープラーニングモデルについて紹介し,HLOBと命名する。
我々は、NASDAQ取引所で取引された15株を含む3つの現実世界のLimit Order Bookデータセット上で、9つの最先端のディープラーニング代替品に対して、我々のモデルをテストした。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:46:44 GMT)
Subgradient Convergence Implies Subdifferential Convergence on Weakly Convex Functions: With Uniform Rates Guarantees [2.7] 非平滑な非平均近似最適化では、サブディファレンシャルマッピングの均一収束を理解することは、リスクのサンプルの定常点を解析するために重要である。
この研究は、下次写像の一様収束と下次写像の経験収束を結びつける。
ハウスドルフ計量によって測定された偏微分凸コンポジットに対する一様収束率を導出する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:20:41 GMT)
Reconstructing Interpretable Features in Computational Super-Resolution microscopy via Regularized Latent Search [2.7] 改良されたディープラーニングアプローチは、2つの画像解像度またはモダリティ間のマッピングを学習することで、顕微鏡画像の解像度を人工的に向上させることができる。
GAN潜時探索に基づく最近の手法では、ペア画像を必要としない解像度が大幅に向上した。
本稿では,正則化潜在探索(RLS)に基づく高分解能超解法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:20:46 GMT)
Exploring the impact of traffic signal control and connected and automated vehicles on intersections safety: A deep reinforcement learning approach [2.7] この研究は、DQN(Deep Q Network)を用いて、CAVとHuman Drive Vehicles(HDV)の交通信号と運転行動を制御する。
これらの結果から,CAVとDQNを併用した交通信号制御による後方・横断競合の大幅な低減が示された。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:17:19 GMT)
Leveraging Many-To-Many Relationships for Defending Against Visual-Language Adversarial Attacks [2.5] 本稿では,視覚言語(VL)モデルに対する敵対的攻撃に対する防衛戦略を初めて検討する。
我々は,敵の強靭性を高めるため,IMRにおけるN:N関係の活用に焦点をあてる。
画像・テキスト・ペアのアライメントは,防衛戦略の有効性に不可欠であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:20:02 GMT)
A note on the error analysis of data-driven closure models for large eddy simulations of turbulence [2.5] データ駆動型乱流閉鎖モデルを用いた流路予測における誤差伝搬の数学的定式化について述べる。
データ駆動クロージャモデルを用いて予測誤差の上限を求める。
また, この誤差は, ロールアウト時間とシステムジャコビアン上界とともに指数関数的に伝播することを示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:39:12 GMT)
Machine Learning in Short-Reach Optical Systems: A Comprehensive Survey [2.4] 本稿では,短距離通信における機械学習技術の応用について概説する。
本稿では,機械学習信号処理における時系列手法の新しい分類法を提案する。
我々は,短時間の光通信システムにおいて,より実用的で効率的な機械学習アプローチの展開の道を開くことを目的としている。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:25:16 GMT)
STIQ: Safeguarding Training and Inferencing of Quantum Neural Networks from Untrusted Cloud [2.3] 信頼できないプラットフォームに量子モデルをデプロイまたはホストすることは、数多くのセキュリティ上の懸念をもたらす。
この脆弱性は、トレーニングや推論中にクラウドプロバイダがこれらの回路に完全にアクセスすることに由来する。
クラウドベースの敵に対するQNNの保護を目的とした,新たなアンサンブルベースの戦略であるSTIQを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:09:46 GMT)
Can GPT Redefine Medical Understanding? Evaluating GPT on Biomedical Machine Reading Comprehension [2.3] 大規模言語モデル(LLM)は、異なる領域における多くのタスクにおいて顕著なパフォーマンスを示している。
本研究では,4つの閉書バイオメディカル機械読解ベンチマークを用いてGPTの評価を行った。
本稿では,ベクトルデータベースの利用を緩和するImplicit Retrieval Augmented Generation (RAG) というプロンプト戦略を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:12:53 GMT)
Causal Inference from Slowly Varying Nonstationary Processes [2.3] 観測データヒンジからの因果推論は、データ生成機構による原因と効果の非対称性に依存する。
本稿では,時間変化フィルタと定常雑音を用いた新しい構造因果モデルを提案し,非定常性から非対称性を利用して因果同定を行う。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:33:47 GMT)
Optimizing Split Points for Error-Resilient SplitFed Learning [2.3] SplitFedは、FL内の個々のクライアントの計算負担を最小限に抑え、プライバシーを維持しながらSLを並列化する。
本研究では,SplitFedのパケット損失に対するモデル分割点のレジリエンスについて検討した。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:03:27 GMT)
Comment on Chiribella et al., Phys. Rev. Lett. 132 (2024) 190201, arXiv:2301.10885 [2.2] この記事では、非可換な量子プロジェクタを無視し、したがってヒルベルト空間量子論と矛盾しない方法で、量子文脈における古典的'を定義する。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:48:20 GMT)
A Comprehensive Survey on Evaluating Large Language Model Applications in the Medical Industry [2.2] 大規模言語モデル(LLM)は、言語理解と生成の高度な能力で様々な産業に影響を与えている。
この包括的調査は、医療におけるLSMの広範な適用と必要な評価を概説する。
本調査は,臨床環境,医療用テキストデータ処理,研究,教育,公衆衛生への意識といった分野におけるLCM応用の詳細な分析を行うために構成されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:50:43 GMT)
IncidentResponseGPT: Generating Traffic Incident Response Plans with Generative Artificial Intelligence [2.2] 道路事故による交通渋滞は、都市環境において大きな課題となり、汚染、経済的な損失、交通渋滞が増大する。
本稿では,迅速な情報提供,適応可能な交通事故対応計画を提供することで,交通管理当局を支援する革新的なソリューションであるインシデントレスGPTを紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:50:48 GMT)
Global optimization in variational quantum algorithms via dynamic tunneling method [2.2] 従来の動的トンネル流れを量子状態の距離測定に応用する。
我々の大域的最適化アルゴリズムは、逆場イジングモデルに対する変分量子固有解法に適用される。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:56:44 GMT)
Qiskit Code Assistant: Training LLMs for generating Quantum Computing Code [2.0] 本稿では,量子コンピューティングの分野を専門とする Code LLM のトレーニングに焦点をあてる。
量子コンピューティングに特化したコードLLMは、量子コンピューティングと量子情報理論の基本的な理解を必要とする。
我々は,Qiskitライブラリを用いて,高品質な量子コードを生成するための Code LLMs のトレーニングについて論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:21:00 GMT)
Algorithmic Transparency and Participation through the Handoff Lens: Lessons Learned from the U.S. Census Bureau's Adoption of Differential Privacy [2.0] 我々は、2020年国勢調査のための情報開示回避システムにおいて、米国国勢調査局による差分プライバシーの採用について検討する。
このケーススタディは、技術的なシフトが価値をどう意味するかについての理解を深めようとしている。
このケーススタディから,アルゴリズムの透明性と参加に関する理解を深めるための3つの教訓を提示する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:29:16 GMT)
EntProp: High Entropy Propagation for Improving Accuracy and Robustness [2.0] ディープニューラルネットワーク(DNN)は、トレーニング中のものと異なる分布外領域に一般化するのに苦労する。
実践的な応用においては、DNNが標準精度と配布外領域に対する堅牢性の両方を持つことが重要である。
エントロピーを増大させ,サンプルを分布内領域からさらに遠ざける2つの手法,すなわちデータ拡張と自由敵対的トレーニングを導入する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:36:20 GMT)
Proof Number Based Monte-Carlo Tree Search [1.9] 本稿では,モンテカルロ木探索(MCTS)とProof-Number Search(PNS)を組み合わせた新しいゲーム検索アルゴリズムであるPN-MCTSを提案する。
本研究は,MCTS木に蓄積された証明値と防腐数から得られる付加的な知識を活用可能な3つの領域を定義する。
実験の結果、PN-MCTSは全てのテストされたゲーム領域でMCTSを上回り、ライン・オブ・アクションで96.2%の勝利率を達成した。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:49:31 GMT)
Exploiting Chaotic Dynamics as Deep Neural Networks [1.9] カオスの本質は、様々な最先端のディープニューラルネットワークで見ることができる。
本フレームワークは精度,収束速度,効率の点で優れた結果を提示する。
この研究は、情報処理において長い間見過ごされてきたカオスの統合のための新しい道を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:03:23 GMT)
ResNCT: A Deep Learning Model for the Synthesis of Nephrographic Phase Images in CT Urography [1.9] ResNCTモデルは、非コントラストおよび尿路画像入力から合成ネフロート画像を生成することに成功した。
このモデルは、CTU検査に対する放射線線量33%の減少により、ネフローゼ相の獲得を除去する手段を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:12:44 GMT)
CiliaGraph: Enabling Expression-enhanced Hyper-Dimensional Computation in Ultra-Lightweight and One-Shot Graph Classification on Edge [1.9] CiliaGraphはグラフ分類のための拡張表現型だが超軽量なHDCモデルである。
CiliaGraphはメモリ使用量を削減し、トレーニング速度を平均292倍に高速化する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:22:59 GMT)
Physics-Aware Neural Implicit Solvers for multiscale, parametric PDEs with applications in heterogeneous media [1.8] パラメタライズされた部分微分方程式(PDE)のためのサロゲート学習のための新しいデータ駆動型フレームワークを提案する。
確率論的学習目的(probabilistic, learning objective)は、重み付けされた残留物を用いてPDEを探索し、仮想データのソースを提供する。
これは、物理を意識した暗黙の解法と組み合わせられ、元のPDEのより粗い、離散化されたバージョンで構成されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:01:49 GMT)
Privacy Preserving Data Imputation via Multi-party Computation for Medical Applications [1.8] 本研究では,セキュアなマルチパーティ計算を用いた機密データに対するプライバシ保護計算手法について検討する。
患者データの保護の重要性を考慮した医療・医療分野を特に対象とする。
糖尿病データセットの実験では、プライバシ保護の計算手法の正しさが検証され、最大の誤差は10~3ドル(約3万3000円)だった。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:36:42 GMT)
Large Language Models Reflect Human Citation Patterns with a Heightened Citation Bias [1.8] サイテーションの実践は科学知識の構造を形成するのに不可欠である。
GPT-4のような大規模言語モデル(LLM)の出現は、これらのプラクティスに新たなダイナミクスをもたらす。
本稿では,GPT-4で推奨される参照の特性と潜在的なバイアスについて分析する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:50:49 GMT)
PARIS: Personalized Activity Recommendation for Improving Sleep Quality [1.7] 睡眠不足の人は、身体的・精神的苦痛、活動制限、不安、痛みを報告しやすい。
身体活動と睡眠の質の関係を利用して、機械学習技術を用いて睡眠を改善する方法を探る。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:06:24 GMT)
Network Analytics for Anti-Money Laundering -- A Systematic Literature Review and Experimental Evaluation [1.7] 本稿では、アンチマネーロンダリング(AML)のためのNA(Network Analytics)に関する文献を網羅し、体系的にレビューする。
Web of Science と Scopus データベースの97論文を特定し分析した結果,Bockel-Rickermann らによる不正分析フレームワークによるアプローチの分類が得られた。
このフレームワークは一般公開されているEllipticデータセットに適用され、手動機能エンジニアリング、ランダムウォークベースのメソッド、ディープラーニングGNNを実装している。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:48:52 GMT)
Transformers as Neural Operators for Solutions of Differential Equations with Finite Regularity [1.7] まず、変換器が演算子学習モデルとして普遍近似特性を持つ理論基盤を確立する。
特に, Izhikevich ニューロンモデル, 分数次 Leaky Integrate-and-Fire (LIFLIF) モデル, 1次元方程式 Euler の3つの例を考える。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:10:24 GMT)
GA-SmaAt-GNet: Generative Adversarial Small Attention GNet for Extreme Precipitation Nowcasting [1.6] 本稿では,極度の降水量予測のための新しい生成逆解析フレームワークであるGA-SmaAt-GNetモデルを提案する。
オランダの降水量データを用いて,SmaAt-GNetとGA-SmaAt-GNetの性能評価を行った。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:41:41 GMT)
Boundary Treatment for Variational Quantum Simulations of Partial Differential Equations on Quantum Computers [1.6] 本稿では偏微分方程式によって記述された初期境界値問題を解くための変分量子アルゴリズムを提案する。
このアプローチでは、現在のノイズの多い中間スケール量子時代の量子コンピュータに適した古典的/量子的ハードウェアを使用する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:52:30 GMT)
Disambiguate Entity Matching using Large Language Models through Relation Discovery [1.6] 本稿では、純粋に意味的な類似点から、エンティティ間の「関係」を理解し定義することへ焦点を移す新しいアプローチを提案する。
本手法では,タスクに関連する一連の関係を事前に定義することにより,類似性のスペクトルをより効率的にナビゲートすることができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:40:55 GMT)
AudioProtoPNet: An interpretable deep learning model for bird sound classification [1.6] 本稿では,そのモデルアーキテクチャによる固有解釈性を提供する音声分類に,Prototypeal Part Network (ProtoPNet) を適用した。
本手法は,特徴抽出のためのConvNeXtバックボーンアーキテクチャに基づいて,訓練データのスペクトログラムを用いて各鳥類のパターンを学習する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:09:17 GMT)
Towards Next-Generation Urban Decision Support Systems through AI-Powered Generation of Scientific Ontology using Large Language Models -- A Case in Optimizing Intermodal Freight Transportation [1.6] 本研究では,事前学習された大規模言語モデル(LLM)を活用する可能性について検討する。
推論コアとしてChatGPT APIを採用することで、自然言語処理、メソノロジーベースのプロンプトチューニング、トランスフォーマーを含む統合ワークフローを概説する。
我々の方法論の成果は、広く採用されているオントロジー言語(OWL、RDF、SPARQLなど)の知識グラフである。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:40:31 GMT)
ÚFAL LatinPipe at EvaLatin 2024: Morphosyntactic Analysis of Latin [1.6] 我々は、Eva 2024 Dependency Parsingタスクの受賞申請である LatinPipe を提示する。
本システムでは, ベースと大型の事前学習型LMの微調整による結合が構成されている。
一般に公開されている7つのラテンコーパスからのサンプリングによって訓練される。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:37:39 GMT)
Are Large Language Models Chameleons? [1.6] 我々は,プロンプトがバイアスや多様性に与える影響が基本であり,文化的,年齢的,性別的バイアスが顕著であることを示す。
個人決定や集団行動のモデル化にLLMを使用する前に,プロンプトの堅牢性と変動性を分析することが重要である。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:54:22 GMT)
Introducing Adaptive Continuous Adversarial Training (ACAT) to Enhance ML Robustness [1.5] ACATは、継続的学習セッション中に、敵のトレーニングサンプルをモデルに統合する。
MLをベースとしたSPAMフィルタの精度は,3回のトレーニング後に69%から88%に向上した。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:23:35 GMT)
TRAMBA: A Hybrid Transformer and Mamba Architecture for Practical Audio and Bone Conduction Speech Super Resolution and Enhancement on Mobile and Wearable Platforms [1.5] 音響・骨伝導音声強調のためのハイブリッドトランスであるTRAMBAとMambaアーキテクチャを提案する。
TRAMBAは、データサンプリングや送信を少なくすることで、ウェアラブルのバッテリ寿命を最大160%改善することを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:46:57 GMT)
Unit-Aware Genetic Programming for the Development of Empirical Equations [1.4] 本稿では,未知単位を「ジョーカー」として伝播する次元解析手法を提案する。
基礎的真理を持つデータセットの実験は、エボリューティブ・カリングの同等の性能を示し、次元解析なしでベースラインへの多目的アプローチを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:57:00 GMT)
Vocos: Closing the gap between time-domain and Fourier-based neural vocoders for high-quality audio synthesis [1.4] フーリエスペクトル係数を直接生成する新しいモデルであるVocosを提案する。
計算効率を大幅に向上し、時間領域のニューラルネットワークのボコーディングアプローチに比べて、桁違いにスピードが向上する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:21:47 GMT)
SynerGraph: An Integrated Graph Convolution Network for Multimodal Recommendation [1.4] 本稿では,マルチモーダルデータの統合と浄化に焦点をあてた,マルチモーダルレコメンデーションシステムに対する新しいアプローチを提案する。
各種データからノイズを除去するフィルタを開発し,提案手法の信頼性を高めた。
我々は、各データセットに対するトップKスパリフィケーションの影響を調査し、不適合と過適合のバランスをとる最適な値を発見した。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:18:32 GMT)
Physics-based material parameters extraction from perovskite experiments via Bayesian optimization [1.4] 有機金属ペロブスカイト半導体の基本材料パラメータを最大8まで抽出できる分析プラットフォームを開発した。
熱劣化の例としては、キャリア移動率とトラップアシスト組換え係数が顕著に低下することが示されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:33:14 GMT)
MetaToken: Detecting Hallucination in Image Descriptions by Meta Classification [1.4] トークンレベルの幻覚を無視可能なコストで検出する軽量バイナリ分類器であるMetaTokenを紹介する。
統計的解析から,これまでの研究で注目されていたLVLMの幻覚の要因を明らかにした。
提案手法の有効性を示す4種類のLVLMについて検討した。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:28:42 GMT)
A Comprehensive Benchmarking Analysis of Fault Recovery in Stream Processing Frameworks [1.3] 本稿では, クラウドネイティブ環境における障害復旧性能, 安定性, 回復時間に関する包括的解析を行う。
以上の結果から,Flinkは最も安定しており,最高の障害回復の1つであることが示唆された。
K Kafka Streamsは適切なフォールトリカバリパフォーマンスと安定性を示しているが、イベントレイテンシは高い。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:22:16 GMT)
Prototype Analysis in Hopfield Networks with Hebbian Learning [1.2] 高い相関状態を持つヘビアン学習は、劣化したメモリ性能をもたらす。
このような学習は、未学習状態が大きな相関部分集合の表現として現れるプロトタイプ形成に繋がることを示す。
このプロセスは、人間の認知におけるプロトタイプ学習と類似している。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:03:48 GMT)
Improved Robustness and Hyperparameter Selection in Modern Hopfield Networks [1.2] 現代のホップフィールドネットワークは、よりシャープな相互作用関数を許容することによって、古典的なホップフィールドネットワークを一般化する。
ネットワークの実装は、メモリベクトルとプローブベクトルのドット積に大きな指数を適用することに依存する。
この問題を詳細に記述し、元のネットワーク記述を変更して問題を緩和し、更新やトレーニング中にネットワークのダイナミクスを変更することはないことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:23:19 GMT)
Towards Information Theory-Based Discovery of Equivariances [1.2] 対称性の存在は、システムに厳密な制約のセットを課す。
並行して、複雑性に制約のある学習と行動の原則モデルが、情報理論の手法の利用を増大させる。
本稿では,学習と情報制約のある適応行動に関する多くの原則研究において,生産的基盤として機能する情報ボトルネック原理の新たな変種を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:50:02 GMT)
A Neural Network Transformer Model for Composite Microstructure Homogenization [1.2] 森田中法のような均質化法は、幅広い構成特性に対して急速な均質化をもたらす。
本稿では,様々なミクロ構造の知識を捉えたトランスフォーマーニューラルネットワークアーキテクチャについて述べる。
ネットワークは、履歴に依存し、非線形で、均質化されたストレス-ひずみ応答を予測する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:20:25 GMT)
Early Detection of Critical Urban Events using Mobile Phone Network Data [1.2] ネットワークシグナリングデータ(NSD)は、個人による携帯電話サービスに関する継続的な時間情報を提供する可能性がある。
NSDは、火災、大事故、スタンプ、テロ攻撃、スポーツやレジャーの集まりなど、重要な都市イベントの早期発見を可能にする。
本稿では,高度NSDが交通サービス消費の異常を検出できるという実証的証拠を提示する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:31:39 GMT)
Complexity and order in approximate quantum error-correcting codes [1.2] 量子回路の複雑性と近似量子誤差補正(AQEC)特性の厳密な接続を確立する。
我々の重要な発見は、サブシステムの分散が$O(k/n)$しきい値以下であれば、コード部分空間の任意の状態は、回路の複雑さの低い境界に従わなければならないということである。
AQECのこの理論は、多体量子系の量子複雑性と順序を理解するための汎用的なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 02:57:17 GMT)
Statistics of local level spacings in single- and many-body quantum chaos [1.2] 局所的なレベル間隔はランダム行列理論のアプローチで研究される。
量子系の大域的対称性とその内部的-カオス的または正規的-力学を同定する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:43:48 GMT)
Parameterized quantum circuits as universal generative models for continuous multivariate distributions [1.1] 量子回路は、回帰、分類、生成タスクにおける機械学習モデルの基盤として広く使われている。
本研究では,予測値のサンプリングベースモデルを解明し,そのような変動量子アルゴリズムの普遍性を証明する。
我々の結果は、生成的モデリングタスクにおける将来の量子回路の設計を導くのに役立つかもしれない。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:58:29 GMT)
Parallel Affine Transformation Tuning of Markov Chain Monte Carlo [1.1] 特に,サンプリング中のアフィン変換を適応的に学習するフレキシブルでユーザフレンドリなスキームを提案する。
提案手法とギブシアン極スライスサンプリングの組み合わせにより,比較的低い計算コストで高品質な試料が得られた。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:04:05 GMT)
An Open-Source Framework for Efficient Numerically-Tailored Computations [1.1] 本稿では,効率的な行列行列乗算を容易にするために,多機能なオープンソースフレームワークを提案する。
AI推論では、ResNet18、ResNet34、ResNet50、DenseNet121、DenseNet161、DenseNet169、VGG11といった最先端のニューラルネットワークモデルを検討する。
我々のアプローチは、すべてのケースにおけるエネルギー消費を一貫して減少させ、特にIEEE754-32の3.3倍、Bfloat16の1.4倍の3.3倍の削減を図っている。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:10:53 GMT)
Leveraging Time-Series Foundation Models in Smart Agriculture for Soil Moisture Forecasting [1.0] 本研究は土壌水ポテンシャルを予測するため,SOTA (State-of-the-art) 時系列基盤モデルである $texttTimeGPT$ を新たに適用した。
我々の結果は、$textttTimeGPT$が、過去の$psi_mathrmsoil$データのみを使用して、競合予測精度を達成することを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:16:03 GMT)
Deep Latent Variable Modeling of Physiological Signals [0.9] 潜時変動モデルを用いた生理モニタリングに関する高次元問題について検討する。
まず、光学的に得られた信号を入力として、心の電気波形を生成するための新しい状態空間モデルを提案する。
次に,確率的グラフィカルモデルの強みと深い敵対学習を組み合わせた脳信号モデリング手法を提案する。
第3に,生理的尺度と行動の合同モデリングのための枠組みを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:07:33 GMT)
Quantum Non-classicality from Causal Data Fusion [0.8] ベルの定理は、量子相関が古典的な原因と効果の理論と相容れないことを示している。
不均一な条件下で収集されたデータテーブルをまとめることを目的とした因果データ融合の問題点について検討する。
我々は,標準ベル非古典性の実現が不可能なシナリオにおいても,データ融合による量子非古典性の存在を実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:35:59 GMT)
Causal Data Fusion with Quantum Confounders [0.8] 量子実験は、古典的に再生できないような、古典的でないシグネチャで観測データや介入データを生成することができることを示す。
複数のデータテーブルの融合による非古典性は、量子資源で達成可能であることを示す。
我々の研究は、介入を組み込むことが、標準ベルの不平等違反を超えた非古典性を検出する強力なツールであることを示している。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:10:30 GMT)
Gemini & Physical World: Large Language Models Can Estimate the Intensity of Earthquake Shaking from Multi-Modal Social Media Posts [0.8] 本稿では,ソーシャルメディアデータとCCTV映像を用いた地盤揺らぎ強度の推定手法を提案する。
生成AIと自然言語処理を利用した非構造化データから関連情報を抽出できることを実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:23:34 GMT)
SEMF: Supervised Expectation-Maximization Framework for Predicting Intervals [0.8] このフレームワークは、完全なデータまたは欠落したデータセットの予測間隔を生成する。
SEMFは既存の機械アルゴリズムとシームレスに統合される。
その結果、最先端技術の進歩の可能性が浮き彫りになった。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:17:13 GMT)
LLMs achieve adult human performance on higher-order theory of mind tasks [0.8] 本稿では,手書きテストスイートであるMulti-Order Theory of Mind Q&Aを導入することで,先行作業の基盤となる。
5つの大きな言語モデルの性能を、新しく集まった成人のベンチマークと比較する。
We found that GPT-4 and Flan-PaLM reach to adult-level and near adult-level performance on ToM task。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:31:16 GMT)
BaboonLand Dataset: Tracking Primates in the Wild and Automating Behaviour Recognition from Drone Videos [0.8] 本研究では,バブーン検出,追跡,行動認識のための,ドローンビデオからの新たなデータセットを提案する。
Baboon検出データセットは、ドローンビデオにすべてのbaboonをバウンディングボックスで手動でアノテートすることで作成されている。
行動認識データセットは、各動物を中心としたビデオサブリージョンであるミニシーンにトラックを変換することで生成される。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:45:07 GMT)
On Dissipativity of Cross-Entropy Loss in Training ResNets [0.7] トレーニングされたResNetがターンパイク現象を示すことを示す。
これは与えられた分類タスクに適した非常に浅いネットワークを見つけるのに使うことができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:52:53 GMT)
Towards Global Glacier Mapping with Deep Learning and Open Earth Observation Data [0.7] Glacier-VisionTransformer-U-Net (GlaViTU) は畳み込み変換型ディープラーニングモデルである。
合成開口レーダデータ、すなわち後方散乱と干渉コヒーレンスを追加することで、利用可能なすべての領域の精度が向上する。
世界中の氷河の9%をカバーするベンチマークデータセットをリリースしました。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:58:03 GMT)
Crowdsourcing with Difficulty: A Bayesian Rating Model for Heterogeneous Items [0.7] 応用統計学と機械学習では、訓練に使用される「金の標準」はしばしば偏りがあり、ほとんど常にうるさい。
DawidとSkeneの人気の高いクラウドソーシングモデルは、レーダ(コーダ、アノテータ)の感度と特異性を調整するが、トレーニングのために収集されたレーティングデータの分布特性を捉えない。
本稿では,難易度,差別性,推測可能性に項目レベルの効果を加えることで,コンセンサスカテゴリを推測できる汎用計測エラーモデルを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:59:28 GMT)
Assessing the Efficacy of Deep Learning Approaches for Facial Expression Recognition in Individuals with Intellectual Disabilities [0.7] 我々は、知的障害者の表情を認識するために、異なるアプローチで12の畳み込みニューラルネットワークを訓練する。
本研究は,ユーザ固有の訓練手法を用いて,この集団内での表情認識の必要性を示唆するものである。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:23:08 GMT)
Vulnerable Road User Detection and Safety Enhancement: A Comprehensive Survey [0.7] 脆弱な道路利用者(VRU)を含む交通事故は、世界的な道路事故のかなりの割合を占める。
高度な信号処理と機械学習技術を組み合わせた交通通信エコシステムの進歩は、多様なセンサーからのデータの活用を促進している。
本稿では,VRUの安全性を高めるための最先端技術と方法論を包括的に調査する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:42:10 GMT)
Pessimism of the Will, Optimism of the Intellect: Fair Protocols with Malicious but Rational Agents [0.7] フェアネスプロトコルの研究のためのゲームベースのフレームワークを提案する。
強いセキュア均衡の概念に基づいており、ゲーム理論の概念的およびアルゴリズム的ツールボックスを利用する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:15:36 GMT)
Linear Logic and Quantum Error Correcting Codes [0.7] 本稿では,量子誤り訂正符号に基づく乗法証明ネットの削減に関する視点を開発する。
各証明ネットに対して、カット除去が誤り訂正に対応するような方法で、コードを関連付ける。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:51:25 GMT)
DGRC: An Effective Fine-tuning Framework for Distractor Generation in Chinese Multi-choice Reading Comprehension [0.7] 本報告では,中国におけるNQDGのためのDGRCという微調整フレームワークについて紹介する。
実験の結果,DGRCは生成性能を著しく向上し,BLEUスコアの2.5倍以上の改善が得られた。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:47:01 GMT)
Non-equilibrium Quantum Monte Carlo Algorithm for Stabilizer Rényi Entropy in Spin Systems [0.6] 量子マジック(英: Quantum magic)または非安定化器性(英: nonstabilizerness)は、量子系の重要な特徴である。
サインプロブレムフリーハミルトニアンを持つスピン系において、量子魔法の尺度の1つである安定化器R'enyiエントロピーを計算するための新しい効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:59:02 GMT)
Hybrid Preference Optimization: Augmenting Direct Preference Optimization with Auxiliary Objectives [0.5] 大規模言語モデル(LLM)を協調するハイブリッドアプローチを提案する。
DPO の暗黙的な報酬分解に対する単純な拡張により、任意の補助報酬の集合を最大化するために LLM をチューニングできる。
提案手法であるHybrid Preference Optimization (HPO) は,ユーザの好みと補助的な設計目的の両方に効果的に一般化できることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:48:47 GMT)
On stability of k-local quantum phases of matter [0.5] 一般量子低密度パリティチェック符号に対応するハミルトンのユークリッドに対するエネルギーギャップの安定性を解析する。
局所ハミルトニアンは広い零温度エントロピーを持つことができるので、熱力学の第3法則の意味を論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:00:20 GMT)
Rydberg platform for non-ergodic chiral quantum dynamics [0.5] 本稿では, ライドベルク原子におけるキラル相互作用の機構を, 指向性アンチブロッケード条件を用いて提案する。
我々は、原子に作用する2つの駆動場の強度を単に調整することで、傷跡、閉じ込め、あるいは局在化を通じて非エルゴード的挙動を観察する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:08:14 GMT)
Quantum error detection with noise-resilient parity-controlled gate in two-dimensional Rydberg atom arrays [0.4] 量子エラー検出は量子ビットパリティの正確な測定に依存する。
本稿では,2次元リドバーグ原子配列内の量子誤差を検出するためのレジリエントパリティ制御ゲートを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:13:57 GMT)
WTTFNet: A Weather-Time-Trajectory Fusion Network for Pedestrian Trajectory Prediction in Urban Complex [0.4] ベースラインディープニューラルネットワークアーキテクチャの性能向上を目的として,新しい気象時トラジェクトリ融合ネットワーク(WTTFNet)を提案する。
歩行者施設工学、公共空間開発、技術主導の小売など、多くの用途で利用することができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:56:54 GMT)
Efficient and operational quantifier of divisibility in terms of channel discrimination [0.4] 本稿では,量子チャネルの可分性を検出し,量子チャネルがいかに非可分であるかを定量化する手法を提案する。
半定値プログラミングにより効率よく解答できることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:13:59 GMT)
Gradient Guided Hypotheses: A unified solution to enable machine learning models on scarce and noisy data regimes [0.4] データ品質問題に対処するために,アーキテクチャに依存しないGGH(Gradient Guided hypotheses)を提案する。
GGHは仮説から勾配を解析し、データの異なるパターンとおそらく矛盾するパターンのプロキシとして分析する。
本研究は,GGHを様々なアプリケーションにおけるデータ品質とモデル性能を向上させるための有望なソリューションとして提示する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:51:40 GMT)
A self-referenced optical phase noise analyzer for quantum technologies [0.4] 我々は、量子技術応用のためのコスト効率の良い光位相ノイズ解析器を提示し、特徴付ける。
この実装において達成されたノイズフロアは、低コストで全ストック構成であり、低複雑さの位相ノイズアナライザであり、商用製品と比較して好適である。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:09:55 GMT)
High-Performance Hybrid Algorithm for Minimum Sum-of-Squares Clustering of Infinitely Tall Data [0.3] 本稿では,Infinitely Tall Data (MSSC-ITD) の最小二乗クラスタリングという,クラスタリング問題の新しい定式化を提案する。
現代の高性能コンピューティング技術を利用することで、HPClustは、有効性、計算効率、拡張性といった主要なクラスタリング指標を強化する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:07:17 GMT)
Model Agnostic Defense against Adversarial Patch Attacks on Object Detection in Unmanned Aerial Vehicles [0.3] 無人航空機(UAV)のキーコンポーネントとなる物体検出
物体探知機に対する 敵のパッチ攻撃は 上流のタスクのパフォーマンスを 著しく損なう可能性がある
本稿では,敵パッチ攻撃の脅威に対するモデル非依存防衛機構を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:19:07 GMT)
ParsEval: Evaluation of Parsing Behavior using Real-world Out-in-the-wild X.509 Certificates [0.2] X.509証明書は、認証とデータの整合性を有効にすることで、インターネット上のセキュアな通信を確立する上で重要な役割を担っている。
インターネット全体の使用のため、複数のプログラミング言語に異なる実装があり、大規模で断片化されたエコシステムにつながっている。
この研究は、WolfSSLのX.509解析モジュールの異常と、エコシステムに根本的な違いがあることを明らかにする。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:15:12 GMT)
Towards Data-Driven Electricity Management: Multi-Region Harmonized Data and Knowledge Graph [0.2] 住宅部門は世界の電力消費の25%を占めている。
複数の地域にまたがる家庭レベルでの均一な消費データ不足は、大規模な研究を妨げる。
本稿では、公開されているソースからコンパイルされ、均一なフォーマットで提示されるマルチリージョンデータセットについて紹介する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:30:34 GMT)
MAGIC: Modular Auto-encoder for Generalisable Model Inversion with Bias Corrections [0.2] 我々は、標準オートエンコーダのデコーダステージを物理モデルに置き換え、バイアス補正層で置き換える。
この一般化可能なアプローチは、モデルを同時に反転させ、バイアスの性質について強い仮定をすることなく、そのバイアスをエンドツーエンドで補正する。
我々の手法は、バイアスを明示的にフィルタリングすることなく、古典的なアプローチの結果に一致または超えます。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:11:10 GMT)
Semiring Activation in Neural Networks [0.2] ニューラルネットワークでの使用に適したセミリングに基づいて、トレーニング可能な非線形演算子のクラスを導入する。
トレーニング可能なセミリング演算子のアクティベーション関数を置き換える実験を行い、これらが完全に接続されたネットワークに組み込むことができることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:47:45 GMT)
Automated Model Selection for Tabular Data [0.2] Rの混合効果線形モデルライブラリは、モデル設計において対話的な機能の組み合わせを提供することができる。
特徴的相互作用を取り入れたデータセットの予測のためのモデル選択プロセスを自動化することを目的としている。
このフレームワークには、優先順位に基づくランダムグリッド検索とグレディ検索という、2つの異なる機能選択のアプローチが含まれている。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:03:16 GMT)
On the modification and revocation of open source licences [0.1] 本稿では、オープンソースコントリビュータがユーザに最新のモデルの更新を強制する権利のサブセットを作成することを主張する。
オープンソースAIモデルに関連する法的、評判、道徳的なリスクは、下流の使用をもっとコントロールできるコントリビュータを正当化する可能性がある。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:00:25 GMT)
On the Condition Monitoring of Bolted Joints through Acoustic Emission and Deep Transfer Learning: Generalization, Ordinal Loss and Super-Convergence [0.1] 本稿では, 畳み込みニューラルネットワーク(CNN)を用いた深部伝達学習を用いて, 音響放射を用いたボルト付き関節のモニタリングを行う。
3本のボルトで接続された2本の細いビームからなる構造であるORION-AEベンチマークを用いて,本手法の性能評価を行った。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:07:21 GMT)
Analyzing Chat Protocols of Novice Programmers Solving Introductory Programming Tasks with ChatGPT [0.1] 大規模なドイツの大学の学生は、ChatGPTの助けを借りてプログラミング演習の解決に動機づけられた。
データは、プロンプト、頻度、チャットの進行状況、内容、その他の利用パターンについて分析された。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:38:32 GMT)
Tackling Cyberattacks through AI-based Reactive Systems: A Holistic Review and Future Vision [0.1] 本稿では,AIによる脅威応答システムの最近の進歩を包括的に調査する。
AI反応ドメインに関する最新の調査は2017年に実施された。
合計で7つの研究課題が特定され、潜在的なギャップを指摘し、開発分野の可能性を示唆している。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:14:12 GMT)
Quantum gravity signatures in gravitational wave detectors placed inside a harmonic trap potential [0.1] 本研究は,高調波トラップ内にのみ設置された偏光と,入ってくる重力波と相互作用する重力波の一般重力波検出器について考察する。
本モデルでは, 半古典的アナルージュに完全に欠落した単一重力子の自然放出を観測した。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:29:40 GMT)
CC-GPX: Extracting High-Quality Annotated Geospatial Data from Common Crawl [0.1] Common Crawl (CC) コーパスは2008年以来9.5ペタバイト以上のデータを含む最大のオープンウェブクローリングデータセットである。
本稿では,CC内のGPXファイルから注釈付きユーザ生成トラックを抽出する効率的なパイプラインを提案する。
得られたマルチモーダルデータセットには、人間による記述の1,416ペアと、最新のCCリリース6つのMultiLineStringベクターデータが含まれている。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:16:28 GMT)
Why Reinforcement Learning in Energy Systems Needs Explanations [0.0] 本稿では,エネルギーシステムにおける強化技術の適用と,これらのモデルの説明がいかに役立つかについて論じる。
経済発展に伴い、インフラの複雑さは劇的に増大し、同様に化石燃料から再生可能エネルギーへのシフトに伴い、このようなシステムには恐ろしい必要性がある。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:09:00 GMT)
WRDScore: New Metric for Evaluation of Natural Language Generation Models [0.0] 仮定に頼らずに精度とリコールを計測する新しい指標を提案する。
予測シーケンスと参照シーケンスの直接重複を測定することは、これらの微妙さを捉えることはできない。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:00:46 GMT)
VisTA-SR: Improving the Accuracy and Resolution of Low-Cost Thermal Imaging Cameras for Agriculture [0.0] 本稿では,農業用低コスト熱画像カメラの温度精度と画質を改善するためのアプローチを提案する。
この研究には、温度測定の校正と検証、ペア画像データセットの取得、農業用熱画像に適したディープラーニングネットワークの開発が含まれる。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:00:20 GMT)
Unified linear response theory of quantum electronic circuits [0.0] 我々は、量子的挙動と緩和と軽視によってもたらされる非単体効果の両方を捉える統一理論を開発する。
我々は,2重量子ドット電荷量子ビットとマヨラナ量子ビットに適用し,アディバティックから共鳴,コヒーレントから非コヒーレントまで連続的にシステムを記述する能力を示す。
我々のモデルは、ハイブリッド量子古典回路の設計を容易にし、量子ビット制御と量子状態の読み出しをシミュレーションする。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:44:18 GMT)
Transforming Information Systems Management: A Reference Model for Digital Engineering Integration [0.0] デジタルエンジニアリングの実践は、情報保証とシステムライフサイクル管理を改善するために、重要かつ未使用のポテンシャルを提供する。
本稿では、モデルベースのエンジニアリング、デジタルスレッド、統合された製品ライフサイクルといった機能が、一般的なフレームワークのギャップにどのように対処できるかを検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:49:47 GMT)
Transfer learning approach to Classify the X-ray image that corresponds to corona disease Using ResNet50 pretrained by ChexNet [0.0] ImageNetデータセットとCheXNetデータセットによって事前訓練されたResNet50に基づいて、ディープモデルをトレーニングする。
Kaggle氏が導入した不均衡なCoronaHack Chest X-Rayデータセットに基づいて、バイナリとマルチクラスの分類を適用した。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:18:50 GMT)
Topological Perspectives on Optimal Multimodal Embedding Spaces [0.0] 本稿では,CLIPと最近のCLOOBの比較分析について述べる。
提案手法は,モダリティギャップドライバ,高次元と低次元の両方に存在するクラスタリング構造,および各埋め込み空間を形成する上で,次元崩壊が果たす重要な役割を包括的に検討することを含む。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:28:23 GMT)
The hydrogen atom perturbed by a 1-dimensional Simple Harmonic Oscillator (1d-SHO) potential [0.0] 一定の1次元弱二次ポテンシャルによって摂動された水素原子は、一階摂動理論において解かれる。
この結果の物理的応用は、例えば、微細構造効果よりも弱い二次ゼーマン効果の研究において見られる。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:29:12 GMT)
The ethical situation of DALL-E 2 [0.0] DALL-E 2はこのドメインで最大の名前の1つである。
本稿では,AI画像生成システムの倫理的意味を分析する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:18:13 GMT)
Text clustering with LLM embeddings [0.0] テキストの埋め込みとクラスタリングアルゴリズムの違いが、テキストデータセットのクラスタリングに与える影響について検討する。
その結果、LLM埋め込みは構造化言語のニュアンスを捉えるのに優れており、BERTは性能において軽量な選択肢を導いていることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:16:13 GMT)
Teaching ideal quantum measurement, from dynamics to interpretation [0.0] テストシステムSと装置Aとの相互作用の過程として、理想的な測定を解析する。
保存法則は2つの独立した緩和機構を持つ。
ボルンの法則は、試験された可観測物の保存法則から生じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:36:06 GMT)
Stability of mixed-state quantum phases via finite Markov length [0.0] 量子条件相互情報(CMI)が指数関数的に減衰する長さ尺度であるマルコフ長を提案する。
マルコフ長はその陰性遷移を除いて至る所で有限であることが示される。
これは混合状態相転移が陰極性転移と一致することを示唆し、準局所復号チャネルも示唆している。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:36:01 GMT)
Spiketrum: An FPGA-based Implementation of a Neuromorphic Cochlea [0.0] 本稿では,汎用スパイク符号化アルゴリズムであるSpketrumを活用するFPGAベースのニューロモルフィック・コクリーを提案する。
コチェリーモデルは、音波振動を生物学的に現実的な音波スパイク列車に変換するのに優れている。
音波形を超えて様々な感覚情報をエンコードする能力は、現在と将来のスパイクベースのインテリジェントコンピューティングシステムにとって有望な感覚入力として位置づけられている。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:09:21 GMT)
Spectral Fidelity and Spatial Enhancement: An Assessment and Cascading of Pan-Sharpening Techniques for Satellite Imagery [0.0] 本研究は,衛星画像のパンシャーピング技術に関する包括的評価を行う。
リモートセンシングにおける情報アルゴリズムの選択の必要性から,新しいカスケード・構造化評価フレームワークが提案されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:00:48 GMT)
Spatial entanglement between two quantum walkers with exchange symmetric coins [0.0] 本研究では、2つのコイン状態間の初期および最終交換対称性が、2つの量子ウォーカー間の空間的絡み合いのダイナミクスにどのように影響するかを検討する。
我々の研究結果は、量子ウォークにおける対称性が絡み合いのダイナミクスにどのように影響するかを明らかにし、量子技術への応用に対する潜在的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:58:09 GMT)
Space and time correlations in quantum histories [0.0] この枠組みで空間的・時間的絡み合いをどう特徴づけるかを思い出す。
静的複合システムのケケットに履歴状態をマッピングする操作プロトコルが提示される。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:10:02 GMT)
Sisteme Hibride de Invatare Automata si Aplicatii [0.0] 分類と回帰のために、ディープニューラルネットワークアプローチとニューロシンボリックアプローチを提案する。
提案するハイブリッドシステムは、経験を通じて、深層ニューラルネットワークによる独自の改善能力と、象徴的な人工知能アプローチによって提供される結果の解釈可能性の両方を取り入れている。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:50:34 GMT)
Single image super-resolution based on trainable feature matching attention network [0.0] 畳み込みニューラルネットワーク(CNN)は画像超解法(SR)に広く利用されている
トレーニング可能な特徴マッチング(TFM)を導入し、CNNに明示的な特徴学習を導入し、その表現能力を増強する。
また,非局所演算の計算要求を軽減するため,SRNL (Same-size-divided Region-level Non-Local) という変種も提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:31:54 GMT)
Sherlock Holmes Doesn't Play Dice: The significance of Evidence Theory for the Social and Life Sciences [0.0] エビデンス理論は、事象が成立する恐れから生じる不確実性を表現することができる。
確率論は、意思決定者が現在検討している可能性に制限されなければならない。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:37:39 GMT)
Self-testing of semisymmetric informationally complete measurements in a qubit prepare-and-measure scenario [0.0] 自己検査は量子システムを認証するための強力な方法である。
本研究では,特定の種類の非射影量子ビット測定の自己検査に焦点をあてる。
我々の結果は、潜在的に最小限の PM シナリオ内で、極小の qubit POVM を自己テストするための道を開いた。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:00:11 GMT)
Scalable Image Coding for Humans and Machines Using Feature Fusion Network [0.0] 本稿では,多数の画像認識モデルと互換性のある人や機械を対象とした,学習に基づくスケーラブルな画像符号化手法を提案する。
提案手法では,パラメータ数を削減しつつ,画像圧縮モデルを効率よく組み合わせることを確認する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:05:31 GMT)
SICs and the Triangle Group $(3,3,3)$ [0.0] 三角群 $3,3,3$ の射影ユニタリ表現に位数3のユニタリが現れることを示す。
特に、任意の正準位数 3 のユニタリが、次元 $d>3$ が素数であれば、ザウナーのユニタリに共役であるという事実を証明する別の方法を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:58:06 GMT)
Rearrangement of single atoms in a 2000-site optical tweezers array at cryogenic temperatures [0.0] 6Kの低温環境下では,2088箇所までの光学的ツイーザの大規模配列におけるルビジウム原子のトラップについて報告する。
提案手法は, 真空中ではなく室温下での顕微鏡目的と, 閉じ込められた原子の低温環境を確保するための窓のない熱シールドの併用に依存する。
フィールドプログラマブルゲートアレイによって制御される移動光学式ツイーザを用いた828原子ターゲットアレイの原子間アレンジメントを実証する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:31:24 GMT)
Quo Vadis ChatGPT? From Large Language Models to Large Knowledge Models [0.0] これらのハイブリッドAIシステムは、NLPベースの技術やNLPライクなアプリケーションに限らないため、LKM(Large Knowledge Models)と呼んでいる。
本稿では,化学工学におけるこのようなシステム開発における課題と機会について論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:06:54 GMT)
Quantum Optimal Control of Squeezing in Cavity Optomechanics [0.0] スクイージング(Squeezing)は、量子状態の古典的でない特徴であり、例えば機械力の量子センシングにおいて有用な資源である。
本稿では、最適制御理論を用いて、2つの外部ドライブを用いた最適セットアップにおけるスクイーズを最大化する方法について述べる。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:23:57 GMT)
Quantum Circuit Switching with One-Way Repeaters in Star Networks [0.0] 我々は、一方通行の量子ネットワークにおいて量子状態を分散するためのプロトコルとして量子回路スイッチングを解析する。
パケットが並列に分散された場合、リクエストはより高いレートで処理されるが、シーケンシャルな分散は、一般的により多くのユーザに対してサービスを同時に提供できる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:46:57 GMT)
Prompt-based vs. Fine-tuned LLMs Toward Causal Graph Verification [0.0] 本研究の目的は,テキストソースを用いた因果グラフの自動検証に自然言語処理(NLP)技術を適用することである。
我々は,(1)因果関係分類タスク用に微調整された事前学習言語モデルと(2)プロンプトベースLPMの2種類のNLPモデルの性能を比較した。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:06:18 GMT)
Phase Noise in Real-World Twin-Field Quantum Key Distribution [0.0] この研究は、鍵レートの決定におけるレーザー品質、ネットワークトポロジー、繊維長、アームバランス、検出器性能の役割を強調している。
注目すべきは、主要なTF-QKDプロトコルが、異なるメカニズムにもかかわらず位相ノイズの影響を受けていることである。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:18:49 GMT)
Parity-dependent state transfer for direct entanglement generation [0.0] 完全状態移動(Perfect State Transfer)とは、量子状態の時間的最適転送を実現する手法である。
超伝導量子ビットの連鎖上での完全状態移動と多ビット絡み合いの発生を実験的に実証した。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:00:04 GMT)
Overcoming Traditional No-Go Theorems: Quantum Advantage in Multiple Access Channels [0.0] 我々は、Multiple Access Channel(MAC)と呼ばれる一般的に遭遇するネットワーク構成において、量子通信の新たな利点を確立する。
量子超デンス符号化プロトコルとは異なり、ここで報告される利点は送信者と受信者の絡み合いを引き起こすことなく実現される。
提示された量子優位性は、入力なしの量子非局所性の概念と深い結びつきを示唆し、絡み合った測定の半デバイス非依存的な証明の可能性を秘めている。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:28:55 GMT)
Optomechanical entanglement induced by backward stimulated Brillouin scattering [0.0] 本稿では,ロバストな光学的絡み合いを生成する手法を提案する。
生成した絡み合いは熱ゆらぎに対して十分に堅牢である。
このような生成された絡み合った状態は、量子情報処理、量子センシング、量子コンピューティングに利用できる。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:17:06 GMT)
Optimizing Nurse Scheduling: A Supply Chain Approach for Healthcare Institutions [0.0] 我々は,契約上の義務や強制的な休息期間などの要因によって複雑化した作業である,スタッフのシフト割り当ての最適化に焦点をあてる。
特に注目されているのは、医療現場で一般的な人事スケジューリングの課題である、看護師のロスターリングの問題です。
新型コロナウイルス(COVID-19)パンデミックが続く中、医療機関のスタッフの課題が悪化している。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:37:51 GMT)
Optimal complexity of parameterized quantum circuits [0.0] 量子回路は、NISQ時代の領域における量子変分アルゴリズムの発展に重要な役割を果たしている。
それらを普遍ランダム回路の原型クラスと比較することにより、ハール測度によって定義される複雑性へのアプローチがより速く、到達するゲートが少なくなることが判明した。
メジャー化基準は表現と平均エンタングルメントの相補的ツールとして証明されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:43:46 GMT)
Online Nonparametric Supervised Learning for Massive Data [0.0] 本研究では,非パラメトリック分類器を大規模にリアルタイムに計算する高速アルゴリズムと,ストリーミングデータフレームワークを開発した。
提案手法は、リアルタイムな胎児の健康モニタリングによく使用される機械学習アルゴリズムと比較して評価・比較する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:04:23 GMT)
On the screened Kratzer potential and its variants [0.0] 近年,二原子分子の振動回転スペクトルの解析にいくつかの可能性が示唆されている。
これらのポテンシャルのパラメータ $D_e $ と $r_e$ はそれぞれエネルギーと平衡結合長ではないことが容易に示せる。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:59:55 GMT)
On Perception of Prevalence of Cheating and Usage of Generative AI [0.0] 本報告では,学生の不正行為の頻度に対する教員の認識と,生成AIが学術的整合性に与える影響について検討する。
以上の結果から,教師は一般的に不正行為を極めて一般的とはみなさないが,その頻度が増加しているという強い信念が持たれている。
ほとんどの教師は、不正行為とAIの使用法を同一視していないが、学生の間で広く使われていることを認めている。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:46:00 GMT)
On Fairness Concerns in the Blockchain Ecosystem [0.0] 私たちはBitcoinとブロックチェーンを監査して、トランザクションの優先順位決定の基準を調査します。
私たちの発見は、ブロックチェーンと分散アプリケーションの将来的な発展に重大な影響を与えます。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:35:37 GMT)
Noisy Quantum Trees: Infinite Protection Without Correction [0.0] 我々は,木構造を持つ量子ネットワークについて研究し,そこでは根から葉まで情報を伝達する。
樹木の深さが大きくなるにつれて、ノイズの不可逆効果とそのような騒音に対する保護との間には競合がある。
距離d>=2の符号と十分小さい(しかしゼロでない)雑音に対して、古典的な情報と絡み合いは無限の深さを持つ雑音の多い木に伝播することを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:23:35 GMT)
New perspectives on the optimal placement of detectors for suicide bombers using metaheuristics [0.0] 本研究では、特定の標的に対する自爆攻撃の運用モデルと、脅威にさらされている地域への検知器の配備に基づく保護対策の活用について考察する。
我々は4つの異なるアルゴリズム、すなわちグリーディヒルクライマー、タブサーチ、進化的アルゴリズムを考える。
その結果,全ての手法では逆方向のシナリオは困難であり,進化的アルゴリズムは結果の探索景観の複雑さに適応していることがわかった。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:06:10 GMT)
Neural Scaling Laws From Large-N Field Theory: Solvable Model Beyond the Ridgeless Limit [0.0] 我々は、Maloney, Roberts, Sully によって提案されたモデルを解くために、大N場の理論手法を用いる。
モデルとトレーニングデータセットのサイズの対称性を説明するダイアグラムレベルでの双対変換を明らかにする。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:00:01 GMT)
Musical Phrase Segmentation via Grammatical Induction [0.0] 様々な音楽的視点の組み合わせを用いて、3つのデータセット上での5つの文法的帰納アルゴリズムの性能を解析する。
実験の結果, LONGESTFIRSTアルゴリズムは3つのデータセットで最高のF1スコアを得ることができた。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:04:36 GMT)
Multi-qubit circuit synthesis and Hermitian lattices [0.0] 我々は,複数ビットのユニタリと等距離の正確な合成のための,新しい最適および合成アルゴリズムを提案する。
最適なアルゴリズムは、グラフのための新しいデータ構造と新しい一貫した関数でインスタンス化されたA*探索である。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:27:50 GMT)
Model-independent cosmological inference post DESI DR1 BAO measurements [0.0] 我々は、モデルに依存しない方法で宇宙の膨張史を再構築するためにガウス過程回帰を実装した。
我々は、$z_texteff = 0.51$のDESI LRGデータが、我々のモデルに依存しないフレームワークの外れ値ではないことを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:18:39 GMT)
Mitigating Data Sharing in Public Cloud using Blockchain [0.0] データの権利、データ共有、データ検証といった重要な側面を持つ、クラウド内のセキュアなデータエコシステムを提案します。
これにより、既存のパブリッククラウドベースのシステムが、信頼性の強化とクラウドデータの非再検討を容易にブロックチェーンをデプロイできるようになる。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:36:35 GMT)
Measuring and Mitigating Bias for Tabular Datasets with Multiple Protected Attributes [0.0] 我々は、国籍、年齢、性別など、複数の保護された属性を含むデータセットに焦点を当てる。
新たな差別措置が導入され、研究者や実践者が適切な措置を選択するのを導く。
既存のバイアス緩和法であるFairDoの新たな応用について述べる。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:27:08 GMT)
Markovian dynamics for a quantum/classical system and quantum trajectories [0.0] 我々は量子/古典系の力学に対する一般的なアプローチを開発する。
重要な特徴は、相互作用が量子成分から古典成分への情報のフローを許容するならば、必然的に力学は散逸的であることである。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:41:39 GMT)
Machine Psychology: Integrating Operant Conditioning with the Non-Axiomatic Reasoning System for Advancing Artificial General Intelligence Research [0.0] 本稿では,AI(Artificial General Intelligence, AGI)研究を強化するための学際的枠組みであるマシン心理学を紹介する。
このフレームワークの中核となる前提は、適応が生物学的および人工知能の両方にとって重要であることである。
本研究は,OpenNARS for Applications を用いた3つの操作型学習タスクを用いて,このアプローチを評価する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:23:57 GMT)
MDS-ViTNet: Improving saliency prediction for Eye-Tracking with Vision Transformer [0.0] MDS-ViTNet(Multi Decoder Saliency by Vision Transformer Network)を提案する。
このアプローチは、マーケティング、医療、ロボティクス、小売など、さまざまな分野において大きな可能性を秘めている。
我々の訓練されたモデルは、いくつかのベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:28:04 GMT)
Loop Polarity Analysis to Avoid Underspecification in Deep Learning [0.0] 本稿では,データ生成過程の因果構造を特定するツールとして,ループ極性解析に目を向ける。
システムを構成する異なるフィードバックループの極性を測定することで、ニューラルネットワークのより堅牢な推論が可能になることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:33:12 GMT)
Lindbladian way for the relaxation time approximation, application to Kibble-Zurek processes due to environment temperature quench, and to Lindbladian perturbation theory [0.0] 大域的なリンドブラディアン・アンサッツが構築され、温度$T$で、調査された系のギブズ状態に熱化される。
このアンザッツはハミルトニアンの2つの固有状態全てを接続し、緩和時間近似(RTA)として知られる単純なマスター方程式をもたらす。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:46:11 GMT)
Learn to Refuse: Making Large Language Models More Controllable and Reliable through Knowledge Scope Limitation and Refusal Mechanism [0.0] 大規模言語モデル(LLM)は印象的な言語理解と生成能力を示している。
これらのモデルは欠陥がなく、しばしばエラーや誤報を含む応答を生成する。
本稿では,LLMに対して,誤りを避けるために,難解な質問への回答を拒否するように指示する拒絶機構を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:19:35 GMT)
Large Language Models for Code Summarization [0.0] 大規模言語モデルがコード説明/要約でどのように機能するかをレビューする。
また、自然言語記述に基づくコード生成機能についても検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:18:51 GMT)
LSPI: Heterogeneous Graph Neural Network Classification Aggregation Algorithm Based on Size Neighbor Path Identification [0.0] 本稿では3つの一般的なデータ集合におけるメタパスについて検討し、異なるメタパスによって接続される隣人の数に大きな違いがあることを見出した。
同時に、大きなボルパスに含まれる騒音情報は、モデル性能に悪影響を及ぼす。
本稿では,大小隣接経路アイデン整形に基づく不均一なグラフニューラルネットワークの分類と集約アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:37:23 GMT)
Inpaint Biases: A Pathway to Accurate and Unbiased Image Generation [0.0] Inpaint Biasesフレームワークは,画像生成の精度を高めるために,ユーザ定義マスクとインペイント技術を利用する。
我々は,このフレームワークが生成した画像のユーザ意図に対する忠実度を大幅に改善し,モデルの作成能力を向上することを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:04:07 GMT)
Individual and Contextual Variables of Cyber Security Behaviour -- An empirical analysis of national culture, industry, organisation, and individual variables of (in)secure human behaviour [0.0] 国家文化、産業タイプ、組織の安全保障文化は個人の安全保障行動に影響を及ぼす変数である。
セキュリティ意識、セキュリティ知識、セキュリティインシデントに関する以前の経験は、セキュリティ行動に影響を及ぼす変数である。
発見は、集団が行動の安全を損なう可能性について、組織に実践的な洞察を与える。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:45:21 GMT)
Implementing arbitrary multi-mode continuous-variable quantum gates with fixed non-Gaussian states and adaptive linear optics [0.0] 非ガウス量子ゲートは光量子情報処理の必須成分である。
本稿では,一般,多モード,高階非ガウスゲートを直接実装する計測手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:20:50 GMT)
Identification of defects and the origins of surface noise on hydrogen-terminated (100) diamond [0.0] 表面欠陥は量子技術の設計と性能において重要な役割を果たす。
表面処理プロトコルは、所望の欠陥の生成を制御し、不要な欠陥を取り除くことができる。
この研究は、走査型トンネル顕微鏡(STM)イメージングと第一原理シミュレーションを組み合わせて、化学気相沈着法(CVD)を用いて作製したH:C(100)-2x1表面上のいくつかの表面欠陥を同定する。
これらの欠陥の原子構造が解明され、磁気ノイズと電荷トラップの顕微鏡的起源が決定される。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:47:24 GMT)
Gouy phase and quantum interference with cross-Wigner functions for matter-waves [0.0] 本稿では,まずガウス波の相関パケットによって特徴付けられる物質波の進化を解析する。
クロスウィグナーは、進化時間が異なるため、グーイ位相差を取得する。
空間強度干渉項から交叉ウィグナーを再構成するためのウィグナー関数に基づく手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:57:08 GMT)
Gone but Not Forgotten: Improved Benchmarks for Machine Unlearning [0.0] 本稿では,機械学習アルゴリズムの代替評価手法について記述し,提案する。
我々は、さまざまなコンピュータビジョンデータセット上で、最先端の未学習アルゴリズムの一連の実験を通して、代替評価の有用性を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:53:23 GMT)
Generating Einstein$\unicode{x2013}$Podolsky$\unicode{x2013}$Rosen correlations for teleporting collective spin states in a two dimensional trapped ion crystal [0.0] 我々はphonon$x$の使用を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:39:39 GMT)
Generalized cluster states from Hopf algebras: non-invertible symmetry and Hopf tensor network representation [0.0] クラスター状態は測定ベースの量子計算(MBQC)にとって重要な資源である
ホップ代数に基づくクラスター状態の構成について述べる。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:40:57 GMT)
GPLaSDI: Gaussian Process-based Interpretable Latent Space Dynamics Identification through Deep Autoencoder [0.0] 潜在空間ODEに依存する新しいLa Gaussianベースのフレームワークを導入する。
本稿では,バーガース方程式,プラズマ物理学におけるフラソフ方程式,上昇する熱バブル問題に対する我々のアプローチの有効性を実証する。
提案手法は,200~10万倍の高速化を実現し,相対誤差を最大7%向上する。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:47:02 GMT)
GKLS Vector Field Dynamics for Gaussian States [0.0] ガウス状態によって記述された系に対するGKLS生成器に付随するベクトル場を構築する。
GKLS力学は分解原理、すなわち、このベクトル場を3つの部分で分解できることが示されている。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:57:56 GMT)
From the classical Frenet-Serret apparatus to the curvature and torsion of quantum-mechanical evolutions. Part II. Nonstationary Hamiltonians [0.0] 非定常ハミルトニアンの下で進化する状態ベクトルによって追跡される量子曲線の曲がりとねじれの定量化方法を示す。
時間変化の設定は、統計的観点からよりリッチな構造を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:40:02 GMT)
From the classical Frenet-Serret apparatus to the curvature and torsion of quantum-mechanical evolutions. Part I. Stationary Hamiltonians [0.0] ヒルベルト空間における量子軌道に対するフレネット・サーレット装置の量子バージョンを提案する。
提案した定数曲率係数は,状態ベクトルに対する接ベクトルの共変微分の大きさ2乗によって与えられる。
提案した定数ねじれ係数は, 接ベクトルの共変微分の射影の大きさ2乗で定義される。
論文参考訳(メタデータ) (Wed, 29 May 2024 18:16:55 GMT)
Few-Shot Testing: Estimating Uncertainty of Memristive Deep Neural Networks Using One Bayesian Test Vector [0.0] 我々は,memristorベースのCIMハードウェア上に実装されたNNのモデル不確かさを推定できるテストベクトル生成フレームワークを提案する。
提案手法は, 異なるモデル次元, タスク, 故障率, 変動ノイズに基づいて評価し, メモリオーバーヘッドを0.024ドルに抑えながら, 100%のカバレッジを連続的に達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:53:16 GMT)
Fault-tolerant simulation of Lattice Gauge Theories with gauge covariant codes [0.0] 量子誤り訂正と格子ゲージ理論(LGT)の間には、強くて簡単な接続が存在することを示す。
このゲージ共変符号上の論理演算を同定し、対応するハミルトニアンがこれらの論理演算の項で表現できることを示す。
積公式と量子化法の両方を用いて、ゲージ共変符号内でハミルトニアンのフォールトトレラント時間進化を行う方法を示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:21:29 GMT)
Fate of non-Hermitian free fermions with Wannier-Stark ladder [0.0] Wannier-Stark ladder (WSL) は非エルミート自由フェルミオンの絡み合い挙動を動的に変化させる。
我々はこれらのフェルミオンの有効ハミルトニアンをWSLで研究した。
本研究は,非エルミタン皮膚効果 (NHSE) とワニエ・スターク局所化の相互作用から引き起こされる絡み合いの位相を探索する方法である。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:00:17 GMT)
FDQN: A Flexible Deep Q-Network Framework for Game Automation [0.0] 本研究では,CNNを用いて高次元センサデータをリアルタイムに処理する,最先端のフレキシブルQ-Network (FDQN) フレームワークを提案する。
モジュール構造で設計されており、フレームワークのコア部分に触れることなく、他のHTMLベースのゲームに簡単に適応できる。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:00:50 GMT)
Exploring the Potential of Hybrid Machine-Learning/Physics-Based Modeling for Atmospheric/Oceanic Prediction Beyond the Medium Range [0.0] 本稿では、機械学習(ML)と従来の物理モデルを組み合わせたハイブリッドモデリング手法の可能性について検討する。
このモデルは、低分解能で簡易なパラメータ化大気一般循環モデル(AGCM)SPEEDYに基づいている。
このモデルはエルニーノの周期と、季節によって3~7ヶ月の降水量による地球規模のテレコネクションを予測する能力を持っている。
論文参考訳(メタデータ) (Wed, 29 May 2024 20:56:44 GMT)
Exploring knowledge graph-based neural-symbolic system from application perspective [0.0] AIシステムにおけるヒューマンライクな推論と解釈可能性の実現は、依然として大きな課題である。
ニューラルネットワークをシンボリックシステムと統合するNeural-Symbolicパラダイムは、より解釈可能なAIへの有望な経路を提供する。
本稿では,知識グラフに基づくニューラルシンボリック統合の最近の進歩について考察する。
論文参考訳(メタデータ) (Wed, 29 May 2024 22:37:08 GMT)
Exploring Frustration Effects of Strongly Interacting Bosons via the Hall Response [0.0] ホール偏極の挙動は,その飽和値と短時間のダイナミクスの両方において,基礎となる位相図の特徴と相関することを示す。
ホール反応は、系に存在する多体キラル量子位相の感度プローブとして用いられる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:18:09 GMT)
Exploring AI-based Anonymization of Industrial Image and Video Data in the Context of Feature Preservation [0.0] 我々は、Deep Learningベースのフルボディ匿名化フレームワークDeepPrivacy2を産業画像およびビデオデータに適用する。
本稿では,アイデンティティ生成の質,時間的一貫性,ポーズ推定と行動認識の適用性について考察する。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:15:52 GMT)
Exclusive-or encoded algebraic structure for efficient quantum dynamics [0.0] 本稿では,多体2レベル量子系の構造を捉えるフォーマリズムを提案する。
この形式主義は、リアルタイム進化、消散的リンドブラッド作用、想像的時間進化、および射影的測定プロセスにどのように適用されるかを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:02:09 GMT)
Entanglement from superradiance and rotating quantum fluids of light [0.0] 超放射能による放射線の増幅は、多くの物理系で観測される普遍的な現象である。
我々は超ラジカル散乱がコヒーレント状態を含む異なる入力状態の絡み合いを生成することを示した。
我々は,安定なエルゴリージョンの作成を実証するために,システムを数値シミュレーションする。
論文参考訳(メタデータ) (Wed, 29 May 2024 09:41:50 GMT)
Emergent (2+1)D topological orders from iterative (1+1)D gauging [0.0] ゲージは、既存の大域対称性をローカライズするためにゲージ場を導入する。
ガーグ処理を繰り返すことで、明示的に任意のものを閉じ込める新しいコードを得る。
提案手法は,下方から高次元位相符号を得るための新しい経路を確立する。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:33:37 GMT)
Efficiently manipulating Pauli strings with PauliArray [0.0] パウリ行列とパウリ弦は量子コンピューティングで広く使われている。
この基底で表される多くのパウリ文字列や演算子を扱うための、十分に包含され、多用途で効率的なツールを持つことが重要である。
このライブラリは、Pauli文字列と演算子の配列を表現するデータ構造と、それらを変更して組み合わせるための様々なメソッドを導入している。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:18:08 GMT)
Efficient generation of entangled multi-photon graph states from a single atom [0.0] 絡み合いは強力な概念であり、科学的・技術的進歩の可能性を秘めている。
空洞内の1つのメモリ原子を用いて、少数の量子ビットから多数の量子ビットに絡み合った状態を生成する方法を示す。
光子1個あたり43.18 (7)%のソース対検出効率のおかげで、これらの大きな状態は1分間に1度、以前のどの実験よりも桁違いに速く測定できる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:20:14 GMT)
Efficient Learning in Chinese Checkers: Comparing Parameter Sharing in Multi-Agent Reinforcement Learning [0.0] マルチエージェント強化学習は,中国チェッカーの競争ゲームにおいて,独立した部分的共有アーキテクチャよりも優れていることを示す。
実験を行うため、可変サイズ6プレーヤチャイナチェッカーという新しいMARL環境を開発した。
これは私たちの知る限りでは、真のゲームに忠実な中国のチェッカーの最初の実装です。
論文参考訳(メタデータ) (Wed, 29 May 2024 03:27:30 GMT)
Efficiency fluctuations of a heat engine with noise induced quantum coherences [0.0] 本研究では,コヒーレント量子熱エンジンの非定常キャビティに結合した効率変動を解析した。
最も高い効率性はノイズ誘起コヒーレンスに依存しない。
効率を変数として扱うことで、コヒーレンスの存在下でのみ、一貫性を高めることができる。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:55:25 GMT)
Dynamics of charge fluctuations from asymmetric initial states [0.0] 電荷非対称初期状態で準備された系における保存されたU(1)電荷のゆらぎのダイナミクスについて検討する。
初期状態が空間において均質であるとしても、電荷揺らぎは初期状態の電荷非対称性に起因する有効不均一性を生成することを示す。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:02:16 GMT)
Domain adaptation in small-scale and heterogeneous biological datasets [0.0] 生物研究におけるドメイン適応のメリットと課題について論じる。
計算生物学者のツールキットにドメイン適応技術を導入することについて論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:01:15 GMT)
Device-independent dimension leakage null test on qubits with minimal resources [0.0] 我々は、デバイス独立であり、最小限の異なる実験を必要とするキュービットの2レベル空間のヌルテストを構築する。
ほとんどの量子ビットは10以上の標準偏差でテストに失敗する。
論文参考訳(メタデータ) (Wed, 29 May 2024 07:15:11 GMT)
Detection of entanglement by harnessing extracted work in an opto-magno-mechanics [0.0] 本研究は,イットリウム鉄ガーネット球内のキャビティ・マグメカニカル・システムにおいて,抽出された作業を通して二部体の絡み合いに対処する。
抽出された結果は、Szil'ardエンジンに似た装置で得られた。
定常状態および動的状態における光子モードとマグノンモードの絡み合いの量を測定するために対数ネガティビティを用いる。
論文参考訳(メタデータ) (Wed, 29 May 2024 15:46:51 GMT)
Convex neural network synthesis for robustness in the 1-norm [0.0] 本稿では,より堅牢なニューラルネットワークの近似を生成する手法を提案する。
モデル予測制御の堅牢化への応用は、その結果を示すために用いられる。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:17:09 GMT)
Confronting the Reproducibility Crisis: A Case Study in Validating Certified Robustness [0.0] 本稿では,VeriGauge ツールキットを用いた "SoK: Certified Robustness for Deep Neural Networks" における検証結果の検証を試みる。
ドキュメント化された方法論に従えば、古い依存関係や利用できない依存関係、バージョンコンフリクト、ドライバの不互換性など、多くのソフトウェアとハードウェアの互換性の問題が発生した。
本稿では,コンテナ化やソフトウェア保存,包括的なドキュメントプラクティスといった潜在的なソリューションを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:37:19 GMT)
Concatenating Binomial Codes with the Planar Code [0.0] 回転ボソニック符号は超伝導量子ビット実験における量子ビットの魅力的な符号化である。
耐故障性量子計算のための計測に基づくスキームにおいて,これらの符号と平面符号の整合性について検討する。
二項符号量子ビットを用いた平面符号の優れた性能を得るために、適応位相測定、最大量子状態推定、重み付き最小重み復号法を実装する必要がある。
論文参考訳(メタデータ) (Wed, 29 May 2024 00:27:52 GMT)
Comparison of Point Process Learning and its special case Takacs-Fiksel estimation [0.0] 本稿では,Takacs-Fiksel推定におけるポイントプロセス学習(PPL)について検討する。
クロスバリデーション体制を離脱する傾向にある場合,特定の損失を有するPLは,タカカス・フィッシャー推定に機能的に低下することを示した。
論文参考訳(メタデータ) (Wed, 29 May 2024 21:00:39 GMT)
Comparative study of light storage in antirelaxation-coated and buffer-gas-filled alkali vapor cells [0.0] バッファーガスを充填したセルを使用することで, 保存時間と効率は, 抗レラクテーション被覆セルに比べて$10倍に向上した。
この知見は将来の電界展開可能な高性能量子メモリの開発に寄与する。
論文参考訳(メタデータ) (Wed, 29 May 2024 12:13:59 GMT)
Clustering-Based Validation Splits for Domain Generalisation [0.0] トレーニングセットと検証セットの最大平均誤差(MMD)が高いと、選択したモデルの一般化可能性を高めることが提案されている。
カーネルk平均クラスタリングに基づくデータ分割アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 19:21:17 GMT)
Characterization of ion-trap-induced ac-magnetic fields [0.0] 高周波イオントラップの非平衡電流によって生じる発振磁場は、精密分光実験に有害な周波数シフトとサイドバンド遷移を誘導する。
本稿では,2光子分光法を用いて,直流バイアス磁場を変更したり,トラップパワーを変化させたりすることなく,RF誘起磁場の強度と方向を決定する手法について述べる。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:40:29 GMT)
Cephalo: Multi-Modal Vision-Language Models for Bio-Inspired Materials Analysis and Design [0.0] セファロ (Cephalo) は、材料科学応用のために設計された多モード視覚大言語モデル(V-LLM)のシリーズである。
視覚的および言語的データを統合して、人間-AIおよびマルチエージェントAIフレームワーク内での理解と相互作用を強化する。
本研究は, 生物材料, 破壊・工学解析, タンパク質生理学, 昆虫行動に基づく生体設計を取り入れた多種多様なユースケースのモデルについて検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 13:34:32 GMT)
Causal Fermion Systems as an Effective Collapse Theory [0.0] 非相対論的極限において、因果フェルミオン系は効果的な崩壊理論をもたらすことが示されている。
統計作用素の力学は、Kossakowski-Lindblad形式の決定論的方程式によって記述される。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:39:01 GMT)
Automated Optimal Layout Generator for Animal Shelters: A framework based on Genetic Algorithm, TOPSIS and Graph Theory [0.0] 動物保護区の人口過多は、病気の拡大と動物の医療費の増大に寄与する。
シェルターが直面する最大の課題の1つは、犬小屋の騒音レベルである。
本稿では,シェルター容量を最大化するケージレイアウトを自動設計する多基準最適化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 14:12:25 GMT)
Are queries and keys always relevant? A case study on Transformer wave functions [0.0] ドット製品アテンションメカニズム(ドット製品アテンションメカニズム)は、元々自然言語処理(NLP)タスク用に設計されたもので、現代のトランスフォーマーの基盤となっている。
本稿では,変分波動関数のパラメトリゼーションの特定の領域において,トランスフォーマーの適応性について検討する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:32:37 GMT)
Anyonic Topological Order in Twisted Equivariant Differential (TED) K-Theory [0.0] 2d半金属相 モジュラー大域質量項は、節点の補集合のねじれた同変 K-理論によって分類される。
誘導SU(2)-アノニック位相秩序は、相互作用する価束の構成空間上のチャーン類に反映される。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:25:07 GMT)
Analysis of spin-squeezing generation in cavity-coupled atomic ensembles with continuous measurements [0.0] 我々は、原子数$N$で、大きなスピンスクイーズを達成できることを示す。
本稿では、このスピンスクイーズプロトコルの最先端光時計への応用について論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:03:00 GMT)
An approach to improve agent learning via guaranteeing goal reaching in all episodes [0.0] 強化学習はマルコフ決定過程における累積報酬の最大化の問題に関係している。
我々は、かなり柔軟で、批判者を構成する限り、事実上あらゆるエージェントを増強するために使用できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 08:45:28 GMT)
Aharonov-Bohm Scattering From Knots [0.0] アハロノフ・ボーム効果はおそらく古典トポロジーと量子論の間の相互作用が探求された最初の例である。
単純なソレノイド電流分布を変化させることで、アハロノフ・ボーム効果を一般化する試みがいくつか行われた。
論文参考訳(メタデータ) (Wed, 29 May 2024 10:13:53 GMT)
Advancing Household Robotics: Deep Interactive Reinforcement Learning for Efficient Training and Enhanced Performance [0.0] 強化学習(Reinforcement Learning, RL)は、ロボットが環境と対話することを可能にする重要なロボティクス技術として登場した。
本稿では,Deep Interactive Reinforcement Learningを通じて情報とアドバイスを保存・再利用する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:46:50 GMT)
Adiabatic time evolution of highly excited states [0.0] 保護エネルギーギャップが存在しないにもかかわらず、量子多体傷は断熱時間の進化に適していることを示す。
単一の孤立した基底状態を操作することは、量子的応用では一般的であるが、傷跡状態の断熱的進化は、基底状態のような状態の塔全体を操作するための柔軟性を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 06:44:06 GMT)
Adaptive posterior concentration rates for sparse high-dimensional linear regression with random design and unknown error variance [0.0] 後方に一貫性のある結果を提供し,その濃度を解析する。
我々は,特定の距離測定値を用いたパラメータ推定のための集中結果を確立するために,調査を拡張した。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:57:04 GMT)
ACE: A general-purpose non-Markovian open quantum systems simulation toolkit based on process tensors [0.0] オープン量子系をシミュレーションするための汎用計算ツールキットについて述べる。
これは、ゼロ次元量子系の合成に対して、複数の、非常に一般的な非マルコフ環境に強く結合した数値的に正確な解を提供する。
論文参考訳(メタデータ) (Wed, 29 May 2024 17:50:50 GMT)
A vision transformer-based framework for knowledge transfer from multi-modal to mono-modal lymphoma subtyping models [0.0] 深層学習モデルを用いた全スライド画像(WSI)解析は癌診断に有望な可能性を示唆している。
DLBCL癌サブタイプと高分解能WSIを区別するためのビジョントランスフォーマーベースのフレームワークを提案する。
本研究は,157例のリンパ腫データセットを用いて,本分類モデルの有望な性能について検討した。
論文参考訳(メタデータ) (Wed, 29 May 2024 11:51:48 GMT)
A random-key GRASP for combinatorial optimization [0.0] 本稿ではランダムキーGRASPのための問題非依存コンポーネントと問題依存デコーダについて述べる。
概念実証として、ランダムキーGRASPは5つのNPハード最適化問題でテストされる。
論文参考訳(メタデータ) (Wed, 29 May 2024 01:07:38 GMT)
A SARS-CoV-2 Interaction Dataset and VHH Sequence Corpus for Antibody Language Models [0.0] AVIDa-SARS-CoV-2は重鎖抗体(VHH)相互作用の抗原可変ドメインを特徴とするデータセットである。
抗体言語モデルの事前学習データセットであるVHHCorpus-2Mには200万以上のVHH配列が含まれている。
VHHCorpus-2Mおよび既存の一般タンパク質および抗体特異的言語モデルを用いたVHHBERTを用いたSARS-CoV-2-VHH結合予測のためのベンチマーク結果を報告する。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:22:18 GMT)
A Privacy-Preserving Graph Encryption Scheme Based on Oblivious RAM [0.0] 本稿では,アクセスパターンとクエリパターンの漏洩を緩和する新しいグラフ暗号化手法を提案する。
提案手法は,(1)暗号化されたグラフで表現された敵が,基盤となるグラフに関する情報に従わないことを保証し,(2)アクセスパターンを隠蔽して問合せ不能を解消する,という2つのキーとなるセキュリティ目標を定めている。
論文参考訳(メタデータ) (Wed, 29 May 2024 16:47:38 GMT)
A Holographic Entanglement Entropy at Spi [0.0] 場の量子論における部分領域に対する有限絡み合いエントロピーを定義するには、2つの論理的に独立なスケールを導入する必要がある。
AdS/CFTでは、IRスケールはAdS長尺、UVカットオフはバルクラジアルカットオフ、サブリージョンは無次元の角度で指定される。
我々は、平坦な空間には空間無限大(spi)に関連付けられる「スパイス部分領域」の概念が存在すると論じる。
論文参考訳(メタデータ) (Wed, 29 May 2024 04:56:47 GMT)
A Fast and Adaptable Algorithm for Optimal Multi-Qubit Pathfinding in Quantum Circuit Compilation [0.0] この研究は、量子回路のコンパイルマッピング問題における臨界サブルーチンとして、マルチキュービットパスフィンディングに焦点を当てている。
本稿では,回路SWAPゲート深さに対して量子ハードウェア上で量子ビットを最適にナビゲートする二進整数線形計画法を用いてモデル化したアルゴリズムを提案する。
我々は、様々な量子ハードウェアレイアウトのアルゴリズムをベンチマークし、計算ランタイム、解SWAP深さ、累積SWAPゲート誤差率などの特性を評価した。
論文参考訳(メタデータ) (Wed, 29 May 2024 05:59:15 GMT)
A Deep Convolutional Neural Network-based Model for Aspect and Polarity Classification in Hausa Movie Reviews [0.0] 本稿では, ハウサ映画レビューにおいて, アスペクトおよび極性分類に適した新しいDeep Convolutional Neural Network (CNN) モデルを提案する。
提案モデルでは,CNNとアスペクトワード予測の注意機構を組み合わせることで,文脈情報と感情の極性を活用する。
アスペクト項抽出では91%、感情極性分類では92%の精度で、従来のマシンモデルより優れている。
論文参考訳(メタデータ) (Wed, 29 May 2024 23:45:42 GMT)