Not All Metrics Are Guilty: Improving NLG Evaluation by Diversifying References [123.4] Div-Refは、参照数を増やして評価ベンチマークを強化する方法である。
本研究では,参照表現の多様化が自動評価と人的評価の相関性を大幅に向上させることを示す実験を行った。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:39:55 GMT)
ModelLock: Locking Your Model With a Spell [90.4] ModelLockと呼ばれる拡散ベースのフレームワークは、テキストガイドによる画像編集を探求し、トレーニングデータをユニークなスタイルに変換するか、バックグラウンドで新しいオブジェクトを追加する。
このデータセットに微調整されたモデルはロックされ、キープロンプトによってのみアンロックされる。
画像分類とセグメンテーションの両方のタスクについて広範な実験を行い、ModelLockが期待する性能を著しく低下させることなく、効果的に細調整されたモデルをロックできることを示します。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:52:34 GMT)
Optimal Flow Matching: Learning Straight Trajectories in Just One Step [89.4] 我々は,新しい最適フローマッチング手法を開発し,理論的に正当化する。
これは2次輸送のための直列のOT変位をFMの1ステップで回復することを可能にする。
提案手法の主な考え方は,凸関数によってパラメータ化されるFMのベクトル場の利用である。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:42:20 GMT)
Streaming Long Video Understanding with Large Language Models [83.1] VideoStreamingは、ビデオ理解のための高度な視覚言語大モデル(VLLM)である。
一定の数のビデオストリーミングトークンを符号化し、伝播的に選択した任意の長さのビデオを理解することができる。
提案モデルは,長大なビデオベンチマークにおいて,優れた性能と高効率を実現する。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:22:09 GMT)
$M^3$GPT: An Advanced Multimodal, Multitask Framework for Motion Comprehension and Generation [80.2] M3$GPTは、理解と生成のための先進的な textbfMultimodal, textbfMultitaskフレームワークである。
我々は、テキスト、音楽、モーション/ダンスなどのマルチモーダル制御および生成信号に離散ベクトル量子化を用いる。
M3$GPTは、さまざまなモーション関連タスク間の接続とシナジーをモデル化することを学ぶ。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:21:59 GMT)
MADiff: Offline Multi-agent Learning with Diffusion Models [79.2] 拡散モデル(DM)は、最近オフライン強化学習を含む様々なシナリオで大きな成功を収めた。
この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。
本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:02:09 GMT)
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting [78.5] そこで本研究では,コードと書き直された変種との類似性に基づいて,ゼロショット合成符号検出器を提案する。
以上の結果から,既存のテキスト用合成コンテンツ検出装置よりも顕著な向上が見られた。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:57:28 GMT)
Limits of Transformer Language Models on Learning to Compose Algorithms [77.2] 我々は,複数のサブタスクの合成を学習するために必要な4つのタスクにおいて,LLaMAモデルのトレーニングと GPT-4 と Gemini の促進効果を評価する。
その結果,現在最先端のTransformer言語モデルにおける構成学習は,非常に非効率なサンプルであることが示唆された。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:09:28 GMT)
Detecting Multimodal Situations with Insufficient Context and Abstaining from Baseless Predictions [75.5] VLU(Vision-Language Understanding)ベンチマークには、提供されたコンテキストによってサポートされない仮定に答えが依存するサンプルが含まれている。
サンプル毎にコンテキストデータを収集し,エビデンスに基づくモデル予測を促進するためにコンテキスト選択モジュールをトレーニングする。
我々は,十分なコンテキストを欠いたサンプルを同定し,モデル精度を向上させる汎用なコンテキスト・アワレ認識検出器を開発した。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:46:38 GMT)
DiffuBox: Refining 3D Object Detection with Point Diffusion [74.0] 本研究では,3次元物体の検出と局所化を確保するために,新しい拡散型ボックス精細化手法を提案する。
提案手法は,様々なドメイン適応設定下で評価し,その結果,異なるデータセット間での大幅な改善が示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:14:55 GMT)
TALC: Time-Aligned Captions for Multi-Scene Text-to-Video Generation [72.3] マルチシーンビデオを生成するために,タイムアラインド・キャプション(TALC)フレームワークを導入する。
具体的には、T2Vアーキテクチャのテキストコンディショニング機構を強化し、映像シーンとシーン記述の時間的アライメントを認識する。
talC-finetuned modelは,多場面ビデオテキストデータにおけるベースライン法を集計スコアで15.5ポイント上回る性能を示した。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:13:26 GMT)
Vertical Federated Learning for Effectiveness, Security, Applicability: A Survey [67.5] Vertical Federated Learning(VFL)は、プライバシ保護のための分散学習パラダイムである。
近年の研究では、VFLの様々な課題に対処する有望な成果が示されている。
この調査は、最近の展開を体系的に概観する。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:05:06 GMT)
Prompt Optimization with EASE? Efficient Ordering-aware Automated Selection of Exemplars [66.8] 大規模言語モデル(LLM)は、現実世界のアプリケーションで印象的な機能を示している。
これらの卓越した作品の品質は、パフォーマンスに大きな影響を与えます。
既存の方法は、先行注文がパフォーマンスに与える影響を適切に説明できない。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:23:05 GMT)
C3LLM: Conditional Multimodal Content Generation Using Large Language Models [66.1] C3LLMは,ビデオ・トゥ・オーディオ,音声・テキスト,テキスト・トゥ・オーディオの3つのタスクを組み合わせた新しいフレームワークである。
C3LLMはLarge Language Model (LLM) 構造を異なるモダリティを整列するためのブリッジとして適合させる。
本手法は,従来の音声理解,ビデオ音声生成,テキスト音声生成のタスクを1つの統一モデルに統合する。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:10:12 GMT)
DiffusionSat: A Generative Foundation Model for Satellite Imagery [63.3] 現在、DiffusionSatは、現在利用可能な大規模な高解像度リモートセンシングデータセットのコレクションに基づいてトレーニングされている、最大の生成基盤モデルである。
提案手法は, リアルタイムなサンプルを作成し, 時間生成, マルチスペクトル入力の超解像, インペイントなどの複数の生成課題を解くのに利用できる。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:44:12 GMT)
Layer-Aware Analysis of Catastrophic Overfitting: Revealing the Pseudo-Robust Shortcut Dependency [61.4] カタストロフィックオーバーフィッティング(CO)は単段階逆行訓練(AT)において重要な課題となる
また,CO中において,前層はより感受性が高く,より早く,より歪みが強く,後者層は相対的不感度を示した。
提案手法であるLayer-Aware Adversarial Weight Perturbation (LAP)は,COを効果的に防止し,ロバスト性を高める。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:56:30 GMT)
COLT: Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.7] そこで我々は,Collaborative Learning-based Tool Retrieval approach, COLTを提案する。
COLTはユーザクエリとツール記述のセマンティックな類似性をキャプチャする。
また、ツールの協調的な情報も考慮に入れている。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:41:23 GMT)
Negative as Positive: Enhancing Out-of-distribution Generalization for Graph Contrastive Learning [60.6] グラフコントラスト学習(GCL)において、最も意味論的に類似したドメイン間負対を正として扱う新たな戦略であるNegative as Positiveを提案する。
実験結果から,GCLのOOD一般化性能が大幅に向上することが確認された。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:29:31 GMT)
Multi-Player Approaches for Dueling Bandits [58.4] Follow Your Leaderのブラックボックスアプローチの直接的な使用は、この設定の低いバウンダリと一致することを示す。
また,Condorcet-Winnerレコメンデーションプロトコルを用いて,メッセージパッシングによる完全分散アプローチも分析する。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:25:48 GMT)
Efficient Bilateral Cross-Modality Cluster Matching for Unsupervised Visible-Infrared Person ReID [56.6] 本稿では, クラスタ間マッチングによるモダリティギャップを低減するための, クラスタマッチングに基づく新たな学習フレームワークを提案する。
このような監視信号の下では、クラスタレベルで特徴を協調的に整列させるために、モダリティ・特定・モダリティ・非依存(MSMA)コントラスト学習フレームワークが提案されている。
公開SYSU-MM01とRegDBデータセットの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:14:29 GMT)
SPP: Sparsity-Preserved Parameter-Efficient Fine-Tuning for Large Language Models [53.6] 空間保存型大規模言語モデルのための効率的な微調整法
コードはhttps://github.com/Lucky-Lance/SPP.comで公開される。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:55:27 GMT)
PTQ4DiT: Post-training Quantization for Diffusion Transformers [52.9] ポストトレーニング量子化(PTQ)は、計算とメモリフットプリントを大幅に削減できる高速でデータ効率のソリューションとして登場した。
提案するPTQ4DiTは,DiTのための特別に設計されたPTQ手法である。
PTQ4DiTは8ビットの精度でDiTの量子化に成功した。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:02:08 GMT)
Efficient Temporal Action Segmentation via Boundary-aware Query Voting [51.9] BaFormerは境界対応のTransformerネットワークで、各ビデオセグメントをインスタンストークンとしてトークン化する。
BaFormerは実行時間の6%しか利用せず、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:44:13 GMT)
An Experimental Study on Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training [51.6] Masked Image Modeling (MIM) Pre-training for Large-scale Vision Transformer (ViTs) は、学習した自己教師型ViT機能に加えて、下流での有望なパフォーマンスを実現する。
本稿では,テキストテキストレメリーで軽量なViTの微調整性能が,この事前学習パラダイムの恩恵を受けるかどうかを問う。
バニラ/階層設計(5.7M$/6.5M$)による純軽量ViTの蒸留による事前トレーニングは、ImageNet-1で79.4%$/78.9%の精度で達成できる。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:59:27 GMT)
N-BVH: Neural ray queries with bounding volume hierarchies [51.4] 3Dコンピュータグラフィックスでは、シーンのメモリ使用量の大部分がポリゴンとテクスチャによるものである。
N-BVHは3次元の任意の光線クエリに応答するように設計されたニューラル圧縮アーキテクチャである。
本手法は, 視認性, 深度, 外観特性を忠実に近似する。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:54:34 GMT)
Efficient Verification-Based Face Identification [50.6] 効率の良いニューラルモデルで顔認証を行う際の問題点を$f$で検討する。
我々のモデルは、23kパラメータと5M浮動小数点演算(FLOPS)しか必要としない、かなり小さな$f$に導かれる。
我々は、6つの顔認証データセットを用いて、我々の手法が最先端のモデルよりも同等か優れていることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:57:41 GMT)
Mitigating Catastrophic Forgetting in Large Language Models with Self-Synthesized Rehearsal [49.2] 大規模言語モデル(LLM)は、連続学習中に破滅的な忘れ込みに悩まされる。
自己合成リハーサル(Self-Synthesized Rehearsal, SSR)と呼ばれるフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:17:29 GMT)
Learning Visual-Semantic Subspace Representations for Propositional Reasoning [49.2] 本稿では,特定の意味構造に適合する視覚表現を学習するための新しい手法を提案する。
我々のアプローチは、新しい核規範に基づく損失に基づいている。
部分空間格子におけるセマンティクスのスペクトル幾何学を最小エンコードしていることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:51:38 GMT)
Josephson bifurcation readout: beyond the monochromatic approximation [49.2] 弱非線形超伝導共振回路に基づく分岐量子検出器の特性を解析する。
この回路は超伝導量子ビットの量子状態の効率的な検出器として機能する。
論文参考訳(メタデータ) (Sat, 25 May 2024 22:22:37 GMT)
Unveiling Vulnerabilities of Contrastive Recommender Systems to Poisoning Attacks [48.9] コントラスト学習(CL)は近年,レコメンダシステムの領域で注目されている。
本稿では,CLをベースとしたレコメンデータシステムの脆弱性を明らかにする。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:23:01 GMT)
DiffAug: Enhance Unsupervised Contrastive Learning with Domain-Knowledge-Free Diffusion-based Data Augmentation [48.3] 本稿では,拡散モードに基づく正データ生成を用いた新しい教師なしコントラスト学習手法であるDiffAugを提案する。
DiffAugはセマンティックエンコーダと条件拡散モデルから構成されており、条件拡散モデルはセマンティックエンコーダに条件付された新しい正のサンプルを生成する。
実験的評価により、DiffAugは、DNA配列、視覚、および生体機能データセットのハンドデザインおよびSOTAモデルに基づく拡張手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:43:16 GMT)
How to escape sharp minima with random perturbations [48.1] 平らなミニマの概念とそれらを見つける複雑さについて研究する。
一般的なコスト関数に対して、近似平坦な局所最小値を求める勾配に基づくアルゴリズムについて論じる。
コスト関数がトレーニングデータよりも経験的リスクであるような環境では、シャープネス認識最小化と呼ばれる最近提案された実用的なアルゴリズムにインスパイアされたより高速なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:42:20 GMT)
Animatable and Relightable Gaussians for High-fidelity Human Avatar Modeling [47.1] 強力な2次元CNNと3次元ガウススプラッティングを活用して高忠実度アバターを作成する新しいアバター表現を提案する。
我々の手法は、動的で現実的で、一般化され、楽しく見えるアバターを作ることができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:23:58 GMT)
Assessing Image Inpainting via Re-Inpainting Self-Consistency Evaluation [47.0] 本稿では,複数の再塗装パスに基づく自己教師付きメトリックを利用する,革新的な評価パラダイムを提案する。
このアプローチは、様々な実行可能なインペイントソリューションの探索を可能にするための自己整合性の原則を強調している。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:05:08 GMT)
Visual-RolePlay: Universal Jailbreak Attack on MultiModal Large Language Models via Role-playing Image Characte [46.8] 本稿では,MLLMジェイルブレイク攻撃に対する視覚ロールプレイ(VRP)と呼ばれる新しい効果的手法を提案する。
VRPは、リスクの高い文字の詳細な記述を生成し、その記述に基づいて対応する画像を生成する。
良質なロールプレイインストラクションテキストと組み合わせると、これらのハイリスクなキャラクターイメージはMLLMを効果的に誤解して悪意ある応答を発生させる。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:17:18 GMT)
Keypoint-based Progressive Chain-of-Thought Distillation for LLMs [46.5] 思考の連鎖蒸留は、推論能力を大きな言語モデルからより小さな学生モデルに伝達する強力な技術である。
従来の手法では、学生はLLMによって生成されるステップバイステップの合理性を模倣する必要がある。
我々はこれらの問題に対処する統合フレームワークKPODを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:27:38 GMT)
IntactKV: Improving Large Language Model Quantization by Keeping Pivot Tokens Intact [46.3] 大規模言語モデル(LLM)は自然言語処理に優れるが、集中的な計算を必要とする。
本稿では,LLMにおける従来見過ごされていた外れ値について紹介する。
IntactKVを提案することで、完全精度モデルからピボットトークンのKVキャッシュを損失なく生成する。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:33:03 GMT)
BAT: Learning to Reason about Spatial Sounds with Large Language Models [45.8] 本稿では,空間的シーン解析モデルの音知覚能力と大規模言語モデル(LLM)の自然言語推論能力を組み合わせたBATを提案する。
実験では,空間音知覚と推論の両方において,BATの優れた性能を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:05:11 GMT)
Vision Language Models for Spreadsheet Understanding: Challenges and Opportunities [45.1] 本稿では,スプレッドシート理解における視覚言語モデルの有用性について考察する。
我々は,OCR,空間認識,視覚的フォーマット認識のVLMを評価するための評価指標を用いた3つの自己監督的課題を提案する。
以上の結果から,VLMは有望な機能を示すが,細胞欠失や不適応による不満足な結果をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:51:48 GMT)
Mitigating Dialogue Hallucination for Large Vision Language Models via Adversarial Instruction Tuning [45.1] LVLM(Large Vision Language Models)の幻覚は、汎用アシスタントの信頼性を高めるために重要である。
本稿では,従来のユーザ・システム対話によってLVLMの幻覚が著しく悪化することを示す。
このバイアスを軽減するために,幻覚的対話に対してLVLMを頑健に微調整するAdversarial Instruction Tuning (AIT)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:31:18 GMT)
A Unified Approach Towards Active Learning and Out-of-Distribution Detection [44.3] 我々は、ALとOODの両方検出のための最初の統合ソリューションとして、SISOMを紹介した。
特徴空間距離メトリクスを活用することで、SISOMは、現在独立したタスクの強みを組み合わせて、両方を効果的に解決する。
ALでは、SISOMは他より優れ、3つのベンチマークでトップ1のパフォーマンスを提供する。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:02:55 GMT)
BVI-Lowlight: Fully Registered Benchmark Dataset for Low-Light Video Enhancement [44.2] 本稿では,2つの低照度条件下での様々な動きシナリオにおける40のシーンからなる,新しい低照度映像データセットを提案する。
我々は、プログラム可能な電動ドリーを用いて、通常の光で捉えた完全に登録された地上真実データを提供する。
画像ベースのポストプロセッシングによりそれらを洗練し、異なる光レベルにおけるフレームの画素ワイドアライメントを保証する。
論文参考訳(メタデータ) (Sat, 25 May 2024 18:43:36 GMT)
SNOBERT: A Benchmark for clinical notes entity linking in the SNOMED CT clinical terminology [43.9] 本稿では,BERT モデルを用いた SNOMED CT のテキストスパンと特定の概念をリンクする手法を提案する。
本手法は, 候補選択と候補マッチングの2段階からなる。これらのモデルは, ラベル付き臨床ノートの公開データセットの中で, 最大規模で訓練された。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:00:44 GMT)
STRIDE: A Tool-Assisted LLM Agent Framework for Strategic and Interactive Decision-Making [43.7] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしており、言語能力と推論能力が顕著である。
本稿では,その戦略的意思決定能力を高めるため,メモリと特殊なツールを備えた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:25:10 GMT)
Time-FFM: Towards LM-Empowered Federated Foundation Model for Time Series Forecasting [43.6] 我々は、事前訓練されたLMを活用して時系列予測のためのFederated Foundation ModelであるTime-FFMを提案する。
総合的な実験により、Time-FFMは最先端の予測よりも優れており、効果的に数発・ゼロショットの予測が可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:02:56 GMT)
Accelerating Transformers with Spectrum-Preserving Token Merging [43.5] PiToMeは、エネルギースコアと呼ばれる追加のメトリックを使用して、情報トークンの保存を優先する。
実験の結果,PiToMeはベースモデルの40~60%のFLOPから保存されていた。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:37:01 GMT)
Overcoming Negative Transfer by Online Selection: Distant Domain Adaptation for Fault Diagnosis [42.9] 遠距離領域適応問題」という用語は、ラベル付きソースドメインからラベル付き未ラベルのターゲットドメインへの適応の難しさを記述している。
この問題は、ソースドメインからの外部知識がターゲットドメインのパフォーマンスに悪影響を及ぼす、負の転送のリスクを示す。
この課題に対応するために、我々は、新しいオンライン選択適応(OSAA)アプローチを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:17:47 GMT)
A Bi-Objective Approach to Last-Mile Delivery Routing Considering Driver Preferences [42.2] MOVRP(Multi-Objective Vehicle Routing Problem)は、輸送・物流業界における複雑な最適化問題である。
本稿では,運転者の判断や操作者の嗜好を考慮した経路作成を目的としたMOVRPに対する新しいアプローチを提案する。
この目的に対処するための2つのアプローチとして,視覚的に魅力的な経路計画と,同様の経路を計画するための過去の運転行動のデータマイニングを評価した。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:25:00 GMT)
DoG-Instruct: Towards Premium Instruction-Tuning Data via Text-Grounded Instruction Wrapping [41.9] 本稿では,高品質な命令応答対を見つけるためのスケーラブルな解法を提案する。
文脈のない自己生成にのみ依存するのではなく、人間による文書に基づくペアを生成するためにLLMを訓練する。
提案手法は,幻覚を減らし,文書の表現をLLMでラップする手法である。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:05:52 GMT)
ANLS* -- A Universal Document Processing Metric for Generative Large Language Models [40.9] 本稿ではANLS*と呼ばれる生成モデルを評価するための新しい指標を提案する。
ANLS*メトリックは、既存のANLSメトリクスをドロップ・イン・リプレースとして拡張し、以前報告されたANLSスコアと互換性がある。
また、SFTと呼ばれる文書のプロンプトを生成する新しい手法を、LATINなどの他のプロンプト技術に対してベンチマークする。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:31:45 GMT)
Pessimistic Backward Policy for GFlowNets [40.0] 本稿では,与えられた報酬関数に比例してオブジェクトをサンプリングする生成フローネットワーク(GFlowNets)について検討する。
本研究では,GFlowNetが低軌道の訓練により,高逆対象を過小評価する傾向にあることを示す。
本稿では,GFlowNetsに対する悲観的なバックワードポリシーを提案し,観測されたフローを最大化し,オブジェクトに対する真の報酬と密接に一致させる。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:30:46 GMT)
Adversarial Examples Might be Avoidable: The Role of Data Concentration in Adversarial Robustness [39.9] 入力空間の小体積部分集合に対する濃度は、ロバストな分類器が存在するかどうかを決定する。
さらに、低次元線形部分空間の結合に集中したデータ分布に対して、データの構造を生かして、データ依存多面体保証を享受する分類器が自然に現れることを示した。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:21:15 GMT)
Towards Accurate Binarization of Diffusion Model [39.8] 本稿では,DMの新しい量子化学習手法であるBinaryDMを提案する。
1.1ビットの重みと4ビットのアクティベーション(W1.1A4)により、BinaryDMは7.11 FIDまで低くなり、性能が低下する。
拡散モデルの最初の二項化法として、W1.1A4 BinaryDMは9.3倍のOPと24.8倍のモデルサイズ保存を実現している。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:34:17 GMT)
Mutual Information Estimation via Normalizing Flows [39.6] 本稿では,相互情報推定問題に対する新しいアプローチを提案する。
推定器は、元のデータをターゲット分布にマッピングし、MIを推定し易い。
また、MI の既知閉形式表現を用いて対象分布を探索する。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:37:21 GMT)
PaSCo: Urban 3D Panoptic Scene Completion with Uncertainty Awareness [38.8] Panoptic Scene Completion (PSC)タスクは、一般的なセマンティック・シーン・コンプリート(SSC)タスクをインスタンスレベルの情報で拡張する。
我々のPSC提案では,スパースマルチスケールコンプリートから空でないボクセルにマスクを用いたハイブリッド手法を用いている。
提案手法は,Panoptic Scene Completionと3つの大規模自律走行データセットにおける不確実性評価の両方において,すべてのベースラインを超えている。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:20:53 GMT)
A statistical framework for weak-to-strong generalization [38.6] LLMが超人的能力と人間的フィードバックとの整合性(強弱性)を、その能力を損なうことなく達成できるかどうかは不明である。
これは弱い(非有能な)フィードバックを使ってより強い(より有能な)モデルを訓練する弱い(非有能な)一般化問題の例である。
我々は、事前学習されたLLMから潜在知識を引き出すことにより、弱強一般化が可能であることを証明した。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:54:05 GMT)
MambaLLIE: Implicit Retinex-Aware Low Light Enhancement with Global-then-Local State Space [38.5] MambaLLIEは暗黙のRetinex対応の低照度エンハンサーで、グローバルなローカルな状態空間設計を特徴としている。
MambaLLIE は最先端の CNN や Transformer ベースの手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:31:49 GMT)
Jailbreak and Guard Aligned Language Models with Only Few In-Context Demonstrations [38.4] 大きな言語モデル(LLM)は様々なタスクで顕著に成功しているが、その安全性と有害なコンテンツを生成するリスクは依然として懸念されている。
本研究では, LLM を倒すために有害な実証を行う In-Context Attack (ICA) と, 有害な応答の再現を拒否する事例を通じてモデルレジリエンスを高める In-Context Defense (ICD) を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:01:15 GMT)
Trivialized Momentum Facilitates Diffusion Generative Modeling on Lie Groups [37.8] 本稿では、自明化と呼ばれる手法がユークリッド空間における拡散モデルの有効性をリー群に伝達する方法を示す。
モーメント変数は、データ分布と固定されたサンプル分布の間の位置変数の移動を支援するためにアルゴリズムによって導入された。
得られた方法は、タンパク質およびRNAのねじれ角の生成および洗練されたトーラスデータセットに対する最先端の性能を達成する。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:53:07 GMT)
A Tractable Inference Perspective of Offline RL [36.6] オフライン強化学習(RL)タスクの一般的なパラダイムは、まずオフラインのトラジェクトリをシーケンスモデルに適合させ、次に高い期待されたリターンをもたらすアクションのモデルを促すことである。
本稿では,様々な確率的クエリを正確にかつ効率的に応答できるトラクタビリティが,オフラインRLにおいて重要な役割を担っていることを強調する。
本稿では,評価時間における良好なシーケンスモデルと高い期待値とのギャップを埋めるTrifleを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:06:06 GMT)
Spectral Editing of Activations for Large Language Model Alignment [36.3] 大規模言語モデル(LLM)は、非現実的あるいは偏見のあるコンテンツを生成するなど、望ましくない振る舞いを示すことが多い。
本稿では、入力表現を方向に向けて投影するための新しい推測時間編集手法、すなわち、アクティベーションのスペクトル編集(SEA)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:08:23 GMT)
Distantly-Supervised Joint Extraction with Noise-Robust Learning [36.2] 我々は、知識ベース(KB)を用いてエンティティの言及を対応するエンティティと関係タグに整合させることによりラベルを生成する遠隔ラベル付きデータにおける共同抽出の問題に焦点をあてる。
既存のアプローチは、ノイズの1つの源のみを考慮するか、外部知識を使って決定を行うかのどちらかであり、トレーニングデータにおいて重要な情報を十分に活用することはできない。
本稿では,軽量トランスフォーマーバックボーンを結合タグ付けのためのシーケンスラベリング方式に組み込んだ一般化可能なフレームワークDENRLを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 18:20:12 GMT)
A Second-Order perspective on Compositionality and Incremental Learning [36.1] 本研究では,非線形ネットワークにおける構成性のデミスト化を試みる理論的研究を提案する。
提案した定式化は、構成可能なモジュールを達成するための事前訓練盆地内に留まることの重要性を強調している。
実際、インクリメンタルに学習されたモジュールのプールは、効果的なマルチタスクモデルの作成をサポートするだけでなく、特定のタスクの未学習と特殊化を可能にする。
論文参考訳(メタデータ) (Sat, 25 May 2024 20:56:54 GMT)
LLM Processes: Numerical Predictive Distributions Conditioned on Natural Language [35.8] 我々のゴールは、数値データを処理し、任意の場所で確率的予測を行うレグレッションモデルを構築することである。
まず、大規模言語モデルから明示的で一貫性のある数値予測分布を抽出する戦略を探求する。
本研究では,テキストを数値予測に組み込む能力を示し,予測性能を改善し,定性的な記述を反映した定量的な構造を与える。
論文参考訳(メタデータ) (Sat, 25 May 2024 22:07:48 GMT)
GlycanML: A Multi-Task and Multi-Structure Benchmark for Glycan Machine Learning [35.8] 我々はGlycan Machine Learning (GlycanML)のための包括的なベンチマークを構築している。
GlycanMLベンチマークは、グリカン分類学予測、グリカン免疫原性予測、グリコシル化型予測、タンパク質-グリカン相互作用予測など様々なタスクからなる。
8つのグリカン分類予測タスクを同時に実行することにより、マルチタスク学習(MTL)アルゴリズムのためのGlycanML-MTLテストベッドを導入する。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:35:31 GMT)
Deep-PE: A Learning-Based Pose Evaluator for Point Cloud Registration [35.8] Deep-PEは、ポーズ選択の精度を高めるために設計された、軽量で学習ベースのポーズ評価器である。
我々のネットワークは、ポイントクラウドのアライメント状態をシミュレートし、学習するために、Pose-Aware Attention (PAA)モジュールを組み込んでいる。
Deep-PEは、登録リコールにおいて、最先端の手法を少なくとも8%と11%で大幅に上回っている。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:32:32 GMT)
Diverse Teacher-Students for Deep Safe Semi-Supervised Learning under Class Mismatch [35.4] 海外教師学生(textbfDTS)という新しい枠組みを導入する。
教師-学生モデルと教師-学生モデルの両方をラベルなしのサンプルで訓練することにより、DTSは見知らぬクラスの検出を同時に改善しながら、見知らぬクラスの分類を強化することができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:54:43 GMT)
VMarker-Pro: Probabilistic 3D Human Mesh Estimation from Virtual Markers [35.2] 我々は,大規模なモキャップデータから学習した仮想マーカーとして,革新的な中間表現を導入する。
VMarkerは、野生の画像から仮想マーカーを検出し、これらのマーカーから現実的な形状の無傷メッシュを得ることができる。
VMarker-Proは、画像に整合した複数の可塑性メッシュを生成する確率的フレームワークである。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:53:52 GMT)
Mixture of In-Context Prompters for Tabular PFNs [33.8] MIXTUREPFNは、36の多様なデータセットに対して、19の強力なディープラーニングとツリーベースのベースラインに対して、Condorcetの勝者である。
上記のアルゴリズムのうち、統計的に有意な上位10位を達成している。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:47:59 GMT)
Genetic-guided GFlowNets for Sample Efficient Molecular Optimization [33.3] 深層学習に基づく生成手法の最近の進歩は、将来性を示しているが、サンプル効率の問題に直面している。
本稿では,強力な遺伝的アルゴリズムを深く生成する手法として,サンプル効率のよい分子最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:20:39 GMT)
Learning to Reason via Program Generation, Emulation, and Search [33.1] 言語モデル(LM)によるプログラム合成は、多くの推論能力を解放した。
すべての推論タスクは、コードとして容易に表現できるわけではない。例えば、常識的推論、道徳的意思決定、皮肉な理解を含むタスクである。
我々は,プログラム合成スキルをこのようなタスクに拡張するために,コード生成とエミュレートされた実行(CoGEX)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:40:50 GMT)
Quantum State Generation with Structure-Preserving Diffusion Model [33.1] 本稿では、量子系の(混合)状態の生成モデリングについて考察する。
鍵となる貢献は、量子状態の物理的性質を尊重するアルゴリズム的な革新である。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:07:29 GMT)
GreenCOD: A Green Camouflaged Object Detection Method [32.8] バックプロパゲーションの回避に際し, カモフラージュした物体を検出するグリーンメソッドであるGreenCODを紹介した。
GreenCODは、事前訓練されたDeep Neural Networks(DNN)から抽出した勾配向上と深部特徴を活用する
注目すべきは、我々のモデルはバックプロパゲーションなしで訓練され、20G乗算演算(MAC)未満で最高の性能を達成することである。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:25:27 GMT)
Breaking the False Sense of Security in Backdoor Defense through Re-Activation Attack [32.7] 防衛後のバックドアモデルの特徴を再検討する。
既存の訓練後防衛戦略から派生した防衛モデルには,元のバックドアが現存していることが判明した。
我々は,これらの休眠バックドアを推論中に簡単に再活性化できることを実証的に示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:57:30 GMT)
Human-Agent Cooperation in Games under Incomplete Information through Natural Language Communication [32.7] 不完全な情報の下で共通の目的を達成するために、2人のプレイヤーが交互にトークンを制御できる共有制御ゲームを導入する。
本ゲームでは,人間を相手とする自律エージェントのポリシー合成問題を定式化する。
本稿では,言語モジュールと計画モジュールからなるコミュニケーションベースのアプローチを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:30:30 GMT)
LoGAH: Predicting 774-Million-Parameter Transformers using Graph HyperNetworks with 1/100 Parameters [31.6] Graph HyperNetworks(GHN)は先日,大規模なビジョンモデルの初期化において,強力なパフォーマンスを示している。
LoGAHにより、774万の大規模ニューラルネットワークのパラメータをメモリ効率よく予測できる。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:56:15 GMT)
Verified Safe Reinforcement Learning for Neural Network Dynamic Models [31.2] 本稿では,非線形神経力学系における安全な制御ポリシーを学習するための新しいアプローチを提案する。
我々は、より複雑なドメインに対して特に価値のあるアイデアである、複数の検証済み初期状態依存コントローラを学習する。
5つの安全な制御問題に関する実験は、我々の訓練されたコントローラーが、最先端のベースラインよりも桁違いに長い水平線上で検証された安全性を達成できることを実証している。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:35:39 GMT)
R.A.C.E.: Robust Adversarial Concept Erasure for Secure Text-to-Image Diffusion Model [31.2] 本稿では、これらのリスクを軽減するために考案された新しいアプローチであるRobust Adversarial Concept Erase(RACE)を紹介する。
RACEは高度な対向訓練フレームワークを使用して、対向テキストの埋め込みを識別し緩和する。
本評価は,白箱攻撃と黒箱攻撃の双方に対して,RASの有効性を示すものである。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:56:01 GMT)
LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning [31.1] 大規模言語モデル(LLM)は大規模トレーニングにおいて重要な障害となっている。
ローランド適応(LoRA)はこの問題を軽減するために提案されている。
微調整作業におけるLoRAの層状特性について検討し、予期せぬが一貫した重みノルムの歪さを観察する。
私たちはLayerwise Importance Sampled AdamW (LISA)と名付けた。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:20:27 GMT)
Posterior Probability Matters: Doubly-Adaptive Calibration for Neural Predictions in Online Advertising [29.8] フィールドレベルのキャリブレーションはきめ細やかで実用的だ。
AdaCalibは、モデル予測をキャリブレーションするためにイソトニック関数ファミリーを学ぶ。
実験では、AdaCalibが校正性能を大幅に改善することを確認した。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:39:17 GMT)
Beyond Primal-Dual Methods in Bandits with Stochastic and Adversarial Constraints [29.5] 我々は,学習者が任意の長期制約を満たすことなく報酬を最大化することを目的とした,knapsacks問題によるバンディットの一般化に対処する。
私たちのゴールは、双方の制約の下で機能するベスト・オブ・ザ・ワールドのアルゴリズムを設計することです。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:09:36 GMT)
Detecting Adversarial Data via Perturbation Forgery [28.6] 逆検出は、自然データと逆データの間の分布とノイズパターンの相違に基づいて、データフローから逆データを特定し、フィルタリングすることを目的としている。
不均衡および異方性雑音パターンを回避した生成モデルに基づく新しい攻撃
本研究では,ノイズ分布の摂動,スパースマスク生成,擬似対向データ生成を含む摂動フォージェリを提案し,未知の勾配に基づく,生成モデルに基づく,物理的対向攻撃を検出することができる対向検出器を訓練する。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:34:16 GMT)
Accelerating Inference of Retrieval-Augmented Generation via Sparse Context Selection [28.2] 大きな言語モデル (LLM) は、検索によって強化され、堅牢な性能と広範な汎用性を示す。
本稿では,スパースRAGという新しいパラダイムを提案する。
Sparse RAGは、検索したドキュメントを並列にエンコードする。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:10:04 GMT)
Position: Why We Must Rethink Empirical Research in Machine Learning [28.0] 我々は、機械学習における経験的研究の一般的な、しかし完全な理解に対して警告する。
我々は,複数の知識を実験的に獲得する方法の認識を深めることを求めている。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:14:36 GMT)
From Orthogonality to Dependency: Learning Disentangled Representation for Multi-Modal Time-Series Sensing Signals [28.0] 表現学習の既存の方法は、モダリティ共有変数とモダリティ固有の潜在変数を分離することを目的としている。
本稿では、モーダリティ共有変数とモーダリティ固有潜伏変数が依存する一般的な生成過程を提案する。
当社の textbfMATE モデルは,モーダリティ共有型およびモーダリティ特化型事前ネットワークを備えた時間変動型推論アーキテクチャ上に構築されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:26:02 GMT)
Calibrated Self-Rewarding Vision Language Models [27.7] LVLM(Large Vision-Language Models)は、訓練済みの大規模言語モデル(LLM)と視覚モデルを統合することで、指導チューニングを通じて大幅に進歩した。
LVLMは、しばしば幻覚現象を示し、生成されたテキスト応答は言語的に妥当に見えるが、入力画像に矛盾する。
本稿では,候補応答を反復的に生成し,各応答に対する報酬を評価し,微調整のための選好データをキュレートすることで,モデルの自己改善を可能にするCalibrated Self-Rewarding(CSR)アプローチを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:36:07 GMT)
5W1H Extraction With Large Language Models [27.4] 5W1Hフレームワークによる重要なニュース要素の抽出は、イベント抽出とテキスト要約に不可欠である。
ChatGPTは、より長いニューステキストの処理やコンテキスト内の特定の属性の分析において問題に直面している。
我々は、ゼロショット/ファウショットからのいくつかの戦略を設計し、より効率的な微調整を行い、元のニュース文書から5W1Hアスペクトを抽出する。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:42:58 GMT)
Text2Reward: Reward Shaping with Language Models for Reinforcement Learning [27.0] Text2Rewardは、大きな言語モデルに基づいた高密度報酬関数の生成と形成を自動化する。
様々なタスクをカバーし、既存のパッケージを活用し、人間のフィードバックで反復的な改善を可能にする、解釈可能な、自由形式の高密度報酬コードを生成する。
移動課題では, 成功率94%を超える6つの新しい動作を学習する。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:42:10 GMT)
Explainable Molecular Property Prediction: Aligning Chemical Concepts with Predictions via Language Models [26.8] 本研究では,言語モデルに基づく分子特性予測のための新しいフレームワークであるLamoleを開発した。
ラモールは同等の分類精度を達成でき、説明精度を最大14.8%向上させることができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:27:04 GMT)
AIGB: Generative Auto-bidding via Diffusion Modeling [26.3] 本稿では,AIGB(AI-Generated Bidding)について紹介する。
このパラダイムでは、入札生成のための条件付き拡散モデルであるDiffBidを提案する。
Alibabaの広告プラットフォーム上で、実世界のデータセットとオンラインA/Bテストで実施された実験は、DiffBidの有効性を実証している。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:21:43 GMT)
Revisit, Extend, and Enhance Hessian-Free Influence Functions [26.1] 影響関数は、モデルの解釈、サブセットのトレーニングセットの選択などにおけるサンプルの影響を評価する重要なツールとして機能する。
本稿では,Trac として知られる特定の有効近似法を再検討する。
この方法は、ヘッセン行列の逆を恒等行列で置き換える。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:43:36 GMT)
On the Inflation of KNN-Shapley Value [26.1] 本稿では, 有害試料と有害試料を区別する閾値としてゼロを校正するキャリブレーションKNN-Shapleyを提案する。
本稿では,データ評価インフレーションの緩和,有害サンプルの検出,データ品質評価におけるCKNN-Shapleyの有効性を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:26:33 GMT)
Evolutionary Large Language Model for Automated Feature Transformation [26.0] 自動特徴変換のための進化的Large Language Model (LLM) フレームワークを提案する。
本フレームワークは,1)RLデータコレクタによるマルチポピュレーションデータベースの構築,2)大規模言語モデル(LLM)のシーケンス理解能力を活用した2つの部分から構成される。
提案手法の有効性と汎用性を実証的に示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:27:21 GMT)
Multi-Group Fairness Evaluation via Conditional Value-at-Risk Testing [24.6] 本研究では,条件付き値-at-Riskに基づく性能格差のテスト手法を提案する。
性能違反を発見するのに必要なサンプルの複雑さは指数関数的に減少し、群数の平方根によって最も上界にあることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:42:29 GMT)
Feature Protection For Out-of-distribution Generalization [24.1] 事前訓練された特徴の保護は、より厳密に調整されたモデルが一般化に結びつくことを示す。
事前訓練された特徴の保護は,OODの一般化に対してより堅牢な微調整モデルをもたらすことを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:00:06 GMT)
Optimistic Multi-Agent Policy Gradient [23.8] 相対的過一般化 (Relative Over generalization, RO) は、エージェントが準最適結合ポリシーに向かって収束する際に起こる。
マルチエージェントポリシー勾配(MAPG)法では,ROに対処する手法は提案されていない。
本稿では,RO問題を緩和するMAPG手法の楽観的な更新を可能にする,汎用的でシンプルなフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:34:47 GMT)
Theoretical Analysis of Weak-to-Strong Generalization [23.2] 既存の弱監督理論は擬似ラベル補正とカバレッジ拡張を考慮しないことを示す。
我々の境界線は、強モデルが追加の誤りを起こさずに弱教師の誤りに適合できない場合に、弱強一般化が起こるという直感を捉えている。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:48:12 GMT)
Pausing Policy Learning in Non-stationary Reinforcement Learning [23.1] 意思決定を継続的に更新することは、時間的ギャップを最小限にするために最適である、という共通の信念に取り組む。
我々は,オンライン強化学習フレームワークの予測を提案し,戦略的に混乱した意思決定の更新により,全体的なパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:38:09 GMT)
Self Model for Embodied Intelligence: Modeling Full-Body Human Musculoskeletal System and Locomotion Control with Hierarchical Low-Dimensional Representation [22.9] 筋骨格モデル(MS-Human-700)を90個の体節,206個の関節,700個の筋腱ユニットで構築した。
低次元表現と階層的深部強化学習を用いた新しいアルゴリズムを開発し、最先端のフルボディ制御を実現する。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:26:22 GMT)
Time-SSM: Simplifying and Unifying State Space Models for Time Series Forecasting [22.8] 状態空間モデル(SSM)は、基底関数の集合を用いて連続系を近似し、それらを離散化して入力データを処理する。
本稿では,SSMを時系列データに適用するためのより直感的で汎用的なガイダンスを提供する,動的スペクトル演算子(Dynamic Spectral Operator)と呼ばれる新しい理論フレームワークを提案する。
パラメータの7分の1しか持たない新しいSSM基盤モデルであるTime-SSMを紹介する。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:42:40 GMT)
FedSheafHN: Personalized Federated Learning on Graph-structured Data [22.8] 我々はFedSheafHNと呼ばれるモデルを提案し、各クライアントのローカルサブグラフをサーバ構築コラボレーショングラフに埋め込む。
我々のモデルは複雑なクライアント特性の統合と解釈を改善します。
また、高速なモデル収束と効果的な新しいクライアントの一般化も備えている。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:51:41 GMT)
Near-Optimal Distributed Minimax Optimization under the Second-Order Similarity [22.6] 本研究では,有限サム構造を目的とする分散楽観的すべり(SVOGS)法を提案する。
我々は$mathcal O(delta D2/varepsilon)$、$mathcal O(n+sqrtndelta D2/varepsilon)$、$tildemathcal O(n+sqrtndelta+L)D2/varepsilon)$の局所呼び出しを証明している。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:34:49 GMT)
Assessing Prompt Injection Risks in 200+ Custom GPTs [21.9] 本研究は、ユーザカスタマイズGPTに固有の重大なセキュリティ脆弱性である即時インジェクション攻撃を明らかにする。
プロンプトインジェクションによって、相手はカスタマイズされたシステムプロンプトを抽出できるだけでなく、アップロードされたファイルにもアクセスできる。
本稿では,このような攻撃を軽減できる可能性の評価とともに,インパルス注入の直接的解析を行う。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:32:39 GMT)
Blockchain-Envisioned UAV-Aided Disaster Relief Networks: Challenges and Solutions [21.8] 無人航空機(UAV)支援災害救助ネットワーク(UDRN)は、UAVを活用して、影響を受けた地域を迅速に評価し、タイムリーに救命物資を届けることにより、地上救援ネットワークを支援する。
コラボレーティブで信頼性のない透明なUDRNサービスに対する需要の増加に対応するため、ブロックチェーンベースのUDRNは、不変の台帳と分散スマートコントラクトを通じて、有望なアプローチとして登場します。
i)協調的救済管理のための一連の協調的スマートコントラクト、(ii)既知の、未知の契約の脆弱性を防止するための動的コントラクト監査機構、(iii)ロバストな取引法医学戦略。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:27:01 GMT)
SPOR: A Comprehensive and Practical Evaluation Method for Compositional Generalization in Data-to-Text Generation [21.7] 本研究では,データ・テキスト生成における合成一般化のための総合的・実践的な評価手法であるSPORを提案する。
2つの異なるデータセット上でSPORを実証し、LLMを含む既存の言語モデルを評価する。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:37:00 GMT)
Rethinking Early-Fusion Strategies for Improved Multispectral Object Detection [21.6] 最近のマルチスペクトル物体検出器では、RGBや熱画像から特徴を抽出するために2分岐構造を採用している。
2分岐構造は単分岐構造よりも優れた性能を達成するが、推論効率は見落としている。
本稿では,新しい形状優先早期融合戦略,弱教師付き学習法,コア知識蒸留技術などに対応する手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:19:34 GMT)
Certifying Adapters: Enabling and Enhancing the Certification of Classifier Adversarial Robustness [21.4] 本稿では,対向ロバスト性の証明を可能にする新しい認証アダプタフレームワーク(CAF)を提案する。
CAFは、ランダムまたは復号化スムーシングに基づく手法と比較して、認証精度の向上を実現している。
アダプタのアンサンブルにより、1つの事前訓練された特徴抽出器は、様々なノイズ摂動スケールに対して防御することができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:18:52 GMT)
Efficient Text-driven Motion Generation via Latent Consistency Training [21.3] 動き拡散モデルはテキスト駆動の動作生成において優れるが、リアルタイムの推論に苦慮する。
本研究では,コンパクトな動作遅延表現の大規模なスキップサンプリングを可能にする動き潜時整合トレーニングフレームワークを提案する。
2つのベンチマークの実験では、モデルの性能が80%の推論コスト削減で実証されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:01:20 GMT)
Finite-Time Analysis for Conflict-Avoidant Multi-Task Reinforcement Learning [21.3] 本稿では,CA と FC という2つのサブプロデューサの選択肢に基づいて,新しい動的重み付けマルチタスク・アクター・クリティック・アルゴリズム (MTAC) を開発した。
MTAC-CAは、タスク間の最小値改善を最大化する競合回避(CA)更新方向と、MTAC-FCターゲットをはるかに高速な収束速度で見つけることを目的としている。
MT10における実験により,既存のMTRL法よりもアルゴリズムの性能が向上したことを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:57:46 GMT)
Lateralization MLP: A Simple Brain-inspired Architecture for Diffusion [20.4] 並列化(L-MLP)と呼ばれる,単純だが効果的なアーキテクチャを提案する。
人間の脳の側方化に触発されて、我々は、L-MLPと呼ばれる新しい単純で効果的なアーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:10:02 GMT)
Federated Unsupervised Domain Generalization using Global and Local Alignment of Gradients [20.4] まず、教師なし学習における領域シフトと勾配のアライメントの関係を理論的に確立する。
クライアントレベルとサーバレベルの両方で勾配を整合させることで、モデルの新たな(ターゲット)ドメインへの一般化が容易であることを示す。
我々はFedGaLAという新しい手法を提案し、クライアントレベルで勾配アライメントを行い、クライアントがドメイン不変の機能を学ぶことを奨励する。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:12:54 GMT)
Towards Black-Box Membership Inference Attack for Diffusion Models [20.2] まず,既存のMIA法を著作権保護に適用する際の限界を同定する。
モデルの内部U-netへのアクセスを必要とせずに動作する新しいブラックボックスメンバーシップ推論手法を提案する。
次に、より包括的な評価を行うために、DALL-E生成データセットを構築する。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:47:58 GMT)
No Free Lunch in LLM Watermarking: Trade-offs in Watermarking Design Choices [20.2] LLM透かし方式における一般的な設計選択は、結果のシステムが驚くほど攻撃を受けやすいことを示す。
本稿では, LLM透かしのガイドラインと防御について述べる。
論文参考訳(メタデータ) (Sat, 25 May 2024 20:51:49 GMT)
Large-Scale Multi-Center CT and MRI Segmentation of Pancreas with Deep Learning [20.0] 膵疾患の診断と経過観察には膵の容積分画の自動化が必要である。
そこで我々は,nnUNetとTransformerネットワークの長所と,ボリューム計算が可能な新しい線形アテンションモジュールを組み合わせたPanSegNetを開発した。
T1W MRIは85.0% (std: 7.9%) , T2W MRIは86.3% (std: 6.4%) であった。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:52:31 GMT)
Paths of A Million People: Extracting Life Trajectories from Wikipedia [20.0] 我々は、軌跡記述の多様性と不均一性から生じる一般化問題に取り組む。
半教師付き学習とコントラスト学習を組み合わせた組立モデルCOSMOSは,F1スコア85.95%を達成している。
我々はまた、8,852(人、時間、場所)のトリプルからなる手作業によるデータセットWikiLifeTrajectoryを作成しました。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:57:33 GMT)
MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time [19.8] MindStarは純粋に推論に基づく探索手法であり、推論タスクを探索問題として扱う。
GSM8KとMATHの両方のデータセット上でM*フレームワークを評価する。
以上の結果から,M*はオープンソースモデルの推論能力を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:07:33 GMT)
Iterated $Q$-Network: Beyond One-Step Bellman Updates in Deep Reinforcement Learning [19.5] 反復$Q$-Network (iQN) は、ベルマンの更新を連続的に行うことができる原則的なアプローチである。
iQNは理論的に根拠があり、値ベースおよびアクター批判的手法でシームレスに使用できることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:42:15 GMT)
PLUG: Revisiting Amodal Segmentation with Foundation Model and Hierarchical Focus [19.3] SAMに基づく最初のアモーダルセグメンテーション手法であるPLUGを提案する。
地域レベルでは、可視・隠蔽領域の関連と区分により、相互の混乱を避けるために、異なる枝の焦点として、イモダル領域とアモーダル領域が割り当てられる。
ポイントレベルでは、不確実性の概念を導入し、曖昧な点を特定し、焦点を合わせる際にモデルを明確に支援する。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:58:20 GMT)
Conformalized Late Fusion Multi-View Learning [18.9] 多視点学習の不確かさの定量化は、科学的な問題における多視点データの利用の増加によって動機づけられる。
個別のビューで個別の予測器を訓練し、単一のビュー予測が利用可能になった後にそれらを組み合わせます。
本稿では,共形予測を単一ビュー予測器上で個別に行う手法として,MVCP(Multi-View Conformal Prediction)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:11:01 GMT)
Adaptive $Q$-Network: On-the-fly Target Selection for Deep Reinforcement Learning [18.6] 自動強化学習(AutoRL)のための新しいアプローチとして,Adaptive $Q$-Network (AdaQN)を提案する。
AdaQNは、追加のサンプルを必要としない最適化手順の非定常性を考慮に入れている。
AdaQNは理論的に健全であり、MuJoCo制御問題において実験的に検証されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:57:43 GMT)
Does SGD really happen in tiny subspaces? [18.3] 近年の研究では、トレーニング軌道に沿って、勾配がトレーニング損失 Hessian の低ランクトップ固有空間とほぼ一致していることが示されている。
本稿では,ニューラルネットワークが支配的な部分空間内でトレーニング可能かどうかを考察し,より効率的なトレーニング手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:44:35 GMT)
K-percent Evaluation for Lifelong RL [18.0] 持続的あるいは生涯にわたる強化学習では、環境へのアクセスは制限されるべきである。
本稿では,実験データのk%しかハイパーパラメータチューニングに使用できない長寿命RLエージェントの評価手法を提案する。
ネットワークの可塑性を維持するために設計されたいくつかのアルゴリズムによる緩和は驚くほどよく機能するのに対し、エージェントはkパーセントのチューニングに制限された場合、一般的に性能が良くない。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:22:21 GMT)
RoboArm-NMP: a Learning Environment for Neural Motion Planning [17.3] 本稿では,ニューラルモーションプランニング(NMP)アルゴリズムの簡易かつ徹底的な評価を可能にする学習・評価環境であるRoboArm-NMPを提案する。
我々のPythonベースの環境は,学習制御ポリシ(教師付きあるいは強化学習ベース)のベースライン実装,PyBulletに基づくシミュレータ,古典的な動作計画解法を用いた解決インスタンスのデータを提供する。
我々は,RoboArm-NMPを用いて,いくつかの顕著なNMP設計点を比較し,最も優れた手法が,固定障害物のあるシーンにおける未確認目標の一般化に成功しているが,未確認障害物構成の一般化には困難であることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:28:11 GMT)
Dynamic Inhomogeneous Quantum Resource Scheduling with Reinforcement Learning [17.2] 量子情報科学と技術における中心的な課題は、量子システムのリアルタイム推定とフィードフォワード制御の実現である。
量子ビット対の自己アテンション機構を強調するトランスフォーマーモデルを用いた新しいフレームワークを提案する。
提案手法は量子システムの性能を著しく改善し,ルールベースエージェントよりも3ドル以上向上する。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:39:35 GMT)
AdAdaGrad: Adaptive Batch Size Schemes for Adaptive Gradient Methods [17.0] 本稿では,AdAdaGradのスカラー変種AdAdaGradNormについて紹介する。
また,画像分類実験を行い,提案手法のメリットを強調した。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:57:29 GMT)
Approximation Rates and VC-Dimension Bounds for (P)ReLU MLP Mixture of Experts [17.0] Mixture-of-Experts(MoEs)は、従来のディープラーニングモデルを越えてスケールアップすることができる。
MoMLPモデル全体のVC次元が$tildeO(LmaxnL,JW)$であるので、MoMLPが一般化可能であることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:02:25 GMT)
Local Causal Structure Learning in the Presence of Latent Variables [16.9] 本稿では,変数がターゲットの直接的な原因や効果であるかどうかを判定する原理的手法を提案する。
実世界の合成データと実世界のデータによる実験結果から,本手法の有効性と有効性について検証した。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:31:05 GMT)
Tensor-Valued Time and Inference Path Optimization in Differential Equation-Based Generative Modeling [16.9] この研究は、従来のスカラー値の時間を複数の次元に拡張するテンソル値の時間を導入している。
また,多次元推論軌道を適応的に決定する新しい経路最適化問題を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:10:27 GMT)
Automating the Selection of Proxy Variables of Unmeasured Confounders [16.8] 既存のプロキシ変数推定器を拡張して、治療と結果の間に複数の未測定の共同創設者が存在するシナリオに対応する。
本稿では、プロキシ変数の選択と因果効果の偏りのない推定のための2つのデータ駆動手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:53:49 GMT)
OmniBind: Teach to Build Unequal-Scale Modality Interaction for Omni-Bind of All [16.7] OmniBindは、あらゆるモダリティの組み合わせと相互作用を実現できる新しい2段階学習フレームワークである。
認識タスクの実験は、任意のモダリティの組み合わせ設定で平均4.05%の性能向上を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:45:41 GMT)
LLMs for User Interest Exploration: A Hybrid Approach [16.5] 従来のレコメンデーションシステムは、過去のユーザとイテムのインタラクションから学び、強化することで、強いフィードバックループを受ける。
本稿では,Large Language Models(LLM)と古典的レコメンデーションモデルを組み合わせたハイブリッド階層型フレームワークを提案する。
数十億のユーザを対象とする産業規模の商用プラットフォーム上で,このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:57:36 GMT)
Retrieval-Augmented Conversational Recommendation with Prompt-based Semi-Structured Natural Language State Tracking [16.4] 大規模言語モデル(LLM)では、ユーザ好みの発話とユーザ生成レビューにおける複雑な言語との間の常識的な接続を解き放つことができます。
RA-RecはConvRecの対話状態トラッキングシステムで、ビデオ、オープンソースのGitHubリポジトリ、インタラクティブなGoogle Colabノートブックで紹介されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:41:26 GMT)
Disentangling Heterogeneous Knowledge Concept Embedding for Cognitive Diagnosis on Untested Knowledge [16.1] 現在の研究は、それぞれの知識概念が複数のエクササイズによってテストされ、カバーされることを前提としている。
いくつかのエクササイズですべての知識概念を完全にカバーすることは、ほとんど不可能です。
未検証知識に基づくアンダーライン認知下線診断フレームワーク(DisKCD)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:49:54 GMT)
HetHub: A Heterogeneous distributed hybrid training system for large-scale models [16.1] GPUアクセラレータのタイプで大規模なクラスタを構築するのは難しい。
既存の分散トレーニングシステムは、均一なGPUアクセラレータしかサポートしていない。
本稿では,ヘテロジニアスGPUアクセラレータを用いたハイブリッド並列処理による分散トレーニングシステムを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:36:35 GMT)
HyperBERT: Mixing Hypergraph-Aware Layers with Language Models for Node Classification on Text-Attributed Hypergraphs [16.1] 我々はハイパーグラフリレーショナル構造とテキスト分散ハイパーグラフを同時にモデル化する新しいアーキテクチャHyperBERTを提案する。
結果から,HyperBERTは5つの挑戦的テキスト分散ハイパーグラフノード分類ベンチマークに対して,新たな最先端性を達成していることがわかった。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:10:38 GMT)
Large Language Model Instruction Following: A Survey of Progresses and Challenges [15.9] 本稿では,現在の指導研究を要約し,考察する。
われわれの知る限りでは、次の教示に関する総合的な調査はこれが初めてである。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:21:21 GMT)
Enabling On-Device Learning via Experience Replay with Efficient Dataset Condensation [15.9] 本稿では,重要な情報損失を回避するために,最も代表的データを特定する問題に対処するオンデバイスフレームワークを提案する。
具体的には、未ラベルの着信データを効果的に処理するために、未ラベルのオンデバイス学習環境向けに設計された擬似ラベル技術を提案する。
バッファ容量は1クラスにつき1サンプルに過ぎず,既存のベースラインを58.4%上回る精度を実現している。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:52:36 GMT)
Understanding Server-Assisted Federated Learning in the Presence of Incomplete Client Participation [15.1] サーバ支援フェデレーションラーニング(SA-FL)は、不完全なクライアント参加の影響を軽減するための一般的なアプローチである。
本稿では,SA-FLが不完全なクライアント参加問題に対処する上で有効であることを示すが,SA-FLの理論的理解は乏しい。
理想的なクライアント参加仮定を持つ古典的FLと同じ線形収束速度を保証するSA-FLアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:18:29 GMT)
gRNAde: Geometric Deep Learning for 3D RNA inverse design [14.7] gRNAdeは3次元RNAバックボーンで動作する幾何学的RNA設計パイプラインである。
構造と力学を明示的に考慮したシーケンスを生成する。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:11:45 GMT)
Each Test Image Deserves A Specific Prompt: Continual Test-Time Adaptation for 2D Medical Image Segmentation [14.7] ドメイン間の分散シフトは、実世界のアプリケーションに事前訓練されたセマンティックセグメンテーションモデルをデプロイする上で重要な障害である。
テスト時間適応は、推論中にドメイン間の分布シフトに取り組むのに有効であることが証明されている。
本稿では,各テスト画像に対する特定のプロンプトをトレーニングし,バッチ正規化レイヤの統計値を調整するために,Visual Prompt-based Test-Time Adaptation (VPTTA)法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:03:43 GMT)
Semantic Density: Uncertainty Quantification in Semantic Space for Large Language Models [14.7] 既存のLarge Language Models (LLM) には、ユーザが生成するレスポンスごとに不確実なメトリックを提供する固有の機能がない。
本稿では,これらの課題に対処する新しい枠組みを提案する。
意味密度は、意味空間における確率分布の観点から各応答の不確かさ情報を抽出する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:20:46 GMT)
Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models [14.5] 信頼性・確率アライメントの概念を紹介します。
モデルの内部と信頼感の一致を調査する。
分析したモデルのうち、OpenAIのGPT-4は信頼性と信頼性のアライメントが最強であった。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:42:04 GMT)
SIGNLINE: Digital signature scheme based on linear equations cryptosystem [14.4] 対数符号は基本的な暗号プリミティブとして機能し、非線形性、非可換性、一方向性、鍵依存因子性などの特性を特徴とする。
提案した暗号体系は、線形方程式の基礎を通じて対数的シグネチャの秘密性を保証する。
量子セキュリティは、対数署名の入力と出力の間のマッピングを排除し、グローバーの量子攻撃を非効率にする。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:35:42 GMT)
Transitional Uncertainty with Layered Intermediate Predictions [14.1] 単一パス不確実性推定のための特徴工学について論じる。
本稿では,現在の単一パス推定器の欠点に対処する簡単なアプローチとして,階層型中間予測を用いた過渡不確実性を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:03:38 GMT)
Multi-Agent Reinforcement Learning for Energy Networks: Computational Challenges, Progress and Open Problems [14.1] マルチエージェント強化学習は、エネルギーネットワークの分散化と脱炭を支援することができる。
これは、エネルギーネットワークの管理における重要な計算上の課題を特定し、それらに対処する最近の研究の進捗をレビューし、MARLを使って対処する可能性のあるオープンな課題を強調することで達成される。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:10:30 GMT)
Learning Point Spread Function Invertibility Assessment for Image Deconvolution [14.1] ニューラルネットワークを用いて任意のPSFの可逆性を学習するために非線形アプローチを用いるメトリクスを提案する。
マッピングされたPSFとユニットインパルスとの差は、DLネットワークによるインバージョンの成功率が高いことを示している。
論文参考訳(メタデータ) (Sat, 25 May 2024 20:00:27 GMT)
NetMamba: Efficient Network Traffic Classification via Pre-training Unidirectional Mamba [14.0] ネットワークトラフィックの分類は、サービス品質の向上、ネットワーク管理の効率化、サイバーセキュリティの強化を目的とした重要な研究分野である。
既存のアプローチは2つの大きな課題に直面している。まず、広く使われているTransformerアーキテクチャの2次複雑さのために、モデル非効率に苦しむ。
本稿では,包括的トラフィック表現方式を備えた線形時間空間モデルであるNetMambaを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:58:27 GMT)
VOODOO XP: Expressive One-Shot Head Reenactment for VR Telepresence [14.0] VOODOO XPは、入力ドライバビデオと1枚の2Dポートレートから高表現力の表情を生成することができる、3D対応のワンショットヘッド再現法である。
本稿では,モノクラー映像設定と双方向通信のためのエンドツーエンドVRテレプレゼンスシステムについて述べる。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:33:40 GMT)
RedMotion: Motion Prediction via Redundancy Reduction [14.0] 自動運転車における動き予測のためのトランスフォーマーモデルであるRedMotionを紹介する。
RedMotionは冗長性低減を通じて環境表現を学習する。
提案手法は,動作予測チャレンジにおけるHPTRやMTR++と比較して,競合的な結果が得られる。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:26:28 GMT)
Interpolating Item and User Fairness in Multi-Sided Recommendations [13.6] 我々は、新しいフェアレコメンデーションフレームワーク、問題(FAIR)を紹介します。
本稿では,リアルタイム学習とフェアレコメンデーションを同時に行う低レベルのアルゴリズム形式を提案する。
我々は,プラットフォーム収益を維持する上でのフレームワークと手法の有効性を実証するとともに,アイテムとユーザ双方に望ましい公平性を確保した。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:07:36 GMT)
No Two Devils Alike: Unveiling Distinct Mechanisms of Fine-tuning Attacks [13.6] 我々は、最も代表的な2つの攻撃方法の分析を行う: Explicit Harmful Attack (EHA)とIdentity-Shifting Attack (ISA)である。
ISAとは異なり、EHAは有害な認識段階を積極的に狙う傾向にあり、EHAとISAは後者の2段階を妨害するが、攻撃の程度とメカニズムは著しく異なる。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:38:40 GMT)
A Study on Developer Behaviors for Validating and Repairing LLM-Generated Code Using Eye Tracking and IDE Actions [13.6] GitHub Copilotは、LLM(Big Language Model)ベースのコード生成ツールである。
本稿では,Copilotが生成したコードを開発者がどのように検証し,修復するかを検討する。
コードの存在を認識したことにより、パフォーマンスの向上、検索努力の向上、コパイロットの使用頻度の向上、認知作業負荷の向上につながった。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:20:01 GMT)
A 7K Parameter Model for Underwater Image Enhancement based on Transmission Map Prior [13.5] 水中画像強調のための深層学習モデルは、軽量および有効両方の制限に直面します。
本稿では,軽量選択的注意ネットワーク (LSNet) を提案する。
提案モデルでは,類似の注意ベースモデルと比較してPSNRが97%,パラメータは7Kである。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:58:24 GMT)
Enhancing Consistency-Based Image Generation via Adversarialy-Trained Classification and Energy-Based Discrimination [13.2] 本稿では,一貫性に基づく画像の生成を後処理する新しい手法を提案し,その知覚的品質を向上させる。
本手法では,両部位を逆向きに訓練する共同分類器-識別器モデルを用いる。
このジョイントマシンの指導の下で、サンプル特異的な投影勾配を用いることで、合成画像を洗練し、ImageNet 64x64データセット上でFIDスコアを改良した。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:53:52 GMT)
SuDA: Support-based Domain Adaptation for Sim2Real Motion Capture with Flexible Sensors [12.8] 既存の柔軟なセンサーベースのMoCapメソッドはディープラーニングに依存しており、トレーニングには大規模で多様なラベル付きデータセットを必要とする。
フレキシブルセンサの高線形性により,ドメイン適応に基づく新しいSim2Real Mocapソリューションを提案する。
我々のソリューションは、新しいサポートベースのドメイン適応法、すなわち、予測関数の支持を整列するSuDAに依存している。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:43:33 GMT)
PM2: A New Prompting Multi-modal Model Paradigm for Few-shot Medical Image Classification [12.6] 本稿では,PM2と呼ばれるマルチモーダル基盤モデルに基づく医用画像分類のための新しいマルチモーダルモデルパラダイムを提案する。
画像のモダリティに加えて、PM2はプロンプトとして知られる別の補足的なテキスト入力を導入し、対応する画像や概念クラスを記述している。
我々のPM2は、プロンプトスキームによらず、かなり優れており、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:31:55 GMT)
Filling Missing Values Matters for Range Image-Based Point Cloud Segmentation [12.6] ポイントクラウドセグメンテーション(PCS)は、ロボットの知覚とナビゲーションタスクにおいて重要な役割を果たす。
大規模屋外点雲を効率的に理解するために、その範囲画像表現が一般的である。
しかし、範囲画像の望ましくない欠落値は、物体の形状やパターンを損なう。
この問題は、オブジェクトからコヒーレントで完全な幾何学的情報を学ぶ際に、モデルにとって困難を生じさせる。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:40:50 GMT)
iREL at SemEval-2024 Task 9: Improving Conventional Prompting Methods for Brain Teasers [11.8] 本稿では,SemEval-2024 Task 9: BRAINTEASER: A Novel Task Defying Common Senseについて述べる。
BRAINTEASERタスクは、モデルの側方思考能力を評価するために設計された複数の選択質問回答を含む。
両サブタスクにおける事前学習言語モデルの性能向上のためのユニークな戦略を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:50:51 GMT)
DiLA: Enhancing LLM Tool Learning with Differential Logic Layer [11.8] 本稿では,ネットワーク層の前方・後方通過に論理的制約を組み込むディファレンシャル・ロジック・レイヤ支援言語モデリング(DiLA)手法を提案する。
2つの古典的推論問題に対するDiLAの性能評価を行い、既存のプロンプトベースおよびソルバ支援アプローチに対する一貫した性能を実証した。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:46:17 GMT)
Proposal for a Quantum Mechanical Test of Gravity at Millimeter Scale [11.8] 重力によるポテンシャル差から誘起される量子相の異なる進化を検出するためにジョセフソン効果を利用する新しい実験を提案する。
この実験は、ミリスケールで量子力学的に重力をテストすることができ、また、小さなスケールでの重力のパリティ不変性を調べることができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:27:28 GMT)
Deep Causal Generative Models with Property Control [11.6] 我々は相関対応因果変分自動エンコーダ(C2VAE)と呼ばれる新しい深層生成フレームワークを提案する。
C2VAEは、非絡み付き潜在ベクトルを用いて特性間の相関関係と因果関係を同時に回復する。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:07:27 GMT)
SLoPe: Double-Pruned Sparse Plus Lazy Low-Rank Adapter Pretraining of LLMs [11.2] SLoPeは、トレーニング前の1%のイテレーションで低ランクのアダプタを追加することで、スパース事前訓練モデルの精度を向上させる。
SLoPeは、数十億のパラメータを持つモデルのトレーニングと推論を、それぞれ1.14times$と1.34times$に加速する。
論文参考訳(メタデータ) (Sat, 25 May 2024 18:43:05 GMT)
Out of Sight, Still in Mind: Reasoning and Planning about Unobserved Objects with Video Tracking Enabled Memory Models [11.1] オブジェクト指向メモリを多目的操作推論フレームワークに符号化する問題について検討する。
部分ビュー点雲のトラジェクトリの履歴を符号化するためにトランスフォーマダイナミクスを利用するLOOMを提案する。
提案手法は,新規なオブジェクトの出現を排除した推論や,オブジェクトの再出現など,複数のタスクを実行できる。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:00:12 GMT)
AutoManual: Generating Instruction Manuals by LLM Agents via Interactive Environmental Learning [11.1] LLM(Large Language Models)ベースのエージェントは、さまざまなドメインにわたるタスクを自律的に完了させることを約束している。
我々は,LLMエージェントが対話を通じて理解を自律的に構築し,新しい環境に適応することを可能にするフレームワークであるAutoManualを紹介した。
AutoManualは、環境知識を多様なルールに分類し、2人のエージェントによってオンラインで最適化する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:11:44 GMT)
Incremental Comprehension of Garden-Path Sentences by Large Language Models: Semantic Interpretation, Syntactic Re-Analysis, and Attention [11.1] 本研究では,4つの大言語モデルを用いて,園芸パス文の処理と誤解釈の運命について検討する。
総合的な目標は、人間とLLMが庭道文の処理に一致しているかどうかを評価することである。
実験により,園芸道文の処理における人間とLLMの連携が期待できることが示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:36:13 GMT)
An Empirical Exploration of Trust Dynamics in LLM Supply Chains [11.1] 我々は、AIシステムが生み出す複雑で動的なサプライチェーンを考慮し、AIへの信頼に対処する研究の範囲を広げることを主張する。
私たちの研究は、新たなタイプの信頼者、信頼者、信頼関係に影響を与える新しい要因を明らかにします。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:37:56 GMT)
A Prototype-Based Neural Network for Image Anomaly Detection and Localization [10.8] 本稿では,画像の異常検出と局所化のためのプロトタイプベースニューラルネットワークProtoADを提案する。
まず,自然画像に事前学習したディープネットワークにより,通常の画像のパッチの特徴を抽出する。
ProtoADは、推論速度の高い最先端の手法と比較して、競争性能が向上する。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:29:04 GMT)
Subtle Biases Need Subtler Measures: Dual Metrics for Evaluating Representative and Affinity Bias in Large Language Models [10.7] 本研究は,Large Language Models (LLMs) における2つのバイアス,代表バイアスと親和性バイアスに対処する。
我々は,これらのバイアスを測定するために,代表バイアススコア(RBS)と親和性バイアススコア(ABS)の2つの新しい指標を導入する。
我々の分析では、白人、ストレート、男性と関連する身元を選好する著名なLSMにおいて、顕著な偏見が明らかとなった。
親和性バイアスによる各モデルにおける特徴的評価パターンの解明
論文参考訳(メタデータ) (Sat, 25 May 2024 15:38:38 GMT)
MINet: Multi-scale Interactive Network for Real-time Salient Object Detection of Strip Steel Surface Defects [10.6] 我々は,DWConv(Deepwise Convolution)とPWConv(Pointwise Convolution)を用いて,異なるスケールの機能を独立して抽出し,対話的に融合する多スケール対話型(MI)モジュールを考案した。
本研究では,ストリップ鋼表面欠陥をリアルタイムに検出するための軽量なマルチスケールインタラクティブネットワーク(MINET)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:09:11 GMT)
Convergence Behavior of an Adversarial Weak Supervision Method [10.4] Weak Supervisionは、機械学習のサブ領域を仮定するパラダイムである。
ラベル付きデータを用いて最新の機械学習手法を訓練することにより、大量のラベル付きデータを取得するコストを改善することができる。
ツムブのルールを組み合わせるための2つのアプローチは、2つのキャンプに分かれ、統計的推定の異なるイデオロギーを反映している。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:33:17 GMT)
FlightPatchNet: Multi-Scale Patch Network with Differential Coding for Flight Trajectory Prediction [10.4] 飛行軌跡予測のための差分符号付きマルチスケールパッチネットワークであるFlightPatchNetを提案する。
飛行軌道における多様な時間的パターンを十分に探求するために、マルチスケールパッチネットワークはバックボーンとして機能するように微妙に設計されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:15:56 GMT)
Secure Hierarchical Federated Learning in Vehicular Networks Using Dynamic Client Selection and Anomaly Detection [10.2] 階層的フェデレートラーニング(HFL)は、車両ネットワークにおける敵または信頼できない車両の課題に直面している。
本研究では,動的車両選択とロバストな異常検出機構を統合した新しい枠組みを提案する。
提案アルゴリズムは,強烈な攻撃条件下においても顕著なレジリエンスを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 18:31:20 GMT)
Single-seed generation of Brownian paths and integrals for adaptive and high order SDE solvers [9.9] 適応型高次解法を新しいVBTアルゴリズムで実現した2つの応用について述べる。
適応解法を用いて高揮発性CIRモデルをシミュレートし、定常ステップの収束順序を2倍以上に向上する。
MCMC問題に対して, 適応的第三次ランゲヴィン解法を応用し, 関数評価の10分の1しか用いない。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:46:46 GMT)
Improving Multi-lingual Alignment Through Soft Contrastive Learning [9.5] 本稿では,事前学習した単言語埋め込みモデルによって測定された文の類似性に基づいて,多言語埋め込みを整合させる新しい手法を提案する。
翻訳文ペアが与えられた場合、言語間埋め込み間の類似性は、単言語教師モデルで測定された文の類似性に従うように、多言語モデルを訓練する。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:46:07 GMT)
An Image is Worth Multiple Words: Discovering Object Level Concepts using Multi-Concept Prompt Learning [9.0] テクスチュラル・インバージョンは、画像のスタイルと外観を表現するために、新しい「単語」を埋め込む特異テキストを学習する。
我々は,複数の未知の単語を1つの文と画像のペアから同時に学習する,MCPL(Multi-Concept Prompt Learning)を導入する。
当社のアプローチでは,テキスト埋め込みのみから学習することを重視しており,ストレージスペースの10%未満を他と比較して使用しています。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:01:46 GMT)
IncomeSCM: From tabular data set to time-series simulator and causal estimation benchmark [9.0] 本稿では,観測データを逐次構造因果モデルに変換するための戦略を提案する。
IncomeSCMシミュレータを構築するために、これらのアイデアをよく知られた成人所得データセットに適用する。
タスクは適切な課題を示し、効果の見積もりはメソッド間で大きく異なる。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:40:16 GMT)
Client2Vec: Improving Federated Learning by Distribution Shifts Aware Client Indexing [8.7] Federated Learning(FL)は、プライバシ保護のための分散機械学習パラダイムである。
Client2VecメカニズムはFLトレーニング開始前に各クライアントに対してユニークなクライアントインデックスを生成する。
クライアントインデックスがFLトレーニングプロセスに与える影響を評価する3つのケーススタディを実施。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:49:23 GMT)
Spin quantum number as quantum resource for quantum sensing [8.0] 我々はスピン量子数$S$の高スピン系を別の量子資源として同定する。
ノイズのないハイゼンベルクスケールに応じて磁界のセンシング精度を向上させることができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:46:43 GMT)
Active Learning for Finely-Categorized Image-Text Retrieval by Selecting Hard Negative Unpaired Samples [7.9] 画像テキスト検索(ITR)モデルをトレーニングするには、十分な量のペアデータを確保することが重要である。
ITRのための能動的学習アルゴリズムを提案し、ペア化されたデータを低コストで収集する。
提案手法の有効性をFlickr30KおよびMS-COCOデータセットで検証した。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:50:33 GMT)
LDPKiT: Recovering Utility in LDP Schemes by Training with Noise^2 [7.9] LDPKiTは,知識伝達による地域差分とユーティリティ保存推論の略である。
CIFAR-10, Fashion-MNIST, SVHN, CARER NLPデータセットを用いた実験により, LDPKiTはプライバシーを損なうことなく実用性を向上させることができることを示した。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:53:58 GMT)
${\rm E}(3)$-Equivariant Actor-Critic Methods for Cooperative Multi-Agent Reinforcement Learning [7.7] 我々は,ある協調型マルチエージェント強化学習問題に固有のユークリッド対称性の活用に焦点をあてる。
我々は,マルチエージェントアクター批判手法の帰納バイアスとして,対称的制約を組み込んだニューラルネットワークアーキテクチャを設計する。
論文参考訳(メタデータ) (Sat, 25 May 2024 20:31:15 GMT)
Enhancing Near OOD Detection in Prompt Learning: Maximum Gains, Minimal Costs [7.7] 我々は,OOD検出AUROCを最小計算コストで最大11.67%改善する高速で簡単なポストホック法を提案する。
本手法は,アーキテクチャの変更やモデルの再学習なしに,任意の素早い学習モデルに容易に適用することができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:46:16 GMT)
Improving 3D Occupancy Prediction through Class-balancing Loss and Multi-scale Representation [7.7] 自動運転システムには3D環境認識が不可欠である。
Birds-Eye-View(BEV)に基づく認識は,このタスクのSOTA性能を達成している。
この問題を解決するために,新しいUNetライクなマルチスケールOccupancy Headモジュールを導入する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:13:13 GMT)
Distributional Counterfactual Explanation With Optimal Transport [7.6] 対実的説明 (CE) は、ブラックボックス決定モデルにおける洞察と解釈可能性を提供するデファクト手法である。
本稿では、CEの概念を分散コンテキストに拡張し、個々のデータポイントから入力および出力分布全体へのスコープを広げる。
DCEでは、利害関係者の視点から、事実と反事実の分布特性の分析に焦点を移す。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:20:59 GMT)
ConStat: Performance-Based Contamination Detection in Large Language Models [7.3] コンスタット(ConStat)は、参照モデルの集合に対する一次ベンチマークと参照ベンチマークのパフォーマンスを比較することで、汚染を確実に検出し、定量化する統計手法である。
多様なモデルアーキテクチャ,ベンチマーク,汚染シナリオの広範な評価において,ConStatの有効性を実証する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:36:37 GMT)
Efficient Quantum Circuit Encoding of Object Information in 2D Ray Casting [7.3] 量子コンピューティングは、古典的なコンピュータでは事実上解決不可能な問題を解決する可能性を秘めている。
コンピュータグラフィックスにおける3Dオブジェクトのレンダリングの簡易化のための重要な手法であるレイキャスティング(レイキャスティング)の強化にこの可能性を活用することを目的としている。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:54:28 GMT)
Navigating AI Fallibility: Examining People's Reactions and Perceptions of AI after Encountering Personality Misrepresentations [7.3] ハイパーパーソナライズされたAIシステムは、パーソナライズされたレコメンデーションを提供するために人々の特性をプロファイルする。
これらのシステムは、人々の最も個人的な特性を推測する際にエラーに免疫がない。
人格の誤表現に遭遇した後、人々がどのように反応し、AIを知覚するかを検討するための2つの研究を行った。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:27:15 GMT)
FeDeRA:Efficient Fine-tuning of Language Models in Federated Learning Leveraging Weight Decomposition [7.2] 微調整後の例外的なパフォーマンスにもかかわらず、プレトレーニング言語モデル(PLM)はプライバシー上の懸念から重大な課題に直面している。
本論文では,フェデレートラーニング(FL)を微調整PLMとみなす。
1つの有望な解決策はパラメータ効率細調整(PEFT)をFLに活用することであり、完全なパラメータ細調整(FFT)よりもはるかに小さなパラメータセットを訓練する。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:55:19 GMT)
Towards Generalizing Inferences from Trials to Target Populations [6.8] 本稿では,ブラウン大学における複数学際ワークショップをカプセル化して,外部の妥当性問題に対処する最前線について述べる。
社会科学、医学、公衆衛生、統計学、コンピュータ科学、教育など様々な分野の専門家は、外挿実験で各分野が直面する固有の障害に対処した。
そこで本論文は,因果効果の一般化性と輸送性に関する総合的理解を高めることを目的としている。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:05:02 GMT)
VERT: Verified Equivalent Rust Transpilation with Large Language Models as Few-Shot Learners [6.8] Rustはメモリ安全性と低レベルのコントロールを組み合わせたプログラミング言語で、Cライクなパフォーマンスを提供する。
既存の作業はルールベースと大規模言語モデル(LLM)という2つのカテゴリに分類される。
私たちは、正式な正確性を保証する形で、可読性のあるRustトランスパイルを生成するツールであるVERTを紹介します。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:15:12 GMT)
Estimation of conditional average treatment effects on distributed data: A privacy-preserving approach [6.8] 条件平均処理効果(CATE)は、複数のパーティに分散したデータが集中できる場合、高精度に推定できる。
プライバシー上の懸念から、このようなデータを集約することは困難である。
分散データのプライバシ保存を伴うCATEモデルを推定する手法として,データ協調型ダブル機械学習を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:15:07 GMT)
Spiking Neural Network Phase Encoding for Cognitive Computing [6.6] 本稿では,認知情報学と認知コンピューティングの原理に基づくスパイキングニューラルネットワーク(SNN)を用いた信号再構成手法を提案する。
N個のスパイキングニューロンを使用することで、SNNは入力信号の周波数成分を捕捉し、各ニューロンは独自の周波数を割り当てる。
スパイキングニューロンの大きさと位相とDFT係数の関係について検討し、元の信号の再構成を可能にする。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:52:17 GMT)
A Classifier-Free Incremental Learning Framework for Scalable Medical Image Segmentation [6.6] 本稿では,単一分類器のないネットワークにおいて,可変数のクラスをセグメント化できる新しいセグメンテーションパラダイムを提案する。
このネットワークは、コントラスト学習を用いて訓練され、簡単な解釈を容易にする識別的特徴表現を生成する。
統合ネットワーク内での様々なクラス数処理における本手法の柔軟性とその漸進学習能力について述べる。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:05:07 GMT)
When simplicity meets effectiveness: Detecting code comments coherence with word embeddings and LSTM [6.4] コードコメントは、プログラマに実用的な情報を提供するため、ソフトウェア開発において重要な役割を果たす。
開発者はコードを更新した後、コメントをそのまま残す傾向があり、2つのアーティファクトの間に相違が生じます。
コードスニペットが与えられたら、そのコメントが一貫性があり、コードの背後にある意図をよく反映しているかどうかを特定することが重要です。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:21:27 GMT)
Dual-Adapter: Training-free Dual Adaptation for Few-shot Out-of-Distribution Detection [6.2] 本研究では,未確認カテゴリからのOODサンプルを推定時間中に検出することを目的とした,数発のアウト・オブ・ディストリビューション(OOD)検出の問題について検討する。
既存の手法は主にOOD検出のためのタスク認識プロンプトの訓練に重点を置いている。
テキストと視覚の両方の観点からOODサンプルを検出するための事前学習自由度適応法(Dual-Adapter)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:34:59 GMT)
CAMEL2: Enhancing weakly supervised learning for histopathology images by incorporating the significance ratio [6.2] 病理組織像解析は癌診断において重要な役割を担っている。
画像レベルで粗いラベルのみを必要とする弱い教師付き学習法は、ラベル付けの労力を大幅に削減する。
我々は,ピクセルレベルのセグメンテーションにおいて,完全に教師付きベースラインに匹敵する結果が得られるCAMEL2を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:24:17 GMT)
From Local to Global Order: A Theory of Neural Synaptic Balance [6.1] 我々は、神経シナプスバランスの理論を開発し、それをニューラルネットワークでどのように実現または強制するかを考察する。
与えられた加算コスト関数$R$(正規化器)に対して、入力重みの総コストが出力重みの総コストと等しい場合、ニューロンは平衡にあると言われる。
この理論は、可換なスケーリングと、可換でないバランスという2つの局所的なニューロン操作に基づいている。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:08:47 GMT)
Graph Neural PDE Solvers with Conservation and Similarity-Equivariance [6.1] 本研究は,保存法則や物理対称性に固執する,高度に一般化可能な新しい機械学習アーキテクチャを提案する。
このアーキテクチャの基礎はグラフニューラルネットワーク(GNN)である。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:18:27 GMT)
USD: Unsupervised Soft Contrastive Learning for Fault Detection in Multivariate Time Series [6.1] 本研究では,データ拡張とソフトコントラスト学習の組み合わせを導入し,より正確に状態行動の多面的特性を捉えることを目的としている。
この二重戦略は、正常な状態と異常な状態を区別するモデルの能力を著しく向上させ、複数のデータセットと設定で障害検出性能が著しく向上する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:48:04 GMT)
LLMEffiChecker: Understanding and Testing Efficiency Degradation of Large Language Models [6.0] 我々は、最先端のLLMにおける潜在的な計算効率を理解し、テストするための最初の試みを行う。
ホワイトボックス設定とブラックボックス設定の両方で動作するツールを提案する。
ツールは平均的なLCMの応答遅延とエネルギー消費を325%から3244%、そして344%から3616%増加させることができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:28:15 GMT)
Mutual Theory of Mind for Human-AI Communication [6.0] 新たな発展により、AIシステムは人間の明示的、暗黙的な行動や口頭で、社会的手がかりを知覚し、認識し、反応することができる。
これらのAIシステムは、現在、デートプラットフォームのマッチメーカーとして機能し、学生の学習をアシスタントとして支援し、仕事のパートナーとして生産性を向上させる。
我々は,人間のコミュニケーションにおけるToMの能力に触発されたMTOM(Mutual Theory of Mind)フレームワークを提案し,この新世代のHAI研究を導く。
論文参考訳(メタデータ) (Sat, 25 May 2024 20:42:37 GMT)
Qsco: A Quantum Scoring Module for Open-set Supervised Anomaly Detection [5.9] 複雑なデータ構造を扱う量子コンピューティングの最近の進歩と機械学習モデルの改善は、異常検出手法におけるパラダイムシフトを先導している。
本研究では、量子変動回路をニューラルネットワークに埋め込み、不確実性やラベルなしデータを扱う際のモデルの処理能力を向上する量子スコーリングモジュール(Qsco)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 22:37:43 GMT)
GeneAgent: Self-verification Language Agent for Gene Set Knowledge Discovery using Domain Databases [5.8] 自己検証機能を備えた第一種言語エージェントGeneAgentを提案する。
様々な生物学的データベースと自律的に相互作用し、精度を高め、幻覚の発生を減らす。
異なるソースから1,106の遺伝子セットをベンチマークすると、GeneAgentは標準のGPT-4よりずっと優れています。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:35:15 GMT)
Single Stage Warped Cloth Learning and Semantic-Contextual Attention Feature Fusion for Virtual TryOn [5.8] 画像ベースの仮想試着は、ホップの衣服を着ている人の画像に合わせることを目的としている。
対象の衣服を人物画像の対応する身体部分と整列させるガーメント・ワープは、この目標を達成するための重要なステップである。
明示的な多段階学習なしに暗黙的に同じことを学習する新しいシングルステージフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:22:51 GMT)
Online Resource Allocation for Edge Intelligence with Colocated Model Retraining and Inference [5.7] 我々は、トレーニングモデルと推論の精度を適応的にバランスするリソース割り当てを最適化するために、ORRICというオンライン近似アルゴリズムを導入する。
ORRICの競合比は従来の推論オンリーパラダイムよりも優れている。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:05:19 GMT)
Elite360D: Towards Efficient 360 Depth Estimation via Semantic- and Distance-Aware Bi-Projection Fusion [5.6] 360度深度推定は全方位視野(FoV)による3次元再構成で注目されている。
最近のアプローチは、主に幾何学に基づく再射との相互射影融合に焦点を当てている。
本研究では,ERP画像とICOSAP(ICOSAP)点集合を非歪かつ空間連続的に入力する新しいフレームワークであるElite360Dを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:05:55 GMT)
Comparative Analysis of Open-Source Language Models in Summarizing Medical Text Data [5.4] 大規模言語モデル(LLM)は,非構造化テキストデータに対する問合せおよび要約処理において,優れた性能を示した。
医用要約タスクにおけるオープンソースのLCMの性能分析のための評価手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:16:22 GMT)
FRAPPE: $\underline{\text{F}}$ast $\underline{\text{Ra}}$nk $\underline{\text{App}}$roximation with $\underline{\text{E}}$xplainable Features for Tensors [5.4] FRAPPEは、CDDを計算することなくテンソルの正準ランクを推定する最初の方法である。
最高のパフォーマンスのベースラインよりも24倍以上高速で、合成データセット上でMAPEが10%改善されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:05:54 GMT)
Multi-scale Quaternion CNN and BiGRU with Cross Self-attention Feature Fusion for Fault Diagnosis of Bearing [5.4] 深層学習は断層診断(FD)に著しい進歩をもたらした
マルチスケール畳み込み畳み込みニューラルネットワーク(MQCNN)、双方向ゲートリカレントユニット(BiG)、クロス自己注意機能融合(CSAFF)を統合した新しいFDモデルを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:55:02 GMT)
Picturing Ambiguity: A Visual Twist on the Winograd Schema Challenge [5.3] WinoVisは、マルチモーダルコンテキストにおける代名詞の曖昧さに関するテキスト・ツー・イメージ・モデルに特化して設計されたデータセットである。
連続したモデルバージョンの評価によると、段階的な進歩にもかかわらず、Stable Diffusion 2.0はWinoVisで56.7%の精度を達成した。
さらなるエラー分析は、複雑な視覚の世界を解釈し、相互作用する能力において、テキスト・ツー・イメージ・モデルを進めることを目的とした将来の研究にとって重要な領域を特定する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:28:22 GMT)
DefSent+: Improving sentence embeddings of language models by projecting definition sentences into a quasi-isotropic or isotropic vector space of unlimited dictionary entries [5.3] 本論文は,DefSent として知られる以前の会議報告において,大幅な改善を示すものである。
そこで本稿では,制約を満たさない進入埋め込みを段階的に構築する手法を提案する。
その結果、定義文は無限辞書エントリの準等方的あるいは等方的ベクトル空間に投影できる。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:43:38 GMT)
Combining Radiomics and Machine Learning Approaches for Objective ASD Diagnosis: Verifying White Matter Associations with ASD [5.1] 自閉症スペクトラム障害(Autism Spectrum disorder)は、社会的スキル、コミュニケーション能力、反復行動、感覚処理の障害につながる典型的な脳発達を特徴とする症状である。
脳MRI画像と機械学習アルゴリズムを組み合わせて自閉症の客観的診断を行う研究は数多く行われているが、白質と自閉症の相関は十分に利用されていない。
我々は,脳MRIにおける白質領域に着目したコンピュータ支援診断モデルを開発した。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:14:00 GMT)
ComFace: Facial Representation Learning with Synthetic Data for Comparing Faces [5.1] 合成画像を用いた顔表現学習手法ComFaceを提案する。
効果的な表現学習のために、ComFaceは2つの特徴表現、すなわち、対人的な顔の違いと対人的な顔の変化を取得することを目指している。
我々のComFaceは、合成データのみを用いて訓練され、実画像を用いて訓練された一般的な事前学習や最先端表現学習方法と同等以上の転送性能を達成する。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:44:07 GMT)
Retro-prob: Retrosynthetic Planning Based on a Probabilistic Model [5.0] 再合成は有機化学の基本的だが挑戦的な課題である。
標的分子を与えられた後生合成の目標は、合成経路に組み立てられる一連の反応を見つけることである。
本稿では,標的分子の合成確率を最大化するために,retro-probと呼ばれる新しい逆合成計画アルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:23:40 GMT)
Cypher4BIM: Releasing the Power of Graph for Building Knowledge Discovery [4.6] IFC(Industry Foundation Classes)の新たなグラフィック形式が開発され、IFC-Graphと呼ばれるようになった。
本研究の目的は,IFC-Graphに適したグラフクエリ言語を開発することである。
論文参考訳(メタデータ) (Sat, 25 May 2024 20:19:34 GMT)
Threat Analysis of Industrial Internet of Things Devices [4.5] 我々は、産業用IoTデバイスを調べ、異なる脅威源を特定し、ランク付けし、共通の脅威と脆弱性を記述している。
これらのデバイス上で脅威分析を行う手順を推奨する。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:45:12 GMT)
Mamba-in-Mamba: Centralized Mamba-Cross-Scan in Tokenized Mamba Model for Hyperspectral Image Classification [4.4] 本研究では、このタスクにステートスペースモデル(SSM)をデプロイする最初の試みである、HSI分類のための革新的なMamba-in-Mamba(MiM)アーキテクチャを紹介する。
MiMモデルには,1)イメージをシーケンスデータに変換する新しい集中型Mamba-Cross-Scan(MCS)機構,2)Tokenized Mamba(T-Mamba)エンコーダ,3)Weighted MCS Fusion(WMF)モジュールが含まれる。
3つの公開HSIデータセットによる実験結果から,本手法は既存のベースラインや最先端アプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:10:07 GMT)
Evidential uncertainty sampling for active learning [4.3] アクティブラーニングにおける最近の研究は、モデル不確実性を再現可能で既約の不確実性に分解することに焦点を当てている。
本稿では,観測への依存を排除しつつ,計算過程を簡素化することを目的とする。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:52:21 GMT)
A GPU-Accelerated Bi-linear ADMM Algorithm for Distributed Sparse Machine Learning [4.3] Bi-cADMMは、計算ノードのネットワーク上で定義された大規模正規化されたスパース機械学習問題を解決することを目的としている。
Bi-cADMMはParallel Sparse Fitting Toolboxと呼ばれるオープンソースのPythonパッケージで実装されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:11:34 GMT)
Analyzing the Attack Surface and Threats of Industrial Internet of Things Devices [4.3] モノのインターネット(Internet of Things)の結果として、産業機器の接続性が増大し、産業制御システムへのリスクが高まっている。
本稿では,産業用IoTデバイスの攻撃面と脅威を解析するための体系的かつ包括的手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:55:23 GMT)
Risk Scenario Generation for Autonomous Driving Systems based on Causal Bayesian Networks [4.2] 自律運転システム(ADS)におけるシナリオ生成のためのCausal Bayesian Networks(CBN)の利用に向けた新しいパラダイムシフトを提案する。
CBNはメリーランドの事故データを用いて構築され、検証されており、自律運転行動に影響を与える無数の要因について深い洞察を提供する。
CARLAシミュレータを用いて,ADSのエンドツーエンドテストフレームワークを構築した。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:26:55 GMT)
Data Complexity Estimates for Operator Learning [4.1] 我々は,演算子学習のデータ複雑性を研究する理論を開発した。
より狭い演算子のクラスにおいて、チューナブルパラメータの数の観点からFNOによって効率的に近似されることで、効率的な演算子学習がデータ複雑性においても達成可能であることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:16:21 GMT)
Unveiling the 3D Morphology of Epitaxial GaAs/AlGaAs Quantum Dots [4.0] ストレインフリーのGaAs/AlGaAs半導体量子ドット(QDs)は、液滴エッチングとナノホール充填(DENI)によって成長し、不明瞭で絡み合った光子源のオンデマンド生成に非常に有望な候補である。
QDの分光指紋と量子光学特性は、その形態に大きく影響されている。
本研究は、DENI QD形態の理解を深め、それらの光電子特性をシミュレートし最適化するための基本的な3次元構造モデルを提供する。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:50:00 GMT)
FastQuery: Communication-efficient Embedding Table Query for Private LLM Inference [3.9] 我々はFastQueryと呼ばれるプライベートな埋め込みテーブルクエリ最適化フレームワークを提案する。
FastQueryは通信対応の埋め込みテーブル量子化アルゴリズムと1ホット対応の高密度パッキングアルゴリズムを備えている。
従来のHEベースのフレームワークと比較して、FastQueryは、それぞれ4.3times$、2.7times$、1.3times$遅延削減を達成した。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:58:45 GMT)
Weaving Complex Graph on simple low-dimensional qubit lattices [3.9] 本稿では、単純な量子ビットアレイから複雑な量子ネットワークを構築するための2つの方法を提案する。
最初のアプローチでは、キュービットのサブセットをチューナブルなカップルとして利用し、事実上非自明なグラフベースのハミルトニアンの範囲を生み出す。
第二のアプローチは、動的グラフ工学を用いて、周期的にカップルを活性化し、非活性化し、効果的な量子ウォークを作ることを可能にしている。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:37:42 GMT)
HairFastGAN: Realistic and Robust Hair Transfer with a Fast Encoder-Based Approach [3.7] 本稿では,高分解能,ほぼリアルタイムの性能,再現性に優れたHairFastモデルを提案する。
我々のソリューションは、StyleGANのFS潜在空間で動作する新しいアーキテクチャを含む。
ヘアスタイルの形状と色を異なる画像から転送する最も難しいシナリオでは、Nvidia V100上で1秒未満で実行することができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:35:15 GMT)
A better approach to diagnose retinal diseases: Combining our Segmentation-based Vascular Enhancement with deep learning features [3.7] 網膜基底像の異常は特定の病態を示す可能性がある。
従来の医学では、網膜関連疾患の診断は、医師の網膜基底画像の主観的評価に依存している。
本稿では,網膜基底画像関連疾患の迅速かつ客観的かつ正確な診断法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:52:40 GMT)
Unsupervised Meta-Learning via In-Context Learning [3.4] 本稿では,トランスフォーマーアーキテクチャで観察される教師なし学習の一般化能力を活用する,教師なしメタラーニングの新たなアプローチを提案する。
提案手法は,メタラーニングをシーケンスモデリング問題として再設計し,トランスフォーマーエンコーダがサポート画像からタスクコンテキストを学習できるようにする。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:29:46 GMT)
Vulnerability Detection in C/C++ Code with Deep Learning [3.1] 我々は、C/C++プログラムのソースコードから抽出したプログラムスライスでニューラルネットワークをトレーニングし、ソフトウェア脆弱性を検出する。
この結果から,ソースコードの特徴の相違と,脆弱なプログラムスライスと非脆弱なプログラムスライスをバランスよく組み合わせることで,バランスの取れた精度が得られることがわかった。
論文参考訳(メタデータ) (Sat, 25 May 2024 22:06:44 GMT)
SPA: Towards A Computational Friendly Cloud-Base and On-Devices Collaboration Seq2seq Personalized Generation [2.8] 大規模な言語モデルは、低リソースのデバイスにかなりのメモリストレージを必要とする。
本稿では,デバイス上で高速な推論を行う軽量アーキテクチャであるSPA(Side on Adaption)を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:19:31 GMT)
Exact Spin Correlators of Integrable Quantum Circuits from Algebraic Geometry [2.8] 積分可能量子回路に対するスピン演算子の弦の相関関数を正確に計算する。
これらのオブザーバブルは、量子シミュレーションプラットフォームのキャリブレーションに使用できる。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:42:14 GMT)
An Automated Real-Time Approach for Image Processing and Segmentation of Fluoroscopic Images and Videos Using a Single Deep Learning Network [2.8] 人工膝関節における画像分割に機械学習を用いる可能性は、そのセグメンテーション精度を改善し、プロセスを自動化し、外科医にリアルタイムの補助を提供する能力にある。
本稿では, リアルタイム全膝画像分割における深層学習手法を提案する。
大規模なデータセットに基づいてトレーニングされた深層学習モデルは、インプラントされた大腿骨とティアビアの両方を正確にセグメント化する際、優れた性能を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:38:28 GMT)
Underwater Image Enhancement by Diffusion Model with Customized CLIP-Classifier [2.6] 繰り返し強調のための多誘導拡散モデルを用いて,新しい水中画像強調手法を提案する。
画像から画像への拡散モデルとCLIP分類器は,微細調整過程において主に高周波領域で機能することがわかった。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:56:15 GMT)
Split-and-Denoise: Protect large language model inference with local differential privacy [2.6] Split-N-Denoise (SnD) はプライベートな推論フレームワークであり、最小の計算コストでクライアント側でトークン埋め込み層を実行するためにモデルを分割する。
各種LLMアーキテクチャおよび下流タスク間のプライバシ・ユーティリティ・トレードオフを最適化する上で,SnDの有効性を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:28:17 GMT)
Safe Deep Model-Based Reinforcement Learning with Lyapunov Functions [2.5] 本稿では,未知のダイナミクスを用いた効率的なポリシー学習を実現するためのモデルベースRLフレームワークを提案する。
本稿では,モデルベースRLのトレーニングおよび政策学習における安全性制約を付加する新しい手法を紹介し,検討する。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:21:12 GMT)
Towards Unlocking Insights from Logbooks Using AI [2.5] ログブックには 粒子加速器に関する 活動や出来事に関する貴重な情報が含まれています
自然言語処理(NLP)が進むにつれて、ログブックがもたらす様々な課題に対処する機会を提供する。
本研究は、DESY, BESSY, Fermilab, BNL, SLAC, LBNL, CERNなどの機関における粒子加速器ログブックの利用性を高めるための、調整された検索用拡張生成(RAG)モデルを共同でテストする。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:38:15 GMT)
LEAST: "Local" text-conditioned image style transfer [2.5] テキスト条件付きスタイル転送により、ユーザーはテキスト記述を通じて、希望する芸術的スタイルを伝達できる。
我々は,テキスト条件付き画像編集とスタイル転送技術について,正確な「ローカル」スタイル転送のためのユーザプロンプトのきめ細かい理解に基づいて評価した。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:06:17 GMT)
Approximations to the Fisher Information Metric of Deep Generative Models for Out-Of-Distribution Detection [2.4] 深層生成モデルは、訓練されたデータよりも高いログ類似度をOODデータに対して常に推測することを示す。
我々は,OODデータに対して,トレーニングデータよりも勾配基準が大きいという単純な直観に基づいて,OOD検出のための深部生成モデルのパラメータに関するデータ点の勾配を利用する。
実験結果から,本手法は,ほとんどの深層生成モデルと画像データセットのペアリングにおいて,典型性試験よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:47:13 GMT)
How Well Do Deep Learning Models Capture Human Concepts? The Case of the Typicality Effect [2.4] 近年,言語モデルと視覚モデルにおける人間のような典型的効果を求める研究は,単一のモダリティのモデルに焦点を当てている。
本研究では、より広い範囲の言語と視覚モデルを考えることにより、このモデルに対する行動評価を拡大する。
また、視覚+言語モデルペアの典型性予測とマルチモーダルCLIPベースのモデルの組み合わせが、どちらのモダリティ単独のモデルよりも人間の典型性判断に適合しているかどうかを評価する。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:38:30 GMT)
Novel Epileptic Seizure Detection Techniques and their Empirical Analysis [2.3] 3次元化アルゴリズム、主成分分析(PCA)、独立成分分析(ICA)、線形判別分析(LDA)を用いる。
提案されたフレームワークはBonnデータセットでテストされる。
シミュレーション結果は、LDAとNBの組み合わせに対して100%の精度を提供する。
論文参考訳(メタデータ) (Sat, 25 May 2024 18:21:39 GMT)
Collective Quantum Entanglement in Molecular Cavity Optomechanics [2.1] 振動分極における量子絡み合いに到達するための光学的スキームを提案する。
この振動-光子絡み合いは室温で存在し、熱雑音に対して頑丈であることがわかった。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:09:09 GMT)
Generating clickbait spoilers with an ensemble of large language models [2.1] クリックベイトスポイラー生成のための微調整された大言語モデルのアンサンブルを提案する。
提案手法はフレーズスポイラーや文節スポイラーに限らず, テキストの非連続部分を参照するマルチパートスポイラーを生成することができる。
実験により,提案したアンサンブルモデルがBLEU, METEOR, BERTScoreの基準値よりも高い性能を示した。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:49:08 GMT)
DAFFNet: A Dual Attention Feature Fusion Network for Classification of White Blood Cells [2.0] 本稿では,WBC の形態的特徴と高レベルな意味的特徴を統合した新しいデュアルブランチネットワーク Dual Attention Feature Fusion Network (DAFFNet) を提案する。
提案するネットワークフレームワークは,6つの公開データセットに対して98.77%,91.30%,98.36%,99.71%,98.45%,98.85%の総合的精度を達成した。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:09:25 GMT)
Proof Number Based Monte-Carlo Tree Search [1.9] 本稿では,モンテカルロ木探索(MCTS)とProof-Number Search(PNS)を組み合わせた新しいゲーム検索アルゴリズムであるPN-MCTSを提案する。
本研究は,MCTS木に蓄積された証明値と防腐数から得られる付加的な知識を活用可能な3つの領域を定義する。
実験の結果、PN-MCTSは全てのテストされたゲーム領域でMCTSを上回り、ライン・オブ・アクションで96.2%の勝利率を達成した。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:39:16 GMT)
Assessing the Role of Communication in Scalable Multi-Core Quantum Architectures [1.9] 本稿では、スケーラブルなマルチコア量子アーキテクチャの性能に対する通信の影響を評価するためのシミュレーションツールであるqcommを紹介する。
我々はqcommを用いて、これらのパラメータがマルチコア量子システムにおける通信性能にどのように影響するかを予備研究する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:24:19 GMT)
Class-Conditional self-reward mechanism for improved Text-to-Image models [1.8] 我々は、自己回帰モデルの概念に基づいて、テキストから画像への生成AIモデルに匹敵するビジョンを導入する。
このアプローチは、自己生成した自己判断データセット上での微調整拡散モデルによって機能する。
既存の商用および研究用テキスト・ツー・イメージ・モデルよりも60%以上優れていると評価されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:05:51 GMT)
An Empirical Study of Excitation and Aggregation Design Adaptions in CLIP4Clip for Video-Text Retrieval [1.8] 本稿では,(1) フレーム特徴間の非相互排他的関係を捉えるための励起モジュールを含む,新しい励起・集約設計を提案する。
我々はシーケンシャルなモジュールとアグリゲーション設計のカスケードを用いて、シーケンシャルなビデオ表現を生成する。
提案するモジュールは,MSR-VTT,ActivityNet,DiDeMoの3つのベンチマークデータセットで評価される。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:45:10 GMT)
Solving the bongard-logo problem by modeling a probabilistic model [1.8] 抽象推論問題は、AIアルゴリズムの認識と認識能力に課題をもたらす。
ボナード・ローゴ問題に適した確率モデルであるPMoCを導入し,高い推論精度を実現する。
我々は、複雑な抽象的推論タスクのために特別に設計された拡張トランスフォーマーであるPose-Transformerを設計した。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:01:07 GMT)
Hybrid THz architectures for molecular polaritonics [1.8] 材料の物理的および化学的性質は共鳴光学モードで修正することができる。
本稿では,局所化フォトニックモードとテラヘルツ領域の分子振動の集団結合を容易にするために,電磁界閉じ込めのいくつかのスキームについて検討する。
さらに、プラズモン共鳴、フォトニックキャビティモード、低エネルギー分子共鳴を組み合わせた場合、200GHzまで達する真空ラビ分割を実証した。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:17:50 GMT)
BOLD: Boolean Logic Deep Learning [1.4] 本稿では、ブール重みと入力からなるニューロンを、降下勾配や実算術の代わりにブール論理を用いてブール領域で効率的に訓練できるようなブール変動の概念を導入する。
提案手法は,ImageNet分類におけるベースライン完全精度を実現し,セマンティックセグメンテーションの最先端結果を上回った。
トレーニングと推論の双方において、エネルギー消費を著しく減少させる。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:50:23 GMT)
Strategizing against Q-learners: A Control-theoretical Approach [1.4] 敵のQ-ラーニングアルゴリズムを知っていれば、いかに戦略的に洗練されたエージェントが素質のQ-ラーナーを活用できるかを定量化する。
連続状態空間に取り組むための量子化に基づく近似スキームを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:53:49 GMT)
Global Well-posedness and Convergence Analysis of Score-based Generative Models via Sharp Lipschitz Estimates [1.3] スコアベース生成モデル(SGM)のグローバルな適合性と収束性を確立する。
スムーズな場合、最適時間長のスコア関数のリプシッツ境界から始める。
最適性は、スコアのリプシッツ定数が初期で有界であるが有限時間で爆発する例によって検証される。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:31:24 GMT)
Real-Time Scene Graph Generation [1.3] シーングラフ生成(SGG)は、画像内のエンティティ間の意味関係をグラフ表現として抽出することができる。
本稿では,オブジェクト検出バックボーンとしてYOLOV8を用いたリアルタイムSGGアプローチの簡易かつ効果的な実装を提案する。
我々の実装は、そのタスクに対して、精度を損なうことなく48以上のFPSを初めて獲得し、他の軽量なアプローチよりも優れている。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:06:12 GMT)
A Novel Feature Map Enhancement Technique Integrating Residual CNN and Transformer for Alzheimer Diseases Diagnosis [1.2] アルツハイマー病(AD)は認知機能低下と異常な脳タンパクの蓄積を伴い、効果的な治療のために時間的診断を必要とする。
ディープラーニングの進歩を活かしたCADシステムはAD検出に成功しているが、計算精度とデータセットの微妙なコントラスト、構造、テクスチャの変化を呈している。
このアプローチは、新しいCNN Meet Transformer(HSCMT)、カスタマイズされた残留学習CNN、ADの多様な形態、コントラスト、テクスチャのバリエーションを学ぶための新しい特徴マップ拡張(FME)戦略の3つの異なる要素を統合する。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:47:22 GMT)
A Differential Equation Approach for Wasserstein GANs and Beyond [1.2] 我々は、WGAN(Wsserstein Generative Adversarial Network)を見るための新しい理論レンズを提案する。
このフレームワークでは、分布依存常微分方程式(ODE)に着想を得た離散化を定義する。
このような離散化が収束していることを示し、W1フォワード・オイラー (W1-FE) と呼ぶこの離散化を実装するための対戦訓練手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:03:39 GMT)
Calibrated Explanations for Regression [1.2] 回帰のための校正的説明は、高速で信頼性があり、安定し、堅牢な説明を提供する。
確率的回帰のための校正的説明は、説明を作成する全く新しい方法を提供する。
Pythonの実装はGitHubで無料で利用可能で、pipとcondaの両方を使ってインストールすることができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 17:29:44 GMT)
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control [1.1] BROは、犬とヒューマノイドのタスクにおいて、ほぼ最適ポリシーを達成するためのモデルフリーのアルゴリズムである。
BROは最先端の結果を達成し、主要なモデルベースおよびモデルフリーアルゴリズムを著しく上回っている。
BROは、非常に難しい犬とヒューマノイドのタスクにおいて、ほぼ最適なポリシーを達成した最初のモデルなしアルゴリズムである。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:53:25 GMT)
StatWhy: Formal Verification Tool for Statistical Hypothesis Testing Programs [1.0] 本稿では,統計的プログラムの正当性を正式に特定し,自動検証する手法を提案する。
プログラマは、ソースコードにアノテートすることで、統計的メソッドの要求をチェックすることをリマインドされる。
StatWhyと呼ばれるソフトウェアツールは、プログラマが統計手法の要件を適切に指定したかどうかを自動的にチェックする。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:07:33 GMT)
InstructPatentGPT: Training patent language models to follow instructions with human feedback [1.0] この研究は、言語モデルが付与される可能性の高い特許クレームを生成する可能性を高めることを目的としている。
言語モデルの制御性を示すために、システムは与えられた特許と異なる報酬を持つプレグラントアプリケーションから学習する。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:48:50 GMT)
Modes of Analyzing Disinformation Narratives With AI/ML/Text Mining to Assist in Mitigating the Weaponization of Social Media [0.8] 本稿では,ソーシャルメディアにおける悪意あるコミュニケーションを捕捉・監視するための定量的モードの必要性を明らかにする。
ソーシャル・ネットワークを利用したメッセージの「ウェポン化」が意図的に行われており、州が後援し、私的に運営される政治的指向のエンティティも含む。
FacebookやX/Twitterのような主要プラットフォームにモデレーションを導入しようとする試みにもかかわらず、完全にモデレートされていないスペースを提供する代替ソーシャルネットワークが現在確立されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:02:14 GMT)
Deep Reinforcement Learning with Enhanced PPO for Safe Mobile Robot Navigation [0.7] 本研究では,複雑な環境下での自律走行のための移動ロボットの訓練における深層強化学習の適用について検討する。
このロボットは、LiDARセンサデータとディープニューラルネットワークを用いて、障害物を回避しつつ、特定の目標に向かって誘導する制御信号を生成する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:08:36 GMT)
Automated Multi-level Preference for MLLMs [0.7] 現在のマルチモーダル大言語モデル(MLLM)は「幻覚」に苦しむ
有望な道の1つは、人間からのフィードバック(RLHF)からの強化学習を利用することである。
二項選好(上等、下等)の一般的な実践を再考し、多水準選好を採用する方が2つの利点があることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:56:06 GMT)
Federated Learning for Non-factorizable Models using Deep Generative Prior Approximations [0.7] フェデレートラーニング(FL)は、データ共有を避けてプライバシを保護しながら、分散クライアント間で協調的なモデルトレーニングを可能にする。
SIGMA(Deep Generative Model Approximation)による構造化独立性(Structured Independence)を導入する。
我々は,SIGMA が合成データに有効であることを示すとともに,オーストラリアの空間依存モデルに先立って条件付き自己回帰式を用いて,空間データに対する FL の実例でその有用性を実証する。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:44:06 GMT)
Role of Momentum in Smoothing Objective Function in Implicit Graduated Optimization [0.7] 運動量を持つ勾配降下(SGD)は、高速収束と優れた一般化性を有する。
運動量を持つSGDは、学習速度、バッチサイズ、運動量係数、勾配のばらつき、勾配ノルムの上界によって決定される目的関数を滑らかにすることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:40:47 GMT)
Continuous Tensor Relaxation for Finding Diverse Solutions in Combinatorial Optimization Problems [0.7] 本研究では、教師なし学習(UL)に基づくCOソルバのための連続的アン緩和(CTRA)を提案する。
CTRAは、単一のトレーニング実行で多様なソリューションを見つけるための計算効率のよいフレームワークである。
数値実験により、CTRAにより、ULベースの解法は、既存の解法を繰り返すよりもはるかに高速にこれらの多様な解を見つけることができることが示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:42:24 GMT)
Transfer learning in predicting quantum many-body dynamics: from physical observables to entanglement entropy [0.7] 本稿では,多体系の物理観測値のサブセットに基づいてトレーニングされたニューラルネットワークの能力について述べる。
特に、トレーニング済みのニューラルネットワークが絡み合いのエントロピーの学習をいかに促進するかに焦点を当てる。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:32:21 GMT)
Estimating the normal-inverse-Wishart distribution [0.6] NIWファミリーにおける平均パラメータから自然パラメータへ変換する収束手順について述べる。
これは、期待伝搬にNIWベースファミリを使用する場合に必要である。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:39:39 GMT)
Acquiring Better Load Estimates by Combining Anomaly and Change-point Detection in Power Grid Time-series Measurements [0.5] 提案手法は,可視データに対する堅牢かつ一般化可能な性能を確保しつつ,解釈可能性の優先順位付けを行う。
その結果, 濾過が適用されない場合に, 洗浄電位が明らかになることが示唆された。
我々の方法論の解釈可能性によって、重要なインフラ計画に特に適しています。
論文参考訳(メタデータ) (Sat, 25 May 2024 10:15:51 GMT)
Implementing a Quantum CNOT and Quantum Memory Using a Quantum-Dot Cellular Automata Array [0.3] そこで本研究では,QCAセルの配列を単一キュービット,複数キュービット演算に利用する方法を示す。
同じ技術がマルチキュービット量子メモリの開発に使われている。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:53:10 GMT)
Circuit Implementation and Analysis of a Quantum-Walk Based Search Complement Algorithm [0.3] 我々は,Shenvi,Kempe,Whaleyによって作成された量子ウォークに基づく探索アルゴリズムの修正版を提案する。
修正された進化作用素は、元のアルゴリズムのように反対の挙動、すなわちターゲット状態を測定する確率を減少させる。
論文参考訳(メタデータ) (Sat, 25 May 2024 18:11:14 GMT)
Multitask methods for predicting molecular properties from heterogeneous data [0.3] マルチタスクガウス過程の回帰は、高価なデータソースと安価なデータソースの両方を活用することで制限を克服することを示した。
マルチタスクサロゲートは,データ生成コストを1桁以上削減し,CCレベルの精度で予測可能であることを報告した。
マルチタスクレグレッションは、既存のデータソースを機会的に活用することによって、データ生成コストをさらに削減するためのツールである。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:10:38 GMT)
Exploratory Data Analysis for Banking and Finance: Unveiling Insights and Patterns [0.3] 本研究は,商店街における取引パターン,信用限度,利用状況について検討した。
また、年齢、性別、利用パターンの収入などの人口統計要因も考慮している。
このレポートは、顧客チャーン率や、人口統計、トランザクション履歴、満足度などの要因を分析し、対処する。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:15:21 GMT)
Nonreciprocal Multipartite Entanglement in a two-cavity magnomechanical system [0.2] 2モードキャビティマグノメカティカルシステムにおける非相互多部絡みの発生手法を提案する。
以上の結果から,マグノンの自己Kerr効果は,結晶軸に沿って運動場を調整した場合に非相互性を示す二部晶の絡み合いを著しく高めることが示唆された。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:25:47 GMT)
Compasslike states in a thermal reservoir and fragility of their nonclassical features [0.2] これらのコンパス状の状態は、熱貯水池に接触すると量子コヒーレンスが失われることに非常に敏感である。
これらの状態のサブプランク構造に着目し、これらの特徴に対するデコヒーレンス効果が、貯水池の平均熱光子数を増加させることによって強くなることを発見した。
論文参考訳(メタデータ) (Sat, 25 May 2024 21:21:40 GMT)
Uncertainty Measurement of Deep Learning System based on the Convex Hull of Training Sets [0.1] 本研究では,訓練データの凸殻に基づくトレーニングモデルの不確実性を測定するTo-hull Uncertainity and Closure Ratioを提案する。
学習したデータの凸船体と見えないサンプルとの間の位置関係を観察し、サンプルが凸船体からどのように外挿されているかを推測することができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 06:25:24 GMT)
Swap distance minimization beyond entropy minimization in word order variation [0.1] エントロピーとスワップ距離は、異なる言語構造において著しく小さい。
転がり実験に関してエントロピーの最小化とスワップ距離の最小化の強い証拠を見出した。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:10:05 GMT)
Improving Transformer Performance for French Clinical Notes Classification Using Mixture of Experts on a Limited Dataset [0.1] トランスフォーマーベースのモデルは、自然言語処理において顕著な結果を示しているが、小規模臨床テキストの分類のような応用では課題に直面している。
本研究は,CHU Sainte-Justine病院における小規模臨床テキストの分類のための,Mixture of Expert (MoE) Transformerモデルを提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:54:20 GMT)
Video Prediction Models as General Visual Encoders [0.0] 研究者らは、映像予測モデルを一般的な視覚エンコーダとして使用し、重要な空間的・時間的情報をキャプチャする能力を活用することを提案する。
人間の視覚研究にインスパイアされたこの手法は、画像から動きを表す潜在空間を開発することを目的としている。
実験には、事前訓練されたビデオ生成モデルの適用、潜伏空間の分析、フォアグラウンド・バックグラウンド・セグメンテーションのためのカスタムデコーダのトレーニングが含まれる。
論文参考訳(メタデータ) (Sat, 25 May 2024 23:55:47 GMT)
TreeFormers -- An Exploration of Vision Transformers for Deforestation Driver Classification [0.0] 本稿では,インドネシアの森林の衛星画像を用いて森林破壊の要因を分類するための視覚変換器(ViT)の適用について検討する。
私のアルゴリズムの入力は332x332ピクセルの衛星画像です。
私は、森林破壊ドライバークラス、草原低木、他はプランテーション、または小規模農業を予測するために、ViTアーキテクチャを使用します。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:07:58 GMT)
Transductive Confidence Machine and its application to Medical Data Sets [0.0] 近隣住民の増加と有意なマーキング効果について検討した。
ニューラルネットワークの応用は、トランスダクティブアルゴリズムと有用な比較として検討された。
論文参考訳(メタデータ) (Sat, 25 May 2024 00:02:15 GMT)
Thermal entanglement in conformal junctions [0.0] 1+1次元境界共形場理論(BCFT)により記述された量子接合を考える。
解析は, 絡み合いの計算によって達成される有限温度での相関に焦点をあてる。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:13:25 GMT)
SynthAI: A Multi Agent Generative AI Framework for Automated Modular HLS Design Generation [0.0] 本稿では,HLS設計の先駆的手法であるSynthAIを紹介する。
SynthAIはReActエージェント、Chain-of-Thought(CoT)プロンプト、Web検索技術、Retrieval-Augmented Generationフレームワークを統合している。
論文参考訳(メタデータ) (Sat, 25 May 2024 05:45:55 GMT)
Spread complexity and quantum chaos for periodically driven spin-chains [0.0] 量子地図における拡散複雑性のダイナミクスをアルノルニ反復法を用いて研究する。
正規対カオス力学におけるアルノルニ係数の特異な挙動と拡散複雑性を見いだす。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:17:43 GMT)
Selfie Taking with Facial Expression Recognition Using Omni-directional Camera [0.0] そこで本研究では,全方向カメラを用いて複数人で自撮りを行う手法を提案する。
具体的には、全方向カメラで数秒のビデオを撮り、その後すべてのフレームで顔検出を行う。
提案手法は, すべてのフレームで表情認識を行い, 参加者が最も幸福なフレームを抽出する。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:07:29 GMT)
Rocket Landing Control with Grid Fins and Path-following using MPC [0.0] 目的は、異なる技術を用いて着陸過程における総燃料消費量を最小化することである。
バッチ手法を用いて最適かつ実現可能な軌道が生成されると、モデル予測制御(MPC)に基づくアルゴリズムを用いて経路を辿ろうとする。
モデルミスマッチと異なる初期状態の下で,TOPEDは実演軌道をうまく追従できることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:42:29 GMT)
Quantum thermodynamic derivation of the energy resolution limit in magnetometry [0.0] エネルギー分解能の限界は、量子計測とランダウアー消去に関連する量子熱力学的作用の結果であることを示す。
これらの考察を原子磁気センサやSQUIDSに適用する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:55:37 GMT)
Quantum entanglement of multiple excitons in strained graphene [0.0] 複数の量子ビットの絡み合った状態は、量子誤り訂正符号に有用である。
我々は,原子状量子ビットとして扱われる最大5個の励起子からなる系の絡み合い力学を研究した。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:52:45 GMT)
Prospects for device-independent quantum key distribution [0.0] デバイス独立量子鍵分布(DIQKD)は、最小限の仮定でセキュアな鍵分布を実現することを目的としている。
我々は,DIQKDのキーレートと耐雑音性を改善するために,いくつかの手法のセキュリティ証明を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:54:15 GMT)
Probing electric-dipole-enabled transitions in the excited state of the nitrogen-vacancy center in diamond [0.0] 装束状態は周波数調整が可能であり, 横電界のゆらぎに対して保護されていることを示す。
以前の結果とは対照的に、ES軌道の磁気状態間の鋭いマイクロ波共鳴を観測する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:34:57 GMT)
Prioritizing High-Consequence Biological Capabilities in Evaluations of Artificial Intelligence Models [0.0] AI評価モデルは、高頻度リスクへの対処を優先すべきである、と我々は主張する。
これらのリスクは、パンデミックなど、大衆に大規模な被害をもたらす可能性がある。
二重用途の生物学的リスクを特定し緩和する科学者の経験は、生物学的AIモデルを評価するための新しいアプローチに役立ちます。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:29:17 GMT)
On the measurements in Quantum Gravity [0.0] 本研究では,観測者スケールに付随するブラックホールのエントロピーによって測定結果の数と測定精度(または範囲)が制限されることを提案する。
これはまた、可観測物の有限表現を保証するために可換関係の代数を変更する必要があることを意味する。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:46:07 GMT)
Nonclassical characteristics in spin-1/2 Heisenberg XYZ model with added DM and KSEA interactions under sinusoidal magnetic field: Hierarchy of quantum resources [0.0] Dzyaloshinsky-Moriya (DM) と Kaplan--Shekhtman--Entin-Wohlman--Aharony (KSEA) 相互作用を加えたスピン-1/2ハイゼンベルクXYZモデルにおける量子コヒーレンスと量子相関の測定についての研究
論文参考訳(メタデータ) (Sat, 25 May 2024 16:13:40 GMT)
Neural networks for geospatial data [0.0] NN-GLSは、GPモデルの非線形平均に対する新しいニューラルネットワーク推定アルゴリズムである。
NN-GLSはグラフニューラルネットワーク(GNN)の特殊型として表現されていることを示す。
理論的には、NN-GLSは不規則に観測された空間相関データプロセスに一貫性があることが示されている。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:48:37 GMT)
Neural Network-Based Tracking and 3D Reconstruction of Baseball Pitch Trajectories from Single-View 2D Video [0.0] 本稿では,2次元映像から3次元座標まで,野球球の軌跡の追跡と再構成のためのニューラルネットワークによるアプローチを提案する。
実験結果から,本手法は2次元入力から3次元軌跡を復元する際の精度が高いことが示された。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:17:10 GMT)
Method and Software Tool for Generating Artificial Databases of Biomedical Images Based on Deep Neural Networks [0.0] 本稿では,GANに基づくバイオメディカル画像の生成法について述べる。
生成した画像データベースと既知のデータベースとの比較を行った。
論文参考訳(メタデータ) (Sat, 25 May 2024 08:15:21 GMT)
Maintaining and Managing Road Quality:Using MLP and DNN [0.0] この研究は、機械学習が道路状況の監視、時間の節約、メンテナンスの費用を自動化できることを示している。
次のステップは、これらのモデルを改善して、実際の都市でテストすることだ。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:57:50 GMT)
MAC: A Meta-Learning Approach for Feature Learning and Recombination [0.0] 本稿では,ニューラルネットワークの幅-深さ双対性を呼び出すことにより,余分な計算ユニット(ACU)を追加することにより,ネットワークの幅を増大させる。
実験の結果,提案手法は,非類似タスク分布に対する既存のANILアルゴリズムを約13%上回る性能を示した。
論文参考訳(メタデータ) (Sat, 25 May 2024 03:03:29 GMT)
Learning to solve Bayesian inverse problems: An amortized variational inference approach using Gaussian and Flow guides [0.0] 本研究では,ベイズ逆写像,すなわちデータから後部への写像を学習することで,リアルタイムな推論を可能にする手法を開発する。
我々のアプローチは、ニューラルネットワークの前方通過のコストで、所定の観測のための後部分布を提供する。
論文参考訳(メタデータ) (Sat, 25 May 2024 19:47:53 GMT)
LUCIE: A Lightweight Uncoupled ClImate Emulator with long-term stability and physical consistency for O(1000)-member ensembles [0.0] 我々は,データ駆動型大気エミュレータであるLUCIEを,漂流気候を伴わない数千年間,自己回帰推論中に安定に維持する。
LUCIEは、1つのA100 GPU上で4ドル(約4,400円)の確率変数を24ドル(約2,400円)で、粗解像度のERA5データを9.5ドル(約9,800円)でトレーニングしている。
他の最先端のAI気象モデルとは異なり、LUCIEは不安定でもなく、エミュレートされた気候の非物理的漂流をもたらす幻覚も生じない。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:27:13 GMT)
Intensity and Texture Correction of Omnidirectional Image Using Camera Images for Indirect Augmented Reality [0.0] モバイル端末でカメラ画像を用いた拡張現実(AR)が観光振興に人気を博している。
カメラ画像に現れる観光客のような障害は、カメラのポーズ推定ミスを引き起こす可能性がある。
モバイル端末からのカメラ画像を用いて,過去の全方位画像の強度とテクスチャを補正する手法を提案する。
論文参考訳(メタデータ) (Sat, 25 May 2024 02:14:07 GMT)
Individual and Contextual Variables of Cyber Security Behaviour -- An empirical analysis of national culture, industry, organisation, and individual variables of (in)secure human behaviour [0.0] 国家文化、産業タイプ、組織の安全保障文化は個人の安全保障行動に影響を及ぼす変数である。
セキュリティ意識、セキュリティ知識、セキュリティインシデントに関する以前の経験は、セキュリティ行動に影響を及ぼす変数である。
発見は、集団が行動の安全を損なう可能性について、組織に実践的な洞察を与える。
論文参考訳(メタデータ) (Sat, 25 May 2024 12:57:17 GMT)
Hermitian-preserving ansatz and variational open quantum eigensolver [0.0] 変分量子固有解法(VOQE)という新しい変分量子アルゴリズムを提案する。
VOQEでは、混合状態の密度行列は二重ヒルベルト空間における純粋状態によって表される。
VOQE のワークフローは、駆動された XXZ モデルの LME の定常状態の解法と、イジングスピン鎖の非エルミート的ハミルトニアンスペクトルを虚数体で解くための VOQE の実装に関するものである。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:16:03 GMT)
Generation of synthetic data using breast cancer dataset and classification with resnet18 [0.0] 合成データは、実際のデータの制約、ラベル付きデータの収集のコスト、プライバシとセキュリティの問題など、さまざまな理由から必要とされる。
GAN(Generative Adversarial Networks)と呼ばれるディープラーニングモデルは,合成データを生成する目的で開発された。
本研究では,乳腺病理組織学的データセットを用いて悪性および陰性にラベル付けされた合成パッチ画像を生成する。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:53:27 GMT)
Generating configurations of increasing lattice size with machine learning and the inverse renormalization group [0.0] 逆再正規化群法は、臨界減速効果を伴わずに格子サイズを増大させる構成を反復的に生成することができる。
統計力学、格子場理論、不規則系のモデルに適用する。
三次元のエドワーズ・アンダーソンスピンガラスの場合、逆再正規化群を用いて、まだ専用スーパーコンピュータでアクセスされていない格子体積の構成を構築することができる。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:00:37 GMT)
Gain sensitivity of the Mach-Zehnder interferometer by photon subtraction strategy [0.0] 元の2モード圧縮真空状態を持つマッハ・ツェンダー干渉計の位相推定感度について検討した。
本研究では,2つのSMSV状態の量子クレーマー・ラオ(QCR)境界を超える位相推定の感度が,実測範囲の5dB>で得られることを示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:55:45 GMT)
Front-propagation Algorithm: Explainable AI Technique for Extracting Linear Function Approximations from Neural Networks [0.0] 本稿では、深層ニューラルネットワークの意思決定ロジックの解明を目的とした、新しいAI技術であるフロントプロパゲーションアルゴリズムを紹介する。
積分グラディエントやシェープ値などの他の一般的な説明可能性アルゴリズムとは異なり、提案アルゴリズムはネットワークの正確で一貫した線形関数説明を抽出することができる。
公開されているベンチマークデータセットに基づいてトレーニングされた3つの異なるニューラルネットワークアーキテクチャで、正確な線形関数を提供することの有効性を実証する。
論文参考訳(メタデータ) (Sat, 25 May 2024 14:50:23 GMT)
Extended spin relaxation times of optically addressed telecom defects in silicon carbide [0.0] シリコン炭化物 (SiC) にバナジウム (V4+) を添加し, 成熟半導体ホスト内での通信スピン光子界面を確立する。
この手法により, 温度を約2Kから100mKに下げ, 全測定地点からのスピンT1の4次増加を観測した。
2フォノンのオルバッハ過程を含む緩和機構を同定し, 高温でのクビット動作を実現するためのひずみ調整の機会を示す。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:55:53 GMT)
Entanglement generation in weakly-driven arrays of multilevel atoms via dipolar interactions [0.0] 弱駆動型低励起状態では、2レベル原子とは対照的に、多レベル原子は強く絡み合っている。
絡み合いは、基底状態多様体における集合スピン波の成長として現れ、駆動を停止した後でも生存する。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:27:32 GMT)
Dirac fermions with electric dipole moment and position-dependent mass in the presence of a magnetic field generated by magnetic monopoles [0.0] 電気双極子モーメント(EDM)と位置依存質量(PDM)を用いたディラックフェルミオンの有界解を決定する。
特に、スペクトルの特性を詳細に検討するとともに、スペクトルの挙動を分析する。
論文参考訳(メタデータ) (Sat, 25 May 2024 16:49:01 GMT)
Controlling Continuous Relaxation for Combinatorial Optimization [0.0] 未学習学習(UL)に基づく最適化(CO)のための解法は、CO目標を直接最適化することで、出力がソフトソリューションを提供するニューラルネットワークを訓練する。
これらの解法は、特に大規模なCO問題に対して、従来の手法や他の学習ベースの手法よりもいくつかの利点を提供している。
論文参考訳(メタデータ) (Sat, 25 May 2024 04:15:04 GMT)
Carnatic Raga Identification System using Rigorous Time-Delay Neural Network [0.0] 大規模な機械学習に基づくRaga識別は、カルナティック音楽の背後にある計算的側面において、いまだに非自明な問題である。
本稿では,離散フーリエ変換と三角フィルタを用いて音符のカスタムビンを生成するステップの組み合わせを用いて,入力音を解析する。
このプログラムの目的は、より広い範囲のオーディオクリップを、よりシュルーティス、ラガ、よりバックグラウンドノイズで効果的かつ効率的にラベル付けできるようにすることである。
論文参考訳(メタデータ) (Sat, 25 May 2024 01:31:58 GMT)
Bi-reachability in Petri nets with data [0.0] トークンが無限のデータ領域から値を運ぶ平らなペトリネットの拡張であるデータを用いてペトリネットを調査する。
それぞれの構成が他方から到達可能かどうかを問う。
これは決定可能性の境界線を推し進める。
論文参考訳(メタデータ) (Sat, 25 May 2024 11:00:44 GMT)
Apply Distributed CNN on Genomics to accelerate Transcription-Factor TAL1 Motif Prediction [0.0] ゲノミクスの分野におけるディープラーニングの可能性と、数時間、数週間、場合によっては数ヶ月のトレーニング時間などの課題を強調します。
本稿では,CNN(Convolutional Neural Networks)に基づく分散ディープラーニングの実装を提案する。
転写因子TAL1モチーフを高速に予測するために,データ並列性に基づく分散戦略を用いることの有効性を実証した。
論文参考訳(メタデータ) (Sat, 25 May 2024 07:09:44 GMT)
AI-Assisted Detector Design for the EIC (AID(2)E) [0.0] ePIC実験には、性能、物理学的到達度、コストなど、多くの設計パラメータと目的が含まれている。
本研究の目的は,EIC(AID(2)E)のためのスケーラブルで分散AI支援型検出器の開発である。
論文参考訳(メタデータ) (Sat, 25 May 2024 15:33:44 GMT)
A Simulated Annealing-Based Multiobjective Optimization Algorithm for Minimum Weight Minimum Connected Dominating Set Problem [0.0] 本稿では,最小連結支配問題の変種に対処するための欲求に基づくシミュレーションアルゴリズムを提案する。
近年の研究では,本手法の優位性について検討した。
論文参考訳(メタデータ) (Sat, 25 May 2024 13:43:18 GMT)
A Declarative Query Language for Scientific Machine Learning [0.0] 我々は,ナイーブユーザのための新しい宣言型機械学習クエリ言語であるem MQLを紹介した。
本稿では,MQLを用いた2つの材料科学実験について論じる。
論文参考訳(メタデータ) (Sat, 25 May 2024 09:58:33 GMT)