AutoDirector: Online Auto-scheduling Agents for Multi-sensory Composition [149.9] AutoDirectorはインタラクティブな多感覚合成フレームワークで、ロングショット、特殊効果、音楽スコア、ダビング、リップシンクをサポートする。
自動スケジューリングにより多感フィルム製造の効率を向上し、ユーザニーズを満たすインタラクティブなタスクの修正と改善を支援する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:18:22 GMT)
KOSMOS-2.5: A Multimodal Literate Model [137.0] テキスト集約画像の機械読取のためのマルチモーダルリテラルモデル KOSMOS-2.5 を提案する。
KOSMOS-2.5は2つの異なる相補的な転写タスクに優れる。
我々は文書理解タスクにKoSMOS-2.5を微調整し、KoSMOS-2.5-CHATという文書理解ジェネラリストを生み出した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:54:23 GMT)
AIM 2024 Challenge on Compressed Video Quality Assessment: Methods and Results [132.2] 本稿では,ECCV 2024における画像操作の進歩(AIM)ワークショップと共同で開催されている圧縮映像品質評価の課題について述べる。
この課題は、様々な圧縮標準の14コーデックで符号化された459本の動画の多様なデータセット上で、VQA法の性能を評価することであった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:32:45 GMT)
Provably Convergent Subgraph-wise Sampling for Fast GNN Training [122.7] 収束保証,すなわちローカルメッセージ補償(LMC)を用いた新しいサブグラフワイズサンプリング手法を提案する。
LMCは、後方パスのメッセージパスの定式化に基づいて、後方パスで破棄されたメッセージを検索する。
大規模ベンチマーク実験により、LCCは最先端のサブグラフワイドサンプリング法よりもはるかに高速であることが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:54:45 GMT)
Mamba-FSCIL: Dynamic Adaptation with Selective State Space Model for Few-Shot Class-Incremental Learning [113.9] FSCIL(Few-shot class-incremental Learning)は、最小限のトレーニングサンプルを持つモデルに新しいクラスを統合するという課題に直面している。
従来の手法では、固定パラメータ空間に依存する静的適応を広く採用し、逐次到着するデータから学習する。
本稿では、動的適応のための中間特徴に基づいてプロジェクションパラメータを動的に調整する2つの選択型SSMプロジェクタを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:32:26 GMT)
Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.2] 遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:39:48 GMT)
Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities [89.4] モデルマージは、機械学習コミュニティにおける効率的なエンパワーメント技術である。
これらの手法の体系的かつ徹底的なレビューに関する文献には大きなギャップがある。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:47:31 GMT)
LongVILA: Scaling Long-Context Visual Language Models for Long Videos [86.3] LongVILAは、Long-contextビジュアル言語モデルのためのフルスタックソリューションである。
LongVILA は VILA の動画フレーム数を 8 から 1024 に効率的に拡張し、長いビデオキャプションスコアを 2.00 から 3.26 に改善し、1400 フレーム (274k コンテキスト長) のビデオニードル・イン・ア・ヘイスタックで 99.5% の精度を実現した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:47:33 GMT)
Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration [83.4] Corexは,大規模言語モデルを自律エージェントに変換する,新たな汎用戦略スイートだ。
人間の振る舞いにインスパイアされたCorexは、Debate、Review、Retrieveモードといった多様なコラボレーションパラダイムによって構成されている。
我々は,複数のLDMを協調的に演奏することで,既存の手法に比べて性能が著しく向上することが実証された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:11:10 GMT)
Persona-DB: Efficient Large Language Model Personalization for Response Prediction with Collaborative Data Refinement [79.2] 本稿では,タスクコンテキスト間の一般化を改善するための階層的な構築プロセスからなる,シンプルで効果的なフレームワークであるPersona-DBを紹介する。
応答予測の評価において,Persona-DB は精度を著しく低減した検索サイズで維持する上で,より優れたコンテキスト効率を示す。
我々の実験は、ユーザーが極めて少ないデータを持つ場合、コールドスタートシナリオで10%以上の顕著な改善が示されていることも示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:31:07 GMT)
MoE-LPR: Multilingual Extension of Large Language Models through Mixture-of-Experts with Language Priors Routing [78.6] 大規模言語モデル(LLM)は、事前学習データに言語が不均等に分布するため、しばしば英語中心である。
そこで本稿では,MoE-LPR (Mixture-of-Experts with Language Priors) と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:43:49 GMT)
LLM3:Large Language Model-based Task and Motion Planning with Motion Failure Reasoning [78.2] 従来のタスク・アンド・モーション・プランニング(TAMP)アプローチは、シンボル的タスク・プランニングと連続的なモーション・ジェネレーションを結びつける手作業によるインタフェースに依存している。
本稿では,ドメインに依存しないインターフェースを備えたLarge Language Model (LLM) ベースの TAMP フレームワーク LLM3 を提案する。
具体的には、事前学習したLLMの強力な推論と計画能力を活用して、シンボル的なアクションシーケンスを提案し、動作計画のための連続的なアクションパラメータを選択する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:46:35 GMT)
Two-Timescale Gradient Descent Ascent Algorithms for Nonconvex Minimax Optimization [77.3] 非テキストマックス最適化問題に対する凸勾配上昇(TTGDA)の統一解析を行う。
具体的には、スムーズな非凹問題を解く複雑性に関する理論的境界を証明している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:14:54 GMT)
OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0] 本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:24:49 GMT)
ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.8] ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。
LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:36:30 GMT)
Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.6] 我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:45:12 GMT)
DiffuMatting: Synthesizing Arbitrary Objects with Matting-level Annotation [74.2] 拡散の強大な全ての生成能力を継承し,「何でも達成する」力を与えるDiffuMattingを提案する。
当社のDiffuMatting can 1)は,コミュニティに優しいアートデザインとコントロール可能な世代を実現するために,コミュニティのLoRAやさまざまな条件制御アプローチと整合性のある,高精度なアノテーションを備えたテンプレートファクトリとして機能する。
マットデータ生成器として、DiffuMattingは汎用オブジェクトとポートレート・マッティングセットを合成し、一般オブジェクト・マッティングでは15.4%、ポートレート・マッティングでは11.4%の誤差を効果的に削減した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:35:15 GMT)
Mitigating Label Noise on Graph via Topological Sample Selection [72.9] トポロジ情報を活用することで,グラフ内の情報的サンプル選択プロセスを促進できる$textitTopological Sample Selection$ (TSS)法を提案する。
提案手法は,対象のクリーン分布下での予測されるリスク上限の上限を最小化し,最先端のベースラインと比較して,提案手法の優位性を実験的に示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:02:28 GMT)
Learning Partially Aligned Item Representation for Cross-Domain Sequential Recommendation [72.7] クロスドメインシーケンシャルレコメンデーションは、ドメイン間でのユーザのシーケンシャルな好みを明らかにすることを目的としている。
ミスアライメントアイテム表現は、サブ最適シーケンシャルモデリングとユーザ表現アライメントにつながる可能性がある。
textbfCross- domain item representation textbfAlignment for textbfCross-textbfDomain textbfSequential textbfRecommendationを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:31:40 GMT)
SelfDRSC++: Self-Supervised Learning for Dual Reversed Rolling Shutter Correction [72.1] 二重反転RS歪み補正(SelfDRSC++)のための自己教師付き学習フレームワークを提案する。
双方向相関マッチングブロックを組み込んだ軽量DRSCネットワークを導入し,光学流の結合最適化とRS特性の補正を行う。
DRSCネットワークを効果的に訓練するために、入力と再構成された二重逆RS画像間のサイクル整合性を保証する自己教師付き学習戦略を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:17:22 GMT)
Great Memory, Shallow Reasoning: Limits of $k$NN-LMs [71.7] 検索とnext-word予測を統合した$k$NN-LMsは、言語モデリングにおいて強力な性能を示している。
この改良された情報リコール能力が、本当に下流の能力に変換されるかどうかを問う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:59:05 GMT)
Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.6] マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。
事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。
次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:48:38 GMT)
SZTU-CMU at MER2024: Improving Emotion-LLaMA with Conv-Attention for Multimodal Emotion Recognition [65.2] 我々は,マルチモーダル感情認識におけるMER2024チャレンジのMER-NOISEとMER-OVトラックに対する勝利のアプローチを示す。
Emotion-LLaMAの高度な感情理解機能を利用して、ラベルなしサンプルの高品質なアノテーションを生成する。
MER-OVトラックでは,オープンボキャブラリアノテーションにEmotion-LLaMAを用いることで,GPT-4Vと比較して平均精度とリコールが8.52%向上した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:58:26 GMT)
What Makes and Breaks Safety Fine-tuning? A Mechanistic Study [65.0] 安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。
安全でない入力の健全な側面をキャプチャする合成データ生成フレームワークを設計する。
これを用いて,3つのよく知られた安全微調整手法について検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:12:37 GMT)
Silent Guardian: Protecting Text from Malicious Exploitation by Large Language Models [63.9] 大規模言語モデル(LLM)に対するテキスト保護機構であるSilent Guardianを紹介する。
保護されるテキストを慎重に修正することで、TPEはLDMを誘導して最初にエンドトークンをサンプリングし、直接相互作用を終了させることができる。
本研究では,SGがターゲットテキストを種々の構成で効果的に保護し,保護成功率の約100%を達成できることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:04:27 GMT)
Larimar: Large Language Models with Episodic Memory Control [62.7] Larimarは、分散エピソードメモリで大規模言語モデルを拡張するための、脳にインスパイアされたアーキテクチャである。
複数のファクト編集ベンチマークの実験結果は、Larimarが最も競争力のあるベースラインに匹敵する精度を達成したことを示している。
本稿では,Larimarを用いた選択的事実認識,情報漏洩防止,入力コンテキスト長の一般化のためのメカニズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:54:47 GMT)
LLM Pruning and Distillation in Practice: The Minitron Approach [61.6] Llama 3.1 8B および Mistral NeMo 12B モデルを 4B および 8B パラメータに圧縮する。
1)深い刈り込みと(2)隠れた/保持/MLP(幅)刈り込みという2つの異なる刈り出し方を探る。
このアプローチは、Llama 3.1 8Bから魅力的な4Bモデル、Mistral NeMo 12Bから最先端のMistral-NeMo-Minitron-8Bモデルを生成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:38:48 GMT)
EmbodiedSAM: Online Segment Any 3D Thing in Real Time [61.2] 身体的なタスクは、エージェントが探索と同時に3Dシーンを完全に理解する必要がある。
オンライン、リアルタイム、微粒化、高度に一般化された3D知覚モデルは、必死に必要である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:57:06 GMT)
D$^3$FlowSLAM: Self-Supervised Dynamic SLAM with Flow Motion Decomposition and DINO Guidance [61.1] 本稿では,動的シーンにおいて動的コンポーネントを正確に識別しながら頑健に動作する自己教師型ディープSLAM法を提案する。
本稿では,この表現に基づく動的更新モジュールを提案し,動的シナリオに優れた高密度SLAMシステムの開発を行う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:45:17 GMT)
Iterative Object Count Optimization for Text-to-image Diffusion Models [59.0] 画像とテキストのペアから学ぶ現在のモデルは、本質的にカウントに苦慮している。
本稿では,物体のポテンシャルを集計する計数モデルから得られた計数損失に基づいて生成画像の最適化を提案する。
様々なオブジェクトの生成を評価し,精度を大幅に向上させた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:51:46 GMT)
Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.0] 分散エージェントは、経験的システムの単一かつ非エポゾディックな実行から平均フィールドゲームにおける平衡を学ぶことができる。
既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。
また, エージェントが局所的な周辺地域に基づいて, グローバルな経験分布を推定できる新しいアルゴリズムも提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:32:46 GMT)
CompilerDream: Learning a Compiler World Model for General Code Optimization [58.9] 汎用コード最適化のためのモデルベース強化学習手法であるCompilerDreamを紹介する。
最適化パスの固有の特性を正確にシミュレートするコンパイラの世界モデルと、このモデルで訓練されたエージェントから、効率的な最適化戦略を生成する。
さまざまなデータセットを網羅し、LLVMのビルトイン最適化や、値予測とエンドツーエンドコード最適化の両方の設定における最先端メソッドを超越している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:45:07 GMT)
MARLIN: Mixed-Precision Auto-Regressive Parallel Inference on Large Language Models [58.3] 本稿では,Mixed-precision AutoRegressive LINearカーネルの設計について述べる。
バッチサイズは16-32までサポートでき、量子化のスピードアップが最大 (4times$) になる。
MarLINは非同期メモリアクセス、複雑なタスクスケジューリング、パイプライン化といったテクニックを組み合わせてこれを実現している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:10:41 GMT)
FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization [57.6] 直接2D-3Dマッチングアルゴリズムでは、メモリが大幅に削減されるが、より大きくあいまいな検索空間のために精度が低下する。
本研究では,2次元3次元探索フレームワーク内の重み付き平均演算子を用いて局所的およびグローバルな記述子を融合させることにより,この曖昧さに対処する。
ローカルのみのシステムの精度を常に改善し、メモリ要求を半減させながら階層的な手法に近い性能を達成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:42:16 GMT)
Story3D-Agent: Exploring 3D Storytelling Visualization with Large Language Models [57.3] 提案するStory3D-Agentは、提供された物語を3Dレンダリングの可視化に変換する先駆的なアプローチである。
プロシージャモデリングを統合することで,複数文字の動作や動きを正確に制御できるだけでなく,多様な装飾的要素も利用できる。
我々は,ストーリー3D-Agentを徹底的に評価し,その有効性を検証し,3Dストーリー表現を前進させるための基本的な枠組みを提供した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:43:15 GMT)
Nothing in Excess: Mitigating the Exaggerated Safety for LLMs via Safety-Conscious Activation Steering [56.9] 重大言語モデル(LLM)が悪意のある命令から脅威を守るためには、安全性の調整が不可欠である。
近年の研究では、過大な安全性の問題により、安全性に配慮したLCMは、良質な問い合わせを拒否する傾向にあることが明らかになっている。
過大な安全性の懸念を和らげるために,SCANS法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:01:34 GMT)
Bidirectional Gated Mamba for Sequential Recommendation [56.9] 最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
我々はtextbfunderlineSelecttextbfunderlineIve textbfunderlineGated textbfunderlineMAmba という新しいフレームワークを紹介した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:12:59 GMT)
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.2] 本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。
まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。
そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:13:53 GMT)
Why am I Still Seeing This: Measuring the Effectiveness Of Ad Controls and Explanations in AI-Mediated Ad Targeting Systems [55.0] 我々は,メタの「より少ない」広告制御の有効性と,AIによるターゲティングへの移行に伴う広告ターゲティング説明の有効性を評価する。
調査対象のトピックに対する"See less"広告コントロールの利用は,Metaがこれらのトピックについて示す広告数を著しく減少させるものではないことがわかった。
ローカル広告の広告ターゲティング説明の大部分は、位置特化ターゲティング基準に言及していない。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:03:11 GMT)
RAGLAB: A Modular and Research-Oriented Unified Framework for Retrieval-Augmented Generation [54.7] 大きな言語モデル(LLM)は対話、推論、知識保持における人間レベルの能力を示す。
現在の研究は、LLMに外部知識を組み込むことによって、このボトルネックに対処している。
RAGLABはモジュール的で研究指向のオープンソースライブラリで、6つの既存のアルゴリズムを再現し、RAGアルゴリズムを調査するための包括的なエコシステムを提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:20:48 GMT)
Differentiating Choices via Commonality for Multiple-Choice Question Answering [54.0] 複数選択の質問応答は、正しい答えを選択するための貴重な手がかりを提供することができる。
既存のモデルでは、それぞれの選択を別々にランク付けし、他の選択によって提供されるコンテキストを見渡すことが多い。
本稿では,DCQAと呼ばれる共通性を識別・排除することで,選択を識別する新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:05:21 GMT)
Deep Generative Models in Robotics: A Survey on Learning from Multimodal Demonstrations [52.1] 近年、ロボット学習コミュニティは、大規模なデータセットの複雑さを捉えるために、深層生成モデルを使うことへの関心が高まっている。
本稿では,エネルギーベースモデル,拡散モデル,アクションバリューマップ,生成的敵ネットワークなど,コミュニティが探求してきたさまざまなモデルについて述べる。
また,情報生成から軌道生成,コスト学習に至るまで,深層生成モデルを用いた様々なアプリケーションについて述べる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:54:54 GMT)
Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.3] 我々は,複数のLVLMエージェントの固有知識を統合する,名前という新しい視覚的ジオローカライゼーションフレームワークを導入する。
本フレームワークでは,エージェント間の通信パターンを最適化するための動的学習戦略を採用している。
提案手法の有効性を検証するため,視覚的ジオローカライゼーションタスクのための新しいデータセットであるGeoGlobeを構築した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:31:30 GMT)
JPEG-LM: LLMs as Image Generators with Canonical Codec Representations [51.1] 離散化は、画像やビデオのような連続したデータを離散トークンとして表現する。
画像やビデオを識別する一般的な方法は、生のピクセル値のモデリングである。
正規表現を用いることで、言語生成と視覚生成の障壁を低くすることができることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:24:53 GMT)
Decoupling Dynamic Monocular Videos for Dynamic View Synthesis [50.9] 動的モノクロビデオからの動的ビュー合成の課題を教師なしで解決する。
具体的には、動的物体の運動を物体の動きとカメラの動きに分離し、教師なし表面の整合性およびパッチベースのマルチビュー制約によって規則化する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:47:01 GMT)
Enabling Small Models for Zero-Shot Classification through Model Label Learning [50.7] モデルと機能の間のギャップを埋める新しいパラダイムであるモデルラベル学習(MLL)を導入する。
7つの実世界のデータセットの実験により、MLLの有効性と効率が検証された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:08:26 GMT)
ContextualStory: Consistent Visual Storytelling with Spatially-Enhanced and Storyline Context [50.6] 既存の自動回帰手法は、メモリ使用量の増加、生成速度の低下、コンテキスト統合の制限に悩まされている。
本研究では,コヒーレントなストーリーフレームの生成とストーリー継続のためのフレーム拡張を目的とした新しいフレームワークであるContextualStoryを提案する。
PororoSVとFlintstonesSVベンチマークの実験では、ContextualStoryはストーリービジュアライゼーションとストーリー継続の両方において既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:17:31 GMT)
ComKD-CLIP: Comprehensive Knowledge Distillation for Contrastive Language-Image Pre-traning Model [49.6] コントラスト言語画像前処理モデルのための包括的知識蒸留法ComKD-CLIPを提案する。
大規模な教師CLIPモデルからより小さな学生モデルに知識を抽出し、パラメータを著しく減らして同等のパフォーマンスを確保する。
EduAttentionは教師モデルで抽出したテキスト特徴と学生モデルで抽出した画像特徴との相互関係を探索する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:36:27 GMT)
Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation [49.0] さまざまな種類のロボットにまたがって単一のポリシーを訓練することによって、ロボット学習はより広範囲で多様なデータセットを活用することができる。
そこで我々はCrossFormerを提案する。CrossFormerはスケーラブルでフレキシブルなトランスフォーマーベースのポリシーで、どんな実施形態からでもデータを消費できる。
我々は、同じネットワークウェイトがシングルアームとデュアルアームの操作システム、車輪付きロボット、クワッドコプター、四足歩行など、非常に異なるロボットを制御できることを実証した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:57:51 GMT)
Randomization Techniques to Mitigate the Risk of Copyright Infringement [48.8] 著作権保護の現在の慣行を補完する潜在的なランダム化手法について検討する。
これは、著作権の先例において実質的な類似性を決定する規則の固有の曖昧さによって動機付けられている。
差分プライバシーのような同様にランダム化されたアプローチは、プライバシーリスクを軽減することに成功している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:55:00 GMT)
Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data [48.4] 我々は、事前学習データにおいて、信頼された情報源から動詞句を引用するモデルを開発する。
実験の結果,Quote-Tuningは高品質な事前学習文書からの動詞句の引用を55%から130%増加させることがわかった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:23:28 GMT)
Logical Distillation of Graph Neural Networks [47.9] グラフを学習するための論理に基づく解釈可能なモデルと,このモデルをグラフニューラルネットワーク(GNN)から抽出するアルゴリズムを提案する。
最近の結果は、GNNの表現性と数量化器を用いた一階述語論理の2変数フラグメント(C2)の関連性を示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:40:02 GMT)
MMFakeBench: A Mixed-Source Multimodal Misinformation Detection Benchmark for LVLMs [47.4] マルチモーダル誤報検出法は、しばしばサンプルごとに単一のソースと種類の偽造を仮定する。
混合ソースの誤情報に対するベンチマークが欠如していることは、この分野の進歩を妨げている。
MMFakeBenchは、ミックスソースMDDの最初の包括的なベンチマークである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:00:04 GMT)
Understanding Epistemic Language with a Bayesian Theory of Mind [47.0] ベイジアン推論に基づく認識的言語解釈モデルを導入する。
実験では,エージェントが迷路をナビゲートして,目標達成に必要な箱に隠されたキーを見つけ,エージェントの信念を判断する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:29:56 GMT)
The NeRFect Match: Exploring NeRF Features for Visual Localization [45.4] 視覚的位置決めのためのシーン表現としてNeRF(Neural Radiance Fields)を提案する。
局所化のための正確な2D-3Dマッチングを確立する際に、NeRFの内部特徴の可能性を探ることで、認識された利点を拡大する。
ビュー合成により学習したNeRFの内部知識を活かした2D-3Dマッチング機能であるNeRFMatchを導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:06:03 GMT)
Robust 3D Gaussian Splatting for Novel View Synthesis in Presence of Distractors [44.6] 3D Gaussian Splattingは素晴らしいビュー合成結果を示している。
静的なシーンの入力データを汚染する動的オブジェクトに対して脆弱である。
提案手法は,多種多様な気晴らしに対して堅牢であり,気晴らしシーンのレンダリング品質を著しく向上することを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:21:27 GMT)
Probing the Safety Response Boundary of Large Language Models via Unsafe Decoding Path Generation [44.1] 大きな言語モデル(LLM)は暗黙のトラブルメーカーである。
LLMは有害なデータ収集や隠蔽攻撃に使用できる。
私たちはこのデコード戦略をJVD(Jailbreak Value Decoding)と名付けます。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:50:29 GMT)
HumanCoser: Layered 3D Human Generation via Semantic-Aware Diffusion Model [43.7] 本稿では,テキストプロンプトから物理的に階層化された3D人間を生成することを目的とする。
本稿では,物理的に分離された拡散モデルに基づく,新しい階層的な人間の表現法を提案する。
そこで本研究では,SMPLによる暗黙的フィールドネットワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:00:11 GMT)
Addressing a fundamental limitation in deep vision models: lack of spatial attention [43.4] この写本の目的は、現在の深層学習モデル、特に視覚モデルにおいて重要な限界を強調することである。
我々は、次世代のより効率的な視覚モデルに道を開くことのできるソリューションを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:39:06 GMT)
Diagnosing and Remedying Knowledge Deficiencies in LLMs via Label-free Curricular Meaningful Learning [42.4] 大規模言語モデル(LLM)は多用途であり、印象的な一般化能力を示している。
彼らは今でも推論ミスを示しており、しばしば知識不足から起因している。
LLMの知識不足を診断・治療するためのラベルフリーなカリキュラム意味学習フレームワーク(LaMer)を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:39:49 GMT)
Memorization In In-Context Learning [42.2] In-context Learning (ICL) は,大規模言語モデル(LLM)の性能向上に有効な手法であることが証明されている。
本研究は、ICLが記憶したトレーニングデータをどのように表すかを示し、この記憶とパフォーマンスの相関について検討した最初のものである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:54:22 GMT)
Approaching Deep Learning through the Spectral Dynamics of Weights [41.9] 重みのスペクトル力学 -- 最適化中の特異値とベクトルの振る舞い -- は、ディープラーニングにおけるいくつかの現象を明確にし、統一する。
ConvNetによる画像分類,UNetsによる画像生成,LSTMによる音声認識,Transformersによる言語モデリングなど,さまざまな実験における最適化における一貫したバイアスを同定する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:48:01 GMT)
An agent design with goal reaching guarantees for enhancement of learning [40.8] 強化学習はマルコフ決定過程における累積報酬の最大化の問題に関係している。
我々は、かなり柔軟で、批判者を構成する限り、事実上あらゆるエージェントを増強するために使用できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:43:36 GMT)
SEA: Supervised Embedding Alignment for Token-Level Visual-Textual Integration in MLLMs [40.7] MLLM(Multimodal Large Language Models)は近年,知覚能力や推論能力が著しく向上している。
イメージレベルの監督を施したトレーニングアダプタは、しばしば重大なミスアライメントをもたらす。
本稿では,視覚言語による事前学習モデルを活用したトークンレベルのアライメント手法であるSupervised Embedding Alignment (SEA)を紹介する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:58:02 GMT)
Xinyu: An Efficient LLM-based System for Commentary Generation [39.2] 新友(しんゆう)は、中国の注釈文作成のコメンテーターを支援するために設計された、効率的なLCMベースのシステムである。
基本要件を満たすため、我々は生成プロセスを逐次ステップに分解し、ターゲット戦略を提案し、微調整を監督する。
実際のシナリオではコメンテーターの効率が大幅に向上し,コメント作成に要する平均時間は4時間から20分に短縮された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:34:29 GMT)
Automatic Dataset Construction (ADC): Sample Collection, Data Curation, and Beyond [38.9] 本稿では,データセット作成をコストと高効率で自動化する革新的な手法を提案する。
我々は,ラベルの誤り検出,ノイズやバイアスのあるデータによる堅牢な学習など,既存の手法を組み込んだオープンソースソフトウェアを提供する。
ラベルノイズ検出、ラベルノイズ学習、クラス不均衡学習に焦点を当てた3つのベンチマークデータセットを設計する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:45:12 GMT)
Automatic knowledge-graph creation from historical documents: The Chilean dictatorship as a case study [38.7] チリ独裁時代(1973-1990年)に関する歴史資料から知識グラフの自動構築に関する結果を示す。
我々のアプローチは、LLMを使ってエンティティとそれらのエンティティ間の関係を自動的に認識することである。
アーキテクチャを評価するために、文書の小さな部分集合を用いて構築された金標準グラフを使用し、これを同じ文書集合を処理する際に、我々のアプローチから得られたグラフと比較する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:15:22 GMT)
LiFCal: Online Light Field Camera Calibration via Bundle Adjustment [38.3] LiFCalは、MLAベースの光フィールドカメラのためのオンラインキャリブレーションパイプラインである。
正確な校正対象のない移動カメラシーケンスからモデルパラメータを正確に決定する。
ターゲットのないシーンに適用可能で、完全な継続的パイプラインでオンラインに実装されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:04:49 GMT)
Chemical Reaction Neural Networks for Fitting Accelerated Rate Calorimetry Data [37.7] 化学反応ニューラルネットワーク(CRNN)は、モリセル21700 P45Bから得られたARCデータにN方程式のアレニウスODEの運動パラメータを適合させるために訓練される。
この手法の柔軟性は、2方程式と4方程式のモデルを用いて実験することによって実証される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:39:41 GMT)
HITS: High-coverage LLM-based Unit Test Generation via Method Slicing [37.4] 大規模言語モデル(LLM)は、Javaプロジェクトの単体テストの生成においてうまく振る舞っている。
しかし、プロジェクト内の複雑な焦点メソッドをカバーするパフォーマンスは貧弱である。
そこで本研究では, 焦点メソッドをスライスに分解し, LLMに対してスライス毎にテストケーススライスを生成することを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:14:26 GMT)
Surgical Workflow Recognition and Blocking Effectiveness Detection in Laparoscopic Liver Resections with Pringle Maneuver [37.3] 腹腔鏡下肝切除におけるプリングル手術 (PM) は, 出血を減少させ, 明確な手術観を提供することを目的としている。
ワークフロー認識とブロック有効性検出の2つの補完的AI支援手術モニタリングタスクを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:02:53 GMT)
Mechanistically analyzing the effects of fine-tuning on procedurally defined tasks [37.3] プレトレーニング中にモデルが学習する基礎的能力に微調整がどう影響するかを考察する。
微調整が基礎となるモデル能力を変えることは滅多にない。
また、微調整により、意図せずにモデルの安全ラッパーを除去できることも示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:37:20 GMT)
FedAIoT: A Federated Learning Benchmark for Artificial Intelligence of Things [37.2] FedAIoTは、AI of Things(AIoT)領域における連邦学習(FL)のベンチマークである。
FedAIoTには、幅広いIoTデバイスから収集された8つのデータセットが含まれている。
ベンチマークの結果は、AIoTにおけるFLの機会と課題を浮き彫りにしたものです。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:22:46 GMT)
Design Principle Transfer in Neural Architecture Search via Large Language Models [37.0] トランスファーブルニューラルアーキテクチャサーチ(TNAS)は、複数のタスクのための効率的なニューラルアーキテクチャを設計するために導入された。
TNASでは、従来の検索プロセスに蓄積されたアーキテクチャ知識を再利用して、新しいタスクのアーキテクチャ検索を温める。
本研究は,新しい伝達パラダイム,すなわち設計原理伝達を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:27:44 GMT)
GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models [36.8] グラフ解析のベンチマークであるGRABを現在および将来のLMMに適用する。
私たちのベンチマークは完全に総合的で、高品質でノイズフリーな質問を確実にします。
GRAB上で20のLMMを評価し、21.7%のスコアで最高のパフォーマンスのモデルで、挑戦的なベンチマークであることが判明した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:59:32 GMT)
Finite element-based space-time total variation-type regularization of the inverse problem in electrocardiographic imaging [36.4] 体表面電位測定による心活動の再構築は、心電図の逆問題を引き起こす。
本研究は,空間時間全変動型正規化に基づく体表面電位マップから心電位を再構成する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:28:56 GMT)
TrAME: Trajectory-Anchored Multi-View Editing for Text-Guided 3D Gaussian Splatting Manipulation [36.0] TAS(Trajectory-Anchored Scheme)による複数ビューの整合性を保証するプログレッシブな3D編集戦略を提案する。
TASは2Dビュー編集と3D更新の間に密結合された反復プロセスを促進し、テキスト・ツー・イメージ・プロセスから得られるエラーの蓄積を防ぐ。
本稿では,2次元ビューの編集中に,ソースブランチからのクロスビューセマンティクスと幾何参照を利用して,対象ブランチからアライメントされたビューを出力する,調整不要なビュー一貫性注意制御(VCAC)モジュールを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:15:52 GMT)
CaRDiff: Video Salient Object Ranking Chain of Thought Reasoning for Saliency Prediction with Diffusion [35.3] ビデオのサリエンシ予測は、ビデオのボトムアップ機能や、記憶や認知などのトップダウンプロセスによって、人間の注意を引き、視線を惹きつけるビデオ内の領域を特定することを目的としている。
既存の手法は主に知覚情報のモデリングに重点を置いているが、言語による推論プロセスは無視されている。
本稿では,マルチモーダル大言語モデル(MLLM),グラウンドモジュール,拡散モデルを統合することで,そのプロセスを模倣するフレームワークであるCaRDiffを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:40:30 GMT)
Last-Iterate Convergence of General Parameterized Policies in Constrained MDPs [35.2] Proposed Primal-Dual based Regularized Accelerated Natural Policy Gradient (PDR-ANPG) algorithm using entropy and quadratic regularizers to reach this goal。
PDR-ANPGは、パラメータ化されたポリシークラスに変換互換性の近似誤差を持たせるため、最終値の$epsilon$Optimity gapを達成できる。
これは、汎用パラメータ化CMDPの最先端最終保証の大幅な改善である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:44:57 GMT)
Multi-Task Multi-Fidelity Learning of Properties for Energetic Materials [34.8] マルチタスクニューラルネットワークは、マルチモーダルデータから学習でき、特定の特性のために訓練されたシングルタスクモデルより優れている。
予想通り、データスカースプロパティでは改善がより重要になります。
このアプローチは、エネルギー材料以外の分野にも広く適用できる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:54:26 GMT)
When ChatGPT Meets Smart Contract Vulnerability Detection: How Far Are We? [34.6] スマートコントラクトの脆弱性を識別する際のChatGPTの性能について,実証的研究を行った。
ChatGPTは高いリコール率を達成するが、スマートコントラクトの脆弱性を特定できる精度は限られている。
我々の研究は、スマートコントラクトの脆弱性の検出に大規模な言語モデル、特にChatGPTを使用する際の長所と短所に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:40:16 GMT)
LLM2Vec: Large Language Models Are Secretly Powerful Text Encoders [34.4] 大規模デコーダのみの言語モデル(LLM)は、今日のNLPタスクとベンチマークのほとんどで最先端のモデルである。
LLM2Vecは、任意のデコーダのみのLCMを強力なテキストエンコーダに変換する、単純な教師なしアプローチである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:46:05 GMT)
Empowering LLMs with Pseudo-Untrimmed Videos for Audio-Visual Temporal Understanding [33.9] PU-VALORは114,000本以上の擬似アンリム化ビデオと詳細な時間的アノテーションを含む包括的オーディオ視覚データセットである。
PU-VALORは、イベントベースのビデオクラスタリングを含む微妙な方法で、大規模だが粗い注釈付きオーディオ視覚データセットVALORから派生した。
AVicunaは、音声・視覚イベントを時間間隔と対応するテキストトークンに整列できるモデルである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:15:20 GMT)
Leveraging Large Language Models for Enhanced Process Model Comprehension [33.8] ビジネスプロセスマネジメント(BPM)では、効果的にプロセスモデルを理解することが重要であるが、重大な課題を生じさせる。
本稿では,Large Language Models(LLM)の高度な機能を活用し,複雑なプロセスモデルの解釈可能性を高める新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:38:36 GMT)
GSTran: Joint Geometric and Semantic Coherence for Point Cloud Segmentation [33.7] 本稿では,セグメント化作業に適した新しい変圧器ネットワークであるGSTranを提案する。
提案するネットワークは主に,局所幾何学変換器と大域意味変換器の2つの主成分から構成される。
ShapeNetPartとS3DISベンチマークの実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:12:37 GMT)
Unlocking Adversarial Suffix Optimization Without Affirmative Phrases: Efficient Black-box Jailbreaking via LLM as Optimizer [33.7] 最適化可能な接尾辞を用いた新規かつ効率的なブラックボックスジェイルブレイク法であるELIPSEを提案する。
我々は,Jailbreakの目標を自然言語命令に変換するタスクプロンプトを用いて,悪意のあるクエリに対する逆接接尾辞を生成する。
ECLIPSE は3つのオープンソース LLM と GPT-3.5-Turbo に対して平均攻撃成功率 0.92 を達成し、GCG を2.4倍に上回っている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:35:24 GMT)
A Practical Trigger-Free Backdoor Attack on Neural Networks [33.4] トレーニングデータへのアクセスを必要としないトリガーフリーのバックドア攻撃を提案する。
具体的には、悪意のあるデータの概念を攻撃者特定クラスの概念に組み込んだ、新しい微調整アプローチを設計する。
提案した攻撃の有効性,実用性,ステルスネスを実世界の3つのデータセットで評価した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:53:36 GMT)
CARLA Drone: Monocular 3D Object Detection from a Different Perspective [33.3] この研究は、異なるカメラ視点で3D検出フレームワークを拡張評価することを提唱している。
我々は、CDroneというCARLA Droneデータセットを導入し、ドローンビューをシミュレートし、既存のベンチマークにおけるカメラ視点の多様性を大幅に拡大する。
我々は、GroundMixと呼ばれる効果的なデータ拡張パイプラインを開発し、その識別要素は、トレーニング画像の3D一貫性向上のためのグラウンドの利用である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:25:03 GMT)
Evolution of Detection Performance throughout the Online Lifespan of Synthetic Images [33.0] 現在の最先端の検出器は、野生の合成画像と実際の画像の区別に苦労している。
オンライン画像の初期出現から経過した時間は,ほとんどの検出器の性能に悪影響を及ぼすことを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:40:40 GMT)
TrackGo: A Flexible and Efficient Method for Controllable Video Generation [32.9] 条件付きビデオ生成のための新しいアプローチであるTrackGoを紹介する。
TrackGoは、ビデオコンテンツを操作するための柔軟で正確なメカニズムを提供する。
また,制御実装のためのTrackAdapterを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:42:04 GMT)
Confounding Privacy and Inverse Composition [32.9] 差分プライバシーでは、センシティブな情報がデータセットに含まれ、Pufferfishのプライバシでは、センシティブな情報がデータの配布を決定する。
我々は、差分プライバシーとPufferfishプライバシーの両方を一般化する新しいプライバシー概念(epsilon, delta$)を導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:45:13 GMT)
TWLV-I: Analysis and Insights from Holistic Evaluation on Video Foundation Models [32.6] 本稿では,映像理解における2つの中核的能力(外観と動作理解)を測定するための枠組みを提案する。
我々は、モーションベースと外観ベースの両方で堅牢な視覚表現を構築する、新しいビデオ基盤モデルであるTWLV-Iを紹介する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:56:27 GMT)
Koopman AutoEncoder via Singular Value Decomposition for Data-Driven Long-Term Prediction [31.9] 固有値の制御は、高い計算複雑性と、トレーニングプロセス中にそれらを管理するのに困難があるため、難しい。
そこで本稿では, コップマン行列の特異値分解(SVD)を利用して, 長期予測を改善することを提案する。
実験により, 学習中, 特異値の損失項は単位円に近い固有値を効果的にもたらすことが示され, 提案手法は, 長期予測タスクにおいて, 既存のベースライン法よりも優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:15:37 GMT)
MambaOcc: Visual State Space Model for BEV-based Occupancy Prediction with Local Adaptive Reordering [31.2] そこで我々は,3次元シナリオ表現の負担を軽減するために,BEV機能を採用したマンバ型占有予測手法を提案する。
Occ3D-nuScenesデータセットの実験は、MambaOccが精度と計算効率の両方で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:29:45 GMT)
Bias and Unfairness in Information Retrieval Systems: New Challenges in the LLM Era [31.2] 検索エンジンやレコメンデーションシステムなどの情報検索システムは、重要なパラダイムシフトを経験している。
大規模言語モデル(LLM)の急速な進歩により、検索エンジンやレコメンダシステムといった情報検索システムは、重要なパラダイムシフトを経験してきた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:23:03 GMT)
TimeSieve: Extracting Temporal Dynamics through Information Bottlenecks [31.1] 本稿では,時系列予測モデルTimeSieveを提案する。
提案手法では、ウェーブレット変換を用いて時系列データを前処理し、マルチスケールの特徴を効果的にキャプチャする。
本研究は,時系列予測における課題に対処するためのアプローチの有効性を検証した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:22:09 GMT)
SPES: Towards Optimizing Performance-Resource Trade-Off for Serverless Functions [31.0] サーバーレスコンピューティングは、その効率性とオンデマンドのクラウドリソースを活用する能力によって、勢いを増している。
既存のソリューションでは、完全な呼び出しパターンを使わずに関数のプリロード/アンロードのために、過剰に単純化された戦略を使う傾向があります。
本研究では、サーバーレス関数のプロビジョニングを最適化することにより、実行時コールドスタート緩和のための最初の差別化スケジューラであるSPESを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:06:36 GMT)
RConE: Rough Cone Embedding for Multi-Hop Logical Query Answering on Multi-Modal Knowledge Graphs [30.9] 知識グラフ上で応答するマルチホップクエリは、クエリに応答するために、開始ノードから1つ以上のホップをトラバースする。
本稿では,クエリに応答するために必要なマルチモーダル情報をキャプチャする埋め込み手法RConEを提案する。
MMKGを問合せする論理構造を初めて導入し,その答えとしてマルチモーダルエンティティのサブエンティティを含む問合せに答える。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:02:35 GMT)
TabReD: A Benchmark of Tabular Machine Learning in-the-Wild [30.9] 機械学習の学術ベンチマークでは、業界グレードのデータセットが不足していることが示される。
幅広いドメインをカバーする8つの業界グレードデータセットの集合であるTabReDを紹介する。
時間に基づくデータ分割の評価は、学術ベンチマークにおいてより一般的なランダム分割の評価と比較して、異なる手法のランク付けにつながることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:54:14 GMT)
CSPI-MT: Calibrated Safe Policy Improvement with Multiple Testing for Threshold Policies [30.6] 我々は、経済、医療、デジタル広告の応用に関する、ユビキタスなポリシーであるしきい値ポリシーに焦点を当てている。
既存の方法は、潜在的に非力な安全チェックに依存し、安全な改善を見つける機会を制限する。
本手法は, 逆条件下では, 既定誤差レベルに対して, 基準値よりも悪いポリシーを採用する確率を制御できることが示される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:38:03 GMT)
Fundamental computational limits of weak learnability in high-dimensional multi-index models [30.5] マルチインデックスモデルは、ニューラルネットワークによる特徴学習を研究する上で有用なベンチマークである。
本稿では, 1次反復アルゴリズムを用いて低次元構造を弱めに復元するために必要な最小サンプル複雑性に着目した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:16:40 GMT)
T2VIndexer: A Generative Video Indexer for Efficient Text-Video Retrieval [30.5] 本稿では,ビデオ識別子を直接生成するシーケンス・ツー・シーケンス生成モデルであるT2VIndexerというモデルに基づくビデオインデクサを提案する。
T2VIndexerは高い精度を維持しながら検索時間を短縮することを目的としている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:40:45 GMT)
RAG-Optimized Tibetan Tourism LLMs: Enhancing Accuracy and Personalization [30.2] 既存の大規模言語モデル(LLM)は、パーソナライズされたレコメンデーション機能と、時に幻覚を引き起こす可能性のあるコンテンツの生成において、課題に直面している。
本研究では,検索強化世代(RAG)技術に基づくチベット観光LLMの最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:34:01 GMT)
Towards Aligned Data Removal via Twin Machine Unlearning [30.1] 現代のプライバシー規制は、機械学習の進化を刺激している。
本稿では,2つの未学習問題を元の未学習問題に対応付けて定義する,TMU(Twin Machine Unlearning)アプローチを提案する。
提案手法は未学習モデルと金モデルとのアライメントを著しく向上させる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:42:21 GMT)
MUSES: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration [29.7] ユーザクエリから3次元制御可能な画像生成のための汎用AIシステムであるMUSESを導入する。
このマルチモーダルエージェントパイプラインは、人間のプロのコラボレーションを模倣することにより、3D制御可能なオブジェクトによる画像の効果的かつ自動生成を容易にする。
T2I-CompBenchおよびT2I-3DisBenchにおけるMUSESの最先端性能を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:29:37 GMT)
UniFashion: A Unified Vision-Language Model for Multimodal Fashion Retrieval and Generation [29.5] ファッション分野におけるマルチモーダル生成と検索タスクの課題を同時に解決する統合フレームワークUniFashionを提案する。
我々のモデルは、様々なファッションタスクにおいて、過去のシングルタスク・オブ・ザ・アーティファクトモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:17:20 GMT)
Parameter-Efficient Fine-Tuning via Circular Convolution [29.4] Low-Rank Adaptation (LoRA)は、微調整された大規模な基盤モデルで人気を博している。
本稿では,Circular Convolution Adaptation (C$3$A)を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:44:11 GMT)
AdapTable: Test-Time Adaptation for Tabular Data via Shift-Aware Uncertainty Calibrator and Label Distribution Handler [29.4] 本稿では,ターゲットラベル分布を推定し,不確実性に基づいて初期確率を調整することによって,出力確率を変化させる新しいテスト時間適応手法であるAdapTableを紹介する。
自然分布シフトと合成汚損の両方の実験により,提案手法の適応効果が示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:01:17 GMT)
Constructions of Efficiently Implementable Boolean functions Possessing High Nonlinearity and Good Resistance to Algebraic Attacks [28.9] 低計算複雑性、非線形性および(高速)代数免疫の間の最もよく知られたトレードオフを提供する関数の2つの新しいクラスを記述する。
2つの新しいクラスから適切に選択された関数は、ストリーム暗号の非線形フィルタモデルで使用されるフィルタ関数を設計する問題に対する優れた解を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:46:50 GMT)
Vessel-Promoted OCT to OCTA Image Translation by Heuristic Contextual Constraints [28.7] 利用可能な3次元光コヒーレンス・トモグラフィー画像から3次元OCTA画像へ変換するTransProと呼ばれる新しい手法を提案する。
当社のTransProメソッドは,従来から見過ごされてきた2つの新しいアイデアが中心です。
2つのデータセットの実験結果から、TransProは最先端のアプローチよりも優れています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:25:51 GMT)
Large Language Models in Mental Health Care: a Scoping Review [28.6] メンタルヘルスにおける大規模言語モデル(LLM)の統合は、新たな分野である。
アプリケーションの結果を体系的にレビューし、臨床設定の利点と限界を明確にすることが必要である。
本総説は、精神医療におけるLSMの使用について、その効果、課題、将来的な応用の可能性について、総合的に概観することを目的としている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:55:37 GMT)
Exploring Scene Coherence for Semi-Supervised 3D Semantic Segmentation [28.5] 半教師付きセマンティックセグメンテーションは3次元シーン理解に不可欠である。
半教師付き3次元セマンティックセマンティックセグメンテーションのためのシーンコヒーレンス(CoScene)を提案する。
私たちのCoSceneは、構造化されていない、秩序のないポイントクラウドにインスパイアされた、簡単なポイント消去戦略を採用して、シーン内の一貫性を確保します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:03:03 GMT)
NYU CTF Dataset: A Scalable Open-Source Benchmark Dataset for Evaluating LLMs in Offensive Security [28.1] 大規模言語モデル(LLM)は、さまざまなドメインにデプロイされているが、Capture the Flag(CTF)の課題を解決する能力は、十分に評価されていない。
我々は、スケーラブルでオープンソースのベンチマークデータベースを作成することで、CTFの課題を解決する上で、LCMを評価する新しい手法を開発した。
このデータベースは、LLMテストと適応学習のためのメタデータを含み、人気のあるコンペからさまざまなCTF課題をコンパイルする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:34:07 GMT)
RePair: Automated Program Repair with Process-based Feedback [28.0] 本稿では,プロセスの監督とフィードバックによって,小規模言語モデル(LM)が優れたパフォーマンスを実現する方法を示す。
我々は、批評家として機能する報酬モデルを開発し、微調整されたLMの行動に対するフィードバックを提供する。
その結果, プロセスベースでは, より大きな結果に基づく生成方法よりも, クローズドソースの大規模LMの性能にほぼ匹敵する結果が得られた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:53:23 GMT)
EMO-LLaMA: Enhancing Facial Emotion Understanding with Instruction Tuning [27.8] EMO-LLaMAと呼ばれる新しいMLLMを提案する。これは、事前訓練された顔分析ネットワークからの顔の事前情報を組み込んで、人間の顔情報を強化する。
EMO-LLaMAは、静的および動的FERデータセット間でSOTA互換または競合的な結果を達成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:28:40 GMT)
A Survey of Embodied Learning for Object-Centric Robotic Manipulation [27.6] オブジェクト中心のロボット操作のための身体学習は、AIの急速に発展し、挑戦的な分野である。
データ駆動機械学習とは異なり、具体化学習は環境との物理的相互作用を通じてロボット学習に焦点を当てる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:32:09 GMT)
Macformer: Transformer with Random Maclaurin Feature Attention [27.5] ランダムなマクロリン特徴(RMF)を用いて様々なドット生成カーネルを近似するトランスフォーマーアーキテクチャであるMacformerを提案する。
我々は, RMFA と ppSBN の効率を示すための玩具実験を行い, 長距離アリーナ (LRA) ベンチマークを用いてMacformer の加速と精度を検証した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:27:36 GMT)
Learning Flock: Enhancing Sets of Particles for Multi~Sub-State Particle Filtering with Neural Augmentation [27.1] 我々は、Learning flock(LF)と呼ばれる粒子フィルタ(PF)のためのディープニューラルネットワーク拡張を導入する。
LFは、集合自体のすべての部分粒子間の関係に基づいて、フロックを造った粒子重み集合を補正することを学ぶ。
レーダマルチターゲットトラッキングにおけるLF拡張の性能,堅牢性,遅延性の改善を実験的に示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:28:12 GMT)
Using Part-based Representations for Explainable Deep Reinforcement Learning [27.0] 深層強化学習におけるアクターモデルに対する非負のトレーニング手法を提案する。
本稿では,よく知られたCartpoleベンチマークを用いて提案手法の有効性を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:21:59 GMT)
Reconstruct Spine CT from Biplanar X-Rays via Diffusion Learning [26.9] 術中CT画像は外科的指導に欠かせない資料であるが、必ずしも手軽に利用でき、実装も容易ではない。
本稿では,バイプレナーX線を用いた3次元CT再構成手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:58:43 GMT)
DeCE: Deceptive Cross-Entropy Loss Designed for Defending Backdoor Attacks [26.2] 本稿では,コード言語モデルのセキュリティを高めるために,汎用的で効果的な損失関数DeCE(Deceptive Cross-Entropy)を提案する。
さまざまなコード合成データセット,モデル,有毒比による実験は,DeCEの適用性と有効性を示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:13:57 GMT)
Slot State Space Models [26.2] 本稿では,情報分離の保存・促進を目的として,独立したメカニズムをSSMに組み込む新しいフレームワークであるSlotSSMを紹介する。
実験では,対象中心の映像理解,3次元視覚推論,映像予測タスクにおけるモデルの評価を行った。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:54:33 GMT)
Personality Alignment of Large Language Models [26.1] 大規模言語モデル(LLM)を整列する現在の手法は、一般的に一般的な人間の価値観や振る舞いを反映することを目的としている。
パーソナリティアライメントの概念を紹介する。
このアプローチは、個々のユーザや近縁なグループの特定の嗜好に合うように、LSMの反応と決定を調整します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:09:00 GMT)
SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance [26.1] Group Equivariant Convolution(GConv)は、モデルに視覚データに隠された対称性を探索させ、パフォーマンスを向上させる。
従来のGConv法は群空間の厳密な操作規則によって制限されており、対称性・ブレーキングや非剛体変換への適応が困難である。
本稿では,Relaxed Rotation-Equivariant Network(R2Net)をバックボーンとして提案し,その上に構築された2次元オブジェクト検出のためのSBDet(Symmetry-Breaking Object Detector)を開発した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:32:03 GMT)
LSVOS Challenge 3rd Place Report: SAM2 and Cutie based VOS [25.9] 我々は、これらの課題に対処するために、最先端(SOTA)モデルSAM2とCutieの長所を組み合わせる。
LSVOS チャレンジ VOS トラックの試験段階での J&F スコアは 0.7952 に達し, 総合3位となった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:39:38 GMT)
Distributional Properties of Subword Regularization [25.8] BPEとMaxMatchは2つの人気のあるサブワードトークン化スキームであり、ドロップアウト正規化のバリエーションがある。
これらの変種は、単語ごとのトークン化の小さなセットに大きく偏っていることを示す。
既存のトークン化の側面の代替として使用するトークン化を均一に行うアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:53:35 GMT)
Gender Bias Evaluation in Text-to-image Generation: A Survey [25.7] テキスト・ツー・イメージ・ジェネレーションにおけるジェンダーバイアス評価に関する最近の研究についてレビューする。
安定拡散やDALL-E 2といった最近の人気モデルの評価に焦点をあてる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:01:23 GMT)
ACE: A Cross-Platform Visual-Exoskeletons System for Low-Cost Dexterous Teleoperation [25.7] 多様なロボットプラットフォームにまたがる効率的な遠隔操作システムの構築は、これまで以上に重要になっている。
我々は、低コストなデキスタラス遠隔操作のためのクロスプラットフォームビジュアル・エクソスケルトンシステムであるACEを開発した。
従来のシステムと比較して、我々の単一のシステムは、高精度な遠隔操作を備えたヒューマノイドハンド、アームハンド、アームグリッパー、四重化グリッパーシステムに一般化することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:48:31 GMT)
AnyDesign: Versatile Area Fashion Editing via Mask-Free Diffusion [25.6] ファッション画像編集は、与えられた指示に基づいて人物の外観を変更することを目的としている。
現在の手法ではセグメンタやキーポイント抽出器のような補助的なツールが必要であり、柔軟性と統一されたフレームワークが欠如している。
本稿では,多目的領域におけるマスフリー編集を可能にする拡散法であるAnyDesignを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:04:32 GMT)
BIV-Priv-Seg: Locating Private Content in Images Taken by People With Visual Impairments [25.4] BIV-Priv-Segは、プライベートコンテンツを表示する視覚障害を持つ人々から生まれた最初のデータセットである。
16のプライベートオブジェクトカテゴリ用のセグメンテーションアノテーションを備えた1,028のイメージが含まれている。
我々は、データセット内のプライベートコンテンツを特定するために、最新のモデルの性能を評価する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:36:38 GMT)
TabSketchFM: Sketch-based Tabular Representation Learning for Data Discovery over Data Lakes [25.2] データレイク上のデータ発見のためのニューラルネットワークタブモデルであるTabFMを提案する。
我々は、結合可能、結合可能、およびサブセットテーブルペアを特定するための事前訓練されたモデルを微調整する。
その結果,最先端技術と比較して,検索におけるF1スコアの大幅な改善が示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:58:00 GMT)
First Activations Matter: Training-Free Methods for Dynamic Activation in Large Language Models [25.2] 本稿では,シークエンス情報を利用したトレーニングフリーなThresholdベースの動的アクティベーション手法を提案する。
本研究は,歴史関連アクティベーションの不確かさと意味不明アクティベーション慣性という2つの重要な特徴を理論的に分析する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:38:51 GMT)
EmoFace: Emotion-Content Disentangled Speech-Driven 3D Talking Face with Mesh Attention [25.1] 感情と表情の相関を効果的に捉えるために,EmoFaceと呼ばれる新しいモデルを提案する。
EmoFaceでは、時間と空間におけるメッシュ間の潜在的な機能依存関係の学習を支援する、新しいMesh Attentionメカニズムを採用している。
また,教師の強制力と3次元顔アニメーションタスクのスケジュールサンプリングを組み合わせた効果的な自己成長学習手法を,私たちの知る限り初めて採用した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:51:12 GMT)
AntifakePrompt: Prompt-Tuned Vision-Language Models are Fake Image Detectors [24.8] 深層生成モデルは、偽情報や著作権侵害に対する懸念を高めながら、驚くほど偽のイメージを作成することができる。
実画像と偽画像とを区別するためにディープフェイク検出技術が開発された。
本稿では,視覚言語モデルとアクシデントチューニング技術を用いて,Antifake Promptと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:42:02 GMT)
Graph Classification via Reference Distribution Learning: Theory and Practice [24.7] グラフ参照分布学習(GRDL, Graph Reference Distribution Learning)は, グラフの効率的な分類法である。
GRDLはGNN層によって与えられるグラフの潜在ノード埋め込みを離散分布として扱い、グローバルプールなしで直接分類できる。
中規模および大規模グラフデータセットの実験は、GRDLが最先端よりも優れていることを示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:42:22 GMT)
Narrowing the Focus: Learned Optimizers for Pretrained Models [24.7] 本稿では,一連の基本作業タスクによって提供される更新方向の階層固有の線形結合を学習する手法を提案する。
画像上で評価すると、これはAdamのような従来の既成の方法と既存の一般的な学習の両方で著しく優れています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:35:06 GMT)
SHIELD: Evaluation and Defense Strategies for Copyright Compliance in LLM Text Generation [24.6] 大規模言語モデル(LLM)は機械学習に変化をもたらしたが、重大な法的懸念を引き起こした。
LLMは著作権を侵害したり、著作権のないテキストを過剰に制限したりすることができる。
本稿では,著作権テキストの発生を防止するために,軽量でリアルタイムな防衛手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:57:05 GMT)
What are the limits of cross-lingual dense passage retrieval for low-resource languages? [23.9] 極低リソース言語に対するマルチ言語パスレトリバー(mDPR)の機能解析を行う。
mDPRは26言語にわたるマルチリンガルなオープンQAベンチマークで成功し、そのうち9つはトレーニング中に見つからなかった。
我々はmDPRが不十分な2つの非常に低リソース言語(AmharicとKhmer)に焦点を当てている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:51:46 GMT)
Source-Free Domain Adaptation Guided by Vision and Vision-Language Pre-Training [23.6] ソースフリードメイン適応(SFDA)は、完全にラベル付けされたソースドメインでトレーニングされたソースモデルを、関連するがラベル付けされていないターゲットドメインに適応させることを目的としている。
従来のSFDAパイプラインでは、ソースモデルを初期化するために、大量のデータ(イメージネットなど)を事前訓練した特徴抽出器が使用される。
トレーニング済みネットワークを対象適応プロセスに組み込むための統合フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:09:11 GMT)
Fight Back Against Jailbreaking via Prompt Adversarial Tuning [23.6] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃の影響を受けやすい。
LLMが有害な情報を生み出すのを防ぐために、いくつかの主要な防衛戦略が提案されている。
本稿では,ユーザプロンプトに付随するプロンプト制御をガードプレフィックスとしてトレーニングする,PAT(Prompt Adversarial Tuning)というアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:01:35 GMT)
PhD: A Prompted Visual Hallucination Evaluation Dataset [23.5] 視覚幻覚評価のための大規模ベンチマークであるPhDを紹介する。
低レベル(対象/属性認識)から中レベル(知覚/位置認識とカウント)までの5つの視覚的認識タスクが検討されている。
合計で102k以上のVQA三重項を持つPhDは、MLLMの性能が様々なモードでかなり変動していることを明らかにする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:21:08 GMT)
Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.4] SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。
SSLはデータから直接監視信号を構築することを目的としている。
本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:57:30 GMT)
CluMo: Cluster-based Modality Fusion Prompt for Continual Learning in Visual Question Answering [23.4] 大規模視覚言語モデル(VLM)は、様々なアプリケーション領域で大幅な性能向上を示している。
タスク上でVLMを微調整すると、その一般化能力と新しいタスクの学習能力が低下する。
本稿では,VLM の新しいプロンプトベースCL法,すなわち $textbfClu$ster-based $textbfMo$dality Fusion Prompt (textbfCluMo)を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:07:49 GMT)
CoPRA: Bridging Cross-domain Pretrained Sequence Models with Complex Structures for Protein-RNA Binding Affinity Prediction [23.1] 我々は,タンパク質-RNA結合親和性データセットPRA310を構築し,性能評価を行った。
我々は,(1)タンパク質-RNA結合親和性,(2)変異による結合親和性の変化を正確に予測できること,(3)データのスケーリングとモデルサイズによるメリットを広く分析し,検証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:48:22 GMT)
Carbon Connect: An Ecosystem for Sustainable Computing [23.0] Carbon Connectは、持続可能なコンピュータシステムの設計と管理戦略を作成するための協調的な研究スラストを構想している。
我々は、計算技術における炭素会計の正確なモデルを必要とします。
新たなハードウェア設計と管理戦略は、経済政策と規制の状況を認識する必要がある。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:15:57 GMT)
Towards Analyzing and Mitigating Sycophancy in Large Vision-Language Models [22.7] LVLM(Large Vision-Language Models)は、視覚言語理解において重要な能力を示す。
シコファンシーは、先導的または偽りのプロンプトの影響を受けず、バイアスのあるアウトプットと幻覚をもたらす。
そこで本研究では,テキストのコントラスト復号化手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:03:21 GMT)
ProteinGPT: Multimodal LLM for Protein Property Prediction and Structure Understanding [22.6] 本稿では,最先端のマルチモーダルタンパク質チャットシステムであるProteinGPTを紹介する。
タンパク質GPTは、タンパク質配列と構造エンコーダを線形射影層とシームレスに統合し、正確な表現適応を行う。
注釈付き132,092タンパク質の大規模データセットをトレーニングし、GPT-4oを用いて命令調整プロセスを最適化する。
実験により、タンパク質GPTはタンパク質とその対応する質問に対する有望な応答を生成できることが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:16:22 GMT)
Calibration and Correctness of Language Models for Code [22.6] コード生成モデルのキャリブレーションを評価するためのフレームワークを開発する。
プラッツスケーリングなどの標準的な手法を用いてキャリブレーションを改善する方法を示す。
私たちのコントリビューションは、言語モデルによって生成された現在のコードの使用において、より良いキャリブレーションの意思決定につながるでしょう。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:58:38 GMT)
OV-DQUO: Open-Vocabulary DETR with Denoising Text Query Training and Open-World Unknown Objects Supervision [22.5] オープンボキャブラリ検出は、検出器が訓練された基本カテゴリを超えて、新しいカテゴリからオブジェクトを検出することを目的としている。
我々はtextbfQuery トレーニングとオープンワールド textbfObjects の監督を行う textbf Open-textbfVocabulary DETR である OV-DQUO を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:40:34 GMT)
Timeline and Boundary Guided Diffusion Network for Video Shadow Detection [22.2] ビデオシャドウ検出(VSD)は、フレームシーケンスでシャドウマスクを検出することを目的としている。
そこで本研究では,VSD のための Timeline and boundary Guided Diffusion (TBGDiff) ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:16:21 GMT)
S$^3$-MonoDETR: Supervised Shape&Scale-perceptive Deformable Transformer for Monocular 3D Object Detection [22.0] 本稿では,モノクロ3次元物体検出のためのSupervised Shape&Scale-perceptive Deformable Attention' (S$3$-DA) モジュールを提案する。
これにより、S$3$-DAは、任意のカテゴリに属するクエリポイントに対する受容的フィールドを効果的に推定し、堅牢なクエリ機能を生成することができる。
KITTIとOpenデータセットの実験では、S$3$-DAが検出精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:28:39 GMT)
Semantic Skill Grounding for Embodied Instruction-Following in Cross-Domain Environments [21.8] EIF(Embodied instruction-following)では、タスクプランナとしての事前訓練言語モデル(LM)が重要な分岐として現れる。
セマンティックスキルの階層的性質を活用するセマンティックスキル基盤フレームワークを提案する。
VirtualHomeベンチマークで行った実験では,300のドメイン横断EIFシナリオにおけるSemGroの有効性が示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:46:36 GMT)
Confidential Computing on Heterogeneous Systems: Survey and Implications [21.7] 近年、情報化と急速なデータ爆発により、高性能な異種システムの需要が高まっている。
CPUとGPUの組み合わせは、その汎用性から特に人気がある。
プライバシ保護技術の進歩、特にハードウェアベースのTEE(Trusted Execution Environments)は、GPUアプリケーションに対して効果的な保護を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:14:45 GMT)
Competence-Based Analysis of Language Models [21.4] CALM (Competence-based Analysis of Language Models) は、特定のタスクの文脈におけるLLM能力を調べるために設計された。
我々は,勾配に基づく対向攻撃を用いた因果探究介入を行うための新しい手法を開発した。
これらの介入を用いてCALMのケーススタディを行い、様々な語彙推論タスクにおけるLCM能力の分析と比較を行う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:27:47 GMT)
Introducing the NewsPaLM MBR and QE Dataset: LLM-Generated High-Quality Parallel Data Outperforms Traditional Web-Crawled Data [21.4] ニューラルマシン翻訳(NMT)の最近の研究により、高品質なマシン生成データに対するトレーニングは、人為的なデータに対するトレーニングよりも優れていることが示されている。
この研究は、LLM生成、MBRデコード、QE参照のデータセットを初めてリリースし、文レベルと多文の両方の例を示す。
我々の(機械生成)データセットのスクラッチからのトレーニングは、(Webcrawled) WMT'23トレーニングデータセットのトレーニングよりも優れています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:03:06 GMT)
In situ mixer calibration for superconducting quantum circuits [21.2] 超伝導量子ビットを用いたin situキャリブレーション法と結果中心ミキサーキャリブレーション法を導入する。
本手法の有効性を,単一量子ゲートの忠実度と量子コヒーレンス時間のベンチマークにより実験的に検証した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:49:39 GMT)
DH-Bench: Probing Depth and Height Perception of Large Visual-Language Models [21.2] 視覚言語モデル(VLM)の幾何学的理解に焦点を当てる。
我々は、Synthetic 2D、Synthetic 3D、Real-Worldのシナリオを含むデータセットを用いて、17の最先端VLMをベンチマークする。
我々の重要な洞察は、VLMの深さと高さの推論能力の欠点と、これらのモデルに存在する固有のバイアスを詳細に分析することである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:16:18 GMT)
Automating Thought of Search: A Journey Towards Soundness and Completeness [20.9] 大型言語モデル (LLMs) の定番の1つとして計画が残っている。
ToS(Thought of Search)は、計画上の問題を解決するループから人間を完全に取り除きます。
評価されたすべての領域の様々な大きさのLLMを用いて、最小限のフィードバックで100%の精度を達成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:19:52 GMT)
KAN4TSF: Are KAN and KAN-based models Effective for Time Series Forecasting? [20.5] 時系列予測研究にコルモゴロフ・アルノルドネットワーク(KAN)を導入する。
本稿では,時系列予測のためのKAモデルであるReversible Mixture of Kan Expert (RMoK)モデルを提案する。
可視化によって時間的特徴量とデータの周期性の関係を見いだす。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:21:52 GMT)
Pano2Room: Novel View Synthesis from a Single Indoor Panorama [20.3] Pano2Roomは、1枚のパノラマ画像から高品質な3D屋内シーンを自動的に再構築するように設計されている。
鍵となるアイデアは、最初に入力パノラマから予備メッシュを構築し、パノラマRGBDインペイントを使用して反復的にこのメッシュを洗練することである。
精巧なメッシュは3次元ガウス散乱場に変換され、収集された擬似ノベルビューで訓練される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:19:12 GMT)
Efficient Exploration and Discriminative World Model Learning with an Object-Centric Abstraction [19.6] エージェントにオブジェクト中心のマッピング(アイテムとその属性のセットを記述する)を与えることで、より効率的な学習が可能になるかどうかを検討する。
この問題は、ピクセルへの高レベルの状態抽象化でアイテムをモデル化することで、階層的に最もよく解決されている。
我々はこの手法を用いて、差別的な世界モデルを学ぶ完全モデルベースのアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:59:31 GMT)
Region Guided Attention Network for Retinal Vessel Segmentation [19.6] 本稿では,領域誘導型アテンションを用いたエンコーダデコーダ機構に基づく軽量網膜血管セグメンテーションネットワークを提案する。
Dice Losは偽陽性と偽陰性を等しく解析し、モデルがより正確なセグメンテーションを生成するように促す。
ベンチマークデータセットの実験では、最先端の手法と比較して、パフォーマンス(0.8285, 0.8098, 0.9677, 0.8166リコール、精度、精度、F1スコア)が向上した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:40:32 GMT)
Operator SVD with Neural Networks via Nested Low-Rank Approximation [19.6] 本稿では, トラッピング特異値分解の低ランク近似に基づく新しい最適化フレームワークを提案する。
最上位の$L$特異値と特異関数を正しい順序で学習するためのエンフェンシングと呼ばれる新しい手法。
本稿では,計算物理学と機械学習のユースケースに対する提案手法の有効性を実証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:09:53 GMT)
LARR: Large Language Model Aided Real-time Scene Recommendation with Semantic Understanding [19.5] リアルタイムScene Recommendation(LARR)を用いた大規模言語モデル
本稿では,Large Language Model Aided Real-time Scene Recommendation(LARR)を紹介する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:56:26 GMT)
Training With "Paraphrasing the Original Text" Improves Long-Context Performance [19.5] 大きな言語モデル(LLM)は進化を続けており、長いコンテキスト入力を扱うように設計されている。
本研究では,LLMの学習能力を高めることを目的とした長文タスクのための学習データ設計手法を提案する。
LlamaおよびQwenのモデルを用いたLongBenchおよびNaturalQuestions Multi-document-QAデータセットの実験により,平均スコアが最大8.48%,4.48%向上した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:31:02 GMT)
Towards Evaluating Large Language Models on Sarcasm Understanding [19.4] 異なるプロンプト手法を用いて,広く使用されている6つのベンチマークデータセットの評価を行った。
GPT-4 は様々なプロンプト法で他の LLM よりも一貫して著しく優れている。
ゼロショットIOプロンプト法は、ゼロショットIOと少数ショットCoTという2つの方法より優れている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:59:51 GMT)
SynPlay: Importing Real-world Diversity for a Synthetic Human Dataset [19.3] SynPlay(シンセティック・プレイグラウンド)は,人間の外見の多様性を現実世界にもたらすことを目的とした,新しい人工人間データセットである。
これまでの作品では見られなかった多様性のレベルを達成するために、現実的な人間の動きとポーズという2つの要素に焦点を当てる。
モデルトレーニングにSynPlayを使用することで,人間の検出とセグメンテーションのための既存の合成データセットよりも精度が向上することを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:58:49 GMT)
Quantum highway: Observation of minimal and maximal speed limits for few and many-body states [19.2] エネルギー時間不確実性原理にインスパイアされた境界は、量子状態が変化する最大速度で証明されている。
既知の量子速度限界をテストすることができ、単一のハミルトンパラメータを変更することで、力学上の異なる境界の交叉を観測できることが示される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:07 GMT)
MeTTA: Single-View to 3D Textured Mesh Reconstruction with Test-Time Adaptation [19.2] 本稿では, 生成前のテスト時間適応であるMeTTAを提案する。
3次元形状,外観,ポーズの連成最適化を設計し,OoDのケースを単一のビューイメージで処理する。
MeTTAは、既存の学習ベースの3D再構成モデルの障害ケースにおけるOoDシナリオを効果的に扱う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:35:16 GMT)
BAdd: Bias Mitigation through Bias Addition [19.1] コンピュータビジョン(CV)データセットは、ディープラーニングモデルによって永続されるバイアスを示すことが多い。
本稿では,バイアスを導入した属性に不変な公平表現を学習する手法であるBAddを紹介する。
BAddは7つのベンチマークで評価され、競合性能を示し、単一のベンチマークとマルチ属性ベンチマークの両方で最先端の手法を上回っている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:50:31 GMT)
GNN-SKAN: Harnessing the Power of SwallowKAN to Advance Molecular Representation Learning with GNNs [19.0] 我々は、KAN(Kolmogorov-Arnold Networks)を統合したGNNの新しいクラスを導入する。
Kanは、その堅牢なデータ適合能力と、小規模AI + Scienceタスクの高精度で知られている。
本稿では,新たなクラスであるGNN-SKANと,その拡張型であるGNN-SKAN+を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:37:31 GMT)
Predicting the Next Action by Modeling the Abstract Goal [18.9] 本研究では,将来の予測の不確実性を低減するために,目標情報を活用する行動予測モデルを提案する。
我々は,行動予測のための視覚的特徴の観察シーケンスに基づいて,抽象目標という新しい概念を導出する。
提案手法は,Epic-Kitchens55 (EK55), EK100, EGTEA Gaze+データセットについて,非常に困難な結果を得た。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:51:36 GMT)
One Law, Many Languages: Benchmarking Multilingual Legal Reasoning for Judicial Support [18.8] この研究は、法域に対する新しいNLPベンチマークを導入している。
エンフロング文書(最大50Kトークン)の処理、エンフドメイン固有の知識(法的テキストに具体化されている)、エンフマルチリンガル理解(5つの言語をカバーしている)の5つの重要な側面においてLCMに挑戦する。
我々のベンチマークにはスイスの法体系からの多様なデータセットが含まれており、基礎となる非英語、本質的には多言語法体系を包括的に研究することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:36:44 GMT)
CHOTA: A Higher Order Accuracy Metric for Cell Tracking [18.8] 現在の指標は、局所的な正当性と、世界的一貫性の弱さを好んでいる。
本稿では,細胞追跡のすべての側面を統一するCHOTAメトリクスを提案する。
CHOTAはすべてのトラッキングエラーに敏感であり,細胞の全系統を再構築する手法が生物学的に関連していることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:27:36 GMT)
Understanding is Compression [18.7] 6G通信速度要件は、データ圧縮の革新的な新しいアイデアに対して、オープンな疑問を提起する。
大規模な言語モデル(LLM)は、これまで以上にデータをよりよく理解しています。
従来の圧縮アルゴリズムを全て破壊するLMCompressを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:45:36 GMT)
The Vizier Gaussian Process Bandit Algorithm [18.7] Google Vizierは、数百万の最適化を実行し、Googleの多くのリサーチとプロダクションシステムを加速した。
本稿では,Open Source Vizierが提供するデフォルトアルゴリズムの実装の詳細と設計選択について論じる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:06:02 GMT)
FRAP: Faithful and Realistic Text-to-Image Generation with Adaptive Prompt Weighting [18.7] FRAPは、画像毎のプロンプト重み付けを適応的に調整し、生成した画像の即時アライメントと認証を改善するための、シンプルで効果的なアプローチである。
FRAPは、複雑なデータセットからのプロンプトに対して、プロンプト画像のアライメントが著しく高い画像を生成する。
また, FRAPとLPMの即時書き直しを併用して, 劣化した即時画像のアライメントを復元する方法について検討した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:30:35 GMT)
Scalable Knowledge Refactoring using Constrained Optimisation [18.7] 提案手法は,従来の最先端手法よりも高速かつ圧縮性が高く,時には60%の高速化が可能であることを示す。
複数のドメインに対する実験結果から,従来の最先端手法よりも高速かつ圧縮性の高いプログラムを,場合によっては60%高速化できることが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:12:42 GMT)
Polyp SAM 2: Advancing Zero shot Polyp Segmentation in Colorectal Cancer Detection [18.6] ポリープ分画は大腸癌の早期発見と診断において重要な役割を担っている。
最近、Meta AI Researchは、いくつかのセグメンテーションタスクで有望なパフォーマンスを示す一般的なセグメンテーションモデル2(SAM2)をリリースした。
そこで本研究では,各種刺激条件下でのセグメンテーションポリプにおけるSAM2の性能評価を行った。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:26:28 GMT)
SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action Recognition [18.5] 従来のデータ駆動研究には大量のビデオサンプルが継続的に必要である。
本稿では,Stemp-Oral frAme tuwenle (SOAP) と呼ばれるアクション認識のための新しいプラグイン・アンド・プレイアーキテクチャを提案する。
SOAP-Netは、SthSthV2、Kineetics、UCF101、SOAP51といった有名なベンチマークで、最先端のパフォーマンスを新たに達成します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:07:08 GMT)
Graph-based Time Series Clustering for End-to-End Hierarchical Forecasting [18.1] 時系列間の関係は、効果的な予測モデル学習における帰納バイアスとして利用することができる。
本稿では,関係性および階層的帰納バイアスを統一するグラフベースの手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:39:10 GMT)
Exploring Large Language Models for Feature Selection: A Data-centric Perspective [18.0] 大規模言語モデル(LLM)は様々なドメインに影響を与え、例外的な少数ショットとゼロショットの学習機能を活用している。
この研究は、データ中心の観点からLLMに基づく特徴選択手法を探求し、理解することを目的としている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:35:19 GMT)
CrossFi: A Cross Domain Wi-Fi Sensing Framework Based on Siamese Network [17.3] CrossFiはシアムネットワークベースのアプローチで、ドメイン内シナリオとクロスドメインシナリオの両方に優れています。
私たちは、クラスごとにテンプレートを生成することができる余分なWeight-Netを開発し、CrossFiがさまざまなシナリオで機能できるようにします。
ジェスチャー認識タスクでは、ドメイン内シナリオで98.17%、ワンショットクロスドメインシナリオで91.72%、ゼロショットクロスドメインシナリオで64.81%、ワンショット新しいクラスシナリオで84.75%の精度を達成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:57:15 GMT)
ProtoArgNet: Interpretable Image Classification with Super-Prototypes and Argumentation [Technical Report] [17.2] ProtoArgNetは、原型的部分学習の精神における画像分類のための、解釈可能な新しいディープニューラルネットワークである。
ProtoArgNetは、prototypeal-partsを統一されたクラス表現に組み合わせたスーパープロトタイプを使用する。
我々は、ProtoArgNetが最先端のプロトタイプ・パートラーニングアプローチより優れているいくつかのデータセットを実証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:29:08 GMT)
Freehand Sketch Generation from Mechanical Components [16.8] MSFormerは、機械部品用に調整されたヒューマノイドフリーハンドスケッチを初めて製作した。
第1段階では、機械部品からマルチビューの輪郭スケッチを得るためにOpen CASCADE技術を採用している。
第2段階では、輪郭スケッチをトランスフォーマーベースのジェネレータによるフリーハンドスケッチに変換する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:28:18 GMT)
GaussianOcc: Fully Self-supervised and Efficient 3D Occupancy Estimation with Gaussian Splatting [16.5] 本研究では, ガウススプラッティングとガウススプラッティングの2つの利用法を提案する。
その結果,GussianOcc法では,計算コストの低い競合性能において,完全に自己監督された3次元占有率推定が可能となった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:06:30 GMT)
DocTabQA: Answering Questions from Long Documents Using Tables [16.3] 本稿では,DocTabQAと呼ばれる質問応答(QA)の新たな問題設定について検討する。
この設定内では、長いドキュメントが与えられたら、答を文書の内容から直接導かれる構造化テーブルに整理することで質問に答えることが目的である。
我々はQTabAデータセットを導入し,300の財務文書と1.5kの質問表を手作業でアノテートした。
本稿では,DocTabTalkと呼ばれる2段階のフレームワークについて述べる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:01:12 GMT)
MCDubber: Multimodal Context-Aware Expressive Video Dubbing [16.3] 我々は,テキストbfMCDubberと呼ばれるマルチモーダルコンテキスト対応ビデオダビングモデルを提案し,モデリング対象を単一の文からコンテキスト情報付きより長いシーケンスに変換する。
Chemベンチマークデータセットの実験では、MCDubberは全ての高度なベースラインと比較してダビング表現性を著しく改善することが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:59:42 GMT)
Positional Prompt Tuning for Efficient 3D Representation Learning [16.3] ポイントクラウド分析は大きな発展を遂げており、ポイントクラウドの分類やセグメンテーションなど、複数のダウンストリームタスクでうまく機能している。
トランスフォーマーアーキテクチャにおける位置符号化構造の単純さを意識して、高次元部分としての位置符号化と、マルチスケール情報を提供するパッチエンコーダを重要視する。
ScanObjectNN OBJ_BGデータセットの95.01%の精度など、いくつかの主流データセットにおいて、PEFTタスクの提案した手法は、トレーニング用のパラメータの1.05%しか持たない。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:18:34 GMT)
Reflex-Based Open-Vocabulary Navigation without Prior Knowledge Using Omnidirectional Camera and Multiple Vision-Language Models [16.2] 地図構築や学習を一切必要としない最も単純な手法を考察し、事前知識のないロボットのオープン語彙ナビゲーションを実行する。
ロボットに全方向カメラと事前学習された視覚言語モデルを適用した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:18:58 GMT)
LAHAJA: A Robust Multi-accent Benchmark for Evaluating Hindi ASR Systems [16.1] LAHAJAというベンチマークを作成し、様々なトピックやユースケースに関する読み書き音声を含む。
LAHAJAの既存のオープンソースおよび商用モデルを評価し,その性能が劣っていることを確認した。
異なるデータセットを使用してモデルをトレーニングし、優れた話者多様性を持つ多言語データに基づいてトレーニングしたモデルが、既存のモデルよりもかなりのマージンで優れていることを確認する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:51:00 GMT)
A Study of Backdoors in Instruction Fine-tuned Language Models [16.1] バックドアのデータ中毒は、そのような攻撃の回避の性質のために深刻なセキュリティ上の懸念である。
このようなバックドア攻撃は、反応の感情を変えたり、検閲に違反したり、過剰に拒否したり(合法的なクエリの検閲を呼び起こしたり)、偽のコンテンツを注入したり、ナンセンスな反応(幻覚)を引き起こす。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:07:49 GMT)
Applying and Evaluating Large Language Models in Mental Health Care: A Scoping Review of Human-Assessed Generative Tasks [16.1] 大規模言語モデル(LLM)はメンタルヘルスのための有望なツールとして登場し、人間のような反応を生成する能力を通じてスケーラブルなサポートを提供する。
しかし, 臨床環境におけるこれらのモデルの有効性は明らかになっていない。
このスコーピングレビューは、これらのモデルが現実世界のシナリオで人間の参加者とテストされた研究に焦点を当てている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:21:59 GMT)
Estimating Peer Direct and Indirect Effects in Observational Network Data [16.0] 本稿では、ピア直接効果とピア間接効果の両方を考慮し、個人自身の治療の効果を考慮に入れた一般的な設定を提案する。
注意機構を用いて、異なる隣人の影響を識別し、グラフニューラルネットワークによる高次隣人効果を探索する。
理論的には,ネットワークシステムにおける介入戦略を改善する可能性があり,ソーシャルネットワークや疫学などの分野にも応用できる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:02:05 GMT)
Improving Generalization and Convergence by Enhancing Implicit Regularization [15.8] Inlicit Regularization Enhancement (IRE)フレームワークは、ディープラーニングにおけるフラットソリューションの発見を加速する。
IREは、平坦な方向と鋭い方向のダイナミクスを分離し、平坦な方向に沿って鋭さを減少させる。
計算オーバーロードを伴わずに,IREをエムジェネリックベースに事実上組み込むことができることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:46:50 GMT)
Improving Speech Recognition Error Prediction for Modern and Off-the-shelf Speech Recognizers [15.7] 我々は、音声認識誤りを2つの方法で予測するために、事前の音声混乱に基づくモデルを拡張した。
後部音響モデルの振舞いをより良くシミュレートするサンプリングベースパラダイムを提案する。
まず,Switchboard ASRシステムのエラーを未知のデータ上で予測し,次に,同じ予測器を用いて,無関係なクラウドベースのASRシステムの挙動を推定する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:48:03 GMT)
Unraveling the emergence of quantum state designs in systems with symmetry [15.7] 対称性を示すランダムなジェネレータ状態からの状態設計の出現について検討する。
初期の時間進化におけるトレース距離の収束速度は,対称性が破られた場合と比較して速い。
我々は, 閉かつオープンな量子多体系の熱化と平衡のさらなる探索の道を開くことを期待する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:17:22 GMT)
Plug-in estimation of Schrödinger bridges [15.7] 本稿では,2つの確率分布間のSchr"odingerブリッジを推定する手法を提案する。
EmphSinkhorn Bridge(英語版)と呼ばれる我々の提案は、目標測度の内在次元に依存する収束率で、確実にSchr"odinger Bridgeを推定することを示します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:07:25 GMT)
Uncovering and Mitigating the Impact of Frozen Package Versions for Fixed-Release Linux [15.5] ミラーの進化に伴う固定リリースLinuxのエコシステムギャップについて検討する。
そこで本研究では,Debianのネイティブミラーをベースとした,依存環境の分離を実現する新しいパッケージ管理手法を提案する。
我々は、現在のツールの不十分さを効果的に改善できる、ccenvという名の作業プロトタイプを提示する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:01:46 GMT)
Do We Really Need to Drop Items with Missing Modalities in Multimodal Recommendation? [15.4] 我々は、(いくつかの)モダリティの欠如は、実際、マルチモーダルレコメンデーションにおいて広く拡散された現象であることを示した。
本稿では,機械学習における従来の計算手法を活用することで,欠落したマルチモーダル機能を推奨するパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:39:47 GMT)
Topological Representational Similarity Analysis in Brains and Beyond [15.4] この論文では、神経表現の幾何学的および位相的特性を組み合わせた新しいフレームワークであるトポロジカルRSA(tRSA)を紹介する。
tRSAは非線型単調変換を表現上の相似性に適用し、中間スケールの幾何学を維持しながら局所位相を強調する。
結果として生じる地形行列は、ノイズや個々の慣用性に頑健なモデル比較を可能にする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:02:00 GMT)
FairBalance: How to Achieve Equalized Odds With Data Pre-processing [15.4] 本研究は、機械学習ソフトウェアにおける等化オッズフェアネスを達成するための、単純で効果的な前処理アプローチを提供することにより、ソフトウェア工学社会の利益を目指している。
学習データに計算重みを割り当てることで,各階層群のクラス分布のバランスをとる前処理アルゴリズムであるFairBalanceを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:29:37 GMT)
SAM-REF: Rethinking Image-Prompt Synergy for Refinement in Segment Anything [14.9] 画像とプロンプトを完全に統合し,グローバルかつローカルにプロンプトする2段階改良フレームワークを提案する。
第一段階のGlobalDiff Refinerは、画像全体とプロンプトを組み合わせた軽量のアーリーフュージョンネットワークだ。
第2ステージのPatchDiff Refinerは、マスクに従ってオブジェクトの詳細ウィンドウを特定してプロンプトし、オブジェクトのローカル詳細を洗練します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:18:35 GMT)
EE-MLLM: A Data-Efficient and Compute-Efficient Multimodal Large Language Model [14.8] データ効率・計算効率・マルチモーダル大言語モデル(EE-MLLM)について紹介する。
EE-MLLMは、追加モジュールや学習可能なパラメータを導入することなく、データと計算効率の両方を達成する。
実験により,EE-MLLMのベンチマークにおける有効性を示した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:36:37 GMT)
EEG-Defender: Defending against Jailbreak through Early Exit Generation of Large Language Models [14.6] 大規模言語モデル(LLM)は、様々なアプリケーションで注目を集めている。
悪意のある目的のためにこれらのモデルを悪用しようとするユーザもいるため、懸念が高まっている。
我々は,LEMに対するEEG-Defenderと呼ばれる,シンプルながら重要な防御手法を導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:25:31 GMT)
DTN: Deep Multiple Task-specific Feature Interactions Network for Multi-Task Recommendation [14.5] 本稿では,新しいモデル構造を持つDeep Multiple Task-specific Feature Interactions Network (DTN)を提案する。
DTNは、MTLネットワークにおいて複数のタスク固有特徴相互作用法とタスク依存ネットワークを導入し、タスク固有特徴相互作用表現を学習できるようにする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:39:21 GMT)
MambaCSR: Dual-Interleaved Scanning for Compressed Image Super-Resolution With SSMs [14.4] MambaCSRは、圧縮画像超解像(CSR)タスクのためのMambaをベースにしたフレームワークである。
本稿では,2つの走査戦略からなるCSRのための効率的なデュアルインターリーブ走査パラダイム(DIS)を提案する。
複数のベンチマークの結果から,圧縮画像超解像タスクにおけるMambaCSRの優れた性能が示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:30:45 GMT)
Video Diffusion Models are Strong Video Inpainter [14.4] 本稿では,FFF-VDI (First Frame Filling Video Diffusion Inpainting Model) を提案する。
我々は、将来のフレームのノイズ潜時情報を伝播して、第1フレームのノイズ潜時符号のマスク領域を埋める。
次に,事前学習した画像間拡散モデルを微調整し,インペイント映像を生成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:01:00 GMT)
Universal Time-Series Representation Learning: A Survey [14.3] 時系列データは、現実世界のシステムやサービスのあらゆる部分に存在する。
ディープラーニングは、時系列データから隠れたパターンや特徴を抽出する際、顕著な性能を示した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:25:00 GMT)
A Novel State Space Model with Local Enhancement and State Sharing for Image Fusion [14.3] 画像融合タスクでは、異なるソースからのイメージは異なる特徴を持つ。
状態空間モデルとしてのMambaは自然言語処理の分野で登場している。
これらの課題に感化されて、画像融合タスク用に設計されたMambaネットワークをカスタマイズし、改善する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:07:02 GMT)
Hamilton-Jacobi Reachability in Reinforcement Learning: A Survey [14.1] ハミルトン・ヤコビ・リーチブル・セットは、安全を確認し、強化学習に基づく制御ポリシーの訓練を監督するための有効なツールとなっている。
本稿では,強化学習におけるHJ到達可能性評価の分野における最近の展開を概観する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:45:41 GMT)
A Novel Evaluation Perspective on GNNs-based Recommender Systems through the Topology of the User-Item Graph [14.1] グラフニューラルネットワーク(GNN)ベースのレコメンデーションシステムは、レコメンデーションにおいて大きな成功を収めている。
本稿では,GNNをベースとしたレコメンデーションに対する新たな評価視点を提案し,グラフトポロジがレコメンデーション性能に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:34:53 GMT)
LBC: Language-Based-Classifier for Out-Of-Variable Generalization [14.0] 大規模言語モデル(LLM)は、応答生成のような自然言語処理タスクにおいて大きな成功を収めている。
LLMの事前学習された知識により、追加のトレーニングなしでテストに現れる新しい変数を解釈できることがわかった。
本稿では,LBC(Language-Based-Classifier)を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:51:33 GMT)
PackMamba: Efficient Processing of Variable-Length Sequences in Mamba training [13.9] Mambaは、生成AIの分野で画期的なアーキテクチャとして登場し、長いシーケンスを扱うのに顕著な習熟度を示している。
Mambaの既存のトレーニングフレームワークは、可変長シーケンス入力による非効率性を示す。
可変長シーケンスを効率的に処理する高スループットなMambaであるPackMambaを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:08:00 GMT)
ClaimVer: Explainable Claim-Level Verification and Evidence Attribution of Text Through Knowledge Graphs [13.6] ClaimVerは、ユーザの情報と検証のニーズを満たすように設計された、人間中心のフレームワークである。
各クレームをハイライトし、信頼された知識グラフに対して検証し、クレームの予測に対して簡潔で明確な説明を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:45:15 GMT)
Optimizing E-commerce Search: Toward a Generalizable and Rank-Consistent Pre-Ranking Model [13.6] 大規模なeコマースプラットフォームでは、ダウンストリームランキングモジュールのために、前もって製品の大部分をフィルタリングするために、プレグレードフェーズが不可欠である。
1) 製品がトップk内にあるかどうかを予測する複数のバイナリ分類タスクを導入し、共通のポイントワイドランキングモデルでの学習目標の追加を容易にする。2) 製品埋め込みのサブセットを事前トレーニングすることで、すべての製品に対するコントラスト学習による一般化性。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:20:34 GMT)
Pre-Training Representations of Binary Code Using Contrastive Learning [13.6] 本稿では、表現学習中にソースコードとコメント情報をバイナリコードに組み込む、バイナリcOde分析のためのContrastive Learning Model(COMBO)を提案する。
COMBOは、ソースコード、バイナリコード、コメントをコントラストコード表現学習に組み込んだ最初の言語表現モデルである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:05:35 GMT)
PowerPM: Foundation Model for Power Systems [13.3] 本稿では,ETSデータをモデル化するための基盤モデルPowerPMを提案し,電力系統の大規模オフザシェルフモデルを提供する。
実験では、プライベートデータとパブリックデータからなる5つの実世界のシナリオデータセットについて検討した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:05:14 GMT)
Latent Adversarial Training Improves Robustness to Persistent Harmful Behaviors in LLMs [13.0] 大きな言語モデル(LLM)は、しばしば望ましくない方法で振る舞うように、明示的に微調整されないようにすることができる。
レッドチーム、モデル編集、解釈可能性に関する最近の研究は、この課題が(逆境的な)微調整が望ましくない能力を排除するのではなく、いかに抑制するかに起因していることを示唆している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:22:40 GMT)
Plug, Play, and Fuse: Zero-Shot Joint Decoding via Word-Level Re-ranking Across Diverse Vocabularies [12.8] マルチモーダル翻訳は、翻訳と画像処理の両方を扱うなど、これらの長所の組み合わせを必要とすることが多い。
本稿では,デコードフェーズにおいて,異なるモデルの統合を可能にする新しいゼロショットアンサンブル戦略を提案する。
提案手法では,単語レベルでのスコアを組み合わせ,単語がいつ完了するかをマルチモーダルで予測することで,復号中にビームを再ランクする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:20:55 GMT)
Cause-Aware Empathetic Response Generation via Chain-of-Thought Fine-Tuning [12.8] 共感反応生成は、対話の文脈を理解し、表現された感情に反応する能力を持つエージェントを与える。
先行研究は、主に話者の感情的ラベルを活用することに重点を置いているが、感情の重要性が原因の推論を無視している。
そこで我々は,感情と原因をうまく設計したChain-of-Thoughtプロンプトを通じて統合した原因認識型共感生成手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:11:03 GMT)
Flexora: Flexible Low Rank Adaptation for Large Language Models [12.7] 大規模言語モデル(LLM)は、モデルパラメータのスケールを拡大することで、人工知能の進歩を推進している。
特定の下流タスクにおけるそれらのパフォーマンスは、通常これらのタスクの知識境界によって妨げられる。
本稿では,フレキシブルな低ランク適応法 (Flexora) を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:48:16 GMT)
VulDetectBench: Evaluating the Deep Capability of Vulnerability Detection with Large Language Models [12.5] 本研究では,Large Language Models(LLM)の脆弱性検出機能を評価するために,新しいベンチマークであるVulDetectBenchを紹介する。
このベンチマークは、LLMの脆弱性を特定し、分類し、発見する能力を、難易度を高める5つのタスクを通じて総合的に評価している。
本ベンチマークでは,脆弱性検出の特定のタスクにおいて,様々なLLMの能力評価を効果的に行うとともに,コードセキュリティの重要領域における今後の研究と改善の基盤となる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:51:06 GMT)
IKUN for WMT24 General MT Task: LLMs Are here for Multilingual Machine Translation [12.3] 本稿では,WMT24における汎用機械翻訳タスクのために開発された2つの多言語システム,IKUNとIKUN-Cを紹介する。
IKUNとIKUN-Cは、それぞれLlama-3-8bとMistral-7B-v0.3上に構築されたオープンシステムと制約されたシステムを表している。
どちらのシステムも、単一のモデルを使用して11の言語方向を処理するように設計されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:44:10 GMT)
LAKD-Activation Mapping Distillation Based on Local Learning [12.2] 本稿では,新しい知識蒸留フレームワークであるローカル注意知識蒸留(LAKD)を提案する。
LAKDは、教師ネットワークからの蒸留情報をより効率的に利用し、高い解釈性と競争性能を実現する。
CIFAR-10, CIFAR-100, ImageNetのデータセットについて実験を行い, LAKD法が既存手法より有意に優れていたことを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:43:27 GMT)
Recognizing Beam Profiles from Silicon Photonics Gratings using Transformer Model [12.1] 我々は、SiPh格子からの光のビームプロファイルの対応する高さカテゴリを認識するトランスモデルを開発した。
得られた結果は、光ビームの自動焦点付けやz軸ステージの自動調整など、様々な用途に拡張することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:10:43 GMT)
Persistent Homology via Ellipsoids [12.1] 我々は楕円体錯体と呼ばれる幾何学的にインフォームドされた単体複合体を構築した。
この複合体は、楕円体が接方向に沿って、データをよりよく近似するという考えに基づいている。
実験を行い、楕円形のバーコードと標準Ripのバーコードを比較する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:10:27 GMT)
OAPT: Offset-Aware Partition Transformer for Double JPEG Artifacts Removal [11.9] OAPTと呼ばれるJPEGアーティファクト除去のためのオフセット対応分割変換器を提案する。
8×8ブロック毎に最大4パターンのJPEG圧縮を行う。
OAPTは圧縮オフセット予測器と画像再構成器の2つのコンポーネントから構成される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:47:54 GMT)
PrivCirNet: Efficient Private Inference via Block Circulant Transformation [11.9] ホモモルフィック暗号化(HE)ベースのディープニューラルネットワーク(DNN)推論は、データとモデルのプライバシを保護するが、大きな計算オーバーヘッドに悩まされる。
ブロック循環変換に基づくプロトコル/ネットワーク協調最適化フレームワークであるPrivCirNetを提案する。
PrivCirNetはブロック循環変換と完全に互換性のあるHE符号化アルゴリズムをカスタマイズする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:26:10 GMT)
MSCPT: Few-shot Whole Slide Image Classification with Multi-scale and Context-focused Prompt Tuning [11.7] 多重インスタンス学習(MIL)は、スライド画像全体(WSI)の弱い教師付き分類のための標準パラダイムとなっている。
トレーニングデータの欠如と稀な疾患の存在は,これらの方法に重大な課題をもたらす。
本稿では、FSWCタスクのためのマルチスケールおよびコンテキスト中心のPrompt Tuning(MSCPT)手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:25:51 GMT)
Selective Prompt Anchoring for Code Generation [11.6] DeepSeek-Coder (6.7B) の小さなバージョンは、オリジナルのはるかに大きなバージョン (33B) よりも優れたパフォーマンスを実現することができる。
我々の結果は、SPAを使用することで、すべての設定でPass@1レートを最大9.7%改善できることを示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:01:08 GMT)
TSB: Tiny Shared Block for Efficient DNN Deployment on NVCIM Accelerators [11.5] Tiny Shared Block (TSB)"は、小さな共有1x1畳み込みブロックをDeep Neural Networkアーキテクチャに統合する。
TSBは、20倍以上の推論精度ギャップの改善、5倍以上のトレーニングスピードアップ、デバイス間マッピングコストの削減を実現している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:11:17 GMT)
Lookism: The overlooked bias in computer vision [11.3] ルックリズムはコンピュータビジョンでは探索されていないが、深い意味を持つ可能性がある。
本稿では,コンピュータビジョンモデルにおける重要なバイアスとして,ルックリズムの体系的研究を提唱する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:07:20 GMT)
Visual SLAM with 3D Gaussian Primitives and Depth Priors Enabling Novel View Synthesis [11.2] 従来の幾何学に基づくSLAMシステムは、密度の高い3D再構成機能を持たない。
本稿では,新しいビュー合成技術である3次元ガウススプラッティングを組み込んだリアルタイムRGB-D SLAMシステムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:24:19 GMT)
Semi-Supervised Learning with Multi-Head Co-Training [11.2] 自己学習から拡張されたコトレーニングは、半教師付き学習のフレームワークの1つである。
本稿では, 単純で効率的なマルチヘッド・コレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:13:47 GMT)
Making Large Vision Language Models to be Good Few-shot Learners [11.2] FSC(Few-shot Classification)は、コンピュータビジョンにおける基本的な課題である。
LVLMは、サポートデータから有用な情報を効果的に抽出するのではなく、特定の応答形式を学習するリスクを負う。
本稿では,FSCにおけるLVLMの性能について検討し,学習不足や重度の位置バイアスの有無などの重要な問題を明らかにする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:01:11 GMT)
Exploiting Diffusion Prior for Out-of-Distribution Detection [11.1] 堅牢な機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
拡散モデルの生成能力とCLIPの強力な特徴抽出能力を活用する新しいOOD検出手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:04:18 GMT)
Semi-supervised 3D Semantic Scene Completion with 2D Vision Foundation Model Guidance [11.1] 我々は、高密度な注釈付きデータへの依存を軽減するために、新しい半教師付きフレームワークを導入する。
提案手法は2次元基礎モデルを用いて3次元シーンの幾何学的・意味的手がかりを生成する。
本手法は,10%のラベル付きデータを用いて全教師付き性能の最大85%を達成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:13:18 GMT)
NeRF-US: Removing Ultrasound Imaging Artifacts from Neural Radiance Fields in the Wild [11.0] 超音波画像データにおける3次元再構成と新しいビュー合成(NVS)の現在の手法は、NeRFベースのアプローチを訓練する際、しばしば深刻な成果物に直面している。
本研究では,NeRFトレーニングに境界確率と散乱密度の3次元測位法を組み込んだNeRF-USを導入した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:52:28 GMT)
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding [11.0] LLM(Large Language Models)は、長いコンテキストのアプリケーションで広く使われるようになった。
投機的復号法(SD)は、性能を犠牲にすることなくレイテンシを低減する手法として広く用いられている。
我々は,中間列から長列の高スループット推論方式であっても,驚くほどSDが高速化可能であることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:55:29 GMT)
Constant-Overhead Magic State Distillation [11.0] マジックステート蒸留は、フォールトトレラント量子計算において重要ながリソース集約的なプロセスである。
既存のプロトコルは、多少の$gamma > 0$で、多対数的に増加するオーバーヘッドを必要とする。
我々は$mathcalO(1)$オーバーヘッド、つまり最適な$gamma = 0$を達成するプロトコルを開発する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:22:09 GMT)
Limitations in Employing Natural Language Supervision for Sensor-Based Human Activity Recognition -- And Ways to Overcome Them [10.9] 自然言語と他のモダリティ間のクロスモーダルなコントラスト事前学習は、驚くべき性能と有効性を示している。
ウェアラブルセンサを用いたヒューマンアクティビティ認識(HAR)において,このような自然言語の監視が有効かどうかを検討する。
当然のことながら、通常のエンドツーエンドのトレーニングやセルフスーパービジョンよりもはるかにパフォーマンスが劣っていることが分かりました。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:30:36 GMT)
Inverting the Leverage Score Gradient: An Efficient Approximate Newton Method [10.7] 本稿では,レバレッジスコア勾配から固有モデルパラメータを復元することを目的とする。
具体的には、レバレッジスコア勾配の逆転を$g(x)$として精査する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:39:42 GMT)
Optimizing Interpretable Decision Tree Policies for Reinforcement Learning [10.7] 決定木は、その固有の解釈可能性について教師あり学習において注目を集めている。
本稿では、強化学習環境におけるニューラルネットワークを置き換えるために、解釈可能な決定木ポリシーを最適化する問題を考察する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:04:00 GMT)
Exploring Robustness of Visual State Space model against Backdoor Attacks [10.7] 我々は、バックドア攻撃のレンズを通して、VSS(Visual State Space Model)の堅牢性を理解する実験を行う。
まず、異なるバックドアトリガに対するVSSの脆弱性を調査し、SSMメカニズムによってVSSモデルがバックドアトリガに対してより影響を受けやすいことを明らかにする。
パッチの摂動に抵抗するために各パッチに再帰するVSSモデルの効果的なバックドアを検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:58:29 GMT)
Pointing the Way: Refining Radar-Lidar Localization Using Learned ICP Weights [10.6] 高レベルスキャン情報に基づいてレーダポイントを重み付けする学習前処理ステップを含むICPベースのレーダライダーローカライゼーションを構築した。
重み付けネットワークをトレーニングするために,新しい,スタンドアローンでオープンソースの差別化可能なICPライブラリを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:22:09 GMT)
Data-Free Class Incremental Gesture Recognition via Synthetic Feature Sampling [10.6] DFCILは、古いクラスのトレーニングデータが利用できない場合でも、古いクラスの知識を再トレーニングしながら、モデルが新しいクラスを継続的に学習できるようにすることを目的としている。
SFR(Synthetic Feature Replay)を開発した。これは,クラスプロトタイプから合成特徴をサンプリングし,古いクラスを再生し,新しいクラスを増強するものだ。
提案手法は,全ステップにわたる平均精度で最大15%の精度向上を実現し,最先端技術に対する大幅な進歩を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:44:15 GMT)
DABench: A Benchmark Dataset for Data-Driven Weather Data Assimilation [10.6] ERA5データを利用したベンチマークデータセットであるDABenchを導入し、エンド・ツー・エンドの気象予報システムの開発を導く。
DaTは4次元の変分DA事前知識をTransformerモデルに統合し、4DVarNetという物理的状態再構成においてSOTAより優れている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:50:19 GMT)
A Survey for Foundation Models in Autonomous Driving [10.3] 大規模言語モデルは、自動運転における計画とシミュレーションに寄与する。
ビジョンファウンデーションモデルは、3Dオブジェクトの検出やトラッキングといった重要なタスクに適応している。
多様な入力を統合するマルチモーダル基礎モデルは、例外的な視覚的理解と空間的推論を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:02:21 GMT)
Large Language Models are Good Attackers: Efficient and Stealthy Textual Backdoor Attacks [10.3] 本稿では,Large Language Models (LLMs) を活用した,効率的なテキストバックドア攻撃手法 EST-Bad を提案する。
私たちのEST-Badには、モデル固有の欠陥をトリガーとして最適化すること、LSMで密かにトリガーを注入すること、バックドアインジェクションの最も影響の大きいサンプルを慎重に選択することの3つの戦略が含まれています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:50:23 GMT)
Mutagenesis screen to map the functionals of parameters of Large Language Models [10.2] 我々は、Llama2-7bとZephyrの生物学的研究で用いられた手法に触発された変異原性スクリーンを用いた。
表現型、特に重篤な結果をもたらす変異は、軸に沿って集結する傾向にあった。
ゼファーでは、特定の突然変異は、記述的なアウトプットよりも詩的な、あるいは会話的な結果をもたらす。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:10:08 GMT)
InstructERC: Reforming Emotion Recognition in Conversation with Multi-task Retrieval-Augmented Large Language Models [10.2] 本稿では,識別的枠組みから大規模言語モデル(LLM)に基づく生成的枠組みへ,感情認識タスクを再構築するための新しいアプローチであるインストラクタCを提案する。
InstructERCは、3つの重要な貢献をしている:(1)モデルがマルチグラニュラリティ対話監視情報を明示的に統合するのに役立つ単純で効果的なテンプレートモジュール、(2)話者識別と感情予測タスクという2つの追加の感情アライメントタスクを導入し、会話における対話の役割の関係と将来の感情傾向を暗黙的にモデル化する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:26:51 GMT)
Federated Learning for Collaborative Inference Systems: The Case of Early Exit Networks [10.2] 協調推論システム(CIS)は、より小さなデバイスが推論タスクの一部をより有能なデバイスにオフロードできるようにすることによって、このパフォーマンストレードオフに対処する。
我々のフレームワークは厳密な理論的保証を提供するだけでなく、CISの最先端(SOTA)トレーニングアルゴリズムを超越している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:04:41 GMT)
To Tag, or Not to Tag: Translating C's Unions to Rust's Tagged Unions [10.2] C-to-Rust変換は、レガシーシステムソフトウェアの信頼性を高めるための有望な方法である。
産業的に開発されたトランスレータであるC2Rustは、安全でない機能を備えたRustコードを生成する。
我々は、C-to-Rust翻訳において、ユニオンをタグ付きユニオンに置き換える手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:23:51 GMT)
Leveraging Variational Autoencoders for Parameterized MMSE Estimation [10.1] 条件付き線形最小二乗誤差推定器のパラメータ化のための変分オートエンコーダに基づくフレームワークを提案する。
導出した推定器は、推定問題の生成前として変分オートエンコーダを用いて最小平均2乗誤差推定器を近似する。
提案手法と最小平均二乗誤差推定器の差分を限定して厳密な解析を行う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:37:51 GMT)
Pixel Is Not A Barrier: An Effective Evasion Attack for Pixel-Domain Diffusion Models [9.9] 拡散モデルは高品質な画像合成のための強力な生成モデルとして登場し、それに基づく画像編集技術も数多くある。
従来の研究は、知覚不能な摂動を加えることで、画像の拡散に基づく編集を防ごうとしてきた。
本研究は,UNETの脆弱性を悪用した特徴表現攻撃損失と,保護された画像の自然性を高めるための潜在最適化戦略を備えた,新たな攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:56:34 GMT)
Medical MLLM is Vulnerable: Cross-Modality Jailbreak and Mismatched Attacks on Medical Multimodal Large Language Models [9.9] 本稿では,MedMLLMの未発見の脆弱性について述べる。
既往の医療データと非典型的自然現象を組み合わせることで、不正な悪意のある攻撃を定義する。
本稿では,MedMLLM の攻撃成功率を大幅に向上させる MCM 最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:56:47 GMT)
SymbolicAI: A framework for logic-based approaches combining generative models and solvers [9.8] 生成過程における概念学習とフロー管理に論理的アプローチを取り入れた,汎用的でモジュール化されたフレームワークであるSybolicAIを紹介する。
我々は,大規模言語モデル(LLM)を,自然言語命令と形式言語命令の両方に基づいてタスクを実行する意味的解決器として扱う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:07:31 GMT)
ST-USleepNet: A Spatial-Temporal Coupling Prominence Network for Multi-Channel Sleep Staging [9.8] 睡眠ステージングは、睡眠の質を評価し、障害を診断するために重要である。
近年の人工知能の進歩により、自動睡眠ステージリングモデルの開発が進められている。
本稿では,時空間グラフ構築モジュールとU字型睡眠ネットワークからなるST-USleepNetという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:57:44 GMT)
Low-Light Object Tracking: A Benchmark [9.8] LLOTは、低照度オブジェクト追跡用に特別に設計されたベンチマークである。
LLOTは、合計132Kフレームを持つ269の挑戦的なシーケンスで構成され、それぞれにバウンディングボックスを慎重にアノテートする。
そこで我々は,H-DCPTを提案する。H-DCPT,H-DCPT,H-DCPT,H-DCPT,H-DCPT,H-DCPT,H-DCPT。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:27:57 GMT)
BURExtract-Llama: An LLM for Clinical Concept Extraction in Breast Ultrasound Reports [9.7] 本研究は,放射線学報告から臨床情報を抽出する社内LCMを開発するためのパイプラインを提案する。
まず、GPT-4を使用して小さなラベル付きデータセットを作成し、それからその上にLlama3-8Bモデルを微調整します。
本研究は, GPT-4の性能だけでなく, コスト削減やデータプライバシの向上などを実現する社内LCMの実現可能性を示すものである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:33:05 GMT)
On Missing Scores in Evolving Multibiometric Systems [9.7] 簡易な和融合と各種スコア計算法の応用により,認識精度が向上することを示す。
実験により, インキュベーション後の核融合は, インキュベーションを伴わない核融合よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:47:06 GMT)
Java-Class-Hijack: Software Supply Chain Attack for Java based on Maven Dependency Resolution and Java Classloading [9.7] Java-Class-Hijackは、依存性ツリーにある正当なクラスをシャドーするクラスを作成することで、攻撃者が悪意のあるコードを注入することを可能にする。
この攻撃について説明するとともに、その実現可能性を示す概念実証を提供し、ドイツのCorona-Warn-Appアプリケーションでそれを再現する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:41:42 GMT)
Optimizing Transmit Field Inhomogeneity of Parallel RF Transmit Design in 7T MRI using Deep Learning [9.6] 超高磁場(UHF)磁気共鳴イメージング(MRI)は信号対雑音比を高くし、空間分解能を高くする。
UHF MRIは、無線周波数(RF)磁場(B1+)の不均一性などの課題を導入し、不均一なフリップ角と画像強度異常をもたらす。
本研究では,新たな深層学習戦略を通じて,B1+フィールドの均一性を論じる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:10:56 GMT)
A Unified Framework for Continual Learning and Machine Unlearning [9.5] 継続的学習と機械学習は機械学習において重要な課題であり、通常は別々に対処される。
制御された知識蒸留を活用することによって,両課題に共同で取り組む新しい枠組みを導入する。
我々のアプローチは、最小限の忘れ込みと効果的な標的未学習で効率的な学習を可能にする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:49:59 GMT)
Multi-Grained Query-Guided Set Prediction Network for Grounded Multimodal Named Entity Recognition [9.5] Grounded Multimodal Named Entity Recognition (GMNER) は、新しい情報抽出(IE)タスクである。
近年,機械読解やシーケンス生成に基づくフレームワークを用いた統一手法は,この難易度に限界を生じさせている。
そこで我々は,Multi-fine Query-guided Set Prediction Network (MQSPN) という新しい統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:09:02 GMT)
Zero-shot Prompt-based Video Encoder for Surgical Gesture Recognition [9.4] 手術ビデオにおけるジェスチャー認識のための訓練済み視覚テキストモデル(CLIP)を開発した。
これはテキストなどの広範囲な外部ビデオデータを利用することができるが、ラベルメタデータも利用でき、コントラスト的損失を弱めている。
実験の結果,プロンプトベースのビデオエンコーダは,外科的ジェスチャー認識タスクにおいて,標準的なエンコーダよりも優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:54:02 GMT)
First line of defense: A robust first layer mitigates adversarial attacks [9.4] ニューラルネットワークの第1層が暗黙の対向ノイズフィルタ(ANF)として機能することを示す。
このフィルタは、カーネルサイズが大きくなり、畳み込みフィルタが増加し、最大値演算が可能である。
本稿では,ResNet,VGG,EfficientNetなどのアーキテクチャにおいて,このフィルタを第1層として統合することにより,対向的に堅牢なネットワークが得られることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:00:16 GMT)
HYVE: Hybrid Vertex Encoder for Neural Distance Fields [9.4] 本稿では,1つの前方パスにおける3次元形状の正確な符号化に適したニューラルネットワークアーキテクチャを提案する。
我々のネットワークは、非ゼロ距離値や形状占有の事前知識を明示することなく、有効な符号付き距離場を出力することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:53:02 GMT)
NuSegDG: Integration of Heterogeneous Space and Gaussian Kernel for Domain-Generalized Nuclei Segmentation [9.3] 我々はNuSegDGと略して、核画像分割のためのドメイン一般化可能なフレームワークを提案する。
HS-AdapterはSAMの画像エンコーダに少数のトレーニング可能なパラメータを注入することで、異なる核ドメインの多次元特徴表現を学習する。
GKP-エンコーダは1つの点によって駆動される密度マップを生成し、位置プロンプトと意味プロンプトを混合することによってセグメント化予測を導く。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:19:23 GMT)
Self-Supervised Iterative Refinement for Anomaly Detection in Industrial Quality Control [9.1] イテレーティブ・リファインメント・プロセス(IRP)は産業品質管理のために設計された堅牢な異常検出手法である。
我々は,2つのベンチマークデータセットである Kolektor SDD2 と MVTec AD を用いて,IRP の有効性を検証する。
実験の結果,IRPは従来の異常検出モデルより一貫して優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:15:20 GMT)
End-to-End Cost-Effective Incentive Recommendation under Budget Constraint with Uplift Modeling [9.0] 本稿では,予算制約下でのエンド・ツー・エンド・エンド・コスト・エフェクティブ・インセンティブ・レコメンデーション(E3IR)モデルを提案する。
具体的には、アップリフト予測モジュールと微分可能なアロケーションモジュールの2つのモジュールから構成される。
E3IRは既存の2段階アプローチに比べてアロケーション性能が向上する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:48:00 GMT)
M2CS: A Microwave Measurement and Control System for Large-scale Superconducting Quantum Processors [9.0] マイクロ波計測制御システム (M2CS) は、大規模超伝導量子プロセッサ専用である。
M2CSは、全体的なパフォーマンス、スケーラビリティ、柔軟性のバランスをとる、コンパクトなモジュラー設計である。
トランスモン超伝導量子ビットのベンチマークテストは、最先端の結果に匹敵するクビットコヒーレンスとゲートフィドリティを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:14:49 GMT)
Efficient Detection of Toxic Prompts in Large Language Models [8.8] 大型言語モデル(LLM)は、有害または非倫理的な反応を誘発する有害なプロンプトを作る悪意のある個人によって利用することができる。
LLMの有害なプロンプトを効率的に検出する軽量グレーボックスであるToxicDetectorを提案する。
ToxicDetectorの精度は96.39%、偽陽性率は2.00%であり、最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:54:04 GMT)
Runtime Verification and Field-based Testing for ROS-based Robotic Systems [8.7] ROSベースのシステムを設計して実行時の検証とフィールドベースのテストを可能にするための明確なガイダンスは存在しない。
本稿では、開発者と品質保証(QA)チームが現場でロボットを開発し、検証し、テストするためのガイドラインを提供することで、このギャップを埋めることを目的とする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:21:06 GMT)
Modeling Reference-dependent Choices with Graph Neural Networks [8.6] 本稿では,データ駆動の観点から参照依存の嗜好をモデル化する新たな研究課題を提案する。
我々はAttributed Reference-dependent Choice Model for Recommendation(ArcRec)という新しいディープラーニングベースのフレームワークを設計する。
ArcRecは、理論的な参照ポイントをインスタンス化するための、集計された履歴購入レコードから参照ネットワークを構築する機能を持つ。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:14:25 GMT)
Visual Localization in 3D Maps: Comparing Point Cloud, Mesh, and NeRF Representations [8.5] 本稿では,カラー3Dマップ表現内でカメラ画像のローカライズが可能なグローバルなグローバルな位置決めシステムを紹介し,評価する。
我々は、点雲、メッシュ、ニューラルフィールド(NeRF)という3種類のカラー3Dマップを作成するための最先端の3つの方法を提案する。
以上の結果から,3つの地図表現がそれぞれ55%以上の一貫した局所化成功率を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:37:17 GMT)
BearLLM: A Prior Knowledge-Enhanced Bearing Health Management Framework with Unified Vibration Signal Representation [8.4] 大規模言語モデル(BearLLM)を活用したベアリング型健康管理フレームワークを提案する。
BearLLMは、ユーザのプロンプトと振動信号を処理することで、複数のベアリング関連タスクを統合する。
私たちは、より有能な産業マルチモーダルモデルの構築に関する将来の研究を刺激するデータセット、モデル、コードを提供しています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:04:54 GMT)
Watch Out for Your Guidance on Generation! Exploring Conditional Backdoor Attacks against Large Language Models [8.3] 大規模な言語モデル(LLM)に対するバックドア攻撃は、通常、入力インスタンスに固定されたトリガと、トリガクエリに対する特定のレスポンスを設定する。
生成条件の特定によって誘導されるLSMに対する新しい中毒パラダイムを提案する。
中毒モデルは通常、正常/他の生成条件下では出力に対して、目標生成条件下では出力に対して有害となる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:32:18 GMT)
Sum of Squares Circuits [8.3] 確率回路(PC)は、このトラクタビリティvs表現性トレードオフを理論的に分析できる枠組みを提供する。
負のパラメータによる減算混合を符号化する正方形PCは単調PCよりも指数関数的に表現可能であることを示す。
我々は、二乗PCと単調PCの両方よりも指数関数的に表現できる新しい種類のPCを定式化する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:08:05 GMT)
Sliding Window Training -- Utilizing Historical Recommender Systems Data for Foundation Models [8.3] 長寿命のレコメンデータシステム(RecSys)は、長年にわたる長いユーザとイテムのインタラクション履歴に遭遇することが多い。
長期的ユーザの好みを効果的に学習するためには、FM(Large RecSys foundation model)が事前学習時にこの情報をエンコードする必要がある。
モデル入力次元を増大させることなく、トレーニング時間中に長いユーザ履歴シーケンスを組み込むスライディングウィンドウトレーニング手法を導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:59:52 GMT)
SimBench: A Rule-Based Multi-Turn Interaction Benchmark for Evaluating an LLM's Ability to Generate Digital Twins [8.2] シムベンチ(SimBench)は、学生大言語モデル(S-LLM)のデジタルツイン(DT)生成能力を評価するためのベンチマークである。
S-LLMのコレクションを与えられたこのベンチマークは、高品質なDTを生成する能力に基づいて、S-LLMのランク付けを可能にする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:52:32 GMT)
Inference Plans for Hybrid Particle Filtering [8.1] ランダム変数のパーティショニングを開発者が制御できるプログラミングインターフェースである推論計画を提案する。
また、開発者はアノテーションを使って推論システムが実装しなければならない推論計画を指定することができる新しいPPLであるSirenを提示する。
評価では,3種類のハイブリッド粒子フィルタリングアルゴリズムに推論計画を適用し,推定計画による制御により平均1.76倍,目標精度を206倍まで向上できることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:07:03 GMT)
BEYOND DIALOGUE: A Profile-Dialogue Alignment Framework Towards General Role-Playing Language Model [8.1] 大規模言語モデル(LLM)の急速な進歩はロールプレイングに革命をもたらし、一般的なロールプレイングモデルの開発を可能にした。
現在のロールプレイングトレーニングには2つの大きな問題がある: (I) 特定のシナリオに対する対話トレーニングを促すために事前に定義されたロールプロファイルを使用することで、対話とプロファイルの間に矛盾や矛盾が生じ、トレーニングバイアスが生じる。
我々はこれらのハードルを克服するために、DIALOGUEと呼ばれるシンプルで効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:31:25 GMT)
QuaCK-TSF: Quantum-Classical Kernelized Time Series Forecasting [7.9] 本稿では,このベイズ手法のロバスト性と,量子モデルにおけるカーネル・パースペクティブから得られるニュアンスド・インサイトとを融合した新しいアプローチを提案する。
我々はIsingの相互作用にインスパイアされた量子特徴写像を組み込み、正確な予測に不可欠な時間的依存関係のキャプチャーの有効性を実証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:39:31 GMT)
Oh, Behave! Country Representation Dynamics Created by Feedback Loops in Music Recommender Systems [7.9] 本研究では,ユーザのプロファイルやレコメンデーションにおける地域(国別)と米国産音楽の表現のダイナミクスについて検討する。
その結果,調査対象のレコメンデーションモデルのほとんどは,レコメンデーションにおける地元のアーティストの楽曲の割合を減少させることが示唆された。
表現力の低い国からのユーザーは、長期的には、地元の音楽の表現不足に最も影響を受けやすい。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:18:28 GMT)
Unraveling the dynamical behaviors in a quasiperiodic mosaic lattice [7.7] 準周期モザイク格子の力学を研究し、その特異な力学特性を解明する。
我々は、奇数点と偶数点に定義された疎結合ハミルトン多様体からなる、大きな準周期ポテンシャル強度領域において有効ハミルトニアンを導出する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:39:35 GMT)
Transfer Learning and the Early Estimation of Single-Photon Source Quality using Machine Learning Methods [7.7] 単一光子源(SPS)は多くのシステムやデバイスの中心であり、現代の量子技術の急増の中で提案されている。
しかし、製造計画が不完全であり、単一光子放射純度はインターフェロメトリーによって実験的に検証されなければならない。
本研究では,不完全排出統計からSPS品質をより高速に推定できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:10:38 GMT)
Quantum Entanglement and non-Hermiticity in free fermion systems [7.5] 本稿では,非エルミート量子系における絡み合いの一般化と応用について述べる。
エンタングルメントの概念がエルミート自由フェルミオン系から非エルミート系へどのように拡張されるかに焦点を当てる。
我々は、絡み合いエントロピーが非エルミート物理学を特徴づける強力な診断ツールであることを示し、様々な応用を強調した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:25:14 GMT)
Gram-Schmidt Methods for Unsupervised Feature Extraction and Selection [7.4] 本稿では,関数空間上のGram-Schmidtプロセスを提案する。
合成および実世界のベンチマークデータセットに対する実験結果を提供する。
驚いたことに、線形特徴抽出アルゴリズムは同等であり、しばしば重要な非線形特徴抽出法よりも優れている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:19:53 GMT)
Automated Deep Learning Optimization via DSL-Based Source Code Transformation [7.4] 本稿では,Adopterという,ディープラーニングによるOPTimizationの自動化手法を提案する。
DLモデルアーキテクチャを表現し、このDSLを利用してモデル変換ルールを指定する。
Adopterは、それぞれ3%と56%の精度とリコールを改善するのに役立ちます。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:32:32 GMT)
The Key of Parameter Skew in Federated Learning [7.3] フェデレートラーニング(FL)は、生データを交換することなく、異なるデータオーナでディープラーニングを実行するための優れたソリューションとして登場した。
本稿では,大域的モデルパラメータ推定の精度に大きく影響を与える現象を記述するために,パラメータスキューの概念を提案する。
高品質なグローバルモデルを得るためのアグリゲーション戦略であるFedSAを紹介する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:01:15 GMT)
The Whole Is Bigger Than the Sum of Its Parts: Modeling Individual Annotators to Capture Emotional Variability [7.1] 感情表現と知覚はニュアンスがあり、複雑で、非常に主観的なプロセスである。
ほとんどの音声感情認識タスクは、アノテータラベルを基底真理として平均化することでこの問題に対処する。
従来の研究は感情の多様性を捉えるために分布を学習しようとしたが、これらの手法は個々のアノテータに関する情報も失っている。
本研究では,モデル学習中の感情分布の学習を可能にする連続モデル出力から分布を生成する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:24:06 GMT)
Offline Policy Learning via Skill-step Abstraction for Long-horizon Goal-Conditioned Tasks [7.1] 本稿では,長期GCタスクに対処するためのオフラインGCポリシー学習フレームワークを提案する。
このフレームワークでは、GCポリシーは、データ上のスキルステップの抽象化の漸進的なモデリングと合わせて、オフラインで徐々に学習される。
我々は,GCポリシーを多岐にわたる長期的目標に適応させる上で,GLvSAフレームワークの優位性と効率性を実証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:05:06 GMT)
Fast erasure decoder for hypergraph product codes [7.1] ハイパーグラフ製品コードによる消去訂正のためのデコーダを提案する。
数値シミュレーションにより,このデコーダは最大確率を近似することを示した。
このデコーダの確率バージョンはO(N1.5)ビット演算で実装できる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:12:01 GMT)
Unfolded proximal neural networks for robust image Gaussian denoising [7.0] 本稿では,二元FBと二元Chambolle-Pockアルゴリズムの両方に基づいて,ガウス分母タスクのためのPNNを統一的に構築するフレームワークを提案する。
また、これらのアルゴリズムの高速化により、関連するNN層におけるスキップ接続が可能であることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:26:51 GMT)
Characterizing the Evolution of Psychological Tactics and Techniques Exploited by Malicious Emails [7.0] 心理学的戦術、PTac、心理学的手法、PTechsは悪意ある電子メールによって悪用される。
本稿では,悪質な電子メールによるPTacsとPTechsの進化を特徴付ける手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:49:54 GMT)
Characterizing the Evolution of Psychological Factors Exploited by Malicious Emails [7.0] 我々は、悪意ある電子メールの進化を心理的要因(PF)のレンズを通して特徴づける。
2004年から2024年までの21年間に1,260件の悪意ある電子メールをケーススタディで調査した。
攻撃者は、多くのPF、特に人間の特性を反映したものを常に利用しようとしてきた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:48:32 GMT)
Practical token pruning for foundation models in few-shot conversational virtual assistant systems [7.0] コントラスト学習目標を持つ変圧器に基づく文埋め込みモデルを事前学習し、学習意図分類モデルの特徴としてモデルの埋め込みを利用する。
提案手法は,数ショットのシナリオに対して最先端の結果を達成し,一般的な意図分類ベンチマークにおいて,他の商用ソリューションよりも優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:42:17 GMT)
Epistemic Injustice in Generative AI [7.0] 生成的AIは、集合的知識の完全性や、私たちが情報を取得し、評価し、信頼するために依存するプロセスを損なう可能性がある。
我々は,この現象の4つの重要な側面を同定する: 増幅的および操作的証言的不正,および医療的無知とアクセス的不正である。
我々は、より公平な情報エコシステムを育むために、生成AIを活用する抵抗戦略、システム設計原則、および2つのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:51:05 GMT)
Video-Foley: Two-Stage Video-To-Sound Generation via Temporal Event Condition For Foley Sound [6.6] 音声合成はマルチメディア生産に不可欠であり、音声と映像を時間的・意味的に同期させることによりユーザエクスペリエンスを向上させる。
ビデオから音声生成によるこの労働集約プロセスの自動化に関する最近の研究は、重大な課題に直面している。
本稿では,Root Mean Square (RMS) を用いた音声合成システムであるVideo-Foleyを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:06:15 GMT)
E-Bench: Subjective-Aligned Benchmark Suite for Text-Driven Video Editing Quality Assessment [6.6] E-Benchはテキスト駆動のビデオ編集の評価に適したベンチマークスイートである。
ビデオ編集のためのビデオ品質アセスメント(VQA)データベースであるE-Bench DBが含まれている。
E-Bench QAは、テキストビデオアライメントと、ソースと編集されたビデオ間の関連モデリングに焦点を当てている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:49:32 GMT)
One-step Structure Prediction and Screening for Protein-Ligand Complexes using Multi-Task Geometric Deep Learning [6.6] マルチタスク幾何学的深層学習に基づいて,LigPoseを1つのモデル,すなわちLigPoseに正確に取り組めることを示す。
LigPoseはリガンドとタンパク質のペアをグラフとして表現し、結合強度と原子間相互作用を補助的なタスクとして学習する。
実験によると、LigPoseは薬物研究の主要な課題について最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:53:50 GMT)
An Asymptotically Optimal Coordinate Descent Algorithm for Learning Bayesian Networks from Gaussian Models [6.5] 線形ガウス構造方程式モデルに基づいて連続観測データからネットワークを学習する問題について検討する。
そこで本研究では,この問題を解決するために新しい座標降下アルゴリズムを提案する。
学習ネットワークの文脈における最適性と統計的保証を備えた最初の座標降下法である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:18:03 GMT)
Towards End-to-End GPS Localization with Neural Pseudorange Correction [6.5] 疑似距離補正(PrNet)のためのニューラルネットワークをトレーニングするためのエンドツーエンドGPSローカライズフレームワークであるE2E-PrNetを提案する。
データ駆動型ニューラルネットワークとモデルベースDNLSモジュールを融合させる可能性については,Android端末が収集したGPSデータを用いて検証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:10:02 GMT)
A Quantum Approximate Optimization Algorithm-based Decoder Architecture for NextG Wireless Channel Codes [6.5] FEC(Forward Error Correction)は、ノイズや干渉があるにもかかわらず、無線ネットワークにおける信頼性の高いデータフローを提供する。
FEC処理は、その計算力に富んだ復号プロセスのために、無線ネットワークのリソースのかなりの部分を必要とする。
我々は、人気のあるNextG無線低密度パリティチェック(LDPC)と極符号を対象とした、QAOAベースのFECデコーダであるFDeQを提案する。
FDeQは、FEC符号ブロック長の低い最先端の古典的復号器と同等のエラー性能で復号化を成功させる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:53:09 GMT)
Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models [6.4] 本稿では,自己回帰型言語モデリングシナリオに対する帰属手法の忠実さを評価するために,反事実生成を利用する手法を提案する。
本手法は, 評価プロトコルをより信頼性の高い, 流動的かつ非分配的な反物を生成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:17:59 GMT)
Toward Understanding Deep Learning Framework Bugs [6.4] 我々は4つの人気のある多種多様なDLフレームワークから1,000のバグについて大規模な調査を行っている。
我々は,DLフレームワークのバグの包括的理解と既存のDLフレームワークテストプラクティスの現状について,12の主要な知見を得た。
このガイドラインに基づいて、我々はTenFuzzと呼ばれるDLフレームワークテストツールのプロトタイプを設計、実装する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:52:04 GMT)
Open-Ended 3D Point Cloud Instance Segmentation [6.3] Open-Ended 3D Instanceメソッドは、テスト中に事前に定義されたクラス名を必要としない。
OV-3DISの最先端技術であるOpen3DISの性能を超越した手法を提案する。
このアプローチでは、ScanNet200とScanNet++データセットのベースラインよりも大幅にパフォーマンスが改善されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:14:11 GMT)
Analysis of Systems' Performance in Natural Language Processing Competitions [6.2] 本論文は,競技結果と競技成績を統計的に分析するための評価手法について述べる。
提案手法は,修正機構との比較や信頼区間の包含など,いくつかの利点がある。
本分析は,競争結果を効果的に評価するための方法論の有用性を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:50:31 GMT)
Mathematical Information Retrieval: Search and Question Answering [6.2] マルチモーダル検索エンジンと数学的質問応答システムは、数学関連の質問に答えるのに役立つ。
この本は、私たちが数学関連の質問に答えるために働くときに人やシステムが実行する情報タスクを特徴づける単純なフレームワークから始まります。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:17:24 GMT)
Optimizing Federated Graph Learning with Inherent Structural Knowledge and Dual-Densely Connected GNNs [6.2] Federated Graph Learning (FGL)は、クライアントがプライベートデータを公開することなく、強力なグラフニューラルネットワーク(GNN)を分散的にトレーニングすることを可能にする。
既存の手法は、グラフデータに固有の構造的知識を見落としているか、リソース要求を大幅に増加させるコストでそれをキャプチャする。
構造的知識の利用効率を最適化する新しいFGLフレームワークであるFedDenseを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:37:50 GMT)
Just Project! Multi-Channel Despeckling, the Easy Way [6.2] 本稿では,既存の単一チャネル分離手法を利用した汎用フレームワークであるMuChaProを紹介する。
鍵となるアイデアは、多数の単一チャネルプロジェクションを生成し、これらのプロジェクションを復元し、それらを最終的なマルチチャネル推定に再結合することである。
MuChaProの特長は、センサ固有のネットワークを学習するための自己教師型トレーニング戦略を適用する可能性である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:12:50 GMT)
NeuFlow v2: High-Efficiency Optical Flow Estimation on Edge Devices [6.2] 計算要求の低減と高い精度のバランスをとる高効率光フロー法を提案する。
より軽量なバックボーンや高速リファインメントモジュールなど,新たなコンポーネントを導入しています。
我々のモデルでは,合成データと実世界のデータの両方で同等の性能を維持しながら,10倍-70倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:23:10 GMT)
Private Means and the Curious Incident of the Free Lunch [6.1] DP実装の最もよく知られた基本的ビルディングブロックは、同一のプライバシー保証のために大幅にノイズを減らしてリリース可能であることを示す。
これを実現するために、最低ケース感度$R$の個々のデータを、すべてのデータが一定のノルム$R$を持つプレフィックスに投影する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:38:48 GMT)
Correlation Analysis of Adversarial Attack in Time Series Classification [6.1] 本研究では,時系列分類モデルの攻撃に対する脆弱性について検討した。
攻撃の有効性を高めるため、正規化技術とノイズ導入が示されている。
世界情報を優先するように設計されたモデルは、敵の操作に対する抵抗が大きいことが判明した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:11:32 GMT)
Linear-time One-Class Classification with Repeated Element-wise Folding [6.1] 本稿では,一級分類における使い易い方法として,繰り返し要素分割法(REF)を提案する。
REFは、一般的に使用されるより要求の多いアプローチの線形時間代替を提供する。
実験の結果、REFは類似の分類性能、あるいは様々なベンチマークデータセットでより複雑なアルゴリズムよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:18:39 GMT)
Fairness measures for biometric quality assessment [6.1] 品質評価アルゴリズムは、捕獲されたバイオメトリック標本の品質を測定する。
十分な品質のサンプルのみを処理し、低品質のサンプルを廃棄することが不可欠である。
提案された措置は、この重要な分野における今後の標準の候補として使われる可能性がある。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:37:19 GMT)
Optical ISAC: Fundamental Performance Limits and Transceiver Design [6.0] 本稿では,単一入力単出力通信を用いた光ポイントツーポイント(P2P)システムにおける最適容量歪みトレードオフを特徴付ける。
提案手法は, アルゴリズムによる最適最大値推定器 (MAP) と最大最大値推定器 (MLE) を目標距離に導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:25:40 GMT)
Learning Deep Dissipative Dynamics [5.9] 分散性は、安定性と入出力安定性を一般化する力学系にとって重要な指標である。
本稿では,ニューラルネットワークで表現される任意のダイナミクスを散逸型プロジェクションに変換する微分可能プロジェクションを提案する。
本手法は, 訓練された力学系の安定性, 入力出力安定性, エネルギー保存を厳密に保証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:44:43 GMT)
QET: Enhancing Quantized LLM Parameters and KV cache Compression through Element Substitution and Residual Clustering [5.9] 行列量子化(Matrix Quantization)は、行列要素をよりコンパクトな形式に圧縮し、記憶要求を減らす。
この手法は,Large Language Model (LLM) の重み圧縮やKVキャッシュ圧縮といった応用において重要である。
本稿では,量子化エラー最小化問題に対処するため,量子エンタングルメントツリー(QET)を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:32:43 GMT)
Supervised Representation Learning towards Generalizable Assembly State Recognition [5.9] アセンブリ状態認識は、アセンブリ手順の実行を促進し、効率の向上とエラーの最小化のためのフィードバックを提供する。
本稿では、表現学習と新たな中間状態情報損失関数修正(ISIL)に基づくアプローチを提案する。
ISILは、状態間のラベルのない遷移を活用し、クラスタリングと分類性能の大幅な改善を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:24:40 GMT)
ACW: Enhancing Traceability of AI-Generated Codes Based on Watermarking [5.8] コードの一部がAIによって生成されるのか、どのAIが創造者であるのかを知ることが望ましい。
ウォーターマーキングは広く有望なソリューションと考えられており、AI生成テキストの特定に成功している。
本稿では,AI生成コードの透かし手法であるACW(AI Code Watermarking)を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:55:41 GMT)
XDT-CXR: Investigating Cross-Disease Transferability in Zero-Shot Binary Classification of Chest X-Rays [5.8] クロス放電伝達性 (XDT) は、同一臓器に影響を及ぼす他の疾患に対してゼロショット分類を行うために、ある疾患で訓練されたバイナリ分類器の潜在能力である。
本研究は, ある肺疾患をトレーニングしたモデルが, 新たな肺疾患を予測できるかどうかを考察する。
フレームワークとしてのXDTは、他のゼロショット学習(ZSL)ベースラインと比較して、より良い予測を行うことができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:05:22 GMT)
Latent Feature and Attention Dual Erasure Attack against Multi-View Diffusion Models for 3D Assets Protection [5.7] MVDM(Multi-View Diffusion Models)は3次元幾何再構成の分野において顕著な改善を実現する。
本稿では,MVDMによる知的財産権侵害問題に最初に対処する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:06:06 GMT)
Real-Time Incremental Explanations for Object Detectors [5.6] IncXは、実時間インクリメンタルな説明近似のためのアルゴリズムである。
我々はオブジェクト検出器のための最先端のブラックボックス説明可能性ツールであるD-RISE上にIncXを実装した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:31:39 GMT)
Automated Detection of Algorithm Debt in Deep Learning Frameworks: An Empirical Study [5.6] 最近の研究では、機械学習モデル(ML/DL)が、SATD(Self-Admitted Technical Debt)と呼ばれるソースコードコメントから技術的負債を検出できることが示されている。
我々の目標は、様々なML/DLモデルのAD検出性能を改善することである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:12:27 GMT)
SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models [5.6] SORSA(Singular Values and Orthonormalized Singular Vectors Adaptation)は, PEFT法の一種である。
我々は,SORSAがパラメータ効率の高い微調整の新たな視点を提供し,優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:47:26 GMT)
Recent Advances in Optimal Transport for Machine Learning [5.5] 2012~2023年の間に、マシンラーニングのための最適なトランスポートのコントリビューションを検討します。
機械学習の4つのサブフィールド(教師なし、教師なし、転送、強化学習)に焦点を当てる。
計算最適輸送とその拡張の最近の発展に注目した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:44:44 GMT)
Lighter, Better, Faster Multi-Source Domain Adaptation with Gaussian Mixture Models and Optimal Transport [5.5] 我々は、異種、ラベル付きソース確率測度を異なるラベル付きターゲット測度に適応させるトランスファー学習におけるタスクであるマルチソースドメイン適応(MSDA)に取り組む。
最適輸送(OT)とガウス混合モデル(GMM)に基づくMSDAのための新しいフレームワークを提案する。
画像分類と故障診断の4つのベンチマークで提案手法を実証的に評価し,より高速かつ少ないパラメータを伴いながら,先行技術よりも改善したことを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:50:00 GMT)
Current Status and Trends in Image Anti-Forensics Research: A Bibliometric Analysis [5.3] 本研究の目的は、画像の反法医学に関する知識構造とホットスポットの研究を包括的にレビューすることである。
VOSViewerソフトウェアを用いた文献分析では、研究動向、主要な研究機関、最も影響力のある出版物、トップパブリッシング会場、そしてこの分野の最もアクティブなコントリビュータが明らかにされている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:21:56 GMT)
Bioimpedance a Diagnostic Tool for Tobacco Induced Oral Lesions: a Mixed Model cross-sectional study [5.3] バイオインダプタンスデバイスは、OPMDとOSCCを区別するための意思決定に役立つ。
BIS測定に基づく診断では、感度は95.9%、特異性は86.7%である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:24:43 GMT)
Video Emotion Open-vocabulary Recognition Based on Multimodal Large Language Model [5.3] 本稿では、MLLM技術を用いてビデオからオープン語彙感情ラベルを生成する方法を紹介する。
MER2024課題のMER-OV(Open-Word Emotion Recognition)において,本手法は重要な優位性を実現し,複雑な感情計算の能力に優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:17:18 GMT)
Losses resistant verification of quantum non-Gaussian photon statistics [5.3] 光の量子非ガウス状態は、量子技術における様々な応用に欠かせない基本的な性質を持つ。
多くの特徴は、光学的損失と検出器の非効率のため、標準基準を用いて検出することが困難である。
我々は、既知の光学的損失と検出器の非効率性をその導出に組み込む量子非ガウス的証人を利用した損失軽減検証技術を採用している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:54:46 GMT)
HiMA: Hierarchical Quantum Microarchitecture for Qubit-Scaling and Quantum Process-Level Parallelism [5.2] 量子ビットスケーリングを容易にし,量子プロセスレベルの並列性を活用するための新しい階層型マイクロアーキテクチャ(HiMA)を提案する。
このマイクロアーキテクチャは、(i)離散量子ビットレベル駆動と読み出し、(ii)プロセスベースの階層的トリガ機構、(iii)ステージングトリガ技術によるマルチプロセスの3つのコア要素に基づいている。
我々は、72量子ビット超伝導量子処理ユニットの制御系としてHiMAを実装し、パブリックな量子クラウドコンピューティングプラットフォームを提供する。
ベンチマークテストでは,5プロセス並列構成で最大4.89倍の高速化を実現した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:29:17 GMT)
Tracing Privacy Leakage of Language Models to Training Data via Adjusted Influence Functions [5.2] この研究は、インフルエンス関数(IF)を実装して、トレーニングデータにプライバシリークをトレースする。
本稿では,大きな勾配ノルムを持つトークンの重みを減少させるHuristically Adjusted IF (HAIF)を提案する。
HAIFは追跡精度を大幅に改善し、PII-Eデータセットでは20.96%から73.71%、PII-CRデータセットでは3.21%から45.93%に向上した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:35:48 GMT)
DreamFactory: Pioneering Multi-Scene Long Video Generation with a Multi-Agent Framework [5.2] textttDreamFactoryは長く、スタイリッシュに一貫性があり、複雑なビデオを生成する。
本稿では,クロスシーン顔距離スコアやクロスシーンスタイル一貫性スコアなどの新しい指標を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:21:13 GMT)
Harnessing quantum light for microscopic biomechanical imaging of cells and tissues [5.1] 本稿では,生物医学研究における光損傷の軽減を目的とした転換的アプローチを紹介する。
量子光励起ブリルアン散乱(SBS)イメージングコントラストを利用して、信号対雑音比を著しく高める。
この方法論の具体的な影響は、標本の生存可能性の顕著な3倍の増大によって証明されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:10:05 GMT)
Data-Centric Machine Learning for Earth Observation: Necessary and Sufficient Features [5.1] モデル記述法を利用して、モデルが最適な性能に達するために必要な特徴を特定する。
一部のデータセットは、時間的なインスタンスの20%未満で最適な精度に達することができるが、他のデータセットでは、1つのモダリティから1つのバンドの時系列が十分である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:26:43 GMT)
An Analysis under a Unified Fomulation of Learning Algorithms with Output Constraints [5.1] ニューラルネットワーク(NN)は様々なタスクでよく機能するが、時には人間に非意味な結果をもたらす。
トレーニング中に出力制約を減らして人間の知識を注入することで、モデルの性能を改善し、制約違反を減らすことができる。
メインタスクの情報と制約注入を統合化するための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:55:22 GMT)
Articulatory Encodec: Coding Speech through Vocal Tract Kinematics [5.1] 調音エンコーデック(Articulatory Encodec)は、音声音声から調音特徴を推定する調音解析モデルである。
話者埋め込みは音節から効果的に切り離され、アクセントを保ったゼロショット音声変換が可能となる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:56:45 GMT)
UNetMamba: Efficient UNet-Like Mamba for Semantic Segmentation of High-Resolution Remote Sensing Images [5.0] 本稿では,新しいマンバに基づくセマンティックセグメンテーションモデルであるUNetMambaを提案する。
これは、高解像度画像内の複雑な情報を効率的にデコードできるMamba Decoder (MSD) と、ローカル・スーパービジョン・モジュール (LSM) を組み込んでいる。
UNet-Mambaは、mIoUがLoveDAで0.87%増加し、ISPRS Vaihingenで0.36%向上した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:53:53 GMT)
Estimating Contribution Quality in Online Deliberations Using a Large Language Model [4.9] 8人のアノテータとともに大きな言語モデル(LLM)を用いて、正当化、新規性、会話の拡張、さらなる拡張の可能性に基づいて貢献度を評価する。
他のアノテータからの平均評価を根拠として、モデルが個々のアノテータより優れていることを発見した。
本研究は,ナッジが検討の質に与える影響を評価することによって,自動品質評価の有用性について述べる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:41:32 GMT)
DeRainGS: Gaussian Splatting for Enhanced Scene Reconstruction in Rainy [4.9] 本研究では, 降雨環境における3次元再構築の課題について紹介する(3DRRE)。
このタスクをベンチマークするために、合成画像と実世界のシーン画像の両方の多様なコレクションからなるHydroViewsデータセットを構築した。
降雨環境の復元に適した3DGS法であるDeRainGSを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:39:18 GMT)
Two infinite families of facets of the holographic entropy cone [4.9] 我々は、最近証明されたホログラフィックエントロピーの不等式の無限族が極大にきついこと、すなわち、ホログラフィックエントロピー円錐の対称性面であることを検証する。
星グラフ上では、両方の不等式族は、サブシステムに作用する二面体に対して、情報の集中/拡散の程度を定量化する。
さらに、K-基底に見られるトーリック不等式は、四者と六者完全テンソルの間の興味深い相互作用を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:14:40 GMT)
Probabilistic Medical Predictions of Large Language Models [4.8] LLM(Large Language Models)は、迅速な工学を通して臨床応用に有意な可能性を証明している。
LLMの数値推論における制限は、これらのテキスト生成確率の信頼性に関する懸念を引き起こす。
5つの医学データセットにまたがる6つの高度なオープンソースLSMを用いて実験したところ、明示的確率の性能は暗黙的確率よりも一貫して低いことがわかった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:47:17 GMT)
On the Interchangeability of Positional Embeddings in Multilingual Neural Machine Translation Models [4.6] 本研究では,NMTモデルの位置埋め込みを絶対正弦波PEからRoPEやALiBiなどの相対的アプローチに効率的に切り替える可能性を探る。
以上の結果より, 副鼻腔PEをロPEとALiBiに置き換えることにより, 少ない品質データで微調整を行うことにより, 性能損失を低減できることがわかった。
これらの相対的PEをスクラッチからトレーニングしたモデルでさえ、微調整されたモデルにわずかに劣り、我々の仮説の効率性と妥当性を裏付ける。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:23:34 GMT)
The Tug-of-War Between Deepfake Generation and Detection [4.6] マルチモーダル生成モデルは急速に進化しており、現実的なビデオやオーディオの生成が急増している。
ディープフェイクビデオは、個人を説得力を持って偽造することができるが、悪用の可能性から特に注目を集めている。
本研究では,ディープフェイク映像の生成と検出の両面を考察し,効果的な対策の必要性を強調した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:33:02 GMT)
Leveraging Large Language Models for Enhancing the Understandability of Generated Unit Tests [4.6] 我々は,検索ベースのソフトウェアテストと大規模言語モデルを組み合わせたUTGenを導入し,自動生成テストケースの理解性を向上する。
UTGenテストケースで課題に取り組む参加者は、最大33%のバグを修正し、ベースラインテストケースと比較して最大20%の時間を使用できます。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:35:34 GMT)
An Improved Phase Coding Audio Steganography Algorithm [4.5] AI技術は音声のクローン化をますます利用しやすくし、AI生成オーディオ偽造の不正行為の増加につながっている。
本研究では,中間位相成分にデータを埋め込んで動的に音声信号を分割する位相符号化型オーディオステガノグラフィーアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:25:31 GMT)
Ancient Wisdom, Modern Tools: Exploring Retrieval-Augmented LLMs for Ancient Indian Philosophy [4.5] 標準の非RAG LLMに対してRAGモデルを開発・ベンチマークする。
人間による評価では、RAGモデルは、事実および包括的応答を生成する上で、標準モデルよりも著しく優れていた。
本研究は,現代の大規模言語モデルと古代の知識システムとを効果的に統合するための知見を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:21 GMT)
Annealed Sinkhorn for Optimal Transport: convergence, regularization path and debiasing [4.4] Sinkhornのアルゴリズムは、大規模な最適輸送(OT)問題を解決する方法である。
コンケーブスケジュールアルゴリズムがOTを解くことは、$beta_tto+infty$と$beta_t-beta_t-1to 0$の場合に限る。
本稿では, 緩和誤差を低減するため, 簡易なアンナーレ・シンクホーンの修正を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:47:01 GMT)
FedMoE: Personalized Federated Learning via Heterogeneous Mixture of Experts [4.4] 我々は、データ不均一性に対処するための効率的パーソナライズされたFederated LearningフレームワークであるFedMoEを紹介する。
FedMoEは2つの微調整段階から構成されており、第1段階では、観測されたアクティベーションパターンに基づいて探索を行うことで問題を単純化する。
第2段階では、これらのサブモデルはさらなるトレーニングのためにクライアントに配布され、サーバ集約のために返される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:16:12 GMT)
Leveraging Fine-Tuned Retrieval-Augmented Generation with Long-Context Support: For 3GPP Standards [4.3] 大型言語モデル(LLM)は電気通信の技術的標準と競合する。
Phi-2小言語モデル(SLM)に基づく細調整検索拡張生成(RAG)システムを提案する。
本実験は,通信分野における既存の質問応答手法よりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:00:05 GMT)
ML-Mamba: Efficient Multi-Modal Large Language Model Utilizing Mamba-2 [4.3] 本稿では,マルチモーダル言語モデルであるML-Mambaを紹介する。
トランスフォーマーベースのバックボーンを事前訓練したMamba-2モデルに置き換え、マルチモーダル学習に2次元視覚選択的走査機構を統合する方法を模索する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:52:52 GMT)
Automated Synthesis of Fault-Tolerant State Preparation Circuits for Quantum Error Correction Codes [4.3] 任意のCSSコードに対するフォールトトレラントな状態準備回路の自動化手法を提案する。
距離3を超える非決定論的状態準備回路の一般構成を提供する。
結果として得られたメソッドは、ミュンヘン量子ツールキットの一部として公開されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:01 GMT)
PathMLP: Smooth Path Towards High-order Homophily [4.3] 実世界のグラフはヘテロフィリーが増加しており、ノードはもはや同じラベルを持つノードに接続されない傾向にある。
本稿では,多層パーセプトロン(MLP)に基づく軽量モデルPathMLPを提案する。
提案手法は,20のデータセットのうち16のベースラインを上回り,ヘテロフィリ問題を緩和する上での有効性と優位性を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:39:15 GMT)
Proximal Policy Optimization with Graph Neural Networks for Optimal Power Flow [4.3] グラフニューラルネットワーク(GNN)は、データに機械学習(ML)アルゴリズムを自然に使用可能にする。
深層強化学習(DRL)は、複雑な意思決定問題を解決する強力な能力で知られている。
問題を解決する方法を学ぶアーキテクチャを提案し、同時にシナリオを発見できるアーキテクチャを提案します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:35:36 GMT)
What Drives Online Popularity: Author, Content or Sharers? Estimating Spread Dynamics with Bayesian Mixture Hawkes [4.2] 本研究では,ソース,コンテンツ,拡散の影響を共同学習するために,ベイズ混合ホークス(BMH)モデルを提案する。
2つの学習課題(コールドスタート人気予測と時間プロファイル性能)でBMHモデルをテストし、2つの実世界のリツイートカスケードデータセットに適用した。
BMHモデルでは、議論を呼んでいるパブリッシャーと信頼できるパブリッシャーの間で、スタイルの有効性の違いが明らかになっている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:36:19 GMT)
FairX: A comprehensive benchmarking tool for model analysis using fairness, utility, and explainability [4.2] FairXは、フェアネス、ユーティリティ、およびeXplainability(XAI)の傘の下でのモデルの包括的分析のために設計されたオープンソースのベンチマークツールである。
FairXは、ベンチマークのバイアス除去モデルをトレーニングし、さまざまな公正度メトリクス、データユーティリティメトリクスを使用して公正性を評価し、統一されたフレームワーク内でモデル予測の説明を生成する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:01:52 GMT)
A Markovian Model for Learning-to-Optimize [4.1] 本稿では,最適化アルゴリズムを念頭に置いて,反復アルゴリズムの確率モデルを提案する。
このモデルに基づいて、学習アルゴリズムの軌道上で定義される関数に対するPAC-Bayesian一般化境界を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:00:22 GMT)
Taming Generative Diffusion for Universal Blind Image Restoration [4.1] BIR-Dはマルチ誘導ブラインド画像復元を実現することができる。
また、複数の複雑な分解を行うイメージを復元し、実用的な応用を実証することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:19:54 GMT)
Multimodal Datasets and Benchmarks for Reasoning about Dynamic Spatio-Temporality in Everyday Environments [4.0] 我々のデータセットは、ロボットがホームセッティングにおける人間の行動や環境をどの程度理解できるかを測定する。
予備実験は、私たちのデータセットがAIの日常生活の理解を測定するのに役立つことを示唆している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:27:55 GMT)
Explainable Deep Learning Framework for Human Activity Recognition [3.9] 本稿では,HARモデルの解釈性と有効性を高めるモデル非依存フレームワークを提案する。
競争力のあるデータ拡張を実装することで、我々のフレームワークはモデル決定の直感的でアクセスしやすい説明を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:59:55 GMT)
Uncertainty estimation of machine learning spatial precipitation predictions from satellite data [3.9] 衛星データとゲージデータを機械学習と組み合わせることで、高解像度の降水データセットを生成する。
6つのアルゴリズムをベンチマークすることで、そのような推定を最適に行う方法のギャップに対処する。
本研究では,空間データ予測の不確かさを推定する機械学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:49:46 GMT)
Parallel Algorithms for Median Consensus Clustering in Complex Networks [3.7] 我々は,グラフの多数の異なるクラスタリングソリューションのコンセンサスを求めるアルゴリズムを開発した。
我々のアルゴリズムはグラフ構造を考慮に入れ、他の手法よりもはるかに高速な品質の解を求める。
並列アルゴリズムは,64コアを大規模実世界のグラフに利用することにより,35倍の高速化を実現する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:27:57 GMT)
Identifying Locally Turbulent Vortices within Instabilities [3.7] 本研究では, 不安定岩などの乱流2次元流れにおける局所乱流渦の自動検出手法を提案する。
具体的には、流れのエントロフィは、トポロジカルな持続によって単純化され、単純化されたエントロフィのモース複合体の盆地を採取して渦を抽出する。
本研究では, 渦の挙動と理想的な乱流渦との相関を推定するために, 運動エネルギースペクトルに基づく指標セットを導入する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:23:22 GMT)
Exceptional swallowtail degeneracies in driven-dissipative quadrature squeezing [3.6] そこで本研究では,2モード駆動散逸式2次スクイージング系の力学において,カクテルカタストロフィが自然に存在することを示す。
本研究では,クモの退化構造が複雑な固有値の非自明なブレイディングを可能にすることを明らかにする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:41:59 GMT)
Diversity and stylization of the contemporary user-generated visual arts in the complexity-entropy plane [3.6] 複雑エントロピー平面(C-H)を用いて視覚芸術様式の出現とスタイル化を導く進化過程を考察する。
2010年から2020年にかけてDeviantArtとBehanceプラットフォームで撮影された149,780の画像を分析した。
その結果,視覚芸術様式のC-H情報と多面像の特徴の相違との間に有意な統計的関係が認められた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:42:06 GMT)
Decoding Pedestrian Stress on Urban Streets using Electrodermal Activity Monitoring in Virtual Immersive Reality [3.6] 本稿では, 歩行者が道路を横断する際のストレスを, 異なる実験操作で系統的に検討する。
実験には合計171人の個人が参加し、信号制御なしで中間ブロックで双方向の道路を横断する任務を負った。
その結果,道路中央中央の道路が避難所として機能し,ストレスが著しく減少した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:46:30 GMT)
Generalization Gap in Data Augmentation: Insights from Illumination [3.5] 実世界の照明条件下で訓練されたモデルと、拡張現実で訓練されたモデルとの一般化の相違について検討する。
その結果,様々なデータ拡張手法を適用した結果,モデルの性能は大幅に向上した。
しかし、様々なデータ拡張手法を利用した後も、顕著な一般化のギャップが残っている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:50:28 GMT)
Against All Odds: Overcoming Typology, Script, and Language Confusion in Multilingual Embedding Inversion Attacks [3.2] 大規模言語モデル(LLM)は、敵、バックドア、侵入攻撃などの侵入を通じて、サイバー攻撃者による悪意ある影響を受けやすい。
本研究では,20言語にまたがる言語間およびクロススクリプト・インバージョン・インバージョン・アタックの文脈における多言語LDMの安全性について検討する。
アラビア文字とキリル文字で書かれた言語は、インド・アーリア語族の言語と同様に、特にインバージョンに弱いことが示唆された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:16:34 GMT)
No Such Thing as a General Learner: Language models and their dual optimization [3.2] 我々は、人間もLLMも、様々な意味で一般の学習者ではないと論じている。
言語に対する人間の認知バイアスの重要性について,LLMのパフォーマンスが人間と類似しているか異同であるかは,重要な議論を軽視するものではないと論じる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:04:08 GMT)
Scalable and non-iterative graphical model estimation [3.2] 反復的比例フィッティング(IPF)とその変種は、非方向性のグラフィカルモデル推定のデフォルト手法である。
高次元における正定値グラフィカルモデル推定のための新規で高速な非定性的手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:46:00 GMT)
Calibrating the Predictions for Top-N Recommendations [3.2] 従来の校正手法が上位N項目の誤校正予測をもたらすことを示す。
そこで本研究では,トップN項目に着目したキャリブレーションモデルの最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:06:28 GMT)
Depends-Kotlin: A Cross-Language Kotlin Dependency Extractor [3.1] Depends-KotlinはKotlinコード内のエンティティの依存関係の抽出をサポートする。
KotlinとJava間の依存関係関係も抽出できる。
Depends-Kotlinは、Kotlin-KotlinとKotlin-Javaの依存関係関係を解決する際に、高い精度とパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:39:24 GMT)
Research on the Application of Large Language Models in Automatic Question Generation: A Case Study of ChatGLM in the Context of High School Information Technology Curriculum [3.1] モデルは多様な質問を生成するためにガイドされ、ドメインの専門家によって包括的に評価される。
以上の結果から,ChatGLMは人為的な質問に対して,明快さと教師の利用意欲で優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:38:32 GMT)
JieHua Paintings Style Feature Extracting Model using Stable Diffusion with ControlNet [3.0] FSDMCのトレーニングデータは、インターネットから収集されたオープンソースのJiehuaアーティストの作品に基づいている。
FSDMCはデータセット上で3.27のFIDを達成し、専門家評価の点でもCycleGANを上回っている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:11:01 GMT)
Rectified Iterative Disparity for Stereo Matching [2.9] コストボリュームに基づく不確実性不確実性推定(UEC)を提案する。
画像対から得られるコストボリュームの豊富な類似性情報に基づいて,提案したUCCは,計算コストの低い競合性能を実現することができる。
提案手法を組み合わせた高性能ステレオアーキテクチャDR Stereoを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:47:04 GMT)
On Learnable Parameters of Optimal and Suboptimal Deep Learning Models [2.9] ディープラーニングモデルの構造的および運用的側面について検討する。
本研究は,学習可能なパラメータ(重み)統計,分布,ノード間相互作用,可視化のニュアンスに着目した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:50:37 GMT)
Joint Constellation Shaping Using Gradient Descent Approach for MU-MIMO Broadcast Channel [2.9] 完全チャネル知識を持つ放送チャンネルの連星座を最適化するための学習に基づくアプローチを提案する。
提案手法の目的は、送信機と受信機間の最小の相互情報を最大化することである。
本手法により得られたレートは,線形プリコーダで得られたレートと比較される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:26:00 GMT)
PermitQA: A Benchmark for Retrieval Augmented Generation in Wind Siting and Permitting domain [2.9] ドメイン関連RAGベンチマークを生成するための包括的なフレームワークを提案する。
我々のフレームワークは、人間(ドメインの専門家)-AI大言語モデル(LLM)による自動質問応答生成に基づいている。
ケーススタディとして、風の座と許容領域に関する第一種ベンチマークであるPermitQAを導入することで、このフレームワークを実証する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:43:11 GMT)
Evaluating Dialect Robustness of Language Models via Conversation Understanding [2.9] 私たちは「タブー」という語遊びをする人間同士の英語(アメリカ英語またはインド英語)の会話を使う。
目的語予測 (TWP) (textiti.e.$, predict the masked target word in a conversation) と目標語選択 (TWS) (textiti.e.$, select the most likely masked target word in a conversation) という2つの評価課題を定式化する。
私たちは、en-MV(en-USが方言情報を含むように変換される)とen-TR(方言情報を含む)の2つのサブセットを作成します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:10:36 GMT)
Runtime Verification via Rational Monitor with Imperfect Information [2.7] 従来の検証では完全な情報を前提としており、監視コンポーネントがすべてを正確に認識している。
この仮定は、特に実環境で動作する自律システムでは、しばしば失敗する。
我々は、リニア時間論理特性の標準RVを拡張し、モニターが不完全な情報を持ち、合理的に振る舞うシナリオに対応する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:56:06 GMT)
Decoding SEC Actions: Enforcement Trends through Analyzing Blockchain litigation using LLM-based Thematic Factor Mapping [2.6] この研究は、グローバル暗号規制に影響を及ぼすとして、特に米国証券取引委員会(SEC)によるブロックチェーン企業に対する米国の訴訟に焦点を当てている。
SECが2012年から2024年まで、ブロックチェーン企業に対して起こしたすべての苦情を、当社の研究で概念化されたテーマ的要因にマッピングして、SECのアクションを駆動する要因を詳細に説明します。
本論では, 主題的要因を定量化し, 苦情の中で引用される特定の法的行為に対する影響を年次的に評価することにより, 規制の重点, パターン, 傾向分析を識別することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:30:59 GMT)
Revisiting FunnyBirds evaluation framework for prototypical parts networks [2.6] 境界ボックスと類似度マップという2種類のProtoPNet視覚化のメトリクススコアを比較した。
分析の結果,類似性マップの利用はProtoPNetの本質とよく一致していることがわかった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:58:34 GMT)
Private Counting of Distinct Elements in the Turnstile Model and Extensions [2.5] スパースベクトル法に基づく非常に単純なアルゴリズムは、アイテムレベルの$(epsilon,delta)$-differential privacyに対して厳密な加算誤差を実現する。
2つ目の結果は、大規模なアルゴリズムでは、アイテムレベルの差分プライバシからイベントレベルの差分プライバシまでのバウンドが低いことを示すバウンドである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:06:22 GMT)
Only Strict Saddles in the Energy Landscape of Predictive Coding Networks? [2.5] 予測符号化(英: Predictive coding, PC)は、重み更新前のネットワーク活動に対して反復推論を行うエネルギーベースの学習アルゴリズムである。
ネットワーク活動の(参照)平衡におけるPCエネルギー景観の幾何学について検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:23:44 GMT)
Unlocking Sustainability Compliance: Characterizing the EU Taxonomy for Business Process Management [2.5] EUは持続可能な活動の分類法を開発しており、それがいつビジネスプラクティスが持続可能と考えられるかを記述している。
ビジネスプロセスの実行が規制の制約に準拠するかどうかをデータ駆動方式で評価する。
分類学の制約の多くは、特にエネルギー、製造、輸送の分野において、適合性チェックに利用できる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:30:11 GMT)
Let Community Rules Be Reflected in Online Content Moderation [2.5] 本研究では,コミュニティルールに基づくコンテンツモデレーションフレームワークを提案する。
コミュニティルールをユーザ生成コンテンツのモデレーションに統合する。
特に、コミュニティルールを取り入れることで、コンテンツモデレーションにおけるモデルパフォーマンスが大幅に向上する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:38:02 GMT)
UniBridge: A Unified Approach to Cross-Lingual Transfer Learning for Low-Resource Languages [2.5] クロスリンガル・トランスファー・ラーニングの有効性を改善するための総合的なアプローチであるUniBridgeを紹介する。
本手法は,埋め込みの初期化と最適な語彙サイズという,言語モデルの2つの重要な要素に対処する。
多言語データセットを用いた実験により,いくつかの言語でF1スコアが大幅に改善された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:55:29 GMT)
Lowering PyTorch's Memory Consumption for Selective Differentiation [2.4] PyTorchの現在のAD実装は、グラフを格納する際のパラメータの微分性に関する情報を無視している。
このようなレイヤのドロップインで微分可能性に依存しない実装を提供し、実行時間に影響を与えることなくメモリ削減能力を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:21:52 GMT)
Copilot-in-the-Loop: Fixing Code Smells in Copilot-Generated Python Code using Copilot [2.3] Pythonはコードの臭いがある場合、可読性と保守性が低下する。
大規模言語モデルの最近の進歩は、コード生成と理解の両方のためのAI対応ツールへの関心が高まっている。
GitHub Copilotは、広く使われているツールのひとつだ。
2023年9月にリリースされたCopilot Chatは、自然言語によるコーディングを容易にするインタラクティブツールとして機能する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:57:43 GMT)
FAGStyle: Feature Augmentation on Geodesic Surface for Zero-shot Text-guided Diffusion Image Style Transfer [2.3] イメージスタイル転送の目標は、オリジナルのコンテンツを維持しながら、スタイル参照によってガイドされたイメージをレンダリングすることである。
ゼロショットテキスト誘導拡散画像スタイル転送方式であるFAGStyleを紹介する。
提案手法は,スライディングウィンドウクロップを組み込むことにより,パッチ間の情報インタラクションを向上させる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:24:43 GMT)
Toward Enhancing Vehicle Color Recognition in Adverse Conditions: A Dataset and Benchmark [2.3] 車両色認識(VCR)は、視覚的に区別可能な車両の属性であるため、重要な研究の関心を集めている。
このタスクの既存の手法の成功にもかかわらず、文献で使用されるデータセットの比較的低い複雑さは、ほとんど見過ごされてきている。
この研究は、より困難なVCRシナリオを表す新しいデータセットをコンパイルすることで、このギャップに対処する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:54:41 GMT)
Active learning for efficient data selection in radio-signal based positioning via deep learning [2.3] 深層学習による無線信号に基づくユーザ機器の位置決めの問題点を考察する。
セルラーネットワークでは、データ収集ステップは高い通信オーバーヘッドを引き起こす可能性がある。
本稿では,効率的なデータ収集のための能動的学習手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:59:35 GMT)
Chernoff Bounds for Tensor Expanders on Riemannian Manifolds Using Graph Laplacian Approximation [2.3] 本稿では,確率末尾境界解析の進歩について述べる。
マルコフ境界、チェビシェフ境界、チェルノフ境界のような伝統的な尾の境界は、多くの科学・工学分野において有益であることが証明されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:59:27 GMT)
Query languages for neural networks [2.2] 我々は、ニューラルネットワークモデルへのアクセスにおいて主に異なる一階述語論理に基づく異なるクエリ言語について研究する。
実数体上の一階述語論理は、ネットワークをブラックボックスと見なす言語を自然に生成する。
ホワイトボックス言語は、ネットワークを重み付きグラフと見なし、重み付き項の和で一階述語論理を拡張することで得られる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:50:01 GMT)
Image Score: Learning and Evaluating Human Preferences for Mercari Search [2.2] 大規模言語モデル(LLM)は、データラベリングタスクに積極的に研究され、使用されている。
本稿では,電子商取引環境における画像品質の評価と予測のためのコスト効率の高いLCM駆動手法を提案する。
LLMが生成したラベルはMercuri上でのユーザ行動と相関していることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:30:06 GMT)
Valuing an Engagement Surface using a Large Scale Dynamic Causal Model [2.1] AIを利用したエンゲージメントサーフェス(ES)は、小売サービス全体で広く普及している。
本研究では,ESに起因する値の分散化と,その有効性を評価するために,大規模に因果モデルを構築した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:42:45 GMT)
Security Evaluation in Software-Defined Networks [2.0] クラウドコンピューティングは、Data Centre(DC)ネットワークの要求を大幅に増加させた。
従来のDCは、クラウドコンピューティングアプリケーションのフレキシブルで集中管理された要件を満たすのに苦労しています。
本稿では、SDN(Software-Defined Networks)のセキュリティを評価するためのフレームワークについて述べる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:56:14 GMT)
Neural Symbolic Logical Rule Learner for Interpretable Learning [2.0] ルールベースのニューラルネットワークは、予測と解釈の両方の論理ルールを学ぶことによって、解釈可能な分類を可能にする。
我々は、選択離散ニューラルネットワークを利用した正規形規則学習アルゴリズム(NFRL)を導入し、共役正規形(CNF)と共役正規形(DNF)の両方の規則を学習する。
11のデータセットに関する広範な実験を通じて、NFRLは12の最先端の代替品と比較して、優れた分類性能、学習ルールの品質、効率と解釈性を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:09:12 GMT)
An Open Knowledge Graph-Based Approach for Mapping Concepts and Requirements between the EU AI Act and International Standards [1.9] EUのAI法は、規制の遵守に関する技術的要件に従って、そのような組織の焦点をシフトする。
本稿では、規則や標準における規範文に関連する用語と要件をマッピングするための、シンプルで繰り返し可能なメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:21:09 GMT)
Improving Calibration by Relating Focal Loss, Temperature Scaling, and Properness [1.9] クロスエントロピーは、訓練データに基づいてよく校正されたクラス確率を生成するために分類器をインセンティブ化する。
焦点損失を信頼性向上変換と適切な損失に分解できることを示す。
焦点温度のスケーリング - 焦点温度のキャリブレーションと温度のスケーリングを組み合わせた新しいポストホックキャリブレーション法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:10:44 GMT)
The Self-Contained Negation Test Set [1.9] 我々は、入力の極性の関数としてのPLMの予測の修正を研究するGubelmann and Handschuh (2022) を英語で構築する。
このテストでは、マスクされた位置で終わる自己完結'の入力を使用します。
改良版である自己完結ネグテストを提案し、より制御され、より体系的であり、最小対を形成する例に基づいている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:38:15 GMT)
A Human Word Association based model for topic detection in social networks [1.9] 本稿では,単語連想の心的能力を模倣する概念に基づく,ソーシャルネットワークの話題検出フレームワークを提案する。
このフレームワークの性能は、トピック検出の分野におけるベンチマークであるFA-CUPデータセットを用いて評価される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:25:25 GMT)
A theory of time based on wavefunction collapse [1.8] 時間の経過は、ゲージ不変状態に向かって崩壊する瞬間状態の連続過程である。
結果として生じる時間進化のユニタリティと指向性は、宇宙論のミニスーパースペースモデルとして実証される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:46 GMT)
Improving the Scan-rescan Precision of AI-based CMR Biomarker Estimation [1.8] ディープラーニング(DL)法を用いた心血管磁気共鳴(CMR)データからの心臓バイオマーカーの定量化には多くの利点がある。
しかし、バイオマーカー推定のスキャン-スキャン精度に焦点を当てた研究はごくわずかである。
そこで本研究では,高セグメンテーション精度だけでなく,スキャン・レスカン精度の向上にも焦点をあてたバイオマーカー推定パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:24:27 GMT)
A Constraint Programming Approach to Fair High School Course Scheduling [1.7] 近年、学生の人口増加やコース多様性の増大に伴い、学生はコーススケジューリング法が不公平であると感じている。
本研究では,学生の選好に基づいて,実行可能で公平な授業スケジュールを生成する手法を開発した。
その結果,本アルゴリズムは実行可能かつ公平なスケジュールを生成することができることがわかった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:14:46 GMT)
Physics-informed Discovery of State Variables in Second-Order and Hamiltonian Systems [1.7] 本研究では, 2階ハミルトニアン系の物理特性を利用してベースラインモデルを制約する手法を提案する。
提案モデルでは,非冗長かつ解釈可能な状態変数の最小セットを特定することにより,ベースラインモデルよりも優れる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:10:50 GMT)
Improving global awareness of linkset predictions using Cross-Attentive Modulation tokens [1.7] Cross-Attentive Modulation (CAM)トークンは、コンテキスト対応の計算を可能にするためにノードとエッジレベルの変調を条件付けるために使用されるクロスアテンティブユニットを導入している。
いくつかの置換不変アーキテクチャで実装し、私たちの仕事のメリットを証明するベンチマークをベンチマークします。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:21:42 GMT)
Investigating Imperceptibility of Adversarial Attacks on Tabular Data: An Empirical Analysis [1.7] 敵対的攻撃は、機械学習モデルに対する潜在的な脅威である。
これらの攻撃は入力データに対する知覚不能な摂動を通じて誤った予測を引き起こす。
本研究は、敵攻撃の非受容性を評価するための重要な特徴とそれに対応する指標のセットを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:48:56 GMT)
Encircling the Liouvillian exceptional points: a brief review [1.6] リウヴィリアの例外点はしばしば非エルミート・ハミルトニアンのそれと異なる性質を持つ。
リウヴィリアの例外点が原子の蒸気、超伝導量子ビット、超低温のイオンや原子などの量子系に広く存在するため、近年は注目が集まっている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:46:04 GMT)
Clinical Insights: A Comprehensive Review of Language Models in Medicine [1.5] この研究は、LLMの基盤技術から、ドメイン固有モデルやマルチモーダル統合の最新の発展まで、その進化を辿っている。
本稿では、これらの技術が臨床効率を高めるための機会と、倫理、データプライバシ、実装の観点からそれらがもたらす課題について論じる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:59:33 GMT)
Solving Decision Theory Problems with Probabilistic Answer Set Programming [1.5] 本稿では,確率的解答集合プログラミングを用いて決定論問題を符号化する可能性を紹介する。
我々のアルゴリズムは、プログラムの非自明なインスタンスを妥当な時間で管理できる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:44:16 GMT)
Time Series Foundation Models and Deep Learning Architectures for Earthquake Temporal and Spatial Nowcasting [1.5] 既成の基盤モデルの総合的な評価を欠いている。
我々はMultiFoundationQuakeとGNNCoderという2つのイノベーションアプローチを紹介した。
我々は,南カリフォルニアの0.1度空間ビン内における今後14日間の時系列予測問題として,地震予報を定式化した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:57:03 GMT)
ControlCol: Controllability in Automatic Speaker Video Colorization [1.5] ユーザに対して制御性を提供する新しい自動話者ビデオカラー化システムを提案する。
ControlColは、Grid and Lombard Gridデータセットの最先端のDeOldifyよりも3.5%パフォーマンスがよい。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:35:37 GMT)
Advances in Preference-based Reinforcement Learning: A Review [1.5] 嗜好に基づく強化学習(PbRL)は、人間の嗜好を数値的な報酬ではなく専門家からのフィードバックとして利用する。
我々はPbRLのスケーラビリティと効率を向上させる新しいアプローチを含む統一されたPbRLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:57:12 GMT)
One-to-one Correspondence between Deterministic Port-Based Teleportation and Unitary Estimation [1.5] ポートベースのテレポーテーションは量子テレポーテーションの変種であり、受信機は送信者と共有される絡み合った状態のポートの1つを選択できるが、他のリカバリ操作は適用できない。
我々は,$d$次元の状態をテレポートするための$N=n+1ポートを用いた決定論的ポートベーステレポーテーション(dPBT)の最適忠実度が,$d$次元のユニタリ推定の最適忠実度に等しいことを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:09 GMT)
Enhancing Ship Classification in Optical Satellite Imagery: Integrating Convolutional Block Attention Module with ResNet for Improved Performance [1.5] 光衛星画像に基づく船舶分類のための高度な畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
最初に標準CBAMを導入し、より情報的な特徴に焦点を向け、87%の精度でモデルに焦点をあてた。
このモデルでは95%の精度を示し、精度、リコール、F1は様々な船級で大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:37:20 GMT)
CMAB: A First National-Scale Multi-Attribute Building Dataset in China Derived from Open Source Data and GeoAI [1.4] 本稿では,3,667の空間都市,2,900万の建物,213億平方メートルの屋上を対象とする全国規模のマルチアトリビュート・ビルディング・データセット(CMAB)について述べる。
何十億もの高解像度のGoogle Earth画像と6000万のストリートビュー画像(SVI)を使って、各ビルの屋上、高さ、機能、年齢、品質特性を生成しました。
我々のデータセットと結果は、グローバルSDGと都市計画にとって不可欠である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:56:15 GMT)
Non-Clifford diagonalization for measurement shot reduction in quantum expectation value estimation [1.4] 短期量子コンピュータ上での期待値を推定するには、しばしば非常に多くの測定を必要とする。
本稿では,この可換性の制約を緩和する手法を提案する。
我々は、$k$-NoCliDが回路ショットの数を減少させることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:03 GMT)
Unveiling the Importance of Non-Shortest Paths in Quantum Networks [1.3] コンカレンス・パーコレーションは非ショートパスに依存しており,これらのパスが再帰および拡張された場合,デトツーリングに対する高いレジリエンスを示す。
本研究はQN設計における重要な原則として,非ホルモン経路が古典的パーコレーションに比べてQN接続性に大きく寄与することを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:42:53 GMT)
Video-to-Text Pedestrian Monitoring (VTPM): Leveraging Computer Vision and Large Language Models for Privacy-Preserve Pedestrian Activity Monitoring at Intersections [1.3] Video-to-Text Pedestrian Monitoring (VTPM)は交差点での歩行者の動きを監視し、リアルタイムのテキストレポートを生成する。
VTPMは歩行者検出と追跡にコンピュータビジョンモデルを使用し、ビデオフレームあたり0.05秒のレイテンシを実現する。
信号データを組み込むことで、90.2%の精度で交差違反を検出する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:21:53 GMT)
Automating Semantic Analysis of System Assurance Cases using Goal-directed ASP [1.2] 本稿では, セマンティックルールに基づく分析機能を備えた Assurance 2.0 の拡張手法を提案する。
本稿では, 論理的整合性, 妥当性, 不整合性など, 保証事例のユニークな意味的側面について考察する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:22:43 GMT)
Quantifying the effect of X-ray scattering for data generation in real-time defect detection [1.1] インライン検出は高度に正確で堅牢で高速なアルゴリズムを必要とする。
DCNNは、大量のラベル付きデータが利用できる場合、これらの要件を満たす。
X線散乱はシミュレーションするのに計算コストがかかることが知られている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:28:04 GMT)
Interpretable Deep Learning for Forecasting Online Advertising Costs: Insights from the Competitive Bidding Landscape [1.1] 本稿では,オンライン広告市場における日平均CPCの予測に様々な時系列予測手法を用いた総合的研究について述べる。
時間融合変換器(TFT)を含む統計モデル,機械学習技術,深層学習手法の性能評価を行った。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:18:34 GMT)
Clinical Context-aware Radiology Report Generation from Medical Images using Transformers [1.1] 胸部X線からのX線診断におけるトランスフォーマーモデルの有用性について検討した。
また,標準言語生成指標のみを用いて放射線学レポート生成を評価する際の限界も強調する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:04:25 GMT)
S4Sleep: Elucidating the design space of deep-learning-based sleep stage classification models [1.1] 本研究では,エンコーダ・予測アーキテクチャの幅広いカテゴリにおける設計選択について検討する。
時系列およびスペクトログラム入力表現の両方に適用可能なロバストアーキテクチャを同定する。
これらのアーキテクチャは、構造化状態空間モデルを積分成分として含み、統計的に重要な性能改善を実現する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:03:22 GMT)
Data-driven Modeling of Combined Sewer Systems for Urban Sustainability: An Empirical Evaluation [1.0] 気候変動は複雑な問題を引き起こし、極端な気象現象が頻繁になり、モデル化が困難になる。
降雨時の過バーデンド複合下水道は未処理排水を水面に流し込む。
ディープラーニング(DL)モデルは、下水道システムの複雑な力学をモデル化するためのコスト効率の良い代替手段を提供する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:46:58 GMT)
Exploiting XAI maps to improve MS lesion segmentation and detection in MRI [1.0] 本研究は, 病変特異的唾液度マップの特性を利用して, セグメンテーションと検出スコアを洗練させる方法について検討する。
第1組の地図から抽出した93個の放射能特性をロジスティック回帰モデルの訓練に用いた。
テストセットでは,初期モデルと比較してF1スコアとPPVが大きなマージンで改善された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:49:01 GMT)
Embedding Ordinality to Binary Loss Function for Improving Solar Flare Forecasting [1.0] 太陽フレア予測への応用を示す二元損失関数にオーディナリティをエンコードする新しい手法を提案する。
我々は、太陽円盤全体にわたる各ARのフレア予測を縦方向の制限なく可能とし、太陽フレア予測を強化した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:42:58 GMT)
Characterizing Online Toxicity During the 2022 Mpox Outbreak: A Computational Analysis of Topical and Network Dynamics [1.0] 2022年のムポックスの流行は、当初は「モンキーポックス」と呼ばれていたが、その後、関連するスティグマや社会的懸念を緩和するために改名された。
我々は660万以上のユニークツイートを収集し、コンテキスト、範囲、コンテンツ、話者、意図といった5つの次元から分析しました。
我々は、Twitter上での有害なオンライン談話(46.6%)、病気(46.6%)、健康政策と医療(19.3%)、ホモフォビア(23.9%)、政治など、高レベルのトピックを5つ特定した。
有毒なコンテンツのリツイートが広まっていたのに対して、影響力のあるユーザはリツイートを通じてこの有毒な行為に関わったり、反対したりすることはめったにない。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:31:01 GMT)
Challenges and Responses in the Practice of Large Language Models [0.9] 本稿は、現在注目されているAI分野に焦点を当て、あらゆる人生の歩みから広範囲で深い疑問を注意深く要約する。
業界動向、学術研究、技術革新、ビジネス応用など、さまざまな分野をカバーしている。
コンピュータパワーインフラストラクチャ、ソフトウェアアーキテクチャ、データリソース、アプリケーションシナリオ、脳科学の5つの中核的な側面から、これらの質問を体系的かつ慎重に分類し、整理する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:24:42 GMT)
Architectural Foundations for the Large Language Model Infrastructures [0.9] 大規模言語モデル(LLM)インフラストラクチャの開発は、人工知能における重要な取り組みである。
本稿では,LLMのインフラ,ソフトウェア,データ管理の複雑な状況について考察する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:34:56 GMT)
Deviations from the Nash equilibrium and emergence of tacit collusion in a two-player optimal execution game with reinforcement learning [0.9] 2つの自律的エージェントが市場の影響下で同じ資産を最適に清算することを学習するシナリオについて検討する。
その結果,エージェントが学んだ戦略は,対応する市場影響ゲームのナッシュ均衡から大きく逸脱していることがわかった。
市場のボラティリティの異なるレベルがエージェントのパフォーマンスと彼らが発見する均衡にどのように影響するかを考察する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:54:53 GMT)
Spin-Dependent Force and Inverted Harmonic Potential for Rapid Creation of Macroscopic Quantum Superpositions [0.9] マクロ的な空間重畳状態を生成する2つの方法が存在する。
本研究では、まず、スピン依存力を用いて初期空間分離を発生させ、次に、IPPを用いてウェーブパケットのコヒーレントな膨張軌道を達成する方法を統合する。
例えば、質量が10〜15ドル kgで大きさが50$mu$mの空間重ね合わせは0.1$秒で実現される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:02:11 GMT)
Does It Look Sequential? An Analysis of Datasets for Evaluation of Sequential Recommendations [0.8] 逐次リコメンデータシステムは、ユーザの履歴におけるインタラクションの順序を利用して、将来のインタラクションを予測することを目的としている。
シーケンシャルな構造を示すデータセットを使用して、シーケンシャルなレコメンデータを適切に評価することが重要です。
本研究では,ユーザの対話列のランダムシャッフルに基づくいくつかの手法を適用し,15個のデータセットの連続構造の強度を評価する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:40:07 GMT)
Detection of Under-represented Samples Using Dynamic Batch Training for Brain Tumor Segmentation from MR Images [0.8] 磁気共鳴イメージング(MR)における脳腫瘍は困難であり、時間を要する。
これらの課題は、MR画像から自動脳腫瘍分割法を開発することで解決できる。
U-Netに基づく様々なディープラーニングモデルが提案されている。
これらのディープラーニングモデルは、腫瘍画像のデータセットに基づいてトレーニングされ、マスクのセグメント化に使用される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:51:47 GMT)
Efficient generative adversarial networks using linear additive-attention Transformers [0.8] 本稿では,Ladaformerという新しいトランスフォーマーブロック上に構築した,効率的な生成対逆ネットワークであるLadaGANを提案する。
LadaGANは、さまざまな解像度のベンチマークデータセットにおいて、既存の畳み込みGANとTransformer GANを一貫して上回る。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:12:16 GMT)
It's Our Loss: No Privacy Amplification for Hidden State DP-SGD With Non-Convex Loss [0.8] 特定の損失関数に対して、DP-SGDの最終繰り返しは、最終損失関数と同じくらい多くの情報をリークすることを示す。
DP-SGDは一般にすべての(非)損失関数に対してプライバシーの増幅は不可能である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:20:25 GMT)
Security of quantum position-verification limits Hamiltonian simulation via holography [0.8] ホログラフィック量子誤り訂正符号を玩具モデルとして用いて,[MPS19]で確立された量子位置検証(QPV)とホログラフィーの関連性を検討した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:41:37 GMT)
Criteria of absolutely separability from spectrum for qudit-qudits states [0.7] 両分割状態空間 $mathcalH_mn=mathcalH_mn$ における四重項状態のスペクトルからの絶対分離性に関する特性について検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:07:09 GMT)
Rydberg electromagnetically induced transparency of $^{85}$Rb vapor in Ar, Ne and N$_2$ gases [0.7] ルビジウム(Rb)蒸気セルに不活性ガスを含む圧力5ドルTorrの電磁誘導透過(EIT)を報告した。
数mTorrから5Trrまでの圧力でアルゴン,ネオン,窒素ガスを含むRb気相セル中のEITスペクトルの周波数シフトと線幅拡大を測定した。
その結果,Rydberg-EITを低圧高周波放電における磁場診断のための全光・非侵入分光プローブとして確立する上で重要である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:17:57 GMT)
Quantum error correction for unresolvable spin ensemble [0.7] 未解決スピンアンサンブルに対する量子誤差補正手法を提案する。
基本的に混合された励起状態の重ね合わせを使用することで、個々のエラーと集合的エラーの両方から保護できるコードを見つける。
本稿では,集合的計測と制御のみで情報回復を実現する方法を示し,メモリ寿命の延長とロス耐性センシングへの応用を解説する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:56:07 GMT)
Energy Estimation of Last Mile Electric Vehicle Routes [0.6] ラストマイルのキャリアは、サステナビリティの目標を達成するために、電気自動車(EV)を配達船に組み入れている。
本稿では,ディープラーニングを用いた最終マイル配送経路におけるEVのエネルギー消費予測の問題に対処する。
私たちは、フィードフォワードニューラルネットワーク(NN)とリカレントニューラルネットワーク(RNN)から始まる、さまざまなディープラーニングソリューションを共有しています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:38:40 GMT)
Harvesting asymmetric steering via non-identical detectors [0.5] エネルギーギャップの異なる2つの非識別慣性検出器を含む非対称ステアリング収穫現象について検討した。
エネルギーギャップ差はArightarrow B$ステアリングの収穫可能範囲を大きくすることができる。
最大ステアリング非対称性は、二方向ステアリングと一方向ステアリングの間の変換を示す場合もある。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:00:54 GMT)
MIS-ME: A Multi-modal Framework for Soil Moisture Estimation [0.5] 地上局から撮影した実世界の画像とそれに対応する気象データからなるデータセットを開発した。
また,MIS-ME-Meteorological & Imageベースの土壌水分計を提案する。
分析の結果,MIS-MEのMAPEは10.14%であり,従来の単潮流法よりも優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:47:26 GMT)
Matmul or No Matmal in the Era of 1-bit LLMs [0.5] 1ビットの大規模言語モデル(LLM)が注目され、新たな研究機会が開かれた。
しかし、1ビット LLM は射影層に極端な量子化を適用することで、少数のモデルを改善するのみである。
本研究では, 1 ビット LLM コンテキストに適した Amdahl's Law の適応について述べる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:44:21 GMT)
R-STELLAR: A Resilient Synthesizable Signature Attenuation SCA Protection on AES-256 with built-in Attack-on-Countermeasure Detection [0.5] サイドチャネル攻撃(SCA)は、現代の組み込みデバイスにおける暗号システムのセキュリティに対する重大な脅威である。
物理的対策により、開示までの最小トレース(MTD)は10億に大幅に増加した。
MTDを従来の閾値の2000倍以上に低減する電圧降下リニア領域バイアス(VLB)アタック手法を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:29:33 GMT)
Hypergraph: A Unified and Uniform Definition with Application to Chemical Hypergraph and More [0.5] 本稿では,非指向性,指向性,ネスト性を持つハイパーグラフの概念を統一するハイパーグラフの新たな定義を提案する。
具体的には、ハイパーエッジを単純なハイパーエッジ、ネストハイパーエッジ、あるいは有向ハイパーエッジと定義する。
この新たな定義の統一性とパワーは、可視化とともに、高次相関を表現するためにハイパーグラフを使うことを促進するべきである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:49:18 GMT)
FedGS: Federated Gradient Scaling for Heterogeneous Medical Image Segmentation [0.4] そこで本研究では,FedGSという新しいFLアグリゲーション手法を提案する。
FedGSは、特に小さな病変に対して、PolypGenとLiTSデータセット間で、FedAvgよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:26:21 GMT)
Defining Boundaries: The Impact of Domain Specification on Cross-Language and Cross-Domain Transfer in Machine Translation [0.4] 言語間変換学習は、高ソース言語のデータを活用することで、有望なソリューションを提供する。
本稿では,ドメイン関連データの微調整によるニューラルネットワーク翻訳(NMT)のドメイン固有品質の向上について検討する。
本研究は,特に医学,法学,ITなどの専門分野において,ドメイン固有の翻訳品質が著しく向上していることを明らかにする。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:28:48 GMT)
A New Chinese Landscape Paintings Generation Model based on Stable Diffusion using DreamBooth [0.4] 本研究では,中国景観絵画の制作方法を紹介する。
LoRAと事前訓練SDM、DreamBoothと事前訓練SDMを組み合わせることにより、トレーニングプロセスが加速される。
ドリームブースと組み合わせたSDMはデータセット上で12.75のFIDを達成し、専門家評価の点で他のモデルよりも優れている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:16:51 GMT)
UniMEL: A Unified Framework for Multimodal Entity Linking with Large Language Models [0.4] MEL(Multimodal Entities Linking)は、ウィキペディアのようなマルチモーダル知識ベースの参照エンティティに、多モーダルコンテキスト内で曖昧な言及をリンクすることを目的とした重要なタスクである。
既存の方法はMELタスクを過度に複雑にし、視覚的意味情報を見渡す。
大規模言語モデルを用いたマルチモーダル・エンティティ・リンクタスクを処理するための新しいパラダイムを確立する統一フレームワークUniMELを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:52:02 GMT)
Reasoning and Tools for Human-Level Forecasting [0.4] 本稿では,Reasoning and Tools for Forecasting (RTF)について紹介する。
我々は,競争予測プラットフォームからの質問でモデルを評価し,本手法が人間の予測に勝るものであることを実証した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:42:06 GMT)
Enhancing Cross-Modal Medical Image Segmentation through Compositionality [0.4] セグメント化性能と解釈可能性を向上させるために,クロスモーダルセグメンテーションネットワークにおける帰納バイアスとして構成性を導入する。
提案するネットワークは、学習可能なvon Mises-Fisherカーネルを用いて学習した表現に合成性を適用する。
実験の結果, セグメンテーション性能が向上し, 複数の医療データセットの計算コストが低減された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:57:24 GMT)
VIRIS: Simulating indoor airborne transmission combining architectural design and people movement [0.4] ウイルス感染リスク屋内シミュレータ (VIRIS) が開発され, 感染拡大の緩和効果を迅速に評価し, 比較している。
このエージェントベースのシミュレータは、屋内空間での人々の移動、ウイルス伝達モデリング、詳細な建築設計を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:54:22 GMT)
GeoReasoner: Reasoning On Geospatially Grounded Context For Natural Language Understanding [0.3] GeoReasonerは、地理的に接地された自然言語を推論できる言語モデルである。
まず、Large Language Modelsを利用して、言語推論と距離情報に基づく総合的な位置記述を生成する。
また、方向と距離の情報を擬似文として扱うことで空間埋め込みに符号化する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:35:21 GMT)
Representation Learning of Complex Assemblies, An Effort to Improve Corporate Scope 3 Emissions Calculation [0.3] 政府、企業、市民も同様に、製造品やサービスの提供による気候への影響を正確に評価する必要がある。
プロセスライフサイクル分析(pLCA)は、生産、使用、廃棄の気候への影響を評価するために用いられる。
代用部品を特定するための半教師付き学習ベースフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:21:31 GMT)
Imagining from Images with an AI Storytelling Tool [0.3] 提案手法は,GPT-4oの視覚的コンテンツを解釈し,エンゲージメントなストーリーを作成するためのマルチモーダル機能について検討する。
この方法はImageTellerと呼ばれる完全に実装されたツールでサポートされており、様々なソースからのイメージを入力として受け入れる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:49:15 GMT)
Designing elegant Bell inequalities [0.3] 本稿では,ベルの不等式を従来のエレガントなベル不等式に類似した違反特徴で構築する方法を提案する。
そのような特徴を持つベルの不等式は、初めて3次元で導出される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:36:45 GMT)
Slicing Input Features to Accelerate Deep Learning: A Case Study with Graph Neural Networks [0.2] 本稿では,機能スライスされた大規模グラフ学習手法であるSliceGCNを紹介する。
これは、ミニバッチトレーニングに典型的な精度損失を回避し、GPU間通信を減らすことを目的としている。
6つのノード分類データセットで実験を行い、興味深い分析結果を得た。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:18:41 GMT)
Edge AI as a Service with Coordinated Deep Neural Networks [0.2] CoDEは、個々のモデルからマルチタスクのDNNを作成することで、最高の報酬が得られるパスである最適なパスを見つけることを目的としている。
実験により,CoDEは推論スループットを向上し,最先端の既存手法に比べて高精度であることがわかった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:47:53 GMT)
RaNDT SLAM: Radar SLAM Based on Intensity-Augmented Normal Distributions Transform [0.2] 本稿では,高速かつ正確なロボット軌道を生成する新しいレーダーSLAMフレームワークであるRaNDT SLAMを紹介する。
我々は新しいベンチマークデータセットとOxford Radar RobotCarデータセットでRaNDT SLAMを評価した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:32:11 GMT)
Spike-and-slab shrinkage priors for structurally sparse Bayesian neural networks [0.2] スパースディープラーニングは、基礎となるターゲット関数のスパース表現を復元することで、課題に対処する。
構造化された空間によって圧縮されたディープニューラルアーキテクチャは、低レイテンシ推論、データスループットの向上、エネルギー消費の削減を提供する。
本研究では, (i) Spike-and-Slab Group Lasso (SS-GL) と (ii) Spike-and-Slab Group Horseshoe (SS-GHS) を併用した過剰ノードを誘発する構造的疎いベイズニューラルネットワークを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:01:06 GMT)
Massively multiplexed nanoscale magnetometry with diamond quantum sensors [0.1] ダイヤモンド中の窒素空孔(NV)中心はナノスケールセンシングに広く利用されている。
我々は、複数の単一のNVセンタを同時に読み取ることができる多重化されたNVセンシングプラットフォームを設計し、実装する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:39:28 GMT)
HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation [0.1] 我々はHybird Transformer Vision Mamba UNet(HTM-UNet)という医療画像分割のためのU字型アーキテクチャーモデルを提案する。
我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir、CVC-ColonDB、ETIS-Larib PolypDBパブリックデータセット、ZD-LCI-GIMプライベートデータセットに関する包括的な実験を行う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:25:14 GMT)
Simulators for Quantum Network Modelling: A Comprehensive Review [0.1] 我々は、量子ネットワークのモデリングに現在使われているツールキットについて、私たちの知る限り、レビューする。
これらのツールキットと標準化されたバリデーション技術により、より正確で信頼性の高い量子ネットワークシミュレータの基礎を構築できる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:07:46 GMT)
Dynamics of operator size distribution in q-local quantum Brownian SYK and spin models [0.1] 局所相互作用が$q$であるブラウン量子多体モデルにおける演算子ダイナミクスについて検討する。
小さな初期サイズの場合、演算子ダイナミクスは初期サイズが大きくなるにつれて狭まる広い分布によって特徴づけられる。
この結果から,$q$局所量子多体系における演算子力学の普遍的特徴が明らかになった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:00:36 GMT)
Cost-Effective Big Data Orchestration Using Dagster: A Multi-Platform Approach [0.1] 本稿では,Dagsterを用いた費用対効果と柔軟なオーケストレーションフレームワークを提案する。
Dagsterのオーケストレーション機能によって、データ処理の効率が向上し、最高のコーディングプラクティスを強制し、運用コストを大幅に削減できることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:05:35 GMT)
A Practical Quantum Algorithm for the Schur Transform [0.1] 量子シュア変換のための効率的な量子アルゴリズムについて述べる。
シュール変換は、標準計算基底を既約表現からなる基底にマッピングする量子コンピュータ上の演算である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:29:29 GMT)
V-RoAst: A New Dataset for Visual Road Assessment [0.1] 道路交通事故は毎年何百万人もの死者を出し、経済に大きな影響を与えている。
本稿では,道路安全評価のための視覚言語モデル (VLM) を用いたアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:40:49 GMT)
Federated Diabetes Prediction in Canadian Adults Using Real-world Cross-Province Primary Care Data [0.0] 本稿では,集中型データストレージや処理を使わずに予測モデルを統合化することで,プライバシの問題を回避するためのフェデレーション学習手法を提案する。
これは、カナダプライマリケアセンチネル監視ネットワーク(CPCSSN)から抽出された実際の臨床データセットを使用して、患者データを共有することなく糖尿病を予測するためのフェデレーションラーニングの最初の応用である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:47:21 GMT)
Large Language Models for Page Stream Segmentation [0.0] ページストリーム(PSS)は、大規模に自動化されたドキュメント処理に必要な必須条件である。
本稿では,商用光文字認識(OCR)アノテーションを特徴とする拡張ベンチマークであるTABME++を紹介する。
我々は,パラメータ効率のよいデコーダモデルに着目し,大規模言語モデル(LLM)の性能評価を行った。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:28:42 GMT)
Vision HgNN: An Electron-Micrograph is Worth Hypergraph of Hypernodes [0.0] 電子マイクログラフにおける複雑な関係をより良くモデル化するためのハイパーグラフニューラルネットワークバックボーンアーキテクチャを提案する。
コスト効率のよいGPUハードウェアを利用することで、提案するフレームワークは一般的なベースラインを上回っます。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:36:53 GMT)
Upper Bound on Locally Extractable Energy from Entangled Pure State under Feedback Control [0.0] 我々は,多粒子交絡純状態に対する有効熱力学を導入する。
局所ハミルトニアンの下でのサブシステムからのフィードバック制御による抽出可能エネルギーの上界を導出する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:55:26 GMT)
Universal platform of point-gap topological phases from topological materials [0.0] エルミートトポロジカル絶縁体と超伝導体から構築した点ギャップ位相の単純で普遍的なプラットフォームを提案する。
そこで, (d-1) 次元の点ギャップ位相は, d次元のトポロジカル絶縁体と超伝導体の境界を逸脱させることによって実現されることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:59:55 GMT)
Towards Robust Federated Image Classification: An Empirical Study of Weight Selection Strategies in Manufacturing [0.0] 本研究は, 最終エポッチウェイト選択 (FEWS) と最適エポッチウェイト選択 (OEWS) の2つのウェイト選択戦略の比較効果について検討した。
EfficientNet、ResNet、VGGなど、さまざまなニューラルネットワークアーキテクチャを使用して、これらの重み選択戦略がモデル収束性と堅牢性に与える影響を評価する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:58:02 GMT)
Towards Probabilistic Inductive Logic Programming with Neurosymbolic Inference and Relaxation [0.0] 本稿では,欠陥や確率的背景知識を扱うPropperを提案する。
ノイズの多いイメージのリレーショナルパターンでは、Propperは8つの例からプログラムを学ぶことができる。
グラフニューラルネットワークのようなバイナリILPや統計モデルよりも優れています。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:38:49 GMT)
Towards "Differential AI Psychology" and in-context Value-driven Statement Alignment with Moral Foundations Theory [0.0] 本研究は,Moral Foundationのアンケートにおいて,パーソナライズされた言語モデルと調査参加者のアライメントについて検討する。
我々は、異なる政治的ペルソナにテキスト・トゥ・テキスト・モデルを適用し、繰り返しアンケートを行い、ペルソナとモデルの組み合わせの合成人口を生成する。
その結果, 適応型モデルでは, 政治的イデオロギーに対する調査をリードする評価が困難であることが示唆された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:20:41 GMT)
Topological Phases of Many-Body Localized Systems: Beyond Eigenstate Order [0.0] 多体局在は物質の非平衡相に顕著な堅牢性を与える。
このような位相は、その基底と励起状態における位相的および対称性の破れ秩序を示すことができる。
それらはまた、異常な局所化位相(ALT相)に属することもある。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:29:24 GMT)
Third-Quantized Master Equations as a classical Ornstein-Uhlenbeck Process and its Entropy Production Rate [0.0] 第3の量子化は開量子系において、2次リンドブレディアンを正規形式に変換する超作用素基底を構成するために用いられる。
我々は、第3量子化と$Q$表現の間のこのギャップを埋める第3量子化の新しい基礎を導入する。
運動方程式は多次元のOrnstein-Uhlenbeck過程に還元され、量子系のエントロピー生成と熱散逸速度を明確に定義する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:01 GMT)
The State of Commercial Automatic French Legal Speech Recognition Systems and their Impact on Court Reporters et al [0.0] 本稿では,裁判所記者の法的手続きの翻訳を支援するための自動音声認識システムの可能性について検討する。
商用およびオープンソースオプションを含む3つのASRモデルを、フランス語の法的発言を認識する能力についてベンチマークする。
この結果は、現在のASRシステムは将来性を示すが、法域の特定のニーズを満たすためにさらなる改良が必要であることを示唆している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:44:28 GMT)
The Noiseless Quantum Computer Does Not Exist [0.0] 量子コンピュータ内の任意の論理ゲートが、他の量子論理ゲートに依存していることを示す。
言い換えれば、量子コンピュータの任意の論理ゲートが、他の量子論理ゲートに依存していることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:00:31 GMT)
TAGIFY: LLM-powered Tagging Interface for Improved Data Findability on OGD portals [0.0] 本稿では,GPT-3.5-turbo や GPT-4 のような大規模言語モデル (LLM) を用いて,データセットのタグ付けを自動化するタグ付けインタフェースのプロトタイプを提案する。
開発したソリューションはユーザによって評価され,今後のプロトタイプ改善のアジェンダを定義するためにフィードバックが収集された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:23:21 GMT)
Suppressing unknown disturbances to dynamical systems using machine learning [0.0] 本研究では,未知のシステムに対して未知の障害を特定し,抑制するためのモデルフリーな手法を提案する。
トレーニング関数の極めて穏やかな制限の下で,本手法は未知の乱れを強く識別し,抑制することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:39:27 GMT)
Structure-preserving Planar Simplification for Indoor Environments [0.0] 本稿では,屋内シーンポイント雲の構造保存型平面簡易化のための新しい手法を提案する。
キャプチャされた各シーンを、構造化された(壁焼床)と非構造化された(屋内オブジェクト)のシーンに分割する。
天井と床を正確に表現するために,壁面の正常性に対して天井と床のメッシュを切断するメッシュクリッピングアルゴリズムを用いる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:32:43 GMT)
Spin-dependent edge states in two-dimensional Dirac materials with a flat band [0.0] 2次元擬似スピン-1型ディラック材料におけるスピン依存型ディラック電子光学について検討する。
特定のスピン配向(例えばスピンダウン)を持つ電子は、長寿命のエッジモードのクラスに閉じ込められ、共鳴散乱を引き起こす。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:38:51 GMT)
Sentiment and Emotion-aware Multi-criteria Fuzzy Group Decision Making System [0.0] グループ意思決定(GDM)システムは、様々な好みを持つ参加者間の合意を促進することで重要な役割を果たす。
本稿では,グループ設定におけるコンセンサス取得の有効性を高めるために,感情と感情を意識した多基準ファジィGDMシステムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:17:06 GMT)
Scale invariance and the Diophantine approximation in the Bloch vector of the thermal multi-photon Jaynes-Cummings model [0.0] 熱多光子Jaynes-Cummingsモデル(JCM)のBlochベクトルの時間発展について検討する。
当時のいくつかの値は、不合理数に対するディオファントス近似の分数の分母で導出することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:48:13 GMT)
Scalable parallel measurement of individual nitrogen-vacancy centers [0.0] ダイヤモンド中の窒素空孔中心は固体スピン欠陥であり、量子センシングや量子情報処理用途に広く採用されている。
複数の光学的に解決されたNV中心を並列に扱う実験プラットフォームを提案する。
本研究では,10NV中心のスピン状態間のショット・ツー・ショット相関を高信号・ノイズ比で検出できることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:38:42 GMT)
Role of momentum in the generator-coordinate method applied to barrier penetration [0.0] バリアトップエネルギーにおける核分裂は、伝統的に内部分裂チャネルに適用された1次元シュリンガー方程式によってモデル化される。
生成コーディネート法(GCM)による有限運動量状態の包含は, GCMをベースとしたハミルトニアンがシュリンガー処理を再現できるエネルギー範囲を大幅に拡大することを示した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:37:00 GMT)
Robust Protein Electrical Junctions with Permanent Contacts show Activation-less Charge Transport down to 10 K [0.0] 真空蒸着した炭素 (eC) で生成したRPJと、バクテリオロドプシン (bR) の単層上に設定されたAu電極
bRの光誘起光サイクルと,bRのアミドIとIIの振動周波数は,eC沈着によって変化した。
これらのジャンクイオンの電流電圧特性は温度非依存性であり, ジャンクションは数ヶ月間安定であった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:06:38 GMT)
RedWhale: An Adapted Korean LLM Through Efficient Continual Pretraining [0.0] 韓国語処理に特化したモデルであるRedWhaleを紹介する。
RedWhaleは、韓国の包括的コーパス前処理パイプラインを含む効率的な継続事前訓練アプローチを用いて開発されている。
実験の結果、RedWhaleは韓国のNLPベンチマークで他の主要なモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 02:49:41 GMT)
Realization of a magic-wavelength nanofiber-based two-color dipole trap with sub-$λ/2$ spacing [0.0] セシウムD2ラインの共振波長の半分以下の間隔で周期的に1次元のトラップ部位の配列を生成する。
配列中の原子のトラップを実演し、その結果のトラップ構成を特徴付ける。
マジックトラップ波長とラムダ/2$スペーシングを併用したナノファイバーベースの光インタフェースの実装は、新しい放射効果の探索に向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:24:11 GMT)
RGBD-Glue: General Feature Combination for Robust RGB-D Point Cloud Registration [0.0] より緩く、より効果的に組み合わせられる新しい機能の組み合わせフレームワークを提案する。
変換一貫性に基づいた明示的なフィルタは,各機能の弱点を克服可能な組み合わせフレームワーク用に設計されている。
ScanNet と 3DMatch の実験により,本手法が最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:32:47 GMT)
RFID based Health Adherence Medicine Case Using Fair Federated Learning [0.0] RFIDベースのデータ記録とNFCベースのデータ抽出を活用するスマートヘルスアテンデンスツールであるSmart Pill Caseを紹介した。
このシステムには、正確な量測定のためのロードセルが含まれており、薬の摂取をモニターし、提案し、警告を発するAndroidアプリを備えている。
フェデレートラーニングにより、Smart Pill Caseは、個々のプライバシーを損なうことなく、複数のユーザの薬の付着パターンから学ぶことができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:12:40 GMT)
Quantum-centric Supercomputing for Physics Research [0.0] この文書はStony Brook University主催の第22回Advanced Computing and Analysis Techniques in Physics Researchの量子中心スーパーコンピューティングに関するプレゼンテーションを要約している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:07:33 GMT)
Quantum super-resolution microscopy by photon statistics and structured light [0.0] 本稿では,光子統計量測定に基づく量子超解像イメージング技術とその高精度なモデリングについて述べる。
我々の再構成アルゴリズムは任意の種類の非ポアソニアンエミッターに適応し、対応する古典的なSOFI法より優れる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:26:08 GMT)
Quantum radar with unreflected photons [0.0] 対象物が散乱する光子の測定を伴わない反射率推定・検出手法として, 2つの記述を導入, 解析した。
その結果,光子不明瞭性によるエコーシードの自発パラメトリックダウンコンバージョンと誘導コヒーレンスを組み合わせた光学活性受信機の設計法が得られた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:00:55 GMT)
Quantum gates between distant atoms mediated by a Rydberg excitation antiferromagnet [0.0] 中性原子の配列で接続された遠方の原子量子ビット間の量子ゲートを実装するための新しいプロトコルを提案する。
このプロトコルは、チャープレーザーパルスを用いてレイドバーグ励起の反強磁性状態に配列中の原子を断熱的に移動させることに基づいている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:44:09 GMT)
Quantum Ecosystem Research and Analysis in Colombia [0.0] 本稿では,コロンビア開発計画の基本柱として量子コンピューティングを取り入れることを提案する。
我々は、我が国の量子技術に対する公的投資に関わるすべての利害関係者のつながりを提供することを期待している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:12:33 GMT)
Quantum Calculation for Two-Stream Instability and Advection Test of Vlasov-Maxwell Equations: Numerical Evaluation of Hamiltonian Simulation [0.0] 量子古典型ハイブリッドVlasov-Maxwellソルバを開発した。
1次元対流試験と1D1V二流不安定試験の数値シミュレーションを行う。
我々の量子アルゴリズムは、古典的アルゴリズムと比較してより大きな時間ステップで堅牢である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:56:55 GMT)
Quantifying Behavioural Distance Between Mathematical Expressions [0.0] そこで本稿では,類似した誤りを伴って表現をクラスタリングする行動距離(BED)の尺度を提案し,実装する。
また,BEDは,記号回帰のための探索空間における誤り景観の滑らかさを著しく改善することを示した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 10:48:04 GMT)
Privacy-Preserving Data Management using Blockchains [0.0] データプロバイダは、データ使用量の変化によって、既存のプライバシの好みをコントロールし、更新する必要がある。
本稿では,データプロバイダがプライベートで機密性の高いデータを保存するためのブロックチェーンベースの方法論を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:10:39 GMT)
Preparing pure $^{43}$Ca$^+$ samples in an ion trap with photoionization and parametric excitations [0.0] 本稿では,レーザー冷却した43ドルCa$+$イオンをイオントラップで効率的に調製するための実用的手法を提案する。
提案手法は, 同位体選択光イオン化法と同位体特異的パラメトリック励起法という, 確立された2つの方法を統合する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:56:13 GMT)
Practical Aspects on Solving Differential Equations Using Deep Learning: A Primer [0.0] このプライマーはDeep Galerkin法に関する技術的および実践的な洞察を提供することを目的としている。
一次元の熱方程式を段階的に解く方法を示す。
また、通常の微分方程式や積分方程式の系にディープ・ガレルキン法を適用する方法を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 01:34:20 GMT)
Possibilities and challenges of STEAM pedagogies [0.0] 本稿では,STEAM(Science, Technology, Engineering, Arts, Mathematics)の教育への統合について検討する。
伝統的なSTEMスキルと共に創造性を育むために芸術を取り入れることを強調している。
高等教育における「学際的エゴセンチュリズム」に対応するとともに、学際的教育を支援するための教員教育の改革の必要性を強調している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:08:35 GMT)
On the design of stabilizing FIR controllers [0.0] 線形FIRシステムのコントローラは静的あるいは動的な出力フィードバック問題として記述できることを示す。
FIRコントローラの場合、出力フィードバックのための2つの一般的なアプローチを調整します。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:26:23 GMT)
On estimates of trace-norm distance between quantum Gaussian states [0.0] 平均ベクトルと共分散行列の観点から、2つの量子ガウス状態間のトレースノーム距離の推定を行った。
本論文では, 状態重なり量と呼ばれる忠実度に類似した量に基づいて, 異なる推定値を得る。
これらの導出は、ArXiv:2405.01431から有用な不等式を置き換えることを目的としていない。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:51:49 GMT)
On Quasi-Localized Dual Pairs in Reproducing Kernel Hilbert Spaces [0.0] 分散データ近似では、選択されたラジアル基底関数の有限個の変換のスパンを近似空間として用いる。
我々は、それらの正準双対と異なる選択肢について議論する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:33:30 GMT)
Model-free spectral reconstruction via Lagrange duality [0.0] リアルタイム応答、包括的断面積、崩壊率を含む様々な物理量は、ユークリッドの相関子から直接は決定できない可能性がある。
本稿では,スミアドスペクトル密度の再構成とスミアドリアルタイム進化の決定に本手法を適用した。
この形式の境界は情報理論的に完全であり、境界内の任意の点について、有界ユークリッドデータと肯定値の両方に一致する関連するスペクトル密度を見出すことができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:39:37 GMT)
Migrating Existing Container Workload to Kubernetes -- LLM Based Approach and Evaluation [0.0] あるアプローチでは、開発者がマニフェストを生成するのを支援するために、大きな言語モデル(LLM)を採用している。
現在、出力が与えられた仕様を満たし、理解可能であるかどうかを決定することは不可能である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:37:10 GMT)
Microwave-Induced Cooling in Double Quantum Dots: Achieving Millikelvin Temperatures to Reduce Thermal Noise around Spin Qubits [0.0] ゲート定義量子ドットにおけるスピン量子ビットは、そのスケーラビリティと長いコヒーレンス時間のために、主要な技術として出現している。
これらの量子ビットを極低温に保つには、通常複雑な低温システムが必要である。
本稿では,マイクロ波誘起状態分散とフォノンフィルタを用いた新しいゲート定義二重量子ドット (DQD) 冷却システムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 22:32:11 GMT)
Low-Overhead Parallelisation of LCU via Commuting Operators [0.0] LCU(Linear Combination of Unitaries)は、演算子のブロック符号化のための強力なスキームであるが、高いオーバーヘッドに悩まされている。
本稿では,LCUの並列化,特にLCUのSELECTサブルーチンについて論じる。
また、本研究の主な成果であるQROM回路の並列化についても論じる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:00:04 GMT)
Local Software Buildability across Java Versions (Registered Report) [0.0] Javaのバージョン6から23をインストールしたコンテナで、すべてのプロジェクトを自動ビルドしようとします。
成功または失敗は終了コードによって決定され、標準出力とエラーストリームは保存される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:51:00 GMT)
Leveraging Chemistry Foundation Models to Facilitate Structure Focused Retrieval Augmented Generation in Multi-Agent Workflows for Catalyst and Materials Design [0.0] 大規模で事前訓練された化学基盤モデルは、セマンティック化学情報検索の基盤となる。
本稿では,OpenCLIPなどの画像モデルと連携して化学基盤モデルを用いて,前例のないクエリや情報検索を行う。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 17:25:45 GMT)
Lee-Yang theory of the superradiant phase transition in the open Dicke model [0.0] 有限測定時間で得られた光子放射統計から超ラジカル相転移を推定できることを示す。
我々の研究は、Dickeモデルと他の量子多体系における相転移が、有限持続時間の測定からどのように検出できるかを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:11:06 GMT)
Irregularity Inspection using Neural Radiance Field [0.0] 大規模生産機械はますます重要になっている。
このような大型機械の欠陥検査を専門家が行うことは、しばしば困難である。
本稿では3次元双対モデルのニューラル・ネットワーク・モデリング(NeRF)に基づくシステムを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:14:07 GMT)
Irregular Bloch Zener oscillations in two-dimensional flat-band Dirac materials [0.0] ランドウ-ツェナー遷移(LZT)とブロッホ-ツェナー振動は、静電場が2次元ディラック材料に印加されたときに起こる。
本研究では,ランダウ-ツェナー-シュタッケルベルク干渉法を記述した断熱インパルスモデルを用いて位相を計算できることを実証する。
ブロッホ・ツェナー振動の不規則性の度合いは、おそらく実験的に実現可能な形態パターンを選択することで利用することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:47:04 GMT)
Interpretable Boosted Decision Tree Analysis for the Majorana Demonstrator [0.0] マヨラナ・デモレーター(Majorana Demonstrator)は、高純度ゲルマニウム検出器でニュートリノのない二重ベータ崩壊を探索する主要な実験である。
機械学習は、これらの検出器が提供する情報の量を最大化する新しい方法を提供する。
解釈可能性に関する研究では、マシンの意思決定ロジックを明らかにし、マシンから学習して従来の分析にフィードバックすることができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:27:41 GMT)
Inflationary Flows: Calibrated Bayesian Inference with Diffusion-Based Models [0.0] 本稿では,拡散モデルを用いてベイズ推定を行う方法を示す。
本稿では,新しいノイズスケジュールを用いて,標準的なDBMトレーニングを通じてそのようなマップを学習する方法を示す。
その結果は、低次元の潜在空間上で一意に定義される非常に表現性の高い生成モデルのクラスである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:57:16 GMT)
Impurities in a trapped 1D Bose gas of arbitrary interaction strength: localization-delocalization transition and absence of self-localization [0.0] 不純物-ボソン相関は弱いボソン-ボソン相互作用の極限においても重要である。
任意の相互作用強度に対する重い不純物によって形成される単一ポラロンのエネルギーを計算する。
ボルン・オッペンハイマー近似におけるポラロン-ポラロン相互作用ポテンシャルを数値的に決定する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:56:17 GMT)
Improving Out-of-Distribution Data Handling and Corruption Resistance via Modern Hopfield Networks [0.0] 本研究は,コンピュータビジョンモデルによるアウト・オブ・ディストリビューションデータ処理能力の向上における,Modern Hopfield Networks (MHN) の可能性を探るものである。
我々は,MHNをベースラインモデルに統合し,ロバスト性を高めることを提案する。
本研究は,MNIST-Cデータセットのモデル性能を一貫して向上することを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 03:26:16 GMT)
Imaging transverse modes in a GHz surface acoustic wave cavity [0.0] 表面音響波(SAW)装置の完全な特徴付けには、音場の空間分布を撮像する必要がある。
プローブとして強く集束したレーザ光を用いたファイバベース走査型ミッチェルソン干渉計を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:01:17 GMT)
Hypergraph Learning based Recommender System for Anomaly Detection, Control and Optimization [0.0] 本稿では,(a)離散ハイパーグラフ構造の連成学習のための自己適応型異常検出フレームワークと,(b)相互依存型センサ間の時間的傾向と空間的関係をモデル化する。
このフレームワークは、ハイパーグラフ構造データのリレーショナル帰納バイアスを利用して、ポイントワイズ・シングルステップ・アヘッド予測を学習する。
ルート原因分析のための異常情報伝搬に基づく計算ハイパーグラフを導出し、オフラインで最適な予測制御ポリシを通じて推奨する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:04:02 GMT)
How to use the dispersion in the $χ^{(3)}$ tensor for broadband generation of polarization-entangled photons [0.0] 偏光-絡み合った光子対は量子光学や技術で広く使われている資源である。
ダイヤモンド結晶中での自発4波長混合により光子対の分極波長(光子毎のTHz)のブロードバンド発生を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:43:23 GMT)
High-performance multiqubit system with double-transmon couplers: Toward scalable superconducting quantum computers [0.0] 2つのDouble-transmon coupler(DTC)を介して結合された3つの固定周波数キュービットの系を数値解析する。
DTCは、最近提案されたチューナブルカプラであり、2つの固定周波数トランスモンが共有ループを介して結合され、追加のジョセフソン接合が設けられている。
分離された2量子ビット系と同様に、DTCは望ましくない残余結合を十分に低減することができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:57:15 GMT)
Genuinely nonlocal sets without entanglement in multipartite systems [0.0] 多部状態の集合が真に非局所的であるのは、それが部分系のすべての分割において局所的に区別できないときである。
集合が局所可換であれば、それが真に非局所性を持つのは上ケースexpandafterromannumeral 1 である。
さもなければ、これは真に非局所的なタイプであるカッパーケースexpandafterromannumeral 2 であると言える。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:18:33 GMT)
Generative AI in Industrial Machine Vision -- A Review [0.0] 生成AIは、パターン認識能力を改善することによって、有望な可能性を実証する。
マシンビジョンにおける生成AIの応用は、データの多様性、計算要求、堅牢な検証方法の必要性により、まだ初期段階にある。
PRISMAガイドラインに基づく文献レビューを行い、産業機械ビジョンにおける生成AIに関する1200以上の論文を分析した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:28:21 GMT)
From the Choi Formalism in Infinite Dimensions to Unique Decompositions of Generators of Completely Positive Dynamical Semigroups [0.0] 我々は、任意のヒルベルト空間に一意な有界作用素 $K$ と一意に正の写像 $Phi$ が存在することを証明している。
特に、上述のヒルベルト空間が無限次元となるとすぐに、チェイ形式の下で空の事前像を持つ正半定値作用素の例が見つかる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:52:41 GMT)
Federated Learning Approach to Mitigate Water Wastage [0.0] 北米の住宅の屋外水利用は毎日90億ガロン近くを占めており、その約50%は過剰な水が原因で無駄になっている。
水の無駄を減らす従来のアプローチは、中央集権的なデータ収集と処理に重点を置いてきた。
住宅・農業環境における水利用を最適化するためのフェデレート学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:35:40 GMT)
Features of the Earth's seasonal hydroclimate: Characterizations and comparisons across the Koppen-Geiger climates and across continents [0.0] 我々は, 約1千万の地温, 降水量, 河川流量時系列を分析した。
我々は,コッペン・ガイガー気候分類システムを採用し,季節的な気候の特徴をまとめるために大陸規模の地理的地域を定義した。
コッペン・ガイガー気候層と大陸規模の地理的地域の間で,これらの特徴の規模を特徴付けるために,顕著な違いを見出した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:50:57 GMT)
Faster Quantum Simulation Of Markovian Open Quantum Systems Via Randomisation [0.0] ランダム化を用いたマルコフ開量子系シミュレーションのための新しい非確率的アルゴリズムを提案する。
本手法は,システムの進化の物理性を維持しつつ,量子シミュレーションのスケーラビリティと精度を高める。
この研究は、オープン量子系のシミュレーションにランダム化技術を適用し、より高速で正確なシミュレーションを可能にする可能性を強調した最初のものである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:06:29 GMT)
FATE: Focal-modulated Attention Encoder for Temperature Prediction [0.0] 気候変動は21世紀の大きな課題の1つである。
従来のデータ駆動モデルはリカレントニューラルネットワーク(RNN)を使用することが多いが、並列化には制限がある。
本稿では,FocalNet Transformerアーキテクチャに基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 04:40:18 GMT)
Exponential Expansion of Massive Schrödinger Cats for Sensing and Entanglement [0.0] 本稿では、ガウス力学を用いて初期小さな重ね合わせを指数関数的に拡張し、干渉計を完成させるためにそれを再結合するプロトコルを提案する。
未知の力は、膨張時間において指数関数的に速く重ね合わせによって感知することができる。
量子力を介して相互作用する2つの干渉計間の絡み合いは、量子ビットベースの非ガウス的プロトコルにおいて初めて、ガウス的手法を用いて完全な量子力学を解くことによって得られる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:33:51 GMT)
Expanding FLORES+ Benchmark for more Low-Resource Settings: Portuguese-Emakhuwa Machine Translation Evaluation [0.0] エマクフワ語はモザンビークで広く話されている低リソース言語である。
私たちは、開発セットと開発セットをポルトガル語からエマフワ語に翻訳します。
使用する翻訳プロセスと品質保証対策について詳述する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 09:23:20 GMT)
Evaluating the Stability of Deep Learning Latent Feature Spaces [0.0] 本研究では,潜在空間の安定性を評価し,その後の解析における一貫性と信頼性を確保するための新しいワークフローを提案する。
我々はこのワークフローを500のオートエンコーダ実現と3つのデータセットにまたがって実装し、合成シナリオと実世界のシナリオの両方を包含する。
本研究は,潜在特徴空間における固有の不安定性に注目し,これらの不安定性を定量化し解釈するワークフローの有効性を実証するものである。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:31:29 GMT)
Entangled pairs in evaporating black holes without event horizons [0.0] 本稿は、ブラックホールのシナリオにおけるホーキングパートナーの定義と運命を探求することを目的としている。
後方散乱の効果を考慮したパートナーの形式を導出する。
我々は、一般相対性理論が量子場理論と半古典的に共存する体制下でホーキング放射を部分的に浄化するために、ホーキングパートナーが動的水平線から「漏れる」ことができないことを発見した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 15:41:44 GMT)
Entangled biphoton generation in myelin sheath [0.0] ミエリンシースによって形成された円筒状の空洞は、振動モードからの自然光子放出を促進することができる。
神経細胞におけるC-H結合振動ユニットの豊富さは、神経系の量子的絡み合いの源となる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 05:14:23 GMT)
Enhancing Startup Success Predictions in Venture Capital: A GraphRAG Augmented Multivariate Time Series Method [0.0] 本稿では,GrahphRAG拡張時系列モデルを用いた新しい手法を提案する。
実験の結果,我々のモデルはスタートアップの成功予測において,過去のモデルよりも大幅に優れていたことがわかった。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:50:40 GMT)
Emergent broadband polarization entanglement from electronic and phononic four-wave mixing indistinguishability [0.0] 中心対称立方体系では、ブロードバンドの強いレーザー場から2光子をストークスと反ストークスの絡み合った光子に変換することができる。
特に,4波混合過程における電子自由度と音速自由度との干渉から生じるブロードバンド偏光絡みは,ストークス・アンチストークスラマンシフト,散乱幾何学,レーザー帯域幅などのパラメータに依存することを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:20:42 GMT)
Drama Engine: A Framework for Narrative Agents [0.0] Drama Engineは、物語の目的のために設計された大規模言語モデルとのエージェントインタラクションのためのフレームワークである。
このフレームワークはマルチエージェントシステムの原則を適用し、動的でコンテキスト対応のコンパニオンを作成する。
このフレームワークのアプリケーションには、マルチエージェントチャットや、クリエイティブな執筆のための仮想同僚が含まれる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:29:38 GMT)
Don't Kill the Baby: The Case for AI in Arbitration [0.0] 連邦航空局(FAA)は、従来の予約にもかかわらず、当事者がAIによる仲裁を契約的に選択することを許可していると論じている。
仲裁におけるAIの使用を提唱することで、契約上の自律性を尊重することの重要性を強調している。
最終的には、仲裁におけるAIに対するバランスの取れたオープンなアプローチを求め、紛争解決の効率性、公平性、柔軟性を高める可能性を認識している。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:34:20 GMT)
Directional emission and photon bunching from a qubit pair in waveguide [0.0] マイクロ波領域におけるパリティ不変導波路に結合した一対の同一量子ビットを考える。
指向性光子放射と2つの光子束の共通起源を示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 07:30:46 GMT)
Detecting the dimensionality of genuine multi-particle entanglement [0.0] 最先端の量子技術は、多くの粒子と高次元を特徴とする絡み合った状態を作り出すことができるようになった。
本稿では, 真に高次元, 真に多粒子の絡み合っていると考えられる総称状態について検討する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 08:03:40 GMT)
Derivation of a Schrödinger Equation for Single Neurons Through Stochastic Neural Dynamics [0.0] ニューロン膜の電気ノイズ(ブラウン運動)は、創発的な「シュル」オーディンガー方程式を引き起こす。
この結果は、脳機能の基礎となるメカニズムに関する新たな洞察を与える可能性がある。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:47:11 GMT)
D-RMGPT: Robot-assisted collaborative tasks driven by large multimodal models [0.0] 検出ロボット管理GPT(D-RMGPT)は,LMMに基づくロボット支援組立プランナである
マーカや以前のトレーニングを必要とせずに、経験の浅い演算子をアセンブリタスクで支援することができる。
組立成功率83%を達成し、未経験者の組立時間を手作業よりも33%削減する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 16:34:21 GMT)
Cooperative atomic emission from a line of atoms interacting with a resonant plane surface [0.0] カシミール・ポルダー効果は、集合的な原子の周波数シフトと崩壊率を変化させることができる。
自由空間において期待される協調効果は、原子が表面に近いときに欠落していることを示す。
本研究では, 共振形地表面の前にあるセシウム6P3/2原子の研究を, この研究結果を実験的に実証するための最も有望なシナリオとして提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:16:02 GMT)
Controlling nonergodicity in quantum many-body systems by reinforcement learning [0.0] 量子非エルゴディティ制御のためのモデルフリー・ディープ強化学習フレームワークを開発した。
我々は, DRLエージェントが量子多体系を効率的に学習できることを実証するために, パラダイム的一次元傾斜Fermi-Hubbardシステムを用いた。
連続制御プロトコルと観測は実験的に実現可能である。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 20:55:44 GMT)
Coherent expansion of the motional state of a massive nanoparticle beyond its linear dimensions [0.0] 量子力学は、巨大な粒子が波のように振る舞うことを予測している。
我々は,大規模な浮遊光学系において,前例のない位置拡散の程度を実験的に達成した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:58:05 GMT)
Characterizing the Entanglement of Anyonic Systems using the Anyonic Partial Transpose [0.0] 混合量子状態の絡み合いは、部分転位とその対応する絡み合い測度、対数ネガティリティを用いて定量化することができる。
近年、部分転位の概念は、交換統計がボゾンやフェルミオンのケースを超えたエキゾチック準粒子であるエキゾチック準粒子の系にまで拡張されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:52:29 GMT)
Capturing anharmonic effects in single vibronic level fluorescence spectra using local harmonic Hagedorn wavepacket dynamics [0.0] 我々は、スペクトルに対するHagedornアプローチと、ポテンシャルの局所的調和近似を組み合わせる。
局所調和法の方が大域調和近似よりも正確な結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 21:01:59 GMT)
CT-AGRG: Automated Abnormality-Guided Report Generation from 3D Chest CT Volumes [0.0] 既存の方法では、観察された異常に明示的に焦点をあてることなく、3D CT画像から直接レポートを生成するのが一般的である。
本稿では,まず異常を予測し,それぞれが対象とする記述を生成する,新たな異常誘導型レポート生成モデルを提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 19:36:27 GMT)
CNN-based Labelled Crack Detection for Image Annotation [0.0] 本稿では,深部畳み込みニューラルネットワーク(CNN)を用いたAM表面のき裂検出手法を提案する。
訓練されたCNNは、14,982の注釈付き画像の解像度が1536 x 1103ピクセルのデータセットで99.54%の精度を達成した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:01:50 GMT)
Bootstrapping Classical Shadows for Neural Quantum State Tomography [0.0] 古典的影を用いたクロスエントロピー損失関数の最適化のための新しい推定器を提案する。
この損失関数は、古典的な影の測定に基づいて訓練されたトランスフォーマーベースニューラルネットワークを用いて、GHZ状態の安定な再構成を実現するために利用できることを示す。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 23:42:27 GMT)
Bayesian Learning in a Nonlinear Multiscale State-Space Model [0.0] この研究は、異なる時間スケールで相互作用するシステム間の動的相互作用を探索する、新しいマルチスケール状態空間モデルを導入する。
本稿では,このマルチスケールモデルにおける未知のプロセスノイズ共分散を学習することにより,未知の状態の推定を行うためのベイズ学習フレームワークを提案する。
本研究では,提案手法の有効性をシミュレーションし,提案手法の有効性を実証するPGASアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:33:48 GMT)
Automatic Image Annotation (AIA) of AlmondNet-20 Method for Almond Detection by Improved CNN-based Model [0.0] 本稿では,アーモンドとその殻の分解過程の向上を目的とした,革新的な方法論を提案する。
最先端のDeep Convolutional Neural Networks(CNN)、特にAlmondNet-20アーキテクチャを活用して、これまでにない精度で99%以上を達成している。
本モデルでは,1000エポック以上の微妙な訓練を行った結果,99%の精度,0.0567の最小損失関数が得られた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 00:20:08 GMT)
AttDiCNN: Attentive Dilated Convolutional Neural Network for Automatic Sleep Staging using Visibility Graph and Force-directed Layout [0.0] Attentive Dilated Convolutional Neural Network (AttDiCNN) と呼ばれる自動睡眠ステージ分類器を提案する。
脳波信号から最も重要な情報を捉えるために、可視性グラフに基づく強制方向レイアウトを用いる。
ネットワークは、ローカル空間特徴抽出ネットワーク(LSFE)、時空間長期保持ネットワーク(S2TLR)、グローバル平均注意ネットワーク(G2A)の3つのコンポータから構成される。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 06:35:50 GMT)
Angstrom-scale ion-beam engineering of ultrathin buried oxides for quantum and neuro-inspired computing [0.0] 埋没した極薄のトンネル酸化物、2D材料、固体電解質を含む多層ナノスケールシステムは、次世代論理、メモリ、量子およびニューロインスパイアされた計算に不可欠である。
ここでは, イオンビームアニールを用いた拡張性アプローチを, アングストロームスケールの厚さ制御による埋没酸化膜工学に応用する。
Al/a-AlOx/Al構造上におけるNe+照射の分子動力学シミュレーションにより, イオン生成結晶欠陥の重要な役割が確認された。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 11:58:38 GMT)
Analysis of nearly planar defects using the Thomas--Fermi--von Weiszacker model [0.0] 完全結晶に対する電子密度と相対エネルギーの収束を解析する。
完全結晶に関して、欠陥結晶の相対エネルギーが有限であることを証明する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:36:28 GMT)
Abelian Anyons on Flux-Quantized M5-Branes [0.0] 我々は、離散光円錐上にM5$perp$MO9-branes ("open M5-branes") 上のアーベルエノン量子状態の導出を示す。
証明の主要なステップは、電荷の端点を持つ弦の構成空間を持つコホモトピーモジュライ空間を特定するために、奥山の定理を使用する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:02 GMT)
A Unified Theory of Quantum Neural Network Loss Landscapes [0.0] 量子ニューラルネットワーク(QNN)がランダムにガウス過程として振る舞うことを示す。
与えられたQNNアーキテクチャの「トレーニング可能性」に関する公式な定義を提案する。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 18:00:08 GMT)
A Quantum Diophantine Equation Solution Finder [0.0] Groverのアルゴリズムは量子検索アルゴリズムであり、リスト内のマーク付きインデックスを非常に効率的に見つけることができる。
指数をディオファンチン方程式の整数変数として扱うことで、グロバーのアルゴリズムは古典的な方法よりも効率的にブルート力の解を見つけることができる。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 13:31:32 GMT)
5G NR PRACH Detection with Convolutional Neural Networks (CNN): Overcoming Cell Interference Challenges [0.0] 畳み込みニューラルネットワーク(CNN)を用いた5Gニューラジオ(5G-NR)ネットワークにおける干渉検出の新しい手法を提案する。
我々のCNNベースのモデルは、様々な干渉シナリオの中で物理ランダムアクセスチャンネル(PRACH)のシーケンスを検出するように設計されている。
実験の結果,従来のPRACH検出手法よりも精度,精度,リコール,F1スコアが優れていた。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 14:33:43 GMT)
2-Level Reinforcement Learning for Ships on Inland Waterways: Path Planning and Following [0.0] 本稿では、深部強化学習(DRL)に基づく内陸水路(IW)における自動表面車両(ASV)の制御のための現実的なモジュール化フレームワークを提案する。
高レベルローカルパス計画(LPP)ユニットと低レベルパス追従(PF)ユニットの2つのレベルから構成され、それぞれDRLエージェントで構成されている。
論文参考訳(メタデータ) (Wed, 21 Aug 2024 12:19:12 GMT)