A Survey on Model MoErging: Recycling and Routing Among Specialized Experts for Collaborative Learning [136.9] MoErgingは、専門家のモデルをリサイクルして、パフォーマンスや一般化を改善した集約システムを構築することを目的としている。
MoErgingメソッドの重要なコンポーネントは、特定の入力やアプリケーションに使用する専門家モデルを決定するルータの作成である。
このサーベイには、キーデザインの選択をカタログ化し、各手法に適した適用方法を明確にするための新しい分類が含まれている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:49:00 GMT)
Better Alignment with Instruction Back-and-Forth Translation [120.2] 本稿では,世界知識を基盤とした高品質な合成データを構築するために,バック・アンド・フォース・トランスフォーメーション(back-and-forth translation)という新たな手法を提案する。
ウェブコーパスから文書が与えられた場合、Liらによって提案されたバックトランスレーション手法を用いて合成命令を生成し、キュレートする。
我々は,Web上の情報多様性と量を活用しながら,効果的なアライメントに必要な応答の品質を確保しながら,両世界の長所を組み合わさっていることを発見した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:00:57 GMT)
EasyInv: Toward Fast and Better DDIM Inversion [107.5] 本稿では DDIM インバージョンへの容易かつ斬新なアプローチである EasyInv を紹介する。
EasyInvの中核となるのは、逆ノイズを近似するための洗練された戦略です。
我々は、EasyInvが従来のDDIMインバージョン手法と同等かそれ以上の結果を提供することができることを説明している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:23:06 GMT)
Made to Order: Discovering monotonic temporal changes via self-supervised video ordering [89.1] 我々は、シャッフルされた画像シーケンスをオーバシリ信号として処理する簡単なプロキシタスクを利用する。
本稿では,任意の長さの画像列を帰属マップで順序付けするトランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:41:48 GMT)
Emotionally Numb or Empathetic? Evaluating How LLMs Feel Using EmotionBench [83.4] 心理学からの感情評価理論を用いて,Large Language Models (LLMs) の人為的能力を評価する。
我々は、研究の中心となる8つの感情を引き出すのに有効な400以上の状況を含むデータセットを収集した。
人間の評価結果を参考として,商業モデルとオープンソースモデルの両方をカバーする7つのLCMを評価対象とする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:52:06 GMT)
Deep Non-rigid Structure-from-Motion: A Sequence-to-Sequence Translation Perspective [81.6] 本稿では,シーケンス・ツー・シーケンス翻訳の観点から,ディープNASfMをモデル化する。
まず,1つのフレームから初期非剛体形状とカメラの動きを推定するために,形状運動予測器を適用した。
そこで我々は,カメラの動きと複雑な非剛体形状をモデル化するためのコンテキストモデリングモジュールを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:30:54 GMT)
Source-Aware Training Enables Knowledge Attribution in Language Models [81.1] 固有のソースの引用は透明性、解釈可能性、検証可能性を高めることができる。
我々のトレーニングレシピは、モデルの難易度に大きな影響を与えることなく、事前学習データへの忠実な帰属を可能にする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:55:35 GMT)
Automated Software Tool for Compressing Optical Images with Required Output Quality [79.2] このツールは、利用可能な品質メトリクスのセットから選択されたメトリックに従って、異なるコーダによって画像を圧縮することができる。
いくつかの実践的な状況に対するツール応用の例を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:11:29 GMT)
DiffSG: A Generative Solver for Network Optimization with Diffusion Model [75.3] 拡散生成モデルはより広い範囲の解を考えることができ、学習パラメータによるより強力な一般化を示す。
拡散生成モデルの本質的な分布学習を利用して高品質な解を学習する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:56:21 GMT)
Masked Image Modeling: A Survey [73.2] マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。
我々は近年,分類学を構築し,最も顕著な論文をレビューしている。
我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:27:02 GMT)
A Novel Cartography-Based Curriculum Learning Method Applied on RoNLI: The First Romanian Natural Language Inference Corpus [71.8] 自然言語推論は自然言語理解のプロキシである。
ルーマニア語のNLIコーパスは公開されていない。
58Kの訓練文対からなるルーマニア初のNLIコーパス(RoNLI)を紹介する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:38:59 GMT)
mPLUG-Owl3: Towards Long Image-Sequence Understanding in Multi-Modal Large Language Models [71.4] 本稿では,多目的なマルチモーダル大言語モデルであるmPLUG-Owl3を提案する。
具体的には、視覚と言語を共通の言語誘導意味空間に効率的に統合する新しいハイパーアテンションブロックを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:10:32 GMT)
Recent Advances in Predictive Modeling with Electronic Health Records [71.2] EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。
深層学習は、医療を含む様々な応用においてその優位性を示している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:35:57 GMT)
Negative Object Presence Evaluation (NOPE) to Measure Object Hallucination in Vision-Language Models [67.8] NOPE(Negative Object Presence Evaluation)は、視覚言語(VL)モデルにおける物体幻覚を評価するために設計された新しいベンチマークである。
視覚的問題における物体の非存在を識別するために,10種類の最先端VLモデルの性能を広範囲に検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:48:31 GMT)
Keep the Cost Down: A Review on Methods to Optimize LLM' s KV-Cache Consumption [67.0] 大規模言語モデル(LLM)は、先進的な言語理解によって様々な産業に革命をもたらした。
KV-Cacheはこの問題の重要解として現れ、トークン生成の時間的複雑さを2次から線形に変換する。
本稿では、KVキャッシュの諸特性を解析し、現在LLMのKVキャッシュ空間利用を最適化するために使われている様々な手法について詳述する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:55:43 GMT)
FlatFusion: Delving into Details of Sparse Transformer-based Camera-LiDAR Fusion for Autonomous Driving [64.0] 多様なセンサーのモダリティからのデータの統合は、自律運転のシナリオにおいて一般的な方法論となっている。
効率的な点雲変換器の最近の進歩は、スパースフォーマットにおける情報統合の有効性を裏付けている。
本稿では,Transformer を用いた sparse cameraLiDAR 融合における設計選択を包括的に検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:46:32 GMT)
Token Compensator: Altering Inference Cost of Vision Transformer without Re-Tuning [63.4] 視覚変換器(ViT)の訓練と推論を高速化するトークン圧縮
しかし、下流タスクに適用した場合、圧縮度はトレーニングと推論の段階で不一致となる。
本稿では,2段階間の圧縮度を分離するモデル演算フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:36:43 GMT)
DyG-Mamba: Continuous State Space Modeling on Dynamic Graphs [59.4] 動的グラフ学習は、現実世界のシステムにおける進化の法則を明らかにすることを目的としている。
動的グラフ学習のための新しい連続状態空間モデルDyG-Mambaを提案する。
我々はDyG-Mambaがほとんどのデータセットで最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:21:46 GMT)
There is No Silver Bullet: Benchmarking Methods in Predictive Combinatorial Optimization [59.3] 予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
モジュールレベルでの設計選択を含む、両方のアプローチのシステマティックなベンチマークはありません。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:43:06 GMT)
RealGen: Retrieval Augmented Generation for Controllable Traffic Scenarios [58.6] RealGenは、トラフィックシナリオ生成のための新しい検索ベースのコンテキスト内学習フレームワークである。
RealGenは、複数の検索されたサンプルの振る舞いを勾配のない方法で組み合わせることで、新しいシナリオを合成する。
このコンテキスト内学習フレームワークは、シナリオを編集する機能を含む多種多様な生成機能を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:20:34 GMT)
LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs [57.2] LLM(Long context large language model)は、最大10000のトークンを処理できるが、2000ワードを超える出力を生成するのに苦労する。
我々は,超長期タスクをサブタスクに分解するエージェントベースのパイプラインであるAgentWriteを紹介する。
出力長が2kから32kのSFTデータを含むデータセットであるLongWriter-6kを構築した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:46:12 GMT)
Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal Prompts [57.0] 本稿では、事前学習された視覚言語モデル(VLM)に基づく、弱教師付きビデオ異常検出および局所化のための時間的プロンプト埋め込み(WSVADL)を学習する新しい手法を提案する。
提案手法は,WSVADLタスクの3つの公開ベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:55:03 GMT)
Transformers Can Do Bayesian Inference [57.0] 我々はPFN(Presideed Data Fitted Networks)を提案する。
PFNは、大規模機械学習技術におけるインコンテキスト学習を活用して、大規模な後部集合を近似する。
我々は、PFNがガウス過程をほぼ完璧に模倣し、難解問題に対する効率的なベイズ推定を可能にすることを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:58:44 GMT)
VolumeDiffusion: Flexible Text-to-3D Generation with Efficient Volumetric Encoder [56.6] 本稿では,テキストから3D生成のための先駆的な3Dエンコーダを提案する。
マルチビュー画像から特徴ボリュームを効率よく取得する軽量ネットワークを開発した。
3Dボリュームは、3D U-Netを使用してテキストから3D生成のための拡散モデルに基づいて訓練される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:35:02 GMT)
Fast Information Streaming Handler (FisH): A Unified Seismic Neural Network for Single Station Real-Time Earthquake Early Warning [56.5] 既存のEEWアプローチは、フェーズの選択、位置推定、大きさ推定を独立したタスクとして扱い、統一されたフレームワークを欠いている。
我々は高速情報ストリーミングハンドラー(FisH)と呼ばれる新しい統合型地震波ニューラルネットワークを提案する。
FisHは、リアルタイムストリーミング地震データを処理し、位相選択、位置推定、大きさ推定をエンドツーエンドで同時生成するように設計されている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:33:23 GMT)
Social Debiasing for Fair Multi-modal LLMs [55.8] MLLM(Multi-modal Large Language Models)は、強力な視覚言語理解機能を提供する。
しかしながら、これらのモデルはトレーニングデータセットから深刻な社会的偏見を継承することが多く、人種や性別といった属性に基づいた不公平な予測につながります。
本稿では,MLLMにおける社会的バイアスの問題に対処する。i)多元的社会的概念(CMSC)を用いた包括的対実的データセットの導入,i)アンチステレオタイプデバイアス戦略(ASD)を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:08:32 GMT)
Training LLMs over Neurally Compressed Text [55.1] 本稿では,高度に圧縮されたテキスト上での大規模言語モデル(LLM)の訓練について検討する。
テキストをブロックに分割し,それぞれが同じビット長に圧縮する新しい圧縮手法であるEqual-Info Windowsを提案する。
提案手法は, 大規模化により向上し, パープレキシティと推論速度のベンチマークにおいて, バイトレベルのベースラインをはるかに上回る, ニューラルネットワークによる効果的な学習を実演する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 22:01:42 GMT)
Out of Length Text Recognition with Sub-String Matching [54.6] 本稿では,このタスクをOOL(Out of Length)テキスト認識と呼ぶ。
サブ文字列マッチング(SMTR)を用いたOOLテキスト認識手法を提案する。
SMTRは2つのクロスアテンションベースのモジュールから構成される: 1つは複数の文字を含むサブストリングを次のクエリと前のクエリにエンコードし、もう1つは画像の特徴に対応するためにクエリを使用する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:36:52 GMT)
Re-TASK: Revisiting LLM Tasks from Capability, Skill, and Knowledge Perspectives [54.1] 本稿では,LLMタスクをcApability, Skill, Knowledgeの視点から再検討する理論モデルであるRe-TASKフレームワークを紹介する。
LLMの能力、その処理する知識、それが適用するスキルの相互作用を調べ、これらの要素がどのように相互接続され、タスクのパフォーマンスに影響を与えるかを解明する。
目的知識注入とスキル適応によるLLMの強化のための構造化戦略を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:58:23 GMT)
Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.0] STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:22:50 GMT)
Prompt Tuning as User Inherent Profile Inference Machine [53.8] 本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。
プロファイル量子化コードブックは、プロファイル埋め込みによるモダリティギャップを協調IDにブリッジする。
4つの公開データセットの実験では、UserIP-Tuningは最先端のレコメンデーションアルゴリズムを上回っている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:25:46 GMT)
StylizedGS: Controllable Stylization for 3D Gaussian Splatting [53.0] StylizedGSは知覚因子を適応的に制御する効率的な3Dニューラルスタイル転送フレームワークである。
本手法は,忠実なブラシストロークとフレキシブル制御による幾何整合性を特徴とする高品質なスタイリゼーションを実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:43:30 GMT)
Deepfake Media Forensics: State of the Art and Challenges Ahead [51.3] AIが生成する合成メディア、別名Deepfakesは、エンターテイメントからサイバーセキュリティまで、多くの領域に影響を与えている。
ディープフェイク検出は、微妙な矛盾やアーティファクトを機械学習技術で識別することに焦点を当て、研究の不可欠な領域となっている。
本稿では,これらの課題に対処する主要なアルゴリズムについて,その利点,限界,今後の展望について検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:10:20 GMT)
Indoor Scene Reconstruction with Fine-Grained Details Using Hybrid Representation and Normal Prior Enhancement [50.6] 多視点RGB画像からの室内シーンの再構成は、平坦領域とテクスチャレス領域の共存により困難である。
近年の手法では、予測された表面正規化によって支援されたニューラルラジアンス場を利用してシーン形状を復元している。
本研究は, 上記の制限に対処して, 高忠実度表面を細かな詳細で再構築することを目的とする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:01:28 GMT)
Machine Learning Message-Passing for the Scalable Decoding of QLDPC Codes [49.5] 本稿では,グラフニューラルネットワークを用いた新規でスケーラブルなデコーダであるAstraを紹介する。
アストラは、タナーグラフで表される制約のスドゥークパズルを解くのと同様に働く。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:05:45 GMT)
A bound on the quantum value of all compiled nonlocal games [49.3] 我々は、コンパイルされた2人プレイヤの非ローカルゲームに対して量子音響結果を確立する。
我々は、基礎となる非局所ゲームの量子交換演算子値が、基礎となるコンパイルされたゲームの量子値の上界であることを証明した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:11:56 GMT)
Can Deception Detection Go Deeper? Dataset, Evaluation, and Benchmark for Deception Reasoning [48.1] 偽装検出を偽装推論に拡張する。
具体的には、潜在的な嘘と基本的な事実を提供し、この文がなぜ嘘なのかを分析する。
本稿では,データセットの構築や評価指標の定義など,この課題に対する最初の試みについて述べる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:16:01 GMT)
SSHPool: The Separated Subgraph-based Hierarchical Pooling [47.8] グラフ分類のための新しい局所グラフプーリング法,すなわち分離部分グラフベース階層プール(SSH)を開発した。
局所グラフ畳み込み単位を局所構造として個別に用いて各部分グラフをより粗いノードに圧縮する。
我々は、グラフ分類のためのSSHPoolモジュールに関連するエンドツーエンドのGNNフレームワークを開発する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:15:11 GMT)
etuner: Redundancy-Aware Efficient Continual Learning on Edge Devices [47.4] 推論精度、微調整実行時間、エネルギー効率を最適化する効率的なエッジ連続学習フレームワークであるETunerを提案する。
実験結果から,ETunerは全体の微調整実行時間を64%削減し,エネルギー消費量を56%削減し,即時モデル微調整アプローチよりも平均推定精度を1.75%向上した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:12:16 GMT)
Retrieval-enhanced Knowledge Editing in Language Models for Multi-Hop Question Answering [47.2] 大規模言語モデル(LLM)は質問応答タスクの習熟度を示しているが、しばしばリアルタイム知識の統合に苦慮している。
マルチホップ質問応答のためのRetrieval-Augmented Model Editing (RAE) フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:34:13 GMT)
Unlock the Power of Frozen LLMs in Knowledge Graph Completion [45.8] 大きな言語モデル(LLM)は、強力なコンテキストモデリングによって大きなコーパスから広範な知識を学ぶ。
我々は、LLMの中間層を刺激するためにプロンプトを利用することで、コンテキスト対応の知識三重項の隠蔽状態を捉える。
我々は、KGのサブグラフサンプリングによるエンティティ記述を生成し、三重項の曖昧さを減らし、知識表現を豊かにする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:15:55 GMT)
PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language Models [45.4] 大規模言語モデル(LLM)は、その例外的な生成能力により、顕著な成功を収めた。
Retrieval-Augmented Generation (RAG)は、これらの制限を緩和するための最先端技術である。
RAGシステムにおける知識データベースは,新たな,実用的な攻撃面を導入している。
この攻撃面に基づいて,RAGに対する最初の知識汚職攻撃であるPoisonedRAGを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:55:06 GMT)
Improving Synthetic Image Detection Towards Generalization: An Image Transformation Perspective [45.2] 現在の合成画像検出(SID)パイプラインは、主に普遍的なアーティファクト機能を構築することを目的としている。
3つの簡単な画像変換を持つ軽量かつ効率的な検出器SAFEを提案する。
我々のパイプラインは、新しい最先端のパフォーマンスを実現し、既存の手法に対する平均精度は4.5%、平均精度は2.9%向上した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:01:12 GMT)
Quantum State Transfer in a Magnetic Atoms Chain Using a Scanning Tunneling Microscope [45.0] 量子スピンチェーンの電気的制御は、量子情報処理に関連する技術での可能性から、ここ数年で際立った目標となった。
走査トンネル顕微鏡(STM)による電場を利用したS=1/2$チタン原子鎖における制御量子状態伝達の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:45:46 GMT)
Measurement events relative to temporal quantum reference frames [45.0] 我々は,Page-Wootters形式に対する2つの一貫したアプローチを比較し,進化と測定の操作的意味を明らかにする。
非イデアルクロックに対して、浄化された測定手法は非局所的、非単位的進化の時間をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:30:56 GMT)
S$^2$Mamba: A Spatial-spectral State Space Model for Hyperspectral Image Classification [45.0] ハイパースペクトル画像(HSI)を用いた土地被覆解析は、空間分解能の低さと複雑なスペクトル情報のため、未解決の課題である。
ハイパースペクトル画像分類のための空間スペクトル状態空間モデルであるS$2$Mambaを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:47:13 GMT)
A Survey of Behavior Learning Applications in Robotics -- State of the Art and Perspectives [44.5] 最近の多くの領域での機械学習の成功は圧倒的に多い。
実際のロボットで学んだり使ったりした行動について、幅広い概要を述べます。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:19:48 GMT)
Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents [44.3] 大きな言語モデル(LLM)は、複雑な推論を必要とする自然言語タスクにおいて顕著な能力を示している。
静的データセットに対する従来の教師付き事前トレーニングは、自律的なエージェント機能を実現するには不十分である。
本稿では,モンテカルロ木探索(MCTS)を自己批判機構と組み合わせ,エージェント間相互作用を反復的に微調整するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:52:13 GMT)
How Transformers Learn Causal Structure with Gradient Descent [44.3] 自己注意はトランスフォーマーが因果構造をエンコードすることを可能にする。
我々は、潜在因果構造を学習する必要があるコンテキスト内学習タスクを導入する。
我々は、文脈内学習タスクで訓練されたトランスフォーマーが、様々な因果構造を回復できることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:45:37 GMT)
Neural Architecture Search based Global-local Vision Mamba for Palm-Vein Recognition [44.3] 本稿では,画像の局所的相関と静脈特徴表現のためのトークン間のグローバル依存性を明示的に学習するための,GLVM(Global-local Vision Mamba)というハイブリッドネットワーク構造を提案する。
第3に,MHMambaブランチ(MHMamba),FIU(Feature Iteration Unit),CNN(Convolutional Neural Network)という3つのブランチからなるConvMambaブロックを提案する。
最後に,Global Local Alternate Neural Architecture Search (GLNAS)法を提案し,GLVMの最適アーキテクチャを進化的アルゴリズムと交互に探索する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:02:23 GMT)
FreeDiff: Progressive Frequency Truncation for Image Editing with Diffusion Models [44.3] 我々は、プログレッシブな$textbfFre$qu$textbfe$ncy truncationを用いて、ユニバーサル編集タスクのための$textbfDiff$usionモデルのガイダンスを洗練するために、新しいフリーアプローチを導入する。
本手法は,様々な編集タスクや多様な画像に対して,最先端の手法で比較結果を得る。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:48:37 GMT)
AKBR: Learning Adaptive Kernel-based Representations for Graph Classification [43.9] グラフ分類のための適応カーネルベース表現(AKBR)を学習するための新しいモデルを提案する。
提案手法は,グラフの適応型カーネル行列を構築するために,エンドツーエンドの表現学習モデルを定義することを目的としている。
実験結果から,提案したAKBRモデルは,標準グラフベンチマークにおいて,既存の最先端グラフカーネルやディープラーニング手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:01:15 GMT)
Multi-view Hybrid Graph Convolutional Network for Volume-to-mesh Reconstruction in Cardiovascular MRI [43.5] 画像間直接抽出のための新しいアーキテクチャであるHybridVNetを紹介する。
グラフ構造として符号化することで,表面および体積メッシュを効率的に処理できることを示す。
我々のモデルは、従来の畳み込みネットワークと変分グラフ生成モデル、深い監督とメッシュ固有の正規化を組み合わせたものです。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:18:41 GMT)
DiffLoRA: Generating Personalized Low-Rank Adaptation Weights with Diffusion [42.4] DiffLoRAは、拡散モデルをハイパーネットワークとして活用し、パーソナライズされた低ランク適応重みを予測する新しいアプローチである。
これらのLoRA重みをテキスト・ツー・イメージモデルに統合することにより、DiffLoRAは推論中のパーソナライズをさらなるトレーニングなしで達成する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:00:35 GMT)
Layerwise Recurrent Router for Mixture-of-Experts [42.4] Mixture-of-Experts (MoE)アーキテクチャは、トレーニングコストを大幅に増加させることなく、モデルサイズをスケールできる能力で際立っている。
現在のMoEモデルはパラメータ非効率をしばしば表示する。
我々はMixture-of-Experts(RMoE)のためのLayerwise Recurrent Routerを紹介する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:25:13 GMT)
Efficient Search for Customized Activation Functions with Gradient Descent [42.2] 異なるアクティベーション関数は、異なるディープラーニングモデルに最適である。
本稿では,基本的な数学的操作と活性化関数のモデル化を組み合わせた,きめ細かい検索セルを提案する。
我々のアプローチは、特別なアクティベーションの識別を可能にし、試したすべてのモデルのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:27:31 GMT)
Breaking Class Barriers: Efficient Dataset Distillation via Inter-Class Feature Compensator [42.0] クラス間特徴補償器(Inter-class Feature Compensator、INFER)は、現在のデータセット蒸留法で広く利用されているクラス固有のデータラベルフレームワークを超越する革新的な蒸留手法である。
INFERは、蒸留中のクラス間相互作用を強化し、蒸留データの有効性と一般化性を高める。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:29:00 GMT)
EXAONE 3.0 7.8B Instruction Tuned Language Model [42.0] EXAONE 3.0命令調整言語モデルは、Large Language Models (LLMs) の最初のオープンモデルである。
EXAONE 3.0は、同じ大きさの他の最先端のオープンモデルに対して、命令追従機能を備えた非常に競争力のある実世界のパフォーマンスを示す。
比較分析の結果,EXAONE 3.0は韓国では特に優れており,一般的なタスクや複雑な推論において魅力的な性能を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:09:32 GMT)
PRESENT: Zero-Shot Text-to-Prosody Control [41.6] PreSENT (Prosody Editing without Style Embeddings or New Training) は、FastSpeech2ベースのモデルにおいて、推論プロセスを直接修正することで明示的な韻律予測を利用する。
我々は、それぞれドイツ語、ハンガリー語、スペイン語の文字誤り率(CER)を12.8%、18.7%、および5.9%とし、3つの言語で前回のCERを2倍以上上回った。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:39:07 GMT)
GeoFormer: Learning Point Cloud Completion with Tri-Plane Integrated Transformer [41.3] ポイント・クラウド・コンプリートは、正確なグローバル・ジオメトリを復元し、部分的なポイント・クラウドからのきめ細かい局所的な詳細を保存することを目的としている。
従来の手法では、3Dポイントのクラウド座標から直接見えない点を予測したり、自己投影された多視点深度マップを使用するのが一般的である。
ポイントのグローバルな幾何学的構造を同時に拡張し、局所的な詳細を改善するGeoFormerを導入する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:15:36 GMT)
PromptKD: Unsupervised Prompt Distillation for Vision-Language Models [40.9] 本稿では,教師モデルの知識を軽量ターゲットモデルに伝達することを目的とした,教師なしドメインプロンプト蒸留フレームワークを提案する。
本フレームワークは,2つの異なる段階から構成される。初期段階では,ドメイン(フェーショット)ラベルを用いて,大規模なCLIP教師モデルを事前訓練する。
その後の段階では、記憶されたクラスベクトルを教師と生徒の画像エンコーダ間で共有し、予測ロジットを算出する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:50:02 GMT)
ActPrompt: In-Domain Feature Adaptation via Action Cues for Video Temporal Grounding [40.6] 本稿では,機能適応のためのドメイン内ファインチューニングのパラダイムを提案する。
本稿では, VLMのイメージエンコーダにアクションキューを注入し, アクションに敏感なパターンの発見に役立てるアクションキュー注入型テンポラルプロンプト学習(ActPrompt)を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:18:32 GMT)
Power Variable Projection for Initialization-Free Large-Scale Bundle Adjustment [40.0] 小型のバンドル調整問題を解決するために,電力可変射影(PoVar)を導入する。
提案手法は, 精度, 速度, 精度の両面から, 最先端の結果が得られたことを実験的に実証する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:25:34 GMT)
Dual-Space Knowledge Distillation for Large Language Models [39.8] KDのための2つのモデルの出力空間を統一する二空間知識蒸留(DSKD)フレームワークを提案する。
我々のフレームワークは、現在のフレームワークのようなKDの様々な距離関数と互換性があるだけでなく、語彙に関係なく、任意の2つのLLM間のKDもサポートしています。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:12:34 GMT)
FuxiTranyu: A Multilingual Large Language Model Trained with Balanced Data [39.5] FuxiTranyuは、バランスの取れたハイパフォーマンス機能を備えたオープンソースの多言語言語モデルである。
80億のパラメータを持つベースモデルであるFuxiTranyu-8Bは、厳密にバランスの取れた多言語データリポジトリ上でゼロからトレーニングされている。
ベースモデルに加えて,多様な多言語命令データセットを微調整したFuxiTranyu-8B-DPOと,さらにDPOを改良したFuxiTranyu-8B-DPOという2つの命令調整モデルも開発している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:57:25 GMT)
Surrogate-Assisted Search with Competitive Knowledge Transfer for Expensive Optimization [39.4] 重大最適化問題 (EOP) は, 様々な応用に応用されているため, 何十年にもわたって研究の関心が高まりつつある。
多くの高度なサロゲート支援進化アルゴリズム (SAEA) にもかかわらず、これらのアルゴリズムの多くは以前に解決されたタスクから知識を伝達する能力に欠けていた。
様々なSAEAを促進するために,プラグアンドプレイの知識伝達手法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:38:22 GMT)
Convergence Error Analysis of Reflected Gradient Langevin Dynamics for Globally Optimizing Non-Convex Constrained Problems [38.5] グラディエントランゲヴィン力学とその変種は、最初は大域方程式において、大域最適解への収束に注目を惹きつけている。
本稿では,新しい凸制約付き非拘束境界問題を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:33:53 GMT)
Multimodal Analysis of White Blood Cell Differentiation in Acute Myeloid Leukemia Patients using a β-Variational Autoencoder [38.1] 形態学的および転写学的データを探索・再構成する教師なし手法を提案する。
本手法は, カスタマイズされた損失関数を持つβ変分オートエンコーダ(β-VAE)をベースとする。
バイオメディシンと診断のための白血球成熟の理解を改善するためのユニークなツールを提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:24:52 GMT)
Bi-directional Contextual Attention for 3D Dense Captioning [38.0] 3Dシークエンスキャプションは、オブジェクトのローカライゼーションと、各オブジェクトの3Dシーンにおける記述の生成を含むタスクである。
最近のアプローチでは、オブジェクトペアとの関係をモデル化したり、オブジェクトの最も近い特徴を集約したりすることで、コンテキスト情報を組み込もうとしている。
変換器エンコーダ・デコーダパイプラインであるBiCAを導入し,2方向コンテキストアテンションを持つ各オブジェクトに対して3次元の高密度キャプションを行う。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:25:54 GMT)
Can virtual staining for high-throughput screening generalize? [37.2] 本研究は,HTSで一般的に見られる3種類の細胞型(肺,卵巣,乳房)と2種類の表現型(毒性および非毒性)のデータが仮想染色モデルを効果的に訓練できるかどうかを系統的に検討した。
我々は、ピクセルベース、インスタンスワイド、生物学的機能ベースの各レベルのモデルの一般化能力を評価する。
本研究は,非毒性条件試料を用いた仮想核・細胞質モデルの訓練が毒性条件試料に一般化するだけでなく,すべての評価レベルの性能向上につながることを示唆している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:31:42 GMT)
Generative AI for Immersive Communication: The Next Frontier in Internet-of-Senses Through 6G [37.1] 感覚のインターネット(Internet of Senses, IoS)は、多感覚体験を提供することを目指しており、私たちの物理的現実において、私たちの知覚は単なる視覚と音以上のものであることを認識している。
本稿では,没入型マルチ感覚メディアを駆動する既存の技術について考察し,その能力と応用の可能性について考察する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:58:13 GMT)
AquilaMoE: Efficient Training for MoE Models with Scale-Up and Scale-Out Strategies [36.6] AquilaMoEは最先端のバイリンガル8*16BMixture of Experts (MoE)言語モデルで、それぞれ16億のパラメータを持つ8人のエキスパートが参加する。
このアプローチは、2段階のプロセスを通じてデータ要求を最小限にしながら、パフォーマンスを最適化する。
我々は16Bモデルと8*16B AquilaMoEモデルの訓練に成功した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:07:00 GMT)
GLGait: A Global-Local Temporal Receptive Field Network for Gait Recognition in the Wild [36.0] 本研究では,グローバルローカルな時間的受容場ネットワーク(GLGait)を設計し,野生における歩行認識の問題に対処する。
GLGaitはグローバルローカル・テンポラル・モジュール(GLTM)を使用して、グローバルローカル・テンポラル・テンポラル・レセプティブ・フィールドを確立する。
また、擬大域的時間受容場を真の全体論的時間受容場に集約することもできる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:48:28 GMT)
ClickAttention: Click Region Similarity Guided Interactive Segmentation [35.9] 本稿では、正クリック領域と全入力との類似性に基づいて、正クリックの影響範囲を拡大するクリックアテンションアルゴリズムを提案する。
提案手法は既存手法よりも優れ,パラメータの少ない最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:26:09 GMT)
Surprisingly Strong Performance Prediction with Neural Graph Features [35.5] アーキテクチャグラフの特性を計算するためのニューラルグラフ特徴量(GRAF)を提案する。
GRAFは高速かつ解釈可能なパフォーマンス予測を提供すると同時に、ゼロコストプロキシよりも優れています。
他のゼロコストプロキシと組み合わせて、GRAFはコストのごく一部で既存のパフォーマンス予測器を上回っている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:42:34 GMT)
SlotLifter: Slot-guided Feature Lifting for Learning Object-centric Radiance Fields [34.4] SlotLifterは、シーンの再構築と分解を共同で扱う新しいオブジェクト中心モデルである。
シーン分解における最先端のパフォーマンスと、4つの挑戦的な合成と4つの複雑な実世界のデータセットに対する新規ビュー合成を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:51:37 GMT)
ViMo: Generating Motions from Casual Videos [34.2] ビデオから動画へ生成する新しいフレームワーク(ViMo)を提案する。
ViMoは、未完成のビデオコンテンツの膨大な量を生かして、多種多様な3Dモーションを作り出すことができる。
実験結果から、高速な動き、様々な視点、あるいは頻繁なオクルージョンが存在するビデオであっても、提案モデルが自然な動きを生成できることを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:57:35 GMT)
Efficient Human-Object-Interaction (EHOI) Detection via Interaction Label Coding and Conditional Decision [33.6] 本研究では, 検出性能, 推論複雑性, 数学的透明性のバランスを良くするために, 効率の良いHOI検出器を提案する。
我々の貢献は、稀な相互作用のケースをエンコードするためのエラー訂正符号(ECC)の適用を含む。
実験により,ECC符号化対話ラベルの利点と検出性能とEHOI法の複雑さのバランスが良好であることが示された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:34:06 GMT)
Navigating Cultural Chasms: Exploring and Unlocking the Cultural POV of Text-To-Image Models [33.0] テキスト・トゥ・イメージ(TTI)モデルに埋め込まれた文化的知覚を,3層にまたがる文化を特徴付けることによって探求する。
本稿では,CLIP空間を用いた本質的な評価を含む総合的な評価手法を提案する。
我々の研究を促進するために、CulText2Iデータセットを導入しました。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:11:49 GMT)
Solving Expensive Optimization Problems in Dynamic Environments with Meta-learning [32.4] 本稿では,高コストな動的最適化問題を解くための,シンプルなメタラーニングに基づく最適化フレームワークを提案する。
このフレームワークは柔軟性があり、任意の既製のサロゲートモデルをプラグイン形式で連続的に使用することができる。
いくつかの最先端アルゴリズムと比較して,提案手法の有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:53:16 GMT)
Latent Space Symmetry Discovery [31.3] 本稿では,非線形群作用の対称性を発見できる新しい生成モデルであるLatent LieGANを提案する。
本モデルでは,群作用に関する条件下で非線形対称性を表現できることが示されている。
LaLiGANはまた、方程式発見や長期予測を含む下流のタスクに有用な構造化された潜在空間をもたらす。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:14:15 GMT)
Model Counting in the Wild [31.1] モデルカウンタの荒野におけるスケーラビリティの厳密な評価を行う。
我々は、これらのインスタンス上で6つの最先端モデルカウンタを評価し、スケーラビリティと実行時のパフォーマンスを評価する。
私たちの分析は、モデルカウントにおけるポートフォリオベースのアプローチの課題と機会を強調します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:49:46 GMT)
Causal Agent based on Large Language Model [30.8] 大規模言語モデル(LLM)は様々な領域で大きな成功を収めている。
因果問題と因果論の固有の複雑さは、それらを自然言語で正確に記述する上で困難を生じさせる。
我々は,LLMに因果的ツールを,因果的エージェント(Causal Agent)というエージェント・フレームワーク内に組み込んで,因果的問題に対処できるようにした。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:22:26 GMT)
IDRetracor: Towards Visual Forensics Against Malicious Face Swapping [30.8] ディープフェイク法に基づく顔交換技術は、個人認証のセキュリティに重大な社会的リスクをもたらす。
本稿では,対象の顔と偽の顔とを逆マッピングにより追跡する,顔追跡という新しいタスクを提案する。
我々は,IDRetracorが定量的,定性的両面から有望なリトラシング性能を示すことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:53:48 GMT)
PBIR-NIE: Glossy Object Capture under Non-Distant Lighting [30.3] グロッシーオブジェクトは自然光下での多視点入力画像から3次元再構成を行う上で重要な課題となる。
PBIR-NIEは, 物体の形状, 材料特性, 周囲の照明を均等に捉えるために設計された逆レンダリングフレームワークである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:26:24 GMT)
Response Wide Shut: Surprising Observations in Basic Vision Language Model Capabilities [30.2] VLM(Vision-Language Models)は、様々な複雑なコンピュータビジョン問題に対処するための汎用ツールとして登場した。
これらのモデルは高い能力を持つが、いくつかの基本的な視覚的理解スキルが欠けていることが示されている。
本稿では,基本的な視覚課題におけるSoTA VLMの限界を理解することを目的とする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:26:32 GMT)
Divide and Conquer: Improving Multi-Camera 3D Perception with 2D Semantic-Depth Priors and Input-Dependent Queries [30.2] 既存の手法は、しばしば意味と深さの手がかりの相乗効果を無視し、分類と位置推定誤差をもたらす。
本稿では,SemanticsとDepthを先行として活用した入力対応トランスフォーマーフレームワークを提案する。
我々のアプローチは、意味と深さの事前を明示的にモデル化するS-Dを用いることで、オブジェクトの分類と位置推定の学習プロセスを阻害する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:51:34 GMT)
Flexible 3D Lane Detection by Hierarchical Shape MatchingFlexible 3D Lane Detection by Hierarchical Shape Matching [29.0] 3次元車線検出は、様々な視覚条件、複雑な類型、厳密な精度要求のため、依然として未解決の問題である。
本稿では,点雲から3次元レーン線を正確に予測するために,エンドツーエンドのフレキシブルかつ階層的なレーン検出器を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:04:23 GMT)
Fast-and-Frugal Text-Graph Transformers are Effective Link Predictors [28.4] リンク予測モデルは、エンティティとリレーションのテキスト記述を取り入れることで、動的グラフに完全に帰納的学習と柔軟性を実現することができる。
本稿では,テキスト記述とグラフ構造を効果的に統合し,リソース集約型テキストエンコーダへの依存を減らすトランスフォーマーベースのアプローチを提案する。
本稿では,FnF-TG(Fast-and-Frugal Text-Graph)トランスフォーマーの高速化とスケーラビリティを両立させながら,従来の最先端手法よりも優れた性能を実現していることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:04:29 GMT)
CROME: Cross-Modal Adapters for Efficient Multimodal LLM [28.3] MLLM(Multimodal Large Language Models)は、画像言語機能を示す。
既存のアプローチは、しばしば高価な言語モデルの再訓練と限定的な適応性を必要とする。
本稿では,効率的な視覚言語命令チューニングフレームワークCROMEを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:45:11 GMT)
Prioritize Alignment in Dataset Distillation [27.7] 既存の方法はエージェントモデルを使用して、ターゲットデータセットから情報を抽出し、蒸留データセットに埋め込む。
既存の手法では,情報抽出と埋め込みの両方の段階において,不整合情報を導入している。
本稿では、以下の2つの視点から情報を整列するデータセット蒸留(PAD)における優先順位付けアライメントを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:39:50 GMT)
MGH Radiology Llama: A Llama 3 70B Model for Radiology [27.6] 本稿では,高度な放射線学に焦点を当てた大規模言語モデルMGH Radiology Llamaを提案する。
Llama 3 70Bモデルを使用して開発され、Radiology-GPTやRadiology-Llama2といった従来のドメイン固有モデルをベースにしている。
従来の指標とGPT-4に基づく評価の両方を取り入れた評価では,汎用LLMよりも高い性能を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:30:03 GMT)
HyperMono: A Monotonicity-aware Approach to Hyper-Relational Knowledge Representation [27.3] ハイパーリレーショナル・ナレッジグラフ(HKG)では、各事実は属性値の修飾子に関連する主三重からなり、追加の事実知識が表現される。
本稿では,ハイパーリレーショナル知識グラフ補完のためのHyperMonoモデルを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:51:39 GMT)
DataNarrative: Automated Data-Driven Storytelling with Visualizations and Texts [27.2] データストーリ生成のための新しいタスクと,さまざまなソースから1,449のストーリを含むベンチマークを導入する。
2つのLLMエージェントを用いたマルチエージェントフレームワークを提案する。
我々のエージェント・フレームワークは一般的にモデルベースと人的評価の両方において非エージェント・フレームワークよりも優れていますが、結果はデータ・ストーリー・ジェネレーションにおけるユニークな課題を明らかにします。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:46:18 GMT)
Judging the Judges: A Systematic Investigation of Position Bias in Pairwise Comparative Assessments by LLMs [27.1] 本研究では,反復的整合性,位置整合性,位置整合性などの指標を用いて位置バイアスを定量化する枠組みを開発した。
我々はMTBenchベンチマークとDevBenchベンチマークから22タスクにわたる9つの判断モデルと40近い回答生成モデルを用いて実験を行い、約80,000の評価インスタンスを生成する。
本研究は,位置バイアスを理解するための新しい概念を導入し,評価のための多次元フレームワークを提供することによって,この分野に大きく貢献する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:52:10 GMT)
Super-intelligence or Superstition? Exploring Psychological Factors Underlying Unwarranted Belief in AI Predictions [27.1] AI予測の信条は、占星術とパーソナリティ心理学に基づく予測の信条と正に相関している。
驚くべきことに、認知スタイルは予測に対する信念に大きな影響を与えなかった。
これらの結果は、AIにおける「合理的迷信」現象を強調しており、信念は批判的評価よりも精神的直感によって駆動される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:35:26 GMT)
Controlling the World by Sleight of Hand [26.9] 我々は、物体と相互作用する人間の手のラベルなしビデオから学習することで、行動条件生成モデルを学ぶ。
画像と、所望のハンドインタラクションの形状/位置が与えられた場合、CosHandは、インタラクションが発生した後の未来のイメージを合成する。
実験により、結果のモデルが手動物体の相互作用の効果をよく予測できることが示されている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:33:45 GMT)
Active Learning for Control-Oriented Identification of Nonlinear Systems [26.2] 本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:11:03 GMT)
Towards Robust and Cost-Efficient Knowledge Unlearning for Large Language Models [25.9] 本研究では,大規模言語モデルを用いた堅牢かつコスト効率の高いアンラーニングのための2つの新しい手法を提案する。
まず、次に最も可能性の高いトークンの確率を増大させることで、不要なトークンを抑制する逆ヒンジ損失を設計する。
また,フィッシャー重み付き低ランク近似に基づく低ランク適応重みの初期化も提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:18:32 GMT)
BVI-UGC: A Video Quality Database for User-Generated Content Transcoding [25.4] ユーザ生成コンテンツ(UGC)のための新しいビデオ品質データベースBVI-UGCを提案する。
BVI-UGCには60(非プリスティン)の参照ビデオと1,080のテストシーケンスが含まれている。
私たちは、10のフル参照と11のノン参照品質メトリクスのパフォーマンスをベンチマークしました。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:30:12 GMT)
Optimal quantum state tomography with local informationally complete measurements [25.3] 一般MPS/MPDO状態が有界誤差で復元できるかどうかを,キュービット数で数個の状態コピーだけを用いて検討する。
我々は、典型的な短距離絡み合う状態、ランダムMPS/MPDO状態、一次元ハミルトニアンの熱状態を含む、様々な一般的な多体量子状態に対する正の答えを提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:58:02 GMT)
SAFETY-J: Evaluating Safety with Critique [24.7] SAFETY-Jは、英語と中国語のための二言語生成安全評価器であり、批判に基づく判断である。
人間の介入を最小限に抑えて批評の質を客観的に評価する自動メタ評価ベンチマークを構築した。
SAFETY-Jはよりニュアンスで正確な安全性評価を提供し、複雑なコンテンツシナリオにおける批判的品質と予測信頼性の両面を向上することを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:59:17 GMT)
ED$^4$: Explicit Data-level Debiasing for Deepfake Detection [24.7] 限られたデータから固有のバイアスを学習することは、一般化可能なディープフェイク検出の失敗の主な原因と考えられている。
データレベルで上記のバイアスに明示的に対処するためのシンプルで効果的な戦略であるED$4$を提示します。
我々は,既存のディープフェイク検出手法よりも有効性と優位性を示すため,広範囲な実験を行った。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:05:20 GMT)
SUBLLM: A Novel Efficient Architecture with Token Sequence Subsampling for LLM [24.7] SUBLLMは、サブサンプリング、アップサンプリング、バイパスモジュールを組み込むことで、コアデコーダのみのフレームワークを拡張する革新的なアーキテクチャである。
トレーニング中、SUBLLMはスピードを26%向上し、GPU毎にメモリを10GB削減する。
推論では、スピードを最大37%向上し、1GPUあたりのメモリを1GB削減する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:49:20 GMT)
Deep Reinforcement Learning for Real-Time Ground Delay Program Revision and Corresponding Flight Delay Assignments [24.1] 地上遅延プログラム(英語: Ground Delay Programs, GDP)は、航空交通管理(ATM)において、空港における容量の調整と不一致の要求に使用される一般的な交通管理イニシアチブである。
動作クローン(BC)と保守的Qラーニング(CQL)という2つのRLモデルを開発した。
これらのモデルは、地上および空中遅延と終端領域の混雑を統合した洗練された報酬関数を利用することで、GDP効率を向上させるように設計されている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:22:46 GMT)
IRS-Assisted Lossy Communications Under Correlated Rayleigh Fading: Outage Probability Analysis and Optimization [23.9] 本稿では,レイリーフェーディングを用いたインテリジェント反射面(IRS)を用いた損失通信システムについて述べる。
相関チャネルモデルを分析し,システム停止確率を導出する。
そして、IRSの位相シフトを最適化するために、深層強化学習法(DRL)を設計する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:27:30 GMT)
Rethinking Channel Dependence for Multivariate Time Series Forecasting: Learning from Leading Indicators [23.5] 本稿では,まず,各段階における先行指標とその先行ステップを効率的に推定するLIFTという新しい手法を提案する。
LIFTは任意の時系列予測メソッドとシームレスに協調できるプラグインとして機能する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:31:22 GMT)
Explainable AI Reloaded: Challenging the XAI Status Quo in the Era of Large Language Models [23.5] 我々は、人間中心の視点が説明可能な(XAI)への道のりであると論じる。
ブラックボックスの外側の説明可能性、ブラックボックスの端付近の説明可能性、インフラの縫い目を利用した説明可能性の3つの側面に沿って、XAI研究による議論を運用する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:39:52 GMT)
Multi-Agent Continuous Control with Generative Flow Networks [23.1] Generative Flow Networks (GFlowNets) は, トラジェクトリの最終状態が報酬に比例する分布から, 多様なトラジェクトリを生成することを目的としている。
本稿では,複数エージェントによる協調探索を実現するために,MACFN(Multi-Agent Generative Continuous Flow Networks)法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:12:03 GMT)
Heavy-Ball Momentum Accelerated Actor-Critic With Function Approximation [23.0] まず,重ボールモーメントを線形関数でパラメータ化した批判再帰に組み込むことにより,モーメントに基づくベネフィット・アクター・クリティカル(mboxHB-A2C)アルゴリズムを提案する。
理論的には,提案したHB-A2Cは,マルコフ雑音を伴う強化学習タスクに,$ooepsilon$-approximate stationary pointと$ooepsilon-2$ iterationsを付与することがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:03:46 GMT)
A Comparison of Imitation Learning Algorithms for Bimanual Manipulation [22.5] 本研究では,顕著な模倣学習アプローチの限界とメリットを実証する。
我々は,過剰制約付き力学系を含む複雑な双方向操作タスクにおいて,それぞれのアルゴリズムを評価する。
模倣学習は複雑なタスクを解くのに適しているが、全てのアルゴリズムが摂動、トレーニング要件、パフォーマンス、使いやすさに等しいわけではない。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:04:17 GMT)
kNN-CLIP: Retrieval Enables Training-Free Segmentation on Continually Expanding Large Vocabularies [22.5] kNN-CLIPは連続セグメンテーションのためのトレーニング不要の戦略である。
再トレーニングや大きなメモリコストを必要とせずに、継続的に成長する語彙に適応することができる。
大語彙セマンティクスとパノプティクスセグメンテーションデータセットにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:24:33 GMT)
Dynamic and Compressive Adaptation of Transformers From Images to Videos [22.5] InTIは動的フレーム間トークン補間を用いた圧縮画像から映像への適応のための新しい手法である。
Kinetics-400 では、InTI が 87.1 の最高-1 の精度に達し、GFLOP の37.5% の顕著な減少がある。
追加の時間モジュールと組み合わせると、InTIは最高1の精度87.6で、GFLOPsは37%減少する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:01:22 GMT)
Variational Learning of Gaussian Process Latent Variable Models through Stochastic Gradient Annealed Importance Sampling [22.3] 本研究では,これらの問題に対処するために,Annealed Importance Smpling (AIS)アプローチを提案する。
シークエンシャルモンテカルロサンプリング器とVIの強度を組み合わせることで、より広い範囲の後方分布を探索し、徐々にターゲット分布に接近する。
実験結果から,本手法はより厳密な変動境界,高い対数類似度,より堅牢な収束率で最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:09:05 GMT)
V4d: voxel for 4d novel view synthesis [22.0] 我々は、V4Dと略される4次元神経放射場をモデル化するために3D Voxelを使用し、3Dvoxelは2つのフォーマットを持つ。
提案した LUTs ベースの改良モジュールは,計算コストの少ない性能向上を実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:43:26 GMT)
Review-driven Personalized Preference Reasoning with Large Language Models for Recommendation [21.8] EXP3RTは、ユーザとアイテムレビューに含まれるリッチな好み情報を活用するために設計された、LLMベースの新しいレコメンデータである。
詳細なステップバイステップの推論と予測された評価を生成する。
実験の結果、EXP3RTは評価予測と候補項目の双方において、トップkレコメンデーションにおいて既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:05:10 GMT)
Temporal Variability and Multi-Viewed Self-Supervised Representations to Tackle the ASVspoof5 Deepfake Challenge [21.7] 本稿では,特定の周波数帯域をマスクしてCMを改善するデータ拡張手法である Frequency Mask を紹介する。
実験では, ASVspoof 5 Track 1 評価セットにおいて, minDCF 0.0158 と EER 0.55% を達成した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:15:15 GMT)
A Survey of Deep Learning for Group-level Emotion Recognition [21.5] グループレベルの感情認識(GER)は、人間の行動を分析する上で重要な領域である。
ディープラーニング(DL)技術の普及に伴い、ニューラルネットワークはGERへの関心が高まっている。
本稿では、GERに適用されたDL技術について概観的なレビューを行い、その分野の新しい分類法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:54:09 GMT)
Introducing the NewsPaLM MBR and QE Dataset: LLM-Generated High-Quality Parallel Data Outperforms Traditional Web-Crawled Data [21.4] ニューラルマシン翻訳(NMT)の最近の研究により、高品質なマシン生成データに対するトレーニングは、人為的なデータに対するトレーニングよりも優れていることが示されている。
この研究は、LLM生成、MBRデコード、QE参照のデータセットを初めてリリースし、文レベルと多文の両方の例を示す。
我々の(機械生成)データセットのスクラッチからのトレーニングは、(Webcrawled) WMT'23トレーニングデータセットのトレーニングよりも優れています。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:06:56 GMT)
Coherence Awareness in Diffractive Neural Networks [21.3] 拡散ネットワークでは空間コヒーレンス(空間コヒーレンス)の程度が劇的な効果を持つことを示す。
特に、物体の空間的コヒーレンス長が光学系で保存される最小の特徴量に匹敵する場合、非コヒーレントおよびコヒーレント極端は許容できる近似として機能しないことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:19:40 GMT)
Figure it Out: Analyzing-based Jailbreak Attack on Large Language Models [21.3] 大規模言語モデル(LLM)に対するジェイルブレイク攻撃に対する分析ベースジェイルブレイク(ABJ)を提案する。
ABJはGPT-4-turbo-0409上で94.8%の攻撃成功率(ASR)と1.06の攻撃効率(AE)を達成する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:46:18 GMT)
On the Correspondence of Non-flat Assumption-based Argumentation and Logic Programming with Negation as Failure in the Head [21.0] 非平坦なABAとLPの対応性を示す。
次に、この結果を、もともと双極性ABAと呼ばれる非平坦なABAの断片に対して定義された、いわゆる集合安定ABA意味論に拡張する。
本稿では,LP の集合安定セマンティクスを頭の中の失敗として定義し,集合安定な ABA セマンティクスとの対応を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:32:51 GMT)
A New Dataset, Notation Software, and Representation for Computational Schenkerian Analysis [20.7] シェーンケリアン分析(Schenkerian Analysis、SchA)は、メロディ、ハーモニー、カウンターポイント、フォームの要素を組み合わせて、音楽作品を支える階層構造を記述する音楽分析の手法である。
SchAはコンピュータ音楽コミュニティによって利用されることはめったにない。
シェンカーデータのより大きなコーパスにより、音楽構造をより深く理解した機械学習モデルを注入することができ、より「人間的」な結果をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:52:06 GMT)
An Infrastructure Cost Optimised Algorithm for Partitioning of Microservices [20.6] アプリケーションをクラウドに移行することは、ソフトウェア業界で広く採用されているため、分散クラウドにデプロイするアプリケーションにとって、最も適しており、広く受け入れられているアーキテクチャパターンであることが証明されている。
信頼性や障害分離,スケーラビリティ,アセットメンテナンスの容易さやオーナシップ境界の明確化など,技術的メリットの両面から,その有効性を実現しています。
場合によっては、既存のアプリケーションをアーキテクチャに移行するという複雑さは、圧倒的に複雑でコストがかかります。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:08:59 GMT)
Deep Inertia $L_p$ Half-Quadratic Splitting Unrolling Network for Sparse View CT Reconstruction [20.6] スパース・ビュー・コンピュート・トモグラフィー (CT) 再構成は, 効果的な正則化技術を必要とする, 難解な逆問題を引き起こす。
L_p$-norm正規化(英語版)を用いてスパーシリティを誘導し、慣性ステップを導入し、慣性$L_p$-norm半四分法分割アルゴリズムの開発に繋がる。
提案アルゴリズムは既存の手法を超越し、特にスキャンされたビューや複雑なノイズ条件が少ない。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:32:59 GMT)
Computation-friendly Graph Neural Network Design by Accumulating Knowledge on Large Language Models [20.3] グラフニューラルネットワーク(GNN)は目覚ましい成功を収めているが、アーキテクチャ設計の複雑さによって妨げられている。
人間の作業量を減らすために、研究者はGNNを設計するための自動アルゴリズムを開発しようとしている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:22:01 GMT)
HDRGS: High Dynamic Range Gaussian Splatting [20.1] 本稿では,高品質でリアルタイムな3D再構成技術であるSplattingを紹介する。
上記の課題に対処するために,我々はさらに高ダイナミックレンジ・ガウス・スプレイティング(GS)法を開発した。
本手法は, 合成シナリオと実世界のシナリオの両方において, 現在の最先端技術を超えている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:32:36 GMT)
NEO-BENCH: Evaluating Robustness of Large Language Models with Neologisms [19.9] 我々は、いくつかの一般的な収集手法を用いて、近年のイングランドのネオロジズムの多様な資源を創出する。
我々は新語を含む文と新語を置き換えたほぼ同一の文とを既存の代用語と比較することにより,時間的ドリフトを分析する。
モデル性能は1つの新語が文中に導入されるとき、機械翻訳においてほぼ半減する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:20:13 GMT)
Neural Speech and Audio Coding [19.4] 本稿では,ニューラル音声および音声符号化システムの領域におけるモデルベースおよびデータ駆動型アプローチの統合について検討する。
既存のコーデックの出力を後処理するように設計されたニューラルネットワークベースの信号エンハンサーを導入している。
本稿では、精神音響学的に校正された損失関数を用いて、エンドツーエンドのニューラルオーディオコーデックを訓練する方法について検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:13:21 GMT)
Class-aware and Augmentation-free Contrastive Learning from Label Proportion [19.4] Label Proportion(LLP)からの学習(Learning from Label Proportion)は、トレーニングデータを事前定義されたインスタンスのバッグに整理する、弱教師付き学習シナリオである。
本稿では,インスタンスレベルでのクラス認識管理を導入した拡張フリーコントラストフレームワークTabLLP-BDCを提案する。
我々のソリューションは、2段階のBag Different Contrastive(BDC)学習機構を備えており、堅牢なクラス認識インスタンスレベルの監視を確立する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:04:47 GMT)
Convergence of Message Passing Graph Neural Networks with Generic Aggregation On Large Random Graphs [19.3] 乱数グラフモデルにおけるメッセージパッシンググラフニューラルネットワークの収束性について,ノード数が無限大になる傾向にあるため,その連続性について検討する。
このような結果を、古典的に使われているすべてのメッセージパッシンググラフニューラルネットワークを含む、多数の集約関数に拡張する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:06:57 GMT)
From NeRFs to Gaussian Splats, and Back [18.8] 限られた数の(典型的には自我中心の)ビューが存在するロボティクスアプリケーションの場合、ニューラル放射場(NeRF)のようなパラメトリックな表現はガウススプラッティング(GS)のような非パラメトリックなものよりも一般化される。
我々はこの2つを前後に変換する手順を開発する。
提案手法は,NRF (PSNR, SSIM, LPIPS) とGS (リアルタイムレンダリング, 表現の修正能力) の双方の利点を生かし, これらの変換の計算コストは, スクラッチからトレーニングするよりも小さかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:49:40 GMT)
Simple but Effective Compound Geometric Operations for Temporal Knowledge Graph Completion [18.6] 時間的知識グラフ補完は、時間的知識グラフに欠けている事実を推測することを目的としている。
現在のアプローチでは、事実知識を連続ベクトル空間に埋め込んで、時間的知識グラフの潜在的なパターンを学習するために幾何学的操作を適用するのが一般的である。
本稿ではTCompoundEを提案する。TCompoundEは時間固有演算と関係固有演算を含む2つの幾何学演算を特別に設計する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:36:30 GMT)
GarmentCodeData: A Dataset of 3D Made-to-Measure Garments With Sewing Patterns [18.5] 縫製パターンを用いた3次元計測服の大規模合成データセットについて述べる。
GarmentCodeDataには115,000のデータポイントがあり、さまざまなデザインをカバーしている。
高速なXPBDシミュレータに基づくオープンソースの3D衣料ドレーピングパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:23:59 GMT)
Robust Black-box Testing of Deep Neural Networks using Co-Domain Coverage [18.4] 信頼できるデプロイメントには、マシンラーニングモデルの厳格なテストが必要です。
我々は、ディープニューラルネットワーク(DNN)の堅牢なテストのためのテストスーツを生成するための新しいブラックボックスアプローチを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:42:57 GMT)
Enhancing Visual Place Recognition via Fast and Slow Adaptive Biasing in Event Cameras [18.3] イベントカメラは、低レイテンシ、エネルギー効率、高ダイナミックレンジといった有益な特徴のために、ロボット工学でますます人気がある。
これらのパラメータは、イベントをトリガーするために必要な光強度の変化を規制する。
本稿では,2つのインタラクション手法を用いて,バイアスパラメータを自動的に調整するフィードバック制御アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:16:48 GMT)
Causal Effect Estimation using identifiable Variational AutoEncoder with Latent Confounders and Post-Treatment Variables [18.3] 観測データから因果効果を推定することは、特に潜伏した共同創設者の存在下では困難である。
本稿では,潜在共同創設者と潜在後処理変数の表現を学習するための,新しい変分オートエンコーダ(VAE)と識別可能な変分オートエンコーダ(iVAE)を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 22:13:25 GMT)
Offline to Online Learning for Personalized Bandwidth Estimation [18.3] 帯域幅推定(BWE)のためのデータ駆動型ソリューションであるMerlinを提案する。
Merlinは、専門家のBWEポリシーを抽出するために、事前の手法から専門家のデモンストレーションを利用する。
実世界のビデオ会議コールでは、Merlinは、客観的なQoEメトリクスに関して統計的に有意な動きをしない専門家のポリシーと一致します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:16:30 GMT)
Interpretable Graph Neural Networks for Tabular Data [18.3] IGNNetは学習アルゴリズムを制約し、解釈可能なモデルを生成する。
IGNNetは最先端の機械学習アルゴリズムに匹敵するパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:44:09 GMT)
MapComp: A Secure View-based Collaborative Analytics Framework for Join-Group-Aggregation [17.5] MapCompは、共同分析のためのジョイングループ集約クエリを容易にする、ビューベースの新しいフレームワークである。
我々の研究は、マテリアライズドビューを使ったセキュアな協調JGAクエリを高速化する最初の取り組みである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:40:48 GMT)
SparkRA: A Retrieval-Augmented Knowledge Service System Based on Spark Large Language Model [17.3] 我々は科学文献の事前学習と微調整による科学文献LLM(SciLit-LLM)を開発した。
本稿では,SciLit-LLMに基づく知識サービスシステムSpark Research Assistant(SparkRA)を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:18:47 GMT)
Amuro & Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models [17.3] 本研究では,複数の中間学習モデルチェックポイントの微調整による事前学習と微調整の関係について検討する。
18のデータセットで得られた結果は、事前学習が微調整後に発表される潜在的な方法でモデルを改善することを示唆している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:28:43 GMT)
SFMViT: SlowFast Meet ViT in Chaotic World [17.3] 本稿では,アンカープルーニング戦略を用いた高性能なデュアルストリーム特徴抽出ネットワークSFMTモデルを提案する。
画像の各フレームで検出されたアンカーをプーンし、有効アンカーをフィルタリングするために、信頼度最大ヒープを導入する。
これらの設計により、ViTは26のmAPを達成できます。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:13:50 GMT)
How to Best Combine Demosaicing and Denoising? [16.9] 分解と分解は 生画像パイプラインにおいて 重要な役割を担っています
ほとんどの復号法はノイズフリー画像の復号化に対処する。
本当の問題は、ノイズの多い生画像の合成と分解だ。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:23:53 GMT)
Style-Talker: Finetuning Audio Language Model and Style-Based Text-to-Speech Model for Fast Spoken Dialogue Generation [16.7] Style-Talkerは、高速音声ダイアログ生成のためのスタイルベースのTSモデルとともに、オーディオLLMを微調整する革新的なフレームワークである。
実験の結果,Style-Talkerは対話の自然さとコヒーレンスの両方の観点から,従来のカスケードと音声音声のベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:35:11 GMT)
Stabilizer bootstrapping: A recipe for efficient agnostic tomography and magic estimation [16.5] 未知の$n$-qubit state $rho$のコピーが与えられたとき、与えられたクラス$C$の何らかの状態を持つフィデリティ$tau$を持ち、そのフィデリティ$ge tau - epsilon$と$rho$を持つ状態を見つける。
我々は,このタスクのための計算効率の良いプロトコルを設計するための新しいフレームワークである安定化器ブートストラッピングを提供し,これを用いて,安定化器状態と離散積状態という,次のクラスに対する新しい非依存トモグラフィープロトコルを得る。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:23:17 GMT)
Hierarchical Structured Neural Network for Retrieval [16.4] 本稿では,階層的クラスタリングとニューラルネットワークモデルを共同で最適化した階層構造ニューラルネットワーク(HSNN)を提案する。
HSNNはAds Recommendationシステムにうまくデプロイされ、現在トラフィックの大部分を処理しています。
本稿では,新鮮度,ボラティリティ,コールドスタートレコメンデーション,クラスタ崩壊,大規模検索生産システムにおけるモデル展開の教訓といった課題に対処し,本システムの開発経験を公開する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:53:46 GMT)
KAN You See It? KANs and Sentinel for Effective and Explainable Crop Field Segmentation [16.4] 本稿では,Sentinel-2 と Sentinel-1 の衛星画像を用いて,Kan 層を U-Net アーキテクチャ (U-KAN) に統合して作物畑の分割を行う。
以上の結果より,従来の完全畳み込み型U-Netモデルに比べて,GFLOPが2%改善したことが示唆された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:07:29 GMT)
TIGER: A Generating-Then-Ranking Framework for Practical Python Type Inference [16.2] Pythonの動的型付けシステムは柔軟性と表現力を提供するが、型関連のエラーにつながる可能性がある。
TIGERはPythonの多様な型カテゴリを扱うための2段階生成レベル(GTR)フレームワークである。
ManyTypes4Pyデータセットに対する評価は、TIGERが様々な型カテゴリの既存のメソッドよりも優れていることを示している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:21:47 GMT)
Exploiting Leakage in Password Managers via Injection Attacks [16.1] 本研究では,パスワードマネージャに対するインジェクション攻撃について検討する。
この設定では、敵は自身のアプリケーションクライアントを制御し、例えば認証情報を共有することで、選択したペイロードを被害者のクライアントに"注入"するために使用する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:45:12 GMT)
Exploring Domain Shift on Radar-Based 3D Object Detection Amidst Diverse Environmental Conditions [15.8] この研究は、4Dレーダーによる物体検出において、しばしば見過ごされがちな領域シフトの問題について考察する。
以上の結果から,様々な気象シナリオにまたがるドメインシフトが明らかになり,ユニークなデータセットの感度が明らかになった。
異なる道路タイプ、特に高速道路から都市環境への移行は、顕著な領域シフトをもたらします。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:55:38 GMT)
CLIP4Sketch: Enhancing Sketch to Mugshot Matching through Dataset Augmentation using Diffusion Models [15.6] 拡散モデルを利用した大規模かつ多様なスケッチ画像を生成する新しいアプローチであるCLIP4Sketchを提案する。
本手法は拡散確率モデル(DDPM)を用いて,個人性やスタイルを明確に制御したスケッチを生成する。
以上の結果から,既存の顔のスケッチデータに対するトレーニングよりも,スケッチ・トゥ・マガットのマッチング精度が大幅に向上したことが示された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:46:39 GMT)
Enhancing Vision-Language Models Generalization via Diversity-Driven Novel Feature Synthesis [15.5] LDFSと呼ばれる新しいドメイン特徴を合成するプラグイン・アンド・プレイ機能合成法を提案する。
LDFSは,これらのドメインからデータを収集することなく,未知のドメイン上でのCLIPの一般化能力の向上に優れていることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:04:26 GMT)
Interpretable Pre-Trained Transformers for Heart Time-Series Data [15.4] 我々は、PTG-PTとECG-PTの2つのトレーニング済み汎用心臓モデルを作成する。
PPGのジクロティックノッチや心電図のP波など,個々の注意が生理学的に反する特徴に反応することを強調した。
これらの事前訓練されたモデルは、心房細動(AF)の分類や、光胸腺撮影におけるビート検出などのタスクにおいて、簡単に微調整できる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:18:45 GMT)
MiTTenS: A Dataset for Evaluating Gender Mistranslation [15.3] さまざまな言語ファミリーやスクリプトから26言語をカバーするデータセットMiTTenSを紹介した。
データセットは、既知の障害パターンをターゲットにした手作りのパスで構築される。
高資源言語においても,すべてのシステムが性別の誤訳や潜在的危害を示すことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:11:47 GMT)
Maximizing V-information for Pre-training Superior Foundation Models [14.8] 大規模データセットの事前トレーニング基盤モデルは、例外的なパフォーマンスを示している。
最近の研究では、事前学習データの増加がモデル性能の向上につながるかどうかが疑問視されている。
V情報の最大化のための最適データ効率学習法を開発した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:28:54 GMT)
CTISum: A New Benchmark Dataset For Cyber Threat Intelligence Summarization [14.3] CTI要約タスクのための新しいベンチマークであるCTISumを提案する。
攻撃プロセスの重要性を考慮すると,攻撃プロセスの要約の詳細なサブタスクが提案されている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:25:16 GMT)
VNet: A GAN-based Multi-Tier Discriminator Network for Speech Synthesis Vocoders [14.2] VNetは、全帯域スペクトル情報を組み込んだGANベースのニューラルボコーダネットワークである。
VNetモデルは高忠実度音声を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:00:02 GMT)
Blessing of Dimensionality for Approximating Sobolev Classes on Manifolds [14.2] 多様体仮説は、自然の高次元データが低次元多様体の周辺で支えられていることを言う。
統計的および学習に基づく手法の最近の成功は、この仮説を実証的に支持している。
我々は、一般化特性に直接関係する理論的な統計的複雑さの結果を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:56:42 GMT)
PayOff: A Regulated Central Bank Digital Currency with Private Offline Payments [13.8] 欧州中央銀行(ECB)は、中央銀行のデジタル通貨(CBDC)の発行の可能性に備えている。
オフライン支払いは、キャッシュライクなプライバシ、ローカル支払い決済、および保持制限の施行を可能にすることが期待されている。
本稿では,デジタルユーロ規制による新しいCBDC設計であるPayOffについて述べる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:15:06 GMT)
Neural Quantile Optimization for Edge-Cloud Networking [13.5] 我々は,バースト可能な請求書に基づいて制約を満足し,コストを最小化するエッジ・クラウド・コンピューティング・ネットワークにおいて,最適なトラフィック割当方式を模索する。
本稿では,教師なし学習による最適化問題を解決するため,Gumbel-softmaxサンプリングネットワークを提案する。
トレーニングされたネットワークは、効率的なトラフィック割当スキームサンプリングとして機能し、実現可能性およびコスト関数値のランダム戦略を著しく上回る。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:04:09 GMT)
A Novel Computational and Modeling Foundation for Automatic Coherence Assessment [13.4] コヒーレンス(Coherence)は、テキスト単位が相互に関連付ける方法を指す、よく書かれたテキストの本質的な性質である。
本研究では,3つの条件 – em cohesion, consistency, emlevance – から成る談話コヒーレント(concourse coherent)を形式的に定義し,これらの条件をそれぞれ計算タスクとして定式化する。
人間によるコヒーレンス評価のための2つのベンチマークで、そのうち1つは、自動生成された500個の短編記事、もう1つは4万個の現実世界のテキストを含む。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:19:29 GMT)
Unveiling Factual Recall Behaviors of Large Language Models through Knowledge Neurons [13.3] 本研究では,Large Language Models (LLMs) が推論タスクに直面すると,その内部知識のリポジトリを積極的にリコールするか,回収するかを検討する。
我々は,LLMが特定の状況下での批判的事実関連を活用できないことを明らかにした。
複雑な推論タスクに対処する強力な手法であるChain-of-Thought(CoT)プロンプトの効果を評価する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:16:23 GMT)
DePatch: Towards Robust Adversarial Patch for Evading Person Detectors in the Real World [13.0] 本稿では,デカップリング逆パッチ(Decoupled adversarial Patch, DePatch)攻撃を導入し,逆パッチの自己結合問題に対処する。
具体的には、逆パッチをブロックワイドセグメントに分割し、これらのセグメント間の依存性を低減する。
さらに,攻撃能力を向上させるために,境界シフト操作とプログレッシブデカップリング戦略を導入する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:25:13 GMT)
Who's asking? User personas and the mechanics of latent misalignment [12.9] 安全に配慮したモデルでは、不整合能力は依然として潜伏している。
モデル世代が安全である場合でも、有害なコンテンツは隠された表現で持続可能であることを示す。
特定のペルソナがモデルセーフガードを破る理由を調査し、モデルがより慈善的な解釈を形成することができることを確かめる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:02:13 GMT)
A Comprehensive Survey on EEG-Based Emotion Recognition: A Graph-Based Perspective [12.7] 脳波に基づく感情認識は、人間の脳の感情パターンに直感的に反応することができる。
重要なトレンドは、そのような依存をカプセル化するグラフの適用である。
脳波に基づく感情認識に感情関連グラフを構築するための総合的なレビューやチュートリアルは存在しない。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:22:49 GMT)
Voltran: Unlocking Trust and Confidentiality in Decentralized Federated Learning Aggregation [12.4] 我々は、フェデレートラーニング(FL)のための信頼、機密性、堅牢性を達成するために設計された革新的なハイブリッドプラットフォームであるVoltranを紹介する。
FLアグリゲーションをTEEにオフロードして、分離され、信頼され、カスタマイズ可能なオフチェーン実行を提供します。
マルチSGX並列実行戦略を導入することで、複数のFLシナリオに強力なスケーラビリティを提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:33:35 GMT)
Recent advances in InGaAs/InP single-photon detectors [12.4] 単一光子検出器(SPD)は、非常に弱い光検出を必要とするアプリケーションで広く使われている。
近赤外領域では、InGaAs/InP単光子アバランシェダイオード(SPAD)に基づくSPDが主な応用候補である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:12:44 GMT)
Improved Random Features for Dot Product Kernels [12.3] 我々はドット製品カーネルのランダムな特徴近似の効率を改善するために、いくつかの新しい貢献をしている。
複雑な特徴の利用はこれらの近似のばらつきを著しく減少させることができることを実証的に示す。
一般のドット製品カーネルのランダムな特徴近似を改善するために,データ駆動型最適化手法を開発した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:22:10 GMT)
EditScribe: Non-Visual Image Editing with Natural Language Verification Loops [12.2] EditScribeは、大規模なマルチモーダルモデルを利用した自然言語検証ループを使用して画像編集を可能にするプロトタイプシステムである。
ユーザはまず、最初のジェネリクスとオブジェクト記述を通じて画像内容を理解し、その後、オープンな自然言語プロンプトを使用して編集動作を指定する。
視覚障害者10名を対象にした調査では、EditScribeが画像編集動作を非視覚的に実行し、検証することを支援した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:40:56 GMT)
Clinical information extraction for Low-resource languages with Few-shot learning using Pre-trained language models and Prompting [12.2] 臨床資料から医療情報を自動抽出することはいくつかの課題をもたらす。
ドメイン適応とプロンプト手法の最近の進歩は、最小限のトレーニングデータで有望な結果を示した。
軽量でドメイン適応型事前訓練モデルが20ショットでトリガーされ、従来の分類モデルを30.5%精度で上回っていることを実証する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:35:31 GMT)
EEG-MACS: Manifold Attention and Confidence Stratification for EEG-based Cross-Center Brain Disease Diagnosis under Unreliable Annotations [12.1] センター間のデータの異質性とアノテーションは、脳信号を用いた疾患のインテリジェントな診断に大きく挑戦する。
神経変性疾患の診断にMACS(Manifold Attention and Confidence Stratification)を用いた枠組みを導入する。
神経認知障害と運動障害の両方を中心コーパスを用いて対象非依存に実験し,既存のアルゴリズムと比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:03:38 GMT)
A Note on Stability in Asynchronous Stochastic Approximation without Communication Delays [11.9] 通信遅延のない非同期近似アルゴリズムについて検討する。
私たちの主な貢献は、これらのアルゴリズムの安定性の証明です。
本稿では,それらの応用を,平均回帰学習における重要な課題として論じる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:17:57 GMT)
HeadGaS: Real-Time Animatable Head Avatars via 3D Gaussian Splatting [11.8] HeadGaSは3Dガウスプレート(3DGS)を3Dヘッド再構成とアニメーションに使用するモデルである。
我々は,HeadGaSがベースラインを最大2dBまで越えて,リアルタイム推論フレームレートの最先端結果を提供することを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:56:58 GMT)
Garment3DGen: 3D Garment Stylization and Texture Generation [11.8] Garment3DGenは、単一の入力イメージをガイダンスとして与えられたベースメッシュから3Dの衣服資産を合成する新しい方法である。
画像から3Dへの拡散手法の最近の進歩を生かして, 3次元の衣服測地を創出する。
我々は、グローバルかつ局所的に一貫した高忠実なテクスチャマップを生成し、入力ガイダンスを忠実にキャプチャする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:18:15 GMT)
Faster Private Minimum Spanning Trees [11.7] 本稿では,時間内で動作中の既存手法の実用性に適合する新しい差分プライベートMSTアルゴリズムを提案する。
我々は,少なくとも$O(n2)$カットエッジを$O(sqrtn log n)$ timeでサンプリングすることのできるデータ構造を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:00:30 GMT)
Detecting Audio-Visual Deepfakes with Fine-Grained Inconsistencies [11.7] 空間領域と時間領域の両方において微妙なアーティファクトを検出するためのきめ細かいメカニズムを提案する。
まず,音声との不整合が生じやすい小さな空間領域を撮影できる局所視覚モデルを提案する。
第2に、トレーニングセットに微妙な時間的不整合を取り入れたサンプルを含む、時間的に局所的な擬似フェイク増強を導入する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:19:59 GMT)
Investigation of unsupervised and supervised hyperspectral anomaly detection [11.6] ハイパースペクトル異常検出(HS-AD)は、キャプチャされたシーンを特徴付け、それらを異常クラスとバックグラウンドクラスに分離する。
我々は以前,ハイパースペクトルアンミキシングと3つの教師なしHS-ADアルゴリズムの等価な投票アンサンブルを設計した。
我々は後に、教師付き分類器を用いて投票アンサンブルの重みを判定し、異種無教師型HS-ADアルゴリズムのハイブリッドを作成する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:20:14 GMT)
Can Large Language Models Reason? A Characterization via 3-SAT [11.4] 論理的推論と制約満足度タスクの中核にある原型NP完全問題である 3-SAT を用いる。
我々は,LLMの推論能力を実証的に特徴付け,それらが問題の固有の硬さとどのように異なるかを示す。
実験により, LLM は 3SAT 問題を解く上で必要となる真の推論を行うことができないことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:54:10 GMT)
WorldScribe: Towards Context-Aware Live Visual Descriptions [11.4] 我々は,ユーザのコンテキストに適応してカスタマイズ可能な実世界のビジュアル記述を自動的に生成するシステムであるWorldScribeを開発した。
WorldScribeは、視覚、言語、および音声認識モデルを組み合わせて、リアルタイム使用をサポートする記述生成パイプラインを導入している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:32:45 GMT)
Improving WiFi CSI Fingerprinting with IQ Samples [11.4] 無線通信の情報セキュリティを確保するためにはアイデンティティ認証が不可欠である。
RFフィンガープリント技術は、暗号ベースの認証アプローチのプロムアップサプリメントを提供する。
近年の進歩は、軽量RFフィンガープリントのための商用WiFiデバイスによる、容易に得ることのできるチャネル状態情報(CSI)を提唱している。
我々は,IQベースの手法に匹敵する性能を実現する新しいCSIフィンガープリントシステムであるCSI2Qを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:21:14 GMT)
Diffusion Model for Slate Recommendation [11.2] スレートレコメンデーション(スレートレコメンデーション)は、ストリーミングプラットフォームやeコマースサイトで、複数のアイテムをまとめて提示するテクニックである。
従来の手法では、ユーザが一度に1つのアイテムだけをエンゲージすると仮定することで、この問題を単純化することが多い。
本研究では,高次元データから構造を学習する能力を活かした拡散モデルを用いた生成手法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:29:57 GMT)
LePaRD: A Large-Scale Dataset of Judges Citing Precedents [11.2] LePaRD (LePaRD) は、アメリカ合衆国連邦裁判所の判例集である。
法的な通過予測は、前例的な裁判所の決定から関連する通過を予測することを目的としている。
LePaRDデータセットのサブセットは無償で利用可能で、データセット全体が公開される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:35:54 GMT)
120 Domain-Specific Languages for Security [11.1] セキュリティエンジニアリングはドメイン固有言語(DSL)によってしばしばサポートされます。
この体系的な文献レビューでは、6つの研究質問に基づいて120のセキュリティ指向DSLを検証している。
高度な断片化を観察することで、統合の機会が得られます。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:24:20 GMT)
Robust Deep Reinforcement Learning for Inverter-based Volt-Var Control in Partially Observable Distribution Networks [11.1] DRLベースのアプローチの大きな問題は、アクティブな分散ネットワークにおける測定デプロイメントの制限である。
このような問題に対処するために,保守的な批評家と代理的な報酬を持つ堅牢なDRLアプローチを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:02:10 GMT)
An Ensemble Score Filter for Tracking High-Dimensional Nonlinear Dynamical Systems [11.0] 本研究では,高次元非線形フィルタ問題に対するアンサンブルスコアフィルタ(EnSF)を提案する。
ニューラルネットワークをトレーニングしてスコア関数を近似する既存の拡散モデルとは異なり、トレーニング不要スコア推定を開発する。
EnSFは、最先端のLocal Ensemble Transform Kalman Filter法と比較して、驚くべきパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:48:39 GMT)
Joint Graph Rewiring and Feature Denoising via Spectral Resonance [10.9] グラフニューラルネットワーク(GNN)は、グラフ構造とノードに関連する特徴ベクトルを入力として扱う。
グラフ構造と特徴を協調的に認知するJDR(Joint Denoising and Rewiring)を提案する。
我々は,合成データと実世界のグラフデータセットに対するアプローチの有効性を実験的に検証した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:16:11 GMT)
Maintaining Adversarial Robustness in Continuous Learning [10.7] 防衛アルゴリズムによって強化された敵の堅牢性は、ニューラルネットワークの重みが更新されて新しいタスクが学習されるため、容易に消去される。
本稿では,従来のデータから試料勾配を効果的に安定化させる新しい勾配予測手法を提案する。
この技術は、サンプル勾配平滑化による防御アルゴリズムのクラスと協調することにより、堅牢性を維持することができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:28:25 GMT)
InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection [10.7] 既存のマルチモーダルサルカズム検出法は性能を過大評価することが証明されている。
マルチモーダルサルカズム検出のための新しいフレームワークであるInterCLIP-MEPを提案する。
InterCLIP-MEPはMMSD2.0ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:52:57 GMT)
A Laplacian-based Quantum Graph Neural Network for Semi-Supervised Learning [10.6] 本研究では,4つのベンチマークデータセットにまたがって,ラプラシアンをベースとした量子半教師付き学習法の性能について検討した。
追加のQubitsの有効性は、量子アルゴリズムとデータセットの適合性に依存する。
ラプラシア語学習のパフォーマンスは、異なるデータセット間で最適な設定が異なり、絡み合うレイヤの数に大きく依存している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:04:20 GMT)
Improved Counting under Continual Observation with Pure Differential Privacy [10.4] 我々は、プライバシーと精度のトレードオフを改善するために、$k$-ary number system with $textit negative digits$を使用するバイナリツリー機構の新たな一般化を提案する。
我々のメカニズムは、全ての「最適」$(varepsilon,delta)$-differentially private factorizationメカニズムに対して平均2乗誤差を改善する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:36:33 GMT)
UICrit: Enhancing Automated Design Evaluation with a UICritique Dataset [10.4] 983のモバイルUIに対して,設計批判と品質評価をターゲットとしたデータセットを提示する。
LLM生成UIフィードバックにおける55%のパフォーマンス向上を実現するために,このデータセットを適用した。
生成UI技術に対する報酬モデルのトレーニングを含む,このデータセットの今後の応用について論じる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:41:43 GMT)
Recent Advances in Generative AI and Large Language Models: Current Status, Challenges, and Perspectives [10.2] 生成人工知能(AI)と大規模言語モデル(LLM)の出現は、自然言語処理(NLP)の新しい時代を象徴している。
本稿では,これらの最先端技術の現状を概観し,その顕著な進歩と広範囲な応用を実証する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:17:32 GMT)
PsybORG+: Modeling and Simulation for Detecting Cognitive Biases in Advanced Persistent Threats [10.2] PsybORG$+$は、認知的脆弱性に影響されたAPTの振る舞いをモデル化するために設計されたマルチエージェントのサイバーセキュリティシミュレーション環境である。
分類モデルは認知的脆弱性推論のために構築され、シミュレータは合成データ生成のために設計されている。
PsybORG$+$は、損失回避と確認バイアスレベルが異なるAPT攻撃者を効果的にモデル化できることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:00:25 GMT)
MAQA: Evaluating Uncertainty Quantification in LLMs Regarding Data Uncertainty [10.2] 我々は,世界知識,数学的推論,コモンセンス推論タスクからなるMulti-Answer Question Answering データセット MAQA を提案する。
その結果,データ不確実性の下でも,エントロピーと一貫性に基づく手法がモデルの不確実性をよく推定できることが示唆された。
我々は、我々の観察が、現実的な環境での不確実性定量化に関する今後の研究の道を開くと信じている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:17:31 GMT)
RW-NSGCN: A Robust Approach to Structural Attacks via Negative Sampling [10.1] グラフニューラルネットワーク(GNN)は、ユーザ関心の予測やソーシャルネットワーク内のコミュニティの検出など、さまざまな実践シナリオに広く応用されている。
近年の研究では、グラフ構造ネットワークは、しばしばトポロジカル摂動と重み乱の形で潜在的なノイズや攻撃を含むことが示されている。
RW-NSGCNはRandom Walk with Restart(RWR)とPageRankアルゴリズムを統合して負のサンプリングを行い、畳み込み操作にDeterminantal Point Process(DPP)ベースのGCNを用いる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:34:56 GMT)
MV-DETR: Multi-modality indoor object detection by Multi-View DEtecton TRansformers [9.5] 本稿では,効率的なトランスベース検出手法として,新しいMV-DETRパイプラインを提案する。
我々は、幾何学とテクスチャの手がかりはどちらも重要であり、別々に符号化できると主張している。
本研究では,ScanNetv2ベンチマークによる新しい技術状態を生成する78%のAPを実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:37:13 GMT)
Defining and Measuring Disentanglement for non-Independent Factors of Variation [9.5] 変動要因が独立していない場合に有効である情報理論に基づく絡み合いの定義を与える。
変動要因が独立でない場合に作用する所定の定義から乱れ度を測定する手法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:30:36 GMT)
Algorithmic Decision-Making under Agents with Persistent Improvement [9.3] 人間の戦略的行動下でのアルゴリズムによる意思決定について検討する。
まず、永続的な改善を特徴付ける動的モデルを開発する。
次に、意思決定者がエージェントの集団の中で最大の改善をインセンティブにするための最適なポリシーを設計する方法について研究する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:32:45 GMT)
FUGNN: Harmonizing Fairness and Utility in Graph Neural Networks [9.3] グラフニューラルネットワーク(GNN)は、フェアネスの優先順位付けが利便性を損なう可能性があるため、難しいトレードオフに直面していることが多い。
我々は、スペクトルグラフ理論のレンズを通して公正性を再検討し、スペクトルグラフ学習の枠組みの中で公正性と有用性を再構築することを目的としている。
フェアネスとユーティリティの対立を調和させる新しいスペクトルグラフ学習手法であるFUGNNを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:04:18 GMT)
Never Lost in the Middle: Mastering Long-Context Question Answering with Position-Agnostic Decompositional Training [9.1] 大規模言語モデル(LLM)は、長い文脈で正しい情報を求めるのに苦労している。
本稿では,LLMの長期的コンテキストにおける情報探索と反射能力の向上を,特別に設計されたタスクを通して行うことを提案する。
実験の結果、マルチドックQAやその他のベンチマークでは、シャッフル設定において、最先端モデルよりも13.7%向上した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:04:18 GMT)
Cross-View Geolocalization and Disaster Mapping with Street-View and VHR Satellite Imagery: A Case Study of Hurricane IAN [9.1] 本研究では,地すべりと損傷知覚推定を同時に行う新しい災害対応フレームワーク,CVDisasterを提案する。
CVDisasterは2つのクロスビューモデルから構成されており、CVDisaster-Geolocはクロスビューなジオローカライゼーションモデルを指す。
CVDisasterは, 微調整を限定して高い競争性能(局地化80%以上, 損傷知覚推定75%以上)を達成できることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:37:26 GMT)
YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.0] 伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:12:37 GMT)
Hierarchical Quantum Control Gates for Functional MRI Understanding [8.8] 本稿では,fMRIデータを効率的に理解するための新しい量子ベース手法であるHQCG法を提案する。
本手法は,超高次元fMRI信号におけるパターンの学習に量子力学を利用する量子マシン上でエンドツーエンドで動作する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:18:25 GMT)
Occupancy-driven Zeeman suppression and inversion in trapped polariton condensates [8.7] 複数のIn0.08Ga0.92As量子井戸を有する半導体マイクロキャビティにおける光学的に閉じ込められたエキシトン-ポラリトン凝縮体の磁気フォトルミネッセンスの研究を行った。
我々は偏光子ゼーマンの分裂を観察し、密閉された小さなトラップにおいて、その完全なパラメトリックスクリーニングを実証した。
より大きな光トラップでは、ゼーマン分裂の完全な逆転がパワーの関数として観測され、凝縮の重要さと背景貯水池の励起物との相互作用が説明される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:16:42 GMT)
PAtt-Lite: Lightweight Patch and Attention MobileNet for Challenging Facial Expression Recognition [8.7] 顔表情認識(英: Facial Expression Recognition, FER)は、人間の表情を認識する機械学習問題である。
MobileNetV1に基づく軽量パッチとアテンションネットワークが提案され、課題のある条件下でFER性能を改善する。
Patt-LiteはCK+、RAF-DB、FER2013、FERPlus、そしてRAF-DBとFERPlusの挑戦的な条件サブセットで最先端の結果を得た。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:17:23 GMT)
DSLR: Document Refinement with Sentence-Level Re-ranking and Reconstruction to Enhance Retrieval-Augmented Generation [8.3] DSLRは、検索された文書を文に分解し、無関係な文をフィルタリングし、それらを再び一貫性のある文に再構成する、教師なしのフレームワークである。
我々は,複数のオープンドメインQAデータセット上でDSLRを実験的に検証し,DSLRが従来の固定サイズパスよりもRAG性能を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:27:10 GMT)
Generalizable Physics-Informed Learning for Stochastic Safety-Critical Systems [8.3] 十分なリスク事象を伴わない短期サンプルを用いて,長期的リスク確率とその勾配を評価するための効率的な手法を提案する。
提案手法は, サンプル効率を向上し, 未確認領域を一般化し, システムパラメータの変化に適応できることをシミュレーションで示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:53:03 GMT)
TraceFL: Achieving Interpretability in Federated Learning via Neuron Provenance [8.2] Federated Learningでは、クライアントはローカルデータ上でモデルをトレーニングし、中央サーバにアップデートを送信する。
このコラボレーティブでプライバシ保護のトレーニングには、コストがかかる — FL開発者は、特定のクライアントにグローバルモデル予測を提供する上で、重大な課題に直面しています。
TraceFLは、個々のクライアントからグローバルモデルへの情報の流れを追跡することで、グローバルモデルの予測に責任を持つクライアントを識別する、きめ細かいニューロンのプロファイランスキャプチャー機構である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:57:07 GMT)
SeLoRA: Self-Expanding Low-Rank Adaptation of Latent Diffusion Model for Medical Image Synthesis [8.2] Low-Rank Adaptation (LoRA) with Latent diffusion model (LDMs) は、訓練済みの大規模言語モデルを効率的に適応するための有効なアプローチである。
本稿では,自己拡張型低ランク適応モジュールであるSeLoRAについて紹介する。
提案手法は,医療データの微調整を効率的に行うだけでなく,画像品質の向上を最小限のランク付けで実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:32:02 GMT)
Asymptotic quantification of entanglement with a single copy [8.1] 本稿では, エンタングルメント蒸留(精製)のプロトコルをベンチマークする方法を紹介する。
その収量を測定する代わりに、私たちは最高のエラーを達成可能であることに焦点を合わせます。
この解は、量子状態の1つのコピーだけを用いて評価できる単一文字量であるエンタングルメントの逆相対エントロピーによって与えられることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:57:59 GMT)
PathInsight: Instruction Tuning of Multimodal Datasets and Models for Intelligence Assisted Diagnosis in Histopathology [7.9] 6つの異なるタスクをカバーする約45,000のケースのデータセットを慎重にコンパイルしました。
特にLLaVA, Qwen-VL, InternLMを微調整したマルチモーダル大規模モデルで, このデータセットを用いて命令ベースの性能を向上させる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:05:06 GMT)
FedMADE: Robust Federated Learning for Intrusion Detection in IoT Networks Using a Dynamic Aggregation Method [7.8] さまざまな分野にわたるIoT(Internet of Things)デバイスは、深刻なネットワークセキュリティ上の懸念をエスカレートしている。
サイバー攻撃分類のための従来の機械学習(ML)ベースの侵入検知システム(IDS)は、IoTデバイスからトラフィック分析のための集中サーバへのデータ送信を必要とし、深刻なプライバシー上の懸念を引き起こす。
我々はFedMADEという新しい動的アグリゲーション手法を紹介した。この手法はデバイスをトラフィックパターンによってクラスタリングし、その全体的なパフォーマンスに対する貢献に基づいてローカルモデルを集約する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:42:34 GMT)
Heterogeneous Space Fusion and Dual-Dimension Attention: A New Paradigm for Speech Enhancement [7.8] 異種空間特徴を統合し,二次元アテンション機構を組み込んだ新しい音声強調フレームワークHFSDAを提案する。
提案モデルは,高レベルな意味情報と詳細なスペクトルデータの両方を抽出し,より詳細な分析と音声信号の改良を可能にする。
我々は、時間次元だけでなくスペクトル領域にわたって特徴抽出能力を高めることで、コンフォーマーモデルを洗練する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:04:24 GMT)
Contrastive Learning on Medical Intents for Sequential Prescription Recommendation [7.8] Attentive Recommendation with Contrasted Intents (ARCI) は、異なるが共存する時間的経路を、共通の訪問シーケンスで捉えるように設計されている。
評価基準と分類基準の両方を用いて,2つの実世界のデータセットを処方勧告タスクとして実験した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:10:28 GMT)
GraNNDis: Efficient Unified Distributed Training Framework for Deep GNNs on Large Clusters [7.6] GraNNDisは、マルチサーバクラスタのための高速分散GNNトレーニングフレームワークである。
GraNNDisは最先端の分散GNNトレーニングフレームワークを大幅に高速化する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:16:35 GMT)
A Comprehensive Survey on Synthetic Infrared Image synthesis [7.5] 合成赤外線シーンとターゲット生成は重要なコンピュータビジョン問題である。
リアルなIR画像の生成と、様々なアプリケーションのトレーニングとテストのターゲットを可能にする。
また、現実世界の赤外線データ収集に伴うコストとリスクの低減にも役立ちます。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:06:50 GMT)
ActiveNeRF: Learning Accurate 3D Geometry by Active Pattern Projection [7.5] 我々は,NeRFの幾何学的品質を改善する3次元幾何再構成フレームワークであるActiveNeRFを提案する。
シーン形状とアクティブパターンを協調的に学習する,学習可能なアクティブパターン描画パイプラインを設計する。
提案手法は,アクティブなパターンを付加し,その一貫性を異なる視点で示すことによって,定性的かつ定量的に芸術幾何学的再構成手法の状態を上回ります。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:06:46 GMT)
Sociodemographic Bias in Language Models: A Survey and Forward Path [7.3] 言語モデル(LM)におけるソシオデモグラフィーバイアスは、現実世界の環境に配置した場合に害を与える可能性がある。
本稿では,過去10年間のLMにおける社会デマトグラフィーバイアス研究の包括的調査について述べる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:51:48 GMT)
From Maximum Cut to Maximum Independent Set [7.3] 最大独立集合(MIS)問題も特定のイジングモデルと関係があることは以前から知られていた。
この戦略により、ランダムなエルドホス・ローニイグラフの独立数に対する近似が大幅に改善されることが判明した。
また、コーディング理論から生じるベンチマークで完全なパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:33:41 GMT)
Clinical translation of machine learning algorithms for seizure detection in scalp electroencephalography: systematic review [7.2] 我々は,臨床翻訳性に着目して,発作検出のための機械学習アルゴリズムを体系的にレビューした。
非スペシャリストにとって、モデルの開発と評価の文脈化に必要なドメイン固有の知識が提供される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:37:14 GMT)
Construction of all MDS and involutory MDS matrices [7.2] 有限体 $mathbbF_pm$ 上のすべての$ntimes n$ MDS と involutory MDS のハイブリッド構成のための2つのアルゴリズムを提案する。
提案アルゴリズムは探索空間を効果的に狭め、$(n-1) 倍 (n-1) の MDS 行列を同定する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:11:01 GMT)
Value of Information and Reward Specification in Active Inference and POMDPs [7.1] 期待される自由エネルギー(EFE)は、活動的推論の中心的な量である。
EFEは情報値を用いてベイズ最適RLポリシーを近似することを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:32:05 GMT)
Model Based and Physics Informed Deep Learning Neural Network Structures [7.1] ニューラルネットワーク(NN)は多くの分野で利用されており、大きな成功を収めている。
大きな難題の1つは、NNの構造の選択である。
モデルベース信号と画像処理と逆問題手法を用いてこの問題を考察する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:28:38 GMT)
A Practical Solver for Scalar Data Topological Simplification [7.1] 本稿では,トポロジカル単純化の最適化のための実践的アプローチを提案する。
フィラメントループを除去する標準的なトポロジカル手法よりも,本手法が優れていることを示す。
また,本手法は表面処理における遺伝子欠陥の修復にも有効であることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:28:13 GMT)
A Robust Large-Period Discrete Time Crystal and its Signature in a Digital Quantum Computer [7.1] 離散時間結晶(DTCs)は、時間変換対称性を破る物質の非平衡量子状態である。
我々は、より非自明な周期四重奏法DTCをサポートする直感的な相互作用スピン-1/2$システムを開発する。
予測される4T$-DTCの強いサインが見つかり、場合によっては、さまざまな種類の障害によって増幅される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:36:48 GMT)
PSM: Learning Probabilistic Embeddings for Multi-scale Zero-Shot Soundscape Mapping [7.1] サウンドスケープは、ある場所で知覚される音響環境によって定義される。
本研究では,地球上の音環境をマッピングする枠組みを提案する。
我々は、マルチスケールの衛星画像で位置を表現し、この画像、音声、テキストの合同表現を学習する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:37:40 GMT)
Unveiling the Flaws: A Critical Analysis of Initialization Effect on Time Series Anomaly Detection [6.9] 時系列異常検出(TSAD)のための深層学習は,過去10年間で大きな注目を集めている。
近年の研究はこれらのモデルに疑問を呈し、その成果は欠陥評価技術に寄与している。
本稿では,TSADモデルの性能に対する影響を批判的に分析する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:08:17 GMT)
Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.9] 腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:24:36 GMT)
Decision-Focused Learning to Predict Action Costs for Planning [6.7] 決定焦点学習(DFL)は最適化問題のパラメータを予測する学習に成功している。
本稿では, 自動計画のためのDFL導入の課題について検討し, アクションコストの予測について考察する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:14:54 GMT)
BSS-CFFMA: Cross-Domain Feature Fusion and Multi-Attention Speech Enhancement Network based on Self-Supervised Embedding [6.7] 音声自己教師型学習(SSL)は、複数の下流タスクで最先端(SOTA)のパフォーマンスを達成したことを示す。
本研究では,BSS-CFFMAと呼ばれる新しいクロスドメイン機能融合とマルチアテンション音声強調ネットワークを提案する。
我々はVoiceBank-DEMANDデータセットの比較およびアブレーションによるBSS-CFFMAモデルの性能評価を行った。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:27:24 GMT)
Deep Index Policy for Multi-Resource Restless Matching Bandit and Its Application in Multi-Channel Scheduling [6.6] 異種資源システムのためのマルチリソースレスマッチング帯域(MR-RMB)モデルについて論じる。
MR-RMBに適したオンライン学習アルゴリズムであるDeep Index Policy(DIP)を導入する。
シミュレーションの結果,DIPが効率よく部分指数を学習できることが示唆された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:24:14 GMT)
HcNet: Image Modeling with Heat Conduction Equation [6.6] 本稿では,モデル全体のアーキテクチャ設計を熱伝導理論フレームワークに統合することを目的とする。
私たちのHeat Conduction Network(HcNet)は競争力のあるパフォーマンスを示しています。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:23:45 GMT)
Vestigial Gapless Boson Density Wave Emerging between $ν= 1/2$ Fractional Chern Insulator and Finite-Momentum Supersolid [6.6] 位相的フラットバンド格子モデルを$nu$ = 1/2ハードコアボソンで研究する。
FCIとSSの間に挟まれたSFのない中間ギャップレスCDW状態が見つかった。
ハニカム格子上では、FCI-ソリッドI-ソリッドII遷移の興味深い配列が、どちらの固体も圧縮不能である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:54:20 GMT)
Neural embedding of beliefs reveals the role of relative dissonance in human decision-making [6.6] 本稿では,オンライン討論プラットフォームから大規模ユーザ参加データを活用することで,数千の信念間のニュアンスな関係を抽出する手法を提案する。
この信念の埋め込み空間は、多様な信念の相互接続性を効果的にカプセル化し、また様々な社会的問題を分極する。
既存の信念と新しい信念との相対的な距離は、認知的不協和の定量的推定に役立てることができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:58:45 GMT)
Towards Cross-Domain Single Blood Cell Image Classification via Large-Scale LoRA-based Segment Anything Model [6.4] BC-SAMとして知られる新しい血液細胞像の分類法を提案する。
BC-SAMはLoRAを用いた微調整技術を採用しており、血液細胞画像から一般的な画像埋め込みを抽出することができる。
異なる細胞画像データセットにおけるBC-SAMの適用性を高めるために,教師なしクロスドメインオートエンコーダを導入する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:20:47 GMT)
Information Geometry and Beta Link for Optimizing Sparse Variational Student-t Processes [6.4] 勾配勾配勾配を用いた実世界のデータセットの計算効率と柔軟性を向上させるために,学生Tプロセスが提案されている。
アダムのような伝統的な勾配降下法はパラメータ空間の幾何を十分に活用しない可能性があり、収束と準最適性能を遅くする可能性がある。
我々は,情報幾何学から自然勾配法を適用し,学生-tプロセスの変分パラメータ最適化を行う。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:53:39 GMT)
Biomedical Event Extraction via Structure-aware Generation [6.3] GenBEEは、バイオメディカルイベント抽出のための構造対応プレフィックスで強化された生成モデルである。
大規模な言語モデルから抽出された知識を活用するイベントプロンプトを構築する。
3つのベンチマークデータセットの実験では、GenBEEの有効性が示されている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:43:19 GMT)
Using Advanced LLMs to Enhance Smaller LLMs: An Interpretable Knowledge Distillation Approach [6.2] 高度な大規模言語モデル(LLM)は、複雑な人間のような相互作用において優れた性能を提供する。
LLMは高価で、スマートフォンのようなエッジデバイスには大きすぎるし、セルフホストが難しいため、セキュリティやプライバシーの懸念が生じる。
本稿では,より小型で経済的なLLMの性能を高めるために,新しい解釈可能な知識蒸留手法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:59:36 GMT)
Harnessing Earnings Reports for Stock Predictions: A QLoRA-Enhanced LLM Approach [6.1] 本稿では、命令ベースの新しい手法と量子化低ランク適応(QLoRA)圧縮を組み合わせることで、LLM(Large Language Models)命令を微調整することで、高度なアプローチを提案する。
近年の市場指標やアナリストの成績等「外部要因」を統合して、リッチで教師付きデータセットを作成する。
この研究は、最先端のAIを微調整された財務データに統合する能力を実証するだけでなく、AI駆動の財務分析ツールを強化するための将来の研究の道を開く。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:53:31 GMT)
ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation [6.0] 教師なしセマンティックセグメンテーション作業を容易にするために,CLIP に存在するバイアスを明示的にモデル化し,修正することを提案する。
学習可能な'参照'プロンプトを用いて、クラス参照バイアスを符号化し、視覚変換器に位置埋め込みを投影し、空間参照バイアスを符号化する。
バイアスモデリング及び修正プロセスを有意義かつ効果的にするために、マスキングされた視覚特徴と異なるクラスのテキスト特徴とに基づく対照的な損失を課す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:10:48 GMT)
Vision Language Model for Interpretable and Fine-grained Detection of Safety Compliance in Diverse Workplaces [6.0] 多様な職場安全コンプライアンスのための解釈可能な検出フレームワークであるClip2Safetyを紹介する。
このフレームワークは、シーン認識、視覚的プロンプト、安全アイテムの検出、きめ細かい検証の4つの主要なモジュールで構成されている。
その結果, Clip2Safetyは, 最先端の質問応答に基づくVLMよりも精度が向上するだけでなく, 推測時間も200倍高速であることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:32:06 GMT)
Mixed-precision Neural Networks on RISC-V Cores: ISA extensions for Multi-Pumped Soft SIMD Operations [5.8] 現代の組み込みマイクロプロセッサは、混合精度NNを非常に限定的にサポートしている。
本稿では,協調ハードウェア設計,混合精度量子化,ISA拡張,推論を可能にするハードウェア・ソフトウェア共同設計フレームワークを提案する。
我々のフレームワークは、平均15倍のエネルギー削減を1%未満の精度で達成でき、ISA非依存のRISC-Vコアよりも優れています。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:40:53 GMT)
Advancing Interactive Explainable AI via Belief Change Theory [5.8] この種の形式化は、対話的な説明を開発するためのフレームワークと方法論を提供する、と我々は主張する。
まず,人間と機械の間で共有される説明情報を表現するために,論理に基づく新しい形式を定義した。
次に、対話型XAIの現実シナリオについて検討し、新しい知識と既存の知識の優先順位が異なり、フォーマリズムがインスタンス化される可能性がある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:11:56 GMT)
Detectability of hierarchical communities in networks [5.7] 階層的な設定では、複数の一貫したパーティションの存在が検出を妨げたり妨げたりする、追加のフェーズが存在することを示す。
したがって、非階層的分割に対する検出可能性限界は、典型的には完全な階層構造の検出可能性に関する不十分な情報を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:49:43 GMT)
Neural networks can detect model-free static arbitrage strategies [5.6] 市場が一部を認めると、ニューラルネットワークがモデルのない静的仲裁の機会を検出できることが示される。
本手法は取引証券数の多い金融市場に適用でき、対応する取引戦略のほぼ即時実行が保証される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:06:36 GMT)
A Theory-Based Explainable Deep Learning Architecture for Music Emotion [5.5] 本稿では,音楽に対する感情応答を予測するための理論ベースで説明可能な深層学習畳み込みニューラルネットワーク(CNN)を開発した。
我々は、音響物理から周波数調和構造を利用する新しいCNNフィルタを設計し、音楽的特徴の知覚に影響を及ぼす。
本稿では,デジタル広告を応用したモデルの有用性について解説する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:01:27 GMT)
SE(3)-Hyena Operator for Scalable Equivariant Learning [5.4] ヒエナ作用素に基づく同変長畳み込みモデルであるSE(3)-ヒエナを導入する。
我々のモデルは20kトークンの幾何学的文脈を同変変圧器のx3.5倍高速に処理する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:06:41 GMT)
Long working distance portable smartphone microscopy for metallic mesh defect detection [5.3] LD-RSMは外部光学部品とスマートフォンを備えた4f光イメージングシステムを構築している。
光学分解能は4.92$mu$m、加工距離は22.23mmである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:16:07 GMT)
Symmetry-guided gradient descent for quantum neural networks [5.2] 対称性の制約を簡潔な数学的形式に定式化する。
コスト関数に制約を適用する2つの方法を設計します。
我々は対称性誘導勾配降下法(SGGD)と呼ぶ。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:02:21 GMT)
Nuisance Function Tuning and Sample Splitting for Optimal Doubly Robust Estimation [5.0] 二重頑健な非パラメトリック関数に対する収束率の最適値を求めるために、ニュアンス関数を推定する方法の問題点を考察する。
プラグインおよび一階偏り補正された推定器は、ニュアンス関数のすべてのH"古い滑らか度クラスに対して収束の最小値が得られることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:24:01 GMT)
Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.8] 我々は、羅生門分割集合(RPS)と呼ばれる別の視点を開発する。
RPSは、たとえ実質的に異なる説明を提供するとしても、最大アフターディパーティションの近くに後続値を持つすべてのパーティションを組み込む。
提案手法を,チャリタブルギフトの価格効果,染色体構造(テロメア長),マイクロファイナンス導入の3つの経験的設定に適用した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:15:32 GMT)
Bi-DCSpell: A Bi-directional Detector-Corrector Interactive Framework for Chinese Spelling Check [4.5] Chinese Spelling Check (CSC) は、中国語の文中の潜在的な誤字を検出し、訂正することを目的としている。
現在のCSCアプローチには2つのタイプがある。
本稿では,CSC(Bi-DCSpell)のための双方向検出器・コレクタフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:07:22 GMT)
Automatic Spatial Calibration of Near-Field MIMO Radar With Respect to Optical Depth Sensors [4.3] 本稿では,光学RGB-DセンサとMIMOレーダの連成校正手法を提案する。
私たちのパイプラインは、自動目標検出と位置決めを可能にする、ベスポークキャリブレーションターゲットで構成されています。
我々は光学領域から2つの異なる深度センシング技術を用いてアプローチを検証する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:16:08 GMT)
Adaptive variational quantum dynamics simulations with compressed circuits and fewer measurements [4.3] AVQDS(T)と呼ばれる適応変分量子力学シミュレーション(AVQDS)法の改良版を示す。
このアルゴリズムは、変分力学の精度の尺度であるマクラクラン距離を一定しきい値以下に保つために、アンザッツ回路に不連結なユニタリゲートの層を適応的に加算する。
また、雑音耐性を増強した変動パラメータに対する線形運動方程式を解くために、固有値トランケーションに基づく手法を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:56:43 GMT)
Sustainable Quantum Computing: Opportunities and Challenges of Benchmarking Carbon in the Quantum Computing Lifecycle [4.2] 本稿では,基礎的方法論とオープンな研究課題を提供する炭素対応量子コンピューティングフレームワークを提案する。
私たちの活動への呼びかけは、持続可能な量子コンピューティングとして知られる新しい研究方向の確立です。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:39:49 GMT)
Leveraging Language Models for Emotion and Behavior Analysis in Education [4.2] 本稿では,大規模言語モデル(LLM)を活用した新しい手法を提案する。
提案手法では, 感情的, エンゲージメント状態の検出において, LLMを誘導するプロンプトを用いて, 非侵襲的でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:11:53 GMT)
SWIFT:A Scalable lightWeight Infrastructure for Fine-Tuning [4.2] Large Language Models (LLM) と Multi-modal Large Language Models (MLLM) は、注意に基づくトランスフォーマーアーキテクチャを利用している。
SWIFTは、大型モデルのためのカスタマイズ可能なワンストップインフラストラクチャである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:22:21 GMT)
Evaluating Cultural Adaptability of a Large Language Model via Simulation of Synthetic Personas [4.1] 我々は、GPT-3.5を用いて、15カ国7,286人の参加者の説得的ニュース記事に対する反応を再現する。
対象者の居住国を特定することで,GPT-3.5の対応性の向上が期待できる。
対照的に、ネイティブ言語プロンプトを使用すると、全体的なアライメントを大幅に削減するシフトが発生する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:32:43 GMT)
Evaluating the Usability of Differential Privacy Tools with Data Practitioners [4.1] 差別化プライバシ(DP)は、プライバシを保存するデータ分析において、ゴールドスタンダードとなっているが、現実のデータセットやシステムに実装することは依然として困難である。
近年開発されているDPツールは,DPの実装を容易にすることを目的としているが,これらのDPツールのユーザビリティについて限定的な研究がなされている。
我々は,PythonベースのオープンソースDPツールであるDiffPrivLib,Tumult Analytics,PipelineDP,OpenDPのユーザビリティを評価した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:49:10 GMT)
Entanglement dynamics in 2d HCFTs on the curved background: the case of q-Möbius Hamiltonian [4.0] 境界状態と熱場状態から始まり、曲線の背景にあるハミルトニアンとともにユークリッド時間に系を進化させ、同じハミルトニアンでそれをリアルタイムで発展させる。
その結果, 初期および後期の絡み合い構造は曲線の背景に依存するが, 絡み合い成長は行わず, 線形であることがわかった。
熱場二重状態の重力双対では、この絡み合いの増大はワームホールの線形成長によるものであるが、境界状態の場合は、世界の終わりが崩壊することによるものである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:11:25 GMT)
Latin Treebanks in Review: An Evaluation of Morphological Tagging Across Time [4.0] 我々は、既存のラテンツリーバンクをレビューし、それらが引き起こしたテキストを識別し、それらの重複を識別し、時間とジャンルにわたってそれらのカバレッジを文書化する。
我々は,POSと形態的特徴タグ付けのクロスタイム解析を行うために,既存の木バンクから抽出した新しい時間分割データを構築した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:55:54 GMT)
Advancing Post-OCR Correction: A Comparative Study of Synthetic Data [4.0] 我々は,コンピュータビジョン特徴検出アルゴリズムを利用して,OCR後合成データ構築のためのグリフ類似性を計算するアルゴリズムを提案する。
ByT5のようなモデルでは、手動でアノテートするデータを必要とせずにキャラクタエラー率(CER)を大幅に削減できることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:01:46 GMT)
Evaluating Research Quality with Large Language Models: An Analysis of ChatGPT's Effectiveness with Different Settings and Inputs [4.0] 本稿では、どのChatGPT入力がより良い品質スコア推定をもたらすかを評価する。
最適な入力は記事のタイトルと抽象であり、平均的なChatGPTスコアは人間のスコアと0.67と相関している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:19:21 GMT)
SpectralGaussians: Semantic, spectral 3D Gaussian splatting for multi-spectral scene representation, visualization and analysis [3.9] 3次元ガウススプラッティングに基づく新しいクロススペクトルレンダリングフレームワーク(3DGS)を提案する。
このフレームワークは、登録されたマルチビュースペクトルとセグメンテーションマップから、現実的で意味のあるスプラットを生成する。
コントリビューションはマルチスペクトルシーン表現、レンダリング、編集における課題に対処し、多様なアプリケーションに新たな可能性を提供します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:32:54 GMT)
Fuzzy Recurrent Stochastic Configuration Networks for Industrial Data Analytics [3.9] 本稿では,ファジィリカレント構成ネットワーク(F-RSCN)と呼ばれる新しいニューロファジィモデルを提案する。
提案したF-RSCNは,複数の貯留層によって構成され,各貯留層は高木・スゲノ・カン(TSK)ファジィ則に関連付けられている。
TSKファジィ推論システムをRCCNに統合することにより、F-RSCNは強力なファジィ推論能力を有し、学習と一般化の両面での音響性能を実現することができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:55:09 GMT)
Mpemba effects in nonequilibrium open quantum systems [3.8] ムペンバ効果は主に古典的なシステムや平衡状態への冷却過程において考慮されている。
平衡状態のない非平衡量子系におけるMPEの出現について検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:24:52 GMT)
Time series forecasting with high stakes: A field study of the air cargo industry [3.8] 本稿では,航空貨物業界における意思決定における機械学習モデルの開発と実装に焦点を当てる。
我々は、統計的および高度なディープラーニングモデルを組み合わせて、6ヶ月の地平線上で貨物需要の信頼できる予測を提供する専門家フレームワークの混合を活用している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:40:07 GMT)
Weyl Calculus and Exactly Solvable Schrödinger Bridges with Quadratic State Cost [3.8] 量子力学におけるワイル計算、特にワイル作用素とワイル記号のアイデアは、そのようなマルコフ核を決定するのにどのように役立つかを説明する。
Weyl calculus による2次状態コストの場合、マルコフ核を明示的に見つけることで、これらのアイデアを説明する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:01:59 GMT)
Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations [3.8] MDST(Multi-round Dialogue State Tracking Model)を導入する。
MDSTは、内的対話状態表現を視覚言語表現の2-タプルとして定義し、各ラウンドの対話履歴をキャプチャする。
VisDial v1.0データセットの実験結果は、MDSTが生成環境において新しい最先端性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:36:15 GMT)
Stateful protocol fuzzing with statemap-based reverse state selection [3.8] Stateful Coverage-Based Greybox Fuzzing (SCGF) はネットワークプロトコルのグレーボックスファジングの最先端手法であると考えられている。
本稿では,SCGFのための状態マップに基づく逆状態選択法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:11:41 GMT)
LoRA$^2$ : Multi-Scale Low-Rank Approximations for Fine-Tuning Large Language Models [3.7] Low-Rank Adaptation (LoRA)は、微調整のためのトレーニング可能なパラメータの数を著しく削減する。
LoRAを複数のスケールに拡張し、LoRA$2$と名付けます。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:31:30 GMT)
WaveShot: A Compact Portable Unmanned Surface Vessel for Dynamic Water Surface Videography and Media Production [3.7] WaveShotは、従来の撮影方法に代わる、高度に操作可能で費用対効果があり、安全を提供することで、水面の映像を変換することを目指している。
WaveShotはプロ級防水カメラと高度な技術を備えており、水路の静的およびダイナミックなシーンを捉えている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:15:32 GMT)
IFShip: A Large Vision-Language Model for Interpretable Fine-grained Ship Classification via Domain Knowledge-Enhanced Instruction Tuning [3.5] そこで本研究では,船の粒度分類を行うための大規模視覚言語モデル (LVLM) IFShipを提案する。
従来の方法とは異なり、IFShipは自然言語でFGSCの推論過程を正確に伝達することで、解釈可能性を向上させる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:36:18 GMT)
Variance-Reduced Cascade Q-learning: Algorithms and Sample Complexity [3.4] Variance-Reduced Cascade Q-learning (VRCQ)と呼ばれる新しいモデルなしアルゴリズムを導入し分析する。
VRCQは、既存のモデルフリー近似型アルゴリズムと比較して、$ell_infty$-normにおいて優れた保証を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:34:33 GMT)
LLMs can Schedule [3.4] ジョブショップスケジューリング問題(JSSP)は、生産プロセスの最適化において重要なハードルであり続けている。
本稿では,JSSPにおけるLarge Language Models(LLM)の可能性について検討する。
驚くべきことに,LLMに基づくスケジューリングは,他のニューラルアプローチに匹敵する性能を達成できることを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:53:58 GMT)
DPO: Differential reinforcement learning with application to optimal configuration search [3.3] 連続状態と行動空間による強化学習は、この分野における最も困難な問題の1つである。
限られたトレーニングサンプルと短いエピソードで設定を処理できる最初の微分RLフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:47:38 GMT)
Federated Smoothing Proximal Gradient for Quantile Regression with Non-Convex Penalties [3.3] IoT(Internet-of-Things)の分散センサーは、大量のスパースデータを生成する。
本稿では, 滑らか化機構をそのビューに統合し, 精度と計算速度を両立させる, 結合型滑らか化近位勾配(G)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:52:42 GMT)
DC3DO: Diffusion Classifier for 3D Objects [3.3] ジェフリー・ヒントン(Geoffrey Hinton)が生成モデリングに力を入れ、オブジェクト分類における3次元拡散モデルの利用について検討する。
提案手法であるDiffusion for 3D Objects (DC3DO) は,追加トレーニングなしで3D形状のゼロショット分類を可能にする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:35:56 GMT)
Leveraging Priors via Diffusion Bridge for Time Series Generation [3.2] 時系列生成はシミュレーション、データ拡張、仮説テスト技術といった実世界のアプリケーションで広く利用されている。
拡散モデルは、時系列生成のデファクトアプローチとして現れています。
TimeBridgeは、拡散ブリッジを活用してフレキシブルな合成を可能にするフレームワークで、選択した事前とデータ分散の間のトランスポートを学習する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:47:59 GMT)
An Introduction to Reinforcement Learning: Fundamental Concepts and Practical Applications [3.2] 強化学習(Reinforcement Learning, RL)は、人工知能(AI)の一分野であり、累積報酬を最大化するために環境と対話して意思決定を行うための訓練エージェントに焦点を当てている。
本稿では,その中核となる概念,方法論,最近の傾向,学習資源について概説する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:08:06 GMT)
Regularizing Self-supervised 3D Scene Flows with Surface Awareness and Cyclic Consistency [3.1] 2つの新たな一貫性損失を導入し、クラスタを拡大し、異なるオブジェクトに分散するのを防ぐ。
提案した損失はモデル独立であり、既存のモデルの性能を大幅に向上させるためにプラグアンドプレイ方式で使用できる。
また,4つの標準センサ一様駆動データセット上で,フレームワークの有効性と一般化能力を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:32:37 GMT)
Control-Flow Attestation: Concepts, Solutions, and Open Challenges [3.0] 本稿では,制御フローの検証に関する最初の調査を行い,最先端のスキームにおける中核的な考え方と解決策について考察する。
この問題は、サイバー物理システムの信頼性、IoTデバイス、クラウドプラットフォームなど、さまざまな環境で調査されてきた。
2016~2024年の間に発行された30以上の論文を調査し、主要な特徴の統合と比較を行い、この分野の今後の研究にいくつかの課題と勧告を提示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:56:20 GMT)
Large language models can consistently generate high-quality content for election disinformation operations [3.0] 大規模言語モデルでは、説得力のある選挙偽情報を大規模に生成する可能性について懸念が高まっている。
本研究は,選挙偽情報処理の段階を自動化するLLMの能力について,二部構成で検討した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:45:34 GMT)
Low-Bitwidth Floating Point Quantization for Efficient High-Quality Diffusion Models [2.9] 拡散モデルは、ディープニューラルネットワークを用いてランダムガウスノイズを反復的にデノベートすることで画像を生成する。
近年の研究では、拡散モデルに対する低ビット幅(例:8ビットまたは4ビット)の量子化が提案されているが、4ビットの整数量子化は典型的には低画質の画像をもたらす。
本稿では,整数量子化法と比較して画像品質がよい拡散モデルのための効果的な浮動小数点量子化法を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:56:20 GMT)
Continual Driving Policy Optimization with Closed-Loop Individualized Curricula [2.9] 閉ループ個別化カリキュラム(CLIC)を特徴とする連続運転ポリシー最適化フレームワークを開発した。
CLICは衝突予測タスクとしてAV評価をフレーム化し、各イテレーションでこれらのシナリオでAV障害が起こる確率を見積もる。
CLICは他のカリキュラムベースのトレーニング戦略を超越し、リスクのあるシナリオの管理を大幅に改善したことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:27:38 GMT)
CEval: A Benchmark for Evaluating Counterfactual Text Generation [2.9] 本稿では,テキスト生成手法の比較のためのベンチマークであるCEvalを提案する。
我々の実験では、偽造テキストを生成するための完璧な方法が見つからなかった。
CEvalをオープンソースのPythonライブラリとして利用できるようにすることで、コミュニティはより多くのメソッドをコントリビュートすることを推奨しています。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:39:59 GMT)
Rectified Iterative Disparity for Stereo Matching [2.9] コストボリュームに基づく不確実性不確実性推定(UEC)を提案する。
画像対から得られるコストボリュームの豊富な類似性情報に基づいて,提案したUCCは,計算コストの低い競合性能を実現することができる。
提案手法を組み合わせた高性能ステレオアーキテクチャDR Stereoを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:28:19 GMT)
An Adaptive Differential Privacy Method Based on Federated Learning [2.9] 本稿では,フェデレート学習に基づく適応型微分プライバシー手法を提案する。
プライバシーの予算を約16%削減できるが、精度はほぼ同じだ。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:08:11 GMT)
A Review of Pseudo-Labeling for Computer Vision [2.8] ディープニューラルネットワークは、しばしば効果的に一般化するためにラベル付きサンプルの大きなデータセットを必要とする。
活発な研究の重要な領域は半教師あり学習であり、代わりに大量の(容易に取得された)未ラベルのサンプルを使おうとする。
本研究では,自己監督手法と教師なし手法の両方において,擬似ラベルのより広範な解釈について検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 22:17:48 GMT)
Let-It-Flow: Simultaneous Optimization of 3D Flow and Object Clustering [2.8] 実大規模原点雲列からの自己監督型3次元シーンフロー推定の問題点について検討する。
重なり合うソフトクラスタと非重なり合う固いクラスタを組み合わせられる新しいクラスタリング手法を提案する。
本手法は,複数の独立移動物体が互いに近接する複雑な動的シーンにおける流れの解消に優れる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:24:12 GMT)
The Distributional Uncertainty of the SHAP score in Explainable Machine Learning [2.7] 本稿では,未知の実体集団分布下でのSHAPスコアの推論の原理的枠組みを提案する。
我々は,この関数の最大値と最小値を求める基本的な問題について検討し,すべての特徴のSHAPスコアに対して厳密な範囲を決定できることを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:12:09 GMT)
Heterogeneity: An Open Challenge for Federated On-board Machine Learning [2.5] 本稿では,フェデレーテッド・ラーニングにおけるクロスプロデューサ・ユース・ケースの文脈における課題の体系的レビューを行う。
このようなアプリケーションは、そのようなシステムの異質性から主に生じるフェデレートラーニングパラダイムに、さらなる課題を提示します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:56:17 GMT)
ConfusedPilot: Compromising Enterprise Information Integrity and Confidentiality with Copilot for Microsoft 365 [2.4] 我々は、Copilotを混乱させ、応答に完全性と機密性を侵害するRAGシステムのセキュリティ脆弱性のクラスであるConfusedPilotを紹介します。
本研究は,現在のRAGベースのシステムにおけるセキュリティ脆弱性を強調し,今後のRAGベースのシステムを保護するための設計ガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 22:51:30 GMT)
A Universal Flexible Near-sensor Neuromorphic Tactile System with Multi-threshold strategy for Pressure Characteristic Detection [2.4] 完全フレキシブル・ニューロモルフィック・触覚認識システムについて報告する。
システム内の信号はパルスとして送信され、しきい値情報として処理される。
本システムは,シンボルパターンやモース符号の認識において,これらの信号の傾向を正確に出力することができ,精度が高い。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:33:36 GMT)
Measuring User Understanding in Dialogue-based XAI Systems [2.4] XAIの最先端は、単発、非個人化、一方通行の説明が特徴である。
本稿では,ユーザが学習しているモデルの予測をシミュレートして,3段階のユーザ理解を計測する。
我々は、高い理解率と低い理解率の集団間の相互作用のパターンを明らかにするために、データを分析した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:17:03 GMT)
KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving [2.4] 本稿では,カメラ,LiDAR,ミリ波レーダからのマルチモーダルセンサデータを融合させることにより,3次元物体検出の高速化を目的としたEV-KANアルゴリズムを提案する。
我々の革新的なBird's Eye View(BEV)ベースのアプローチは、Transformerアーキテクチャを利用して、検出精度と効率を大幅に向上します。
実験の結果,EV-KANモデルは,ほとんどの検出カテゴリにおいて優れた性能を示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:18:26 GMT)
A Study of Undefined Behavior Across Foreign Function Boundaries in Rust Libraries [2.4] Rustは、他の言語との相互運用に頻繁に使用される。
Miriは、これらのモデルに対してアプリケーションを検証できる唯一の動的解析ツールである。
Miriは外部機能をサポートしておらず、Rustエコシステムの中心に重要な正当性ギャップがあることを示唆している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:07:19 GMT)
Improving Quantum Developer Experience with Kubernetes and Jupyter Notebooks [2.3] 量子ソフトウェア開発者の経験を改善するために,アクセス可能で費用効率のよい遠隔計算機能を利用することの可能性を検討する。
新しい機能には、そのパワーを効果的に活用できるソフトウェアソリューションが必要です。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:27:35 GMT)
VulCatch: Enhancing Binary Vulnerability Detection through CodeT5 Decompilation and KAN Advanced Feature Extraction [2.3] VulCatchはバイナリレベルの脆弱性検出フレームワークである。
生のバイナリコードをコードT5を使って擬似コードに変換する。
高い検出精度(98.88%)と精度(97.92%)を達成するために、Word2vec、Inception Blocks、BiLSTM Attention、Residual接続を使用している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:46:50 GMT)
Oracle Bone Script Similiar Character Screening Approach Based on Simsiam Contrastive Learning and Supervised Learning [2.2] 本稿では,ファジィ総合評価手法を用いて,ResNet-50自己教師型学習とRepVGG教師型学習を統合する手法を提案する。
ソース画像データセットHWOBCオラクルを入力として対象画像を選択し、最も類似した画像を手動で介入することなく順番に出力する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:00:51 GMT)
Towards Holistic Disease Risk Prediction using Small Language Models [2.1] 様々な病気のリスクを同時に予測することを目的とした,小言語モデルと複数のデータソースを接続するフレームワークを提案する。
本実験では,12種類のタスクをマルチタスク学習装置に組み込んだ。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:01:33 GMT)
Physics-informed graph neural networks for flow field estimation in carotid arteries [2.0] 循環動態量は動脈硬化などの循環器疾患にとって貴重なバイオメディカルリスク因子である。
本研究では,機械学習を利用した血行動態場推定のための代理モデルを作成する。
私たちは、基礎となる対称性と物理に関する事前情報を含むグラフニューラルネットワークをトレーニングし、トレーニングに必要なデータ量を制限する。
このことは、物理インフォームドグラフニューラルネットワークを4次元フローMRIデータを用いてトレーニングすることで、見えない頸動脈領域の血流を推定できることを示している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:09:28 GMT)
When to Accept Automated Predictions and When to Defer to Human Judgment? [2.0] 我々は、トレーニングされたニューラルネットワークの出力がどのように変化するかをクラスタリングを用いて分析し、出力とクラスセントロイド間の距離を測定する。
本稿では,分布変化による予測の信頼度を評価する指標として,この距離を提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:06:08 GMT)
Autonomation, not Automation: Activities and Needs of Fact-checkers as a Basis for Designing Human-Centered AI Systems [1.8] 我々は中央ヨーロッパのファクトチェッカーに詳しいインタビューを行った。
我々の貢献には、非英語圏における事実確認作業の多様性に関する詳細な調査が含まれる。
学際的なコラボレーションのおかげで、AI研究におけるファクトチェックのプロセスを3つの追加段階に拡張します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:15:09 GMT)
Two-scale Neural Networks for Partial Differential Equations with Small Parameters [1.7] 物理インフォームドニューラルネットワーク(PINN)を用いた偏微分方程式(PDE)を小さなパラメータで解くための2スケールニューラルネットワーク手法を提案する。
提案手法は, トラルニケートパラメータの探索にフーリエ特徴やその他の計算的課税を加えることなく, 簡単な方法で小さなパラメータでPDEを解くことができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:53:06 GMT)
Quantification of total uncertainty in the physics-informed reconstruction of CVSim-6 physiology [1.7] 本研究では,MC X-TFCを模擬した微分系の状態とパラメータの推定における総不確かさの分解について検討した。
MC X-TFCは、ヒト生理学の文脈で開発された6成分の固形ODEであるCVSim-6モデルに適用される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:10:39 GMT)
Casper: Prompt Sanitization for Protecting User Privacy in Web-Based Large Language Models [1.7] Casper は LLM サービスに送信する前に,ユーザの入力から機密情報を検出および削除することで,ユーザのプライバシ保護を目指している。
Casperのコアには、ルールベースのフィルタ、機械学習(ML)ベースの名前付きエンティティ認識器、ブラウザベースのローカルLLMトピック識別子からなる3層化機構がある。
我々は,4000個の合成プロンプトのデータセット上でCasperを評価し,PII(Personal Identible Information)とプライバシーに敏感なトピックを,それぞれ98.5%,89.9%の精度で効果的にフィルタリングできることを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:08:37 GMT)
What should I wear to a party in a Greek taverna? Evaluation for Conversational Agents in the Fashion Domain [1.7] 大型言語モデル(LLM)は、オンラインファッション小売の領域に革命をもたらす可能性がある。
我々は、大規模なeコマースファッションプラットフォームにおいて、顧客とファッションアシスタントとの間の4K会話の多言語評価データセットを作成します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:11:27 GMT)
The Misclassification Likelihood Matrix: Some Classes Are More Likely To Be Misclassified Than Others [1.7] 本研究では、分散シフト下でのニューラルネットワーク予測の信頼性を定量化するための新しいツールとして、MLM(Misclassification Likelihood Matrix)を紹介した。
この研究の意味は、画像の分類を超えて、自動運転車などの自動運転システムで進行中の応用に及んでいる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:18:04 GMT)
Unified-IoU: For High-Quality Object Detection [1.6] そこで我々は,異なる品質予測ボックス間の重み付けをより重視する,Unified-IoU (UIoU) と呼ばれる新しいIoU損失関数を提案する。
提案手法は,複数のデータセット,特にIoU閾値が高い場合において,より優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:56:45 GMT)
A lightweight YOLOv5-FFM model for occlusion pedestrian detection [1.6] ヨロは、効率的で単純な1段階目標検出法であり、様々な環境における歩行者検出によく用いられる。
本稿では,これらの問題に対処する軽量YOLOv5モデルを提案する。
このモデルは浮動小数点演算(FLOP)の少ない歩行者検出精度を向上させることができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:42:02 GMT)
Entendre, a Social Bot Detection Tool for Niche, Fringe, and Extreme Social Media [1.5] オープンアクセス、スケーラブル、プラットフォームに依存しないボット検出フレームワークであるEntendreを紹介した。
われわれは、ほとんどのソーシャルプラットフォームが一般的なテンプレートを共有しており、ユーザーはコンテンツを投稿し、コンテンツを承認し、バイオを提供することができるという考えを生かしている。
Entendreの有効性を示すために、私たちは、現在定義されている右翼プラットフォームであるParlerに人種差別的コンテンツを投稿するアカウントの中で、ボットの存在を調査するために使用しました。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:50:49 GMT)
Better Gaussian Mechanism using Correlated Noise [1.5] 分散を$(sqrtd + 1)/4$にスケールしたガウス変数として分布するランダム変数を追加することで、独立雑音サンプルの分散を$(d + sqrtd)/4$でのみスケールできることを示す。
私たちのメカニズムの中心的な考え方はシンプルで、そのテクニックは柔軟です。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:31:03 GMT)
Comparative Analysis of Digital Tools and Traditional Teaching Methods in Educational Effectiveness [1.4] この研究は、MoCo Innovationの助けを借りて、クラークスバーグ小学校で行われた。
デジタルツールを使用した学生は、テストスコアを70%から77%に24.2%改善した。
しかし、この改善の主な理由はデジタルツールかどうかを確かめるためには、さらなる研究が必要である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:28:42 GMT)
Efficient Deep Model-Based Optoacoustic Image Reconstruction [1.3] ディープラーニングアプローチは、最近、高品質な光音響画像のリアルタイム復元を解き明かした。
本稿では,中規模のグラフィックカード上で高いフレームレートを実現するための,比較的軽量な(17Mパラメータ)ネットワークアーキテクチャであるEfficientDeepMBを提案する。
本研究では,生体内光音響スキャンの大規模・多種多様なデータセットを用いて,再建速度と精度の観点から,効率的なDeepMBの性能を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:05:30 GMT)
AI Research is not Magic, it has to be Reproducible and Responsible: Challenges in the AI field from the Perspective of its PhD Students [1.2] 欧州13カ国から28名のAI博士候補を調査した。
課題は、データセット、モデル、実験などのAIリソースの発見可能性と品質だ。
責任と再現可能なAI研究プラクティスをすぐに採用する必要がある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:19:02 GMT)
Learning Noise-Robust Stable Koopman Operator for Control with Physics-Informed Observables [1.1] 非線形力学系のクープマン演算子に対する新しい学習フレームワークを提案する。
可観測物は、Polyflowによる制御方程式によって通知される。
雑音の頑健性の向上と長期安定性を保証するため,クープマン作用素の安定パラメータ化を設計した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:39:34 GMT)
Refining the weighted subspace-search variational quantum eigensolver: compression of ansätze into a single pure state and optimization of weights [1.0] 重み付き部分空間探索変分量子固有解法(SSVQE)は、量子系の励起状態特性を計算するための顕著なアルゴリズムである。
本研究は,本研究の実践的実現に向けて,その基本的特徴のいくつかを詳述する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:52:06 GMT)
Case-based Explainability for Random Forest: Prototypes, Critics, Counter-factuals and Semi-factuals [1.0] 説明可能なケースベース推論(XCBR)は、実例を参照してモデルの出力を解明する実践的なアプローチである。
XCBRは、最近までツリーベースモデルなど、多くのアルゴリズムであまり研究されていない。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:08:54 GMT)
Fingerspelling within Sign Language Translation [1.0] Fingerspellingは、その高周波動作とオープン語彙語の使用により、手話処理の課題を提起する。
文全体の文脈において,手話翻訳モデルが指遣いをいかに理解するかを評価する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:57:14 GMT)
The Visual Experience Dataset: Over 200 Recorded Hours of Integrated Eye Movement, Odometry, and Egocentric Video [1.0] Visual Experienceデータセットは717のセッションで構成されており、6歳から49歳の58人の観察者が記録している。
VEDBの潜在的な応用には、ビデオトラッキング方法論の改善、画像統計の評価、シーンとアクティビティの認識のためのディープニューラルネットワークの精細化などがある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:01:14 GMT)
SceneGPT: A Language Model for 3D Scene Understanding [0.9] SceneGPTは,3次元の空間的推論をトレーニングや明示的な3次元の監督なしに行うことができるLLMベースのシーン理解システムである。
本フレームワークの主な構成要素は,1)シーン表現として機能し,シーン内のオブジェクトとその空間関係を符号化する3次元シーングラフ,2)3次元空間推論のための文脈学習に適応可能な事前学習LLMである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:26:30 GMT)
Alpha-Trimming: Locally Adaptive Tree Pruning for Random Forests [0.8] 急激な伐採アルゴリズムであるアルファトリミングは、ランダムな森林の伐採に有効な手法として提案されている。
アルファトリミングの顕著な特徴は、そのチューニングパラメータが、一度木が完全に成長した後に、ランダムな森で木を適合させることなく調整できることである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:41:09 GMT)
Meta-Learning for Federated Face Recognition in Imbalanced Data Regimes [0.8] この作業では、CelebAデータセットに基づいた3つの新しいデータパーティションが導入されている。
また、FFR設定でHessian-Free Model Agnostic Meta-Learning (HF-MAML)を提案する。
HF-MAMLは3つのCelebAデータ分割における現行のFFRモデルよりも高いスコアを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:03:10 GMT)
The logic of rational graph neural networks [0.8] 我々は,GC2 の深度 3$ のクエリは,合理的なアクティベーション関数を持つ GNN では表現できないことを証明した。
これは、すべての非ポリノミカル活性化関数がGNNの最大表現性を参照しているわけではないことを示している。
また、一階述語論理(RGC2)の有理サブフラグメントを示し、すべてのグラフに対して有理GNNがRGC2クエリを均一に表現できることを証明する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:12:03 GMT)
Integration of Genetic Algorithms and Deep Learning for the Generation and Bioactivity Prediction of Novel Tyrosine Kinase Inhibitors [0.8] 薬物発見の2つの重要な側面に対処するために,遺伝的アルゴリズムと深層学習モデルを組み合わせたアプローチを提案する。
この生成モデルは遺伝的アルゴリズムを利用して、最適化されたADMET(吸収、分布、代謝、排他、毒性)と薬物類似性特性を持つ新しい小さな分子を創出する。
深層学習モデルを用いて、チロシンキナーゼに対するこれらの生成分子の生物活性を予測する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:50:47 GMT)
CRISP: Confidentiality, Rollback, and Integrity Storage Protection for Confidential Cloud-Native Computing [0.8] クラウドネイティブなアプリケーションはオーケストレーションに依存しており、サービスを頻繁に再起動させる。
再起動中、攻撃者は機密サービスの状態を悪意のある意図を助長する可能性のある以前のバージョンに戻すことができる。
本稿では,Intel SGXの既存のランタイムを使用してロールバックを透過的に防止するロールバック保護機構であるCRISPを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:29:30 GMT)
The advantages of context specific language models: the case of the Erasmian Language Model [0.7] 我々はErasmian Language Model (ELM) を,エラスムス大学ロッテルダム校および大学によって事前訓練・微調整された,9億のパラメータモデルとして提示する。
本研究は,エッセイ執筆の授業コンテキストにおいてモデルがどのように適切に機能するか,その文脈の一部である課題において優れたパフォーマンスを達成するかを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:34:59 GMT)
Do Vision-Language Foundational models show Robust Visual Perception? [0.7] 人間の知覚のような分布シフトに頑健なビジョン言語基盤モデルは存在するか?
具体的には、多種多様な視覚言語モデルを検討し、これらのシステムの性能が汚職に基づく分布変化の影響について比較する。
我々は、上記の分布シフトの下で、ゼロショット画像分類タスクに対して、定性的かつ定量的に一般化能力を解析する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:06:53 GMT)
Spb3DTracker: A Robust LiDAR-Based Person Tracker for Noisy Environment [0.7] 人検出と追跡(PDT)は、自動運転車の分野で2Dカメラベースのシステムによって大幅に進歩している。
プライバシー問題の増加が大きな問題として浮上し、LiDARベースのPDTを代替手段として移行するきっかけとなった。
本稿では,LiDAR ベースの PDT フレームワークの重要なコンポーネントとして,後処理の検出,データアソシエーション,モーションモデリング,ライフサイクル管理について検討する。
多様な環境向けに設計されたロバストな人物トラッカーであるSpbTrackを紹介する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:18:42 GMT)
Crowdsourcing: A Framework for Usability Evaluation [0.7] 方法:現在のユーザビリティ評価研究をレビューするために,系統地図調査を行った。
複数実験を行い、初級観衆ユーザビリティインスペクタと専門家による評価をベンチマークとして比較した。
結果:本研究は,特にWebサイトにおいて,専門家評価を一般的な方法として特定した。
ケーススタディは、このフレームワークが効果的なユーザビリティ検査を可能にし、ソフトウェアの再設計が成功することを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:14:14 GMT)
Quantitative analysis of attack-fault trees via Markov decision processes [0.7] 本稿では,マルコフ決定プロセスを用いて,メトリクスの信頼性(安全性)と攻撃コスト(セキュリティ)の両面を見出す新しい手法を提案する。
これにより、安全とセキュリティの完全な相互運用が可能になると同時に、オートマトンアプローチよりもはるかに軽量で高速になります。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:06:07 GMT)
Generalized knowledge-enhanced framework for biomedical entity and relation extraction [0.7] バイオメディカルな実体と関係抽出のためのタスク非依存で再利用可能な背景知識グラフを構築するための新しいフレームワークを開発する。
私たちのモデルの設計は、人間がドメイン固有のトピックを学ぶ方法にインスパイアされています。
我々のフレームワークは、そのような共通知識共有機構を用いて、異なるドメイン固有のバイオメディカルテキストに効果的に転送可能な学習が可能な、一般的なニューラルネットワーク知識グラフを構築する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:06:45 GMT)
The Adaptive Strategies of Anti-Kremlin Digital Dissent in Telegram during the Russian Invasion of Ukraine [0.6] 本研究では,Telegramにおけるアンチクレムリン含有量の7段階にわたる動態について検討した。
新興トピックに関するデータ駆動の計算分析により、ロシアの経済、戦闘の更新、国際政治、ロシアの内政が明らかになった。
クレムリンコントロールを脅かすこれらの出来事に対する視聴者の承認は、テレグラムが野党のオンラインプレーフィールドをレベル付けしていることを示唆している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:10:06 GMT)
A Perspective on Large Language Models, Intelligent Machines, and Knowledge Acquisition [0.6] 大言語モデル(LLM)は「知識」を生成できることで知られている。
しかし、抽象概念と推論を理解するためのLLMと人間の能力の間には大きなギャップがある。
我々はこれらの問題を、人間の知識獲得とチューリングテストの哲学的な文脈で論じる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 03:25:49 GMT)
DynaSeg: A Deep Dynamic Fusion Method for Unsupervised Image Segmentation Incorporating Feature Similarity and Spatial Continuity [0.6] 我々は、革新的な教師なしイメージセグメンテーションアプローチであるDynaSegを紹介する。
従来の方法とは異なり、ダイナセグは動的重み付け方式を採用している。
画像の特徴に柔軟に対応し、他のセグメンテーションネットワークとの統合を容易にする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:44:38 GMT)
Efficient Quantum Simulation Algorithms in the Path Integral Formulation [0.6] 我々は、経路積分定式化のハミルトン版に基づく2つの新しい量子アルゴリズムと、 $fracm2dotx2 - V(x)$ という形でラグランジアンに対して提供する。
我々のラグランジアンシミュレーションアルゴリズムは、連続極限において$D+1$次元の$eta$粒子を持つシステムに対して、$V(x)$が有界であれば$widetildeO(eta D t2/epsilon)$としてスケールする離散ラグランジアンを演算するオラクルに対して、多数のクエリを必要とすることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:00:47 GMT)
On minimizing the training set fill distance in machine learning regression [0.6] 本研究では,選択した集合の充填距離を最小化することを目的としたデータ選択手法を提案する。
FPSを用いてトレーニングセットを選択することで、ガウスカーネル回帰アプローチの特定の場合のモデルの安定性を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:50:36 GMT)
Multilingual Models for Check-Worthy Social Media Posts Detection [0.6] この研究には様々なモデルの包括的分析が含まれており、特に多言語モデルに焦点を当てている。
この研究の新規性は、検証可能な事実的主張を効果的に含む有害なポストとポストを同時に検出できるマルチラベル多言語分類モデルの開発にある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:55:28 GMT)
Accurate and Efficient Structural Ensemble Generation of Macrocyclic Peptides using Internal Coordinate Diffusion [0.5] RINGERは拡散型トランスフォーマーモデルであり、その2次元表現から大環状ペプチドの3次元コンフォメーションアンサンブルを生成する。
本稿では,RINGERが計算コストのごく一部で高品質かつ多様なジオメトリを生成する方法を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:19:21 GMT)
Sustaining Maintenance Labor for Healthy Open Source Software Projects through Human Infrastructure: A Maintainer Perspective [0.5] オープンソースソフトウェア(OSS)は私たちのグローバルなデジタルインフラストラクチャを推進しますが、一般的には少数の人々によって管理されています。
本研究の目的は, 持続可能なOSSプロジェクトの構築と維持を可能にするために, 維持作業をどのように支援し, 確保できるかを検討することである。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:30:52 GMT)
Exploring the anatomy of articulation rate in spontaneous English speech: relationships between utterance length effects and social factors [0.4] 発話長の影響は、ひとたび説明されると社会的要因の役割を低下させることが示されている。
年齢や性別も発話速度を調節するが、その効果はマグニチュードよりもはるかに小さい。
これらの結果から,発話長の影響は調音的・知覚的制約によって条件付けられる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:47:29 GMT)
Quantum-limited generalized measurement for tunnel-coupled condensates [0.4] 我々は、制御された原子の外部結合に基づく一般化された測定方式を実装した。
これにより、2つのトンネル結合型1Dボースガス系における数値不均衡と相対位相の同時アクセスが可能となる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:06:59 GMT)
Stationary states of boundary driven quantum systems: some exact results [0.4] 密度行列がリンドブラディアン、$dotrho=-i[H,rho]+mathcal Drho$を介して進化する有限次元開量子系について検討する。
H$で通勤する系上の任意の定常密度行列 $barrho$ は $barrho=hatrho_Aotimesrho_B$ の積でなければならないことを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:33:56 GMT)
Magnetically Induced Schrödinger Cat States: The Shadow of a Quantum Space [0.4] 二次元平面上に位置する非相対論的電気双極子系において、絡み合ったシュリンガー猫状態を生成するスキームを導入する。
以上の結果から, モデルパラメータの特定の範囲において, 崩壊現象や絡み合いの回復現象が生じる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:08:07 GMT)
Learning Optimal Filters Using Variational Inference [0.4] 本稿では,パラメータ化解析マップを学習するためのフレームワークを提案する。
この手法は線形および非線形力学系をフィルタリングするゲイン行列の学習に利用できることを示す。
今後、このフレームワークを新しいフィルタリングアルゴリズムの学習に適用する予定である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:08:39 GMT)
Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling [0.3] GESTは、マスク付きLMと英語-to-X機械翻訳システムにおいて、ジェンダーステレオタイプ推論を測定するための新しいデータセットである。
GESTには、9つのスラヴ語と英語で男女16のステレオタイプに対応するサンプルが含まれている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:40:35 GMT)
Massive Dimensions Reduction and Hybridization with Meta-heuristics in Deep Learning [0.2] ヒストグラムに基づく微分進化(HBDE)は、パラメータを最適化するために勾配に基づくアルゴリズムと勾配のないアルゴリズムをハイブリダイズする。
HBDEは、CIFAR-10とCIFAR-100データセットに基づいて評価されたベースライン勾配と親勾配のないDEMアルゴリズムより優れている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:28:20 GMT)
Attainability of quantum state discrimination bounds with collective measurements on finite copies [0.2] いくつかの簡単な量子ビット例において、未知状態の任意の数のコピーに対してヘルストローム境界に対する解析式を求める。
また、M-コピーヘルストローム境界を飽和させるために必要な条件についても検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:08:16 GMT)
Approaches for enhancing extrapolability in process-based and data-driven models in hydrology [0.2] 本稿では,プロセスベースおよびデータ駆動型水文モデルにおける外挿可能性の評価・向上手法をレビューし,比較する。
主要な戦略は、未ゲージ領域におけるモデルパフォーマンスを評価するために、残余のクロスバリデーションと類似性に基づく手法の使用である。
ディープラーニング、トランスファーラーニング、ドメイン適応技術も、データスパースおよび極端な条件下でモデル予測を改善する可能性を約束している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:59:24 GMT)
AuToMATo: A Parameter-Free Persistence-Based Clustering Algorithm [0.1] 永続的ホモロジーに基づく新しいパラメータフリークラスタリングアルゴリズムであるAuToMAToを提案する。
我々は,AuToMAToを,他の最先端クラスタリングアルゴリズムと比較した。
我々はPythonでAuToMAToのオープンソース実装を提供し、標準シキトラーンアーキテクチャと完全に互換性がある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:15:37 GMT)
Event-Stream Super Resolution using Sigma-Delta Neural Network [0.1] イベントカメラは、それらが収集するデータの低解像度で疎結合で非同期な性質のため、ユニークな課題を示す。
現在のイベント超解像アルゴリズムは、イベントカメラによって生成された異なるデータ構造に対して完全に最適化されていない。
バイナリスパイクをSigma Delta Neural Networks(SDNNs)と統合する手法を提案する
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:25:18 GMT)
Attention Based Feature Fusion Network for Monkeypox Skin Lesion Detection [0.1] 最近のサルポックスの流行は公衆衛生に重大な懸念をもたらしている。
深層学習アルゴリズムは、新型コロナウイルス(COVID-19)を含む病気の特定に利用できる。
本稿では,ヒトサルポックス病を分類するために,事前学習した2つのアーキテクチャをマージする軽量モデルを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:21:03 GMT)
Integrating Saliency Ranking and Reinforcement Learning for Enhanced Object Detection [0.1] 本研究では、強化学習(RL)に基づく視覚的注意法と給与ランキング技術を組み合わせた一連の実験について検討する。
この研究で得られた平均精度(mAP)は51.4で、RLをベースとした単体検出器のベンチマークを上回りました。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:46:42 GMT)
Why Do Experts Favor Solar and Wind as Renewable Energies Despite their Intermittency? [0.0] 再生可能エネルギーの専門家ではない人々は、エネルギー技術とエネルギー市場について学んでいます。
そのような疑問の1つは、なぜ太陽と風力発電が断続的であるときに将来のエネルギーの大部分を供給するのかである。
太陽風と風の予測コストは競合技術よりも2~4倍低い。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:56:23 GMT)
What Matters in Hierarchical Search for Combinatorial Reasoning Problems? [0.0] 近年の取り組みでは,階層的な高次探索戦略を取り入れたサブゴアル手法による計画の強化が試みられている。
有望ではあるが、従来の低レベルのプランナに対する彼らのパフォーマンスは一貫性がなく、アプリケーションコンテキストに関する疑問を提起している。
難解な値関数、複雑なアクション空間、環境におけるデッドエンドの存在、あるいは多様な専門家から収集されたデータなど、ハイレベル検索の利点を活用する上で重要な属性を同定する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:56:45 GMT)
WRDScore: New Metric for Evaluation of Natural Language Generation Models [0.0] 堅牢な計量は、意味的および統語的バリエーションの両方を考慮して、メソッド命名の汎用性を考慮する必要がある。
既存の埋め込みベースのメトリクスは、しばしば不均衡な精度とリコール、正規化されたスコアの欠如、シーケンスに関する非現実的な仮定に悩まされる。
我々は、最適輸送の理論を活用し、単純性と有効性のバランスをとる新しい計量であるWRDScoreを構築します。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:32:07 GMT)
Unmasking the Uniqueness: A Glimpse into Age-Invariant Face Recognition of Indigenous African Faces [0.0] Age-Invariant Face Recognition (AIFR) は、アフリカと比較してヨーロッパ、アメリカ、アジアでかなりの研究成果を上げている。
この研究は、顔画像解析研究においてアフリカ民族の誤表現を減らすために、アフリカ先住民の顔のためのAIFRシステムを開発した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:54:10 GMT)
Uniform observable error bounds of Trotter formulae for the semiclassical Schrödinger equation [0.0] 観測可能なクラスの計算コストは、最先端の限界よりもはるかに低いことを示します。
We improve the additive observable error bounds to uniform-in-$h$ observable error bounds。
これは、我々の知る限りでは、半古典的シュル「オーディンガー方程式」に対する最初の一様可観測誤差である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:16:59 GMT)
Uncertainty Quantification in Alzheimer's Disease Progression Modeling [0.0] 本研究は,モンテカルロ・ドロップアウト,変分推論,マルコフ・チェイン・モンテカルロ,アンサンブル・ラーニングの512症例を対象とした4年間の認知的スコア・トラジェクトリの信頼性評価を行った。
MC Dropout と MCMC は,ノイズの多いトレーニングデータの下で,よく校正され,正確な予測を行うことができることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:53:34 GMT)
Trade-offs between classical and quantum space using spooky pebbling [0.0] Pebbleゲームは、空間/時間のトレードオフを研究するために使用されます。
本稿では,一般的な回路に対して,スポーキーな小石ゲームフレームワークを初めて適用する。
制限されたランタイム内では、古典的な空間を考慮すると量子空間を減らす戦略を見つけることができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:57:08 GMT)
Topological quantum compilation of two-qubit gates [0.0] 我々は,単一ビット動作までの制御NOTゲートと等価なリークフリーなゲートを生成する。
生成されたクラスのほとんどは、2量子ゲートのワイルチャンバー表現の端近くに位置している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:02:54 GMT)
Thermodynamic sensing of quantum nonlinear noise correlations [0.0] 非線形2モード干渉計とメカニカル発振器を結合した量子ノイズセンシングの概念を考案した。
これらの機械は、2モードノイズ場の量子非線形相関を抽出可能な熱力学的変数によって検出することができる。
この方法は、マルチモード量子非線形ゲージ場のシミュレーションと制御を前進させる可能性がある。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:30:23 GMT)
The Potential of Combined Learning Strategies to Enhance Energy Efficiency of Spiking Neuromorphic Systems [0.0] この原稿は、畳み込みスパイキングニューラルネットワーク(CSNN)のための新しい複合学習アプローチを通じて、脳にインスパイアされた知覚コンピュータマシンの強化に焦点を当てている。
CSNNは、人間の脳にインスパイアされたエネルギー効率の良いスパイクニューロン処理を提供する、バックプロパゲーションのような従来のパワー集約的で複雑な機械学習手法に代わる、有望な代替手段を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:40:50 GMT)
The Physics-Informed Neural Network Gravity Model: Generation III [0.0] 第3世代物理インフォームドニューラルネットワーク重力モデル(PINN-GM-III)
本稿では,第3世代物理インフォームドニューラルネットワーク重力モデル(PINN-GM-III)を紹介する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:10:19 GMT)
The News Comment Gap and Algorithmic Agenda Setting in Online Forums [0.0] 我々はオーストリアの新聞Der Standardから120万件のコメントを分析し、"News Comment Gap"と異なるランキングアルゴリズムの効果を理解する。
ジャーナリストはポジティブで、タイムリーで、複雑で、直感的な反応を好むのに対し、読者は、エリート作家の記事に類似したコメントを好む。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:43:32 GMT)
The Complexities of Differential Privacy for Survey Data [0.0] アメリカ合衆国国勢調査局は、2020年12月の国勢調査にこの概念を採用したと発表した。
その魅力的な理論的特性にもかかわらず、実際にDPを実装することは、特に調査データに関して難しいままである。
調査の文脈でDPを採用する際に考慮すべき5つの側面を識別する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:15:42 GMT)
TableGuard -- Securing Structured & Unstructured Data [0.0] TableGuard"はリレーショナルデータベースに適したデータ難読化のための革新的なアプローチである。
API呼び出しは、難読化されたデータのみを返すため、サードパーティとデータを共有する際のプライバシを保護する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:20:52 GMT)
Sumotosima: A Framework and Dataset for Classifying and Summarizing Otoscopic Images [0.0] オトスコープ(Otoscopy)は、耳管と耳栓を内視鏡で検査する診断法である。
本研究では,新しい資源効率のよいディープラーニングとトランスフォーマーベースのフレームワークSumotosimaを提案する。
私たちのフレームワークは、三重項とクロスエントロピー損失の組み合わせに取り組んでいます。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:26:41 GMT)
Stunned by Sleeping Beauty: How Prince Probability updates his forecast upon their fateful encounter [0.0] 眠れる美女を眠らせ、コインを投げる。
コイントスの結果がタイルズの場合、スリープングビューティは月曜日に目覚め、再び眠り、火曜日に再び目覚める。
結果が頭なら、Sleeping Beautyは月曜日にのみ目覚める。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:27:16 GMT)
Structure-preserving Planar Simplification for Indoor Environments [0.0] 本稿では,屋内シーンポイント雲の構造保存型平面簡易化のための新しい手法を提案する。
キャプチャされた各シーンを、構造化された(壁焼床)と非構造化された(屋内オブジェクト)のシーンに分割する。
天井と床を正確に表現するために,壁面の正常性に対して天井と床のメッシュを切断するメッシュクリッピングアルゴリズムを用いる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:10:26 GMT)
Speed Limits and Scrambling in Krylov Space [0.0] 強化されたレベル反発は、ランダム/可積分行列におけるOQSLの増加に対応する。
多体系では、力学はモデルのテンソル積構造によってより複雑になる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:31:39 GMT)
Speculations on Uncertainty and Humane Algorithms [0.0] Provenanceは、アルゴリズムが危険を防ぐために何を知っているかを知ることを可能にする。
正当でない、あるいは不可能な仮定をするよりも、私たちが知っていることを計算することが不可欠です。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:54:34 GMT)
Slow approach to adiabaticity in many-body non-Hermitian systems: the Hatano-Nelson Model [0.0] 非エルミート量子多体系における近接断熱力学を探索する。
我々の研究は、断熱と非エルミート多体物理学の複雑な相互作用を強調している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:00:01 GMT)
Robustness of optimal quantum annealing protocols [0.0] ハミルトンのノルムがこれらの誤りに対するロバスト性を定量化し、コスト関数に追加の正規化項を導入する動機となっていることを示す。
我々はポントリャーギンの最大原理に基づいて、結果として生じるロバストな量子最適制御問題の最適条件を分析する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:10:56 GMT)
Revisiting de Broglie's Double-Solution Pilot-Wave Theory with a Lorentz-Covariant Lagrangian Framework [0.0] De Broglieの二重解法プログラムを再構築する目的で、パイロット波システムの豊富なファミリーを紹介する。
特に、全族は局所的かつローレンツ不変である。
粒子は、常にコンプトンスケールの湯川波束で、その軌道から独立していることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:29:18 GMT)
Quantum obesity and steering ellipsoids for fermionic fields in Garfinkle-Horowitz-Strominger dilation spacetime [0.0] 本稿では,2量子ビット上の時空のGarfinkle-Horowitz-Stromingerダイアレーションを受けるギシン状態に対する量子肥満(QO),量子不協和(QD),および量子ステアリング楕円体(QSE)について検討する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:07:26 GMT)
Quantum cloning transformation unlocks the potential of W class of states in a secret sharing protocol [0.0] 本稿では,3つのパーティ間で共有される状態の3ビットWクラスを利用した量子秘密共有プロトコルを提案する。
このプロトコルは確率的であり,プロトコルの成功確率を計算した。
より絡み合った状態のWクラスでさえも、提案された秘密共有スキームにおいて重要な役割を果たす。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:27:58 GMT)
Quantifying uncertainty in climate projections with conformal ensembles [0.0] 我々は,共形推論に基づく気候予測における不確実性定量化の新しいアプローチである共形アンサンブルを導入する。
従来の手法とは異なり、共形アンサンブルは気候モデルと観測データを様々なスケールでシームレスに統合し、統計的に厳密で容易に解釈できる不確実性推定を生成する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:23:55 GMT)
QIris: Quantum Implementation of Rainbow Table Attacks [0.0] 我々は量子虹彩テーブルの動作プロトタイプを開発する。
我々は、量子コンピューティングがパスワードクラッカーのようなサイバーツールの速度を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:51:26 GMT)
Purcell-enhanced single-photon emission from InAs/GaAs quantum dots coupled to broadband cylindrical nanocavities [0.0] 本研究では,InAsQDの発光速度を金属被覆GaAsナノピラーに結合することにより38倍に向上することを示した。
これらのキャビティは、4.5x10-4 (lambda/n)3のサブ波長モードボリュームと62のクオリティ係数を特徴とし、15nmの広い帯域にわたってパーセルを増幅した単一光子放出を可能にする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:48:36 GMT)
Prompt-Based Segmentation at Multiple Resolutions and Lighting Conditions using Segment Anything Model 2 [0.0] 本稿では,ゼロショット型,プロンプト型セグメンテーションモデル(SAM)とその更新版SAM2の有効性について考察する。
SAM 2はSAMよりも改善され、特に点によって誘導される場合の準最適照明条件において顕著である。
高解像度の画像では、最適条件と準最適条件の両方において、Eff-UNetはYOLOv9ボックスによって引き起こされたSAMモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:27:43 GMT)
Probing instantaneous quantum circuit refrigeration in the quantum regime [0.0] 量子回路冷凍機(QCR)は、量子系の励起集団を電気的に冷却することができる。
本研究では,量子状態における瞬時QCRを実証した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:10:42 GMT)
Primer on quantum weirdness [0.0] 基本量子力学の知識を仮定する。
我々は、射影子、密度作用素、ベルの不等式、絡み合い、リンドブラッド方程式としてアイデアを説明できる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:06:02 GMT)
Pragmatic inference of scalar implicature by LLMs [0.0] 本研究では,Large Language Models (LLM) が不適応の実用的推論にどのように関与するかを検討する。
BERTは本質的に実用的不適応を一部という用語に含めず、デフォルトモデルに固執している。
GPT-2は、コンテキスト駆動モデルと整合して、コンテキスト内で実用的不適応を推論する処理困難に直面しているようだ。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:52:29 GMT)
Play Me Something Icy: Practical Challenges, Explainability and the Semantic Gap in Generative AI Music [0.0] この写真は、説明可能なAIの文脈において、テキスト音声およびテキスト音声生成ツールの性質を批判的に考察することを目的としている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 22:42:05 GMT)
Physics Informed Deep Learning for Strain Gradient Continuum Plasticity [0.0] 我々は、物理情報深層学習に基づく時空間離散化を用いて、速度依存ひずみ勾配塑性モデルの解を近似する。
物理情報ニューラルネットワークからインスピレーションを得て、PIDLモデルの損失関数をいくつかの新しい方法で修正する。
本稿では, PIDL法がひずみ可塑性モデルによって生じる計算問題にどのように対処できるかを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 06:02:05 GMT)
Performance Evaluation of YOLOv8 Model Configurations, for Instance Segmentation of Strawberry Fruit Development Stages in an Open Field Environment [0.0] 本研究では, オープンフィールド環境下でイチゴを熟成・未熟成段階に分割するためのYOLOv8モデル構成の性能評価を行った。
YOLOv8nモデルは、平均平均精度 (mAP) が80.9%と優れたセグメンテーション精度を示し、他のYOLOv8構成よりも優れていた。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:41:26 GMT)
Ownership in low-level intermediate representation [0.0] 高レベルの言語におけるオーナシップの概念は、プログラマとコンパイラの両方がメモリ操作の有効性を判断するのに役立ちます。
低レベル中間表現のようなLLVMのオーナシップセマンティクスを開発する。
LLVMのモデルチェッカーであるSEABMCでこれらのセマンティクスを実装している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:31:34 GMT)
Optimizing Emotion Recognition with Wearable Sensor Data: Unveiling Patterns in Body Movements and Heart Rate through Random Forest Hyperparameter Tuning [0.0] 調査では、スマートウォッチと心拍モニターを装着した50人の参加者が250メートルの歩行を完了した。
被験者の感情状態はPANASアンケートを用いて評価した。
研究は、歩く前に映画を見ること、歩く前に音楽を聴くこと、歩きながら音楽を聴くことの3つのシナリオを精査した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:35:13 GMT)
Optimal strategies for low-noise detection of atoms using resonant frequency modulation spectroscopy in cold atom interferometers [0.0] 共鳴周波数変調分光法は、冷間原子干渉計の出力を測定するための高感度な方法として用いられている。
本手法を蛍光イメージングの標準手法と比較し, 縮合原子源を用いた小型干渉計の蛍光イメージングに優れることを示した。
しかし, 原子数に制限があるため, 励起原子源を用いる場合, 蛍光イメージングが好ましいと考えられる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:23:25 GMT)
Optimal Bound for PCA with Outliers using Higher-Degree Voronoi Diagrams [0.0] 本稿では,主成分分析 (PCA) のための新しいアルゴリズムについて紹介する。
外れ値が存在する場合でも、PCAの最適部分空間にナビゲートする。
このアプローチは、$nd+mathcalO(1)textpoly(n,d)$の時間複雑性を持つ最適解を得る。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:05:36 GMT)
On the Local Ultrametricity of Finite Metric Data [0.0] 有限測度データに対して,新しい測度尺度を提案する。
ベイン・リップス・コーナー (Vin-Rips corner) は、正則微分 1-形式から来るラドン測度によって与えられる p-進マンフォード曲線のサンプルである。
これはアイリスデータセットに実験的に適用される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:37:20 GMT)
On a Scale-Invariant Approach to Bundle Recommendations in Candy Crush Saga [0.0] 本稿では,モバイルゲームシナリオにおけるアイテムレコメンデーション作成における注意モデルの利用について述べる。
この手法はその後、Candy Crush Sagaのバンドルレコメンデーションに適用される。
提案手法は,クリック率を30%,テイクレートを40%以上向上させ,ユーザのエンゲージメントを30%向上させることを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:42:32 GMT)
On "Consistent Quantization of Nearly Singular Superconducting Circuits" [0.0] 超伝導回路の量子化に関するRymarzとDiVincenzoによる分析は、それらの一般的な結論を正当化するには不十分である。
いくつかの相違点の1つの源は、ジョセフソン接合の存在下での拡張変数とコンパクト変数の間の長年にわたる論争である。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:26:16 GMT)
Observation of anomalous classical-to-quantum transitions in many-body systems [0.0] オープン多体光学系における異常な古典-量子遷移の実験的観察について報告する。
我々の研究は、凝縮物質から核物理学まで、他の物理学分野に重要な意味を持つ。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:10:09 GMT)
Nuclear Excitation by Near-Resonant Electron Transition in $^{229}$Th$^{39+}$ Ions [0.0] 基底状態から8 eV 229m$Th異性体への核励起に関する理論的考察がなされている。
229m$Th異性体励起速度の上限は、共鳴時に1.05時間s1016$s$-1$という大きな値に達する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:12:39 GMT)
Nonexponential decay law of the 2P-1S transition of the H-atom [0.0] 我々は水素原子の不安定な2P励起状態に対する生存確率$P(t)$を評価する。
短い時間と長い時間に$P(t)$は指数法則からの偏差を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:59:09 GMT)
Musings on SVD and pseudo entanglement entropies [0.0] 擬エントロピーとSVDエントロピーは、選択後を含む絡み合いエントロピーの一般化である。
この研究では、量子状態の空間上の測度としてそれらの性質を分析し、その余剰が2つの状態の違いの有用な特徴を与えると主張している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:23:52 GMT)
Multi-Layered Security System: Integrating Quantum Key Distribution with Classical Cryptography to Enhance Steganographic Security [0.0] 本稿では,量子鍵分布(QKD)と古典的暗号技術を統合する新しい暗号システムを提案する。
提案手法は,E91QKDプロトコルを利用して,通信相手間で共有秘密鍵を生成する。
このキーは、Secure Hash Algorithm(SHA)を使用してハッシュされ、固定長の高エントロピーキーを提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:20:29 GMT)
MICL: Improving In-Context Learning through Multiple-Label Words in Demonstration [0.0] In-context Learning (ICL)では、サンプルラベルペアをデモとして使用することで、大規模な言語モデル(LLM)が新しいタスクを実行できる。
LLMの出力空間分布に基づく実演において,サンプルとラベルの両方を整理する包括的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:46:52 GMT)
Layer-Specific Optimization: Sensitivity Based Convolution Layers Basis Search [0.0] 畳み込み層の重みに対して行列分解を適用する新しい方法を提案する。
この方法の本質は、すべての畳み込みを訓練することではなく、畳み込みのサブセット(基底畳み込み)のみを訓練することであり、残りを基底の線形結合として表現することである。
ResNetファミリとCIFAR-10データセットによるモデル実験では、ベース畳み込みはモデルのサイズを減らすだけでなく、ネットワークの前方および後方通過を加速する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:01:59 GMT)
Large Model Strategic Thinking, Small Model Efficiency: Transferring Theory of Mind in Large Language Models [0.0] 微調整によるシミュレーション可能な小型モデルの実現可能性について検討する。
社会的文脈と社会的ジレンマを組み合わせた20のシナリオを持つ,大規模事前学習モデルを提案する。
微調整された小型言語モデルでは,より大型の言語モデルに近い性能を示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:09:57 GMT)
Language Models as Models of Language [0.0] この章は、理論言語学への現代言語モデルの潜在的貢献について批判的に考察する。
言語モデルが階層的な構文構造を学習し,様々な言語現象に対する感受性を示すことを示唆する経験的証拠の蓄積を概説する。
私は、理論言語学者と計算研究者の緊密な協力が貴重な洞察をもたらすと結論づける。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:26:04 GMT)
Iterative quantum optimization of spin glass problems with rapidly oscillating transverse fields [0.0] IST-SAT(Iterative Symphonic Tunneling for Satisfiability Problem)と呼ばれる新しい反復量子アルゴリズムを導入する。
IST-SATは高周波振動横場を用いた量子スピンガラス最適化問題を解く。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:09:30 GMT)
Is Power-Seeking AI an Existential Risk? [0.0] 本報告では、人工知能の実在リスクに関する懸念の核となる論点として、私が見ているものについて考察する。
私は、この種のエージェントを作成することが2070年までに実在の災害につながるという、より具体的な6つの前提の議論を定式化し、評価します。
私は、2070年までにこの種の実在する災害が起こるという、全体の5%の見積もりにたどり着きました。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:19:59 GMT)
Interpolating many-body wave functions for accelerated molecular dynamics on the near-exact electronic surface [0.0] 我々は原子配置の空間を通して相関多電子状態のスキームを開発する。
我々は、その後のダイナミクスに対して、ほぼ正確なポテンシャルエネルギー表面への証明可能な収束を示す。
分子動力学の軌跡を体系的に解くため、現代の電子構造アプローチと組み合わせる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:57:20 GMT)
Impact of dark states on the stationary properties of quantum particles with off-centered interactions in one dimension [0.0] 一次元に閉じ込められた非相対論的粒子に対する2体接触相互作用の一般化を提案する。
粒子は距離cが離れているときにのみ相互作用する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:20:29 GMT)
Holography of Transmission Lines: Insights of Continuous MERA and AdS/CFT [0.0] 我々はAdS空間における伝送線路の量子化と相互作用を分析する。
その結果、量子回路における複雑な現象の扱いと制御に関する新たな洞察が得られた。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:12:08 GMT)
Handbook for Efficiently Quantifying Robustness of Magic [0.0] ロバストネス・オブ・マジック(RoM)は、非クリフォード演算に対する与えられた量子状態の有用性の度合いを特徴付ける。
本稿では,RoMを計算するための効率的な新しいアルゴリズムを提案する。
我々は、魔法の状態と部分的に歪んだ量子状態のコピーについて、最先端の結果を数値的に示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:19:47 GMT)
Generative AI for automatic topic labelling [0.0] 本稿では,トピックラベリングのための3つのLPM(Flan, GPT-4o, GPT-4 mini)の信頼性を評価することを提案する。
スイスのすべての生物学教授が作成した科学論文のデータセットからトピックを生成します。
まず、両方のGPTモデルが、モデルの出力キーワードからトピックを正確に正確にラベル付けできることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 16:07:16 GMT)
Generative AI Tools in Academic Research: Applications and Implications for Qualitative and Quantitative Research Methodologies [0.0] 本研究では,生成人工知能(GenAI)が学術研究に与える影響について検討し,質的・定量的データ分析への応用に焦点をあてる。
GenAIツールは急速に進化し、研究の生産性を高め、複雑な分析プロセスを民主化するための新たな可能性を提供する。
学術的実践への統合は、研究の完全性、セキュリティ、著作家精神、そして学術作品の変化する性質に関する重要な疑問を提起する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:10:03 GMT)
Geminal theory within the seniority formalism and bi-variational principle [0.0] 本稿では,重大性形式論と二変分原理におけるゲジナル理論の数学的構造について概説する。
星座にちなんで名づけられたゲミナル波動関数は、量子化学におけるペア電子波動関数の平均場のような表現を提供する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 12:04:04 GMT)
Experimental realization of entanglement between two Brownian particles [0.0] 座標と粗粒度速度の不確実性関係は、量子絡み合いに似た現象を引き起こす。
相互接続された粒子は、ブラウン量子にインスパイアされた古典的相関の絡み合いを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:07:32 GMT)
Establishing Quantum-Secured Channels in Large-Scale Optical Networks [0.0] 量子鍵分配技術に基づく量子セキュアな光チャネルは、世界的に大きな関心を集めている。
このようなチャネルを長距離に配置することは技術的課題に直面している。
運用環境における大規模光ネットワークにおける量子セキュアチャネルの確立に関する業界展望について論じる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:54:06 GMT)
Enhancing Multiview Synergy: Robust Learning by Exploiting the Wave Loss Function with Consensus and Complementarity Principles [0.0] 本稿では、ウェーブロス(W-loss)関数を利用した新しいマルチビューサポートベクターマシンであるWave-MvSVMを紹介する。
Wave-MvSVMは、コンセンサスと相補性の両方の原則を統合することで、より包括的でレジリエントな学習プロセスを保証する。
多様なデータセットにわたる大規模な経験的評価は、Wave-MvSVMの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:25:22 GMT)
Enhancing Diabetic Retinopathy Diagnosis: A Lightweight CNN Architecture for Efficient Exudate Detection in Retinal Fundus Images [0.0] 本稿では,自動解凍器検出に適した,新しい軽量畳み込みニューラルネットワークアーキテクチャを提案する。
我々は、モデルの一般化性を高めるために、ドメイン固有のデータ拡張を取り入れた。
本モデルでは,F1スコアの90%を達成し,基礎画像による糖尿病網膜症の早期発見における有効性を示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:13:33 GMT)
Emergent Gauge Fields and the "Choi-Spin Liquids" in Steady States [0.0] リンドブラディアン群の進化の定常状態は、二重ヒルベルト空間の「グッツウィラー射影」波動関数に写像できることを示す。
また、チャーン絶縁体から始めると、リンドブラディアン進化の定常状態が自然に「強弱」なU(1)対称性の破れを持つことが示される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:00:01 GMT)
Elementary Quantum Arithmetic Logic Units for Near-Term Quantum Computers [0.0] 本研究では,2次元配列に量子ビットを配置した近距離量子コンピュータに対して,実現可能な量子演算論理ユニット(QALU)を提案する。
本稿では、符号付き整数の補表現を計算するために、実現可能な量子演算を導入する。
本研究は,量子コンピュータにおけるQALUの実装を実証し,スケーラブルで資源効率のよい量子演算への展開を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 01:49:58 GMT)
Efficient Multiparty Entanglement Distribution with DODAG-X Protocol [0.0] DODAG-Xは量子ネットワークにおける多部絡み合い分布のプロトコルである。
グラフ検証とパスフィニングの計算を最小化し,計算オーバーヘッドを大幅に削減する。
DODAG-Xは任意のネットワークにおいて最大3次元の絡み合いを発生させる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 18:00:00 GMT)
EE3P3D: Event-based Estimation of Periodic Phenomena Frequency using 3D Correlation [0.0] 本稿では,イベントカメラによる周期現象の頻度測定手法を提案する。
このアプローチは、周期的な現象に対して、非常に類似した事象の集合が特定の時間的ウィンドウ内で生成されると仮定する。
類似イベントの集合は、イベントストリーム空間における3次元時間相関によって検出される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:50:46 GMT)
Dynamic Exclusion of Low-Fidelity Data in Bayesian Optimization for Autonomous Beamline Alignment [0.0] 本研究は、ビーム品質の信頼できない読み出しを識別し、最適化モデルが低忠実度ビームを産出する可能性のある点を求めることを阻止する手法の研究である。
探索されたアプローチには、サイズと位置モデルの損失解析を用いた動的プルーニングと、最適な適合のためにモデルにどの点を含めるべきかを決定する長さスケールに基づく遺伝的アルゴリズムが含まれる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 00:20:39 GMT)
Direction of Arrival Correction through Speech Quality Feedback [0.0] Demucs Denoiserモデルは、方向推定における誤差に敏感である。
本研究では,その拡張出力のリアルタイム推定音声品質を観測変数として用いたDOA補正手法を提案する。
提案システムは,音声品質のみをガイドとして,最大15$oの誤りをリアルタイムに補正することができる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 23:43:20 GMT)
Diffusion map particle systems for generative modeling [0.0] 拡散写像とラプラシアン調整ワッサーシュタイン勾配勾配(LAWGD)に基づく新しい拡散写像粒子システム(DMPS)を提案する。
拡散写像は、サンプルから対応するランゲヴィン拡散過程の生成元を近似し、基礎となるデータ生成多様体を学習するために用いられる。LAWGDは、核の適切な選択を条件として、対象分布からの効率的なサンプリングを可能にする。
本手法では、オフライントレーニングや最小限のチューニングは必要とせず、適度な次元のデータセットにおいて、他の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:08:10 GMT)
Diagnosis extraction from unstructured Dutch echocardiogram reports using span- and document-level characteristic classification [0.0] 本研究は,非構造オランダ心エコー図による自動スパンレベル診断と文書レベル診断の有用性について検討した。
本研究では,重み付きおよびマクロF1スコア,精度,性能評価のためのリコールを用いて,スパンレベルと文書レベルの両方で自動ラベリング手法を開発し,試験した。
SpanCategorizerとMedRoBERTa.nlモデルは、他のすべてのスパンと文書分類器よりも優れていた。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 14:33:32 GMT)
Deep Learning for Speaker Identification: Architectural Insights from AB-1 Corpus Analysis and Performance Evaluation [0.0] この研究は、話者識別(SID)の複雑な分野を深く掘り下げている。
特徴抽出には,Mel SpectrogramとMel Frequency Cepstral Coefficients(MFCC)が重要である。
この研究は、AB-1 Corpusデータセット内のバイアス評価に加えて、アクセントと性別の正確性を検証するための言語分析を行う。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 10:46:50 GMT)
Decentralized Intelligence Health Network (DIHN) [0.0] 分散ヘルスインテリジェンスネットワーク(Decentralized Health Intelligence Network, DHIN)は、医療における健康データ主権とAI利用の課題に対処する理論フレームワークである。
医療における効果的なAIトレーニングをサポートし、患者が健康データをコントロールし、金銭的に利益を享受し、分散型でスケーラブルなエコシステムに貢献できるようにする。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 02:55:29 GMT)
Cross Pseudo Supervision Framework for Sparsely Labelled Geospatial Images [0.0] 土地利用土地被覆(LULC)マッピングは、都市と資源計画にとって重要なツールである。
本研究では,高解像度衛星画像を用いたLULC予測のための半教師付きセグメンテーションモデルを提案する。
粗いラベル付きデータに基づいて画像分割モデルをトレーニングするクロス擬似スーパービジョンフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 09:00:42 GMT)
Correctness Comparison of ChatGPT-4, Gemini, Claude-3, and Copilot for Spatial Tasks [0.0] 本研究では、4つのチャットボットに割り当てられた7つのタスクカテゴリの76個の空間的タスクに対してゼロショットの正当性評価を行う。
チャットボットは、空間リテラシー、GIS理論、プログラミングコードと関数の解釈に関連するタスクでうまく機能したが、マッピング、コード記述、空間推論の弱点が明らかになった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:02:18 GMT)
Classifying Density Matrices of 2 and 3 Qubit States Up To LU Equivalence [0.0] この証明の修正版として,Jing-Yang-Zhao の論文 "Local Unitary Equivalence of Quantum States" がある。
私たちはこの対応を3$-qubitsに一般化することができる。
これらの結果は、LU同値の概念を準LU同値に緩和すれば、$2と$3に拡張できる。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 15:43:41 GMT)
Characterisation of a levitated sub-mg ferromagnetic cube in a planar alternating-current magnetic Paul trap [0.0] 室温で交互に流れる平面磁性ポールトラップに浮かぶサブmg磁性立方体を特徴付ける。
この技術は、マイクロンサイズの粒子制限におけるMHzリリレーションモードの経路を定め、超伝導回路やスピンベースの量子システムへの磁気的結合を可能にした。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 11:54:34 GMT)
Cavity-enhanced induced coherence without induced emission [0.0] 本稿ではZu-Wang-Mandelインターフェロメトリ(ZWM)の強化に関する理論的研究について述べる。
これは、絡み合ったアイドラー光子間の不明瞭性を介して、単一信号光子間の干渉効果を生成する能力を示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 05:13:44 GMT)
CS-TRD: a Cross Sections Tree Ring Detection method [0.0] この手法は、Canny Devernayエッジ検出器(シグマ)のパラメータ、サイズ要因、光の数、および穴の位置に依存する。
CS-TRDは完全に自動化されており、UruDendroデータセット(Pinus taeda)で89%、Kennelデータセット(Abies alba)で97%のFスコアを特別なハードウェア要件なしで達成している。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:35:32 GMT)
BERT's Conceptual Cartography: Mapping the Landscapes of Meaning [0.0] 概念的景観を創り出すことにより、文脈的ニュアンスを探求する第一歩を踏み出す。
我々は、British National CorpusとBERTの音声コンポーネントを使用して、文脈化された単語埋め込みを作成します。
本研究は,概念工学の本質的な複雑さを浮き彫りにし,各単語がユニークで複雑な景観を示すことを示した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 20:08:26 GMT)
Automatic Feature Recognition and Dimensional Attributes Extraction From CAD Models for Hybrid Additive-Subtractive Manufacturing [0.0] 本稿では,加法および減算加工の両方に関連する特徴を含む合成CADデータセットを作成するための新しいアプローチを提案する。
階層型グラフ畳み込みニューラルネットワーク (HGCNN) モデルは, 合成加法-減算的特徴を正確に識別するために実装されている。
提案モデルでは,特徴認識精度が97%を超え,特徴抽出精度が100%以上であることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:38:32 GMT)
Atomic fluorescence collection into planar photonic devices [0.0] 個々のエミッタからの蛍光収集は、状態検出とリモート絡み合い生成において重要な役割を果たす。
平面フォトニクスは、閉じ込められたイオン系の堅牢でスケーラブルな対処のために実証されている。
遠距離場光子収集効率は、エミッタ位置のみの集光光学に関連付けられたフィールドで簡単に表現できることを示す。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 17:58:58 GMT)
Application of LLM Agents in Recruitment: A Novel Framework for Resume Screening [0.0] 本稿では,新しいLarge Language Models (LLM) ベースのエージェントフレームワークについて紹介する。
我々のフレームワークは、大規模なデータセットから各履歴を効率的に要約し、評価する能力において、異なる。
その結果,自動再試行フレームワークは従来の手作業よりも11倍高速であることがわかった。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 04:50:43 GMT)
Adaptive Data Quality Scoring Operations Framework using Drift-Aware Mechanism for Industrial Applications [0.0] 本稿では,産業データストリームの動的品質次元がもたらす課題に対処する新しい枠組みを提案する。
このフレームワークは動的変更検出機構を統合し、データ品質の変化を積極的に監視し、適応する。
実験結果は、予測性能と効率的な処理時間を示し、実用的な品質駆動型AIアプリケーションにおけるその有効性を強調した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 08:32:06 GMT)
AI-Powered Energy Algorithmic Trading: Integrating Hidden Markov Models with Neural Networks [0.0] 本研究では,HMM(Hidden Markov Models)とニューラルネットワークを組み合わせた新たなアプローチを提案する。
新型コロナウイルスの期間(2019-2022年)に、この二重モデルアプローチはシャープ比0.77で83%のリターンを達成した。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 21:52:52 GMT)
A mid-circuit erasure check on a dual-rail cavity qubit using the joint-photon number-splitting regime of circuit QED [0.0] 本研究では, 単一モードに静的に結合したアンシラのスペクトルを2つのモードで結合光子数に依存することを示す。
2つの超伝導キャビティに符号化されたデュアルレール量子ビットに対するハードウェア効率の良い消去チェックを実現する。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 13:52:32 GMT)
A POD-TANN approach for the multiscale modeling of materials and macroelement derivation in geomechanics [0.0] 本稿では,固有直交分解(POD)と熱力学に基づくニューラルネットワーク(TANN)を組み合わせた新しいアプローチを提案する。
この手法はPODを利用して、微視的状態情報からマクロな内部状態変数を抽出する。
このアプローチの有効性は、複雑さを増大させる応用を通じて検証される。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 19:08:56 GMT)
"You still have to study" -- On the Security of LLM generated code [0.0] 日常的な(教室)プログラミングタスクにおいても,AIアシスタントの利用が増加しているのを目撃する。
プログラマがいわゆる"prompt"に基づいて生成するコードは、常に認められたセキュリティ基準を満たしているとは限らない。
論文参考訳(メタデータ) (Tue, 13 Aug 2024 07:57:53 GMT)