Lumina-Next: Making Lumina-T2X Stronger and Faster with Next-DiT [120.4] 本稿では,Lumina-T2Xの改良版を提案する。
これらの改善により、Lumina-Nextは基本的なテキスト・ツー・イメージ生成の品質と効率を向上するだけでなく、優れた解像度の補間能力も示している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:53:26 GMT)
Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.1] 遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:42:27 GMT)
Instructing Prompt-to-Prompt Generation for Zero-Shot Learning [116.3] 伝達可能な知識発見のための指導的視覚的プロンプトを蒸留するためのtextbfPrompt-to-textbfPrompt 生成手法 (textbfP2P) を提案する。
P2Pのコアとなるのは、アクセシブル条件付き視覚特徴と、モーダル共有セマンティック概念に関するテキスト命令からセマンティック関連命令をマイニングすることである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:59:48 GMT)
PixelLM: Pixel Reasoning with Large Multimodal Model [110.5] PixelLMはピクセルレベルの推論と理解のための効率的かつ効率的なLMMである。
コードブックトークンの隠された埋め込みからマスクを生成し、詳細なターゲット関連情報をエンコードする。
PixelLMは、さまざまなピクセルレベルの画像推論と理解タスクを網羅し、複数のベンチマークで確立されたメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:22:29 GMT)
Learning to Edit: Aligning LLMs with Knowledge Editing [102.0] 本稿では,大規模言語モデルに新たな知識を入力問題に適用する学習 to LTE(Learning to Edit)フレームワークを提案する。
LTEには2段階のプロセスがある: (i) アライメントフェーズ(アライメントフェーズ)。
LTEの知識編集性能の優位性、バッチおよびシーケンシャルな編集の堅牢性、一般的なタスクに対する最小限の干渉、高速な編集速度を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:46:03 GMT)
Improving the Adversarial Robustness for Speaker Verification by Self-Supervised Learning [95.6] この研究は、特定の攻撃アルゴリズムを知らずにASVの敵防衛を行う最初の試みの一つである。
本研究の目的は,1) 対向摂動浄化と2) 対向摂動検出の2つの視点から対向防御を行うことである。
実験の結果, 検出モジュールは, 約80%の精度で対向検体を検出することにより, ASVを効果的に遮蔽することがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:36:34 GMT)
Enhancing Temporal Consistency in Video Editing by Reconstructing Videos with 3D Gaussian Splatting [94.8] Video-3DGSは、ゼロショットビデオエディタの時間的一貫性を高めるために設計された3Dガウススプラッティング(3DGS)ベースのビデオ精細機である。
本手法は動的モノクロビデオの編集に適した2段階の3次元ガウス最適化プロセスを利用する。
58の動的モノクロビデオ間の時間的一貫性を確保することで、ビデオ編集を強化する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:00:39 GMT)
A General Framework for Learning from Weak Supervision [93.9] 本稿では、新しいアルゴリズムを用いて、弱監督(GLWS)から学習するための一般的な枠組みを紹介する。
GLWSの中心は期待最大化(EM)の定式化であり、様々な弱い監督源を順応的に収容している。
また,EM計算要求を大幅に単純化する高度なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:03:55 GMT)
Outdated Issue Aware Decoding for Factual Knowledge Editing [93.5] 本稿では,従来のISsueを意識した復号化手法を提案する。
元のモデルと編集されたモデルとの確率分布の差を捉える。
我々は、古くなった問題を緩和するために、編集されたモデルにおけるトークン予測の違いを増幅する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:00:15 GMT)
Towards Efficient Exact Optimization of Language Model Alignment [93.4] 嗜好データから直接ポリシーを最適化するために、直接選好最適化(DPO)が提案された。
問題の最適解に基づいて導出されたDPOが,現実の最適解の妥協平均探索近似に繋がることを示す。
本稿では、アライメント目的の効率的な精度最適化(EXO)を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:15:12 GMT)
VideoPhy: Evaluating Physical Commonsense for Video Generation [93.3] 生成したビデオが現実世界のアクティビティの物理的常識に従うかどうかを評価するためのベンチマークであるVideoPhyを提示する。
具体的には、物理世界における様々な素材間の相互作用を含む688のキャプションのリストをキュレートする。
私たちは、オープンモデル(例: VideoCrafter2)やクローズドモデル(例: GoogleのLumiere、Pika)など、さまざまな最先端のテキスト・ビデオ生成モデルから、これらのキャプションに条件付けされたビデオを生成します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:53:55 GMT)
HarmonyDream: Task Harmonization Inside World Models [93.1] モデルベース強化学習(MBRL)は、サンプル効率の学習を約束する。
本稿では,タスク調和性を維持するために損失係数を自動的に調整する,シンプルで効果的なアプローチであるHarmonyDreamを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:21:40 GMT)
HelloFresh: LLM Evaluations on Streams of Real-World Human Editorial Actions across X Community Notes and Wikipedia edits [92.6] HelloFreshは、本質的に動機づけられた人間のラベルによって生成された実世界のデータの連続的なストリームに基づいている。
ウィキペディアページのX(元Twitter)コミュニティノートと編集の最近のイベントをカバーしている。
テストデータの汚染とベンチマークオーバーフィッティングのリスクを軽減します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:25:57 GMT)
Understanding the Impact of Negative Prompts: When and How Do They Take Effect? [92.5] 本稿では, 負のプロンプトがどのように作用するか, どのように作用するかを明らかにするための, 初めての総合的研究について述べる。
我々の経験的分析は、負のプロンプトの2つの主要な挙動を識別する。
負のプロンプトは、単純な適応アルゴリズムによって、背景に最小限の変更を加えて、オブジェクトの塗り絵をしやすくする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:42:46 GMT)
Unified Generation, Reconstruction, and Representation: Generalized Diffusion with Adaptive Latent Encoding-Decoding [90.8] 深層生成モデルは,3つのコア機能 – 新たなインスタンスの生成,入力の再構築,コンパクト表現の学習 – に固定されている。
一般化逆変換拡散確率モデル(EDDPM)を導入する。
EDDPMはパラメタライズされた符号化復号を導入することで標準拡散におけるガウス雑音化を一般化する。
テキスト、タンパク質、画像の実験は、多様なデータやタスクを扱う柔軟性を示している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:28:52 GMT)
Zero-shot High-fidelity and Pose-controllable Character Animation [89.7] イメージ・ツー・ビデオ(I2V)生成は、単一の画像からビデオシーケンスを作成することを目的としている。
既存のアプローチは、キャラクターの外観の不整合と細部保存の貧弱さに悩まされている。
文字アニメーションのための新しいゼロショットI2VフレームワークPoseAnimateを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:32:32 GMT)
Correctable Landmark Discovery via Large Models for Vision-Language Navigation [89.2] Vision-Language Navigation (VLN) は、ターゲット位置に到達するために、エージェントが言語命令に従う必要がある。
以前のVLNエージェントは、特に探索されていないシーンで正確なモダリティアライメントを行うことができない。
我々は,Large ModEls (CONSOLE) によるコレクタブルLaNdmark DiScOveryと呼ばれる新しいVLNパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:59:21 GMT)
Language Model Decoding as Direct Metrics Optimization [87.7] 現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:23:11 GMT)
ChatDev: Communicative Agents for Software Development [84.9] ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:23:49 GMT)
LCS: A Language Converter Strategy for Zero-Shot Neural Machine Translation [84.4] 我々は,Language Converter Strategy (LCS) という,シンプルだが効果的な戦略を提案する。
ターゲット言語をトップエンコーダ層に埋め込むことで、LCSはエンコーダの混乱を緩和し、デコーダの安定した言語表示を保証する。
MultiUN、TED、OPUS-100データセットの実験結果は、LCSがターゲット外の問題を著しく軽減できることを示している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:52:17 GMT)
Missci: Reconstructing Fallacies in Misrepresented Science [84.3] ソーシャルネットワーク上の健康関連の誤報は、意思決定の貧弱さと現実世界の危険につながる可能性がある。
ミスシは、誤った推論のための新しい議論理論モデルである。
大規模言語モデルの批判的推論能力をテストするためのデータセットとしてMissciを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:11:10 GMT)
The Unreasonable Effectiveness of Easy Training Data for Hard Tasks [84.3] 既存の事前学習言語モデルが比較的容易にハードなデータから一般化されることがしばしばあるという驚くべき結論を提示する。
本稿では,テキスト内学習,線形ヘッド,QLoRAなどの簡単な微調整手法を用いて,このような難解な一般化を実演する。
本研究は, LMの難解な一般化が, 研究課題に対して驚くほど強いことを結論づける。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:10:11 GMT)
Position: A Call to Action for a Human-Centered AutoML Paradigm [83.8] 自動機械学習(AutoML)は、機械学習(ML)を自動かつ効率的に構成する基本的目的を中心に形成された。
AutoMLの完全な可能性を解き放つ鍵は、現在探索されていないAutoMLシステムとのユーザインタラクションの側面に対処することにある、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:05:24 GMT)
Experiential Co-Learning of Software-Developing Agents [83.3] 大規模言語モデル(LLM)は、特にソフトウェア開発において、様々な領域に大きな変化をもたらした。
本稿では,新しいLLM学習フレームワークであるExperiential Co-Learningを紹介する。
実験では、このフレームワークにより、エージェントは、目に見えないソフトウェア開発タスクをより効果的に対処できることを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:39:20 GMT)
High-Dimensional Kernel Methods under Covariate Shift: Data-Dependent Implicit Regularization [83.1] 本稿では,共変量シフト下での高次元におけるカーネルリッジの回帰について検討する。
バイアス分散分解により、再重み付け戦略が分散を減少させることができることを理論的に証明する。
偏見について,任意の偏見の正則化を解析し,偏見が正則化の異なる尺度で非常に異なる振る舞いをすることができることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:03:27 GMT)
How Do Nonlinear Transformers Learn and Generalize in In-Context Learning? [82.5] トランスフォーマーベースの大規模言語モデルでは、トレーニング済みのモデルが微調整なしで新しいタスクを処理できるような、コンテキスト内学習機能が印象的だった。
我々は、TransformerがICLを実現する方法の仕組みが、Transformerにおけるトレーニング問題の技術的課題にどのように貢献するかを分析する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:04:56 GMT)
Solving Poisson Equations using Neural Walk-on-Spheres [80.2] 高次元ポアソン方程式の効率的な解法としてニューラルウォーク・オン・スフェース(NWoS)を提案する。
我々は,NWoSの精度,速度,計算コストにおける優位性を実証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:59:22 GMT)
The No Free Lunch Theorem, Kolmogorov Complexity, and the Role of Inductive Biases in Machine Learning [80.1] ニューラルネットワークモデルは、Kolmogorov複雑性を使って形式化された、同じ好みを共有している、と我々は主張する。
実験の結果、事前訓練された言語モデルでも、低複雑さのシーケンスを生成するのが好まれることがわかった。
これらの観察は、ますます小さな機械学習モデルで異なるように見える問題を統一する深層学習の傾向を正当化する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:36:13 GMT)
FollowBench: A Multi-level Fine-grained Constraints Following Benchmark for Large Language Models [79.6] FollowBenchは、大規模言語モデルのベンチマークに続くきめ細かい制約のベンチマークである。
本稿では,初期命令に段階的に1つの制約を付加するマルチレベル機構を提案する。
FollowBench上での13のLLMの評価により,LLMの弱さと今後の研究への道のりを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:39:26 GMT)
A-Bench: Are LMMs Masters at Evaluating AI-generated Images? [78.4] A-Benchは、マルチモーダルモデル(LMM)がAI生成画像(AIGI)を評価するマスターであるかどうかを診断するために設計されたベンチマークである。
最終的に、16のテキスト・ツー・イメージモデルの2,864のAIGIがサンプリングされ、それぞれが人間の専門家によって注釈付けされた質問回答と組み合わせられ、18のLMMでテストされる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:55:02 GMT)
Improved Techniques for Optimization-Based Jailbreaking on Large Language Models [78.3] Greedy Coordinate Gradient (GCG)攻撃の成功は、最適化ベースのジェイルブレイク技術の研究への関心が高まっている。
我々はGCGのような最適化ベースのジェイルブレイクにいくつかの改良(経験的)技術を提案する。
以上の結果から,GCGが最先端のジェイルブレイク攻撃より優れ,100%近い攻撃成功率を達成できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:35:49 GMT)
Follow-Your-Pose v2: Multiple-Condition Guided Character Image Animation for Stable Pose Control [77.1] Follow-Your-Pose v2は、インターネットで簡単に利用できるノイズの多いオープンソースビデオでトレーニングすることができる。
われわれの手法は、2つのデータセットと7つのメトリクスで35%以上のマージンで最先端の手法より優れています。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:03:18 GMT)
Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases [76.9] 拡散モデルと人間の嗜好のギャップを埋めることが、実用的生成への統合に不可欠である。
本稿では,拡散モデルの時間的帰納バイアスを利用したポリシー勾配アルゴリズムTDPO-Rを提案する。
実験の結果,報酬過小評価を緩和する手法が有効であることが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:36:47 GMT)
How do Transformers perform In-Context Autoregressive Learning? [76.2] 簡単な次のトークン予測タスクでTransformerモデルをトレーニングする。
トレーニングされたTransformerが、まず$W$ in-contextを学習し、次に予測マッピングを適用することで、次のトークンを予測する方法を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:44:00 GMT)
RAFT: Adapting Language Model to Domain Specific RAG [75.6] 本稿では、ドメイン内の「オープンブック」設定において、モデルが質問に答える能力を改善するためのトレーニングレシピであるRetrieval Augmented FineTuning(RAFT)を紹介する。
RAFTは、質問に答える助けとなる関連文書から、動詞の正しいシーケンスを引用することで、これを達成します。
RAFTは、PubMed、HotpotQA、Gorillaデータセット全体のモデルのパフォーマンスを一貫して改善する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:27:51 GMT)
Self-Consistency Training for Density-Functional-Theory Hamiltonian Prediction [74.8] ハミルトン予測は自己整合性理論を持ち,自己整合性トレーニングを提案する。
これにより、大量のラベルのないデータでモデルをトレーニングできるため、データの不足に対処できる。
一連のクエリに対してDFT計算を補正するため、教師付きトレーニングのためのラベルを生成するのにDFTを実行するより効率的である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:46:36 GMT)
Not All Attention is Needed: Parameter and Computation Efficient Transfer Learning for Multi-modal Large Language Models [73.5] MLLM(Multi-modal Large Language Models)のための新しいパラメータと計算効率のチューニング手法を提案する。
The Efficient Attention Skipping (EAS) method evaluate the attention redundancy and skips the less important MHAs to speed up inference。
実験により、EASは高い性能とパラメータ効率を維持するだけでなく、推論速度を大幅に高速化することが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:52:44 GMT)
Puzzle Pieces Picker: Deciphering Ancient Chinese Characters with Radical Reconstruction [73.3] Oracle Bone Inscriptionsは、世界で最も古い書式である。
多くのOracle Bone Inscriptions (OBI) は未解読のままであり、今日の古生物学におけるグローバルな課題の1つとなっている。
本稿では, 急進的再構成によってこれらの謎的文字を解読する新しい手法, Puzzle Pieces Picker (P$3$) を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:34:39 GMT)
Mitigating Label Noise on Graph via Topological Sample Selection [72.9] トポロジ情報を活用することで,グラフ内の情報的サンプル選択プロセスを促進できる$textitTopological Sample Selection$ (TSS)法を提案する。
提案手法は,対象のクリーン分布下での予測されるリスク上限の上限を最小化し,最先端のベースラインと比較して,提案手法の優位性を実験的に示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:04:12 GMT)
The Chosen One: Consistent Characters in Text-to-Image Diffusion Models [71.2] そこで本研究では,テキストプロンプトのみを入力として,一貫した文字生成を完全自動化する手法を提案する。
本手法は, 基本手法と比較して, 即時アライメントと同一性整合性のバランスが良くなる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:34:30 GMT)
Understanding the Limitations of Diffusion Concept Algebra Through Food [68.5] 潜伏拡散モデルは バイアスと概念の関係に 重要な洞察を与えます
食品分野は、複雑な組成と地域バイアスを通じて、ユニークな課題を提供する。
我々は、料理の多様性のニュアンスを捉え、表現するモデルの能力に関する測定可能な洞察を明らかにする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:57:02 GMT)
An LLM Compiler for Parallel Function Calling [68.0] 我々は,複数の関数呼び出しを効率的にオーケストレーションするために並列に関数を実行するLLMCompilerを紹介する。
ReActと比較して、一貫したレイテンシの高速化が3.7倍、コストの削減が6.7倍、精度が9%向上している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:53:10 GMT)
Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.6] 学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:30:57 GMT)
Exploring User Retrieval Integration towards Large Language Models for Cross-Domain Sequential Recommendation [66.7] Cross-Domain Sequential Recommendationは、異なるドメイン間でユーザのシーケンシャルな好みをマイニングし、転送することを目的としている。
本稿では,ユーザ検索手法を探索し,CDSRの性能向上を目的とした URLLM という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:19:54 GMT)
Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity [66.7] ゼロ階最適化(ZO)は、微調整された大規模言語モデルのためのメモリ効率の高い戦略である。
本研究では,ZO を用いた LLM パラメータの極小サブセットの微調整の実現可能性について検討した。
この結果から,ZO を用いた LLM の微調整パラメータ 0.1% は,ZO の微調整性能より優れることが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:07:35 GMT)
An open dataset for oracle bone script recognition and decipherment [66.4] Oracle Bone Script (OBS) は、3000年前にさかのぼる上海王朝の人文と地理に関する貴重な洞察を持っている。
時間の経過はそれらの意味の多くを曖昧にしており、これらの古代のテキストを解読する上で重要な課題が提示されている。
人工知能(AI)の出現により、OBSの解釈を支援するAIが実現可能な選択肢となった。
このデータセットは1,588個の解読されたスクリプトの77,064個の画像と9,411個の未解読文字の62,989個の画像を含んでいる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:23:00 GMT)
Improving Sample Efficiency of Model-Free Algorithms for Zero-Sum Markov Games [66.2] モデルフリーのステージベースQ-ラーニングアルゴリズムはモデルベースアルゴリズムと同じ$H$依存の最適性を享受できることを示す。
本アルゴリズムは,楽観的値関数と悲観的値関数のペアとして参照値関数を更新するキーとなる新しい設計を特徴とする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:24:33 GMT)
How Transformers Learn Diverse Attention Correlations in Masked Vision Pretraining [66.1] 本研究では,マスク付き再建前訓練における一層変圧器の学習に関する,最初のエンドツーエンドの理論的保証を提供する。
概念的側面から,マスク付き視覚前訓練目標を用いた変圧器の局所的・多彩な注意パターンの生成機構を考察する。
技術面では、ソフトマックス・アテンションモデルにおけるトレーニングダイナミクスのエンドツーエンド特性は、入力と位置の埋め込みを同時に考慮する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:22:56 GMT)
Forward-Backward Reasoning in Large Language Models for Mathematical Verification [65.9] 自己整合性(Self-Consistency)は、さまざまな推論チェーンの回答をサンプリングし、多数決によって最終回答を選択する。
候補解の検証に後方推論を導入する。
検証のための FOrward と BAckward Reasoning は最先端の性能を達成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:37:35 GMT)
Prioritizing Safeguarding Over Autonomy: Risks of LLM Agents for Science [65.8] 大規模言語モデル(LLM)を利用したインテリジェントエージェントは、自律的な実験を行い、様々な分野にわたる科学的発見を促進する上で、大きな可能性を証明している。
彼らの能力は有望だが、これらのエージェントは安全性を慎重に考慮する必要がある新たな脆弱性も導入している。
本稿では,科学領域におけるLSMをベースとしたエージェントの脆弱性の徹底的な調査を行い,その誤用に伴う潜在的なリスクに光を当て,安全性対策の必要性を強調した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:13:09 GMT)
Prioritizing Safeguarding Over Autonomy: Risks of LLM Agents for Science [65.8] 大規模言語モデル(LLM)を利用したインテリジェントエージェントは、自律的な実験を行い、様々な分野にわたる科学的発見を促進する上で、大きな可能性を証明している。
彼らの能力は有望だが、これらのエージェントは安全性を慎重に考慮する必要がある新たな脆弱性も導入している。
本稿では,科学領域におけるLSMをベースとしたエージェントの脆弱性の徹底的な調査を行い,その誤用に伴う潜在的なリスクに光を当て,安全性対策の必要性を強調した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:13:09 GMT)
Measuring Retrieval Complexity in Question Answering Systems [64.7] 検索複雑性(Retrieval complexity, RC)は、検索された文書の完全性に基づく新しい計量である。
任意の検索システムを用いてRCを計測するための教師なしパイプラインを提案する。
本システムは検索システムに大きな影響を与える可能性がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:30:52 GMT)
Levels of AGI for Operationalizing Progress on the Path to AGI [64.6] 本稿では,人工知能(AGI)モデルとその前駆体の性能と動作を分類する枠組みを提案する。
このフレームワークは、AGIのパフォーマンス、一般性、自律性のレベルを導入し、モデルを比較し、リスクを評価し、AGIへの道筋に沿って進捗を測定する共通の言語を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:08:35 GMT)
AD-H: Autonomous Driving with Hierarchical Agents [64.5] 我々は,ハイレベル命令と低レベル制御信号を中間言語駆動の命令に接続することを提案する。
我々は、AD-Hという階層型マルチエージェント駆動システムを用いて、このアイデアを実装した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:25:46 GMT)
Silent Guardian: Protecting Text from Malicious Exploitation by Large Language Models [63.9] 大規模言語モデル(LLM)に対するテキスト保護機構であるSilent Guardianを紹介する。
保護されるテキストを慎重に修正することで、TPEはLDMを誘導して最初にエンドトークンをサンプリングし、直接相互作用を終了させることができる。
本研究では,SGがターゲットテキストを種々の構成で効果的に保護し,保護成功率の約100%を達成できることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:53:12 GMT)
Are language models rational? The case of coherence norms and belief revision [63.8] 我々は、論理的コヒーレンス規範と、言語モデルにおける信念の強さに結びついたコヒーレンス規範を考察する。
コヒーレンスに結びついた有理ノルムはいくつかの言語モデルに適用できるが、他のモデルには適用されない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:36:21 GMT)
LW-DETR: A Transformer Replacement to YOLO for Real-Time Detection [63.8] リアルタイム物体検出においてYOLOよりも優れた軽量検出変換器LW-DETRを提案する。
アーキテクチャは、ViTエンコーダ、プロジェクタ、浅いDETRデコーダの単純なスタックである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:07:24 GMT)
Wings: Learning Multimodal LLMs without Text-only Forgetting [63.6] Wingsは、テキストのみの対話とマルチモーダル理解の両方に優れる新しいMLLMである。
実験の結果、Wingsはテキストのみの問合せタスクと視覚的問合せタスクの両方において、MLLMのスケールが等しく優れていることが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:59:40 GMT)
Zero-Shot Image Segmentation via Recursive Normalized Cut on Diffusion Features [62.6] ファンデーションモデルは、言語、ビジョン、マルチモーダルタスクなど、さまざまな領域にまたがる強力なツールとして登場した。
本稿では,拡散UNetエンコーダを基礎ビジョンエンコーダとして使用し,教師なしゼロショットセグメンテーション手法であるDiffCutを紹介する。
我々の研究は、拡散UNetエンコーダに埋め込まれた極めて正確なセマンティック知識を強調し、下流タスクの基盤ビジョンエンコーダとして機能する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:32:31 GMT)
Decision-focused Graph Neural Networks for Combinatorial Optimization [62.3] 最適化問題に取り組むための新たな戦略は、従来のアルゴリズムに代わるグラフニューラルネットワーク(GNN)の採用である。
GNNや従来のアルゴリズムソルバがCOの領域で人気が高まっているにもかかわらず、それらの統合利用とエンドツーエンドフレームワークにおけるそれらの相関について限定的な研究がなされている。
我々は、GNNを利用してCO問題に補助的なサポートで対処する決定に焦点を当てたフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:52:27 GMT)
Political Compass or Spinning Arrow? Towards More Meaningful Evaluations for Values and Opinions in Large Language Models [61.5] 我々は,大規模言語モデルにおける価値と意見の制約評価パラダイムに挑戦する。
強制されない場合、モデルが実質的に異なる答えを与えることを示す。
我々はこれらの知見をLLMの価値と意見を評価するための推奨とオープンな課題に抽出する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:17:53 GMT)
Gated Linear Attention Transformers with Hardware-Efficient Training [60.7] 本研究は、並列化性に対してメモリ移動をオフにする線形注意のためのハードウェア効率のアルゴリズムについて述べる。
次に、このアルゴリズムを、データ依存ゲートを用いたより表現力豊かな線形アテンションに一般化する。
変圧器の標準アテンション層に代えて使用すると、結果として生じるゲート状リニアアテンショントランスが競合的に動作することが分かる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:47:27 GMT)
MR-GSM8K: A Meta-Reasoning Benchmark for Large Language Model Evaluation [60.7] 大規模言語モデル(LLM)のための新しい評価パラダイムを導入する。
このパラダイムは、しばしば推論プロセスを無視する結果指向の評価から、より包括的な評価へと重点を移す。
GSM8Kデータセットにこのパラダイムを適用し,MR-GSM8Kベンチマークを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:05:42 GMT)
Dynamic 3D Gaussian Fields for Urban Areas [60.6] 大規模でダイナミックな都市部における新規ビュー合成(NVS)のための効率的なニューラル3Dシーン表現法を提案する。
本研究では,大規模都市にスケールするニューラルネットワークシーン表現である4DGFを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:07:39 GMT)
Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.8] 本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:41:25 GMT)
S-LoRA: Serving Thousands of Concurrent LoRA Adapters [59.5] パラメータ効率のよい微調整法であるLoRA(Lo-Rank Adaptation)は、ベースモデルを複数のタスクに適応させるためによく用いられる。
本稿では,多数のLoRAアダプタのスケーラブルな提供を目的としたシステムであるS-LoRAを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:06:43 GMT)
CODIS: Benchmarking Context-Dependent Visual Comprehension for Multimodal Large Language Models [59.0] 我々は、自由形式のテキストで提供されるコンテキストを用いて視覚的理解を高めるモデルの有効性を評価するために、CODISと名付けられた新しいベンチマークを導入する。
以上の結果から,MLLMは必ずしも人体性能に劣っていることが示唆された。
このことは、MLLMが視覚を文脈依存的に理解する能力を高めることの必要性を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:14:06 GMT)
Text-like Encoding of Collaborative Information in Large Language Models for Recommendation [58.9] BinLLMはLarge Language Models for Recommendation (LLMRec)とシームレスに連携する新しい手法である。
BinLLMは、外部モデルからの協調的な埋め込みをバイナリシーケンスに変換する。
BinLLMは、ドット決定記法を用いてバイナリシーケンスを圧縮するオプションを提供し、過度に長い長さを避ける。
論文参考訳(メタデータ) (Wed, 05 Jun 2024 12:45:25 GMT)
Node-wise Filtering in Graph Neural Networks: A Mixture of Experts Approach [58.9] グラフニューラルネットワーク(GNN)は、多様なグラフ構造パターンをまたいだノード分類タスクに非常に効果的であることが証明されている。
伝統的に、GNNは均一なグローバルフィルタ(通常、ホモフィルグラフのローパスフィルタとヘテロフィルグラフのハイパスフィルタ)を用いる。
我々は,異なるノードに対する適切なフィルタを適応的に選択するために,専門家の混在を利用した新しいGNNフレームワークNode-MoEを紹介する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:12:38 GMT)
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.7] 本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:05:52 GMT)
DREW : Towards Robust Data Provenance by Leveraging Error-Controlled Watermarking [58.4] 誤り訂正符号と透かしを用いたデータ検索法(DREW)を提案する。
DREWはランダムに参照データセットをクラスタ化し、各クラスタに独自のエラー制御された透かしキーを注入する。
関連するクラスタを特定した後、最も正確な一致を見つけるために、クラスタ内に埋め込みベクトル類似性検索を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:19:44 GMT)
The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse [58.0] 単一の編集でさえモデル崩壊を引き起こし、様々なベンチマークタスクで大幅なパフォーマンス低下を示す。
編集後の大規模言語モデルのベンチマークは、過激な時間とリソース集約である。
我々は、GPT-3.5を用いて、ハードケースに基づいた新しいデータセット、HardEditを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:43:00 GMT)
FusionBench: A Comprehensive Benchmark of Deep Model Fusion [58.0] ディープモデル融合(Deep Model fusion)とは、複数のディープニューラルネットワークの予測やパラメータを単一のモデルに統合する手法である。
FusionBenchは、ディープモデル融合に特化した最初の包括的なベンチマークである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:54:28 GMT)
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models [57.8] 機械翻訳(MT)の品質を評価するために,大規模言語モデル(LLM)を用いることで,システムレベルでの最先端のパフォーマンスを実現する。
我々はtextbftexttError Analysis Prompting (EAPrompt) と呼ばれる新しいプロンプト手法を提案する。
本手法は,多次元品質指標 (MQM) とtextitproduces を用いて,システムレベルとセグメントレベルの両方で説明可能かつ信頼性の高いMT評価を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:40:54 GMT)
Soft Self-Consistency Improves Language Model Agents [57.7] 現在の「サンプルとセレクト」メソッドは、回答を得るために多数決に頼っている。
SOFT-SC(Soft Self-Consistency)は、SCの不連続スコアをモデル確率から計算した連続スコアに置き換える。
一定の数のサンプルに対して、SOFT-SCはSCを1.3%上回り、bashプログラムの絶対的な成功率、オンラインショッピングの6.6%増、インタラクティブホームゲームでは4.7%増となる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:50:19 GMT)
Text Injection for Neural Contextual Biasing [57.6] 本研究では文脈テキストインジェクション(CTI)を提案する。
1000億のテキストを持つCTIは、強い神経バイアスモデルから43.3%の相対的なWER削減を達成することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:20:17 GMT)
PyramidInfer: Pyramid KV Cache Compression for High-throughput LLM Inference [57.5] 大規模言語モデル(LLM)は、目覚ましい理解能力を示しているが、推論中のGPUメモリ使用の課題に直面している。
本稿では,KVキャッシュを重要なコンテキストを階層的に保持することで圧縮するPraamidInferを提案する。
PyramidInferは、KVキャッシュで54%以上のGPUメモリを削減したAccelerateと比較して、2.2倍のスループットを改善している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:01:24 GMT)
Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.1] 本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。
高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。
我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:05:55 GMT)
GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.6] 我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:51:22 GMT)
Distribution-Aware Data Expansion with Diffusion Models [56.0] 本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:15:24 GMT)
Mitigating Biases for Instruction-following Language Models via Bias Neurons Elimination [54.9] 本稿では,命令追従設定における言語モデルのバイアスニューロンを除去するための,新しい実用的なバイアス緩和手法であるCRISPRを提案する。
CRISPRは自動的にバイアス出力を決定し、バイアス出力に影響を与えるニューロンを説明可能性法を用いてバイアスニューロンに分類する。
実験により,モデルのタスク性能と既存知識を損なうことなく,ゼロショット命令追従条件下でのバイアス軽減効果が示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:49:19 GMT)
Graph Structure and Feature Extrapolation for Out-of-Distribution Generalization [54.6] アウト・オブ・ディストリビューション(OOD)の一般化は、テスト分布がトレーニング分布からシフトする一般的な学習シナリオを扱う。
我々は,非ユークリッド空間線型補間の新しい設計により,グラフOOD一般化を実現することを提案する。
我々の設計は、根底にある因果機構を損なうことなく、OODサンプルを特定のシフトのために調整する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:41:31 GMT)
SSR-2D: Semantic 3D Scene Reconstruction from 2D Images [54.5] 本研究では,3Dアノテーションを使わずにセマンティックなシーン再構成を行う中心的な3Dシーンモデリングタスクについて検討する。
提案手法の鍵となる考え方は,不完全な3次元再構成と対応するRGB-D画像の両方を用いたトレーニング可能なモデルの設計である。
本研究では,2つの大規模ベンチマークデータセットであるMatterPort3DとScanNetに対して,セマンティックシーン補完の最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:02:12 GMT)
Event3DGS: Event-based 3D Gaussian Splatting for Fast Egomotion [54.2] Event3DGSは、生のイベントストリームからのみガウススプラッティングを学ぶ最初の方法である。
高速なエゴモーションの下でイベントストリームのみから高忠実度3D構造を再構築することができる。
複数のデータセットの実験は、既存のアプローチと比較してEvent3DGSのレンダリング品質が優れていることを検証している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:06:03 GMT)
FragRel: Exploiting Fragment-level Relations in the External Memory of Large Language Models [54.1] 断片接続型階層型メモリベース大規模言語モデル(LLM)を提案する。
外部メモリにおけるフラグメントレベルの関係を定式化し、異なるテキストタイプに対していくつかのインスタンスを提示する。
長いストーリー理解、リポジトリレベルのコード生成、長期チャットにこれらの関係を組み込むことの利点を検証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:31:37 GMT)
Adapter-X: A Novel General Parameter-Efficient Fine-Tuning Framework for Vision [52.8] 本稿では,2次元画像と3次元点雲の微調整を改善するためのAdapter-Xという新しいフレームワークを提案する。
2D画像と3Dポイントの雲のモードで完全な微調整をし、パラメータが大幅に少ない、すなわち2Dと3Dの分類タスクにおいて、オリジナルのトレーニング可能なパラメータのわずか0.20%と1.88%で、初めて性能を上回った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:26:44 GMT)
Private Online Learning via Lazy Algorithms [52.8] 我々は,オンライン学習の問題,特に専門家によるオンライン予測(OPE)とオンライン凸最適化(OCO)について検討する。
遅延オンライン学習アルゴリズムをプライベートアルゴリズムに変換する新しい変換を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:43:05 GMT)
DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.7] 本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:18:03 GMT)
Text-to-Image Rectified Flow as Plug-and-Play Priors [52.6] 整流流は、ソースからターゲット分布への線形進行を強制する新しい生成モデルのクラスである。
補正フローアプローチが生成品質と効率を上回り,推論ステップを少なくすることを示した。
また,画像のインバージョンや編集における競合性能も示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:02:31 GMT)
Reinforcement Learning for Node Selection in Branch-and-Bound [52.3] 現在の最先端セレクタは手作りのアンサンブルを使用して、ナイーブなサブノードセレクタと、個々のノードデータに依存する学習ノードセレクタを自動的に切り替える。
孤立ノードではなく木の状態全体を考慮しながら強化学習(RL)を用いる新しいシミュレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:36:39 GMT)
ADer: A Comprehensive Benchmark for Multi-class Visual Anomaly Detection [52.2] 本稿では,新しい異常検出手法のモジュラーフレームワークであるtextbftextitADerを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:40:07 GMT)
TACT: Advancing Complex Aggregative Reasoning with Information Extraction Tools [51.6] 大規模言語モデル(LLM)は、テキスト間の情報の集約を必要とするクエリではよく機能しないことが多い。
この設定をよりよく評価し、モデリング作業を容易にするために、テーブルを通してのテキストと計算について紹介する。
TACTには、1つ以上のテキストに散在する縫合情報を要求し、この情報を複雑な統合して回答を生成する、困難な命令が含まれている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:32:56 GMT)
EMOE: Expansive Matching of Experts for Robust Uncertainty Based Rejection [51.2] Expansive Matching of Experts (EMOE) は, アウト・オブ・ディストリビューションポイントによる予測と不確実性に基づく拒絶を改善するために, サポート拡張, 補間的擬似ラベルを用いた新しい手法である。
本稿では,潜在空間におけるOODインスタンスを生成する拡張データ拡張手法と,擬似ラベル処理のための拡張拡張点をフィルタリングするための実証実験に基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:22:38 GMT)
Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms [50.8] 人間フィードバックからの強化学習(RLHF)は,近年の大規模言語モデル(LLM)の成功に不可欠である。
この研究は、DAAに対する過度な最適化やハッキングの問題を定式化し、定式化する。
DAA法は, 幅広いKL予算にまたがるだけでなく, データセットの1つのエポックが完成する前にも劣化することがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:41:37 GMT)
How Truncating Weights Improves Reasoning in Language Models [49.8] 特定のグローバルな関連が、特定の重み成分やトランスフォーマーブロックにどのように格納されるかを検討する。
実験的にも理論的にも、トレーニング中にどのように起こるのかを分析します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:51:08 GMT)
Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.6] 本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:19:09 GMT)
Context versus Prior Knowledge in Language Models [49.2] 言語モデルは、事前学習中に学んだ事前知識と、文脈で提示された新しい情報を統合する必要があることが多い。
本稿では,モデルがコンテキストと先行するエンティティへの依存性を測定するための2つの相互情報ベースメトリクスを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:42:38 GMT)
Future Directions in the Theory of Graph Machine Learning [49.0] グラフ上の機械学習、特にグラフニューラルネットワーク(GNN)を使用すると、グラフデータが広く利用できるため、関心が高まっている。
実際の成功にもかかわらず、GNNの特性に関する理論的理解は非常に不完全である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:55:43 GMT)
Challenges and Considerations in the Evaluation of Bayesian Causal Discovery [49.0] 因果発見の不確実性を表現することは、実験設計において重要な要素であり、より広く、安全で信頼性の高い因果決定のために重要である。
単一の推定因果グラフとモデルパラメータによる評価に依存する非ベイズ因果発見とは異なり、因果発見はその量の性質に起因する課題を提示する。
評価に最も適した指標についてのコンセンサスはない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:45:23 GMT)
StreamSpeech: Simultaneous Speech-to-Speech Translation with Multi-task Learning [48.8] StreamSpeechは、翻訳と同時ポリシーを共同で学習するSimul-S2STモデルである。
CVSSベンチマークの実験では、StreamSpeechはオフラインS2STタスクとSimul-S2STタスクの両方で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:24:22 GMT)
HASS: Hardware-Aware Sparsity Search for Dataflow DNN Accelerator [47.7] 本稿では,ソフトウェアとハードウェアの共同最適化を用いて,非構造的ウェイトとデータフローアクセラレーターの疎結合性を利用した新しい手法を提案する。
我々は既存のスパース設計と比較して1.3$times$から4.2$times$までの効率改善を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:25:18 GMT)
PLaD: Preference-based Large Language Model Distillation with Pseudo-Preference Pairs [47.4] 大きな言語モデル(LLM)は、様々なタスクにおいて印象的な機能を示しているが、その膨大なパラメータサイズは、リソース制約のある設定での適用性を制限している。
知識蒸留(KD)は、大規模な教師モデルからコンパクトな学生モデルに専門知識を移すことによって、実行可能なソリューションを提供する。
PLaD は新規な嗜好に基づく LLM 蒸留フレームワークである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:08:25 GMT)
Assessing the Emergent Symbolic Reasoning Abilities of Llama Large Language Models [47.1] 大規模言語モデル(LLM)は、幅広いタスクにおいて印象的なパフォーマンスを達成する。
LLMは数学的推論ベンチマークにおいて創発的な能力を示す。
我々は,Llama 2ファミリーの3つのモデルについて,異なるシンボリック推論タスクで評価した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:22:43 GMT)
Polarization Wavefront Lidar: Learning Large Scene Reconstruction from Polarized Wavefronts [46.8] 我々は、放射光と受信光の偏光を変調する新しい長距離偏光波面センサ(PolLidar)を導入する。
我々は、新しい学習的再構成手法を用いて、屋外シナリオにおける正常、距離、材料特性を推定するために偏波波面を利用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:09:51 GMT)
FactPICO: Factuality Evaluation for Plain Language Summarization of Medical Evidence [46.7] 本稿では,医療用テキストのプレーン言語要約のためのファクトPICOを提案する。
3つのランダム化制御試験(RCT)から生成される抽象語の345のプレーン言語要約で構成されている。
本研究は,これらのサマリーにおけるRCTの重要要素の事実と,それらに関する報告された知見について評価する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:27:00 GMT)
Rewards-in-Context: Multi-objective Alignment of Foundation Models with Dynamic Preference Adjustment [46.4] リワード・イン・コンテキスト(Rewards-in-Context, RiC)を導入する。
RiCは単一のファンデーションモデルの教師付き微調整のみを必要とし、推論時間中にユーザの好みを動的に調整する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:25:41 GMT)
SYN2REAL: Leveraging Task Arithmetic for Mitigating Synthetic-Real Discrepancies in ASR Domain Adaptation [46.1] 本稿では,自動音声認識(ASR)における領域適応のための新しい「SYN2REAL」タスクベクトルを提案する。
この問題に対処するために、実音声と合成音声で微調整されたモデル間のパラメータ差を減じて「SYN2REAL」ベクトルを作成することを提案する。
SLURPデータセットを用いた実験により, 対象ドメインに対する単語誤り率の平均は11.15%向上した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:25:56 GMT)
Path-Specific Causal Reasoning for Fairness-aware Cognitive Diagnosis [45.9] 我々は,学生の感性的属性を排除するために,新しいパス特化因果推論フレームワーク(PSCRF)を設計する。
実世界のデータセット(例えば、PISAデータセット)に対する大規模な実験は、提案したPSCRFの有効性を実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:47:30 GMT)
Fairness in Serving Large Language Models [45.8] 本稿では,処理された入出力トークンの数を考慮したコスト関数に基づくサービスフェアネスの定義を提案する。
本稿では,新たなスケジューリングアルゴリズムであるVirtual Counter Token (VTC)を提案する。
サービススケジューラの2倍の厳しい上限を証明し、作業保守の要件に準拠します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:43:16 GMT)
DeepLag: Discovering Deep Lagrangian Dynamics for Intuitive Fluid Prediction [45.8] 本稿では, タングルサム流体力学に対処する新しいラグランジアン・ユーレリア複合パラダイムを提案する。
ユーレアン観測に基づいて未来を予測するのではなく、流体中に隠れたラグランジアン力学を発見するためにDeepLagを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:34:33 GMT)
Riemannian Preconditioned LoRA for Fine-Tuning Foundation Models [45.7] Low-Rank Adaptation (LoRA) は、パラメータ効率のよい微細チューニング(PEFT)法として人気がある。
本研究では,各勾配ステップに$r倍r$プレコンディショナーを導入することにより,LoRAトレーニングの強化について検討する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:36:45 GMT)
Convex Relaxations of ReLU Neural Networks Approximate Global Optima in Polynomial Time [45.7] 本稿では,2層ReLULUネットワーク間における重み減衰と凸緩和の最適性ギャップについて検討する。
私たちの研究は、なぜローカルメソッドがうまく機能するのかを理解することに新たな光を当てています。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:38:58 GMT)
An Information Theoretic Approach to Machine Unlearning [45.6] 学びの鍵となる課題は、モデルのパフォーマンスを保ちながら、必要なデータをタイムリーに忘れることである。
この研究では、ゼロショットのアンラーニングシナリオに対処し、未学習のアルゴリズムは、トレーニングされたモデルと忘れられるデータだけが与えられたデータを削除できなければならない。
モデルの幾何に基づいて、単純だが原則化されたゼロショットアンラーニング法を導出する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:04:20 GMT)
Improving In-Context Learning with Prediction Feedback for Sentiment Analysis [45.5] 大規模言語モデル(LLM)は、文脈内学習(ICL)パラダイムを通じて感情分析において有望な結果を得た。
人間のフィードバックによる理解の調整能力にインスパイアされた本論文は,事前の予測とフィードバックを取り入れたICLを強化する。
9つの感情分析データセットによる実験結果から,従来のICL法よりもフレームワークが優れていることが示され,平均F1改善率は5.95%となった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:04:08 GMT)
Blinded by Generated Contexts: How Language Models Merge Generated and Retrieved Contexts When Knowledge Conflicts? [45.2] 応答が生成されたコンテキストと検索されたコンテキストに関連付けられているかどうかを識別する。
実験では、誤った情報を提供する場合でも、生成されたコンテキストを優先する複数のLSMにおいて、重大なバイアスが示される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:33:16 GMT)
Computational Approaches for Integrating out Subjectivity in Cognate Synonym Selection [45.1] 言語系統学の初期において、一つの同義語のみを選択することが推奨された。
バイナリ文字行列は、すべての同義語を含むデータセット全体を表現することができることを示す。
また、CLDFフォーマットで提供されるコグネートデータに対して、上記のすべてのキャラクタマトリックスタイプを生成するためのPythonインターフェースも提供しています。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:56:26 GMT)
Double-I Watermark: Protecting Model Copyright for LLM Fine-tuning [45.1] 提案手法は、微調整中に特定の透かし情報をカスタマイズされたモデルに効果的に注入する。
提案手法を各種微調整法で評価し, その無害性, 頑健性, 独特性, 不受容性, 妥当性を定量的および定性的な分析により検証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:30:02 GMT)
Phy-Diff: Physics-guided Hourglass Diffusion Model for Diffusion MRI Synthesis [45.1] 本稿では,高画質のdMRIを生成する物理誘導拡散モデルを提案する。
本モデルは拡散過程におけるノイズ進化におけるdMRIの物理原理を紹介する。
実験の結果,本手法は他の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:09:19 GMT)
Reconciling Heterogeneous Effects in Causal Inference [45.0] 本稿では、機械学習におけるモデル乗法にReconcileアルゴリズムを適用し、因果推論における異種効果を再現する。
本研究の結果は,医療,保険,住宅などの高額な事業において,公正な成果の確保に有意な意味を持っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:43:46 GMT)
Parallel Quantum Computing Simulations via Quantum Accelerator Platform Virtualization [45.0] 本稿では,量子回路実行の並列化モデルを提案する。
このモデルはバックエンドに依存しない機能を利用することができ、任意のターゲットバックエンド上で並列量子回路の実行を可能にする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:16:07 GMT)
Dissipative preparation of a Floquet topological insulator in an optical lattice via bath engineering [45.0] フロケット工学は、光学格子中の電荷ニュートラル原子を実現するための重要なツールである。
駆動散逸系はトポロジカル絶縁体に近似することを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:35:08 GMT)
Open Grounded Planning: Challenges and Benchmark Construction [44.9] 我々は,新たな計画課題--オープン・グランド・プランニングを提案する。
オープングランドプランニングの主な目的は、可変アクションセットに基づいて実行可能なプランを生成するようモデルに求めることである。
そして、現在最先端のLLMを5つの計画手法とともにテストし、既存のLLMとメソッドが、オープンドメインの基盤となる計画によってもたらされる課題を解決するのに依然として苦労していることを明らかにした。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:46:52 GMT)
MMLU-Pro: A More Robust and Challenging Multi-Task Language Understanding Benchmark [44.8] 本稿では、主に知識駆動型MMLUベンチマークを拡張するために設計された拡張データセットであるMMLU-Proを紹介する。
24種類のプロンプトを試験した結果,MMLUの4-5%からMMLU-Proの2%に低下した。
MMLU-Proは、この分野の進歩をよりよく追跡するための、より差別的なベンチマークであることを確認した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:03:36 GMT)
Quantifying Task Priority for Multi-Task Optimization [44.6] マルチタスク学習の目標は、単一の統合ネットワーク内で多様なタスクを学習することである。
マルチタスク学習のための接続強度に基づく最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:52:29 GMT)
Floating Anchor Diffusion Model for Multi-motif Scaffolding [44.6] 先行研究は、塗装や条件付き生成によってこの問題にアプローチする。
フローティングアンカー拡散(FADiff)モデルを提案する。
FADiffは、モチーフの存在を保証する拡散の過程において、厳格かつ独立してモチーフが浮かぶことを可能にする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:54:18 GMT)
EgoExoLearn: A Dataset for Bridging Asynchronous Ego- and Exo-centric View of Procedural Activities in Real World [44.3] EgoExoLearnは、以下のプロセスで人間の実演をエミュレートするデータセットである。
EgoExoLearnには120時間にわたるエゴセントリックでデモ的なビデオデータが含まれている。
クロスビューアソシエーション、クロスビューアクションプランニング、クロスビュー参照スキルアセスメントなどのベンチマークを提示する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:44:52 GMT)
U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [44.2] Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:13:03 GMT)
Fourier Controller Networks for Real-Time Decision-Making in Embodied Learning [42.9] Transformerは、時間変化のある特徴をモデル化するための強化学習を約束している。
データ効率の低下と推論遅延の低さに悩まされている。
本稿では,周波数領域の新しい視点から課題を考察する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:03:03 GMT)
CoopHash: Cooperative Learning of Multipurpose Descriptor and Contrastive Pair Generator via Variational MCMC Teaching for Supervised Image Hashing [42.7] GAN(Generative Adversarial Networks)のような生成モデルは、画像ハッシュモデルで合成データを生成することができる。
GANは訓練が難しいため、ハッシュアプローチが生成モデルとハッシュ関数を共同で訓練するのを防ぐことができる。
本稿では,エネルギーをベースとした協調学習に基づく新しい協調ハッシュネットワークを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:33:23 GMT)
RetrievalQA: Assessing Adaptive Retrieval-Augmented Generation for Short-form Open-Domain Question Answering [42.7] アダプティブ検索拡張生成(ARAG)は、不特定に検索するのではなく、クエリに対する検索の必要性を動的に決定することを目的としている。
この研究は、新しい世界とロングテール知識をカバーする1,271の短い形式の質問を含む、RetrievalQAというベンチマークを提示する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:23:21 GMT)
Interactive Image Selection and Training for Brain Tumor Segmentation Network [42.6] 画像マーカー(FLIM)からの特徴学習に基づく画像選択と訓練のための対話的手法を用いる。
その結果,本手法では,U字型ネットワークのエンコーダを訓練するための少数の画像を選択することができ,手動選択に匹敵する性能を得ることができ,また,バックプロパゲーションとトレーニング画像のトレーニングを施した同一のU字型ネットワークを超越することさえできた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:03:06 GMT)
SelfReDepth: Self-Supervised Real-Time Depth Restoration for Consumer-Grade Sensors [42.5] SelfReDepthは、深度復元のための自己教師型ディープラーニング技術である。
複数のシーケンシャルな深度フレームとカラーデータを使用して、時間的コヒーレンスで高品質な深度ビデオを実現する。
我々の結果は、実世界のデータセット上での我々のアプローチのリアルタイムパフォーマンスを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:38:02 GMT)
Robust CLIP: Unsupervised Adversarial Fine-Tuning of Vision Embeddings for Robust Large Vision-Language Models [42.4] 頑健なCLIPビジョンエンコーダを実現するために,教師なし逆向き微調整方式を提案する。
悪質な第三者によるLVLMのユーザに対する盗聴攻撃は、CLIPモデルを堅牢なものに置き換えれば、もはや不可能であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:32:03 GMT)
Quantum Sensing from Gravity as Universal Dephasing Channel for Qubits [42.0] 重力赤方偏移とアハロノフ・ボーム相の一般的な現象を明らかにする。
絡み合った量子状態は普遍的な速度で脱相することを示す。
精密重力計と機械ひずみ計のための量子センサとして,量子ビットプラットフォームを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:36:06 GMT)
Optimizing Language Models for Human Preferences is a Causal Inference Problem [41.6] 直接結果データセットからの人間の嗜好に対する言語モデル最適化について検討する。
まず,言語モデルの最適化を因果問題と見なして,モデルがテキストと結果の関係を正しく学習することを保証する。
我々はCPOを2倍の頑健なCPOで拡張し、従属目的の分散を低減し、バイアスに対する確実な強い保証を維持します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:19:19 GMT)
Boosting Reinforcement Learning with Strongly Delayed Feedback Through Auxiliary Short Delays [41.5] 強化学習(Reinforcement Learning, RL)は、事象と知覚知覚の間の遅延の一般的な場合において困難である。
本稿では、短時間の遅延を含む補助的なタスクを活用して、長時間の遅延でRLを高速化する、Auxiliary-Delayed Reinforcement Learning (AD-RL) 法を提案する。
具体的には、AD-RLは短い遅延に対する値関数を学習し、ブートストラップとポリシー改善技術を用いて長い遅延に調整する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:12:37 GMT)
Towards Detecting LLMs Hallucination via Markov Chain-based Multi-agent Debate Framework [41.5] 本稿では,マルコフ連鎖に基づくマルチエージェント論争検証フレームワークを提案し,簡潔なクレームにおける幻覚検出精度を向上させる。
本手法は,クレーム検出,エビデンス検索,マルチエージェント検証を含むファクトチェック処理を統合する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:59:45 GMT)
No-Regret Algorithms for Safe Bayesian Optimization with Monotonicity Constraints [41.0] 未知の関数 $f$ を $(s,mathbfx)$ という形式の一連の作用に対して逐次最大化する問題を考える。
提案アルゴリズムの修正版では,各$mathbfx$に対応するほぼ最適の$s$を求めるタスクに対して,サブ線形後悔が得られることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:41:26 GMT)
Enhancing 3D Lane Detection and Topology Reasoning with 2D Lane Priors [40.9] 3次元車線検出とトポロジー推論は、自動運転シナリオにおいて必須のタスクである。
Topo2DはTransformerをベースとした新しいフレームワークで、2Dレーンインスタンスを利用して3Dクエリと3D位置埋め込みを初期化する。
Topo2Dは、マルチビュートポロジ推論ベンチマークOpenLane-V2で44.5% OLS、シングルビュー3Dレーン検出ベンチマークOpenLaneで62.6%のF-Socreを達成した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:48:56 GMT)
PartialFormer: Modeling Part Instead of Whole for Machine Translation [40.7] より小さなFFNを利用するパラメータ効率のよいトランスフォーマーアーキテクチャであるPartialFormerを紹介する。
これらの小さなFFNは、効果的なコラボレーションのためのマルチヘッドアテンションメカニズムに統合される。
9つの翻訳タスクと1つの抽象的な要約タスクの実験により、PartialFormerアプローチの有効性が検証された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:12:04 GMT)
Tensor Polynomial Additive Model [40.3] TPAMは、加法モデルの固有の解釈可能性、透明な意思決定、意味のある特徴値の抽出を保存している。
精度を最大30%向上し、圧縮速度を最大5倍向上させ、良好な解釈性を維持することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:23:11 GMT)
Graph Neural Network Explanations are Fragile [40.0] 我々は、敵の攻撃下でGNNの説明者を研究するための第一歩を踏み出した。
逆の摂動グラフ構造は、GNNモデルが正しい予測を行うのを確実にするが、GNN説明器は摂動グラフに大きく異なる説明を与える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:23:02 GMT)
Generalized Source Tracing: Detecting Novel Audio Deepfake Algorithm with Real Emphasis and Fake Dispersion strategy [39.9] 本稿では,音声ディープフェイク音声認識のためのReal Emphasis and Fake Dispersion(REFD)戦略を提案する。
REFDはAudio Deepfake Detection Challenge 2023 Track3で86.83%のF1スコアを達成した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:16:55 GMT)
Enhancing Multimodal Large Language Models with Multi-instance Visual Prompt Generator for Visual Representation Enrichment [39.8] まず、Q-formerのようなクエリベースのトランスフォーマーを用いたアダプタは、単純化されたマルチインスタンス学習法であることを示す。
次に、リッチな視覚表現をLLMに組み込むために、MIVPG(Multi-instance Visual Prompt Generator)と呼ばれる汎用コンポーネントを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:36:43 GMT)
Feature learning in finite-width Bayesian deep linear networks with multiple outputs and convolutional layers [39.7] 深い線形ネットワークは広く研究されているが、複数の出力と畳み込み層を持つ有限幅アーキテクチャの場合はほとんど知られていない。
我々の研究は、この物理学の直観と用語を厳密なベイズ統計に翻訳する辞書を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:37:42 GMT)
Poisoning Attacks and Defenses in Recommender Systems: A Survey [39.3] 現代のレコメンデーターシステム(RS)は、デジタルプラットフォーム全体のユーザエクスペリエンスを著しく向上させたが、毒殺攻撃による重大な脅威に直面している。
この調査は、攻撃者のレンズを通してこれらの脅威を調べることによって、ユニークな視点を示す。
攻撃目標の設定、攻撃能力の評価、犠牲者のアーキテクチャの分析、毒殺戦略の実行の4段階を含む系統的なパイプラインについて詳述する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:30:59 GMT)
Self-Specialization: Uncovering Latent Expertise within Large Language Models [39.0] 近年の研究では、大規模言語モデルが一般的な指示に従うように整列された自己アライメントの有効性が実証されている。
我々はエキスパートドメイン専門化のための自己調整に焦点を当てる。
我々の自己特殊化モデルは、ベースモデルよりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:48:45 GMT)
Long-Time Error-Mitigating Simulation of Open Quantum Systems on Near Term Quantum Computers [38.9] 本研究では,最大2千個のエンタングゲートを含むディープ回路においても,ハードウェアエラーに対する堅牢性を示す量子ハードウェア上でのオープン量子システムシミュレーションについて検討する。
我々は, 無限の熱浴に結合した2つの電子系をシミュレートする: 1) 駆動電界における放散自由電子系, 2) 磁場中の単一軌道における2つの相互作用電子の熱化 - ハバード原子。
この結果から, 開放量子系シミュレーションアルゴリズムは, ノイズの多いハードウェア上で, 同様に複雑な非散逸性アルゴリズムをはるかに上回ることができることを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:12:39 GMT)
Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference [38.8] 線形計算複雑性マルチモーダル言語モデル(MLLM)であるCobraを提案する。
特に、Cobraは効率的なMamba言語モデルを視覚的モダリティに統合する。
プロジェクトページは、https://sites.google.com/view/cobravlm.com/com/com/cobravlm.comで公開されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:34:58 GMT)
What is the Best Way for ChatGPT to Translate Poetry? [38.5] 英漢詩翻訳におけるChatGPTの能力について検討し、目的のプロンプトと小規模なサンプルシナリオを用いて最適なパフォーマンスを確かめる。
本稿では,単言語詩の説明を翻訳プロセスの案内情報として活用する,説明支援歌唱機械翻訳(EAPMT)手法を提案する。
EAPMT法は従来のChatGPTや既存のオンラインシステムよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:48:26 GMT)
Exploring Data Efficiency in Zero-Shot Learning with Diffusion Models [38.4] Zero-Shot Learning (ZSL) は、クラスレベルでのデータ効率を向上させることで、分類器が見えないクラスを識別できるようにすることを目的としている。
これは、未確認クラスの事前に定義されたセマンティクスから画像特徴を生成することで実現される。
本稿では,限られた例が一般的に生成モデルの性能低下をもたらすことを示す。
この統合されたフレームワークは拡散モデルを導入し、クラスレベルとインスタンスレベルのデータ効率を改善する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:37:06 GMT)
HYDRA: Model Factorization Framework for Black-Box LLM Personalization [38.0] パーソナライゼーションは現代のインテリジェントシステムにおいて重要な研究領域として現れてきた。
ブラックボックスの大規模言語モデル(LLM)が示した驚くべき数ショットの能力にもかかわらず、それらのモデルパラメータの本質的な不透明さは、生成された出力を個々の期待と整合させる上で大きな課題である。
本研究では,履歴データからユーザ固有の行動パターンを抽出し,パーソナライズされた生成を提供するモデル因子化フレームワークHYDRAを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:08:46 GMT)
Generative Flows on Discrete State-Spaces: Enabling Multimodal Flows with Applications to Protein Co-Design [37.6] 本稿では、フローベース生成モデルの実現に欠落したリンクを提供する離散データのフローベースモデルを提案する。
私たちの重要な洞察は、連続時間マルコフ連鎖を用いて連続空間フローマッチングの離散的等価性を実現できるということです。
この能力をタンパク質共設計のタスクに適用し、タンパク質の構造と配列を共同生成するモデルを学ぶ。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:31:17 GMT)
Pre-trained Large Language Models Use Fourier Features to Compute Addition [37.6] 事前訓練された大規模言語モデル(LLM)は、驚くべき数学的推論能力を示す。
加法などの基本的な算術の計算方法はまだ不明である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:40:53 GMT)
MagiNet: Mask-Aware Graph Imputation Network for Incomplete Traffic Data [37.4] 我々はGraphAware GraphAware Networkを提案する。
本手法は,不完全データの潜在表現を学習するための適応マスク時間エンコーダを設計する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:06:07 GMT)
Exploring and Improving Drafts in Blockwise Parallel Decoding [37.3] 言語モデルの推論速度を改善する手法として,Sternらによりブロックワイド並列復号法 (BPD) が提案された。
本稿では,ブロックドラフトの理解と改善に2つの方法で貢献する。
改良されたブロックドラフトは、ブロック効率が+5-21%向上することを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:00:35 GMT)
NUMCoT: Numerals and Units of Measurement in Chain-of-Thought Reasoning using Large Language Models [37.2] 数値と測定単位の処理において,既存のLarge Language Models (LLMs) を解析する。
まず,算術語問題を言語から数への数値変換や単位に基づく測度変換など,様々なサブプロデューサにアナライズする。
さらに,数量や単位に挑戦する古代中国の算術作品から,数学用語の問題に注釈を付ける。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:26:14 GMT)
Hi5: 2D Hand Pose Estimation with Zero Human Annotation [36.5] 本稿では,新しい大規模合成手ポーズ推定データセットHi5と,高品質な合成データ収集のための新しい安価な方法を提案する。
我々は,実世界の変動性を忠実に表現した単一のコンシューマPCを用いて,583,000の画像と正確なポーズアノテーションを用いたデータセットを生成する。
本実験は,実データセットにおけるデータ表現問題に対する有効な解決策として,合成データに対する有望な結果を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:45:10 GMT)
Can Implicit Bias Imply Adversarial Robustness? [36.5] 勾配に基づくトレーニングアルゴリズムの暗黙のバイアスは、しばしばよく一般化されるトレーニングネットワークにつながるため、主に有益であると考えられている。
しかし、Frei et al. (2023) は、そのような暗黙の偏見が敵の堅牢性を傷つけることを示した。
この結果から,トレーニングネットワークの暗黙的バイアスとロバスト性において,データ構造とアーキテクチャの相互作用の重要性を強調した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:16:19 GMT)
Caduceus: Bi-Directional Equivariant Long-Range DNA Sequence Modeling [36.4] 長範囲のトークン相互作用、ゲノムの上流および下流領域の影響、およびDNAの逆相補性について研究した。
本稿では,長距離マンバブロックから構築したこれらの課題を動機とするアーキテクチャを提案する。
RC同種二方向長範囲DNA言語モデルの最初のファミリーであるCaduceusの基盤として,MambaDNAを使用している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:02:37 GMT)
DeepPolar: Inventing Nonlinear Large-Kernel Polar Codes via Deep Learning [36.1] 極性符号は、短期間のブロック長規則のための最先端の誤り訂正符号として登場した。
DeepPolarコードは、カーネルサイズを大きくし、これらのカーネルをパラメータ化し、ニューラルネットワークを介してデコーダにマッチさせることで、従来のPolarコーディングフレームワークを拡張している。
以上の結果から,これらのデータ駆動型コードは,既存のニューラルコードと従来のポラコードの両方と比較して,カーネルサイズが大きくなるというメリットを効果的に活用できることが示唆された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:05:13 GMT)
On the Maximal Local Disparity of Fairness-Aware Classifiers [36.0] 種々の予測近傍(MCDP)に沿った最大累積比差という新しい公正度尺度を提案する。
MCDPを精度よく効率的に計算するために,推定誤差の少ない計算複雑性を大幅に低減する,証明可能な精度と近似計算アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:35:48 GMT)
Test-Time Degradation Adaptation for Open-Set Image Restoration [35.9] オープンセット画像復元のためのテスト時間劣化適応フレームワークを提案する。
本手法はタスク固有の手法よりも性能が優れている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:13:24 GMT)
LaMP: When Large Language Models Meet Personalization [35.8] 本稿では,大規模言語モデルにおけるパーソナライズの重要性を強調し,LaMPベンチマークを導入する。
LaMPは、パーソナライズされた出力を生成するための言語モデルのトレーニングと評価のための新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:29:31 GMT)
Prompt-based Visual Alignment for Zero-shot Policy Transfer [35.8] 強化学習におけるオーバーフィッティングは、強化学習への応用における主要な障害の1つとなっている。
ゼロショットポリシー転送のための画像における有害領域バイアスを軽減するために,プロンプトベースの視覚アライメント(PVA)を提案する。
CARLAシミュレータを用いて視覚に基づく自律運転タスクにおけるPVAの検証を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:26:30 GMT)
Sharpness-Aware Minimization and the Edge of Stability [35.3] 勾配降下(GD)をステップサイズ$eta$でトレーニングすると、損失のHessianのノルムが約2/eta$に達するまで増加し、その後この値に変動することを示す。
我々は、Sharpness-Aware Minimization (SAM) の「安定性の端」に到達するための同様の計算を行う。
GDの場合とは異なり、SAM-edgeの結果は勾配のノルムに依存する。3つのディープラーニングトレーニングタスクを用いて、SAMは、この分析によって同定された安定性の端で動作していることを実証的に確認する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:31:45 GMT)
NeuroPrune: A Neuro-inspired Topological Sparse Training Algorithm for Large Language Models [35.1] 自然言語処理(NLP)におけるトランスフォーマーベース言語モデルの普及
しかし、高価なトレーニングや推論は、その適用性に重大な障害となる。
脳神経ネットワークにインスパイアされた我々は、ネットワークトポロジーのレンズを通してスパーシティアプローチを探索する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:07:13 GMT)
Towards Federated Domain Unlearning: Verification Methodologies and Challenges [35.0] フェデレート・ドメイン・アンラーニングに関する最初の総合的な実証的研究について紹介する。
その結果,非学習がモデルの深い層に不均等に影響を及ぼすことが判明した。
フェデレート・ドメイン・アンラーニングに適した新しい評価手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:05:55 GMT)
Observation of Nonlinear Response and Onsager Regression in a Photon Bose-Einstein Condensate [34.8] 量子回帰定理は、2つの異なる時間における系の相関が平均値の時間応答と同じ運動方程式によって制御されていることを述べる。
ここでは,光子ボース・アインシュタイン凝縮体中の2時間粒子数相関が,色素分子浴の急激な摂動に対する凝縮物の応答と同じダイナミクスを示すことを実験的に実証した。
これは量子気体の回帰定理を確認し、さらに、摂動が浴槽に作用し、凝縮反応のみが監視される非伝統的な形でこの関係のテストを確立する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:10:07 GMT)
Recurrent Distance Filtering for Graph Representation Learning [34.8] 反復的なワンホップメッセージパッシングに基づくグラフニューラルネットワークは、遠方のノードからの情報を効果的に活用するのに苦労していることが示されている。
これらの課題を解決するための新しいアーキテクチャを提案する。
我々のモデルは、ターゲットへの最短距離で他のノードを集約し、線形RNNを用いてホップ表現のシーケンスを符号化する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:18:59 GMT)
TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes [34.7] 3D高密度キャプションは、自然言語による3Dシーンの包括的理解を実現するための基盤となる。
屋外3次元高密度キャプションの新たな課題について紹介する。
我々は,BEV表現を利用してオブジェクトボックスの提案を生成するTOD3Capネットワークを提案する。
また、TOD3Capデータセットを導入し、850シーンから64.3Kの屋外オブジェクトを2.3Mで記述した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:57:17 GMT)
Towards Real-world Scenario: Imbalanced New Intent Discovery [34.7] New Intent Discovery (NID)は、ラベル付きおよび大規模ラベル付きデータを限定的に利用することによって、未定義のユーザインテントの既知のカテゴリを検出することを目的としている。
本研究は,i-NID(i-NID)タスクを導入し,長期分布における親しみやすい,新しい意図カテゴリーを同定する。
3つのデータセットからなる新しいベンチマーク(ImbaNID-Bench)を作成し、実世界のロングテール分布をシミュレートする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:22:27 GMT)
ParamReL: Learning Parameter Space Representation via Progressively Encoding Bayesian Flow Networks [34.7] そこで本研究では,パラメータ空間内で動作するParamReLという表現学習フレームワークを提案する。
具体的には、ParamReLは、観察からではなく、パラメータから直接潜在意味論を学習するエンフセルフエンコーダを提案する。
相互情報用語は、潜在意味論の混乱をさらに促進し、同時に意味的意味論を捉える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:49:33 GMT)
Alignment Calibration: Machine Unlearning for Contrastive Learning under Auditing [33.4] まず,Machine Unlearning for Contrastive Learning (MUC) の枠組みを提案し,既存の手法を適用した。
我々は,いくつかの手法が未学習者であり,既存の監査ツールがデータ所有者にとって,対照的な学習における未学習の効果を検証するのに十分でないことを観察した。
コントラスト学習の特性を明示的に考慮し,未学習を容易に検証するための新しい指標に最適化することで,アライメント(AC)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:55:45 GMT)
Interactive Text-to-Image Retrieval with Large Language Models: A Plug-and-Play Approach [33.2] 本稿では,対話型テキスト・画像検索タスクにおける対話型コンテキストクエリの問題に対処する。
対話形式のコンテキストを再構成することにより、既存の視覚的対話データから検索モデルを微調整する必要がなくなる。
対象画像の属性に関する非冗長な質問を生成するために,LLM質問機を構築した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:09:01 GMT)
Reparameterization invariance in approximate Bayesian inference [32.9] 線形化の成功を説明するために, 線形化の新たな幾何学的視点を構築した。
これらのreパラメータ化不変性は、元のニューラルネットワーク予測に拡張可能であることを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:49:15 GMT)
Speech-based Clinical Depression Screening: An Empirical Study [32.8] 本研究では,AIを用いた抑うつスクリーニングにおける音声信号の有用性について検討した。
参加者は、北京大学第6病院の外来から採用されているうつ病患者を含む。
音声と深部音声の特徴を各参加者の分節録音から抽出した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:43:54 GMT)
Universality of Linear Recurrences Followed by Non-linear Projections: Finite-Width Guarantees and Benefits of Complex Eigenvalues [32.8] 実あるいは複素線型対角線再帰と組み合わせることで、列列列マップの任意に正確な近似が導かれることを示す。
我々は、単位円盤付近で複雑な固有値(すなわち、S4で最も成功した戦略)を利用することが、情報を保存する上で、RNNに大いに役立つことを証明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:00:40 GMT)
The Heuristic Core: Understanding Subnetwork Generalization in Pretrained Language Models [32.5] 1つのモデル内であっても、ドメイン内でも同様に機能するが、大きく異なる一般化を行うマルチワークを見つけることができる。
本研究は, 予め訓練したLMにおける構文一般化機構について, より詳細な知見を提供するものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:44:03 GMT)
SoK: Challenges and Opportunities in Federated Unlearning [32.0] 本論文は、この新興分野における研究動向と課題を特定することを目的として、未学習の未学習文学を深く研究することを目的としている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:00:03 GMT)
Pulmonary Embolism Mortality Prediction Using Multimodal Learning Based on Computed Tomography Angiography and Clinical Data [31.8] 本研究の目的は,CTPA(CTPA),臨床データ,肺重症度指数(PESI)スコアを用いて深層学習モデルを構築し,PE死亡率を予測することである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:05:16 GMT)
TruthX: Alleviating Hallucinations by Editing Large Language Models in Truthful Space [31.8] 大規模言語モデル(LLM)は、正しい知識を知っていても、時に非現実的な応答を生成する。
LLMの真偽を活性化する推論時間介入手法であるTrathXを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:15:04 GMT)
AD3: Implicit Action is the Key for World Models to Distinguish the Diverse Visual Distractors [31.6] 本稿では,視覚的邪魔者の暗黙的な動作を学習するためのImplicit Action Generator (IAG)を提案する。
暗黙的動作インフォームド・ディバース・ビジュアル・ディトラクタ・ディスタンス・ディスタンス・ディファクタ(AD3)という新しいアルゴリズムを提案する。
そこで本手法は,異種・同種両輪のトラヒックを特徴とする様々な視覚制御タスクにおいて,優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:25:53 GMT)
SpikeLM: Towards General Spike-Driven Language Modeling via Elastic Bi-Spiking Mechanisms [30.8] バイオインスパイアされたスパイクニューラルネットワーク(SNN)は、生物学的可視性、事象駆動性、バイナリアクティベーションの利点がある。
大規模言語モデルは有望な一般化能力を示しており、より一般的なスパイク駆動モデルを探究する上で価値のある問題である。
本研究は、識別的および生成的タスクを含む、汎用言語タスクのための最初の完全なスパイク機構を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:59:03 GMT)
GraphAlign: Pretraining One Graph Neural Network on Multiple Graphs via Feature Alignment [30.6] グラフ自己教師型学習(SSL)は、グラフ構造化データによるマイニングと学習をかなり約束する。
本研究では,グラフニューラルネットワーク(GNN)を,豊富なノード特徴を持つグラフのコレクションにプリトレーニングすることを目的としている。
本稿では,既存のグラフSSLフレームワークにシームレスに統合可能な汎用GraphAlign法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:22:32 GMT)
HAAQI-Net: A Non-intrusive Neural Music Audio Quality Assessment Model for Hearing Aids [30.3] 本稿では、補聴器使用者に適した音質評価のための非侵襲的深層学習モデルであるHAAQI-Netを紹介する。
HAAQI-Netは、双方向長短期記憶(BLSTM)アーキテクチャを用いて、音楽オーディオクリップや聴覚障害パターンから直接HAAQIのスコアを予測する。
その結果,線形相関係数0.9368,スピアマンランク相関係数0.9486,平均正方形誤差0.0064の予測スコアが得られた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:17:40 GMT)
Exact Conversion of In-Context Learning to Model Weights [30.1] In-Context Learningは、大きな言語モデルの強力な創発的特性である。
線形化変圧器ネットワークでは, バイアス項を含めることで, ICLを明示的かつ永続的にすることができることを示す。
我々のアルゴリズム(ICLCA)は、正確な変換を安価に行うことができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:47:40 GMT)
Interpretability Illusions in the Generalization of Simplified Models [30.1] ディープラーニングシステムを研究する一般的な方法は、単純化されたモデル表現を使用することである。
このアプローチは、これらの単純化の結果が元のモデルに忠実であると仮定する。
単純化された表現がトレーニングセットの完全なモデルを正確に近似できたとしても、モデルの挙動を正確に把握できない可能性があることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:03:37 GMT)
ACE: A Model Poisoning Attack on Contribution Evaluation Methods in Federated Learning [30.0] フェデレートラーニング(FL)では、クライアントのセットが、ローカルトレーニングデータを共有することなく、機械学習モデル(グローバルモデルと呼ばれる)を協調的にトレーニングする。
本研究は, FL におけるコントリビューション評価手法であるACE を用いた第1モデル毒殺攻撃を提案する。
その結果,ACEは5つの最先端コントリビューション評価手法を効果的に,かつ効果的に認識していることがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:10:27 GMT)
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation [29.9] ゼロショット型クロスタスク選好アライメントとロバスト・リワード学習(PEARL)を提案する。
PEARLは、ターゲットタスクの人間ラベルなしで、クロスタスクの嗜好伝達からポリシーを学習する。
Meta-World と Robomimic のロボット操作タスクに関する実証的な結果から,我々の手法はタスク間で好みラベルを正確に転送し,適切なポリシーを学習できることを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:00:48 GMT)
How to Train Neural Field Representations: A Comprehensive Study and Benchmark [29.7] 本稿では、並列化を利用してニューラルネットワークのデータセットを高速に最適化するJAXベースのライブラリを提案する。
下流タスクに対するNeFの適合性に対する異なるハイパーパラメータの影響について検討する。
提案するライブラリと分析に基づいて、一般的な視覚データセットのニューラルネットワーク変種からなるベンチマークであるNeural Field Arenaを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:51:53 GMT)
SaySelf: Teaching LLMs to Express Confidence with Self-Reflective Rationales [29.3] SaySelfは、大規模言語モデルに、より正確なきめ細かな信頼推定を表現するためのトレーニングフレームワークである。
さらに、SaySelf は LLM に対して、パラメトリック知識のギャップを明確に識別する自己反射的合理性を生成するよう指示する。
生成した自己反射的理性は合理的であり、キャリブレーションにさらに貢献できることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:04:01 GMT)
Population Transformer: Learning Population-level Representations of Intracranial Activity [29.2] Population Transformer (PopT) は頭蓋内神経記録を大規模に学習する。
PopTの開発における2つの重要な課題に対処する。
複数チャネルの頭蓋内電極データの復号化と解釈性を改善するために,事前訓練したPopTをリリースする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:15:09 GMT)
MODABS: Multi-Objective Learning for Dynamic Aspect-Based Summarization [29.1] 本稿では,Longformer-Encoder-Decoderを用いた新しい多目的学習フレームワークを提案する。
提案手法は3つの多様なデータセットのベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:32:28 GMT)
Learning Visual Prompts for Guiding the Attention of Vision Transformers [29.0] 本研究は、視覚変換器の注意を導くための視覚的プロンプトを学習することを提案する。
入力画像に追加される学習された視覚的プロンプトは、事前訓練された視覚変換器の注意を画像上の空間的位置にリダイレクトする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:13:38 GMT)
Highway Value Iteration Networks [28.8] 価値反復ネットワーク(VIN)の構造にハイウェイ値反復を導入する。
結果として生じる新しいハイウェイVINは、標準的なバックプロパゲーションを使用して数百のレイヤーで効果的に訓練することができる。
数百の計画ステップを必要とする長期計画作業において、ディープハイウェイVINは伝統的なVINといくつかの先進的で非常に深いNNの両方を上回っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:46:26 GMT)
Can Large Language Models be Good Emotional Supporter? Mitigating Preference Bias on Emotional Support Conversation [28.7] この研究はESConv上での大規模言語モデル(LLM)の結果を分析した。
特定の戦略に対する高い嗜好を示すことは、効果的な感情的支援を妨げている。
その結果,(1) 特定の戦略に対する嗜好の低さは情緒的支援の進行を妨げること,(2) 外部援助は嗜好バイアスの軽減に役立つこと,(3) 既存のLCMだけでは感情的な支持者にはならないこと,などが強調された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:39:59 GMT)
Degrees of Freedom Matter: Inferring Dynamics from Point Trajectories [28.7] ニューラルネットワークによってパラメータ化された暗黙の運動場を学習し、同一領域内の新規点の動きを予測することを目的とする。
我々は、SIRENが提供する固有正則化を活用し、入力層を変更して時間的に滑らかな運動場を生成する。
実験では, 未知点軌道の予測におけるモデルの性能評価と, 変形を伴う時間メッシュアライメントへの応用について検討した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:02:10 GMT)
Autonomous Workflow for Multimodal Fine-Grained Training Assistants Towards Mixed Reality [28.3] この作業は、AIエージェントを詳細にトレーニングするための拡張現実(XR)アプリケーションにシームレスに統合するための自律ワークフローを設計する。
パイロットXR環境におけるLEGOブロック組立のためのマルチモーダルきめ細粒度トレーニングアシスタントのデモンストレーションを行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:47:37 GMT)
Combinatorial Optimization with Automated Graph Neural Networks [28.2] NP-hard CO 問題,すなわち textbfAutoGNP を解決するために,textbfAUTOmated textbfGNN のクラスを新たに提案する。
AutoGNPの考え方は、グラフニューラルアーキテクチャ検索アルゴリズムを使用して、与えられたNPハード最適化問題に対して最適なGNNを自動的に見つけることである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:43:41 GMT)
Learning Topological Representations with Bidirectional Graph Attention Network for Solving Job Shop Scheduling Problem [27.9] 既存の学習に基づくジョブショップスケジューリング問題の解法(JSSP)は、通常、非方向性グラフに適した既製のGNNモデルを使用し、解離グラフ(DG)のリッチで有意義な位相構造を無視する。
本稿では,JSSP を解決するための DG を局所検索フレームワークに組み込むためのトポロジ対応双方向グラフアテンションネットワーク (TBGAT) を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:19:06 GMT)
Active Preference Optimization for Sample Efficient RLHF [27.8] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデルと人間の嗜好の整合において重要である。
現在の方法は、プロンプトジェネレーションのデータセットからプロンプトジェネレーションペアを均一に選択することに依存している。
我々は、好みデータをクエリすることでモデルアライメントを向上させるアクティブな学習アルゴリズムである$textttAPO$を開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:10:08 GMT)
Efficiently Train ASR Models that Memorize Less and Perform Better with Per-core Clipping [27.5] Per-core clip-ping (PCC) は、ASRモデルにおける意図しない記憶を効果的に緩和することができる。
PCCはASRのパフォーマンス指標に肯定的な影響を与え、収束率の改善と単語誤り率の削減につながった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:44:10 GMT)
Outliers and Calibration Sets have Diminishing Effect on Quantization of Modern LLMs [27.4] 学習後量子化(PTQ)は大規模言語モデル(LLM)の効率を向上させる
PTQにおける校正セットの役割,特に隠れ活性化に対する効果について検討する。
我々の分析では、利用可能なモデル間で量子化の有効性に顕著なコントラストが示される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:53:18 GMT)
Abstract Meaning Representation-Based Logic-Driven Data Augmentation for Logical Reasoning [27.2] 本稿では,論理駆動型データ拡張手法AMR-LDAを提案する。
AMR-LDAは元のテキストを抽象的意味表現(AMR)グラフに変換する。
修正されたAMRグラフは、拡張データを生成するためにテキストに変換される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:54:51 GMT)
Continual Traffic Forecasting via Mixture of Experts [27.2] 進化するネットワーク下での交通予測のための新しい交通予測混合(TFMoE)を提案する。
主なアイデアは、トラフィックフローを複数の均質なグループに分割し、特定のグループに責任を持つ専門家モデルを割り当てることである。
これにより、各エキスパートモデルは、トレーニング中の専門家間の干渉を最小限にしながら、特定のパターンのセットを学習し、適応することに集中することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:51:17 GMT)
Synergistic Integration of Coordinate Network and Tensorial Feature for Improving Neural Radiance Fields from Sparse Inputs [26.9] 本稿では,低周波信号に対する強いバイアスで知られる座標ネットワークと多面表現を統合する手法を提案する。
提案手法は,スパース入力を持つ静的および動的NeRFのベースラインモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:32:36 GMT)
MultiPA: A Multi-task Speech Pronunciation Assessment Model for Open Response Scenarios [26.9] 発音アセスメントモデルにより、ユーザーは実生活のコミュニケーションと同様の方法で言語スキルを実践することができる。
オープン応答に対する文レベルの精度, 流布度, 韻律, 単語レベルの精度評価を提供するマルチタスク発音評価モデルであるMultiPAを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:16:42 GMT)
Model Synthesis for Zero-Shot Model Attribution [26.8] 生成モデルは、芸術、デザイン、人間とコンピュータの相互作用などの様々な分野を形作っている。
実世界の生成モデルの指紋パターンを模倣した多数の合成モデルを生成するモデル合成手法を提案する。
実験により, この指紋抽出装置は, 合成モデルのみを訓練し, 様々な実世界の生成モデルに対して, 印象的なゼロショットの一般化を実現することができた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:00:17 GMT)
Bidirectional Autoregressive Diffusion Model for Dance Generation [26.4] 本稿では,双方向自己回帰拡散モデル(BADM)を提案する。
生成したダンスが前方方向と後方方向の両方で調和することを強制するために、双方向エンコーダが構築される。
生成したダンス動作をよりスムーズにするため、局所運動強調のための局所情報デコーダを構築する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:57:03 GMT)
ArtWhisperer: A Dataset for Characterizing Human-AI Interactions in Artistic Creations [26.4] 本研究は,対象画像の生成にテキスト・ツー・イメージ・モデルをどのように利用するかを検討する。
私たちはArtWhispererを作った。これはユーザーがターゲットイメージを与えられたオンラインゲームで、ターゲットに類似した画像を生成するプロンプトを反復的に見つける。
我々は5万以上の人間とAIのインタラクションを記録し、各インタラクションはユーザによって生成された1つのテキストプロンプトと、それに対応する生成された画像に対応する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:01:39 GMT)
PLA4D: Pixel-Level Alignments for Text-to-4D Gaussian Splatting [26.4] 我々は,静的な3Dオブジェクトを生成し,それらに動きを注入するために,テキストからビデオまでのフレームを明示的な画素アライメントターゲットとして提案する。
本研究では、変形ネットワークを用いてガウスの変化を駆動し、滑らかな4次元物体表面に対する参照再ファインメントを実装するモーションアライメントを開発する。
従来の方法と比較して、PLA4Dはより少ない時間でより優れたテクスチャの詳細を持つ合成出力を生成し、Janus-faced問題を効果的に緩和する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:35:09 GMT)
Fine-Grained Causal Dynamics Learning with Quantization for Improving Robustness in Reinforcement Learning [26.3] 因果ダイナミクス学習は、強化学習における堅牢性を高めるための有望なアプローチである。
本稿では,微粒な因果構造を推定し,それらを予測に利用する新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:13:58 GMT)
PatentGPT: A Large Language Model for Intellectual Property [26.3] 大規模言語モデル(LLM)は、多くの自然言語処理タスクにまたがる例外的な性能のため、大きな注目を集めている。
しかし,知的財産権(IP)分野における大規模言語モデルの応用は,専門知識の要求が強いため困難である。
我々は、IPドメインのユニークな要件を満たす、IP指向のLLMをトレーニングするための、低コストで標準化された手順を初めて提示する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:02:48 GMT)
Dishonesty in Helpful and Harmless Alignment [26.1] 大規模言語モデル(LLM)は、人間の好みを満たす場合の報酬を得る強化学習によって、人間の価値に整合している。
また、LSMが無害反応を生じさせると嘘をつくような無害なアライメントにおいても、これは不当な結果をもたらすことが判明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:21:19 GMT)
BadAgent: Inserting and Activating Backdoor Attacks in LLM Agents [26.1] 提案手法は,BadAgentというバックドア攻撃に対して脆弱であることを示す。
提案手法は信頼性のあるデータを微調整した後でも極めて堅牢である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:14:28 GMT)
DEER: A Delay-Resilient Framework for Reinforcement Learning with Variable Delays [26.0] 本稿では,解釈性を効果的に向上し,ランダム遅延問題に対処するためのフレームワークである$textbfDEER (Delay-Resilient-Enhanced RL)$を提案する。
様々な遅延シナリオでは、トレーニングされたエンコーダは、追加の修正を必要とせずに、標準のRLアルゴリズムとシームレスに統合することができる。
その結果, DEER は定常およびランダムな遅延設定において最先端の RL アルゴリズムよりも優れていることを確認した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:45:26 GMT)
Trust Regions for Explanations via Black-Box Probabilistic Certification [26.0] クエリアクセスのみのブラックボックスモデルを考えると、この例を中心とした最大のハイパーキューブを見つけることはできますか?
そのようなエファントラスト領域を効率的に見つけることは、複数の利点がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:36:21 GMT)
Tackling GenAI Copyright Issues: Originality Estimation and Genericization [25.7] 本稿では、生成モデルの出力を一般化し、著作権を侵害しにくくする汎用化手法を提案する。
提案手法は,テキストから画像への生成モデルの出力を改良し,より汎用的で著作権に適合した画像を生成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:58:32 GMT)
Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding [25.5] 本稿では,LVLM推論における幻覚の低減を目的とした,命令コントラストデコーディング(ICD)手法を提案する。
本手法は,マルチモーダル核融合モジュールにおいて,外乱指示が幻覚を著しく悪化させるという観察に着想を得たものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:53:42 GMT)
Residual Connections and Normalization Can Provably Prevent Oversmoothing in GNNs [25.4] 残差接続と正規化層を有する(線形化)グラフニューラルネットワーク(GNN)の形式的かつ正確な特徴付けを提供する。
正規化層の中心となるステップは、メッセージパッシングにおけるグラフ信号を変化させ、関連する情報を抽出しにくくすることを示す。
本稿では,グラフNormv2と呼ばれる新しい正規化レイヤを導入し,その中心となるステップを学習することで,元のグラフ信号を望ましくない方法で歪ませないようにする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:53:16 GMT)
SpikeZIP-TF: Conversion is All You Need for Transformer-based SNN [24.9] スパイキングニューラルネットワーク(SNN)は、高効率と精度の特色から注目されている。
本研究では,新しいANN-to-SNN変換手法であるSpikezip-TFを提案する。
Spikezip-TFは、CVデータセット(ImageNet)では83.82%、NLPデータセット(SST-2)では93.79%の精度を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:24:07 GMT)
Ranking Large Language Models without Ground Truth [24.8] 大規模言語モデル(LLM)の評価とランキングは,これらのモデルの普及に伴って重要な問題となっている。
我々は、プロンプトのデータセットが与えられた場合、根拠となる真実や参照応答にアクセスせずにそれらをランク付けする、新しい視点を提供する。
この考え方を繰り返し適用し、LLMをランク付けする2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:56:49 GMT)
Cooperative Edge Caching Based on Elastic Federated and Multi-Agent Deep Reinforcement Learning in Next-Generation Network [24.7] エッジキャッシュは、小型セルベースステーション(SBS)におけるキャッシュユニットの強化により、次世代ネットワークにとって有望なソリューションである
SBSは,ユーザの個人情報を保護しながら,学習を通じて正確な人気コンテンツを予測することが重要である。
従来のフェデレーション学習(FL)はユーザのプライバシを保護することができるが、UE間のデータ格差はモデル品質の低下につながる。
ネットワークのコストを最適化するために, 弾性フェデレーションとマルチエージェント深部強化学習(CEFMR)に基づく協調エッジキャッシュ方式を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:35:48 GMT)
Reward Model Learning vs. Direct Policy Optimization: A Comparative Analysis of Learning from Human Preferences [24.6] 我々は、人間からのフィードバック(RLHF)からの強化学習のパラダイムと、最近提案された直接選好最適化(DPO)のパラダイムを体系的に比較することにより、人間の嗜好から学ぶことのより深い理解に向けた一歩を踏み出した。
RLHFとDPOの両方によって誘導される最適下界の最小値統計的境界を導出する。
我々は解析を近似最適化設定に拡張し、RLHFとDPOの指数的に減衰する収束率を導出する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:00:36 GMT)
CKGConv: General Graph Convolution with Continuous Kernels [24.6] グラフ位置符号化によって導出される疑似座標の連続関数としてカーネルをパラメータ化することで、新しい一般的なグラフ畳み込みフレームワークを提案する。
このContinuous Kernel Graph Convolution(CKGConv)と名付けます。
CKGConvベースのネットワークは、既存のグラフ畳み込みネットワークよりも優れており、様々なグラフデータセットで最高のグラフ変換器と互換性があることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:54:39 GMT)
Stealthy Attack on Large Language Model based Recommendation [24.5] 大規模言語モデル (LLM) はレコメンダシステム (RS) の進歩を推進している。
本研究では,レコメンデーションモデルにLSMを導入することで,項目のテキスト内容に重点を置いているため,新たなセキュリティ脆弱性が生じることを明らかにした。
攻撃者は、テストフェーズ中に単にテキストの内容を変更するだけで、アイテムの露出を大幅に向上させることができることを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:02:47 GMT)
Analyzing Social Biases in Japanese Large Language Models [24.4] 本稿では,英語バイアスベンチマークBBQに基づいて,質問回答のための日本語バイアスベンチマークデータセット(JBBQ)を構築した。
日本語大言語モデル(LLM)における社会的バイアスの分析
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:56:11 GMT)
Unveiling Selection Biases: Exploring Order and Token Sensitivity in Large Language Models [24.3] 大規模言語モデル(LLM)における「選択バイアス」について検討する。
複数のモデルやタスクにまたがる広範な経験的分析を通じて、これらのバイアスの影響を定量化する。
モデル性能を向上させるための緩和戦略を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:16:51 GMT)
Multi-Modal and Multi-Agent Systems Meet Rationality: A Survey [24.1] 合理性(Rationality)とは、論理的な思考と、証拠や論理的な規則に沿った決定によって特徴づけられる、理性によって導かれる性質である。
最近の研究は、一貫性と信頼性を高めるために、様々な種類のデータやツールと協調して働く複数のエージェントの強みを活用する試みである。
本稿では,マルチモーダルシステムとマルチエージェントシステムが,現状調査によって合理性に向かって進んでいるかを理解することを目的とする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:39:56 GMT)
Task and Motion Planning for Execution in the Real [24.0] この作業は、作業を含むタスクと動作の計画を生成するが、計画時には完全には理解できない。
実行は、タスク目標に到達するまでオフラインで計画された動きとオンライン行動を組み合わせる。
提案したフレームワークを評価するために,40の実ロボット試験とモチベーション実証を行った。
その結果、実行時間が短縮され、アクションの数が少なくなり、さまざまなギャップが生じる問題の成功率が向上した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:30:40 GMT)
Large Language Models as Evaluators for Recommendation Explanations [23.9] 我々は,LLMがレコメンデーション・リコメンデーション・リコメンデーションの評価に役立てられるかどうかを検討する。
我々は,評価者ラベルとユーザが提供する真実との相関を計測するために,3段階のメタ評価戦略を設計し,適用する。
本研究は,LLMを評価対象として活用することは,レコメンデーション説明文の評価において,正確かつ再現可能で費用対効果の高いソリューションであることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:23:23 GMT)
Inv-Adapter: ID Customization Generation via Image Inversion and Lightweight Adapter [23.7] Inv-Adapter は,DDIM 画像の逆変換により事前学習したテキスト・ツー・イメージモデルを用いて,ID 画像の拡散領域表現を抽出する。
抽出したIDの高アライメントとテキスト・ツー・イメージ・モデルの中間的特徴から、それらをベース・テキスト・ツー・イメージ・モデルに効率的に組み込む。
提案したInv-Adapterは,IDのカスタマイズ生成とモデルスケールにおいて高い競争力を持つことを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:59:08 GMT)
One-Shot Imitation Learning with Invariance Matching for Robotic Manipulation [23.6] IMOPは、注釈のない1つのデモから新しいタスクを学ぶ。
IMOPはまた、新しい形状に一般化し、デモと異なるオブジェクトを操作することを学べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:11:10 GMT)
Self-Augmented In-Context Learning for Unsupervised Word Translation [23.5] 大規模言語モデル (LLMs) は、強力な単語翻訳やバイリンガル語彙誘導(BLI)機能を示す。
教師なしBLIのための自己拡張型インコンテキスト学習(SAIL)を提案する。
提案手法は,2つの確立したBLIベンチマーク上でのLDMのゼロショットプロンプトよりも大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:38:42 GMT)
Language-guided Detection and Mitigation of Unknown Dataset Bias [23.3] 本稿では,キャプションの部分的発生に基づく事前知識のないキーワードとして潜在的なバイアスを識別する枠組みを提案する。
我々のフレームワークは、事前知識のない既存のメソッドよりも優れているだけでなく、事前知識を前提としたメソッドにさえ匹敵する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:11:33 GMT)
A Bi-metric Framework for Fast Similarity Search [23.3] 近接するデータ構造を設計するための新しい「バイメトリック」フレームワークを提案する。
本フレームワークでは, 高精度で計算に費用がかかる基底トラストメトリックと, 安価だが精度の低いプロキシメトリックの2つの相似性関数を仮定する。
プロキシメトリックのみを使用して、両方のメトリクスに対して限られた数の呼び出ししか使用せず、データ構造を構築する方法を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:17:48 GMT)
Improve Mathematical Reasoning in Language Models by Automated Process Supervision [22.7] 高品質プロセス監視データの効率的な収集のために,textitOmegaPRM という新しいモンテカルロ木探索アルゴリズムを提案する。
プロセスリワードモデル(PRM)をトレーニングするために、150万以上のプロセス監視アノテーションを収集することができます。
我々は,Gemini Proモデルの数学推論性能を改良し,MATHベンチマークで69.4%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:25:40 GMT)
DySLIM: Dynamics Stable Learning by Invariant Measure for Chaotic Systems [22.6] 散逸的なカオスシステムからダイナミクスを学ぶことは、その固有の不安定性のため、非常に難しい。
不変測度と力学の学習を対象とする新しいフレームワークを提案する。
スケーラブルな正規化項で分布をターゲットとすることで、このアプローチをより複雑なシステムに拡張できることを期待する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:22:59 GMT)
Rethinking Momentum Knowledge Distillation in Online Continual Learning [22.6] そこで本研究では,MKD(Momentum Knowledge Distillation)を多くのフラグシップであるオンライン連続学習(OCL)手法に適用するための,直接的かつ効果的な方法論を提案する。
ImageNet100の既存の最先端の精度を10%以上向上させるとともに、私たちは、OCLのトレーニング中にMKDの内部力学と影響に光を当てました。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:30:34 GMT)
CondTSF: One-line Plugin of Dataset Condensation for Time Series Forecasting [22.5] データセット凝縮の目的は、合成データセットでトレーニングされたモデルが、完全なデータセットでトレーニングされたモデルと互換性を持って動作できることを保証することである。
分類において、合成データは、全データセットで訓練されたモデルと合成データセットで訓練されたモデルが同じ入力に対して同一のラベルを生成する場合、よく蒸留されると考えられる。
TS予測において, 合成データ蒸留の有効性は, モデル間の距離によって決定される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:52:46 GMT)
WaveCoder: Widespread And Versatile Enhancement For Code Large Language Models By Instruction Tuning [22.4] 4つの普遍的なコード関連タスクにまたがる2万の命令インスタンスからなるデータセットであるCodeOceanを紹介する。
次に、WidespreadとVersatile拡張命令チューニングを備えた微調整コードLLMであるWavecoderを紹介する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:06:45 GMT)
Disentanglement Learning via Topology [22.3] マルチスケールなトポロジ的損失項を付加することにより,不整合表現を学習するTopDisを提案する。
ディスタングルメントは、ディープラーニングモデルの説明可能性と堅牢性にとって重要なデータ表現の重要な特性である。
提案した位相損失を用いて,訓練されたGANにおいて不整合方向を求める方法を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:19:44 GMT)
Read to Play (R2-Play): Decision Transformer with Multimodal Game Instruction [22.3] 本稿では,エージェントに対するタスクガイダンスの強化について検討し,ゲームプレイ指導の理解を可能にした。
命令チューニングを決定変換器に組み込むためのマルチモーダルゲーム命令セットを構築する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:27:50 GMT)
Methods for Class-Imbalanced Learning with Support Vector Machines: A Review and an Empirical Evaluation [22.1] クラス不均衡学習に関して,SVMに基づくモデルの階層的分類を導入する。
ベンチマーク不均衡データセットを用いて,各カテゴリの各種SVMモデルの性能を比較した。
以上の結果から,データ前処理の要求がないため,アルゴリズム手法は時間がかかりにくいが,再サンプリング手法とアルゴリズム手法を併用した融合方式は,一般に最善を尽くしていることがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:55:08 GMT)
Quantum Algorithms and Lower Bounds for Finite-Sum Optimization [22.1] 我々は、複雑性 $tildeObig(n+sqrtd+sqrtell/mubig)$ の量子アルゴリズムを与え、古典的なタイト境界 $tildeThetabig(n+sqrtnell/mubig)$ を改善する。
また、$d$が十分大きいとき、量子下界$tildeOmega(n+n3/4(ell/mu)1/4)$を証明します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:13:52 GMT)
Achieving Near-Optimal Convergence for Distributed Minimax Optimization with Adaptive Stepsizes [22.0] 分散ミニマックス問題に直接適応的手法を適用することで,非収束性が得られることを示す。
追跡追跡プロトコルを用いた分散分散分散ミニマックス法であるD-AdaSTを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:54:36 GMT)
Effects of Exponential Gaussian Distribution on (Double Sampling) Randomized Smoothing [21.6] 指数標準ガウス分布(Exponential Standard Gaussian, ESG)と指数一般ガウス分布(Exponential General Gaussian, EGG)の2種類の分布がランダム化平滑化および二重ランダム化平滑化(DSRS)に及ぼす影響について検討した。
実世界のデータセットに関する我々の実験は、ESGの理論的解析を確認し、RSとDSRSの双方に対して、異なる指数$eta$でほぼ同じ認証を提供する。
原始DSRSと比較して、EGGが提供する認証精度の上昇は、ImageNetで最大6.4%まで顕著である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:10:16 GMT)
Sensitivity-Informed Augmentation for Robust Segmentation [21.6] カメラ品質の変動やレンズ歪みなどの内部ノイズはセグメンテーションモデルの性能に影響を与える可能性がある。
我々は,学習ベースセグメンテーションモデルの堅牢性を高めるために,効率的で適応性があり,勾配のない手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:40:29 GMT)
Uncertainty Estimation on Sequential Labeling via Uncertainty Transmission [21.4] NERタスクは、エンティティを抽出し、テキストが与えられたラベルを予測することを目的としている。
本研究は,NER予測の不確実性スコアを推定することを目的としたUE-NERに焦点を当てる。
抽出されたエンティティに対する不確実性スコアを推定するための逐次ラベル付け後ネットワーク(SLPN)を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:04:29 GMT)
Noise-Aware Algorithm for Heterogeneous Differentially Private Federated Learning [21.3] 本稿では,クライアントモデル更新における真のノイズレベルを効率的に推定するRobust-HDPを提案する。
ユーティリティと収束速度を改善し、不正なプライバシパラメータをサーバに送信する可能性のあるクライアントに対して安全である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:41:42 GMT)
Synthetic Programming Elicitation and Repair for Text-to-Code in Very Low-Resource Programming Languages [21.2] 合成プログラミングの活用とコンパイル(SPEAK)について紹介する。
SPEAKは意味的正当性を犠牲にすることなく、より頻繁に構文的正当性プログラムを生成する。
ケーススタディにおいて,SPEAKの性能を実証的に評価し,既存の検索基準や微調整基準と比較すると,SPEAKは構文的に正しいプログラムをより頻繁に生成することがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:16:19 GMT)
Visual-Text Cross Alignment: Refining the Similarity Score in Vision-Language Models [21.2] 近年、CLIP(CLIP)のような事前訓練された視覚言語モデル(VLM)を用いて、クエリイメージ全体をより細かいテキスト記述と整合させることで、ゼロショットのパフォーマンスを著しく向上させることが発見されている。
本稿では, より詳細な記述は, 画像全体よりも, クエリ画像の局所的な領域とより効果的に整合する傾向があることを実証的に見出した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:08:41 GMT)
ContrastAlign: Toward Robust BEV Feature Alignment via Contrastive Learning for Multi-Modal 3D Object Detection [21.1] 異種モダリティのアライメントを高めるための新しいContrastAlignアプローチを提案する。
MAPは70.3%であり, nuScenes 検証セットでは BEVFusion を 1.8% 上回っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:59:37 GMT)
Adversarial Generation of Hierarchical Gaussians for 3D Generative Model [20.8] 本稿では,Gaussianを3D GANの3次元表現として利用し,その効率的かつ明示的な特徴を活用する。
生成したガウスの位置とスケールを効果的に正規化する階層的多スケールガウス表現を持つジェネレータアーキテクチャを導入する。
実験結果から,最先端の3D一貫したGANと比較して,レンダリング速度(x100)が大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:52:20 GMT)
Near-field Beamforming for Extremely Large-scale MIMO Based on Unsupervised Deep Learning [20.7] 教師なし深層学習に基づく近距離場ビームフォーミング法を提案する。
提案手法はベースライン方式と比較して安定なビームフォーミングゲインが得られる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:26:25 GMT)
Optimal Transport Guided Correlation Assignment for Multimodal Entity Linking [20.6] マルチモーダルエンティティリンクは、マルチモーダルなコンテキストにおける曖昧な言及をマルチモーダルな知識グラフ内のエンティティにリンクすることを目的としている。
既存の手法は、自動的に学習された注意重みに大きく依存して、いくつかの局所的な相関機構を試行する。
本稿では,OT-MELを用いた新しいMELフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:13:56 GMT)
Approximate Nearest Neighbour Search on Dynamic Datasets: An Investigation [20.4] 近似k-Nearest Neighbour (ANN) 法は情報マイニングや大規模高次元データセットでの機械学習支援によく用いられる。
静的なデータセットを持つアプリケーションでは、ランタイム制約とデータセットプロパティを使用して、適切な操作特性を持つANNメソッドを経験的に選択することができる。
従来の評価手法は、インデックス構造を更新する際の計算コストや、インデックス更新の率とサイズを考慮していない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:42:42 GMT)
Towards Better Understanding of Contrastive Sentence Representation Learning: A Unified Paradigm for Gradient [20.4] 文表現学習(SRL)は自然言語処理(NLP)において重要な課題である
コントラスト型と非コントラスト型自己監督型学習(SSL)の類似性について多くの研究がなされている。
しかし、ランキングタスク(すなわち、SRLのセマンティックテキスト類似性(STS))では、対照的なSSLは非コントラストSSLを著しく上回っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:07:50 GMT)
Evaluation of data inconsistency for multi-modal sentiment analysis [20.3] 感情意味の不整合は、マルチモーダル感情分析におけるユビキタスな課題である。
本研究は、新たな課題を提示し、感情分析システムの今後の発展に有用な洞察を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:11:56 GMT)
Sample-specific Masks for Visual Reprogramming-based Prompting [20.3] ビジュアルリプログラミング(VR)は、タスクをターゲットにしたトレーニング済みモデルの再利用を目的としたプロンプト技術である。
本稿では,共有マスクがVRの一般化を制限し,近似誤差を増大させる可能性を示す。
この発見に動機づけられた我々は、サンプル特異的マルチチャネルマスク(SMM)と呼ばれるVRのための新しいフレームワークを設計した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:15:43 GMT)
DifAttack++: Query-Efficient Black-Box Adversarial Attack via Hierarchical Disentangled Feature Space in Cross Domain [20.2] 本研究は,高攻撃成功率(ASR)と良好な一般化性を備えた,効率的なスコアベースブラックボックス攻撃について検討する。
我々はtextitHierarchical textbfDisentangled textbfFeature space と textitcross domain に基づいて, textbfDifAttack++ という新しい攻撃手法を設計する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:32:29 GMT)
DenoDet: Attention as Deformable Multi-Subspace Feature Denoising for Target Detection in SAR Images [20.1] 本稿では、畳み込みバイアスを校正し、高周波により多くの注意を払うために、明示的な周波数領域変換によって支援されるネットワークを提案する。
変換領域ソフトしきい値処理を行う動的周波数領域アテンションモジュールであるTransDenoを設計する。
プラグアンドプレイのTransDenoは、複数のSARターゲット検出データセットに対して最先端のスコアを設定する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:05:26 GMT)
I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models [20.1] 学習後の量子化は、大きな言語モデルの推論を加速する強力な技術として機能する。
既存の作業は、推論中にかなりの数の浮動小数点(FP)操作を必要とする。
この制限は、エッジとクラウドデバイス上の大きな言語モデルのデプロイを妨げる。
大規模言語モデルに適した整数のみの完全量子化PTQフレームワークであるI-LLMを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:26:58 GMT)
Local to Global: Learning Dynamics and Effect of Initialization for Transformers [20.0] 我々は一階マルコフ連鎖と単層変圧器に焦点をあてる。
我々は,次世代の予測損失に基づいてトレーニングしたトランスフォーマーパラメータが,グローバルあるいはローカルのミニマに収束可能であることを証明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:57:41 GMT)
Multimodal Reasoning with Multimodal Knowledge Graph [19.9] 大規模言語モデル(LLM)を用いたマルチモーダル推論は、幻覚や、不十分な知識や時代遅れな知識の存在に悩まされることが多い。
マルチモーダル知識グラフを用いたマルチモーダル推論(MR-MKG)手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:28:01 GMT)
NEO-BENCH: Evaluating Robustness of Large Language Models with Neologisms [19.9] 我々は、いくつかの一般的な収集手法を用いて、近年のイングランドのネオロジズムの多様な資源を創出する。
我々は新語を含む文と新語を置き換えたほぼ同一の文とを既存の代用語と比較することにより,時間的ドリフトを分析する。
モデル性能は1つの新語が文中に導入されるとき、機械翻訳においてほぼ半減する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:12:23 GMT)
S$^2$GSL: Incorporating Segment to Syntactic Enhanced Graph Structure Learning for Aspect-based Sentiment Analysis [19.7] ABSAのための構文強化グラフ構造学習にセグメンテーションを取り入れた2$GSLを提案する。
S$2$GSLはセグメント対応セマンティックグラフ学習と構文ベースの潜在グラフ学習を備えている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:44:35 GMT)
Towards Safer Large Language Models through Machine Unlearning [19.7] SKU(Selective Knowledge Unlearning)は、有害な知識を排除し、通常のプロンプトで実用性を維持するために設計されている。
第1段階は、モデル内の有害な知識を特定し、取得することを目的としており、第2段階は、この知識を取り除くことを目的としている。
本実験は,有害情報除去と有効性維持のバランス点をSKUが特定できることを実証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:57:09 GMT)
The Harder You Try, The Harder You Fail: The KeyTrap Denial-of-Service Algorithmic Complexity Attacks on DNSSEC [19.6] 我々は、DNSSECベースのアルゴリズムによる、DNSに対する新しいタイプの複雑性攻撃を開発し、KeyTrap攻撃をダブする。
1つのDNSパケットだけで、KeyTrap攻撃は脆弱性のあるDNSリゾルバのCPU数の2.0倍のスパイクを引き起こし、最大16時間停止する。
KeyTrapをエクスプロイトすることで、攻撃者はDNSSEC検証リゾルバを使用して、任意のシステムにおけるインターネットアクセスを効果的に無効にすることができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:33:04 GMT)
Knowledge-Infused Legal Wisdom: Navigating LLM Consultation through the Lens of Diagnostics and Positive-Unlabeled Reinforcement Learning [19.6] 本稿では、適応型弁護士のような診断質問を利用して、追加の事例情報を収集する診断法大言語モデル(D3LM)を提案する。
D3LMは、革新的なグラフベースのPositive-Unlabeled Reinforcement Learning (PURL)アルゴリズムを導入し、批判的な質問を生成する。
また,米国事例法データベースに基づく新たな英語CVGデータセットも導入した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:47:35 GMT)
Push Past Green: Learning to Look Behind Plant Foliage by Moving It [19.4] 部分的な可視性、極端に粗い構造、植物のための未知の幾何学と力学は、そのような操作を困難にしている。
SRPNetは、特定の植物に対する候補アクションの実行時に、どの空間が露呈しているかを予測するニューラルネットワークである。
SRPNetは、どれだけの空間が露光されるかだけでなく、どこで露光されるかも予測するだけでなく、植物の葉の下のより多くの空間を徐々に明らかにする一連の行動を実行することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:59:01 GMT)
Adapting Open-Source Large Language Models for Cost-Effective, Expert-Level Clinical Note Generation with On-Policy Reinforcement Learning [19.1] 本研究では,オープンソースのLLaMA-213億パラメータモデルに対する包括的ドメイン・タスク特化プロセスを提案する。
教師モデルとしてGemini 1.0 Proを用いて、政治強化学習を行うための新しいアプローチであるDistillDirectを導入する。
我々のモデルであるLLaMA-Clinicは、医師が作成したものと同等の品質の臨床メモを生成することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:03:17 GMT)
Self-Supervised Skeleton Action Representation Learning: A Benchmark and Beyond [19.1] 自己教師付き学習(SSL)はラベル効率のよい骨格に基づく行動理解に有効であることが証明されている。
最近のスケルトンベースのSSLへの取り組みは目覚ましい進歩を遂げている。
本稿では,自己教師型骨格に基づく行動表現学習に関する包括的調査を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:21:54 GMT)
JumpCoder: Go Beyond Autoregressive Coder via Online Modification [18.9] JumpCoderは、人間に似たオンライン修正と非逐次生成が可能な新しいモデルに依存しないフレームワークで、LLMを増強する。
JumpCoderの背景にある重要なアイデアは、生成時に必要に応じて、現在生成されたコードに新しいコードを挿入することである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:12:03 GMT)
Exploring Human-AI Perception Alignment in Sensory Experiences: Do LLMs Understand Textile Hand? [18.9] タッチのような知覚のモダリティは、視覚のような他の感覚のモダリティよりも多面的かつニュアンス的である。
これは触覚のアライメントに関する最初の調査であり、繊維の手で例示されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:46:07 GMT)
Unified-modal Salient Object Detection via Adaptive Prompt Learning [18.9] 単一モードSODタスクと多モードSODタスクの両方に対処するため,UniSODと呼ばれる統一フレームワークを提案する。
UniSODは適応的なプロンプト学習を通じてタスク固有のヒントでモーダルアウェアプロンプトを学習する。
提案手法は,RGB,RGB-D,RGB-T SODの14のベンチマークデータセットに対して,総合的な性能向上を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:43:31 GMT)
Are Your Models Still Fair? Fairness Attacks on Graph Neural Networks via Node Injections [18.7] グラフニューラルネットワーク(GNN)では、悪意のある敵対的攻撃に直面した際の公正な脆弱性が明らかにされている。
我々は、より現実的な環境でGNNフェアネスの脆弱性を探求するノードインジェクションベースのフェアネスアタック(NIFA)を紹介する。
NIFAは、ノードの1%だけを注入することで、フェアネスを意識したGNNを含むメインストリームのGNNの公平性を著しく損なう可能性がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:26:53 GMT)
FuRL: Visual-Language Models as Fuzzy Rewards for Reinforcement Learning [18.6] オンライン強化学習(RL)における事前学習型視覚言語モデル(VLM)の活用について検討する。
本稿ではまず,VLMをRLタスクの報酬として適用する際の報酬ミスアライメントの問題を同定する。
ファジィVLM報酬支援RL(FuRL)という軽量微調整法を導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:05:23 GMT)
Filtered not Mixed: Stochastic Filtering-Based Online Gating for Mixture of Large Language Models [18.4] MoE-F - オンライン時系列予測タスクにおいて、N$で事前訓練されたエキスパート大規模言語モデル(LLM)を組み合わせるための正式なメカニズム。
我々のメカニズムは,各専門家のランニング性能の条件情報を利用して,次のステップで時系列を予測するためのLLMの最適な組み合わせを予測する。
I) MoE-Fアルゴリズム -- プラグアンドプレイフィルタハーネスとしてデプロイ可能、(II) 提案したフィルタリングに基づくゲーティングアルゴリズムの理論的最適性保証、(III) 経験的評価とアブレーション結果。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:53:50 GMT)
Transfer Learning for Latent Variable Network Models [18.3] 潜在変数ネットワークモデルにおける推定のための伝達学習について検討する。
潜伏変数が共有されている場合、エラーの消滅が可能であることを示す。
我々のアルゴリズムは、$o(1)$エラーを達成し、ソースやターゲットネットワーク上でパラメトリック形式を仮定しない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:33:30 GMT)
IrokoBench: A New Benchmark for African Languages in the Age of Large Language Models [18.3] 本報告では,16種類の低リソースアフリカ言語を対象とした人文翻訳ベンチマークデータセットであるIrokoBenchについて紹介する。
IrokoBenchを使って10のオープンおよび4つのプロプライエタリ言語モデルでゼロショット、少数ショット、および翻訳テストの設定(テストセットを英語に翻訳する)を評価します。
オープンモデルとプロプライエタリモデルの間には大きなパフォーマンスギャップが見られ、最高パフォーマンスのオープンモデルであるAya-101は、最高のパフォーマンスのプロプライエタリモデルであるGPT-4oのパフォーマンスの58%に過ぎません。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:23:08 GMT)
Efficient Exploration of the Rashomon Set of Rule Set Models [18.2] 解釈可能な機械学習における新たなパラダイムは、ほぼ最適性能を示すすべてのモデルの羅生門集合を探索することを目的としている。
ラショモン集合探索に関する既存の研究は、特定のモデルのクラスに対するラショモン集合の徹底的な探索に焦点を当てている。
本稿では,Rashomonのルールセットの集合を網羅的探索の有無で探索する手法を初めて提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:37:41 GMT)
Choice of PEFT Technique in Continual Learning: Prompt Tuning is Not All You Need [18.1] PEFT法としてプロンプトチューニングを選択することで,CLシステム全体の性能が損なわれることがわかった。
我々は,Pmpt と S-Prompt の学習という,最先端の2つの連続学習手法において,LoRA による即時チューニングを置き換える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:53:37 GMT)
Efficient User Sequence Learning for Online Services via Compressed Graph Neural Networks [18.1] グラフニューラルネットワーク(GNN)は、モデルシーケンス関係に広く適用され、類似したシーケンスから情報を抽出している。
本稿では,ユーザシーケンス表現学習のための関係モデリングにグラフ圧縮技術を導入するため,ECSeqという新しい統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:22:11 GMT)
A Neuro-Symbolic Framework for Answering Graph Pattern Queries in Knowledge Graphs [17.9] ほとんどのニューロシンボリッククエリプロセッサは木のようなグラフパターンクエリに制約されている。
不完全な知識グラフ上で任意のグラフパターンクエリに応答するフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:56:54 GMT)
Llumnix: Dynamic Scheduling for Large Language Model Serving [17.9] 大規模言語モデル(LLM)に対する推論は、その可能性を解き放つ鍵である。
Llumnixは、実行時再スケジューリングによって、不均一で予測不能な要求に応答するLLMサービスシステムである。
Llumnixはテールレイテンシを桁違いに改善し,高優先度要求を最大1.5倍高速化し,最大36%のコスト削減を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:20:18 GMT)
Paths towards time evolution with larger neural-network quantum states [17.8] 我々は、傾斜したイジングモデルにおいて、常磁性から反強磁性相への量子クエンチを考える。
両タイプのネットワークに対して、予測時間依存変動モンテカルロ法(p-tVMC)は、非計画的手法よりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:32:38 GMT)
Building Efficient and Effective OpenQA Systems for Low-Resource Languages [17.6] 低コストで効率的な OpenQA システムを低リソース環境向けに開発できることを示す。
主な要素は、機械翻訳されたラベル付きデータセットと関連する非構造化知識ソースを用いた、弱い監視である。
我々は,SQuAD2.0の機械翻訳であるSQuAD-TRを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:13:31 GMT)
UniAP: Unifying Inter- and Intra-Layer Automatic Parallelism by Mixed Integer Quadratic Programming [17.6] UniAPは、並列戦略の2つのカテゴリを共同で最適化し、最適解を見つけるための最初の並列手法である。
実験の結果、UniAPは最先端の手法よりもスループットが最大3.80$times$で、ストラテジー最適化の時間を最大107$times$で5つのTransformerベースのモデルで削減できることがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:44:44 GMT)
Unveiling Hidden Factors: Explainable AI for Feature Boosting in Speech Emotion Recognition [17.6] 音声感情認識(SER)は、メンタルヘルス、教育、人間とコンピュータの相互作用など、いくつかの応用分野から注目されている。
本研究では,機械学習モデルの性能向上のための特徴関連性と説明可能性を強調した,SERの反復的特徴増強手法を提案する。
提案手法の有効性をトロントの感情音声セット(TESS)、ベルリンの感情音声データベース(EMO-DB)、Ryersonの感情音声データベース(RAVDESS)、Surrey Audio-Visual Expressed Emotioned Emotion(SAVEE)データセットのSERベンチマークで検証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:21:55 GMT)
Iterative Feature Boosting for Explainable Speech Emotion Recognition [17.6] 本稿では,効率的な特徴工学手法に基づく新しい教師付きSER手法を提案する。
特徴の関連性を評価し,特徴セットを洗練させるために,結果の説明可能性に特に注意を払っている。
提案手法は,TESSデータセット上での感情認識において,ヒトレベルのパフォーマンス(HLP)および最先端の機械学習手法より優れる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:28:13 GMT)
The PESQetarian: On the Relevance of Goodhart's Law for Speech Enhancement [17.5] 本稿では,広く使用されているPSSQ尺度を利用した拡張モデルを提案する。
得られた3.82のPSSQ値は、VB-DMDベンチマークで「最先端」のPSSQ性能を示すが、我々の例では、計量をw.r.t.に最適化すると、同じ計量上で孤立した評価が誤解を招く可能性がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:07:39 GMT)
LLM as a Scorer: The Impact of Output Order on Dialogue Evaluation [17.4] 本研究では,大規模言語モデル(LLM)を用いた対話評価における即時設計の効果について検討する。
理由と得点の順序はLLMのスコアに大きく影響し,「理性優先」アプローチによりより包括的評価が得られた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:25:10 GMT)
Pruner-Zero: Evolving Symbolic Pruning Metric from scratch for Large Language Models [17.4] 我々は,遺伝的プログラミングを用いた記号的プルーニング指標の自動検索フレームワークを開発した。
特に、既存のプルーニング指標を含む精巧な探索空間を考案し、潜在的な記号的プルーニング指標を発見する。
このようにして、Pruner-Zeroはシンボリックプルーニングメトリクスの自動生成を可能にする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:25:23 GMT)
SAM-LAD: Segment Anything Model Meets Zero-Shot Logic Anomaly Detection [17.3] 視覚異常検出は、産業的欠陥検出や診断など、現実世界の応用において不可欠である。
我々は,任意のシーンにおける論理的異常検出のためのゼロショット・プラグイン・アンド・プレイフレームワークSAM-LADを提案する。
産業用データセットを含む様々なベンチマークを用いて,提案するSAM-LADを検証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:33:55 GMT)
Revisiting the Trade-off between Accuracy and Robustness via Weight Distribution of Filters [17.3] 敵対的攻撃はディープニューラルネットワーク(DNN)の潜在的な脅威であることが証明されている。
本稿では,Adversarial Weight-Varied Network (AW-Net) という,サンプルワイドな動的ネットワークアーキテクチャを提案する。
AW-Netは、敵ルータが生成する制御信号に基づいて、ネットワークの重みを適応的に調整する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:46:22 GMT)
Robust Prompt Optimization for Defending Language Models Against Jailbreaking Attacks [17.2] 大規模言語モデル(LLM)は敵の攻撃や脱獄に対して脆弱である。
本稿では,LLMをジェイルブレイク攻撃から守るための最適化に基づく目標と,堅牢なシステムレベルの防御を実現するアルゴリズムを提案する。
GPT-4の攻撃成功率(ASR)は6%,Llama-2の攻撃成功率(ASR)は0%に低下した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:39:54 GMT)
Training of Physical Neural Networks [16.8] 物理ニューラルネットワーク(PNN)は、物理系の特性を利用して計算を行うニューラルネットワークである。
PNNはいつか、AIシステムで何が可能で実用的なのかを根本的に変えるかもしれない。
大規模にPNNを訓練するために、バックプロパゲーションベースやバックプロパゲーションフリーアプローチを含む多くの手法が検討されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:28:04 GMT)
Buffered Asynchronous Secure Aggregation for Cross-Device Federated Learning [16.7] 本稿ではバッファ型非同期セキュアアグリゲーション(BASA)という新しいセキュアアグリゲーションプロトコルを提案する。
BASAはAFLと完全に互換性があり、各ユーザがユーザ間の同期通信に頼ることなく、サーバとの1ラウンドの通信しか必要としないという条件の下でセキュアなアグリゲーションを提供する。
BASAに基づいてハードウェアに余分な要求を伴わずにセキュアなアグリゲーションを実現する最初のAFL法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:39:32 GMT)
LLM-based Rewriting of Inappropriate Argumentation using Reinforcement Learning from Machine Feedback [16.6] 本稿では,議論における不適切な言語を計算的に緩和する方法について検討する。
コンテンツ保存と適切性のバランスをとるための強化学習に基づく書き直し手法を提案する。
絶対的および相対的評価研究において,報酬関数の重み付け方式について検討した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:18:08 GMT)
Does your data spark joy? Performance gains from domain upsampling at the end of training [16.6] 大規模なFLモデルスケールでのトレーニングにおけるドメイン固有のデータセットの影響を理解することは、費用がかかる。
ドメインアップサンプリングを使用して、さまざまなベンチマークを改善するために、個々のデータセットの有用性を大規模に特徴付ける。
このツールは、さまざまな事前トレーニングデータセットの影響を大規模に実験する機能を開放するが、完全な事前トレーニング実行に比べてコストが低い。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:29:15 GMT)
Efficient HDR Reconstruction from Real-World Raw Images [16.5] エッジデバイス上の高解像度スクリーンは、効率的な高ダイナミックレンジ(HDR)アルゴリズムに対する強い需要を刺激する。
多くの既存のHDRメソッドは不満足な結果をもたらすか、計算資源やメモリ資源を消費する。
本研究では,生画像から直接HDRを再構成し,新しいニューラルネットワーク構造を探索する優れた機会を見出した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:44:13 GMT)
Quantum Computing: Vision and Challenges [16.5] 本稿では,量子コンピューティングの現在の研究に基づく基礎とビジョンについて考察する。
本稿では,量子コンピュータハードウェアの最先端開発と量子暗号,量子ソフトウェア,高スケール性量子コンピュータの今後の進歩について論じる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:30:26 GMT)
BoNBoN Alignment for Large Language Models and the Sweetness of Best-of-n Sampling [16.4] 本稿では,大言語モデルからのサンプルを,ベスト・オブ・nドルサンプリングを用いてヒトの嗜好に合わせることの問題点について述べる。
基本モデルからKL距離に対する勝利率とのトレードオフの観点から,n$の最高値が本質的に最適であることを示す。
実験により,BoNBoNアライメントは基本方針に好適なモデルの生成において,大幅な改善をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:23:40 GMT)
Using GNN property predictors as molecule generators [16.3] グラフニューラルネットワーク(GNN)は、物質や分子特性を正確に予測する強力なツールとして登場した。
本稿では、これらのニューラルネットワークの可逆性を利用して、所望の電子特性を持つ分子構造を直接生成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:53:47 GMT)
Searching Priors Makes Text-to-Video Synthesis Better [16.3] 一般的なテキスト・ツー・ビデオ(T2V)生成プロセスを検索ベースで生成するパイプラインとして再構築する。
モデルトレーニングをスケールアップする代わりに、既存の動画を前向きのデータベースとして使用しています。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:53:28 GMT)
Active ML for 6G: Towards Efficient Data Generation, Acquisition, and Annotation [16.3] 本稿では,6Gネットワークにおけるアクティブ機械学習(ML)の統合について検討する。
受動的MLシステムとは異なり、アクティブMLはネットワーク環境と相互作用する。
我々は,能動学習に基づく6Gネットワークが計算効率を向上させる可能性を強調した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:29:05 GMT)
Remove that Square Root: A New Efficient Scale-Invariant Version of AdaGrad [16.2] 本稿では,複雑な機械学習タスクに一貫した適応アルゴリズムKATEを提案する。
我々はKATEと他の最先端適応アルゴリズムAdam AdaGradを比較し、異なる問題を持つ数値実験を行った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:13:02 GMT)
Synergistic Graph Fusion via Encoder Embedding [16.2] 共有集合を用いたマルチグラフ埋め込みのためのグラフ融合埋め込み法を提案する。
教師あり学習の枠組みの下では,本手法は顕著で,非常に望ましい相乗効果を示す。
我々の総合シミュレーションと実データ実験は,提案手法の有効性を裏付ける説得力のある証拠を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:26:44 GMT)
Synergistic Graph Fusion via Encoder Embedding [16.2] 共有集合を用いたマルチグラフ埋め込みのためのグラフ融合埋め込み法を提案する。
教師あり学習の枠組みの下では,本手法は顕著で,非常に望ましい相乗効果を示す。
我々の総合シミュレーションと実データ実験は,提案手法の有効性を裏付ける説得力のある証拠を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:26:44 GMT)
Explaining the Contributing Factors for Vulnerability Detection in Machine Learning [16.1] ソフトウェアリポジトリから脆弱性をマイニングし、機械学習技術を使ってソフトウェアの脆弱性を自動的に検出する傾向が増えている。
本研究では、異なる脆弱性機能と3つの代表的な機械学習モデルの組み合わせが、実際の17のプロジェクトにおいて、脆弱性検出の精度にどのように影響するかを検討する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:48:00 GMT)
Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives [16.1] 本稿では,POMDPにおける最大到達可能性確率問題(indefinite-horizon)と呼ばれる問題について検討する。
割引問題に対するポイントベース手法の成功に触発され,MRPPへの拡張について検討した。
本稿では,これらの手法の強みを有効活用し,信念空間を効率的に探索するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:33:50 GMT)
Towards Open-world Cross-Domain Sequential Recommendation: A Model-Agnostic Contrastive Denoising Approach [16.1] クロスドメインシーケンシャルレコメンデーション(CDSR)は、従来のシーケンシャルレコメンデーション(SR)システムに存在するデータ空間の問題に対処することを目的としている。
現実世界のレコメンデーションシステムでは、CDSRシナリオは通常、疎い振る舞いを持つ長い尾を持つユーザーの大多数と、一つのドメインにしか存在しないコールドスタートユーザーで構成される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:04:32 GMT)
Ranking Entities along Conceptual Space Dimensions with LLMs: An Analysis of Fine-Tuning Strategies [16.1] 我々は特に、与えられた概念空間次元に応じてエンティティをランク付けするタスクに焦点をあてる。
得られたモデルのランク付け能力が知覚的・主観的特徴に移行するかどうかを解析する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:42:40 GMT)
Synthetic Oversampling: Theory and A Practical Approach Using LLMs to Address Data Imbalance [16.0] 不均衡なデータと急激な相関は、機械学習とデータサイエンスにおける一般的な課題である。
過度に表現されていないクラスのインスタンス数を人工的に増加させるオーバーサンプリングは、これらの課題に対処するために広く採用されている。
我々は,大規模言語モデルの能力を活用して,少数グループを対象とした高品質な合成データを生成する,体系的なオーバーサンプリング手法であるOPALを紹介する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:24:26 GMT)
Log Parsing with Self-Generated In-Context Learning and Self-Correction [15.9] さまざまなログ解析手法が提案されているが、人為的なルールや限られたトレーニングデータによる学習ベースモデルに依存しているため、ログデータの進化に対する彼らのパフォーマンスは満足できないままである。
本稿では,自己生成型インコンテキスト学習(SG-ICL)と自己補正を併用したLLMを用いた効果的かつ適応的なログ解析フレームワークであるAdaを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:31:43 GMT)
A Quantum Neural Network-Based Approach to Power Quality Disturbances Detection and Recognition [15.8] 電力品質障害(PQD)は電力システムの安定性と信頼性に大きな影響を及ぼす。
本稿では,PQDの検出と認識のための改良型量子ニューラルネットワーク(QNN)モデルを提案する。
このモデルは、障害の検出、7つの単一障害の認識、10の混合障害の認識を含む実験で99.75%、97.85%、95.5%の精度を達成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:10:11 GMT)
Right to be Forgotten in the Era of Large Language Models: Implications, Challenges, and Solutions [15.7] Forgotten(RTBF)となる権利は、技術の進化の結果として最初に確立された。
近年のLarge Language Models (LLMs) は RTBF への準拠に新たな課題を提起している。
我々は、差分プライバシー、機械学習、モデル編集、ガードレールの使用など、RTBFの技術的ソリューションの実装方法を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:14:19 GMT)
Pushing the Limits of Zero-shot End-to-End Speech Translation [15.7] データ不足とテキストモダリティ間のモダリティギャップは、エンドツーエンド音声翻訳(ST)システムの2つの大きな障害である。
ゼロショットSTの手法であるZeroSwotを導入し、ペアSTデータを使わずにモダリティギャップをブリッジする。
実験の結果,STデータを使わずにモダリティギャップを効果的に塞ぐことが可能であること,MuST-CとCoVoSTで得られた結果が本手法の優位性を示している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:56:20 GMT)
Mixture of Gaussian-distributed Prototypes with Generative Modelling for Interpretable and Trustworthy Image Recognition [15.7] ガウス分布プロトタイプ(MGProto)の混合(mixture of Gaussian-Distributed Prototypes)と呼ばれるプロトタイプ分布を学習するための新しい生成パラダイムを提案する。
MGProtoは最先端の画像認識とOoD検出性能を実現し,解釈可能性の向上を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:03:02 GMT)
Robust Communication and Computation using Deep Learning via Joint Uncertainty Injection [15.7] コミュニケーションと計算の収束と機械学習と人工知能の統合は、第6世代通信システム(6G)の鍵となる力となる。
本稿では,空間多重化を用いた複数のデバイスを同時に運用する1つの基地局のネットワークについて考察する。
そこで本稿では,チャネル情報と計算状態情報の両面での不確実性の中で,通信と計算機のパワーを同時に管理する,革新的なディープラーニングベースのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:00:09 GMT)
Minimally Modifying a Markov Game to Achieve Any Nash Equilibrium and Value [15.7] 本稿では,ゲームデザイナや悪意ある相手がゼロサムマルコフゲームの報酬関数を変更するゲーム修正問題について検討する。
我々は、あるゲームのユニークな平衡としてインストールできるポリシープロファイルの集合を特徴づける。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:09:46 GMT)
Towards More General Video-based Deepfake Detection through Facial Feature Guided Adaptation for Foundation Model [15.6] 内部にリッチな情報をエンコードしたファンデーションモデルを適用することにより,新しいディープフェイク検出手法を提案する。
近年のパラメータ効率の良い微調整技術に触発されて,新しいサイドネットワーク型デコーダを提案する。
提案手法は,見知らぬディープフェイクサンプルの同定に優れた有効性を示し,顕著な性能向上を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:29:37 GMT)
Audio Mamba: Bidirectional State Space Model for Audio Representation Learning [15.5] 本稿では,音声分類のためのSSMベースモデルとして,自己注意のない初のAudio Mambaを紹介する。
我々は、AuMを6つの異なるベンチマークを含む様々なオーディオデータセットで評価し、同等またはより良いパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:00:59 GMT)
GENEVA: GENErating and Visualizing branching narratives using LLMs [15.4] textbfGENEVAはプロトタイプツールで、ストーリーラインの分岐と再収束を伴うリッチな物語グラフを生成する。
textbfGENEVAはゲーム開発、シミュレーション、その他のゲームライクな特性を持つアプリケーションを支援する可能性がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:59:27 GMT)
Shedding Light on Large Generative Networks: Estimating Epistemic Uncertainty in Diffusion Models [15.4] 生成拡散モデルは、その大きなパラメータ数(1億を超える)と高次元画像空間での操作で顕著である。
本研究では,拡散モデルに対する疫学的不確実性を推定するための新しいフレームワークであるDiffusion Ensembles for Capturing Uncertainty (DECU)を導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:03:21 GMT)
Distributional Adversarial Loss [15.3] 敵の攻撃に対して防衛する上での大きな課題は、単純な敵さえも実行可能な攻撃の巨大な空間である。
これにはランダムな平滑化手法が含まれており、敵の影響を除去するために入力にノイズを加える。
もう一つのアプローチは入力の離散化であり、敵の可能なアクションの数を制限する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:03:47 GMT)
Bi-Chainer: Automated Large Language Models Reasoning with Bidirectional Chaining [15.1] 本稿では,分岐オプションに遭遇した場合に,双方向チェイン方式であるBi-Chainerを提案する。
Bi-Chainerは,4つの挑戦的論理推論データセット上で,一方向チェインフレームワーク上での高精度ブートを実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:15:38 GMT)
MCTS: A Multi-Reference Chinese Text Simplification Dataset [15.1] 漢文の簡体化に関する研究は、古くからほとんど行われていない。
マルチ参照中国語テキスト単純化データセットであるMCTSを紹介する。
いくつかの教師なし手法と高度な大規模言語モデルの性能を評価する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:38:56 GMT)
On the Duality Between Sharpness-Aware Minimization and Adversarial Training [14.9] 対戦訓練(AT)は、敵の攻撃に対する最も効果的な防御の1つだが、必然的にクリーンな精度が低下している。
サンプルを摂動させる代わりに、SAM(Sharpness-Aware Minimization)はトレーニング中にモデルの重量を摂動させ、より平坦なロスランドスケープを見つける。
SAMのみを用いることで、敵の堅牢性を向上させることができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:39:57 GMT)
AFF-ttention! Affordances and Attention models for Short-Term Object Interaction Anticipation [14.7] 短期的オブジェクトインタラクション予測は、ユーザの目標を理解するためにウェアラブルアシスタントやヒューマンロボットのインタラクションに不可欠である。
我々は2つのコントリビューションでSTA予測の性能を改善した。
まず、フレーム誘導時間プーリング、デュアルイメージ・ビデオアテンション、マルチスケール機能融合を統合した新しいアテンションベースアーキテクチャであるSTAformerを提案する。
第2に、手と物体の軌跡の観測から相互作用ホットスポットを予測し、ホットスポット周辺に局在したSTA予測に対する信頼性を高める。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:34:47 GMT)
PreFLMR: Scaling Up Fine-Grained Late-Interaction Multi-modal Retrievers [14.7] 知識に基づく視覚質問応答(KB-VQA)のための広範囲なトレーニングおよび評価フレームワークM2KRを提案する。
我々はM2KRを用いて、KB-VQAに対する最近開発された細粒化遅延作用型マルチモーダルレトリバー(FLMR)の事前学習版であるPreFLMRを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:46:23 GMT)
Initialization-enhanced Physics-Informed Neural Network with Domain Decomposition (IDPINN) [14.7] 予測精度を向上させるために,新しい物理インフォームドニューラルネットワークフレームワークIDPINNを提案する。
我々は,いくつかの前方問題に対して数値的に評価し,IDPINNの利点を精度で実証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:03:45 GMT)
Graphon Mean Field Games with a Representative Player: Analysis and Learning Algorithm [14.6] 軽度の仮定でグラノン平衡の存在と特異性を証明し、この平衡を用いてネットワーク上の有限プレイヤーゲームに対する近似解を構築することができることを示す。
オンラインのオラクルフリー学習アルゴリズムは平衡を数値的に解くために開発され、その収束のためにサンプル複雑性解析が提供される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:51:23 GMT)
Label-Efficient Model Selection for Text Generation [14.6] DiffUseは、好みアノテーションに基づいた候補テキスト生成モデル間の情報決定を行う手法である。
何百ものモデルペアに対する一連の実験において、DiffUseは必要なアノテーション数を劇的に削減できることを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:26:18 GMT)
GenMorph: Automatically Generating Metamorphic Relations via Genetic Programming [14.4] GenMorphはJavaメソッドのメタモーフィックリレーション(MR)を自動的に生成するテクニックである。
進化的アルゴリズムを使って、有効なオーラクルを探索し、誤報を起こさず、テスト中のメソッドにソフトウェア欠陥を暴露する。
以上の結果から,GenMorphは23手法中18手法に対して有効MRを生成できる(突然変異スコアは20%)。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:05:21 GMT)
Automatically Generating Metamorphic Relations via Genetic Programming [14.4] GenMorphはJavaメソッドのメタモーフィックリレーション(MR)を自動的に生成するテクニックである。
進化的アルゴリズムを使って、有効なオーラクルを探索し、誤報を起こさず、テスト中のメソッドにソフトウェア欠陥を暴露する。
以上の結果から,GenMorphは23手法中18手法に対して有効MRを生成できる(突然変異スコアは20%)。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:05:21 GMT)
Conformal Validity Guarantees Exist for Any Data Distribution (and How to Find Them) [14.4] 理論上,共形予測はテキスト共同データ分布に拡張可能であることを示す。
最も一般的なケースは計算に実用的でないが、具体的には特定の共形アルゴリズムを導出するための手順を概説する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:49:11 GMT)
MoMo: Momentum Models for Adaptive Learning Rates [14.4] 我々は任意の運動量法で利用できる新しいPolyak型適応学習率を開発した。
我々はまず,SGD-Mのモーメントモデルに基づく適応学習率であるMoMoを開発した。
運動量に基づく手法と組み合わせてMoMoを利用できることを示すとともに,MoMo-Adamの開発によってこれを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:03:57 GMT)
Noisy Data Visualization using Functional Data Analysis [14.3] 動的プロセスのための関数情報幾何 (FIG) と呼ばれる新しいデータ可視化手法を提案する。
提案手法は,可視化のために設計されたEIGの変種よりも優れていることを示す。
次に、脳波による睡眠活動の測定を可視化するために、我々の手法を使用します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:53:25 GMT)
AROMA: Preserving Spatial Structure for Latent PDE Modeling with Local Neural Fields [14.2] 本稿では、局所的なニューラルネットワークを用いた偏微分方程式(PDE)のモデリングを強化するためのフレームワークであるAROMAを提案する。
我々のフレキシブルエンコーダ・デコーダアーキテクチャは、様々なデータタイプから空間物理場のスムーズな遅延表現を得ることができる。
拡散型定式化を用いることで、従来のMSEトレーニングと比較して安定性が向上し、ロールアウトが長くなる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:23:46 GMT)
VORTEX: Real-Time Off-Chain Payments and Cross-Chain Swaps for Cryptocurrencies [14.2] TEEベースのレイヤ2ソリューションであるVERTEXを,暗号の領域における2つの重要な課題に対処する。
支払い者は、オンチェーン関係や仲介チャネルを必要とせずに、誰にでも直接支払いを行うことができる。
これは、中央サーバーに頼ることなくリアルタイムのクロスチェーンスワップを可能にする、最初の既知のソリューションである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:57:09 GMT)
Mutual Information Guided Backdoor Mitigation for Pre-trained Encoders [14.2] 事前訓練されたエンコーダ上に構築された下流タスクは、ほぼ最先端のパフォーマンスを達成することができる。
バックドア緩和技術は 下流のタスクモデルのために設計されています
MIMICは、潜在的なバックドアエンコーダを教師ネットとして扱い、知識蒸留を用いて教師ネットからクリーンな学生エンコーダを蒸留する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:27:15 GMT)
Dream-in-Style: Text-to-3D Generation using Stylized Score Distillation [14.1] 本稿では,3次元オブジェクトをスタイルで生成する手法を提案する。
本手法は,入力としてテキストプロンプトとスタイル参照画像を取り,ニューラルラディアンス場を再構成して3次元モデルを合成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:27:34 GMT)
Task-Oriented Wireless Communications for Collaborative Perception in Intelligent Unmanned Systems [13.9] 協調的知覚は、無人システムにおいてより包括的で信頼性の高い環境認識を実現する大きな可能性を示している。
CP タスクの実装は,CP タスクの特性と無線チャネルのダイナミックスにより,依然として重要な課題に直面している。
通信方式とCP手順を協調的に最適化するタスク指向無線通信フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:22:19 GMT)
Do Llamas Work in English? On the Latent Language of Multilingual Transformers [13.9] 我々は、英語が支配するコーパスが、英語を内的ピボット言語として使っているかどうかを問う。
本研究は、独特な正しい単語継続を伴う英語でないプロンプトを慎重に構築する。
これらの結果を、3つの位相が「入力空間」、「概念空間」、「出力空間」で機能する概念モデルにキャストした。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:08:01 GMT)
Listenable Maps for Audio Classifiers [13.6] 本稿では,忠実で聞きやすい解釈を生成するポストホック解釈法であるリスナブル・マップ・フォー・オーディオ(L-MAC)を紹介する。
L-MACは、事前訓練された分類器の上のデコーダを使用して、入力オーディオの関連部分をハイライトするバイナリマスクを生成する。
L-MACは複数の勾配法やマスキング法よりも忠実な解釈を一貫して生成することを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:26:16 GMT)
Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models [13.5] 利用可能な最大規模でトレーニングされた最先端モデルの機能と推論能力の劇的な破壊を実演する。
モデルは間違った解に強い自信を表現し、しばしば非感覚的な「推論」のような説明を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:23:54 GMT)
Random matrix theory improved Fréchet mean of symmetric positive definite matrices [13.5] Fr'echet平均を推定するランダム行列理論に基づく手法を提案する。
人工脳波と実世界の脳波とハイパースペクトルデータの両方を含む評価の結果,我々は最先端の手法を大きく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:39:06 GMT)
IterMask2: Iterative Unsupervised Anomaly Segmentation via Spatial and Frequency Masking for Brain Lesions in MRI [13.4] 病理セグメント化に対する教師なし異常セグメンテーションアプローチは、健康な被験者の画像に基づいてモデルを訓練する。
正常な」トレーニングデータから逸脱するパターンを示すため、新しい画像にどの病理も「異常」として分類することを目指している。
本稿では,この問題を緩和するために,新しい空間マスク修復戦略であるIterMask2を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:17:23 GMT)
FREA: Feasibility-Guided Generation of Safety-Critical Scenarios with Reasonable Adversariality [13.2] 本稿では,新しい安全クリティカルシナリオ生成手法であるFREAを紹介する。
敵シナリオの合理的性を確保するためのガイダンスとして、AVの最も大きな実現可能な領域(LFR)が組み込まれている。
実験により、FREAは安全クリティカルなシナリオを効果的に生成し、かなりの近距離事象をもたらすことが示されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:26:15 GMT)
Which Side Are You On? A Multi-task Dataset for End-to-End Argument Summarisation and Evaluation [13.2] 本稿では,議論のための議論的エッセイを作成するエンドツーエンドの過程を捉えた議論マイニングデータセットを提案する。
私たちのデータセットには、上記のタスクをサポートするさまざまなプロパティで完全に注釈付けされたクレームの14万の例が含まれています。
ベンチマークでは,各タスクに対する有望な結果を示す一方で,4つのタスクすべてに対するエンドツーエンドのパフォーマンスが著しく低下していることが判明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:15:45 GMT)
AnoVox: A Benchmark for Multimodal Anomaly Detection in Autonomous Driving [13.0] AnoVoxは、コンテンツと時間的異常の両方を含む最初のベンチマークである。
正規性の形式的定義を提案し,従順なトレーニングデータセットを提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:46:15 GMT)
Unified PAC-Bayesian Study of Pessimism for Offline Policy Learning with Regularized Importance Sampling [13.0] 我々は、共通重み正規化に普遍的に適用される、トラクタブルなPAC-ベイジアン一般化を導入する。
本結果は,標準IW正則化手法の有効性を実証し,共通理解に挑戦するものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:32:14 GMT)
SLIFER: Investigating Performance and Robustness of Malware Detection Pipelines [12.9] アカデミアは、モデル1つまたはアンサンブル内の静的解析と動的解析を組み合わせることに焦点を当てる。
静的解析と動的解析の両方を逐次利用したWindowsのマルウェア検出パイプラインであるSLIFERを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:56:24 GMT)
Identifying latent state transition in non-linear dynamical systems [12.9] 本研究は,基礎となる低次元潜在状態とその時間進化を回復することにより,力学系の一般化と解釈可能性を向上させることを目的とする。
非線形ICAの進歩にインスパイアされた状態空間モデリングフレームワークを提案する。これは、潜在状態だけでなく、過去の状態を現在の状態にマッピングする未知の遷移関数も特定できる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:52:43 GMT)
StableSSM: Alleviating the Curse of Memory in State-space Models through Stable Reparameterization [12.7] 再パラメータ化のない状態空間モデルは従来のRNNと同様のメモリ制限を示す。
本分析では, 安定境界に収束するリカレント重みの結果として, この「記憶の帰結」を同定する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:15:16 GMT)
A Geometric View of Data Complexity: Efficient Local Intrinsic Dimension Estimation with Diffusion Models [12.6] 部分多様体の局所内在次元を推定することは長年の問題である。
拡散モデルに付随するフォッカー・プランク方程式は、LID推定器を提供することができる。
我々の推定器はFLIPDと呼ばれ、すべての一般的なDMと互換性があり、LID推定ベンチマークで既存のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:00:02 GMT)
Exploring Robustness in Doctor-Patient Conversation Summarization: An Analysis of Out-of-Domain SOAP Notes [12.6] 領域外データを用いた最先端の医師・患者間会話生成モデルの性能について検討する。
両構成における細調整型言語モデルとGPTの限界と強みを解析した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:11:20 GMT)
DRAGIN: Dynamic Retrieval Augmented Generation based on the Information Needs of Large Language Models [12.6] 大規模言語モデル(LLM)のリアルタイム情報要求に基づく動的検索拡張生成を導入する。
本フレームワークは,テキスト生成プロセスにおいて,LLMのリアルタイム情報要求に基づいて,いつ,何を取得するかを決定するように設計されている。
実験の結果,DRAGINは全タスクにおいて優れた性能を示し,本手法の有効性を実証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:44:59 GMT)
Space Decomposition for Sentence Embedding [12.5] 本稿では,MixSPと呼ばれる新しい埋め込み空間分解法を提案する。
上位と下位のサンプルを正確に識別・ランク付けするように設計されている。
実験の結果,MixSPは上位クラスと下位クラスの重複表現を著しく低減した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:20:10 GMT)
DriVLMe: Enhancing LLM-based Autonomous Driving Agents with Embodied and Social Experiences [12.5] DriVLMeは、人間と自動運転車のコミュニケーションを容易にするためのビデオ言語モデルに基づくエージェントである。
オープンループベンチマークとクローズドループヒューマンスタディの両方において競合性能を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:14:44 GMT)
Is Free Self-Alignment Possible? [12.4] AlignEZは、自己生成の好みデータと表現編集を使って、ほぼ無償でアライメントを提供する新しいアプローチである。
実験の結果、このほぼ無償の手順は、ベーストレーニング済みモデルとチューニング済みモデルの間のギャップを平均31.6%狭めることが判明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:35:17 GMT)
CR-UTP: Certified Robustness against Universal Text Perturbations on Large Language Models [12.4] ランダムな平滑化に基づく既存の証明されたロバスト性は、入力固有のテキスト摂動の証明にかなりの可能性を示している。
ナイーブな方法は、単にマスキング比とマスキング攻撃トークンの可能性を増大させることであるが、認証精度と認証半径の両方を著しく低下させる。
本研究では,マスキングにおいて高い認証精度を維持する優れたプロンプトを識別する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:53:01 GMT)
BWS: Best Window Selection Based on Sample Scores for Data Pruning across Broad Ranges [12.2] データサブセットの選択は、フルデータセットのトレーニングを近似できる大規模なデータセットの、小さくても情報に富むサブセットを見つけることを目的としている。
難易度スコアに基づいて順序付けされたサンプルから最適なウィンドウサブセットを選択する方法を提案することにより、普遍的で効率的なデータサブセット選択法であるBest Window Selection(BWS)を導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:33:09 GMT)
Gaussian Representation for Deformable Image Registration [12.2] パラメトリックな3次元ガウス制御点を用いた新しいDIR手法を提案する。
3次元医用画像間の空間場を明示的かつフレキシブルに表現する。
我々は4D-CT肺DIR-Labと心房性ACDCデータセットに対するアプローチを検証し,大幅に改善された処理時間2.43秒で平均目標登録誤差(TRE)を1.06mmとした。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:44:54 GMT)
Canonical Consolidation Fields: Reconstructing Dynamic Shapes from Point Clouds [12.2] 我々はCanonical Consolidation Fields(CanFields)を紹介する。
CanFieldsは、独立にサンプリングされた点雲の時系列を単一の変形コヒーレントな形状に再構成する方法である。
動的点雲の多種多様なベンチマークにおいて,本手法のロバスト性と精度を実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:07:55 GMT)
Generative Modeling with Flow-Guided Density Ratio Learning [12.2] Flow-Guided Density Ratio Learning (FDRL)は、生成モデルに対するシンプルでスケーラブルなアプローチである。
我々は,FDRLが128時間128ドルの高次元の画像を生成するとともに,既存の勾配流ベースラインを定量的なベンチマークで上回っていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:00:33 GMT)
Docs2KG: Unified Knowledge Graph Construction from Heterogeneous Documents Assisted by Large Language Models [12.0] エンタープライズデータの80%は非構造化ファイルに格納され、不均一なフォーマットに対応するデータレイクに格納される。
多様な異種文書からマルチモーダル情報を抽出する新しいフレームワークであるDocs2KGを紹介する。
Docs2KGは、抽出されたキー情報を表す統一知識グラフを生成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:35:59 GMT)
A Framework for Mapping Organisational Workforce Knowledge Profile in Cyber Security [11.9] 総合的なサイバーセキュリティの知識プロファイルを構築することは、大きな課題だ。
組織のサイバーセキュリティ知識を評価するための明確な方法論が欠如している。
我々は、組織の知識プロファイルを構築するために、CyBOKを活用するフレームワークを前進させる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:34:37 GMT)
DRED: Zero-Shot Transfer in Reinforcement Learning via Data-Regularised Environment Design [11.9] 本研究では,RLエージェントのゼロショット一般化能力(ZSG)に,個々の環境インスタンスやレベルのサンプリングがどう影響するかを検討する。
基本層を共有する深いアクター・クリティカルなアーキテクチャでは, エージェントの内部表現と, 生成したトレーニングデータのトレーニングレベルとの相互情報を最小限に抑える。
既存のUED手法は,ZSG性能の低いトレーニング分布を著しくシフトできることがわかった。
オーバーフィッティングと分散シフトの両面を防止するため,データ正規化環境設計(D)を導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:44:10 GMT)
Tiny models from tiny data: Textual and null-text inversion for few-shot distillation [11.8] ほとんどショット画像分類では、ごく少数のトレーニング例を使って画像の分類を行う。
近年の視覚基礎モデルでは、数発の転送能力は優れているが、推論では大きくて遅い。
本稿では,テキスト逆変換の多様性とNull-text逆変換の特異性を組み合わせた新しい拡散モデル逆変換法(TINT)を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:01:42 GMT)
Exploiting LMM-based knowledge for image classification tasks [11.8] 画像のセマンティック記述の抽出にはMiniGPT-4モデルを用いる。
本稿では,MiniGPT-4の生成する意味記述に対応するテキスト埋め込みを得るために,テキストエンコーダを付加的に使用することを提案する。
3つのデータセットに対する実験的な評価は,LMMに基づく知識を活用した分類性能の向上を実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:56:24 GMT)
From Inverse Optimization to Feasibility to ERM [11.7] パラメータの予測に付加的なコンテキスト情報を利用するコンテキスト逆設定について検討する。
合成および実世界の問題に対する我々のアプローチを実験的に検証し,既存手法と比較して性能が向上したことを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:38:37 GMT)
FILS: Self-Supervised Video Feature Prediction In Semantic Language Space [11.6] 本稿では,セマンティックビデオ表現を学習するための自己教師型アプローチを示す。
本稿では,意味言語空間における特徴予測手法であるFILSについて述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:44:06 GMT)
Are LLMs classical or nonmonotonic reasoners? Lessons from generics [11.6] 本研究では,7つのLLMの非単調推論能力を1つの抽象的および1つの常識的推論タスクで研究する。
LLMは人間の非単調な推論能力に従って推論パターンを示すが、ジェネリックスの真理条件に関する安定した信念を維持できない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:23:11 GMT)
Comparing Graph Transformers via Positional Encodings [11.6] グラフ変換器の識別能力は位置符号化の選択と密接に結びついている。
位置符号化には、絶対位置符号化(APE)と相対位置符号化(RPE)の2種類がある。
APE と RPE を用いたグラフトランスフォーマーは、パワーの区別の点で等価であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:35:24 GMT)
Comparing Graph Transformers via Positional Encodings [11.6] グラフ変換器の識別能力は位置符号化の選択と密接に結びついている。
位置符号化には、絶対位置符号化(APE)と相対位置符号化(RPE)の2種類がある。
APE と RPE を用いたグラフトランスフォーマーは、パワーの区別の点で等価であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:35:24 GMT)
Ethical Implications of ChatGPT in Higher Education: A Scoping Review [11.6] 本稿では,ChatGPTを高等教育に活用する上での倫理的課題について考察する。
英語,中国語,日本語の最近の学術論文をレビューすることで,本論文の深層的な検討とギャップの特定をめざした。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:42:20 GMT)
Is Knowledge All Large Language Models Needed for Causal Reasoning? [11.5] 本稿では,大規模言語モデル(LLM)の因果推論について,人工知能の進化における解釈可能性と信頼性を高めるために検討する。
本稿では,do-operativesを利用した新たな因果帰属モデルを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:12:02 GMT)
Dynamical topology of chiral and nonreciprocal state transfers in a non-Hermitian quantum system [11.5] 我々は、非エルミート・ハミルトニアンの例外点(EP)を閉じ込めたイオン系で囲むことで、トポロジカルキラルおよび非相互ダイナミクスを研究する。
これらの力学は、散逸によって引き起こされる非断熱過程においても、外部の摂動に対して位相的に堅牢である。
この結果は、オープン量子系のトポロジカルな性質を探求するための重要なステップである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:51:58 GMT)
Position: Quo Vadis, Unsupervised Time Series Anomaly Detection? [11.3] Timeseries Anomaly Detection (TAD)における機械学習奨学金の現状は、欠陥のある評価指標の持続的使用に悩まされている。
本稿は,TADにおける現状を批判的に分析し,現在の研究の誤解を招きかねない軌跡を明らかにした。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:12:17 GMT)
Distilling Aggregated Knowledge for Weakly-Supervised Video Anomaly Detection [11.3] ビデオ異常検出は、監視ビデオにおける異常事象を識別できる自動モデルを開発することを目的としている。
集約表現から比較的単純なモデルに知識を蒸留することで,最先端の性能が得られることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:44:42 GMT)
Prepared for the Worst: A Learning-Based Adversarial Attack for Resilience Analysis of the ICP Algorithm [11.2] 本稿では,ライダー点雲に対する深層学習に基づく攻撃により,ICPアルゴリズムのレジリエンスを評価する新しい手法を提案する。
提案した攻撃はICPに対して重大なポーズエラーを引き起こし、その88%以上でベースラインを上回ります。
例として、ICPが測定結果の破損に対して特に脆弱である地図上の領域を特定するために、我々の攻撃が有効であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:59:16 GMT)
BIPED: Pedagogically Informed Tutoring System for ESL Education [11.2] 大規模言語モデル(LLM)は、容易に利用でき、コスト効率の良い会話型知能チューニングシステム(CITS)として機能する大きな可能性を秘めている。
既存のCITSは、単純な概念だけを教えるか、多様な学習戦略に取り組むために必要な教育的な深さを欠くように設計されている。
バイリンガル PEDagogically-informed Tutoring dataset of one-on-one, human-to- Human English tutoring Interaction。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:49:24 GMT)
Locality-Sensitive Hashing-Based Efficient Point Transformer with Applications in High-Energy Physics [11.2] 本研究では,大規模クラウド処理に最適化された新しいトランスモデルを提案する。
本モデルは局所帰納バイアスを統合し,ハードウェアフレンドリーな正規演算とほぼ直線的な複雑性を実現する。
大規模クラウドデータに対するカーネル近似において,LSH(Locality-sensitive hashing),特にOR & AND-construction LSH(OR & AND-construction LSH)の優位性が示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:57:00 GMT)
A Combination Model Based on Sequential General Variational Mode Decomposition Method for Time Series Prediction [11.1] 我々は、金融時系列を予測する非線形な方法で、新しいSGVMD-ARIMA組合せモデルを構築した。
予測区間内では,従来の分解予測群モデルよりも利点が向上した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:35:38 GMT)
Compressed Federated Reinforcement Learning with a Generative Model [11.1] 強化学習は近年、前例のない人気を得たが、それでもサンプルの非効率さに悩まされている。
この課題に対処するため、フェデレーション強化学習(FedRL)が出現し、エージェントは局所的な推定を集約することで単一のポリシーを協調的に学習する。
通信効率のよいFedRL手法であるCompFedRLを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:04:47 GMT)
Multi-Microphone Speech Emotion Recognition using the Hierarchical Token-semantic Audio Transformer Architecture [11.1] 本研究では,音声感情認識(SER)アルゴリズムの性能劣化を緩和する新しい手法を提案する。
これらの課題に対処し、感情分類精度を向上させるために、マルチマイクロホン信号の処理を提案する。
我々のマルチマイクロフォンモデルは,実世界の残響環境において,単チャンネルベースラインよりも優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:50:59 GMT)
A Short and General Duality Proof for Wasserstein Distributionally Robust Optimization [11.0] 本稿では, 関東ロビッチ輸送コスト, 測定可能な損失関数, および有意な確率分布を抑えるような, 分散的ロバストな最適化のための一般化双対性結果を提案する。
我々は、ある可測射影と弱い可測選択条件が満たされている場合にのみ、交換可能性原理が成立することを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:49:35 GMT)
Solving Sharp Bounded-error Quantum Polynomial Time Problem by Evolution methods [10.9] 局所ハミルトニアンの基底状態の縮退は、物理学の多くの分野において重要である。
局所ハミルトニアン$kの基底状態を見つけることは、量子メルリンアーサーのより簡単な問題である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:00:22 GMT)
Automating Turkish Educational Quiz Generation Using Large Language Models [10.9] 本稿では、トルコ語教育文書の広範なコレクションを含む、トルコ・クイズ・インストラクト(トルコ語版)という専門的なデータセットを紹介する。
本研究は, GPT-4-Turbo, GPT-3.5-Turbo, Llama-2-7b-chat-hf, Llama-2-13b-chat-hfなどの大規模言語モデル(LLM)の機能を活用し,クイズ質問や回答を自動的に生成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:54:50 GMT)
Adaptively Perturbed Mirror Descent for Learning in Games [10.9] 本稿では,ペイオフ関数の勾配が単調なゲームにおいて,ミラーDescent(MD)アルゴリズムに対するペイオフ摂動手法を提案する。
その結果,アルゴリズムの収束が著しく加速していることが判明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:57:02 GMT)
Computational Limits of Low-Rank Adaptation (LoRA) for Transformer-Based Models [10.8] 変形器モデルにおけるローランド適応(LoRA)更新の計算限界について検討する。
我々のキーとなる観察は、LoRA適応の勾配計算における低ランク分解の存在がアルゴリズムの高速化につながることである。
我々は,LoRA勾配の階層的低ランク構造を利用して,LoRA適応のためのニアリニア近似アルゴリズムの存在を証明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:44:08 GMT)
Neural Topic Models with Survival Supervision: Jointly Predicting Time-to-Event Outcomes and Learning How Clinical Features Relate [10.7] 本稿では,生存予測モデル学習のためのニューラルネットワークフレームワークを提案する。
特に、各主題を「トピック」の分布としてモデル化する。
トピックの存在は、特定の臨床特徴が被験者に現れる可能性が高くなることを意味する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:45:55 GMT)
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning [10.6] まず,MSEによる過大評価現象を理論的に解析し,過大評価誤差の理論的上限を与える。
最後に、過小評価演算子と拡散ポリシーモデルに基づくオフラインRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:37:42 GMT)
Cooperative learning of Pl@ntNet's Artificial Intelligence algorithm: how does it work and how can we improve it? [10.6] PlantNetは、植物観察をアップロードし、注釈付けすることで、グローバルなデータ収集を可能にする。
合意を得ることはトレーニングには不可欠だが、収集された膨大なデータによって、従来のラベルアグリゲーション戦略が困難になる。
当社の戦略は,クラウドソースデータから植物種を識別する能力に基づいて,ユーザ毎の信頼スコアとしてユーザ専門性を推定する。
ユーザの知識の多様性に基づいて,ユーザのスキルを推定することで,ラベル付け性能が向上することが実証された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:12:29 GMT)
On the Universality of Coupling-based Normalizing Flows [10.5] 本稿では,RealNVP などの結合型正規化フローの分布定理を提案する。
容積保存正規化フローは普遍的ではなく、どの分布を学習するか、どのように表現性を修正するかを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:52:14 GMT)
Item-Language Model for Conversational Recommendation [10.3] ユーザインタラクション信号をエンコードするテキスト整列アイテム表現を生成するために,ILM(Item-Language Model)を提案する。
項目エンコーダにおける言語アライメントの重要性とユーザインタラクション知識の両立を実証する広範な実験を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:35:50 GMT)
Monotone, Bi-Lipschitz, and Polyak-Lojasiewicz Networks [10.2] 本稿では,バイリプシチブル・インバータブルニューラルネットワークであるBiLipNetを提案する。
リプシッツネスと逆リプシッツネスの両方を円滑に制御することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:52:51 GMT)
Representation Learning For Efficient Deep Multi-Agent Reinforcement Learning [10.2] 我々は,MARL訓練を補完するために考案された総合表現学習の形式を適用したMAPO-LSOを提案する。
特に、MAPO-LSOは遷移力学再構成と自己予測学習のマルチエージェント拡張を提案する。
実験の結果,MAPO-LSOはバニラMARLと比較して,サンプル効率と学習性能の顕著な向上を示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:11:44 GMT)
Rethinking Guidance Information to Utilize Unlabeled Samples:A Label Encoding Perspective [10.2] 経験的リスク最小化(ERM)は、ラベル付きサンプルが不十分なシナリオでは脆弱である。
本稿では,ラベルリスク最小化(LERM)を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:22:54 GMT)
Image Copy-Move Forgery Detection and Localization Scheme: How to Avoid Missed Detection and False Alarm [10.1] 画像コピー-ムーブ(英: Image copy-move)は、画像の一部が同じ画像の別の部分に置き換えられる操作であり、違法な目的に使用できる。
近年の研究では、キーポイントに基づくアルゴリズムは、優れた、ロバストなローカライゼーション性能を達成している。
しかし、入力画像が低解像度である場合、既存のキーポイントベースのアルゴリズムのほとんどは、十分なキーポイントを生成するのが困難である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:50:29 GMT)
QJL: 1-Bit Quantized JL Transform for KV Cache Quantization with Zero Overhead [10.1] LLMをシリアル化するには、KVキャッシュにキーバリューの埋め込みを格納する必要があるため、かなりのメモリを必要とする。
従来の量子化法は、量子化定数を保存する必要があるため、大きなメモリオーバーヘッドに直面している。
ジョンソン-リンデンシュトラウス変換とサインビット量子化を組み合わせた新しい量子化手法であるQJLを導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:42:05 GMT)
From Tarzan to Tolkien: Controlling the Language Proficiency Level of LLMs for Content Generation [10.0] 本稿では,この課題に対するいくつかの重要なアプローチの有効性を評価する。
この結果から,プロンプトベース戦略を用いた場合,GPT-4とオープンソースモデルの間に大きな性能差があることが判明した。
我々の最良のモデルであるCALM (CEFR-Aligned Language Model) は、GPT-4やその他の戦略の性能をほんの少しのコストで上回ります。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:57:17 GMT)
PatentEval: Understanding Errors in Patent Generation [10.0] 本稿では,機械が生成する特許文書において,2つの異なるタスクを評価するために特別に設計された包括的エラータイプポロジーを紹介する。
我々はまた,この文脈で言語モデルを体系的に評価するためのベンチマークであるPatentEvalを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:55:27 GMT)
Detecting Model Misspecification in Amortized Bayesian Inference with Neural Networks: An Extended Investigation [10.0] 本研究では、教師なしの方法で訓練し、テスト時にモデルの誤特定を確実に検出できる新しい誤特定尺度を提案する。
提案手法は,不審な出力をユーザに警告し,予測が信頼できない場合に警告を発し,モデル設計者がより良いシミュレータを探索する際の指針となることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:30:16 GMT)
Optical read and write of spin states in organic diradicals [9.9] 有機分子半導体はスピン配置の合成制御を提供する。
ダイラディカル分子におけるスピン光学的アドレナビリティの発見を報告する。
結果は、これらの調整可能なオープンシェル有機分子を、テーラーメイドのスピン光学界面を設計するためのプラットフォームとして確立する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:18:24 GMT)
The Good, the Bad, and the Hulk-like GPT: Analyzing Emotional Decisions of Large Language Models in Cooperation and Bargaining Games [9.8] 本稿では,Large Language Models (LLMs) の意思決定に関する新しい方法論を紹介する。
感情がLLMのパフォーマンスに大きく影響を与え、より最適な戦略の開発につながることを示す。
驚くべきことに、感情的な刺激、特に怒りの感情は、GPT-4の「超人的」アライメントを妨害する可能性がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:08:54 GMT)
CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning [9.5] 大規模言語モデル(LLM)には、幅広い基礎知識と適度な推論能力がある。
LLM生成したプランを一定の制約で特定のロボットに実行させることは困難である。
本稿では,LLM と Answer Set Programming (ASP) を結合して制限を克服するアプローチである CLMASP を紹介する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:21:44 GMT)
How to Construct Quantum FHE, Generically [9.5] 我々は、$mathsfNC1$で復号した(コンパクトな)量子完全同型暗号スキームを構築する。
さらなる貢献として、グループアクションから2モードのトラップドア関数が新たにインスタンス化されることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:32:15 GMT)
Enhancing the Resilience of Graph Neural Networks to Topological Perturbations in Sparse Graphs [9.4] 本稿では,トポロジ駆動ラベル伝搬,ベイズラベル遷移,ランダムウォークによるリンク解析を組み合わせた新しいラベル推論フレームワークTraTopoを提案する。
TraTopoは、ランダムウォークサンプリング(特にリンク予測のために孤立ノードをターゲットとする)を活用することで、スパースグラフの先駆者を大幅に上回っている。
経験的評価では、ノード分類におけるTraTopoの優位性が強調され、現在のGCNモデルよりも精度が高い。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:40:08 GMT)
PrE-Text: Training Language Models on Private Federated Data in the Age of LLMs [9.4] PrE-Text合成データは、デバイス上で訓練された小さなモデルよりも優れていることを示す。
また,PrE-TextのDP合成データを用いて大規模モデルを微調整することで,大規模言語モデル(LLM)の性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:27:02 GMT)
KerasCV and KerasNLP: Vision and Language Power-Ups [9.4] KerasCVとKerasNLPはコンピュータビジョンと自然言語処理のためのKeras APIの拡張である。
これらのドメインパッケージは、使いやすさとパフォーマンスを重視した高速な実験を可能にするように設計されている。
ライブラリは完全にオープンソース(Apache 2.0ライセンス)で、GitHubから入手できる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:52:07 GMT)
Optimization without Retraction on the Random Generalized Stiefel Manifold [9.3] 本稿では,B$のランダムな推定値にのみアクセスしながら,最適化問題を解く,安価な反復法を提案する。
我々の方法はすべての反復において制約を強制するのではなく、予想で定義される一般化されたスティーフェル多様体上の臨界点に収束する反復を生成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:27:17 GMT)
Enhanced Classification of Heart Sounds Using Mel Frequency Cepstral Coefficients: A Comparative Study of Single and Ensemble Classifier Strategies [9.3] 本稿では,Mel Frequency Cepstral Coefficients (MFCCs) の有用性について検討した。
単一分類法とアンサンブル分類法という2つの分類法が用いられた。
その結果,アンサンブル分類法は単一分類法に比べて精度が高かった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:40:49 GMT)
EffiVED:Efficient Video Editing via Text-instruction Diffusion Models [9.3] EffiVEDは、命令誘導ビデオ編集をサポートする効率的な拡散ベースモデルである。
我々は、膨大な画像編集データセットとオープンワールドビデオを、EffiVEDをトレーニングするための高品質なデータセットに変換する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:05:15 GMT)
FedStaleWeight: Buffered Asynchronous Federated Learning with Fair Aggregation via Staleness Reweighting [9.3] 非同期フェデレートラーニング(AFL)メソッドは、最も遅いエージェントによる非同期フェデレーションに代わる、有望な代替手段として登場した。
AFLモデルでは、更新を高速に生成できるエージェントに対して、遅いエージェントを残してトレーニングを行う。
我々はFedStaleWeightを紹介した。これは非同期クライアント更新の集約に、平均安定化を利用して公平な再重み付けを計算するアルゴリズムである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:52:22 GMT)
A Shocking Amount of the Web is Machine Translated: Insights from Multi-Way Parallelism [9.2] ウェブ上のコンテンツは、しばしば多くの言語に翻訳されることを示し、これらのマルチウェイ翻訳の低品質は、機械翻訳(MT)を用いて作成された可能性が高いことを示している。
また、多くの言語に翻訳されるコンテンツの種類の選択バイアスの証拠も見出され、低品質の英語コンテンツがMTを介して多くの低リソース言語に翻訳されるのと一致している。
私たちの研究は、Webから取り除かれたモノリンガルデータとバイリンガルデータの両方について、多言語大言語モデルのようなトレーニングモデルに関する深刻な懸念を提起します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:49:57 GMT)
Exploring Higher Order Structures in Graph Explanantions [9.2] 細胞複合体を用いて高次構造を捕捉するフレームワークHOGEを紹介する。
現実世界では、高次構造は分子やソーシャルネットワークのようにユビキタスである。
本研究は,グラフ説明の実用性を大幅に向上させるものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:31:30 GMT)
Global Clipper: Enhancing Safety and Reliability of Transformer-based Object Detection Models [9.1] 推論中にビットフリップを引き起こすソフトエラーは、性能に大きく影響を与え、予測を変える。
本研究は,トランスフォーマーモデルに特化して設計された効果的な緩和戦略であるGlobal ClipperとGlobal Hybrid Clipperを紹介する。
ソフトエラーに対するレジリエンスを大幅に向上させ、欠陥推論を0%に削減する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:06:17 GMT)
RevRIR: Joint Reverberant Speech and Room Impulse Response Embedding using Contrastive Learning with Application to Room Shape Classification [8.9] 本稿では,音声の発話から直接部屋パラメータを推定しやすくするデュアルエンコーダアーキテクチャを提案する。
音声と音響応答を同時に埋め込むために、コントラッシブ・ロス・エンコーダ関数を用いる。
テスト段階では、残響発話のみが利用可能であり、その埋め込みはルーム形状分類のタスクに使用される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:13:55 GMT)
Harder or Different? Understanding Generalization of Audio Deepfake Detection [8.9] 最近の研究は、音声のディープフェイク検出における重要な課題を強調している。
これは、テキスト音声(TTS)モデルの品質が継続的に向上していること、すなわち、より新しいDeepFakesは単に'ハード'で検出できるのか?
ドメイン内テストデータとドメイン外テストデータのパフォーマンスギャップを'ハードネス'と'ディファレンス'コンポーネントに分解することで、この問題に答える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:33:15 GMT)
Pairwise Ranking Loss for Multi-Task Learning in Recommender Systems [8.8] オンライン広告システムでは、Click-Through Rate (CTR) や Conversion Rate (CVR) といったタスクが同時に MTL 問題として扱われることが多い。
本研究では,変換に対応する露光ラベルを決定指標とみなす。
モデル予測間でのtextbfairtextbfwise textbf ranking(PWiseR)損失を計算し、タスク固有の損失を新たに導入する。
論文参考訳(メタデータ) (Wed, 05 Jun 2024 05:17:08 GMT)
CGELBank Annotation Manual v1.1 [8.8] CGELBankは、ケンブリッジ・グラマー・オブ・イングリッシュ(Cambridge Grammar of the English)から派生した英語の構文形式に基づくツリーバンクおよび関連ツールである。
この文書はCGELBankアノテーションスキームの特異性を概説している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:14:37 GMT)
Improving Users' Passwords with DPAR: a Data-driven Password Recommendation System [8.8] データ駆動型PAssword RecommendationシステムDPARを提案する。
流出した9500万のパスワードのデータセットに基づいて、DPARはパスワードレコメンデーションを生成する。
DPARはパスワードの強度を平均34.8ビット増加させ、パスワードをリコールする能力に大きな影響を与えなかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:19:24 GMT)
Which exceptional low-dimensional projections of a Gaussian point cloud can be found in polynomial time? [8.7] 反復アルゴリズムのクラスで実現可能な分布のサブセット$mathscrF_m,alpha$について検討する。
統計物理学の非厳密な手法は、一般化されたパリの公式の言葉で$mathscrF_m,alpha$の間接的な特徴づけを与える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:54:56 GMT)
Enhancing Repository-Level Code Generation with Integrated Contextual Information [8.6] CatCoderは静的型付けプログラミング言語用に設計された新しいコード生成フレームワークである。
CatCoderは、関連するコードと型コンテキストを統合することで、リポジトリレベルのコード生成を強化する。
CatCoderは、pass@kスコアの点で、RepoCoderベースラインを最大17.35%上回っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:56:42 GMT)
Large Language Models as In-context AI Generators for Quality-Diversity [8.6] In-context QDは、QDアーカイブから品質の異なる例をコンテキストとして、少数ショットと多ショットのプロンプトを使って興味深いソリューションを生成することを目的としている。
In-context QD display promising results than both QD baselines and similar strategy developed for single-jective optimization。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:40:08 GMT)
A comprehensive and FAIR comparison between MLP and KAN representations for differential equations and operator networks [8.6] Kolmogorov-Arnold Networks (KAN) は、最近標準表現モデルに代わる表現モデルとして導入された。
そこで我々はkansを用いて機械学習モデル(PIKAN)とDeep operatorモデル(DeepokaN)を構築し、前方および逆問題に対する微分方程式を解く。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:10:36 GMT)
Solution Concepts in Hierarchical Games under Bounded Rationality with Applications to Autonomous Driving [8.5] 階層型ゲームを用いた運転行動のゲーム理論モデルを作成する。
本研究では,自然主義データに適合するモデルと,その予測能力に基づいて行動モデルを評価する。
以上の結果から, 運転行動モデルとして評価された動作モデルのうち, レベル0の振る舞いをルールフォローとしてモデル化したQuantal Level-kモデルの適応として, 運転行動のモデル化が, 自然主義的な運転行動に最も適していることが示唆された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:28:42 GMT)
Document-level Claim Extraction and Decontextualisation for Fact-Checking [8.5] ファクトチェックのための文書レベルのクレーム抽出手法を提案する。
文書から中心文を識別するために,まずクレーム抽出を抽出要約として再放送する。
次に、文の非コンテクスト化を通じて、原文から必要なコンテキストを含むように書き直します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:16:46 GMT)
Fault Tolerant ML: Efficient Meta-Aggregation and Synchronous Training [8.4] 分散機械学習(ML)システムにおけるビザンチン・ロバスト学習の挑戦的枠組みについて検討する。
最初のコントリビューションは,ベースラインアグリゲータを最適なパフォーマンスレベルにアップグレードする,効率的なメタアグリゲータの導入です。
本稿では,ビザンチン・ロバスト訓練の理論的および実践的優位性,特にチューニングプロセスの簡略化について述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:32:31 GMT)
Text-to-Events: Synthetic Event Camera Streams from Conditional Text Input [8.4] イベントカメラは、低レイテンシとスパース出力応答を持つ視覚センサーを必要とするタスクに有利である。
本稿では,テキスト・ツー・Xモデルを用いてラベル付きイベント・データセットを新たに作成する方法を報告する。
本モデルでは,異なる文文によって引き起こされる人間のジェスチャーのリアルなイベントシーケンスを生成できることを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:34:12 GMT)
MMCL: Boosting Deformable DETR-Based Detectors with Multi-Class Min-Margin Contrastive Learning for Superior Prohibited Item Detection [8.2] X線画像における禁止項目検出は、最も効果的なセキュリティ検査方法の1つである。
X線画像における特異な現象が重なり合うと、前景と背景の特徴が結合する。
コンテンツクエリのカテゴリ意味情報を明らかにするために,Multi-class Min-Margin Contrastive Learning (MMCL)法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:07:58 GMT)
Stochastic Diffusion: A Diffusion Probabilistic Model for Stochastic Time Series Forecasting [8.2] 本稿では,データ駆動型事前知識を各ステップで学習する新しい拡散(StochDiff)モデルを提案する。
学習された事前知識は、複雑な時間的ダイナミクスとデータ固有の不確実性を捉えるのに役立つ。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:13:38 GMT)
EgoSurgery-Tool: A Dataset of Surgical Tool and Hand Detection from Egocentric Open Surgery Videos [8.1] EgoSurgery-Phaseデータセットの拡張であるEgoSurgery-Toolを紹介する。
EgoSurgery-Toolは15のカテゴリにまたがる49K以上の手術用ツールで構成され、大規模な手術用ツール検出データセットを構成する。
9つの一般的な物体検出器を用いてEgoSurgery-Toolの包括的解析を行い,手術器具と手指検出の両面での有効性を検証した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:36:15 GMT)
Computation-Efficient Era: A Comprehensive Survey of State Space Models in Medical Image Analysis [8.1] 状態空間モデル(SSM)は、最近、シーケンシャルなモデリングと視覚的表現学習において大きな関心を集めている。
コンピュータービジョンの進歩に乗じて、医療画像はMambaモデルによる新しい時代を告げた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:29:03 GMT)
Analysis of Utterance Embeddings and Clustering Methods Related to Intent Induction for Task-Oriented Dialogue [8.1] 本研究では,タスク指向のダイアログスキーマの設計における課題を克服するための教師なしアプローチについて検討する。
意図の自動誘導には,(1)インテントラベリングのためのクラスタリングアルゴリズム,(2)ユーザ発話の埋め込み空間の2つの因果関係を仮定する。
クラスタリングによる事前学習したMiniLMは,NMI,ARI,F1,精度,インテント誘導タスクにおけるサンプルカバレッジを著しく向上させた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:14:42 GMT)
Ranking Manipulation for Conversational Search Engines [8.0] 本稿では,対話型検索エンジンが参照するソースのランク付け順序に対するインジェクションのインジェクションの影響について検討する。
低品位製品を確実に促進する攻撃木を用いた脱獄技術を提案する。
これらの攻撃は、Perplexity.aiのような最先端の会話検索エンジンに効果的に転送される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:14:21 GMT)
Hire: Hybrid-modal Interaction with Multiple Relational Enhancements for Image-Text Matching [7.8] 画像テキストマッチング(ITM)はコンピュータビジョンの基本的な問題である。
画像テキストマッチングのためのマルチエンハンスメント(termed textitHire)を用いたハイブリッドモーダル機能を提案する。
特に、明示的なモーダル空間意味グラフに基づく推論ネットワークは、視覚オブジェクトの文脈表現を改善するために設計されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:10:55 GMT)
Large Language Model Meets Graph Neural Network in Knowledge Distillation [7.7] サービス指向アーキテクチャにおけるQoS(Quality of Service)を予測するための時間認識フレームワークを提案する。
提案するTOGCLフレームワークは,複数のメトリクスにわたって最先端のメソッドを著しく上回り,最大38.80%の改善を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:38:12 GMT)
Style Mixture of Experts for Expressive Text-To-Speech Synthesis [7.7] 本稿では、スタイルエンコーダによってモデル化された埋め込み空間を、スタイルエキスパートによって処理される抽出可能なサブセットに分割するアプローチであるStyleMoEを紹介する。
提案手法の有効性を客観的かつ主観的に実証し,多様かつ不明瞭なスタイルに対するスタイル空間のカバー範囲を拡大する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:17:47 GMT)
Dynamic Spectral Clustering with Provable Approximation Guarantee [7.7] 本論文は, クラスタ構造が緩やかな条件下では, 最終グラフ$G_T$のクラスタはスペクトルクラスタリングアルゴリズムの動的変種によってよく近似できることを示した。
合成と実世界の両方のデータセットに関する実験的研究により、我々の設計したアルゴリズムの実用性がさらに裏付けられる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:16:55 GMT)
TSPDiffuser: Diffusion Models as Learned Samplers for Traveling Salesperson Path Planning Problems [7.6] 旅行セールスパーソンパス計画問題(TSPPP)のための新しいデータ駆動パスプランナを提案する。
障害物マップ内の目的地の集合を考慮に入れれば、最も短い衝突のない経路を効率的に見つけることが目的である。
我々は,TSPPP インスタンスの集合とその各ソリューション上で拡散モデルを訓練し,未知の問題インスタンスに対する可塑性経路を生成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:15:55 GMT)
When Spiking neural networks meet temporal attention image decoding and adaptive spiking neuron [7.5] スパイキングニューラルネットワーク(SNN)は、生物学的に妥当な方法で時間情報をエンコードし、処理することができる。
本稿では,時間的注意(TAID)に基づく画像復号法と適応型Leaky-Integrate-and-Fireニューロンモデルを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:21:55 GMT)
A Combination Model for Time Series Prediction using LSTM via Extracting Dynamic Features Based on Spatial Smoothing and Sequential General Variational Mode Decomposition [7.4] 本稿では,Sequential General VMDと空間平滑化Long短期記憶ニューラルネットワーク(SS-LSTM)の組み合わせモデルに基づく市場販売量の時系列予測手法を提案する。
季節的・周期的な傾向によるデータ予測実験の結果, 特定の市場状況において, より高い価格予測精度とより正確な精度が得られることが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:00:03 GMT)
Too Big to Fail: Larger Language Models are Disproportionately Resilient to Induction of Dementia-Related Linguistic Anomalies [7.2] より大型のGPT-2モデルでは、マスキングによる劣化の程度を示すために、被マスキング/被マスキングを行うために、不均等に多くの注意ヘッドを必要とすることが示されている。
これらの結果から, トランスフォーマーモデルにおける注意機構は, 認知と脳保護の概念に類似している可能性が示唆された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:31:50 GMT)
EdgeSync: Faster Edge-model Updating via Adaptive Continuous Learning for Video Data Drift [7.2] リアルタイムビデオ分析システムは一般的に、レイテンシを低減するためにエッジデバイスに重みを減らしたモデルを配置する。
映像コンテンツの特徴の分布は時間とともに変化し、既存のモデルの精度が低下する。
最近の研究は、リモートサーバを使用して、複雑なモデルの助けを借りて、エッジで軽量モデルを継続的にトレーニングし、適応するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:06:26 GMT)
Learning Low-dimensional Latent Dynamics from High-dimensional Observations: Non-asymptotics and Lower Bounds [7.2] 我々は,低次元潜在変数を持つ線形時間不変モデル(LTI)の学習に焦点をあてるが,高次元観測は行わない。
我々は,観測者の列空間のような高次元の特徴を復元し,データを低次元に埋め込み,低次元モデルパラメータを学習するアルゴリズムを提案する。
その後、メタデータセットからLTIシステムの学習を容易にするエンド・ツー・エンドのアルゴリズムが提案される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:53:34 GMT)
CommonPower: Supercharging Machine Learning for Smart Grids [7.1] PythonツールのCommonPowerは、これらのニーズに対処する最初のモジュラーフレームワークである。
CommonPowerはシングルエージェントとマルチエージェントのRLトレーニングアルゴリズムのための統一インターフェースを提供する。
システム方程式の記号表現に基づくモデル予測制御アプローチが組み込まれている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:06:52 GMT)
Code Comparison Tuning for Code Large Language Models [7.0] コード大言語モデル(Code LLM)の単純かつ効果的なチューニング手法であるコード比較チューニング(CCT)を提案する。
CCTは、トークンレベルとシーケンスレベルの両方において、比較の概念を命令チューニングに統合する。
CCTがpass@1スコアの命令チューニングを最大4ポイント上回っていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:00:08 GMT)
Analysis of Multi-Source Language Training in Cross-Lingual Transfer [7.0] 言語間移動(XLT)法はこのデータ不足問題に対処するのに寄与している。
XLT(Multi-Source Language Training (MSLT)-leads)と呼ばれる手法における複数のソース言語の使用により、異なる言語に対する埋め込み空間のミキシングが増加することを示す。
一方,任意の組み合わせのソース言語を使用することで,性能が常に向上するとは限らないことが判明した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:23:55 GMT)
FUSU: A Multi-temporal-source Land Use Change Segmentation Dataset for Fine-grained Urban Semantic Understanding [6.8] 都市セマンティック理解のためのマルチソース・マルチ時間変化セグメンテーションデータセットであるFUSUを紹介する。
FUSUは、これまでで最も詳細な土地利用分類システムであり、17のクラスと300億ピクセルのアノテーションがある。
20-50cmの地上サンプルと月847km2の光学・レーダー衛星時系列の両時間高解像度衛星画像を含む。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:13:03 GMT)
Learning Long Range Dependencies on Graphs via Random Walks [6.8] この研究は、ランダムウォークとメッセージパッシングを組み合わせることによって、両方のメソッドの制限を克服する新しいアーキテクチャであるNeuralWalkerを提案する。
NeuralWalkerは19のグラフとノードベンチマークデータセットで大幅なパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:36:57 GMT)
Discovering Bias in Latent Space: An Unsupervised Debiasing Approach [6.7] 基礎モデルの質問応答能力は、変化を促すために非常に敏感である。
モデルの内部表現において、このバイアスを直接修正することを提案する。
実験により,SteerFairは命令調整によるモデル性能のバラツキを大幅に低減することを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:29:09 GMT)
Error-preserving Automatic Speech Recognition of Young English Learners' Language [6.5] 言語学習者が実践しなければならない中心的なスキルの1つは、言語を話すことである。
近年の音声技術と自然言語処理の進歩は、彼らの発話スキルを実践する新しいツールの開発を可能にしている。
そこで我々は,若手学習者による自然発話に対処し,誤りを抑えるASRシステムを構築した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:15:37 GMT)
Prediction-powered Generalization of Causal Inferences [6.4] 実験の規模が限られていることが,一般化を統計的に実現不可能な課題にしていることを示す。
我々は、さらなる観察研究から得られた予測モデルを用いて、試行データを補う一般化アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:44:14 GMT)
Revisiting Scalable Hessian Diagonal Approximations for Applications in Reinforcement Learning [6.4] 二次情報は多くのアプリケーションにとって価値があるが、計算は困難である。
BL89よりも改善されたHesScaleを導入し、無視できる余分な計算を追加した。
小さなネットワークでは、この改善は全ての代替品よりも高い品質であり、不偏性のような理論的保証のあるものでさえも計算がより安価である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:53:20 GMT)
Characterising the Creative Process in Humans and Large Language Models [6.4] 本研究では,人間とLLMが交互利用課題における意味空間を探索する方法を自動評価する手法を提案する。
文埋め込みを用いて応答カテゴリを識別し、ジャンププロファイルを生成するために使用する意味的類似性を計算する。
我々の結果は、人間における初期の研究と、永続性(意味空間の深部探索)と柔軟性(複数の意味空間を横断する広部探索)の両方を創造性に反映している。
人口としてのLSMは人間のプロファイルと一致するが、創造性との関係は異なる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:15:43 GMT)
Deconstructing the Goldilocks Zone of Neural Network Initialization [6.3] 等質ニューラルネットワークにおけるGoldilocksゾーンの包括的解析について述べる。
本研究では, 正曲率の過大さをモデル信頼度, 初期損失の低さ, 以前は知られていなかったクロスエントロピー損失勾配に関連付ける。
私たちは、強力なモデルパフォーマンスがGoldilocksゾーンと完全に一致していないことに気付き、この関係についてさらなる研究を要求します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:44:31 GMT)
Topological Neural Networks go Persistent, Equivariant, and Continuous [6.3] 我々は,GNN/TNNとPHの交差において,様々な手法を仮定し,統一するフレームワークとしてTopNetsを紹介した。
TopNetは、抗体設計、分子動力学シミュレーション、薬物特性予測など、さまざまなタスクで強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:56:54 GMT)
A Solution for Commercializing, Decentralizing and Storing Electronic Medical Records by Integrating Proxy Re-Encryption, IPFS, and Blockchain [6.2] 本稿では,EVM互換のブロックチェーンとIPFSを用いた分散ストレージを実現するための革新的なソリューションを提案する。
プライバシとコントロールを確保するため,医療データマーケットプレースでは,PRE(Proxy Re-Encryption)という暗号認証方式を採用しています。
ブロックチェーンのスマートコントラクトとIPFSを通じて、ユーザの健康データに対するコントロールを強化し、医療記録の整合性とプライバシを保護する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:56:53 GMT)
SPIN: Sparsifying and Integrating Internal Neurons in Large Language Models for Text Classification [6.2] 本稿では,テキスト分類のための大規模言語モデルの中間層の内部ニューロンを分散・統合するモデルに依存しないフレームワークを提案する。
SPINはテキスト分類の精度、効率、解釈可能性を大幅に改善する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:15:47 GMT)
Enhancing Consistency and Role-Specific Knowledge Capturing by Rebuilding Fictional Character's Persona [6.2] アシスタントAPIは、情報抽出部が毎回異なるため、検索でしばしば達成できない。
Assistants APIへの入力としてペルソナドキュメントを使用することで、一貫性のあるペルソナを維持するのは難しい。
CharacterGPTは、Assistants APIの欠点を軽減する新しいペルソナ再構築フレームワークである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:57:20 GMT)
ChatLang-8: An LLM-Based Synthetic Data Generation Framework for Grammatical Error Correction [6.2] 本稿では,サブジェクトセレクタ,グラマーセレクタ,プロンプトマネージャ,評価器を含む自動フレームワークを提案する。
また,8種類の主語名詞と23種類の文法を含む文法的誤り訂正タスクであるtextbfChatLang-8を提案する。
実験の結果,ChatLang-8は既存のGECデータセットと比較して,より均一なパターン構成を示すことがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:35:00 GMT)
Compressed and Sparse Models for Non-Convex Decentralized Learning [6.1] 頻繁なモデル通信は、分散機械学習の効率にとって重要なボトルネックである。
モデル空間と勾配勾配を組み合わせた新しい分散MLアルゴリズムであるMalcom-PSGDを提案する。
本手法は,最先端技術と比較して通信コストを約75%削減する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:43:04 GMT)
Pipeline Parallelism with Controllable Memory [6.1] 既存のパイプラインスケジュールのほとんどすべてが、私たちの知る限り、メモリ非効率であることを示しています。
制御可能なアクティベーションメモリを備えたメモリ効率の高いビルディングブロック群を導入し,最大アクティベーションメモリを1F1Bの1/2に削減する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:19:02 GMT)
Simplification of Risk Averse POMDPs with Performance Guarantees [6.1] 部分的に観測可能な領域における不確実性の下でのリスク回避意思決定は、AIの基本的問題であり、信頼性の高い自律エージェントにとって不可欠である。
この場合、値関数がリターンの条件値(CVaR)である場合、問題は部分的に観測可能なマルコフ決定プロセス(POMDP)を用いてモデル化される。
POMDPの最適解を計算することは、一般に計算的に計算可能である。
我々は,性能保証を提供しながら,値関数の評価を高速化する簡易化フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:05:52 GMT)
A Human-Annotated Video Dataset for Training and Evaluation of 360-Degree Video Summarization Methods [6.1] 本稿では,360度映像コンテンツを2次元映像要約に変換する,360度映像要約のための新しいデータセットを提案する。
このデータセットには、トレーニングや360度ビデオ要約手法の客観的評価に使用可能な、地平の人間生成サマリーが含まれている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:43:48 GMT)
BanglaAutoKG: Automatic Bangla Knowledge Graph Construction with Semantic Neural Graph Filtering [6.1] 知識グラフ(KG)は情報処理や推論アプリケーションに必須であることが証明されている。
世界中で広く使用されているにもかかわらず、Banglaは包括的なデータセットが不足しているため、KGでは比較的不足している。
バングラテキストからベンガルKGを自動構築できる先駆的フレームワークであるBanglaAutoKGを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:39:56 GMT)
Controllable Talking Face Generation by Implicit Facial Keypoints Editing [6.0] 本稿では,音声による表情の変形を制御するための音声合成手法であるControlTalkを提案する。
提案手法は,HDTFやMEADなど,広く使用されているベンチマークにおいて,最先端の性能よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:54:46 GMT)
Inductive Generalization in Reinforcement Learning from Specifications [6.0] 論理的仕様からRLの新しい帰納的一般化フレームワークを提案する。
我々は、帰納的タスクのインスタンスに対して、ゼロショット方式で適切に適合したポリシーを生成する、高階関数、ポリシジェネレータを学習する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:06:48 GMT)
Hint of Thought prompting: an explainable and zero-shot approach to reasoning tasks with LLMs [6.0] 本稿では、説明可能性とゼロショットの一般化を促進させる新しい思考ヒント(HoT)を提案する。
我々のHoTプロンプトは、既存のゼロショットCoTと比較してゼロショット推論タスクに大きな利点がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:16:49 GMT)
The Simpler The Better: An Entropy-Based Importance Metric To Reduce Neural Networks' Depth [5.9] 本稿では,大規模モデルによって伝達される事前知識を活用する効率戦略を提案する。
本稿では,過度にパラメータ化された深層ニューラルネットワークの深さを低減するために,エントロピー・バサード・インシデンス・mEtRic (EASIER) を利用する手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:05:17 GMT)
FedPylot: Navigating Federated Learning for Real-Time Object Detection in Internet of Vehicles [5.8] フェデレートラーニングは、車載ネットワークで洗練された機械学習モデルをトレーニングするための有望なソリューションである。
我々は、フェデレーションオブジェクト検出実験をシミュレートする軽量MPIベースのプロトタイプであるFedPylotを紹介する。
本研究は, 精度, 通信コスト, 推論速度に影響を及ぼし, 自動運転車が直面する課題に対するバランスのとれたアプローチを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:06:59 GMT)
Situation Monitor: Diversity-Driven Zero-Shot Out-of-Distribution Detection using Budding Ensemble Architecture for Object Detection [5.7] コンディションモニターは、トランスフォーマーに基づくオブジェクト検出モデルのための新しいゼロショットアウトオブディストリビューション(OOD)検出手法である。
自律運転のような安全クリティカルな機械学習アプリケーションの信頼性を高める。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:20:36 GMT)
Analyzing the Influence of Training Samples on Explanations [5.7] 本稿では,与えられた説明に強い影響を与えるトレーニングデータサンプルを同定する新しい問題を提案する。
そこで本研究では,そのような学習サンプルを同定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:20:06 GMT)
Contextual Hourglass Network for Semantic Segmentation of High Resolution Aerial Imagery [5.7] 本研究では,新しいセマンティックセグメンテーション手法を開発し,それをContextual Hourglass Networkと呼ぶ。
本手法では,予測の堅牢性を向上させるため,新しい時間ガラスモジュールを設計する。
さらに,複数の時間ガラスモジュールを接続することで,エンコーダとデコーダのスタック構造をさらに活用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:31:36 GMT)
Feature Contamination: Neural Networks Learn Uncorrelated Features and Fail to Generalize [5.6] 分散シフトの下で一般化される学習表現は、堅牢な機械学習モデルを構築する上で重要である。
ニューラルネットワークを教師ネットワークから得られる表現に明示的に適合させることさえ、学生ネットワークの一般化には不十分であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:04:27 GMT)
P2PFormer: A Primitive-to-polygon Method for Regular Building Contour Extraction from Remote Sensing Images [5.6] 既存の方法は不規則な輪郭、丸い角、冗長点に悩まされている。
本稿では,ポストプロセッシングを使わずに通常の建物輪郭を生成する,新しい合理化パイプラインを提案する。
P2PFormerは、WHU、CrowdAI、WHU-Mixデータセット上で、最先端のパフォーマンスを新たに実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:38:45 GMT)
Single Photon Quantum Ranging: When Sequential Decoding Meets High Dimensional Entanglement [5.5] モードごとの低雑音レベルと低反射率状態における量子レンジ問題について考察する。
本稿では,送信機における高次元時間ビン絡み合わせと検出器における逐次決定規則を慎重に構成する手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:41:14 GMT)
Multi-tiling Neural Radiance Field (NeRF) -- Geometric Assessment on Large-scale Aerial Datasets [5.4] 本稿では,大規模航空データセット上でのNeRF(Neural Radiance Fields)のスケールアップを目指す。
具体的には、メモリ消費を減らすため、位置特定サンプリング技術とマルチカメラタイリング(MCT)戦略を導入する。
提案手法を代表的手法であるMip-NeRFに実装し,その幾何性能を3光度MVSパイプラインと比較する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:10:13 GMT)
Pruning-Based Extraction of Descriptions from Probabilistic Circuits [5.3] 確率回路を用いて、正にラベル付けされた実例から概念を学習する。
これらの回路は、このタスクに魅力的なトラクタブルモデルを形成するが、ドメインの専門家がそれらを検査し分析することは困難である。
本稿では,学習した確率回路を論理に基づく識別モデルに変換することにより,この問題を解決することを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:54:23 GMT)
Differentially Private Knowledge Distillation via Synthetic Text Generation [5.2] 本研究では,差分プライベートな知識蒸留アルゴリズムであるDistilDPを提案する。
DistilDPは、差分的にプライベートなLLMによって生成された合成データを利用する。
実験の結果, DistilDPは既存のベースラインよりも実用性を大幅に向上できることがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:07:44 GMT)
StatBot.Swiss: Bilingual Open Data Exploration in Natural Language [5.1] Text-to-SwissシステムにおけるLarge Language Models (LLM)による改善の可能性は、主にモノリンガルな英語データセットに基づいて評価される。
我々は、現実世界のアプリケーションに基づいてテキスト・ツー・スイスシステムを評価するための最初のベンチマークデータセットであるStatBotをリリースした。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:03:19 GMT)
Exploring Real World Map Change Generalization of Prior-Informed HD Map Prediction Models [5.1] ハイディフィニション(HD)マップの構築と維持は、自動運転車の配備にとって大きな障壁となる。
実世界のHDマップの変化を一般化するために,どの合成摂動が最も有用かを決定するための大規模実験を行った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:28:26 GMT)
Aligning Transformers with Weisfeiler-Leman [5.0] グラフニューラルネットワークアーキテクチャは、理論的によく理解された表現力を提供する$k$-WL階層と一致している。
我々は,ラプラシアンPEやSPEなどの確立した位置符号化の研究を可能にする理論的枠組みを開発する。
我々は,大規模PCQM4Mv2データセットを用いてトランスフォーマーの評価を行い,最先端のPCQM4Mv2と競合する予測性能を示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:06:33 GMT)
Predicting unobserved climate time series data at distant areas via spatial correlation using reservoir computing [5.0] 本研究は, 気象要素, 特に地表温度と圧力を, データ観測点から離れた目標地点で予測することに焦点を当てた。
その結果,予測精度は観測地点と目標地点の距離によって低下することがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:39:10 GMT)
A Simple Learning-Augmented Algorithm for Online Packing with Concave Objectives [5.0] 本稿では,線形制約付きオンラインパッキング問題に対する単純な学習拡張アルゴリズムの導入と解析を行う。
さらに、このような単純なブラックボックス解が最適である場合に必要かつ十分な条件を理解するという問題を提起する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:39:28 GMT)
Why is "Problems" Predictive of Positive Sentiment? A Case Study of Explaining Unintuitive Features in Sentiment Classification [4.9] 説明可能なAI(XAI)アルゴリズムは、マシンラーニングモデルがどのように予測を行うかを理解するためのものだ。
多くのアプローチは、どの入力特徴がターゲットラベルの最も予測的かを説明する。
本研究では,ユーザにとって直感的でない連想を自動的に検出する手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:31:19 GMT)
L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration [4.9] 本稿では,非秩序な低重なり点群を登録するL-PRという新しいフレームワークを提案する。
我々はこれらをLiDARフィデューシャルマーカーと呼んでいるが、人気のある AprilTag や ArUco のマーカーと同じである。
提案手法が競合相手に対して4つの点で優位性を示すことを示すため,定性的かつ定量的な実験を行った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:08:13 GMT)
Nonlinear Transformations Against Unlearnable Datasets [4.9] 自動スクラップは、データ所有者の許可なしにディープラーニングモデルのデータを収集する一般的な方法として際立っている。
近年,このデータ収集手法に関するプライバシー問題に取り組み始めている。
学習不可能(unlearnable)な例と呼ばれるこれらのアプローチによって生成されたデータは、ディープラーニングモデルによって"学習"される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:00:47 GMT)
Simul-LLM: A Framework for Exploring High-Quality Simultaneous Translation with Large Language Models [4.9] 数十億のパラメータを持ち、大量のデータに事前訓練された大規模言語モデル(LLM)は、さまざまな下流自然言語処理タスクにおいて、最先端の性能に近いかそれ以上の性能を持つようになった。
Simul-LLMは、SimulMTにフォーカスしたLLMのためのオープンソースのファインチューニングおよび評価パイプライン開発フレームワークである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:12:13 GMT)
CROSSCON: Cross-platform Open Security Stack for Connected Devices [4.9] IoT(Internet of Things)組み込みデバイスの普及は2030年までに300億に達する見込みだ。
CROSSCONは、新しいオープンでモジュール化され、普遍的に互換性のあるIoTセキュリティスタックを開発することで、現在のIoT課題に対処することを目指している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:03:40 GMT)
Phase Transitions in the Anisotropic Dicke-Stark Model with $A$-square terms [4.8] 標準等方性ディックモデルにおける超ラジカル相転移の禁止
SRPTは0温度と有限温度の両方で起こりうることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:41:11 GMT)
DoubleML -- An Object-Oriented Implementation of Double Machine Learning in R [4.8] RパッケージのDoubleMLは、ダブル/デバイアスの機械学習フレームワークを実装している。
機械学習手法に基づいた因果モデルでパラメータを推定する機能を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:09:23 GMT)
MultifacetEval: Multifaceted Evaluation to Probe LLMs in Mastering Medical Knowledge [4.8] 大規模言語モデル (LLMs) はドメイン間で優れており、医療評価ベンチマークで顕著なパフォーマンスを提供している。
しかし、実際の医療シナリオにおける報告されたパフォーマンスと実践的効果の間には、依然として大きなギャップがある。
医療知識のエンコーディングと習得におけるLLMの程度と範囲を検討するための,新しい評価フレームワークであるMultifacetEvalを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:15:07 GMT)
Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository [4.8] 実世界のリポジトリ内でクラスレベルのコードを生成する際に,LLMを厳格に評価するためのベンチマークであるRepoClassBenchを紹介する。
RepoClassBenchには、リポジトリの選択からJava、Python、C#にまたがる"Natural Language to Class Generation"タスクが含まれている。
Retrieve-Repotools-Reflect (RRR)は,レポジトリレベルのコンテキストを反復的にナビゲートし,推論する静的解析ツールを備えた新しいアプローチである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:44:24 GMT)
All Language Models Large and Small [4.7] 多くの主要な言語モデル(LM)は、訓練と実行の両方で高強度の計算資源を使用する。
これは、デプロイメントのリソースコストを削減し、意思決定タスクの実行を高速化するという課題を引き起こします。
本稿では,Language Optimising Network Distribution (LONDI) フレームワークという新しいLMフレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:08:28 GMT)
Degree Heterogeneity in Higher-Order Networks: Inference in the Hypergraph $\boldsymbolβ$-Model [4.5] 複数層からなるハイパーグラフ $boldsymbolbeta$-model について検討した。
最大極大推定値(ML)の収束率を導出し,その最小値の最適性を確立する。
また、ハイパーグラフ $boldsymbolbeta$-model における適合性の問題についても考察する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:00:23 GMT)
M2SA: Multimodal and Multilingual Model for Sentiment Analysis of Tweets [4.5] 本稿では,既存のテキスト型Twitter感情データセットを,簡単なキュレーションプロセスを通じてマルチモーダルフォーマットに変換する。
本研究は,研究コミュニティにおける感情関連研究の新たな道を開くものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:34:55 GMT)
Giving each task what it needs -- leveraging structured sparsity for tailored multi-task learning [4.5] この研究はレイヤ改良型マルチタスク(LOMT)モデルを導入している。
LOMTモデルは、構造化された空間を利用して、個々のタスクの特徴選択を強化し、マルチタスクシナリオにおける全てのタスクのパフォーマンスを向上させる。
従来のMTLモデルとは対照的に,LOMTモデルの詳細な性能解析により,ほとんどのタスクの組み合わせにおいて,LOMTモデルの方が優れていたことが明らかとなった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:23:38 GMT)
On the Power of Randomization in Fair Classification and Representation [4.4] 正当性制約を課す際に生じる精度の損失を最小限に抑えるためにランダム化の力を示す。
本研究では, DPフェア, EOフェア, PEフェアの表現を, 最適なDPフェア, EOフェア, PEフェアの分類器に比較して, 高い精度で, 精度を損なうことなく構築する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:55:11 GMT)
Factory-based Fault-tolerant Preparation of Quantum Polar Codes Encoding One logical Qubit [4.4] Q1符号の論理的コード状態を作成するためのフォールトトレラントな方法が最近提案されている。
そこでは,Q1コードステートの複数コピーを並列に作成するための,Q1コードステートのファクトリ準備について検討する。
追加のスケジューリングステップを使用することで、エラーが検出されるたびに、準備が完全に破棄されるのを避けることができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:26:57 GMT)
Distribution-Free Conformal Joint Prediction Regions for Neural Marked Temporal Point Processes [4.3] 我々は、共形予測の枠組みを用いて、ニューラルTPPモデルにおける不確実性に対するより信頼性の高い手法を開発した。
主な目的は、イベントの到着時刻とマークに対する分布自由な共同予測領域を生成し、有限サンプルの限界カバレッジを保証することである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:06:27 GMT)
Solving Differential Equations using Physics-Informed Deep Equilibrium Models [4.2] 本稿では、常微分方程式(ODE)の初期値問題(IVP)を解決する物理インフォームド・ディープ平衡モデル(PIDEQ)を提案する。
この研究は、深層学習と物理に基づくモデリングをブリッジすることで、IVPを解くための計算技術を進歩させ、科学計算と工学の応用に寄与する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:25:29 GMT)
Author, Content or Sharers? Estimating Spread Dynamics with Bayesian Mixture Hawkes [4.2] 本研究では,ソース,コンテンツ,拡散の影響を共同学習するために,ベイズ混合ホークス(BMH)モデルを提案する。
2つの学習課題(コールドスタート人気予測と時間プロファイル性能)でBMHモデルをテストし、2つの実世界のリツイートカスケードデータセットに適用した。
BMHモデルでは、議論を呼んでいるパブリッシャーと信頼できるパブリッシャーの間で、スタイルの有効性の違いが明らかになっている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:41:02 GMT)
Learning Solutions of Stochastic Optimization Problems with Bayesian Neural Networks [4.2] 多くの実世界の設定において、これらのパラメータのいくつかは未知または不確かである。
最近の研究は、利用可能なコンテキスト特徴を用いて未知のパラメータの値を予測することに焦点を当てている。
本稿では、不確実性ニューラルネットワーク(BNN)をモデル化し、この不確実性を数学的解法に伝達する新しい枠組みを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:11:46 GMT)
Entity Matching using Large Language Models [4.2] 本稿では, PLM ベースのマーカに代わる, タスク固有の訓練データ依存モデルとして, LLM (Generative Large Language Model) を用いて検討する。
GPT4は一致判定のための構造化された説明を生成することができることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:33:25 GMT)
ASoBO: Attentive Beamformer Selection for Distant Speaker Diarization in Meetings [4.1] 話者ダイアリゼーション(SD)は、同一話者に属する音声セグメントをグループ化することを目的としている。
ビームフォーミング(ビームフォーミング、つまり空間フィルタリング)は、マルチマイクロフォンオーディオデータを処理する一般的な方法である。
本稿では,固定空間フィルタのバンクの出力を選択する自己注意型アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:28:28 GMT)
Writing Order Recovery in Complex and Long Static Handwriting [4.0] 我々は,薄型静的軌跡の秩序回復を推定する新しいシステムを提案する。
我々は、ペンダウンの開始点を知ることが、回復した筆記の質にどのように影響するかを評価する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:23:17 GMT)
Entangled states are typically incomparable [4.0] 2部量子系では、アリスとボブは$|psirangle$を別の状態 $|phirangle$に変換することができる。
ニールセンの定理によれば、この予想はランダム行列のスペクトルの大量化に関する予想と等価に表現できる。
我々はこの予想を証明し、クンデン、ファッキ、フロリオ、グラメグナのいくつかの関連する予想を裏付ける。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:49:53 GMT)
Dynamic Ranking and Translation Synchronization [3.9] 本研究では, エン翻訳同期問題の動的設定への拡張について検討する。
そこで我々は,2つの推定器を提案し,その1つはスムーズネスの最小二乗法に基づくものであり,もう1つは適切な滑らかさ演算子の低周波固有空間への射影に基づくものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:16:43 GMT)
Adversarial Moment-Matching Distillation of Large Language Models [3.9] 知識蒸留(KD)は、より大きな教師モデルで学生モデルを導くのに非常に効果的であることが示されている。
そこで本稿では,モーメントマッチング距離を推定し,学生のポリシーを最適化して最小化するための逆トレーニングアルゴリズムを提案する。
タスクに依存しない指示追従実験とタスク固有の実験の両方の結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:27:29 GMT)
Non-uniformity is All You Need: Efficient and Timely Encrypted Traffic Classification With ECHO [3.9] 本稿では,ML/DLベースの暗号化トラフィック分類のための新しい最適化プロセスであるECHOを紹介する。
ECHOは、分類時間とメモリ利用の両方を目標とし、2つの革新的なテクニックを取り入れている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:49:27 GMT)
Augmented balancing weights as linear regression [3.9] 自動脱バイアス機械学習(AutoDML)としても知られる拡張バランスウェイトの特徴を新たに提供する。
拡張推定器は、元の結果モデルから得られる係数と、不注意な通常の最小二乗(OLS)から得られる係数を同じデータに組み合わせた単一の線形モデルと等価であることを示す。
私たちのフレームワークは、この人気の高い推定器のクラスにブラックボックスを開きます。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:53:16 GMT)
Measurement of dynamic nonlocal deformation using nanodiamond sensors [3.7] ナノインデンテーションと分光分析を用いた動的非局所変形検出法を開発した。
時間的および空間的に解決された機械的解析を実現する。
この研究は、軟質で複雑な生体関連物質の時空間力学的解析の有用なツールとしてナノダイヤモンドセンサーを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:07:56 GMT)
Learning Semantic Traversability with Egocentric Video and Automated Annotation Strategy [3.7] ロボットは、シーンのセマンティック理解に基づいて、画像内のセマンティック・トラバース可能な地形を識別する能力を持つ必要がある。
この推論能力はセマンティックトラバーサビリティに基づいており、テストドメイン上で微調整されたセマンティックセグメンテーションモデルを使用して頻繁に達成される。
本稿では,エゴセントリックなビデオと自動アノテーションプロセスを用いて,セマンティック・トラバーサビリティ推定器を訓練するための効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:40:04 GMT)
Radiomics-guided Multimodal Self-attention Network for Predicting Pathological Complete Response in Breast MRI [3.7] 本研究では,ダイナミックコントラスト強調画像(DCE)とADCマップを用いた乳癌患者のpCR予測モデルを提案する。
本手法は, 腫瘍関連領域からの特徴抽出を誘導するために放射線を利用した自己注意機構を備えたエンコーダを用いて, DCE MRI と ADC から特徴抽出を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:49:55 GMT)
"Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations [3.6] 専門家デモ(RLED)からの強化学習(Reinforcement Learning from Expert Demonstrations)のような手法は、学習プロセス中のエージェント探索を促進するために外部の専門家によるデモンストレーションを導入します。
学習にとって最も有益な人間のデモのベストセットをどうやって選ぶかが、大きな関心事になります。
本稿では,学習エージェントが軌跡に基づく特徴空間において,専門家による実演を最適化したクエリを生成できるアルゴリズムEARLYを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:52:21 GMT)
The Copycat Perceptron: Smashing Barriers Through Collective Learning [3.6] 本研究では,各学生の一般化性能に影響を及ぼすサーマルノイズが存在する場合の一般的な設定を解析する。
レプリカの結合は、$alpha$の小さな値への位相図の曲がりに繋がることがわかった。
これらの結果は、最近推測されたReplicated Simulated Annealingのベイズ最適性に関する解析的および数値的な証拠を与える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:52:54 GMT)
Fuzzing Frameworks for Server-side Web Applications: A Survey [3.5] 本稿では,Web APIによるWebアプリケーションテストのための最先端ファジィフレームワークについてレビューする。
我々は過去10年間に、ピアレビューされた記事のオンラインリポジトリ7件から論文を収集してきた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:45:02 GMT)
Temporal Graph Rewiring with Expander Graphs [3.5] 時間グラフリウィリング(TGR)は、時間グラフ上でグラフをリウィリングするための最初のアプローチである。
TGRは、連続時間動的グラフにおいて、時間的に離れたノード間の通信を可能にする。
我々はTGRが広く使われているTGNモデルの性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:22:46 GMT)
Mixed-Dimensional Qudit State Preparation Using Edge-Weighted Decision Diagrams [3.4] 量子コンピュータは難解な問題を解く可能性がある。
このポテンシャルを利用するための重要な要素の1つは、多値系(qudit)のために量子状態を効率的に準備する能力である。
本稿では,混合次元系に着目した量子状態生成法について検討する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:00:01 GMT)
Linear Transformers with Learnable Kernel Functions are Better In-Context Models [3.4] In-Context学習能力を増幅するベースカーネルにエレガントな変更を加える。
本稿では,マルチクエリ・アソシエイト・リコールタスクによって評価されたインコンテキスト学習能力を増幅する,独特でエレガントな変更をベースカーネルに提示する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:13:22 GMT)
Oscillations enhance time-series prediction in reservoir computing with feedback [3.4] 貯留層コンピューティング(Reservoir computing)は、脳のモデリングに使用される機械学習フレームワークである。
貯水池系が不安定になるため、長期目標時系列を正確に再現することは困難である。
本研究では,振動駆動型貯水池計算 (ODRC) をフィードバックで提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:30:29 GMT)
Understanding and measuring software engineer behavior: What can we learn from the behavioral sciences? [3.3] 我々は,心理測定器や様々な情報源からの質的データなど量的尺度を統合する包括的手法を提唱する。
本稿では,行動科学の方法論的スキルを活用することによって,この課題の進展を評価するためのさまざまな方法について述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:59:40 GMT)
Generative Diffusion Models for Fast Simulations of Particle Collisions at CERN [3.3] 高エネルギー物理シミュレーションでは、CERNの大型ハドロン衝突型加速器における粒子衝突実験の複雑さの解明に重要な役割を果たしている。
近年の進歩は、最先端の生成機械学習手法として拡散モデルの有効性を強調している。
拡散モデルに基づくALICE実験において,Zero Degree Calorimeter (ZDC) のシミュレーションを行った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:11:53 GMT)
Deep Generative Models for Proton Zero Degree Calorimeter Simulations in ALICE, CERN [3.3] 本稿では、ALICE実験において、プロトンZero Degree Calorimeterに合わせた革新的なディープラーニングシミュレーション手法を提案する。
本手法は,モンテカルロをベースとした従来の手法と比較して,大幅な高速化を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:41:09 GMT)
BVE + EKF: A viewpoint estimator for the estimation of the object's position in the 3D task space using Extended Kalman Filters [3.2] RGB-Dセンサーは、放射線や雨などの外部の摂動に敏感であるため、オープンフィールド環境で動作している課題に直面している。
複数の作品がモノクロカメラを用いて物体の3D位置を認識するという課題に近づいている。
我々は,拡張カルマンフィルタ(EKF)を用いた最適視点推定器(BVE)というガウス視点推定器を用いて3次元物体の位置を予測する問題にアプローチすることを目的とする。
このアルゴリズムはタスクの効率を証明し、最大平均ユークリッド誤差は約32mmに達した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:20:34 GMT)
Language Model Can Do Knowledge Tracing: Simple but Effective Method to Integrate Language Model and Knowledge Tracing Task [3.1] 本稿では,LKT(Language Model-based Knowledge Tracing)を提案する。
LKTはテキスト情報を効果的に組み込んでおり、大規模なベンチマークデータセットで以前のKTモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:26:59 GMT)
Partial-Label Learning with a Reject Option [3.1] 本稿では,不確実な予測を拒否できるリジェクションオプションを持つ新しい部分ラベル学習アルゴリズムを提案する。
提案手法は, 競合相手と比較して, 非還元予測の数と精度の最良のトレードオフを提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:05:18 GMT)
Partial-Label Learning with a Reject Option [3.1] 本稿では,不確実な予測を拒否できるリジェクションオプションを持つ新しい部分ラベル学習アルゴリズムを提案する。
提案手法は, 競合相手と比較して, 非還元予測の数と精度の最良のトレードオフを提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:05:18 GMT)
A Self-Supervised Denoising Strategy for Underwater Acoustic Camera Imageries [3.1] 本稿では,深層学習技術を用いた音響カメラ画像の復調手法を提案する。
微細な特徴を保存しながらノイズを除去し、局所的な特徴マッチングの性能を向上させる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:07:37 GMT)
AVFF: Audio-Visual Feature Fusion for Video Deepfake Detection [3.0] 本稿では,2段階のクロスモーダル学習法であるAVFF(Audio-Visual Feature Fusion)を提案する。
マルチモーダルな表現を抽出するために、コントラスト学習と自動符号化の目的を使い、新しい音声-視覚マスキングと特徴融合戦略を導入する。
我々は、FakeAVCelebデータセットの98.6%の精度と99.1%のAUCを報告し、現在のオーディオ・ビジュアル・オブ・ザ・アートをそれぞれ14.9%、9.9%上回った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:20:12 GMT)
One Queue Is All You Need: Resolving Head-of-Line Blocking in Large Language Model Serving [2.9] 大規模言語モデル(LLM)サービスのためのマルチモデルキュー管理フレームワークを提案する。
QLM は複数の LLM Serving Operations (LSOs) の動作をオーケストレーションし、HOL ブロックの削減と達成率の最大化を図っている。
実世界のLLMサービスデータセットを用いた異種GPUデバイスおよびモデルの評価では、QLMはSLO達成率を40-90%改善し、スループットを20-400%向上した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:17:34 GMT)
Challenging the Validity of Personality Tests for Large Language Models [2.9] 大規模言語モデル(LLM)は、テキストベースのインタラクションにおいて、ますます人間らしく振る舞う。
人格検査に対するLLMの反応は、人間の反応から体系的に逸脱する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:33:18 GMT)
Gaussian Copula Models for Nonignorable Missing Data Using Auxiliary Marginal Quantiles [2.9] 我々は,計算効率のよい推定・計算アルゴリズムを開発した。
本モデルを用いて,ノースカロライナの170,000人の学生を対象に,鉛暴露レベルとエンドツーエンドテストスコアの関係を分析した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:11:59 GMT)
C-MCTS: Safe Planning with Monte Carlo Tree Search [2.8] CMDP(Constrained Markov Decision Process)の定式化は、制約を受ける安全クリティカルな意思決定タスクの解決を可能にする。
エージェント展開前のオフラインフェーズで時間差学習を訓練した安全評論家を用いてコストを見積もるConstrained MCTS(C-MCTS)を提案する。
C-MCTSはコスト制約を満たすが、制約境界に近づき、以前の作業よりも高い報酬を達成する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:24:55 GMT)
Text Embedding Inversion Security for Multilingual Language Models [2.8] 研究は、基礎となるモデルに関する知識がなくても、埋め込みからテキストを再構築できることを示している。
本研究は,単言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:22:00 GMT)
Text Embedding Inversion Security for Multilingual Language Models [2.8] 研究は、基礎となるモデルに関する知識がなくても、埋め込みからテキストを再構築できることを示している。
本研究は,単言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語・多言語
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:22:00 GMT)
Enhancing CTC-based speech recognition with diverse modeling units [2.7] 近年,エンド・ツー・エンド(E2E)自動音声認識(ASR)モデルの進化が目覚ましい。
E2Eシステムの上に、研究者はE2EモデルのN-best仮説を音素モデルで再現することで、かなり精度を向上した。
本稿では,E2Eモデルと多種多様なモデリングユニットを併用した効率的な共同学習手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:52:55 GMT)
Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation [2.7] 本稿では,Flash拡散モデルの生成を高速化する,効率的で高速で多用途な蒸留法を提案する。
この手法は、COCO2014とCOCO 2017データセット上の画像生成のために、FIDとCLIP-Scoreの観点から最先端のパフォーマンスに達する。
この手法の汎用性は、テキスト・トゥ・イメージ、インペイント、フェイス・スワッピング、スーパーレゾリューション、UNetベースのデノイザ(SD1.5, SDXL)やDiT(Pixart-$alpha$)などの異なるバックボーンの使用など、いくつかのタスクにまたがる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:21:33 GMT)
Elliptic curves over Hasse pairs [2.7] 我々は、$$q$の点を持つ$mathbbF_q$上で定義される楕円曲線の同型類の集合 $mathcalE_i$ の関係を研究する。
奇妙なハッセ対の場合、$q$がフェルマーまたはメルセンヌ素数の与えられたパワーであるとき、空のユニオン$mathcalE_i$の可能性を排除できない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:59:30 GMT)
The AI Community Building the Future? A Quantitative Analysis of Development Activity on Hugging Face Hub [2.6] 私たちはHugging Face (HF) Hub上での開発活動を分析します。
例えば、70%以上のモデルが0回ダウンロードされ、1%が99%ダウンロードされている。
コミュニティにはコア周辺構造があり、多彩な開発者のコアと、分離された開発者の大多数があります。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:28:43 GMT)
FindingEmo: An Image Dataset for Emotion Recognition in the Wild [2.6] FindingEmoは25kイメージのアノテーションを含む新しいイメージデータセットだ。
様々な自然主義的、社会的な場面で複数の人物を描いた複雑な場面に焦点が当てられ、全体像が注釈付けされている。
注釈付きディメンションには、Valence、Arousal、Emotionのラベルがあり、Prolificを使ってアノテーションを収集する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:42:25 GMT)
Incorporating Navigation Context into Inland Vessel Trajectory Prediction: A Gaussian Mixture Model and Transformer Approach [2.5] 船舶の移動がフェアウェイ内で制限されている内陸輸送では、航行コンテキスト情報は不可欠である。
本研究では,多モード分布曲線を生成するためにAISと放電測定の融合データセットを適用した。
これらの分布特徴を組み込むことで予測精度が向上する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:23:41 GMT)
Integral fluctuation theorems and trace-preserving map [2.5] 我々は、測定と進化を構築されたマッピングに統合することで、生成関数を書き換える。
この写像は完全に正であり、元の積分FTはこれらの構築された写像のトレース保存性によって決定される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:44:26 GMT)
Geometric Localization of Homology Cycles [2.5] 時間的に計算可能で、近似的な意味で安定なサイクルの幾何的最適化を提案する。
実際、(自明な)正確なアルゴリズムは、最悪のケースランタイムがあるにもかかわらず、計算コストがかかる。
これらのアルゴリズムは、適度なサイズのデータセットに対して適切なランタイムを持ち、一貫して高品質である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:13:25 GMT)
Advancing African-Accented Speech Recognition: Epistemic Uncertainty-Driven Data Selection for Generalizable ASR Models [2.5] 本稿では,アノテーションプロセスの自動化に不確実性を利用するマルチラウンド適応プロセスを提案する。
この手法はデータアノテーションを合理化し、モデルの不確実性に最も寄与するデータサンプルを戦略的に選択する。
以上の結果から,従来のベースラインよりも平均45%少ないデータを必要とする一方で,WERの相対的改善率は27%であることが示唆された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:10:06 GMT)
Sparse Color-Code Net: Real-Time RGB-Based 6D Object Pose Estimation on Edge Devices [2.3] 提案するColor-Code Net (SCCN) は,この要件に対処する明確かつ簡潔なパイプライン設計を具現化したものである。
SCCNはRGB画像中の対象オブジェクトに対して画素レベルの予測を行い、パースペクティブ-n-Pointプロセスの高速化に必須なオブジェクト幾何学的特徴の空間性を利用する。
特に、ベンチマークLINEMODデータセットとOcclusionMODデータセットで、19フレーム/秒(FPS)と6FPSの見積率を実現している。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:21:48 GMT)
Lossless Image Compression Using Multi-level Dictionaries: Binary Images [2.3] カラー画像の圧縮性は、その空間構造、強度変化、色変化のパターンから本質的に導かれるものであると論じる。
提案手法はまず,バイナリ画像のデータセットから16時間16ドル,8時間8ドル,4時間4ドル,2時間2平方ピクセルパターンの辞書を学習する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:24:10 GMT)
Variational Pseudo Marginal Methods for Jet Reconstruction in Particle Physics [2.2] ジェット潜伏構造を推定するためのコンビニアル・シークエンシャルモンテカルロ法を提案する。
第2の貢献として、パラメータ学習のための変分推論アルゴリズムを開発するために、得られた推定値を利用する。
本研究では,コライダー物理生成モデルを用いて生成したデータを用いて実験を行い,本手法の有効性について述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:18:55 GMT)
Examining the robustness of LLM evaluation to the distributional assumptions of benchmarks [2.2] 調査コミュニティは、しばしばモデルの性能を評価するために、ベンチマークの試験プロンプト全体にわたるモデルの平均パフォーマンスに依存します。
これは、ベンチマーク内のテストプロンプトが実世界の関心の分布からランダムなサンプルを表すという仮定と一致している。
その結果,(1)テストプロンプト間のモデル性能の相関は非ランダムであり,(2)テストプロンプト間の相関を考慮すれば,主要なベンチマーク上でモデルランキングを変更でき,(3)セマンティックな類似性や共通LLM障害点を含む説明的要因が得られた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:14:15 GMT)
A Novel Technique for Query Plan Representation Based on Graph Neural Nets [2.2] 本研究では,異なる木モデルを用いたアグリゲードのコスト推定と計画選択性能への影響について検討する。
本稿では, Gated Recurrent Unit (GRU) によるGNNを用いたツリーモデルBiGGを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:27:20 GMT)
Fermionic quantum computation with Cooper pair splitters [2.2] 量子ビットではなく局所フェルミオンモード(LFM)を用いる普遍量子コンピュータの実践的実装を提案する。
デバイスレイアウトは、ハイブリッド超伝導島で結合された量子ドットトンネルと、ドット間の可変容量結合からなる。
クーパー対分割、弾性コツネリング、クーロン相互作用のコヒーレント制御により、量子ゲートの普遍的な集合を実装することができることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:02:48 GMT)
TempFuser: Learning Agile, Tactical, and Acrobatic Flight Maneuvers Using a Long Short-Term Temporal Fusion Transformer [2.2] TempFuserは、新しい長期の短期融合トランスアーキテクチャである。
複雑なドッグファイト問題において、アジャイル、戦術、およびアクロバティックな飛行操作を学ぶことができる。
我々のモデルは、優れた仕様で敵に面した場合でも、人間のようなアクロバティックな操作を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:19:01 GMT)
Self-Supervised Interpretable End-to-End Learning via Latent Functional Modularity [2.2] MoNetは、自己教師付き、解釈可能なエンドツーエンド学習のための、機能的にモジュール化されたネットワークである。
現実世界の屋内環境では、MoNetは効果的な視覚自律ナビゲーションを示し、ベースラインモデルを7%から28%上回っている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:07:17 GMT)
CONFIDERAI: a novel CONFormal Interpretable-by-Design score function for Explainable and Reliable Artificial Intelligence [2.1] 本稿では,共形予測と説明可能な機械学習を結びつける手法を提案する。
全体的な方法論は、実世界の関心のあるいくつかのデータセットで有望な結果で検証される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:19:37 GMT)
Mind's Eye: Image Recognition by EEG via Multimodal Similarity-Keeping Contrastive Learning [2.1] 本稿では,ゼロショット脳波画像分類のためのMUltimodal similarity-keeper contrastivE学習フレームワークを提案する。
我々は、脳波信号に適した多変量時系列エンコーダを開発し、正規化コントラスト脳波画像事前学習の有効性を評価する。
本手法は,200方向ゼロショット画像分類において,トップ1の精度が19.3%,トップ5の精度が48.8%の最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:42:23 GMT)
VWise: A novel benchmark for evaluating scene classification for vehicular applications [2.0] VWiseは、道路型分類とシーン分類タスクのための新しいベンチマークである。
ラテンアメリカ諸国の様々な都市環境と農村環境をカバーする520以上のビデオクリップを収集しました。
ベースライン実験において,いくつかの最先端分類モデルを評価し,84%以上の精度を得た。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:52:45 GMT)
Partial Label Learning with Focal Loss for Sea Ice Classification Based on Ice Charts [2.0] 本稿では,海氷分類を学習するための新しいGeoAI手法を提案する。
我々は、ポリゴンレベルのラベルを候補部分ラベルとして扱い、対応する氷濃度を各ラベルの信頼性スコアとして割り当て、焦点損失と統合して畳み込みニューラルネットワーク(CNN)を訓練する。
提案手法により,Sentinel-1双偏極SAR画像の海氷分類性能が向上し,分類精度が87%から92%に向上し,F-1スコアが90%から93%に向上した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:49:30 GMT)
Rethinking Spiking Neural Networks as State Space Models [2.0] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワークに代わる生物学的に妥当な代替品として提案されている。
状態空間モデルに基づく新しいスパイキング神経モデルについて述べる。
我々のモデルは、様々な長距離依存タスクにまたがるSNNモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:23:11 GMT)
Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost [1.9] Retriever Augmented Generation (RAG) システムは,言語モデルの能力向上に重要な役割を担っている。
現在の幻覚検出技術は、精度、低レイテンシ、低コストを同時に提供できない。
本稿では,RAG設定における幻覚検出のためのLuna: a DeBERTA-large (440M)エンコーダについて紹介する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:45:04 GMT)
Graph Convolutional Branch and Bound [1.9] 本稿では,最適化パイプラインにおけるディープラーニングモデルの有効性を示す。
この文脈では、ニューラルネットワークを利用して、価値ある情報を素早く取得することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:42:43 GMT)
RadBARTsum: Domain Specific Adaption of Denoising Sequence-to-Sequence Models for Abstractive Radiology Report Summarization [1.8] 本研究では,抽象的放射線学レポート要約のためのドメイン固有かつ容易なBARTモデルの適応であるRadBARTsumを提案する。
本手法は,1)生物医学領域の知識学習を改善するための新しい実体マスキング戦略を用いて,放射線学報告の大規模コーパス上でBARTモデルを再学習すること,2)印象区間を予測するためにFindersとバックグラウンドセクションを用いて要約タスクのモデルを微調整すること,の2つの段階を含む。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:43:11 GMT)
Analyzing and Estimating Support for U.S. Presidential Candidates in Twitter Polls [1.7] 我々は、2016年と2020年の大統領選挙において、米国の大統領候補に対する支持を誇示する2万件近いTwitterの投票を調査した。
われわれの調査結果によると、Twitterの世論調査は、大統領候補の地位から、さまざまな点で偏っている。
2016年と2020年の世論調査は、主に年上の男性によって作成され、ドナルド・トランプ氏に有利な偏見を示していた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:57:29 GMT)
Surrogate Neural Networks Local Stability for Aircraft Predictive Maintenance [1.7] サロゲートニューラルネットワークは、計算的に要求されるエンジニアリングシミュレーションの代用として、産業で日常的に使用されている。
性能と時間効率のため、これらのサロゲートモデルは安全クリティカルなアプリケーションでの使用のために開発されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:46:22 GMT)
Balancing Performance and Efficiency in Zero-shot Robotic Navigation [1.7] 本稿では,ロボット工学におけるオブジェクトゴールナビゲーションタスクに適用したビジョンランゲージフロンティアマップの最適化研究について述べる。
本研究は,視覚言語モデル,オブジェクト検出器,セグメンテーションモデル,視覚質問応答モジュールの効率と性能を評価する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:31:05 GMT)
Large Language Models are Few-shot Generators: Proposing Hybrid Prompt Algorithm To Generate Webshell Escape Samples [1.6] 大規模言語モデルの助けを借りてウェブシェルエスケープサンプル生成のためのHybrid Promptアルゴリズムを提案する。
ウェブシェルサンプル生成用に特別に開発されたプロンプトアルゴリズムとして、Hybrid Promptアルゴリズムは、Chain of Thought、Tree of Thoughtなど様々なプロンプトなアイデアを組み合わせただけでなく、ウェブシェル階層モジュールのような様々なコンポーネントも組み込んでいる。
実験結果から,Hybrid Promptアルゴリズムはコード推論能力に優れ,高品質なウェブシェルサンプルを生成することができることがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:23:48 GMT)
Conditional Wasserstein Distances with Applications in Bayesian OT Flow Matching [1.6] 逆問題において、多くの条件生成モデルは、合同測度と学習近似との距離を最小化することにより、後続測度を近似する。
条件付きワッサーシュタイン距離は、後部の期待するワッサーシュタイン距離と等しいような制限された結合の集合を通じて導入する。
我々は条件付きワッサーシュタイン距離の理論的性質を導出し、対応する測地線と速度場と流れのODEを特徴づける。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:51:08 GMT)
CSS: Contrastive Semantic Similarity for Uncertainty Quantification of LLMs [1.5] テキストペアの不確実性を測定するための類似性特徴を求めるモジュールであるContrastive Semantic similarityを提案する。
我々は,3つの大規模言語モデル (LLM) を用いて,複数のベンチマーク質問応答データセットについて広範な実験を行った。
提案手法は,LLMの信頼性の高い応答を,同等のベースラインよりも高い精度で推定できることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:35:44 GMT)
NFT Wash Trading: Direct vs. Indirect Estimation [1.5] 最近の研究では、ウォッシュトレーディングのようなオフチェーン暗号取引所における取引価値の約70%が見積もられている。
この論文は、トランザクションのオンチェーン的性質、すなわちWeb3のイノベーションのキーテットが適用すべき直接推定方法を可能にする、NTT市場へと転換する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:22:39 GMT)
SuperFormer: Volumetric Transformer Architectures for MRI Super-Resolution [1.5] 我々は最先端のSwin Transformerモデルを3D医療領域に拡張する。
本稿では,3次元アプリケーション用VTにおけるボリューム情報処理と符号化位置に関する新しいアプローチを提案する。
磁気共鳴イメージング(MRI)における体積変換器を用いた超解像法であるSuperFormerを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:14:29 GMT)
Unified Prediction Model for Employability in Indian Higher Education System [1.5] 本研究は,学生の就学率の予測に関して,インド教育制度に有意な差がないことを統計的に検証し,証明するものである。
モデルは、インドのシナリオにおける学生の雇用可能性予測のための一般化されたソリューションを提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:23:15 GMT)
Robust Prediction Model for Multidimensional and Unbalanced Datasets [1.5] 本稿では,ロバスト予測モデルを用いて属性の集合を求める。
健康分野、教育分野、ビジネス分野、不正検出分野の5つの異なるデータセットでテストされている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:28:39 GMT)
Cluster Model for parsimonious selection of variables and enhancing Students Employability Prediction [1.5] 教育におけるデータは一般的に非常に大きく、多次元であり、自然界では不均衡である。
本稿では,様々な大学や大学から,MCA(Masters in Computer Applications)の学生データを収集する。
本論文では, 前処理段階に適用されたクラスタモデルを用いて, 変数の相似選択を行う。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:06:46 GMT)
Stateless and Non-Interactive Order-Preserving Encryption for Outsourced Databases through Subtractive Homomorphism [1.4] 秩序保存暗号化(OPE)は、アウトソースデータベースの文脈において、20年以上にわたって広く研究されてきた。
本稿では、ステートレスクライアントに適した新しいOPEスキームを提案し、クエリ中にクライアントとサーバのインタラクションを必要としない。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:14:04 GMT)
Npix2Cpix: A GAN-based Image-to-Image Translation Network with Retrieval-Classification Integration for Watermark Retrieval from Historical Document Images [1.4] 古代の透かしの識別と復元は、長い間、コーディコロジーと歴史の主要なトピックであった。
本稿では,U-net をベースとした条件付き逆数生成ネットワーク (GAN) を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:10:49 GMT)
Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types [1.3] 本稿では、同期語彙関係と単語の意味定義の両方から情報を活用するモデルを提案する。
具体的には,WordNet の構文定義と階層情報を用いて,Blank (1997) のセマンティックチェンジ型データセットのデジタル化バージョンでそれをテストする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:52:21 GMT)
Primitive Quantum Gates for an SU(3) Discrete Subgroup: $Σ(36\times3)$ [1.2] 我々は、108要素$Sigma(36times3)$群のデジタル量子シミュレーションのためのプリミティブゲートセットを構築する。
量子シミュレーションのために$SU(3)$の非アーベル結晶のような部分群が構築されたのはこれが初めてである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:09:00 GMT)
BEACON: A Bayesian Optimization Strategy for Novelty Search in Expensive Black-Box Systems [1.2] ノベルティ・サーチ (NS) は、シミュレーションや実験を通じて様々なシステムの振る舞いを自動的に発見する探索アルゴリズムのクラスである。
このような高価なブラックボックスシステムに特化して設計されたサンプル効率のNSに対するベイズ最適化法を提案する。
提案手法は,限られたサンプル予算の下で,より大規模な多様な挙動の集合を見出すことにより,既存のNSアルゴリズムよりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:23:52 GMT)
Combining Graph Neural Network and Mamba to Capture Local and Global Tissue Spatial Relationships in Whole Slide Images [1.2] 計算病理学では、ギガピクセル全体のスライド画像(WSI)から空間的特徴を抽出することが基本的な課題である。
本稿では,メッセージパッシンググラフニューラルネットワーク(GNN)と状態空間モデル(Mamba)を組み合わせて,局所的およびグローバルな空間関係を捉えるモデルを提案する。
早期肺腺癌患者の無再発生存予測に有効であった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:06:57 GMT)
Readability-guided Idiom-aware Sentence Simplification (RISS) for Chinese [1.2] 本稿では,データ拡張技術と語彙単純化を組み合わせた新しいフレームワークRISSを提案する。
RISSは,(1)高品質な文ペアをマイニングするRPS (Readability-Guided Paraphrase Selection) と(2)認識単純化 (Aware Simplification) という,慣用的な表現の理解と単純化を促進するモデルを導入する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:15:48 GMT)
Rethinking Programming Paradigms in the QC-HPC Context [1.1] マルチタスク管理の文脈で量子処理ユニット(QPU)の洗練の道を探る。
科学的発見の可能性はどのように実現されるかを説明する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:44:19 GMT)
Convolutional Neural Networks and Vision Transformers for Fashion MNIST Classification: A Literature Review [1.1] 画像分類領域における畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)の比較分析について検討する。
我々のゴールは、電子商取引業界におけるファッションMNISTデータセットの画像を分類するためのViTとCNNの最も適切なアーキテクチャを決定することです。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:32:22 GMT)
Variational Estimators of the Degree-corrected Latent Block Model for Bipartite Networks [1.1] 列および列クラスタの様々な度合いを考慮に入れた次数補正潜在ブロックモデル(DC-LBM)を提案する。
我々は,Mステップにおけるパラメータ推定のための閉形式解を作成することにより,効率的な変動予測-最大化アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:32:37 GMT)
Large Language Models Can Infer Psychological Dispositions of Social Media Users [1.1] GPT-3.5とGPT-4は、ゼロショット学習シナリオにおいて、ユーザのFacebookステータス更新からビッグファイブの性格特性を導出できるかどうかを検証する。
その結果, LLM-inferred と self-reported trait score の間には r =.29 (range = [.22,.33]) の相関が認められた。
予測は、いくつかの特徴について、女性と若い個人にとってより正確であることが判明し、基礎となるトレーニングデータやオンライン自己表現の違いから生じる潜在的なバイアスが示唆された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:25:06 GMT)
Reconfiguring Participatory Design to Resist AI Realism [1.1] 本稿では,参加型デザインがAIリアリズムに疑問を呈し抵抗する役割を担っていることを論じる。
AIリアリズムの3つの側面について検討する:真のエンパワーメントを欠く民主化のファサード、人間の適応性への要求、AIシステムを実現する必要不可欠な人的労働の難しさ。
PDを再構成して価値中心のビジョンへの関与を継続し、AI以外の選択肢を探究し、AIシステムを目に見えるものにすることで、AIリアリズムに抵抗することを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:21:46 GMT)
Reconstruction Error-based Anomaly Detection with Few Outlying Examples [1.0] 本研究では,正規データのドメイン記述の外部に既知の異常を配置するようにモデルに指示する,再構成エラーに基づくアーキテクチャのアプローチについて検討する。
特に,本手法では,正常例と未知例の双方に関連のある再現誤差の対比を増大させるために,限られた数の異常例を利用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:07:58 GMT)
Local vs. Global Interpretability: A Computational Complexity Perspective [1.0] 計算複雑性理論を用いて、MLモデルの局所的および大域的視点を評価する。
これらのモデルの局所的およびグローバル的解釈可能性に関する知見を提供する。
我々は,計算複雑性レンズによる説明可能性の検証が,MLモデル固有の解釈可能性をより厳密に把握する上で有効であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:23:49 GMT)
Ariadne: a Privacy-Preserving Communication Protocol [1.0] 本稿ではプライバシ保護型通信ネットワーク層プロトコルであるAriadneを紹介する。
信頼できるサードパーティに依存することを避けるために、ソースルーティングアプローチを使用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:20:12 GMT)
A Flexible Recursive Network for Video Stereo Matching Based on Residual Estimation [0.9] RecSMはビデオステレオマッチングの残差推定に基づくネットワークである。
スタック数は3で、RecSMはACVNetと比較して4倍のスピード向上を実現し、1つのNVIDIA 2080TI GPUに基づいて0.054秒で実行される。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:49:14 GMT)
Robust Ante-hoc Graph Explainer using Bilevel Optimization [0.8] グラフニューラルネットワークのための新鮮でフレキシブルなアンテホック説明器 RAGE を提案する。
RAGEは、予測に必要な完全な情報を含む分子サブ構造を効果的に識別することができる。
種々の分子分類タスクに関する実験により、RAGEの説明は既存のポストホック法やアンテホック法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 00:56:47 GMT)
Homomorphic Polynomial Public Key Cryptography for Quantum-secure Digital Signature [0.8] 2022年の研究では、KuangらはMPPK暗号を導入した。
彼らはMPPKをホモモルフィックなポリノミアル公開鍵(HPPK)に拡張し、大きな隠蔽リング操作に同型暗号化を適用した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:35:48 GMT)
cDVGAN: One Flexible Model for Multi-class Gravitational Wave Signal and Glitch Generation [0.8] 本稿では,複数の時間領域観測のクラスをシミュレートする手法として,ジェネレーティブ・アドリアック・ネットワーク・フレームワークに新しい条件モデルを提案する。
提案したcDVGANは,3つのクラスの特徴を再現する4種類のベースラインGANモデルより優れている。
実験の結果,cDVGAN生成データによる畳み込みニューラルネットワークのトレーニングにより,検出器ノイズに埋め込まれたサンプルの検出が向上することがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:30:30 GMT)
Comparative Benchmarking of Failure Detection Methods in Medical Image Segmentation: Unveiling the Role of Confidence Aggregation [0.7] 本稿では,医療画像セグメンテーションにおける故障検出手法の評価を目的とした総合的なベンチマークフレームワークを提案する。
我々は、現在の障害検出指標の強度と限界を特定し、リスクカバレッジ分析を全体的評価アプローチとして推奨する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:36:33 GMT)
Fantastyc: Blockchain-based Federated Learning Made Secure and Practical [0.7] フェデレートラーニング(Federated Learning)は、クライアントがローカルデータを共有せずに、中央サーバのオーケストレーション下で機械学習モデルを協調的にトレーニングすることを可能にする分散フレームワークである。
このフレームワークの中心性は、ブロックチェーンベースのフェデレーション学習アプローチによって、文献で扱われる障害点を表している。
この課題に対処するために設計されたFantastycを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:01:49 GMT)
Gapless symmetry-protected topological phases and generalized deconfined critical points from gauging a finite subgroup [0.7] 大域対称性の有限部分群を測ることによって、従来の位相と位相遷移を非伝統的な位相にマッピングすることができる。
本研究では,グローバルな$U(1)$を持つ創発的な$mathbbZ$-gaugedシステムについて検討する。
また、これらの相の安定性と、小さな摂動に対する臨界点とその潜在的な実験的実現についても論じる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:34:07 GMT)
Fiducial Tag Localization on a 3D LiDAR Prior Map [0.7] 既存のLiDARフィデューシャルタグローカライズ法は3次元LiDARマップには適用されない。
我々は, 3次元LiDAR事前マップ上で, 画像タグを直接ローカライズする新しい手法を開発した。
我々は,3次元LiDARマップ上のタグのローカライズに適用可能な手法として,定性的かつ定量的な実験を行った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:12:32 GMT)
FAPNet: An Effective Frequency Adaptive Point-based Eye Tracker [0.7] イベントカメラは、視線追跡の領域における従来のカメラに代わるものだ。
既存のイベントベースの視線追跡ネットワークは、イベントにおける重要できめ細かい時間情報を無視する。
本稿では、ポイントクラウドをイベント表現として利用し、視線追跡タスクにおける事象の高時間分解能とスパース特性を利用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:08:01 GMT)
Complementary Relationships between Entanglement and Measurement [0.6] 量子ビット系では、単一系における測定と二部系における測定の両方が絡み合いに関して考慮される。
例えば$overlineE+Dle 1$は、$overlineE$が測定後の平均絡み合いであることを示す。
得られた乱れ量や情報取得量は、絡み合いによって厳密に制限されていると結論付けている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:24:54 GMT)
Assessing Political Bias in Large Language Models [0.6] 我々は、ドイツの有権者の視点から、欧州連合(EU)内の政治問題に関するオープンソースのLarge Language Models(LLMs)の政治的バイアスを評価する。
Llama3-70Bのような大型モデルは、左派政党とより緊密に連携する傾向にあるが、小さなモデルは中立であることが多い。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:48:27 GMT)
Demonstrating Mutual Reinforcement Effect through Information Flow [0.6] 相互強化効果(MRE)は,テキスト分類タスクにおける単語レベルとテキストレベルの分類の相乗的関係について検討する。
我々はMRE理論を観察・実証するために情報フロー解析を用いる。
我々は,文章レベルの分類ラベルの予測を促進するために,単語レベルの情報を動詞化子として活用し,学習を促すためのMREの適用を拡大する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:47:38 GMT)
VQUNet: Vector Quantization U-Net for Defending Adversarial Atacks by Regularizing Unwanted Noise [0.6] 本稿では,新たなノイズ低減手法であるベクトル量子化U-Net(VQUNet)を導入し,対向雑音を低減し,高忠実度でデータを再構成する。
VQUNetは、ノイズ低減とデータ再構成の両方のためのマルチスケール階層構造を通して、離散潜在表現学習を特徴とする。
これは、Fashion-MNISTとCIFAR10データセットの両方に対する様々な敵攻撃の下で、最先端のノイズ低減ベースの防衛手法より優れている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:10:03 GMT)
Generative AI and Digital Neocolonialism in Global Education: Towards an Equitable Framework [0.6] 本稿では、ジェネレーティブ・人工知能(GenAI)が西洋以外の社会に西洋のイデオロギーをどう強制するかを批判的に論じる。
元内は、主に西洋の学生に関する文化資料や事例を取り入れたコンテンツを作ることで、文化帝国主義を育むことができる。
GenAIによる西洋語の使用は、非支配的な言語を疎外することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:43:55 GMT)
Modulated Ringdown Comb Interferometry for next-generation high complexity trace gas sensing [0.5] 変調リングダウンコム干渉計は、長さ変調キャビティを通して伝達される超並列コム線によって輸送されるリングダウンダイナミクスを解く。
広帯域1010cm-1, キャビティ微細度23,000の範囲で, 高度に分散したヒトの呼吸サンプルを計測し, 本手法の有効性を実証した。
これにより、20個の異なる分子種を1個の三量体当たりの感度で同時定量することができ、その濃度は7桁に変化する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:02:54 GMT)
TIDMAD: Time Series Dataset for Discovering Dark Matter with AI Denoising [0.4] ダークマターの起源は 現代物理学において 最も重要な問題の一つです
ABRACADABRA実験は暗黒物質を探索するために特別に設計された。
このデータリリースは、コアAIアルゴリズムが信号を抽出し、実際の物理結果を生成することを可能にする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:18:36 GMT)
Ethical considerations of use of hold-out sets in clinical prediction model management [0.4] 我々は、善意、非正当性、自律性、正義の倫理的原則に焦点をあてる。
また,様々なホールドアウトセットサンプリング手法による統計的問題についても論じる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:42:46 GMT)
Physics-Informed Critic in an Actor-Critic Reinforcement Learning for Swimming in Turbulence [0.4] 我々は、PIRL戦略と、所定の制御(PC)および標準物理に依存しない強化学習戦略を開発・比較する。
我々のPIRLスキームはActor-Physicistと呼ばれ、ニューラルネットワークパラメータ化Criticを解析的に導出した物理関数に置き換えるActor-Criticアルゴリズムの適応である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:06:57 GMT)
Heisenberg-limited adaptive gradient estimation for multiple observables [0.4] 量子力学において、一般観測値の期待値を測定することは、固有の統計的不確実性を持つ。
我々は,ルート平均二乗誤差内における一般可観測値の期待値を推定する適応量子アルゴリズムを提案する。
本手法は,量子コンピュータを用いた複雑な量子システムにおいて,様々な物理特性を正確に理解し,予測する新しい手法である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:16:47 GMT)
What's happening in your neighborhood? A Weakly Supervised Approach to Detect Local News [0.4] 我々は、ローカルニュースの自動検出とコンテンツに基づくローカルニュースレコメンデーションを可能にする統合パイプラインを開発した。
スタンフォード大学のCore NERモデルと比較して、私たちのパイプラインはより高精度で、実世界と人間ラベルのデータセットでリコール評価されています。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:50:00 GMT)
A multistep strategy for polynomial system solving over finite fields and a new algebraic attack on the stream cipher Trivium [0.4] 我々は,少なくとも1つの解を持つシステム向けに設計されたMultiというアルゴリズムで,この戦略を実装した。
我々は,最大ステップ数のマルチステップ戦略を用いることで,Multiの最適複雑性が達成されることを証明し,その結果,単一のステップからなる戦略である標準的な推測・決定戦略が最悪の選択であることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:23:34 GMT)
Multi-Sample Dynamic Time Warping for Few-Shot Keyword Spotting [0.4] na"ive approach to detect keywords in a target sequence were consisting all samples of all class using sub-sequence dynamic time warping。
あるいは、クラス毎に単一のFr'echet平均しかクエリできないため、処理時間が短縮される。
本研究では,全てのクエリサンプルの変動性を含むクラス固有のコストテンソルを計算するために,マルチサンプル動的時間ワープを提案する。
論文参考訳(メタデータ) (Wed, 05 Jun 2024 07:45:31 GMT)
Technological Perspective on Digital Sovereignty [0.3] この報告書は、技術的観点からのデジタル主権の意味と、スイスや海外で現在どのような活動が行われているかを示している。
また、今後の「スマート・デジタル・ソブリンティ・ストラテジー」の戦略的方向性や具体的な勧告も提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:44:33 GMT)
Olfactory Label Prediction on Aroma-Chemical Pairs [0.3] 本稿では,アロマケミカルのブレンドから発生する臭気特性を正確に予測できるグラフニューラルネットワークモデルを提案する。
本稿では、ラベル付き分子対からなるデータセットに対して、既存のアプローチと新しいアプローチの両方を適用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:26:48 GMT)
From Seedling to Harvest: The GrowingSoy Dataset for Weed Detection in Soy Crops via Instance Segmentation [0.3] 我々は、ニューラルネットワークを訓練し、インスタンスセグメンテーションを通して雑草や大豆を検知する包括的データセットを導入する。
我々のデータセットは、大豆の生育の様々な段階をカバーし、雑草の侵入の影響に関する時系列的な視点を提供する。
また、このデータセットでトレーニングされたアートモデルの6つの状態を提供し、プランテーションプロセスのすべての段階で大豆や雑草を理解し、検出することができます。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:22:49 GMT)
Neural force functional for non-equilibrium many-body colloidal systems [0.2] パワー関数理論と機械学習を組み合わせて、コロイド粒子の非平衡過剰多体系を研究する。
まず、ブラウン粒子のコンピュータシミュレーションから、一体場を定常にサンプリングする。
ニューラルネットワークは、このデータを用いて訓練され、一体密度と速度プロファイルから一体の内部力場への公式な正確に機能的なマッピングを宇宙空間で局所的に表現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:57:23 GMT)
EpidermaQuant: Unsupervised detection and quantification of epidermal differentiation markers on H-DAB-stained images of reconstructed human epidermis [0.2] 再建ヒト表皮の一体性は組織学的解析と角化細胞分化マーカーを用いて評価できる。
スキャンされた組織をコンピュータで分析することで、専門家の時間を節約し、定量化の精度を向上させることができる。
染色画像の作成とキャプチャと複数のアーティファクトの存在の間の技術差は、計算方法の結果に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:45:56 GMT)
Evaluating AI fairness in credit scoring with the BRIO tool [0.2] 本稿では,AIシステムにおける公平性の問題を定量的に詳細に分析する手法と,クレジットスコアリングへの応用について述べる。
BRIOは、社会的不公平に関してAIシステムを評価するためのツールであり、より一般的には倫理的に望ましくない行動である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:00:46 GMT)
Scientific Hypothesis Generation by a Large Language Model: Laboratory Validation in Breast Cancer Treatment [0.1] 大規模言語モデル(LLM)はAIを変革し、人間の知性を必要とする幅広いタスクにおいて画期的なパフォーマンスを達成した。
ここでは乳がん治療の分野での科学的仮説の根拠としてLLMの使用を実験的に検証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:50:51 GMT)
Almost exact recovery in noisy semi-supervised learning [0.1] グラフに基づく半教師付き学習手法は、グラフ構造とラベル付きデータを組み合わせ、ラベルなしデータを分類する。
MAPの連続緩和から導かれるアルゴリズムを提案し,その一貫性を確立する。
数値実験により,非常にノイズの多いラベル付きデータであっても,合成および実データに対して有望な性能が得られた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:03:47 GMT)
Exploring Multilingual Large Language Models for Enhanced TNM classification of Radiology Report in lung cancer staging [0.1] 大型言語モデル(LLM)は、自然言語による放射線学レポートの構造化を自動化することを約束する。
本研究の目的は,GPT3.5-turbo (GPT3.5) を用いた放射線学報告に基づくTNM分類の精度と日本語と英語の多言語LPMの有用性を検討することである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:11:55 GMT)
You Only Accept Samples Once: Fast, Self-Correcting Stochastic Variational Inference [0.0] YOASOVI(ヨアソビ)は、ベイズ系大規模モデルにおける変分推論(VI)の高速で自己補正的な直観最適化を行うアルゴリズムである。
これを実現するために、各イテレーションで VI に使用される目的関数について利用可能な情報を活用し、通常のモンテカルロサンプリングを受け入れサンプリングに置き換える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:28:53 GMT)
What Matters in Hierarchical Search for Combinatorial Reasoning Problems? [0.0] 近年の取り組みでは,階層的な高次探索戦略を取り入れたサブゴアル手法による計画の強化が試みられている。
有望ではあるが、従来の低レベルのプランナに対する彼らのパフォーマンスは一貫性がなく、アプリケーションコンテキストに関する疑問を提起している。
難解な値関数、複雑なアクション空間、環境におけるデッドエンドの存在、あるいは多様な専門家から収集されたデータなど、ハイレベル検索の利点を活用する上で重要な属性を同定する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:14:58 GMT)
Visualization for Recommendation Explainability: A Survey and New Perspectives [0.0] 本研究では,4次元のレコメンデータシステムにおける説明に関する文献を体系的にレビューする。
我々は,レコメンデーションシステムにおいて,説明的視覚化を設計するための一連のガイドラインを導出する。
本研究の目的は、視覚的に説明可能なレコメンデーション研究の可能性について、研究者や実践者がより深く理解することである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:41:02 GMT)
Variational readout through quantum teleportation [0.0] この文書は、実際の検出器にはあまり役に立たないことが判明したため、ジャーナルは出版されない。
このバックアクションを緩和する1つの戦略は、測定ショットノイズと放射圧ノイズとを相互に関連付ける変分読み出しを用いることである。
本稿では,フィルタキャビティを不要とする量子テレポーテーションの原理を応用した,変分読み出し手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:15:31 GMT)
Unpacking Approaches to Learning and Teaching Machine Learning in K-12 Education: Transparency, Ethics, and Design Activities [0.0] 機械学習の学習と教育を概念化するための3つのアプローチを同定する。
その1つは、データ駆動アプローチであり、若者にデータセットを作成し、トレーニングし、テストする機会を提供することを強調している。
アルゴリズム駆動学習の第2のアプローチは、機械学習モデルの背後にある学習アルゴリズムやエンジンの動作に関する学習を優先するものだ。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:37:21 GMT)
Towards Quantum Computing Timelike Hadronic Vacuum Polarization and Light-by-Light Scattering: Schwinger Model Tests [0.0] 本稿では1+1次元の量子電磁力学を用いてHVPとHLBLを解析する手法を提案する。
そのために、テンソルネットワーク技術、特に行列積状態とデジタル量子コンピュータの古典的エミュレータの両方を使用します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:00:01 GMT)
Thermodynamically reversible quantum measurements and related work costs [0.0] 量子計測の実現に必要なエネルギー資源を解析する。
一般的な熱力学の議論を通して、最小限の必要な作業は測定対象のシステムのエネルギー変動に依存することを示す。
有限時間熱力学過程に固有のエントロピー生成の増大に伴う作業コストの増加について述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:55:34 GMT)
The Task-oriented Queries Benchmark (ToQB) [0.0] タスク指向クエリの標準ベンチマークはまだ利用できない。
NLP分野の既存のベンチマークは主にタスク指向の対話に焦点を当てている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:05:41 GMT)
The Focked-up ZX Calculus: Picturing Continuous-Variable Quantum Computation [0.0] 連続変数量子計算のためのグラフィカル言語を定式化する。
我々はヘフティCVQC相互作用を捉えたエキサイティングな新しいグラフィカルルールを提案する。
量子誤り訂正法を応用し、ゴッテマン・キタエフ・プレスキル符号エンコーダ、シンドローム測定、ハダマール固有状態の魔法状態蒸留のグラフィカル表現を導出する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:56:18 GMT)
The Challenges of Evaluating LLM Applications: An Analysis of Automated, Human, and LLM-Based Approaches [0.0] 本稿では,LLMに基づく評価と人間の評価との関連性について論じる。
本稿では,人間とLLMによる評価と併用可能な包括的因子評価機構を提案する。
その結果, 因子に基づく評価は, LLMアプリケーションにおいてどの側面を改善する必要があるか, より優れた洞察をもたらすことがわかった。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:55:10 GMT)
Sub-diffraction estimation, discrimination and learning of quantum states of light [0.0] サブレイリー推定の手法として空間モードデマルチプレクシング(SPADE)が提案されている。
サブレイリー分解能を実現するハイブリッド量子古典画像分類器を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:08:58 GMT)
Spread complexity and localization in $\mathcal{PT}$-symmetric systems [0.0] 拡散複雑性と拡散エントロピーを用いた$mathcalPT$-symmetric量子系における波動関数の拡散について検討する。
我々は$mathcalPT$-breakken 相において、強結合格子の一方の端に局在することを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:00:00 GMT)
Spiking representation learning for associative memories [0.0] 本稿では、教師なし表現学習と連想記憶操作を行う新しい人工スパイクニューラルネットワーク(SNN)を提案する。
モデルの構造は新皮質列状構造から派生し,隠れた表現を学習するためのフィードフォワードプロジェクションと,連想記憶を形成するための繰り返しプロジェクションを組み合わせたものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:30:11 GMT)
SlicerChat: Building a Local Chatbot for 3D Slicer [0.0] 3D Slicerは3Dデータ視覚化と分析のための強力なプラットフォームだが、新しいユーザーにとって大きな学習曲線がある。
このプロジェクトでは,3D Slicer関連の質問に答えるために最適化されたSlicerChatシステムを構築している。
サイズ1.1B、7B、13Bのモデルは、低階適応を用いて微調整された。
3DスライダドキュメンテーションのさまざまなソースがRetrieval Augmented Generationパラダイムで使用するためにコンパイルされた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 03:32:06 GMT)
Simplification of tensor updates toward performance-complexity balanced quantum computer simulation [0.0] 本研究は、テンソルネットワークに基づく量子コンピュータシミュレーションの文脈におけるテンソル更新の単純化について研究する。
数値シミュレーションによると、単純更新と呼ばれる手法は、量子多体スピン系からもたらされ、忠実度と計算複雑性のバランスが良好である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:18:28 GMT)
Shaping the topology of twisted bilayer graphene via time-reversal symmetry breaking [0.0] 我々は、時間反転対称性の破れを利用して、ねじれた二層グラフェン(TBG)の位相特性を操る
TRSBの強度を変化させることで、相対的なチャーン数を持つ一対の平坦なバンドを示す位相絶縁相の間の位相相転移を発見する。
この新しい電子相は、フェルミエネルギーの関数として、その非量子化異常ホール導電率を測定することで、研究室で同定できることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:14:28 GMT)
Sampling in Unit Time with Kernel Fisher-Rao Flow [0.0] 非正規化対象密度からサンプリングするための平均場ODEと対応する相互作用粒子系(IPS)を導入する。
IPSは勾配のない閉形式であり、参照密度からサンプリングし、(正規化されていない)ターゲット-参照密度比を計算する能力のみを必要とする。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:30:09 GMT)
Reproducibility study of FairAC [0.0] 本研究は,Guo, Chu, Li arXiv:2302.12977 の論文 "Fair Attribute Completion on Graph with Missing Attributes" の成果を再現することを目的としている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:26:45 GMT)
Relative-belief inference in quantum information theory [0.0] 相対的信念手順は、幅広い情報基準の最適化から選択されたものよりも次元が小さくないヒルベルト空間を選択することを示す。
我々は、相対的信念手順を重要な応用、すなわち不完全な量子源の状態再構成に適用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:59:58 GMT)
Reconstructing training data from document understanding models [0.0] 文書理解モデルは、機密文書を処理するために企業によってますます採用されている。
本稿では,これらのモデルのトレーニングデータからセンシティブフィールドを抽出するために設計された最初の再構成攻撃について述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:13:18 GMT)
Reacting like Humans: Incorporating Intrinsic Human Behaviors into NAO through Sound-Based Reactions to Fearful and Shocking Events for Enhanced Sociability [0.0] 人間は、突然大きな音に遭遇した時に自然反応を示し、それを刺激したり怖がったりします。
この研究では、環境を感知するマルチモーダルシステムが設計され、突然大きな音が鳴り響くと自然の人間の恐怖反応が現れる。
これらの有効な動きと推論は、本質的な人間の反応を模倣し、ロボットの社会性を高めることができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:52:09 GMT)
Randomized Principal Component Analysis for Hyperspectral Image Classification [0.0] 2つのハイパースペクトルデータセットの分類において,特徴量を20と30に減らした。
最も高い分類精度は、LightGBMによって0.9925と0.9639と得られた。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:49:25 GMT)
Raman effects in Quantum Frequency Conversion using Bragg Scattering [0.0] 4波混合ブラッグ散乱によるファイバベース周波数変換を記述する量子力学モデルを提案する。
自発ラマン散乱によるノイズは、ポンプが量子場から30Hz未満であれば、この種の周波数変換に深刻な困難をもたらす。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:44:19 GMT)
Quantum-critical properties of the one- and two-dimensional random transverse-field Ising model from large-scale quantum Monte Carlo simulations [0.0] 本研究では1次元と2次元でT = 0$の焼成障害を有する強磁性横磁場イジングモデルについて検討する。
実効的なゼロ温度シミュレーションの強調は、既存の文献におけるいくつかの矛盾を解消する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:39:22 GMT)
Quantum channels and some absolute properties of quantum states [0.0] 2つの量子ビットと2つの量子ビットの量子チャネルの作用を探索し、いくつかの量子状態が非絶対状態からその作用の下で絶対状態へと移動することを発見した。
絶対性の概念を条件付き R'enyi エントロピーに拡張し、絶対条件付き R'enyi エントロピー非負性 (ACRENN) を持つ状態に必要な条件を求める。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:32:55 GMT)
Quantum Dynamics in Krylov Space: Methods and Applications [0.0] 量子系の力学は状態空間や作用素空間(クリロフ空間)の部分空間内で展開する。
このレビューでは、量子進化のコンパクトで効率的な記述を提供するために、クリロフ部分空間法を用いる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:53:01 GMT)
Predicting the Geothermal Gradient in Colombia: a Machine Learning Approach [0.0] 地熱勾配の決定は 特定の地域の地熱エネルギーポテンシャルを評価するのに 不可欠です
地熱勾配の予測に教師付き機械学習の最近の進歩を活用するアプローチを提案する。
我々は,本モデルの予測精度が12%以内であり,他の著者による独立測定値が本モデルとよく一致していることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:37:03 GMT)
Posterior and variational inference for deep neural networks with heavy-tailed weights [0.0] 我々は、ネットワーク重みをランダムにサンプリングする事前分布を持つベイズフレームワークにおいて、ディープニューラルネットワークを考察する。
後部分布は, ほぼ最適のミニマックス収縮速度を達成できることを示す。
また, 実験結果の変分ベイズ版も提供し, 平均場変分近似は, ほぼ最適理論的支援の恩恵を受けていることを示した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:24:20 GMT)
Perturbation Theory and the Sum of Squares [0.0] sum-of-squares (SoS) 階層は半定値プログラミングに基づく強力な手法であり、古典的および量子最適化の両問題に利用できる。
この階層の3種類の系に対する弱い結合摂動理論を再現する能力を考える。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:12:17 GMT)
PINNs error estimates for nonlinear equations in $\mathbb{R}$-smooth Banach spaces [0.0] PINNの誤差推定を許容するPDEの演算式クラスについて述べる。
Lp$空間に対して、PINNの残差境界のツールであるブランブル・ヒルベルト型補題を得る。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:58:25 GMT)
Ordinal Mixed-Effects Random Forest [0.0] 我々は、通常混合効果ランダムフォレスト(OMERF)と呼ばれる革新的な統計手法を提案する。
ランダム・フォレストの使用を階層データや順序応答の分析にまで拡張する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:30:40 GMT)
Optimal mixers restricted to subspaces and the stabilizer formalism [0.0] 与えられた部分空間を保存するミキサーの理解と構築を両立させる新しい形式主義を提示する。
我々は、我々のアプローチを論理X-ミクサーまたは論理XQAOAと呼ぶ。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:56:42 GMT)
Optimal Control and Glassiness in Quantum Sensing [0.0] ダイヤモンド中の窒素空孔中心は、磁場、温度、または関連する信号を検知するための量子ビットとして操作することができる。
パルスを$pi$を超えて拡張し、連続時間依存の制御フィールドの最適化を探索する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:18:22 GMT)
On the non-uniqueness of the energy-momentum and spin currents [0.0] ネーターの第二定理を用いて相対論的スピン流体力学の巨視的エネルギー-運動量とスピン密度を導出する。
ネーターの第二定理を用いて、スピン 1-半の自由ディラック粒子に対する擬ゲージ変換を必要とせず、エネルギー-運動量とスピン電流を導出する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:02:47 GMT)
Normalizing Flows for Conformal Regression [0.0] Conformal Prediction (CP)アルゴリズムは、ラベル付きデータに基づいて出力を校正することで予測モデルの不確実性を推定する。
キャリブレーション過程をトレーニングすることで、間隔をローカライズする一般的なスキームを提案する。
Papadopoulos et al. (2008)の誤り再重み付けCPアルゴリズムとは異なり、このフレームワークは名目と経験的条件の妥当性のギャップを推定できる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:04:28 GMT)
Nonreciprocal synchronization of active quantum spins [0.0] 対角的非相反的な方法で相互作用する2種類の量子スピンのモデルを示す。
非相互相互作用がそれらの同期力学に深く影響していることを示す。
我々の研究は、能動量子物質における非相互相互作用を探求する新たな道を開く。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:12:34 GMT)
Neural empirical interpolation method for nonlinear model reduction [0.0] 減数順序モデル(ROM)における非線形項計算の時間的複雑さを低減するためのニューラル経験法(NEIM)を導入する。
NEIM は、ROM の非線形項のアフィン分解を近似することにより、この還元を実現するグレディアルゴリズムである。
NEIMは強欲な戦略に基づいており,その性能を調査するための基本的な誤り解析を行うことができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:17:33 GMT)
Negative impact of heavy-tailed uncertainty and error distributions on the reliability of calibration statistics for machine learning regression tasks [0.0] 重み付き不確実性および誤差分布に対して,MV,MSE,それらの信頼区間の推定は信頼性に欠けることが示されている。
同じ問題が、一般的なenceのような条件付きキャリブレーション統計にも影響することが期待されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:25:23 GMT)
Multivariate Physics-Informed Convolutional Autoencoder for Anomaly Detection in Power Distribution Systems with High Penetration of DERs [0.0] 本稿では,物理インフォームド・コンボリューション・オートエンコーダ(PIConvAE)モデルを提案する。
提案モデルの性能評価は,カリフォルニア州リバーサイドのIEEE 123バスシステムと実世界の給電システムを用いて行った。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:28:57 GMT)
Multi-Task Multi-Scale Contrastive Knowledge Distillation for Efficient Medical Image Segmentation [0.0] 本論文は,医用画像分割作業におけるニューラルネットワーク間の知識伝達の実現可能性を検討することを目的とする。
データボリュームが制限される医療画像の文脈では、より大きなトレーニング済みネットワークからの知識を活用することが有用である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:06:04 GMT)
Mpemba effects in open nonequilibrium quantum systems [0.0] 2種類の量子Mpemba効果が可能であることを示す。
量子ムペンバ効果の存在は、より単純な観測可能量を測定することによって既に確立できる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 17:58:19 GMT)
Measuring two temperatures using a single thermometer [0.0] 1つの温度計を用いて2つの温度を同時に測定できることを示す。
特に、複数の量子自由度(DoF)を持つ複合粒子を温度センサとして検討する。
これらの粒子をマッハ・ツェンダー型干渉計で同時に2つの温度を推定できることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:14:55 GMT)
Magnetization without spin: effective Lagrangian of itinerant electrons [0.0] 有効ラグランジアンの有限$B$は、Bneq 0$の物理効果を適切に表す。
スレーター・ポーリング曲線と呼ばれる磁場の普遍的なシフトは、有効ラグランジアンから導かれる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:03:24 GMT)
MESS: Modern Electronic Structure Simulations [0.0] 電子構造シミュレーション(Electronic Structure Simulation, ESS)は、原子論的なスケールに関する定量的科学的知見を提供するために何十年も使われてきた。
最近の機械学習(ML)の導入は、MLモデルをFORTRANやCといった言語でコーディングする必要があることを意味している。
我々は、JAXで実装された最新の電子構造シミュレーションパッケージであるMESSを紹介し、ESSコードをMLの世界に移植する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:15:16 GMT)
LlamaCare: A Large Medical Language Model for Enhancing Healthcare Knowledge Sharing [0.0] 24G GPUでChatGPTと同等の性能を示した。
PubMedQAやUSMLE 1-3など,いくつかのベンチマークを対象としたワンショットおよび数ショットトレーニングのための処理データをリリースしました。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:08:42 GMT)
Linking Named Entities in Diderot's \textit{Encyclopédie} to Wikidata [0.0] ディドロトの『Encyclop'edie』はヨーロッパにおける第8世紀からの参考文献で、その時代の知識を収集することを目的としている。
2つの百科事典間のデジタル接続の欠如は、それらの比較と知識がどのように進化したかの研究を妨げる可能性がある。
我々は,textitEncyclop'edieエントリの10,300以上のアノテーションをWikidata識別子で記述し,これらのエントリをグラフに接続する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:00:04 GMT)
Leveraging Off-the-Shelf Silicon Chips for Quantum Computing [0.0] 有望な実装には、トランジスタ内の量子ドットを利用する半導体量子ビットが含まれる。
いくつかのイニシアチブは商用トランジスタの使用を探求し、研究者にスケーラビリティ、品質の改善、可利用性、アクセシビリティを提供する。
本稿では,量子ビットの市販化の可能性と市販化の可能性について考察する。
これは、ノイズ、コヒーレンス、大規模産業ファブにおける限定的なカスタマイズ性、スケーラビリティの問題といった課題に対処する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:44:07 GMT)
Leveraging KANs For Enhanced Deep Koopman Operator Discovery [0.0] 多層パーセプトロン(MLP)は、非線形力学を線形化するディープ・クープマン作用素の発見に広く利用されている。
Kolmogorov-Arnold Networks (KAN) がより効率的かつ正確な代替手段として出現し、各ネットワークタイプの性能の比較を提案する。
学習速度は31倍、パラメータ効率は15倍、予測精度はDeep Neural Networks(DNN)の1.25倍である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:50:27 GMT)
Isolated pulsar population synthesis with simulation-based inference [0.0] 中性子星誕生特性とその動的・磁気進化をモデル化する枠組みを開発する。
次に、神経後部推定に焦点を当てたSBIアプローチに従い、パラメータの後部分布を推定するために深部ニューラルネットワークを訓練する。
我々のアプローチは、複雑な集団合成フレームワークに対する頑健な統計的推測への重要な一歩である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:34:42 GMT)
Intrusion Tolerance for Networked Systems through Two-Level Feedback Control [0.0] サービスレプリカを2段階最適制御問題とするシステムの侵入耐性を定式化する。
ローカルレベルではノードコントローラが侵入回復を行い、グローバルレベルではシステムコントローラが複製係数を管理する。
この定式化に基づいて、侵入耐性システムのための新しい制御アーキテクチャであるTOLERANCEを設計する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 06:50:21 GMT)
Input of the Coulomb law modification to the Lamb shift of the hydrogen atom [0.0] 相対論的水素原子のスペクトルにおける偶発的縮退を除去する放射補正を計算する。
水素原子のエネルギースペクトルはこれらの補正によって得られる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:06:31 GMT)
Inferring the time-varying coupling of dynamical systems with temporal convolutional autoencoders [0.0] 因果推論のためのテンポラルオートエンコーダ(TACI)を紹介する。
TACIは、2つの頭を持つ新しい機械学習アーキテクチャと因果関係を評価するために、新しい代理データメトリクスを組み合わせる。
TACIが様々なシステム間で動的因果相互作用を正確に定量化できることを実証する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:51:20 GMT)
In-operando microwave scattering-parameter calibrated measurement of a Josephson travelling wave parametric amplifier [0.0] 超伝導進行波パラメトリック増幅器(英語版) (TWPAs) は、一般にキュービット読み出しに使用されるブロードバンド近量子制限型マイクロ波増幅器である。
マイクロ波キャリブレーション法を用いてジョセフソン接合を用いたTWPAインオペランドのS-パラメータを抽出する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:46:41 GMT)
Improving Plan Execution Flexibility using Block-Substitution [0.0] AI計画における部分順序プランは、制約の少ない性質のため、実行の柔軟性を促進する。
プランの順序変更は、計画内の不要なアクション順序を削除し、プランの順序変更は、アクション順序の最小化のために任意に修正する。
本研究は,従来の計画整理・順序変更戦略とは対照的に,計画外の行動に代えて計画の柔軟性を向上させる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:30:48 GMT)
Identification of Stone Deterioration Patterns with Large Multimodal Models [0.0] 岩盤要素の異常や劣化パターンを認識し,分類するための基礎的マルチモーダルモデルの能力を評価する。
主な石の劣化パターンと異常の分類を定式化した上で, 石造遺産の高度に代表的な354点の選抜をモデルに依頼した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:44:49 GMT)
Hybridizing Traditional and Next-Generation Reservoir Computing to Accurately and Efficiently Forecast Dynamical Systems [0.0] Reservoir Computer (RC) は時系列予測のための強力な機械学習アーキテクチャである。
次世代貯水池コンピュータ (NGRC) が導入された。
本稿では,動的システムの時系列予測のためのハイブリッドRC-NGRC手法を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 21:49:03 GMT)
How to discretize continuous state-action spaces in Q-learning: A symbolic control approach [0.0] 本稿では,空間離散化法における大きな欠点を浮き彫りにした系統解析について述べる。
この課題に対処するために,行動関係を表す記号モデルを提案する。
この関係により、オリジナルのシステムへの抽象化に基づいて、合成されたコントローラをシームレスに適用することができる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 22:58:27 GMT)
Hot Schrödinger Cat States [0.0] 我々は、トランスモン量子ビットとのユニタリ相互作用のみを用いて、マイクロ波空洞内の熱状態の変位の量子重ね合わせを生成する。
これはキャビティモードの温度が1.8ケルビンであり、キャビティの物理的環境の60倍の温度である。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:39:51 GMT)
High-efficiency microwave photodetection by cavity coupled double dots with single cavity-photon sensitivity [0.0] 超伝導キャビティ結合二重量子ドット(DQD)フォトダイオードは、マイクロ波領域で最大25%の光子-電子変換効率を達成する。
より高品質な共振器でマイクロ波信号を100 aWの電力レベルまで測定し,共振器内で1光子ずつマイクロ波信号をプローブする感度を実現する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:23:19 GMT)
Haar-random and pretty good measurements for Bayesian state estimation [0.0] 我々は、純状態の均一なアンサンブルに対して、IDD列のランダムな測定値の平均忠実度を導出する。
混合量子状態のアンサンブルに対して、ユニタリな2-設計で定義される測定値がハールランダムなユニタリで定義される値と密接に近似していることが分かる。
単発更新では、Petzリカバリマップを用いて、かなり良いベイズ平均推定値が得られることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 04:17:00 GMT)
Global fermionic mode optimization via swap gates [0.0] 大域フェルミオンモード最適化により、与えられた誤差マージンに対する量子多体波関数の最適表現を求める。
固定階数行列積状態多様体上の定常点は、グラスマン多様体上の合同最適化によって得られる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:47:37 GMT)
Generalized "Square roots of Not" matrices, their application to the unveiling of hidden logical operators and to the definition of fully matrix circular Euler functions [0.0] Notの平方根は量子コンピューティング理論において重要な論理演算子である。
物理学では、次元 2 の平方複素行列である。
演算子の2つの平方根に対する一般表現がどのように得られるかを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:33:10 GMT)
GPT-4's One-Dimensional Mapping of Morality: How the Accuracy of Country-Estimates Depends on Moral Domain [0.0] Open AIのGPTモデルは、各国間の道徳的意見の変化を予測することができる。
高所得国では低所得国に比べて精度が著しく高い傾向にある。
本研究は, 過去の知見を再現し, 道徳的問題の種類によってどのように精度が変化するかを調べることによって研究を進めることを目的としている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:58:45 GMT)
GFN: A graph feedforward network for resolution-invariant reduced operator learning in multifidelity applications [0.0] 本研究は,多忠実度アプリケーションのための新しい分解能不変モデルオーダー削減戦略を提案する。
我々はこの研究で開発された新しいニューラルネットワーク層、グラフフィードフォワードネットワークに基づいてアーキテクチャを構築した。
パラメトリックな偏微分方程式に対する自己エンコーダに基づく還元戦略において,異なるメッシュサイズでのトレーニングとテストの能力を利用する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:31:37 GMT)
FedCC: Robust Federated Learning against Model Poisoning Attacks [0.0] フェデレートラーニング(Federated Learning)は、学習モデルにおけるプライバシの問題に対処するように設計されている。
新しい分散パラダイムは、データのプライバシを保護するが、サーバがローカルデータセットにアクセスできないため、攻撃面を区別する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:54:14 GMT)
Expressive Symbolic Regression for Interpretable Models of Discrete-Time Dynamical Systems [0.0] このタスクのためのシンボリックニューラルネットワーク訓練表現(SymANNTEx)アーキテクチャ
修正したSymanNTExモデルでは,単一状態のマップを適切に識別し,二状態のアトラクタの近似に適度に成功していることを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 05:05:29 GMT)
Evaluating the Efficacy of Large Language Models in Detecting Fake News: A Comparative Analysis [0.0] 本研究では,偽ニュースコンテンツの識別・フィルタリングにおける各種LLMの有効性について検討した。
Kaggleのフェイクニュースデータセットを用いて、この研究は偽ニュース検出におけるLLMの現在の能力と限界に光を当てる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 02:55:21 GMT)
Equivalence Set Restricted Latent Class Models (ESRLCM) [0.0] 等価集合制限潜在クラスモデル(ESRLCM)と呼ばれる新しいベイズモデルを提案する。
このモデルは、一般的なアイテム応答確率を持つクラスタを特定し、従来の制限された潜在属性モデルよりも汎用的に実行する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:35:37 GMT)
Entropy Production from Maximum Entropy Principle: a Unifying Approach [0.0] エントロピー生成は、不可逆現象と熱力学の第2法則を特徴づける重要な量である。
私たちはJaynesの最大エントロピー原理を使って、際立った、明らかに矛盾する定義をまとめるフレームワークを構築します。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:16:56 GMT)
Entanglement harvesting in buckled honeycomb lattices by vacuum fluctuations in a microcavity [0.0] 平面マイクロキャビティ内に設置した2つの同一折り畳みハニカム格子間の絡み合いについて検討した。
空洞場の初期状態として真空状態を考慮すると,コンカレンス測定を用いて絡み合いの形成を解析する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:54:51 GMT)
Entanglement Asymmetry in non-Abelian Anyonic Systems [0.0] 本研究は,ノンアノニカルシステムとは根本的に異なる情報理論特性を示す。
バイパルタイト系では、純粋な状態は異なる境界スペクトルを持ち、混合状態は純粋な境界状態を含む。
本研究は, 量子通信や暗号プロトコルの実現に繋がる可能性があり, 情報理論的側面の理解を著しく促進するものである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:00:06 GMT)
Ensembling Portfolio Strategies for Long-Term Investments: A Distribution-Free Preference Framework for Decision-Making and Algorithms [0.0] 本稿では、長期的富という観点から個別の戦略を上回るために、逐次的ポートフォリオのための複数の戦略をまとめることの問題点について考察する。
我々は,市場条件にかかわらず,戦略を組み合わせるための新たな意思決定枠組みを導入する。
シャープ比の小さなトレードオフがあるにもかかわらず、提案した戦略を支持する結果を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:08:57 GMT)
Enhancing Traffic Sign Recognition with Tailored Data Augmentation: Addressing Class Imbalance and Instance Scarcity [0.0] 本稿では道路安全に不可欠な交通標識認識(TSR)における重要な課題に取り組む。
本稿では,合成画像生成や幾何変換などのデータ拡張技術を紹介する。
本手法は,実世界の条件を正確にシミュレートするための多種多様な拡張プロセスを導入し,トレーニングデータの多様性と代表性を拡大する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:45:45 GMT)
Enhancing Computational Efficiency of Motor Imagery BCI Classification with Block-Toeplitz Augmented Covariance Matrices and Siegel Metric [0.0] 本稿では,拡張共分散法(ACM)の数学的特性をより徹底的に活用し,拡張共分散法(ACM)の強化を提案する。
ACMと同じような分類性能を実現しており、一般的には--あるいは-------------------------------------------------------------------------------------
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:59:13 GMT)
Enhanced Automotive Object Detection via RGB-D Fusion in a DiffusionDet Framework [0.0] 視覚に基づく自律走行には、信頼性と効率的な物体検出が必要である。
本研究では、単眼カメラと深度センサからのデータ融合を利用してRGBと深度(RGB-D)データを提供するDiffusionDetベースのフレームワークを提案する。
RGB画像のテクスチャ特徴と色特徴とLiDARセンサの空間深度情報を統合することにより,自動車目標の物体検出を大幅に強化する特徴融合が提案されている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:24:00 GMT)
EngineBench: Flow Reconstruction in the Transparent Combustion Chamber III Optical Engine [0.0] 我々は、高品質な実験データを使用する最初の機械学習指向データベースであるEngineBenchを紹介する。
本稿では,エンジン設計問題に対するより汎用的な事前学習MLモデルの開発を支援する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:38:30 GMT)
Doubly minimized sandwiched Renyi mutual information: Properties and operational interpretation from strong converse exponent [0.0] Sion のミニマックス定理を用いて $alphain [frac23,infty]$ の新たな双対関係を証明した。
2倍に最小化されたレニイ相互情報である$alphain [1,infty]$が、二項量子状態判別の文脈で運用上の意味を持つことを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:51:22 GMT)
Dimension-free uniform concentration bound for logistic regression [0.0] 制約付きロジスティック回帰の次元リスク関数に束縛された新規な一様濃度を与える。
我々の境界は、ラデマッハ複雑性論とマクダイアルメイドの不等式によって導かれる条件よりも大きな数の一様法則に対して、より穏やかな条件をもたらす。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:50:57 GMT)
Determination of Optimal Chain Coupling made by Embedding in D-Wave Quantum Annealer [0.0] D-wave quantum annealer (D-wave QA) の量子ビットは最適化問題の構造とは異なるペガサスグラフ上に設計されている。
弱く強い$J_c$値は連鎖破壊と連鎖エネルギーの強制を引き起こす。
可能な最低エネルギーを観測するための最大確率p$の値が決定されるアルゴリズムを提示する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:18:22 GMT)
Designing an Objective-Driven Test Method for the Comparative Performance Evaluation of Commercial DTI Solutions for Counter UAS systems [0.0] Unmanned Aerial Systems (UAS) はますます商用化され、安価になった。
検出トラッキングと識別(DTI)ソリューションを備えたカウンターUASシステムの開発と展開に重点が置かれている。
これらのDTIシステムでは標準的なテスト手法が利用できず、異なるテスト手法がこれらのシステムの比較を困難または不可能にしている。
本稿では,C-UASを対象とした商用DTIソリューションにおける目標駆動型テスト手法の定義,開発,検証,およびそれに対応する性能評価について報告する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:20:50 GMT)
Delay-induced spontaneous dark state generation from two distant excited atoms [0.0] 1次元導波路に結合した2つの完全に励起された2層原子の非マルコフ動力学を遅延の有無で検討する。
我々の結果は長距離量子ネットワークに関係しており、遠方の量子エミッタ間の自発的な絡み合い発生のメカニズムを提示する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 23:49:09 GMT)
Defining subsystems in Hilbert spaces with non-Euclidean metric [0.0] 有限次元ヒルベルト空間における部分系は、下層の内積構造とは無関係である。
異なるサブシステム分解は、GNS表現の異なる同値類を選択することに一致することを示す。
擬エルミート・ハミルトニアンの形式が与えられたとき、ハミルトニアン互換計量の選択は部分系分解を特徴づける。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:40:09 GMT)
Defending Large Language Models Against Attacks With Residual Stream Activation Analysis [0.0] 敵攻撃は大きな言語モデルの 完全性を損なう
本稿では, LLM へのホワイトボックスアクセスを前提とした, 革新的な防御戦略を提案する。
そこで本研究では,アタックプロンプト分類の新たな結果に対して,残差ストリーム中のアクティベーションパターンを解析するための確立された手法を適用した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 13:06:33 GMT)
Cryptocurrency Frauds for Dummies: How ChatGPT introduces us to fraud? [0.0] 本研究では、ChatGPTと暗号通貨詐欺の増大する問題との複雑な相互作用について考察する。
本稿では,ChatGPTプロンプトを操作することで,アウトプットへの影響,倫理的条件の回避,特定の不正目標達成の方法を示す。
注意すべきことは、我々の仕事は詐欺を奨励し、促進することではなく、ChatGPTの使用に伴う詐欺のリスクに対する認識を高めることにある。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 09:09:32 GMT)
CountCLIP -- [Re] Teaching CLIP to Count to Ten [0.0] 本稿では,「10人へのCLIP教育」について検討する。
画像中のゼロショットカウント精度を向上させるために、CLIPモデルを微調整する方法を提供する。
より少ない計算資源でトレーニングデータの小さなサブセットでモデルの性能を向上させる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:05:08 GMT)
Correlation of Software-in-the-Loop Simulation with Physical Testing for Autonomous Driving [0.0] 本稿では,社内で開発されたSILシミュレーションツールチェーンの検証事例について述べる。
テストトラックをSILシミュレーションと整合させるため,同期手法を提案する。
提案手法の有効性を示すための予備的な結果を示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:11:10 GMT)
Convergence of Some Convex Message Passing Algorithms to a Fixed Point [0.0] グラフィカルモデルにおけるMAP推論問題に対する一般的なアプローチは、双対線型計画法や(ブロック座標)降下によるラグランジュ緩和から得られる上限を最小化することである。
これは凸/収束メッセージパッシング(convex/convergent message passing)とも呼ばれる。
アルゴリズムは$mathcalO (1/varepsilon)$ iterationsで終了することを示す。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 12:20:29 GMT)
Conditional Shift-Robust Conformal Prediction for Graph Neural Network [0.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データの結果を予測する強力なツールとして登場した。
有効性にもかかわらず、GNNは堅牢な不確実性推定を提供する能力に制限がある。
本稿では,GNNに対する条件シフトロバスト(CondSR)の共形予測を提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 18:17:51 GMT)
Conditional Idempotent Generative Networks [0.0] The Conditional Idempotent Generative Networks (CIGN) is a novel approach that expand on Idempotent Generative Networks (IGN) to enable conditional generation。
CIGNは条件付け機構を組み込むことでこの制限に対処し、ユーザーは特定のタイプのデータに対して生成プロセスを制御できる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 01:31:50 GMT)
Computational Supremacy of Quantum Eigensolver by Extension of Optimized Binary Configurations [0.0] 我々は、D-Wave Quantum Annealer(D-Wave QA)に基づく量子固有解法を開発する。
このアプローチは、古典的コンピュータの導出を伴わない固有状態$vert psi rangle$を最適化するために反復的なQA測定を実行する。
提案したQEアルゴリズムは誤差の5倍の10~3$の正確な解を提供することを確認した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 15:19:53 GMT)
Coherent states of the asymmetric harmonic oscillator [0.0] 固有状態のヒルベルト空間の部分空間上のコヒーレントな状態を構築する。
これらのコヒーレントな状態は、進化の過程でコヒーレンスを維持する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 08:39:34 GMT)
Automated Verification of Silq Quantum Programs using SMT Solvers [0.0] SilVerは、Silqで記述された量子プログラムの動作を検証する自動化ツールである。
我々は,SilqプログラムとSMT証明義務のインターフェースとして,量子RAMスタイルのコンピュータをベースとしたプログラミングモデルを提案する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 10:12:47 GMT)
An analytical solution of the Schrodinger equation for the neutral ground state Para Helium [0.0] 本報告では, シュロディンガー方程式の解析解と, その対応する波動関数について, 基底状態における中性ヘリウム原子, パラヘリウム様原子について述べる。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:35:00 GMT)
Against Bell's Theorem [0.0] ベルの定理を証明しようとする実験は、実際にはこの目標を達成できないことを示す。
ベルの定理の実験的な証明は原則として不可能ではないが、全く異なる実験装置を必要とする。
我々の研究の主な成果は、利用可能な実験データに基づいて、局所的な現実的な隠れ変数理論を排除できないことである。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 07:56:04 GMT)
Accounting for multiplicity in machine learning benchmark performance [0.0] 最先端のパフォーマンスをSOTA(State-of-the-art)のパフォーマンスの見積として使うのはバイアスのある推定器であり、過度に楽観的な結果をもたらす。
本稿では、複数の分類器の場合の確率分布について、既知の解析手法を適用できるようにし、より優れたSOTA推定値を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 14:29:27 GMT)
A multilingual dataset for offensive language and hate speech detection for hausa, yoruba and igbo languages [0.0] 本研究では,ナイジェリアの3大言語であるHausa,Yoruba,Igboにおいて,攻撃的言語検出のための新しいデータセットの開発と導入の課題に対処する。
私たちはTwitterからデータを収集し、それを手動でアノテートして、ネイティブスピーカーを使用して、3つの言語毎にデータセットを作成しました。
学習済み言語モデルを用いて、データセット中の攻撃的言語の検出の有効性を評価し、最高の性能モデルが90%の精度で達成した。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 20:07:50 GMT)
A dynamical implementation of canonical second quantization on a quantum computer [0.0] 量子コンピュータの個別レジスタにおける生成・破壊演算子の実装に関する理論的手法を開発する。
有限メモリバンク上の可換(反可換)関係の定理を確立し、必要となる対称性および反対称性作用素を提供する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 11:02:47 GMT)
A Temporal Kolmogorov-Arnold Transformer for Time Series Forecasting [0.0] Temporal Kolmogorov-Arnold Transformer (TKAT)は、データストリームの時間パターンをキャプチャするために設計された、新しいアテンションベースのアーキテクチャである。
TKATは、TFT(Temporal Fusion Transformer)にインスパイアされた強力なエンコーダ・デコーダモデルとして登場し、観測された特徴が既知の部分よりも重要となるタスクを処理する。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 16:32:16 GMT)
A Comparison of Recent Algorithms for Symbolic Regression to Genetic Programming [0.0] シンボリック回帰は、科学者が理解できる方法でデータをモデル化し、マッピングすることを目的としている。
最近の進歩は、これらの2つの分野のギャップを埋めようと試みている。
論文参考訳(メタデータ) (Wed, 5 Jun 2024 19:01:43 GMT)