CodeAttack: Revealing Safety Generalization Challenges of Large Language Models via Code Completion [117.2] 本稿では,自然言語入力をコード入力に変換するフレームワークであるCodeAttackを紹介する。
我々の研究は、コード入力に対するこれらのモデルの新たな、普遍的な安全性の脆弱性を明らかにした。
CodeAttackと自然言語の分布ギャップが大きくなると、安全性の一般化が弱くなる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:04:34 GMT)
Offline Imitation from Observation via Primal Wasserstein State Occupancy Matching [111.8] 本稿では,学習者と専門的国家占有者の間の一次ワッサースタイン距離を最小化するために,プライマルワッサースタインDICEを提案する。
我々のフレームワークは SMODICE の一般化であり、$f$-divergence と Wasserstein の最小化を統一する最初の研究である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:43:27 GMT)
Unified Text-to-Image Generation and Retrieval [96.7] MLLM(Multimodal Large Language Models)の文脈における統一フレームワークを提案する。
まず,MLLMの内在的識別能力について検討し,学習自由な方法で検索を行うための生成的検索手法を提案する。
次に、自動回帰生成方式で生成と検索を統一し、生成した画像と検索した画像の最も適合した画像を選択する自律的決定モジュールを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:00:28 GMT)
The BiGGen Bench: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models [94.3] BiGGen Benchは、77のタスクにわたるLMの9つの異なる能力を徹底的に評価するために設計された、原則化された世代ベンチマークである。
BiGGen Benchの重要な特徴は、インスタンス固有の評価基準の使用であり、人間の評価のニュアンスな識別を忠実に反映している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:30:30 GMT)
Set the Clock: Temporal Alignment of Pretrained Language Models [91.8] 言語モデル(LM)は、多くの時点から派生したWebテキストで訓練されており、一般には、明確な時間的根拠は持たない。
本研究では、事前訓練されたLMの時間的カオスを調査し、その内部知識を目標時間に合わせるための様々な手法を探索する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:47:15 GMT)
LLMs Meet Multimodal Generation and Editing: A Survey [89.8] 本調査では,画像,ビデオ,3D,オーディオなど,さまざまな領域にわたるマルチモーダル生成と編集について詳述する。
これらの分野でのマイルストーンの成果を要約し、これらの研究をLLM法とCLIP/T5法に分類する。
我々は、既存の生成モデルを人間とコンピュータの相互作用に活用できるツール強化マルチモーダルエージェントを掘り下げる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:34:12 GMT)
Are LLMs Capable of Data-based Statistical and Causal Reasoning? Benchmarking Advanced Quantitative Reasoning with Data [89.2] 実世界のデータを用いた統計的および因果推論において,大規模言語モデルの能力を評価するために,データベンチマークを用いた定量的推論を導入する。
このベンチマークは、教科書、オンライン学習教材、学術論文のデータシートを伴う411の質問のデータセットで構成されている。
データとテキストに対するモデルの量的推論能力を比較するために、ベンチマークを290のテキストのみの質問、すなわちQRTextで強化する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:54:09 GMT)
Separating the "Chirp" from the "Chat": Self-supervised Visual Grounding of Sound and Language [77.3] DenseAVは、ビデオ視聴のみで高解像度、意味論的、音声視覚的に整合した特徴を学習する、新しいデュアルエンコーダ基盤アーキテクチャである。
そこで本研究では,DenseAVによる単語の「意味」と音の「位置」の特定が可能であることを明らかにした。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:38:21 GMT)
Contextual Continuum Bandits: Static Versus Dynamic Regret [70.7] 本研究では,学習者が側情報ベクトルを逐次受信し,凸集合内の行動を選択する,文脈連続帯域幅問題について検討する。
線形な静的な後悔を実現するアルゴリズムは,任意のアルゴリズムを拡張して,線形な動的後悔を実現することができることを示す。
インテリアポイント法にインスパイアされ,自己協和障壁を用いるアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:12:08 GMT)
Do Deep Neural Network Solutions Form a Star Domain? [68.7] 本稿では,与えられた学習課題のスターモデルを求めるスターライトアルゴリズムを提案する。
得られた恒星領域上でのベイズモデル平均値に対するより良い不確実性の推定を実証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:51:03 GMT)
Beat: Bi-directional One-to-Many Embedding Alignment for Text-based Person Retrieval [66.6] テキストベースの人物検索(TPR)は、テキスト記述に基づいて特定の個人を検索する難題である。
これまでは、テキストと画像のサンプルをモーダルシェード空間で整列させようと試みてきた。
本稿では,各サンプルに対して明確な最適化方向を提供する,効果的な双方向一対多埋め込みパラダイムを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:06:55 GMT)
How Alignment and Jailbreak Work: Explain LLM Safety through Intermediate Hidden States [65.5] 大規模言語モデル(LLM)は、悪意のあるユーザ入力に対する応答を避けるために、安全アライメントに依存している。
ジェイルブレイクは安全ガードレールを回避でき、LLMは有害な内容を発生させる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:04:37 GMT)
An Independence-promoting Loss for Music Generation with Language Models [65.0] 音楽生成方式は音声トークンの語彙に依存しており、一般にオートエンコーダによって学習された離散潜在空間の符号として提供される。
本稿では,音楽生成のための言語モデルにおけるトークン化器として使用されるオートエンコーダを正規化するために,独立性向上の損失を導入する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:55:51 GMT)
Learning to Evaluate the Artness of AI-generated Images [64.5] アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:13:12 GMT)
Holistic Visual-Textual Sentiment Analysis with Prior Models [64.5] 本稿では,頑健な視覚・テキスト感情分析を実現するための総合的手法を提案する。
提案手法は,(1)感情分析のためのデータから特徴を直接学習する視覚テキストブランチ,(2)選択された意味的特徴を抽出する事前学習された「専門家」エンコーダを備えた視覚専門家ブランチ,(3)暗黙的に視覚テキスト対応をモデル化するCLIPブランチ,(4)多モード特徴を融合して感情予測を行うBERTに基づくマルチモーダル特徴融合ネットワークの4つの部分から構成される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:09:56 GMT)
Factor Graph Optimization of Error-Correcting Codes for Belief Propagation Decoding [62.3] 低密度パリティ・チェック符号は、他の種類の符号よりもいくつかの利点がある。
提案手法は,既存の人気符号の復号性能を桁違いに向上させる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:08:56 GMT)
Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions [62.0] 大規模言語モデル(LLM)は様々な分野にまたがる幅広い応用を実証してきた。
我々は、ピアレビュープロセスを多ターン長文対話として再構築し、著者、レビュアー、意思決定者に対して異なる役割を担っている。
複数の情報源から収集された92,017件のレビューを含む26,841件の論文を含む包括的データセットを構築した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:24:17 GMT)
Binarized Diffusion Model for Image Super-Resolution [62.0] 画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
モデル構造では、二項化に最適化されたUNetアーキテクチャを設計する。
我々は,一貫した次元を維持するために,一貫した画素ダウンサンプル (CP-Down) と一貫したピクセルアップサンプル (CP-Up) を提案する。
BI-DiffSRが既存のバイナライゼーション法より優れていることを示す総合実験を行った。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:30:25 GMT)
OmniControlNet: Dual-stage Integration for Conditional Image Generation [61.1] 我々は、外部条件生成アルゴリズムを1つの高密度予測法に統合することにより、広く採用されているコントロールネットの双方向統合を提供する。
提案したOmniControlNetは,1)タスク埋め込み指導下での1つのマルチタスク高密度予測アルゴリズムによる条件生成と,2)テキスト埋め込み指導下での異なる条件付き画像生成プロセスを統合した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:03:47 GMT)
When LLMs Meet Cunning Texts: A Fallacy Understanding Benchmark for Large Language Models [59.8] 本稿では,人間が理解し易いが,理解し難い文を含むFaLlacy Understanding Benchmark (FLUB)を提案する。
具体的には、FLUBが焦点を絞ったcunningテキストは、主に、実際のインターネット環境から収集されたトリッキーでユーモラスで誤解を招くテキストで構成されている。
FLUBに基づいて,複数の代表および先進LLMの性能について検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:55:05 GMT)
SRRT: Exploring Search Region Regulation for Visual Object Tracking [58.7] 探索領域規則追跡(SRRT)と呼ばれる新しい追跡パラダイムを提案する。
SRRTでは,各フレームに対して最適な探索領域を動的に推定するために,提案された探索領域レギュレータを適用している。
大規模なLaSOTベンチマークでは、SRRTはSiamRPN++とTransTをAUCの4.6%と3.1%で改善した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:45:49 GMT)
DAPR: A Benchmark on Document-Aware Passage Retrieval [57.5] 我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:00:37 GMT)
Neural Scaling Laws on Graphs [54.4] モデルおよびデータの観点から,グラフ上のニューラルスケーリング法則について検討する。
モデルスケーリングでは,スケール法が崩壊する現象を調査し,オーバーフィッティングを潜在的な理由として同定する。
データスケーリングについては、グラフのサイズが極めて不規則であるため、スケーリング法則においてグラフデータのボリュームを効果的に測定することはできないことを示唆する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 20:49:33 GMT)
Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.3] 合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:40:20 GMT)
F-LMM: Grounding Frozen Large Multimodal Models [53.8] 我々は,人間とAIの会話において,F-LMM(F-LMM)を解凍したLMMを提示する。
トレーニング可能なCNNレイヤをいくつか使用すれば、ワードピクセルのアテンション重みをマスクロジットに変換することができる。
我々のF-LMMは特別なセグメンテーショントークンを学習したり、高品質な接地命令チューニングデータを利用したりもしません。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:14:26 GMT)
Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.2] 対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:34:45 GMT)
GTR: Improving Large 3D Reconstruction Models through Geometry and Texture Refinement [52.0] マルチビュー画像から3次元メッシュを再構成する手法を提案する。
提案手法は, 変圧器を用いたトリプレーンジェネレータとニューラルレージアンスフィールド(NeRF)モデルを用いた大規模再構成モデルから着想を得たものである。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:19:24 GMT)
Visual Prompt Tuning in Null Space for Continual Learning [52.0] 既存のプロンプトチューニング手法は、継続学習(CL)における印象的な性能を示す。
本稿では,従来のタスクの特徴に代表される部分空間に直交する方向のプロンプトを調整することで各タスクを学習し,CLにおける破滅的な忘れを克服するために学習されたタスクに干渉しないようにすることを目的とする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:57:40 GMT)
Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.4] 階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。
本手法はGAN内の階層層を系統的に探索する。
さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 09:15:54 GMT)
Do Prompts Really Prompt? Exploring the Prompt Understanding Capability of Whisper [51.1] 本研究は,Whisperと情報伝達の相互作用について考察する。
Whisperは、予想されていたテキストのプロンプトを完全に把握できないかもしれない。
また、英語のプロンプトが両方の言語のデータセットで一般的にマンダリンよりも優れていることも指摘されている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:44:59 GMT)
Fantastic Semantics and Where to Find Them: Investigating Which Layers of Generative LLMs Reflect Lexical Semantics [51.0] 本稿では,Llama2という人気言語モデルに対する語彙意味論のボトムアップ進化について検討する。
実験の結果,下位層の表現は語彙的意味論を符号化しているが,上位層はより弱い意味帰納的帰納的帰納的帰納的帰納的帰納的帰納的帰属的帰属的帰属的帰属的存在であることがわかった。
これは、高層層がより良い語彙意味論を得るマスク言語モデリングのような差別的な目的を持つモデルとは対照的である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:07:50 GMT)
FreeSplat: Generalizable 3D Gaussian Splatting Towards Free-View Synthesis of Indoor Scenes [50.5] FreeSplatは、長いシーケンス入力から自由視点合成まで、幾何学的に一貫した3Dシーンを再構築することができる。
ビュー数に関係なく、広いビュー範囲にわたる堅牢なビュー合成を実現するための、シンプルで効果的なフリービュートレーニング戦略を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:06:29 GMT)
2D Gaussian Splatting for Geometrically Accurate Radiance Fields [50.1] 3D Gaussian Splatting (3DGS)は近年,高画質の新規ビュー合成と高速レンダリングを実現し,放射界再構成に革命をもたらした。
多視点画像から幾何学的精度の高い放射場をモデル化・再構成するための新しいアプローチである2DGS(2D Gaussian Splatting)を提案する。
競合する外観品質、高速トレーニング速度、リアルタイムレンダリングを維持しつつ、ノイズフリーかつ詳細な幾何学的再構成を可能にする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:30:48 GMT)
MoPS: Modular Story Premise Synthesis for Open-Ended Automatic Story Generation [50.0] モジュール・ストーリー・プリミゼ・シンセサイザー(MoPS)について紹介する。
MoPSはストーリーの前提をバックグラウンドやペルソナなどのモジュールに分割し、自動設計と生成を行う。
より詳細な評価は、我々の合成された施設が多様性、魅力、完全性、独創性に優れていることを示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:31:14 GMT)
PairCFR: Enhancing Model Training on Paired Counterfactually Augmented Data through Contrastive Learning [49.6] Counterfactually Augmented Data (CAD)は、既存のデータサンプルのラベルを他のクラスに戻すのに、最小限かつ十分な修正を適用することで、新しいデータサンプルを作成する。
近年の研究では、CADを用いたトレーニングが、他の重要な文脈情報を無視しながら、モデルが修正機能に過度にフォーカスする可能性があることが示されている。
我々は、対実的手がかりの学習に加えて、グローバルな特徴アライメントを促進するために、対照的な学習を採用する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:29:55 GMT)
Provable Optimization for Adversarial Fair Self-supervised Contrastive Learning [49.4] 本稿では,自己教師型学習環境におけるフェアエンコーダの学習について検討する。
すべてのデータはラベル付けされておらず、そのごく一部だけが機密属性で注釈付けされている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:11:12 GMT)
When to Trust LLMs: Aligning Confidence with Response Quality [49.4] 我々はconfidence-Quality-ORDer保存アライメントアプローチ(CONQORD)を提案する。
品質報酬と秩序保存アライメント報酬機能を統合する。
実験により,CONQORDは信頼性と応答精度のアライメント性能を著しく向上することが示された。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:54:46 GMT)
LLM Questionnaire Completion for Automatic Psychiatric Assessment [49.2] 大規模言語モデル(LLM)を用いて、非構造的心理面接を、様々な精神科領域と人格領域にまたがる構造化された質問票に変換する。
得られた回答は、うつ病の標準化された精神医学的指標(PHQ-8)とPTSD(PCL-C)の予測に使用される特徴として符号化される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 09:03:11 GMT)
II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models [49.1] マルチモーダルな大言語モデル(MLLM)は、様々なベンチマークで新しいブレークスルーをもたらしている。
本稿では,画像の高次知覚評価を目的とした画像意味理解ベンチマークII-Benchを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:25:47 GMT)
VCR-GauS: View Consistent Depth-Normal Regularizer for Gaussian Surface Reconstruction [47.6] そこで本研究では,通常のパラメータと他のパラメータを直接結合するDepth-Normal正規化器を提案する。
ガウスベースのベースラインと比較すると,提案手法はより優れた再構築品質を得るとともに,より高速なトレーニング速度と100以上のFPSレンダリングにおいて,競争力のある外観品質を維持することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:15:43 GMT)
Adapting Large Language Models for Document-Level Machine Translation [46.4] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。
近年の研究では、中程度のLLMはタスク固有の微調整後、より大きなLLMよりも優れていることが示されている。
本研究では,特定の言語対に対する文書レベルの機械翻訳(DocMT)にLLMを適用することに焦点を当てた。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:13:03 GMT)
VillagerAgent: A Graph-Based Multi-Agent Framework for Coordinating Complex Task Dependencies in Minecraft [46.2] 我々は,複雑なエージェント間の依存関係を解決するために,非巡回グラフ多エージェントフレームワーク VillagerAgent を導入する。
VillagerBenchに関する実証的な評価は、VillierAgentが既存のAgentVerseモデルより優れていることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:21:47 GMT)
MaLa-ASR: Multimedia-Assisted LLM-Based ASR [46.1] プレゼンテーションスライドから抽出したテキストキーワードを統合して,会議内容の認識を改善する,LLMベースのASRモデルであるMaLa-ASRを提案する。
MaLa-ASR の平均 WER は L95 と S95 のサブセットで 9.4% と 11.7% であり、ベースラインモデルでは 27.9% と 44.7% の減少を示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:00:00 GMT)
Effective Causal Discovery under Identifiable Heteroscedastic Noise Model [46.0] 因果DAG学習は、最近精度と効率の両面で有望な性能を達成した。
本稿では,変数間のノイズ分散の変動を考慮したDAG学習のための新しい定式化を提案する。
次に、最適化の難しさに対処する効果的な2相反復DAG学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:41:37 GMT)
When quantum memory is useful for dense coding [45.4] 我々は、送信側と受信側の間で、特定の事前共有状態のコピーを$n$で高密度に符号化することについて議論する。
我々は、受信機側で量子メモリを使用する利点を、事前に設定された状態がもたらすものについて検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:59:04 GMT)
Low-depth Clifford circuits approximately solve MaxCut [45.0] 低深さクリフォード回路に基づくMaxCutの量子インスピレーション近似アルゴリズムを提案する。
我々のアルゴリズムは、深さ$O(N)$ Clifford回路を構築することにより、$N$頂点グラフ上のMaxCutの近似解を求める。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:15:47 GMT)
CorrMAE: Pre-training Correspondence Transformers with Masked Autoencoder [44.9] 本稿では,マスク付き対応を再構築することにより,一般的な不整合表現を取得するための事前学習手法を提案する。
実際には,通信プルーニングの事前学習に適したマスクオートエンコーダフレームワークであるCorrMAEを導入する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:14:00 GMT)
An Investigation of Noise Robustness for Flow-Matching-Based Zero-Shot TTS [43.8] ゼロショット音声合成システム(TTS)は、任意の話者の声を短い音声プロンプトから合成することができる。
生成した音声の品質は、音声プロンプトがノイズを含むと著しく劣化する。
本稿では,ノイズの多い音声プロンプトから発生する音声の質を高めるための様々な手法について検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:51:50 GMT)
Utilizing Grounded SAM for self-supervised frugal camouflaged human detection [43.5] カモフラーゲ型物体検出のタスクには, 自己教師型学習法とフラゴール型学習法の両方が導入された。
微調整作業のための教師付きフラジカルトランスファー学習を用いて,強力なベースラインを作成する。
本実験は, フル教師付きフラガラル学習と比較して, 純粋な自己超越によって同様の性能が得られることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:19:20 GMT)
MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations [43.5] MS-HuBERTは、堅牢な音声表現を学習するためのエンドツーエンドの自己教師付き事前学習手法である。
ASR Librispeechベンチマークでバニラの HuBERT を平均5%の差で上回っている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:30:28 GMT)
An Entropy-based Text Watermarking Detection Method [41.4] トークンエントロピーの影響は、透かし検出プロセスにおいて完全に考慮すべきである。
我々は,textbfEntropy-based TextbfWatermarking textbfEWD (textbfEWD)を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:51:57 GMT)
Methodology and Real-World Applications of Dynamic Uncertain Causality Graph for Clinical Diagnosis with Explainability and Invariance [41.4] Dynamic Uncertain Causality Graph (DUCG)アプローチは、さまざまなアプリケーションシナリオで因果性駆動、説明可能、不変である。
54件の主訴を含む46件のDUCGモデルが製造された。
実際の診断は100万件以上行われており、誤診断は17例に過ぎなかった。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:37:45 GMT)
3D-MolT5: Towards Unified 3D Molecule-Text Modeling with 3D Molecular Tokenization [41.1] 3D-MolT5は1次元分子配列と3次元分子構造の両方をモデル化する統合されたフレームワークである。
鍵となる革新は、細粒度の3次元部分構造表現を特別な3次元トークン語彙にマッピングする方法論にある。
提案した3D-MolT5は,分子特性予測,分子キャプション,テキストベースの分子生成タスクにおいて,既存の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:20:55 GMT)
Expressive Power of Graph Neural Networks for (Mixed-Integer) Quadratic Programs [41.0] 二次計画法 (QP) は非線形計画法において最も広く適用されている分野である。
QPタスクにグラフニューラルネットワーク(GNN)を適用する最近の研究は、GNNが最適化インスタンスの重要な特徴を捉えることができることを示している。
本稿では,2次プログラムの重要な特性を確実に表現できるメッセージパスGNNの存在を実証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 23:57:47 GMT)
Improving Antibody Design with Force-Guided Sampling in Diffusion Models [39.9] 本研究では,力場エネルギーに基づくフィードバックを統合することで拡散モデルのサンプリングプロセスを強化する新しい手法を提案する。
我々のモデルであるDiffForceは、拡散サンプリングプロセスの導出に力を使い、2つの分布を効果的にブレンドする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:50:35 GMT)
Generalized Source Tracing: Detecting Novel Audio Deepfake Algorithm with Real Emphasis and Fake Dispersion Strategy [39.9] 本稿では,音声ディープフェイク音声認識のためのReal Emphasis and Fake Dispersion(REFD)戦略を提案する。
REFDはAudio Deepfake Detection Challenge 2023 Track3で86.83%のF1スコアを達成した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:33:59 GMT)
Injecting Undetectable Backdoors in Deep Learning and Language Models [39.3] 外部の専門家企業が開発したMLモデルにおいて,検出不能なバックドアによる脅威について検討する。
我々は、バックドアの存在がまだ検出不可能であることを保証しながら、ニューラルネットワークにバックドアを植える戦略を開発する。
我々は、ステガノグラフィー機能の存在に基づいて、ニューラルネットワークのバックドア攻撃をそのようなモデルに拡張する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:26:21 GMT)
From Basic to Extra Features: Hypergraph Transformer Pretrain-then-Finetuning for Balanced Clinical Predictions on EHR [39.0] 本稿では,HTP-Starを提案する。このHTP-Starは,EHRデータモデリングのための事前トレーニング-then-finetuneフレームワークを用いてハイパーグラフ構造を利用する。
HTP-Starは,基本的特徴と付加的特徴を有する患者のバランスを保ちながら,様々なベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:41:03 GMT)
Video-Language Understanding: A Survey from Model Architecture, Model Training, and Data Perspectives [38.8] 人間は環境を理解するために複数の感覚を使う。視覚と言語は、私たちの思考を簡単に伝え、周りの世界を知覚できるため、最も重要な感覚の2つだ。
ビデオ言語ペアは、我々の言語媒体と視覚環境の両方を時間的ダイナミクスで模倣できるので、ヒューマンライクな感覚でビデオ言語理解システムを構築することには、多くの関心が寄せられている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 02:36:28 GMT)
PaRa: Personalizing Text-to-Image Diffusion via Parameter Rank Reduction [38.4] PaRaはT2Iモデルパーソナライズのための効率的かつ効率的なランク削減手法である。
我々のデザインは、新しい概念へのT2Iモデルの使用は、小さな世代空間を意味するという事実に動機づけられている。
そこで,PaRaは単一/複数オブジェクト生成における既存のファインタニング手法の利点と,単一画像編集の利点を両立することを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:51:51 GMT)
Gentle-CLIP: Exploring Aligned Semantic In Low-Quality Multimodal Data With Soft Alignment [38.4] マルチモーダル融合は様々なモダリティの間の障壁を突破し、すでに多くの印象的なパフォーマンスを生み出している。
様々な専門分野において、トレーニングプロセスに十分なアライメントデータを得るのに苦労している。
我々は,半教師付きマルチモーダルアライメントを多様体マッチング問題に変換し,Gentle-CLIPというCLIPに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:41:14 GMT)
EmbSpatial-Bench: Benchmarking Spatial Understanding for Embodied Tasks with Large Vision-Language Models [38.4] 我々は,LVLMの具体的空間的理解を評価するベンチマークであるEmbSpatial-Benchを構築した。
本稿では,LVLMの具体的空間理解を改善するために設計された命令調整データセットであるEmbSpatial-SFTを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:23:14 GMT)
Evolution-aware VAriance (EVA) Coreset Selection for Medical Image Classification [37.6] 進化対応可変(EVA)と呼ばれる新しいコアセット選択戦略を提案する。
EVAは10%のトレーニングデータで98.27%の精度を達成しているが、完全なトレーニングセットでは97.20%である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:22:50 GMT)
How Uniform Random Weights Induce Non-uniform Bias: Typical Interpolating Neural Networks Generalize with Narrow Teachers [37.5] NN のパラメータ化に先立つフラット' が NN 関数に先立ってリッチな先行を誘導することを示す。
これにより、より単純な関数へのバイアスが発生し、表現するパラメータが少なくなる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:32:58 GMT)
GrowOVER: How Can LLMs Adapt to Growing Real-World Knowledge? [37.0] 本稿では,更新の連続サイクルを経たGrowOVER-QAとGrowOVER-Dialogue,動的オープンドメインQA,ダイアログベンチマークを提案する。
本研究は,検索強化言語モデル(RaLM)が,まだトレーニングされていない知識や最近更新されていない知識に悩まされていることを示唆している。
本稿では,新たな検索対話型言語モデルフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:16:04 GMT)
Risk Aware Benchmarking of Large Language Models [37.0] 本稿では,統計的に有意な基礎モデルの社会技術的リスクを定量的に評価するための分布的枠組みを提案する。
本試験における2次統計は,計量学や数理ファイナンスでよく用いられる平均リスクモデルと関連していることを示す。
筆者らは,本フレームワークを用いて,命令からのドリフトや有害なコンテンツの出力に関連するリスクに関する,さまざまな大規模言語モデルを比較した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:26:34 GMT)
Distributional Preference Alignment of LLMs via Optimal Transport [37.0] 最適輸送(AOT)によるアライメント(Alignment)と呼ばれるLLMの分布選好アライメント手法を提案する。
AOTは、正のサンプルの報酬分布を負のサンプルの分布の第1次において支配的に支配することにより、LLMを未ペアの選好データに整合させる。
AOTは,Open LLM BenchmarksとAlpacaEvalで評価すると,7Bモデルの最先端モデルにつながることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:41:05 GMT)
Self-supervised Adversarial Training of Monocular Depth Estimation against Physical-World Attacks [36.2] 単眼深度推定は、自律運転のような応用において重要な役割を果たす。
接地木深度を欠くMDEモデルには, 接地木深度を必要とする従来の対地木深度学習法は直接適用されない。
我々は,MDEモデルに対して,地底深度を必要とせずにビュー合成を活用する,新たな自己教師型対向訓練手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:02:28 GMT)
Interpretable User Satisfaction Estimation for Conversational Systems with Large Language Models [36.0] 既成のMLモデルやテキスト埋め込みに基づくアプローチは、一般化可能なパターンの抽出に不足している。
LLMは、埋め込み型アプローチよりも、自然言語の発話から、ユーザの満足度を解釈可能なシグナルを抽出できることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 00:58:25 GMT)
Localized Adaptive Risk Control [35.9] ローカライズド・アダプティブ・リスク・コントロール(Localized Adaptive Risk Control, L-ARC)は、統計的ローカライズされたリスク保証をターゲットとするオンラインキャリブレーション方式である。
L-ARCは、異なるデータサブポピュレーションにまたがるリスク保証を備えた予測セットを生成する実験によって実証される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:23:49 GMT)
DMS: Addressing Information Loss with More Steps for Pragmatic Adversarial Attacks [35.8] 本稿では,ファイル形式における情報損失が敵攻撃の有効性に与える影響について検討する。
DMS-AIとDMS-AS(Integrated Gragients-based Textitadversarial integerization)の2つのコア技術を利用するDo More Steps(DMS)アルゴリズムを導入する。
特に、DMS-AIは勾配方向に応じて非整数画素値を整数化し、DMS-ASは属性結果を比較して非整数画素を選択する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:38:45 GMT)
ProFeAT: Projected Feature Adversarial Training for Self-Supervised Learning of Robust Representations [35.7] 教師付きAdversarial Training (AT) におけるラベル付きデータの必要性は,ATによる自己監督学習(SSL)技術の利用を促している。
既存のSSLメソッドの対向トレーニングへの直接的な適用は、SSLとATの組み合わせによるトレーニングの複雑さの増大により、サブ最適になっている。
本研究では,教師と生徒の弱さと強みを兼ね備えた,特徴とプロジェクタに対する適切な攻撃と防御の損失を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:20:46 GMT)
Peptide Vaccine Design by Evolutionary Multi-Objective Optimization [34.8] ペプチドワクチン設計の主な課題は、個人間のアレルの多様性に起因するペプチドの有効サブセットを選択することである。
従来の研究は主に、ペプチド-マヨルヒストコンパチビリティ複合体(ペプチド-MHC)結合の期待数を最大化することを目的として、制約付き最適化問題としてこのタスクを定式化した。
本稿では,2目的最適化問題としてペプチドワクチン設計を再構成する多目的最適化に基づく新しいフレームワークEMOを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:28:55 GMT)
Random Projection Layers for Multidimensional Time Series Forecasting [33.4] RPMixerと呼ばれる全MLP時系列予測アーキテクチャを提案する。
本手法は,各ブロックがアンサンブルモデルにおいてベース学習者のように振る舞う深層ニューラルネットワークのアンサンブル的挙動を利用する。
提案手法は時空間グラフモデルと一般予測モデルの両方を含む代替手法より優れている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:54:29 GMT)
MeanSparse: Post-Training Robustness Enhancement Through Mean-Centered Feature Sparsification [32.7] 本稿では,敵対的学習モデルの後処理により,畳み込みニューラルネットワーク(CNN)の強靭性を改善するための簡易かつ効果的な手法を提案する。
我々の技術であるMeanSparseは、平均中心特徴ベクトルをスパースする新しい演算子を持つ訓練モデルの活性化関数をカスケードする。
実験によると、RobostBenchのリーダーボードの上位モデルに適用すると、新しいロバストネス記録が72.08%に達する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:14:55 GMT)
DeLLMa: A Framework for Decision Making Under Uncertainty with Large Language Models [31.8] DeLLMaは不確実な環境での意思決定の精度を高めるために設計されたフレームワークである。
DeLLMaは主要な言語モデルの意思決定性能を継続的に向上し、競合する手法に比べて最大40%の精度向上を達成できることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:04:13 GMT)
Long-Horizon Rollout via Dynamics Diffusion for Offline Reinforcement Learning [31.1] 我々はDyDiffと略してDynamics Diffusionを提案し、学習ポリシーからDMに情報を反復的に注入することができる。
DyDiffはポリシーの一貫性を維持しながら、長時間のロールアウトの精度を確保し、モデルフリーのアルゴリズムに容易にデプロイできる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:56:59 GMT)
One Prompt To Rule Them All: LLMs for Opinion Summary Evaluation [30.7] 我々は,Op-I-Promptが,人間との平均スピアマン相関を0。
我々の知る限り、我々は、意見要約領域において、クローズドソースモデルとオープンソースモデルの両方において、LCMを評価対象として調査した最初の人物です。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:10:22 GMT)
ControlLoc: Physical-World Hijacking Attack on Visual Perception in Autonomous Driving [30.3] 危険な運転シナリオを引き起こすために、デジタルハイジャック攻撃が提案されている。
我々は、自律運転(AD)視覚認識全体のハイジャック脆弱性を活用するために設計された、新しい物理世界の逆パッチアタックであるControlLocを導入する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:53:50 GMT)
Accurate Neural Training with 4-bit Matrix Multiplications at Standard Formats [30.3] 重みとアクティベーションの量子化は、ディープニューラルネットワーク(DNN)トレーニングの計算フットプリントを削減する主要な方法の1つである。
我々は、前と後の両方の位相を4ビットに定量化するために、$textitlogarithmic unbiased Quantization$ (LUQ)法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:06:23 GMT)
GFPack++: Improving 2D Irregular Packing by Learning Gradient Field with Attention [29.8] 2次元不規則パッキングは、材料利用やテクスチャアトラス生成など、様々な応用における古典的な最適化問題である。
従来の数値法では、収束が遅く、計算コストが高い。
スコアベース拡散モデルのような既存の学習ベースの手法にも、回転支持の欠如、頻繁な衝突、任意の境界への適応性の低下、推論の遅さといった制限がある。
本稿では,この課題に対処する注目型勾配場学習手法GFPack++を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:44:08 GMT)
Minimum Variance Unbiased N:M Sparsity for the Neural Gradients [29.6] ディープラーニングでは、粒度の細かいN:Mは、GEMM(General Matrix multiply)のデータフットプリントと帯域幅をx2まで削減する。
本稿では,この手法を神経勾配にも適用する方法について検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:21:18 GMT)
Linear Causal Representation Learning from Unknown Multi-node Interventions [29.2] 十分に多様な介入環境が与えられれば、祖先への識別はソフトな介入だけで可能であることが確立された。
注目すべきは、これらの保証はより制限的な単一ノードの介入において最もよく知られた結果と一致することである。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 23:56:49 GMT)
Language Models Know the Value of Numbers [28.9] 言語モデルが数学の基本的な要素である数値の値を知っているかどうかを考察する。
実験結果は,大規模言語モデルにおける符号付き数値の存在を支持する。
我々の研究は、LLMが数値の価値を知っていて、LLMの数値情報をよりよく探索し、設計し、活用するための洞察を提供する証拠を提供する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:42:01 GMT)
Generalized Independent Noise Condition for Estimating Causal Structure with Latent Variables [28.4] 線形非ガウス非巡回因果モデルに対する一般化独立雑音(GIN)条件を提案する。
GIN条件に照らしてLiNGLaHの因果構造が同定可能であることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:07:50 GMT)
A Survey on Text-guided 3D Visual Grounding: Elements, Recent Advances, and Future Directions [27.5] テキスト誘導型3D視覚接地(T-3DVG)は、複雑な3Dシーンからの言語クエリに対応する特定のオブジェクトを見つけることを目的としている。
データ収集と3Dポイント・クラウド・ソース・プロセッシングの複雑さから、2Dビジュアル・グラウンドと比較すると、このタスクは現実世界に近づき、大きな可能性を秘めている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:52:12 GMT)
SlowPerception: Physical-World Latency Attack against Visual Perception in Autonomous Driving [26.7] 視覚知覚成分の高遅延は、車両衝突などの安全リスクにつながる可能性がある。
我々は、プロジェクタベースの普遍摂動を生成することによって、AD知覚に対する最初の物理世界の遅延攻撃であるSlowPerceptionを紹介する。
当社のSlowPerceptionでは,AD認識システム間で平均2.5秒のレイテンシで,物理世界の第2レベルのレイテンシを実現しています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:30:18 GMT)
Grounding Continuous Representations in Geometry: Equivariant Neural Fields [26.6] 条件付きニューラルネットワークでは、フィールドはNeFを条件とする潜在変数で表現され、そのパラメータはデータセット全体にわたって共有される。
クロスアテンション・トランスフォーマーをベースとした同変ニューラル場を提案し,NeFを静止点雲である幾何条件変数に条件付けする。
これらの主な特性は、他の非同変NeFアプローチと比較して、分類実験とデータセット全体を適合させる能力の検証によって検証される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:16:30 GMT)
A DeNoising FPN With Transformer R-CNN for Tiny Object Detection [25.9] そこで本稿では,Trans R-CNN (DNTR) を用いたFPNのデノベーション手法を提案する。
DNTRは、簡単なプラグイン設計、DeNoising FPN (DN-FPN)、効果的なTransformerベースの検出器であるTrans R-CNNで構成されている。
我々は、古いR-CNN検出器を新しいTrans R-CNN検出器に置き換え、自己注意を持つ小さな物体の表現に集中する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:18:15 GMT)
CHAMP: A Competition-level Dataset for Fine-Grained Analyses of LLMs' Mathematical Reasoning Capabilities [25.9] 概念とHint-Annotated Math Problems (CHAMP) は、概念に注釈を付けた高校数学の競争問題である。
このベンチマークは困難で、最高のモデルは標準設定で58.1%しか得点できない。
モデルはしばしば、間違った推論ステップを通じて、正しい最終回答に到達します。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:47:26 GMT)
ProgGen: Generating Named Entity Recognition Datasets Step-by-step with Self-Reflexive Large Language Models [25.7] 大規模言語モデルは、名前付きエンティティ認識のような構造化された知識抽出タスクにおいて不足する。
本稿では,より優れたNERデータセットを生成するため,LCMを質素なNER能力で活用するための革新的で費用効率のよい戦略について検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:48:35 GMT)
Learning to Infer Generative Template Programs for Visual Concepts [25.3] 我々は、視覚概念をドメイン・ジェネラルな方法で捉えたプログラムを推論する方法を学ぶ。
筆者らのフレームワークは, 少数ショット生成や協調作業など, 概念関連タスクを複数サポートしている。
2Dレイアウト、Omniglot文字、そして3D形状です。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:54:18 GMT)
Domain Generalization Guided by Large-Scale Pre-Trained Priors [24.7] ドメイン一般化(DG)は、限られたソースドメインからモデルをトレーニングすることを目的としており、未知のターゲットドメインに一般化することができる。
大規模事前訓練型ファインチューン(FT-LP)について紹介する。
FT-LPは、事前訓練されたモデルをDG微調整プロセスに前もって組み込んで、各最適化ステップで事前訓練されたモデルを参照することを保証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:32:32 GMT)
Async Learned User Embeddings for Ads Delivery Optimization [24.1] 本稿では,Metaプラットフォームにおけるシーケンスベースのマルチモーダルユーザ活動から,毎日数十億のユーザに対する高忠実度ユーザ埋め込みを学習することを提案する。
オフラインとオンラインの両方の実験で大きな成果を上げています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:35:20 GMT)
A brief introduction to a framework named Multilevel Guidance-Exploration Network [23.8] 本稿では,Multilevel Guidance-Exploration Network(MGENet)と呼ばれる新しいフレームワークを提案する。
具体的には、まず骨格キーポイントを入力とし、RGBエンコーダを誘導する学習済み正規化フローを用いて、未知のRGBフレームを入力として取り込んで、動作遅延特徴を探索する。
提案手法は,上海技術とUBnormalデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:12:44 GMT)
Fight Back Against Jailbreaking via Prompt Adversarial Tuning [23.6] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃の影響を受けやすい。
LLMが有害な情報を生み出すのを防ぐために、いくつかの主要な防衛戦略が提案されている。
本稿では,ユーザプロンプトに付随するプロンプト制御をガードプレフィックスとしてトレーニングする,PAT(Prompt Adversarial Tuning)というアプローチを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:18:46 GMT)
Supervised Learning and Large Language Model Benchmarks on Mental Health Datasets: Cognitive Distortions and Suicidal Risks in Chinese Social Media [23.5] 中国のソーシャルメディアから,自殺リスク分類のためのSOS-HL-1Kと,認知歪み検出のためのSocialCD-3Kの2つの新しいデータセットを紹介した。
本稿では,2つの教師付き学習手法と8つの大規模言語モデル(LLM)を用いた総合的な評価を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:49:52 GMT)
RATT: A Thought Structure for Coherent and Correct LLM Reasoning [23.3] 本稿では,思考過程の各段階における論理的健全性と事実的正当性の両方を考慮した新しい思考構造であるRetrieval Augmented Thought Tree(RATT)を紹介する。
様々な種類のタスクに関する実験では、RATT構造が既存の手法を事実的正当性と論理的整合性で著しく上回っていることが示されている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:37:26 GMT)
Aligning LLM Agents by Learning Latent Preference from User Edits [23.2] 本研究では,エージェントの出力に対するユーザ編集に基づいて,言語エージェントの対話的学習について検討する。
本稿では,履歴編集データに基づいてユーザの潜伏傾向を推定する学習フレームワーク PreLUDE を提案する。
本稿では,要約とメール作成という2つの対話型環境を導入し,GPT-4シミュレーションユーザを用いて評価を行う。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:45:09 GMT)
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning [23.0] 言語命令を利用して,より高レベルなポリシーのための静的報酬関数を生成する新しいHRLフレームワークを提案する。
言語誘導報酬はより低い原始的な振る舞いに影響されないため、LGR2は非定常性を緩和する。
弊社のアプローチは、難易度の高いスパークリワードロボットナビゲーションと操作環境において、70ドル以上の成功率を達成した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:40:24 GMT)
CCSI: Continual Class-Specific Impression for Data-free Class Incremental Learning [22.4] クラスインクリメンタル学習は、特定の病気クラスで訓練されたディープネットワークを新しい病気に適応することで、有望なソリューションを提供する。
以前に提案された手法では、過去のサンプルを永久に保存する必要がある。
本研究では,従来の学習クラスからのデータストレージの代わりに,学習クラス上でのデータ合成を利用する新しいデータ自由クラスインクリメンタルラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:52:21 GMT)
Attention as a Hypernetwork [22.1] トランスフォーマーは、トレーニング中に構成部品に遭遇した可能性があるが、構成が存在しない新しい問題インスタンスに一般化することができる。
モデルのサイズとデータのスケーリングによって構成の一般化が実現され,変換器内で機能的に構造化された潜在コードが発生することを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:08:00 GMT)
Self-Expansion of Pre-trained Models with Mixture of Adapters for Continual Learning [21.2] 継続学習(CL)は、学習した知識を壊滅的に忘れることなく、定常的でないデータストリームから継続的に知識を蓄積することを目的としている。
現在の PTM ベースの CL 法は,学習可能なアダプタの追加や,凍結した PTM へのプロンプトの追加によって,下流タスクへの効果的な継続的適応を行う。
PTM CL における安定性・塑性バランスの制御を強化する新しい手法である Modularized Adaptation (SEMA) を用いた事前学習モデルの自己拡張を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:24:03 GMT)
Domain Agnostic Conditional Invariant Predictions for Domain Generalization [21.0] 本稿では,識別リスク最小化(DRM)理論とそれに対応するアルゴリズムを提案する。
DRM理論では、ソース領域全体とそのサブセット間の予測分布の相違が、不変な特徴の獲得に寄与することを証明する。
我々は,複数の実世界のデータセット上での領域一般化手法に対するアルゴリズムの評価を行った。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 02:38:52 GMT)
Improved Convex Decomposition with Ensembling and Boolean Primitives [20.2] アート手法の状態は、一定数のプリミティブからなる開始点を予測するための学習された回帰手順を含む。
本稿では, (a) 少数の負のプリミティブを組み込んで, (b) 多数の異なる回帰手順を組み込むことで, 精度を大幅に向上できることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:06:44 GMT)
DomainRAG: A Chinese Benchmark for Evaluating Domain-specific Retrieval-Augmented Generation [19.7] Retrieval-Augmented Generationは、大規模言語モデルの様々な制限に対処する有望なソリューションを提供する。
現在の研究は、しばしばウィキペディアのような一般的な知識ソースを使って、常識的な問題を解決するモデルの能力を評価している。
対話型RAGの能力を含むRAGモデルに必要な6つの能力を特定した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:33:51 GMT)
ATLAS: Improving Lay Summarisation with Attribute-based Control [19.6] レイ要約(Lay summarisation)は、専門家でない聴衆に理解しやすい要約を作成することを目的としている。
以前の作業では、生成したサマリの内容とスタイルが、モデルをトレーニングするために使用されるデータに完全に依存する、オールサイズのアプローチを前提としていました。
我々は,生成された要約の全体的「遅延性」に寄与する様々な特性を制御できる,抽象的な要約手法ATLASを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:22:55 GMT)
Neuron-Level Knowledge Attribution in Large Language Models [19.5] 異なる出力に対して重要なニューロンをピンポイントする手法を提案する。
このアプローチは、3つのメトリクスにまたがる優れたパフォーマンスを示します。
われわれは,記憶に関するデータとコードを公開し,今後の知識編集研究の舞台を整える。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 20:03:02 GMT)
Information Theoretic Guarantees For Policy Alignment In Large Language Models [19.3] 参照ポリシーの下での報酬がガウス以下の尾を持つ場合、$sqrtmathsfKL$情報理論上界が成り立つことを示す。
また、$n$ポリシーの最高値として、$mathsfKL$上界が任意の$f$-divergenceに対して得られることを証明します。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:41:50 GMT)
Improving Model Generalization by On-manifold Adversarial Augmentation in the Frequency Domain [19.3] 深層ニューラルネットワーク(DNN)は、トレーニングデータとテストデータが異なる基礎ディストリビューションである場合、大幅に劣化するパフォーマンスに悩まされる可能性がある。
近年の研究では、OODの一般化を改善するために正反対あるいは外逆の例が利用可能であることが示されている。
本稿では Wavelet モジュール (AdvWavAug) によるデータ拡張手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:32:58 GMT)
Latent Diffusion Model-Enabled Real-Time Semantic Communication Considering Semantic Ambiguities and Channel Noises [19.3] セマンティックコミュニケーション(Semantic Communication, SemCom)は, コミュニケーションシステムのための新しいパラダイムである。
DLベースのSemComシステムは、過度な適合、一般化の貧弱、オフレイアに対する感受性のために、パフォーマンス上のボトルネックに直面していることが多い。
本稿では,潜在拡散モデルに基づくSemComシステムを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 23:39:31 GMT)
MLCM: Multistep Consistency Distillation of Latent Diffusion Model [19.2] MLCM(Multistep Latent Consistency Models)は、低コストで高品質な画像合成のためのアプローチである。
MLCMは2~8ステップのみのサンプリングで高品質で楽しい画像を生成することができることを示す。
また、制御可能な生成、画像スタイル転送、中国画像生成を含むアプリケーションにおけるMLCMの汎用性を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:55:50 GMT)
BAGEL: Bootstrapping Agents by Guiding Exploration with Language [19.1] この研究は、人間の監督なしに言語モデル(LM)エージェントをブートストラップする方法であるBAGELを提示する。
BAGELのデモを使用して、ゼロショットLMエージェントをテスト時に、検索したデモよりもコンテキスト内学習により適応する。
ToolQAとMiniWob++では2-13%以上の絶対値の改善が見られ、最大で13倍のエラーが発生しています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:12:26 GMT)
RefGaussian: Disentangling Reflections from 3D Gaussian Splatting for Realistic Rendering [18.4] 本稿では3D-GSからの反射を現実的にモデル化するRefGaussianを提案する。
伝送成分と反射成分の両方に対して局所的な滑らかさを確保するために局所正規化手法を用いる。
提案手法は,より優れた新規な視点合成と高精度な深度推定結果を実現する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:49:39 GMT)
An Empirical Study of Self-Admitted Technical Debt in Machine Learning Software [18.0] 自己承認型技術的負債(SATD)は、機械学習ベースのソフトウェアの品質に大きな影響を与える可能性がある。
本稿では,5つのドメインにわたる318のオープンソースMLプロジェクトと318の非MLプロジェクトを分析し,SATDをMLコードで解析することを目的とする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:11:26 GMT)
Machine Against the RAG: Jamming Retrieval-Augmented Generation with Blocker Documents [18.0] Retrieval-augmented Generation (RAG)システムは、関連する文書を知識データベースから検索し、検索した文書にLSMを適用して回答を生成する。
我々は、潜在的に信頼できないコンテンツを持つデータベースで運用するRAGシステムが、私たちがジャミングと呼ぶ新しいタイプのサービス拒否攻撃に弱いことを実証した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:55:55 GMT)
ICU-Sepsis: A Benchmark MDP Built from Real Medical Data [17.9] 本稿では、強化学習(RL)アルゴリズムを評価するためのベンチマークで使用できるICU-Sepsisについて述べる。
近年, セプシス管理は応用RL研究において重要な課題となっている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:11:00 GMT)
Stealthy and Persistent Unalignment on Large Language Models via Backdoor Injections [17.5] バックドアインジェクションにより,大規模言語モデルに対してステルスと永続的不整合を行うことが可能であることを示す。
提案したステルスと持続的不整合は、再整合防御に対する強い持続性を維持しつつ、安全性評価に合格することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:27:40 GMT)
CompVPD: Iteratively Identifying Vulnerability Patches Based on Human Validation Results with a Precise Context [16.7] パッチの通知が不完全で遅延することが多いため、オープンソースソフトウェアにタイムリーにセキュリティパッチを適用するのは難しい。
本稿では,パッチに関連するコードを正確に識別する多粒度スライシングアルゴリズムと適応拡張アルゴリズムを提案する。
脆弱性の特定には、CompVPDと4つのSOTA(State-of-the-art/practice)アプローチを実証的に比較する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:09:03 GMT)
Stealthy Targeted Backdoor Attacks against Image Captioning [16.4] 本稿では,画像キャプションモデルに対するバックドア攻撃を標的とした新たな手法を提案する。
本手法は,物体検出に普遍摂動技術を活用することで,まず特別なトリガを学習する。
我々のアプローチは、モデルクリーンパフォーマンスに無視できる影響を与えながら、高い攻撃成功率を達成することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:11:06 GMT)
Demystifying the Characteristics for Smart Contract Upgrades [16.2] 我々は,契約更新の特徴を理解するために,プロキシベースのアップグレード可能なスマートコントラクトに関する実証的研究を行う。
583のコントラクトが、933のユニークなコントラクトバージョンを含む機能にアップグレードされたことが分かりました。
結果は、276のプロキシのアップグレードによる4,334のABIの破壊的変更が示されており、ブロックチェーンが目撃した584トランザクション内で実際の使用が壊れていることを示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:09:49 GMT)
Symmetric Matrix Completion with ReLU Sampling [15.1] エントリー依存サンプリングによる対称正半定値低ランク行列補完(MC)の問題について検討する。
特に、静止点のみを観測する修正線形単位(ReLU)サンプリングについて検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:14:53 GMT)
Anomaly Multi-classification in Industrial Scenarios: Transferring Few-shot Learning to a New Task [14.9] 本稿では,異常多型化という,新規で価値のある研究課題を提案する。
このタスクに数発の学習を適用する上での課題として,RelationNetとPatchCoreを組み合わせたベースラインモデルを導入する。
本稿では,擬似クラスとそれに対応するプロキシタスクを生成するデータ生成手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:07:39 GMT)
OD-DETR: Online Distillation for Stabilizing Training of Detection Transformer [14.7] 本稿では,オンライン蒸留によるDETRトレーニングの安定化を目的とする。
指数移動平均(EMA)で蓄積した教師モデルを利用する。
実験の結果,提案したOD-DETRはトレーニングの安定化に成功し,パラメータを増やすことなく性能を大幅に向上することがわかった。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:07:35 GMT)
Mitigating spectral bias for the multiscale operator learning [14.4] 本稿では階層的行列アプローチに着想を得た階層的注意神経演算子(HANO)を提案する。
HANOは、スケール適応的な相互作用範囲とレベル階層上の自己アテンションを備えており、制御可能な線形コストでネストされた特徴計算を可能にする。
我々の数値実験により,HANOは多スケール問題に対して最先端(SOTA)法より優れていることが示された。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:13:08 GMT)
Why So Gullible? Enhancing the Robustness of Retrieval-Augmented Models against Counterfactual Noise [14.4] 検索された文書セットでは、「関連」文書でさえ誤った情報や誤った情報を含むことがある。
我々の研究は、"関連"文書でさえ誤った情報や誤った情報を含む、より困難なシナリオを調査します。
本稿では,識別器を明示的に微調整したり,GPT-3.5に識別能力の付与を促すことによって,検索した文書間の知識衝突を処理する手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 23:42:48 GMT)
Bayesian Deep Learning Via Expectation Maximization and Turbo Deep Approximate Message Passing [14.1] メッセージパッシングに基づくEM-TDAMPと呼ばれるベイズ深層学習アルゴリズムを提案する。
本稿では,ボストンの住宅価格予測と手書き文字認識へのEM-TDAMPの適用について詳述する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:44:16 GMT)
Parameter-Efficient Fine-Tuning of LLaMA for the Clinical Domain [13.9] 臨床応用のような新しい領域に事前訓練された言語モデルを適用するには、伝統的にパラメータの集合全体をトレーニングする必要がある。
本稿では,2段階のPEFTフレームワークを提案し,臨床領域で評価する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:00:36 GMT)
Fooling the Textual Fooler via Randomizing Latent Representations [13.8] 敵語レベルの摂動はよく研究され効果的な攻撃戦略である。
本稿では、敵の例を生成する過程を複雑にすることを目的とする、軽量で攻撃に依存しない防御法を提案する。
本稿では,AdvFoolerの対人的単語レベル攻撃に対する最先端のロバスト性を実証的に示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:06:28 GMT)
Efficient Shapley Values for Attributing Global Properties of Diffusion Models to Data Group [13.8] モデルプルーニングと微調整を利用してシェープリー値を効率的に推定する手法を開発した。
I) CIFARデータセットで訓練されたDDPMのグローバル画像品質、(II) CelebA-HQで訓練されたLCMの人口統計学的多様性、(iii) 印象派のアートワークで修正された安定拡散モデルLoRAの全体的な審美的品質、の3つのユースケースで本手法の有用性を実証的に実証した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:42:09 GMT)
Learning to Maximize Mutual Information for Chain-of-Thought Distillation [13.7] Distilling Step-by-Step(DSS)は、より大きなモデルよりも優れた推論能力を持つ小さなモデルを投入することで、約束を証明している。
しかし、DSSは2つのトレーニングタスクの本質的な関係を見落とし、CoT知識とラベル予測のタスクの非効率な統合につながる。
学習に基づく手法を用いて,この問題を解決するための変分手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:24:54 GMT)
Fusing Structure from Motion and Simulation-Augmented Pose Regression from Optical Flow for Challenging Indoor Environments [13.7] オブジェクトのローカライゼーションは、ロボット工学、バーチャルおよび拡張現実、倉庫における商品の輸送など、さまざまなアプリケーションにおいて重要なタスクである。
近年のディープラーニングの進歩により、単眼視覚カメラを用いた局所化が可能になった。
本研究の目的は,これらの課題に対して,追加情報を導入し,相対的ポーズ回帰(RPR)法を用いて絶対的なポーズを規則化することである。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:57:45 GMT)
Grid-Centric Traffic Scenario Perception for Autonomous Driving: A Comprehensive Review [13.0] グリッド中心の認識は、終わりのない長い尾のセマンティックな未知の障害を持つオープンワールド駆動シナリオに対して、より堅牢である。
近年の研究は、網羅的な環境表現のようなグリッド中心の認識の大きな利点を示している。
本研究は,2次元のBEVグリッドから3次元のBEVグリッド,4次元のBEVグリッド,および4次元のBEVグリッド技術に関する従来および現在の知識を整理する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:58:10 GMT)
Understanding the Effectiveness of Large Language Models in Detecting Security Vulnerabilities [12.8] LLM(Large Language Models)は、コード関連のタスクにおいて顕著なパフォーマンスを示す。
トレーニング済みのLLMがセキュリティ上の脆弱性を検出し、既存のツールの限界に対処できるかどうかを評価する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:12:48 GMT)
Learning to utilize gradient information for crisp edge detection [12.8] エッジ検出はコンピュータビジョンの基本課題であり、ディープ畳み込みニューラルネットワーク(DCNN)の開発において大きな進歩を遂げた。
本研究では,この問題を効果的に解決する手法を提案する。
提案手法は,軽量な事前学習バックボーン,マルチスケールコンテキスト拡張モジュール集約勾配情報(MCGI),境界補正モジュール(BCM),境界修正モジュール(BRM)から構成される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:25:02 GMT)
Memory-guided Network with Uncertainty-based Feature Augmentation for Few-shot Semantic Segmentation [12.7] 学習可能なメモリベクトルの集合からなるクラス共有メモリ(CSM)モジュールを提案する。
これらのメモリベクトルは、トレーニング中にベースクラスから要素オブジェクトパターンを学習し、トレーニングと推論の両方でクエリ機能を再エンコードする。
我々は、CSMとUFAを代表的FSS作品に統合し、広く使われているPASCAL-5$i$とCOCO-20$i$データセットの実験結果を得た。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:50:22 GMT)
Flow of Reasoning: Efficient Training of LLM Policy with Divergent Thinking [12.5] 大きな言語モデル(LLM)は、しばしば高品質で多様な推論を生成するのに苦労する。
本稿では,FoR(Flow of Reasoning,フロー・オブ・推論)を提案する。
FoR は初期状態から終状態へのマルコフフローとして多段階 LLM 推論を定式化する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:06:58 GMT)
SPA-SVC: Self-supervised Pitch Augmentation for Singing Voice Conversion [12.5] 歌声変換(SPA-SVC)のための自己教師付きピッチ拡張法を提案する。
サイクルピッチシフトトレーニング戦略と構造類似度指数(SSIM)の損失をSVCモデルに導入し,その性能を効果的に向上する。
歌唱データセットM4Singerの実験結果から,提案手法はモデル性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:34:01 GMT)
TopoBenchmarkX: A Framework for Benchmarking Topological Deep Learning [11.4] TopoBenchmarkXは、トポロジカルディープラーニング(TDL)の研究を標準化し、加速するライブラリである。
TDLパイプラインをデータ読み込みと処理、モデルトレーニング、最適化、評価のための独立したモジュールコンポーネントのシーケンスにマッピングする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:31:19 GMT)
What Can We Learn from State Space Models for Machine Learning on Graphs? [11.4] グラフ構造化データに対する状態空間モデル(SSM)の原則拡張として,グラフ状態空間畳み込み(GSSC)を提案する。
グローバルな置換同変集合アグリゲーションと分解可能なグラフカーネルを活用することにより、GSSCはSSMの3つの利点を全て保持する。
グラフ機械学習のパワフルでスケーラブルなモデルとしてのGSSCの可能性を明らかにする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:03:36 GMT)
Do LLMs Exhibit Human-Like Reasoning? Evaluating Theory of Mind in LLMs for Open-Ended Responses [11.1] 心の理論 (ToM) は、他個人が自身の意図、感情、思考を持っていると認識することを必要とする。
大きな言語モデル(LLM)は要約、質問応答、翻訳といったタスクに優れる。
進歩にもかかわらず、LLMがToM推論を真に理解している範囲は、未解決のシナリオでは不十分である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:57:59 GMT)
Sparse Binarization for Fast Keyword Spotting [11.0] KWSモデルは、リアルタイムアプリケーション、プライバシ、帯域幅効率のためにエッジデバイスにデプロイすることができる。
本稿では,スパース入力表現に基づく新しいキーワードスポッティングモデルを提案する。
また,本手法は高速かつノイズの多い環境でもより堅牢である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:03:48 GMT)
Efficient LLM Comparative Assessment: a Product of Experts Framework for Pairwise Comparisons [10.9] 本稿では,効率的な比較評価のためのPoE(Product of Expert)フレームワークを紹介する。
個人比較は、ペアのスコア差に関する情報を提供する専門家と見なされる。
PoEフレームワークは、これらの専門家からの情報を組み合わせて、基礎となる候補セットに関して最大化できる表現を生成する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:56:11 GMT)
Demonstrations Are All You Need: Advancing Offensive Content Paraphrasing using In-Context Learning [10.9] 監督されたパラフレーズは、意味と意図を維持するために大量のラベル付きデータに大きく依存している。
本稿では,大規模言語モデル(LLM)を用いたICL(In-Context Learning)を探索し,実践者を支援することを目的とする。
本研究は, 実演数と順序, 即時指導の排除, 測定毒性の低下など, 重要な要因に焦点を当てた。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:22:33 GMT)
Certified Robustness to Data Poisoning in Gradient-Based Training [10.8] 我々は、潜在的に操作されたデータでトレーニングされたモデルの振る舞いを証明可能な保証を提供する最初のフレームワークを開発する。
本フレームワークは,未標的および標的毒に対するロバスト性,および入力およびラベル操作の両方に対するバックドア攻撃を認証する。
我々は、エネルギー消費、医療画像、自律運転などの応用から、複数の実世界のデータセットに対するアプローチを実証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:59:46 GMT)
UCTB: An Urban Computing Tool Box for Building Spatiotemporal Prediction Services [10.8] UCTBと呼ばれる時間的群集流予測ツールボックスの設計と実装を行う。
複数の時間領域の知識と最先端のモデルを同時に統合する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 09:28:46 GMT)
Self-Distilled Disentangled Learning for Counterfactual Prediction [10.7] 我々は、SD2$として知られる自己蒸留遠絡フレームワークを提案する。
情報理論を基礎として、複雑な相互情報推定器の設計を伴わずに、理論上独立に不整合表現を鳴らす。
人工と実世界の両方のデータセットを用いて実験を行い,本手法の有効性を確認した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:58:19 GMT)
Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering [10.7] 我々は,レンダリング可能な3Dガウスアンに直接デコード可能なビットストリームを生成するポイントクラウド圧縮スキームを開発した。
提案手法はスケーラブルなビットストリームを生成し,異なるビットレート範囲で複数の詳細レベルを実現する。
提案手法は,高品質な点雲のリアルタイムカラーデコーディングとレンダリングをサポートし,自由視点でインタラクティブな3Dストリーミングアプリケーションを実現する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 20:58:32 GMT)
A Generalized Version of Chung's Lemma and its Applications [10.6] 我々はChung's lemmaの一般化バージョンを開発し、より一般的なステップサイズルールの族に対する単純な非漸近収束フレームワークを提供する。
解析の副産物として、指数的なステップサイズが目的関数の幾何学に適応し、基礎となる景観の正確な知識を必要とせずに最適な収束率を達成することができることを観察する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:25:10 GMT)
Multi-Task Learning for Sparsity Pattern Heterogeneity: Statistical and Computational Perspectives [10.5] マルチタスク学習(MTL)において、複数の線形モデルがデータセットの集合上で協調的に訓練される問題を考える。
我々のフレームワークの重要な特徴は、回帰係数のスパーシティパターンと非ゼロ係数の値がタスク間で異なることである。
提案手法は,1) 係数のサポートを個別に促進し,2) 非ゼロ係数の値を類似させることにより,タスク間の情報共有を奨励する。
これにより、非ゼロ係数値がタスク間で異なる場合でも、モデルが可変選択中に強度を借りることができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:20:43 GMT)
Algorithms for mean-field variational inference via polyhedral optimization in the Wasserstein space [10.3] ワッサーシュタイン空間上の有限次元多面体部分集合の理論を開発し、一階法による函数の最適化を行う。
我々の主な応用は平均場変動推論の問題であり、これは分布の$pi$ over $mathbbRd$を製品測度$pistar$で近似しようとするものである。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:19:10 GMT)
61A-Bot: AI homework assistance in CS1 is fast and cheap -- but is it helpful? [10.0] 本稿では,大規模CS1コースの学生を対象に,GPT-4を用いた対話型宿題アシスタント(61A-Bot)の開発と展開について報告する。
宿題の完了時間を大幅に短縮する。
これらは50~80年生の生徒にとって最も顕著であり、30分以上、標準偏差は4回以上も前学期よりも速い。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 00:23:20 GMT)
Mamba YOLO: SSMs-Based YOLO For Object Detection [9.9] Mamba-YOLOはステートスペースモデルに基づく新しい物体検出モデルである。
本報告では,マンバヨロが既存のYOLOシリーズモデルを上回る性能と競争性を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:56:19 GMT)
InfoGaussian: Structure-Aware Dynamic Gaussians through Lightweight Information Shaping [9.7] 本研究では,運動ネットワークにおける相関ガウス間の移動共鳴を強制する手法を開発した。
動作ネットワークを形作るための軽量な最適化を施した効率的なコントラスト訓練パイプラインを開発する。
提案手法は,挑戦的な場面で評価し,大幅な性能向上を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:33:32 GMT)
Aegis: A Decentralized Expansion Blockchain [9.5] 本稿では,プライマリチェーンの利害関係に基づく拡張チェーンであるAegisについて,バウンドプライマリチェーンの書き込み時間を仮定する。
Aegis は Aegis ブロックからプライマリブロックへの参照を使用して委員会を定義し、プライマリチェーンのチェックポイントで決定を継続し、前回が廃止された場合、プライマリチェーンにリセットして新しい委員会を設置する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:53:48 GMT)
HDMba: Hyperspectral Remote Sensing Imagery Dehazing with State Space Model [9.4] ハイパースペクトルリモートセンシング画像(HSI)のヘイズは、空間的な可視性劣化とスペクトル歪みを引き起こす。
我々は、ウィンドウ内のローカル依存関係をキャプチャする新しいウィンドウ選択スキャンモジュール(WSSM)を開発した。
局所的および大域的スペクトル空間情報フローをモデル化することにより,ハジー領域の包括的解析を実現する。
Gaofen-5 HSIデータセットの実験結果から、HDMbaは他の最先端手法よりも性能が優れていることが示された。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:53:02 GMT)
A Knowledge-Component-Based Methodology for Evaluating AI Assistants [9.4] GPT-4をベースとしたCS1プログラム代入のためのヒント自動生成システムの評価を行った。
本システムは,学生が短時間のプログラミング演習において,誤った解法をいかに改善できるか,という自然言語指導を提供する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 00:58:39 GMT)
Solution for CVPR 2024 UG2+ Challenge Track on All Weather Semantic Segmentation [9.3] UG2+ Challenge at CVPR 2024において, 悪天候におけるセマンティックセグメンテーションの解決法について述べる。
InternImage-Hのバックボーンを,大規模関節データセットから事前トレーニングした重み付きで初期化し,最先端のUpernetセグメンテーション手法で強化する。
提案手法は,テストセット上での高度な性能を実証し,この課題において第3位を達成している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:56:35 GMT)
CantonMT: Cantonese to English NMT Platform with Fine-Tuned Models Using Synthetic Back-Translation Data [9.2] この研究は、標準データ拡張手法を、新しい言語翻訳の方向であるCantonese-to- Englishにバック翻訳することで展開する。
実データ量と合成データを用いて微調整したモデルを提案する。
我々は、このtextsc CantonMT研究プロジェクトに含まれるモデルのユーザフレンドリなインターフェースを作成し、カントン語から英語へのMT研究を促進するために利用できるようにする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:10:04 GMT)
Arabic Diacritics in the Wild: Exploiting Opportunities for Improved Diacritization [9.2] アラビア語テキストにおけるダイアクリティカルマークの欠如は、アラビア語自然言語処理(NLP)に重大な課題をもたらす
本稿では,自然発生型ダイアクリティカルティクスを「野生におけるダイアクリティカルティクス」と呼ぶ事例について検討する。
そこで本研究では,実世界の部分的辞書化単語を文脈における最大完全辞書化にマッピングする注釈付きデータセットを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:29:55 GMT)
Technical Report for CVPR 2024 WeatherProof Dataset Challenge: Semantic Segmentation on Paired Real Data [9.1] この課題は、世界中の様々な天候によって劣化した画像のセマンティックセグメンテーションを目標とする。
我々は、インターンイメージ(InternImage)という訓練済みの大規模視覚基盤モデルを導入し、異なるレベルのノイズを持つ画像を用いて訓練した。
その結果、45.1mIOUで2位となり、他の優勝者より少なかった。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:08:07 GMT)
QGEval: A Benchmark for Question Generation Evaluation [9.0] 人間の評価は質問生成(QG)の分野で頻繁に使われており、最も正確な評価方法の1つである。
統一評価基準が欠如しており、QG技術と自動評価手法の両方の開発を妨げている。
質問生成のための多次元評価ベンチマークであるQGEvalを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 09:51:55 GMT)
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains [8.4] 大規模言語モデル(LLM)は近年,顕著な汎用性を示している。
健康状況に合わせて様々なオープンソース LLM が利用可能であるにもかかわらず、汎用 LLM を医療分野に適用することは重大な課題である。
我々は、Mistralを基盤モデルとして、バイオメディカルドメインに適したオープンソースのLLMであるBioMistralを紹介した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:19:09 GMT)
Can Prompt Modifiers Control Bias? A Comparative Analysis of Text-to-Image Generative Models [8.4] 本研究では,主要なテキスト・画像モデルであるStable Diffusion, DALL-E 3, Adobe Fireflyにおける社会的バイアスの存在と操作について検討した。
我々の発見は、バイアス制御におけるエンジニアリングの課題と可能性を明らかにし、倫理的AI開発における重要なニーズを浮き彫りにしている。
この研究は、テキストから画像生成モデルにおけるバイアスの微妙なダイナミクスを明らかにするだけでなく、バイアスを制御するための新しい研究フレームワークを提供することによって、AI倫理を前進させる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 00:54:57 GMT)
Security Vulnerability Detection with Multitask Self-Instructed Fine-Tuning of Large Language Models [8.2] 脆弱性検出のためのMSIVD, マルチタスクによる自己指示型微調整を, チェーン・オブ・シント・プロンプトとLDMによる自己指示にインスパイアした。
実験の結果,MSIVDは高い性能を示し,LineVul(LLMベースの脆弱性検出ベースライン)はBigVulデータセットでは0.92点,PreciseBugsデータセットでは0.48点であった。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:18:05 GMT)
Adaptive Text Watermark for Large Language Models [8.1] プロンプトやモデルの知識を必要とせずに、強力なセキュリティ、堅牢性、および透かしを検出する能力を維持しつつ、高品質な透かしテキストを生成することは困難である。
本稿では,この問題に対処するための適応型透かし手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:52:21 GMT)
Nearly Minimax Optimal Regret for Multinomial Logistic Bandit [8.1] 本研究では,学習エージェントが文脈情報に基づいて順にアソシエーションを選択する,文脈多項ロジット(MNL)バンディット問題について検討する。
左下肢と左上肢の間には有意な差がみられた。
そこで本研究では,$tildeO(dsqrtT)$と一致する上限を実現する定数時間アルゴリズム OFU-MNL+を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:14:10 GMT)
Ctrl-V: Higher Fidelity Video Generation with Bounding-Box Controlled Object Motion [8.1] 本研究では,2次元または3次元境界ボックスのピクセルレベルのレンダリングを条件付けとして,制御可能な映像生成モデルを提案する。
また、初期フレームと終端フレームのバウンディングボックスから最大15フレームまでのバウンディングボックスを25フレームクリップで予測できるバウンディングボックス予測器を作成する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:44:35 GMT)
Whose Preferences? Differences in Fairness Preferences and Their Impact on the Fairness of AI Utilizing Human Feedback [8.0] 我々は、人種、年齢、政治的スタンス、教育水準、LGBTQ+アノテーターのアイデンティティによって、公平さの選好に大きなギャップを見いだす。
また、テキストで言及された人口統計は、ユーザーがモデレーションにおいて個人の公平さをどう知覚するかに大きな影響を及ぼすことを示した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:42:25 GMT)
Interpretable Deep Clustering for Tabular Data [8.0] クラスタリングは、データ分析で広く使われている基本的な学習タスクである。
本稿では,インスタンスとクラスタレベルでの解釈可能なクラスタ割り当てを予測する,新たなディープラーニングフレームワークを提案する。
提案手法は,生物,テキスト,画像,物理データセットのクラスタ割り当てを確実に予測できることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:40:00 GMT)
How Important Is Tokenization in French Medical Masked Language Models? [7.9] 自然言語処理(NLP)分野において,サブワードトークン化が主流となっている。
本稿では,フランス生物医学領域におけるサブワードトークン化の複雑さを,多種多様なNLPタスクにまたがって探究する。
従来のトークン化手法に形態素に富んだ単語セグメンテーションを統合するオリジナルトークン化戦略を導入する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:11:31 GMT)
WARDEN: Multi-Directional Backdoor Watermarks for Embedding-as-a-Service Copyright Protection [7.7] 本稿では,複数の可能な透かし方向を組み込むことで,透かしの除去をより困難にするための新しいプロトコルを提案する。
我々の防衛アプローチであるWARDENは、特に透かしのステルスネスを高め、CSE攻撃に対する効果を実証的に示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:34:55 GMT)
A Zero-shot and Few-shot Study of Instruction-Finetuned Large Language Models Applied to Clinical and Biomedical Tasks [7.5] 我々は4つの言語モデル(LLM)を評価する。
英語における13のリアル・ワールド・クリニカル・バイオメディカル・自然言語処理(NLP)タスクについて
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:06:57 GMT)
Zero-Shot End-To-End Spoken Question Answering In Medical Domain [6.9] 従来のカスケードシステムと比較して,ゼロショット型SQA方式を提案する。
我々は1.55BパラメータASRモデルと組み合わせた1.3BパラメータLLMの最大14.7倍のリソースを必要とすることを実証した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:13:36 GMT)
Text2VP: Generative AI for Visual Programming and Parametric Modeling [6.5] 本研究は、GPT-4から派生したテキスト・ツー・ビジュアルプログラミング(Text2VP)GPTを利用して、パラメトリック・モデリングにおける生成AIの革新的な応用を創出し、研究する。
主な焦点は、AI生成スクリプトを通じてパラメータとパラメータ間のリンクを含むグラフベースのビジュアルプログラミングの自動生成である。
我々のテストでは、動作パラメトリックモデルを生成するText2VPの機能を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 02:22:20 GMT)
Scaling Graph Convolutions for Mobile Vision [6.4] 本稿では、このスケーリング問題を解決するビジョングラフニューラルネットワーク(ViG)モジュールであるMobile Graph Convolution(MGC)を紹介する。
提案するモバイルビジョンアーキテクチャであるMobileViGv2は,MPCを用いて提案手法の有効性を実証する。
私たちの最大のモデルであるMobileViGv2-Bは、83.4%のトップ1の精度で、MobileViG-Bより0.8%高く、2.7msの推論遅延を実現しています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:49:19 GMT)
Realtime Dynamic Gaze Target Tracking and Depth-Level Estimation [6.4] 車両のヘッドアップディスプレイ(HUD)のような様々な用途における透明ディスプレイ(TD)は、ユーザー体験に革命をもたらす可能性がある。
このイノベーションは、リアルタイムのヒューマンデバイスインタラクション、特に動的に変化するTDに対するユーザの視線を正確に識別し追跡する上で、大きな課題を引き起こします。
本研究では,(1)目視対象を特定し,動的に追跡する木に基づくアルゴリズム,(2)目視の深度レベルを目視追跡データから推定するマルチストリーム自己認識アーキテクチャからなる,リアルタイム目視監視のための2重頑健で効率的な体系的ソリューションを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 20:52:47 GMT)
ALGO: Object-Grounded Visual Commonsense Reasoning for Open-World Egocentric Action Recognition [6.3] 本研究では, ALGO-Action Learning with Grounded Object Recognitionを提案する。
まず,物体中心の視覚言語モデルを用いたニューロシンボリック・プロンプト手法を提案する。
第二に、事前のコモンセンス知識により、エネルギーに基づく象徴的パターン理論の枠組みを通して、プラプシブルな活動を発見する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:30:04 GMT)
Structured Learning of Compositional Sequential Interventions [5.9] 我々は、各ユニットが時間の経過とともに介入の組み合わせに晒される、逐次的な治療体制について考察する。
標準ブラックボックスアプローチは、カテゴリ変数の列を出力にマッピングする。
ここでは, 逐次的介入の効果をモジュールに分離する方法を明示的なモデルで表す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:36:36 GMT)
Latent Neural Operator for Solving Forward and Inverse PDE Problems [5.8] 本稿では、潜時空間におけるPDEを解く潜時ニューラルネットワーク(LNO)を提案する。
実験によると、LNOはGPUメモリを50%削減し、トレーニングを1.8回スピードアップし、6つの前処理のベンチマークのうち4つと逆処理のベンチマークで最先端の精度に達する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:42:57 GMT)
STARLING: Self-supervised Training of Text-based Reinforcement Learning Agent with Large Language Models [5.8] インタラクティブなフィクションゲームのための既存の環境は、特定のスキルセットをマスターするためにRLエージェントを生成するのにドメイン固有または時間を要する。
本稿では,テキストベースのRLエージェントを自動生成ゲームでブートストラップし,目標環境の目標を達成するためのパフォーマンスと一般化能力を向上する,自己教師型RL,STARlingのための対話型環境を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:07:47 GMT)
A Comprehensive Evaluation of Parameter-Efficient Fine-Tuning on Automated Program Repair [5.7] 事前学習・微調整」パラダイムにより、大規模言語モデル(LLM)が自動プログラム修復(APR)の修正能力を向上できる
我々はまず,このギャップを埋めるために,インストラクションデータセットであるAPR-INSTRUCTIONを作成するために,プロンプトエンジニアリングを採用している。
最高の微調整モデルでは、最先端のLLMベースのAPR技術よりも58%多くのバグが修正されている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:42:19 GMT)
Multi-Stain Multi-Level Convolutional Network for Multi-Tissue Breast Cancer Image Segmentation [5.6] 病理組織学のための新しい畳み込みニューラルネットワーク(CNN)を提案する。
本モデルでは, 折り畳み, アーティファクト, ぼやけた領域, バブルなどの悪い領域を, 多段階のコンテキストを用いて組織領域から分離することができる。
トレーニングパイプラインでは、コンテキスト認識による拡張を使用して、1200万のパッチを生成しました。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:35:49 GMT)
General Distribution Learning: A theoretical framework for Deep Learning [5.3] 本稿では,ジェネラルラーニング・ディストリビューション(General Learning Distribution)と呼ばれる新しい理論フレームワークを紹介する。
GD Learningは、真の基礎となる分布に焦点を当てている。
GDラーニングエラーでは、期待される古典的統計的学習フレームワークに対応して、モデルとデータによって生じる適合誤差に分割する。
この知識はデータセット全体の最適なエラーを最小限にし、パフォーマンスを向上させるのに役立つ。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:49:22 GMT)
Janus graphene nanoribbons with a single ferromagnetic zigzag edge [5.2] ジグザグ縁グラフェンナノリボン(ZGNR)中のπ電子のトポロジー設計は、磁気量子現象とエキゾチック量子相をもたらす。
ZGNRにおけるクロスエッジ磁気カップリングの排除は、新しい種類の強磁性量子スピン鎖の実現を可能にする。
本稿では、2つの異なるエッジ構成を持つJanus GNRの形で、そのような強磁性GNRを設計および製造するための一般的なアプローチについて報告する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:45:36 GMT)
RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation [5.1] 本稿では,RAGシステムに明示的文脈関連度推定器(RE)を注入するRE-RAGフレームワークを提案する。
Retrieval-augmented Generation (RAG) フレームワークは、外部知識を参照して、オープンドメイン質問応答タスクにおける最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:11:19 GMT)
MedREQAL: Examining Medical Knowledge Recall of Large Language Models via Question Answering [5.1] 大きな言語モデル(LLM)は、大きなテキストコーパスで事前学習中に知識を符号化する印象的な能力を示している。
体系的レビューから得られた新しいデータセットを構築することにより, LLMが医療知識のリコールを示す能力について検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:33:28 GMT)
The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control [5.0] 2024年は、分析翻訳品質評価のための多次元品質指標フレームワークの10周年である。
本稿では,最新のMQM開発について詳述し,3つのサンプルサイズ範囲にわたる翻訳品質測定への普遍的アプローチを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:03:49 GMT)
Which Backbone to Use: A Resource-efficient Domain Specific Comparison for Computer Vision [4.6] ImageNetのような大規模なデータセットで事前トレーニングされたアーキテクチャバックボーンは、一般的に機能抽出器として使用される。
本研究は、一貫したトレーニング設定下で、複数の軽量で事前訓練されたCNNバックボーンを体系的に評価する。
本研究は,異なるバックボーンの性能トレードオフと有効性について,実用的な知見を提供する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 02:01:25 GMT)
Convergence Conditions of Online Regularized Statistical Learning in Reproducing Kernel Hilbert Space With Non-Stationary Data [4.6] 本研究では,HilbertRKHSにおける正規化学習アルゴリズムの収束性について検討した。
独立および非独立に分散したデータストリームに対して、アルゴリズムは平均二乗一貫性を達成する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:11:36 GMT)
Manifold Fitting under Unbounded Noise [4.5] 出力多様体は、基底多様体上の射影点の接空間を直接推定することによって構成される。
我々の新しい手法は、推定された多様体と基礎多様体の間の距離の上限という観点から、高い確率で理論収束を与える。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:22:48 GMT)
Exploring the Efficacy of Large Language Models (GPT-4) in Binary Reverse Engineering [4.5] この研究は、基本的なコード解釈に関する第1段階と、より複雑なマルウェア分析に関する第2段階の2段階を含む。
この研究は、リバースエンジニアリングにおけるLLMの可能性と現在の限界を強調し、将来の応用と改善のための重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 09:23:58 GMT)
Enhancing Mobile "How-to" Queries with Automated Search Results Verification and Reranking [4.5] 本稿では,オンライン技術支援検索結果の精度と関連性を改善するための新しい手法を提案する。
我々は、AIエージェントが検索結果のステップバイステップの指示を、制御されたAndroid環境で解釈し実行できるようにするための、最初のソリューションを開発した。
その結果,上位結果の品質と信頼性は著しく向上した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:33:00 GMT)
SinkLoRA: Enhanced Efficiency and Chat Capabilities for Long-Context Large Language Models [4.5] 自己保持機構は、シーケンス長で2次スケールする。
LongLoRAは、コンテキスト拡張を有効に可能にしたスパースアテンション(S(2)-Attn)を提案した。
SinkLoRAは相変わらずバニラの注意ほど効率的ではなく、完全な注意よりも難易度の改善の39%にしか達していない。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:23:34 GMT)
FedRC: Tackling Diverse Distribution Shifts Challenge in Federated Learning by Robust Clustering [4.5] Federated Learning(FL)は、エッジデバイス上でクライアントデータを保持することによって、プライバシを保護する機械学習パラダイムである。
本稿では,多様な分布シフトの同時発生による学習課題を特定する。
提案するクラスタリングの原理に従う新しいクラスタリングアルゴリズムフレームワークであるFedRCを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:36:10 GMT)
Moving Sampling Physics-informed Neural Networks induced by Moving Mesh PDE [4.5] 移動メッシュ法に基づくエンドツーエンド適応サンプリングニューラルネットワーク(MMPDE-Net)を提案する。
我々は,MMPDE-Netに基づく反復アルゴリズムを開発し,サンプリングポイントをより正確かつ制御しやすくする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:56:30 GMT)
Feature Accentuation: Revealing 'What' Features Respond to in Natural Images [4.4] 本稿では,任意の入力画像のどの位置と何にあるかが特徴の応答を誘導するかを伝達できる,解釈可能性ツールキット「Feature accentuation」に新たな手法を導入する。
パラメータ化,拡張,正規化の特別な組み合わせは,シード画像とターゲット特徴を同時に類似した自然な視覚化をもたらす。
我々は,Lucentの拡張であるFaccentライブラリとして,機能アクセントの正確な実装をコミュニティに提供する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:06:59 GMT)
Global Sensitivity Analysis of Uncertain Parameters in Bayesian Networks [4.4] 我々は,大域的分散に基づくパラメータの感度分析を行う。
我々の方法は不確実性をネットワークの$n$追加変数としてエンコードすることで機能する。
最後に、結果のネットワークにSobolの手法を適用して、グローバルな感度指標を$n$とする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:36:38 GMT)
MrRank: Improving Question Answering Retrieval System through Multi-Result Ranking Model [4.2] 大型言語モデル(LLM)は幻覚や古い情報に悩まされることが多い。
これを解決するために、情報検索(IR)システムを使用して、最新の知識を持つLLMを拡張できる。
異種赤外線システムを組み合わせた学習からランクへのアプローチを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:00:01 GMT)
Feriji: A French-Zarma Parallel Corpus, Glossary & Translator [3.3] 本稿では,機械翻訳用に設計された最初のロバストなフレンチ・ザーマ並列コーパスと用語集であるFerijiを紹介する。
我々はデータセット上で3つの大きな言語モデルを微調整し、最高の性能モデルでBLEUスコア30.06を得る。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:08:33 GMT)
Individual misinformation tagging reinforces echo chambers; Collective tagging does not [3.2] ここでは、Twitterのデータを用いて、個別の誤情報タグ付けの結果を示す。
タグ付けポスターは、新しい政治情報を探求し、すぐに話題の興味を拡大したが、タグ付けされたポスターは、情報バブルに後退した。
Twitterの新しいプラットフォーム、Community Notesでは、偽情報のタグ付けは他のファクトチェッカーがポスターを露出する前にピアレビューした。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:35:44 GMT)
Language Model Can Do Knowledge Tracing: Simple but Effective Method to Integrate Language Model and Knowledge Tracing Task [3.1] 本稿では,LKT(Language Model-based Knowledge Tracing)を提案する。
LKTはテキスト情報を効果的に組み込んでおり、大規模なベンチマークデータセットで以前のKTモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:53:29 GMT)
Understanding Open Source Contributor Profiles in Popular Machine Learning Libraries [3.1] MLライブラリ内のコントリビュータプロファイルを識別することで,機械学習コントリビュータの理解を目指す。
6つの有名なMLライブラリから7,640人のコントリビュータを調査して、Core-Afterhour、Core-Workhour、Peripheral-Afterhour、Peripheral-Workhourの4つのコントリビュータプロファイルを特定しました。
1) プロジェクトエクスペリエンス、オーサリングファイル、コラボレーション、地理的位置は、すべてのプロファイルの重要な特徴です。 2) コアのコントリビュータは、周辺プロファイルと比較してOSSのエンゲージメントが著しく異なること、3) コントリビュータの作業好みとワークロードのコントリビュータがプロジェクトの人気に大きく影響すること、4) 長期的なコントリビュータが、より小さく、一定で、バランスが取れ、技術的なコントリビューションが少ないこと、などです。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:10:49 GMT)
Region of Interest Loss for Anonymizing Learned Image Compression [3.1] 人間の顔が認識不能になり,人体が検出不能となるような,十分な匿名化を実現する方法を示す。
このアプローチは、ネットワーク越しに機密性の高い匿名化データを送信するのではなく、キャプチャデバイス上の1ステップで圧縮と匿名化を可能にする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:36:06 GMT)
Introducing GenCeption for Multimodal LLM Benchmarking: You May Bypass Annotations [3.1] GenCeptionは、新しくてアノテーションのないMLLM評価フレームワークである。
モダリティ間のセマンティックコヒーレンスを評価するために一元的データが必要であり、逆に幻覚へのモデルの傾きを反映している。
我々はGenCeptionの有効性を実証し,MLLMベンチマークの結果と強い相関関係を示した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:10:34 GMT)
Diverse 3D Human Pose Generation in Scenes based on Decoupled Structure [3.0] そこで本研究では,セマンティックコントロールによるシーン内の多様な3次元ポーズを生成する手法を提案する。
私たちのアプローチは、ポーズ生成、コンタクト生成、シーンに人間を配置する3つのステージで構成されています。
PROXデータセットを用いた実験結果から,より物理的に妥当な相互作用が得られた。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:33:10 GMT)
Robust portfolio optimization for recommender systems considering uncertainty of estimated statistics [2.9] 本稿では,基数に基づく不確実性集合に基づく推定統計の不確実性に対応する,ロバストなポートフォリオ最適化モデルを提案する。
提案手法は,様々なレーティング予測アルゴリズムの推薦品質を向上させる可能性がある。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:42:54 GMT)
A Survey on Complexity Measures of Pseudo-Random Sequences [2.7] 1960年代に2進列のコルモゴロフ複雑性が導入されて以来、ランダムネス評価のための複雑性測定のトピックにおいて大きな進歩があった。
本調査は, 擬似ランダム列の線形, 二次, 最大次複雑度に関する過去40年間の顕著な研究をレビューする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 20:42:16 GMT)
A Superalignment Framework in Autonomous Driving with Large Language Models [2.7] 大規模言語モデル (LLM) と多モード大規模言語モデル (MLLM) は、自律運転において広く使われている。
その重要性にもかかわらず、自動運転におけるLLMのセキュリティの側面は未解明のままである。
本研究は,マルチエージェントLLMアプローチを利用した,自動運転車の新たなセキュリティフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:26:38 GMT)
CoMIX: A Multi-agent Reinforcement Learning Training Architecture for Efficient Decentralized Coordination and Independent Decision-Making [2.5] ロバストコーディネートスキルにより、エージェントは共有環境で、共通の目標に向けて、そして理想的には、お互いの進歩を妨げることなく、結合的に操作することができる。
本稿では,分散エージェントのための新しいトレーニングフレームワークであるCoordinated QMIXについて述べる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:48:32 GMT)
Seventeenth-Century Spanish American Notary Records for Fine-Tuning Spanish Large Language Models [2.4] 我々の資料は、アルゼンチン国立公文書館から入手した17世紀の手書きの記譜集である。
我々のコレクションは、分類やマスキング言語モデリングといったタスクのために、スペイン語のLLMを微調整するのに利用できることを実証する。
私たちのリソースは、過去のテキスト分析の貴重なリソースであり、GitHubで公開されています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:54:22 GMT)
Numerical solution of a PDE arising from prediction with expert advice [2.0] 本研究は,エキスパート・アドバイスを用いたオンライン機械学習における予測問題について,対向的な環境で検討する。
このゲームの多くのステップに対する連続極限は、この解が両方のプレイヤーにとって最適な戦略を符号化する退化楕円型方程式である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:17:05 GMT)
Partial Label Learning with Focal Loss for Sea Ice Classification Based on Ice Charts [2.0] 本稿では,海氷分類を学習するための新しいGeoAI手法を提案する。
我々は、ポリゴンレベルのラベルを候補部分ラベルとして扱い、対応する氷濃度を各ラベルの信頼性スコアとして割り当て、焦点損失と統合して畳み込みニューラルネットワーク(CNN)を訓練する。
提案手法により,Sentinel-1双偏極SAR画像の海氷分類性能が向上し,分類精度が87%から92%に向上し,F-1スコアが90%から93%に向上した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:16:27 GMT)
Predicting Open-Hole Laminates Failure Using Support Vector Machines With Classical and Quantum Kernels [2.0] 本研究では, 面内載荷時の開放孔複合板の最終的な破壊包絡を学習するために, 代理モデルの訓練方法を示す。
カーネル-ターゲットアライメント最適化により、すべてのカーネルのフリーパラメータを最適化し、安全なロード状態と障害発生ロード状態の分離を最良とする。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:49:00 GMT)
A Reality check of the benefits of LLM in business [1.9] 大規模言語モデル(LLM)は、言語理解および生成タスクにおいて顕著なパフォーマンスを達成した。
ビジネスプロセスにおけるLCMの有用性と準備性について概説する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 02:36:00 GMT)
IndoHerb: Indonesia Medicinal Plants Recognition using Transfer Learning and Deep Learning [1.8] 本研究は,コンボリューショナルニューラルネットワーク(CNN)の導入を通じてインドネシアの草本植物を分類する課題に対処する。
厳密なデータ前処理と5つの異なるモデルを用いた移動学習手法を用いた分類を行った。
包括的な分析の結果、ConvNeXtは92.5%の精度で最高の精度を達成した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:41:55 GMT)
Beyond Gut Feel: Using Time Series Transformers to Find Investment Gems [1.7] 本稿では,PE(Private Equity)業界におけるデータ駆動アプローチの適用拡大について論じる。
本稿では、関連するアプローチの総合的なレビューを行い、候補企業の成功可能性を予測するための新しいアプローチを提案する。
3つの一般的なベースラインに向けてベンチマークした2つの実世界の投資タスクに関する実験は、我々のアプローチの有効性を実証した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:42:47 GMT)
CompanyKG: A Large-Scale Heterogeneous Graph for Company Similarity Quantification [1.7] 我々は,企業の特徴や関係を多様に表現し,学習するための知識グラフである企業KGを提案し,公開する。
具体的には、131万の企業が、企業記述の埋め込みに富んだノードとして表現されている。
15の異なる企業間関係は、51.06万の重み付きエッジをもたらす。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:20:21 GMT)
Controlling Unknown Quantum States via Data-Driven State Representations [1.6] 量子状態の正確な制御は、量子コンピューティングや他の量子技術にとって重要である。
システム状態の表現を構築するために,少量の測定データを用いた機械学習アルゴリズムを開発した。
本研究では, 未知の多体量子状態と非ガウス連続変数状態の, 限定された量子測定値からのデータを用いて, 正確な制御を実現することを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:07:05 GMT)
Replica symmetry breaking in spin glasses in the replica-free Keldysh formalism [1.6] ガラス相の持続的緩やかな時効ダイナミクスから, 超音波測定が現れることを示す。
我々は、微視的量子モデルから始まるギンズバーグ・ランダウ効果的なケルディシュ作用を導出した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:06:15 GMT)
Less is KEN: a Universal and Simple Non-Parametric Pruning Algorithm for Large Language Models [1.6] KENはカーネル密度推定(KDE)に基づく単純で普遍的で非構造化プルーニングアルゴリズムである
Kenは、最適化されたトランスフォーマーを構築することを目的としており、最も重要なパラメータを選択的に保存し、他のパラメータをトレーニング前の状態に復元する。
Kenは、元の未実行バージョンと同等かそれ以上のパフォーマンスを達成し、パラメータの最小25%の削減を実現している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:32:03 GMT)
Heterogeneous Treatment Effects in Panel Data [1.6] 回帰木を用いて,観測結果を類似の処理効果で解離クラスタに分割する手法を提案し,評価する。
我々の理論的結果は、結果の見積もりを真の治療効果に収束させるものである。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:02:08 GMT)
Digital Business Model Analysis Using a Large Language Model [1.6] 本研究では,LLMをベースとした類似企業の比較分析手法を提案する。
この方法は、デジタルビジネスモデル設計におけるアイデア生成を支援することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:16:11 GMT)
DH-PTAM: A Deep Hybrid Stereo Events-Frames Parallel Tracking And Mapping System [1.4] 本稿では,視覚的並列追跡・マッピング(PTAM)システムに対するロバストなアプローチを提案する。
提案手法は,異種多モード視覚センサの強度を統一参照フレームに組み合わせたものである。
私たちの実装のリサーチベースのPython APIはGitHubで公開されています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:56:51 GMT)
Governance of Generative Artificial Intelligence for Companies [1.4] 我々は企業内でGenAIガバナンスのためのフレームワークを開発する。
このフレームワークは、ビジネスチャンスを利用するのに適したスコープ、目的、ガバナンスメカニズムを概説します。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:48:05 GMT)
Contrastive Learning from Synthetic Audio Doppelgangers [1.4] 合成音声を利用したデータスケールと変換の制限に対する解決策を提案する。
音声合成器のパラメータをランダムに摂動することで、音色、ピッチ、時間的エンベロープの因果的に操作された変化を持つオーディオ・ドッペルグ・アンガー合成正ペアを生成する。
ランダムに生成された合成データへのシフトにもかかわらず,本手法は,標準音声分類ベンチマークにおける実データと競合する強力な表現を生成する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:44:06 GMT)
Text Detoxification as Style Transfer in English and Hindi [1.2] 本論文は, 有毒テキストを非有毒テキストに自動的に変換するテキストデトックス化に焦点を当てている。
類似したタスクからの知識伝達,マルチタスク学習,削除と再構築の3つのアプローチを提案する。
以上の結果から,本手法は実際の内容の保存と流布の維持を両立しながら,テキストの脱毒を効果的にバランスさせることが示唆された。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:48:06 GMT)
Hidden Holes: topological aspects of language models [1.1] 我々は,GPTに基づく大規模言語モデルにおけるトポロジ的構造の発達について,訓練中の深度と時間にわたって検討した。
後者は、すべての自然言語に共通する変化パターンを持つが、合成されたデータがない、よりトポロジ的な複雑さを示すことを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:25:09 GMT)
Multilingual Text Style Transfer: Datasets & Models for Indian Languages [1.1] 本稿では,ヒンディー語,マガヒ語,マラヤラム語,マラタイ語,パンジャービ語,オディア語,テルグ語,ウルドゥー語など,インド諸言語の感情伝達に焦点を当てた。
これらの8言語それぞれに対して、1000の正と1000の負のスタイルパラレル文からなる専用データセットを導入する。
次に、並列性、非並列性、言語横断性、共有学習アプローチに分類される様々なベンチマークモデルの性能を評価する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:46:48 GMT)
Toward identifiability of total effects in summary causal graphs with latent confounders: an extension of the front-door criterion [1.1] 本稿では,動的システムにおける要約因果グラフを用いた全効果の同定という課題に対処する。
隠れた境界が存在する場合でも、観測データから全体効果を特定するのに十分なグラフィカルな条件を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:43:06 GMT)
Estimating Unknown Population Sizes Using the Hypergeometric Distribution [1.0] 総人口と構成カテゴリーの規模が不明な場合, 個別分布の推定に挑戦する。
本研究では,連続潜伏変数上での分布条件の混合となるデータ生成過程について考察する。
実験データシミュレーションにより,本手法は数値データをモデル化する他の可能性関数よりも優れていることが示された。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 21:43:28 GMT)
BD-SAT: High-resolution Land Use Land Cover Dataset & Benchmark Results for Developing Division: Dhaka, BD [1.0] BD-SATは高解像度のデータセットで、ダッカ大都市圏と周辺農村部と都市部のLULCアノテーションを含んでいる。
厳密で標準化された手順を用いて、地上空間距離が2.22メートル/ピクセルであるBing衛星画像を用いて、地上の真理を作成する。
その結果, 注釈付きBD-SATは, 5つの主要なLULCクラスに対して, 適切な精度で大規模深層学習モデルを訓練するのに十分であることがわかった。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 20:54:58 GMT)
Deception Analysis with Artificial Intelligence: An Interdisciplinary Perspective [1.0] 私たちは、欺くAIに関するタイムリーで意味のある学際的な視点を構築します。
DAMAS - 社会認知モデル作成のための総合的多エージェントシステムフレームワークで, 詐欺の分析を行う。
本稿では,コンピュータサイエンス,哲学,心理学,倫理,インテリジェンス・アナリティクスの観点から,AIアプローチによる騙しのモデル化と説明について述べる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:31:26 GMT)
Evolving Collective Behavior in Self-Organizing Particle Systems [0.9] EvoSOPSは、数学的に指定された標的行動を達成するための分散アルゴリズムのランドスケープを探索する。
集約、フォトタキシング、分離の振る舞いのために、EvoSOPSは、既存のSOPSに基づく「確率的アプローチ」の数学的理論よりも4.2-15.3%高い適合性を達成するアルゴリズムを発見した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:25:42 GMT)
BOSC: A toolbox for aerial imagery mapping [0.8] BOSCは航空画像を操作するためのツールボックスである。
それは、今日のドローンと衛星資源の豊富さにおける重要なニーズに対処する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:54:23 GMT)
Particle Multi-Axis Transformer for Jet Tagging [0.8] 本稿では,新しいアーキテクチャであるParticle Multi-Axis transformer (ParMAT)を提案する。
ParMATは単一ユニット内の局所的およびグローバルな空間的相互作用を含み、様々な入力長を扱う能力を向上させる。
JETCLASSは10種類の粒子からなる1億基のジェットを含む,公開可能な大規模データセットである。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:34:16 GMT)
GasTrace: Detecting Sandwich Attack Malicious Accounts in Ethereum [0.8] サンドイッチ攻撃を検知・防止するためのカスケード分類フレームワークであるGasTraceを提案する。
GasTraceの精度は96.73%、F1スコアは95.71%である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:25:34 GMT)
Unveiling UV/IR Mixing via Symmetry Defects: A View from Topological Entanglement Entropy [0.7] いくつかのトポロジカル格子モデルは,その基底状態の縮退に複雑な格子サイズ依存性を示すことを示す。
我々の研究は、トポロジカル格子モデルにおけるUV/IR混合の堅牢な記述として、翻訳対称性欠陥フレームワークを確立する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:16:03 GMT)
Vision Mamba: Cutting-Edge Classification of Alzheimer's Disease with 3D MRI Scans [0.7] アルツハイマー病の早期発見のための3次元MRI画像の分類は、医用画像において重要な課題である。
畳み込みニューラルネットワーク(CNN)とトランスフォーマーを用いた従来のアプローチは、この領域で重要な課題に直面している。
本研究では,3次元MRI画像の分類のための状態空間モデル(SSM)に基づく高度なモデルであるVision Mambaを用いてアルツハイマー病を検出することを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:23:22 GMT)
A Survey on LLM-Based Agentic Workflows and LLM-Profiled Components [0.6] 大規模言語モデル (LLMs) は、従来の単一パスであるChain-of-Thought技術よりも改善された高度なエージェントの開発を触媒している。
本調査では, LLM-Profiled Components (LMPC) と非LLMコンポーネントの無知に着目し, 共通点を概説する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:42:55 GMT)
A Cradle-to-Gate Life Cycle Analysis of Bitcoin Mining Equipment Using Sphera LCA and ecoinvent Databases [0.6] 我々は、専用のBitcoinマイニング機器のクレードル・トゥ・ゲートライフサイクルアセスメント(LCA)を実施し、そのアーキテクチャを考慮に入れた。
結果は、Bitcoinマイニングのためのアプリケーション固有の集積回路が、生産関連の影響の主な要因であることを示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:55:48 GMT)
Cyber-sensorium: An Extension of the Cyber Public Health Framework [0.6] 我々は、デジタルネットワークと人間の福祉に不可欠な生物学的神経システムとの類似性を引き出す。
このシステムに対するサイバー攻撃は深刻な世界的なリスクをもたらし、その保護の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:44:49 GMT)
Convolution and Attention-Free Mamba-based Cardiac Image Segmentation [0.5] 畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの自己アテンションモデルは、医療画像セグメンテーションの標準となっている。
我々は,CAF-MambaSegNetという,コンボリューションと自己注意型マンバベースセマンティックネットワークを提案する。
私たちのゴールは、最先端の結果を上回ることではなく、この革新的で、革命的で、自己意識のない方法が、どのようにしてさらなる研究を刺激するかを示すことです。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:53:05 GMT)
Investigation of the Impact of Economic and Social Factors on Energy Demand through Natural Language Processing [0.5] この研究はイギリスとアイルランドの5つの地域で実施された。
1日から30日の間、複数の地平線を考慮に入れている。
また、GDP、失業、インフレといった経済変数も考慮している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 16:25:14 GMT)
Cross Language Soccer Framework: An Open Source Framework for the RoboCup 2D Soccer Simulation [0.5] RoboCup Soccer Simulation 2D (SS2D) の研究は、Helios、Cyrus、Glidersといった既存のCppベースのコードの複雑さによって妨げられている。
本稿では,ハイパフォーマンスなHeliosベースコードとシームレスに統合する,g-based, language-agnostic frameworkの変換解を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:11:40 GMT)
Event prediction and causality inference despite incomplete information [0.4] 我々は,データポイントのシーケンス内で発生した事象を予測し,説明する上での課題について検討した。
特に、イベントの発生を引き起こす未知のトリガーが、非攻撃的で、マスク付き、ノイズの多いデータポイントから成り立つシナリオに注目しました。
分析、シミュレーション、機械学習のアプローチを組み合わせて、調査、定量化、ソリューションを提供しました。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:23:20 GMT)
A critical appraisal of water table depth estimation: Challenges and opportunities within machine learning [0.4] 大規模(大陸やグローバルなど)で表される水深の空間マップは、物理ベース(PB)モデルまたは機械学習ベース(ML)モデルを用いてシミュレートすることができる。
我々は,XGBoostアルゴリズムと2000万以上の実・代用的なWTD観測を用いて,WTDの3つの微細分解能(500m)MLシミュレーションを構築した。
我々のモデルは、北米のほとんどのエコリージョンでWTDの目に見えない実・代用的な観測をより正確に予測することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 06:44:06 GMT)
Binary Quantum Random Number Generator Based on Value Indefinite Observables [0.4] 測定値の不定観測値に基づく全ての量子乱数生成器は、コチェン・スペクター理論とロケートコチェン・スペクター理論が次元2で偽であるため、少なくとも3次元である。
量子乱数生成器を3次元の値の不確定観測値から構築し, 3次元の値と同じ品質の2値量子乱数出力を生成する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 12:53:32 GMT)
A Relevance Model for Threat-Centric Ranking of Cybersecurity Vulnerabilities [0.3] 脆弱性の追跡と更新の絶え間ないプロセスは、サイバーセキュリティの専門家にとって最大の関心事だ。
我々は、MITRE ATT&CKから派生した敵対的基準を用いた脅威の軽減に特化して、脆弱性管理のためのフレームワークを提供する。
我々の結果は、サイバー脅威のアクターが標的にし、悪用される可能性のある脆弱性の特定に向けた平均71.5%から91.3%の改善を示している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 23:29:12 GMT)
Large Language Models Memorize Sensor Datasets! Implications on Human Activity Recognition Research [0.2] 本研究では,Large Language Models (LLMs) が,訓練中にHAR(Human Activity Recognition)データセットにアクセス可能かどうかを検討する。
ほとんどの現代のLLMは、事実上(アクセス可能な)インターネット上でトレーニングされています。
特にダフネットデータセットでは、GPT-4はセンサー読み取りのブロックを再現することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:38:27 GMT)
GCtx-UNet: Efficient Network for Medical Image Segmentation [0.2] GCtx-UNetは軽量なセグメンテーションアーキテクチャで、最先端のアプローチよりも正確さでグローバルおよびローカルの画像特徴をキャプチャできる。
GCtx-UNetは、Synapseの多臓器腹部CTデータセット、ACDCの心臓MRIデータセット、およびいくつかのポリープセグメンテーションデータセットで評価される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:17:14 GMT)
Deep Learning to Predict Glaucoma Progression using Structural Changes in the Eye [0.2] 緑内障は視神経症を特徴とする慢性眼疾患であり、不可逆的な視力喪失を引き起こす。
早期発見は萎縮をモニターし、さらなる視力障害を防ぐ治療戦略を開発するために重要である。
本研究では,深層学習モデルを用いて,複雑な疾患の特徴と進行基準を同定する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 01:12:41 GMT)
An Analysis of Elo Rating Systems via Markov Chains [0.2] 本稿では,オンライン環境におけるプレイヤーのスキルランキングの一般的な方法であるEloレーティングシステムについて理論的解析を行う。
We study Elo under the Bradley-Terry--Luce model and using technique from Markov chain theory, show that Elo learns the model parameters at a rate with the state of the art。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:53:54 GMT)
Few-Shot Load Forecasting Under Data Scarcity in Smart Grids: A Meta-Learning Approach [0.2] 本稿では,短期負荷予測のためのモデルに依存しないメタ学習アルゴリズムを提案する。
提案手法は,任意の長さの未知の負荷時間列に迅速に適応し,一般化することができる。
提案手法は,実世界の消費者の歴史的負荷消費データのデータセットを用いて評価する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:59:08 GMT)
Are Large Language Models Actually Good at Text Style Transfer? [0.2] テキストスタイル転送(TST)を用いた大規模言語モデル(LLM)の性能解析を行う。
TSTは、中核的な内容を保持しながら、テキストの言語スタイルを変更することを含む。
我々は、ゼロショットと少数ショットのプロンプトと、公開されているデータセットに対するパラメータ効率の微調整を用いて、事前訓練されたLLMの能力を評価する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:45:41 GMT)
Optimizing Multi-Stuttered Speech Classification: Leveraging Whisper's Encoder for Efficient Parameter Reduction in Automated Assessment [0.2] 本研究は, 発声音声における不一致の同定における最後のエンコーダ層の役割を明らかにするものである。
これは、様々な方言や言語に適応できるモデルに、計算的に効率的なアプローチをもたらした。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:42:51 GMT)
What is my quantum computer good for? Quantum capability learning with physics-aware neural networks [0.0] 本稿では,学習能力モデルのための量子物理学的ニューラルネットワークアーキテクチャを提案する。
我々のアーキテクチャは、量子プログラムにおけるエラーの物理に対する効率的な近似とグラフニューラルネットワークの側面を組み合わせる。
このアプローチは、実験データとシミュレーションデータの両方における平均絶対誤差を最大$sim50%$還元する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:11:41 GMT)
Time Evolution of Relativistic Quantum Fields in Spatial Subregions [0.0] 相対論的場の量子論の状態の時間発展を空間的部分領域$Omega$に限定して研究する。
環境の影響を境界項でエンコードする方法を示す。
この方法で得られる境界条件は、空間と時間におけるエネルギー非保存と非局所である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:11:34 GMT)
The Arrow of Time is Alive and Well but Forbidden Under the Received View of Physics [0.0] アロー・オブ・タイム問題(Arrow of Time Problem)は、経験的に観察された時間の方向性は物理理論と矛盾していると主張している。
物理学と時間の矢印の間には、実際には必要な衝突はない、と私は主張する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:52:16 GMT)
TR2MTL: LLM based framework for Metric Temporal Logic Formalization of Traffic Rules [0.0] TR2MTLは、大規模言語モデル(LLM)を使用して、交通ルールを自動的にメートル法時間論理(MTL)に変換するフレームワークである。
AVルールの形式化のためのヒューマン・イン・ループ・システムとして構想されている。
時間論理や規則の様々な形式に拡張することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 09:55:04 GMT)
SynthAI: A Multi Agent Generative AI Framework for Automated Modular HLS Design Generation [0.0] 本稿では,HLS設計の自動化手法であるSynthAIを紹介する。
SynthAIはReActエージェント、Chain-of-Thought(CoT)プロンプト、Web検索技術、Retrieval-Augmented Generationフレームワークを統合している。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 23:01:24 GMT)
Source -Free Domain Adaptation for Speaker Verification in Data-Scarce Languages and Noisy Channels [0.0] ドメイン適応はしばしば、非常に小さなターゲットデータセットとアクセス不能なソースデータによって妨げられる。
本稿では,データスカース言語における話者検証のための限られたターゲット音声データセットへのソースフリー領域適応手法について検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:27:20 GMT)
Smiles2Dock: an open large-scale multi-task dataset for ML-based molecular docking [0.0] 分子ドッキングのための大規模マルチタスクデータセットであるSmiles2Dockを紹介する。
我々は、ChEMBLデータベースから15のAlphaFoldタンパク質に170万をドッキングし、2500万以上のタンパク質-リガンド結合スコアを与えました。
我々のデータセットとコードは、分子ドッキングのための新しいMLベースの手法の開発を支援するために公開されています。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:13:03 GMT)
Simulating Parton Fragmentation on Quantum Computers [0.0] 粒子フラグメンテーション関数(FF)は、高エネルギー衝突においてユビキタスに存在するハドロン生成の過程を理解するのに不可欠である。
本稿では、量子コンピューティング手法を用いてFFを評価するための第一歩となるフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:41:48 GMT)
Scalable Image Coding for Humans and Machines Using Feature Fusion Network [0.0] 本稿では,多数の画像認識モデルと互換性のある人や機械を対象とした,学習に基づくスケーラブルな画像符号化手法を提案する。
提案手法では,パラメータ数を削減しつつ,画像圧縮モデルを効率よく組み合わせることを確認する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 07:18:58 GMT)
SAM-PM: Enhancing Video Camouflaged Object Detection using Spatio-Temporal Attention [0.0] Segment Anything Model (SAM) は画像セグメンテーションにおける異常な性能で注目されている。
カモフラージュされた物体は一般的に背景に溶け込み、静止画では区別が難しい。
これらの課題を克服するために,SAMスパイダーモジュール (SAM-PM) と呼ばれる新しい手法を提案する。
本手法は,SAMのパラメータの1%未満の追加で,時間的一貫性とドメイン固有の専門知識をセグメンテーションネットワークに効果的に組み込む。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:33:38 GMT)
Procrastination Is All You Need: Exponent Indexed Accumulators for Floating Point, Posits and Logarithmic Numbers [0.0] 本稿では,浮動小数点数の長い列の和をシンプルかつ効果的に求める。
浮動小数点数のマニッサを指数で指数付けしたアキュムレータに付加する累積位相と、実際の総和結果が終了する再構成位相とからなる。
FPGAとASICの両方のアーキテクチャの詳細は、演算を乗算器で融合させ、効率的なMACを作成することを含む。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:44:17 GMT)
Probabilistic Approach to Black-Box Binary Optimization with Budget Constraints: Application to Sensor Placement [0.0] ブラックボックスの目的関数と予算制約による二項最適化問題に対する完全確率的アプローチを提案する。
本研究では、非零成分の総数で条件付けられた確率変数をモデル化する条件付きベルヌーイ分布を開発する。
このアプローチは一般に、非確率的ブラックボックス目的関数と予算制約を持つバイナリ最適化問題に適用できる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 15:37:28 GMT)
Phase-Subtractive Interference and Noise-Resistant Quantum Imaging with Two Undetected Photons [0.0] 本稿では、2つの独立した源によって生成される4光子量子状態を用いて2光子干渉パターンを生成する量子干渉現象について述べる。
共通認識とは対照的に、干渉パターンは、検出された光子によって得られる位相と完全に独立にすることができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:36:17 GMT)
On the singular position-dependent mass [0.0] 我々は、一般的なPDMに対処する適切なフレームワークは、BenDanielとDukeによって提案された対称性であると主張している。
回復力が原子に作用することを考えると、収束したフン関数は量子状態を記述する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 19:37:41 GMT)
OceanCastNet: A Deep Learning Ocean Wave Model with Energy Conservation [0.0] OceanCastNet (OCN) はエネルギーバランスの深いディープラーニングの予測モデルである。
OCNは、業界で広く使われているWaveWatch IIIモデルより一貫して優れている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 04:22:21 GMT)
Observation Denoising in CYRUS Soccer Simulation 2D Team For RoboCup 2024 [0.0] サッカーシミュレーション2Dでは、効果的な意思決定には正確な観察が不可欠である。
本稿では,予測モデリングと交叉解析を利用するデノゲーションアルゴリズムを提案する。
提案手法は,ノイズや部分的データの影響を緩和し,ゲームプレイ性能を向上させることを目的としている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 03:15:29 GMT)
Interpretable machine learning approach for electron antineutrino selection in a large liquid scintillator detector [0.0] 我々は,大規模な液体シンチレータ検出器のための強力な信号バックグラウンド識別器として,完全に接続されたニューラルネットワークを導入した。
JUNO検出器を例として、カットベースアプローチの効率が既に高いにもかかわらず、提示されたMLモデルにより、イベント選択効率がさらに向上できることを実証する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:17:08 GMT)
Information scrambling in quantum-walks [0.0] 離散時間量子ウォークにおける情報スクランブルについて検討する。
我々は,時間外順序付き相関器 (OTOC) とK-複雑度を情報スクランブルの探索として検討する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:38:50 GMT)
Heart Sound Segmentation Using Deep Learning Techniques [0.0] 本稿では,S1 (LUB) とS2 (DUB) に心音区分けと分類を行う新しい手法を提案する。
我々は、FFTに基づくフィルタリング、イベント検出のための動的プログラミング、ロバストな分類のためのSiameseネットワークを採用している。
本手法は,既存手法と比較して,PASCALの心臓音響データセットに優れた性能を示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 05:30:05 GMT)
Harnessing The Power of Attention For Patch-Based Biomedical Image Classification [0.0] 本稿では,従来のCNNの代替として,自己認識機構に基づく新しいアーキテクチャを提案する。
可変画像サイズを高解像度に適応させるLancoz5手法を提案する。
提案手法は、誘導バイアス、重み共有、受容場制限、効率的なデータハンドリングなど、注意に基づく視覚モデルが直面する重要な課題に対処する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:12:34 GMT)
Evidence of Scaling Regimes in the Hopfield Dynamics of Whole Brain Model [0.0] 実験的に導出された脳トポロジによって伝達されるホップフィールド再帰ニューラルネットワークは、スケーリング図を復元する。
スケーリング指数は、崩壊長の値に非常に敏感であり、また、使用される脳小包の数にも非常に敏感である。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 14:29:31 GMT)
Entanglement Entropy of Free Fermions with a Random Matrix as a One-Body Hamiltonian [0.0] 我々は、大きめの$N$の量子系とその小きめの$L$のサブシステムを考える。
この場合、絡み合いエントロピーは、短距離ホッピングを持つシステムで知られている体積法則に従うことが示される。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 13:10:29 GMT)
Electronic Wigner-Molecule Polymeric Chains in Elongated Silicon Quantum Dots and Finite-Length Quantum Wires [0.0] シリコン量子ビット間のワイヤ状準1次元(1D)長量子ドット(EQD)カプラに閉じ込められた電子のスペクトル特性について検討した。
自己整合性一般化されたポプル-ネスベット方程式の低エネルギー対称性の解は、シリコンで実験的に作られたものからモデル化された閉じこもりを示す。
破壊対称性の va-UHF 解は、後に量子力学的に要求されるパリティ復元によって強化され、 va-UHF の単一決定解を超え、絡み合ったウィグナー-分子鎖の形成を予測する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:54:49 GMT)
Data-Driven Upper Confidence Bounds with Near-Optimal Regret for Heavy-Tailed Bandits [0.0] 対称な報酬分布のための分布自由データ駆動型 UCB アルゴリズムを提案する。
パラメータフリーなRMM-UCB法では,重み付き分布であっても,ほぼ最適の残差を証明した。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:06:50 GMT)
Data-Driven Radio Environment Map Estimation Using Graph Neural Networks [0.0] グラフニューラルネットワークを用いて無線環境マップ(REM)を推定する手法を提案する。
提案アーキテクチャは、ネットワーク全体の空間的依存関係をキャプチャするグラフニューラルネットワークの利点を継承する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 00:17:33 GMT)
Conserving Human Creativity with Evolutionary Generative Algorithms: A Case Study in Music Generation [0.0] 本研究では,音楽制作における進化的生成アルゴリズムの適用について検討し,人間の創造性を保ち,向上させる。
人間のフィードバックを微分進化アルゴリズムに組み込むことで、国際レコードレーベルに提出された6曲を制作しました。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 18:11:05 GMT)
Comments on "Federated Learning with Differential Privacy: Algorithms and Performance Analysis" [0.0] NbAFL (Theorem 2) の収束上界は誤りである。
このコメントは NbAFL の収束上界の正しい形式を示すことを目的としている。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:03:56 GMT)
Building Artificial Intelligence with Creative Agency and Self-hood [0.0] 本論文は,最終ページで紹介された論文の学術的概要について紹介する。
自己触媒ネットワークの形式的枠組みは、自己組織化された自己維持構造の起源をモデル化する手段を提供する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 22:28:11 GMT)
A novel method for identifying rice seed purity based on hybrid machine learning algorithms [0.0] 穀物産業では、種子の品質を評価する上で重要な要素として、種子の純度の同定が重要である。
本研究では,ハイブリッド機械学習アルゴリズムを用いて,特定の品種のイネ種子の純度を自動的に同定する手法を提案する。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 17:13:25 GMT)
A modular entanglement-based quantum computer architecture [0.0] マルチパーティの絡み合いを利用したモジュラー量子計算アーキテクチャを提案する。
ベル対よりも異なる種類の多部絡み合いを用いることで、モジュール間のより効率的で柔軟な結合が可能になる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 11:07:57 GMT)
A Variational Approach to Learning Photonic Unitary Operators [0.0] 我々は、横方向空間自由度で変調された構造光の高次元特性を利用して、ユニタリ演算を学習する。
我々の研究は高次元情報処理を推進し、未知の状態とチャネルのプロセスおよび量子状態トモグラフィーに適応することができる。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 10:36:27 GMT)
A Low Rank Neural Representation of Entropy Solutions [0.0] 本研究では, 平滑な凸束関数を持つ非線形スカラー保存法則に対するエントロピー解の新しい表現を構築した。
衝撃トポロジーの複雑さにかかわらず, 一定の層数と少数の係数を持つ低階神経表現が任意のエントロピー解を近似できることを示す。
論文参考訳(メタデータ) (Sun, 9 Jun 2024 08:37:11 GMT)