Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research [139.7] ドルマ (Dolma) は、ウェブコンテンツ、科学論文、コード、パブリックドメインの書籍、ソーシャルメディア、百科事典の素材を多用した3トリルの英語コーパスである。
我々はDolmaの設計原則、その構築の詳細、内容の要約を含む、Dolmaを文書化します。
我々は、重要なデータキュレーションの実践について学んだことを共有するために、Dolmaの中間状態の分析と実験結果を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:46:40 GMT)
DeepStack: Deeply Stacking Visual Tokens is Surprisingly Simple and Effective for LMMs [137.9] ほとんどの大きなマルチモーダルモデル(LMM)は、大きな言語モデル(LLM)の第1層にシーケンスとして視覚トークンを供給することによって実装される。
本稿では,LMMのための新しいアーキテクチャであるDeepStackについて述べる。LMMの言語層とビジョントランスフォーマーの$N$レイヤを考慮すると,視覚トークンを$N$グループに積み上げ,各グループを下位から上位までの整列トランスフォーマー層に供給する。
驚くべきことに、この単純な手法は、レイヤ間の視覚トークン間の相互作用をモデル化するLMMのパワーを、最小限のコストで大幅に向上させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:34 GMT)
TextEE: Benchmark, Reevaluation, Reflections, and Future Challenges in Event Extraction [131.8] イベント抽出のための標準化され、公正で再現可能なベンチマークであるTextEEを提示する。
TextEEは、標準化されたデータ前処理スクリプトと、8つの異なるドメインにまたがる16のデータセットの分割を含む。
TextEEベンチマークで5つの大きな言語モデルを評価し、満足なパフォーマンスを達成するのにどのように苦労しているかを実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:24:16 GMT)
Language-Specific Neurons: The Key to Multilingual Capabilities in Large Language Models [117.2] 大規模言語モデル(LLM)は、特別にキュレートされた多言語並列コーパスで事前訓練されることなく、顕著な多言語機能を示す。
LLM内の言語特異的ニューロンを識別するための新しい検出手法である言語アクティベーション確率エントロピー(LAPE)を提案する。
以上の結果から,LLMが特定の言語を処理できる能力は,神経細胞のサブセットが少なすぎるためであることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:14:46 GMT)
AgentGym: Evolving Large Language Model-based Agents across Diverse Environments [117.0] 大規模言語モデル(LLM)はそのようなエージェントを構築するための有望な基盤と考えられている。
我々は、自己進化能力を備えた一般機能 LLM ベースのエージェントを構築するための第一歩を踏み出す。
我々はAgentGymを提案する。AgentGymは、幅広い、リアルタイム、ユニフォーマット、並行エージェント探索のための様々な環境とタスクを特徴とする新しいフレームワークである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:15:41 GMT)
Fact-Checking the Output of Large Language Models via Token-Level Uncertainty Quantification [116.8] 大型言語モデル(LLM)は幻覚、すなわちその出力に誤った主張を生じさせることで有名である。
本稿では,トークンレベルの不確実性定量化に基づくファクトチェックと幻覚検出パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:32:39 GMT)
NATURAL PLAN: Benchmarking LLMs on Natural Language Planning [109.7] 本稿では,3つのタスク – トリップ計画,ミーティング計画,カレンダースケジューリング – を含む,自然言語の現実的な計画ベンチマークであるNATURAL PLANを紹介する。
我々は、Google Flights、Google Maps、Google Calendarなどのツールからの出力を、モデルに対するコンテキストとして提供することによって、タスクに関する完全な情報を備えたLCMの計画能力に焦点をあてる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:27:35 GMT)
Matching Anything by Segmenting Anything [109.3] 我々は、堅牢なインスタンスアソシエーション学習のための新しい手法であるMASAを提案する。
MASAは、徹底的なデータ変換を通じてインスタンスレベルの対応を学習する。
完全アノテートされたドメイン内ビデオシーケンスでトレーニングした最先端の手法よりも,MASAの方が優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:20:07 GMT)
Adam: Dense Retrieval Distillation with Adaptive Dark Examples [104.0] 本稿では,教師が持つ暗黒知識を適応暗黒エクストリームで伝達する知識蒸留フレームワークであるADAMを提案する。
2つの広く利用されているベンチマークで実験を行い、本手法の有効性を検証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:20:27 GMT)
BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences [96.7] 本稿では,BurstAttention'という分散アテンションフレームワークを提案し,メモリアクセスと通信操作を最適化する。
異なる長さ設定下での実験結果は、BurstAttentionが長いシーケンスを処理する上で大きな利点があることを示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:43:52 GMT)
Enhancing Temporal Consistency in Video Editing by Reconstructing Videos with 3D Gaussian Splatting [94.8] Video-3DGSは、ゼロショットビデオエディタの時間的一貫性を高めるために設計された3Dガウススプラッティング(3DGS)ベースのビデオ精細機である。
本手法は動的モノクロビデオの編集に適した2段階の3次元ガウス最適化プロセスを利用する。
58の動的モノクロビデオ間の時間的一貫性を確保することで、ビデオ編集を強化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:40:56 GMT)
VisualWebArena: Evaluating Multimodal Agents on Realistic Visual Web Tasks [93.9] VisualWebArenaは、マルチモーダルWebエージェントのパフォーマンスを現実的なタスクで評価するために設計されたベンチマークである。
このベンチマークを実行するには、イメージテキスト入力を正確に処理し、自然言語命令を解釈し、ユーザが定義した目的を達成するためにウェブサイト上でアクションを実行する必要がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:01:09 GMT)
Outdated Issue Aware Decoding for Factual Knowledge Editing [93.5] 本稿では,従来のISsueを意識した復号化手法を提案する。
元のモデルと編集されたモデルとの確率分布の差を捉える。
我々は、古くなった問題を緩和するために、編集されたモデルにおけるトークン予測の違いを増幅する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:41:00 GMT)
ShareGPT4Video: Improving Video Understanding and Generation with Better Captions [93.3] 本稿では,大容量ビデオ言語モデル(LVLM)の映像理解と,高密度かつ高精度なキャプションによるテキスト・ツー・ビデオモデル(T2VM)のビデオ生成を目的としたShareGPT4Videoシリーズを紹介する。
ShareGPT4Video, 40K GPT4V Annotated dense Casts of video with various lengths and sources, developed through carefully designed data filtering and annotating strategy。
さらに,任意の動画に対して高品質なキャプションを効率よく生成できる優れたキャプションキャプタであるShareCaptioner-Videoを開発した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:54 GMT)
Estimating Barycenters of Distributions with Neural Optimal Transport [93.3] 本稿では,Wasserstein Barycenter問題を解くための新しいスケーラブルなアプローチを提案する。
我々の手法は最近のNeural OTソルバをベースとしている。
また,提案手法の理論的誤差境界も確立する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:07:02 GMT)
What Do Language Models Learn in Context? The Structured Task Hypothesis [89.7] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)と呼ばれるデモで提示されたインコンテキストの例から新しいタスクを学習する
一般的な仮説の一つは、タスク選択によるICLの説明である。
もう一つの一般的な仮説は、ICLはメタ学習の一形態である、すなわち、モデルが事前学習時に学習アルゴリズムを学習し、それを実演に適用する、というものである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:15:34 GMT)
Robust Distortion-free Watermarks for Language Models [85.6] 本稿では,自動回帰言語モデルからテキストに透かしを植え付ける手法を提案する。
言語モデルから乱数列をサンプルにマッピングすることで、透かし付きテキストを生成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:53:25 GMT)
LCS: A Language Converter Strategy for Zero-Shot Neural Machine Translation [84.4] 我々は,Language Converter Strategy (LCS) という,シンプルだが効果的な戦略を提案する。
ターゲット言語をトップエンコーダ層に埋め込むことで、LCSはエンコーダの混乱を緩和し、デコーダの安定した言語表示を保証する。
MultiUN、TED、OPUS-100データセットの実験結果は、LCSがターゲット外の問題を著しく軽減できることを示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:22:38 GMT)
Gradient Clipping Improves AdaGrad when the Noise Is Heavy-Tailed [83.8] AdaGradやAdamのような適応的なステップを持つメソッドは、現代のディープラーニングモデルのトレーニングに不可欠です。
AdaGradはノイズが狭い場合, 高い確率収束性を有することを示す。
我々は、Clip-RAD RedaGrad with Delayと呼ばれるAdaGradの新バージョンを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:49:10 GMT)
$Se^2$: Sequential Example Selection for In-Context Learning [83.2] インコンテキスト学習(ICL)のための大規模言語モデル(LLM)は、実演例によって起動する必要がある。
以前の研究は、主に"select then organize"パラダイムに従って、ICLの例の選択を幅広く検討してきた。
本稿では,この問題を$Se$quential $Se$lection問題として定式化し,シーケンシャル・アウェア法である$Se2$を導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:12:57 GMT)
AutoJailbreak: Exploring Jailbreak Attacks and Defenses through a Dependency Lens [83.1] 本稿では,ジェイルブレイク攻撃と防衛技術における依存関係の体系的解析について述べる。
包括的な、自動化された、論理的な3つのフレームワークを提案します。
このアンサンブル・ジェイルブレイク・アタックと防衛の枠組みは,既存の研究を著しく上回る結果となった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:24:41 GMT)
On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [83.0] 我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。
我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:44:17 GMT)
Competition of Mechanisms: Tracing How Language Models Handle Facts and Counterfactuals [82.7] 解釈可能性研究は、経験的成功と大規模言語モデル(LLM)の科学的理解のギャップを埋めることを目的としている。
本稿では,個々のメカニズムではなく,複数のメカニズムの相互作用に着目した,メカニズムの競合の定式化を提案する。
本研究は, 種々のモデル成分間の機構とその競合の痕跡を示し, 特定の機構の強度を効果的に制御する注意位置を明らかにした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:45:21 GMT)
Automating Dataset Updates Towards Reliable and Timely Evaluation of Large Language Models [81.3] 大規模言語モデル(LLM)は、さまざまな自然言語ベンチマークで素晴らしいパフォーマンスを実現している。
本稿では、データセットの自動更新と、その有効性に関する体系的な分析を提案する。
1) 類似したサンプルを生成するための戦略を模倣すること,2) 既存のサンプルをさらに拡張する戦略を拡張すること,である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:49:44 GMT)
DebugBench: Evaluating Debugging Capability of Large Language Models [80.7] DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:10:00 GMT)
Flash3D: Feed-Forward Generalisable 3D Scene Reconstruction from a Single Image [80.5] Flash3Dは、1つの画像からシーン再構成と新しいビュー合成を行う方法である。
一般性については、単分子深度推定のための「基礎」モデルから始める。
効率性のために、我々はこの拡張をフィードフォワードガウススプラッティングに基づける。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:56 GMT)
See More Details: Efficient Image Super-Resolution by Experts Mining [79.4] 本稿では,エキスパートマイニングを用いた効率的なSRモデルであるSeemoReを紹介する。
当社のアプローチは、さまざまなレベルの専門家を戦略的に取り入れ、協調的な方法論を採用しています。
正確なSRに欠かせない重要な要素を専門に扱うことで、我々のモデルは複雑な機能内詳細を明らかにすることに長けています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:30:40 GMT)
Feedback Loops With Language Models Drive In-Context Reward Hacking [79.0] フィードバックループがコンテキスト内報酬ハッキング(ICRH)を引き起こす可能性があることを示す。
ICRHに繋がる2つのプロセス、すなわちアウトプット・リファインメントとポリシー・リファインメントを同定し研究する。
AI開発が加速するにつれて、フィードバックループの効果が増大する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:39:09 GMT)
Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.6] 音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。
音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:37:32 GMT)
What Languages are Easy to Language-Model? A Perspective from Learning Probabilistic Regular Languages [78.2] 大規模言語モデル (LM) は文字列上の分布である。
RNNとTransformer LMによる規則的LM(RLM)の学習性について検討する。
RNNとトランスフォーマーの双方において,RLMランクの複雑さは強く,学習可能性の有意な予測因子であることが判明した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:34:24 GMT)
Auto Arena of LLMs: Automating LLM Evaluations with Agent Peer-battles and Committee Discussions [77.8] LLM エージェントによる評価プロセス全体を自動化した LLM の自動アリーナを提案する。
最新のLLM17実験において,オートアリーナは人間の嗜好と最も高い相関関係を示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:36:09 GMT)
Variational Learning is Effective for Large Deep Networks [76.9] 改良された変分オンラインニュートンは、大規模ネットワークのトレーニングにおいて、Adamと一貫して一致し、より優れていることを示す。
IVONの計算コストはAdamとほぼ同じであるが、予測の不確実性の方が優れている。
変分学習が効果的であるという圧倒的な証拠を見出す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:31:43 GMT)
Everything to the Synthetic: Diffusion-driven Test-time Adaptation via Synthetic-Domain Alignment [76.4] テスト時間適応(TTA)は、未知のシフト対象ドメインでテストする場合、ソースドメイン事前訓練モデルの性能を向上させることを目的としている。
従来のTTA手法は、主にターゲットデータストリームに基づいてモデルの重みを適応し、ターゲットデータの量と順序に敏感なモデル性能を実現する。
最近の拡散駆動型TTA法は非条件拡散モデルを用いて強い性能を示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:39:09 GMT)
JIGMARK: A Black-Box Approach for Enhancing Image Watermarks against Diffusion Model Edits [76.3] JIGMARKは、コントラスト学習による堅牢性を高める、第一級の透かし技術である。
本評価の結果,JIGMARKは既存の透かし法をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:31:41 GMT)
Open-Domain Text Evaluation via Contrastive Distribution Methods [75.6] 本稿では,Contrastive Distribution Methodsと呼ばれるオープンドメインテキスト生成手法を提案する。
マルチターン対話におけるコヒーレンス評価と制御可能な生成におけるコヒーレンス評価の実験により,CDMの優位性は人間の判断と相関していることが示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:24:17 GMT)
Interpreting the Second-Order Effects of Neurons in CLIP [73.5] CLIPの個々のニューロンの機能をテキストで自動的に記述することで解釈する。
ニューロンから後続のアテンションヘッドに流れる影響を、直接出力に解析する「第2次レンズ」を提案する。
以上の結果から,ニューロンのスケーラブルな理解は,モデル騙しや新しいモデル機能の導入に有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:52 GMT)
Aligning Large Language Models with Self-generated Preference Data [73.0] 大規模言語モデル(LLM)と人間の嗜好との整合性を高める新しいフレームワークを提案する。
私たちのキーとなるアイデアは、小さな(種)データの中で人間の事前知識を活用することです。
本稿では,ノイズ認識型選好学習アルゴリズムを導入し,生成した選好データにおける品質低下のリスクを軽減する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:01:02 GMT)
Explainability and Hate Speech: Structured Explanations Make Social Media Moderators Faster [72.8] 実世界のモデレーターの速度に及ぼす説明の影響について検討する。
我々の実験では、一般的な説明は速度に影響せず、しばしば無視されるが、構造化された説明はモデレーターの意思決定時間を7.4%減少させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:23:10 GMT)
Reasons to Reject? Aligning Language Models with Judgments [72.4] 言語フィードバックを用いた大規模言語モデル(LLM)の整合性について検討する。
本稿では,不適切なコンテンツ検出と判断に基づく修正が可能なコントラスト型異種訓練(Contrastive Unlikelihood Training, CUT)を提案する。
以上の結果から,CUTは175BのDaVinci003を破り,AlpacaEvalの50.84ポイントを達成できた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:16:54 GMT)
SAPT: A Shared Attention Framework for Parameter-Efficient Continual Learning of Large Language Models [71.8] 大規模言語モデル(LLM)を動的世界に展開するには,継続的な学習(CL)能力が不可欠である。
既存の方法は、パラメータ効率チューニング(PET)ブロックを用いてタスク固有の知識を取得するための学習モジュールと、テスト入力に対して対応するものを選択するための選択モジュールを考案する。
本稿では,共有注意学習と選択モジュールを通じてPET学習と選択を調整するための新しい共有注意フレームワーク(SAPT)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:02:51 GMT)
Gear-NeRF: Free-Viewpoint Rendering and Tracking with Motion-aware Spatio-Temporal Sampling [70.3] 本研究では,シーンをレンダリングする動的領域の階層化モデリングを可能にする意味的セマンティックギアに基づく,時間的(4D)埋め込みの学習方法を提案する。
同時に、ほぼ無償で、当社のトラッキングアプローチは、既存のNeRFベースのメソッドでまだ達成されていない機能である、自由視点(free-view of interest)を可能にします。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:37:39 GMT)
Culturally Aware and Adapted NLP: A Taxonomy and a Survey of the State of the Art [70.1] 文化的に認識され、適応された自然言語処理への関心の高まりは、近年の研究にインスピレーションを与えている。
文化」概念の共通理解の欠如は、この新興地域の進歩を評価するのを困難にしている。
本稿では,研究の進展を分析し,理解するための体系的な枠組みを提供する,文化の要素の広範な分類法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:16:43 GMT)
Two Optimizers Are Better Than One: LLM Catalyst Empowers Gradient-Based Optimization for Prompt Tuning [70.0] 我々は,勾配に基づく最適化と大規模言語モデル(MsLL)が相互補完的であることを示し,協調的な最適化手法を提案する。
私たちのコードはhttps://www.guozix.com/guozix/LLM-catalystでリリースされています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:59:27 GMT)
Small Language Models Need Strong Verifiers to Self-Correct Reasoning [69.9] 大規模言語モデル(LLM)の推論性能を高めるための有望なソリューションとして自己補正が登場した。
この研究は、小さい(=13B)言語モデル(LM)が、より強いLMから最小の入力で推論タスクを自己補正できるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:59:24 GMT)
Measuring and Addressing Indexical Bias in Information Retrieval [69.8] PAIRフレームワークは、ランキングドキュメンテーションやIRシステム全体の自動バイアス監査をサポートする。
DUOを導入した後、我々は32kの合成と4.7kの天然文書からなる新しいコーパスで8つのIRシステムの広範な評価を行った。
人間の行動学的研究は、私たちのアプローチを検証し、私たちのバイアスメトリクスが、いつ、どのように指標バイアスが読者の意見を変えるかを予測するのに役立ちます。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:42:37 GMT)
Tell, Don't Show!: Language Guidance Eases Transfer Across Domains in Images and Videos [69.3] ラベル付きソースから未ラベルのターゲットデータへの識別的知識の堅牢な転送をドメインギャップでガイドするフレームワークであるLaGTranを紹介する。
意味的にリッチなテキストモダリティがより好ましい転送特性を持つという我々の観察に触発された我々は、ソース学習されたテキスト分類器を用いて、ターゲットテキスト記述の予測を生成するための転送機構を考案した。
言語指導による私たちのアプローチは驚くほど簡単でシンプルですが、GeoNetやDomainNetといった挑戦的なデータセットに対する以前のアプローチよりもはるかに優れています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:44:48 GMT)
DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.9] 提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:12:04 GMT)
VidMuse: A Simple Video-to-Music Generation Framework with Long-Short-Term Modeling [68.7] ビデオ入力に対応する音楽を生成するためのフレームワークであるVidMuseを提案する。
VidMuseは、ビデオと音響的、意味的に一致した高忠実な音楽を生成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:11 GMT)
Discrete Diffusion Modeling by Estimating the Ratios of the Data Distribution [67.9] 離散空間に対するスコアマッチングを自然に拡張する新たな損失として,スコアエントロピーを提案する。
標準言語モデリングタスク上で,Score Entropy Discrete Diffusionモデルをテストする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:06:44 GMT)
Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1] 大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:29:23 GMT)
GLACE: Global Local Accelerated Coordinate Encoding [66.9] シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:50 GMT)
Buffer of Thoughts: Thought-Augmented Reasoning with Large Language Models [65.5] Buffer of Thoughts (BoT) は、斬新で多目的な思考補足的推論手法である。
そこで我々はメタバッファーを提案し,一連の情報的高レベルの思考を記憶する。
各問題に対して、関連する思考タイミングを検索し、特定の推論構造で適応的にインスタンス化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:22:08 GMT)
WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models [65.2] 既存のWebエージェントは1つの入力モダリティしか処理せず、単純化されたWebシミュレータや静的なWebスナップショットでのみ評価される。
我々は,WebVoyagerを紹介した。LMM(Large Multimodal Model)を利用したWebエージェントで,現実世界のWebサイトと対話することで,エンド・ツー・エンドでのユーザ指示を完了することができる。
GPT-4(All Tools)とWebVoyager(text-only)の両方のパフォーマンスを大幅に上回る、59.1%のタスク成功率を実現していることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:37:34 GMT)
Emulated Disalignment: Safety Alignment for Large Language Models May Backfire! [65.1] 大きな言語モデル(LLM)は、人間との安全な会話を確保するために安全アライメントを行う。
本稿では,安全アライメントの反転が可能なトレーニングフリーアタック手法を提案する。
本手法をエミュレートした脱アライメント (ED) と呼ぶのは, このコントラスト分布からのサンプリングは, 安全報酬を最小限に抑えるため, 微調整の結果を確実にエミュレートするからである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:54:48 GMT)
Lost in the Source Language: How Large Language Models Evaluate the Quality of Machine Translation [64.6] 本研究では,機械翻訳評価タスクにおいて,Large Language Models (LLM) がソースデータと参照データをどのように活用するかを検討する。
参照情報が評価精度を大幅に向上させるのに対して,意外なことに,ソース情報は時として非生産的である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:51:16 GMT)
Cluster-Aware Similarity Diffusion for Instance Retrieval [64.4] 拡散に基づく再ランク付け(diffusion-based re-level)は、隣り合うグラフで類似性の伝播を実行することで、インスタンスを検索する一般的な方法である。
本稿では,新しいクラスタ・アウェア類似性(CAS)拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:15:44 GMT)
Zero-Painter: Training-Free Layout Control for Text-to-Image Synthesis [63.8] レイアウト条件のテキスト-画像合成のためのZero-Painterを提案する。
本手法では,オブジェクトマスクと個々の記述とグローバルテキストプロンプトを組み合わせることで,忠実度の高い画像を生成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:02:00 GMT)
Attractor Memory for Long-Term Time Series Forecasting: A Chaos Perspective [63.6] textbftextitAttraosはカオス理論を長期時系列予測に取り入れている。
本研究では,AttraosがPatchTSTと比較して,パラメータの12分の1しか持たない主流データセットやカオスデータセットにおいて,LTSF法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:21:29 GMT)
3rd Place Solution for MOSE Track in CVPR 2024 PVUW workshop: Complex Video Object Segmentation [63.2] ビデオオブジェクト(VOS)はコンピュータビジョンにおいて重要なタスクであり、ビデオフレーム間の背景から前景オブジェクトを区別することに焦点を当てている。
我々の研究はCutieモデルからインスピレーションを得ており、オブジェクトメモリ、メモリフレームの総数、および入力解像度がセグメンテーション性能に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:56:25 GMT)
Verbalized Machine Learning: Revisiting Machine Learning with Language Models [63.1] 言語化機械学習(VML)の枠組みを紹介する。
VMLはパラメータ空間を人間の解釈可能な自然言語に制限する。
VMLの有効性を実証的に評価するために,いくつかの研究を行っている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:56 GMT)
Ameliorate Spurious Correlations in Dataset Condensation [62.8] 元のデータセット内のバイアスがデータセット凝縮の性能に与える影響について検討する。
カーネル密度推定を用いたサンプル再重み付け方式に基づく,単純かつ高効率な手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:52:28 GMT)
Unintended Impacts of LLM Alignment on Global Representation [62.7] 開発者は、RLHF(Reinforcement Learning From Human Feedback)やDPO(Direct Preference Optimization)など、様々な手順で、大規模言語モデル(LLM)をユーザの好みに合わせることができる。
我々は、アライメントが、グローバルな表現の3つの軸、すなわち、英語方言、多言語主義、世界各国の意見にどのように影響するかを探求する。
これらの意図しない影響に繋がる設計決定と、より公平な選好チューニングの推奨を議論することで、私たちは結論付けました。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:31:48 GMT)
Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2] 予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:37:39 GMT)
OlympiadBench: A Challenging Benchmark for Promoting AGI with Olympiad-Level Bilingual Multimodal Scientific Problems [62.1] 我々はOlympiadレベルのバイリンガル・マルチモーダル・サイエンス・ベンチマークであるOlympiadBenchを紹介し、Olympiadレベルの数学と物理学のコンペティションの8,476の問題を特徴とする。
最も優れたモデルであるGPT-4Vはオリンピアドベンチで平均17.97%を獲得し、物理学ではわずか10.74%である。
GPT-4Vの分析では、幻覚、知識欠失、論理的誤信などの問題が指摘されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:19:44 GMT)
How Private are DP-SGD Implementations? [61.2] 2種類のバッチサンプリングを使用する場合、プライバシ分析の間に大きなギャップがあることが示される。
その結果,2種類のバッチサンプリングでは,プライバシ分析の間に大きなギャップがあることが判明した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:35:51 GMT)
Jailbreak Vision Language Models via Bi-Modal Adversarial Prompt [60.5] 本稿では,テキストと視覚のプロンプトを協調的に最適化することにより,ジェイルブレイクを実行するバイモーダル・アドバイサル・プロンプト・アタック(BAP)を提案する。
特に,大規模言語モデルを用いてジェイルブレイクの失敗を分析し,テキストのプロンプトを洗練させるために連鎖推論を採用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:00:42 GMT)
MVTN: Learning Multi-View Transformations for 3D Understanding [60.2] 本稿では,3次元形状認識のための最適視点を決定するために,可変レンダリングを用いたマルチビュー変換ネットワーク(MVTN)を提案する。
MVTNは3次元形状認識のためのマルチビューネットワークでエンドツーエンドに訓練することができる。
提案手法は,複数のベンチマークによる3次元分類と形状検索における最先端性能を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:12:31 GMT)
Principles of Designing Robust Remote Face Anti-Spoofing Systems [60.1] 本稿では,デジタル攻撃に対する最先端の対面防止手法の脆弱性に光を当てる。
反偽造システムに遭遇する一般的な脅威を包括的に分類する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:05:35 GMT)
Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving [59.7] 本稿では,E2E-ADシステムのマルチ能力をクローズドループで評価するための最初のベンチマークであるBench2Driveを紹介する。
我々は最先端のE2E-ADモデルを実装し、Bench2Driveで評価し、現状と今後の方向性について洞察を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:12:30 GMT)
AdaLomo: Low-memory Optimization with Adaptive Learning Rate [59.6] 大規模言語モデルに対する適応学習率(AdaLomo)を用いた低メモリ最適化を提案する。
AdaLomoはAdamWと同等の結果を得ると同時に、メモリ要件を大幅に削減し、大きな言語モデルをトレーニングするためのハードウェア障壁を低くする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:22:25 GMT)
Feature Distribution on Graph Topology Mediates the Effect of Graph Convolution: Homophily Perspective [59.6] A-X依存はグラフ畳み込みの効果を媒介し、より小さい依存はGNNベースのノード分類を改善する。
本研究では,A-X依存の原理的尺度を提案し,(ii)A-X依存を制御するランダムグラフモデルを設計し,(iii)A-X依存がグラフの畳み込みとどのように関係するかに関する理論を確立し,(iv)実世界のグラフに経験的解析を提示する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:19:49 GMT)
Privacy Preserving Semi-Decentralized Mean Estimation over Intermittently-Connected Networks [59.4] 信頼できない無線ネットワークの異なるノードに分散するベクトルの平均をプライベートに推定する問題を考える。
半分散的なセットアップでは、ノードは隣人と協力してローカルコンセンサスを計算し、中央サーバにリレーする。
ノード間のデータ共有による協調中継とプライバシー漏洩のトレードオフについて検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:12:15 GMT)
Direct Preference Optimization with an Offset [58.8] 直接選好最適化(DPO)は、大きな言語モデルと人間の選好を整合させる成功戦略である。
本稿では,DPOをオフセット(ODPO)で一般化し,微調整時にすべての選好ペアを等しく扱わないDPOを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:02:37 GMT)
Point Cloud Matters: Rethinking the Impact of Different Observation Spaces on Robot Learning [58.7] ロボット学習においては、異なるモードの異なる特徴のために観察空間が不可欠である。
本研究では,RGB, RGB-D, 点雲の3つのモードに着目し, 様々な観測空間がロボット学習に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:32:40 GMT)
WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.6] 本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。
透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:17:43 GMT)
LLplace: The 3D Indoor Scene Layout Generation and Editing via Large Language Model [58.2] LLplace は軽量な微調整のオープンソース LLM Llama3 に基づく新しい3D屋内シーンレイアウトデザイナである。
LLplaceは、空間的関係の先行とコンテキスト内例の必要性を回避し、効率的で信頼性の高い部屋レイアウト生成を可能にする。
提案手法は,高品質な3D設計ソリューションを実現する上で,LLplaceがインタラクティブに3D屋内レイアウトを効果的に生成・編集できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:53:01 GMT)
Causal Estimation of Memorisation Profiles [58.2] 言語モデルにおける記憶の理解は、実践的および社会的意味を持つ。
覚書化(英: Memorisation)とは、モデルがそのインスタンスを予測できる能力に対して、あるインスタンスでトレーニングを行うことによる因果的影響である。
本稿では,計量学の差分差分設計に基づく,新しい,原理的,効率的な記憶推定法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:09 GMT)
Neural Pfaffians: Solving Many Many-Electron Schrödinger Equations [58.1] 神経波関数は、計算コストが高いにもかかわらず、多電子系の基底状態の近似において前例のない精度を達成した。
近年の研究では、個々の問題を個別に解くのではなく、様々な構造や化合物にまたがる一般化波動関数を学習することでコストを下げることが提案されている。
この研究は、分子間の一般化に適した過度にパラメータ化され、完全に学習可能なニューラルウェーブ関数を定義することで、この問題に取り組む。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:54:29 GMT)
Word Embeddings Are Steers for Language Models [57.8] このようなステアをLM-Steersと呼び、すべてのサイズのLMに存在するものを見つけます。
言語モデルのデトックス化や感情制御といったタスクでは、LM-Steersは同等または優れたパフォーマンスを達成することができる。
LM-Steerは明示的な形式計算により異なる言語モデル間で転送可能である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:07:27 GMT)
PaCE: Parsimonious Concept Engineering for Large Language Models [57.7] 本稿では、アライメントのための新しいアクティベーションエンジニアリングフレームワークとしてParsimonious Concept Engineering (PaCE)を提案する。
まず、これらの概念を十分にモデル化するために、各原子が意味論的概念に対応するような活性化空間に大規模な概念辞書を構築する。
推論時に,概念辞書に沿ったLCMアクティベーションをスパース符号化により分解し,そのアクティベーションを良性成分と望ましくない成分の線形結合として正確に表現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:10 GMT)
VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.4] LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。
既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。
対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:53:37 GMT)
Backdoor Attack with Sparse and Invisible Trigger [57.4] ディープニューラルネットワーク(DNN)は、バックドア攻撃に対して脆弱である。
バックドアアタックは、訓練段階の脅威を脅かしている。
軽度で目に見えないバックドアアタック(SIBA)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:44:11 GMT)
SF-V: Single Forward Video Generation Model [57.3] そこで本稿では,単段階ビデオ生成モデルを得るための新しい手法を提案する。
実験により,提案手法は計算オーバーヘッドを大幅に低減した合成ビデオの競合生成品質を実現することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:27 GMT)
A Universal Class of Sharpness-Aware Minimization Algorithms [57.3] 我々は、新しいシャープネス尺度を導入し、新しいシャープネス対応目標関数を導出する。
これらの測度がテキスト的に表現可能であることを証明し、トレーニング損失ヘッセン行列の任意の関数を適切なハイパーおよび行列式で表すことを可能にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:52:09 GMT)
Multi-modal Stance Detection: New Datasets and Model [57.0] テキストと画像からなるツイートに対するマルチモーダル姿勢検出について検討する。
我々は、シンプルで効果的なマルチモーダル・プロンプト・チューニング・フレームワーク(TMPT)を提案する。
TMPTはマルチモーダル姿勢検出における最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:17:58 GMT)
Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.8] Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。
CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:08:24 GMT)
PRISE: LLM-Style Sequence Compression for Learning Temporal Action Abstractions in Control [55.8] 時間的行動抽象化は、信念状態表現とともに、シーケンシャルな意思決定のための強力な知識共有メカニズムである。
本稿では,時間的動作の抽象化をシーケンス圧縮問題として扱う新しい視点を提案する。
本稿では,連続的なアクション量子化とバイトペア符号化を組み合わせて,強力なアクション抽象化を学習するアプローチを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:47:52 GMT)
Full Parameter Fine-tuning for Large Language Models with Limited Resources [55.8] 大規模言語モデル(LLM)は自然言語処理(NLP)に革命をもたらしたが、トレーニングには大量のGPUリソースを必要としている。
我々は,メモリ使用量を削減するために,勾配とパラメータの更新を1ステップで融合する新しい計算,LOMO(LOw-Memory Optimization)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:22:26 GMT)
A Measure-Theoretic Axiomatisation of Causality [55.7] 我々は、コルモゴロフの確率の測度理論的公理化を因果関係の公理化への出発点とすることを好んで論じる。
提案するフレームワークは測度理論に厳格に根ざしているが,既存のフレームワークの長期的制限にも光を当てている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:06:33 GMT)
Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data [55.5] 本研究では, 吸収拡散の具体的なスコアをクリーンデータの条件付き確率として表すことができることを示す。
時間に依存しない条件付き確率を特徴付ける専用拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:22:11 GMT)
Exploring and steering the moral compass of Large Language Models [55.2] 大規模言語モデル(LLM)は、様々な分野における自動化と意思決定の推進の中心となっている。
本研究は,その道徳的特徴を評価するために,最も先進的なLCMの総合的比較分析を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:53:23 GMT)
NAP^2: A Benchmark for Naturalness and Privacy-Preserving Text Rewriting by Learning from Human [55.2] 我々は,人間によって使用される2つの共通戦略を用いて,機密テキストの衛生化を提案する。
我々は,クラウドソーシングと大規模言語モデルの利用を通じて,NAP2という最初のコーパスをキュレートする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:07:44 GMT)
DiNADO: Norm-Disentangled Neurally-Decomposed Oracles for Controlling Language Models [55.1] NeurAlly-Decomposed Oracle (NADO)は、大きな言語モデルで制御可能な生成のための強力なアプローチである。
バニラNADOは低確率制御信号の減衰勾配に悩まされる。
本稿では,NADOアルゴリズムの性能向上を図るために,NADOアルゴリズムの改良版であるDiNADOを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:01:09 GMT)
Provably Neural Active Learning Succeeds via Prioritizing Perplexing Samples [54.0] ニューラルネットワークベースのアクティブラーニング(NAL)は、ニューラルネットワークを使用してサンプルの小さなサブセットを選択してトレーニングする、費用対効果の高いデータ選択技術である。
我々は、機能学習の観点から、両方のクエリ基準ベースのNALの成功について、統一的な説明を提供することにより、一歩前進させようとする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:38:01 GMT)
Follow-Your-Emoji: Fine-Controllable and Expressive Freestyle Portrait Animation [53.8] Follow-Your-Emojiは、ポートレートアニメーションのための拡散ベースのフレームワークである。
参照ポートレートとターゲットランドマークシーケンスを識別する。
本手法は,フリースタイルの肖像画の表現を制御できることを実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:38:10 GMT)
On the Embedding Collapse when Scaling up Recommendation Models [53.7] 埋め込み崩壊現象をスケーラビリティの阻害とみなし、埋め込み行列は低次元の部分空間を占有する傾向にある。
本稿では,組込み集合固有の相互作用モジュールを組み込んで,多様性を持つ組込み集合を学習する,単純かつ効果的な組込み設計を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:36:57 GMT)
Agent-Pro: Learning to Evolve via Policy-Level Reflection and Optimization [53.5] 大規模言語モデル(LLM)は多様なタスクに対して堅牢な問題解決能力を示す。
これらのタスクソルバは、タスクルールを通知し、行動を調整するために手作業によるプロンプトを必要とする。
本稿では,ポリシーレベルのリフレクションと最適化を備えた LLM ベースのエージェントである Agent-Pro を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:40:47 GMT)
FastGAS: Fast Graph-based Annotation Selection for In-Context Learning [53.2] インコンテキスト学習(ICL)は、大規模言語モデル(LLM)に対して、一連のトレーニングインスタンスをプロンプトとして使用することにより、新しいタスクに対処する権限を与える。
既存の手法では、アノテーションのラベルなし例のサブセットを選択する方法が提案されている。
本稿では,高品質なインスタンスを効率的に識別するグラフベースの選択手法であるFastGASを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:05:54 GMT)
Adapter-X: A Novel General Parameter-Efficient Fine-Tuning Framework for Vision [52.8] 本稿では,2次元画像と3次元点雲の微調整を改善するためのAdapter-Xという新しいフレームワークを提案する。
2D画像と3Dポイントの雲のモードで完全な微調整をし、パラメータが大幅に少ない、すなわち2Dと3Dの分類タスクにおいて、オリジナルのトレーニング可能なパラメータのわずか0.20%と1.88%で、初めて性能を上回った。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:18:41 GMT)
Is Table Retrieval a Solved Problem? Exploring Join-Aware Multi-Table Retrieval [52.6] 本稿では,テーブル検索において,任意のクエリやデータベースに対して有用な結合関係を明らかにする手法を提案する。
提案手法は,F1スコアの最大9.3%,エンドツーエンドQAの最大5.4%の精度で,テーブル検索の最先端手法よりも優れている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:59:40 GMT)
Multi-Agent Imitation Learning: Value is Easy, Regret is Hard [52.3] 我々は,エージェント群を協調させようとする学習者の視点で,マルチエージェント模倣学習(MAIL)問題を研究する。
MAILの以前の作業のほとんどは、基本的には、デモのサポート内で専門家の振る舞いにマッチする問題を減らすものです。
エージェントが戦略的でないという仮定の下で、学習者と専門家の間の価値ギャップをゼロにするのに十分であるが、戦略的エージェントによる逸脱を保証するものではない。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:18:20 GMT)
ADer: A Comprehensive Benchmark for Multi-class Visual Anomaly Detection [52.2] 本稿では,新しい異常検出手法のモジュラーフレームワークであるtextbftextitADerを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:20:10 GMT)
LogicBench: Towards Systematic Evaluation of Logical Reasoning Ability of Large Language Models [52.0] 最近開発された大規模言語モデル (LLM) は、幅広い言語理解タスクにおいて非常によく機能することが示されている。
しかし、それらは自然言語に対して本当に「理性」があるのだろうか?
この疑問は研究の注目を集めており、コモンセンス、数値、定性的など多くの推論技術が研究されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:15:54 GMT)
Localized Gaussian Point Management [52.0] 局所的点管理(LPM)は、点加算と幾何校正の双方の最も高い需要において、これらの誤り貢献ゾーンを特定することができる。
LPMは特定ゾーンに点密度を適用し、これらの領域の前に位置する点の不透明度をリセットし、不条件点を補正する新たな機会を創出する。
特に、LPMはバニラ3DGSとSpaceTimeGSの両方を改善して、リアルタイム速度を維持しながら最先端のレンダリング品質を実現している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:55:07 GMT)
Understanding crypter-as-a-service in a popular underground marketplace [51.3] Cryptersは、ターゲットバイナリを変換することで、アンチウイルス(AV)アプリケーションからの検出を回避できるソフトウェアの一部です。
シークレット・アズ・ア・サービスモデルは,検出機構の高度化に対応して人気を博している。
本論文は,シークレット・アズ・ア・サービスに特化したオンライン地下市場に関する最初の研究である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:11:03 GMT)
Understanding Information Storage and Transfer in Multi-modal Large Language Models [51.2] 本研究では,マルチモーダル大規模言語モデルを用いて,現実的な視覚的質問応答タスクにおいて情報処理を行う方法について検討する。
鍵となる発見は、これらのMLLMが情報記憶のためにずっと古いレイヤの自己注意ブロックに依存していることを示している。
モデル編集アルゴリズムであるMultEditを導入し、誤りを訂正し、MLLMに新しいロングテール情報を挿入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:35:36 GMT)
UFineBench: Towards Text-based Person Retrieval with Ultra-fine Granularity [50.9] 既存のテキストベースの人物検索データセットは、しばしば比較的粗い粒度のテキストアノテーションを持つ。
これにより、実際のシナリオにおけるクエリテキストのきめ細かいセマンティクスを理解するモデルが妨げられます。
我々は,超微細な人物検索のためにtextbfUFineBench という新しいベンチマークを作成した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:27:59 GMT)
Evaluating the IWSLT2023 Speech Translation Tasks: Human Annotations, Automatic Metrics, and Segmentation [50.6] 音声言語翻訳国際ワークショップ(IWSLT 2023)における共有タスクの結果を総合的に評価する。
本稿では,セグメントコンテキストによる自動回帰と直接評価に基づく効果的な評価戦略を提案する。
分析の結果,1) 提案した評価戦略は頑健であり,他の種類の人的判断とよく相関している,2) 自動測定基準は通常,必ずしも直接評価スコアとよく関連しているわけではない,3) COMET は chrF よりもわずかに強い自動測定基準である,といった結果を得た。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:18:42 GMT)
Low-Rank Similarity Mining for Multimodal Dataset Distillation [50.5] マルチモーダルデータセット蒸留におけるローランド類似性マイニング(LoRS)を提案する。
LoRSは、画像とテキストのペアと基底真理類似性行列を蒸留し、低ランクの分解を効率とスケーラビリティに活用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:05:20 GMT)
Lean Workbook: A large-scale Lean problem set formalized from natural language math problems [50.2] 大規模な言語モデルは、リーンのような形式言語を使って証明する数学の定理が得意ではありません。
この領域で重要な課題は、これらの形式言語で利用可能なトレーニングデータの不足である。
本稿では,自然言語の数学的問題をリーン4文に変換するために,合成データを反復的に生成・フィルタリングするパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:25:43 GMT)
DIRECT-3D: Learning Direct Text-to-3D Generation on Massive Noisy 3D Data [50.2] テキストプロンプトから高品質な3Dアセットを作成するための拡散型3D生成モデルであるDIRECT-3Dを提案する。
我々のモデルは、広範に騒々しく不整合な3D資産で直接訓練されている。
単一クラス生成とテキスト・ツー・3D生成の両方で最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:15 GMT)
Proactive Detection of Voice Cloning with Localized Watermarking [50.1] 本稿では,AI生成音声の局所検出に特化して設計された,最初の音声透かし技術であるAudioSealを紹介する。
AudioSealは、ローカライゼーションロスと共同でトレーニングされたジェネレータ/検出器アーキテクチャを使用して、サンプルレベルまでローカライズされた透かし検出を可能にする。
AudioSealは、実生活のオーディオ操作に対する堅牢性と、自動的および人的評価指標に基づく非知覚性の観点から、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:48:28 GMT)
Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.0] この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:51:35 GMT)
DPZero: Private Fine-Tuning of Language Models without Backpropagation [49.4] DPZeroは、ほぼ次元に依存しない新しいゼロオーダーアルゴリズムである。
DPZeroのメモリ効率は、いくつかの下流タスクでプライベートに微調整されたRoBERTaとOPTで実証される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:31:03 GMT)
RoboCoder: Robotic Learning from Basic Skills to General Tasks with Large Language Models [49.2] 大規模言語モデル(LLM)はロボットタスクの見通しを改善した。
既存のベンチマークはまだ、一般化機能に制限のある単一のタスクに限られている。
包括的なベンチマークと自律学習フレームワークであるRoboCoderを紹介します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:41:47 GMT)
The CLRS-Text Algorithmic Reasoning Language Benchmark [48.5] CLRS-TextはCLRSベンチマークのテキストバージョンである。
CLRS-Textは、30の多様な、挑戦的なアルゴリズムタスクのためのトレースデータを手続き的に生成することができる。
このベンチマークでは、様々なLMをジェネラリストエグゼクタとして微調整し評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:29:25 GMT)
Chaos with Keywords: Exposing Large Language Models Sycophancy to Misleading Keywords and Evaluating Defense Strategies [47.9] 本研究では,Large Language Models (LLMs) の梅毒傾向について検討する。
LLMは、たとえ完全に正しくなくても、ユーザが聞きたいものと一致した回答を提供する傾向があります。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:03:05 GMT)
Simplified and Generalized Masked Diffusion for Discrete Data [47.7] 離散データの生成モデリングのための自己回帰モデルの代替として、マスケッド拡散(または吸収拡散)が積極的に研究されている。
本研究の目的は,マスク拡散モデルの潜在能力を最大限に活用する,シンプルで汎用的なフレームワークを提供することである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:10 GMT)
Speaker Verification in Agent-Generated Conversations [47.6] 近年の大型言語モデル (LLM) の成功は、様々な話者の特徴やスタイルに合わせたロールプレイング・会話エージェントを開発し、汎用的・特殊な対話タスクを遂行する能力を高めるために広く関心を集めている。
本研究では,2つの発話が同一話者から発せられるかどうかを検証することを目的とした,エージェント生成会話における話者検証という,新たな評価課題を紹介する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:36:16 GMT)
Energy-based Epistemic Uncertainty for Graph Neural Networks [47.5] 高品質な不確実性推定を提供するエネルギーベースモデル(EBM)を提案する。
我々は、エネルギー関数を正則化することにより、データ空間の可積分密度を確実に誘導する。
我々のフレームワークは、様々な分散シフトに敏感な事前学習GNNに適用可能な、シンプルで効果的なポストホック手法である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:13:29 GMT)
Argument-Aware Approach To Event Linking [47.4] イベントリンクは、テキスト内のイベント参照と、知識ベース(KB)内の関連するノードを接続する。
我々は、入力テキストにタグ付けされたイベント引数情報を追加することで、イベントリンクモデルを改善する。
イベント引数の制御操作により、KB内インスタンスからKB外のトレーニング例を合成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:18:25 GMT)
PLaD: Preference-based Large Language Model Distillation with Pseudo-Preference Pairs [47.4] 大きな言語モデル(LLM)は、様々なタスクにおいて印象的な機能を示しているが、その膨大なパラメータサイズは、リソース制約のある設定での適用性を制限している。
知識蒸留(KD)は、大規模な教師モデルからコンパクトな学生モデルに専門知識を移すことによって、実行可能なソリューションを提供する。
PLaD は新規な嗜好に基づく LLM 蒸留フレームワークである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:47:31 GMT)
Sync4D: Video Guided Controllable Dynamics for Physics-Based 4D Generation [47.2] そこで我々は, カジュアルにキャプチャした参照ビデオを用いて, 3次元ガウシアンにおける制御可能なダイナミックスを作成する新しい手法を提案する。
提案手法は,参照ビデオから様々なカテゴリで生成された様々な3Dガウスにオブジェクトの動きを転送する。
本手法は, 形状整合性と時間的整合性の両方を維持しながら, 特異かつ高品質な運動伝達を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:27:38 GMT)
Mini Honor of Kings: A Lightweight Environment for Multi-Agent Reinforcement Learning [47.1] ゲームはマルチエージェント強化学習(MARL)の研究環境として広く利用されている
人気のモバイルゲーム「Honor of Kings」用の地図エディタを初めて公開し、軽量環境「Mini HoK」を設計する。
Mini HoKは非常に効率的で、実験をパーソナルPCやラップトップ上で行うことができるが、既存のMARLアルゴリズムには十分な課題がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:42:33 GMT)
The Revolution of Multimodal Large Language Models: A Survey [46.8] MLLM(Multimodal Large Language Models)は、視覚とテキストのモダリティをシームレスに統合することができる。
本稿では,近年の視覚的MLLMのレビュー,アーキテクチャ選択,マルチモーダルアライメント戦略,トレーニング手法について述べる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:13:43 GMT)
Towards Physically Consistent Deep Learning For Climate Model Parameterizations [46.1] 深層学習に基づくパラメータ化のための効率的な教師付き学習フレームワークを提案する。
提案手法は,入力の小さな部分集合を実際の物理ドライバとして頑健に識別する。
我々のフレームワークは、データ駆動型気候モデルパラメータ化における大きな課題に対処するための重要なステップである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:02:49 GMT)
How Far Can We Compress Instant-NGP-Based NeRF? [45.9] 我々は、記憶に優しいNeRF表現を提供するために、Context-based NeRF Compression (CNC)フレームワークを導入する。
我々は、より優れたコンテキストモデリングのための強力な事前知識として、ハッシュ衝突と占有グリッドを利用する。
86.7%,82.3%のストレージサイズ削減を実現した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:16:03 GMT)
Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives [45.9] 研究によると、外部からのフィードバックがなければ、Large Language Modelの本質的なリフレクションは不安定である。
我々の調査によると、重要なボトルネックは自己評価されたフィードバックの品質である。
要求に合わせて様々な解決の観点を適応的に探求し、相違点を対比し、これらの相違点を再検討し、相違点を排除するために使用できるチェックリストにまとめます。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:46:03 GMT)
Lever LM: Configuring In-Context Sequence to Lever Large Vision Language Models [45.7] 我々は,67Mパラメータを持つ変換器である小言語モデル(LM)を用いて,9Bパラメータを持つはるかに大きな視覚言語モデル(LVLM)をレバーすることを提案する。
具体的には、この textbfLever-LM を用いて、LVLM のインコンテキストリアリング(ICL)性能を改善するために、効果的なインコンテキスト・デモ(ICD)シーケンスを構成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:54:23 GMT)
VideoTetris: Towards Compositional Text-to-Video Generation [45.4] VideoTetrisは、合成T2V生成を可能にするフレームワークである。
我々は, VideoTetrisがT2V生成において, 印象的な質的, 定量的な結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:25:33 GMT)
Dipole-dipole interactions mediated by a photonic flat band [45.0] 平面バンド(FB)のフォトニックアナログに分散結合したエミッタ間の光子-双極子相互作用について検討する。
このような光子を媒介とする相互作用の強度は、特徴的な局在長を持つ距離で指数関数的に崩壊する。
1Dと2Dの両方の大規模なFBに対して解析的に導かれる普遍的スケーリング法則により, 局所化長はCLS間の重なりで増大することがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:02:13 GMT)
ABEX: Data Augmentation for Low-Resource NLU via Expanding Abstract Descriptions [44.9] ABEXは自然言語理解(NLU)タスクのための生成データ拡張手法である。
まず、文書を簡潔で抽象的な記述に変換し、その結果の抽象化を拡張して新しい文書を生成する。
12のデータセットと4つの低リソース設定にまたがる4つのNLUタスクに対するABEXの有効性を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:29:57 GMT)
ReST-MCTS*: LLM Self-Training via Process Reward Guided Tree Search [44.8] ReST-MCTS*は、プロセス報酬ガイダンスとツリー検索MCTS*を統合し、高品質な推論トレースを収集する。
まず,ReST-MCTS*における木探索ポリシーは,従来のLCM推論基準よりも精度が高いことを示した。
次に、この木探索ポリシーによって探索されたトレースをトレーニングデータとして使用することにより、複数の反復に対して3つの言語モデルを継続的に拡張できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:40:00 GMT)
Competition Report: Finding Universal Jailbreak Backdoors in Aligned LLMs [44.6] 大規模な言語モデルは安全であり、ユーザーが不正情報や違法行為の指示などの有害なコンテンツを生成できないように調整されている。
これまでの研究では、アライメントプロセスが毒殺攻撃に弱いことが示されている。
本報告では,今後の研究の要点と将来性について概説する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:45:52 GMT)
Provably Efficient Bayesian Optimization with Unknown Gaussian Process Hyperparameter Estimation [44.5] 目的関数の大域的最適値にサブ線形収束できる新しいBO法を提案する。
本手法では,BOプロセスにランダムなデータポイントを追加するために,マルチアームバンディット法 (EXP3) を用いる。
提案手法は, 様々な合成および実世界の問題に対して, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:38:50 GMT)
Self-Play with Adversarial Critic: Provable and Scalable Offline Alignment for Language Models [44.4] 本研究では,大規模言語モデル(LLM)とオフラインの嗜好データとの整合性について検討する。
オフラインRL文献から平均的な悲観的手法にインスパイアされた,セルフプレイによる新たなオフライン優先最適化手法であるSPACを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:23:49 GMT)
CityDreamer: Compositional Generative Model of Unbounded 3D Cities [44.2] CityDreamerは、非有界な3D都市向けに特別に設計された合成モデルである。
我々は、鳥の視線シーン表現を採用し、インスタンス指向と物指向のニューラルフィールドの両方にボリュームレンダリングを採用する。
CityDreamerは、現実的な3D都市を生成するだけでなく、生成された都市内の局所的な編集でも、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:38:50 GMT)
U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [44.2] Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:22:45 GMT)
American Sign Language Handshapes Reflect Pressures for Communicative Efficiency [43.6] コミュニケーション効率は言語学と認知科学において顕著な理論である。
ASL(American Sign Language)のハンプチは,これらの効率をいかに反映するかを示す。
以上の結果より, コミュニケーション効率に対するプレッシャーは, 英語の語彙借用ではなく, ASL の使用が主であることが明らかとなった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:46:21 GMT)
Breaking through the learning plateaus of in-context learning in Transformer [43.6] 文脈学習(In-context learning)、すなわち文脈の例から学ぶことは、Transformerの印象的な能力である。
この文脈内学習スキルを持つための学習用トランスフォーマーは、学習台地の発生により、計算集約的である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:09:52 GMT)
Evaluating the Influence of Temporal Context on Automatic Mouse Sleep Staging through the Application of Human Models [43.4] ヒトの睡眠ステージリングモデルでは、入力の時間的文脈を数十分の範囲に拡張することで、最近性能改善が示されている。
長期の睡眠パターンはマウス睡眠では明らかでないが、現在のマウス睡眠ステージモデルよりも時間的文脈を増大させると、パフォーマンスが向上する可能性がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:07:19 GMT)
BitsFusion: 1.99 bits Weight Quantization of Diffusion Model [43.1] 安定拡散v1.5から1.99ビットまでのUNetを量子化し、7.9倍のサイズのモデルを実現する新しい重み量子化法を開発した。
我々は、様々なベンチマークデータセットと人による評価を通じて、量子化モデルを広範囲に評価し、その優れた生成品質を実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:23 GMT)
CoopHash: Cooperative Learning of Multipurpose Descriptor and Contrastive Pair Generator via Variational MCMC Teaching for Supervised Image Hashing [42.7] GAN(Generative Adversarial Networks)のような生成モデルは、画像ハッシュモデルで合成データを生成することができる。
GANは訓練が難しいため、ハッシュアプローチが生成モデルとハッシュ関数を共同で訓練するのを防ぐことができる。
本稿では,エネルギーをベースとした協調学習に基づく新しい協調ハッシュネットワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:45:27 GMT)
The Prompt Report: A Systematic Survey of Prompting Techniques [42.6] 本稿では, プロンプトの分類を組立て, 利用分析を行うことにより, プロンプトの構造的理解を確立した。
本稿では,33の語彙の包括的語彙,58のテキストのみのプロンプト技術,40のモダリティのテクニックを提示する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:10:11 GMT)
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability [42.5] 本稿では,高忠実度かつ多目的な制御性を有する一般化可能な運転世界モデルであるVistaを提案する。
本稿では,移動インスタンスと構造情報の学習を促進するために,新たな2つの損失を提案する。
動作制御性には,高レベルな意図から低レベルな操作に至るまで,多種多様な制御が組み込まれている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:52:03 GMT)
SIMPLE: A Gradient Estimator for $k$-Subset Sampling [42.4] この作業では、フォワードパスの離散$k$-subsetサンプリングに戻ります。
勾配推定器 SIMPLE は, 最先端推定器と比較して, バイアスやばらつきが低いことを示す。
実験結果から,線形回帰を説明・スパースする学習性能が向上した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:33:51 GMT)
Neural Implicit Representation for Building Digital Twins of Unknown Articulated Objects [42.3] 本稿では2つのRGBDスキャンから未知の調音物体のディジタル双対を異なる調音状態で構築する問題に対処する。
提案手法は,まず各状態におけるオブジェクトレベルの形状を再構成し,基礎となる調音モデルを復元する。
また、複数の可動部も扱っており、以前の物体の形や構造に依存していない。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:20:55 GMT)
Model Poisoning Attacks to Federated Learning via Multi-Round Consistency [42.1] 本稿では,悪意のあるクライアントのモデル更新間で複数ラウンドの一貫性を実現するPoisonedFLを提案する。
5つのベンチマークデータセットに対する実証的な評価は、PoisonedFLが8つの最先端の防御を破り、既存の7つのモデル中毒攻撃を上回っていることを示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:47:16 GMT)
A Comprehensive Evaluation of Quantization Strategies for Large Language Models [42.0] 大規模言語モデル(LLM)におけるパラメータの数を増やすことで、ダウンストリームタスクのパフォーマンスが向上するが、計算とメモリコストが上昇する。
モデルウェイトやアクティベーションに必要なビットを最小性能で削減する量子化技術が普及している。
本稿では,知識とキャパシティ,(2)アライメント,(3)効率の3つの重要な次元からなる構造化評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:38:26 GMT)
Understanding and Patching Compositional Reasoning in LLMs [41.9] 本研究の目的は,言語モデルにおける構成的推論失敗の根本原因を明らかにすることである。
実験結果から着想を得たので,ロジットレンズを応用し,LLMの内部隠蔽状態を識別するための介入実験を行った。
このディープダイブは、暗黙の推論結果が実際に中間層内に存在することを明らかにし、最終的な明示的な推論結果を形成する上で、因果的な役割を担っている。
本研究は, 暗黙の推論結果の正確な生成とレバリングにおいて, リンチピンとして現れるマルチヘッド自己注意モジュール(MHSA)を, これらの層内に発見するものである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:06:41 GMT)
Geometric Quantum Machine Learning with Horizontal Quantum Gates [41.9] 本稿では,変分量子回路の対称性インフォームド構成のための代替パラダイムを提案する。
これを実現するために水平量子ゲートを導入し、これは対称性の方向に関してのみ状態を変換する。
対称空間に基づく水平ゲートの特定のサブクラスに対しては、KAK定理により、ゲートの効率的な回路分解が得られる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:04:39 GMT)
Breeding Programs Optimization with Reinforcement Learning [41.8] 本稿では,シミュレートされた作物育種プログラムの最適化にReinforcement Learning (RL) を用いることを提案する。
RLに基づく育種アルゴリズムをベンチマークするために、Gym環境のスイートを導入する。
この研究は、シリコでシミュレートされた場合の遺伝的ゲインの観点から、標準手法よりもRL手法の方が優れていることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:17:51 GMT)
Diffusion Tuning: Transferring Diffusion Models via Chain of Forgetting [41.8] Diff-Tuningは、忘れる傾向の連鎖を利用する、フラストレーション的にシンプルな転送手法である。
D Diff-Tuningは標準的な微調整よりも26%改善され、ControlNetの収束速度が24%向上した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:08:22 GMT)
Both Matter: Enhancing the Emotional Intelligence of Large Language Models without Compromising the General Intelligence [41.7] 感情インテリジェンス(EI)は、現在の大言語モデル(LLM)ベースの会話型汎用AIアシスタントのユーザインタラクションエクスペリエンスを改善する上で、重要な役割を果たす。
これまでの研究は主に、EI関連分類や回帰タスクの微調整による感情知覚能力の向上に重点を置いていた。
タスク命令付きテキスト・ツー・テキスト生成におけるEI関連タスクの大規模コレクションであるtextscEiBenchを紹介する。
UnderlinetextbfModular UnderlinetextbfEmotional Underline
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:13:27 GMT)
RICE: Breaking Through the Training Bottlenecks of Reinforcement Learning with Explanation [40.8] RICEは強化学習のための革新的な精製手法である。
トレーニングボトルネックを突破するための説明手法が組み込まれている。
様々なRL環境と実世界のアプリケーションでRICEを評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:36:03 GMT)
Efficient 3D-Aware Facial Image Editing via Attribute-Specific Prompt Learning [40.7] 本稿では,属性特異的なプロンプト学習に基づく効率的な3次元顔編集フレームワークを提案する。
提案フレームワークは,属性固有の特徴を維持しつつ,3次元認識とビューの整合性を備えた高品質な画像を生成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:01:30 GMT)
DICE: Detecting In-distribution Contamination in LLM's Fine-tuning Phase for Math Reasoning [40.6] ベンチマークデータに類似したデータによるトレーニングでさえ、全体的な能力を改善することなく、配信中のタスクのパフォーマンスを膨らませる、と我々は主張する。
そこで本研究では,LSMの内部状態を利用して汚染を検出・検出する新しい手法であるDICEを提案する。
実験により、DICEは様々なLSMおよび数学推論データセットにまたがる分布内汚染を検出するのに高い精度を示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:55:53 GMT)
UltraMedical: Building Specialized Generalists in Biomedicine [40.5] バイオメディカルドメインにおける高品質な手動および合成データセットからなるUltraMedicalコレクションについて述べる。
Llama-3シリーズに基づく専門的な医療モデル群を微調整し、様々な医療ベンチマークで呼吸能力を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:50:26 GMT)
Multifidelity domain decomposition-based physics-informed neural networks and operators for time-dependent problems [40.5] 多重忠実積層PINNとドメイン分解に基づく有限基底PINNの組み合わせを用いる。
ドメイン分解アプローチは、PINNと重ね合わせのPINNアプローチを明らかに改善する。
FBPINNアプローチは、多要素物理インフォームド・ディープ・オペレーター・ネットワークに拡張可能であることが実証された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:50:53 GMT)
Improving Alignment and Robustness with Short Circuiting [40.5] AIシステムは有害な行動をとることができ、敵の攻撃に対して非常に脆弱である。
有害な出力に反応する「短絡回路」をモデル化する手法を提案する。
我々は、我々のアプローチをAIエージェントに拡張し、攻撃されているときの有害な行動の率を大幅に低下させることを実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:57:04 GMT)
R-CONV: An Analytical Approach for Efficient Data Reconstruction via Convolutional Gradients [40.2] 本稿では,畳み込み層の勾配を効率的に利用するための高度なデータ漏洩手法を提案する。
我々の知る限りでは、これは勾配から直接畳み込み層の入力を再構築する最初の分析手法である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:28:04 GMT)
Meta-learning for Positive-unlabeled Classification [40.1] 提案手法は,モデルがPUデータに適用された後のテスト分類リスクを最小限に抑える。
この方法は各インスタンスをニューラルネットワークを使ってタスク固有の空間に埋め込む。
提案手法は1つの実世界のデータセットと3つの実世界のデータセットで既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:50:01 GMT)
Class-Aware Cartilage Segmentation for Autonomous US-CT Registration in Robotic Intercostal Ultrasound Imaging [39.6] 形状制約後処理を施したクラスアウェア軟骨骨分節ネットワークを提示し, 患者固有の骨骨格を捕捉する。
一般的なテンプレートから個々の患者へ、宿主間走査経路をマッピングするために、密度の高い骨格グラフに基づく非剛性登録が提示される。
提案手法は,CTテンプレートから個々の患者へのパスを,頑健かつ正確にマッピングできることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:15:15 GMT)
Solving Systems of Linear Equations: HHL from a Tensor Networks Perspective [39.6] 本稿では,HHLアルゴリズムに基づく線形方程式系の解法を,新しい四重項法を用いて提案する。
テンソルネットワーク上で量子インスパイアされたバージョンを実行し、プロジェクションのような非単体演算を行う能力を生かした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:17:26 GMT)
RoboMamba: Multimodal State Space Model for Efficient Robot Reasoning and Manipulation [38.9] 我々は、ロボット推論とアクション機能の両方を提供するエンドツーエンドのロボットMLLMであるRoboMambaを紹介する。
具体的には、視覚エンコーダをMambaと統合し、協調学習による言語埋め込みと視覚データを整列する。
一度RoboMambaが十分な推論能力を持つと、最小限の微調整パラメータで操作スキルを得ることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:47 GMT)
SGLang: Efficient Execution of Structured Language Model Programs [38.7] 本稿では,複雑な言語モデルプログラムの効率的な実行システムであるSGLangを紹介する。
Radix for KVLangや圧縮有限状態マシンなどの新しい最適化によるランタイム実行は、より高速な構造化出力デコードを実現する。
SGを6.4倍のスループットでキャッシュする実験は、様々な大規模言語マルチモーダルモデルにおける最先端の推論と比較できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:10:06 GMT)
Reflect-RL: Two-Player Online RL Fine-Tuning for LMs [38.5] オンライン強化学習(RL)と教師付き微調整(SFT)を用いた微調整言語モデル(LM)システムであるReflect-RLを提案する。
GPT-2 XL 1.56BはReflect-RLで微調整され、Mistral 7Bのようなより大きなオープンソースLMよりも優れていた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:04:41 GMT)
Navigate through Enigmatic Labyrinth A Survey of Chain of Thought Reasoning: Advances, Frontiers and Future [38.2] 思考の連鎖はLLMの推論能力を大幅に向上させる。
本稿では,高度な手法を要約し,関連研究を体系的に研究する。
また、現在のフロンティアを掘り下げて、課題と今後の方向性を述べています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:58:54 GMT)
Leakage Mobility in Superconducting Qubits as a Leakage Reduction Unit [37.8] 計算部分空間からの漏れはノイズの損傷源である。
超伝導量子ビット間の漏れ移動が量子安定性実験の性能に及ぼす影響について検討した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:52:46 GMT)
Every Answer Matters: Evaluating Commonsense with Probabilistic Measures [37.8] 我々は,複数世代にわたるオープンエンド世代を通して,共通感覚を評価する新しい生成タスクを提案する。
また,人間の判断と強く相関する確率的評価法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:10:27 GMT)
Scaling and evaluating sparse autoencoders [37.7] k-スパースオートエンコーダを用いたオートエンコーダスケーリングの特性について検討した。
オートエンコーダのサイズと空間性に関して、クリーンなスケーリング法則を見つけます。
我々は、400億トークンのGPT-4アクティベーションに対して1600万の潜伏オートエンコーダをトレーニングする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:10:12 GMT)
Stereo-Depth Fusion through Virtual Pattern Projection [37.5] 本稿では,新しい汎用ステレオ・ディープデータ融合パラダイムを提案する。
これは、信頼できない物理パターンプロジェクターを奥行きセンサーに置き換えることで、アクティブなステレオ原理を模倣する。
従来のステレオカメラで取得した左右の画像に、シーン形状と整合した仮想パターンを投影する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:58 GMT)
Assessing LLMs for Zero-shot Abstractive Summarization Through the Lens of Relevance Paraphrasing [37.4] 大言語モデル(LLM)は、与えられた記事に対する抽象的な要約のゼロショット生成において最先端のパフォーマンスを達成した。
本稿では,LLMのロバスト性を測定するためのシンプルな戦略であるrelevance paraphrasingを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:08:43 GMT)
Generalized Cauchy-Schwarz Divergence and Its Deep Learning Applications [37.3] 多様性の尺度は、深層学習において中心的な役割を担い、ますます不可欠になりつつある。
一般化コーシーシュワルツ発散(GCSD)と呼ばれる複数の分布に適した新しい測度を導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:02:00 GMT)
FanOutQA: A Multi-Hop, Multi-Document Question Answering Benchmark for Large Language Models [37.3] FanOutQA(ファンアウトQA)は、ウィキペディアによる高品質な質問応答ペアと人間による注釈付き分解のデータセットである。
GPT-4、LLaMA 2、Claude-2.1、Mixtral-8x7Bを含む、データセットとベンチマーク7 LLMの3つのベンチマーク設定を定式化します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:41:21 GMT)
ReFiNe: Recursive Field Networks for Cross-modal Multi-scene Representation [37.2] 連続神経場として表現される複数の形状を、従来より高い精度で符号化する方法を示す。
我々は、データセット毎に1つのネットワークで、最先端のマルチシーン再構成と圧縮結果を実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:55:34 GMT)
Tables as Texts or Images: Evaluating the Table Reasoning Ability of LLMs and MLLMs [37.2] 画像に基づく表表現におけるLLMの性能評価を初めて紹介する。
本研究は、テーブル関連タスクにおけるLLMの有効利用に関する知見を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:02:25 GMT)
Evaluating the Smooth Control of Attribute Intensity in Text Generation with LLMs [36.9] 大規模言語モデル(LLM)はテキスト生成に革命をもたらした。
生成したテキストの属性強度の範囲,キャリブレーション,一貫性を評価する指標を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:35:51 GMT)
Solving Inverse Problems in Protein Space Using Diffusion-Based Priors [36.7] 生生物物理測定を3次元原子モデルに変換するための多用途フレームワークを提案する。
本手法は, 線形および非線形逆問題において, 後方サンプリングベースラインよりも優れた性能を示す。
これは、Cryo-EM密度マップから原子モデルを精製する最初の拡散法である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:38:53 GMT)
Wireless Network Digital Twin for 6G: Generative AI as A Key Enabler [36.7] 本稿では、メッセージレベルとポリシーレベルの両方で、階層的生成型AI対応無線ネットワークディジタルツインを提案する。
6G時代の無線ネットワークディジタル双生児のオープンな研究課題について論じる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:53:13 GMT)
LLMs Could Autonomously Learn Without External Supervision [36.4] 大規模言語モデル(LLM)は、伝統的に人間の注釈付きデータセットと事前定義されたトレーニング目標に結び付けられてきた。
本稿では,LLMのための自律学習手法を提案する。
本手法は, LLMに対して, 文章と直接対話して自己学習を行う能力を与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:48:35 GMT)
Tox-BART: Leveraging Toxicity Attributes for Explanation Generation of Implicit Hate Speech [36.2] トレーニングはしばしば、世界的知識を提供し、標準メトリクスのパフォーマンスを改善するために、トップk関連知識グラフ(KG)を組み合わせる。
暗黙的な説明を生み出す上でKGsの品質が果たす役割の矛盾する証拠を提示する。
提案手法はゼロショット GPT-3.5 よりも高精度な説明を行い,タスクの複雑な性質を強調した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:54:44 GMT)
PDHG-Unrolled Learning-to-Optimize Method for Large-Scale Linear Programming [36.1] 本稿では,大規模線形計画問題の解法として PDHG-Net と呼ばれる FOM-Unrolled Neural Network (NN) を提案する。
提案手法は,大規模LP問題に対するFOMと比較して,最大3ドル以上の高速化を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:07:37 GMT)
Evaluating Durability: Benchmark Insights into Multimodal Watermarking [36.1] 画像およびテキスト生成モデルにより生成された透かし付きコンテンツの、一般的な実世界の画像破損やテキスト摂動に対する堅牢性について検討する。
今後,より堅牢な透かし技術の開発が進む可能性がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:57:08 GMT)
UNIMO-G: Unified Image Generation through Multimodal Conditional Diffusion [36.1] UNIMO-Gは条件付き拡散フレームワークであり、インターリーブされたテキストと視覚入力を持つマルチモーダルプロンプトで動作する。
テキスト・ツー・イメージ生成とゼロショット・テーマ駆動合成の両面で優れている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:25:09 GMT)
Spatiotemporal-Augmented Graph Neural Networks for Human Mobility Simulation [35.9] 本稿では,SRpatio-Augmented gaph Neural Network という,位置の動的時間的効果をモデル化する新しいフレームワークを提案する。
STARフレームワークは、行動対応を捉えるために様々な時間グラフを設計し、異なる場所の居住地をシミュレートする新しいブランチを構築し、最終的にその期間を逆向きに最適化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:56:08 GMT)
Using Large Language Model for End-to-End Chinese ASR and NER [35.9] 本稿では,クロスアテンションによる音声特徴を組み込んだエンコーダ・デコーダアーキテクチャを提案する。
本稿では,中国語の自動音声認識(ASR)と名前認識(NER)の2つの手法を比較した。
実験の結果,エンコーダ-デコーダアーキテクチャは短いコンテキストでデコーダのみのアーキテクチャよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:39:50 GMT)
Instance Segmentation and Teeth Classification in Panoramic X-rays [35.8] 歯のセグメンテーションと認識は様々な歯科応用や歯科診断において重要である。
この記事では、U-NetとYOLOv8という2つのディープラーニングモデルのパイプラインを提供します。
我々は YOLOv8 と U-Net の機能を利用して, 歯のセグメンテーションの質と信頼性を改善した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:57:29 GMT)
Time Sensitive Knowledge Editing through Efficient Finetuning [35.8] 大きな言語モデル(LLM)は、様々なタスクにおいて印象的な能力を示し、多くのドメインに変革をもたらす。
LLMの知識を最新に保つことは、事前トレーニングが完了するまで、依然として課題である。
既存の位置と編集の知識編集(KE)手法には2つの制限がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:41:36 GMT)
Physics3D: Learning Physical Properties of 3D Gaussians via Video Diffusion [35.7] ビデオ拡散モデルを用いて3Dオブジェクトの様々な物理的特性を学習する新しい手法である textbfPhysics3D を提案する。
本手法では,粘弾性材料モデルに基づく高一般化物理シミュレーションシステムを設計する。
弾性材料とプラスチック材料の両方を用いて, 本手法の有効性を実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:47 GMT)
Speculative Decoding via Early-exiting for Faster LLM Inference with Thompson Sampling Control Mechanism [35.7] そこで本研究では,非損失加速を用いたEarly-Exiting Speculative Decoding (EESD) という新しい手法を提案する。
EESDは、大きな言語モデル(LLM)のセグメントを使用してドラフトトークンを生成し、最初のN層の後、初期出力構造を取り入れている。
提案手法では,従来の手法と比較して,トークンの復号化速度が著しく向上していることが示されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:40:28 GMT)
How Good is Zero-Shot MT Evaluation for Low Resource Indian Languages? [35.4] Assamese、Kannada、Maithili、Punjabiといった低リソースのインドの言語に焦点を当てたゼロショット評価に重点を置いている。
ゼロショット性能を示すことが知られている学習指標であっても、人間のアノテーションとKendall TauとPearsonの相関は0.32と0.45である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:28:08 GMT)
Knowledge Graph Question Answering for Materials Science (KGQA4MAT): Developing Natural Language Interface for Metal-Organic Frameworks Knowledge Graph (MOF-KG) Using LLM [35.2] 材料科学における知識グラフ質問回答のためのベンチマークデータセット(KGQA4MAT)を提案する。
構造データベースと文献から抽出した知識を統合することにより,金属-有機フレームワーク(MOF-KG)の知識グラフを構築した。
我々は、比較、集約、複雑なグラフ構造を含む161の複雑な質問からなるベンチマークを開発した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:35:09 GMT)
Road Network Representation Learning with the Third Law of Geography [35.0] 道路ネットワーク表現学習は,多くのタスクに適用可能な道路セグメントに対して,圧縮された効率的なベクトル化表現を学習することを目的としている。
本稿では,近年の地理第三法則の原則により,道路ネットワークの表現を実現することを提案する。
3つの下流タスクにまたがる2つの実世界のデータセット上で、我々のフレームワークを評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:04:43 GMT)
Empirical Guidelines for Deploying LLMs onto Resource-constrained Edge Devices [34.8] 資源制約のある計算環境がパーソナライズされたLLMの設計選択にどのように影響するかを検討する。
いくつかの重要な設計要因のトレードオフと、学習効率と正確性に対するそれらの相互干渉の影響を考察する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:41:53 GMT)
An Empirical Study on Low Code Programming using Traditional vs Large Language Model Support [34.7] 低コードプログラミング(Low-code Programming、LCP)は、より抽象度の低いモデルを用いたプログラミングである。
LCP と LLM ベースの LCP に対する従来のアプローチの技術的原則と応用シナリオは、大きく異なる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:07:38 GMT)
SecFormer: Towards Fast and Accurate Privacy-Preserving Inference for Large Language Models [34.6] 本稿では,Transformerモデルに対する高速かつ正確なPPIを実現するために,SecFormerという高度な最適化フレームワークを導入する。
効率面では、SecFormerは、BERT$_textBASE$とBERT$_textLARGE$のPumaよりも3.56倍高速である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:22:44 GMT)
Projection-Free Variance Reduction Methods for Stochastic Constrained Multi-Level Compositional Optimization [34.6] 本稿では,制約付きマルチレベル最適化関数に対するプロジェクションフリーアルゴリズムについて検討する。
段階的適応を用いて凸関数と強凸関数の複素数を求める。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:56:56 GMT)
BLSP-Emo: Towards Empathetic Large Speech-Language Models [34.6] BLSP-Emoは、音声における意味と感情の両方を理解可能なエンドツーエンドの音声言語モデルを開発するための新しいアプローチである。
実験の結果,BLSP-Emoモデルでは,音声の理解と共感応答の伝達が優れていることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:02:31 GMT)
DiffCAD: Weakly-Supervised Probabilistic CAD Model Retrieval and Alignment from an RGB Image [34.5] 本稿では,RGB画像からのCAD検索とアライメントに対する,最初の弱教師付き確率的アプローチであるDiffCADを提案する。
我々はこれを条件付き生成タスクとして定式化し、拡散を利用して画像中のCADオブジェクトの形状、ポーズ、スケールをキャプチャする暗黙の確率モデルを学ぶ。
提案手法は, 合成データのみを用いて学習し, 単眼深度とマスク推定を利用して, 種々の実対象領域へのロバストなゼロショット適応を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:37:01 GMT)
MoralBench: Moral Evaluation of LLMs [34.4] 本稿では,大規模言語モデル(LLM)の道徳的推論能力の測定と比較を目的とした新しいベンチマークを提案する。
LLMの出力の道徳的次元を探索するために特別に計算された最初の包括的データセットを示す。
本手法は, 定量的分析と倫理学者の質的洞察を組み合わせることで, モデル性能の徹底的な評価を確実にする多面的手法である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:15:01 GMT)
LiveCodeBench: Holistic and Contamination Free Evaluation of Large Language Models for Code [34.0] コード関連アプリケーションに適用される大規模言語モデルは、顕著な分野として現れている。
既存の評価ベンチマーク(HumanEval、MBPPなど)は、もはやその能力を評価するには不十分である。
コードに対するLLMの包括的で汚染のない評価手法であるLiveCodeBenchを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:41:21 GMT)
COURIER: Contrastive User Intention Reconstruction for Large-Scale Visual Recommendation [33.9] 我々は、既存のモダリティ機能を超えたさらなる改善のために、推奨に適した視覚的特徴事前学習法が必要であると論じる。
本研究では,行動履歴からユーザ興味に関連する視覚的特徴を抽出する効果的なユーザ意図再構築モジュールを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:01:55 GMT)
Guardrail Baselines for Unlearning in LLMs [33.9] ファインタニングは、大きな言語モデルから'未学習'の概念への有望なアプローチである。
ガードレールをベースとしたプロンプトやフィルタリングなどの手法が,ファインタニングに匹敵する未学習結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:45:09 GMT)
Identification of highly-forbidden optical transitions in highly charged ions [33.8] 最近、Ar$13+$で最初の高電荷イオン(HCI)ベースの光時計がデモされた。
本稿では、線形ポールトラップに制限されたHCIにおけるサブヘルツクロック遷移に対する量子論理に着想を得た実験的探索手法について検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:41:22 GMT)
Global Parameterization-based Texture Space Optimization [33.3] 本研究では,グローバルなパラメータ化に基づいて,テクスチャ空間を最適化し,コンパクトなテクスチャマッピングを実現する手法を提案する。
実験により, 提案手法の有効性と, 保存効率, レンダリング効率の向上効果が示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:36:02 GMT)
GenAI Arena: An Open Evaluation Platform for Generative Models [33.2] 本稿では,異なる画像および映像生成モデルを評価するためのオープンプラットフォームGenAI-Arenaを提案する。
GenAI-Arenaは、より民主的で正確なモデルパフォーマンスの指標を提供することを目指している。
テキスト・ツー・イメージ・ジェネレーション、テキスト・ツー・ビデオ・ジェネレーション、画像編集の3つのアリーナをカバーしている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:15:42 GMT)
What is Dataset Distillation Learning? [33.0] 本研究では, 蒸留データの挙動, 代表性, ポイントワイド情報量について検討する。
蒸留したデータは、トレーニング中に実際のデータに代わるものとしては役に立たない。
蒸留データを解釈し、個別の蒸留データポイントが意味のある意味情報を含んでいることを示す枠組みを提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:28:56 GMT)
PlaneMVS: 3D Plane Reconstruction from Multi-View Stereo [32.8] カメラのポーズによる複数入力ビューからの3次元平面再構成のための新しいフレームワークPlainMVSを提案する。
対照的に、マルチビュー幾何学を利用するマルチビューステレオ(MVS)パイプラインで3次元平面を再構成する。
本手法は,学習面の先行性により,SOTA学習に基づくMVS手法よりも優れる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:07:04 GMT)
Concise and Organized Perception Facilitates Reasoning in Large Language Models [32.7] 大規模言語モデル (LLM) は, 推論作業における乱雑な内容や無関係な内容を扱う際に, 人間の認知バイアスに類似した障害パターンを示す。
コンシス・アンド・オーガナイズド・パーセプション(COP)という新しい推論手法を提案する。
COPは与えられたステートメントを慎重に分析し、冗長性を効率的に排除しながら、最も関連する情報を識別する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:28:02 GMT)
Does Pre-trained Language Model Actually Infer Unseen Links in Knowledge Graph Completion? [32.6] 知識グラフ(KG)は、エンティティ間の関係を記述するリンクである。
知識グラフ補完(英: Knowledge Graph Completion、KGC)は、KG内のエンティティ間の見えない関係を推論するタスクである。
RESCALのような従来の埋め込みベースのKGCメソッドは、トレーニングデータからの知識のみを使用して、欠落したリンクを推測する。
最近のプレトレーニング言語モデル(PLM)に基づくKGCは、事前トレーニング中に得られた知識を利用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:01:08 GMT)
Amortized Equation Discovery in Hybrid Dynamical Systems [32.5] AMORE(Amortized Equation Discovery)と呼ばれるエンド・ツー・エンドの学習フレームワークを提案する。
本手法は, 方程式発見, セグメンテーション, 予測における従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:49:02 GMT)
Online Control in Population Dynamics [32.1] オンライン制御のパラダイムに基づく新しいフレームワークを提案する。
まず、進化する個体群を自然にモデル化できる線形力学系の集合を特徴づける。
次に、これらのシステムに対して、ほぼ最適の後悔境界を持つ効率的な勾配ベースの制御を与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:29:48 GMT)
KMMLU: Measuring Massive Multitask Language Understanding in Korean [32.1] KMMLUは、人文科学からSTEMまで、45科目にわたる35,030名のエキスパートレベルの多重選択質問を備えた、韓国の新しいベンチマークである。
以前の韓国のベンチマークは既存の英語のベンチマークから翻訳されるが、KMMLUはオリジナルの韓国の試験から収集される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:23:58 GMT)
Sample Complexity Bounds for Estimating Probability Divergences under Invariances [31.9] 群不変確率分布は、機械学習において多くのデータ生成モデルに現れる。
本研究では, 多様体上のリー群の滑らかな作用に関して, 固有の不変性が, サンプルの複雑性をいかに改善するかを考察する。
結果は正次元の群にとって全く新しいものであり、有限群作用に対する最近の境界を拡張する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:00:14 GMT)
ActionReasoningBench: Reasoning about Actions with and without Ramification Constraints [31.9] 行動と変化(RAC)に関する推論は、歴史的に多くの初期のAI課題の開発を促してきた。
我々は13のドメインを含む新しいベンチマークであるActionReasoningBenchを導入し、LLM(Large Language Models)を厳格に評価する。
この結果は,これらのモデルがベンチマークに含まれるすべてのカテゴリで重大な課題に直面していることを示唆している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:15:37 GMT)
Language Agent Tree Search Unifies Reasoning Acting and Planning in Language Models [31.5] 我々はLanguage Agent Tree Search (LATS)を紹介した。Language Agent Tree Search (LATS)は、推論、行動、計画において言語モデル(LM)の能力を相乗化する最初の一般的なフレームワークである。
当社のアプローチの重要な特徴は、より意図的で適応的な問題解決メカニズムを提供する外部フィードバック環境の導入である。
LATSは、GPT-4でHumanEval上でプログラミングするための最先端パス@1精度(92.7%)を達成し、GPTによるWebShop上のWebナビゲーションの勾配ベースの微調整に匹敵する勾配なし性能(平均スコア75.9)を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:51:17 GMT)
M&M VTO: Multi-Garment Virtual Try-On and Editing [31.5] M&M VTO(M&M VTO)は、複数の衣料品画像、衣服レイアウトのためのテキスト記述、人物のイメージを入力として利用する、ミックス・アンド・マッチ方式の仮想試行法である。
例としては、シャツのイメージ、ズボンのペアの画像、"ローリングスリーブ、シャツの入れ墨"、人物のイメージなどがある。
アウトプットは、その衣服(望ましいレイアウト)が特定の人にどのように見えるかを視覚化するものだ。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:46:37 GMT)
Adaptive Sampling of k-Space in Magnetic Resonance for Rapid Pathology Prediction [31.3] そこで本研究では,k空間サンプルを逐次選択し,対象疾患検出を最適化するための適応ポリシーを学習する,MR用適応サンプリング法を提案する。
ASMRは、k空間の8%しか使用せず、また、EMRT、LO、DPSなどのk空間サンプリングにおいて、最先端の作業よりも優れています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:00 GMT)
Improving Linear System Solvers for Hyperparameter Optimisation in Iterative Gaussian Processes [31.3] 本稿では,線形系解法を用いる反復法に着目し,限界次数勾配を推定する。
本稿では,解決者間で適用可能な3つの重要な改善点について論じる。
これらのテクニックは、トレランスの解決時に最大7,2倍のスピードアップを提供し、停止時に平均残留ノルムを最大7,7倍まで下げる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:54:31 GMT)
On Limitation of Transformer for Learning HMMs [31.1] 本稿では,隠れマルコフモデル(HMM)の学習における変換器の性能について検討する。
我々は,トランスフォーマーが,すべてのテスト済みHMMモデルに対して,トレーニング速度とテスト精度の両方で連続ニューラルネットワーク(Recurrent Neural Networks, RNN)の性能を一貫して低下させることを示した。
さらに,HMMのタイプと複雑さに基づいて,トランスフォーマーの深さと,それが効果的に学習できるシーケンス長との関係を明らかにした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:59:51 GMT)
Token-Specific Watermarking with Enhanced Detectability and Semantic Coherence for Large Language Models [31.1] 大規模言語モデルは、潜在的な誤報を伴う高品質な応答を生成する。
ウォーターマーキングは、テキストに隠れたマーカーを埋め込むことによって、この文脈において重要な意味を持つ。
ウォーターマーキングのための新しい多目的最適化(MOO)手法を提案する。
本手法は,検出性と意味的整合性を同時に達成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:49:37 GMT)
A Survey on Medical Large Language Models: Technology, Application, Trustworthiness, and Future Directions [31.0] 大規模言語モデル(LLM)は、人間レベルの言語の生成と理解に優れた能力があることから、大きな注目を集めている。
LLMは医療分野において革新的で強力なアドジャンクとして出現し、伝統的なプラクティスを変革し、医療サービス強化の新しい時代を告げている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:15:13 GMT)
Infusing Self-Consistency into Density Functional Theory Hamiltonian Prediction via Deep Equilibrium Models [30.7] 本稿では,統合ニューラルネットワークアーキテクチャ,Deep Equilibrium Density Functional Theory Hamiltonian (DEQH)モデルを紹介する。
DEQHモデルは本質的にハミルトニアンの自己整合性の性質を捉えている。
本稿では,DECと既製の機械学習モデルを組み合わせた多目的フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:05:58 GMT)
LOGIN: A Large Language Model Consulted Graph Neural Network Training Framework [30.5] 我々は,GNN設計プロセスの合理化とLarge Language Models(LLM)の利点を活用して,下流タスクにおけるGNNの性能向上を目指す。
我々は,LLMs-as-Consultants(LLMs-as-Consultants)という新たなパラダイムを策定し,LLMとGNNを対話的に統合する。
両グラフのノード分類におけるLOGINの有効性を実証的に評価した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:29:31 GMT)
CDMamba: Remote Sensing Image Change Detection with Mamba [30.4] 我々はCDMambaと呼ばれるモデルを提案し、CDタスクを扱うためのグローバル機能とローカル機能とを効果的に組み合わせている。
具体的には,Mambaのグローバルな特徴抽出と畳み込みによる局所的詳細化を実現するために,Scaled Residual ConvMambaブロックを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:04:30 GMT)
Tool-Planner: Dynamic Solution Tree Planning for Large Language Model with Tool Clustering [30.3] ツールキットに基づくタスク処理フレームワークであるTool-Plannerを提案する。
Tool-Plannerは同じ関数を持つAPI関数をツールキットにグループ化する。
ツールエラーが発生した場合、言語モデルはツールキットに基づいてツールを再選択し、調整することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:30:14 GMT)
Exact Conversion of In-Context Learning to Model Weights in Linearized-Attention Transformers [30.1] In-Context Learningは、大きな言語モデルの強力な創発的特性である。
線形化変圧器ネットワークでは, バイアス項を含めることで, ICLを明示的かつ永続的にすることができることを示す。
我々のアルゴリズム(ICLCA)は、正確な変換を安価に行うことができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:15:29 GMT)
MLVU: A Comprehensive Benchmark for Multi-Task Long Video Understanding [30.0] 我々は,Long Video Understanding の包括的かつ詳細な評価を行うため,MLVU と呼ばれる新しいベンチマークを提案する。
MLVUは以下の重要な値を示す: 1) ビデオ長の実質的かつ柔軟な拡張により、ベンチマークは幅広い期間にわたってLVUのパフォーマンスを評価することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:09:32 GMT)
Conformal Prediction for Deep Classifier via Label Ranking [29.8] コンフォーマル予測(Conformal prediction)は、予測セットを所望のカバレッジ保証で生成する統計フレームワークである。
我々は、$textitSorted Adaptive Prediction Sets$ (SAPS)という新しいアルゴリズムを提案する。
SAPSは最大ソフトマックス確率を除いて全ての確率値を捨てる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:52:04 GMT)
Token-Level Contrastive Learning with Modality-Aware Prompting for Multimodal Intent Recognition [29.5] マルチモーダルな意図認識の課題に対処するために,TCL-MAP(Modality-Aware prompting)を用いたトークンレベルのコントラスト学習手法を提案する。
提案したTCLは,モダリティを意識したプロンプトとグラウンドの真理ラベルに基づいて,拡張サンプルを構築し,NT-Xent損失をラベルトークンに用いた。
本手法は最先端の手法と比較して顕著な改善を実現している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:10:23 GMT)
Multistep Distillation of Diffusion Models via Moment Matching [29.2] 本稿では,拡散モデルをより高速にサンプル化するための新しい手法を提案する。
本手法は,クリーンデータの条件付き期待値に適合して,多段階拡散モデルを数段階モデルに蒸留する。
我々は、Imagenetデータセット上で、最先端の新たな結果を得る。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:20:21 GMT)
TwinS: Revisiting Non-Stationarity in Multivariate Time Series Forecasting [29.2] 非定常周期分布に対処するTransformer-based TwinSモデルを提案する。
ウェーブレット畳み込みモデルは、ウェーブレットのような畳み込みカーネルサイズをスケールすることで、ネストした期間をモデルとした。
周期認識注意は、畳み込みサブネットワークを通して周期関連スコアを生成することによって注意を誘導する。
Channel-Temporal Mixedは、チャネル時混合学習を通じて時系列間の全体的な関係をキャプチャする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:14:23 GMT)
Step Out and Seek Around: On Warm-Start Training with Incremental Data [28.9] データは、自律運転のような現実世界のディープラーニングアプリケーションにおいて、時間とともに連続的にやってくることが多い。
以前トレーニングされたチェックポイントからのウォームスタートは、知識と高度な学習を維持する最も直感的な方法です。
本稿では、2つの新しいコンポーネントを持つ連続モデル改善アルゴリズムである知識統合・獲得(CKCA)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:12:55 GMT)
PromptFix: Few-shot Backdoor Removal via Adversarial Prompt Tuning [28.8] 事前訓練された言語モデル(PLM)は、この数年間、その非並列なパフォーマンスで大きな注目を集めてきた。
PLMを訓練するコストの上昇と、その驚くべき一般化性は、数発の微調整とプロンプトに共同で貢献している。
しかし、既存の研究では、これらのNLPモデルは、トリガートークンが提示されたときにモデル挙動が操作されるように、バックドア化可能であることが示されている。
本稿では,NLPモデルのバックドア緩和戦略であるPromptFixを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:06:42 GMT)
Harmonious Group Choreography with Trajectory-Controllable Diffusion [28.8] Trajectory-Controllable Diffusion (TCDiff) は、重複しない軌道を利用してコヒーレントなダンスの動きを促進する新しい手法である。
ダンサーの衝突に対処するために,音楽に基づいて複数のダンサーの軌道を生成できるダンス・ビート・ナビゲータを導入する。
フレキシブルなフットワークを実現するために,隣接するフレームからの軌道変位を利用したフットワークアダプタを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:19:12 GMT)
On the Expressive Power of Spectral Invariant Graph Neural Networks [28.6] Eigenspace Projection GNN(EPNN)と呼ばれるスペクトル不変GNNを設計するための統一メッセージパッシングフレームワークを導入する。
EPNNは、従来のスペクトル不変アーキテクチャをすべて統一し、それらが厳密に表現されにくいか、EPNNと同値であることを示す。
より表現力の高いGNNと組み合わせることで、スペクトル特徴を用いることで表現性が向上するかどうかを論じる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:41 GMT)
Take a Step Further: Understanding Page Spray in Linux Kernel Exploitation [28.4] Page Sprayと呼ばれる新しい手法が登場し、カーネルの脆弱性に対するページレベルのエクスプロイトに焦点を当てている。
その根本原因、搾取モデル、他の搾取技術に対する比較利益、および潜在的緩和戦略に関する質問は、ほとんど答えられていない。
この研究は、セキュリティ研究者や開発者がPage Sprayに関する洞察を得るのを支援することを目的としている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:04:06 GMT)
PEMT: Multi-Task Correlation Guided Mixture-of-Experts Enables Parameter-Efficient Transfer Learning [28.4] マルチタスク変換学習に基づくパラメータ効率の高いファインチューニングフレームワークPEMTを提案する。
我々は17のデータセットにまたがる幅広いタスクについて実験を行う。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:11:29 GMT)
Uncovering Limitations of Large Language Models in Information Seeking from Tables [28.2] 本稿では,テーブル情報探索(TabIS)のための信頼性の高いベンチマークを紹介する。
テキスト類似度に基づくメトリクスによる信頼性の低い評価を避けるため、TabISはテキスト生成フォーマットではなく、単一選択の質問フォーマット(質問毎に2つのオプション)を採用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:30:59 GMT)
PairNet: Training with Observed Pairs to Estimate Individual Treatment Effect [28.1] PairNetは、実測結果に基づいて、ペアの例による損失を最小限に抑える、新しいITT推定トレーニング戦略である。
ベースラインに比べてITEエラーが大幅に低い。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:50:16 GMT)
POEM: Interactive Prompt Optimization for Enhancing Multimodal Reasoning of Large Language Models [28.1] 大規模言語モデル(LLM)の効率的なプロンプトエンジニアリングを容易にするビジュアル分析システムであるPOEMを提案する。
本システムは,様々なプロンプトによって引き起こされるマルチモーダル知識を包括的に理解するために,モジュール間の相互作用パターンを様々な詳細レベルで探索することを可能にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:21:30 GMT)
In-Context Unlearning: Language Models as Few Shot Unlearners [28.0] 我々は,Large Language Models (LLMs) のための新しいアンラーニング手法を提案する。
このメソッドは、モデルパラメータを更新することなく、コンテキスト内で特定の種類の入力を提供することで、モデルからインスタンスを解放する。
実験の結果、文脈内アンラーニングは、モデルパラメータへのアクセスを必要とする他の最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:31:08 GMT)
mCSQA: Multilingual Commonsense Reasoning Dataset with Unified Creation Strategy by Language Models and Humans [27.8] 言語固有の知識と常識のためにデータセットをキュレートすることは困難である。
現在の多言語データセットの多くは翻訳によって作成されており、そのような言語固有の側面を評価できない。
CSQAの構築プロセスに基づくマルチ言語コモンセンスQA(mCSQA)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:14:54 GMT)
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories [27.6] 報酬の少ない自律エージェントの訓練は、オンライン強化学習(RL)における長年の問題である
本稿では、オフラインデータを利用した適応軌道微分器(ATraDiff)と呼ばれる生成拡散モデル学習手法を提案する。
ATraDiffは、様々な環境における最先端のパフォーマンスを一貫して達成しており、特に複雑な設定の改善が顕著である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:15 GMT)
CoGenesis: A Framework Collaborating Large and Small Language Models for Secure Context-Aware Instruction Following [27.2] 本稿では,大規模(クラウドインフラストラクチャにホストされている)と小型(ローカルデバイスにデプロイされている)を統合し,論理的にプライバシー問題に対処する協調生成フレームワークを提案する。
1) ユーザコンテキストが提供されると大規模モデルの性能は良好に向上するが,そのようなコンテキストの欠如に苦慮する。
我々のフレームワークは、混合スケールモデルを利用して、競争性能を示し、プライバシー問題に対する実現可能な解決策を提供します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:30:24 GMT)
Variational inference, Mixture of Gaussians, Bayesian Machine Learning [27.2] 変分推論(VI)はベイズ推定において一般的なアプローチである。
この研究は、非ガウスの場合のVIの理論研究に寄与することを目的としている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:38:59 GMT)
TOAD: Task-Oriented Automatic Dialogs with Diverse Response Styles [27.1] タスク指向自動ダイアログ(TOAD: Task-Oriented Automatic Dialogs)は,新規でスケーラブルなTODデータセットである。
TOADデータセットは、現実的なアプリケーションコンテキストのインタラクションをシミュレートし、さまざまなシステムレスポンススタイルオプションを提供する。
我々はTOADを2つの応答生成タスクでベンチマークし、その結果、ユーザ表現ミラーリングなしでより冗長な応答や応答をモデリングすることがより困難であることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:18:11 GMT)
Memorization in deep learning: A survey [26.7] 近年の研究では、Deep Neural Networks(DNN)が一般的なパターンを学習するのではなく、例から特定の詳細を記憶する傾向にある興味深い現象が明らかになった。
これにより、DNNにおける一般化の性質と、セキュリティ侵害に対する感受性に関する批判的な疑問が提起される。
一般化とセキュリティ/プライバシドメインに基づく記憶定義を整理するための体系的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:17:40 GMT)
Decentralized Stochastic Gradient Descent Ascent for Finite-Sum Minimax Problems [26.7] ミニマックス問題は、多くの機械学習モデルに広く応用されているため、近年大きな注目を集めている。
そこで我々は,アセンチュムミニマックス問題に対する分散分散勾配降下法を新たに開発した。
我々の研究は、この種のミニマックス問題に対してそのような理論的複雑さを最初に達成するものである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:06:04 GMT)
NormAd: A Benchmark for Measuring the Cultural Adaptability of Large Language Models [26.6] 我々は75カ国の社会的・文化的規範を表す新しい物語のデータセットであるNormAdを紹介した。
我々は,大規模言語モデルが社会的・文化的文脈の粒度の異なるレベルに適応する能力を評価する。
NormAdデータセットとその関連コードはGitHubでリリースしています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:02:39 GMT)
SilentCipher: Deep Audio Watermarking [26.6] 音声透かしにおける3つの重要な革新を紹介する。
まず、心理音響モデルに基づくしきい値を統合して、知覚不能な透かしを実現する。
次に,psuedo-differentiable compression layerを導入し,透かしアルゴリズムの堅牢性を向上させる。
第三に、知覚的損失を排除し、堅牢性および知覚不能な透かしの両方でSOTAを実現する方法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:58:31 GMT)
Learned Feature Importance Scores for Automated Feature Engineering [26.5] AutoMANは、高精度で低レイテンシを実現し、異種データに拡張可能な、自動機能エンジニアリングフレームワークである。
これは、変換された特徴を明確に示さずに、候補変換空間を効果的に探索することに基づいている。
データセットのタスクターゲットを直接機能エンジニアリングに組み込んで、機能変換の重要性をエンドツーエンドに学習する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:17:00 GMT)
DPN: Decoupling Partition and Navigation for Neural Solvers of Min-max Vehicle Routing Problems [26.5] 本稿では、分割とナビゲーションのための異なる埋め込みを学習する、新しいアテンションベースのパーティション・アンド・ナビゲーション・エンコーダ(P&N)を提案する。
エージェント置換対称損失関数(APS)を開発した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:30:24 GMT)
Bidirectional Autoregressive Diffusion Model for Dance Generation [26.4] 本稿では,双方向自己回帰拡散モデル(BADM)を提案する。
生成したダンスが前方方向と後方方向の両方で調和することを強制するために、双方向エンコーダが構築される。
生成したダンス動作をよりスムーズにするため、局所運動強調のための局所情報デコーダを構築する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:56:56 GMT)
Adaptive Multi-Scale Decomposition Framework for Time Series Forecasting [26.1] 時系列予測(TSF)のための新しい適応型マルチスケール分解(AMD)フレームワークを提案する。
我々のフレームワークは時系列を複数のスケールで異なる時間パターンに分解し、MDM(Multi-Scale Decomposable Mixing)ブロックを活用する。
提案手法は,時間依存性とチャネル依存性の両方を効果的にモデル化し,マルチスケールデータ統合を改良するために自己相関を利用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:27:33 GMT)
Why Has Predicting Downstream Capabilities of Frontier AI Models with Scale Remained Elusive? [26.0] 広範に使用されている複数選択質問応答ベンチマークのスケーリング動作のモデル化が困難であることを示す。
ダウンストリーム性能は、性能とスケールの統計的関係を段階的に低下させる一連の変換によって負のログ確率から計算されることを示す。
計算量の増加に伴う誤った選択に対して、確率質量と確率質量が共起する正しい選択に対する確率質量がどのようにして成立するかを実証的に研究し、誤った選択に対するスケーリング法則が達成可能であることを示唆する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:46:56 GMT)
Bootstrapping Expectiles in Reinforcement Learning [25.8] 多くの古典的強化学習(RL)アルゴリズムは、次の状態への期待を含むベルマン演算子に依存している。
実際にこれは、$L$損失を、批評家にとってより一般的な期待損失に置き換えることによって、非常に簡単にできる。
過大評価問題に対して,提案手法は古典的ツインクリティカルよりも優れた結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:51:39 GMT)
Textual Inversion and Self-supervised Refinement for Radiology Report Generation [25.8] 放射線学レポート作成のためのテキスト・インバージョン・セルフ・教師付きリファインメント(TISR)を提案する。
TISRは、画像を擬似語として表現することで、テキストと画像を同じ空間に投影し、相互モデリングのギャップをなくす。
広範に利用されている2つの公開データセットの実験を行い、様々なベースラインで大幅に改善した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:51:34 GMT)
On The Persona-based Summarization of Domain-Specific Documents [25.8] 本稿では,医療用コーパスを用いて,ドメイン固有の小ファウンデーションLLMを効率的に微調整する手法を提案する。
また,AIによる評価により,要約品質を効果的に評価できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:00:41 GMT)
Neural Collapse for Cross-entropy Class-Imbalanced Learning with Unconstrained ReLU Feature Model [25.6] トレーニングデータセットがクラス不均衡である場合、いくつかのNeural Collapse(NC)プロパティはもはや真実ではない。
本稿では,制約のないReLU特徴量モデルの下で,NCを不均衡状態に一般化し,クロスエントロピー損失の低減を図る。
重みは,各クラスのトレーニングサンプル数によって異なるが,重みはスケールおよび集中型クラス平均値に一致していることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:36:49 GMT)
Better Late Than Never: Formulating and Benchmarking Recommendation Editing [25.5] 本稿では、既知の、不適切なレコメンデーション行動を修正することに焦点を当てたレコメンデーション編集を紹介する。
本稿では, 厳密な修正, 協調的な修正, 集中的な修正の3つの主目的によるレコメンデーション編集の課題を正式に定義する。
ベイジアン・パーソナライズド・ランキング・ロス(Personalized Ranking Loss)を用いたレコメンデーション編集のための簡易かつ効果的なベンチマークを提示する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:44:33 GMT)
Measuring and Reducing LLM Hallucination without Gold-Standard Answers [25.3] 幻覚は 事実的不正確で 説得力のある答えを生み出します
既存の幻覚測定には、ゴールド標準の回答を持つベンチマークデータセットが必要である。
FEWLは、ゴールドスタンダードの回答が欠落しているシナリオ用に特別に設計されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:33:02 GMT)
Unveiling the Tapestry of Consistency in Large Vision-Language Models [25.1] 本研究では,プロンプトの解空間が知識点を中心に回転する際に,大規模視覚言語モデル(LVLM)がどのように機能するかを検討する。
ConBenchツールに基づいて、タペストリーを最初に公開し、以下の結果を得た。
我々は,本論文が研究コミュニティのモデル評価を加速し,一貫性領域の今後の進歩を促進することを願っている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:58:29 GMT)
Don't trust your eyes: on the (un)reliability of feature visualizations [25.0] 自然入力上での通常のネットワーク動作から完全に切り離された任意のパターンを示すために、特徴視覚化をトリックする方法を示す。
次に、標準の無人ネットワークで同様の現象が起こる証拠を提供する。
これは機能ビジュアライゼーションの正当性チェックとして使用できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:05:40 GMT)
UrbanSARFloods: Sentinel-1 SLC-Based Benchmark Dataset for Urban and Open-Area Flood Mapping [24.9] UrbanSARFloodsは、事前処理されたSentinel-1強度データと、洪水前後に取得された干渉コヒーレンス画像を含むデータセットである。
8,879ドルの512times 512$チップで、20のランドカバークラスと18の洪水イベントにまたがって807,500$km2$をカバーしている。
我々はUrbanSARFloodsを用いて、既存の最先端の畳み込みニューラルネットワーク(CNN)を、オープンかつ都市的な洪水領域のセグメンテーションに使用した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:28:43 GMT)
Patchscopes: A Unifying Framework for Inspecting Hidden Representations of Language Models [24.8] 我々は、Patchscopesと呼ばれるフレームワークを導入し、LLMの計算に関する幅広い疑問にどのように答えられるかを示す。
本稿では,従来の表現を語彙空間に投影し,LLMに介入する手法の多くを,このフレームワークの例とみなすことができることを示す。
Patchscopesは、事前検査技術を統一するだけでなく、より有能なモデルを使用してより小さなモデルの表現を説明する、マルチホップ推論エラー修正などの新しい可能性も開放している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:59:58 GMT)
GLINT-RU: Gated Lightweight Intelligent Recurrent Units for Sequential Recommender Systems [24.8] 本稿では,新しい効率的なシーケンシャルレコメンデーションフレームワークGLINT-RUを提案する。
推論速度を加速するために、GRU(Gated Recurrent Units)モジュールを使用する。
我々のフレームワークは、既存のベースラインよりも優れた予測速度と予測精度を実現している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:55:55 GMT)
A Random Matrix Approach to Low-Multilinear-Rank Tensor Approximation [24.6] 本研究では,データテンソルの展開のスペクトルの多次元的挙動を特徴付け,信号の主方向の検出性を決定する関連信号-雑音比を示す。
その結果,非自明な状態下でのマルチリニアSVD (MLSVD) の再構成性能を正確に予測することができた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:22:18 GMT)
Meta-Tuning LLMs to Leverage Lexical Knowledge for Generalizable Language Style Understanding [24.4] 現在の大規模言語モデルは、微調整なしでいくつかの言語スタイルを捉えるのに苦労していることを示す。
我々は,LLMを代表語彙に基づいてメタトレーニングし,それらが微調整されていない新しいスタイルを認識できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:20:45 GMT)
Rolling Diffusion Models [24.3] Rolling Diffusionは、スライディングウィンドウのデノゲーションプロセスを使用する新しいアプローチである。
拡散過程は、後続の列に現れるフレームにより多くのノイズを割り当てることで、時間の経過とともに徐々に悪化する。
テンポラルダイナミクスが複雑である場合、ローリング拡散は標準拡散よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:39:53 GMT)
HORAE: A Domain-Agnostic Modeling Language for Automating Multimodal Service Regulation [24.1] この研究は、マルチモーダル規則をモデル化するための統一仕様言語であるHORAEの設計原則を提示する。
HORAEは、HORAEという名前の細調整された大規模言語モデルをさらに活用することで、インテリジェントなサービス規制パイプラインを促進する方法を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:44:57 GMT)
Large Language Models as Evaluators for Recommendation Explanations [23.9] 我々は,LLMがレコメンデーション・リコメンデーション・リコメンデーションの評価に役立てられるかどうかを検討する。
我々は,評価者ラベルとユーザが提供する真実との相関を計測するために,3段階のメタ評価戦略を設計し,適用する。
本研究は,LLMを評価対象として活用することは,レコメンデーション説明文の評価において,正確かつ再現可能で費用対効果の高いソリューションであることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:31:37 GMT)
Quality-Diversity with Limited Resources [23.9] RefQDはニューラルネットワークを表現部と決定部に分解する。
リソースオーバーヘッドを減らすため、アーカイブ内のすべての決定部分と表現部分を共有する。
サンプル効率のよいQDアルゴリズムと比較すると、同等か良い性能が得られる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:06:00 GMT)
Inv-Adapter: ID Customization Generation via Image Inversion and Lightweight Adapter [23.7] Inv-Adapter は,DDIM 画像の逆変換により事前学習したテキスト・ツー・イメージモデルを用いて,ID 画像の拡散領域表現を抽出する。
抽出したIDの高アライメントとテキスト・ツー・イメージ・モデルの中間的特徴から、それらをベース・テキスト・ツー・イメージ・モデルに効率的に組み込む。
提案したInv-Adapterは,IDのカスタマイズ生成とモデルスケールにおいて高い競争力を持つことを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:59:46 GMT)
Offline Inverse RL: New Solution Concepts and Provably Efficient Algorithms [23.6] 逆強化学習(IRL)は、行動の実証から専門家の報酬機能を回復することを目的としている。
本稿では、オフライン設定の機会と限界を捉えた、実現可能な報酬セットという新しい概念を紹介する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:49:52 GMT)
How to Scale Inverse RL to Large State Spaces? A Provably Efficient Approach [23.6] Inverse Reinforcement Learning (IRL)は、報酬関数の推定を改善するためにサンプルを使用する。
文献で利用可能なアルゴリズムはいずれも大きな状態空間の問題にスケールできないことを示す。
本稿では, 実現可能な集合の概念を一般化する, 報酬相反の新たな枠組みを紹介する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:37:42 GMT)
Refactoring to Pythonic Idioms: A Hybrid Knowledge-Driven Approach Leveraging Large Language Models [23.2] 多くのPythonユーザは、Pythonのイディオムを使うのが難しいと感じている。
規則の決定とLLMの適応性に動機付けられ,我々はハイブリッドアプローチを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:22:46 GMT)
Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents [22.9] ファウンデーションモデルに対応した生成人工知能はエージェントの開発と実装を容易にする。
本稿では、文脈、力、トレードオフを分析した17のアーキテクチャパターンからなるパターンカタログを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:43:15 GMT)
ELFS: Enhancing Label-Free Coreset Selection via Clustering-based Pseudo-Labeling [22.8] 高性能なSOTA(State-of-the-art)コアセット選択手法では,データセット全体に対して基調ラベルが必要となる。
ELFSは,ラベルのない新しいコアセット選択法である。
ELFS は SOTA ラベルのないベースラインより一貫して優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:23:05 GMT)
Beyond Similarity: Personalized Federated Recommendation with Composite Aggregation [22.4] フェデレーションレコメンデーションは、大規模なデバイスからローカルモデルを集約することで、グローバルな知識を集めることを目的としている。
現在の手法は主に、連合視覚コミュニティによって発明された集約関数を利用して、類似したクライアントからのパラメータを集約する。
複合アグリゲーション(FedCA)を用いたパーソナライズド・フェデレーション・レコメンデーション・モデルを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:17:52 GMT)
Federated TrustChain: Blockchain-Enhanced LLM Training and Unlearning [22.3] 大規模言語モデル(LLM)のためのブロックチェーンベースの新しいフェデレーション学習フレームワークを提案する。
我々のフレームワークはブロックチェーン技術を活用して、各モデルのコントリビューションの改ざん防止記録を作成し、フェデレートされた学習メカニズムをシームレスに統合する革新的なアンラーニング機能を導入しています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:44:44 GMT)
CityLight: A Universal Model Towards Real-world City-scale Traffic Signal Control Coordination [22.3] 交通信号制御(TSC)は、既存の道路インフラに影響を与えることなく、交通効率を高めるための安価な手段である。
都市交通管理にTSCを適用させるため,都市規模高速道路網におけるTSC調整を目標とした。
本稿では,パラメータ共有MAPPOに基づく最適化手法であるCityLightを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:57:09 GMT)
Towards Minimax Optimality of Model-based Robust Reinforcement Learning [22.2] EmphRobust discounted Markov Decision Processes (RMDPs) における$epsilon$-optimal Policy のサンプル複雑性について検討した。
この問題は、非ロバストの場合において広く研究されており、$tildemathcalO(fracH4mid S mid2mid A midepsilon2)$サンプルが$epsilon$-Optimal Policyを提供し、最小限最適である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:32:02 GMT)
Frequency-based Matcher for Long-tailed Semantic Segmentation [22.2] 我々は、比較的未探索なタスク設定、長い尾のセマンティックセマンティックセグメンテーション(LTSS)に焦点を当てる。
本稿では,セマンティックセグメンテーション手法と長鎖解の性能を示すために,二値評価システムを提案し,LTSSベンチマークを構築した。
また,1対1のマッチングによって過剰な圧縮問題を解決する周波数ベースのマーカであるLTSSを改善するトランスフォーマーベースのアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:57:56 GMT)
GeoGen: Geometry-Aware Generative Modeling via Signed Distance Functions [22.1] 単一ビューコレクションから3次元形状と画像を合成するための新しい生成手法を提案する。
ニューラルラディアンス場を用いたボリュームレンダリングを用いることで、生成した幾何学はノイズが多く、制約がないという重要な制限を継承する。
エンド・ツー・エンドで訓練された新しいSDFベースの3D生成モデルであるGeoGenを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:00:10 GMT)
LEIA: Facilitating Cross-lingual Knowledge Transfer in Language Models with Entity-based Data Augmentation [22.0] 言語間で整列したウィキペディアのエンティティ名を利用する言語適応チューニング手法であるLEIAを紹介する。
この方法は、ターゲット言語コーパスを英語のエンティティ名で拡張し、左から右への言語モデリングを用いてモデルを訓練することを含む。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:30:59 GMT)
STAR: Constraint LoRA with Dynamic Active Learning for Data-Efficient Fine-Tuning of Large Language Models [21.9] 我々は不確実性に基づくアクティブラーニングとLoRAを統合する新しい手法を提案する。
不確実性ギャップについて、ベースモデルの不確実性とフルモデルの不確実性を組み合わせた動的不確実性測定を導入する。
モデルのキャリブレーションが不十分な場合、LoRAトレーニング中に正規化手法を導入し、モデルが過度に信頼されないようにする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:31:39 GMT)
DINER: Debiasing Aspect-based Sentiment Analysis with Multi-variable Causal Inference [21.9] 本稿では,多変量因果推論に基づく新しいフレームワークを提案する。
レビューブランチでは、バイアスはコンテキストからの間接的なコンバウンドとしてモデル化される。
アスペクトブランチでは、バイアスはラベルとの直接的な相関として記述される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:27:33 GMT)
On the Last-Iterate Convergence of Shuffling Gradient Methods [21.9] 対象値に関して勾配法をシャッフルする際の最終点収束率を初めて証明する。
我々の結果は、(ほぼ)既存のラストイテレートの下限と一致するか、あるいは、平均的なイテレートの前の最高の上限と同速である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:52:22 GMT)
NoisyGL: A Comprehensive Benchmark for Graph Neural Networks under Label Noise [21.7] グラフニューラルネットワーク(GNN)は、メッセージパッシング機構を通じてノード分類タスクにおいて強力なポテンシャルを示す。
ラベルノイズは実世界のグラフデータによく見られ、トレーニング中に誤った情報を伝播することでGNNに悪影響を及ぼす。
ラベルノイズ下でのグラフニューラルネットワークの総合ベンチマークであるNoisyGLを紹介する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:45:00 GMT)
RepCodec: A Speech Representation Codec for Speech Tokenization [21.6] RepCodecは意味的音声トークン化のための新しい表現である。
RepCodecは、音声認識と生成の両方において広く使われているk-meansクラスタリング手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:36:46 GMT)
Linear Opinion Pooling for Uncertainty Quantification on Graphs [21.6] 本稿では,ディリクレ分布の混合による不確実性を表す新しい手法を提案する。
このアプローチの有効性は、様々なグラフ構造化データセットに関する一連の実験で実証されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:10:37 GMT)
Step-aware Preference Optimization: Aligning Preference with Denoising Performance at Each Step [21.6] テキストと画像の拡散モデルと人間の好みを一致させるためのステップアウェア優先最適化(SPO)を提案する。
SPOは、ステップ認識選好モデルとステップワイズリサンプラーを用いて、各ステップにおける復調性能を独立して評価し、調整する。
安定拡散v1.5およびSDXLによる実験により,SPOは最新の拡散DPOよりも著しく優れていることが示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:57:09 GMT)
Through the Lens of Split Vote: Exploring Disagreement, Difficulty and Calibration in Legal Case Outcome Classification [21.6] 法的決定では、裁判官が全会一致の判断を下すことができない場合に、分割票(SV)が発生する。
本稿では、自然に観察できる人間の不一致と価値の多元性として、分割投票を考察する。
我々の知る限り、法的NLPにおける人間の判断に対する校正の体系的な調査はこれが初めてである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:53:50 GMT)
Enhancing In-Context Learning Performance with just SVD-Based Weight Pruning: A Theoretical Perspective [21.4] 本稿では,SVDを用いた軽量刈り込みによりICL性能が向上するエキサイティングな現象を示す。
In this proposed a simple, model-compression and derivative-free algorithm for downstream task in enhance ICL inference。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:15:35 GMT)
ConsistencyTTA: Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation [21.3] 拡散モデルは、世代毎の根底にあるデノナイジングネットワークへのクエリ数が過度に多いため、遅い推論に悩まされる。
本稿では,1つの非自己回帰型ネットワーククエリのみを必要とするフレームワークであるConsistencyTTAを紹介する。
そこで我々は「CFG対応潜時整合モデル」を提案し, 整合性生成を潜時空間に適応させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:32:00 GMT)
CMFeed: A Benchmark Dataset for Controllable Multimodal Feedback Synthesis [21.2] 制御可能なマルチモーダルフィードバック合成(CMFeed)データセットは、マルチモーダル入力からの感情制御フィードバックの生成を可能にする。
本稿では,エンコーダ,デコーダ,制御性モジュールからなるベンチマークフィードバック合成システムを提案する。
トランスフォーマーと高速なR-CNNネットワークを使用して特徴を抽出し、感情固有のフィードバックを生成し、感情分類精度は77.23%に達する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:26:26 GMT)
Towards Principled Superhuman AI for Multiplayer Symmetric Games [21.2] マルチプレイヤーゲームでは、プレイヤー数が2人を超えると、固有の課題が提示される。
これらの課題は、平衡が不均一であることと、エージェントのリスクが極めて過度に作用することから生じる。
本稿では,マルチプレイヤー対称正規形式ゲームにおいて,両課題を実証的に解決することで,これらの課題を解決するための第一歩を踏み出す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:59:17 GMT)
Exploiting Code Symmetries for Learning Program Semantics [21.1] コード対称性をセマンティクス保存変換として定義するグループ理論フレームワークを導入する。
プログラム依存グラフ上に定義された置換群から符号対称性に即時同値な自己意図の新たな変種を開発する。
この結果から,コード対称性群を経由したコード構造を符号化するコードLLMが,より高速に一般化されることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:35:20 GMT)
Everywhere & Nowhere: Envisioning a Computing Continuum for Science [21.1] 新たなデータ駆動科学は、分散データソースを活用して、エンドツーエンドの現象を理解し、実験を推進し、重要な意思決定を促進することを目指している。
本稿では,エッジ,コア,中間のリソースにまたがる,どこにでもある,どこにでもあるコンピューティングについて検討し,科学を支援するための抽象化を提供する。
また、どんなデータをいつどこで処理すべきかを表現できるプログラミング抽象化の最近の研究や、リソースの発見とそれらのリソースをまたいだ計算のオーケストレーションを自動化する自律型サービスも紹介されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:07:31 GMT)
Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning [21.0] 検索強化キャプションモデルSmallCapのロバスト性を解析した。
より多様な集合から抽出したキャプションを抽出してモデルを訓練することを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:59:03 GMT)
Characterizing Similarities and Divergences in Conversational Tones in Humans and LLMs by Sampling with People [21.0] 本稿では,会話のトーンと文を同時に抽出する反復的手法を提案する。
我々は,人間の会話音とGPT-4の関係を解釈可能な表現するために,我々のアプローチをどのように利用できるかを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:26:00 GMT)
Unleashing Generalization of End-to-End Autonomous Driving with Controllable Long Video Generation [20.9] 空間的整合性を高めるために,多視点にわたって共有ノイズモデリング機構を備えた拡散型長ビデオ生成手法を提案する。
本手法は,最先端の手法に比べて約5倍長くなる一貫性を損なうことなく,最大40フレームの映像を生成することができる。
我々のフレームワークは、認識と予測タスクを超えて、エンド・ツー・エンドの自動運転モデルの計画性能を25%向上させることができます。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:39:50 GMT)
Sparsity-Accelerated Training for Large Language Models [20.9] 大規模言語モデル (LLM) は様々な自然言語処理 (NLP) タスクの習熟度を示した。
LLMは、連続的な事前訓練や教師付き微調整など、追加の訓練を必要とすることが多い。
本稿では,この学習プロセスの迅速化のために,事前学習したLLMのエンハンスパシティを活用することを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:38:34 GMT)
Improving Physics-Augmented Continuum Neural Radiance Field-Based Geometry-Agnostic System Identification with Lagrangian Particle Optimization [20.6] 幾何学に依存しないシステム識別(Geometry-Agnostic System Identification)は、幾何学的な仮定なしにビデオシーケンスから物体の幾何学的特性と物理的性質を識別する技術である。
近年, 物理学強化連続神経放射場 (PAC-NeRF) が, この手法の有望な結果を示している。
ラグランジアン粒子最適化(LPO)を提案し,ラグランジアン空間の映像系列を用いて粒子の位置と特徴を最適化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:17:33 GMT)
Safety Alignment in NLP Tasks: Weakly Aligned Summarization as an In-Context Attack [20.6] メインストリームNLPタスクは安全配慮に適切に適合しているか?
本研究は, 各種NLPタスクの安全性の相違について明らかにした。
セキュリティアライメントの弱いタスクを悪用するアタックは、従来より堅牢と考えられていたタスクの整合性を損なう可能性がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:58:32 GMT)
FastDrag: Manipulate Anything in One Step [20.5] 本稿では,FastDragというワンステップのドラッグベースの画像編集手法を導入し,編集プロセスの高速化を図る。
この革新は1段階の遅延セマンティック最適化を実現し、編集速度を大幅に向上させる。
私たちのFastDragはDragBenchデータセットで検証されています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:42:09 GMT)
A Survey on 3D Human Avatar Modeling -- From Reconstruction to Generation [20.3] 多くの現実世界のアプリケーションの中核に位置する3Dヒューマンモデリングは、大きな注目を集めている。
本調査は,3次元アバターモデリングの新技術の概要を明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:58:00 GMT)
ERA-CoT: Improving Chain-of-Thought through Entity Relationship Analysis [20.2] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて、賞賛できる成果を達成している。
これらの課題は、多段階の推論を必要とする暗黙の関係の存在から生じる。
本稿では,エンティティ間の関係を捉えることで,LLMのコンテキスト理解を支援する新しいアプローチであるERA-CoTを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:54:56 GMT)
On the Trade-off between Redundancy and Local Coherence in Summarization [20.2] 抽出した要約文の相互結合と冗長性の制御を目的とした場合のトレードオフについて検討する。
提案した非教師システムでは,文書の冗長性のレベルによって,密集度の高い要約を抽出できることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:27:20 GMT)
A + B: A General Generator-Reader Framework for Optimizing LLMs to Unleash Synergy Potential [20.1] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)に必要な知識を補う効果的なソリューションである。
LLM自体から生成する検索段階を置き換えるために、"generate-then-read"パイプラインが提案されている。
本稿では,基礎モデルと型の組み合わせの異なる一般的な「A + B」フレームワークを体系的な調査のために形式化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:14:27 GMT)
LenslessFace: An End-to-End Optimized Lensless System for Privacy-Preserving Face Verification [20.1] レンズレスカメラは光を直接センサーにエンコードし、すぐに認識できない画像を生成する。
本稿では、符号化レンズレスキャプチャー上で直接、プライバシー保護顔認証のためのエンドツーエンド最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:50:15 GMT)
GNNAnatomy: Systematic Generation and Evaluation of Multi-Level Explanations for Graph Neural Networks [20.1] グラフニューラルネットワーク(GNN)は、ノード/グラフ分類やリンク予測といったグラフを含むさまざまな機械学習(ML)タスクにおいて、非常に有効であることが証明されている。
GNNによる決定を説明すると、グラフ構造に基づく集約された関係情報が複雑なデータ変換をもたらすため、課題が生じる。
モデルおよびデータセットに依存しない視覚分析システムであるGNNAnatomyを導入し、GNNのマルチレベル説明の生成と評価を容易にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:09:54 GMT)
HackAtari: Atari Learning Environments for Robust and Continual Reinforcement Learning [20.0] 強化学習(Reinforcement Learning, RL)は、新奇性を探索の手段として活用するが、エージェントはしばしば新しい状況を扱うのに苦労する。
我々は最も一般的なRLベンチマークであるAtari Learning Environmentに制御ノベルティを導入したフレームワークであるHackAtariを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:17:05 GMT)
Enhanced Language Model Truthfulness with Learnable Intervention and Uncertainty Expression [19.7] 大きな言語モデル(LLM)は長文で一貫性のあるテキストを生成することができるが、事実を幻覚させることが多い。
真性最適化のための学習可能なインターベンション手法であるLITOを提案する。
複数のLLMと質問応答データセットの実験は、LITOがタスク精度を維持しながら真理性を改善することを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:32:15 GMT)
Attribute-Aware Implicit Modality Alignment for Text Attribute Person Search [19.6] 本稿では,テキスト属性と画像間の局所的な表現の対応を学習するためのAIMA(Attribute-Aware Implicit Modality Alignment)フレームワークを提案する。
提案手法は,現在の最先端手法をはるかに上回ることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:34:42 GMT)
Towards Dynamic Trend Filtering through Trend Point Detection with Reinforcement Learning [19.5] 我々はマルコフ決定過程(MDP)として定式化されたトレンドポイント検出を提案する。
我々はこれらの重要な点を動的トレンドポイント(DTP)と呼び、それらを補間することでトレンドを抽出する。
DTF-netは、他のトレンドフィルタリングアルゴリズムと比較して、急激な変化を捉えるのに優れていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:50:22 GMT)
Benchmarking General Purpose In-Context Learning [19.4] インコンテキスト学習(ICL)は、AIコミュニティにますますアピールしている。
ICLを拡張して、幅広いタスクに対応し、学習の地平を広げることを目指しています。
GPICLの機能のトレーニングと評価に特化して開発されたベンチマークを2つ導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:18:17 GMT)
Open-Endedness is Essential for Artificial Superhuman Intelligence [19.4] 我々は,人間の観察者に対して,AIシステムにおける開放性を達成するための材料が現在存在することを論じる。
我々は、一般の能力を持つオープンAIの安全性への影響を検証して結論付ける。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:15:02 GMT)
RA-ISF: Learning to Answer and Understand from Retrieval Augmentation via Iterative Self-Feedback [19.3] 大規模言語モデル(LLM)は多くのタスクにおいて例外的な性能を示すが、それでもパラメータに格納された知識に大きく依存している。
Retrieval-augmented Generation (RAG)メソッドは、外部知識を統合することでこの問題に対処する。
本稿では、反復的にタスクを分解し、3つのサブモジュールで処理し、モデルの問題解決能力を向上するフレームワークであるRetrieval Augmented Iterative Self-Feedback (RA-ISF)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:55:36 GMT)
Decoupled Alignment for Robust Plug-and-Play Adaptation [19.1] 教師付き微調整(SFT)や人間フィードバックからの強化学習(RLHF)を必要とせずに,大規模言語モデル(LLM)を整列させる低リソース安全性向上手法を提案する。
本研究の主な目的は、知識蒸留を利用して、既存のよく整合したLLMからアライメント情報を抽出し、プラグイン・アンド・プレイ方式で非整合なLLMに統合することである。
有害な質問データセットでは, 平均防御成功率が約14.41%向上し, 51.39%に達した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:25:40 GMT)
XL-HeadTags: Leveraging Multimodal Retrieval Augmentation for the Multilingual Generation of News Headlines and Tags [19.1] 見出しとエンティティ(トピック)タグは、読者にコンテンツが彼らの時間に値するかどうかを判断するために不可欠である。
記事に埋め込まれた画像やキャプションなどの補助情報を利用して関連文の検索を行う。
我々はXL-HeadTagsというデータセットをコンパイルした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:40:19 GMT)
Threads of Subtlety: Detecting Machine-Generated Texts Through Discourse Motifs [19.1] 人造テキストと機械生成テキストの境界線は、ますますぼやけつつある。
本稿は,人間によって書かれたテキストにおいて,識別可能な言語的特徴と独特な言語的特性を識別する調査について述べる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:04:52 GMT)
3rd Place Solution for PVUW Challenge 2024: Video Panoptic Segmentation [19.1] 追加の手法によって補足されたクエリワイドアンサンブルを中心にした包括的アプローチを導入する。
提案手法はVIPSegテストセットのVPQスコア57.01を達成し,第3回Pixelレベルビデオ理解チャレンジのVPSトラックで3位にランクインした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:22:56 GMT)
Data Measurements for Decentralized Data Markets [19.0] 分散データ市場は、機械学習のためのより公平なデータ取得を提供することができる。
我々は、データ購入者が関連する多様なデータセットを持つ売り手を見つけることができるように、フェデレートされたデータ測定をベンチマークして提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:03:51 GMT)
Recovering document annotations for sentence-level bitext [18.9] 我々は、ドイツ語、フランス語、スペイン語、イタリア語、ポーランド語、ポルトガル語の3つのデータセットの文書レベルの情報を再構築する。
本稿では,従来のbitextフィルタに代わる文書レベルのフィルタリング手法を提案する。
最後に、これらの長い文脈でモデルをトレーニングし、文章レベルの翻訳を劣化させることなく文書レベルの翻訳を改善することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:58:14 GMT)
Transformers need glasses! Information over-squashing in language tasks [18.8] 復号器のみの変換器における情報伝達について検討する。
変換器への入力の特定のシーケンスは、最終的なトークンにおいて任意にクローズな表現が得られることを示す。
また,デコーダのみのトランスフォーマー言語モデルでは,入力中の特定のトークンに対する感度が低下することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:14:44 GMT)
SplineCam: Exact Visualization and Characterization of Deep Network Geometry and Decision Boundaries [18.8] SplineCamはサンプリングやアーキテクチャの単純化といった近似を使わずにDNs幾何を計算する。
SplineCamは、アーキテクチャを比較し、一般化可能性を測定し、多様体上の決定境界からサンプルを抽出することを可能にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:40:04 GMT)
Are We Done with MMLU? [18.7] 我々は、人気のあるMassive Multitask Language Understandingベンチマークでエラーを特定し、分析する。
例えば、Virologyサブセットで分析された質問の57%にエラーが含まれていることがわかった。
MMLU-Reduxは,30名のMMLU被験者を対象に,手動で書き直した3000の質問のサブセットである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:49:06 GMT)
Evaluating Large Language Models for Health-related Queries with Presuppositions [18.7] UPHILLは健康関連クエリーからなるデータセットで、予測の度合いは様々である。
InstructGPT, ChatGPT, BingChatモデルの実際の精度と一貫性を評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:27:29 GMT)
Transfer Learning for Latent Variable Network Models [18.3] 潜在変数ネットワークモデルにおける推定のための伝達学習について検討する。
潜伏変数が共有されている場合、エラーの消滅が可能であることを示す。
我々のアルゴリズムは、$o(1)$エラーを達成し、ソースやターゲットネットワーク上でパラメトリック形式を仮定しない。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:13:41 GMT)
Adaptive Layer Splitting for Wireless LLM Inference in Edge Computing: A Model-Based Reinforcement Learning Approach [18.2] 本研究では、モデルベース強化学習(MBRL)からインスピレーションを得て、エッジとユーザ機器(UE)間の最適分割点を決定するフレームワークを提案する。
報酬代理モデルを導入することで、頻繁な性能評価の計算コストを大幅に削減できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:07:59 GMT)
BadRAG: Identifying Vulnerabilities in Retrieval Augmented Generation of Large Language Models [18.1] 大規模言語モデル(LLM)は時代遅れの情報と誤ったデータを生成する傾向によって制約される。
Retrieval-Augmented Generation (RAG) は、検索手法の強みと生成モデルを組み合わせることで、これらの制限に対処する。
RAG は LLM に対する新たな攻撃面を導入している。特に RAG データベースは Web などの公開データからしばしば引き出されるためである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:38:42 GMT)
Differentiable Combinatorial Scheduling at Scale [18.1] 本稿では,Gumbel-Softmax微分可能なサンプリング手法を用いて,微分可能なスケジューリングフレームワークを提案する。
スケジューリングタスクの不等式制約をエンコードするために,任意の不等式制約を積極的にエンコードするテキスト制約付きGumbel Trickを導入する。
本手法は, トレーニングデータを必要とせずに, 勾配降下による効率よく, スケーラブルなスケジューリングを容易にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:09:39 GMT)
Decay Pruning Method: Smooth Pruning With a Self-Rectifying Procedure [18.0] Decay Pruning Method (DPM) は自己修正機構を備えた新しいスムーズプルーニング手法である。
DPMは2つのキーコンポーネントから構成される: (i) Smooth Pruning: 従来のシングルステッププルーニングをマルチステップスムーズプルーニングに変換する。
自己修正: この手順は、勾配情報に基づく準最適プルーニングの修正により、上記のプロセスをさらに強化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:14:32 GMT)
Addressing Order Sensitivity of In-Context Demonstration Examples in Causal Language Models [18.0] インコンテクスト学習は、インコンテクストの実例の順序に大きく影響される。
情報拡張・一貫性強化手法と呼ばれる教師なしの微調整手法を導入する。
提案手法は,文脈内サンプルの順序に対するCausalLMsの感度を低減し,堅牢な一般化性を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:01:09 GMT)
Evaluating Quantized Large Language Models [17.9] 学習後量子化(PTQ)は,大規模言語モデル(LLM)のコスト削減のための有望な手法として登場した。
本稿では,PTQがOPT, LLaMA2, Falcon, Bloomz, Mistral, ChatGLM, Vicuna, LongChat, StableLM, Gemma, Mambaを含む11種類のモデルファミリに与える影響を評価することにより,これらの因子の徹底的な評価を行う。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:30:44 GMT)
Automatic Bug Detection in LLM-Powered Text-Based Games Using LLMs [17.8] 大規模言語モデル(LLM)はインタラクティブなゲームデザインに革命をもたらし、動的プロットラインとプレイヤーとNPC間の相互作用を可能にしている。
LLMは幻覚、忘れやすさ、プロンプトの誤解釈などの欠陥を示し、論理的な矛盾や意図された設計からの予期せぬ逸脱を引き起こす可能性がある。
ゲームログからこのようなバグを自動的に識別するシステム LLM ベースの手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:11:08 GMT)
HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models [17.8] HoneyBeeは、マルチモーダルオンコロジーデータセットを構築するためのスケーラブルなモジュラーフレームワークである。
生の医療データに欠かせない特徴や関係を捉えた埋め込みを生成する。
HoneyBeeは、現在進行中のオープンソース活動であり、コード、データセット、モデルは、プロジェクトリポジトリで利用可能である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:23:48 GMT)
From Tissue Plane to Organ World: A Benchmark Dataset for Multimodal Biomedical Image Registration using Deep Co-Attention Networks [17.7] 組織と臓器の登録は、特定の組織学的セクションがヒトの臓器のごく一部しか取得できないため、追加の課題となる。
私たちは、さまざまな機関からソースを得たATOMベンチマークデータセットを作成し、この課題を機械学習問題に変換することを目的としています。
RegisMCANモデルの性能は,臓器画像から抽出した部分領域が全体の3次元体積内からどこから抽出されたのかを正確に予測する深層学習の可能性を示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:21:15 GMT)
Multivector Neurons: Better and Faster O(n)-Equivariant Clifford Graph Neural Networks [17.7] 本研究では,クリフォード・マルチベクタに基づく新しいメッセージパッシンググラフニューラルネットワーク(GNN)を試作する。
我々はNボディデータセットの最先端エラーを0.0035にプッシュし、最近の手法よりも8%改善した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:17:44 GMT)
C^2RV: Cross-Regional and Cross-View Learning for Sparse-View CBCT Reconstruction [17.5] コーンビームCT(CBCT)は医療現場で広く用いられている画像技術である。
コーン状X線による測定により, CBCTの復元が困難になる。
本稿では,3次元空間におけるクロスリージョン学習を実現するために,明示的なマルチスケールボリューム表現を活用してC2RVを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:37:56 GMT)
PowerPeeler: A Precise and General Dynamic Deobfuscation Method for PowerShell Scripts [17.4] サイバー攻撃者は、悪意のあるスクリプトを難読化するために様々なテクニックを使うことが多い。
既存の難読化ツールは静的解析の限界に悩まされている。
PowerPeelerは、命令レベルでの最初の動的スクリプトの難読化アプローチである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:55:50 GMT)
Chain of Thoughtlessness? An Analysis of CoT in Planning [17.3] 推論問題におけるLLM(Large Language Model)のパフォーマンスは通常、分布から一般化しない。
本稿では,古典的計画領域であるBlocksworldの問題に対する思考連鎖のケーススタディを示す。
それらのプロンプトが問題クラスに特有である場合、一連の思考プロンプトから有意義なパフォーマンス改善が得られます。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:44:52 GMT)
PCART: Automated Repair of Python API Parameter Compatibility Issues [17.2] Pythonのサードパーティライブラリは、特にディープラーニングや科学計算といった分野において、重要になっている。
サードパーティライブラリのAPIパラメータは進化の過程で頻繁に変更され、特定のバージョンに依存するクライアントアプリケーションの互換性の問題が発生する。
Python APIパラメータの互換性問題を自動的に検出し、修復するツールはありません。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:15:12 GMT)
Prototypical Reward Network for Data-Efficient RLHF [17.2] RLHF(Reinforcement Learning from Human Feedback)の報奨モデルが大規模言語モデル(LLM)の微調整に有効であることが証明された。
提案するフレームワークであるProto-RMは,人間からのフィードバックに制限された報酬モデルを改善するために,プロトタイプネットワークを活用している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:23:30 GMT)
Light-PEFT: Lightening Parameter-Efficient Fine-Tuning via Early Pruning [17.0] 本稿では,基礎モデルの仮設初期計画とPEFTの多官能初期計画の2つの手法を含むLight-PEFTフレームワークを提案する。
PEFT法を直接利用するのに対し、Light-PEFTはトレーニングと推論の高速化を実現し、メモリ使用量を削減し、同等のパフォーマンスを維持する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:03:29 GMT)
XFT: Unlocking the Power of Code Instruction Tuning by Simply Merging Upcycled Mixture-of-Experts [16.9] XFTは、命令調整型大規模言語モデル(LLM)の性能限界を解き放つための、シンプルだが強力なトレーニングスキームである。
XFTはHumanEval+を13%改善し、MBPP+、MultiPL-E、DS-1000で2%から13%改善した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:18:21 GMT)
Local Causal Structure Learning in the Presence of Latent Variables [16.9] 本稿では,変数がターゲットの直接的な原因や効果であるかどうかを判定する原理的手法を提案する。
実世界の合成データと実世界のデータによる実験結果から,本手法の有効性と有効性について検証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:44:36 GMT)
To Distill or Not to Distill? On the Robustness of Robust Knowledge Distillation [16.7] 現在の多言語ASRモデルは計算集約的であり、適切な総合的な評価を欠いている。
我々は、大きな教師モデルからより効率的なより小さな学生の変種に知識を蒸留する。
最もよく蒸留されたモデル全体の性能(45.0$% WER)は、SoTAモデルの2倍の大きさである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:11:53 GMT)
Generalization-Enhanced Code Vulnerability Detection via Multi-Task Instruction Fine-Tuning [16.5] VulLLMは、マルチタスク学習をLarge Language Models (LLM)と統合して、ディープシークな脆弱性機能を効果的にマイニングする新しいフレームワークである。
6つの大きなデータセットで実施された実験は、VulLLMが有効性、一般化、堅牢性という観点から7つの最先端モデルを上回ることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:29:05 GMT)
Multidimensional Quantum Generative Modeling by Quantum Hartley Transform [16.3] 我々はハートレー核関数の指数的に増加する正則基底に基づいて量子モデルを構築するためのアプローチを開発する。
その結果、発達した量子ハートレーモデルは、規模が大きくなるにつれて生成AIに対して異なる量子アプローチを提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:42:09 GMT)
Interpretable Lightweight Transformer via Unrolling of Learned Graph Smoothness Priors [16.0] 我々は反復最適化アルゴリズムをアンロールすることで、解釈可能で軽量なトランスフォーマーのようなニューラルネットワークを構築する。
正規化信号依存グラフ学習モジュールは、従来の変圧器の基本自己保持機構の変種に相当する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:01:28 GMT)
FLUID-LLM: Learning Computational Fluid Dynamics with Spatiotemporal-aware Large Language Models [16.0] 大規模言語モデル(LLM)は、顕著なパターン認識と推論能力を示している。
FLUID-LLMは,非定常流体力学を予測するために,事前学習LLMと事前認識符号化を組み合わせた新しいフレームワークである。
この結果から,FLUID-LLMは時間情報を事前学習したLLMに効果的に統合し,CFDタスク性能を向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:55:40 GMT)
Knowledge-to-SQL: Enhancing SQL Generation with Data Expert LLM [15.9] 既存のメソッドは、クエリを生成するための大規模言語モデル(LLM)の包括的な機能に依存している。
我々は,すべてのテキスト・トゥ・モデルに対して適切な知識を利用する知識・ツー・データ・エキスパート・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:56:59 GMT)
Continual Counting with Gradual Privacy Expiration [15.9] 提案アルゴリズムは,大規模なプライバシー有効期限関数に対して,O(log(T)/epsilon)$の加算誤差を実現する。
我々の経験的評価は、自然ベースラインアルゴリズムよりも大きな値の$d$に対する経験的プライバシ損失が著しく小さく、徐々に増加するプライバシー損失を達成していることを示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:20:16 GMT)
When is Tree Search Useful for LLM Planning? It Depends on the Discriminator [15.8] 大規模言語モデル(LLM)は、ジェネレータ、識別器、計画方法という3つのコンポーネントを持つ言語エージェントフレームワークの下で、多段階の問題を解決する。
本稿では,先進的な計画手法を用いて,識別精度がエージェント全体の性能に与える影響を包括的に分析する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:55:40 GMT)
Untrained Neural Nets for Snapshot Compressive Imaging: Theory and Algorithms [15.5] スナップショット圧縮イメージング(SCI)は、単一の2次元計測から高次元(3D)データキューブを復元する。
本稿では、DIP(Deep Image prior)などの未学習ニューラルネットワーク(UNN)を用いたSCI回復アルゴリズムに着目し、ソース構造をモデル化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:22:43 GMT)
Estimating the Level of Dialectness Predicts Interannotator Agreement in Multi-dialect Arabic Datasets [15.5] アラビアレベル・オブ・ダイアレクトネス(ALDi)スコアとアノテータのデータセットに関する合意との関係を解析した。
各サンプルの方言の母語話者に対して高いALDiスコアのルーティングサンプルを優先順位付けすることを推奨する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:32:45 GMT)
Catapults in SGD: spikes in the training loss and their impact on generalization through feature learning [15.4] 我々は、勾配降下の訓練損失(SGD)のスパイクが「触媒」であることを示す。
我々は,カタパルトが真の予測器の平均勾配外積(AGOP)との整合性を高めて特徴学習を促進することを示す。
SGDのバッチサイズが小さくなれば、より多くのカタパルトが発生し、AGOPアライメントとテスト性能が向上する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:57:32 GMT)
Credit Card Fraud Detection Using Advanced Transformer Model [15.3] 本研究は、より堅牢で正確な不正検出のための最新のTransformerモデルの革新的な応用に焦点を当てる。
データソースを慎重に処理し、データセットのバランスをとり、データの分散性の問題に対処しました。
我々は、SVM(Support Vector Machine)、ランダムフォレスト(Random Forest)、ニューラルネットワーク(Neural Network)、ロジスティック回帰(Logistic Regression)など、広く採用されているいくつかのモデルと性能比較を行った。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:12:57 GMT)
TESTEVAL: Benchmarking Large Language Models for Test Case Generation [15.3] 大規模言語モデル(LLM)を用いたテストケース生成のための新しいベンチマークであるTESTEVALを提案する。
オンラインプログラミングプラットフォームLeetCodeから210のPythonプログラムを収集し、全体的なカバレッジ、ターゲットライン/ブランチカバレッジ、ターゲットパスカバレッジという3つの異なるタスクを設計します。
特定のプログラム行/ブランチ/パスをカバーするテストケースを生成することは、現在のLLMでは依然として困難である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:07:50 GMT)
Deep Networks Always Grok and Here is Why [15.3] グローキング(英: Grokking)または遅延一般化(英: delay generalization)とは、ディープニューラルネットワーク(DNN)における一般化が、ほぼゼロのトレーニングエラーを達成してから長く経過する現象である。
我々は、グルーキングが実際ずっと広く、幅広い実践的な設定で実現されていることを実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:33:15 GMT)
Learning Optimal Linear Precoding for Cell-Free Massive MIMO with GNN [15.3] 実用的なシステムで要求される1~2ミリ秒の時間予算で計算できるグラフニューラルネットワーク(GNN)を開発した。
本稿では,AP と UE の数が異なる様々なシナリオにおいて,ほぼ最適なスペクトル効率を実現することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:29:33 GMT)
Spiking CenterNet: A Distillation-boosted Spiking Neural Network for Object Detection [15.0] スパイキングニューラルネットワーク(SNN)はこの課題に対処するための有望なアプローチである。
本稿では,イベントデータに対するオブジェクト検出のためのSpking CenterNetを提案する。
我々の研究は、スパイク物体検出の分野で知識蒸留を利用する最初のアプローチである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:26:55 GMT)
Proofread: Fixes All Errors with One Tap [14.8] 本稿では,サーバサイドのLarge Language Models (LLM) を利用した新しいGboard機能であるProofreadを紹介する。
本稿では,データ生成からメトリクス設計,モデルチューニング,デプロイメントに至るまで,完全なシステムについて述べる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:38:08 GMT)
A Multitask Training Approach to Enhance Whisper with Contextual Biasing and Open-Vocabulary Keyword Spotting [14.7] キーワードスポッティング強化Whisper(KWS-Whisper)を導入し,ユーザ定義された名前付きエンティティを認識する。
モデル最適化のために,OV-KWSとコンテキストASRタスクを学習するマルチタスク学習手法を提案する。
我々は,OV-KWS が ASR 誤り訂正法と凍結ウィスパーモデルを強化するためのプラグイン・アンド・プレイモジュールであることが実証された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:18:10 GMT)
Motion-aware Dynamic Graph Neural Network for Video Compressive Sensing [14.7] ビデオスナップショットイメージング(SCI)は、2D検出器を使用してシーケンシャルなビデオフレームをキャプチャし、それらを1つの測定値に圧縮する。
既存の再建手法の多くは、長距離空間および時間的依存関係を効率的に捉えることができない。
グラフニューラルネットワーク(GNN)に基づくフレキシブルでロバストなアプローチを提案し,距離に関わらず,空間と時間における画素間の非局所的相互作用を効率的にモデル化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:13:19 GMT)
Improved Factorized Neural Transducer Model For text-only Domain Adaptation [14.7] エンド・ツー・エンドのASRモデルをテキストデータでドメイン外のデータセットに適合させることは困難である。
Factorized Neural Transducer (FNT) は、語彙を予測するために別個の語彙デコーダを導入することでこの問題に対処することを目指している。
本稿では、音響情報と言語情報を包括的に統合した改良型分解型ニューラルトランスデューサ(IFNT)モデル構造を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:28:49 GMT)
Label-Efficient Model Selection for Text Generation [14.6] DiffUseは、好みアノテーションに基づいた候補テキスト生成モデル間の情報決定を行う手法である。
何百ものモデルペアに対する一連の実験において、DiffUseは必要なアノテーション数を劇的に削減できることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:07:17 GMT)
Slicing Mutual Information Generalization Bounds for Neural Networks [14.5] 我々は、ディープラーニングアルゴリズムに適した、より厳密な情報理論の一般化バウンダリを導入する。
我々の境界は、標準MI境界よりも有意な計算的および統計的優位性を提供する。
パラメータがランダムな部分空間に正確に横たわる必要がないアルゴリズムに解析を拡張します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:15:37 GMT)
Can Language Models Use Forecasting Strategies? [14.3] 実世界の出来事と関連する人間の予測の新たなデータセットを用いた実験について述べる。
モデルはまだ、未来に関する正確な予測に苦戦している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:01:42 GMT)
ValueBench: Towards Comprehensively Evaluating Value Orientations and Understanding of Large Language Models [14.3] 大規模言語モデル(LLM)は多様な分野を変革し、人間のプロキシとして影響力を増している。
この研究は、LLMにおける価値オリエンテーションと価値理解を評価するための最初の総合的な心理測定ベンチマークであるValueBenchを紹介した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:14:16 GMT)
Bisimulation Metrics are Optimal Transport Distances, and Can be Computed Efficiently [14.3] マルコフ連鎖間の最適な輸送距離を定式化するための新しい枠組みを提案する。
関節分布の全空間における最適輸送距離を計算することは、線形プログラムの解法として等価に定式化できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:25:14 GMT)
M-QALM: A Benchmark to Assess Clinical Reading Comprehension and Knowledge Recall in Large Language Models via Question Answering [14.2] 我々は,3つのジェネラリストと3つの専門的なバイオメディカルサブドメインにおいて,22のデータセットに関する大規模な実験研究を行うために,複数選択と抽象質問応答を用いた。
15個のLLMの性能の多面的解析により、リコールや理解の向上につながる命令チューニングなどの成功要因が明らかになった。
最近提案されたドメイン適応モデルには十分な知識が欠如している可能性があるが、収集した医療知識データセットを直接微調整することは、奨励的な結果を示している。
我々は、必要な知識を単に思い出し、提示された知識と統合するモデルの能力の間に大きなギャップがあることを明らかにする、スキル指向手動エラー解析で定量的結果を補完する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:43:21 GMT)
Proactive Detection of Physical Inter-rule Vulnerabilities in IoT Services Using a Deep Learning Approach [14.2] 複数のトリガーアクションルールは、共有環境チャネルを介して物理的に相互に相互作用することができる。
このような脆弱性は、攻撃者がIoTシステムに対する攻撃を開始するために悪用することができる。
本稿では,ユーザ要求仕様から物理的相互作用を積極的に発見するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:13:02 GMT)
Improving Zero-Shot Chinese-English Code-Switching ASR with kNN-CTC and Gated Monolingual Datastores [14.2] 本稿では,2つのモノリンガルデータストアとゲートデータストア選択機構を利用する,kNN-CTCベースのコードスイッチングASR(Code-Switching ASR)フレームワークを提案する。
提案手法では,各フレームの復号化に適したデータストアを選択し,言語固有の情報をASRプロセスに確実に注入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:39:17 GMT)
Vectorized Conditional Neural Fields: A Framework for Solving Time-dependent Parametric Partial Differential Equations [14.1] 本稿では、時間依存型PDEの解をニューラルネットワークとして表現するために、VCNeF(Vectorized Conditional Neural Fields)を提案する。
VCNeFsは、複数の時間的クエリポイントに対して、そのソリューションを並列に計算し、複雑さをモデル化する。
広範な実験により、VCNeFは既存のMLベースのサロゲートモデルと競合し、しばしば上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:02:06 GMT)
xMIL: Insightful Explanations for Multiple Instance Learning in Histopathology [13.9] 複数のインスタンス学習(MIL)モデルは、腫瘍検出、バイオマーカー予測、結果予測といったタスクで顕著に成功している。
我々は、説明可能なAI(XAI)のレンズを通してMILを再考し、より一般的な仮定を持つ洗練されたフレームワークであるxMILを紹介した。
提案手法は, バイオマーカー予測タスクにおいて, 特に忠実度が向上し, 従来の説明手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:26:40 GMT)
TAXI: Evaluating Categorical Knowledge Editing for Language Models [13.9] 知識編集は、言語モデルに新しい事実を注入し、その事実性を改善することを目的としている。
現在のベンチマークでは、効率、正確、一般化可能な編集を保証するために重要な一貫性の評価に失敗している。
分類的知識編集における一貫性を評価するためのベンチマークデータセットであるTAXIを手作業で作成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:46:36 GMT)
Spatio-Temporal Field Neural Networks for Air Quality Inference [13.6] 本稿では,新しいモデルSpatio-Temporal Field Neural Networkとその対応するフレームワークであるPraamidal Inferenceを提案する。
本モデルは中国本土における大気質の全国的推定における最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:27:33 GMT)
Exploring Pessimism and Optimism Dynamics in Deep Reinforcement Learning [13.4] 政治的でないアクター批判的アルゴリズムは、継続的な制御タスクに対する深い強化学習の可能性を示している。
本稿では,アクターと批評家の双方に対して,悲観的・楽観的な程度を独立的に制御できる枠組みであるUtility Soft Actor-Critic(USAC)を紹介する。
USACは、政治以外のアクター批判的アルゴリズム内でバランスをとるための重要なステップである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:26:02 GMT)
Synthesizing Conversations from Unlabeled Documents using Automatic Response Segmentation [13.3] 我々は,会話型質問応答システムにおける不適切でコストのかかるデータトレーニングの課題に対処する。
本稿では,ロバストなダイアログ合成手法を提案する。
文境界におけるセグメンテーションを使わずに,ダイアログタスクのためのデータのセグメンテーションを学習する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:52:45 GMT)
LLMEmbed: Rethinking Lightweight LLM's Genuine Function in Text Classification [13.3] 本稿では,この古典的だが挑戦的な課題に対処するために,LLMEmbedという,シンプルで効果的なトランスファー学習戦略を提案する。
その結果,LLMEmbedはトレーニングのオーバーヘッドを低く抑えながら,高い性能を発揮することがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:46:59 GMT)
FOX: Coverage-guided Fuzzing as Online Stochastic Control [13.3] ファジィング(fuzzing)は、ターゲットプログラムに対してランダムなテスト入力を生成してソフトウェア脆弱性を発見する効果的な手法である。
本稿では、スケジューラとミュータレータコンポーネントに焦点をあて、既存のカバレッジ誘導ファザの限界に対処する。
本稿では、制御理論アプローチの概念実証実装であるFOXについて、業界標準ファザと比較する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:21:05 GMT)
Which Side Are You On? A Multi-task Dataset for End-to-End Argument Summarisation and Evaluation [13.2] 本稿では,議論のための議論的エッセイを作成するエンドツーエンドの過程を捉えた議論マイニングデータセットを提案する。
私たちのデータセットには、上記のタスクをサポートするさまざまなプロパティで完全に注釈付けされたクレームの14万の例が含まれています。
ベンチマークでは,各タスクに対する有望な結果を示す一方で,4つのタスクすべてに対するエンドツーエンドのパフォーマンスが著しく低下していることが判明した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:30:11 GMT)
TSCMamba: Mamba Meets Multi-View Learning for Time Series Classification [13.1] 時系列分類のための補完的コンテキストを提供するために、周波数領域と時間領域の機能を統合した新しいマルチビューアプローチを提案する。
本手法は,連続ウェーブレット変換スペクトル特徴を時間的畳み込みあるいは多層パーセプトロン特徴と融合する。
10の標準ベンチマークデータセットによる実験は、我々のアプローチが最先端のTSCモデルよりも平均6.45%の精度向上を達成することを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:05:10 GMT)
Accelerated Policy Gradient: On the Convergence Rates of the Nesterov Momentum for Reinforcement Learning [13.0] 我々は、強化学習(RL)における政策最適化に、祝福されたネステロフの加速勾配(NAG)法を適応する。
i) $tildeO (1/t2)$, (ii) $O(e-ct)$, (ii) $O(e-ct)$。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:06:24 GMT)
Simulating, Fast and Slow: Learning Policies for Black-Box Optimization [12.9] 本稿では,学習方針を学習することで,類似のブラックボックス最適化問題のクラスを解く新しい手法を提案する。
ポリシーをトレーニングした後、ブラックボックスシミュレーターに関わる問題を下流で最適化するには、コストのかかるシミュレーターコールを最大90%削減する必要がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:05:09 GMT)
ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images [12.9] 熱画像に基づくエゴセントリックな3Dハンドポーズ推定のための新しいベンチマークであるThermoHandsを提案する。
このベンチマークには、28の被験者から収集されたマルチビューとマルチスペクトルのデータセットが含まれており、手動オブジェクトと手動仮想インタラクションを実行している。
本稿では,2つのトランスフォーマーモジュールを有効エゴセントリックな3Dハンドポーズ推定に利用した新しいベースライン手法であるTherFormerを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:42:24 GMT)
Identifying latent state transition in non-linear dynamical systems [12.9] 本研究は,基礎となる低次元潜在状態とその時間進化を回復することにより,力学系の一般化と解釈可能性を向上させることを目的とする。
非線形ICAの進歩にインスパイアされた状態空間モデリングフレームワークを提案する。これは、潜在状態だけでなく、過去の状態を現在の状態にマッピングする未知の遷移関数も特定できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:27:57 GMT)
Online Joint Fine-tuning of Multi-Agent Flows [12.9] 本稿では,ラーニング・トゥ・サーチフレームワークに触発された全フローのオンライン共同微調整手順について述べる。
このアプローチはシミュレータアクセスを活用して、エピソード全体の好みを減らし、個々のノード出力よりも好みを減らします。
私は、最先端の結果を達成するためのマルチホップQAデータセットMuseicに適用します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:21:03 GMT)
CORU: Comprehensive Post-OCR Parsing and Receipt Understanding Dataset [12.8] 本稿では,CORU(Comprehensive Post-OCR Parsing and Receipt Understanding dataset)を紹介する。
CORUはスーパーマーケットや衣料品店など、さまざまな小売店からの2万以上の注釈付きレシートで構成されている。
従来の手法の有効性を評価するため,CORU上でのモデル範囲のベースライン性能を確立した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:38:15 GMT)
Integrating Pre-Trained Speech and Language Models for End-to-End Speech Recognition [12.8] 本稿では,E2E ASRのための事前学習された音声表現モデルと大規模言語モデル(LLM)を統合することを提案する。
提案モデルは,音響特徴抽出や音響・言語モデリングを含む,ASRプロセス全体の最適化を可能にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:24:16 GMT)
Uncovering the Limits of Machine Learning for Automatic Vulnerability Detection [12.5] 本稿では,ML4VD技術の真の性能と限界をよりよく評価するための新しいベンチマーク手法を提案する。
6つのML4VD技術と2つのデータセットを使用して、(a)テストデータの脆弱性を予測するために、最先端のモデルが無関係な機能に過度に適合していること、(b)データ拡張によって得られるパフォーマンスが、トレーニング中に適用される特定の拡張を超えて一般化されないことを発見した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:36:20 GMT)
Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement Learning [12.5] モデルに基づくオフライン強化学習(RL)への現在のアプローチは、しばしば不確実性に基づく報酬のペナル化を取り入れている。
この罰則は過度な保守主義をもたらし、過小評価による過度な最適政策をもたらす可能性があると我々は主張する。
我々は,ベルマン作用素における不確実性を伝播できる信頼性の高い不確実性推定器の欠如を,過納化の重要な原因とみなす。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:58:41 GMT)
Multi-group Learning for Hierarchical Groups [12.5] 我々は、多群学習の研究を、群が階層的に構造化される自然の場合にまで拡張する。
そこで我々は,ほぼ最適なサンプル量を持つ解釈可能かつ決定論的決定木予測器を出力するアルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:14:03 GMT)
DSHGT: Dual-Supervisors Heterogeneous Graph Transformer -- A pioneer study of using heterogeneous graph learning for detecting software vulnerabilities [12.5] 脆弱性検出はソフトウェアセキュリティにおいて重要な問題であり、学術と産業の両方から注目を集めている。
ディープラーニング、特にグラフニューラルネットワーク(GNN)の最近の進歩は、幅広いソフトウェア脆弱性の自動検出の可能性を明らかにしている。
この研究において、我々はCode Property Graphという形で異種グラフ表現を最初に探求した1人です。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:06:55 GMT)
Improving Geo-diversity of Generated Images with Contextualized Vendi Score Guidance [12.3] 最先端のテキスト・トゥ・イメージ生成モデルでは、日常の物体を現実世界の真の多様性で描写するのに苦労する。
本稿では, 遅延拡散モデルの後方ステップを導出し, サンプルの多様性を高めるための推論時間介入, 文脈化されたVendi Score Guidance(c-VSG)を導入する。
c-VSGは、画像の品質と一貫性を同時に維持または改善しつつ、最もパフォーマンスの悪い領域と平均の両方において、生成画像の多様性を著しく向上させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:35:51 GMT)
HeSum: a Novel Dataset for Abstractive Text Summarization in Hebrew [12.3] HeSum(ヘサム)は、現代ヘブライ語で抽象的なテキスト要約のために設計されたベンチマークである。
HeSumは、プロが書いたヘブライ語ニュースサイトから入手した1万記事と1万記事のペアで構成されている。
言語学的分析は、ヘサムの高い抽象性とユニークな形態的課題を裏付ける。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:36:14 GMT)
Dataset Condensation for Time Series Classification via Dual Domain Matching [12.3] 本研究では,textittextbfTime textittextbfSeries textittextbfClassificationをDual Domain Matching経由で生成する新しいフレームワークであるtextittextbfCondensationを提案する。
提案するフレームワークは,時間領域と周波数領域の両方のサロゲート目的にマッチする凝縮データセットを生成することを目的としている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:30:49 GMT)
DoWhy-GCM: An extension of DoWhy for causal inference in graphical causal models [12.2] 我々は、DoWhy Pythonライブラリの拡張であるDoWhy-GCMを紹介する。
DoWhy-GCMは、外れ値の根本原因を特定するなど、さまざまな因果クエリに対処する。
ユーザは典型的に因果関係を因果グラフで指定し、因果関係を適合させ、因果関係を判断する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:16:26 GMT)
Compressible Dynamics in Deep Overparameterized Low-Rank Learning & Adaptation [12.1] モデルパラメータ内のデータと圧縮可能な力学の固有な低次元構造を利用することで、計算負担を伴わずにパラメータ化の利点を享受できることが示される。
提案手法は,低ランク行列と微調整言語モデルに対して有効であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:29:49 GMT)
The 3D-PC: a benchmark for visual perspective taking in humans and machines [12.0] ディープニューラルネットワーク(DNN)は、大規模な画像データセットのトレーニング後に3Dシーンを分析できるようになる、という報告が増えている。
DNNにおけるこの創発的3次元解析能力は、3次元知覚課題(3D-PC)を伴う視覚的視点撮影(VPT)に十分か検討した。
3D-PCは3つの3次元解析タスクからなる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:59:39 GMT)
FACOS: Enabling Privacy Protection Through Fine-Grained Access Control with On-chain and Off-chain System [11.9] 本稿では、ブロックチェーンベースのプライバシ保護による、チェーン上およびオフチェーン上のきめ細かいアクセス制御、すなわちFACOSを提案する。
暗号化データを集中あるいは非フォールトトレラントIPFSシステムにのみ格納する同様の作業と比較して、オフチェーンデータストレージのセキュリティとロバスト性を向上しました。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:23:12 GMT)
BindGPT: A Scalable Framework for 3D Molecular Design via Language Modeling and Reinforcement Learning [11.9] 本稿では,タンパク質結合部位内で3D分子を生成するために,概念的にシンプルだが強力なアプローチを用いた新規な生成モデルBindGPTを提案する。
このような単純な概念的アプローチと事前学習とスケーリングが組み合わさって、現在の最高の特殊拡散モデルよりも同等以上の性能を発揮することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:10:50 GMT)
What Makes Language Models Good-enough? [11.8] 心理学的な研究は、人間が手元にあるタスクに「十分な」言語入力を表現できる可能性を示唆している。
本研究では,言語モデルにどのようなアーキテクチャ的特徴が与える影響について検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:51:28 GMT)
MELODY: Robust Semi-Supervised Hybrid Model for Entity-Level Online Anomaly Detection with Multivariate Time Series [11.8] 欠陥のあるコード変更は、ターゲットサービスのパフォーマンスを低下させ、ダウンストリームサービスのカスケード障害を引き起こす可能性がある。
本稿では,デプロイメントにおける異常検出の問題について検討する。
我々は、エンティティレベルオンラインアノミクス検出のための新しいフレームワーク、半教師付きハイブリッドモデル(MELODY)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:35:00 GMT)
Improving Audio Codec-based Zero-Shot Text-to-Speech Synthesis with Multi-Modal Context and Large Language Model [11.6] 複数の拡張を伴ってコンテキスト特徴を適応する新しい音声ベースのTSモデルを提案する。
Qformerの成功に触発されて,マルチモーダルなコンテキスト強化Qformerを提案する。
提案手法は,様々な状況のTSシナリオにおいて,ベースラインよりも優れる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:06:45 GMT)
Generative AI-in-the-loop: Integrating LLMs and GPTs into the Next Generation Networks [11.5] 大規模言語モデル(LLM)が最近登場し、認知タスクにおけるほぼ人間レベルのパフォーマンスを実証している。
次世代AI-in-the-loop」の概念を提案する。
LLMとMLモデルを組み合わせることで、それぞれの能力を活用し、どちらのモデルよりも優れた結果が得られると考えています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:25:07 GMT)
Strengthened Symbol Binding Makes Large Language Models Reliable Multiple-Choice Selectors [11.5] 大規模言語モデル(LLM)研究における重要な研究領域として,MCQ(Multiple-Choice Questions)があげられる。
我々は、ポイントワイド・インテリジェント・フィードバック(PIF)と呼ばれるMCQのための効率的なスーパーバイザード・ファインチューニングアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:32:45 GMT)
A Ship of Theseus: Curious Cases of Paraphrasing in LLM-Generated Texts [11.4] 私たちの研究は、興味深い疑問を浮き彫りにしている: テキストは、多くのパラフレーズを実行したときに、オリジナルの著者を保っているか?
計算手法を用いることで,テキスト分類モデルにおける性能低下が,各パラフレーズが原作者のスタイルから逸脱する程度と密接に関連していることが判明した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:14:32 GMT)
Spatio-temporal Early Prediction based on Multi-objective Reinforcement Learning [11.3] 森林火災、犯罪、交通渋滞などの応用において、タイムリーな予測は人命と財産を守るのに不可欠である。
本稿では,複数目的強化学習に基づくモデルを提案する。
提案手法は,3つの大規模実世界のデータセットにおいて,早期の時系列・時間予測タスクにおける既存手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:03:51 GMT)
Fusion-Eval: Integrating Assistant Evaluators with LLMs [11.3] フュージョン・エバル(Fusion-Eval)は、Large Language Models(LLM)を活用して様々なアシスタント評価者の洞察を統合する革新的な手法である。
We show that Fusion-Eval achieve a 0.962 system-level Kendall-Tau correlation with human on SummEval and a 0.744 turn-level Spearman correlation on TopicalChat。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:47:44 GMT)
OCCAM: Towards Cost-Efficient and Accuracy-Aware Image Classification Inference [11.3] 画像分類クエリに対して最適な分類器割り当て戦略を計算するための原理的手法であるOCCAMを提案する。
さまざまな実世界のデータセットにおいて、OCCAMは40%のコスト削減を実現し、精度の低下はほとんど、あるいはまったくない。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:05:39 GMT)
Character-Level Chinese Dependency Parsing via Modeling Latent Intra-Word Structure [11.2] 本稿では,中国語における単語の内部構造をモデル化する。
制約付きアイズナーアルゴリズムは、文字レベルの木の互換性を確保するために実装されている。
詳細な分析により、粗大なパース戦略により、より言語学的に妥当な単語内構造を予測することができることが明らかになった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:23:02 GMT)
Ask LLMs Directly, "What shapes your bias?": Measuring Social Bias in Large Language Models [11.1] 社会的偏見は、様々な人口統計学的アイデンティティを対象とする社会的認識の蓄積によって形成される。
本研究では,社会的知覚を直感的に定量化し,大規模言語モデルにおける社会的バイアスを評価する指標を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:32:09 GMT)
Promoting Fairness and Diversity in Speech Datasets for Mental Health and Neurological Disorders Research [10.9] 我々は、メンタルヘルスや神経疾患のための音声データセットの展望をグラフ化する。
我々は、より責任ある研究を促進するために倫理的な懸念に焦点を当てたチェックリストにそれを蒸留する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:36:07 GMT)
Exploring the Zero-Shot Capabilities of Vision-Language Models for Improving Gaze Following [10.9] 人のポーズやオブジェクトとのインタラクションに関連する文脈的手がかりは、フォローする人を見つめるための貴重な情報を提供することができる。
視覚言語モデル (VLM) を用いて, 視覚の視線改善のために, 広範囲の文脈的手がかりを抽出し, 視線改善を行う。
画像全体と、対象人物の周りに描かれた楕円を併用することが、視覚的プロンプトの最も効果的な戦略である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:41:39 GMT)
Leveraging Codebook Knowledge with NLI and ChatGPT for Zero-Shot Political Relation Classification [10.9] 本研究では,既存のコードブックと自然言語推論(NLI)に基づくZSPモデルを用いたゼロショット学習手法の評価を行った。
実験の結果、ChatGPTの強みと限界が明らかとなり、ZSPの辞書ベースの手法の性能が著しく低下した。
本研究は,移動学習と既存分野の専門知識を活用し,研究効率と拡張性を高めることの有効性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:46:44 GMT)
Why Can Large Language Models Generate Correct Chain-of-Thoughts? [10.9] 自然言語生成に適した2階層階層型グラフィカルモデルを提案する。
我々は、LLM生成した思考の連鎖の可能性を測る魅力的な幾何学的収束率を確立する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:18:56 GMT)
Efficient Knowledge Infusion via KG-LLM Alignment [10.7] 知識グラフ検索法は知識注入の効率的かつ効率的な手法であることが証明されている。
既存のアプローチでは、公開知識グラフとタスクの特定の領域との知識ミスマッチ、知識グラフを用いたLLMの情報コンプライアンスの貧弱な2つの主要な課題に直面している。
本稿では,知識グラフから情報を利用するLLMの能力を高めるための3段階のKG-LLMアライメント戦略を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:55:55 GMT)
Maximal Domain Independent Representations Improve Transfer Learning [10.7] ドメイン適応(DA)は、データ表現をドメイン独立表現(DIRep)とドメイン依存表現(DDRep)に分解する。
我々は、転送学習性能を高める最大DIRepを作成するために、DDRepに対してKL発散損失を用いることで、DDRepを最小化するために、より強い制約を課す新しいアルゴリズムを開発する。
Officeを含むいくつかの標準ベンチマーク画像データセットを用いて、最先端アルゴリズムに対するアプローチの等速性能を実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:50:59 GMT)
BioInstruct: Instruction Tuning of Large Language Models for Biomedical Natural Language Processing [10.7] 25,005の命令から大規模言語モデル(LLM)を作成する。
命令は、80人のキュレートされた命令からランダムに3列のサンプルを引いたGPT-4言語モデルによって作成される。
いくつかのBioNLPタスクにおいて、これらの命令調整LDMを評価し、質問応答(QA)、情報抽出(IE)、テキスト生成(GEN)の3つの主要なカテゴリに分類できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:16:12 GMT)
Mind Your Format: Towards Consistent Evaluation of In-Context Learning Improvements [10.7] 大規模な言語モデルは、いくつかの例から新しいタスクを解くための驚くべき能力を示している。
プロンプトテンプレート、あるいはインプット例をフォーマットしてプロンプトを取得する方法は、コンテキスト内学習の重要な側面であるが、見過ごされがちである。
テンプレートの貧弱な選択は、最強モデルと推論手法の性能をランダムな推測レベルに低下させることができることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:01:37 GMT)
Continuous Test-time Domain Adaptation for Efficient Fault Detection under Evolving Operating Conditions [10.6] 本稿では,入力変数をシステムパラメータと測定値に分離したテスト時間領域適応異常検出(TAAD)フレームワークを提案する。
本手法は,実世界のポンプモニタリングデータセットを用いて検証し,既存の領域適応法よりも優れた故障検出手法であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:53:14 GMT)
VISTA: Visualized Text Embedding For Universal Multi-Modal Retrieval [10.6] 汎用マルチモーダル検索のための新しい埋め込みモデルVISTAを提案する。
画像理解機能を備えた強力なテキストエンコーダを拡張するフレキシブルアーキテクチャを導入する。
第2に,埋め込みモデルのトレーニングを容易にするために,高品質な合成画像テキストを提供する2つのデータ生成戦略を開発する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:37:47 GMT)
PathOCL: Path-Based Prompt Augmentation for OCL Generation with GPT-4 [10.6] 本稿では,Object Constraint Language生成を容易にするために設計された新しいパスベースのプロンプト拡張技術であるPathOCLを紹介する。
以上の結果から,PathOCLは完全クラスモデル(UML-Augmentation)に比較して,有効かつ正しいOCL制約を多く生成することがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:10:24 GMT)
Enhancing Supervised Visualization through Autoencoder and Random Forest Proximities for Out-of-Sample Extension [10.6] 教師付き次元削減の価値は、データ特徴とラベルの間の意味のある関係を明らかにする能力にある。
一般的な次元減少法は固定された潜在点の集合を埋め込むが、目に見えないテスト集合に一般化することはできない。
本研究では,ランダム森林をベースとしたディメンタリティ低減手法RF-PHATEのアウト・オブ・サンプル拡張法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:06:50 GMT)
Spectral Toolkit of Algorithms for Graphs: Technical Report (2) [10.4] 本稿では,局所性に敏感なハッシュ,カーネル密度推定,高速スペクトルクラスタリングについて述べる。
このレポートには、新しく実装されたアルゴリズムのユーザガイド、新機能の実験とデモ、開発の背後にあるいくつかの技術的考察が含まれている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:32:37 GMT)
Repurposing Language Models into Embedding Models: Finding the Compute-Optimal Recipe [10.3] 本稿では,テキスト埋め込みモデルに対して,計算-最適方式で対照的に学習する方法について検討する。
我々の革新は、異なる計算予算レベルでのテキスト埋め込みモデルのモデルサイズ、データ量、微調整方法の最適構成を生成するアルゴリズムである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:22:33 GMT)
Multi-Label Classification for Implicit Discourse Relation Recognition [10.3] 暗黙的な談話関係認識のための多言語分類フレームワークについて検討する。
本研究では,複数ラベルの分類手法が単一ラベルの予測性能を低下させないことを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:37:25 GMT)
Superpoint Gaussian Splatting for Real-Time High-Fidelity Dynamic Scene Reconstruction [10.2] 我々はSuperpoint Gaussian Splatting(SP-GS)という新しいフレームワークを提案する。
我々のフレームワークはまずシーンを再構築し、同様の性質を持つガウスをスーパーポイントにクラスタ化する。
これらのスーパーポイントを利用して、3次元ガウススプラッティングを動的シーンに拡張し、計算コストをわずかに増加させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:32:41 GMT)
On the Hardness of Probabilistic Neurosymbolic Learning [10.2] ニューロシンボリックモデルにおける確率的推論の微分の複雑さについて検討する。
モデルサンプリングに基づく非バイアス勾配推定器WeightMEを紹介する。
我々の実験は、まだ正確な解が可能である場合でも、既存の偏差近似は最適化に苦慮していることを示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:56:33 GMT)
Unveiling the Dynamics of Information Interplay in Supervised Learning [10.1] 本研究では,行列情報理論を解析ツールとして用いて,教師付き学習プロセスにおけるデータ表現と分類ヘッドベクトル間の情報相互作用のダイナミクスを解析する。
実験の結果,MIRとHDRはニューラルネットワークで発生する多くの現象を効果的に説明できることがわかった。
教師付きおよび半教師付き学習において,MIRとHDRの損失項を導入し,サンプルと分類ヘッド間の情報相互作用を最適化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:17:57 GMT)
Stochastic Polyak Step-sizes and Momentum: Convergence Guarantees and Practical Performance [10.1] 我々はヘビーボール法(SHB)の更新規則に適した新しいポリアク型変種を提案し,検討する。
MomSPS$_max$ に対して、(仮定なしで)凸および滑らかな問題に対する解の近傍に SHB の保証を提供する。
その他の2つの変種である MomDecSPS と MomAdaSPS は、SHB の最初の適応的なステップサイズであり、事前の知識なしに正確な最小値への収束を保証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:08:06 GMT)
Towards Understanding Task-agnostic Debiasing Through the Lenses of Intrinsic Bias and Forgetfulness [10.1] 言語モデリング能力に影響を及ぼす影響は、高品質でコンテキストの長いデバイアスコーパスによって緩和することができる。
タスク依存型デバイアスングヒンジの有効性は、下流アプリケーションに使用されるタスク固有データとデバイアスドモデルの両方の量的バイアスレベルに影響を及ぼす。
本稿では,ソーシャル・フェア・デバイアスを下流ファインチューニング,ProSocialTuningに伝達する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:11:11 GMT)
Multi-Objective Hyperparameter Optimization in Machine Learning -- An Overview [10.1] 本稿では,多目的ハイパーパラメータ最適化の基礎を導入し,応用MLにおけるその有用性を動機づける。
進化的アルゴリズムの領域とベイズ最適化の両方から、既存の最適化戦略を広範囲に調査する。
動作条件,予測時間,スパースネス,フェアネス,解釈可能性,ロバストネスなどの目的を考慮し,複数の特定のMLアプリケーションにおけるMOOの有用性を解説する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:14:36 GMT)
Privacy-Preserving UCB Decision Process Verification via zk-SNARKs [10.0] zkUCBは、トレーニングデータとアルゴリズムパラメータの機密性を保護し、透明な UCB 意思決定を保証するように設計されている。
実験ではzkUCBの優れた性能が強調され、量子化ビットの使用に対する報酬が強化された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:02:21 GMT)
Detecting Model Misspecification in Amortized Bayesian Inference with Neural Networks: An Extended Investigation [10.0] 本研究では、教師なしの方法で訓練し、テスト時にモデルの誤特定を確実に検出できる新しい誤特定尺度を提案する。
提案手法は,不審な出力をユーザに警告し,予測が信頼できない場合に警告を発し,モデル設計者がより良いシミュレータを探索する際の指針となることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:58:17 GMT)
Optimal Batched Linear Bandits [9.8] 本稿では,探索・推定・探索の枠組みを取り入れたバッチ線形バンドイト問題に対するE$4$アルゴリズムを提案する。
探索速度の適切な選択により、E$4$は、$O(loglog T)$バッチのみで有限時間ミニマックス最適後悔を達成する。
探索レートの別の選択で、E$4$は、少なくとも$O(log T)$バッチを必要とするインスタンス依存の後悔境界を達成することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:57:52 GMT)
HENASY: Learning to Assemble Scene-Entities for Egocentric Video-Language Model [9.8] 現在のモデルは、ビデオと言語間のインスタンスレベルのアライメントに大きく依存している。
我々は、人間の知覚からインスピレーションを得て、エゴビデオ表現のための構成的アプローチを探求する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:08:45 GMT)
NICE: To Optimize In-Context Examples or Not? [9.7] In-context Learning and Optimization of in-context Example (ICE) could significantly improve the accuracy of large language model (LLMs)
タスク固有の命令が提供されるとき、ICEを最適化する必要性について検討し、それが減少するリターンをもたらすタスクが多数存在することを確認する。
本研究では,与えられた命令からタスクの学習可能性を定量化する,正規化不変例選択基準(NICE)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:16:55 GMT)
Toward Unbiased Multiple-Target Fuzzing with Path Diversity [9.6] AFLRunと呼ばれる新しいファジリングソリューションを提案し、目標経路の多様性と非バイアスエネルギーの割り当てを特徴とする。
我々は,プロトタイプシステムを構築し,その性能を標準ベンチマークと広範囲にファジドされた実世界のアプリケーションを用いて評価した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:46:00 GMT)
Learning to Generate Instruction Tuning Datasets for Zero-Shot Task Adaptation [9.6] Bonitoは、未注釈のテキストをタスク固有のトレーニングデータセットに変換する条件付きタスク生成のモデルである。
そこで,本研究では,自己教師付きベースライン上での事前学習モデルと指導モデルの平均性能を著しく向上することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:50:26 GMT)
Efficient tensor networks for control-enhanced quantum metrology [9.6] 長い制御操作によって強化された量子力学の戦略を最適化するための効率的なテンソルネットワークアルゴリズムを提案する。
提案アルゴリズムは,最大$N=100$クエリに対して,メトロジー戦略を最適化する上で,優れた性能を有する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:14:32 GMT)
Behavior-Targeted Attack on Reinforcement Learning with Limited Access to Victim's Policy [9.5] ブラックボックス内の被害者エージェントを操作する新しい方法を提案する。
本手法は二段階最適化問題として定式化され,マッチング問題に還元される。
いくつかの強化学習ベンチマークにおける実証評価の結果,提案手法はベースラインに対する攻撃性能に優れていた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:49:51 GMT)
ArMeme: Propagandistic Content in Arabic Memes [9.5] 我々は,プロパガンダ的コンテンツの手動アノテーションを用いたアラビア・ミーム・データセットを開発した。
我々は,その検出のための計算ツールの開発を目的とした包括的解析を行う。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:56:49 GMT)
Manipulating the Relaxation Time of Boundary-Dissipative Systems through Bond Dissipation [9.4] 本研究では, 結合散逸が境界散逸系の緩和時間に及ぼす影響について検討した。
我々の研究は、オープンシステムでは、ある種類の消散が、別の種類の消散によって生じる影響を規制するために使用できることを明らかにしている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:39:44 GMT)
Omni6DPose: A Benchmark and Model for Universal 6D Object Pose Estimation and Tracking [9.4] 6D Object Pose Estimationは、大規模なデータセットの不足に悩まされているコンピュータビジョンにおいて、決定的に難しいタスクである。
本稿では,Omni6DPoseについて紹介する。Omni6DPoseは,オブジェクトのカテゴリ,大規模,多様性の多様性を特徴とするデータセットである。
我々は、SOTAカテゴリレベルのポーズ推定フレームワークの強化版であるGenPose++を紹介し、2つの重要な改善を取り入れた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:57:20 GMT)
Building Expressive and Tractable Probabilistic Generative Models: A Review [9.4] 我々は、主に確率回路(PC)に焦点をあてて、トラクタブル確率生成モデルに焦点をあてる。
我々は、表現性とトラクタビリティの本質的にのトレードオフについて統一的な視点を提供し、表現力と効率的なPCの構築を可能にする設計原則とアルゴリズム拡張を強調した。
我々は、ディープ・ニューラル・モデルの概念を融合させることにより、ディープ・ハイブリッドPCを構築するための最近の取り組みについて論じ、この発展途上の分野における将来の研究を導くための課題とオープンな疑問を概説する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:25:34 GMT)
Generalizability of Mixture of Domain-Specific Adapters from the Lens of Signed Weight Directions and its Application to Effective Model Pruning [9.3] ドメイン固有のアダプタ混合物のドメイン内評価における一般化可能性について検討する。
また,その重みを解析することにより,ドメイン固有アダプタの内部構造についても検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:52:09 GMT)
Batch-in-Batch: a new adversarial training framework for initial perturbation and sample selection [9.2] 適応学習法は, 単純な一様分布から, 対向サンプルに対する独立な初期摂動を生成する。
モデルを強化するため,Batch-in-Batchと呼ばれるシンプルで効果的なトレーニングフレームワークを提案する。
BBフレームワーク内でトレーニングされたモデルは、様々な対角的設定において、常に高い対角的精度を有することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:34:43 GMT)
Dynamic angular synchronization under smoothness constraints [9.2] 統計モデルにより平均二乗誤差(MSE)の漸近的回復を保証する。
MSE が 0 に収束するのは、静的条件よりも穏やかな条件で$T$ が増加するためである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:36:41 GMT)
BEADs: Bias Evaluation Across Domains [9.2] 大規模言語モデル(LLM)は、トレーニングデータからバイアスを継承し、永続することができる。
我々は、幅広いNLPタスクをサポートするために、BEAD(Bias Evaluations Across Domains)データセットを紹介します。
我々の経験的分析は、BEADが異なる言語モデル間でのバイアスの検出と低減に有効であることを示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:18:30 GMT)
Generating Explanations for Cellular Neural Networks [9.2] 細胞複合体を用いて高次構造を捕捉するフレームワークHOGEを紹介する。
現実世界では、高次構造は分子やソーシャルネットワークのようにユビキタスである。
本研究は,グラフ説明の実用性を大幅に向上させるものである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:42:52 GMT)
Regularized KL-Divergence for Well-Defined Function-Space Variational Inference in Bayesian neural networks [9.0] 後続の不確実性推定は事前の選択に依存しており、重み空間における情報的事前の発見は困難であることが証明されている。
これは、重みではなく、BNNが生成する関数に直接先行する変動推論(VI)手法を動機付けている。
提案手法は, 合成および小型実世界のデータセットに先立って, GPによって規定される特性を組み込んだものである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:57:49 GMT)
A Class-Aware Representation Refinement Framework for Graph Classification [9.0] グラフ分類作業のためのクラス認識表現rEfinement (CARE) フレームワークを提案する。
CAREは単純だが強力なクラス表現を計算し、グラフ表現の学習をより良いクラス分離性へと導くためにそれらを注入する。
9つのベンチマークデータセット上の11のよく知られたGNNバックボーンを用いた実験は、そのGNNよりもCAREの優位性と有効性を検証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:50:54 GMT)
GenSafe: A Generalizable Safety Enhancer for Safe Reinforcement Learning Algorithms Based on Reduced Order Markov Decision Process Model [8.9] 安全強化学習(SRL)アルゴリズムにGenizable Safety enhancer(GenSafe)を導入する。
GenSafeは、当初のコスト制約から再構成されたROMDPベースの制約を解決することで、エージェントが取るアクションを洗練し、制約満足度を高める。
その結果,特に早期学習段階における安全性能の向上だけでなく,タスク性能を満足なレベルに維持できることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:51:30 GMT)
Aligning Agents like Large Language Models [8.9] 高次元感覚情報から複雑な3D環境下での行動訓練は困難である。
我々は、模倣学習エージェントの望ましくない振る舞いと、不整合大言語モデル(LLM)の不整合応答の類似性を描く。
トレーニングエージェントにこのアプローチをうまく適用するための洞察とアドバイスを提供しながら、希望するモードを一貫して実行できるようにエージェントを調整できることを実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:05:45 GMT)
LDM-RSIC: Exploring Distortion Prior with Latent Diffusion Models for Remote Sensing Image Compression [8.8] 遅延拡散モデルに基づくリモートセンシング画像圧縮法(LDM-RSIC)を提案する。
第1段階では、自己エンコーダは、高品質な入力画像から予め学習する。
第2段階では、既存の学習ベース画像圧縮アルゴリズムの復号化画像に条件付LDMにより前者が生成される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:13:44 GMT)
Polyhedral Conic Classifier for CTR Prediction [8.7] 本稿では,産業レコメンデーションシステムにおけるクリックスルー率(CTR)予測の新しい手法を提案する。
これは数値的不均衡と幾何学的非対称性の固有の課題に対処する。
我々は多面体円錐関数を用いたディープニューラルネットワーク分類器を用いた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:26:48 GMT)
A Survey on Intelligent Internet of Things: Applications, Security, Privacy, and Future Directions [8.7] IoT(Internet of Things)の急速な進歩は、コミュニケーション技術の革命を促進し、さまざまなカスタマーサービスを提供している。
人工知能(AI)技術は、IoT操作の促進と、現代的なアプリケーションシナリオにおけるその可能性の最大化に活用されている。
IoTとAIの収束により、Intelligent IoT(IIoT)と呼ばれる新しいネットワークパラダイムが生まれました。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:55:30 GMT)
Homomorphism Counts for Graph Neural Networks: All About That Basis [8.3] 我々は、よりきめ細かいアプローチを論じ、対象パターンの基底''にすべての構造の準同型数を含む。
これにより計算複雑性の面で追加のオーバーヘッドを発生させずに、より表現力のあるアーキテクチャが得られる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:00:46 GMT)
Monocular Localization with Semantics Map for Autonomous Vehicles [8.2] 低レベルのテクスチャ機能の代わりに安定したセマンティック機能を利用する新しい視覚的セマンティックローカライゼーションアルゴリズムを提案する。
まず、セマンティックマップは、カメラやLiDARセンサーを使用して、グラウンドマーカー、レーンライン、ポールなどのセマンティックオブジェクトを検出してオフラインで構築される。
オンラインの視覚的ローカライゼーションは意味的特徴とマップオブジェクトのデータアソシエーションによって行われる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:12:38 GMT)
DSNet: A Novel Way to Use Atrous Convolutions in Semantic Segmentation [8.2] 我々は、現代の畳み込みニューラルネットワーク(CNN)におけるアトラス畳み込みの設計を再考する。
本稿では,モデルアーキテクチャの浅い層にアトラス畳み込みを組み込んだDual-Branch CNNアーキテクチャDSNetを提案する。
私たちのモデルは、ADE20K、Cityscapes、BDDデータセットの正確性とスピードの新たな最先端のトレードオフを実現しています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:51:57 GMT)
DDA: Dimensionality Driven Augmentation Search for Contrastive Learning in Laparoscopic Surgery [8.2] DDA(Diality Driven Augmentation Search)と呼ばれる新しい手法により,適切な拡張ポリシーの検索を自動化する。
腹腔鏡下手術におけるDDAの有用性と有効性を示すとともに,適切なデータ拡張ポリシーの確立に成功している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:46:22 GMT)
Shadow and Light: Digitally Reconstructed Radiographs for Disease Classification [8.2] DRR-RATEは、21,304人のユニークな患者から50,188個の前方デジタル再構成ラジオグラフィー(DRR)から構成される。
各画像は、対応する放射線学テキストレポートと18の病理学クラスのためのバイナリラベルとがペアリングされる。
我々は,既存の大規模胸部X線リソース,特にCheXpertデータセットとCheXnetモデルと併用して,DRR-RATEの適用性を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:19:18 GMT)
EgoSurgery-Tool: A Dataset of Surgical Tool and Hand Detection from Egocentric Open Surgery Videos [8.1] EgoSurgery-Phaseデータセットの拡張であるEgoSurgery-Toolを紹介する。
EgoSurgery-Toolは15のカテゴリにまたがる49K以上の手術用ツールで構成され、大規模な手術用ツール検出データセットを構成する。
9つの一般的な物体検出器を用いてEgoSurgery-Toolの包括的解析を行い,手術器具と手指検出の両面での有効性を検証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:28:27 GMT)
Why the Metric Backbone Preserves Community Structure [8.1] よく分断されたコミュニティを持つネットワークでは、計量バックボーンは多くのコミュニティ間のエッジを保持する傾向にある。
計量バックボーンは,コミュニティの存在下で効率的なスペーサーであることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:36:21 GMT)
A Geometric Modeling of Occam's Razor in Deep Learning [8.0] ディープニューラルネットワーク(DNN)は、非常に高次元のパラメータ空間の恩恵を受ける。
彼らの巨大なパラメータの複雑さと実践上の素晴らしいパフォーマンスは、より興味深く、説明できないものです。
本稿では,この現象を研究するための幾何学的フレーバー付き情報理論手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:26:17 GMT)
Small-E: Small Language Model with Linear Attention for Efficient Speech Synthesis [7.9] 近年の言語モデルによるテキスト音声合成の進歩は、自然性やゼロショット音声のクローニングの実現において顕著な能力を示した。
本稿では,リピートやスキップの問題を緩和する特別なクロスアテンション機構を導入し,トランスフォーマーを新たなアーキテクチャに置き換えることを提案する。
我々のアーキテクチャは、長いサンプルで効率的に訓練し、同等の大きさのベースラインに対して最先端のゼロショット音声クローンを実現することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:48:17 GMT)
TAAT: Think and Act from Arbitrary Texts in Text2Motion [7.7] 既存のデータセットは、テキストがアクションラベルを含むという仮定に依存している。
本稿では、テキストが任意のものであるというより現実的な仮定で、この問題を再定義する。
我々は、HumanML3Dデータセット上のアクションテキストをより多くのシーンテキストに拡張し、任意のテキストを含む新しいHumanML3D++データセットを作成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:46:24 GMT)
Excluding the Irrelevant: Focusing Reinforcement Learning through Continuous Action Masking [7.6] 強化学習(RL)における連続的な行動空間は、一般に間隔集合として定義される。
タスク知識の不足は、関連するアクションのより小さな状態固有の集合を特定するのに十分である。
本稿では,アクション空間を関連するアクションの状態依存集合に正確にマッピングするための3つの連続的なアクションマスキング手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:55:16 GMT)
T-RAG: Lessons from the LLM Trenches [7.5] アプリケーションエリアは、民間企業文書に対する質問応答です。
Retrieval-Augmented Generationは、LLMベースのアプリケーションを構築するための最も顕著なフレームワークである。
Tree-RAG (T-RAG) と呼ばれるシステムは、エンティティ階層を表現するためにツリー構造を使用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:42:47 GMT)
MELA: Multilingual Evaluation of Linguistic Acceptability [7.5] 言語アクセプタビリティの多言語評価 -- MELA -- 10言語を対象とする46Kのサンプルを用いて、言語アクセプタビリティに関する最も大きなベンチマークを提示する。
多言語解釈可能性の追求において, 微調整XLM-Rを用いた探索実験を行った。
言語間移動実験は、受容可能性判定における伝達が非自明であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:31:51 GMT)
Model Free Prediction with Uncertainty Assessment [7.5] そこで本研究では,深部推定パラダイムを条件付き平均推定を行うプラットフォームに変換する新しいフレームワークを提案する。
本研究では, 条件付き拡散モデルに対する終端収束率を開発し, 生成した試料の正規性を確立する。
数値実験により,提案手法の有効性を実証的に検証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:06:54 GMT)
Opportunities for Adaptive Experiments to Enable Continuous Improvement in Computer Science Education [7.5] 適応実験では、異なる条件が学生に展開されるにつれて、データを分析・活用する。
これらのアルゴリズムは、その後の学生との相互作用において最も効果的な条件を動的に展開することができる。
本研究は, ブリッジング研究における適応実験の重要性を探求し, 継続的な改善を実現するための方法である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:30:07 GMT)
Deep Learning Based Named Entity Recognition Models for Recipes [7.5] 名前付きエンティティ認識(NER)は、構造化されていない、または半構造化されていないデータから既知のラベルで情報を抽出する技術である。
私たちは26,445のフレーズを累積してデータセットを作成しました。
金本位レシピデータレポジトリRecipeDBの成分句を分析し,Stanford NERを用いて注釈した。
深層学習に基づく言語モデルの統計的、微調整を含むこれらのデータセットに対するNERアプローチの徹底的な調査は、深い洞察を与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:41:21 GMT)
Learning from higher-order statistics, efficiently: hypothesis tests, random features, and neural networks [7.5] ニューラルネットワークが高次累積から特徴を抽出する際の効率について検討する。
ニューラルネットワークが2つの分布を2次サンプルの複雑さで区別することを実際に学習していることが示される。
その結果,ニューラルネットワークはスパイクされた累積モデルにおいて,高次相関から情報を効率的に抽出できることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:48:20 GMT)
A Noise-robust Multi-head Attention Mechanism for Formation Resistivity Prediction: Frequency Aware LSTM [7.5] 生成比抵抗の予測は, 石油・ガス貯留層の評価において重要な役割を担っている。
従来の坑井検層技術では、ボアホールの正確な比抵抗を測定することができない。
周波数認識LSTMを構築するために,周波数認識フレームワークと時間的アンチノイズブロックを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:31:52 GMT)
Frequency Enhanced Pre-training for Cross-city Few-shot Traffic Forecasting [7.5] 都市間数発の予測という概念が現実的なアプローチとして現れている。
FEPCrossは事前訓練段階と微調整段階を有する。
実世界の交通データセット上で実施された実証的な評価は、FEPCrossの異常な有効性を検証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:38:45 GMT)
Evaluating the World Model Implicit in a Generative Model [7.3] 最近の研究は、大きな言語モデルが暗黙的に世界モデルを学ぶことを示唆している。
これには、単純な論理的推論、地理的ナビゲーション、ゲームプレイング、化学といった問題が含まれる。
我々は,古典的なマイヒル・ネローデ定理に触発された世界モデル回復のための新しい評価指標を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:20:31 GMT)
FAIntbench: A Holistic and Precise Benchmark for Bias Evaluation in Text-to-Image Models [7.3] FAIntbenchは、テキスト・トゥ・イメージ(T2I)モデルにおけるバイアスの総合的かつ正確なベンチマークである。
我々はFAIntbenchを7種類の大規模T2Iモデルの評価に適用し,人間による評価を行った。
その結果, FAIntbenchが種々のバイアスの同定に有効であった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:23:06 GMT)
Characterizing segregation in blast rock piles a deep-learning approach leveraging aerial image analysis [7.2] 本研究では,岩盤断片の分離を特徴付ける高度な画像解析手法を提案する。
ドローンが捉えた画像の解析により,詳細な岩石の破片径分布の正確な記述が達成された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:13:56 GMT)
A Large-Scale Neutral Comparison Study of Survival Models on Low-Dimensional Data [7.2] この研究は、単一イベント、右検閲、低次元生存データに焦点を当てた最初の大規模な中性ベンチマーク実験を示す。
我々は、32の公開データセット上で、古典的な統計的アプローチから多くの一般的な機械学習手法まで、18のモデルをベンチマークした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:13:38 GMT)
Reassessing How to Compare and Improve the Calibration of Machine Learning Models [7.2] 結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。
キャリブレーションと予測の指標が追加の一般化の指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:33:45 GMT)
CIRCUITSYNTH: Leveraging Large Language Models for Circuit Topology Synthesis [7.1] 有効な回路トポロジの自動合成を容易にするためにLCMを利用する新しい手法であるCIRCUITSYNTHを導入する。
提案手法は,回路効率の向上と出力電圧の特定を目的とした今後の研究の基盤となる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:59:59 GMT)
Predictive Uncertainty Quantification via Risk Decompositions for Strictly Proper Scoring Rules [7.1] 予測モデリングの不確かさは、しばしばアドホック法に依存する。
本稿では,統計的リスクを通じて不確実性を理解するための理論的アプローチを紹介する。
我々は、ポイントワイズリスクをベイズリスクと過剰リスクに分割する方法を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:52:17 GMT)
Rethinking LLM and Linguistic Steganalysis: An Efficient Detection of Strongly Concealed Stego [7.0] 我々はLSGCと呼ばれる2つのモードを持つ新しいLSを開発した。
生成モードでは、LS-task"記述"を作成しました。
分類モードでは、LSGCはLS-taskの"記述"を削除し、"causalLM"のLLMを"シーケンス"アーキテクチャに変更した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:18:02 GMT)
Provable Bounds on the Hessian of Neural Networks: Derivative-Preserving Reachability Analysis [6.9] 本稿では,アクティベーションの異なるニューラルネットワークに適した新しい到達可能性解析手法を提案する。
本手法の重要な特徴は,活性化関数のループ変換により,その単調性を効果的に活用することである。
結果として得られるエンドツーエンドの抽象化は、微分情報を局所的に保存し、小さな入力集合に正確な境界を与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:02:49 GMT)
Minimizing $f$-Divergences by Interpolating Velocity Fields [6.9] Wasserstein Gradient Flowは、ターゲットと粒子の分布間の$f$-divergenceを最小限に抑える経路に沿って粒子を動かすことができる。
粒子を移動させるためには、これらの2つの分布間の密度比関数から導かれる対応する速度場を計算する必要がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:31:45 GMT)
Wake Vision: A Large-scale, Diverse Dataset and Benchmark Suite for TinyML Person Detection [6.9] 人検出に適した大規模で多様なデータセットであるWake Visionを紹介した。
Wake Visionは600万枚以上の画像で構成されている。
We provide two Wake Vision training set: Wake Vision (Large) and Wake Vision (Quality)。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:21:08 GMT)
Views Are My Own, but Also Yours: Benchmarking Theory of Mind Using Common Ground [6.9] 自然発生音声対話に基づく最初のToMデータセットであるCommon-ToMを導入し,LMがToMの実証に苦慮していることを示す。
次に,信念の単純で明示的な表現を統合することで,Common-ToM上でのLM性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:30:01 GMT)
Flexible Clustering with a Sparse Mixture of Generalized Hyperbolic Distributions [6.8] モデルベースのクラスタリングに対する従来のアプローチは、高次元のデータでは失敗することが多い。
一般化双曲分布の混合に対する成分スケール行列のパラメトリゼーションを提案する。
解析的に実現可能な予測最大化アルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:30:18 GMT)
Requirements for Organizational Resilience: Engineering Developer Happiness [6.8] この問題のテーマは"Well-Being for Resilience: Developers Thrive"である。
3つのキーワード、幸福、レジリエンス、繁栄の関連について論じる。
議論を始めよう!
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:32:50 GMT)
Partial train and isolate, mitigate backdoor attack [6.6] 疑わしいサンプルを分離可能なモデルをトレーニングするために,モデルの一部を凍結する新しいモデルトレーニング方法(PT)を提案する。
そして、これに基づいてクリーンモデルが微調整され、バックドア攻撃に抵抗する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:26:59 GMT)
A Small and Fast BERT for Chinese Medical Punctuation Restoration [6.6] そこで本研究では,中国医学的句読点回復のための「事前訓練・微調整」パラダイムに基づく,高速で軽量な事前訓練モデルを提案する。
各種蒸留モデルを用いた実験により, 現状の中国RoBERTaと比較して, モデルサイズが10%であるのに対して, 95%の性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:59:43 GMT)
NaijaHate: Evaluating Hate Speech Detection on Nigerian Twitter Using Representative Data [6.4] ヘイトスピーチ検出(HSD)にアノテートされた最初のデータセットであるNaijaHateを紹介する。
バイアス付きデータセット上で評価されたHSDは,少なくとも2倍の速さで実世界の性能を過大評価する。
ナイジェリアのTwitterコンテキストに合わせた事前学習モデルであるNaijaXLM-Tを提案し、ドメイン適応型事前学習が果たす重要な役割を確立する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:21:34 GMT)
Legal Judgment Reimagined: PredEx and the Rise of Intelligent AI Interpretation in Indian Courts [6.3] textbfPrediction with textbfExplanation (textttPredEx)は、インドの文脈における法的判断予測と説明のための、専門家による最大のデータセットである。
このコーパスは、法的分析におけるAIモデルのトレーニングと評価を大幅に強化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:57:48 GMT)
Deep Learning for Protein-Ligand Docking: Are We There Yet? [6.1] 実用的タンパク質リガンドドッキングのための最初の包括的なベンチマークであるPoseBenchを紹介する。
PoseBenchは、研究者がApo-to-holoタンパク質-リガンドドッキングとタンパク質-リガンド構造生成のためのDLドッキング法を厳格かつ体系的に評価することを可能にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:33:06 GMT)
Encoding Semantic Priors into the Weights of Implicit Neural Representation [6.1] Inlicit Neural representation (INR) は近年,信号表現の有望なパラダイムとして浮上している。
本稿では,INRの重みに先行する意味をエンコードするSPWと呼ばれるreパラメータ化手法を提案する。
実験の結果,SPWは様々なタスクにおいて,様々なINRモデルの性能を大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:35:41 GMT)
Inspired by AI? A Novel Generative AI System To Assist Conceptual Automotive Design [6.0] デザインインスピレーションは、デザインの方向性を確立するだけでなく、感情を呼び起こし、概念設計プロセス中に意味を伝えるためにも不可欠である。
多くの実践的デザイナーはPinterestのようなプラットフォーム上でテキストベースの検索を使用してイメージのアイデアを集め、続いて紙にスケッチしたり、デジタルツールを使ってコンセプトを開発したりする。
拡散モデルのような新しい生成AI技術は、テキストとイメージインスピレーションインプットに基づいてデザイン概念を迅速に生成することで、これらのプロセスを合理化するための有望な道を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:04:14 GMT)
Cut-and-Paste with Precision: a Content and Perspective-aware Data Augmentation for Road Damage Detection [5.9] 道路の損傷は、道路インフラの完全性、安全性、耐久性に重大な課題をもたらす可能性がある。
近年、道路監視アプリケーションにおいて、画像に基づく損傷検出のための様々なデータ駆動手法が研究されている。
本稿では、コンテンツ認識(すなわち、画像中の道路の真の位置を考える)と視点認識(すなわち、注入された損傷と対象画像との視点の差を考慮する)の両面から改善されたカット・アンド・ペースト増強手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:06:42 GMT)
Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception [5.9] 多様な3次元知覚タスクのための新しいカメラレーダ融合アーキテクチャであるHyDRaを紹介する。
我々のハイト・アソシエーション・トランスフォーマー・モジュールは、すでに視界のレーダー機能を利用して、より堅牢で正確な深度予測を行う。
HyDRaは64.2 NDS (+1.8) と58.4 AMOTA (+1.5) のカメラレーダー融合のための新しい最先端技術を実現している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:34:38 GMT)
Semantic Similarity Score for Measuring Visual Similarity at Semantic Level [5.9] シーングラフ生成とグラフマッチングに基づくセマンティック類似度スコア(Semantic similarity Score)のセマンティック評価指標を提案する。
このメトリクスは、画像の意味レベル情報のセマンティックレベルの違いを測定することができ、視覚的意味コミュニケーションシステムにおける評価に使用できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:51:26 GMT)
Spontaneous Speech-Based Suicide Risk Detection Using Whisper and Large Language Models [5.8] 本稿では,青年期における自発音声による自殺リスクの自動検出について検討する。
提案システムでは,被験者119名を対象に,検出精度0.807とF1スコア0.846を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:21:13 GMT)
Benchmark Data Contamination of Large Language Models: A Survey [5.8] 本稿では,Large Language Models (LLMs) 評価におけるベンチマークデータ汚染(BDC)の複雑な課題について述べる。
従来のベンチマークに関連するリスクを軽減するための代替アセスメント手法を検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:41:39 GMT)
Latent Neural Operator for Solving Forward and Inverse PDE Problems [5.8] 本稿では、潜時空間におけるPDEを解く潜時ニューラルネットワーク(LNO)を提案する。
実験によると、LNOはGPUメモリを50%削減し、トレーニングを1.8回スピードアップし、6つの前処理のベンチマークのうち4つと逆処理のベンチマークで最先端の精度に達する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:04:53 GMT)
Semantically Diverse Language Generation for Uncertainty Estimation in Language Models [5.8] 大規模言語モデル(LLM)は、テキストを生成する際に幻覚に悩まされることがある。
現在のLLMは、テキストトークンを予測および付加することにより、自動回帰形式でテキストを生成する。
LLMの予測不確かさを定量化するために,Semantically Diverse Language Generationを導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:53:34 GMT)
Sparse Multi-baseline SAR Cross-modal 3D Reconstruction of Vehicle Targets [5.7] 本稿では,光学画像と異種レンダリングとクロスモーダル監視を統合したクロスモーダル再構成ネットワーク(CMR-Net)を提案する。
シミュレーションデータのみに基づいてトレーニングされたCMR-Netは、公開可能なシミュレーションデータセットと実測データセットの両方で、高解像度の再構築機能を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:18:59 GMT)
Feature Contamination: Neural Networks Learn Uncorrelated Features and Fail to Generalize [5.6] 分散シフトの下で一般化される学習表現は、堅牢な機械学習モデルを構築する上で重要である。
ニューラルネットワークを教師ネットワークから得られる表現に明示的に適合させることさえ、学生ネットワークの一般化には不十分であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:45:59 GMT)
UVOSAM: A Mask-free Paradigm for Unsupervised Video Object Segmentation via Segment Anything Model [5.6] Segment Anything Model (SAM)は、画像セグメンテーションのための新しいプロンプト駆動パラダイムを導入し、新しい可能性を提供している。
本稿では,STD-Netトラッカーを用いたUVOSのマスクフリーパラダイムであるUVOSAMを提案する。
STD-Netは、フレーム内特徴とフレーム間特徴の効果的な相関を確立するために、空間的・時間的疎結合な変形可能なアテンション機構を組み込んでいる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:57:51 GMT)
From Stream to Pool: Dynamic Pricing Beyond i.i.d. Arrivals [5.6] 我々は、独占販売業者と繰り返しやりとりする顧客に対して、textbfpool$を調査する。
特に,ディスカウント関数が一定であれば,プールモデルによりストリームモデルが復元される。
我々は、非適応的で詳細のない(すなわち、バリュエーションを「知る」)政策を提示し、競争比1/kで達成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:38:57 GMT)
Lie Neurons: Adjoint-Equivariant Neural Networks for Semisimple Lie Algebras [5.6] 本稿では,任意の半単純リー代数のデータを入力として取り込む同変ニューラルネットワークを提案する。
対応する群はリー代数を随伴演算として作用し、提案したネットワーク随伴-同変を導出する。
我々のフレームワークは、3次元ユークリッド空間からリー代数空間への単純な$mathrmSO(3)$-equivariantネットワークであるベクトルニューロンを一般化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:01:49 GMT)
HyperSense: Hyperdimensional Intelligent Sensing for Energy-Efficient Sparse Data Processing [5.6] HyperSenseは、センサデータのオブジェクト存在予測に基づいて、ADCモジュールのデータ生成率を効率的に制御する。
HyperSense用に調整されたFPGAベースのドメイン固有アクセラレータは、NVIDIA Jetson OrinのYOLOv4と比較して5.6倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:52:12 GMT)
Past, Present, and Future of Citation Practices in HCI [5.5] 本稿は、2016年のACM CHI Conferenceで紹介された編集方針が、CHIコミュニティを拡大する道のりでどのように開始したかを示す。
もしこのほぼ直線的な傾向が相変わらず続くなら、CHI 2030の記事には平均130の参照が含まれている。
我々のメタリサーチは、資源のデジタルアクセシビリティや学術的圧力などの影響を受けながら、HCIにおける引用実践の性質と意味がどう変化したかについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:00:56 GMT)
Exfiltration of personal information from ChatGPT via prompt injection [5.4] ChatGPT 4と4oは、攻撃者がユーザーの個人情報を流出させるプロンプトインジェクション攻撃の影響を受けやすい。
この脆弱性は、ChatGPTのメモリ機能の導入によって悪化している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:43:38 GMT)
Toward Artificial Open-Ended Evolution within Lenia using Quality-Diversity [5.4] 複雑なシステムにおける多種多様な自己組織化パターンの自動発見には,品質多様性が有効であることを示す。
我々のフレームワークは、Leniabreederと呼ばれ、手動で定義された多様性基準と教師なしの多様性尺度の両方を利用して、発見可能なパターンの範囲を広げることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:35:27 GMT)
Chimera: Effectively Modeling Multivariate Time Series with 2-Dimensional State Space Models [5.4] State Space Models (SSM) は、一変量時系列モデリングのための古典的なアプローチである。
本稿では、2つの入力依存型2次元SSMヘッドと異なる離散化プロセスを用いて長期進行と季節パターンを学習するチメラについて述べる。
実験により,広範囲で多様なベンチマークにおいて,Chimeraの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:58:09 GMT)
Elucidating the theoretical underpinnings of surrogate gradient learning in spiking neural networks [5.3] 脳内の情報処理とニューロモルフィックコンピューティングを研究するためには、スパイクニューラルネットワークの訓練が不可欠である。
この問題を解決するために、シュロゲート勾配は実験的に成功したが、その理論的基礎は解明されていない。
我々の研究は、サロゲート勾配に関する理論基盤の欠如と、スパイキングニューラルネットワークのエンドツーエンドトレーニングのための解析的に十分に確立されたソリューションを提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:48:18 GMT)
StatBot.Swiss: Bilingual Open Data Exploration in Natural Language [5.1] Text-to-SwissシステムにおけるLarge Language Models (LLM)による改善の可能性は、主にモノリンガルな英語データセットに基づいて評価される。
我々は、現実世界のアプリケーションに基づいてテキスト・ツー・スイスシステムを評価するための最初のベンチマークデータセットであるStatBotをリリースした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:29:23 GMT)
A Probabilistic Approach to Learning the Degree of Equivariance in Steerable CNNs [5.1] ステアブル畳み込みニューラルネットワーク(SCNN)は、幾何学的対称性をモデル化することによってタスク性能を向上させる。
しかし、未知あるいは様々な対称性は、過剰に制約された重量と性能を低下させる可能性がある。
本稿では,SCNNの等価度を学習するための確率的手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:45:19 GMT)
Subhomogeneous Deep Equilibrium Models [5.1] 暗黙のニューラルネットワークは、様々なアプリケーションにおける従来のネットワークの強力な代替手段として成長してきた。
これらのモデルは、しばしば存在と独自性の保証を欠き、安定性、性能、問題を高める。
我々は,非同次作用素の概念と非線形ペロン・フロベニウス理論に基づく暗黙深度ニューラルネットワークにおける固定点の存在と特異性について,新たな解析を行った。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:38 GMT)
A Survey on Multilingual Large Language Models: Corpora, Alignment, and Bias [5.1] 本稿では,MLLMの進化,鍵技術,多言語能力について概説する。
我々は、MLLMのトレーニングや下流タスクに適した多言語データセットに広く利用されている多言語コーパスについて検討する。
本稿では,MLLMのカテゴリと評価指標を含むバイアスについて論じ,既存のデバイアス手法を要約する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:04:15 GMT)
Hypernetworks for Personalizing ASR to Atypical Speech [5.0] メタ学習型ハイパーネットワークを用いて,多種多様な非定型音声特性に対して,高度に個別化された発話レベル適応を生成する。
ハイパーネットは,全パラメータ予算の0.1%を用いて,WERの相対的な75.2%削減を維持しつつ,分布外話者よりも一般化されていることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:39:00 GMT)
Intention and Face in Dialog [5.0] 本稿では、意図と礼儀正しさの両方を分類するために訓練された3つの計算システムについて分析する。
丁寧な理論では、エージェントは彼らの欲求(肯定的な顔)に感謝したいという願望に付き添い、無関心で自由(否定的な顔)を維持したいという補完的な欲求に出席する。
音声行為と同様に、発話はいわゆる顔行為を行うことができ、これは話者や聞き手の肯定的な顔や否定的な顔を上げたり脅したりすることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:26:35 GMT)
$i$Trust: Trust-Region Optimisation with Ising Machines [5.0] ボックス制約による信頼領域に基づく最適化を実現するため,Ising マシンの応用を提案する。
修正イジングマシンは凸性あるいは凸性の合理的な仮定の下で示されている。
この命題は古典的および量子古典的なハイブリッドシナリオの両方に有用である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:25:59 GMT)
"Generate" the Future of Work through AI: Empirical Evidence from Online Labor Markets [5.0] 大規模言語モデル(LLM)に基づく生成AI(ChatGPTなど)は、人工知能(AGI)の第1世代と考えられている。
我々の論文は、労働市場に対するAIの影響と個人の反応に関する重要な洞察を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:23:57 GMT)
Bias in News Summarization: Measures, Pitfalls and Corpora [4.9] 本稿では,要約モデルにおけるバイアス付き行動の定義と実用運用について紹介する。
目的合成モデルと汎用チャットモデルの両方で生成された英語要約における性別バイアスを測定する。
単一文書要約におけるコンテンツ選択は、性バイアスの影響をほとんど受けていないが、幻覚は偏見の証拠である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:49:26 GMT)
Diffusion-based image inpainting with internal learning [4.9] 本稿では,1枚の画像,あるいは数枚の画像でトレーニング可能な画像インペイントのための軽量拡散モデルを提案する。
このアプローチは,特定のケースにおいて,最先端の大規模モデルと競合することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:04:06 GMT)
Deep Probabilistic Movement Primitives with a Bayesian Aggregator [4.8] 運動プリミティブは、限られたデモから始まるロボットの動きを再現する訓練可能なパラメトリックモデルである。
本稿では,上述のすべての操作を符号化し,ベイズ文脈アグリゲータを用いるディープ・ムーブメント・プリミティブ・アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:04:28 GMT)
The Rate-Distortion-Perception-Classification Tradeoff: Joint Source Coding and Modulation via Inverse-Domain GANs [4.7] チャネルレート,歪み知覚,分類精度の厳密なトレードオフが存在することを示す。
本稿では,このトレードオフをナビゲートする2つの画像圧縮手法を提案する。
また、提案したID-GANアルゴリズムは、画像の歪み、知覚、分類精度のバランスを保ち、従来の分離法よりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:52:14 GMT)
Essentially Sharp Estimates on the Entropy Regularization Error in Discrete Discounted Markov Decision Processes [4.7] エントロピー規則化自然ポリシー勾配法では,既存の線形保証の改善の2乗根において,全体の誤差が指数関数的に減少することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:20:37 GMT)
VHDL-Eval: A Framework for Evaluating Large Language Models in VHDL Code Generation [4.7] 本稿では,VHDLコード生成タスクの評価に特化して設計された包括的評価フレームワークを提案する。
このデータセットは、Verilog評価問題の集合をVHDLに翻訳し、公開されているVHDL問題を集約することにより、合計202の問題を発生させる。
生成したVHDL符号の機能的正当性を評価するために, 自己検証テストベンチのキュレートセットを利用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:06:50 GMT)
Tree-Planted Transformers: Unidirectional Transformer Language Models with Implicit Syntactic Supervision [4.7] 樹木の植え付けという新しい手法を提案する。
構文構造を明示的に生成する代わりに、一方向トランスフォーマーLMの注目重みに木を「移植」する。
Tree-Planted Transformerは、基礎となるTransformer LMの推論効率を変更することなく、SLMからトレーニング効率を継承する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:16:16 GMT)
Semmeldetector: Application of Machine Learning in Commercial Bakeries [4.7] Semmeldetectorは、オブジェクト検出モデルを使用して、画像中の焼き菓子を検出し、分類し、カウントする機械学習アプリケーションである。
我々は18種類の焼き菓子を識別して検出モデルを訓練する1151の画像からなるデータセットをコンパイルした。
テストセットでAP@0.5の89.1%を達成しました。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:17:24 GMT)
Neural Surface Reconstruction from Sparse Views Using Epipolar Geometry [4.7] 再建過程にエピポーラ情報を組み込んだ新しい手法であるEpiSを提案する。
提案手法は,コストボリュームから複数のソースビューから抽出したエピポーラ特徴に粗い情報を集約する。
スパース条件における情報ギャップに対処するため,グローバルおよび局所正規化手法を用いて単眼深度推定から深度情報を統合する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:47:48 GMT)
Accelerating Production LLMs with Combined Token/Embedding Speculators [4.6] 本報告では,新規な投機的復号化ドラフトモデルの設計と訓練について述べる。
文脈ベクトルとサンプリングトークンの両方にドラフト予測を条件付けすることで、投機器を訓練して高品質なn-gramを効率的に予測することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:38:34 GMT)
Multipath parsing in the brain [4.6] 人間は言葉ごとの文章を聴く順番で理解する。
本研究では,音声ブックを聴きながら機能的ニューロイメージングを行う人々の時系列データと,段階的依存からの予測を関連づけることで,これらの構文的あいまいさを人間がどのように処理するかを検討する。
英語と中国語の両方でマルチパス解析の証拠が見つかる。このマルチパス効果に関連する脳領域には、両側上側頭回を含む。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:40:47 GMT)
Learned feature representations are biased by complexity, learning order, position, and more [4.5] 我々は表現と計算の間の驚くべき解離を探求する。
さまざまなディープラーニングアーキテクチャをトレーニングして、入力に関する複数の抽象的な特徴を計算します。
学習した特徴表現は、他の特徴よりも強い特徴を表現するために体系的に偏っていることが分かりました。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:22:31 GMT)
Optimization of state parameters in displacement assisted photon subtracted measurement-device-independent quantum key distribution [4.5] 光子サブトラクション(PS)は、量子情報処理タスクの性能を高めることが示されている。
本研究では,CV-MDI-QKDにおける非ガウス資源状態の役割について検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:21:47 GMT)
No real advantage of photon subtraction and displacement in continuous variable measurement device independent quantum key distribution [4.5] 我々は、連続可変測定装置独立量子鍵分布(CV-MDI-QKD)の性能向上における単一光子減算(SPS)の役割と変位を批判的に分析する。
SPSの実施はCV-MDI-QKDの耐損失性を向上させる効果が得られない。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:09:08 GMT)
Bayesian Power Steering: An Effective Approach for Domain Adaptation of Diffusion Models [4.4] ベイズパワーステアリング(BPS)と呼ばれる新しいネットワーク構造を持つ大規模拡散モデルの微調整フレームワークを提案する。
BPSは、事前学習された事前分布からタスク固有の知識を抽出する。
大規模な拡散モデルを効率よく利用し、異なる隠れた特徴をヘッドヘビーでフットライトな構成で区別する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:52:28 GMT)
It's Not a Modality Gap: Characterizing and Addressing the Contrastive Gap [4.4] CLIPのような2エンコーダコントラストモデルでは、モダリティギャップが報告されている。
これらの要因を全て考慮しても、対照的な損失は実際にトレーニング中にギャップを生じさせます。
この対照的なギャップがCLIP空間の低均一性に起因する証拠を提示する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:29:21 GMT)
AMPIC: Adaptive Model Predictive Ising Controller for large-scale urban traffic signals [4.4] 本稿では,スケーラビリティと最適性の両方を保証するAMPICという制御手法を提案する。
提案手法では,車両流の予測モデルを明確に考慮し,各制御区間における最適制御問題の解法としてモデル予測制御を用いる。
その結果,AMPICは従来の制御方式よりも待ち時間が少なく,より高速な走行が可能であった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:20:34 GMT)
Speed of Light Exact Greedy Decoding for RNN-T Speech Recognition Models on GPU [4.4] 現在の最先端のRNN-Tデコード実装は、GPUアイドルを80%残している。
本稿では,このアイドル時間を排除したRNN-Tモデルに対して,GPUによるgreedyデコーディングの正確な実装を提案する。
この作業により、11億のパラメータ RNN-T モデルでも、同様のサイズの CTC モデルよりもわずか16%遅く動作することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:03:28 GMT)
Assessment of Sentinel-2 spatial and temporal coverage based on the scene classification layer [4.4] 本稿では,領域のクリーンな光学的カバレッジを評価する手法を提案する。
手動しきい値とSCLの特定のラベルにより、提案手法は空間的および時間的カバレッジのパーセンテージを割り当てる。
この評価は,MLモデルの予測結果と相関することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:22:06 GMT)
GRASP: A novel benchmark for evaluating language GRounding And Situated Physics understanding in multimodal language models [4.4] 本稿では,ビデオベースマルチモーダル大言語モデル(LLM)の言語基盤と物理的理解能力を評価するための新しいベンチマークGRASPを提案する。
我々は、最先端のマルチモーダルLCMの評価にそれを用いている。
評価の結果,これらのモデルの言語基盤化や直感的な物理能力に重大な欠陥があることが判明した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:35:53 GMT)
A multi-core periphery perspective: Ranking via relative centrality [4.3] コミュニティとコア周辺は、広く研究されている2つのグラフ構造である。
グラフのコア周辺構造がコミュニティ構造を理解することに与える影響は、十分に利用されていない。
我々は,各コミュニティが密接な連結部分(中核)を持ち,残りの部分(周辺部)が疎い,基底真理コミュニティを持つグラフのための小説を紹介する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:21:27 GMT)
A novel robust meta-analysis model using the $t$ distribution for outlier accommodation and detection [4.3] $t$分布を用いた新しいロバストメタ分析モデルの提案(t$Meta)
簡易かつ高速なEM型アルゴリズムを極大推定のために開発した。
実際のデータでの実験では、$t$Metaは、穏やかなアウトリーチを伴う状況において、関連する競合と好意的に比較されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:15:39 GMT)
Remaining useful life prediction of Lithium-ion batteries using spatio-temporal multimodal attention networks [4.2] リチウムイオン電池は、電気自動車や再生可能エネルギー貯蔵など様々な用途で広く使われている。
電池の残存寿命(RUL)の予測は信頼性と効率の確保に不可欠である。
本稿では, 時空間アテンションネットワーク(ST-MAN)を用いたリチウムイオン電池の2段階RUL予測手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:20:48 GMT)
Combining Multi-Objective Bayesian Optimization with Reinforcement Learning for TinyML [4.2] マルチオブジェクトベイズ最適化(MOBOpt)に基づくマイクロコントローラ(TinyML)にディープニューラルネットワークをデプロイするための新しい戦略を提案する。
本手法は,DNNの予測精度,メモリ消費量,計算複雑性のトレードオフを効率的に検出することを目的としている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:51:21 GMT)
On Regularization via Early Stopping for Least Squares Regression [4.2] 我々は、任意のスペクトルを持つ汎用データや、幅広い学習率スケジュールにおいて、早期停止が有益であることを証明した。
最適停止時間を推定し,推定値の精度を実証的に示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:10:51 GMT)
Discrete error dynamics of mini-batch gradient descent for least squares regression [4.2] 置換のないサンプリングにおいて,少なくとも正方形に対するミニバッチ勾配勾配のダイナミクスについて検討した。
また、連続時間勾配流解析では検出できない離散化効果について検討し、最小バッチ勾配降下がステップサイズ依存解に収束することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:26:14 GMT)
On the Effects of Data Scale on Computer Control Agents [4.1] 我々は,ファインチューニング単独が現実のコンピュータ制御エージェント構築の有効なアプローチであるかどうかを考察する。
新しいデータセットであるAndroidControlをリリースし、Androidアプリによる日々のタスクのデモ15,283件で構成されています。
ドメインを微調整したモデルでテストすると、ゼロと数ショットのベースラインを上回り、ロバストなパフォーマンスを単純により多くのデータを収集して得られるようにスケールすることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:49:29 GMT)
Do Language Models Understand Morality? Towards a Robust Detection of Moral Content [4.1] 抽象概念と常識知識を活用する新しいシステムを導入する。
そこで本研究では,現実のシナリオにおける道徳的価値を検出するために,多目的で堅牢な手法を開発することを目的とする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:08:16 GMT)
RIFF: Learning to Rephrase Inputs for Few-shot Fine-tuning of Language Models [4.1] 本稿では,パラメータ効率のよい微調整手法と合わせて,元のタスクの入力テキストを変更することの影響について検討する。
入力テキストの書き直しを効果的に行うため,最大辺縁類似度を目標とした数発のパラフレーズモデルを訓練する。
本研究では, パラメータ効率のよい微調整だけで達成できることを超えて, 列車におけるパラフレーズとテスト時間によるデータ豊か化により, 性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:43:30 GMT)
Optimal Embedding Dimension for Sparse Subspace Embeddings [4.0] ランダム$mtimes n$ matrix $S$は、忘れられない部分空間埋め込み(OSE)である。
mtimes n$ random matrix $S$ with $mgeq (1+theta)d$ is an oblivious subspace embedding with $epsilon = O_theta(1)$。
これを使用すれば、現在の行列乗算時間よりも早く適用できる$O(d)$埋め込み次元で、最初の難解な部分空間埋め込みを構築することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:57:38 GMT)
It is Simple Sometimes: A Study On Improving Aspect-Based Sentiment Analysis Performance [4.0] タスク記述にNLP関連タスクプレフィックスを付加することにより、命令学習パラダイムの拡張であるPFInstructを提案する。
この単純なアプローチは全てのテストされたSemEvalサブタスクのパフォーマンスを改善し、ATEサブタスク(Rest14)の以前の状態(SOTA)を+3.28 F1スコア、AOOEサブタスクの平均+5.43 F1スコアで上回った。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:23:48 GMT)
Exploring the interplay between mass-energy equivalence, interactions and entanglement in an optical lattice clock [3.9] 我々は、スピンコヒーレントおよび絡み合った量子状態に疑問を呈する光学格子クロック(OLC)における質量エネルギー等価性の顕在化を探索する。
我々の研究は、OLC実験における一般相対性理論が量子コヒーレンスと絡み合いに与える影響を探求する新たな可能性を開く。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:23:56 GMT)
Position: How Regulation Will Change Software Security Research [3.8] ソフトウェア工学の研究は、業界が新しい標準に従うのに役立つより良いツールとサポートを提供する必要がある、と私たちは主張する。
我々は法学者と計算機科学者の強い協力を主張する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:16:44 GMT)
BiomedBench: A benchmark suite of TinyML biomedical applications for low-power wearables [3.8] ウェアラブルデバイスを用いた患者のリアルタイムモニタリングのための,完全エンドツーエンドのTinyMLバイオメディカルアプリケーションからなる新しいベンチマークスイートを提案する。
BiomedBenchはオープンソーススイートとしてリリースされ、バイオエンジニアリングシステムとTinyMLアプリケーション設計の領域全体の将来の改善を可能にする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:24:21 GMT)
Towards Better Question Generation in QA-based Event Extraction [3.7] イベント抽出(EE)は、構造化されていないテキストからイベント関連情報を抽出することを目的としている。
質問の品質は、抽出精度に劇的に影響を及ぼす。
本稿では,QAベースのEEのための強化学習手法RLQGを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:40:00 GMT)
The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.6] 我々は、異種録音からの学習を表現するために、神経科学にインスパイアされた自己教師対象の初期のセットをニューラルネットワークとともに開発する。
実験の結果、これらの目的によって学習された表現は、対象物、データセット、タスクにまたがって一般化され、ラベル付きデータよりも速く学習されることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:59:09 GMT)
Quantum computing quantum Monte Carlo with hybrid tensor network for electronic structure calculations [3.6] 本稿では,QC-QMCとハイブリッドテンソルネットワークを組み合わせて,QC-QMCの適用性を1つの量子デバイスサイズを超えて拡張するアルゴリズムを提案する。
本アルゴリズムは, ハイゼンベルク連鎖モデル, グラファイト系ハバードモデル, 水素平面モデル, モノアリルビイミダゾールをフル構成相互作用QMCを用いて評価した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:00:04 GMT)
"Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations [3.6] 専門家デモ(RLED)からの強化学習(Reinforcement Learning from Expert Demonstrations)のような手法は、学習プロセス中のエージェント探索を促進するために外部の専門家によるデモンストレーションを導入します。
学習にとって最も有益な人間のデモのベストセットをどうやって選ぶかが、大きな関心事になります。
本稿では,学習エージェントが軌跡に基づく特徴空間において,専門家による実演を最適化したクエリを生成できるアルゴリズムEARLYを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:04:15 GMT)
Flexible ViG: Learning the Self-Saliency for Flexible Object Recognition [3.6] 柔軟性のある物体を認識することは、本質的に多様な形状や大きさ、半透明な特性、曖昧な境界、微妙なクラス間の違いなど、大きな課題を生んでいる。
本稿では,フレキシブルビジョングラフニューラルネットワーク(FViG)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:55:06 GMT)
What Should Embeddings Embed? Autoregressive Models Represent Latent Generating Distributions [3.6] 埋め込みの最適な内容を特定することができる3つの設定を同定する。
次に、これらの3種類の潜伏生成分布をトランスフォーマーがエンコードしていることを示す実験的検討を行った。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:06:46 GMT)
One-shot learning for solution operators of partial differential equations [3.6] データから偏微分方程式(PDE)で表される物理系の方程式を学習し、解くことは、科学と工学の様々な分野において中心的な課題である。
従来のPDEの数値解法は複雑なシステムでは計算コストがかかり、物理系の完全なPDEが必要となる。
本稿では,1つのPDEソリューション,すなわちワンショット学習のみを必要とする,最初のソリューション演算子学習法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:39:27 GMT)
Efficient Graph Encoder Embedding for Large Sparse Graphs in Python [3.5] グラフ埋め込み(GEE)は最も高速なグラフ埋め込み技術として示されており、様々なネットワークデータアプリケーションに適している。
GEEの改良版であるスパースGEEを提案し、スパース行列におけるゼロエントリの計算と保存を最適化し、ランニング時間をさらに向上する。
実験により, スパース版は, 大規模なスパースグラフをPythonで実装したオリジナルのGEEと比較して, 大幅な高速化を実現しており, スパースGEEは標準ラップトップで数分で数百万のエッジを処理することができることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:49:34 GMT)
Pi-fusion: Physics-informed diffusion model for learning fluid dynamics [3.5] 流体力学における速度と圧力場の時間的進化を予測する物理インフォーム拡散モデルPi-fusionを提案する。
相反学習に基づくトレーニング戦略を導入し,流体運動の準周期パターンを学習する。
実験結果から, 提案手法は, 速度場と圧力場の時間的変化を予測する既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:14:59 GMT)
Are Large Language Models the New Interface for Data Pipelines? [3.5] 言語モデル(Language Model)とは、人間のコミュニケーションを理解し、生成するために設計された様々な種類のモデルを含む用語である。
大規模言語モデル (LLM) は、人間のような流布やコヒーレンスでテキストを処理する能力によって注目されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:10:32 GMT)
A Vision to Enhance Trust Requirements for Peer Support Systems by Revisiting Trust Theories [3.5] このビジョンペーパーは、医療従事者(HCW)に影響を及ぼすメンタルヘルス危機に焦点を当てている。
本研究は,認知信頼理論に固定された信頼枠組みを提案することによって,知覚信頼要件を導き出す新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:21:11 GMT)
Providing High-Performance Execution with a Sequential Contract for Cryptographic Programs [3.3] 定時プログラミングは、サイドチャネル攻撃に対する暗号プログラムを強化するための広くデプロイされたアプローチである。
現代のプロセッサは、プログラムの意図しないパスを投機的に実行することで、定数時間ポリシーの基本的な前提に違反している。
我々は,投機的制御フローに基づく攻撃に対して,一定時間暗号コードを保護するための新しいハードウェア・ソフトウェア機構であるCassandraを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:34:48 GMT)
Pointer-Guided Pre-Training: Infusing Large Language Models with Paragraph-Level Contextual Awareness [3.3] ポインター誘導セグメントオーダリング(SO)は,段落レベルのテキスト表現の文脈的理解を高めることを目的とした,新しい事前学習手法である。
実験の結果,ポインタ誘導型事前学習は複雑な文書構造を理解する能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:17:51 GMT)
A Comprehensive Study of Quantum Arithmetic Circuits [3.3] 我々は、量子演算回路における現在の最先端技術の概要を体系的に整理し、容易に理解することができる。
具体的には,加算,減算,乗算,除算,モジュラ指数といった基本的な操作について述べる。
我々はこれらの顕著な設計の詳細な量子的実装を掘り下げ、様々な目的を考慮してそれらの効率性を評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:54:45 GMT)
Enhancing Sign Language Detection through Mediapipe and Convolutional Neural Networks (CNN) [3.2] この研究は、ASLデータセットの効率的かつ正確な解釈のためにMediaPipeとCNNを組み合わせる。
ASLデータセットのモデルによって達成される精度は99.12%である。
このシステムは、コミュニケーション、教育、アクセシビリティードメインに応用される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:05:12 GMT)
Interfacing Gottesman-Kitaev-Preskill Qubits to Quantum Memories [3.2] 共振器を介した制御変位ゲートに基づく量子メモリとGKP量子ビット状態のインタフェースを提案する。
我々は、このプロトコルを拡張して、Acillary optical quadrature-squeezed light の要求を回避することにより、GKPクラスター状態の生成を実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:23:54 GMT)
Entangling Quantum Memories at Channel Capacity [3.2] 光周波数またはマイクロ波チャネルを介する量子メモリのエンタングは、短い範囲と長い範囲に量子ビットをリンクする鍵である。
空洞補助型メモリフォトンインタフェースは,ゴッテマン・キタエフ・プレスキル(GKP)フォトニッククイディットと物質記憶の絡み合わせに利用できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:22:11 GMT)
Quixer: A Quantum Transformer Model [3.1] 量子トランスモデルQuixerについて紹介する。
Quixerはトークンの重ね合わせを作成し、この混合にトレーニング可能な非線形変換を適用することで機能する。
パラメータ化された成分を固定構造に置換して量子変換器の新たなクラスを生成できることが示される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:52:05 GMT)
Reducing the climate impact of data portals: a case study [3.1] 本稿では,MaRDI(Mathematical Research Data Initiative)ポータルのエネルギーフットプリント削減技術について論じる。
今後,これらの変化を実践し,エネルギー効率の向上に関する具体的な測定を行う予定である。
論文参考訳(メタデータ) (Thu, 06 Jun 2024 08:45:36 GMT)
SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera [3.0] 得られたデータフットプリントとハイパースペクトルセグメンテーションの計算負荷を緩和するビジョントランスフォーマー(ViT)アルゴリズムを提案する。
我々のカメラは、高スペクトル立方体全体を1つの高解像度でキャプチャする代わりに、異なる解像度で画像領域やパッチを適応的にサンプリングすることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:33:23 GMT)
reAnalyst: Scalable Analysis of Reverse Engineering Activities [3.0] reAnalystは、リバースエンジニアリング(RE)プラクティスの研究を容易にするために設計されたスケーラブルな分析フレームワークである。
スクリーンショット、キーストローク、アクティブなプロセスのツールに依存しないデータ収集を統合することで、reAnalystは従来のRE研究の限界を克服することを目指している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:14:14 GMT)
Cons-training tensor networks [2.9] テンソルネットワークと呼ばれる新しいファミリーを導入する。
textitconstrained matrix product state (MPS)
これらのネットワークは、不等式を含むちょうど任意の離散線型制約をスパースブロック構造に含んでいる。
これらのネットワークは、特に、可能空間上で厳密にサポートされた分散をモデル化するために調整されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:29:48 GMT)
Bridging the Empirical-Theoretical Gap in Neural Network Formal Language Learning Using Minimum Description Length [2.9] 理論的に正しい解は、実際には一般的に用いられる目的の最適化ではないことを示す。
我々は1つの単純な形式言語に注目し、理論上正しい解が実際には一般的に使用される目的の最適性ではないことを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:16:12 GMT)
Entropy annealing for policy mirror descent in continuous time and space [2.8] 本研究では、エントロピー規則化値関数の勾配に基づいてポリシーを更新する連続時間ポリシーミラー降下ダイナミクスを解析する。
固定エントロピーレベルでは、力学は正規化問題の最適解に指数関数的に収束する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:31:08 GMT)
Direct Probe of Topology and Geometry of Quantum States on IBM Q [2.8] 量子幾何テンソル(QGT)の密度行列形式は、量子回路上のパウリ作用素の測定から明示的に再構成可能であることを示す。
我々は,IBM量子コンピュータに適した2つのアルゴリズムを提案し,直接QGTを探索する。
IBM Qから得られた明示的な結果として、チャーン絶縁体モデルを示し分析する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:36:38 GMT)
TexIm FAST: Text-to-Image Representation for Semantic Similarity Evaluation using Transformers [2.8] TexIm FASTは、トランスフォーマー(TexIm FAST)を用いた意味評価のための自己教師付き変分自動エンコーダ(VAE)による固定長表現を生成する新しい手法である。
画像表現は、言語的な複雑さを維持しながら、暗黙の推論を可能にし、クロスモーダルな応用において強力である。
TexIm FASTの有効性は、MSRPC、CNN/Daily Mail、XSumデータセット上でのセマンティックテキスト類似性(STS)のタスクに対して広く分析されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:28:50 GMT)
MuJo: Multimodal Joint Feature Space Learning for Human Activity Recognition [2.8] 人間活動認識は、幅広い分野で応用されているAIの長年の問題である。
マルチモーダルコントラスト事前学習を用いて,HARの性能を異なるモードで向上する方法を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:42:36 GMT)
Enhanced Semantic Segmentation Pipeline for WeatherProof Dataset Challenge [2.7] 本報告では、WeatherProofデータセットチャレンジの勝利ソリューションについて述べる。
本稿では,この課題に対するセマンティックセグメンテーションパイプラインの強化を提案する。
我々は、より広い視角を持つ新しいデータセットであるWeatherProofExtraを導入し、データ拡張手法を採用した。
私たちのソリューションは、最終リーダーボードで1位にランクされています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:12:50 GMT)
Holographic Gaussian Boson Sampling with Matrix Product States on 3D cQED Processors [2.7] 3D cQEDプロセッサ上でのマルチモード状態ベクトルのシミュレーションのための量子回路を導入する。
モード数が少ないcQEDデバイスはマルチモードシステムのシミュレートに使用できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:35:12 GMT)
High-precision and low-depth eigenstate property estimation: theory and resource estimation [2.7] 量子多体系の固有状態特性を推定することは、古典的および量子コンピューティングの双方にとって、長年にわたる、挑戦的な問題である。
本稿では,固有状態に対する固有値と観測可能な期待値を推定するランダムサンプリングアルゴリズムのフルスタック設計を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:54:26 GMT)
Generative Assignment Flows for Representing and Learning Joint Distributions of Discrete Data [2.6] 本稿では,多数の離散確率変数の結合確率分布を表現するための新しい生成モデルを提案する。
全ての離散な関節分布のメタ・プレプレックスにおけるセグレ写像による流れの埋め込みは、任意の対象分布を原理的に表すことができることを保証している。
我々のアプローチは、結合された離散変数のモデリングの第一原理から強い動機を持っている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:58:33 GMT)
Quantifying Misalignment Between Agents [2.6] 近年,AIアライメント問題に対する懸念が高まっている。
我々は、観察されているエージェントの個体数によって、不一致がいかに異なるかを示す。
私たちのモデルは、価値仕様のアプローチから離れ、代わりにエージェントが実際に持っているような複雑な、インターロック、時には矛盾する目標に焦点を合わせています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:31:22 GMT)
Evaluating the Efficacy of Large Language Models in Identifying Phishing Attempts [2.6] 何十年にもわたるサイバー犯罪戦術であるフィッシングは、今日のデジタル世界において大きな脅威となっている。
本稿では,15大言語モデル (LLM) がフィッシング手法の検出に有効であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:03:03 GMT)
1-D CNN-Based Online Signature Verification with Federated Learning [2.6] 従来のオンライン署名検証モデルは、データのプライバシに重大なリスクをもたらす。
本稿では,オンライン署名検証に1次元畳み込みニューラルネットワーク(CNN)を利用する新しいフェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:27:28 GMT)
Optimizing Autonomous Driving for Safety: A Human-Centric Approach with LLM-Enhanced RLHF [2.5] RLHF(Reinforcement Learning from Human Feedback)は、大規模言語モデル(LLM)で人気がある。
RLHFは通常、微調整のステップで適用され、直接の「推奨」を必要とする。
ニュージャージー州とニューヨーク市にある実生活テストベッドから収集したデータを用いて、我々のモデルを検証します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:10:34 GMT)
A Dynamic Model of Performative Human-ML Collaboration: Theory and Empirical Evidence [2.5] 本稿では,人間-機械学習協調システムにおける機械学習モデルの展開を考えるための新しい枠組みを提案する。
この動的プロセスの原理は,MLモデルとHuman+MLシステムが同じ性能を持つような,異なる安定点に収束できることを示す。
この結果から,人間による決定が議論の余地のない根拠の真理から逸脱する可能性のある状況において,MLモデルの展開が現実的な意味を持つことがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:27:11 GMT)
Exploiting Global Graph Homophily for Generalized Defense in Graph Neural Networks [2.5] グラフニューラルネットワーク(GNN)モデルは、敵攻撃の影響を受けやすい。
そこで我々は,グラフの局所的ホモフィリーを防御としてではなく,グローバル性を高める,Talosという新しい防衛手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:08:01 GMT)
Optimal joint cutting of two-qubit rotation gates [2.5] 仮想ゲート・テレポーテーションプロトコルに基づく2ビット回転ゲートの連成切断方式を提案する。
回路分割間の古典的な通信は不要であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:58:34 GMT)
Enhancing Graph U-Nets for Mesh-Agnostic Spatio-Temporal Flow Prediction [2.4] 本研究では,畳み込みニューラルネットワークに基づく従来のディープラーニングアプローチを克服することを目的とする。
グラフU-Netを用いた一過性流れ場の固有予測を改善するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:01:36 GMT)
Explicit decoders using quantum singular value transformation [2.3] 量子情報を回復可能な2つの明示的復号化量子回路を提供する。
提案した復号回路は、既知の明示的復号器と比較して計算コストを低減させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:44:42 GMT)
DeepRacer on Physical Track: Parameters Exploration and Performance Evaluation [2.2] 本稿では、AWS DeepRacerの物理的なレーストラック機能に焦点を当てる。
シミュレーション環境では,勾配降下バッチサイズが高いモデルの方が勾配降下バッチサイズが低いモデルよりも優れた性能を示した。
シミュレーション環境でのオブジェクトの回避は効果的であるように見えるが、これらのモデルを物理的環境に持ち込む際には、オブジェクトを避けることが顕著な課題であった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:17:27 GMT)
Cross-variable Linear Integrated ENhanced Transformer for Photovoltaic power forecasting [2.2] PV-ClientはENhanced Transformerモジュールを使用して、PVシステム内の様々な機能の複雑なインタラクションをキャプチャする。
PV-Clientは、デコーダモジュールをプロジェクション層に置き換えることで、埋め込み層と位置符号化層を合理化する。
PVパワー予測におけるPV-ClientのSOTA(State-of-the-art)性能を確認する実世界の3つのPVパワーデータセットの実験結果。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:30:27 GMT)
Statistically Optimal Generative Modeling with Maximum Deviation from the Empirical Distribution [2.1] 本稿では, 左非可逆なプッシュフォワード写像に制約されたワッサーシュタインGANが, 複製を回避し, 経験的分布から著しく逸脱する分布を生成することを示す。
我々の最も重要な寄与は、生成分布と経験的分布の間のワッサーシュタイン-1距離の有限サンプル下界を与える。
また、生成分布と真のデータ生成との距離に有限サンプル上限を確立する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:00:36 GMT)
Single Exposure Quantitative Phase Imaging with a Conventional Microscope using Diffusion Models [2.1] TIE(Transport-of-Intensity Equation)はしばしば異なるデフォーカス距離で複数の取得を必要とする。
そこで本研究では,クロマティック収差を用いて,必要なスルーフォーカス画像を単一露光で誘導する手法を提案する。
我々の貢献は、色収差を利用した別のTIEアプローチを提供し、白色光による正確な単一露光位相測定を実現している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:44:24 GMT)
Shield Synthesis for LTL Modulo Theories [2.0] 我々は、複雑な安全仕様に従ってシールドを生成するための新しいアプローチを開発する。
我々の知る限りでは、このような表現力のためにシールドを合成するための最初のアプローチである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:40:29 GMT)
FPN-fusion: Enhanced Linear Complexity Time Series Forecasting Model [2.0] 本研究では,線形計算複雑性を考慮した新しい時系列予測モデルFPN-fusionを提案する。
まず、時系列データの特徴を効果的に把握するためにFPN(Feature Pyramid Network)が採用され、従来の分解からトレンドや季節的なコンポーネントへ変換される。
FPN融合は、8つのオープンソースデータセットで32ケース中31ケースでDLinerを上回り、平均2乗誤差(MSE)は16.8%、平均絶対誤差(MAE)は11.8%となっている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:34:26 GMT)
Graph Convolutional Branch and Bound [1.9] 本稿では,最適化パイプラインにおけるディープラーニングモデルの有効性を示す。
この文脈では、ニューラルネットワークを利用して、価値ある情報を素早く取得することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:46:26 GMT)
Predictability Analysis of Regression Problems via Conditional Entropy Estimations [1.9] 回帰問題の予測可能性を評価するために,条件付きエントロピー推定器を開発した。
合成および実世界のデータセットの実験は、これらの推定器の堅牢性と有用性を示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:59:19 GMT)
Solving Dense Linear Systems Faster Than via Preconditioning [1.9] 我々のアルゴリズムは$tilde O(n2)$ if $k=O(n0.729)$であることを示す。
特に、我々のアルゴリズムは$tilde O(n2)$ if $k=O(n0.729)$である。
主アルゴリズムはランダム化ブロック座標降下法とみなすことができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:33:16 GMT)
Element-wise Multiplication Based Physics-informed Neural Networks [1.9] 本稿では,これらの問題を解決するために,EM-PINN( Element-wise multiplication based Physics-informed Neural Networks)を提案する。
要素ワイド乗算演算は、特徴を高次元非線形空間に変換するために採用され、PINNの表現能力を効果的に向上する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:27:52 GMT)
MS-IMAP -- A Multi-Scale Graph Embedding Approach for Interpretable Manifold Learning [1.8] 本稿では,コントラスト学習手法を用いたスペクトルグラフウェーブレットに基づくマルチスケールグラフネットワークの組込みフレームワークを提案する。
提案した埋め込みの重要な特徴は,埋め込み空間と入力特徴空間との対応性を確立する能力である。
提案手法の有効性を,下流タスクを通じて,様々な公開データセットに埋め込まれたグラフの有効性を検証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:31:53 GMT)
Position: Categorical Deep Learning is an Algebraic Theory of All Architectures [1.8] 本稿では,ディープラーニングアーキテクチャの特定と研究のための汎用フレームワークの探求について述べる。
本稿では,これら2つのニューラルネットワーク設計の風味をエレガントに仮定する単一理論として,圏論を適用することを提案する。
この理論は、幾何学的深層学習によって引き起こされる制約と、ニューラルネットワークの多様な風景から引き出された多くのアーキテクチャの実装をいかに回復するかを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:58:55 GMT)
Quantum Diamond Microscope for Narrowband Magnetic Imaging with High Spatial and Spectral Resolution [1.8] 量子ダイヤモンド顕微鏡(QDM)は、最近開発されたマイクロスケールの空間分解能を持つ磁場の近接場イメージング技術である。
本発明の機器は、空間分解能$approx2,mathrmmu m$, field-of-view $approx300times300,mathrmmu m2$, and per-pixel sensitivity to narrowband field $sim1,$nT$$$$$Hz$-1/2$を有する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:57:53 GMT)
Anna Karenina Strikes Again: Pre-Trained LLM Embeddings May Favor High-Performing Learners [1.7] オープンエンドな質問に対する教師なしの回答を行動的および認知的プロファイルにクラスタリングすることは、新しい技術である。
本報告では, 正解を含むほとんどのKPの発見可能性の低下を報告した。
我々は、この「発見可能性バイアス」を、事前学習されたLLM埋め込み空間におけるKPの表現に遡る。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:36:48 GMT)
A Human-in-the-Loop Approach to Improving Cross-Text Prosody Transfer [1.7] Text-To-Speech (TTS) の韻律変換モデルでは、参照発話を条件付けすることで、同じテキストに対して様々な韻律変換を生成することができる。
しかし、テキスト間の韻律伝達のように、参照発話が対象のテキストと異なる場合、これらのモデルは韻律をテキストから切り離すのに苦労し、結果として自然性が低下する。
本稿では,提案するHitL(Human-in-the-Loop)アプローチを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:01:53 GMT)
Polyp and Surgical Instrument Segmentation with Double Encoder-Decoder Networks [1.7] 本稿では,内視鏡画像からポリープと手術器具を分離するMedAIコンペティションの解決法について述べる。
我々のアプローチは、以前にポリプセグメンテーションに応用した二重エンコーダデコーダニューラルネットワークに依存している。
実験結果から,本手法は医療専門家による手動記述と良好な一致を示すセグメンテーションを創出することが示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:37:46 GMT)
Avoiding Barren Plateaus with Entanglement [1.7] 本稿では,回路を一意的な2ドル設計から一意的な1ドル設計に移行するための補助制御量子ビットの導入を提案する。
次に、これらの補助量子ビットを除去して元の回路構造に戻し、ユニタリな1ドルの設計特性を保存する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:06:05 GMT)
From operculum and body tail movements to different coupling of physical activity and respiratory frequency in farmed gilthead sea bream and European sea bass. Insights on aquaculture biosensing [1.6] AEFishBIT加速度計は2匹の養殖魚の発散活動と呼吸パターンを評価するために外付けでオペキュラムに装着した。
毎日のロコモター活性と呼吸周波数のリズミカル性は、金頭海藻と欧州海藻の両方で強調された。
行動モニタリングの利用は、より効率的な養殖魚を選択するための信頼性が高く大規模な有望なツールになりつつある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:46:00 GMT)
Noisy certification of continuous variables graph states [1.5] ノイズや不完全な設定であっても,CVグラフの状態を効率よく検証し,検証することができることを示す。
次に、異なるアプリケーションのためのプロトコルの後に得られた状態のユーザビリティに、我々の研究結果がどのように影響するかについて議論する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:42:58 GMT)
Towards Avoiding the Data Mess: Industry Insights from Data Mesh Implementations [1.5] Data Meshは、企業データ管理のための、社会技術的、分散化されたコンセプトである。
業界の専門家との15の半構造化インタビューを行います。
本研究は,業界の専門家による知見を総合し,データメッシュの採用を成功させるための予備的ガイドラインを研究者や専門家に提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:13:09 GMT)
Communication-Efficient Distributed Deep Learning via Federated Dynamic Averaging [1.5] Federated Dynamic Averaging (FDA)は通信効率の良いDDL戦略である。
FDAは従来のアルゴリズムと最先端のアルゴリズムと比較して、通信コストを桁違いに削減している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:52:16 GMT)
Data-Centric Label Smoothing for Explainable Glaucoma Screening from Eye Fundus Images [1.4] 我々は、異なるスキルを持つ複数のアノテータからの情報を、カスタマイズされたラベルスムーシングスキームにどのように組み合わせるかに焦点を当てる。
従来のresnet50モデルよりもスムースな手法が優れている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:38:06 GMT)
M3LEO: A Multi-Modal, Multi-Label Earth Observation Dataset Integrating Interferometric SAR and RGB Data [1.4] M3LEOは、偏光、干渉、コヒーレンスSARデータを含むマルチモーダルでマルチラベルのEOデータセットである。
17.5TBで、6つの地理的領域に約10Mのデータチップがある。
フレームワークとの統合のために、人気のあるプラットフォームで利用可能なデータセットを処理するツールを提供しています。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:30:41 GMT)
Rare Class Prediction Model for Smart Industry in Semiconductor Manufacturing [1.4] 本研究では, 半導体製造プロセスから収集したIn situデータに対して, 希少なクラス予測手法を開発した。
第一の目的は、ノイズとクラス不均衡の問題に対処し、クラス分離を強化するモデルを構築することである。
ROC曲線はAUCが0.95、精度が0.66、リコールが0.96である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:09:43 GMT)
Subspace Clustering in Wavelet Packets Domain [1.4] サブスペースクラスタリング(SC)アルゴリズムは、サブスペースモデルを用いて、サブスペースが描画されるサブスペースに応じてデータポイントをクラスタリングする。
サブスペースの分離性とノイズに対する堅牢性を改善するために,ウェーブレットパケット(WP)ベースの変換領域サブスペースクラスタリングを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:49:11 GMT)
Legal Documents Drafting with Fine-Tuned Pre-Trained Large Language Model [1.4] 本稿では,中国語の分節化を伴わずに多数の注釈のない法律文書を活用でき,大規模言語モデルを微調整できることを示す。
また、法的文書草案作成作業も達成でき、同時に情報プライバシーの保護と情報セキュリティ問題の改善も達成できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:00:20 GMT)
Online learning of quantum processes [1.4] パウリのチャネルと同様に、境界ゲートの複雑さは、オンライン学習の後悔とミスバウンドモデルでオンラインに学習できることを示します。
また,パウリ流路に対する試料効率の高いシャドウトモグラフィー法も提案する。
我々の研究は、量子チャネルのクラスおよびより一般的には非マルコフ量子プロセスに対するオンライン学習の研究を開始する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:54:20 GMT)
Learning Regularities from Data using Spiking Functions: A Theory [1.4] 我々は,正則性の定義を数学で定義する新しい機械学習理論を提案する。
発見された非ランダム性は、関数が十分単純であれば正則性に符号化される。
この過程において、最適なスパイク関数である「ベスト」正則性は、最も多くの情報を取得することができるものであると主張する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:41:38 GMT)
AC4MPC: Actor-Critic Reinforcement Learning for Nonlinear Model Predictive Control [1.4] acMPCの性能向上のためにアクター・クリティックなacRL技術をどのように活用できるかを示す。
各acMPCインスタンスを2回、異なる初期推定のために並列制御アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:15:51 GMT)
Transformable Gaussian Reward Function for Socially-Aware Navigation with Deep Reinforcement Learning [1.4] 変形型ガウス報酬関数(TGRF)を導入する。
TGRFは、ハイパーパラメータチューニングの負担を大幅に軽減し、様々な報酬関数をまたいだ表示を行い、学習速度の高速化を示す。
我々は,TGRFの概念的背景,特徴,実験,実世界の応用を明らかにするセクションを通じて,TGRFを検証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:41:46 GMT)
Nomic Embed Vision: Expanding the Latent Space [1.3] マイノミック・エンベッド・ビジョン(英語版)とマイノミック・エンベッド・テキスト(英語版)は、視覚、言語、マルチモーダルタスク間で高いパフォーマンスを達成するための最初の統合潜在空間を形成する。
本報告では、高度に高性能でオープンコードでオープンウェイトな画像埋め込みモデルであるnomic-embed-visionのトレーニングについて述べる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:02:51 GMT)
Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types [1.3] 本稿では、同期語彙関係と単語の意味定義の両方から情報を活用するモデルを提案する。
具体的には,WordNet の構文定義と階層情報を用いて,Blank (1997) のセマンティックチェンジ型データセットのデジタル化バージョンでそれをテストする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:53:36 GMT)
The syntax-semantics interface in a child's path: A study of 3- to 11-year-olds' elicited production of Mandarin recursive relative clauses [1.3] 本論文の著者らは,3~11歳のマンダリンRC8種の最も構造化された生産物について,実験を行った。
4種類のシンタクティックタイプはRCで,主観的RCはオブジェクト的RCに埋め込まれていた。
各対象に対して、参加者には、不可逆な外部意味論の条件を構成する音声・視覚刺激が与えられた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:51:14 GMT)
Multi-Task Inference: Can Large Language Models Follow Multiple Instructions at Once? [1.2] マルチタスク推論は、全体の推論時間を平均1.46倍に削減する。
驚いたことに、Llama-2-Chat-70BやGPT-4のような最先端のLCMでは、マルチタスク推論によるパフォーマンスが7.3%、12.4%向上した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:55:17 GMT)
Comparing statistical and machine learning methods for time series forecasting in data-driven logistics -- A simulation study [1.2] シミュレーション時系列の広いセットにおいて,ボックス外予測性能の観点から,様々な予測手法を比較した。
各種線形および非線形時系列をシミュレートし,統計的学習手法の1ステップ予測性能について検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:46:20 GMT)
Quantum Communication: From Fundamentals to Recent Trends, Challenges and Open Problems [1.2] 量子通信の新しい領域は、現代の通信技術を置き換える可能性を示している。
量子力学の原理を用いたセキュリティと情報共有能力の向上により、ネットワーク技術者や物理学者がこの技術を次世代無線システム向けに開発することを奨励している。
本稿では,量子通信の理解に必要な基本概念を構築し,重要な概念をレビューし,これらの概念をどのように活用して通信を成功させるかを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:35:35 GMT)
Innovations in Cover Song Detection: A Lyrics-Based Approach [1.2] 歌の歌詞を利用したカバー歌検出手法を提案する。
曲とその対応するオリジナルをカバーする新しいデータセットを提案する。
他のカバーソングのデータセットとは対照的に、オリジナルソングとカバーソングの注釈付き歌詞を含んでいる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:52:25 GMT)
Adaptive Lightweight Security for Performance Efficiency in Critical Healthcare Monitoring [1.2] IoT(Internet of Things, モノのインターネット)とその多様な技術は、将来の医療システムにとって不可欠なコンポーネントになっている。
進化する医療パラダイムは、IoTデバイスのさまざまなリソース制約に適応可能な、適応的なセキュリティ手順とテクノロジを必要とする。
この記事では、ユニークな医療監視要件を提起し、必要なセキュリティを提供するために、既存の暗号化ベースのセキュリティアプローチを研究します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:55:16 GMT)
Fast Redescription Mining Using Locality-Sensitive Hashing [1.1] 本稿では,既存の手法よりも高速にマッチングおよび拡張順序を実行するアルゴリズムを提案する。
我々のアルゴリズムは局所性に敏感なハッシュに基づいており、数値属性の離散化を扱うための調整されたアプローチである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:13:48 GMT)
Multifidelity surrogate modeling, NARGP, digital twin, aquaculture net cage, real-time monitoring, graph convolutional networks [1.1] デジタルツイン技術は水産産業を前進させることができるが、その採用は限られている。
フレキシブルな浮体構造である魚網ケージは、養殖農場の重要かつ脆弱な構成要素である。
本研究では,水生生物網の構造動態をリアルタイムにモニタリングするデジタルツインへの統合のための多要素代理モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:26:30 GMT)
llmNER: (Zero|Few)-Shot Named Entity Recognition, Exploiting the Power of Large Language Models [1.1] 本稿では,大規模言語モデル(LLM)を用いたゼロショットおよび少数ショットNERを実装するPythonライブラリであるllmNERについて述べる。
llmNERはプロンプトを作成し、モデルをクエリし、LLMによって返される完了を解析することができる。
ライブラリの柔軟性を示すため、2つのNERタスクでソフトウェアを検証しました。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:01:59 GMT)
Improving the Fairness of Deep-Learning, Short-term Crime Prediction with Under-reporting-aware Models [1.1] 本稿では,予測公正性を高めるために2つのアプローチのパワーを組み合わせた新しいディープラーニングアーキテクチャを提案する。
提案手法は, 内処理脱バイアスモデルと比較して, 犯罪予測の公平性を向上することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 04:05:23 GMT)
Imbalanced Data Clustering using Equilibrium K-Means [1.1] セントロイドベースのクラスタリングアルゴリズムは、大規模なクラスタに対する学習バイアスに悩まされている。
本稿では,ボルツマン演算子に基づく新たなクラスタリング目的関数を提案する。
提案された新しいアルゴリズムは平衡K平均 (EKM) と呼ばれ、2つのステップ間で交互に行われる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:51:21 GMT)
MedPromptExtract (Medical Data Extraction Tool): Anonymization and Hi-fidelity Automated data extraction using NLP and prompt engineering [1.0] 医療記録のシームレスなデジタル化における大きな障害は、既存の記録との相互運用性の欠如である。
本稿では,MedPromptExtractという,半教師付き学習,大規模言語モデル,自然言語処理,エンジニアリングなどを組み合わせて,非構造化の医療記録を構造化データに変換する自動ツールを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:39:00 GMT)
Performance of large language models in numerical vs. semantic medical knowledge: Benchmarking on evidence-based Q&As [1.0] 大規模言語モデル(LLM)は言語ベースの臨床実践の多くの側面において有望な結果を示す。
包括的医療知識グラフ(50,00以上の査読済み記事から得られたデータ)を用いて「EBMQA」を作成しました。
私たちはこのデータセットを、最先端の2つのLLMであるChat-GPT4とClaude3-Opusについて24,500以上の質問を使ってベンチマークした。
いずれのLLMも数値QAよりもセマンティックに優れており,Claude3は数値QAでGPT4を上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:41:46 GMT)
Leveraging automatic strategy discovery to teach people how to select better projects [1.0] 個人や組織の決定は、規範的な決定戦略が現実の世界であまりにも要求されているため、過小評価されることが多い。
最近の研究は、人工知能を利用して規範的な意思決定戦略を発見し、教えることによって、いくつかのエラーを防ぐことができることを示唆している。
この記事は、このアプローチを現実の意思決定問題、すなわちプロジェクト選択に拡張する最初のものです。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:51:44 GMT)
A Hybrid Deep Learning Classification of Perimetric Glaucoma Using Peripapillary Nerve Fiber Layer Reflectance and Other OCT Parameters from Three Anatomy Regions [0.9] ハイブリッドディープラーニングモデルは、NFL反射率とその他のOCTパラメータを組み合わせて、緑内障の診断を改善する。
全体的な精度は0.948で0.893の感度と1.000の特異性があり、AROCは0.979であり、ロジスティック回帰モデルよりもかなり優れている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:30:51 GMT)
Digital twins in sport: Concepts, Taxonomies, Challenges and Practical Potentials [0.9] 2019年のGartnerのリストによると、デジタル双子は戦略的技術トレンドのうち10社に属している。
スポーツは、健康的な生活様式の欠如に苦しむ現代人の絶え間ない仲間になっている。
スポーツにおけるデジタルツインの応用は、スポーツトレーニングの分野だけでなく、競技中にアスリートを管理する分野にも劇的な変化をもたらした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:51:01 GMT)
An intelligent tutor for planning in large partially observable environments [0.9] 本研究では,部分的に観測可能な環境下での計画のための知的チューターを開発し,評価する。
計画戦略を教えるための知的家庭教師と比べ、この新しい知的家庭教師は2つの革新を組み合わせている。
330人の参加者による事前登録実験では、新しいインテリジェントチューターは、部分的に観察可能な環境で良い判断を下す能力を向上させるのに非常に効果的であることが示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:29:08 GMT)
Online learning of a panoply of quantum objects [0.9] 多くの量子タスクにおいて、学習したい未知の量子オブジェクトが存在する。
正半定値行列の一般部分集合について学習するために亜線型後悔を証明した。
我々の境界はコンパクトな凸表現を持つ他の多くの量子オブジェクトに適用できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:44:08 GMT)
A Road-Map for Transferring Software Engineering methods for Model-Based Early V&V of Behaviour to Systems Engineering [0.9] モデルベースシステムエンジニアリングの初期において,システム動作の検証と検証(V&V'ed)の必要性が高まっていることについて論じる。
本稿では、初期のV&Vに関する文献の概要と、潜在的な解決策に関する既存の課題について述べる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:04:23 GMT)
Topological Materials for Near-Field Radiative Heat Transfer [0.8] トポロジカル材料は量子状態と電磁エネルギーを持ち、ナノレーザーや量子フォトニクスシステムの恩恵を受けることができる。
表面モードをサポートするサブ波長系における近接場熱放射は、ナノスケール熱管理やエネルギー変換など様々な応用がある。
本研究では, 周期的および準周期的ナノ粒子アレイ, ディラック, ワイル半金属系材料, 大域対称性の破れた構造, およびその他のトポロジカル絶縁体などのトポロジカルな効果を近接場熱伝達に与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:49:57 GMT)
Negative Feedback for Music Personalization [0.8] ユーザシーケンスへの入力と、インターネットラジオの次世代レコメンデータシステムのトレーニングのための負のターゲットの両方として、真の負のフィードバックを使用することの利点を示す。
トレーニング中に明示的な負のサンプルを使用することは、トレーニング時間を60%削減し、テスト精度を6%向上させる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:22:56 GMT)
A Room-Temperature Solid-State Maser Amplifier [0.8] メーザーはかつて、低ノイズマイクロ波増幅技術における最先端の技術の1つであった。
室温で動作する連続波固体メーザー増幅器について報告する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:46:11 GMT)
Position: Embracing Negative Results in Machine Learning [0.7] 予測パフォーマンスだけでは出版価値の指標にはならない、と私たちは主張する。
本稿では、ネガティブな結果を公開する利点を示し、コミュニティが彼らの出版が正規化されるパラダイムへと進むための具体的な手段を提供する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:51:12 GMT)
One Point, One Object: Simultaneous 3D Object Segmentation and 6-DOF Pose Estimation [0.7] 純粋な3次元点雲シーンにおける3次元オブジェクト分割と6-DOFポーズ推定を同時に行う手法を提案する。
提案手法の重要な構成要素は,純3次元点群における3次元オブジェクト分割と6-DOFポーズ推定を同時に予測できるマルチタスクCNNアーキテクチャである。
実験評価のために,Augmented Reality (AR) を用いた2つの最先端3Dオブジェクトデータセット citePLciteTLINEMOD のための拡張トレーニングデータを生成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:28:13 GMT)
Confabulation: The Surprising Value of Large Language Model Hallucinations [0.7] ナラティビティを認知的資源として活用するために,LLMのコミュニケーションの計測可能な意味的特性は,人間の正当性を反映している,と我々は主張する。
この発見は、通常、非難の否定的な理解の中で緊張を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:32:29 GMT)
An operator learning perspective on parameter-to-observable maps [0.7] 本稿では,有限次元ベクトル入力や出力に対応可能なフーリエニューラルマッピングフレームワークを提案する。
自然な疑問は、パラメータ・トゥ・オブザーバブル(PtO)マップをエンドツーエンドに学習するか、あるいは最初に解演算子を学習し、次にフルフィールドの解からオブザーバブルを計算するかである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:20:07 GMT)
Simulating Floquet scrambling circuits on trapped-ion quantum computers [0.7] 情報スクランブルは量子コンピューティングの有望な応用の1つである。
本稿では,Hayden-Preskillリカバリプロトコルと,アウト・オブ・タイム・オー・オー・オー・オー・タイムの相関器を計算するためのインターフェロメトリプロトコルを実証する。
生成したスクランブル回路の応用として、局所演算子のマイクロカノニカル期待値の計算を実験的に実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:42:31 GMT)
A Fast Algorithm to Simulate Nonlinear Resistive Networks [0.7] 線形不等式制約を持つ二次計画問題として,非線形抵抗ネットワークのシミュレーションのための新しい手法を提案する。
シミュレーション手法は既存のSPICEシミュレーションよりも優れており、最大327倍のネットワークを160倍高速でトレーニングすることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:13:14 GMT)
Generative AI and Digital Neocolonialism in Global Education: Towards an Equitable Framework [0.6] 本稿では、生成的人工知能(GenAI)が西洋以外の社会に西洋のイデオロギーをどう強制するかを批判的に論じる。
これは、地域の利害関係者や世界的な利害関係者がこれらの効果を緩和する戦略を示唆している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:13:43 GMT)
Dynamics and triggers of misinformation on vaccines [0.6] われわれは、さまざまなソーシャルメディアプラットフォーム(Facebook、Instagram、Twitter、YouTube)におけるイタリアのワクチンに関する6年間の議論を分析している。
われわれはまず、ニュース制作時系列の象徴的転送エントロピー分析を用いて、ワクチンに関する議題を慎重に推進する、疑わしい、あるいは信頼できるソースのカテゴリを決定する。
次に、伝達されたスタンスに基づいてワクチン関連コンテンツを正確に分類し、話題を議論する深層学習モデルを活用する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:17:31 GMT)
Statistical Multicriteria Benchmarking via the GSD-Front [0.5] 一般化支配順序付け(GSD)を用いた分類器の比較を提案する。
我々は、(潜在的に新しい)分類器が、最先端の分類器のセットのGSDフロントにあるかどうかを統計的に検証する。
ベンチマークスイートであるPMLBとプラットフォームであるOpenMLについて説明する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:06:27 GMT)
Beyond 5G Network Failure Classification for Network Digital Twin Using Graph Neural Network [0.5] ネットワークデジタルツイン(NDT)の第5世代(5G)コアネットワークは、多数のコンポーネントを持つ複雑なシステムであり、かなりのデータを生成する。
NDT用に設計されたメッセージパッシングニューラルネットワーク(MPNN)にグラフフーリエ変換(GFT)を統合する新しい手法を提案する。
このアプローチは、実およびシミュレーションされたNDT環境での障害タイプを特定し、5Gおよびそれ以上のネットワークにおける正確な障害分類の可能性を示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:36:25 GMT)
A Study of Optimizations for Fine-tuning Large Language Models [0.5] 微調整された大きな言語モデルは、特定のアプリケーションに適応しようとするユーザの間では一般的な選択である。
しかし、これらのモデルの微調整は、ユーザがリソース予算、ランタイム、モデルサイズ、コンテキストの長さなど、いくつかの要因を調べる必要があるため、必要なタスクである。
特定の課題は、微調整がメモリ集約であり、処理可能なハードウェアメモリとトレーニングデータのコンテキスト長に制約を課すことである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:09:31 GMT)
Language Models Don't Learn the Physical Manifestation of Language [0.4] 言語のみのモデルは言語の物理的表現を学ばないと主張する。
本稿では,H-Testと呼ばれる一連のタスクを通して,言語の視覚的聴覚特性を実証的に調査する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:20:21 GMT)
Deep Vision-Based Framework for Coastal Flood Prediction Under Climate Change Impacts and Shoreline Adaptations [0.3] 低データ環境下での高忠実度ディープビジョンに基づく沿岸洪水予測モデルを訓練するための体系的枠組みを提案する。
また,沿岸の洪水予測問題に特化して,CNNの深部構造を導入している。
開発したDLモデルの性能は、一般に採用されている測地回帰法に対して検証される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:54:34 GMT)
Matrix product state approximations to quantum states of low energy variance [0.3] 有限エネルギー密度を持つ1次元系における純粋量子状態の効率的なシミュレート方法を示す。
我々は、スペクトルの大部分に中程度の絡み合いエントロピーを持つ非常に狭い支持状態が存在することを証明した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:43:17 GMT)
Exploring the Latest LLMs for Leaderboard Extraction [0.3] 本稿では, LLMs-ralMist 7B, Llama GPT-4-Turbo, GPT-4.o を用いて, 実験的なAI研究論文からリーダボード情報を抽出する方法について検討する。
本研究は,これらのモデルを用いて,研究論文からの4倍率(Task,Metric,Score)の生成性能を評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:54:45 GMT)
Effective Context Selection in LLM-based Leaderboard Generation: An Empirical Study [0.3] 本稿では,Large Language Models (LLMs) のAI研究リーダーボード生成における文脈選択の影響について検討する。
本研究では, 従来の自然言語推論(NLI)手法を超越して, 事前に定義された分類法を使わずに新しい開発に適応する手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:05:39 GMT)
Entanglement engineering of optomechanical systems by reinforcement learning [0.2] 絡み合いは量子情報科学と技術の基礎である。
エンタングルメント工学に対する深層強化学習手法を開発した。
我々は、線形または非線形光子-フォノン相互作用を持つ量子光学系を用いて、プロトコルの動作を実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:25:36 GMT)
Ultrafast Optical Control of Rashba Interactions in a TMDC Heterostructure [0.2] 我々は、ラシュバ相互作用の大きさを定量化するための顕微鏡的アプローチに基づく理論的記述を開発する。
Rashbaにより誘導されるバレー内スピン混合は、T = 50 K以上の支配的スピン緩和チャネルとなる。
我々の研究は、超高速スピン操作に使用できるヘテロ構造において、未発見のスピン脱分極チャネルを同定する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:27:28 GMT)
GOOSE: Goal-Conditioned Reinforcement Learning for Safety-Critical Scenario Generation [0.1] ゴール条件付きシナリオ生成(Goal-conditioned Scenario Generation、GOOSE)は、ゴール条件付き強化学習(RL)アプローチで、安全クリティカルなシナリオを自動的に生成する。
安全クリティカルな事象につながるシナリオを生成する上でのGOOSEの有効性を実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:59:08 GMT)
Real-Time Spacecraft Pose Estimation Using Mixed-Precision Quantized Neural Network on COTS Reconfigurable MPSoC [0.1] 本稿では、市販MPSoCのFPGAコンポーネント上に実装された混合精度量子化ニューラルネットワークを用いて、リアルタイム宇宙船のポーズ推定の先駆的なアプローチを提案する。
我々の貢献には、そのようなアルゴリズムを初めてリアルタイムでオープンソースに実装することが含まれており、効率的な宇宙船ポーズ推定アルゴリズムを広く利用できるようにするための大きな進歩を示している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:36:26 GMT)
Eigenpath traversal by Poisson-distributed phase randomisation [0.1] 本稿では,AQC(Adiabatic Quantum Computation)と同様,量子計算のためのフレームワークを提案する。
ポアソン過程によって決定された間隔でランダムデファーズ演算を行うことにより、特定の固有値に関連する固有空間を追跡することができる。
有限性に対する単純な微分方程式を導出し、アルゴリズムのクラスの時間複雑性を境界とする一般定理を導出する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:33:29 GMT)
T-Count Optimizing Genetic Algorithm for Quantum State Preparation [0.1] 本稿では,Clifford+Tゲートセットのゲートからなる状態準備回路に対して,遺伝的アルゴリズムを提案する。
我々のアルゴリズムは、最もエラーが多いコンポーネントの数が減少するフォールトトレラント実装可能なソリューションを自動的に生成する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:26:14 GMT)
LNQ Challenge 2023: Learning Mediastinal Lymph Node Segmentation with a Probabilistic Lymph Node Atlas [0.0] リンパ節転移の評価は、正確ながん転移を達成する上で重要な役割を担っている。
リンパ節検出は、境界が不明確であり、様々な大きさと形態的特徴があるため、課題となる。
LNQ 2023 MICCAIチャレンジの一環として,課題に対処するためのツールとして解剖学的先行性(anatomical priors)を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:57:25 GMT)
Weight-based Decomposition: A Case for Bilinear MLPs [0.0] GLU(Gated Linear Units)は、現代の基礎モデルにおいて一般的なビルディングブロックとなっている。
Bilinear 層は "gate" の非線形性を低下させるが、他の GLU に匹敵する性能を持つ。
双線型テンソルを相互作用する固有ベクトルの集合に分解する手法を開発する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:46:51 GMT)
Wave packet dynamics of entangled q-deformed states [0.0] 2つの異なる初期q-変形状態、q-変形フォック状態およびq-変形コヒーレント状態について検討した。
絡み合いのダイナミクスは周期的、準周期的、カオス的な振る舞いの特徴を明らかにする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:17:46 GMT)
User Intent Recognition and Semantic Cache Optimization-Based Query Processing Framework using CFLIS and MGR-LAU [0.0] この研究は、拡張QPのためのクエリにおける情報、ナビゲーション、およびトランザクションベースのインテントを分析した。
効率的なQPのために、データはEpanechnikov Kernel-Ordering Pointsを用いて構造化され、クラスタリング構造(EK-OPTICS)を同定する。
抽出された特徴、検出された意図、構造化データは、MGR-LAU(Multi-head Gated Recurrent Learnable Attention Unit)に入力される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:28:05 GMT)
Unitary Quantum Algorithm for the Lattice-Boltzmann Method [0.0] 本稿では,Lattice-Boltzmann法に基づく計算流体力学の量子アルゴリズムを提案する。
我々の量子アルゴリズムは非線形性を捉えている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:30:48 GMT)
Truncated Modular Exponentiation Operators: A Strategy for Quantum Factoring [0.0] 本稿では、ワークレジスタが$vert 1 rangle$で始まるという単純な観察に依存するME演算子を構築する方法を提案する。
しかし、ME演算子は極めて寛容であり、レベルが省略された近似形式は、正確な演算子と同様に、要因を抽出できることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:36:36 GMT)
Translation symmetry restoration under random unitary dynamics [0.0] 初期状態によって破壊される力学の特定の対称性が、与えられたサブシステムの縮小状態のレベルでどのように復元されるかを検討する。
ここでは、時空対称性の復元に同じ論理を適用することができ、従って完全な汎用システムの緩和を特徴付けることができることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:40:22 GMT)
The Missing Curve Detectors of InceptionV1: Applying Sparse Autoencoders to InceptionV1 Early Vision [0.0] スパースオートエンコーダ(SAE)に関する最近の研究は、ニューラルネットワークから解釈可能な特徴を抽出する上で有望であることを示している。
本稿では、よく研究された畳み込みニューラルネットワークであるInceptionV1の初期の視覚層にSAEを適用する。
以上の結果から,SAEは個々のニューロンから明らかでない新しい解釈可能な特徴を発見できることが示された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:28:49 GMT)
Symmetry-induced higher-order exceptional points in two dimensions [0.0] 2次元パラメータ空間における対称性誘起高次EPの出現の完全な特徴付けを行う。
EP2s以外のEP3s、EP4s、EP5sは2Dで安定化できる。
これらの高次EPは、常に対称性によって決定される分散とペアで現れなければならない。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:05:19 GMT)
Success probabilities in time-reversal based hybrid quantum state transfer [0.0] 空飛ぶ量子ビットで接続された量子ネットワークの2つのメモリノードを考える。
実際のフライングキュービットのスペクトル形状と理想的な形状の重なり合いによって、どのように、なぜ対面する確率が決定されるのかを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:58:39 GMT)
Spherinator and HiPSter: Representation Learning for Unbiased Knowledge Discovery from Simulations [0.0] 我々は、幅広いシミュレーションから有用な科学的洞察を得るための、新しい、偏見のない、機械学習に基づくアプローチについて説明する。
我々の概念は、低次元空間におけるデータのコンパクトな表現を学習するために非線形次元削減を適用することに基づいている。
本稿では、回転不変な超球面変動畳み込み自己エンコーダを用いて、潜時空間の電力分布を利用して、IllustrisTNGシミュレーションから銀河を訓練したプロトタイプを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:34:58 GMT)
Spatial-Temporal Graph Representation Learning for Tactical Networks Future State Prediction [0.0] 本稿では,戦術通信ネットワークのための空間時間グラフデコーダ(STGED)フレームワークを紹介する。
STGEDはグラフベースのアテンション機構を利用して、一連の通信ネットワーク状態を空間的に符号化する。
我々は,STGEDが時間ステップの異なる入力に対して,ベースラインモデルよりも大きなマージンで一貫した性能を示すことを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:13:41 GMT)
Shaping History: Advanced Machine Learning Techniques for the Analysis and Dating of Cuneiform Tablets over Three Millennia [0.0] 紀元前4千年紀後期頃の古代メソポタミアに出現したキュニフォーム・タブレットは、人類最古の書記体系の1つである。
伝統的に、これらのタブレットの分析と日付は、形状と書体の主観的な評価に依存している。
デジタル化の最近の進歩は、アクセシビリティと分析能力を高めることによって、キュニフォームの研究に革命をもたらした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:05:32 GMT)
Sequential memory improves sample and memory efficiency in Episodic Control [0.0] 最先端の強化学習アルゴリズムは、パフォーマンスを達成するために必要なエピソードの数が多いため、サンプル非効率である。
哺乳類の海馬にインスパイアされたERLアルゴリズムは、通常、拡張メモリシステムを使用して過去の出来事から学習をブートストラップし、このサンプル非効率問題を克服する。
ここでは、エピソードサンプリングの順序から得られる取得メモリ内容のバイアスを含めることで、エピソード制御アルゴリズムのサンプリングとメモリ効率が向上することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:50:45 GMT)
Robust preparation of ground state phases under noisy imaginary time evolution [0.0] 我々は、様々なノイズモデルに基づく非単体ITT「回路」について考察する。
ノイズの存在下では, 基底状態秩序と相転移が持続することがわかった。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:29:12 GMT)
Revisiting fixed-point quantum search: proof of the quasi-Chebyshev lemma [0.0] グローバーのアルゴリズムはソッフル問題に悩まされており、これは量子探索の成功確率が、時間が小さすぎる場合や、適切な時間から大きすぎる場合、劇的に減少することを意味する。
ソッフル問題を克服するため、最適なクエリ数を持つ固定点量子探索を提案した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:26:11 GMT)
Revisiting astrophysical bounds on continuous spontaneous localization models [0.0] これまでに見いだされたいくつかの天体物理学的境界を再検討し、様々なコンパクト物体の自然加熱試験法を導入する。
それぞれのバウンダリを比較し、それぞれのメリットと欠点について議論します。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:42:10 GMT)
Reinterpreting 'the Company a Word Keeps': Towards Explainable and Ontologically Grounded Language Models [0.0] 我々は,大言語モデル(LLM)の相対的な成功は,記号的対準記号的議論の反映ではないと主張している。
我々は,LLMで採用されたのと同じボトムアップ戦略を,シンボリック・セッティングで採用することを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:38:35 GMT)
RF-Photonic Deep Learning Processor with Shannon-Limited Data Movement [0.0] 光ニューラルネットワーク(ONN)は、超低レイテンシとエネルギー消費を持つ有望な加速器である。
我々は、周波数領域のデータを符号化する乗法的アナログ周波数変換ONN(MAFT-ONN)を導入する。
我々は、生のRF信号で完全にアナログのディープラーニングを演算する最初のハードウェアアクセラレータを実験的に実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:32:35 GMT)
Quantum-to-classical crossover in the spin glass dynamics of cavity QED simulators [0.0] 量子および古典的なスピングラスは、大きく異なる進化を示す。
相互作用のボソニック媒質の周波数が横磁場の値に近づくと、スピンガラスの秩序が共鳴的に向上することを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:36:40 GMT)
Quantum Speed Limits for Implementation of Unitary Transformations [0.0] 任意の次元におけるユニタリ作用素による量子進化の速度限界に関する境界を与える。
私たちが見いだす境界は、マンデルスタム・タム(TM)とマルゴラス・レヴィチン(MT)の一般化と考えることができる。
量子情報処理に関心のある変換のいくつかのクラスにおけるこれらの境界の適用について論じる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:17:21 GMT)
QuAS: Quantum Application Score for benchmarking the utility of quantum computers [0.0] 本稿では,Quantum Application Score (QuAS) と呼ばれる改訂された総合的スコア法を提案する。
本稿では,量子コンピュータの実用性をよりよく評価するアプリケーションレベルの計量値を得る方法について論じる。
D-WaveやIBM、量子インスパイアやリゲッティの量子シミュレータなど、さまざまなハードウェアプラットフォーム上で新しいメトリクスを評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:39:58 GMT)
Probing quantum complexity via universal saturation of stabilizer entropies [0.0] 非安定化性(nonstabilizerness)またはマジック(Magic)は、量子コンピューティングの鍵となるリソースである。
安定化器 R'enyi entropies (SREs) は, 臨界数の非クリフォード演算においてその最大値を飽和させることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:46:35 GMT)
Pre-trained Transformer Uncovers Meaningful Patterns in Human Mobility Data [0.0] 本研究では、国規模の未ラベルの人体移動データに基づいて事前訓練されたトランスフォーマーが、対象の地理の深い理解を深めることのできる埋め込みを学習することを示す。
我々は,人間の移動性に関する幅広い概念をカプセル化するために,事前学習した埋め込みの性能を評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:59:46 GMT)
Physics-Informed Neural Network based inverse framework for time-fractional differential equations for rheology [0.0] 時間差分方程式は、記憶効果によって特徴づけられる現象を捉えるための堅牢な枠組みを提供する。
しかし、分数微分を含む逆問題の解決は、安定性と特異性に関連する問題を含む顕著な課題を提示する。
本研究では, PINNの適用範囲を広げて, 時間-屈折微分を含む逆問題に対処し, 異常拡散と, 2) 分数粘弾性方程式の2つの問題を対象とする。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 01:29:17 GMT)
Path Integrals from Spacetime Quantum Actions [0.0] 量子トレースを用いて「歴史上の仮定」を識別できる新しい形式主義を提案する。
ファインマンのパス積分(PI)の定式化から QM の標準的バージョンがどのように多くの性質を継承するかを論じる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:17:35 GMT)
Particle creation using the classical stochastic method [0.0] 古典的手法を用いて高調波発振器の粒子生成を計算する。
はじめに真空状態を作成し、ランゲヴィンの運動方程式を用いて時間とともに進化させる。
アンサンブルを平均化することにより、状態のエネルギーを最終時に計算し、生成した粒子の量を決定する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:47:45 GMT)
PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips Dataset [0.0] PARADISE は,wikiHow をベースとした実践的な手続きテキスト上で,Q&A 形式を用いた帰納的推論タスクである。
計画の暗黙的な知識を与えられた目標からのみ推論するモデルの能力をテストすることを目的として、中間的なステップを除く、目標に直接関連した警告およびヒント推論タスクを含む。
我々の実験は、微調整言語モデルとゼロショットプロンプトを利用して、ほとんどのシナリオにおいて、大規模言語モデルに対するタスク固有小モデルの有効性を明らかにした。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:22:16 GMT)
Optomechanical Backaction in the Bistable Regime [0.0] 機械共振器の内在性非線形キャビティバックアクション冷却がキャビティの非線形状態内で深く動作可能であることを示す。
非線形性を考慮に入れた理論により, 分岐点を超えた空洞においても, バックアクション冷却の正確な予測が可能である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:17:50 GMT)
Optimisation of time-ordered processes in the finite and asymptotic regime [0.0] 量子情報理論における多くの問題は、力学系の逐次的な結果に対する最適化として定式化することができる。
本研究では,このクラスの最適化問題に対して,トラクタブル緩和を導入する。
無限個の時間ステップの極限における逐次問題の最大スコアは一般に計算不可能であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:02:08 GMT)
Operator dynamics and entanglement in space-time dual Hadamard lattices [0.0] 空間格子上および離散時間で定義された多体量子力学(ストロボスコープフロケ系または量子回路)は、ここ数年研究の活発な領域であった。
空間と時間において離散的であると、自然な疑問が生じる: いつそのようなモデルは時とともに空間において一元的に進化すると見なすことができるのか?
この性質を持つモデルは時空双対性(英語版)と呼ばれることもあるが、絡み合い成長や相関関係に関連する多くの興味深い特徴を持っていることが示されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:48:43 GMT)
Open Problem: Active Representation Learning [0.0] 本稿では,部分的に観察可能な環境下での探索学習と表現学習を両立させる新しい課題のクラスである,能動表現学習の概念を紹介する。
我々は、能動的局所化とマッピング(能動SLAM)からアイデアを拡張し、それを適応顕微鏡で実証した科学的発見問題に変換する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:23:22 GMT)
Ontology for Healthcare Artificial Intelligence Privacy in Brazil [0.0] この記事では、医療における人工知能(AI)の応用に備えて、病院データを匿名で扱うための体系的なアプローチを概説する。
開発プロセスは、スコープの定義、知識の選択、重要な用語のレビュー、疫学研究で使用されるデザインを記述するクラスの構築、機械学習パラダイム、データと属性の種類、匿名化されたデータが露出する可能性のあるリスク、プライバシー攻撃、再識別を緩和する技術、プライバシーモデル、匿名化の効果を測定するメトリクスを含む7つの実践的なステップで構成された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:49:29 GMT)
Nonstandard derivation of the Gorini-Kossakowski-Sudarshan-Lindblad master equation of a quantum dynamical semigroup from the Kraus representation [0.0] 我々は、量子力学半群 $exp(tL)$ の生成元 $L$ が、ゴリーニ=コッサ=スダルシャン=リンドブラッド生成子(GKSL)と呼ばれる特定の形式を持つという定理の新たな非標準証明を与える(リンドブラディアンとも呼ばれる)。
また、閉完全正の写像が閉クラウス作用素を持つという関連する事実の非標準的証明を与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:26:49 GMT)
Non-Linear Inference Time Intervention: Improving LLM Truthfulness [0.0] Inference Time Intervention (ITI) フレームワークを開発した。
この改善は、非線形多点探索および多点介入の導入において現れている。
ITIの基準値に対して16%以上のMC1改善が報告された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:58:20 GMT)
Neural Networks Assisted Metropolis-Hastings for Bayesian Estimation of Critical Exponent on Elliptic Black Hole Solution in 4D Using Quantum Perturbation Theory [0.0] 楕円型クラス$textSL(2,mathbbR)$変換の4次元アインシュタイン-アキション-ディラトン系の量子摂動理論について検討する。
我々は, 量子摂動理論に基づく新しいニューラルネットワーク支援メトロポリス・ハスティングを開発し, 臨界指数を求める。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:55:55 GMT)
Modeling of New Energy Vehicles' Impact on Urban Ecology Focusing on Behavior [0.0] 新たなエネルギー車両の需要の急増は、エネルギーの保存、排出の削減、生態環境の強化によって引き起こされる。
新しいエネルギー車両の行動分析と鉱業利用パターンを特定できる。
新しいエネルギー車両と環境との相互作用をシミュレートするための環境計算モデリング手法が提案されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:03:52 GMT)
Megastable quantization in self-excited systems [0.0] 凝縮ポテンシャルの古典的な粒子は、ハミルトン保守力学系を生じさせる。
対応する量子粒子は、数え切れないほど無限の離散エネルギーレベルを示す。
我々の定式化は、一般の閉包ポテンシャルにおいて自励粒子に拡張することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:40:57 GMT)
Malware Classification Based on Image Segmentation [0.0] 本稿では,マルウェアの可視化と分類のための新しい手法を提案する。
マルウェアバイナリファイルから生成されたグレースケール画像を,セクションカテゴリに基づいてセグメント化する。
これらのサブイメージはマルチチャネルイメージとして扱われ、マルウェア分類のための深層畳み込みニューラルネットワークに入力される。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:05:20 GMT)
Machine Learning-Assisted Discovery of Flow Reactor Designs [0.0] 本稿では,次世代の化学反応器の設計のための機械学習支援手法を提案する。
我々は高次元パラメータ化、計算流体力学、多次元ベイズ最適化を適用する。
従来の設計よりも60%のプラグフロー性能向上をもたらす新しい設計特徴の選定を合理化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:21:09 GMT)
Loschmidt echo, emerging dual unitarity and scaling of generalized temporal entropies after quenches to the critical point [0.0] 我々は、共形場理論が進化の新たな二重ユニタリ性を意味することを予測し、確認する。
我々の結果は,最先端テンソルネットワークアルゴリズムを用いることで,クエンチの持続時間に応じて増大するリソースのみを必要とすることを示唆している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 07:26:48 GMT)
Looking Right is Sometimes Right: Investigating the Capabilities of Decoder-only LLMs for Sequence Labeling [0.0] 最近のデコーダのみの大規模言語モデル(LLM)は、より小さなステートベースのエンコーダと同等に動作する。
因果マスクを階層的に除去することで,IEタスク上でのオープンLLMのSL性能を向上させる手法について検討する。
その結果,層依存性CM除去によるオープンLCMは,強いエンコーダや命令調整LDMよりも優れていた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:33:19 GMT)
Leveraging SPD Matrices on Riemannian Manifolds in Quantum Classical Hybrid Models for Structural Health Monitoring [0.0] 橋梁のリアルタイム有限要素モデリングは、構造的整合性に関する包括的な洞察を提供することにより、現代の構造的健康モニタリングシステムを支援する。
FEM計算コストとリアルタイム解析の必要性は大きな課題である。
本研究では,新しい量子古典多層パーセプトロンパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:21:28 GMT)
Leveraging KANs For Enhanced Deep Koopman Operator Discovery [0.0] 多層パーセプトロン(MLP)は、非線形力学を線形化するディープ・クープマン作用素の発見に広く利用されている。
Kolmogorov-Arnold Networks (KAN) がより効率的かつ正確な代替手段として出現し、各ネットワークタイプの性能の比較を提案する。
学習速度は31倍、パラメータ効率は15倍、予測精度はDeep Neural Networks(DNN)の1.25倍である。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:13:35 GMT)
LCEN: A Novel Feature Selection Algorithm for Nonlinear, Interpretable Machine Learning Models [0.0] 本稿では,非線形で解釈可能な機械学習モデルを作成するためのLASSO-Clip-EN (LCEN)アルゴリズムを提案する。
LCENは、さまざまな人工および経験的なデータセットでテストされている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:18:40 GMT)
Krylov complexity of density matrix operators [0.0] KrylovをベースとしたKrylovの複雑性(C_K$)やSpreadの複雑性(C_S$)などが注目されている。
密度行列演算子で表される状態の複雑さを考慮し,それらの相互作用を考察する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:32:49 GMT)
Kirigami: large convolutional kernels improve deep learning-based RNA secondary structure prediction [0.0] 我々は,リボ核酸(RNA)分子の二次構造を予測するために,新しい完全畳み込みニューラルネットワーク(FCN)アーキテクチャを導入する。
深層学習を用いてヌクレオチド残基間の塩基対の確率を推定する。
広く採用されている1,305分子からなる標準化されたテストセットにおいて、本手法の精度は現在のSOTA(State-of-the-art)二次構造予測ソフトウェアよりも高い。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:04:32 GMT)
Interplay between the Hilbert-space dimension of the control system and the memory induced by quantum SWITCH [0.0] 制御系のヒルベルト空間次元の増大が量子SWITCHの性能に及ぼす影響について検討する。
制御系のヒルベルト空間次元の増大は、それによって引き起こされる非マルコフ記憶の増大につながることを観察する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:25:44 GMT)
Improving Model Chain Approaches for Probabilistic Solar Energy Forecasting through Post-processing and Machine Learning [0.0] 我々は,グローバル水平照度と太陽光発電のアンサンブル後予測のための統計的および機械学習手法を開発した。
その結果, 後処理が発電予測を大幅に改善すること, 特に後処理が発電予測に応用されることが示唆された。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:08:50 GMT)
High-dimensional entanglement witnessed by correlations in arbitrary bases [0.0] エンタングルメントの認証は多くの量子技術の開発において重要なステップである。
特に、相互バイアスのないベース(MUB)は、よく理解され、常に絡み合った認証のために使用されるパラダイム的な例である。
ここでは,MUBの相関関係から任意のベースへのエンタングルメント認証ツールボックスを,アライメント参照フレームを必要とせずに拡張する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:00:00 GMT)
High-Fidelity Electron Spin Gates in a Scalable Diamond Quantum Register [0.0] ダイヤモンド中のNVスピン間のエンタングゲートを頑丈に実装し易い。
環境条件下では,F=(96.0 pm 2.5)=%のレコードゲート忠実度を示す。
我々の支配的誤差の同定は、誤差補正しきい値を超えたNV-NVゲートへの道を開く。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:58:36 GMT)
Harmonic generation with topological edge states and electron-electron interaction [0.0] Su-Schrieffer-Heeger(SSH)モデルにおけるトポロジカルエッジ状態の存在は、高調波発生スペクトルに大きな影響を及ぼす。
我々は,多体基底状態と少数の励起多体状態のみを用いて,自明な位相と位相相の調和収率の大きな差を少数レベルのモデルで再現できることを示した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:31:38 GMT)
Haptic in-sensor computing device made of carbon nanotube-polydimethylsiloxane nanocomposites [0.0] 本研究では,犠牲テンプレート法を用いて階層構造を有する触覚センサの試作に成功した。
我々は入力刺激を高次元情報に変換し,CNTs-PDMSナノコンポジットの新たな経路を実現する。
このアプローチは、計算コストを削減しつつ、ロボットの触覚を高めることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 11:05:49 GMT)
Generative AI Needs Adaptive Governance [0.0] ジェネレーティブAIは、ガバナンス、信頼、ヒューマンエージェンシーの概念に挑戦する。
本稿では,ジェネレーティブAIが適応的ガバナンスを求めていることを論じる。
我々は、アクター、ロール、および共有およびアクター固有のポリシー活動の概要を概説する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:47:14 GMT)
Generalizing measurement-induced phase transitions to information exchange symmetry breaking [0.0] 情報力学は進化状態の R'enyi と von-Neumann エントロピーを用いて研究される。
エンタングルメント遷移は,情報交換対称性の自発的な破れとして理解することができることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:17:21 GMT)
Generalized phase estimation in noisy quantum gates [0.0] 我々は、キュービットゲートに焦点をあて、ゲートの連続的な応用の可能性を検討する。
我々は、Von Mises-Fisher分布に支配される古典的ゆらぎとして、キュービット回転に影響を与える劣化雑音と傾き雑音をモデル化する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:26:27 GMT)
Far from equilibrium field theory for strongly coupled light and matter: dynamics of frustrated multi-mode cavity QED [0.0] 我々は, 相互作用する光物質系の非平衡ダイナミクスを得るために, 関数積分法を適用した。
提案手法は, 「二粒子既約」 (2PI) の有効作用の構築に基礎を置いている。
我々は, フラストレーション型多モード量子電磁力学の文脈におけるスピンガラス生成の解析を補完するために, 本手法を適用した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:25:47 GMT)
FairytaleQA Translated: Enabling Educational Question and Answer Generation in Less-Resourced Languages [0.0] 本稿では,幼児の物語理解能力の評価と向上を目的とした,有名なQAデータセットであるFairytaleQAの機械翻訳版を紹介する。
我々は、翻訳データセット内の質問生成(QG)タスクとQAタスクのベンチマークを確立するために、微調整された、控えめなスケールのモデルを採用している。
本稿では,質問応答対の生成モデルを提案し,質問適合性,回答可能性,妥当性,子どもの適合性などの品質指標を取り入れた評価を行った。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:31:47 GMT)
FOOD: Facial Authentication and Out-of-Distribution Detection with Short-Range FMCW Radar [0.0] 本稿では,短距離FMCWレーダを用いた顔認証とオフ・オブ・ディストリビューション(OOD)検出フレームワークを提案する。
本研究パイプラインは,IDサンプルの正しいクラスを共同で推定し,OODサンプルを検出して不正確な予測を防止する。
また,60GHz短距離FMCWレーダを用いて収集したデータセットに対して,分布しない顔の識別における平均分類精度98.07%を実現した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:08:03 GMT)
Extraction of nonlinearity in neural networks with Koopman operator [0.0] ニューラルネットワークの非線形性が不可欠である程度について検討する。
我々は、Koopman演算子、拡張動的モード分解、テンソルトレイン形式を用いる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:28:12 GMT)
Evidence-based certification of quantum dimensions [0.0] 離散変数と連続変数の両方に対する一般的な次元認証プロトコルを導入する。
我々は、状態の有効次元を、後続確率が前よりも大きいような最小の次元とみなす。
スペクトル時間および偏光度測定による実験データを用いて、得られた有効次元に対してベイズ的可算誤差バーを正しく割り当てる方法について実証する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:12:30 GMT)
Evidence of the quantum-optical nature of high-harmonic generation [0.0] 我々は,高調波発生は,非古典的な光の発生を,システムのデコヒーレンスに先立って行うことができることを示す。
これはスケーラビリティやデコヒーレンス、巨大な絡み合った状態の生成といった量子技術の課題に対処する可能性がある。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:27:30 GMT)
Evaluating Large Vision-Language Models' Understanding of Real-World Complexities Through Synthetic Benchmarks [0.0] 本研究では,AI生成画像と人間生成画像とを区別するLVLM(Large Vision-Language Models)の能力を評価する。
この評価のための新しい自動ベンチマーク構築手法を導入する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 19:50:33 GMT)
Estimating molecular thermal averages with the quantum equation of motion and informationally complete measurements [0.0] 変分量子固有解法(VQE)を用いて量子系の熱平均を計算する。
qEOMの欠点は、システムの基底状態にある多数の観測値の期待値を測定する必要があることである。
本研究では,情報完全正の演算子評価尺度(IC-POVM)による測定に着目し,測定オーバーヘッドの低減を実現する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:02:24 GMT)
Environment induced dynamical quantum phase transitions in two-qubit Rabi model [0.0] 散逸性2量子Rabiモデルにおける動的量子相転移を観察する。
遷移は2ビットの絡み合いにも現れる。
これらの発見は、非可積分モデルにおける動的量子相転移の複雑な挙動に光を当てた。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 17:48:15 GMT)
Entanglement transitions in quantum-enhanced experiments [0.0] 関心のシステムから情報を伝達し、量子コンピュータで処理する量子強化実験は、サンプリングタスクにおいて指数関数的優位性を持つ可能性がある。
我々は、従来の実験で発生する測定誘起相転移(MIPT)と同様に、量子化実験も絡み合い相転移を示すことを実証した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 22:10:35 GMT)
Entanglement and Bell nonlocality with bottom-quark pairs at hadron colliders [0.0] 過去数年間、量子力学における重要な概念である絡み合いとベル非局所性は、高エネルギー衝突器で探索できることが示されている。
近年、LHCの底クォークの対でスピン相関を測定できることが示されている。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 18:00:02 GMT)
Enhancing Weather Predictions: Super-Resolution via Deep Diffusion Models [0.0] 本研究では,気象データの超解像に対するディープラーニング拡散モデルの適用について検討した。
本稿では,低分解能気象データを高分解能出力に変換する手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 14:15:12 GMT)
Engineering open-shell extended edge states in chiral graphene nanoribbons on MgO [0.0] Ag(001)上のMgO単分子膜上の狭いキラルグラフェンナノリボン(GNR)のエッジは、整数電荷とスピン-1/2フロンティア状態をホストできることが示されている。
薄肉絶縁膜で支持されるGNRは、量子センシングや量子情報処理において、テーラーメイドのアクティブな要素として使用できることを示唆する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 10:08:59 GMT)
Electronic states in quantum wires on a Möbius strip [0.0] M"オビウス帯に沿ったワイヤに拘束された2次元非相対論的電子ガスの特性について検討した。
各方向について、曲率が電子状態とその対応するエネルギースペクトルをどのように変化させるかを検討する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 20:42:10 GMT)
Digital Inheritance in Web3: A Case Study of Soulbound Tokens and the Social Recovery Pallet within the Polkadot and Kusama Ecosystems [0.0] 本研究では,ソウルバウンドトークンとソーシャルリカバリパレットを用いたデジタル継承の枠組みを提案する。
この結果は、ソウルバウンドトークンとソーシャルリカバリパレットがデジタル継承計画の作成に有望なソリューションを提供する一方で、テスタのデジタルエグゼキュータや開発者にとって重要な考慮がもたらされることを示唆している。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:30:09 GMT)
Data-driven discovery of self-similarity using neural networks [0.0] 本稿では、観測データから直接自己相似性を発見するニューラルネットワークに基づく新しいアプローチを提案する。
物理問題における自己相似解の存在は、支配法則が権力者指数によって主張される関数を含むことを示す。
観測データを用いてニューラルネットワークモデルをトレーニングし、トレーニングが成功すれば、物理問題のスケール・トランスフォーメーション対称性を特徴付けるパワー指数を抽出できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:36:05 GMT)
Count-mean Sketch as an Optimized Framework for Frequency Estimation with Local Differential Privacy [0.0] パラメータの異なるプライベートなCount-Mean Sketch(CMS)アルゴリズムを再検討する。
我々は既存のバイアスを取り除くためにCMSの実装を変更します。
ペアワイズ非依存ハッシュがCMSに十分であることを示す。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 06:55:08 GMT)
Contrastive Sparse Autoencoders for Interpreting Planning of Chess-Playing Agents [0.0] 本研究では,一対のゲームトラジェクトリを研究するために,CSAE(Sparse Autoencoder)を提案する。
CSAEを用いて,チェスエージェントの計画に意味のある概念を抽出し,解釈することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:57:31 GMT)
Concurrent Training and Layer Pruning of Deep Neural Networks [0.0] トレーニングの初期段階において、ニューラルネットワークの無関係な層を特定し、排除できるアルゴリズムを提案する。
本研究では,非線形区間を切断した後にネットワークを流れる情報の流れを,非線形ネットワーク区間の周囲の残差接続を用いた構造を用いる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 23:19:57 GMT)
Computing $\varphi(N)$ for an RSA module with a single quantum query [0.0] RSAモジュールの$N$に対して$varphi(N)$を、ランダムに選択された整数の代入として$N$を演算する計算時間アルゴリズムを与える。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 13:30:18 GMT)
Complementary polynomials in quantum signal processing [0.0] 与えられた$P$を実装するには、まず対応する補完的な$Q$を構築しなければならない。
この問題に対する既存のアプローチでは、明示的な誤り解析には適さない数値的手法が採用されている。
複素解析を用いた補体系に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:47:11 GMT)
Coherent control of a triangular exchange-only spin qubit [0.0] 3電子交換のみのスピン量子ビットのコヒーレント制御と、近接した三角形の幾何学で配列された量子ドットが示される。
交換結合の時間領域制御を示し、キュービット性能を特徴付ける。
コンパクトな三角形デバイス形状は、接続性の高い2次元量子ドットアレイに容易に拡張できる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 03:03:00 GMT)
Classification of Non-native Handwritten Characters Using Convolutional Neural Network [0.0] 非ネイティブユーザによる英語文字の分類は、カスタマイズされたCNNモデルを提案することによって行われる。
我々はこのCNNを、手書きの独立した英語文字データセットと呼ばれる新しいデータセットでトレーニングする。
5つの畳み込み層と1つの隠蔽層を持つモデルでは、文字認識精度において最先端モデルよりも優れる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:08:07 GMT)
Circuit-level fault tolerance of cat codes [0.0] ボソニック符号は、量子情報を単一の無限次元物理系に格納することを可能にする。
ボソニックコードにおける現在の取り組みの多くは、損失エラーのみを修正することにある。
猫符号を符号化した情報保存のための誤り訂正回路の性能を評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:18:25 GMT)
Chebyshev Spectral Neural Networks for Solving Partial Differential Equations [0.0] この研究は、フィードフォワードニューラルネットワークモデルとエラーバックプロパゲーション原理を用いて、損失関数の計算に自動微分(AD)を利用する。
楕円偏微分方程式を用いて,CSNNモデルの数値効率と精度について検討し,よく知られた物理インフォームドニューラルネットワーク(PINN)法と比較した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 05:31:45 GMT)
Can Large Language Models abstract Medical Coded Language? [0.0] 大規模言語モデル(LLM)は医療コードを認識しており、これらのコードから正確に名前を生成することができる。
本研究は,大規模言語モデル(LLM)が医療コードを認識し,それらのコードから正確に名前を生成することができるかどうかを評価する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:58:49 GMT)
Byzantine Attacks Exploiting Penalties in Ethereum PoS [0.0] 本稿ではブロックチェーン内の安全性に対する不活性リークの影響について検討する。
我々の発見は、不活性ノードのペナルティ化がブロックチェーンの特性を損なう可能性があることを発見した。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 16:27:39 GMT)
Building Hybrid B-Spline And Neural Network Operators [0.0] 制御システムはサイバー物理システム(CPS)の安全性を確保するために不可欠である
本稿では,B-スプラインの帰納バイアスとデータ駆動型ニューラルネットワークを組み合わせることで,CPS行動のリアルタイム予測を容易にする手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 21:54:59 GMT)
Beyond Traditional Benchmarks: Analyzing Behaviors of Open LLMs on Data-to-Text Generation [0.0] データ・トゥ・テキスト(D2T)生成タスクにおけるオープン・大規模言語モデル(LLM)の挙動を解析する。
オープン LLM は,Quintd で収集した共通フォーマットのデータから,ゼロショット設定で,ゆるやかで一貫性のあるテキストを生成することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 12:29:44 GMT)
Bayesian sequential design of computer experiments for quantile set inversion [0.0] 複素数値シミュレータのようなシステムを表現する未知の多変量関数を考える。
我々の目的は、確率が与えられた閾値未満の出力につながる決定論的入力のセットを推定することである。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 08:18:04 GMT)
Analyzing the sensitivity of an atom interferometer with a phase modulation readout scheme [0.0] 典型的な読み出し方式を用いて原子干渉計の感度を解析的に算出する。
正弦波位相変調を用いることで、従来の位相浄化法で得られた感度を超えることができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 09:50:04 GMT)
Analytic thermodynamic properties of the Lieb-Liniger gas [0.0] 本稿では, 1次元ボース気体のリーブ・ライニガー模型の有限温度熱力学量を記述する, 近似解析手法の現状について概説する。
この量子多体理論のパラダイムモデルは、物理学の多くの分野において重要な役割を果たす。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 00:23:46 GMT)
AI without networks [0.0] 我々は、生成モデリングを取り入れたAIのためのネットワークフリーフレームワークを開発する。
我々は、この枠組みを、民族学、制御理論、数学の3つの異なる分野の例で示す。
また、生成AIによる倫理的法的課題に対処するために、この枠組みに基づいて容易に計算された信用割当手法を提案する。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 02:50:06 GMT)
A Voxel-based Approach for Simulating Microbial Decomposition in Soil: Comparison with LBM and Improvement of Morphological Models [0.0] 本研究では,有機物の微生物分解をシミュレーションするための新しい計算手法を提案する。
この方法は、変換および拡散過程をシミュレートするために、連結ボクセルの値付きグラフを用いる。
得られたモデルは、多孔質媒体の拡散変換過程をシミュレートするために適応することができる。
論文参考訳(メタデータ) (Thu, 6 Jun 2024 15:35:25 GMT)