CoIN: A Benchmark of Continual Instruction tuNing for Multimodel Large Language Model [121.2] 逐次的命令チューニングパラダイムにおける既存のMLLMを評価するためのベンチマークであるContinuous Instruction tuNing(CoIN)を提案する。
CoINの実験では、現在の強力なMLLMが依然として破滅的な忘れを被っていることが示されている。
従来の命令アライメントを維持するのに有効なMLLMにMoELoRAを導入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:16:37 GMT)
RealignDiff: Boosting Text-to-Image Diffusion Model with Coarse-to-fine Semantic Re-alignment [112.5] 本稿では,RealignDiffという2段階の粗大なセマンティックアライメント手法を提案する。
粗いセマンティックリアライメントフェーズにおいて、生成された画像キャプションと与えられたテキストプロンプトとのセマンティックな相違を評価するために、新しいキャプション報酬を提案する。
微妙なセマンティックリアライメントステージは、局所的な密集キャプション生成モジュールと再重み付けアテンション変調モジュールを用いて、局所的なセマンティックビューから生成された画像を洗練する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:59:05 GMT)
Linear Adversarial Concept Erasure [108.4] 与えられた概念に対応する線形部分空間の同定と消去の問題を定式化する。
提案手法は, トラクタビリティと解釈性を維持しつつ, 深い非線形分類器のバイアスを効果的に軽減し, 高い表現性を有することを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:28:38 GMT)
Scaling Diffusion Language Models via Adaptation from Autoregressive Models [105.7] 拡散言語モデル(DLM)は、テキスト生成モデルのための将来性のある新しいパラダイムとして登場した。
170Mから7BまでのARモデルをDiffuGPTとDiffuLLaMAの拡散モデルに変換し、200B未満のトークンでトレーニングできることを示す。
実験の結果,これらのモデルは初期のDLMよりも優れており,ARと競合していることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:04:22 GMT)
How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? [91.5] 本稿では,CIDM(Concept-Incremental Text-to-image Diffusion Model)を提案する。
破滅的な忘れと概念の無視を解決し、新しいカスタマイズタスクを概念的な方法で学習する。
実験により、CIDMが既存のカスタム拡散モデルを上回ることが確認された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:47:29 GMT)
R-CoT: Reverse Chain-of-Thought Problem Generation for Geometric Reasoning in Large Multimodal Models [86.1] 本稿では,R-CoT(Reverse Chain-of-Thought)幾何問題生成パイプラインを提案する。
まず、GeoChainを導入し、高忠実度幾何画像とそれに対応する記述を生成する。
次に、記述に基づいてステップバイステップの推論を行うReverse A&Q手法を設計し、推論結果から逆の質問を生成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:58:39 GMT)
MIA-DPO: Multi-Image Augmented Direct Preference Optimization For Large Vision-Language Models [85.3] Multi-Image Augmented Direct Preference Optimization (MIA-DPO)は、マルチイメージ入力を効果的に処理する視覚的嗜好アライメントアプローチである。
MIA-DPOは、グリッドコラージュやピクチャ・イン・ピクチャ形式で配置された無関係な画像で単一の画像データを拡張することにより、多様なマルチイメージトレーニングデータの不足を軽減する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:56:48 GMT)
Optimal Design for Reward Modeling in RLHF [83.4] 我々は,人間からの強化学習における報酬訓練モデルを定式化する。
有効なデータセットの選択は、単純な後悔の最小化タスクとしてフレーム化します。
適切な前提の下では、単純な後悔に縛られる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:55:39 GMT)
1-bit AI Infra: Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs [81.7] bitnetは1ビットのLarge Language Modelの可能性を最大限に活用するために設計されたソフトウェアスタックです。
実験では、bitnetはxCPUの2.37xから6.17x、ARMの1.37xから5.07xまでの大幅なスピードアップを実現している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:17:42 GMT)
Pulling Target to Source: A New Perspective on Domain Adaptive Semantic Segmentation [80.1] ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送することを目的としています。
我々はT2S-DAを提案し、T2S-DAはドメイン適応のためのソースにターゲットを引っ張る形式として解釈する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:53:05 GMT)
WorldSimBench: Towards Video Generation Models as World Simulators [79.7] 我々は、予測モデルの機能を階層に分類し、WorldSimBenchと呼ばれる2つの評価フレームワークを提案することにより、World Simulatorの評価の第一歩を踏み出す。
WorldSimBenchにはExplicit Perceptual EvaluationとImplicit Manipulative Evaluationが含まれている。
我々の総合的な評価は、ビデオ生成モデルのさらなる革新を促進する重要な洞察を与え、World Simulatorsをエンボディされた人工知能への重要な進歩と位置づけている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:56:11 GMT)
Set-based Meta-Interpolation for Few-Task Meta-Learning [79.4] そこで本研究では,メタトレーニングタスクの分散化を目的とした,ドメインに依存しないタスク拡張手法Meta-Interpolationを提案する。
様々な領域にまたがる8つのデータセットに対してメタ補間の有効性を実証的に検証した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:00:40 GMT)
Mechanisms of Symbol Processing for In-Context Learning in Transformer Networks [78.5] 大規模言語モデル(LLM)は、文脈内学習(ICL)によるシンボル処理における印象的な能力を示した。
トランスネットワークにおけるロバストなシンボル処理を実現するメカニズムの解明を目指す。
複雑で抽象的なシンボル処理を行うための記号プログラムを記述できる高レベル言語 PSL を開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:38:10 GMT)
Few-shot NeRF by Adaptive Rendering Loss Regularization [78.5] スパース入力を用いた新しいビュー合成はニューラルラジアンス場(NeRF)に大きな課題をもたらす
近年の研究では、位置レンダリングの周波数規則化は、数発のNeRFに対して有望な結果が得られることが示されている。
我々は,AR-NeRFと呼ばれる数発のNeRFに対して適応レンダリング損失正規化を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:05:26 GMT)
Scalable Ranked Preference Optimization for Text-to-Image Generation [76.2] 直接優先度最適化(DPO)は、テキスト・ツー・イメージ(T2I)モデルを人間のフィードバックに合わせるための強力なアプローチとして登場した。
本研究では,DPOトレーニングのための大規模および完全合成データセット収集のためのスケーラブルなアプローチについて検討する。
具体的には、事前訓練された報酬関数を用いてペア画像の好みを生成し、アノテーションプロセスに人間を巻き込む必要をなくす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:42:56 GMT)
Leveraging Hallucinations to Reduce Manual Prompt Dependency in Promptable Segmentation [74.0] 本稿では,プロペラジェネレータとマスクジェネレータを備えたProMaC(Prompt-Mask Cycle Generation framework)を提案する。
プロンプトジェネレータは、最初は、テストイメージ上で拡張された文脈知識を抽出するための幻覚を探究する、複数スケールの思考プロンプトの連鎖を使用する。
生成されたマスクは、プロンプトジェネレータを反復的にタスク関連の画像領域に集中させ、無関係な幻覚を減らし、より良いプロンプトとマスクを共同で生成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:33:47 GMT)
Conditional Language Policy: A General Framework for Steerable Multi-Objective Finetuning [72.5] Conditional Language Policy (CLP) は、複数の目的に対して言語モデルを微調整するためのフレームワークである。
CLPは、推論時に競合する目的を効果的にトレードオフするステアブルモデルを学ぶ。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:42:39 GMT)
Mind's Eye of LLMs: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models [71.9] 大規模言語モデル(LLM)は、言語理解と様々な推論タスクにおいて印象的な性能を示した。
本稿では,LLMの空間的推論を視覚的に行うために,VoT(Visual-of-Thought)を提案する。
VoTはLLMの空間的推論能力を著しく向上させる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:20:26 GMT)
A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers [70.4] イベント予測への既存のアプローチには、タイムアウェアな位置埋め込み、学習行とフィールドエンコーディング、クラス不均衡に対処するオーバーサンプリング方法などがある。
基本位置埋め込みと因果言語モデリングの目的を持つ標準自己回帰型LPM変換器を用いて,単純だが柔軟なベースラインを提案する。
私たちのベースラインは、一般的なデータセットで既存のアプローチよりも優れており、さまざまなユースケースに使用することができます。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:24:23 GMT)
I've Got 99 Problems But FLOPS Ain't One [70.3] 私たちは、機械学習アプリケーションのための1000億ドルのデータセンターを構築するための公開計画から始まり、関連する研究方向を見つけるために、従来からあるアプローチを取っています。
データセンターのようなワークロードが持つものを見つけ、ネットワーク研究に焦点をあてて、その課題を探求します。
我々は、データセンターの構築とそのようなモデルの訓練は技術的に可能であると結論づけるが、これはDC間通信のための新しい広域トランスポート、マルチパストランスポート、および新しいデータセンタートポロジを必要とする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:00:36 GMT)
A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers [70.2] イベント予測への既存のアプローチには、タイムアウェアな位置埋め込み、学習行とフィールドエンコーディング、クラス不均衡に対処するオーバーサンプリング方法などがある。
基本位置埋め込みと因果言語モデリングの目的を持つ標準自己回帰型LPM変換器を用いて,単純だが柔軟なベースラインを提案する。
私たちのベースラインは、一般的なデータセットで既存のアプローチよりも優れており、さまざまなユースケースに使用することができます。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:24:23 GMT)
Toward Fairer Face Recognition Datasets [69.0] 顔認識と検証は、ディープ表現の導入によってパフォーマンスが向上したコンピュータビジョンタスクである。
実際のトレーニングデータセットにおける顔データとバイアスのセンシティブな性格による倫理的、法的、技術的な課題は、彼らの開発を妨げる。
生成されたトレーニングデータセットに階層属性のバランス機構を導入することにより、公平性を促進する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:45:20 GMT)
Dynamic Spectrum Access for Ambient Backscatter Communication-assisted D2D Systems with Quantum Reinforcement Learning [68.6] 無線スペクトルは乏しくなり、D2D通信のスペクトル効率は低い。
本稿では, 周囲RF信号の後方散乱を可能にするために, 環境後方散乱通信技術をD2Dデバイスに統合することを目的とする。
我々は、より少ないトレーニングパラメータでより高速な収束率を達成することができる新しい量子強化学習(RL)アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:36:43 GMT)
MMBench-Video: A Long-Form Multi-Shot Benchmark for Holistic Video Understanding [67.6] 本稿では,ビデオ理解において大規模視覚言語モデル(LVLM)を厳格に評価するための定量的なベンチマークであるMMBench-Videoを紹介する。
MMBench-VideoにはYouTubeの長いビデオが組み込まれており、フリーフォームの質問を採用し、実用的なユースケースを反映している。
ベンチマークは、慎重に構築された能力の分類に従って人間に注釈を付けることで、モデルの時間的推論スキルを調査するために慎重に作成されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:09:54 GMT)
RoPINN: Region Optimized Physics-Informed Neural Networks [66.4] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法として広く応用されている。
本稿では,地域最適化としての新たな訓練パラダイムを提案し,理論的に検討する。
実践的なトレーニングアルゴリズムであるRerea Optimized PINN(RoPINN)は、この新しいパラダイムからシームレスに派生している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:26:20 GMT)
ProgFed: Effective, Communication, and Computation Efficient Federated Learning by Progressive Training [65.7] 本稿では,効率的なフェデレート学習のためのプログレッシブトレーニングフレームワークであるProgFedを提案する。
ProgFedは計算と双方向通信のコストを本質的に低減し、最終モデルの強力な性能を維持している。
以上の結果から, ProgFed はフルモデルの標準トレーニングと同等の速度で収束することがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:52:23 GMT)
VoiceTextBlender: Augmenting Large Language Models with Speech Capabilities via Single-Stage Joint Speech-Text Supervised Fine-Tuning [64.6] 大規模言語モデル(LLM)のバックボーンの低ランク適応(LoRA)に対して,新しい単一段階共同音声テキストSFTアプローチを提案する。
従来のSpeechLMの7Bまたは13Bパラメータと比較すると,我々の3Bモデルは様々な音声ベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:36:06 GMT)
TravelPlanner: A Benchmark for Real-World Planning with Language Agents [63.2] 我々は,旅行計画に焦点を当てた新しい計画ベンチマークであるTravelPlannerを提案する。
豊富なサンドボックス環境、400万近いデータレコードにアクセスするためのさまざまなツール、計画意図とリファレンスプランを慎重にキュレートした1,225のツールを提供する。
包括的評価では、現在の言語エージェントがそのような複雑な計画タスクを処理できないことが示されており、GPT-4でさえ0.6%の成功率しか達成できない。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:02:57 GMT)
An Adaptive Framework for Generating Systematic Explanatory Answer in Online Q&A Platforms [62.9] 質問応答(QA)性能を向上させるために設計された,革新的なフレームワークであるSynthRAGを提案する。
SynthRAGは動的コンテンツの構造化に適応的なアウトラインを用いることで従来のモデルを改善する。
Zhihuプラットフォーム上のオンラインデプロイメントでは、SynthRAGの回答が注目すべきユーザエンゲージメントを実現していることが明らかになった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:14:57 GMT)
Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.5] 知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。
それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。
本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:01:14 GMT)
The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention [61.8] 我々は多様性の介入とT2Iモデルにおける人口統計学的事実性とのトレードオフを定量化する。
DoFaiRの実験では、多様性指向の指示によって、性別や人種の異なる集団の数が増加することが明らかになった。
本研究では,歴史における世代ごとのジェンダーや人種構成について,言語化された事実情報を反映したFact-Augmented Intervention (FAI)を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:53:28 GMT)
Learning Lossless Compression for High Bit-Depth Volumetric Medical Image [61.7] 本稿では,高ビット深度医用ボリューム圧縮に適したBit-DivisionベースのLosless Volumetric Image Compressionフレームワークを提案する。
BD-LVICフレームワークは、高ビット深度を2つの下位ビット深度セグメント(MSBV)とLast Significant Bit-Volume(LSBV)に巧みに分割する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:18:36 GMT)
Gaussian-Informed Continuum for Physical Property Identification and Simulation [60.3] 本稿では,視覚的観察を通して物理特性(システム同定)を推定する問題について検討する。
そこで我々は,物体を3次元ガウス点集合として復元するために,運動因子化に基づく新しい動的3次元ガウスフレームワークを提案する。
抽出された物体表面に加えて、ガウスインフォームド連続体はシミュレーション中の物体マスクのレンダリングを可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:01:34 GMT)
Learning to Plan for Retrieval-Augmented Large Language Models from Knowledge Graphs [59.8] 知識グラフ(KG)から得られた計画データを用いて,大規模言語モデル(LLM)計画能力を向上するための新しいフレームワークを提案する。
KGデータで微調整されたLLMは、計画能力を向上し、検索を含む複雑なQAタスクを処理するのがより適している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:42:59 GMT)
RaTEScore: A Metric for Radiology Report Generation [59.4] 本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:53:00 GMT)
Attribute or Abstain: Large Language Models as Long Document Assistants [58.3] LLMは人間が長い文書を扱うのを助けることができるが、幻覚で知られている。
既存の属性に対するアプローチはRAG設定でのみ評価されている。
これは、検索が不要な長いドキュメント設定とは大きく異なるが、助けになる可能性がある。
そこで本研究では,6種類の多種多様文書タスクのベンチマークであるLABと,異なる大きさの5つのLLMに対する属性に対する異なるアプローチの実験を行う。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:00:40 GMT)
The Male CEO and the Female Assistant: Evaluation and Mitigation of Gender Biases in Text-To-Image Generation of Dual Subjects [58.3] 本稿では,Paired Stereotype Test (PST) フレームワークを提案する。
PSTクエリT2Iモデルは、男性ステレオタイプと女性ステレオタイプに割り当てられた2つの個人を描写する。
PSTを用いて、ジェンダーバイアスの2つの側面、つまり、ジェンダーの職業におけるよく知られたバイアスと、組織力におけるバイアスという新しい側面を評価する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:47:44 GMT)
SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.1] タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:42:07 GMT)
Hijack-GAN: Unintended-Use of Pretrained, Black-Box GANs [57.9] 現状のGANモデルは、無条件画像生成以外の様々な用途に利用できることを示す。
我々は、画像生成プロセスの制御も可能な反復的なスキームによりこれを達成した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:55:35 GMT)
LLM-Assisted Multi-Teacher Continual Learning for Visual Question Answering in Robotic Surgery [57.4] 患者のデータのプライバシは、モデル更新時に古いデータの可用性を制限することが多い。
CL研究は外科領域で2つの重要な問題を見落としていた。
本稿では,多モーダル大規模言語モデル (LLM) と適応重み付け手法を用いて,これらの問題に対処することを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:27:48 GMT)
Reconfidencing LLMs from the Grouping Loss Perspective [56.8] 大規模言語モデル(LLM)は、自信のある音調で幻覚的な答えを生じさせる可能性がある。
近年の研究では、不確実性制御はキャリブレーションを超えて行わなければならないことが示されている。
そこで我々は,MistralとLLaMAの回答に対する信頼度を評価するために,知識ベースから導出した新しい評価データセットを構築した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:08:57 GMT)
ALTA: Compiler-Based Analysis of Transformers [56.8] 本稿では,ALTAプログラムをトランスフォーマー重みにマッピングできるALTAとコンパイラを提案する。
ALTA は Weiss らによって提案された RASP にインスパイアされている。
コンポジション一般化タスクのSCANベンチマークの解法と同様に,トランスフォーマーがパリティと加算を計算するための長さ不変のアルゴリズムをどう表現できるかを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:58:49 GMT)
FreeVS: Generative View Synthesis on Free Driving Trajectory [55.5] FreeVSは、実際の運転シーンで、無料の新しい軌跡のカメラビューを合成できる、新しい完全に生成的なアプローチである。
FreeVSは、新しいトラジェクトリの再構成プロセスや合成ビューなしで、バリデーションシーケンスに適用できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:59:11 GMT)
Klein-Gordon oscillators and Bergman spaces [55.2] 我々はミンコフスキー空間$mathbbR3,1$における相対論的発振子の古典的および量子力学を考える。
このモデルの一般解は、平方可積分な正則函数(粒子に対する)の重み付きベルグマン空間と、K"アラー・アインシュタイン多様体上の反正則函数$Z_6$から与えられる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:52:55 GMT)
Characterization of the multiplicity of solutions for camera pose given two vertically-aligned landmarks and accelerometer [55.2] 2つのラベル付きランドマークのセンサ画像から加速度センサを備えたカメラの位置と向きを復元する問題を考察する。
これは、重力データなしでカメラの位置と向きを$n$ポイントから回復する、これまで研究されてきたP$n$P問題における変種である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:12:03 GMT)
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration [54.8] 本研究では,未ラベルの事前軌跡データを用いて効率的な探索戦略を学習する方法について検討する。
我々の手法 SUPE (Skills from Unlabeled Prior Data for Exploration) は、これらのアイデアの慎重な組み合わせがそれらの利点を兼ね備えていることを示す。
実験により,SUPEが従来の戦略を確実に上回り,長い水平・スパース・リワードタスクの一組の解決に成功したことを実証的に示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:58:45 GMT)
FedLAP-DP: Federated Learning by Sharing Differentially Private Loss Approximations [53.3] 我々は,フェデレーション学習のための新しいプライバシ保護手法であるFedLAP-DPを提案する。
公式なプライバシー分析は、FedLAP-DPが典型的な勾配共有方式と同じプライバシーコストを発生させることを示している。
提案手法は, 通常の勾配共有法に比べて高速な収束速度を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:45:38 GMT)
Lessons from Learning to Spin "Pens" [51.9] 本研究では,ペンのような物体を回転させる能力を示すことによって,学習に基づく手動操作システムの境界を推し進める。
まず、強化学習を用いて、特権情報でオラクルポリシーを訓練し、シミュレーションにおいて高忠実度軌道データセットを生成する。
次に、これらの実世界の軌道を用いて感覚運動のポリシーを微調整し、実世界の力学に適応させる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:56:39 GMT)
On Catastrophic Inheritance of Large Foundation Models [51.4] 大ファンデーションモデル(LFM)は素晴らしいパフォーマンスを誇示している。しかし、彼らの神話的および解釈されていないポテンシャルについて大きな懸念が持ち上がっている。
我々は, LFMに深く根ざした「破滅的継承」という, 無視された問題を特定することを提案する。
この問題の背景にある課題を議論し、事前学習と下流適応の両方からLFMの破滅的な継承を理解するためのフレームワークであるUIMを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:40:23 GMT)
Reinforcement Learning under Latent Dynamics: Toward Statistical and Algorithmic Modularity [51.4] 強化学習の現実的な応用は、エージェントが複雑な高次元の観察を行う環境を含むことが多い。
本稿では,統計的・アルゴリズム的な観点から,textit General$ latent dynamicsの下での強化学習の課題に対処する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:22:49 GMT)
Which Client is Reliable?: A Reliable and Personalized Prompt-based Federated Learning for Medical Image Question Answering [51.3] 本稿では,医学的視覚的質問応答(VQA)モデルのための,パーソナライズド・フェデレーションド・ラーニング(pFL)手法を提案する。
提案手法では,学習可能なプロンプトをTransformerアーキテクチャに導入し,膨大な計算コストを伴わずに,多様な医療データセット上で効率的にトレーニングする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:31:17 GMT)
STBA: Towards Evaluating the Robustness of DNNs for Query-Limited Black-box Scenario [50.4] 本研究では,クエリ制限シナリオにおいて,悪意のある逆の例を作成するために,空間変換ブラックボックス攻撃(STBA)を提案する。
そこで本研究では,STBAが対向例の認識不能性を効果的に改善し,クエリ制限条件下での攻撃成功率を大幅に向上できることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:06:02 GMT)
ESpeW: Robust Copyright Protection for LLM-based EaaS via Embedding-Specific Watermark [50.1] 組み込み・アズ・ア・サービス(Eding)はAIアプリケーションにおいて重要な役割を担っている。
編集はモデル抽出攻撃に対して脆弱であり、著作権保護の緊急の必要性を強調している。
そこで我々は,Edingの著作権保護を堅牢にするための新しい埋め込み専用透かし (ESpeW) 機構を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:34:49 GMT)
Exploring Tokenization Methods for Multitrack Sheet Music Generation [48.8] 本研究ではABC表記におけるマルチトラックシート音楽のトークン化について検討する。
計算効率と音楽性の両方の観点から、実験結果から、バーストリームパッチングが全体として最も優れていることが示されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:19:48 GMT)
Automated Contrastive Learning Strategy Search for Time Series [48.7] 時系列データセットやタスクに対するコントラスト学習(AutoCL)を自動的に学習する,MicrosoftのAutomated Machine Learning(AutoML)プラクティスを提示する。
まず,データ拡張,埋め込み変換,コントラッシブなペア構成,コントラスト的な損失を網羅した,3時間1012ドルの探索空間を構築した。
さらに,評価タスクの性能からCLSを最適化し,空間内で有効なCLSを得る効率的な強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:54:42 GMT)
FairDgcl: Fairness-aware Recommendation with Dynamic Graph Contrastive Learning [48.4] 提案手法は,高品質なデータ拡張を実現し,コメンデーションフェアネスを改善する方法である。
具体的には,動的グラフ対逆学習フレームワークであるFairDgclを提案する。
FairDgclは、公正さと精度の両方を持つ拡張表現を同時に生成できることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:43:03 GMT)
ImDy: Human Inverse Dynamics from Imitated Observations [48.0] 逆ダイナミクス(ID)は、人間の運動学的観察から駆動トルクを再現することを目的としている。
従来の最適化ベースのIDは高価な実験室のセットアップを必要とし、可用性を制限している。
本稿では、近年進歩的な人間の動作模倣アルゴリズムを利用して、データ駆動方式で人間の逆ダイナミクスを学習することを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:06:08 GMT)
GPHM: Gaussian Parametric Head Model for Monocular Head Avatar Reconstruction [47.1] 高忠実度3D人間の頭部アバターは、VR/AR、デジタル人間、映画製作に不可欠である。
近年の進歩は、変形可能な顔モデルを利用して、様々なアイデンティティと表現を表現するアニメーションヘッドアバターを生成している。
本稿では,人間の頭部の複雑さを正確に表現するために,三次元ガウスを用いた3次元ガウスパラメトリックヘッドモデルを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:35:58 GMT)
Lightning-Fast Image Inversion and Editing for Text-to-Image Diffusion Models [46.7] 暗黙の方程式の根を求めることによって問題を定式化し,効率よく解ける手法を考案する。
我々の解法は、数値解析においてよく知られた手法であるNewton-Raphson (NR) に基づいている。
希少物体の画像および生成における改善された結果を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:20:12 GMT)
GraphTeam: Facilitating Large Language Model-based Graph Analysis via Multi-Agent Collaboration [46.7] GraphTeamは3つのモジュールから5つのLLMベースのエージェントで構成されており、異なる特殊性を持つエージェントは複雑な問題に対処するために協力することができる。
6つのグラフ分析ベンチマークの実験は、GraphTeamが最先端のパフォーマンスを達成し、精度の点で最高のベースラインよりも平均25.85%改善していることを示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:02:59 GMT)
Equivalence of the Empirical Risk Minimization to Regularization on the Family of f-Divergences [45.9] 経験的リスク最小化の解決策として、$f$-divergence regularization (ERM-$f$DR) を挙げる。
関数の特定の選択に対する解の例は、$f$である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:55:31 GMT)
Non-myopic Generation of Language Model for Reasoning and Planning [45.8] 本稿では,モデル予測制御を利用した予測復号化手法を提案する。
我々の実験では、数学、コーディング、エージェントの幅広いタスクにおいて、大幅な改善が示されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:02:09 GMT)
CV-VAE: A Compatible Video VAE for Latent Generative Video Models [45.7] 可変エンコーダ(VAE)は、OpenAIのビデオの自動時間圧縮において重要な役割を果たす。
現在、潜伏拡散に基づくビデオモデルによく使われる連続ビデオ(3D)VAEが欠けている。
本稿では,静止空間が与えられた画像VAEと互換性のある映像モデル,CV-VAEの映像VAEをトレーニングする方法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:38:44 GMT)
VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation [45.5] VILA-Uは、ビデオ、画像、言語理解、生成を統合する統一基盤モデルである。
VILA-Uは、両方のタスクに1つの自動回帰的な次世代予測フレームワークを使用している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:42:06 GMT)
SimRAG: Self-Improving Retrieval-Augmented Generation for Adapting Large Language Models to Specialized Domains [45.3] Retrieval-augmented Generation (RAG) は大規模言語モデル(LLM)の質問応答能力を向上させる
しかし、科学や医学などの専門分野に汎用的なRAGシステムを適用することは、分散シフトやドメイン固有のデータへのアクセス制限など、ユニークな課題を生んでいる。
ドメイン適応のための質問応答と質問生成のジョイント機能を備えた自己学習手法であるSimRAGを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:24:16 GMT)
Neural Network Prediction of Strong Lensing Systems with Domain Adaptation and Uncertainty Quantification [45.0] MVE(Mean-variance Estimator)は、ニューラルネットワークの予測からアレタリック(データ)の不確実性を得るための一般的なアプローチである。
本研究では、強いレンズデータに対する非教師なし領域適応(UDA)と組み合わせて、MVEの有効性を初めて研究する。
MVE に UDA を追加すると,UDA なしで MVE モデルより約 2 倍精度が向上することがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:56:57 GMT)
Geometric Antibunching and Directional Shaping of Photon Anticorrelations [45.0] 我々は、幾何的アンチバンチと呼ばれる光子反相関の新しいメカニズムを見出した。
この現象はエミッターの量子状態に完全に依存しない。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:29:15 GMT)
Dialectal and Low Resource Machine Translation for Aromanian [45.0] ルーマニア語、英語、ルーマニア語を翻訳できるニューラルマシン翻訳システムを提案する。
BLEUスコアはテキストの方向やジャンルによって17から32まで様々である。
Aromanian-Romanian-Romanian bilingual corpus は 79k 個の清潔な文対から構成される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:00:23 GMT)
Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments [44.6] 本稿では,特定の個人オブジェクトの位置と到達を具体化するタスクデノマイトされたパーソナライズされたパーソナライズドインスタンスベースのナビゲーション(PIN)を提案する。
各エピソードにおいて、ターゲットオブジェクトは、中性背景上の視覚的参照画像のセットと手動による注釈付きテキスト記述の2つのモードを使用してエージェントに提示される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:01:09 GMT)
Towards a Similarity-adjusted Surprisal Theory [43.8] リコッタとSzeidl(2006)の多様性指数を用いて、類似性調整された仮定(英語版)(英語版)と呼ばれる計量に仮定を拡張した。
類似性調整された推定は、ある種のデータセットの標準的な推定値を超える予測力を追加し、理解の努力を補完する尺度として機能することを示唆している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:49:51 GMT)
Together We Can: Multilingual Automatic Post-Editing for Low-Resource Languages [43.4] 本研究では,低リソースのインド・アーリア語における機械翻訳の品質を高めるために,多言語自動編集(APE)システムの可能性を検討する。
言語間移動を容易にするため,Hindi-MarathiとMarathi-Hindi APE三重項を生成する。
実験により、多言語 APE モデルは、対応するイングリッシュ・ヒンディー語とイングリッシュ・マラティ語をそれぞれ2.5ドルと2.39ドル TER で上回った。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:37:08 GMT)
POMDP-Driven Cognitive Massive MIMO Radar: Joint Target Detection-Tracking In Unknown Disturbances [43.0] この研究は、トラッキングと検出タスクを強化するために、部分的に観測可能なマルコフ決定プロセスフレームワークの適用について検討する。
提案手法では,ノイズ統計に関するアプリオリ知識を必要としないオンラインアルゴリズムを用いる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:34:11 GMT)
Lightweight Neural App Control [42.8] 本稿では,様々なAndroidアプリ間での効率的なインタラクションとコントロールを実現するために,新しい携帯電話制御アーキテクチャである「アプリエージェント」を紹介した。
提案された軽量マルチモーダルアプリ制御(LiMAC)は、スクリーンショットや対応するUIツリーなどの過去のモバイル観測のテキスト目標とシーケンスを入力として、正確なアクションを生成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:57:00 GMT)
Data Augmentation for Automated Adaptive Rodent Training [42.2] 私たちはデータ駆動のアプローチを使って、実験室でネズミを訓練する方法を最適化しました。
われわれは、効率よく自動トレーナーを構築するために、いくつかの有歯動物モデルを構築した。
そこで我々は,行動確率分布に基づく新しい類似度尺度を開発し,モデルと実歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯歯
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:51:11 GMT)
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models [42.2] We present a new efficient LLVM, Mamba based traversal of rationales (Meteor)
豊富な情報を含む長大な論理を埋め込むために,線形時間複雑性を伴う逐次データ処理が可能なMambaアーキテクチャを用いる。
その後、バックボーン・マルチモーダル言語モデル (MLM) を訓練し、合理性の助けを借りて回答を生成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:54:16 GMT)
Breaking Class Barriers: Efficient Dataset Distillation via Inter-Class Feature Compensator [42.0] クラス間特徴補償器(Inter-class Feature Compensator、INFER)は、現在のデータセット蒸留法で広く利用されているクラス固有のデータラベルフレームワークを超越する革新的な蒸留手法である。
INFERは、蒸留中のクラス間相互作用を強化し、蒸留データの有効性と一般化性を高める。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:01:27 GMT)
Prethermal Floquet time crystals in chiral multiferroic chains and applications as quantum sensors of AC fields [41.9] 乱れた多鉄鎖鎖における予熱フロケット時間結晶(pFTC)の出現について検討した。
我々はモデルの位相図を導出し、系の磁化、絡み合い、コヒーレンスダイナミクスを特徴づける。
また、交流場の量子センサとしてのpFTCの適用についても検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:15:57 GMT)
Embezzling entanglement from quantum fields [41.9] 絡み合いの埋め込みは、補助系の参照状態から絡み合った量子状態を抽出する直感的な可能性を指す。
エンベジングエンタングルメントの操作タスクとフォン・ノイマン代数の数学的分類との深い関係を明らかにする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:35:02 GMT)
ExpertFlow: Optimized Expert Activation and Token Allocation for Efficient Mixture-of-Experts Inference [41.4] ExpertFlowは、柔軟なルーティングを調整し、CPUとGPU間の効率的な専門家スケジューリングを可能にすることで、推論効率を向上させるように設計されている。
実験により、ExpertFlowは最大93.72%のGPUメモリを節約し、ベースライン法に比べて推論速度を2~10倍に向上することを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:24:54 GMT)
Trends in Integration of Knowledge and Large Language Models: A Survey and Taxonomy of Methods, Benchmarks, and Applications [41.2] 大規模言語モデル(LLM)は、様々な自然言語処理において優れた性能を示すが、時代遅れのデータやドメイン固有の制限から生じる問題の影響を受けやすい。
本稿では,手法,ベンチマーク,応用の分類など,知識モデルと大規模言語モデルの統合の動向を論じるレビューを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:48:20 GMT)
Beware of Calibration Data for Pruning Large Language Models [41.2] トレーニング後のプルーニングは、リソース集約的な反復的なトレーニングを必要としない有望な方法である。
キャリブレーションデータの効果は, 先進的な刈り取り戦略を設計するよりもさらに価値が高いことを示す。
予備調査では、トレーニングデータに類似したキャリブレーションデータを使用することで、より良いパフォーマンスが得られることも明らかにした。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:36:21 GMT)
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation [41.1] LLaVA-MoDは、小規模マルチモーダル言語モデルの効率的なトレーニングを可能にするために設計されたフレームワークである。
スパースミキサーアーキテクチャを言語モデルに統合することにより、s-MLLMのネットワーク構造を最適化する。
また,包括的知識移動を確保するために,先進的な知識移動戦略を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:52:23 GMT)
LLaVA-MoD: Making LLaVA Tiny via MoE Knowledge Distillation [41.1] LLaVA-MoDは、小規模マルチモーダル言語モデルの効率的なトレーニングを可能にするために設計されたフレームワークである。
スパースミキサーアーキテクチャを言語モデルに統合することにより、s-MLLMのネットワーク構造を最適化する。
また,包括的知識移動を確保するために,先進的な知識移動戦略を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:52:23 GMT)
Large Language Models Engineer Too Many Simple Features For Tabular Data [40.6] 大規模言語モデル (LLM) が機能工学のパフォーマンスに悪影響を及ぼすバイアスを示すかどうかを検討する。
LLMによって提案される演算子の周波数の異常を検出することにより,潜在的なバイアスを検出する手法を提案する。
以上の結果から,LSMは加法などの単純な演算子に偏りがあり,グループ化やアグリゲーションなどの複雑な演算子を利用できないことが示唆された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:37:20 GMT)
Exploring Self-Supervised Skeleton-Based Human Action Recognition under Occlusions [40.3] 本稿では,自律型ロボットシステムに自己教師付き骨格に基づく行動認識手法を統合する手法を提案する。
まず、隠蔽されたスケルトン配列を用いて事前トレーニングを行い、次にk平均クラスタリング(KMeans)を用いてシーケンス埋め込みを行い、意味的に類似したサンプルをグループ化する。
比較的完全な配列を生成するために不完全な骨格配列を挿入することは、既存の骨格に基づく自己管理法に重要な利益をもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:36:26 GMT)
Diffusion Models are Certifiably Robust Classifiers [40.3] 拡散分類器が$O(1)$ Lipschitznessを持ち、それらの証明された堅牢性を確立し、それらの固有のレジリエンスを実証する。
その結果、CIFAR-10の80%以上と70%以上は、それぞれ0.25未満の標準と0.5未満の逆方向の摂動下での強靭性が確認された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:26:10 GMT)
Hypergraphs as Weighted Directed Self-Looped Graphs: Spectral Properties, Clustering, Cheeger Inequality [40.2] ハイパーグラフはグループ関係を研究するときに現れ、機械学習の分野で広く使われている。
ハイパーグラフの統一的な定式化は行われていないが、最近提案されたエッジ依存レイリー重み付け(EDVW)モデリングは、ハイパーグラフの最も一般化されたモデリング手法の1つである。
グラフ上の対応する定義と整合性を持つハイパーグラフQuotient, NCut, boundary/cut, volume, and conductance の定義を提案する。
そして、正規化されたハイパーグラフラプラシアンがNCut値と関連があることを証明し、スペクトルクラスタリングのためのHyperClus-Gアルゴリズムを刺激する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:16:48 GMT)
AlleNoise: large-scale text classification benchmark dataset with real-world label noise [40.1] 我々は、実世界のインスタンス依存ラベルノイズを持つ新しいキュレートされたテキスト分類ベンチマークであるAlleNoiseを提示する。
ノイズの分布は、主要なeコマースマーケットプレースの実際のユーザから来ており、人間のミスの意味を現実的に反映している。
このような実環境騒音に対処するには,雑音ラベルを用いた学習方法の代表的選択が不十分であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:19:06 GMT)
An Intelligent Agentic System for Complex Image Restoration Problems [39.9] AgenticIRは、イメージ処理に対する人間のアプローチを、知覚、スケジューリング、実行、反射、再スケジューリングの5つの重要な段階に従って模倣する。
我々は、テキスト生成を介して対話する大規模言語モデル(LLM)と視覚言語モデル(VLM)を用いて、IRモデルのツールボックスを操作する。
実験では、複雑なIRタスクを扱うAgenicIRの可能性を実証し、視覚処理における汎用知性を達成するための有望な道を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:11:26 GMT)
Primal-Dual Spectral Representation for Off-policy Evaluation [39.2] 外部政治評価(OPE)は、強化学習(RL)における最も基本的な問題の1つである。
我々のアルゴリズムであるSpectralDICEは原始的かつ標本効率が高く、その性能は厳密な理論的なサンプル複雑性保証と様々なベンチマークでの徹底的な経験的評価によって支えられている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:38:31 GMT)
PixLore: A Dataset-driven Approach to Rich Image Captioning [39.2] 本研究では,標準商用GPU上でのLoRa法を用いてBLIP-2モデルの微調整によりクエリ変換を行う新しい手法であるPixLoreを紹介する。
続くアプローチでは、ChatGPTが組み合わせて拡張した最先端のコンピュータビジョンモデルから、慎重に組み立てられたデータセットをトレーニングする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:47:10 GMT)
TSDS: Data Selection for Task-Specific Model Finetuning [39.2] タスク固有の微調整の有効性は、適切なトレーニングデータの選択に大きく依存する。
本稿では,タスク固有のモデル微調整のためのデータ選択フレームワークであるTSDS(Task-Specific Data Selection)を提案する。
提案手法で選択したデータを用いて,1%選択率で命令チューニングを行う場合,全データセットで処理性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:00:41 GMT)
A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.1] FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。
1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:56:26 GMT)
No Filter: Cultural and Socioeconomic Diversity in Contrastive Vision-Language Models [38.9] コントラッシブ・ビジョン言語モデル(VLM)における文化的・社会経済的多様性の研究
我々の研究は、より包括的なマルチモーダルシステムを構築するために、多様なデータを使うことの価値を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:25:39 GMT)
LVBench: An Extreme Long Video Understanding Benchmark [38.8] LVBenchは長いビデオの理解に特化して設計されたベンチマークである。
我々のデータセットは、公開されているビデオからなり、長いビデオの理解と情報抽出を目的とした様々なタスクを包含する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:37:01 GMT)
ADEM-VL: Adaptive and Embedded Fusion for Efficient Vision-Language Tuning [38.3] ADEM-VLは、事前訓練された大規模言語モデルに基づいてモデルをチューニングする効率的な視覚言語手法である。
我々のフレームワークはScienceQAデータセットの平均精度を0.77%上回る。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:31:06 GMT)
Efficient Neural Implicit Representation for 3D Human Reconstruction [38.2] 従来の3次元の人間の動きを再構築するには、高価なハードウェアを使う必要があり、高い処理コストがかかる。
本研究では,モノクラービデオソースから正確な人間のアバターを効率的に再構築する革新的アプローチであるHumanAvatarを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:16:01 GMT)
Efficient cavity-assisted storage of photonic qubits in a solid-state quantum memory [37.7] キャビティ固体量子メモリにおける弱コヒーレント光パルスとフォトニック量子ビットの高効率保存と検索について報告する。
我々は1つの光子レベルで弱いコヒーレントパルスを62%の効率で保存する。
次に, 弱コヒーレントな時間ビン量子ビットを (51+-2) 効率で保存し, 得られた量子ビットに対して (94.8+-1.4) 以上の測定デバイスを限定する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:53:47 GMT)
Harnessing Your DRAM and SSD for Sustainable and Accessible LLM Inference with Mixed-Precision and Multi-level Caching [35.8] 大規模言語モデル(LLM)は目覚ましい能力を示している。
LLMの展開は、現在のAIアプリケーションから排出される二酸化炭素の主要な部分である。
本稿では,古いハードウェア上でのLCM推論を可能にするモデルモジュール化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:08:59 GMT)
When "Competency" in Reasoning Opens the Door to Vulnerability: Jailbreaking LLMs via Novel Complex Ciphers [35.4] 我々は,大規模言語モデル (LLM) をジェイルブレイクするための新しい手法である Custom Encryptions (ACE) を用いた攻撃を提案する。
我々は、ACEが4つの最先端LCMに対して有効であることを評価し、オープンソースモデルでは最大66%、オープンソースモデルでは88%のアタック成功率(ASR)を達成した。
これに基づいて、カスタム暗号化(LACE)を用いたレイヤ攻撃(Layered Attacks)を導入し、ASRをさらに強化するために、カスタム暗号を通じて複数のレイヤの暗号化を利用する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:38:14 GMT)
No more hard prompts: SoftSRV prompting for synthetic data generation [35.2] 我々は、ターゲットとする合成テキストシーケンスを生成するためのソフトプロンプトベースの新しいフレームワーク、SoftSRVを提案する。
提案するフレームワークは,対象分布からサンプルを抽出し,データ駆動損失最小化を用いてパラメータ化した"コンテキスト"ソフトプロンプトを訓練する。
We found that SoftSRV improve on hard-prompting baselines, generated data with superior fine-tuning performance。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:55:14 GMT)
Cross-model Control: Improving Multiple Large Language Models in One-time Training [35.0] クロスモデル制御(CMC)は、1回トレーニングで複数の大規模言語モデルを改善する手法である。
この知見に基づいて、最小数のパラメータを持つ小さな言語モデルを組み込む。
本稿では,PM-Mined という新しいトークンマッピング手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:52:09 GMT)
The Dark Side of Rich Rewards: Understanding and Mitigating Noise in VLM Rewards [34.6] VLM(Vision-Language Models)は、エンボディエージェントを訓練するための報酬信号を生成するために使われるようになっている。
我々の研究によると、VLM報酬によって誘導されるエージェントは、本質的な報酬のみを使用するエージェントに比べて、しばしばパフォーマンスが劣っている。
ノイズを緩和する新しい報奨関数であるBiMIを導入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:22:48 GMT)
On provable privacy vulnerabilities of graph representations [34.5] グラフ表現学習(GRL)は複雑なネットワーク構造から洞察を抽出するために重要である。
また、これらの表現にプライバシー上の脆弱性があるため、セキュリティ上の懸念も高まる。
本稿では,エッジ再構成攻撃により,高感度なトポロジ情報を推定できるグラフニューラルモデルの構造的脆弱性について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:50:51 GMT)
Causality-Aware Spatiotemporal Graph Neural Networks for Spatiotemporal Time Series Imputation [33.9] 時系列を解析するためには、欠落値の計算が不可欠である。
新しい因果性対応時空間グラフニューラルネット(Casper)は、新しいPrompt Decoder(PBD)とStemporal Causal Attention(SCA)を含んでいる
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:18:49 GMT)
Adaptive Dense Reward: Understanding the Gap Between Action and Reward Space in Alignment [33.6] Reinforcement Learning from Human Feedback (RLHF) は、Large Language Models (LLM) を人間の好みに合わせるのに非常に効果的であることが証明されている。
この制限は、RLHFが特定のトークンを強化または抑制すべきかどうかについての認識の欠如に起因している。
本稿では,様々なタスクに頑健に適用可能な適応的メッセージワイドRLHF'法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:16:15 GMT)
Deep Learning for Detecting and Early Predicting Chronic Obstructive Pulmonary Disease from Spirogram Time Series [32.3] 慢性閉塞性肺疾患(慢性閉塞性肺疾患、COPD)は、慢性肺疾患である。
今後のCOPDリスクを早期に予測するために,ディープラーニングに基づくDeepSpiroを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:18:11 GMT)
Over-the-Air Federated Learning in Cell-Free MIMO with Long-term Power Constraint [32.3] オーバー・ザ・エア・フェデレート・ラーニング(Over-the-Air Federated Learning)は、人工知能をサポートする無線ネットワークのための重要なアプリケーションである。
我々は,Lyapunov最適化を用いてラウンド間の長期制約を分離するMOP-LOFPCアルゴリズムを提案する。
実験結果から, MOP-LOFPCは, モデルのトレーニング損失と長期電力制約への固執との間に, より優れた, より柔軟なトレードオフを実現することが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:51:11 GMT)
Over-the-Air Federated Learning in Cell-Free MIMO with Long-term Power Constraint [32.3] オーバー・ザ・エア・フェデレート・ラーニング(Over-the-Air Federated Learning)は、人工知能をサポートする無線ネットワークのための重要なアプリケーションである。
我々は,Lyapunov最適化を用いてラウンド間の長期制約を分離するMOP-LOFPCアルゴリズムを提案する。
実験結果から, MOP-LOFPCは, モデルのトレーニング損失と長期電力制約への固執との間に, より優れた, より柔軟なトレードオフを実現することが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:51:11 GMT)
Counter-Current Learning: A Biologically Plausible Dual Network Approach for Deep Learning [32.1] 生物学的妥当性の欠如が 批判されている
本稿では,ニューラルネットワークにおけるクレジット代入のための生物学的に妥当なフレームワークである対流学習(CCL)を提案する。
我々の研究は、ニューラルネットワークにおける学習と適応の代替メカニズムを提供する、生物学的にインスパイアされた、そして実証可能な学習アルゴリズムの方向性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:27:27 GMT)
Counter-Current Learning: A Biologically Plausible Dual Network Approach for Deep Learning [32.1] 生物学的妥当性の欠如が 批判されている
本稿では,ニューラルネットワークにおけるクレジット代入のための生物学的に妥当なフレームワークである対流学習(CCL)を提案する。
我々の研究は、ニューラルネットワークにおける学習と適応の代替メカニズムを提供する、生物学的にインスパイアされた、そして実証可能な学習アルゴリズムの方向性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:27:27 GMT)
Timetable Nodes for Public Transport Network [31.8] 時間依存トランスポートネットワークにおける高速パスフィニングは、ナビゲーションシステムにおいて重要かつ困難な問題である。
本稿では,計算幾何学と異なる最適化手法を用いて,グラフベースのアプローチを進化させる手法を提案する。
我々のソリューションは他の時間依存ネットワークに適合し、他のパスフィンディングアルゴリズムに統合できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:02:39 GMT)
Harmonizing Visual Text Comprehension and Generation [31.6] 視覚テキストの理解と生成に長けた,統一的で汎用的なマルチモーダル生成モデルであるTextHarmonyを提案する。
我々は,多モード生成空間を部分的に分離して,モダリティ特化およびモダリティ非依存のLoRAエキスパートを集約するSlide-LoRAを提案する。
様々なベンチマークによる総合的な実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:27:23 GMT)
Blendify -- Python rendering framework for Blender [31.3] BlendifyはPythonベースのフレームワークで、シームレスにBlenderと統合できる。
オブジェクト生成を自動化し、色とマテリアルリンクを扱い、シャドーキャッチャーオブジェクトのような機能を実装する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:29:02 GMT)
Linearly Multiplexed Photon Number Resolving Single-photon Detectors Array [31.0] 光子数分解検出器(英: Photon Number Resolving Detector、PNRD)は、入射光ビームに存在する光子数を測定する装置である。
本稿では, 線形多重光子数分解型単一光子検出器アレイの性能と設計について考察する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:01:32 GMT)
Over-the-Air Federated Learning in Cell-Free MIMO with Long-term Power Constraint [30.9] オーバー・ザ・エア・フェデレート・ラーニング(Over-the-Air Federated Learning)は、人工知能をサポートする無線ネットワークのための重要なアプリケーションである。
我々は,Lyapunov最適化を用いてラウンド間の長期制約を分離するMOP-LOFPCアルゴリズムを提案する。
実験結果から, MOP-LOFPCは, モデルのトレーニング損失と長期電力制約への固執との間に, より優れた, より柔軟なトレードオフを実現することが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:51:11 GMT)
Selective Vision is the Challenge for Visual Reasoning: A Benchmark for Visual Argument Understanding [30.4] 視覚的前提を付加した1,611枚の画像のデータセットであるVisArgsを提示する。
本稿では,視覚的議論の理解を評価するための3つのタスクを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:57:31 GMT)
An integrated photonic engine for programmable atomic control [29.8] 光部品の小型化は、古典光学と量子光学のスケールと性能をバルクデバイスの限界を超えて押し上げた。
統合可視光変調器を用いたマルチチャネル量子制御のためのスケーラブルで再構成可能なフォトニックアーキテクチャを提案し,実装する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:00:26 GMT)
SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack [29.7] 我々はセマンティック・コンスタント・アンリミスタント・アンリミテッド・アタック(SCA)と呼ばれる新しいフレームワークを提案する。
SCAは、編集しやすいノイズマップを抽出するために反転法を採用し、意味的なガイダンスを提供するためにMLLM(Multimodal Large Language Model)を使用している。
我々のフレームワークは、最小限の識別可能な意味変化を示す敵例の効率的な生成を可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:53:38 GMT)
SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack [29.7] 我々はセマンティック・コンスタント・アンリミスタント・アンリミテッド・アタック(SCA)と呼ばれる新しいフレームワークを提案する。
SCAは、編集しやすいノイズマップを抽出するために反転法を採用し、意味的なガイダンスを提供するためにMLLM(Multimodal Large Language Model)を使用している。
我々のフレームワークは、最小限の識別可能な意味変化を示す敵例の効率的な生成を可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:53:38 GMT)
SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack [29.7] 我々はセマンティック・コンスタント・アンリミスタント・アンリミテッド・アタック(SCA)と呼ばれる新しいフレームワークを提案する。
SCAは、編集しやすいノイズマップを抽出するために反転法を採用し、意味的なガイダンスを提供するためにMLLM(Multimodal Large Language Model)を使用している。
我々のフレームワークは、最小限の識別可能な意味変化を示す敵例の効率的な生成を可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:53:38 GMT)
SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack [29.7] 我々はセマンティック・コンスタント・アンリミスタント・アンリミテッド・アタック(SCA)と呼ばれる新しいフレームワークを提案する。
SCAは、編集しやすいノイズマップを抽出するために反転法を採用し、意味的なガイダンスを提供するためにMLLM(Multimodal Large Language Model)を使用している。
我々のフレームワークは、最小限の識別可能な意味変化を示す敵例の効率的な生成を可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:53:38 GMT)
Do LLMs Have Distinct and Consistent Personality? TRAIT: Personality Testset designed for LLMs with Psychometrics [29.3] 大規模言語モデル(LLM)は会話エージェントとして様々な領域に適応している。
LLMのパーソナリティを評価するために設計された8Kのマルチチョイス質問からなる新しいベンチマークTRAITを紹介する。
LLMは独特で一貫した性格を示し、トレーニングデータの影響を強く受けている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:01:14 GMT)
Vision-Based Mobile App GUI Testing: A Survey [29.0] ビジョンベースのモバイルアプリ GUI テストアプローチは、コンピュータビジョン技術の開発とともに現れた。
本稿では,271論文における最新技術に関する包括的調査を行い,92論文は視覚に基づく研究である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:48:26 GMT)
A Survey on Open Information Extraction from Rule-based Model to Large Language Model [29.0] オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクである。
本調査では,2007年から2024年までのOpenIE技術の概要を概説し,時系列的視点を強調した。
この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:36:50 GMT)
SuperGrad: a differentiable simulator for superconducting processors [29.0] SuperGradは超伝導量子プロセッサの設計を、勾配計算機能を組み込んで加速するシミュレータである。
SuperGradは、ハミルトン人を構築するためのユーザフレンドリなインターフェースを提供し、複合システムの静的特性と動的特性の両方をコンピューティングする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:42:32 GMT)
Optimal Streaming Algorithms for Multi-Armed Bandits [28.6] ストリーミングBAI問題では,最大報酬が1-delta$の確率でアームを識別することが目的である。
我々は,O(log Delta-1)$パス内で,ほぼインスタンス依存の最適なサンプル複雑性を実現するシングルアームメモリアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:54:04 GMT)
TranSPORTmer: A Holistic Approach to Trajectory Understanding in Multi-Agent Sports [28.3] TranSportmerは、これらすべてのタスクに対処できる統合トランスフォーマーベースのフレームワークである。
時間的ダイナミクスと社会的相互作用を同変的に効果的に捉える。
プレイヤー予測、プレイヤー予測・インプット、ボール推論、ボールインプットにおいて、最先端のタスク固有モデルより優れている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:35:44 GMT)
Understanding When Tree of Thoughts Succeeds: Larger Models Excel in Generation, Not Discrimination [27.5] Tree of Thoughts (ToT) は、推論ステップを提案するジェネレータと、どのステップを実装するかを決定する識別器を使用する推論戦略である。
我々は、ToTが最も有益である条件をよりよく理解するために、ジェネレータと識別器の役割を別々に分析する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:26:10 GMT)
AVHBench: A Cross-Modal Hallucination Benchmark for Audio-Visual Large Language Models [27.4] AVHBenchは、音声視覚モデルの知覚と理解能力を評価するために設計された最初の総合的なベンチマークである。
以上の結果から,既存のLLMはモダリティ間の相互相互作用による幻覚に苦慮していることが明らかとなった。
AVHBenchを用いた簡単なトレーニングにより、幻覚に対する聴覚的LLMの堅牢性が改善される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:36:06 GMT)
FedGMark: Certifiably Robust Watermarking for Federated Graph Learning [27.4] Federated Graph Learning(FedGL)は、さまざまなクライアントからグラフデータを協調的にトレーニングする、新たな学習パラダイムである。
FedGMarkは、FedGLにとって初めての堅牢なバックドアベースの透かしである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:25:55 GMT)
TensorOpera Router: A Multi-Model Router for Efficient LLM Inference [27.3] TO-lemmaはモノリシックなLLMクエリシステムである。
様々なLLM専門家をシームレスに単一のクエリインターフェースに統合する。
クエリの要求に基づいて、入力クエリを最も高性能な専門家に動的にルーティングする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:11:42 GMT)
From Real Artifacts to Virtual Reference: A Robust Framework for Translating Endoscopic Images [27.2] 内視鏡的画像検査では,術前データと術中画像の併用が手術計画やナビゲーションに重要である。
既存のドメイン適応法は、生体内アーティファクトによる分布シフトによって妨げられる。
本稿では,アーチファクト・レジリエントな画像翻訳手法とそれに関連するベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:01:22 GMT)
OpenMU: Your Swiss Army Knife for Music Understanding [27.2] 音楽理解のためのマルチモーダル言語モデルをトレーニングするためのベンチマークスイートであるOpenMU-Benchを紹介する。
OpenMU-Benchは、歌詞理解と音楽ツールの使用によって、音楽理解の範囲を広げる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:21:09 GMT)
LongRAG: A Dual-Perspective Retrieval-Augmented Generation Paradigm for Long-Context Question Answering [27.1] LongRAGはLCQAのための汎用的で双対的かつ堅牢なLCMベースのRAGシステムパラダイムである。
LongRAGは長文LLM(6.94%増)、アドバンストRAG(6.16%増)、バニラRAG(17.25%増)を大きく上回る
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:24:58 GMT)
Federated Transformer: Multi-Party Vertical Federated Learning on Practical Fuzzily Linked Data [27.1] ファジィ識別子を持つ多人数ファジィVFLをサポートする新しいフレームワークFeTを紹介する。
実験の結果,FeTは50個までスケールした場合の精度で,ベースラインモデルを最大46%超えることがわかった。
2パーティファジィなVFL設定では、FeTは最先端のVFLモデルよりもパフォーマンスとプライバシが改善されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:00:14 GMT)
Fast and Slow Generating: An Empirical Study on Large and Small Language Models Collaborative Decoding [27.0] 大規模言語モデルと小言語モデル(SLM)の協調的復号化は,これらの問題を緩和するための有望な戦略を示す。
両プロセス認知理論に着想を得て,FS-GEN(Fast and Slow Generating)と呼ばれる統合フレームワークを提案する。
このフレームワーク内では、LSMはSystem 2(slow and intention)に、独立したSLMはSystem 1に分類される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:23:00 GMT)
DataTales: A Benchmark for Real-World Intelligent Data Narration [26.6] DataTalesは、データナレーションにおける言語モデルの習熟度を評価するために設計されたベンチマークである。
本研究は,有能なデータナレーションに必要な精度と分析深度を達成する上で,言語モデルが直面する重要な課題を浮き彫りにするものである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:30:02 GMT)
Adaptive Variance Reduction for Stochastic Optimization under Weaker Assumptions [26.5] 非函数に対して$mathcalO(log T)$の最適収束率を達成する新しい適応還元法を導入する。
また、提案手法を拡張して、合成最適化のために$mathcalO(log T)$と同じ最適率を得る。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:49:39 GMT)
Accelerating ERM for data-driven algorithm design using output-sensitive techniques [26.3] データ駆動型アルゴリズム設計のための効率的な学習アルゴリズムを開発するための技術について研究する。
提案手法は,超平面の集合によって誘導されるポリトープを列挙する出力感受性アルゴリズムである。
本稿では、価格問題、リンクベースのクラスタリング、動的プログラミングに基づくシーケンスアライメントのアルゴリズムを提供することにより、我々の技術を説明する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:21:18 GMT)
Multi-Draft Speculative Sampling: Canonical Architectures and Theoretical Limits [26.2] 提案手法は,異なるドラフトモデルから独立して提案シーケンスをサンプリングするマルチドラフト・投機的サンプリングについて検討する。
最適スキームを2段階の解に分解できることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:28:34 GMT)
WAGLE: Strategic Weight Attribution for Effective and Modular Unlearning in Large Language Models [26.1] 本稿では,大規模言語モデル(LLM)におけるモデルウェイトと未学習プロセスの相互作用について考察する。
重みの「影響」と「影響」とを相互に関連付けることによって,重みの「影響」を記憶・保持するLLMアンラーニング手法であるWAGLEを設計する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:22:07 GMT)
Real-World Robot Applications of Foundation Models: A Review [25.5] LLM(Large Language Models)やVLM(Vision-Language Models)のような基盤モデルの最近の発展は、様々なタスクやモダリティにまたがる柔軟な適用を促進する。
本稿では,現実のロボット工学における基礎モデルの実用的応用について概説する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:39:00 GMT)
Regularizing Hidden States Enables Learning Generalizable Reward Model for LLMs [25.0] 本研究では,分配シフトに対する報酬モデルの一般化能力を高める新しい手法を提案する。
我々は、ベースモデルの言語モデルヘッドを保持し、隠れた状態のテキスト生成機能を維持するために、テキスト生成損失のスイートを組み込む。
実験結果から,導入した正規化手法が学習報酬モデルの精度を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:22:44 GMT)
FOOGD: Federated Collaboration for Both Out-of-distribution Generalization and Detection [25.0] Federated Learning(FL)は、クライアントモデルと連携してグローバルな知識を捉える、有望な機械学習パラダイムである。
実世界のシナリオにFLモデルをデプロイすることは、分布内データと予期せぬ分布外データの共存のため、依然として信頼性が低い。
本稿では,各クライアントの確率密度を推定し,信頼性の高いグローバル分布を求めるFOOGDを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:14:21 GMT)
Quantum Architecture Search with Unsupervised Representation Learning [24.7] 教師なし表現学習は量子アーキテクチャ探索(QAS)を前進させる新しい機会を提供する
QASは変分量子アルゴリズム(VQA)のための量子回路を最適化するように設計されている
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:30:50 GMT)
OmniFlatten: An End-to-end GPT Model for Seamless Voice Conversation [24.7] 全音声対話システムは人間と人間の相互作用を著しく反映している。
低レイテンシと自然なインタラクションを実現することは、大きな課題です。
エンドツーエンド音声対話システムは、効率的で自然なエンドツーエンドシステムを開発する上で有望な方向である。
OmniFlatten氏によって生成された対話のオーディオサンプルは、このWebサイトにある。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:58:58 GMT)
ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting [24.6] 視覚言語モデル(VLM)は、マルチモーダルなタスクに優れていますが、オープンワールド環境における意思決定の具体化にそれらを適用することは、課題を示します。
鍵となる問題は、低レベルの観測において個々のエンティティと計画に必要な抽象概念をスムーズに結合することの難しさである。
VLMとポリシーモデルの間の新しい通信プロトコルである視覚的時間的コンテキストプロンプトを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:26:59 GMT)
Richelieu: Self-Evolving LLM-Based Agents for AI Diplomacy [24.5] 外交は、特に必要な交渉段階を考慮して、決定空間の停滞を伴う。
従来のAIエージェントは、複数のエージェントを含むタスクにおいて、多段階ゲームやより大きなアクションスペースを扱う能力を確実に証明している。
我々は、3つのコアと不可欠な機能を組み合わさり、LSMベースのより強力な社会エージェントに組み込むことで、高度に包括的なマルチエージェントミッションのために、AIの上限を人間のようなエージェントに向ける第一歩を踏み出します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:39:57 GMT)
Richelieu: Self-Evolving LLM-Based Agents for AI Diplomacy [24.5] 外交は、特に必要な交渉段階を考慮して、決定空間の停滞を伴う。
従来のAIエージェントは、マルチエージェントタスクにおいて、マルチステップゲームと大きなアクションスペースを扱う能力を示した。
我々は、包括的なマルチエージェントミッションを実行することができる人間のようなエージェントを作成するAIの可能性を探究することを目的としている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:39:57 GMT)
Richelieu: Self-Evolving LLM-Based Agents for AI Diplomacy [24.5] 外交は、特に必要な交渉段階を考慮して、決定空間の停滞を伴う。
従来のAIエージェントは、マルチエージェントタスクにおいて、マルチステップゲームと大きなアクションスペースを扱う能力を示した。
我々は、包括的なマルチエージェントミッションを実行することができる人間のようなエージェントを作成するAIの可能性を探究することを目的としている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:39:57 GMT)
Learning Fair and Preferable Allocations through Neural Network [24.2] 我々は、専門家の知識を複製することで、優れた特性を厳密に満たすメカニズムを設計することを目指している。
形式的アルゴリズムは望ましい結果を見つけるのに苦労し、これらの暗黙の規則を直接複製することは不公平な割り当てをもたらす。
我々は、RRをパラメータ化し、RRに使用するエージェント注文を学習できるようにトレーニングできるニューラルネットワークを開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:47:55 GMT)
Statistical Efficiency of Distributional Temporal Difference Learning [24.0] 我々は、分布時間差分学習(CTD)と量子時間差分学習(QTD)の有限サンプル性能を解析する。
$gamma$-discounted infinite-horizon decision process に対して、NTD では $tildeOleft(frac1varepsilon2p (1-gamma)2pright)$ が、高い確率で $varepsilon$-optimal estimator を達成するために必要であることを示す。
我々はヒルベルト空間における新しいフリードマンの不等式を確立し、これは独立な関心事である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:26:07 GMT)
Understanding Layer Significance in LLM Alignment [23.6] LLMアライメント(ILA)の重要なレイヤを特定するための新しい手法を提案する。
ILAは、さまざまなアライメントデータセットにまたがる重要なレイヤを一貫して識別する。
実験結果から,非定常層凍結はモデル全体の性能を向上する一方で,最重要層を選択的に調整することで,性能損失を最小限に抑えて微調整効率を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:47:05 GMT)
Can Language Models Induce Grammatical Knowledge from Indirect Evidence? [23.6] 本稿では,言語モデルが間接的データ(間接的証拠)を効率的に用いて文の受理性を推定するかどうかを検討する。
対照的に、人間は間接的エビデンスを効率的に使用しており、これは効率的な言語習得に寄与する帰納的バイアスの1つと考えられている。
実験の結果,同じ構造を持つインスタンスに繰り返し露出しても,言語モデルが文法的知識を誘導しないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:49:32 GMT)
Can Language Models Induce Grammatical Knowledge from Indirect Evidence? [23.6] 本稿では,言語モデルが間接的データ(間接的証拠)を効率的に用いて文の受理性を推定するかどうかを検討する。
対照的に、人間は間接的エビデンスを効率的に使用しており、これは効率的な言語習得に寄与する帰納的バイアスの1つと考えられている。
実験の結果,同じ構造を持つインスタンスに繰り返し露出しても,言語モデルが文法的知識を誘導しないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:49:32 GMT)
Reducing Variance in Meta-Learning via Laplace Approximation for Regression Tasks [23.3] 勾配に基づくメタラーニングにおける分散化の問題に対処する。
本稿では,各支持点を個別に重み付けすることで,勾配推定のばらつきを低減する手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:53:49 GMT)
Reducing Variance in Meta-Learning via Laplace Approximation for Regression Tasks [23.3] 勾配に基づくメタラーニングにおける分散化の問題に対処する。
本稿では,各支持点を個別に重み付けすることで,勾配推定のばらつきを低減する手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:53:49 GMT)
SemiSAM: Enhancing Semi-Supervised Medical Image Segmentation via SAM-Assisted Consistency Regularization [23.3] 半教師付き手法はラベルのないデータを利用することで性能を向上させることができる。
SemiSAMは、ラベル付き画像が1つまたは数つしか利用できない場合、既存の半教師付きフレームワークのパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:14:19 GMT)
Generative AI Security: Challenges and Countermeasures [22.7] 生成的AIのフットプリントは、多くの業界で拡大しており、興奮と監視の増大につながっている。
本稿では、ジェネレーティブAIがもたらすユニークなセキュリティ課題について論じ、これらのリスクを管理するための潜在的研究の方向性を概説する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:28:19 GMT)
ReflecTool: Towards Reflection-Aware Tool-Augmented Clinical Agents [22.6] 大規模言語モデル(LLM)は医療分野で有望な可能性を示している。
ClinicalAgent Bench (CAB) は、5つの重要な臨床次元にわたる18のタスクからなる総合的な医療エージェントベンチマークである。
ReflecToolはドメイン固有のツールを2段階以内で利用できる新しいフレームワークである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:19:18 GMT)
CondTSF: One-line Plugin of Dataset Condensation for Time Series Forecasting [22.5] データセット凝縮の目的は、合成データセットでトレーニングされたモデルが、完全なデータセットでトレーニングされたモデルと互換性を持って動作できることを保証することである。
分類において、合成データは、全データセットで訓練されたモデルと合成データセットで訓練されたモデルが同じ入力に対して同一のラベルを生成する場合、よく蒸留されると考えられる。
TS予測において, 合成データ蒸留の有効性は, モデル間の距離によって決定される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:05:11 GMT)
CogSteer: Cognition-Inspired Selective Layer Intervention for Efficient Semantic Steering in Large Language Models [22.4] 本研究では,眼球運動計測法を用いて,層間における大規模言語モデル(LLM)の振る舞いを解釈する。
これらの知見に触発され, ステアリング層選択を導入し, 微調整と推論による層間干渉法に適用した。
提案手法は, 計算資源の97%, トレーニング時間の60%を効率よく節約しつつ, 毒性スコアの点で優れた結果が得られる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:40:15 GMT)
Belt and Braces: When Federated Learning Meets Differential Privacy [22.1] フェデレーテッド・ラーニング(FL)は、生データを公開することなく、大規模機械学習(ML)に大きな可能性を秘めている。
差別化プライバシ(DP)は、証明可能な保証を備えた事実上のプライバシ保護標準である。
実践者は、その開発と分類を十分に認識しているだけでなく、プライバシとユーティリティの難しい選択に直面していることが多い。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:17:12 GMT)
Learning Versatile Skills with Curriculum Masking [22.1] 逐次意思決定のためのカリキュラムマスキング事前学習パラダイムであるCurrMaskを提案する。
CurrMaskは、カリキュラムで知識を整理して学習する方法に触発され、多様なスキルを学ぶための事前訓練中にマスクの仕組みを調整する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:17:13 GMT)
Conformal Prediction for Causal Effects of Continuous Treatments [22.1] 本研究では, 連続処理の潜在的な結果に対する新しいコンフォメーション予測法を提案する。
共形予測区間が正当性スコアが未知であっても有効となるように、不確実性推定によって導入された追加的不確実性を考慮する。
我々の知る限りでは、確率スコアが不明で、データから推定しなければならない場合、我々は、継続的治療のための共形予測を最初に提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:09:10 GMT)
Learning to Manipulate Anywhere: A Visual Generalizable Framework For Reinforcement Learning [21.9] 視覚強化学習に適した一般化可能なフレームワークであるtextbfManiwhereを提案する。
実験の結果,Maniwhereは既存の最先端手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:32:34 GMT)
Let Me Teach You: Pedagogical Foundations of Feedback for Language Models [21.9] 自然言語フィードバック(NLF)は、大規模言語モデル(LLM)と人間の嗜好を整合させるメカニズムとして、ますます人気が高まっている。
FELTはフィードバック空間の様々な特徴を概説し、これらの変数に基づいてフィードバックコンテンツ分類を行う。
我々は、分類をコミュニティに公開し、分類を将来の研究にマッピングするためのガイドと例を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:33:44 GMT)
Backdoor in Seconds: Unlocking Vulnerabilities in Large Pre-trained Models via Model Editing [21.5] ある種の敵攻撃は、トレーニングデータセットを汚染することで、機械学習モデルの振る舞いを操作できる。
EDTモデル, textbfEfficient, textbfData-free, textbfTraining-free バックドアアタック手法を導入する。
モデル編集技術にインスパイアされたEDTは、編集ベースの軽量コードブックを、大規模な事前訓練されたモデルのバックドアに注入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:32:14 GMT)
Efficient End-to-end Language Model Fine-tuning on Graphs [21.2] Text-Attributed Graphs (TAGs) からの学習は、その幅広い現実世界のアプリケーションのために大きな注目を集めている。
我々は,TAG上での言語モデルのエンドツーエンドな微調整のための,新規かつ効率的なアプローチであるLEAdingを紹介する。
提案手法は,Ogbn-arxiv のリーダーボード上で,最先端のSOTA(State-of-the-art)を達成し,優れた性能を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:53:48 GMT)
Human-Agent Coordination in Games under Incomplete Information via Multi-Step Intent [21.2] 自律エージェントと人間のパートナー間の戦略的調整はターンベースの協調ゲームとしてモデル化できる。
不完全な情報の下でターンベースのゲームを拡張し、プレイヤーが単一のアクションではなく、ターンごとに複数のアクションを実行できるようにする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:37:19 GMT)
Learning Code Preference via Synthetic Evolution [20.9] 合成進化データからペアワイズコードの選好モデルを学習するためのフレームワークであるCodeFavorを提案する。
評価の結果、CodeFavorはモデルベースのコード優先の精度を最大28.8%改善した。
CodeFavorモデルは、34倍のコスト効率で、6-9倍のパラメータでモデルのパフォーマンスと一致させることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:22:20 GMT)
Learning Code Preference via Synthetic Evolution [20.9] 合成進化データからペアワイズコードの選好モデルを学習するためのフレームワークであるCodeFavorを提案する。
評価の結果、CodeFavorはモデルベースのコード優先の精度を最大28.8%改善した。
CodeFavorモデルは、34倍のコスト効率で、6-9倍のパラメータでモデルのパフォーマンスと一致させることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:22:20 GMT)
MobileSafetyBench: Evaluating Safety of Autonomous Agents in Mobile Device Control [20.8] デバイス制御エージェントの安全性を評価するためのベンチマークであるMobileSafetyBenchを紹介する。
メッセージングやバンキングアプリケーションを含む,さまざまなモバイルアプリケーションとのインタラクションに関わる,さまざまなタスクセットを開発します。
実験の結果,現状のLDMをベースとしたベースラインエージェントは,有効なタスクの実行において良好に機能するが,安全タスクでは性能が劣ることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:51:43 GMT)
xLSTM-Mixer: Multivariate Time Series Forecasting by Mixing via Scalar Memories [20.8] 時系列データは様々な分野に分散しており、堅牢で正確な予測モデルの開発が必要である。
我々は,時間的シーケンス,共同時間可変情報,堅牢な予測のための複数の視点を効果的に統合するモデルであるxLSTM-Mixerを紹介する。
我々は,最近の最先端手法と比較して,xLSTM-Mixerの長期予測性能が優れていることを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:13:11 GMT)
Double Banking on Knowledge: Customized Modulation and Prototypes for Multi-Modality Semi-supervised Medical Image Segmentation [20.7] マルチモダリティ(MM)半教師あり学習(SSL)に基づく医用画像セグメンテーションは近年注目を集めている。
しかし、現在の手法にはいくつかの課題がある。
本稿では,医療画像セグメンテーションのための新しいMM-SSLアプローチであるDouble Bank Dual Consistency (DBDC)を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:19:20 GMT)
Towards Effective Data-Free Knowledge Distillation via Diverse Diffusion Augmentation [20.6] データフリー知識蒸留(DFKD)は、モデル圧縮の領域において重要な技術である。
本稿では,多種拡散増強(DDA)によるDFKDの革新的アプローチを紹介する。
CIFAR-10, CIFAR-100, Tiny-ImageNetデータセットの総合的な実験により, 本手法の優れた性能が示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:01:16 GMT)
TabDPT: Scaling Tabular Foundation Models [20.0] 実データによる性能向上と一般化の方法を示す。
本モデルでは,CC18(分類)およびCTR23(回帰)ベンチマークの最先端性能を実現する。
TabDPTはまた、モデルのサイズと利用可能なデータの量の両方が増加するにつれて、強力なスケーリングを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:00:00 GMT)
Physical Reasoning and Object Planning for Household Embodied Agents [19.9] 我々はCommonSense Object Affordance Task (COAT)を紹介した。
COATは現実世界の環境における実践的な意思決定の複雑さに関する洞察を提供する。
コントリビューションには、3つの要因すべてに対する洞察に富んだ人間の嗜好マッピングと4つの広範囲なQAデータセットが含まれています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:50:54 GMT)
Interpreting Context Look-ups in Transformers: Investigating Attention-MLP Interactions [19.3] 本研究では,大規模言語モデル(LLM)において,注意頭と次点ニューロンがどのように相互作用し,新たな単語を予測するかを検討する。
以上の結果から,注意頭は特定の文脈を認識し,それに応じてトークン予測ニューロンを活性化することが明らかとなった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:20:15 GMT)
Rethinking Positive Pairs in Contrastive Learning [19.1] 視覚表現のための普遍的なコントラスト学習フレームワークであるHydraについて述べる。
このアプローチはIN1Kを用いて検証され、1Kの多様なクラスが500,500対からなる。
我々の研究は、任意のペアの共通の特徴を学習することの価値を強調し、弱い関係を持つサンプルペアに対する対照的な学習手法の適用性を広げる可能性がある。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:07:18 GMT)
Exploring structure diversity in atomic resolution microscopy with graph neural networks [18.9] ディープラーニングは、構造多様性を迅速で正確でインテリジェントな方法で探求するための強力なツールです。
この作業は、迅速で正確でインテリジェントな方法で構造多様性を探求する強力なツールを提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:48:35 GMT)
Gradient-based Jailbreak Images for Multimodal Fusion Models [18.9] イメージ入力による言語モデルの強化は、より効果的なジェイルブレイク攻撃を可能にする可能性がある。
マルチモーダル融合モデルは、非微分可能関数を使用して全ての入力モダリティをトークン化する。
ジェイルブレイク画像は、同じ目的で最適化されたテキストジェイルブレイクよりも優れています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:38:29 GMT)
Gradient-based Jailbreak Images for Multimodal Fusion Models [18.9] イメージ入力による言語モデルの強化は、より効果的なジェイルブレイク攻撃を可能にする可能性がある。
マルチモーダル融合モデルは、非微分可能関数を使用して全ての入力モダリティをトークン化する。
ジェイルブレイク画像は、同じ目的で最適化されたテキストジェイルブレイクよりも優れています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:38:29 GMT)
Quasi-Medial Distance Field (Q-MDF): A Robust Method for Approximating and Discretizing Neural Medial Axis [18.6] 本稿では,主流の明示的媒介軸計算手法から分岐する新しい暗黙的手法を提案する。
本手法は,トーンメッシュと点雲からのコンパクト媒質軸変換を学習する際の精度とロバスト性を向上する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:23:05 GMT)
Att2CPC: Attention-Guided Lossy Attribute Compression of Point Clouds [18.2] 本稿では, オートエンコーダアーキテクチャを利用して, ポイントクラウド属性を効率よく圧縮する手法を提案する。
実験の結果,YチャネルのBD-PSNRとYUVチャネルの平均改善率は1.15dBと2.13dBであることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:32:21 GMT)
Towards Understanding the Fragility of Multilingual LLMs against Fine-Tuning Attacks [18.2] LLM(Large Language Models)は、その安全性に対する幅広い懸念を引き起こしている。
近年の研究では, 微調整によりLLMの安全性の整合性を容易に除去できることが示されている。
我々は,多言語LLMにおける微調整攻撃の理解をさらに進める。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:27:36 GMT)
Conquering the Communication Constraints to Enable Large Pre-Trained Models in Federated Learning [18.1] フェデレートラーニング(FL)は、ローカルデバイス上の生データに一元的にアクセスすることなく、モデルの協調的なトレーニングを可能にするための、有望なパラダイムとして登場した。
最近の最先端の事前訓練モデルでは、より能力が高くなっているが、パラメータも増えている。
FLにおけるこれらの強力で容易に利用できる事前学習モデルが、通信負荷を同時に軽減しつつ優れた性能を達成するためのソリューションを見つけることができるだろうか?
具体的には,FedPEFTの性能を,クライアントの安定性,データ分散,プライバシ設定の違いによって体系的に評価する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:50:18 GMT)
Non-intrusive Speech Quality Assessment with Diffusion Models Trained on Clean Speech [18.1] クリーン音声のみを訓練した無条件拡散モデルを用いて音声品質の評価を行う。
ガウス分布の終端における対応するサンプルの確率を推定することにより、発話の質を評価することができることを示す。
提案手法は,POLQAやSI-SDRなどの侵入的音声品質指標とよく相関し,有望な結果を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:53:58 GMT)
Dependency Graph Parsing as Sequence Labeling [18.1] 我々は、グラフ解析をタグ付けタスクとしてキャストするのに使用できる、非有界および有界な線形化の範囲を定義する。
セマンティック依存関係とUD解析の強化に関する実験結果から, シーケンスラベル依存グラフは, 符号化の優れた選択により, 高い効率性と, 最先端の精度を両立させることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:37:02 GMT)
Exploring Large Language Models for Feature Selection: A Data-centric Perspective [18.0] 大規模言語モデル(LLM)は様々なドメインに影響を与え、例外的な少数ショットとゼロショットの学習機能を活用している。
我々は,データ中心の観点からLLMに基づく特徴選択手法を探求し,理解することを目指している。
本研究は,テキストベースの特徴選択手法の有効性とロバスト性を強調し,実世界の医療応用を用いてその可能性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:01:05 GMT)
Susu Box or Piggy Bank: Assessing Cultural Commonsense Knowledge between Ghana and the U.S [17.9] AMAMMER$epsilon$は、英語のLLMの常識知識を評価するために設計された525の多重選択質問からなるテストセットである。
我々は、ガーナ人と米国の参加者による調査を含む多段階のプロセスを使用する。
単体では、モデルはガーナのアノテーターよりもアメリカのアノテーターの好みに沿った答えの選択を好む。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:56:15 GMT)
Hotel Booking Cancellation Prediction Using Applied Bayesian Models [17.7] 36,285の観測と17の特徴を持つKaggleデータセットを使用して、ベイジアン・ロジスティック・回帰とベータ・バイノミカル・モデルが実装された。
12の特徴と5,000のランダムに選択された観測結果に適用されたロジスティック・モデルは、予測精度でベータ・ビノミカル・モデルを上回った。
主な予測者は、大人、子供、滞在時間、リードタイム、駐車場、ルームタイプ、特別リクエストなどであった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:13:31 GMT)
ODBAE: a high-performance model identifying complex phenotypes in high-dimensional biological datasets [17.6] ODBAE (Outlier Detection using Balanced Autoencoders) は、微妙かつ極端な外れ値の両方を明らかにするために設計された機械学習手法である。
以上の結果から,ODBAEは生体系における関節異常の検出と恒常性摂動の理解の促進に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:02:38 GMT)
CLR-Bench: Evaluating Large Language Models in College-level Reasoning [17.1] 大規模言語モデル(LLM)は、様々な言語理解タスクで顕著な性能を示した。
複雑な大学レベルの推論において,LLMを包括的に評価するためにCLR-Benchを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:55:08 GMT)
Bonsai: Gradient-free Graph Distillation for Node Classification [17.0] グラフ蒸留は、GNNのスケーラブルなトレーニングを可能にするための有望な道として登場した。
本研究は, 現行のグラフ蒸留技術において, 重大な欠点を明らかにするものである。
本稿では,テキスト計算木がメッセージパッシングGNNの基本処理単位を形成するという観察により,新しいグラフ蒸留法であるボンサイについて述べる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:08:45 GMT)
Efficient Sign-Based Optimization: Accelerating Convergence via Variance Reduction [16.8] それぞれ$mathcalO(d1/2T-1/2 + dn-1/2)$と$mathcalO(d1/4T-1/4)$の収束率を改善する2つの新しいアルゴリズムを導入する。
提案手法の有効性を検証した数値実験を行った。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:42:35 GMT)
Mitigating Graph Covariate Shift via Score-based Out-of-distribution Augmentation [16.6] トレーニングとテストデータセット間の分散シフトは、グラフ学習におけるモデルパフォーマンスを著しく損なう。
本稿では,全体のグラフパターンの妥当性と安定性を保ちつつ,未知の環境特徴を合成するスコアベースのグラフ生成戦略を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:09:02 GMT)
Integral Operator Approaches for Scattered Data Fitting on Spheres [16.4] 重み付きスペクトルフィルタアルゴリズムの近似性能について検討する。
重み付きスペクトルフィルタアルゴリズムのソボレフ型誤差推定を最適に導出する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:06:25 GMT)
PLGS: Robust Panoptic Lifting with 3D Gaussian Splatting [16.3] 雑音の多い2Dセグメンテーションマスクから3DGSが一貫した単眼セグメンテーションマスクを生成できるPLGSと呼ばれる新しい手法を提案する。
本手法は,従来の最先端手法よりもセグメンテーション品質と速度の両面で優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:05:05 GMT)
Estimating the Spectral Moments of the Kernel Integral Operator from Finite Sample Matrices [16.3] 本稿では,カーネル積分作用素のスペクトルモーメントを無限入力と特徴の極限で非バイアスで推定するアルゴリズムを提案する。
本手法は,動的プログラミングに基づいて,演算子スペクトルのモーメントを推定できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:12:59 GMT)
Human Action Recognition without Human [16.3] バックグラウンドシーケンスだけで、現在の大規模アクションデータセットで人間のアクションを分類できるかどうかを考察する。
実験は、アクションラベルを理解するためのバックグラウンドシーケンスの効果を明確に示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:32:26 GMT)
PnLCalib: Sports Field Registration via Points and Lines Optimization [16.3] 放送されたスポーツビデオのカメラキャリブレーションは、正確なスポーツフィールドの登録に多くの課題をもたらす。
従来の検索ベースの手法は初期カメラのポーズ推定に依存しており、非標準位置で苦労する可能性がある。
本稿では,3次元サッカー場モデルと予め定義されたキーポイントのセットを利用して,これらの制限を克服する最適化に基づくキャリブレーションパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:48:44 GMT)
TANQ-Sim: Tensorcore Accelerated Noisy Quantum System Simulation via QIR on Perlmutter HPC [16.3] TANQ-Simは、コヒーレントノイズと非コヒーレントノイズの両方で実用的なディープ回路をシミュレートするために設計された、フルスケールの密度行列ベースのシミュレータである。
このようなシミュレーションにかかわる計算コストに対処するため,新しい密度行列シミュレーション手法を提案する。
また,その性能を最適化するために,密度行列シミュレーションのための特定のゲート融合手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:57:29 GMT)
ELAICHI: Enhancing Low-resource TTS by Addressing Infrequent and Low-frequency Character Bigrams [16.2] 言語や地理的に関連のある言語からの高品質なデータを活用して、ターゲット言語のためのTSを改善する。
第2に,非スタディオ環境で記録された低品質自動音声認識(ASR)データを利用する。
第3に、より堅牢な出力を生成するために、合成データを用いた大規模モデルからの知識蒸留を適用する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:18:25 GMT)
Self-Supervised Graph Neural Networks for Enhanced Feature Extraction in Heterogeneous Information Networks [16.1] 本稿では,インターネットの急速な発展に伴う複雑なグラフデータ処理におけるグラフニューラルネットワーク(GNN)の適用と課題について考察する。
自己監督機構を導入することにより、グラフデータの多様性と複雑さに対する既存モデルの適合性を向上させることが期待されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:14:37 GMT)
Topology meets Machine Learning: An Introduction using the Euler Characteristic Transform [16.1] 私は、ポイントクラウド、グラフ、メッシュを分析するためのより効率的なモデルをもたらすユースケースを提示します。
本稿では,(1)トポロジカル空間上の関数の学習,(2)データ中のトポロジ的情報に関する知識を生かしたハイブリッドモデルの構築,(3)ニューラルネットワークの質的特性の分析など,トポロジカルな概念が将来どのように使われるか,というビジョンを概説する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:56:05 GMT)
CorrectionLM: Self-Corrections with SLM for Dialogue State Tracking [16.1] 大規模言語モデル (LLM) はフィードバックや改善を通じて自己改善能力を示すが、現在の小言語モデル (SLM) はこの分野では限られた成功を収めている。
CORRECTIONLMは、SLMがLLMを介さずにインコンテキストの例を使って自己修正できる新しい補正フレームワークである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:27:16 GMT)
Do causal predictors generalize better to new domains? [16.0] 我々は、健康、雇用、教育、社会的利益、政治の応用をカバーする16の予測タスクについて検討する。
予測タスク毎に,予測対象に因果的影響を与える特徴を選択する。
因果関係によらず、利用可能な全ての特徴を用いた予測器は、因果的特徴を用いた予測器よりもドメイン内および領域外精度が優れていることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:29:39 GMT)
Reinforcement Learning with Dynamic Multi-Reward Weighting for Multi-Style Controllable Generation [16.0] テクストスタイルは、対人的ダイナミクス(フォーマル性など)や著者の感情や態度(嫌悪感など)など、多様な情報の集合を表現する
オープンな疑問は、言語モデルを明示的に制御して、テキストを生成する際にターゲットスタイルを織り合わせる方法だ。
このような制御された生成の1つのアプローチは、多目的強化学習(RL)である。
判別器の校正出力や,判別器の大きさによる動的重み付けなど,多型報酬の定式化について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:39:25 GMT)
Process Supervision-Guided Policy Optimization for Code Generation [15.9] 単体テストフィードバックによる強化学習(RL)は、大規模言語モデル(LLM)コード生成を強化しているが、完全なコード評価後にのみ提供される少ない報酬に依存している。
本稿では,人間のコード修正を模倣したプロセス・リワード・モデル(PRM)を提案する。
我々の実験結果は、特に長期シナリオにおいて、RL駆動型コード生成の強化におけるPRMの有効性を強調した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:22:33 GMT)
Guide for Defense (G4D): Dynamic Guidance for Robust and Balanced Defense in Large Language Models [15.9] 本稿では,多エージェントベースの防衛フレームワークであるG4D(Guide for Defense)について紹介する。
一般的なjailbreak攻撃と良質なデータセットに関する大規模な実験は、我々のG4Dが一般的なおよびドメイン固有のシナリオに対するLLMのロバスト性を高めることができることを示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:40:37 GMT)
PGDiffSeg: Prior-Guided Denoising Diffusion Model with Parameter-Shared Attention for Breast Cancer Segmentation [15.9] 早期発見は乳癌による高い死亡率の軽減に不可欠である。
低解像度・高ノイズの医用画像から腫瘍を見つけることは極めて困難である。
本稿では,乳がん画像分割に拡散復調法を適用した新しいPGDiffSegを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:17:03 GMT)
GPT-SW3: An Autoregressive Language Model for the Nordic Languages [15.8] 本稿は,北欧語における最初の大規模生成言語モデルであるGPT-SW3の開発過程を詳述する。
本論文は,より小規模な言語のための大規模生成モデルの開発に携わる研究者のガイドおよび参考となることを期待する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:13:49 GMT)
MADial-Bench: Towards Real-world Evaluation of Memory-Augmented Dialogue Generation [15.6] メモリ拡張対話システム(MADS)の有効性を評価するための新しいメモリ拡張対話ベンチマーク(MADail-Bench)を提案する。
このベンチマークは2つのタスクを別々に評価する: メモリ検索とメモリ認識は、パッシブとプロアクティブの両方のメモリリコールデータを組み込んだものである。
このベンチマークにおける最先端の埋め込みモデルと大規模言語モデルの結果は、さらなる進歩の可能性を示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:47:58 GMT)
OWL2Vec4OA: Tailoring Knowledge Graph Embeddings for Ontology Alignment [15.0] 本稿では,組込みシステムOWL2Vec*の拡張であるOWL2Vec4OAを提案する。
本稿では,提案する拡張の理論的基礎,実装の詳細,および実験的評価について述べる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:59:15 GMT)
Generative AI Models for Different Steps in Architectural Design: A Literature Review [14.9] 生成AIモデルの原則と進歩を理解し、アーキテクチャアプリケーションにおけるそれらの関連性を分析することが不可欠である。
本稿ではまず,確率拡散モデル(DDPM),3次元生成モデル,基礎モデルを中心に,生成AI技術の概要を紹介する。
建築設計プロセスを6段階に分割し、2020年から現在までの各段階における関連する研究プロジェクトについてレビューする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:38:40 GMT)
Value Residual Learning For Alleviating Attention Concentration In Transformers [14.9] 複数の注意層を積み重ねると 注意集中につながる
この問題に対処する自然な方法の1つは、レイヤ横断の注意を使うことで、以前のレイヤからの情報を後続のレイヤに直接アクセス可能にすることである。
本稿では,第1層の値から第1層の値への残差接続を付加することにより,層間注意を近似する残差値(ResFormer)の変換器を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:15:07 GMT)
Can visual language models resolve textual ambiguity with visual cues? Let visual puns tell you! [14.8] 語彙的曖昧さの解消におけるマルチモーダル入力の影響を評価するための新しいベンチマークUNPIEを提案する。
私たちのデータセットには1,000個の句が含まれており、それぞれに両方の意味を説明する画像が添付されています。
その結果,様々なソクラティック・モデルとビジュアル・ランゲージ・モデルにより,視覚的コンテキストが与えられた場合に,テキストのみのモデルよりも改善されることが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:55:20 GMT)
Can visual language models resolve textual ambiguity with visual cues? Let visual puns tell you! [14.8] 語彙的曖昧さの解消におけるマルチモーダル入力の影響を評価するための新しいベンチマークUNPIEを提案する。
私たちのデータセットには1,000個の句が含まれており、それぞれに両方の意味を説明する画像が添付されています。
その結果,様々なソクラティック・モデルとビジュアル・ランゲージ・モデルにより,視覚的コンテキストが与えられた場合に,テキストのみのモデルよりも改善されることが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:55:20 GMT)
Towards Foundation Model for Chemical Reactor Modeling: Meta-Learning with Physics-Informed Adaptation [14.8] 本稿では, 化学反応器モデリングにおける基礎モデルの新たな応用について述べる。
我々のモデルは3つの古典的な原子炉タイプにまたがって一般化するように設計されている。
これは、異なる反応器のセットアップにまたがる様々な整数の順序で、目に見えない反応に迅速に適応することを示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:29:20 GMT)
CoreInfer: Accelerating Large Language Model Inference with Semantics-Inspired Adaptive Sparse Activation [14.8] 数十億のパラメータを持つ大規模言語モデル(LLM)が、エキサイティングなAIアプリケーションに新たな波を巻き起こした。
アダプティブスパースアクティベーション推論(Adaptive sparse activation inference)は、トークンごとに少数のニューロンのみを活性化し、モデル推論を加速する新しい方法を提供する。
本稿では,文レベルの予測に基づく適応的なスパースアクティベーション推論手法であるCoreInferを紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:45:23 GMT)
Pruning By Explaining Revisited: Optimizing Attribution Methods to Prune CNNs and Transformers [14.8] 計算要求の削減と効率の向上のための効果的なアプローチは、ディープニューラルネットワークの不要なコンポーネントを創り出すことである。
これまでの研究では、eXplainable AIの分野からの帰属法が、最も関係の低いネットワークコンポーネントを数ショットで抽出し、プルークする効果的な手段であることが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:53:24 GMT)
KeySpace: Public Key Infrastructure Considerations in Interplanetary Networks [14.7] 本稿では,メガコンステレーションと惑星間ネットワークに着目し,衛星ネットワークにおける鍵管理システムの実現に向けた目標と要件について検討する。
本研究では、高度に分散した惑星間ネットワークにおいて、地球上のPKI技術が実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:47:20 GMT)
Addressing Asynchronicity in Clinical Multimodal Fusion via Individualized Chest X-ray Generation [14.7] 本稿では,胸部X線像の最新の画像表現を動的に生成するDDL-CXRを提案する。
提案手法は,従来のCXR画像とERH時系列を戦略的に条件付けした患者特異的生成のための潜時拡散モデルを利用する。
MIMICデータセットを用いた実験は、提案モデルがマルチモーダル融合における非同期性に効果的に対応し、既存の手法を一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:34:39 GMT)
Multi-Continental Healthcare Modelling Using Blockchain-Enabled Federated Learning [14.6] 我々は,地域データセットを共有することなく,多大陸(ヨーロッパ,北米,アジア)のデータセットを用いたグローバルヘルスケアモデリングの枠組みを提案する。
技術的には、ブロックチェーン対応のフェデレーション学習は、医療データのプライバシと安全性の要件を満たすように適応して実装されている。
実験結果から,提案するフレームワークは有効で,効率的で,プライバシーが保たれていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:55:53 GMT)
Quantifying the Gain in Weak-to-Strong Generalization [14.5] より弱いモデルよりも強いモデルによって達成される性能の向上は、弱いモデルによって生成されるラベル上の強モデルによって引き起こされる不適合誤差によって定量化されることを示す。
例えば、強いモデルが弱いモデルよりも改善する量を予測することができ、また、そのミスフィットエラーに基づいて、強いモデルをトレーニングするために異なる弱いモデルを選択することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:55:34 GMT)
Large Language Models Still Exhibit Bias in Long Text [14.3] 大規模言語モデルにおけるバイアスを評価するフレームワークであるLong Text Fairness Test (LTF-TEST)を紹介する。
LTF-TESTはモデル応答とそれらの背後にある推論の両方を評価することで、単純な応答では検出が難しい微妙なバイアスを明らかにする。
FT-REGARD(FT-REGARD)を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:51:33 GMT)
AdaDiffSR: Adaptive Region-aware Dynamic Acceleration Diffusion Model for Real-World Image Super-Resolution [14.3] 拡散モデル(DM)は、単一画像の超解像や他の画像間翻訳タスクにおいて有望な結果を示している。
我々は、動的時間ステップサンプリング戦略(DTSS)を備えたDMsベースの超解像パイプラインであるAdaDiffSRを提案する。
実験の結果,AdaDiffSR は現在の最先端の DM ベースの SR 手法よりも高い性能を達成できることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:29:18 GMT)
Hopf algebras and solvable unitary circuits [14.2] 我々は、離散空間と時間における量子多体ダイナミクスをモデル化するための、正確に解けるモデルの新たなファミリーを導入する。
得られた正確な結果は、多くの身体の傷の量子的な現象、そしてより一般的には、制約された系における花束量子力学の現象に光を当てるかもしれない。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:10:06 GMT)
Efficient Inference for Augmented Large Language Models [14.2] Augmented Large Language Models (LLM)は、APIコールを通じて外部データソースを統合することで、スタンドアロンのLLMの機能を強化する。
SJF(Shortest Job First)のような従来のサイズベースのスケジューリングアルゴリズムは、完了時間の最小化にはあまり効果がない。
拡張LLMのための新しいLLM推論フレームワークであるLAMPSを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:53:30 GMT)
ECG Semantic Integrator (ESI): A Foundation ECG Model Pretrained with LLM-Enhanced Cardiological Text [14.1] 本研究は,12誘導ECG信号の学習表現の品質とロバスト性の向上を目的とした,新しいマルチモーダルコントラスト保持フレームワークを提案する。
私たちのフレームワークは、Cardio Query Assistant(CQA)とECG Semantics Integrator(ESI)の2つの重要なコンポーネントで構成されています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:01:50 GMT)
GenUDC: High Quality 3D Mesh Generation with Unsigned Dual Contouring Representation [13.9] 3次元生成モデルは、複雑な構造と現実的な表面を持つ高品質なメッシュを生成する。
我々は、Unsigned Dual Contouring (UDC) をメッシュ表現として活用することにより、これらの課題に対処するGenUDCフレームワークを提案する。
さらに、GenUDCは2段階の粗大な生成プロセスを3Dメッシュ生成に採用している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:59:49 GMT)
Graphusion: A RAG Framework for Knowledge Graph Construction with a Global Perspective [13.9] この研究は、無料テキストからゼロショットの知識グラフフレームワークであるGraphusionを導入している。
ステップ1では、トピックモデリングを用いてシードエンティティのリストを抽出し、最終KGに最も関連性の高いエンティティを導く。
ステップ2ではLSMを用いて候補三重項抽出を行い、ステップ3では抽出した知識のグローバルなビューを提供する新しい融合モジュールを設計する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:54:03 GMT)
Enhancing Federated Learning Convergence with Dynamic Data Queue and Data Entropy-driven Participant Selection [13.8] Federated Learning(FL)は、エッジデバイス上でのコラボレーティブモデルトレーニングのための分散アプローチである。
本稿では,サーバ上のデータのグローバルサブセットを作成し,デバイス間で動的に分散することにより,FLの収束を改善する手法を提案する。
提案手法により,MNISTデータセットでは約5%,CIFAR-10では約18%,CIFAR-100では約20%の精度向上を実現した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:47:04 GMT)
The Art of Imitation: Learning Long-Horizon Manipulation Tasks from Few Demonstrations [13.7] TP-GMMの適用にはいくつかのオープンな課題がある。
我々はロボットのエンドエフェクター速度を方向と大きさに分解する。
次に、複雑な実証軌道からセグメントとシーケンスのスキルを抽出する。
私たちのアプローチでは,5つのデモから複雑な操作タスクを学習することが可能です。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:07:05 GMT)
The Art of Imitation: Learning Long-Horizon Manipulation Tasks from Few Demonstrations [13.7] TP-GMMの適用にはいくつかのオープンな課題がある。
我々はロボットのエンドエフェクター速度を方向と大きさに分解する。
次に、複雑な実証軌道からセグメントとシーケンスのスキルを抽出する。
私たちのアプローチでは,5つのデモから複雑な操作タスクを学習することが可能です。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:07:05 GMT)
Do Large Language Models Have an English Accent? Evaluating and Improving the Naturalness of Multilingual LLMs [13.6] 大規模言語モデル (LLM) は主に英語を基本言語として設計されている。
多言語である少数の人々でさえ、強い英語中心の偏見を示す傾向がある。
本稿では,多言語出力の語彙的および構文的自然性を評価するための新しい自動コーパスレベル指標を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:00:27 GMT)
TP-Eval: Tap Multimodal LLMs' Potential in Evaluation by Customizing Prompts [13.5] マルチモーダルな大言語モデル(MLLM)は、その印象的な機能に多くの注目を集めています。
本稿では、既存のベンチマークにおけるこの欠陥を分析し、TP-Evalと呼ばれる新しい評価フレームワークを提案する。
TP-Evalは、オリジナルのプロンプトを異なるモデル向けにカスタマイズされたプロンプトに書き換える。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:54:43 GMT)
Bridging Swarm Intelligence and Reinforcement Learning [13.3] スワーミング(SI)は、単純な個人の大きなグループがどのようにして複雑な行動を生み出すかを探求する。
我々は,多武装バンディット問題におけるCDMと単エージェント強化学習(RL)の理論的,経験的等価性を実証する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:49:37 GMT)
ZIP-FIT: Embedding-Free Data Selection via Compression-Based Alignment [13.3] ZIP-FITは、gzip圧縮を使用して、潜在的なトレーニングデータとターゲットタスク分布のアライメントを測定するデータ選択フレームワークである。
ZIP-FIT選択データに基づいてトレーニングされたモデルは、ベースラインよりも85.1%高速なクロスエントロピー損失を達成する。
ZIP-FITは、小さく、よく整合したデータセットが、より大きながターゲットの少ないデータセットよりも優れていることを示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:01:06 GMT)
Exploiting Text-Image Latent Spaces for the Description of Visual Concepts [13.3] コンセプトアクティベーションベクトル(Concept Activation Vectors, CAV)は、人間のフレンドリな概念をモデルの内部的特徴抽出プロセスにリンクすることで、ニューラルネットワークの意思決定に関する洞察を提供する。
新しいCAVが発見されたとき、それらは人間の理解可能な記述に翻訳されなければならない。
本稿では,新たに発見された概念集合の解釈を支援するために,各CAVに対してテキスト記述を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:51:07 GMT)
Time and Frequency Synergy for Source-Free Time-Series Domain Adaptations [13.2] 本稿では、ソースフリーな時系列領域適応問題に対処するための時間周波数領域適応(TFDA)を提案する。
TFDAは、最終予測を行う際に時間と周波数の両方の特徴を完全に活用した二重分岐ネットワーク構造で開発されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:29:50 GMT)
Adaptive Test Generation with Qgrams [13.2] 我々は、ペアワイズ距離計算を過去の実行のコンパクトアグリゲーションに置き換える、適応的ランダムテストのための新しいフレームワークを提案する。
Qgrams を用いた ART では,平均でランダムテストの 4 倍,従来の距離ベース手法による ART の 3.5 倍の目標がカバーされている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:26:51 GMT)
On the limits of agency in agent-based models [13.1] エージェント・ベース・モデリング(ABM)は、環境の中で動作し相互作用するエージェントの集合をシミュレートすることで、複雑なシステムの振る舞いを理解しようとする。
大規模言語モデル(LLM)の最近の進歩は、ABMを強化する機会を与える。
我々は,AMMを数百万のエージェントに拡張するフレームワークであるAgentTorchを紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:37:10 GMT)
DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark [13.0] 顔認識(FR)システムはプライバシーのリスクを引き起こす。
1つの対策は敵攻撃であり、不正な悪意のあるFRを欺くことである。
トレース可能な対角線透かしに基づく最初の二重識別保護方式を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:42:29 GMT)
Understanding the Effectiveness of Large Language Models in Detecting Security Vulnerabilities [12.8] 5つの異なるセキュリティデータセットから5,000のコードサンプルに対して、16の事前学習された大規模言語モデルの有効性を評価する。
全体として、LSMは脆弱性の検出において最も穏やかな効果を示し、データセットの平均精度は62.8%、F1スコアは0.71である。
ステップバイステップ分析を含む高度なプロンプト戦略は、F1スコア(平均0.18まで)で実世界のデータセット上でのLLMのパフォーマンスを著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:32:15 GMT)
Gazelle: An Instruction Dataset for Arabic Writing Assistance [12.8] アラビア文字支援のための包括的なデータセットであるGazelleを提示する。
また、アラビア文字支援ツールの強化を目的とした評価フレームワークも提供する。
私たちの調査結果は、継続的モデルトレーニングとデータセットの強化の必要性を浮き彫りにしています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:51:58 GMT)
FIPER: Generalizable Factorized Fields for Joint Image Compression and Super-Resolution [12.8] 本稿では,超解法(SR)と画像圧縮の統一表現(**Factorized Fields**)を提案する。
まず、一般化可能な分解場のための係数バックボーンと基底スウィン変換器を含むSRモデルを導出する。
次に、訓練されたSRモジュールの強い情報回復能力を圧縮パイプラインの先行機能として活用し、圧縮効率と詳細再構築の両方を改善した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:59:57 GMT)
ODTFormer: Efficient Obstacle Detection and Tracking with Stereo Cameras Based on Transformer [12.6] ODTFormerはTransformerベースのモデルで、障害検出と追跡の両方の問題に対処する。
我々は,最先端の障害物追跡モデルに匹敵する精度を報告し,そのコストはごくわずかである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:05:01 GMT)
Local Contrastive Editing of Gender Stereotypes [12.6] 言語モデル(LM)に符号化されたステレオタイプバイアスは、安全な言語技術に対する脅威となる。
本稿では,参照モデルに関する対象モデルにおける重みのサブセットのローカライズと編集を可能にする,局所的コントラスト編集を提案する。
局所的なコントラスト編集は、性別バイアスを符号化する重みの小さな部分集合を正確にローカライズし、制御できることを実証する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:12:35 GMT)
Utility Theory of Synthetic Data Generation [12.5] 本稿では,統計的学習フレームワークにおける実用理論の確立により,実践と理論のギャップを埋める。
合成データに基づいてトレーニングされたモデルの一般化とランキングの2つのユーティリティメトリクスを考慮に入れている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:34:35 GMT)
DisenGCD: A Meta Multigraph-assisted Disentangled Graph Learning Framework for Cognitive Diagnosis [12.5] 既存のグラフ学習に基づく認知診断(CD)法は,比較的良好な結果を得た。
本稿では,CD(DisenGCD)のためのメタマルチグラフ支援不整合グラフ学習フレームワークを提案する。
実験は、最先端のCD法よりも、DisenGCDの性能と堅牢性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:15:59 GMT)
Theoretically Grounded Pruning of Large Ground Sets for Constrained, Discrete Optimization [12.0] 最適解にはならない要素を破棄する軽量プルーニングアルゴリズムを開発した。
軽微な仮定の下では、最適値が保持される割合と、得られたプルーニングされた基底集合のサイズに関する理論的保証が証明される。
私たちのアルゴリズムであるQuickPruneは、地面の90%以上を効率よくプルーンし、最先端の古典的および機械学習より優れている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:18:07 GMT)
GenDP: 3D Semantic Fields for Category-Level Generalizable Diffusion Policy [11.8] 本稿では,3次元のセマンティックフィールドを介し,空間的・意味的な明示的な情報を含む新しいフレームワークを提案する。
本手法は,未確認インスタンスにおける拡散政策の平均成功率を20%から93%に引き上げることにより,その効果を実証する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:51:47 GMT)
Probabilistic ML Verification via Weighted Model Integration [11.8] 機械学習モデルの確率形式検証(PFV)はその初期段階にある。
重み付きモデル統合(WMI)に基づくMLシステムのPFV統合フレームワークを提案する。
ML検証文献におけるスケーリング手法が,本来の範囲を超えていかに一般化できるかを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:04:57 GMT)
Asynchronous RLHF: Faster and More Efficient Off-Policy RL for Language Models [11.6] RLHFにおける生成と学習の分離を提案する。
非同期トレーニングは、オンラインだが非政治的なRLHFという未調査の制度に依存している。
非同期RLHFのさらなる計算最適化について検討するが、性能上のコストがかかることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:59:50 GMT)
Real-time Vehicle-to-Vehicle Communication Based Network Cooperative Control System through Distributed Database and Multimodal Perception: Demonstrated in Crossroads [11.6] 本稿では,VVCCS(Real-time-to-Vehicle Communication Based Network Cooperative Control System)を提案する。
VVCCSは、自動運転におけるマクロスコープの交通計画と衝突回避に革命をもたらす。
また,多目的追跡とレーダセンシングを併用した総合的マルチモーダル認識システムを開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:59:55 GMT)
LMLPA: Language Model Linguistic Personality Assessment [11.6] 大規模言語モデル(LLM)は、日常の生活や研究にますます利用されている。
与えられたLLMの性格を測定することは、現在課題である。
言語モデル言語パーソナリティアセスメント(LMLPA)は,LLMの言語的パーソナリティを評価するシステムである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:48:51 GMT)
Correlated Proxies: A New Definition and Improved Mitigation for Reward Hacking [11.6] 状態に対する代償と真報酬の相関に基づく報酬ハッキングの定義を導入する。
基本方針の正則化が報酬ハッキングを効果的に防止できることを理論的に示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:52:57 GMT)
Benchmarking Foundation Models on Exceptional Cases: Dataset Creation and Validation [11.6] 本稿では, グラフィックノベル, 書道, ニュース記事, 歌詞など, 複数のモダリティにまたがるFM評価のための新しいデータセットを開発する。
これには、例えば分類、文字認識、トークン予測、テキスト生成といったタスクが含まれる。
また,性能向上のため,Chain-of-Few(CoT)やCoT+Thought-Shotといった迅速な技術も提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:24:23 GMT)
BadFair: Backdoored Fairness Attacks with Group-conditioned Triggers [11.4] BadFairは、バックドア型フェアネスアタック手法である。
BadFairは、通常の条件下で正確さと公正さで動作するモデルをステルス的に作り出すが、特定のトリガーによって起動されると、特定のグループに対して誤った結果を生成して生成する。
以上の結果から,BadFairは標的グループを標的とした攻撃で85%以上の攻撃成功率を達成したが,精度の低下は最小限であった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:14:54 GMT)
A spring-block theory of feature learning in deep neural networks [11.4] 特徴学習深層ネットは、定期的に低次元の幾何学にデータを徐々に崩壊させる。
この現象は, 非線形性, ノイズ, 学習率, および力学を形作る他の選択の集合的作用から生じることを示す。
ダイアグラムを再現するマクロメカニカル理論を提案し、DNNのいくつかが遅延でアクティブな理由を説明し、層をまたいだ特徴学習と一般化をリンクする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:11:34 GMT)
Telling Stories for Common Sense Zero-Shot Action Recognition [11.2] 本稿では,WikiHowの記事から抽出した多様なアクションクラスに対するリッチなテキスト記述を含む,新しいデータセットであるStoriesを紹介する。
各クラスに対して、アクションを特徴付けるために必要なステップ、シーン、オブジェクト、動詞を詳述した多文の物語を抽出する。
このコンテキストデータは、アクション間のニュアンス付き関係のモデリングを可能にし、ゼロショット転送への道を開く。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:25:17 GMT)
MCUBERT: Memory-Efficient BERT Inference on Commodity Microcontrollers [11.1] 小型マイクロコントローラユニット(MCU)上でBERTのような言語モデルを実現するためのMCUBERTを提案する。
組込み圧縮のためのクラスタ化低ランク近似に基づくMCU対応2段階ニューラルネットワーク探索アルゴリズムを提案する。
初めて、MCUBERTはコモディティMCU上で軽量BERTモデルを提供し、256KB未満のメモリで512以上のトークンを処理する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:27:37 GMT)
RegExplainer: Generating Explanations for Graph Neural Networks in Regression Task [11.1] グラフ回帰モデル(XAIG-R)を解釈するための説明を求める。
これらの課題に対処するために,情報ボトルネック理論に基づく新たな目的を提案する。
回帰タスクにおいて連続的に順序付けられたラベルに取り組むための対照的な学習戦略を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:43:03 GMT)
Learning Goal-Conditioned Representations for Language Reward Models [10.9] 対照的な$textitgoal-conditioned$でトレーニング報酬モデル(RM)を提案する。
RM表現のこのトレーニング方法により、textitsteerability$が向上し、特定の目標状態を達成するアクションの可能性を評価することができる。
さらに、これらの表現は、希望する将来の目標状態に条件付けすることで、きめ細かい制御を行うことができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:33:34 GMT)
Navigate Complex Physical Worlds via Geometrically Constrained LLM [10.9] 本研究は幾何規則の集合を導入し,多層グラフとマルチエージェントシステムフレームワークに基づくワークフローを開発する。
この研究は、幾何学的制約問題を解くために、大規模なモデル知識にインスパイアされた遺伝的アルゴリズムを用いている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:14:07 GMT)
Can Uncertainty Quantification Enable Better Learning-based Index Tuning? [10.9] インデックスチューニングは、ワークロードに基づいて最適なインデックスを選択することで、データベースのパフォーマンスを最適化するために不可欠である。
従来の道具に依存する手法は、しばしば非効率性と不正確さに悩まされる。
我々は,不確実性定量化を伴う学習ベースモデルを強化する最初の不確実性認識フレームワークであるBeautyを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:23:53 GMT)
Dynamic Tuning of Single-Photon Emission in Monolayer WSe2 via Localized Strain Engineering [10.8] 次世代集積型単一光子エミッタ(SPE)の候補として2次元(2D)材料が出現している
本稿では,WSe2単層膜における個々のSPEの正確な発光エネルギーチューニングについて述べる。
2D SPEのチューニング性は、量子技術のための2D材料とオンチップの統合フォトニクスへの確かな一歩を表している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:18:14 GMT)
Markov Chain of Thought for Efficient Mathematical Reasoning [10.7] 多段階の思考の連鎖(CoT)は、推論ステップとタスク固有のアクションの論理構造から恩恵を受ける。
我々は、標準多段階CoTを思考のマルコフ連鎖(MCoT)として概念化する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:53:29 GMT)
TAGE: Trustworthy Attribute Group Editing for Stable Few-shot Image Generation [10.6] TAGEは3つの積分モジュールからなる革新的な画像生成ネットワークである。
CPMモジュールは、カテゴリに依存しない属性のセマンティックディメンションを掘り下げて、それらを個別のコードブックにカプセル化する。
PSMモジュールは、CPMのTransformerアーキテクチャにシームレスに統合されるセマンティックキューを生成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:26:19 GMT)
Diffusion Priors for Variational Likelihood Estimation and Image Denoising [10.5] 本稿では,現実の雑音に対処するために,逆拡散過程における適応的確率推定とMAP推定を提案する。
実世界の多様なデータセットの実験と分析により,本手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:52:53 GMT)
Multimodal Information Bottleneck for Deep Reinforcement Learning with Multiple Sensors [10.5] 強化学習はロボット制御タスクにおいて有望な成果を上げてきたが、情報の有効活用に苦慮している。
最近の研究は、複数の感覚入力から関節表現を抽出するために、再構成や相互情報に基づく補助的損失を構築している。
生のマルチモーダル観測について,学習した共同表現で情報を圧縮することが有用である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:32:37 GMT)
JointMotion: Joint Self-Supervision for Joint Motion Prediction [10.4] JointMotionは、自動運転車における関節運動予測のための自己教師付き事前訓練手法である。
提案手法は,Wayformer,HPTR,Scene Transformerの各モデルにおける最終変位誤差を,それぞれ3%,8%,12%削減する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:39:15 GMT)
Evaluation of Language Models in the Medical Context Under Resource-Constrained Settings [10.4] 医療分野における言語モデルに関する総合的な調査を行った。
医療用テキスト分類と条件付きテキスト生成のためのサブセットの評価を行った。
その結果、タスク全体での顕著なパフォーマンスが明らかとなり、特定のモデルが医療知識を含む可能性について評価された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:10:29 GMT)
AutoSpec: Automated Generation of Neural Network Specifications [10.2] 学習強化システムにおけるニューラルネットワークの包括的かつ正確な仕様を自動的に生成する最初のフレームワークであるAutoSpecを紹介する。
評価の結果,AutoSpecは人間の定義した仕様よりも優れており,本研究で導入された2つのベースラインアプローチが優れていることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:05:48 GMT)
Online Differentially Private Synthetic Data Generation [10.2] 差分プライベートな合成データセットを毎回$t$で生成するオンラインアルゴリズムを開発した。
このアルゴリズムは、$O(log(t)t-1/d)$ for $dgeq 2$と$O(log4.5(t)t-1)$ for $d=1$の近似精度を1-ワッサーシュタイン距離で達成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:07:09 GMT)
Augmenting Training Data with Vector-Quantized Variational Autoencoder for Classifying RF Signals [10.0] 本稿では,Vector-Quantized Variational Autoencoder (VQ-VAE) を用いたトレーニングデータの拡張を提案する。
VQ-VAEモデルは高忠実な合成RF信号を生成し、トレーニングデータセットの多様性と忠実度を高める。
実験結果から,VQ-VAE生成データの導入により,ベースラインモデルの分類精度が大幅に向上することが示唆された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:17:45 GMT)
Closed-form merging of parameter-efficient modules for Federated Continual Learning [9.9] 一度に1つのLoRA行列をトレーニングする交代最適化戦略であるLoRMを導入する。
これにより、未知の変数を個別に解くことができ、ユニークな解を見つけることができる。
本手法は,さまざまなFCILシナリオにおける最先端性能を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:30:13 GMT)
MiLoRA: Efficient Mixture of Low-Rank Adaptation for Large Language Models Fine-tuning [9.9] 低ランク適応法(LoRA)とその混合実験法(MOE)は,高効率なパラメータ効率微調整法(PEFT)である。
新規かつ効率的なLoRA変種であるMiLoRAを提案する。
MiLoRAは、各LoRAモジュールを専門家として考慮し、プロンプト対応のルーティング機構を採用することで、従来のMOEスタイルのLoRAメソッドと異なる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:04:40 GMT)
Deterministic formation of carbon-functionalized quantum emitters in hexagonal boron nitride [9.9] 六方晶窒化ホウ素(hBN)の絶縁における単一光子放出体(SPE)は、量子フォトニクスに幅広い関心を呼んだ。
我々は, 超音波ナノインデンテーションを用いて, 位置決定論的炭素官能化量子エミッタをhBN中に生成する簡単な手法を提案する。
得られたSPEは高品質であり、単一の製造工程で大きな配列にスケールアップすることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:13:27 GMT)
Hamiltonian Matching for Symplectic Neural Integrators [9.8] ハミルトンの運動方程式は、天文学、量子力学、粒子物理学、気候科学など、物理学の様々な分野における基本的な枠組みを形成している。古典的な数値解法は通常、これらの系の時間発展を計算するために用いられる。
パラメトリック時間依存ハミルトニアン関数の正確なフローマップの列を構成するニューラルネットワークに基づく新しいシンプレクティックインテグレータであるSympFlowを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:21:56 GMT)
TargetCall: Eliminating the Wasted Computation in Basecalling via Pre-Basecalling Filtering [9.7] 最先端のベースコールは、高度なベースコール精度を達成するために複雑なディープラーニングモデルを使用する。
多くのアプリケーションでは、ほとんどの読み取りは参照ゲノムと一致しない。
我々は,ベースコールにおける無駄な計算をなくすための,最初のベースコール前フィルタであるTargetCallを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:36:37 GMT)
FairWASP: Fast and Optimal Fair Wasserstein Pre-processing [9.6] 本報告では,FairWASPについて述べる。FairWASPは,従来のデータを変更することなく,分類データセットの格差を低減するための,新しい前処理手法である。
我々は,整数重みが最適であることを理論的に示す。つまり,本手法はサンプルの重複や除去と等価に理解することができる。
本研究は, 大規模混合整数プログラム (MIP) として前処理タスクを再構成し, 切削平面法に基づく高効率なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:22:37 GMT)
OVT-B: A New Large-Scale Benchmark for Open-Vocabulary Multi-Object Tracking [9.6] 我々は,OVT-Bというオープン語彙多目的追跡のための大規模ベンチマークを構築した。
OVT-Bには1,048のカテゴリのオブジェクトと、637,608のバウンディングボックスアノテーションを備えた1,973のビデオが含まれている。
また,OVTの簡易かつ効果的なベースライン法を開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:28:46 GMT)
Screw Geometry Meets Bandits: Incremental Acquisition of Demonstrations to Generate Manipulation Plans [9.6] 本研究では,1回に1回に1回,十分な審美的デモンストレーションの集合を得るという課題について検討する。
実験結果から操作計画を生成するために, (i) スクリュー幾何表現を用いて, これらのオープンな問題に対処する新しい手法を提案する。
本研究は,2つの実例操作課題,すなわち注水とスクーピングに関する実験結果である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:57:56 GMT)
A Data-Driven Odyssey in Solar Vehicles [9.6] 本研究では,太陽光発電における長距離走行の理解を支援するシミュレータを提案する。
Google Mapsのデータと天気情報を利用することで、シミュレータは現実世界の運転条件を再現する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:39:26 GMT)
Exploring the Adversarial Robustness of CLIP for AI-generated Image Detection [9.5] 比較言語-画像事前学習(CLIP)に基づく手法に着目し,AI生成画像検出器の対角的ロバスト性について検討した。
CLIPベースの検出器は、CNNベースの検出器と同様に、ホワイトボックス攻撃に対して脆弱である。
この分析は、より効果的な戦略を開発するのに役立つ法医学的検出器の特性に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:06:32 GMT)
AdaRankGrad: Adaptive Gradient-Rank and Moments for Memory-Efficient LLMs Training and Fine-Tuning [9.5] 大規模言語モデル(LLM)の訓練と微調整には、メモリと計算要求に関する課題が伴う。
低ランク適応(LoRA)など、これらの課題に対処する様々な技術が開発されている。
トレーニングが進むにつれて、推定勾配のランクが徐々に低下する現象に着想を得た新しい手法を導入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:53:26 GMT)
FLUX: Fast Software-based Communication Overlap On GPUs Through Kernel Fusion [9.5] 本稿では,GPUに依存する計算で通信遅延を著しく隠蔽する新しいFlux法を提案する。
Fluxは核融合によって最大96%の通信を重複させる可能性がある。
全体としては、様々なGPU世代と相互接続を持つ128GPUのクラスタ上で、Megatron-LM上でのトレーニングのために、最大1.24倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:45:33 GMT)
Towards Croppable Implicit Neural Representations [9.4] Inlicit Neural Representations(INR)は、ニューラルネットワークを使って自然信号をエンコードする能力により、近年注目されている。
本稿では、編集可能なINRのアイデアを探求し、特に広く使われている収穫作業に焦点を当てる。
デザインによる収穫を支援する新しいINRアーキテクチャであるLocal-Global SIRENsを紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:02:12 GMT)
Towards Croppable Implicit Neural Representations [9.4] Inlicit Neural Representations(INR)は、ニューラルネットワークを使って自然信号をエンコードする能力により、近年注目されている。
本稿では、編集可能なINRのアイデアを探求し、特に広く使われている収穫作業に焦点を当てる。
デザインによる収穫を支援する新しいINRアーキテクチャであるLocal-Global SIRENsを紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:02:12 GMT)
Is artificial intelligence still intelligence? LLMs generalize to novel adjective-noun pairs, but don't mimic the full human distribution [9.3] 人工知能はまだ知性があるのか?」といった推論は、LLMが意味と構成の一般化能力を理解するための良いテストベッドを提供する。
我々は, LLM の範囲を調査し, 最大のモデルでは, 文脈によって推測が決定されたときに, 人間の様の推論を描画できることを見出した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:05:57 GMT)
PETAH: Parameter Efficient Task Adaptation for Hybrid Transformers in a resource-limited Context [9.2] 本稿では,Hybrid Transformer のタスク適応性能向上と PETAH: Efficient Task Adaptation for Hybrid Transformer の導入について述べる。
我々のPETAH適応ハイブリッドモデルは、パラメータを少なくし、モバイルハードウェアでより効率的であると同時に、ViTのタスク適応技術よりも優れています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:24:47 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [9.2] ビュー合成のための連続的動的ニューラルネットワークプリミティブ(CD-NGP)を提案する。
提案手法は時間的および空間的なハッシュエンコーディングから特徴を相乗化して高いレンダリング品質を実現する。
本稿では,厳格かつ非剛性な動きを持つマルチビュー,例外的に長いビデオシーケンスからなる新しいデータセットを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:10:29 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [9.2] CD-NGPは動的シーンにおける3次元再構成と新しいビュー合成のための高速でスケーラブルな表現である。
連続学習にインスパイアされた本手法は,まず入力ビデオを複数のチャンクに分割し,次にモデルのチャンクをチャンクで訓練し,最後に,第1枝とその後の枝の特徴を融合させる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:10:29 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [9.2] CD-NGPは動的シーンにおける3次元再構成と新しいビュー合成のための高速でスケーラブルな表現である。
連続学習にインスパイアされた本手法は,まず入力ビデオを複数のチャンクに分割し,次にモデルのチャンクをチャンクで訓練し,最後に,第1枝とその後の枝の特徴を融合させる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:10:29 GMT)
POD-Attention: Unlocking Full Prefill-Decode Overlap for Faster LLM Inference [9.2] 我々は、ハイブリッドバッチの注意を効率的に計算する最初のGPUカーネルであるPOD-Attentionを紹介する。
POD-Attentionは、GPUのリソースを慎重に割り当てることで、計算帯域とメモリ帯域の両方の利用を最大化することを目的としている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:06:56 GMT)
Utilitarian Algorithm Configuration for Infinite Parameter Spaces [9.1] 有効性アルゴリズム構成は、与えられたアルゴリズムのパラメータ空間を自動的に検索し、その性能を最適化する手法である。
無限パラメータ空間を効率的に探索するためのCOUP(Continuous, Optimistic Utilitarian Procrastination)を導入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:33:57 GMT)
Information transmission under Markovian noise [9.1] マルコフ力学に基づく開量子系を考える。
ワンショット$epsilon$-error情報送信容量が$Phin$を有限時間持つ場合、上と下の境界が見つかる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:26:17 GMT)
Fully undistillable quantum states are separable [9.1] 我々は、Alice が Bob または Charlie のいずれかとの絡み合いを $|psi_ABCrangle$ で蒸留できないことを証明している。
すべての低位状態が1ウェイ蒸留可能であるわけではないが、ランダムにサンプリングされた低位状態はほぼ確実に1ウェイ蒸留可能であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:57:17 GMT)
Detecting positive quantum capacities of quantum channels [9.1] ノイズの多い量子チャネルは、非ゼロレートで確実に量子情報を送信するために使用することができる。
これは、チャネルの非有界な数のコピーに対して、チャネルのコヒーレントな情報の計算を必要とするためである。
入力,出力,環境空間の相対的サイズに,チャネルが情報を伝達する能力が密接に関連していることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:41:57 GMT)
Real-Time Summarization of Twitter [9.0] 我々は、リアルタイムプッシュ通知のシナリオに焦点を当て、システムはサンプルツイートのストリームを監視し、特定の興味のあるプロフィールに関連するつぶやきを返す必要がある。
ツイートが特定の関心プロファイルに関連するかどうかを分類するために、Dirichletスコアと、非常にスムーズな(ベースライン)で採用しています。
また、プッシュキューから冗長なツイートを削除することも望まれる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:01:13 GMT)
A Kernel Perspective on Distillation-based Collaborative Learning [9.0] 統計的に異種環境において局所データやモデルを直接共有しない非パラメトリック協調学習アルゴリズムを提案する。
理論的結果から着想を得て,ニューラルネットワークアーキテクチャに基づく実用的蒸留に基づく協調学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:40:13 GMT)
Multiversion Hindsight Logging for Continuous Training [8.9] Multiversion Hindsight Loggingでは、古いバージョンが異なるデータをログしている場合でも、エンジニアが過去のバージョンをクエリできる。
FlorDBは、履歴クエリの効率的な処理のための統一リレーショナルモデルを提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:27:30 GMT)
RE-tune: Incremental Fine Tuning of Biomedical Vision-Language Models for Multi-label Chest X-ray Classification [8.9] 本稿では,マルチモーダル・バイオメディカル・ビジョン・ランゲージ・モデルを微調整する新しいアプローチであるRE-tuneを紹介する。
工学的な肯定的および否定的なテキストプロンプトにより、我々は大規模言語モデルの能力を活用できる。
我々は,RE-tuneを3つの現実的な段階的学習シナリオ(クラスインクリメンタル,ラベルインクリメンタル,データインクリメンタル)で評価する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:40:33 GMT)
Does Generative AI speak Nigerian-Pidgin?: Issues about Representativeness and Bias for Multilingualism in LLMs [8.8] ナイジャ語はナイジェリアで約1億2000万人の話者が話すナイジェリア・ピジン語である。
混成言語(英語、ポルトガル語、ヨルバ語、ハウサ語、イグボ語など)である。
西アフリカ・ピジン英語(西アフリカ・ピジン英語)(WAPE)として知られる西アフリカで話される大きなピジン語と非ネイティブで区別するのは困難である
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:46:13 GMT)
YOLO-Vehicle-Pro: A Cloud-Edge Collaborative Framework for Object Detection in Autonomous Driving under Adverse Weather Conditions [8.8] 本稿では, YOLO-VehicleとYOLO-Vehicle-Proの2つの革新的なディープラーニングモデルを提案する。
YOLO-Vehicleは、自動運転シナリオに特化したオブジェクト検出モデルである。
YOLO-Vehicle-Proはこの基盤の上に構築されており、改良されたイメージデハージングアルゴリズムを導入している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:07:13 GMT)
Scalable Random Feature Latent Variable Models [8.8] ブロック座標降下変動推論(BCD-VI)と呼ばれる明示的なPDFと新しいVBIアルゴリズムを得るために,ディリクレプロセス(DP)のスティック破断構成を導入する。
これにより、RFLVMのスケーラブルバージョン、あるいは略してSRFLVMの開発が可能になる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:22:43 GMT)
Hadamard Representations: Augmenting Hyperbolic Tangents in RL [8.6] 活性化関数は、ディープニューラルネットワークの重要なコンポーネントの1つである。
強化学習では、連続的な微分可能なアクティベーションの性能は、線形単位関数と比較して低下することが多い。
我々は、より高速な学習、死んだ神経細胞の減少、深いQ-ネットワークによる効果的なランクの向上を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:05:57 GMT)
ShapefileGPT: A Multi-Agent Large Language Model Framework for Automated Shapefile Processing [8.6] 大規模言語モデル(LLM)を利用した革新的なフレームワークであるShapefileGPTを提案する。
ShapefileGPTはマルチエージェントアーキテクチャを使用し、プランナーエージェントがタスクの分解と監督を担当し、ワーカーエージェントがタスクを実行する。
評価のために,幾何演算や空間的クエリといったカテゴリのタスクを含む,権威教科書に基づくベンチマークデータセットを開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:58:14 GMT)
GDDA: Semantic OOD Detection on Graphs under Covariate Shift via Score-Based Diffusion Models [8.6] アウト・オブ・ディストリビューション(OOD)検出はグラフニューラルネットワーク(GNN)にとって大きな課題となる
グラフ上の既存のOOD検出方法のほとんどは、主にテストデータドメイン内のインスタンスの識別に焦点を当てている。
本研究では,両タイプのシフトを同時に処理し,グラフ上でのOOD検出に新たな課題を提起する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:05:33 GMT)
Stabilizing black-box model selection with the inflated argmax [8.5] 本稿では,バッジと「膨らませた」argmax演算を組み合わせたモデル選択の安定化手法を提案する。
提案手法では,データに適合するモデルの小さなコレクションを選択し,高い確率で任意のトレーニングポイントを除去すると,元のコレクションと重複するモデルのコレクションが生成される。
いずれの設定においても,提案手法は,選択したモデルの安定かつコンパクトなコレクションを生成し,様々なベンチマークより優れている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:39:07 GMT)
Adversarial Domain Adaptation for Metal Cutting Sound Detection: Leveraging Abundant Lab Data for Scarce Industry Data [8.5] 機械学習(ML)モデルを用いた音響検出は,費用対効果の高い非侵襲的なモニタリング手法として利用することができる。
そこで本研究では,産業データ不足から学習するために,豊富な実験データを活用する新たなドメイン適応(DA)手法を提案する。
本モデルでは,多層パーセプトロンをベースとしたバニラドメイン適応モデルの性能を評価した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:55:21 GMT)
Do Large Language Models Truly Grasp Mathematics? An Empirical Exploration [8.4] 近年の研究では、LLMが人間のような論理的推論を採用することを奨励することで、チェーン・オブ・シント・プロンプトが数学的推論を促進することが示唆されている。
以上の結果から,CoTプロンプトの使用にもかかわらず,最新のo1-previewモデルを含む主要なLLMは大きなエラー率を示し続けていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:43:28 GMT)
Stochastic gradient descent in high dimensions for multi-spiked tensor PCA [8.4] マルチスパイクテンソルモデルにおけるオンライン勾配勾配の高次元におけるダイナミクスについて検討する。
我々は、スパイクが「逐次除去」と呼ばれるプロセスで順次回収されることを発見した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:20:41 GMT)
Securing Federated Learning Against Novel and Classic Backdoor Threats During Foundation Model Integration [8.2] フェデレートラーニング(FL)は、プライバシを保護しながら、分散モデルトレーニングを可能にする。
近年、ファンデーションモデル(FM)をFLに統合することで性能が向上する一方で、新たなバックドア攻撃機構が導入されている。
本稿では,サーバ上でのモデルアグリゲーション中に隠れた特徴空間における異常なアクティベーションを制限し,新たなデータフリー防衛戦略を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:54:41 GMT)
Challenge on Sound Scene Synthesis: Evaluating Text-to-Audio Generation [8.2] 本稿では,2024年における音響シーン・イベントの検出・分類の一環として,音シーン合成の課題に対処する。
本稿では,Fr'echet Audio Distanceと知覚的アセスメントを組み合わせた評価手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:35:41 GMT)
Cross-lingual Transfer of Reward Models in Multilingual Alignment [8.1] 人間のフィードバックによる強化学習(RLHF)は、正確な報酬モデル(RM)から大きく恩恵を受けることが示されている。
近年の報酬モデリングスキームの研究は英語に傾き、多言語アライメントにおけるRLHFの適用性を制限している。
様々な言語、主に英語から訓練されたRMの言語間移動について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:00:13 GMT)
STAR: SocioTechnical Approach to Red Teaming Language Models [8.1] STARは、大きな言語モデルの赤いチーム安全性のための現在のベストプラクティスを改善する社会技術フレームワークである。
これは、人間のレッドチームのためにパラメータ化された命令を生成することで、ステアビリティを高め、リスク表面のカバレッジを改善する。
特定のグループに対する害を評価するために、人口統計と一致させることで信号品質を改善し、より敏感なアノテーションをもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:41:45 GMT)
A Wavelet Diffusion GAN for Image Super-Resolution [8.0] 拡散モデルは,高忠実度画像生成のためのGAN(Generative Adversarial Network)の優れた代替品として登場した。
しかし、そのリアルタイム実現性は、遅いトレーニングと推論速度によって妨げられている。
本研究では,ウェーブレットを用いた単一画像超解法のための条件拡散GANスキームを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:34:06 GMT)
The Ultimate Combo: Boosting Adversarial Example Transferability by Composing Data Augmentations [7.9] ブラックボックス回避攻撃には、データ拡張(例えば、ランダムリサイズ)が組み込まれている。
代理機械学習(ML)モデルからターゲットへの敵の例の一般化を支援するため、特定の転送可能性ベースの攻撃にはデータ拡張が組み込まれている。
我々はデータ拡張が転送可能性にどのように影響するかを体系的に研究した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:30:24 GMT)
MojoBench: Language Modeling and Benchmarks for Mojo [7.9] MojoBenchはMojoコード生成のための最初のフレームワークです。
Mojo-Coderは、GPT-4oやClaude-3.5-Sonnetのような主要なモデルよりも30~35%の性能向上を実現している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:11:40 GMT)
Relaxed Equivariance via Multitask Learning [7.9] マルチタスク学習と等価性を近似するトレーニング手法であるREMULを紹介する。
制約のないモデルは、追加の単純な等分散損失を最小化することにより、近似対称性を学習できることが示される。
提案手法は, 等変ベースラインと比較して, 推論時の10倍, トレーニング時の2.5倍の速さで, 競争性能が向上する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:50:27 GMT)
Congestion Forecast for Trains with Railroad-Graph-based Semi-Supervised Learning using Sparse Passenger Reports [7.9] 本稿では,交通アプリケーションを通じて収集した乗客からの報告を用いた鉄道渋滞予測について述べる。
列車の混雑予測のための半教師付き手法(SURCONFORT)を提案する。
第一に、疎いラベル付きデータと多くのラベルなしデータを活用するために、半教師付き学習を採用しています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:25:53 GMT)
Bounded KRnet and its applications to density estimation and approximation [7.8] 本稿では,有界領域上に,B-KRnetと呼ばれる可逆写像を開発する。
データに対する密度推定/近似や、フォッカー・プランク方程式やケラー・セゲル方程式のようなPDEの解に応用する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:28:59 GMT)
Neural Cover Selection for Image Steganography [7.8] ステガノグラフィーでは、カバー選択と呼ばれる最適なカバー画像を選択することは、効果的なメッセージ隠蔽のために重要である。
近年のジェネレーティブモデルの発展に触発されて,新しいカバー選択フレームワークを導入する。
提案手法は, メッセージ回復と画像品質において大きな利点を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:32:34 GMT)
Annotator-Centric Active Learning for Subjective NLP Tasks [7.8] アクティブラーニング(AL)は、最も有益なサンプルを戦略的に注釈付けすることで、人間のアノテーションを収集するコストに対処する。
本稿では,データサンプリングに続き,アノテーション選択戦略を取り入れたACAL(Annotator-Centric Active Learning)を提案する。
本研究の目的は,人間の判断の多様性を効率的に近似し,アノテータ中心の指標を用いてモデル性能を評価することである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:12:39 GMT)
Unsupervised Low-dose CT Reconstruction with One-way Conditional Normalizing Flows [7.7] 本稿では,CNFsをベースとした非教師付きLDCT反復再構成アルゴリズムを提案する。
双対空間において交互最適化を行う際には厳密な片方向変換を用いる。
異なるデータセットに対する実験により、提案アルゴリズムの性能は、最先端の教師なしおよび教師なしの手法を超越する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:47:29 GMT)
Solving a Stackelberg Game on Transportation Networks in a Dynamic Crime Scenario: A Mixed Approach on Multi-Layer Networks [7.7] 警察のリソースが限られている犯罪者の割り込みは、時間とともに犯罪が場所を変えるため、難しい作業である。
我々は,攻撃者,守備者双方の動きを追跡する階層グラフの概念を考察する。
我々は,層状ネットワーク上に近似アルゴリズムを構築し,ディフェンダーの準最適戦略を求める。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:05:18 GMT)
The Double-Edged Sword of Behavioral Responses in Strategic Classification: Theory and User Studies [7.7] 本稿では,アルゴリズムに対する人間の反応の行動バイアスを考慮した戦略的分類モデルを提案する。
分類器の誤認が、偏りのあるエージェントと合理的なエージェントの反応の異なるタイプの相違をもたらすことを示す。
行動バイアスのある戦略的エージェントは、完全に合理的な戦略エージェントと比較して、会社に利益をもたらすか、または(予想外の)害を与える可能性があることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:42:54 GMT)
CLEAR: Character Unlearning in Textual and Visual Modalities [7.6] マルチモーダル・アンラーニング(MMU)手法を評価するためのベンチマークであるCLEARを紹介する。
CLEARには200人の架空の人物と3700枚の画像が関連付けられている。
10 MU 法を評価し,それらを MMU に適用し,マルチモーダルな忘れ方に特有な新たな課題を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:30:50 GMT)
Improving Instance Optimization in Deformable Image Registration with Gradient Projection [7.6] 変形可能な画像登録は本質的に多目的最適化問題である。
これらの矛盾する目的は、しばしば最適化結果の貧弱につながる。
ディープラーニングの手法は、大規模なデータセット処理の効率化により、最近この領域で人気を博している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:55:10 GMT)
Dependency-Aware Compilation for Surface Code Quantum Architectures [7.5] 表面符号を実装した量子コンピュータにおける量子回路のコンパイル問題について検討する。
我々はこの問題を新しいアルゴリズムで効率よく、ほぼ最適に解決する。
我々の評価は、我々のアプローチが現実的なワークロードをコンパイルするのに強力で柔軟であることを示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:50:05 GMT)
Evaluating Explanations Through LLMs: Beyond Traditional User Studies [7.4] 我々は,7つの大言語モデル(LLM)を用いた人間参加者を再現し,反事実的・因果的説明を比較検討したユーザスタディを再現する。
以上の結果から, (i) LLMは, 原研究の結論のほとんどを再現でき, (ii) 異なるLLMは, 結果のアライメントレベルが異なること, (iii) LLMメモリや出力変動性などの実験的要因がヒトの反応のアライメントに影響を及ぼすことが示唆された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:31:52 GMT)
Physics-informed Neural Networks for Functional Differential Equations: Cylindrical Approximation and Its Convergence Guarantees [7.4] 関数微分方程式(FDE)の第一学習法を提案する。
FDEは物理学、数学、最適制御において基本的な役割を果たす。
FDEの数値近似が開発されたが、しばしば解を単純化する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:16:35 GMT)
Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers [7.4] RoPE(Rotary Positional Embeddings)は、Transformerモデルにおける位置符号化を強化する。
本稿では,RoPEが位置依存回転を導入し,トークン埋め込みにおける位相シフトを引き起こす方法について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:48:28 GMT)
Phase sensitivity for an SU(1,1) interferometer via multiphoton subtraction at the output port [7.2] SU(1,1)干渉計の内部光子損失は、外部光子損失と比較して位相感度に有意な影響を及ぼす。
深刻な光子損失の条件下であっても、多光子減量演算は位相感度を標準量子限界を超えることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:08:47 GMT)
CPE-Pro: A Structure-Sensitive Deep Learning Method for Protein Representation and Origin Evaluation [7.2] タンパク質構造評価用結晶対予測学習モデル(CPE-Pro)を開発した。
CPE-Proはタンパク質の構造情報を学習し、構造間の差異を捉え、4つのデータクラスの正確なトレーサビリティを実現する。
我々は Foldseek を用いてタンパク質構造を「構造配列」にエンコードし、タンパク質構造配列言語モデル SSLM を訓練した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:08:10 GMT)
Surgical Scene Segmentation by Transformer With Asymmetric Feature Enhancement [7.2] 視覚特異的トランスフォーマー法は外科的シーン理解に有望な方法である。
非対称特徴拡張モジュール(TAFE)を用いたトランスフォーマーベースの新しいフレームワークを提案する。
提案手法は, 手術分割作業におけるSOTA法よりも優れており, さらに, 微細な構造認識の能力も証明している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:58:47 GMT)
Safeguard is a Double-edged Sword: Denial-of-service Attack on Large Language Models [7.0] 大規模言語モデル(LLM)に対する新たなDoS攻撃を提案する。
ソフトウェアやフィッシング攻撃によって、攻撃者は短い、一見無害な敵のプロンプトを設定ファイルのユーザープロンプトに挿入する。
我々の攻撃は、Llama Guard 3の97%以上のユーザリクエストを普遍的にブロックする、約30文字の、一見安全な敵のプロンプトを自動的に生成できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:26:06 GMT)
Safeguard is a Double-edged Sword: Denial-of-service Attack on Large Language Models [7.0] 大規模言語モデル(LLM)に対する新たなDoS攻撃を提案する。
ソフトウェアやフィッシング攻撃によって、攻撃者は短い、一見無害な敵のプロンプトを設定ファイルのユーザープロンプトに挿入する。
我々の攻撃は、Llama Guard 3の97%以上のユーザリクエストを普遍的にブロックする、約30文字の、一見安全な敵のプロンプトを自動的に生成できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:26:06 GMT)
Scalable Offline Reinforcement Learning for Mean Field Games [6.8] Off-MMDは、純粋なオフラインデータを用いて平均フィールドゲームにおける平衡ポリシーを近似する新しい平均フィールドRLアルゴリズムである。
我々のアルゴリズムは複雑な環境にスケールし、群衆探索やナビゲーションといったベンチマークタスクで強いパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:16:34 GMT)
A provable initialization and robust clustering method for general mixture models [6.8] クラスタリングは、異種データの存在下での統計機械学習の基本的なツールである。
最新の結果は、ガウス以下の誤差を伴うセントロイドの周りにデータが分散されている場合に、最適なラベルの誤りを保証することに焦点が当てられている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:55:59 GMT)
A Comprehensive Analysis on the Learning Curve in Kernel Ridge Regression [6.7] 本稿では,カーネルリッジ回帰(KRR)の学習曲線を最小限の仮定で総合的に研究する。
本稿では, スペクトル固有デカイ, 固有関数の特性, カーネルの滑らかさなど, カーネルのキー特性の役割を解析する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:52:52 GMT)
Training Free Guided Flow Matching with Optimal Control [6.7] 最適制御を用いたガイドフローマッチングのための学習自由フレームワークであるOC-Flowを提案する。
OC-Flowは,テキスト誘導画像操作,条件分子生成,全原子ペプチド設計において優れた性能を示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:53:11 GMT)
A Unified View of Group Fairness Tradeoffs Using Partial Information Decomposition [6.7] 本稿では,機械学習における顕著なグループフェアネス概念の関係について,新しい情報理論的視点を紹介する。
我々の主な貢献は、部分情報分解(PID)と呼ばれる情報理論における作業の本体を活用することにより、これらの3つの不公平性の正確な関係を解明することである。
本研究では,これら3つの不公平度尺度が重複し,相互に相反し,潜在的なトレードオフにつながるような粒状領域を特定するためにPIDを利用する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:25:02 GMT)
Bayesian optimization for robust robotic grasping using a sensorized compliant hand [6.7] 触覚センサを含む実システムにおいて,様々な把握指標を分析し,現実的な把握最適化を実現する。
ロボットシステムにおける実験的な評価は、未知の物体の把握を行う方法の有用性を示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:33:14 GMT)
Cyber-Physical Authentication Scheme for Secure V2G Transactions Using Blockchain and Smart Contracts [6.6] 電気自動車(EV)の急速な普及により、車両間通信(V2G)ネットワークにおける堅牢なサイバーセキュリティ対策の必要性が高まっている。
本稿では,ブロックチェーンベースのV2Gシステム内でのPnC操作のプラグアンドチャージに適した,サイバー物理認証プロトコルとスマートコントラクトのトレーディングを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:22:34 GMT)
Cyber-Physical Authentication Scheme for Secure V2G Transactions Using Blockchain and Smart Contracts [6.6] 電気自動車(EV)の急速な普及により、車両間通信(V2G)ネットワークにおける堅牢なサイバーセキュリティ対策の必要性が高まっている。
本稿では,ブロックチェーンベースのV2Gシステム内でのPnC操作のプラグアンドチャージに適した,サイバー物理認証プロトコルとスマートコントラクトのトレーディングを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:22:34 GMT)
Cyber-Physical Authentication Scheme for Secure V2G Transactions [6.6] 電気自動車(EV)の急速な普及により、車両間通信(V2G)ネットワークにおける堅牢なサイバーセキュリティ対策の必要性が高まっている。
本稿では,ブロックチェーンベースのV2Gシステム内でのPnC操作のプラグアンドチャージに適した,サイバー物理認証プロトコルとスマートコントラクトのトレーディングを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:22:34 GMT)
Bayesian Analysis of Combinatorial Gaussian Process Bandits [6.6] GP-UCB, GP-BayesUCB, GP-TSの3つのアルゴリズムに対して, 新たな累積後悔境界を提供する。
我々は,オンラインエネルギー効率ナビゲーションの課題に対処するために,我々のフレームワークを使用している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:01:45 GMT)
QICS: Quantum Information Conic Solver [6.3] 我々はQICSを紹介した。QICSはPythonで完全に実装されたオープンソースのプリマル・デュアルインテリア・ポイント・ソルバである。
QICSは量子相対エントロピーを含む最適化問題を解くことができる。
我々は、QICSが最先端の量子相対エントロピー計画法よりも優れていることを示す広範な数値実験を紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:00:24 GMT)
DiffSpec: Differential Testing with LLMs using Natural Language Specifications and Code Artifacts [6.2] 大規模な言語モデルで差分テストを生成するためのフレームワークであるDiffSpecを紹介する。
本稿では,2つの異なるシステム,すなわちeBPFランタイムとWasmバリデータに対するDiffSpecの有効性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:46:43 GMT)
DiffSpec: Differential Testing with LLMs using Natural Language Specifications and Code Artifacts [6.2] 大規模な言語モデルで差分テストを生成するためのフレームワークであるDiffSpecを紹介する。
本稿では,2つの異なるシステム,すなわちeBPFランタイムとWasmバリデータに対するDiffSpecの有効性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:46:43 GMT)
Uncertainty Estimation and Quantification for LLMs: A Simple Supervised Approach [6.2] LLMにおける不確実性推定と校正の問題について検討する。
LLMの応答の不確かさを推定するためにラベル付きデータセットを利用する教師付きアプローチを提案する。
本手法は,ブラックボックス,グレイボックス,ホワイトボックスなど,モデルアクセシビリティの異なるレベルに適応し,実装が容易である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:33:54 GMT)
Generating entanglement of two acoustic modes by driving the qubit in circuit quantum acoustodynamics system [6.2] 回路量子音響力学系における2つの長寿命フォノンモードの絡み合いを生成する方法を提案する。
2つの音響モードが圧電相互作用を介してキュービットに結合し、キュービットはマイクロ波磁場によって駆動される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:30:03 GMT)
Fast classical simulation of qubit-qudit hybrid systems [6.1] 量子回路のシミュレーションは、テンソル積や行列乗法に大きく依存する計算集約的なタスクである。
近年の進歩は、テンソル生成物や行列乗算の必要性を排除し、効率と並列化の大幅な改善をもたらす。
本稿では,Qubit-Quditハイブリッドシステムに適用可能なブロックシミュレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:49:25 GMT)
GRAMMAR: Grounded and Modular Methodology for Assessment of Closed-Domain Retrieval-Augmented Language Model [6.1] Retrieval-Augmented Generation (RAG) システムは、クローズドドメインや社内知識ベースを問うために様々な産業で広く利用されている。
これらのシステムを評価することは、クローズドドメインデータのプライベートな性質と、真理を検証できるクエリの不足により、大きな課題となる。
本稿では,グラウンドドデータ生成プロセスを含む評価フレームワークであるGRAMMARと,欠陥モジュールを効果的に特定する評価プロトコルを紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:19:02 GMT)
LLMScan: Causal Scan for LLM Misbehavior Detection [6.0] 大規模言語モデル(LLM)は、非現実的でバイアスがあり、有害な応答を生成する。
この研究は、因果解析に基づく革新的なモニタリング技術であるLLMScanを導入している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:41:49 GMT)
Explaining Bayesian Networks in Natural Language using Factor Arguments. Evaluation in the medical domain [6.0] 因子論の独立性の概念を導入し、議論がいつ共同で、あるいは別々に提示されるべきかという問題に対処する。
本稿では,その強みによって順序付けられたすべての独立因子の引数のリストを生成するアルゴリズムを提案する。
本提案は,ヒトによる評価研究を通じて,医学領域において検証されている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:33:27 GMT)
CollabStory: Multi-LLM Collaborative Story Generation and Authorship Analysis [5.9] 私たちはCollabStoryと呼ばれる、初めてLLM生成のコラボレーティブなストーリーデータセットを生成します。
オープンソース命令チューニング LLM を用いて,32k 以上のストーリーを生成する。
我々は、人間と人間の複数著者によるタスクや分析の標準となるPANタスクを拡張した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:05:12 GMT)
Responsible Multilingual Large Language Models: A Survey of Development, Applications, and Societal Impact [5.8] この作業は、実運用環境におけるMLLMの開発とデプロイのためのエンドツーエンドフレームワークを提供することによって、ギャップを埋める。
調査の結果,世界言語の88.38%が低資源言語に分類されるなど,言語多様性を支える上で重要な課題が明らかになった。
この調査は、より包括的で効果的な多言語AIシステムの開発に取り組んでいる実践者や研究者にとって不可欠なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:19:15 GMT)
Posterior Sampling-based Online Learning for Episodic POMDPs [5.8] 本研究では,遷移モデルと観測モデルが未知のエピソードPOMDPに対するオンライン学習問題を考察する。
ポストリアサンプリングに基づくPOMDPのための強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:47:42 GMT)
Bridging the Gaps: Utilizing Unlabeled Face Recognition Datasets to Boost Semi-Supervised Facial Expression Recognition [5.8] 我々は、半教師付きFERを高めるために、大きな未ラベルの顔認識(FR)データセットを活用することに重点を置いている。
具体的には,アノテーションを使わずに大規模な顔画像の事前訓練を行う。
ラベル付き画像や多彩な画像の不足を緩和するために、Mixupベースのデータ拡張戦略を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:26:19 GMT)
Understanding Transfer Learning via Mean-field Analysis [5.7] 我々は、KL規則化された経験的リスク最小化を用いて、$alpha$-ERMとファインチューニングの2つの主要なトランスファー学習シナリオを検討する。
平均場状態における一層ニューラルネットワークを用いたトランスファーラーニングの利点を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:51:54 GMT)
UnCLe: Unsupervised Continual Learning of Depth Completion [5.7] UnCLeはマルチモーダル深度推定タスクの教師なし連続学習のための標準ベンチマークである。
連続したデータストリーム上の教師なし学習の実践シナリオ下で、深度補完モデルをベンチマークする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:56:33 GMT)
Calibrating Deep Neural Network using Euclidean Distance [5.7] 機械学習では、Focal Lossは、サンプルの分類が難しいことを強調することで、誤分類率を減らすために一般的に使用される。
高校正誤差は予測確率と実際の結果との相違を示し、モデルの信頼性に影響を及ぼす。
本研究では,FCL (Focal Loss) と呼ばれる新しい損失関数を導入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:06:50 GMT)
Enhancing Multimodal Medical Image Classification using Cross-Graph Modal Contrastive Learning [5.7] 本稿では,マルチモーダルな医用画像分類のためのクロスグラフ・モーダルコントラスト学習フレームワークを提案する。
提案手法は、パーキンソン病(PD)データセットと公共メラノーマデータセットの2つのデータセットで評価される。
以上の結果から,CGMCLは従来手法よりも精度,解釈可能性,早期疾患予測に優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:25:25 GMT)
Faster Language Models with Better Multi-Token Prediction Using Tensor Decomposition [5.6] 本稿では, 精度を損なうことなくサンプリング効率を向上させることを目的とした, 変圧器のマルチトークン予測のための新しいモデルを提案する。
階数=r$標準確率分解に一般化することにより、複数のトークンを同時に予測する改良されたモデルを開発する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:06:36 GMT)
Multilingual Hallucination Gaps in Large Language Models [5.5] フリーフォームテキスト生成において,複数の言語にまたがる幻覚現象について検討する。
これらのギャップは、使用するプロンプトや言語による幻覚応答の頻度の違いを反映している。
その結果, 幻覚率の変動, 特に高次言語と低次言語の違いが明らかになった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:41:51 GMT)
Characterising Open Source Co-opetition in Company-hosted Open Source Software Projects: The Cases of PyTorch, TensorFlow, and Transformers [5.2] 市場競争相手を含む企業は、長い間、オープンソースソフトウェア(OSS)の開発に協力してきた。
オープン・ソース・コ・ペティション」は「オープンソース・コ・ペティション」として知られる協力・競争の絡み合いをもたらす
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:35:41 GMT)
Robust and Explainable Depression Identification from Speech Using Vowel-Based Ensemble Learning Approaches [5.1] 本研究では、音声から抑うつを識別するための説明可能な機械学習アルゴリズムについて検討する。
個別の患者健康アンケート8(PHQ-8)項目スコアを予測する8つのモデルを備えたボットアップアプローチと、うつ病を評価するルータモジュールを備えたMixture of Experts(MoE)を用いた"トップダウン"アプローチである。
どちらの手法も最先端のベースラインに匹敵するパフォーマンスを描いており、平均/中間値のデータセットに対する重大さと感受性の低下を示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:03:09 GMT)
Quantifying the Risks of Tool-assisted Rephrasing to Linguistic Diversity [5.1] 文章アシスタントと大規模言語モデルは、テキストコンテンツの作成に広く利用されている。
我々は,このリスクの定量化に向けた第一歩として,表現ツールの使用によって実現された意味的変化と語彙的変化を計測する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:42:36 GMT)
Two-Step Offline Preference-Based Reinforcement Learning with Constrained Actions [5.1] PRCと呼ばれる新しい2段階学習手法を開発した。
我々は,ロボット制御環境における各種データセットの学習効率を実証的に検証した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:38:34 GMT)
VR-Splatting: Foveated Radiance Field Rendering via 3D Gaussian Splatting and Neural Points [5.0] 仮想現実システムの高性能な要求は、3DGSのような高速なシーン表現を活用する上で課題となる。
これらの障害に対する有望な解決策として、ファベレーテッドレンダリングを提案する。
本手法では, 周辺視の3DGSのスムーズなレンダリングと融合した, 周辺領域の神経点レンダリングのシャープで詳細な出力を生かした, 仮想現実感のための新たなファブリックレンダリング手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:54:48 GMT)
Predicting 30-Day Hospital Readmission in Medicare Patients: Insights from an LSTM Deep Learning Model [4.9] 本研究は, LSTMネットワークと機能工学を用いたメディケア病院の入院状況を分析し, コントリビューションの評価を行った。
LSTMモデルは、入院レベルおよび患者レベルのデータから時間的ダイナミクスを捉えるように設計されている。
主な特徴は、Charlson Comorbidity Index、病院の滞在時間、過去6ヶ月間の入院、人口統計学の変数は影響を受けなかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:50:32 GMT)
Credal Learning Theory [4.6] 我々は,データ生成分布の変動をモデル化するために,凸集合の確率を用いて,不規則な学習理論の基礎を定めている。
境界は有限仮説空間や古典的な結果を直接一般化する無限モデル空間の場合に導かれる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:40:23 GMT)
Universal Black-Box Reward Poisoning Attack against Offline Reinforcement Learning [4.6] ニューラルネットワークを用いた汎用オフライン強化学習に対する汎用的ブラックボックス型報酬中毒攻撃の問題点について検討する。
一般オフラインRL設定において,最初の汎用ブラックボックス報酬中毒攻撃を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:31:22 GMT)
A Multimodal Fusion Network For Student Emotion Recognition Based on Transformer and Tensor Product [4.5] 本稿ではトランスフォーマーアーキテクチャとテンソル製品融合戦略に基づく新しいマルチモーダルモデルを提案する。
BERTのテキストベクトルとViTのイメージベクトルを組み合わせて、生徒の心理的条件を93.65%の精度で分類する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:21:40 GMT)
Bayes optimal learning in high-dimensional linear regression with network side information [4.5] ネットワークの形でサイド情報を持つ教師付き学習問題は、ゲノム学、神経科学の分野で頻繁に発生する。
本稿では,ネットワーク側情報を用いた高次元線形回帰におけるベイズ最適学習の研究を開始する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:54:08 GMT)
MoC-System: Efficient Fault Tolerance for Sparse Mixture-of-Experts Model Training [4.4] 本研究では,分散学習システムで発生する多数のチェックポイントシャードをオーケストレーションするMixture-of-Checkpoint System (MoC-System)を提案する。
MoC-Systemは、新しい部分エキスパートチェックポイント(PEC)機構を備えており、これはアルゴリズムシステムの共同設計であり、専門家の選ばれたサブセットを戦略的に保存する。
We build MoC-System on the Megatron-DeepSpeed framework, achieve a 98.9% down of overhead for each checkpointing process。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:08:33 GMT)
Time-to-Lie: Identifying Industrial Control System Honeypots Using the Internet Control Message Protocol [4.3] 本稿では,標的装置のTTL値を用いてICSミツバチを隠蔽的に識別するサイドチャネル手法を提案する。
我々は,多くのICSハニーポットが,ネットワークツールのみを用いて,最小限のインタラクションによって容易に識別可能であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:06:02 GMT)
Inferring stability properties of chaotic systems on autoencoders' latent spaces [4.3] カオスシステムと乱流では、畳み込みオートエンコーダとエコー状態ネットワーク(CAE-ESN)がダイナミクスの予測に成功した。
CAE-ESNモデルは、低次元多様体における空間ベクトルの不変安定性と幾何学を推論することを示した。
この研究は、潜在空間における高次元カオスシステムの安定性を推測する新たな機会を開く。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:25:36 GMT)
Flexible Process Variant Binding in Information Systems with Software Product Line Engineering [4.2] プロセスモデルにおける変異を管理するための様々なアプローチが提案されている。
本稿では,コンパイル時のアクティビティ実装の選択を可能にすることで,これまでの作業を拡張する。
別の課題として、異なる組織は、デジタル化されたビジネスプロセスにおいて、異なる情報に基づいて意思決定を収集し、基盤にしたいと考えるかもしれません。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:10:42 GMT)
Hierarchical Light Transformer Ensembles for Multimodal Trajectory Forecasting [4.2] 階層型光変圧器アンサンブル(HLT-Ens)という新しい手法を提案する。
HLT-Ensは、新しい階層的損失関数を用いて、トランスフォーマーアーキテクチャのアンサンブルを効率的に訓練する。
我々は、HLT-Ensが最先端の性能レベルを達成し、軌道予測技術を改善するための有望な道を提供することを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:15:32 GMT)
Scaling Robot Policy Learning via Zero-Shot Labeling with Foundation Models [4.1] NILS: 拡張性のための自然言語命令ラベリング。
NILSは、未処理の長距離ロボットデータをスケールで自動的にラベル付けする。
NILSを用いて430時間以上のロボットデータから得られた115k以上の軌道をラベル付けする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:19:48 GMT)
CAT: Contrastive Adapter Training for Personalized Image Generation [4.1] コントラスト適応訓練(Contrastive Adapter Training, CAT)を提案し, CAT損失を応用してアダプタトレーニングを強化する。
提案手法は,モデルがアダプタを開始する際に,ベースモデルの本来の知識の保存を容易にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:16:42 GMT)
Hybrid Spatial Representations for Species Distribution Modeling [4.0] 種分布モデリング(SDM)は、ある種が地球上の特定の位置に存在するかどうかを予測することを目的としている。
これまでの研究では、有望な結果を達成するモデルを構築するために、ニューラルな暗黙表現を使用してきた。
暗黙の埋め込みと明示的な埋め込みを組み合わせたハイブリッドな埋め込み方式を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:13:24 GMT)
MsMorph: An Unsupervised pyramid learning network for brain image registration [4.0] MsMorphは、イメージペアを登録する手動プロセスの模倣を目的とした、イメージ登録フレームワークである。
異なるスケールで意味情報をデコードし、予測された変形場に対して連続的に合成する。
提案手法は,画像ペアとその近傍の異なる領域に着目し,手動による登録手法をシミュレートする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:20:57 GMT)
A Bi-consolidating Model for Joint Relational Triple Extraction [4.0] リレーショナルトリプルを抽出する現在の手法は、エンティティ認識に依存することなく、生文の可能なエンティティペアに基づいて直接予測を行う。
このタスクは、複数の関係三重項が文中に1つまたは2つの実体を共有するという深刻な意味的重なり合う問題に悩まされる。
関係三重関係に関連する局所的・大域的意味的特徴を同時に強化することにより、この問題に対処するバイコンソリデーションモデルを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:39:31 GMT)
MM-Eval: A Multilingual Meta-Evaluation Benchmark for LLM-as-a-Judge and Reward Models [4.0] 大型言語モデル(LLM)は、人間の好みや判断のプロキシとして機能するタスクの評価器として一般的に用いられる。
既存のベンチマークは主に英語に重点を置いており、非英語の文脈における評価者としてのLLMの有効性についての限られた洞察を提供している。
MM-Evalは6つのカテゴリにまたがる18言語をカバーする多言語メタ評価ベンチマークである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:04:55 GMT)
Leveraging the Domain Adaptation of Retrieval Augmented Generation Models for Question Answering and Reducing Hallucination [3.9] Retrieval Augmented Generation Modelは、質問回答のような下流アプリケーションに非常に効果的である。
最近、RAG-end2endモデルはアーキテクチャをさらに最適化し、ドメイン適応における顕著なパフォーマンス改善を実現した。
本稿では,ドメイン適応による多様なRAGおよびRAG様アーキテクチャの性能について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:32:46 GMT)
AutoRNet: Automatically Optimizing Heuristics for Robust Network Design via Large Language Models [3.8] AutoRNetは、大規模な言語モデルと進化的アルゴリズムを統合して堅牢なネットワークを生成するフレームワークである。
次数分布を維持しながら収束と多様性のバランスをとる適応適合度関数を導入する。
AutoRNetはスパースで高密度なスケールフリーネットワークで評価される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:18:38 GMT)
On the Design and Performance of Machine Learning Based Error Correcting Decoders [3.8] まず, 単一ラベル型ニューラルネットワーク (SLNN) とマルチラベル型ニューラルネットワーク (MLNN) のデコーダについて検討した。
次に、エラー訂正符号変換器(ECCT)とクロスアテンションメッセージパッシング変換器(CrossMPT)という、2つのトランスフォーマーベースのデコーダに注目します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:05:26 GMT)
Is the GPU Half-Empty or Half-Full? Practical Scheduling Techniques for LLMs [3.8] 文献および実用サービスシステムからスケジューリング手法を調査する。
文献からのスケジューラは、しばしば優れたパフォーマンスを得るが、かなりの複雑さをもたらす。
対照的に、実際のデプロイメントにおけるスケジューラは、しばしばテーブルに簡単にパフォーマンス向上を残しますが、実装、デプロイ、設定が容易です。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:05:46 GMT)
Continual Learning on a Data Diet [3.7] 連続学習(CL)メソッドは通常、利用可能なすべてのデータから学習する。
データセット内のすべてのデータポイントが同等のポテンシャルを持つわけではない。
この格差は、サンプルの品質と量の両方がモデルの一般化性と効率に直接影響を及ぼすので、性能に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:42:17 GMT)
Advancing NLP Security by Leveraging LLMs as Adversarial Engines [3.7] 本稿では,大規模言語モデル(LLM)を多種多様な敵攻撃を発生させるエンジンとして活用することにより,NLPのセキュリティを向上するための新しいアプローチを提案する。
我々は、この概念を、敵のパッチ、普遍的摂動、標的攻撃など、幅広い種類の攻撃タイプに拡張することを主張する。
敵対的NLPにおけるこのパラダイムシフトは、広範囲にわたる影響、モデル堅牢性の向上、新たな脆弱性の発見、防御機構の革新の推進などをもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:32:03 GMT)
Strongly-polynomial time and validation analysis of policy gradient methods [3.7] 本稿では,有限状態および行動マルコフ決定過程(MDP)と強化学習(RL)のための,優位ギャップ関数と呼ばれる新しい終了基準を提案する。
この利点ギャップ関数をステップサイズルールの設計に組み込むことで、最適ポリシーの定常状態分布に依存しない新しい線形収束率を導出する。
政策勾配法に対してそのような強い収束特性が確立されたのはこれが初めてである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:40:50 GMT)
Strongly-Polynomial Time and Validation Analysis of Policy Gradient Methods [3.7] 最適性ギャップ上の上界と下界の両方を提供する、単純で計算可能なギャップ関数を開発する。
ギャップ関数の収束は、最適性ギャップの収束よりも強い収束モードである。
基本方針ミラー降下は, 決定論的およびMDP的設定の両方において, 高速な分布自由収束を示すことを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:40:50 GMT)
Learning the dynamics of Markovian open quantum systems from experimental data [3.7] このアルゴリズムはマルコフ・チェイン・モンテカルロのアプローチに基づいている。
我々は,1対の量子エミッタ上で実行される量子光学実験について,我々のアルゴリズムをベンチマークした。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:14:59 GMT)
Adaptive Spatio-temporal Estimation on the Graph Edges via Line Graph Transformation [3.6] 線形グラフ変換を利用したLGLMS (Line Graph Least Mean Square) アルゴリズムを提案する。
LGLMSは古典的なLMSアルゴリズムに類似した適応アルゴリズムであるが、グラフエッジに適用される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:53:57 GMT)
Holon Programming Model -- A Software-Defined Approach for System of Systems [3.5] 本稿では,システムのフレキシブルかつ適応的なプログラミングを実現するためのソフトウェア定義手法を提案する。
Holon Programming Modelは、開発者が複雑なシステムの振る舞いを効果的に設計し、編成することを可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:34:29 GMT)
AskBeacon -- Performing genomic data exchange and analytics with natural language [3.5] AskBeaconは、GA4GH Beaconプロトコルを介して、安全に共有されたコホートに大規模言語モデルを適用することを可能にする。
単にBeaconを"探す"ことで、実行可能な洞察を得、分析し、出版対応にすることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:29:24 GMT)
Simplifying Deep Temporal Difference Learning [3.5] 安定性を維持しつつ,TDトレーニングの高速化と簡易化が可能であるかを検討する。
我々の重要な理論的結果は、LayerNormのような正規化技術が証明可能な収束性TDアルゴリズムが得られることを初めて示している。
これらの結果に触発され,より簡易なオンラインQ-LearningアルゴリズムであるPQNを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:27:12 GMT)
Quantum optomechanical control of long-lived bulk acoustic phonons [3.4] マイクロファブリック化高オーバトンバルク波共振器(mathrmmu$HBARs)は、非常に長いコヒーレンス時間を持つ高周波機械モードをサポートすることが示されている。
我々は、個々の高コヒーレンスフォノンモードの量子オプティメカ制御を可能にする新しいオプティメカティカルシステムを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:06:27 GMT)
Breaking the Illusion: Real-world Challenges for Adversarial Patches in Object Detection [3.4] 敵対的攻撃は、機械学習システムの堅牢性と信頼性に重大な脅威をもたらす。
本研究では,物理世界におけるYOLOオブジェクト検出ネットワークにおける逆パッチの性能について検討した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:16:11 GMT)
Universal approximation results for neural networks with non-polynomial activation function over non-compact domains [3.3] ユークリッド空間の非コンパクト部分集合上の関数空間内のニューラルネットワークに対する普遍近似結果を導出する。
非ポリノミカルアクティベーション関数を持つニューラルネットワークにより、十分に正規かつ可積分なフーリエ変換を持つ関数を近似するための次元非依存の速度を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:51:05 GMT)
Collaborative AI in Sentiment Analysis: System Architecture, Data Prediction and Deployment Strategies [3.3] 大規模言語モデル(LLM)に基づく人工知能技術は、特に感情分析においてゲームチェンジャーとなっている。
しかし、複雑なマルチモーダルデータを処理するための多様なAIモデルの統合と、それに伴う機能抽出の高コストは、大きな課題を呈している。
本研究では,様々なAIシステムにまたがるタスクを効率的に分散・解決するための協調型AIフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:09:57 GMT)
Graph Signal Adaptive Message Passing [3.2] Graph Signal Adaptive Message Passing (GSAMP)は、新しいメッセージパッシング手法である。
同時に、時間変化のグラフ信号に対して、オンライン予測、データ計算の欠如、ノイズ除去を行う。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:44:56 GMT)
Accessible, At-Home Detection of Parkinson's Disease via Multi-task Video Analysis [3.2] 既存のAIベースのパーキンソン病検出方法は、主にモータや音声タスクの単調な分析に焦点を当てている。
本稿では,このマルチモーダルデータを利用して診断精度を向上させる不確実性校正核融合ネットワーク(UFNet)を提案する。
UFNetは、精度、ORC曲線下(AUROC)の面積、非隣接特異性を維持しながら感度において、シングルタスクモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:08:59 GMT)
Reservoir computing for system identification and predictive control with limited data [3.1] 我々は、ベンチマーク制御システムの力学を学習し、モデル予測制御(MPC)の代理モデルとして機能するRNN変種の評価を行う。
エコー状態ネットワーク(ESN)は、計算複雑性の低減、より有効な予測時間、MPC目的関数のコスト削減など、競合するアーキテクチャよりも様々な利点がある。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:59:07 GMT)
Generalizable Prompt Tuning for Vision-Language Models [3.1] 学習可能なソフトプロンプトは下流のタスクではよく機能するが、一般化性に欠ける。
本研究は,ソフトプロンプトと手作りプロンプトをテキストモダリティの2つのビューとして扱うことで,タスク固有および一般的な意味情報をよりうまくまとめることができることを示した。
より表現力のあるプロンプトを生成するために、視覚的モダリティからのクラスワイド増強を導入し、より広い範囲の未確認クラスに対して大きなロバスト性をもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:22:59 GMT)
Generalizable Prompt Tuning for Vision-Language Models [3.1] 学習可能なソフトプロンプトは下流のタスクではよく機能するが、一般化性に欠ける。
本研究は,ソフトプロンプトと手作りプロンプトをテキストモダリティの2つのビューとして扱うことで,タスク固有および一般的な意味情報をよりうまくまとめることができることを示した。
より表現力のあるプロンプトを生成するために、視覚的モダリティからのクラスワイド増強を導入し、より広い範囲の未確認クラスに対して大きなロバスト性をもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:22:59 GMT)
A Training Data Recipe to Accelerate A* Search with Language Models [3.0] A*のような検索アルゴリズムを備えた大規模言語モデル(LLM)は、拡張された推論とスケーラブルな推論の約束を持っている。
我々は,A*探索アルゴリズムの要件を LLM の要件から実験的に切り離して,この課題を一般化する。
提案手法は,解を見つけるのに要する反復回数を最大15倍に削減し,壁面通過速度を最大5倍に向上させる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:37:31 GMT)
Bridging the Diagnostic Divide: Classical Computer Vision and Advanced AI methods for distinguishing ITB and CD through CTE Scans [2.9] 放射線医の間では, 内皮-皮下脂肪比は, ITBとCDの鑑別における代用バイオマーカーとして認識されている。
本稿では,この比率計算を自動化するために,皮下脂肪の自動分離のための新しい2次元画像コンピュータビジョンアルゴリズムを提案する。
ITB, CD, 正常患者のサンプルを用いて, CTEスキャンのデータセットを用いてResNet10モデルを訓練し, 75%の精度を得た。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:05:27 GMT)
CARLA2Real: a tool for reducing the sim2real gap in CARLA simulator [2.9] 我々は、シミュレーションデータのフォトリアリズムを高めるために最先端のアプローチを採用し、それらを実世界のデータセットの視覚的特徴と整合させる。
そこで我々はCARLA2Realを開発した。CARLA2Realは、広く使われているオープンソースのCARLAシミュレーターである。
このツールは、CARLAをほぼリアルタイムで出力し、13FPSのフレームレートを達成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:33:30 GMT)
Convolutions and More as Einsum: A Tensor Network Perspective with Advances for Second-Order Methods [2.9] 我々はそれらをテンソルネットワーク(TN)として見ることで畳み込みを単純化する
TN はダイアグラムを描画し、微分のような関数変換を実行するようにそれらを操作し、それらを固有値で効率的に評価することで、基礎となるテンソル乗法を推論することができる。
我々のTN実装は、標準実装のメモリオーバーヘッドをなくしながら、最大4.5倍のKFAC変異を加速し、近似バックプロパゲーションのための新しいハードウェア効率の良いドロップアウトを可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:47:01 GMT)
Spectraformer: A Unified Random Feature Framework for Transformer [2.9] 本稿では,Transformerの線形化におけるカーネル関数の近似と学習のための統合フレームワークであるSpectraformerを紹介する。
我々の経験から、異なるカーネルは異なるタスクに長けており、カーネルの選択はパフォーマンスモデルの基本であることを示唆している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:08:23 GMT)
All Random Features Representations are Equivalent [2.8] すべてのランダムな特徴表現が同じ近似誤差を持つことを示す。
つまり、最適なサンプルをすれば、好きな表現を自由に選択できるということです。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:04:36 GMT)
Key Algorithms for Keyphrase Generation: Instruction-Based LLMs for Russian Scientific Keyphrases [2.8] キーフレーズの選択は、広範囲のアプリケーションを持つ自然言語処理において難しいタスクである。
既存の教師なしおよび教師なしのソリューションをロシア語に適用することは、いくつかの制限に直面している。
近年の英文研究により,大言語モデル (LLM) がキーフレーズの生成に成功していることが示された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:07:32 GMT)
Fully smooth one shot multipartite soft covering of quantum states without pairwise independence [2.7] 我々は,量子状態に対する一発多部被覆,いわゆる凸分割,型結果の完全なスムーズな証明を行う強力な機械を提供する。
古典的量子状態に対してスムーズな多重粒子凸が分裂する重要なケースでは、これらの状態の特定の辺縁がペア独立性を満たさない場合でも、我々の機械は機能する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:27:23 GMT)
Fully smooth one shot multipartite covering and decoupling of quantum states via telescoping [2.7] 量子状態に対する完全スムーズな多重分割と凸分割の結果を証明した。
我々の手法は、様々な基本的なネットワーク量子情報理論の問題に対して、最初の完全に滑らかなショットインナーバウンドを証明できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:07:43 GMT)
Neural networks with quantum states of light [2.6] フォトニック人工ニューラルネットワークは、古典光学と量子光学の両方の利点を利用する機会を提供する。
フォトニックなニューロインスパイアされた計算と機械学習は、古典的な環境でうまく実証されている。
量子光学ネットワークは、テレポーテーション、量子鍵分布、量子コンピューティングといった画期的な応用を誘発している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:23:49 GMT)
Audio-visual cross-modality knowledge transfer for machine learning-based in-situ monitoring in laser additive manufacturing [2.6] 本稿では, LAM in-situ モニタリングのための相互モダリティ知識伝達手法について紹介する。
3つのCMKT法が提案され、セマンティックアライメント、完全教師付きマッピング、半教師付きマッピングである。
この2つのマッピング手法は、完全な教師付きおよび半教師付き学習アプローチを用いて、特徴を1つのモダリティから別のモダリティへと導出することで知識を伝達する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:38:00 GMT)
Exploring Stronger Transformer Representation Learning for Occluded Person Re-Identification [2.6] 我々はトランスフォーマーに基づく人物識別フレームワークであるSSSC-TransReIDを組み合わせた新しい自己監督・監督手法を提案した。
我々は、ネガティブなサンプルや追加の事前学習なしに、人物の再識別のための特徴表現を強化することができる自己教師付きコントラスト学習ブランチを設計した。
提案モデルでは, 平均平均精度(mAP) とランク1の精度において, 最先端のReID手法よりも優れたRe-ID性能が得られ, 高いマージンで性能が向上する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:07:41 GMT)
Gaze-Assisted Medical Image Segmentation [2.5] 医用画像(MedSAM)におけるSegment Anything Modelの微調整のプロンプトとして,腹部画像の読影データを用いた。
視線支援MedSAMの結果は,最先端のセグメンテーションモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:38:57 GMT)
Retrieving snow depth distribution by downscaling ERA5 Reanalysis with ICESat-2 laser altimetry [2.5] 本研究は、ICESat-2衛星レーザー高度計による積雪深度測定を用いて、マイクロスケール(10m)で積雪深度マップを作成する。
積雪深とそれに対応するERA5ランド積雪深との関係を確立するために回帰モデルを適用した。
ERA5時間帯全体を対象とした月次積雪深図の時系列作成方法(1950年以降)
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:59:06 GMT)
Understanding Gradient Boosting Classifier: Training, Prediction, and the Role of $γ_j$ [2.4] Gradient Boosting (GBC) は、二項分類のための機械学習アルゴリズムである。
本論文は,終端ノード値の計算に焦点をあてて,トレーニングと予測のプロセスを説明する。
私たちは、読者が理解できるように、付録にステップバイステップの例を提供します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:28:19 GMT)
Understanding Gradient Boosting Classifier: Training, Prediction, and the Role of $γ_j$ [2.4] Gradient Boosting (GBC) は、二項分類のための機械学習アルゴリズムである。
本論文は,終端ノード値の計算に焦点をあてて,トレーニングと予測のプロセスを説明する。
私たちは、読者が理解できるように、付録にステップバイステップの例を提供します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:28:19 GMT)
ConfusedPilot: Confused Deputy Risks in RAG-based LLMs [2.4] 我々は、Copilotを混乱させ、応答に完全性と機密性を侵害するRAGシステムのセキュリティ脆弱性のクラスであるConfusedPilotを紹介します。
本研究は,現在のRAGベースのシステムにおけるセキュリティ脆弱性を強調し,今後のRAGベースのシステムを保護するための設計ガイドラインを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:55:31 GMT)
Quantum illumination using polarization-entangled photon pairs for enhanced object detection [2.3] 物体を照らすための絡み合った光源は、従来の照明法よりも有利である。
量子照明における偏光共役光子対の利点を実験的に実証した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:43:21 GMT)
On the potential of Optimal Transport in Geospatial Data Science [2.3] 最適輸送(OT)に基づく空間的評価指標と損失関数を提案する。
我々のフレームワークは部分的OTを活用し、空間予測問題における再配置コストを最小限に抑えることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:35:57 GMT)
Self-similar phase diagram of the Fibonacci-driven quantum Ising model [2.2] フィボナッチ力学を用いたストロボスコピック量子イジングモデルについて検討する。
位相図の進化を管理する自己相似変換を同定する。
我々の予測は現在の量子情報プロセッサで検証可能である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:42:03 GMT)
CASCRNet: An Atrous Spatial Pyramid Pooling and Shared Channel Residual based Network for Capsule Endoscopy [2.2] この写本は、MISAHUBによるカプセルビジョンチャレンジ2024に関する著作を要約している。
CASCRNet(Capsule endoscopy-Aspp-SCR-Network)を提案する。
提案されたモデルは、F1スコア78.5%、平均AUC98.3%で病気の分類に成功した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:35:18 GMT)
Predicting total time to compress a video corpus using online inference systems [2.2] ビデオコーパスの集約時間予測の精度は、クリップごとの予測の2倍以上に向上した。
コーパスの各分数に対するビデオ計算オーバーヘッドとML予測器の適切な選択を考慮すると、5%未満の予測誤差が得られる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:21:53 GMT)
FuzzWiz -- Fuzzing Framework for Efficient Hardware Coverage [2.2] FuzzWizという自動ハードウェアファジリングフレームワークを作成しました。
RTL設計モジュールのパース、C/C++モデルへの変換、アサーション、リンク、ファジングによるジェネリックテストベンチの作成を含む。
ベンチマークの結果,従来のシミュレーション回帰手法の10倍の速度でカバー範囲の約90%を達成できた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:06:08 GMT)
Improving Text Generation on Images with Synthetic Captions [2.1] SDXLやSD 1.5のような潜伏拡散モデルは、現実的な画像を生成する上で重要な能力を示している。
本稿では,SDXLを大規模データセット上でのトレーニングに要しない,低コストなアプローチを提案する。
提案手法は,異なるシナリオにおけるテキスト生成の精度向上に有効であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:28:53 GMT)
Ornstein-Uhlenbeck Adaptation as a Mechanism for Learning in Brains and Machines [2.1] システムのパラメータと大域的強化信号のノイズを利用する新しい手法を提案する。
連続的に動作し、学習の一般的なメカニズムとしてオルシュタイン・ウレンベック適応(OUA)が提案されている。
OUAは、ニューロモルフィックコンピューティングに潜在的に応用可能な、従来の勾配に基づく手法に代わる実行可能な代替手段を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:19:26 GMT)
Unsupervised Domain Adaptation for Action Recognition via Self-Ensembling and Conditional Embedding Alignment [2.1] 本稿では, 整合正則化, 時間アンサンブル, 条件分布アライメントの3つの関数からなる新しい共同最適化アーキテクチャを提案する。
$mu$DARは、平均マクロF1スコアを4つのベンチマークwHARデータセットで6つの最先端UDAメソッドで改善する$approx$4-12%の範囲をもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:59:27 GMT)
Robust Two-View Geometry Estimation with Implicit Differentiation [2.0] 本稿では,新しい2次元幾何推定フレームワークを提案する。
これは微分可能なロバスト損失関数のフィッティングに基づいている。
本研究では,屋外シナリオと屋内シナリオの両方において,カメラポーズ推定タスクに対するアプローチを評価する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:51:33 GMT)
Transport map unadjusted Langevin algorithms: learning and discretizing perturbed samplers [2.0] 本研究では, 対象分布の正規化を前提条件とし, ランゲヴィン力学の収束を加速する輸送写像の利用について検討する。
また, トランスポートマップを非可逆摂動型 ULA に適用すると, 元の力学の幾何的不変摂動 (GiIrr) が得られることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:18:35 GMT)
ProtoLens: Advancing Prototype Learning for Fine-Grained Interpretability in Text Classification [2.0] ProtoLensはプロトタイプベースのモデルで、テキスト分類のための詳細なサブ文レベルの解釈機能を提供する。
ProtoLensは、Prototype-aware Span extractモジュールを使用して、関連するテキストスパンを識別する。
ProtoLensは、競争精度を維持しながら解釈可能な予測を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:53:46 GMT)
Deep Generative Models for 3D Medical Image Synthesis [1.9] 深部生成モデリングは、現実的な医療画像を合成するための強力なツールとして登場した。
本章では3次元医用画像合成のための様々な深部生成モデルについて考察する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:33:23 GMT)
Correlations and signaling in the Schrödinger-Newton model [1.9] シュル・オーディンガー-ニュートン相互作用は多体系の初期状態の積形式を保っていることを示す。
また,スーパールミナルシグナリングを回避する混合状態拡張法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:44:56 GMT)
Anomaly Prediction: A Novel Approach with Explicit Delay and Horizon [1.9] 本稿では,時系列異常予測に時間的情報を直接組み込んだ新しい手法を提案する。
本研究は, 時間的, 正確な異常予測を行う上で, 提案手法の有効性を実証し, 今後の研究のための新しいベンチマークを設定した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:29:56 GMT)
Parallel quench and dynamic geometrical order parameter [1.9] DQPTに付随する幾何学的変化を,特定の非ブロックバンドモデルに対して,より単純な量で特徴付けることができることを示す。
これらの性質は、2レベルシステムとスピン-$j$システムを含む例を通して詳細に説明する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:07:08 GMT)
Differentially Private Learning Needs Better Model Initialization and Self-Distillation [1.8] 微分プライベートSGD(DPSGD)は、言語モデルのプライバシ保護トレーニングを可能にするが、実用性、多様性、言語品質を低下させることが多い。
DPRefineは,厳密なフィルタリングを施した小さな訓練済みLMのデータを用いてモデルを初期化する3相法である。
GPT-2のような小型モデルは合成と蒸留に有効であり、プライバシー保護言語をスケーラブルかつ効率的に展開する可能性を強調している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:19:51 GMT)
Evaluating Deep Learning Approaches for Predictions in Unmonitored Basins with Continental-scale Stream Temperature Models [1.8] 最近の機械学習(ML)モデルは、大規模な空間スケールでの正確な予測に膨大なデータセットを利用することができる。
本研究では,モデル設計とインプットに必要なデータ,および性能向上のためのトレーニングについて考察する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:36:59 GMT)
Simulating quantum chaos without chaos [1.8] 量子ハミルトニアンの新しいクラスを導入し、量子カオスの従来の理解に根本的に挑戦する。
我々のアンサンブルは、強い相互作用を持つハミルトニアンのガウスユニタリアンサンブル(GUE)と計算的に区別できない。
この効率的な計算の不明瞭さと従来のカオス指標の対比は、量子カオスの性質に関する基本的な仮定を疑問視している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:01:50 GMT)
Masked Clinical Modelling: A Framework for Synthetic and Augmented Survival Data Generation [1.8] 本稿では,マスク付き言語モデリングに触発されたMCM(Masked Clinical Modelling)について紹介する。
MCMはデータ合成と条件付きデータ拡張の両方のために設計されている。
我々は,このプロトタイプをCox Proportional Hazardsモデルを用いてWHAS500データセット上で評価する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:57:12 GMT)
Medical Imaging Complexity and its Effects on GAN Performance [1.8] 医用医用画像合成は, 画像合成のための強力な手法として, GAN (Generative Adversarial Network) による医用画像合成が登場した。
サンプルデータセットサイズと生成された画像の忠実度との関係を計測するベンチマークを実験的に確立する。
サンプルサイズが変化する複数の医用画像データセットをトレーニングした,最先端の2つのGANであるStyleGAN 3とSPADE-GANを用いて実験を行った。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:28:25 GMT)
GeoCode-GPT: A Large Language Model for Geospatial Code Generation Tasks [1.8] 本稿ではGeoCode-PTとGeoCode-SFTコーパスとGeoCode-Eval評価データセットをオープンソースとして公開した。
プレトレーニングと微調整にQRAとLoRAを活用することで,地理空間コード生成にフォーカスした最初のLLMであるGeoCode-GPT-7Bを導入する。
実験の結果、GeoCode-GPTは他のモデルよりも9.1%から32.1%、コード要約能力は5.4%から21.7%、コード生成能力は1.2%から25.1%で優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:52:51 GMT)
HCDN: A Change Detection Network for Construction Housekeeping Using Feature Fusion and Large Vision Models [1.7] 住宅の粗悪な管理は、建設事故に大きく貢献している。
AIとコンピュータビジョンの進歩にもかかわらず、ハウスキーピング環境の悪化を検出する既存の方法は、多くの課題に直面している。
本稿では,高度変化検出ニューラルネットワークであるHousekeeper Change Detection Network (HCDN)を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:36:47 GMT)
Enhancing Interaction Modeling with Agent Selection and Physical Coefficient for Trajectory Prediction [1.7] 本稿では,インタラクションエージェントを手動で選択し,アテンションスコアの代わりに相関関係を計算するASPILinを提案する。
興味深いことに、InterACTION、HighD、CitySimデータセットで実施された実験は、我々の手法が効率的かつ簡単であることを実証している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:56:05 GMT)
Refining Ky Fan's majorization relation with linear programming [1.6] 2つの正の半定値作用素のテンソル積である2つの作用素の和に対して、ケイファンの偏微分関係の可分版が証明される。
量子情報理論におけるスピンアライメント予想は、2レターレベルに肯定的に解決される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:02:46 GMT)
LEGO: Language Model Building Blocks [1.6] 大規模言語モデル(LLM)は自然言語処理(NLP)において必須であるが、データ収集、事前学習、微調整、推論に費用がかかる。
本稿では,LSMからSLMを抽出し,再結合する新しい手法であるLEGOを提案する。
最先端のLCMプルーニング戦略を使用することで、タスク固有のSLMビルディングブロックを作成できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:31:42 GMT)
Generalized Resubstitution for Regression Error Estimation [1.6] 経験的確率測度と損失関数の選択に対応する回帰に対する置換誤差推定器を提案する。
これらの誤差推定器は広い仮定の下で一貫したものであることを証明している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:22:21 GMT)
B-Side: Binary-Level Static System Call Identification [1.6] B-Sideはシステムコールのスーパーセットを識別できる静的バイナリ解析ツールで、x86-64の静的/動的実行実行が実行時に呼び出すことができる。
B-Sideは、プログラム/ライブラリソースへのアクセスを前提とせず、シンボリックな実行を活用することで、適切な精度を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:26:52 GMT)
Quantformer: from attention to profit with a quantitative transformer trading strategy [1.6] この研究は2010年から2019年にかけて、中国資本市場における4,601株の5000,000以上の転がるデータを集めている。
本研究は、他の100因子量的戦略と比較して、株価トレンド予測におけるモデルの性能が優れていることを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:27:26 GMT)
KhmerST: A Low-Resource Khmer Scene Text Detection and Recognition Benchmark [1.5] 我々は,1,544人の専門家による注釈付き画像を含む,最初のKhmerシーンテキストデータセットを紹介した。
この多様なデータセットには、平らなテキスト、起立したテキスト、照度の低いテキスト、遠くのポリゴン、部分的に不明瞭なテキストが含まれる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:04:24 GMT)
Explainable Hierarchical Urban Representation Learning for Commuting Flow Prediction [1.5] 通勤フロー予測は、現実の自治体の業務に欠かせない課題である。
我々は,異なるタイプのODフローを予測するために,意味のある領域埋め込みを生成するヘテロジニアスグラフベースモデルを開発した。
提案モデルでは,一様都市構造の観点から既存モデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:25:58 GMT)
Explainable Hierarchical Urban Representation Learning for Commuting Flow Prediction [1.5] 通勤フロー予測は、現実の自治体の業務に欠かせない課題である。
我々は,異なるタイプのODフローを予測するために,意味のある領域埋め込みを生成するヘテロジニアスグラフベースモデルを開発した。
提案モデルでは,一様都市構造の観点から既存モデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:25:58 GMT)
AI, Global Governance, and Digital Sovereignty [1.4] 我々は、AIシステムがグローバルガバナンスに埋め込まれて、公的/民間の協力とコンテストのデュエルダイナミクスを生み出すことを議論している。
我々は、AIとグローバルガバナンスに関するIR研究の今後の方向性をスケッチして結論付ける。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:05:33 GMT)
Efficient Sketches for Training Data Attribution and Studying the Loss Landscape [1.3] 本稿では,スケーラブルな勾配とHVPスケッチのための新しいフレームワークを提案する。
我々の研究は、事前訓練された言語モデルの振る舞いに新たな光を当て、本質的な次元性やヘッセン性に関する仮定に挑戦する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:44:08 GMT)
Non-Clifford and parallelizable fault-tolerant logical gates on constant and almost-constant rate homological quantum LDPC codes via higher symmetries [1.3] 本研究では, 3次元多様体上に定式化されたホモロジー量子量子低密度パリティチェック符号群に対するフォールトトレラント量子計算について, 定値あるいはほぼ一定の符号化速度で検討する。
3次元多様体の3次元交叉不変量を計算するための一般形式法を開発した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:17:23 GMT)
metasnf: Meta Clustering with Similarity Network Fusion in R [1.3] Metasnf は R パッケージで,クラスタソリューションの広い領域を効率的に検索するメタクラスタリングを適用することができる。
パッケージには、クラスタの可視化、キャラクタリゼーション、バリデーションを支援する機能も含まれている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:39:08 GMT)
PathMoCo: A Novel Framework to Improve Feature Embedding in Self-supervised Contrastive Learning for Histopathological Images [1.3] SRA(stent reconstruction augmentation)と呼ばれる新しい病理組織特異的画像強調法を提案する。
我々は、SRAとMoCo v3を統合する。これは、自己教師付きコントラスト学習の指導的モデルであり、新たなコントラスト損失項を付加し、新しいモデルPathMoCoを呼ぶ。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:38:12 GMT)
Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning [1.3] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、一貫性のない推論に苦戦している。
本研究では,LLM出力の信頼性と透明性を高めるフレームワークであるProof of Thoughtを紹介する。
主な貢献は、論理的整合性を高めるためのソート管理を備えた堅牢な型システム、事実的知識と推論的知識を明確に区別するための規則の明示である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:27:20 GMT)
PyTSC: A Unified Platform for Multi-Agent Reinforcement Learning in Traffic Signal Control [1.3] MARL(Multi-Agent Reinforcement Learning)は、交通信号制御(TSC)の複雑さに対処するための有望なアプローチである。
MARLベースのTSC研究のための既存のプラットフォームは、遅いシミュレーション速度や複雑でメンテナンスが難しいといった課題に直面している。
TSCのためのMARLアルゴリズムのトレーニングと評価を容易にする、堅牢で柔軟なシミュレーション環境であるPyTSCを紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:10:38 GMT)
A utility-based spatial analysis of residential street-level conditions; A case study of Rotterdam [1.2] 本稿では,都市規模での住宅地選択における街路レベルの条件から導かれるユーティリティの空間分布について検討する。
街路レベルの条件から派生したユーティリティは,高度に局所化されたスケールで大きく変化することがわかった。
また,都市中心部の不動産価格が高いのは,街並みの魅力的な条件によるものではないことも明らかにした。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:52:22 GMT)
NexusIndex: Integrating Advanced Vector Indexing and Multi-Model Embeddings for Robust Fake News Detection [1.2] NexusIndexは、偽ニュース検出を強化する新しいフレームワークとモデルである。
高度な言語モデル、イノベーティブなFAISSNexusIndexレイヤ、アテンションメカニズムを統合している。
実験の結果,NexusIndexは各種データセットの効率と精度において,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:59:39 GMT)
LeTO: Learning Constrained Visuomotor Policy with Differentiable Trajectory Optimization [1.2] 本稿では,制約付きビジュモータポリシーの学習手法であるLeTOを紹介した。
シミュレーションおよび実ロボットにおけるLeTOの定量的評価を行った。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:04:54 GMT)
CUTECat: Concolic Execution for Computational Law [1.1] コンコリック実行ツール内でのデフォルトロジックの処理方法を示し、Catalaのコンテキストで私たちのアプローチを実装します。
我々は、フランス住宅給付のカタラ実施と米国税法第132条を評価した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:30:23 GMT)
Comparing Three Generations of D-Wave Quantum Annealers for Minor Embedded Combinatorial Optimization Problems [1.1] 我々は3世代にわたるD-Wave量子アニールのベンチマークを報告する。
イジングあるいは等価なQUBOは、これらの問題の定式化は順序の減少のために補助変数を必要としない。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:40:14 GMT)
Predicting Company Growth by Econophysics informed Machine Learning [1.1] 本稿では,企業成長のためのエコノフィックモデルを組み込んだ機械学習に基づく予測フレームワークを提案する。
当社のモデルでは,法をスケールする企業固有の成長メカニズムと,ランダムな要因や個人的意思決定の影響による変動の両面を捉えている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:30:20 GMT)
Deep Autoencoder with SVD-Like Convergence and Flat Minima [1.1] 我々は,コルモゴロフ障壁を克服するために,学習可能な重み付きハイブリッドオートエンコーダを提案する。
トレーニングされたモデルは、他のモデルに比べて何千倍もシャープさが小さいことを実証的に見出した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 00:04:26 GMT)
The Probabilistic Tsetlin Machine: A Novel Approach to Uncertainty Quantification [1.0] 本稿では,不確実性定量化のための堅牢で信頼性の高い,解釈可能なアプローチを実現することを目的とした,確率的テセリンマシン(PTM)フレームワークを提案する。
オリジナルのTMとは異なり、PTMは全ての節にわたって各Tsetlin Automaton(TA)の各状態に留まる確率を学習する。
推論中、TAは学習された確率分布に基づいて状態のサンプリングによって行動を決定する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:20:42 GMT)
Optimizing Travel Itineraries with AI Algorithms in a Microservices Architecture: Balancing Cost, Time, Preferences, and Sustainability [1.0] この研究の目的は、アーキテクチャにおけるAIアルゴリズムの実装が、コスト、時間、ユーザの好み、環境の持続可能性によって、旅行イテナリーをどのように強化するかである。
コスト予測とパーソナライゼーションの両方に機械学習モデル、イテレーションの最適化のための遺伝的アルゴリズム、持続可能性チェックのためのイテレーションを使用する。
実験の結果,1000人の同時ユーザに対して平均4.5秒の応答時間,92%のユーザの選好精度が確認された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:15:56 GMT)
Empirical investigation of multi-source cross-validation in clinical ECG classification [1.0] クロスバリデーション法は、機械学習に基づく臨床予測モデルの精度を推定するために用いられる。
マルチソース環境における標準Kフォールドクロスバリデーションと離脱元クロスバリデーションの系統的評価について述べる。
以上の結果から,K-foldクロスバリデーションは単一ソースデータと複数ソースデータの両方において,新たなソースへの一般化を目標とする場合の予測性能を体系的に過大評価していることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:27:26 GMT)
A Time-Aware Approach to Early Detection of Anorexia: UNSL at eRisk 2024 [0.9] eRisk研究所は、Web上の早期リスク検出に関連する問題に対処することを目的としている。
研究グループは,CPI+DMCアプローチを定義し,両目標を独立に解決し,タイムアウェアアプローチによってタスク2を解決した。
ERDE50測定値とランキングベース測定値で優れた結果を得た結果,ERDE50の問題を解決する上での一貫性を実証した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:30:37 GMT)
1-2-3-Go! Policy Synthesis for Parameterized Markov Decision Processes via Decision-Tree Learning and Generalization [0.9] 特に、パラメータ化されたマルコフ決定過程をインスタンス化するときに状態空間は極端に大きくなる。
我々は,そのような巨大なMDPに対して合理的な政策を得るための学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:57:05 GMT)
E2E-Swin-Unet++: An Enhanced End-to-End Swin-Unet Architecture With Dual Decoders For PTMC Segmentation [0.8] 甲状腺乳頭癌 (PTMC) を効果的に管理し, 患者の不快感を最小限に抑えることは臨床的に重要な課題である。
RFAはPTMC治療に対する手術や放射線治療のより侵襲的な代替手段を提供しており、回復時間の短縮と痛みの軽減が特徴である。
E2E-Swin-Unet++はSwin-Unetアーキテクチャの高度なエンドツーエンド拡張であり、偽PTMCセグメンテーションのリスクを最小限に抑えるために甲状腺領域情報を取り入れている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:33:33 GMT)
A Pipeline for Segmenting and Structuring RGB-D Data for Robotics Applications [0.8] 色と深度(RGB-D)データを分割・構造化するための新しいパイプラインを導入する。
我々のパイプラインはRGB-Dデータを正確なセマンティックマスクに分割できる。
これらのマスクは、生の捕獲された点雲を意味的に分離された点雲に融合するために使用される。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:01:31 GMT)
Exponential Separations between Quantum Learning with and without Purification [0.8] 量子学習タスクでは、量子メモリは、どの単一コピー戦略よりも統計的複雑さが指数関数的に減少する。
また, ターゲット混合状態の浄化にアクセスできることにより, このような指数的還元を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:47:43 GMT)
Polarimetry With Spins in the Solid State [0.8] 半導体系量子コンピュータにおけるスピン読み出しの主機構を偏光測定として再放送する。
我々は、ホウ素アクセプターで穴を交換するシリコン量子ドットを通してスピンで偏光測定を行う。
この研究は、スピンの不整合が量子計算系におけるスピン可読率の基本的な上限をどう設定するかを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:40:08 GMT)
Uncovering the Genetic Basis of Glioblastoma Heterogeneity through Multimodal Analysis of Whole Slide Images and RNA Sequencing Data [0.7] グリオ芽腫は、急速な進行と予後不良を特徴とする、非常に攻撃的な脳腫瘍である。
以上の結果より, グリオ芽腫に関連のある新規遺伝子が同定された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:55:40 GMT)
Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions [0.7] 本稿では,最近発表されたニュースメディアの信頼性評価手法の拡張を提案する。
大規模ニュースメディアハイパーリンクグラフ上での4つの強化学習戦略の分類性能を評価する。
本実験は,2つの難解なバイアス記述子,事実報告と政治的偏見を対象とし,情報源メディアレベルでの大幅な性能向上を示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:18:26 GMT)
Denoising Diffusion Models for Inpainting of Healthy Brain Tissue [0.7] 本論文は,健康な脳組織の局所的合成技術であるBraTS 2023への貢献である。
この課題の課題は、腫瘍組織を脳磁気共鳴(MR)画像の健康な組織に変換することである。
我々は、健康な組織を採取し、再び塗布されることを学ぶスライスを用いて訓練された2Dモデルを使用します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:42:07 GMT)
Using Stochastic Gradient Descent to Smooth Nonconvex Functions: Analysis of Implicit Graduated Optimization [0.7] バッチ降下勾配 (SGD) における雑音は, 目的関数の平滑化の効果を示す。
我々は,学習率とバッチサイズによってスムース化の度合いが変化する新しい累積最適化アルゴリズムを解析する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:40:44 GMT)
Multi-Excitation Projective Simulation with a Many-Body Physics Inspired Inductive Bias [0.7] ハイパーグラフ上の複数の粒子のランダムウォークをチェーンオブ思考とみなす一般化であるMulti-Excitation Project Simulationive (mePS)を導入する。
量子多体物理学で著しく成功した少数体相互作用モデルにインスパイアされた帰納バイアスは、我々の古典的なmePSフレームワークで定式化される。
インダクティブバイアスは指数関数から数値への複雑性を減らし、その指数は相互作用する粒子の数を表す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:39:00 GMT)
Compilation of Trotter-Based Time Evolution for Partially Fault-Tolerant Quantum Computing Architecture [0.6] 2次元ハバードモデルハミルトンの時間発展をシミュレーションする効率的な方法を提案する。
解析の結果, 単純直列コンパイルに比べて10倍以上の高速化が得られた。
物理誤差率が$p_rm phys = 10-4$のデバイスの場合、地上でのエネルギー推定を高速化するためには、およそ6.5倍 104$ の物理量子ビットが必要であると推定する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:07:50 GMT)
A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning [0.6] ツールの使用、計画、フィードバック学習は、現在、LLM(Large Language Model)ベースのエージェントを開発するための3つの重要なパラダイムである。
この調査では、これらのフレームワークを体系的にレビューし、議論するための統合された分類法を導入している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:36:57 GMT)
Extending and Applying Automated HERMES Software Publication Workflows [0.6] HERMESは、リッチメタデータによるソフトウェアの公開を自動化するツールである。
HERMESをエンドユーザとして,非公式なコマンドラインインターフェースと継続的インテグレーションパイプラインのステップの両方で使用する方法を紹介します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:11:48 GMT)
Task Prompt Vectors: Effective Initialization through Multi-Task Soft-Prompt Transfer [0.6] 調律されたソフトプロンプトの重みとランダムな初期化の要素的差分によって生成されるタスクプロンプトベクトルを導入する。
我々は,タスクプロンプトベクトルを低リソース設定で使用して,類似タスクのプロンプトチューニングを効果的に初期化することを示す。
これにより、異なるタスクから事前訓練されたベクトルで即時算術を行うことができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:37:50 GMT)
Zeitenwenden: Detecting changes in the German political discourse [0.6] ドイツの政治情勢は、1871年に最初のドイツ国家が結成されて以来、常に変化してきた。
ドイツ連邦議会の全会期は記録され、過去数年間にわたってデジタル化されている。
トピックモデルLDAの時系列変種を用いて、これらのテキストを分析し、どのイベントが政治談話に持続的な影響を与え、政治トピックが時間とともにどのように変化したかを調べる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:28:53 GMT)
YOLOv11: An Overview of the Key Architectural Enhancements [0.6] 本稿では、オブジェクト検出、インスタンスセグメンテーション、ポーズ推定、オブジェクト指向オブジェクト検出(OBB)など、さまざまなコンピュータビジョンタスクにまたがるYOLOv11の拡張機能について検討する。
本稿では,パラメータ数と精度のトレードオフに着目し,平均精度(mAP)と計算効率の両面からモデルの性能改善を概観する。
我々の研究は、オブジェクト検出の広い視野におけるYOLOv11の位置と、リアルタイムコンピュータビジョンアプリケーションに対する潜在的な影響についての洞察を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:55:22 GMT)
DMTG: A Human-Like Mouse Trajectory Generation Bot Based on Entropy-Controlled Diffusion Networks [0.5] 機械学習は、従来の画像とテキストベースのCAPTCHAを攻撃に対して脆弱にしている。
GeeTestやAkamaiのような現代的なCAPTCHAには、マウスの軌道検出のような行動分析が組み込まれている。
実験では、DMTGは他のモデルと比較してボット検出精度を4.75%-9.73%削減した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:27:30 GMT)
Federated learning with differential privacy and an untrusted aggregator [0.5] モバイルデバイス上でのトレーニングモデルのフェデレーション学習が人気を集めている。
現在のシステムは、モデルの正確性、プライバシー保証、デバイスの効率の間に大きなトレードオフがある。
本稿では,このトレードオフを大幅に改善する新しいフェデレーション学習システムであるAeroについて述べる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:24:09 GMT)
In-Pixel Foreground and Contrast Enhancement Circuits with Customizable Mapping [0.5] 画素内コントラスト強調回路は、画素回路内で直接画像処理を行う。
前景強調モードでは、低強度背景画素をほぼゼロに抑える。
コントラスト強調モードでは、全体のコントラストを改善する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:26:22 GMT)
Acquiring Better Load Estimates by Combining Anomaly and Change Point Detection in Power Grid Time-series Measurements [0.5] 提案手法は,可視データに対する堅牢かつ一般化可能な性能を確保しつつ,解釈可能性の優先順位付けを行う。
その結果, 濾過が適用されない場合に, 洗浄電位が明らかになることが示唆された。
我々の方法論の解釈可能性によって、重要なインフラ計画に特に適しています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:24:50 GMT)
Ranking of Multi-Response Experiment Treatments [0.5] 複数応答実験における最適処理を推定するための確率的ランキングモデルを提案する。
この枠組みでは、治療ランクの点から、まず全体的な最適性を定式化する。
我々は、最適から最小限の最適な理想的な特性から治療を報告できる潜在ランクを推測する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:00:35 GMT)
Improve Value Estimation of Q Function and Reshape Reward with Monte Carlo Tree Search [0.4] 強化学習は、GoやAtariといった完璧な情報ゲームで大きな成功を収めた。
不完全な情報ゲームのための強化学習の研究は、より複雑なゲーム構造とランダム性のために比較的限られている。
本稿では,不完全な情報ゲームであるUnoに着目し,Q値過大評価を減らし,報酬関数を書き換えることにより,これらの問題に対処することを目的とする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:43:03 GMT)
Hybrid Quantum-Classical Reinforcement Learning in Latent Observation Spaces [0.4] 量子機械学習の最近の進歩は、古典的な制御問題に取り組むために量子法を使うことに関心を喚起している。
本稿では,古典的オートエンコーダと量子エージェントを併用して,この次元課題を解決することを提案する。
遅延空間学習法の性能解析のために, 一連の数値実験を設計する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:19:38 GMT)
Integrating Large Language Models for UAV Control in Simulated Environments: A Modular Interaction Approach [0.3] 本研究では,UAV制御における大規模言語モデルの適用について検討する。
UAVが自然言語コマンドを解釈し、応答できるようにすることで、LLMはUAVの制御と使用を簡素化する。
本稿では,自律的な意思決定,動的なミッション計画,状況認識の向上,安全プロトコルの改善など,LCMがUAV技術に影響を与えるいくつかの重要な領域について論じる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:56:53 GMT)
An Ontology-Enabled Approach For User-Centered and Knowledge-Enabled Explanations of AI Systems [0.3] 説明可能性に関する最近の研究は、AIモデルやモデル説明可能性の動作を説明することに重点を置いている。
この論文は、モデルとユーザ中心の説明可能性の間のギャップを埋めようとしている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:03:49 GMT)
KMS states of Information Flow in Directed Brain Synaptic Networks [0.3] 我々は、脳シナプスネットワークのKMS状態が、神経相互作用のグローバルな統計測度をもたらすことを示した。
具体的には、この系のKMS状態が、神経相互作用のグローバル統計測度をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:53:10 GMT)
Assessment of Developmental Dysgraphia Utilising a Display Tablet [0.3] 本研究の目的は,ディスプレイ・スクリーン・タブレットで記録されたオンライン筆跡の定量的分析が発達障害評価(DD)を十分に支援できるかどうかを検討することである。
勾配アルゴリズムに基づく機械学習モデルを用いて、最大83.6%の精度でDD診断をサポートすることができた。
DDの小児は, 空気中の時間が多く, ペン高, 脳卒中高, 空気中のテンポの低下, 角速度の変動が認められた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:24:58 GMT)
MOTIVE: A Drug-Target Interaction Graph For Inductive Link Prediction [0.3] 本稿では,11,000遺伝子と3,600化合物のセルペイント機能を有する形態的cOmpoundターゲット相互作用グラフであるMOTIVEについて紹介する。
我々は、現実的なユースケース下で厳密な評価を可能にするために、ランダムでコールドソース(新薬)とコールドターゲット(新遺伝子)データを分割する。
ベンチマークの結果,Cell Painting機能を用いたグラフニューラルネットワークは,グラフ構造のみから学習したニューラルネットワークよりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:29:28 GMT)
Latent Noise Segmentation: How Neural Noise Leads to the Emergence of Segmentation and Grouping [0.2] 人間は知覚的なグルーピングを使用して、監督なしに画像のセグメント化を積極的に行うことができる。
教師なしの知覚的グループ化を解くための反直感的計算手法を提案する。
現実的な仮定の下では、ニューラルノイズは互いに物体を分離するのに有効であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:56:02 GMT)
Stable generative modeling using Schrödinger bridges [0.2] 本稿では,Schr"odinger BridgesとLangevin dynamicsを組み合わせた生成モデルを提案する。
我々のフレームワークは自然に条件付きサンプルを生成し、ベイズ推論問題に拡張することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:19:16 GMT)
Entity-based Reinforcement Learning for Autonomous Cyber Defence [0.2] 自律的なサイバー防衛の鍵となる課題は、防御エージェントが様々なネットワークトポロジや構成をまたいで一般化する能力を確保することである。
深層強化学習への標準的アプローチは、一定の大きさの観測と行動空間を期待する。
自律型サイバー防衛では、訓練対象と異なるネットワークトポロジを持つ環境に一般化するエージェントを開発することが困難になる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:04:12 GMT)
Leveraging Deep Learning for Time Series Extrinsic Regression in predicting photometric metallicity of Fundamental-mode RR Lyrae Stars [0.2] 我々はガイア光Gバンドの光曲線から基本モード(ab型)RRリレー星の金属度を推定する新しい手法を開発した。
我々のディープラーニングモデルは、平均絶対誤差(MAE)が0.0565である顕著な予測性能を示した。
我々の研究は、天文学研究における深層学習の重要性を、特にガイアのようなミッションからの大規模なデータセットで浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:26:35 GMT)
Advancing Network Security: A Comprehensive Testbed and Dataset for Machine Learning-Based Intrusion Detection [0.2] 私たちのTestbedは、機械学習ベースのネットワーク実験のための、ネットワークトラフィックを生成するための高度なプラットフォームとして機能します。
このTestbedを利用することで、地上の真理性を完全に満たす小さな悪意のあるネットワークトラフィックデータセットを公開します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:58:10 GMT)
VISAGE: Video Synthesis using Action Graphs for Surgery [0.2] 腹腔鏡下手術における映像生成の新しい課題について紹介する。
提案手法であるVISAGEは,アクションシーングラフのパワーを利用して,腹腔鏡下手術のシーケンシャルな特徴を捉える。
腹腔鏡下手術における高忠実度ビデオ生成について検討した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:28:17 GMT)
Non-Hermitian Hamiltonian Approach for Two-Dimensional Spectroscopy [0.2] 非エルミートハミルトニアン法(NHH)と応答関数形式の比較を行う。
NHH法は緩和を過大評価するが、より包括的な記述を提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:46:46 GMT)
SpeakGer: A meta-data enriched speech corpus of German state and federal parliaments [0.1] SpeakGerデータセットは、1947年から2023年までのドイツ連邦議会とドイツ連邦議会の16州すべてからの議論で構成されている。
このデータセットには、聴衆からのスピーチに対する反応と、講演者のパーティー、年齢、選挙区、政党の政治的アライメントに関する情報という形で、豊富なメタデータが含まれている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:00:48 GMT)
Neuropsychology and Explainability of AI: A Distributional Approach to the Relationship Between Activation Similarity of Neural Categories in Synthetic Cognition [0.1] 本稿では,人間の認知トークンの概念を応用した,人工ニューラルネットワークの説明可能性へのアプローチを提案する。
ニューロンが生成するカテゴリセグメントは、実際には入力ベクトル空間内のカテゴリサブ次元の重ね合わせの結果であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:27:09 GMT)
Beyond Backpropagation: Optimization with Multi-Tangent Forward Gradients [0.1] 前向き勾配は、前方モード自動微分によって計算されたランダム接線に沿った方向微分からの勾配を近似するアプローチである。
本稿では,マルチタングルト前方勾配の詳細な解析を行い,プロジェクションに基づく複数の接点からの前方勾配を組み合わせるための改良されたアプローチを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:02:59 GMT)
Subsystem Evolution Speed as Indicator of Relaxation [0.1] サブシステムの進化速度に着目し,時間依存状態から直接緩和を評価する方法を提案する。
緩和に達するシステムでは、システムサイズが大きくなるにつれて、十分に小さくても有限サイズのサブシステムの進化速度が顕著に低下することを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:58:34 GMT)
regAL: Python Package for Active Learning of Regression Problems [0.0] PythonパッケージregALでは、レグレッション問題に対するさまざまなアクティブな学習戦略を評価することができる。
我々は,レグレッション問題に対する様々なアクティブ学習戦略を評価することができるPythonパッケージregALを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:34:36 GMT)
What resources do agents need to acquire knowledge in Quantum Thermodynamics? [0.0] 我々は、エージェントがアクセスするリソースを考慮するために、量子知識を取得するための既知のユニタリモデルを拡張します。
このフレームワークは粗粒のPOVMのユニタリ表現であり、熱力学と状態推定を結合する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:00:00 GMT)
Universal quantum processors in spin systems via robust local pulse sequences [0.0] 長距離相互作用を持つスピン系における量子シミュレーションと計算を実現するためのプロトコルを提案する。
我々のアプローチは、ウォルシュ関数によってパラメトリケートされた外部場を持つ単一スピンの局所アドレッシングに依存する。
我々は、スピンモデル、量子エラー補正、量子最適化アルゴリズムの力学の例を用いて、我々のプロトコルを実証し、数値的にベンチマークする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:42:11 GMT)
Universal Entanglement Revival of Topological Origin [0.0] 我々は散逸性フェルミオンおよびボゾン性Su-Schrieffer-Heeger(SSH)モデルにおける絡み合いのダイナミクスを解析した。
デコヒーレンスチャネルがキラル対称性を保存すると、幅広いパラメータの絡み合いが復活する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:10:33 GMT)
Univariate Conditional Variational Autoencoder for Morphogenic Patterns Design in Frontal Polymerization-Based Manufacturing [0.0] 本稿では,FP製造における階層パターンの逆設計のための新しい確率的生成モデルを提案する。
設計空間と設計ターゲットの両方を符号化するcVAEとは異なり、UcVAEは設計空間のみを符号化する。
トレーニングされたUcVAEは、高忠実度階層パターンを生成する複数のプロセス条件ソリューションを生成することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:50:05 GMT)
Unified Microphone Conversion: Many-to-Many Device Mapping via Feature-wise Linear Modulation [0.0] 本稿では,デバイス変動に対する音響イベント分類システムのレジリエンスを高めるための統合生成フレームワークを提案する。
提案手法は最先端の手法を2.6%向上させ, マクロ平均F1スコアの変動率を0.8%低減する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:10:09 GMT)
Ultratight confinement of atoms in a Rydberg empowered optical lattice [0.0] 本稿では,サブ波長空間構造を持つ原子型光学格子の創出について述べる。
このポテンシャルは、3レベルリドベルク配位原子の非線形光学応答を利用して生成される。
これらの超狭トラップ技術の開発は、Rydberg-Fermiゲート、アトムトロニクス、量子ウォーク、Hubbardモデル、中立原子量子シミュレーションなどの応用に大いに期待できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:59:03 GMT)
UCB Exploration for Fixed-Budget Bayesian Best Arm Identification [0.0] 固定予算設定におけるベストアーム識別(BAI)について検討した。
ベイズ条件下での固定予算BAI問題に対して理論的かつ実験的に効率的であるUPB探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:44:21 GMT)
UCB Exploration for Fixed-Budget Bayesian Best Arm Identification [0.0] 固定予算設定におけるベストアーム識別(BAI)について検討した。
ベイズ条件下での固定予算BAI問題に対して理論的かつ実験的に効率的であるUPB探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 05:44:21 GMT)
Transformer models as an efficient replacement for statistical test suites to evaluate the quality of random numbers [0.0] 我々は,複数のNIST STSテストを一度に実行し,より高速に実行するディープラーニングモデルを提案する。
このモデルでは,これらの統計的試験に合格して,複数ラベルの分類結果を出力する。
また,このモデルと従来の深層学習法を比較し,そのモデルが類似した性能を示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:18:14 GMT)
Towards Active Participant-Centric Vertical Federated Learning: Some Representations May Be All You Need [0.0] VFL(Vertical Federated Learning)に新たなシンプルなアプローチを導入する。
Active Participant-Centric VFLは、アクティブな参加者が非協力的な方法で推論を行うことを可能にする。
この方法は、教師なし表現学習と知識蒸留を統合し、従来のVFL法に匹敵する精度を実現する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:07:00 GMT)
Topological frequency conversion in rhombohedral multilayer graphene [0.0] ロンボヘドラル多層グラフェンは 位相周波数変換をサポートする
ベルナール二層グラフェンは, 消散率の低いため, THzスケールの用途に最も有望であることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:59:33 GMT)
Time evolution in quantum mechanics with a minimal time scale [0.0] 最小測定可能な時間スケールを示す量子論を示す。
我々はPage-Wootters形式を用いて量子系の時間発展を記述する。
最小時間スケールでは、格子上の時間発展を記述する離散シュロディンガー方程式を導入することもできる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:11:50 GMT)
Time Matters: Scaling Laws for Any Budget [0.0] FLOPに基づく一般的な時間推定は低い推定値であることを示す。
メモリコピーに基づくより正確なプロキシを構築する。
これにより、トランスモデルのトレーニング速度を正確に見積もることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:56:39 GMT)
The Web unpacked: a quantitative analysis of global Web usage [0.0] ウェブトラフィックの総量を推定し、ドメインおよび産業セクター間でのウェブトラフィックの分布を調査する。
分析の結果,Webトラフィックが著しく集中していることが判明した。
トラフィックの大部分は営利目的のウェブサイトだが、ほとんどが無料のウェブサイトに流れており、有料の壁をベースとしないビジネスモデルの優位性を強調している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:00:38 GMT)
The Representation Jensen-Shannon Divergence [0.0] 確率分布の違いの定量化は機械学習において重要である。
本研究は,従来のジェンセン・シャノン発散に触発された新しい尺度であるジェンセン・シャノン発散(RJSD)の表現を提案する。
本研究は, RJSDが2サンプル試験, 分散シフト検出, 教師なし領域適応において優れていることを示すものである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:39:31 GMT)
The Impact of Knowledge Silos on Responsible AI Practices in Journalism [0.0] この研究は、ジャーナリズムにおける責任あるAIプラクティスの採用に、知識サイロがどう影響するか、そしてそのようにすることを目的としている。
De Telegraaf, de Volkskrant, the Nederlandse Omroep Stichting, RTL Nederlandで14回の半構造化インタビューを行った。
我々の結果は、ニュース組織のすべての層にまたがって、AIに関する情報を共有するためのより良い構造を構築することの重要性を強調します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:58:38 GMT)
Testing local realistic hidden-variable theories without inequalities [0.0] 相関関数の非等式は含まないが,相関関数の直接比較を行う。
これは、従来の不等式とは異なる結果が反実的推論を伴わないことを意味する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:31:55 GMT)
Systematic teaching of UML and behavioral diagrams [0.0] 本稿では,図を作成するために必要なスキルの体系的獲得について論じる。
より特異な質問タイプは、画像アノテーションに関する質問など、画像に関連している。
実証されたすべての演習は、デジタルと手書きのトレーニングと試験の両方に適しています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:18:54 GMT)
StockGPT: A GenAI Model for Stock Prediction and Trading [0.0] 本稿では,100年近くにわたって米国株の7千万株に対して,自己回帰数モデルであるStockGPTを紹介した。
StockGPTは、各リターンシリーズをトークンのシーケンスとして扱うことで、将来のリターンを予測する隠されたパターンを自動的に学習する。
2001年から2023年までの維持試験では、StockGPT予測による日毎および月毎のリバランスロングショートポートフォリオが強いパフォーマンスをもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:28:45 GMT)
Simultaneous Dimensionality Reduction for Extracting Useful Representations of Large Empirical Multimodal Datasets [0.0] 我々は,高次元データから低次元記述を得る手段として,次元減少の科学に焦点をあてる。
我々は,システム内の複雑な相互作用や高次元力学系など,従来の仮定に反する実世界のデータによって引き起こされる課題に対処する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:27:40 GMT)
Self-training Language Models for Arithmetic Reasoning [0.0] 我々は、新しいデータなしでモデルの推論能力を改善する可能性を探る。
モデルは単一ラウンド(オフライン)とオンラインの自己学習の両方で大幅に改善できることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:43:02 GMT)
Self-training Language Models for Arithmetic Reasoning [0.0] 我々は、新しいデータなしでモデルの推論能力を改善する可能性を探る。
モデルは単一ラウンド(オフライン)とオンラインの自己学習の両方で大幅に改善できることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:43:02 GMT)
Self-consistency, relativism and many-particle system [0.0] 自己整合性、相対論、多粒子系の相互関係を考察する。
論文は、位相空間における準密度確率の時間独立関数を持つ量子系は、電磁波を放出することができないことを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:51:13 GMT)
Self-Supervised Learning for Time Series: A Review & Critique of FITS [0.0] 最近提案されたモデルFITSは、パラメータ数を大幅に削減した競合性能を主張する。
複雑な周波数領域で1層ニューラルネットワークをトレーニングすることで、これらの結果を再現することができる。
実験の結果,FITSは特に周期パターンや季節パターンの捕集に優れるが,トレンド,非周期的,ランダムな組立行動に苦慮していることがわかった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:03:09 GMT)
Selective continuous-variable quantum process tomography [0.0] 本稿では,連続可変量子プロセストモグラフィーのためのプロトコルを提案する。
本稿では,このプロトコルを用いて,連続変数の量子過程を部分的に再構成し,数値シミュレーションで再現する方法について述べる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:49:32 GMT)
Securing Stack Smashing Protection in WebAssembly Applications [0.0] これまでの研究によると、WebAssemblyは効果的な保護メカニズムが欠如しているため、バッファオーバーフローに対して脆弱である。
WebAssemblyスタンドアロンランタイムにおけるStack Smashing Protection(SSP)の実装を評価し、現在の実装における2つの弱点を明らかにする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:41:59 GMT)
SJMalloc: the security-conscious, fast, thread-safe and memory-efficient heap allocator [0.0] ヒープベースのエクスプロイトは、アプリケーションのセキュリティに重大な脅威をもたらす。
強化アロケータは現実世界のアプリケーションでは広く採用されていない。
SJMallocは、ヒープ上のアプリケーションのデータから離れて、そのメタデータを帯域外で保存する。
SJMallocは、GLibcsアロケータに比べて6%パフォーマンスが向上し、わずか5%のメモリしか使用していない。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:47:12 GMT)
RotCAtt-TransUNet++: Novel Deep Neural Network for Sophisticated Cardiac Segmentation [0.0] 本稿では、複雑な心構造の堅牢なセグメンテーションに適した新しいアーキテクチャであるRotCAtt-TransUNet++を提案する。
提案手法では,エンコーダ内のネストスキップ接続でマルチスケール機能を集約することで,グローバルコンテキストのモデリングを強調する。
実験の結果,提案モデルでは,4つの心的データセットと1つの腹部的データセットにまたがる既存のSOTAアプローチよりも優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:41:51 GMT)
Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors [0.0] そこで本研究では、ミスや測定誤差データに適用するために、チューニングパラメータを持つ指数損失関数を提案する。
逆確率重み付けと加算度エラーモデルを用いて、欠落データや測定誤差に対処する。
乳癌のデータセットを用いて本症例を検証した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:10:39 GMT)
Real-Time Weapon Detection Using YOLOv8 for Enhanced Safety [0.0] このモデルは、様々な種類の銃器とエッジ武器を描いた何千もの画像を含む包括的なデータセットで訓練された。
精度,リコール,F1スコア,平均平均平均精度(mAP)を複数のIoU閾値で比較し,モデルの性能評価を行った。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:35:51 GMT)
Real time anomalies detection on video [0.0] 本稿では,この問題を解決するためのディープラーニングアプローチを提案する。
このアプローチでは、畳み込みモデル(CNN)を使用して、映像に関連する特徴を抽出する。
これらの特性はLSTM/GRUモデルによって解析される時系列を形成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:25:26 GMT)
Quantum many-body scars as remnants of stable many-body periodic orbits [0.0] 量子多体傷(Quantum many-body scars, QMBS)は、閉量子系における熱化の一般的なシナリオを否定する弱いエルゴード性破壊現象である。
多数のフレーバーを持つボソニックモデルを研究することによって、予想に反例を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:11:00 GMT)
Quantum linear system algorithm with optimal queries to initial state preparation [0.0] 線形システムの量子アルゴリズムは、2つのオラクルを問合せして解状態$A-1|brangle$を生成する。
本稿では,$mathbfThetaleft (1/sqrtpright)$クエリを$O_b$に変換する量子線形系アルゴリズムを提案する。
微分方程式の解法のような様々な応用において、ブロックプレコンディショニングスキームを用いて$p$への依存をさらに改善することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:00:01 GMT)
Quantum equations of motion and the geometrical imperative II: relativistic [0.0] ミンコフスキー計量の平方根をディラック/クリフォード行列を用いて抽出する。
結果の4分の4の演算子 4$ は平方根を表す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:20:10 GMT)
Quantum correlations of the photon fields in a waveguide quantum electrodynamics [0.0] 2レベル原子上の単一光子パルスの散乱に対する第1次および第2次光子相関関数を計算する。
マルコフ近似の中では、正の周波数電場を持つ量子作用素の解析式が見つかる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:36:19 GMT)
Quantum Transport Straintronics and Mechanical Aharonov-Bohm Effect in Quasi-metallic SWCNTs [0.0] 単層カーボンナノチューブ(SWCNT)は、原子的に精密なエッジを持つ2次元材料の効果的に狭いリボンである。
それらの大きなサブバンドエネルギー間隔は、単一の量子輸送チャネルを持つトランジスタに繋がる。
準金属-SWCNTトランジスタにおけるQTSの研究に応用モデルを適用した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:37:31 GMT)
Quantum Probability Geometrically Realized in Projective Space [0.0] 本稿では、与えられた量子系の複素ヒルベルト空間に関連する射影空間に全ての量子確率公式を渡すことを目的とする。
アップショットは、量子論は射影部分空間の確率論であり、または同等に、量子事象の確率論であるということである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 20:29:15 GMT)
Quantum Computing Education in Latin America: Experiences and Strategies [0.0] 量子コンピューティングは、資格を持つ専門家の不足に直面している急速に進歩している分野である。
ラテンアメリカでは、量子教育が初期段階にあり、地域の才能格差が悪化している。
本研究は,コロンビア国立大学における量子コンピューティングと人工知能の研究グループによる,量子コンピューティングを高等教育に統合する取り組みを紹介するものである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:32:43 GMT)
Quantized two terminal conductance, edge states and current patterns in an open geometry 2-dimensional Chern insulator [0.0] 2次元トポロジカルシステムにおける2つの端子コンダクタンスの量子化はランダウアー・ブッティカー(Landauer-Buttiker, LB)理論によって正当化される。
電流は導体と絶縁体の両方に局在しており、絶縁体は角付近で入退する。
量子化された2末端伝導は、興味深い有限サイズ効果と系-貯留層結合への依存性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:37:14 GMT)
Population stratification for prediction of mortality in post-AKI patients [0.0] 急性腎障害(AKI)は、入院患者の20%に影響を及ぼす重篤な臨床疾患である。
患者のリスクと医療費は、予測モデルと機械学習に基づくフォローアップ計画によって最小化できる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:36:23 GMT)
P1-KAN an effective Kolmogorov Arnold Network for function approximation [0.0] 新しいコルモゴロフ・アルノルドネットワーク(KAN)は、高次元の潜在的不規則関数を近似するために提案されている。
精度で多層パーセプトロンより優れ、収束が速いことを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:05:11 GMT)
P1-KAN an effective Kolmogorov Arnold Network for function approximation [0.0] 新しいコルモゴロフ・アルノルドネットワーク(KAN)は、高次元の潜在的不規則関数を近似するために提案されている。
精度で多層パーセプトロンより優れ、収束が速いことを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 06:05:11 GMT)
Optimizing the role of human evaluation in LLM-based spoken document summarization systems [0.0] 生成AIコンテンツに適した音声文書要約のための評価パラダイムを提案する。
実験設計における堅牢性, 再現性, 信頼性を確保するために, 詳細な評価基準とベストプラクティスガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:37:14 GMT)
Optimizing Load Scheduling in Power Grids Using Reinforcement Learning and Markov Decision Processes [0.0] 本稿では,動的負荷スケジューリングの課題に対処する強化学習(RL)手法を提案する。
提案手法は実時間負荷スケジューリングのためのロバストでスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:16:22 GMT)
On the explainability of quantum neural networks based on variational quantum circuits [0.0] リッジ関数は、ニューラルネットワークによって行われる近似の下限を記述し、研究するために用いられる。
変動量子回路に基づく量子ニューラルネットワークは、リッジ関数の線形結合として記述できることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:31:03 GMT)
New Insight in Cervical Cancer Diagnosis Using Convolution Neural Network Architecture [0.0] 畳み込みニューラルネットワーク(CNN)モデルにおける右の選択は、画像分類におけるCNNの成功の鍵となる。
本研究は, 頚部癌スミア画像の分類に, 勾配降下(SGD), RMSprop, Adam, AdaGrad, AdaDelta, Adamax, Nadamsを用いた。
実験結果から,すべてのCNNおよび最適化手法において,転送学習モデルの性能が向上することが結論された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:11:39 GMT)
Music102: An $D_{12}$-equivariant transformer for chord progression accompaniment [0.0] Music102は、D12等価変圧器によるコード進行伴奏を強化する。
先行する音楽知識を符号化することにより、モデルはメロディとコードシーケンスの双方で等価性を維持する。
この研究は、離散音楽領域への自己注意機構と層正規化の適応性を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 03:11:01 GMT)
Melody Construction for Persian lyrics using LSTM recurrent neural networks [0.0] 歌詞の音節とメロディの間には音韻的相関があることが推定された。
この仮定を調査するためにSeq2seqニューラルネットワークを開発した。
ペルシャの歌のパラレル音節と音節列で訓練され、新しい音節列のための快楽な旋律が提案された。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:11:44 GMT)
Measuring individual semantic networks: A simulation study [0.0] 本研究では,個別のセマンティックネットワークの推定に基づく心理測定特性を調査するリカバリシミュレーションを行う。
以上の結果から,セマンティックネットワークの推論成功は達成可能であるが,同時に重要な課題も浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:40:44 GMT)
Locating Information in Large Language Models via Random Matrix Theory [0.0] 我々は,事前学習した変換器モデルBERTとLlamaの重量行列を解析した。
訓練後に偏差が出現し モデル内の学習された構造が特定できます
その結果、微調整後、小さな特異値がモデルの能力に重要な役割を果たすことが明らかとなった。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:19:08 GMT)
Lissajous dynamics of a quantum particle in a tilted two-dimensional discrete lattice [0.0] 離散2次元傾斜格子における単一粒子の量子力学を解析する。
格子のパラメータと粒子の初期状態がどのように調整され、進化の過程で確率分布がその形状を変えることはないかを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:20:58 GMT)
Learning a quantum computer's capability [0.0] 本稿では,量子コンピュータの能力のスケーラブルな予測モデルを効率的に構築するハードウェアに依存しない手法を提案する。
我々のCNNベースのアプローチは、回路を3次元テンソルとして効率的に表現し、CNNを用いてその成功率を予測する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:03:19 GMT)
Latent Structures of Intertextuality in French Fiction [0.0] 本稿では、計算文学研究の分野が、テクスチュアリティの研究を行う上で理想的な場所であると論じる。
我々は18世紀、19世紀、20世紀初頭の12万以上のフランスのフィクションのコーパスについて紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:50:40 GMT)
Kenyan Sign Language (KSL) Dataset: Using Artificial Intelligence (AI) in Bridging Communication Barrier among the Deaf Learners [0.0] ケニア手話(Kenyan Sign Language、KSL)は、ケニアの聴覚障害者コミュニティで使われている言語である。
本研究の目的は、英語をKSLに変換するAI支援技術データセットを開発することである。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 22:01:31 GMT)
Introduction to quantum entanglement in many-body systems [0.0] この章の目的は、多部構成のシナリオに特に重点を置いて、このトピックについて教育的な紹介を行うことである。
まず、絡み合い理論から必要な数学的ツールと基本的な概念を提供することから始める。
次に、テンソル・ネットワーク状態や対称状態のような凝縮マター理論に有用な様々な絡み合い構造に着目する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:00:18 GMT)
Interplay between the Hilbert-space dimension of a control system and the memory induced by a quantum SWITCH [0.0] 制御系のヒルベルト空間次元の増大が量子SWITCHの性能に及ぼす影響について検討する。
制御系のヒルベルト空間次元の増大は、それによって引き起こされる非マルコフ記憶の増大につながることを観察する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:43:17 GMT)
Infinite Width Models That Work: Why Feature Learning Doesn't Matter as Much as You Think [0.0] 無限幅NTKでは特徴学習が不要であることを示す。
また,NTKは,機能学習を人工的に無効にしても,従来の有限モデルよりも性能が低いことを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:08:50 GMT)
Incremental Learning of Affordances using Markov Logic Networks [0.0] Affordancesは、ロボットが周囲のセマンティックな理解を行えるようにする。
MLN-CLAは、知識を保持し、変化した知識のみを更新し、MLNを再訓練することで、様々な知識領域における新しい関係を学習する。
MLN-CLAは蓄積学習やゼロショット推論に有効であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:29:30 GMT)
Impact of Knowledge Silos on Responsible AI Practices in Journalism [0.0] この研究は、ジャーナリズムにおける責任あるAIプラクティスの採用に、知識サイロがどう影響するか、そしてそのようにすることを目的としている。
De Telegraaf, de Volkskrant, the Nederlandse Omroep Stichting, RTL Nederlandで14回の半構造化インタビューを行った。
我々の結果は、ニュース組織のすべての層にまたがって、AIに関する情報を共有するためのより良い構造を構築することの重要性を強調します。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:58:38 GMT)
Identifiable Representation and Model Learning for Latent Dynamic Systems [0.0] 本稿では,潜在力学系における表現とモデル学習の問題について検討する。
線形あるいはアフィン非線形潜在力学系に対して、スケーリングまでの表現を同定し、いくつかの単純な変換までモデルを決定できることを証明した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:55:42 GMT)
Hypergraph Neural Networks Reveal Spatial Domains from Single-cell Transcriptomics Data [0.0] 空間的クラスタリングは、組織サンプルを細胞の様々なサブ集団に分類するために重要である。
ILISIスコアは,他の手法と比較して1.843と高い結果が得られた。
我々のモデルは下流クラスタリングにおいて他の手法よりも優れており、最高ARI値は0.51、スコアは0.60である。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:32:50 GMT)
Hidden variable theory for non-relativistic QED: the critical role of selection rules [0.0] 非相対論的量子電磁力学と相反する隠れ変数理論を提案する。
本手法では,定常状態の占有に関する命題を記述するために,論理変数を導入する。
これは、個々の試行の本質的な性質をうまく記述している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 23:25:53 GMT)
Generalized Extended Uncertainty Principles, Liouville theorem and density of states: Snyder-de Sitter and Yang models [0.0] 一般化不確実性原理(GUP)と拡張不確実性原理(EUP)は、小・大距離で量子重力効果を導入する。
GUPとEUPの組み合わせにより、一般拡張不確実性原理(GEUPまたはEGUP)は、座標とモータの両方に非可換性を導入することでこれらの修正をさらに一般化する。
本稿では,GEUPが統計物理学におけるリウヴィルの定理および非相対論的量子力学の枠組みにおける状態密度に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:56:12 GMT)
Generalizations across filler-gap dependencies in neural language models [0.0] 人間は有限入力から構造的一般化を行うことで文法を発達させる。
多様な表面形状に拘わらず、構造的一般化を共有するフィラーギャップ依存性が、入力からどのように生じるのかを問う。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:04:42 GMT)
GameLabel-10K: Collecting Image Preference Data Through Mobile Game Crowdsourcing [0.0] 本研究は,ゲーム内通貨に報いる有償アノテータをゲームプレイヤに置き換えることによるパフォーマンス向上の可能性を検討する。
私たちはモバイルの歴史戦略ゲーム、Armchair Commanderの開発者と協力して、このアイデアを試しています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:55:22 GMT)
GameLabel-10K: Collecting Image Preference Data Through Mobile Game Crowdsourcing [0.0] 本研究は,ゲーム内通貨に報いる有償アノテータをゲームプレイヤに置き換えることによるパフォーマンス向上の可能性を検討する。
私たちはモバイルの歴史戦略ゲーム、Armchair Commanderの開発者と協力して、このアイデアを試しています。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:55:22 GMT)
Future Token Prediction -- Causal Language Modelling with Per-Token Semantic State Vector for Multi-Token Prediction [0.0] 本研究では,Future Token Prediction(FTP)と呼ばれる事前学習手法について検討する。
FTPは、擬似シーケンスに線形かつ拡張的に投影される各トークン位置の埋め込みベクトルを生成する。
プログラミングの問題として、FTPネットワークはGPTネットワークよりもはるかに優れた結果をもたらす。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:50:15 GMT)
From PDFs to Structured Data: Utilizing LLM Analysis in Sports Database Management [0.0] 本研究では,PDF文書から構造化形式への半構造化データ処理におけるLarge Language Models(LLMs)の有効性について検討した。
我々は,OpenAI の GPT-4 と Anthropic の Claude 3 Opus モデルを用いたAI 支援手法を開発し,評価した。
このシステムは自動処理で90%の成功率に達し、エラーのない72ファイル中65ファイルの処理に成功し、7900行以上のデータを変換した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:17:31 GMT)
From Keywords to Structured Summaries: Streamlining Scholarly Information Access [0.0] 本稿では,科学コミュニティにおける情報検索(IR)エンジンの重要性の高まりについて述べる。
出版物の量が増えているため、従来のキーワードベースの検索エンジンの非効率性に対処する。
提案するソリューションには、構造化されたレコード、視覚化ダッシュボードを含む高度な情報技術(IT)ツールの基盤となるものが含まれる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:06:10 GMT)
Fragile spin liquid in three dimensions [0.0] 古典的ハイゼンベルク模型の基礎状態をその直線グラフ、トリリン格子上で研究する。
このネットワークは、最近提案された脆弱なスピン液体の概念を3次元で実現している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:51:11 GMT)
Floquet-Lindblad Master Equation Approach to Open Quantum System Dynamics [0.0] FLiMEFloと呼ばれる新しい解法が展示され、これは周期的(鍵型)ハミルトニアンに適している。
FloiMEは、他の解法よりも高速で高精度でありながら、時間周期システムを効率的かつ正確にシミュレートすることができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:19:04 GMT)
Feature Learning in Attention Mechanisms Is More Compact and Stable Than in Convolution [0.0] 注意がよりコンパクトで安定した方法でデータを処理することを示す。
トポロジカルデータ解析を用いた実験により,本研究の妥当性を検証した。
視覚変換器(ViTs)とResNetsとの比較により,ViTsの出力分散は高いが,特徴学習はResNetsよりも安定であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 07:44:14 GMT)
Feature Homomorphism -- A Cryptographic Scheme For Data Verification Under Ciphertext-Only Conditions [0.0] 本稿では、新しいタイプの準同型:特徴準同型を提案する。
この機能に基づいて、暗号文のみの条件下でのデータ検証のための暗号スキームを導入する。
提案手法は,本論文で概説した要件を満たすアルゴリズム群を設計することを含む。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:52:58 GMT)
Fast and interpretable electricity consumption scenario generation for individual consumers [0.0] 予測クラスタリング木(PCT)に基づく高速かつ解釈可能なシナリオ生成手法を提案する。
提案手法は, トレーニングや予測において, 少なくとも7倍の精度で, 最先端の時系列を生成する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:41:58 GMT)
Evaluating 21st Century Skills Development through Makerspace Workshops in Computer Science Education [0.0] 本研究は,メーカースペースワークショップをコンピュータサイエンス教育に組み込むことの有効性を評価する。
本研究は,メーカースペース活動が学生のスキル開発に与える影響を定量化する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:47:48 GMT)
Escaping the Forest: Sparse Interpretable Neural Networks for Tabular Data [0.0] 我々のモデルであるSparse TABular NET や sTAB-Net がツリーベースモデルよりも効果的であることを示す。
SHAPのようなポストホックメソッドよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:50:07 GMT)
Enhancing literature review with LLM and NLP methods. Algorithmic trading case [0.0] 本研究では,機械学習アルゴリズムを用いて,アルゴリズム取引分野の知識を分析し,整理する。
1956年から2020年の第1四半期にかけて、1億3600万件の研究論文のデータセットをフィルタリングして14,342件の関連記事を特定した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 13:37:27 GMT)
Enhancing Enterprise Security with Zero Trust Architecture [0.0] Zero Trust Architecture (ZTA) は、現代のサイバーセキュリティに対する変革的なアプローチである。
ZTAは、ユーザ、デバイス、システムがデフォルトで信頼できないことを前提として、セキュリティパラダイムをシフトする。
本稿では、アイデンティティとアクセス管理(IAM)、マイクロセグメンテーション、継続的監視、行動分析など、ZTAの重要なコンポーネントについて検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:53:16 GMT)
Enhancement of Approximation Spaces by the Use of Primals and Neighborhood [0.0] 近隣と原始」からのインスピレーションを引き出す4つの新しい一般化された粗集合モデルを導入する。
我々は、現在のモデルは、粗い集合モデルに関連するほとんどすべての重要な側面を保存できると主張している。
また、我々の日常的な健康に関する問題に対して定義する新たな戦略が、より正確な発見をもたらすことも示している。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:49:13 GMT)
Enhanced Gaussian interferometric power, entanglement and Gaussian quantum steering in magnonics system with squeezed light [0.0] 本稿では,三部系マグノン系における2つのマグノン間の量子相関性を改善する手法を提案する。
本稿では, スクイーズパラメータと光パラメトリック増幅器によるQCの増強について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:31:44 GMT)
Emotion Recognition with Facial Attention and Objective Activation Functions [0.0] 本稿では,VGGNet,ResNet,ResNetV2などの既存のCNNビジョンベースモデルに対して,SEN-Net,ECA-Net,CBAMの注意機構を導入する。
これらのモデルの性能を著しく向上させることができるだけでなく、異なるアクティベーション関数と組み合わせることで、これらのモデルの性能をさらに向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 10:14:37 GMT)
Do LLMs Have Political Correctness? Analyzing Ethical Biases and Jailbreak Vulnerabilities in AI Systems [0.0] 我々は,PCJailbreakの概念を導入し,これらの安全性に起因したバイアスによって引き起こされる固有のリスクを強調した。
生成前に防御プロンプトを注入することでジェイルブレイクを防ぎ,効率的な防御手法であるPCDefenseを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:15:52 GMT)
Disjointness Violations in Wikidata [0.0] ウィキデータにおける解離の現在のモデル化について分析する。
我々は、SPARQLクエリを使用して、不一致違反の原因となる各犯人を特定し、矛盾する情報を特定し、修正するための公式をレイアウトする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:12:05 GMT)
Discovery of Quasi-Integrable Equations from traveling-wave data using the Physics-Informed Neural Networks [0.0] PINNは2+1次元非線形偏微分方程式の渦解の研究に用いられる。
保存法則(cPINN)、初期プロファイルの変形、および識別の解像度を改善するための摩擦アプローチを考察する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 08:29:13 GMT)
Dicke State Generation and Extreme Spin Squeezing via Rapid Adiabatic Passage [0.0] そこで我々は,Dicke状態に基づく高速断熱通路方式を提案する。
この方法により、多原子系のディック状態は最大量子フィッシャー情報で絡み合った状態に駆動することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 21:47:29 GMT)
Deep learning for model correction of dynamical systems with data scarcity [0.0] 本稿では,少ない高忠実度データセットのみを用いて,既存の力学系モデルを修正するためのディープラーニングフレームワークを提案する。
我々は、高忠実度データの量が非常に小さく、既存のデータ駆動モデリング手法のほとんどを適用できない場合に焦点を当てる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:33:11 GMT)
Deep Learning for Active Region Classification: A Systematic Study from Convolutional Neural Networks to Vision Transformers [0.0] 太陽活動領域は、太陽の地球環境を著しく破壊し、太陽フレアやコロナ質量放出のような厳しい宇宙天気の原因となる。
本研究は,Mt. Wilson分類法に基づく活動領域カットアウトの分類における深層学習手法の適用に関して,本研究の結果について述べる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 12:19:12 GMT)
Decoherence of spin superposition state caused by a quantum electromagnetic field [0.0] 本研究では、ミンコフスキー時空における量子電磁場の存在下で、空間的に重畳された電気的中性スピン-$frac12$粒子のデコヒーレンスについて検討する。
スピン磁場結合によるデコヒーレンスを, 重畳軌道の各分岐に沿った2点相関関数から生じる局所的デコヒーレンスと, 重畳軌道間の相関関数から生じる非局所的デコヒーレンスに分類できることを示した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 01:56:23 GMT)
Cooling limits of coherent refrigerators [0.0] 量子系は、コヒーレント仮想量子ビットを用いることで、既存の非コヒーレント冷却境界以下で冷却可能であることを示す。
我々は、普遍的なコヒーレント冷却限界を導出し、それらに到達するための特定のプロトコルを導入する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:09:13 GMT)
Controlling cooperative emission and superradiance in waveguide-coupled quantum dots [0.0] ナノフォトニック導波路に埋め込まれた独立に調整可能なInAs量子ドットの集合放出の測定を報告する。
分割ダイオード構造は、導波路結合効率の低下を最小限に抑えながら、広範囲にわたる量子ドット遷移エネルギーの独立的な電気制御を可能にする。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 14:03:12 GMT)
Constant-time magic state distillation [0.0] 再構成可能なqubitアーキテクチャでは、高速な$mathcalO(1)$コードサイクルのマジックステート蒸留を実行することができる。
入力誤り率$prightarrow MathcalO(p3)$から,両蒸留回路の回路レベルの雑音下での誤差抑制能力を確認した。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:08:28 GMT)
BlurryScope: a cost-effective and compact scanning microscope for automated HER2 scoring using deep learning on blurry image data [0.0] ブルリスコープ(BlurryScope)は、組織部位の自動検査・解析のための費用効率が高くコンパクトなソリューションである。
BlurryScopeは、特殊なハードウェアとニューラルネットワークベースのモデルを統合して、モーションレッドな組織像を処理する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 04:46:36 GMT)
Bilateral Hippocampi Segmentation in Low Field MRIs Using Mutual Feature Learning via Dual-Views [0.0] 低磁場MRIはよりアクセスしやすく、費用対効果が高いため、小児の鎮静は不要である。
低磁場MRIにおける両側海馬の自動セグメンテーションのための新しい深層学習手法を提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 02:00:07 GMT)
Benchmarking Floworks against OpenAI & Anthropic: A Novel Framework for Enhanced LLM Function Calling [0.0] 大規模言語モデル(LLM)は、様々な領域で顕著な能力を示しているが、その経済的影響は、ツールの使用や関数呼び出しの課題によって制限されている。
本稿では,LLMの関数呼び出し能力を大幅に向上させる新しいアーキテクチャであるThorV2を紹介する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 15:23:23 GMT)
Automated Defect Detection and Grading of Piarom Dates Using Deep Learning [0.0] 本稿では,ピアロム日付のリアルタイム検出・分類・評価に特化して設計された,革新的なディープラーニングフレームワークを提案する。
我々のフレームワークは、最先端のオブジェクト検出アルゴリズムと畳み込みニューラルネットワーク(CNN)を統合し、欠陥同定の高精度化を実現している。
実験の結果,既存の手法よりも精度と計算効率が優れていた。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 18:25:20 GMT)
An improvement of optical PPM communication with high security [0.0] 光通信における重要な課題の1つは、光ファイバーチャネルを通過する伝送情報データを保護することである。
多くのアイデアが提案され、超高速通信の物理層に実装するために活発に開発されている。
本稿では,これらの欠点を解消する変調と受信に関する光学的スキームを提案する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 11:23:16 GMT)
An improved Bell-CHSH observable for gauge boson pairs [0.0] 本研究では、スピン作用素の平方に基づいてベルの不等式を考える。
ベル作用素の新たな選択は、衝突子に見られる状態に関して有望な性質を持つ。
我々はまた、異なる相互作用を媒介するゲージボゾンを含むシステムにおいてベル違反を初めて調査する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:54:15 GMT)
Alternative Bell's states and teleportation [0.0] ベル状態は量子コンピューティングにおいて最も有用なものの一つである。
絡み合った状態の代替基底を提案する。
これらの代替基底の量子回路と符号を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:53:14 GMT)
Alternative Bell's states and teleportation [0.0] ベル状態は量子コンピューティングにおいて最も有用なものの一つである。
絡み合った状態の代替基底を提案する。
これらの代替基底の量子回路と符号を示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 17:53:14 GMT)
AI driven health recommender [0.0] Webアプリケーションは、機械学習をルートとして使用することで、クリーンでリアルタイムなデータで作られています。
患者が提示する症状に基づいて疾患名を検出し、各疾患の薬剤、摂取予防、フォローするダイエット、ワークアウトを推奨するので、疾患を最小化することができる。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 16:08:00 GMT)
A Type System to Ensure Non-Interference in ReScript [0.0] 本稿では,ReScript構文のサブセットとして,非干渉を強制するために設計された型システムを提案する。
型システムに対する健全性の証明を結論として,式が型許容である場合,本質的に非干渉であることを示す。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 09:47:10 GMT)
$2+1$ dimensional Floquet systems and lattice fermions: Exact bulk spectral equivalence [0.0] フロケ絶縁体と呼ばれる周期的に駆動される系は連続時間で、静的フェルミオン理論は離散時間で結ばれている。
ここでは、Floquet物理を高次元で捉えるための静的離散時間理論の可能性について検討する。
論文参考訳(メタデータ) (Wed, 23 Oct 2024 19:09:01 GMT)