Self-Calibrated Listwise Reranking with Large Language Models [137.7] 大規模言語モデル (LLM) はシーケンシャル・ツー・シーケンス・アプローチによってタスクのランク付けに使用されている。
この階調のパラダイムは、より大きな候補集合を反復的に扱うためにスライディングウインドウ戦略を必要とする。
そこで本稿では,LLMを用いた自己校正リストのランク付け手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:31:31 GMT)
Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models [112.0] Mixture-of-Transformer (MoT) はスパースマルチモーダルトランスアーキテクチャである。
MoTはモデルの非埋め込みパラメータをモダリティで分離する。
複数の設定とモデルスケールでMoTを評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:06 GMT)
Findings of the IWSLT 2024 Evaluation Campaign [102.8] 本稿は、第21回IWSLT会議によって組織された共有タスクについて報告する。
共通タスクは、音声翻訳における7つの科学的課題に対処する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:11:55 GMT)
Explaining Mixtures of Sources in News Articles [102.0] 我々は、長文世代における計画評価のケーススタディとして、ニュースのソース選択という1つの計画について検討する。
これは人間の計画にとって重要なケーススタディであり、他の種類の計画を評価するためのフレームワークとアプローチを提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:34:05 GMT)
CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation [98.1] CaPoは,1)メタプラン生成,2)プログレッシブなメタプランと実行の2つのフェーズで協調効率を向上する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:08:04 GMT)
Towards Calibrated Robust Fine-Tuning of Vision-Language Models [97.2] 本研究は、視覚言語モデルにおいて、OOD精度と信頼性校正の両方を同時に改善する頑健な微調整法を提案する。
OOD分類とOOD校正誤差は2つのIDデータからなる共有上限を持つことを示す。
この知見に基づいて,最小の特異値を持つ制約付きマルチモーダルコントラスト損失を用いて微調整を行う新しいフレームワークを設計する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:25:25 GMT)
Provably Faster Algorithms for Bilevel Optimization via Without-Replacement Sampling [96.5] 勾配に基づくアルゴリズムはバイレベル最適化に広く用いられている。
本研究では,より高速な収束率を実現する非置換サンプリングに基づくアルゴリズムを提案する。
合成および実世界の両方のアプリケーションに対してアルゴリズムを検証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:05:31 GMT)
BitNet a4.8: 4-bit Activations for 1-bit LLMs [95.7] 1ビット大言語モデルの4ビットアクティベーションを可能にするBitNet a4.8を導入する。
我々はBitNet a4.8がBitNet b1.58と同等のトレーニングコストでパフォーマンスを実現することを実証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:41:50 GMT)
CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models [91.2] 大規模言語モデル(LLM)は、生成されたコードを自己定義し、自律的に改善する機能を持つエージェントとして機能する。
コード生成プロセスの異なる段階における探索空間を効率的に探索するLLMエージェントのためのフレームワークであるCodeTreeを提案する。
具体的には、異なるコーディング戦略を明示的に探求し、対応するコーディングソリューションを生成し、その後、ソリューションを洗練するために統合されたツリー構造を採用しました。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:09:54 GMT)
MVSplat360: Feed-Forward 360 Scene Synthesis from Sparse Views [90.3] MVSplat360は多様な現実世界シーンの360degノベルビュー合成(NVS)のためのフィードフォワードアプローチであり、スパース観測のみを用いて紹介する。
この設定は、入力ビュー間の重複が最小限であり、提供された視覚情報が不十分であるために本質的に不適切である。
私たちのモデルは、エンドツーエンドのトレーニングが可能で、5つのスパースなインプットビューで任意のビューのレンダリングをサポートしています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:59:31 GMT)
Winner-Take-All Column Row Sampling for Memory Efficient Adaptation of Language Model [89.9] 分散を低減した行列生成のために, WTA-CRS と呼ばれる新しい非バイアス推定系を提案する。
我々の研究は、チューニング変換器の文脈において、提案した推定器が既存のものよりも低い分散を示すという理論的および実験的証拠を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:38:33 GMT)
Optimal Flow Matching: Learning Straight Trajectories in Just One Step [89.4] 我々は,新しいtextbf Optimal Flow Matching (OFM) アプローチを開発し,理論的に正当化する。
これは2次輸送のための直列のOT変位をFMの1ステップで回復することを可能にする。
提案手法の主な考え方は,凸関数によってパラメータ化されるFMのベクトル場の利用である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:45:10 GMT)
Vision Language Models are In-Context Value Learners [89.3] 本稿では、視覚言語モデル(VLM)に埋め込まれた世界的知識を活用してタスクの進捗を予測する普遍的価値関数推定器である生成価値学習(GVL)を提案する。
ロボットやタスク固有のトレーニングがなければ、GVLは300以上の異なる現実世界のタスクに対して、ゼロショットと数ショットの効果的な値をインコンテキストで予測することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:17:50 GMT)
StoryAgent: Customized Storytelling Video Generation via Multi-Agent Collaboration [88.9] CSVG(Customized Storytelling Video Generation)のためのマルチエージェントフレームワークを提案する。
StoryAgentはCSVGを特殊エージェントに割り当てられた個別のサブタスクに分解し、プロの制作プロセスを反映する。
具体的には、撮影時間内整合性を高めるために、カスタマイズされたイメージ・ツー・ビデオ(I2V)手法であるLoRA-BEを導入する。
コントリビューションには、ビデオ生成タスクのための汎用フレームワークであるStoryAgentの導入や、プロタゴニストの一貫性を維持するための新しい技術が含まれている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:00:33 GMT)
Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.1] エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:38:32 GMT)
LongEmbed: Extending Embedding Models for Long Context Retrieval [87.6] 本稿では、埋め込みモデルのコンテキストウィンドウ拡張について検討し、追加のトレーニングを必要とせず、制限を32kまで押し上げる。
まず、新たに構築したLongEmbedベンチマークにおいて、コンテキスト検索のための現在の埋め込みモデルの性能について検討する。
実験では、PlaceRoのようなトレーニング不要のコンテキストウィンドウ拡張戦略が、既存の埋め込みモデルのコンテキストウィンドウを複数の折り畳みで効果的に拡張できることが示されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:29:32 GMT)
A Manifold Perspective on the Statistical Generalization of Graph Neural Networks [84.0] 我々は、スペクトル領域の多様体からサンプリングされたグラフ上のGNNの統計的一般化理論を確立するために多様体の視点を取る。
我々はGNNの一般化境界が対数スケールのグラフのサイズとともに線形に減少し、フィルタ関数のスペクトル連続定数とともに線形的に増加することを証明した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:49:10 GMT)
FLIRT: Feedback Loop In-context Red Teaming [79.6] ブラックボックスモデルを評価し,その脆弱性を明らかにする自動レッドチーム化フレームワークを提案する。
私たちのフレームワークは、レッドチームモデルに対するフィードバックループでコンテキスト内学習を使用し、それらを安全でないコンテンツ生成にトリガーします。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:23:51 GMT)
Self-Consistency Preference Optimization [79.4] 自己整合性優先最適化(ScPO)を導入する。
ScPOは、教師なしの新たな問題に関して、一貫性のない答えよりも好まれる一貫性のある回答を反復的に訓練する。
ゼブラ論理では、ScPO fine Llamatunes-3 8Bは、Llama-3 70B、Gemma-2 27B、Claude-3 Haikuより優れている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:41:00 GMT)
Mini-InternVL: A Flexible-Transfer Pocket Multimodal Model with 5% Parameters and 90% Performance [78.5] Mini-InternVL は 1B から 4B までのパラメータを持つ一連の MLLM であり、パラメータの 5% しか持たない性能の90% を達成している。
我々は,ダウンストリームタスクにおける特化モデルの転送と性能向上を可能にする,Mini-InternVLの統一適応フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:35:52 GMT)
Active-Dormant Attention Heads: Mechanistically Demystifying Extreme-Token Phenomena in LLMs [77.7] 実践者は変圧器に基づく大言語モデルにおいて、3つのパズリング現象を一貫して観察してきた。
これらの現象は、ある種のいわゆる「シンクトークン」が不当に高い注意重みを負っているのが特徴である。
極端トーケン現象のメカニズムを解明する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:57:02 GMT)
Scaling Laws for Precision [73.2] トレーニングと推論の両方に"精度対応"のスケーリング法則を考案する。
推論では,学習後の量子化によって生じる劣化が,モデルがより多くのデータに基づいて訓練されるにつれて増加することが分かる。
トレーニングのために、我々のスケーリング法則は、異なるパーツの異なるモデルの損失を、異なる精度で予測することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:10:10 GMT)
OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models [70.7] コードのための大規模言語モデル(LLM)は、コード生成、推論、タスク、エージェントシステムなど、さまざまな領域で必須になっている。
トップクラスのコードLLMであるOpenCoderは、主要なモデルに匹敵するパフォーマンスを達成するだけでなく、研究コミュニティの'オープンクックブック'として機能します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:47:25 GMT)
Proportional Fairness in Obnoxious Facility Location [70.6] この問題に対して,距離に基づく比例フェアネスの概念の階層構造を提案する。
決定論的かつランダムなメカニズムを考察し、比例フェアネスの価格に関する厳密な境界を計算する。
モデルの拡張が2つあることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:13:43 GMT)
NeuralClothSim: Neural Deformation Fields Meet the Thin Shell Theory [70.1] 薄型シェルを用いた新しい擬似布シミュレータであるNeuralClothSimを提案する。
メモリ効率の高い解法はニューラル変形場と呼ばれる新しい連続座標に基づく表面表現を演算する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:45:25 GMT)
Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.7] ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:08:35 GMT)
M3DocRAG: Multi-modal Retrieval is What You Need for Multi-page Multi-document Understanding [63.3] M3DocRAGは、様々な文書コンテキストに柔軟に対応する新しいマルチモーダルRAGフレームワークである。
M3DocRAGは視覚情報を保存しながら、単一の文書や多数の文書を効率的に処理できる。
M3DocVQAはオープンドメインDocVQAを3,000以上のPDFドキュメントと4万以上のページで評価するための新しいベンチマークである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:29:38 GMT)
Differential Privacy Overview and Fundamental Techniques [63.0] この章は、"Differential Privacy in Artificial Intelligence: From Theory to Practice"という本の一部である。
まず、データのプライバシ保護のためのさまざまな試みについて説明し、その失敗の場所と理由を強調した。
次に、プライバシ保護データ分析の領域を構成する重要なアクター、タスク、スコープを定義する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:52:11 GMT)
Q-SFT: Q-Learning for Language Models via Supervised Fine-Tuning [63.0] 価値に基づく強化学習は、幅広いマルチターン問題に対する効果的なポリシーを学ぶことができる。
現在の値ベースのRL法は、特に大規模な言語モデルの設定にスケールすることが困難であることが証明されている。
本稿では,これらの欠点に対処する新しいオフラインRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:36:52 GMT)
Image Understanding Makes for A Good Tokenizer for Image Generation [62.9] 我々は,トークンシーケンスにイメージを投影する効果的なトークン化器に依存する,トークンベースのIGフレームワークを提案する。
我々は、強力なIU機能を持つトークン化装置が、さまざまなメトリクス、データセット、タスク、提案ネットワークで優れたIG性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:55:23 GMT)
AlignXIE: Improving Multilingual Information Extraction by Cross-Lingual Alignment [62.7] AlignXIEは、様々な言語、特に非英語のIEをコード生成タスクとして定式化している。
翻訳されたインスタンス予測タスクを通じてIEの言語間アライメントフェーズを組み込む。
ChatGPTを$30.17%、SoTAを$20.03%上回ることで、言語横断IEの優れた機能を実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:36:05 GMT)
Aligning Text-to-Image Diffusion Models with Reward Backpropagation [62.5] 本稿では,報酬勾配のエンドツーエンドのバックプロパゲーションを用いて,拡散モデルを下流の報酬関数に整合させる手法であるAlignPropを提案する。
AlignPropは、選択肢よりも少ないトレーニングステップでより高い報酬を得るが、概念的にはシンプルである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:54:22 GMT)
Gradient Cuff: Detecting Jailbreak Attacks on Large Language Models by Exploring Refusal Loss Landscapes [61.9] 大規模言語モデル(LLM)は、ユーザがクエリを入力し、LLMが回答を生成する、顕著な生成AIツールになりつつある。
害と誤用を減らすため、人間のフィードバックからの強化学習のような高度な訓練技術を用いて、これらのLLMを人間の価値に合わせる努力がなされている。
近年の研究では、組込み安全ガードレールを転覆させようとする敵のジェイルブレイクの試みに対するLLMの脆弱性を強調している。
本稿では,脱獄を検知するGradient Cuffという手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:41:38 GMT)
LOVA3: Learning to Visual Question Answering, Asking and Assessment [61.5] 質問への回答、質問、評価は、世界を理解し、知識を得るのに不可欠な3つの人間の特性である。
現在のMLLM(Multimodal Large Language Models)は主に質問応答に焦点を当てており、質問や評価スキルの可能性を無視することが多い。
LOVA3は、"Learning tO Visual Question Answering, Asking and Assessment"と名付けられた革新的なフレームワークである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:41:03 GMT)
Enhancing Trust in Clinically Significant Prostate Cancer Prediction with Multiple Magnetic Resonance Imaging Modalities [61.4] 米国では、前立腺がんが男性の死因としては2番目に多く、2024年には35,250人が死亡している。
本稿では,複数のMRIモダリティを組み合わせて深層学習モデルを訓練し,臨床的に有意な前立腺癌予測のためのモデルの信頼性を高めることを検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:48:27 GMT)
Learning in Stackelberg Games with Non-myopic Agents [60.9] そこで本研究では,主役が非筋力的な長寿命エージェントと繰り返し対話するスタックルバーグゲームについて,エージェントの支払関数を知らずに検討する。
我々は、非ミオピックエージェントの存在下での学習を、ミオピックエージェントの存在下で堅牢な帯域最適化に還元する一般的なフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:35:38 GMT)
Long-form factuality in large language models [60.1] 大規模言語モデル(LLM)は、しばしば、オープンエンドトピックの事実検索プロンプトに応答するときに、事実エラーを含むコンテンツを生成する。
我々は、GPT-4を用いて、オープンドメインにおけるモデルの長文事実をベンチマークし、LongFactを生成する。
そこで我々は,LLMエージェントを検索拡張現実性評価器 (SAFE) と呼ぶ手法により,長期的事実性の自動評価器として使用できることを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:14:38 GMT)
LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation [60.0] LLMの強いテキスト理解は、CLIPのイメージキャプション処理能力を改善することができる。
LLM2CLIPは,CLIPの可能性を解き放つために,LLMのパワーを取り入れた新しいアプローチである。
我々の実験は、このアプローチがクロスモーダルタスクを大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:16 GMT)
Revisiting Link Prediction: A Data Perspective [59.3] グラフの基本的なタスクであるリンク予測は、友人の推薦、タンパク質分析、薬物相互作用予測など、様々な応用において不可欠であることが証明されている。
既存の文献の証拠は、すべてのデータセットに適した普遍的に最良のアルゴリズムが存在しないことを裏付けている。
我々は,局所的な構造的近接,大域的な構造的近接,特徴的近接という,リンク予測に不可欠な3つの基本的要因を認識する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:01:16 GMT)
SYNTHEVAL: Hybrid Behavioral Testing of NLP Models with Synthetic CheckLists [59.1] 我々は,NLPモデルの包括的評価のために,SyntheVALを提案する。
最後の段階では、人間の専門家が困難な例を調査し、手動でテンプレートを設計し、タスク固有のモデルが一貫して示す障害の種類を特定します。
我々は、感情分析と有害言語検出という2つの分類課題にSynTHEVALを適用し、これらの課題における強力なモデルの弱点を特定するのに、我々のフレームワークが有効であることを示す。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 15:00:00 GMT)
LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field [58.9] ニューラル光場(NeLF)に基づく最初の頭部アバターモデルであるLightAvatarを紹介する。
LightAvatarは3DMMパラメータから画像をレンダリングし、メッシュやボリュームレンダリングを使わずに、単一のネットワークフォワードパスを介してカメラがポーズする。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 04:49:24 GMT)
VideoGLaMM: A Large Multimodal Model for Pixel-Level Visual Grounding in Videos [58.8] VideoGLaMMは、ユーザが提供するテキスト入力に基づいて、ビデオの細かいピクセルレベルのグラウンド化を行うための新しいモデルである。
このアーキテクチャは、ビデオコンテンツの空間的要素と時間的要素の両方をテキスト命令と同期させるよう訓練されている。
実験の結果、我々のモデルは3つのタスクすべてで既存のアプローチより一貫して優れています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:59:27 GMT)
Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.7] 多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:37:51 GMT)
SVDQunat: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models [58.5] 拡散モデルは高品質な画像を生成するのに非常に効果的であることが証明されている。
これらのモデルが大きくなるにつれて、メモリが大幅に増加し、レイテンシの低下に悩まされる。
本研究では,その重みとアクティベーションを4ビットに定量化し,拡散モデルの高速化を目指す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:58 GMT)
Taming Rectified Flow for Inversion and Editing [57.4] FLUXやOpenSoraのような定流拡散変換器は、画像生成やビデオ生成の分野では例外的な性能を示した。
その堅牢な生成能力にもかかわらず、これらのモデルはしばしば不正確な逆転に悩まされ、画像やビデオ編集などの下流タスクにおける有効性を制限できる。
本稿では,修正フローODEの解法における誤差を低減し,インバージョン精度を向上させる新しいトレーニングフリーサンプリング器RF-rを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:29:02 GMT)
bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction [57.2] 疎二分量時間画像データから高画質の画像スタックを元の解像度で再構成する新しい方法であるbit2bitを提案する。
Poisson denoisingの最近の研究に触発されて、スパースバイナリ光子データから高密度な画像列を生成するアルゴリズムを開発した。
本研究では,様々な課題の画像条件下でのSPADの高速映像を多種多種に含む新しいデータセットを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:52:47 GMT)
The Fundamental Rights Impact Assessment (FRIA) in the AI Act: Roots, legal obligations and key elements for a model template [55.2] 基本権利影響評価(FRIA)の理論的・方法論的検討における既存のギャップを埋めることを目的とする。
この記事では、FRIAのモデルテンプレートの主要なビルディングブロックについて概説する。
これは、AIが人権と完全に整合していることを保証するために、他の国家および国際規制イニシアチブの青写真として機能する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:55:55 GMT)
GUI Agents with Foundation Models: A Comprehensive Survey [53.0] この調査は(M)LLMベースのGUIエージェントに関する最近の研究を集約する。
データ、フレームワーク、アプリケーションにおける重要なイノベーションを強調します。
本稿では, (M)LLM ベースの GUI エージェントの分野におけるさらなる発展を期待する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:28:10 GMT)
Adaptive Caching for Faster Video Generation with Diffusion Transformers [52.7] 拡散変換器(DiT)はより大きなモデルと重い注意機構に依存しており、推論速度が遅くなる。
本稿では,Adaptive Caching(AdaCache)と呼ばれる,ビデオDiTの高速化のためのトレーニング不要手法を提案する。
また,AdaCache内で動画情報を利用するMoReg方式を導入し,動作内容に基づいて計算割り当てを制御する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:06:32 GMT)
Sharp Analysis for KL-Regularized Contextual Bandits and RLHF [52.5] Reverse-Kullback-Leibler (KL) 正則化は、強化学習におけるポリシー最適化を強化する主要な手法である。
単純な2段階混合サンプリング戦略は, カバー係数に付加的な依存しか持たずに, サンプルの複雑さを達成できることが示される。
この結果は,より効率的なRLHFアルゴリズムの設計に光を当て,KL正規化とRLHFにおけるデータカバレッジの役割を包括的に理解するものである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:22:46 GMT)
DomainGallery: Few-shot Domain-driven Image Generation by Attribute-centric Finetuning [51.7] DomainGalleryは、数ショットのドメイン駆動画像生成方法である。
属性消去、属性の切り離し、正規化、拡張が特徴である。
さまざまなドメイン駆動生成シナリオにおいて、DomainGalleryの優れたパフォーマンスを検証する実験が行われます。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:55:36 GMT)
TinyStyler: Efficient Few-Shot Text Style Transfer with Authorship Embeddings [51.3] 本稿では,TinyStylerについて紹介する。
我々は、TinyStylerのテキスト属性スタイル転送機能について、自動評価と人的評価で評価する。
私たちのモデルはhttps://huggingface.co/tinystyler/tinystyler.comで公開されています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:56:19 GMT)
On Softmax Direct Preference Optimization for Recommendation [50.9] そこで我々は,LMをベースとした推奨項目の識別を支援するために,ランキング情報をLMに挿入するソフトマックスDPO(S-DPO)を提案する。
具体的には、ユーザの嗜好データに複数の負を組み込んで、LMベースのレコメンデータに適したDPO損失の代替版を考案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:30:53 GMT)
Measuring short-form factuality in large language models [50.2] 本稿では,言語モデルが短い事実探索質問に答える能力を評価するベンチマークであるSimpleQAを提案する。
SimpleQAはGPT-4応答に対して逆向きに収集される。
SimpleQAの各回答は、正しいか、間違っているか、試みられていないかのどちらかとしてランク付けされる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:58:42 GMT)
Variational Low-Rank Adaptation Using IVON [50.0] 変動学習はローランド適応(LoRA)の精度と校正を著しく向上させることができることを示す。
我々はAdamWを改良変分オンラインニュートン(IVON)アルゴリズムで置き換え、大きな言語モデルを微調整する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:17:30 GMT)
Opponent Shaping for Antibody Development [49.3] 抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
治療によって誘導される選択的圧力はウイルスに作用し、変異株の出現を誘導し、初期治療が効果を低下させる。
我々は、ウイルスの進化的脱出の遺伝的シミュレーションを実装するために、抗体とウイルス抗原の結合の計算モデルを構築した。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 12:15:52 GMT)
Evaluating GPT-4 at Grading Handwritten Solutions in Math Exams [49.0] 我々は、最先端のマルチモーダルAIモデル、特にGPT-4oを利用して、大学レベルの数学試験に対する手書きの応答を自動的に評価する。
確率論試験における質問に対する実際の学生の反応を用いて, GPT-4oのスコアと, 様々なプロンプト技術を用いて, 人間の学級のスコアとの整合性を評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:51:47 GMT)
AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and Generation [48.8] 本稿では,畳み込みブロックと変圧器ブロックを組み合わせたハイブリッドアーキテクチャAsCANを紹介する。
AsCANは、認識、セグメンテーション、クラス条件画像生成など、さまざまなタスクをサポートしている。
次に、同じアーキテクチャをスケールして、大規模なテキスト・イメージタスクを解決し、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:43:17 GMT)
Analyzing The Language of Visual Tokens [48.6] 我々は、離散的な視覚言語を分析するために、自然言語中心のアプローチをとる。
トークンの高度化はエントロピーの増大と圧縮の低下を招き,トークンが主にオブジェクト部品を表すことを示す。
また、視覚言語には結合的な文法構造が欠如していることが示され、自然言語と比較して難易度が高く、階層構造が弱いことが判明した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:28 GMT)
ALI-Agent: Assessing LLMs' Alignment with Human Values via Agent-based Evaluation [48.5] 大規模言語モデル(LLM)は、人間の価値観と不一致した場合、意図しない、有害なコンテンツも引き出すことができる。
現在の評価ベンチマークでは、LLMが人的価値とどの程度うまく一致しているかを評価するために、専門家が設計した文脈シナリオが採用されている。
本研究では, LLM エージェントの自律的能力を活用し, 奥行き及び適応的アライメント評価を行う評価フレームワーク ALI-Agent を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:07:07 GMT)
When Does Classical Chinese Help? Quantifying Cross-Lingual Transfer in Hanja and Kanbun [48.1] 古典中国語から漢語・漢文への言語間移動可能性の仮定を疑問視する。
実験の結果,漢文で書かれた古代朝鮮語文書の言語モデル性能に対する古典中国語データセットの影響は最小限であった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:59:54 GMT)
GraphTeam: Facilitating Large Language Model-based Graph Analysis via Multi-Agent Collaboration [46.7] GraphTeamは3つのモジュールから5つのLLMベースのエージェントで構成されており、異なる特殊性を持つエージェントは複雑な問題に対処するために協力することができる。
6つのグラフ分析ベンチマークの実験は、GraphTeamが最先端のパフォーマンスを達成し、精度の点で最高のベースラインよりも平均25.85%改善していることを示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:10:20 GMT)
Belief propagation for general graphical models with loops [45.3] 我々は、任意のグラフィカルモデル上で、Kirkleyらによって一般化されたBP提案を明示する統一的な視点を開発する。
BPスキームを導出し、ループ型テンソルネットワークおよびより一般的にはループ型グラフィカルモデル上でBPの推論式を提供する。
テンソルネットワークメッセージパッシング手法は,Kirkley の手法と基本的に同じ近似に依存することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:32:42 GMT)
Whisper-Flamingo: Integrating Visual Features into Whisper for Audio-Visual Speech Recognition and Translation [45.3] Whisperのような音声モデルは、数十万時間のデータで訓練されているため、より良い音声からテキストへのデコーダを学ぶことができる。
本稿では,Whisper音声認識と翻訳モデルに視覚的特徴を統合するWhisper-Flamingoを提案する。
LRS3 上で最先端の ASR WER (0.68%) と AVSR WER (0.76%) を達成する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:58:19 GMT)
Practical hybrid PQC-QKD protocols with enhanced security and performance [44.9] 我々は,量子古典ネットワーク内でQKDとPQCが相互運用するハイブリッドプロトコルを開発した。
特に、それぞれのアプローチの個々の性能に対して、スピードと/またはセキュリティを向上する可能性のある、異なるハイブリッド設計について検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:01:15 GMT)
Loki: Low-rank Keys for Efficient Sparse Attention [44.7] 大規模言語モデル(LLM)の推論は、計算コストとメモリコストの面で高価である。
本研究では,注目ブロックで計算された鍵ベクトルの次元性に着目し,自己注意を近似する手法を提案する。
低次元空間で計算されたアテンションスコアに基づいてKVキャッシュ内のトークンをランク付けし、選択する新しいスパースアテンション手法であるLokiを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:58:50 GMT)
Confident Natural Policy Gradient for Local Planning in $q_π$-realizable Constrained MDPs [44.7] 制約付きマルコフ決定プロセス(CMDP)フレームワークは、安全性や他の重要な目的を課すための重要な強化学習アプローチとして出現する。
本稿では,線形関数近似が$q_pi$-realizabilityで与えられる学習問題に対処する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:56:03 GMT)
Axioms for AI Alignment from Human Feedback [44.5] 我々は、強力な公理保証を持つ報酬関数を学習するための新しいルールを開発する。
社会的選択の観点からの重要な革新は、我々の問題が線形構造を持っていることである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:40:25 GMT)
DiT4Edit: Diffusion Transformer for Image Editing [44.5] Diffusion Transformerベースの画像編集フレームワークであるDiT4Editを提案する。
DiT4Editは、DPM-r逆変換アルゴリズムを使用して、反転潜伏子を取得し、UNetベースのフレームワークで一般的に使用されるDDIMアルゴリズムと比較してステップ数を減らした。
我々の設計は、特に高解像度で任意のサイズの画像において、画像編集においてUNet構造を超えることができるように、DiTの利点を活用している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:07:59 GMT)
Learning Morphisms with Gauss-Newton Approximation for Growing Networks [44.0] ニューラル・アーキテクチャ・サーチ(NAS)の一般的な手法は、ネットワーク・アソシエーション(英語版)と呼ばれるネットワークのアーキテクチャへの小さな局所的な変更を通じてネットワークを成長させることに基づいている。
本稿では、損失関数のガウス・ニュートン近似を用いてネットワーク成長のためのNAS法を提案し、ネットワークの候補型を効率的に学習し評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:12:42 GMT)
The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities [43.6] 異なる言語における意味論的に等価な入力に対するモデル表現は中間層で類似していることを示す。
この空間は、ロジットレンズを介してモデルの主要な事前学習言語を使って解釈することができる。
1つのデータ型における共有表現空間の介入は、他のデータ型におけるモデル出力にも予測可能に影響を与える。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:55:09 GMT)
Lightning IR: Straightforward Fine-tuning and Inference of Transformer-based Language Models for Information Retrieval [43.4] 本稿では、情報検索のためのトランスフォーマーベース言語モデルの微調整と推論を行うPyTorchベースのフレームワークであるLightning IRを紹介する。
Lightning IRは、微調整やインデックス付けから検索と再ランク付けまで、情報検索パイプラインのすべてのステージをサポートする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:03:21 GMT)
$B^4$: A Black-Box Scrubbing Attack on LLM Watermarks [42.9] 透かしは、知覚不可能なパターンを埋め込むことによって、コンテンツ検出の顕著な技術として登場した。
以前の作業では、通常、特定のタイプの透かしが既に知られているグレーボックスアタックの設定が検討されていた。
ここでは、ウォーターマークに対するブラックボックスのスクラブ攻撃であるB4$を提案します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:26:43 GMT)
TaE: Task-aware Expandable Representation for Long Tail Class Incremental Learning [42.6] 本稿では,各タスクから多様な表現を学習するための新しいタスク対応拡張(TaE)フレームワークを提案する。
TaEは最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:47:17 GMT)
CONTRAST: Continual Multi-source Adaptation to Dynamic Distributions [42.3] Continual Multi-source Adaptation to Dynamic Distributions (CONTRAST) は、複数のソースモデルを最適に組み合わせて動的テストデータに適応する新しい手法である。
提案手法は,ソースモデルを最適に組み合わせ,モデル更新の優先順位付けを最小限に行うことができることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:28:54 GMT)
FactTest: Factuality Testing in Large Language Models with Finite-Sample and Distribution-Free Guarantees [41.8] 幻覚や非現実的コンテンツを生成するための大規模言語モデル(LLM)は、高い領域での信頼性を損なう。
FactTest は LLM が与えられた質問に対する正しい回答を確実に提供できるかどうかを統計的に評価する新しいフレームワークである。
本研究では,FactTestが幻覚を効果的に検出し,未知の疑問に答えることを禁じるモデルの能力を向上させることにより,40%以上の精度向上を実現していることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:17:42 GMT)
Learning in Budgeted Auctions with Spacing Objectives [41.6] 多くのオークションでは、参加者は勝利の頻度だけでなく、勝利が時間とともにどのように分配されるかに気を配る。
我々は,この現象の簡単なモデルを導入し,勝利の値が最後の勝利以来のコンケーブ関数であるような,予算付きオークションとしてモデル化する。
状態に依存しない戦略は変換の不確かさを伴わずに線形後悔を引き起こすことを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:31:31 GMT)
Closing the Gap: Achieving Global Convergence (Last Iterate) of Actor-Critic under Markovian Sampling with Neural Network Parametrization [40.4] Actor-Critic (AC)アルゴリズムの最近の理論的解析は、AC実装の実践的な側面に対処する上での遅延である。
我々は,5つの重要な実践的側面をすべて包含するACアルゴリズムの包括的理論的解析を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:44:09 GMT)
ImpScore: A Learnable Metric For Quantifying The Implicitness Level of Language [40.4] インプシット言語は, 自然言語処理システムにおいて, 正確なテキスト理解を実現し, ユーザとの自然な対話を促進するために不可欠である。
本稿では,外部参照に頼ることなく,言語の暗黙度を定量化するスカラー計量を開発した。
ImpScoreは、12,580$(単純文、明示文)のペアからなる特別なキュレートされたデータセットに対して、ペアのコントラスト学習を使用してトレーニングされる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:23:29 GMT)
AIOS: LLM Agent Operating System [39.6] 本稿では,LLMベースのエージェント管理のコンテキスト下で,AIOS(LLMベースのAIエージェントオペレーティングシステム)のアーキテクチャを提案する。
エージェントアプリケーションからリソースとLLM固有のサービスをAIOSカーネルに分離することで、LLMベースのエージェントを提供するための新しいアーキテクチャを導入する。
AIOSを使用すると、さまざまなエージェントフレームワークで構築されたエージェントを最大2.1倍高速に実行することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:10:11 GMT)
Soft-Label Integration for Robust Toxicity Classification [39.2] この研究は、クラウドソースアノテーションとソフトラベル技術を統合する、新しい双方向最適化フレームワークを導入している。
GroupDROは、アウト・オブ・ディストリビューション(OOD)リスクに対する堅牢性を高めるために使用される。
実験の結果,提案手法は,平均および最悪のグループ精度において,既存のベースライン法よりも優れていた。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:53:17 GMT)
Diff-2-in-1: Bridging Generation and Dense Perception with Diffusion Models [39.1] マルチモーダルデータ生成と濃密な視覚知覚の両方を扱うために,統一的で汎用的な拡散型フレームワークDiff-2-in-1を導入する。
また,従来のトレーニングセットの分布を反映したマルチモーダルデータを作成するために,デノナイジングネットワークを利用することにより,マルチモーダル生成による識別的視覚知覚をさらに強化する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:53 GMT)
CAD-MLLM: Unifying Multimodality-Conditioned CAD Generation With MLLM [39.1] マルチモーダル入力に条件付きパラメトリックCADモデルを生成可能な最初のシステムであるCAD-MLLMを導入する。
先進的な大規模言語モデル (LLM) を用いて,多様なマルチモーダルデータとCADモデルのベクトル化表現に特徴空間を整合させる。
得られたデータセットはOmni-CADと呼ばれ、CADモデル毎にテキスト記述、多視点画像、ポイント、コマンドシーケンスを含む最初のマルチモーダルCADデータセットである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:31:08 GMT)
Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.1] 本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。
Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。
Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:36:19 GMT)
DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning [38.7] 本稿では、視覚世界を再構築することなく、視覚力学をモデル化する新しい手法であるDINO-WMを提案する。
迷路ナビゲーション,テーブルトッププッシュ,粒子操作など,様々な領域でDINO-WMを評価した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:54:37 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [38.7] 本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。
それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。
データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:23:16 GMT)
The Oscars of AI Theater: A Survey on Role-Playing with Language Models [38.7] 本調査では,言語モデルを用いたロールプレイングの急成長分野について検討する。
それは、初期のペルソナモデルから、Large Language Models(LLMs)によって促進される高度なキャラクタ駆動シミュレーションまでの開発に焦点を当てている。
データやモデル,アライメント,エージェントアーキテクチャ,評価など,これらのシステムを設計する上で重要なコンポーネントを包括的に分類する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:23:16 GMT)
The Implicit Bias of Gradient Descent on Separable Multiclass Data [38.1] 我々は、指数的尾特性のマルチクラス拡張を導入するために、置換同変と相対マージンベース(PERM)損失の枠組みを用いる。
提案手法は二分法の場合をよく反映しており,二分法と多分法のギャップを埋めるためのPERMフレームワークの威力を示すものである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:39:06 GMT)
Non-Euclidean Mixture Model for Social Network Embedding [37.5] ソーシャルネットワークのリンクは、ホモフィリーか社会的影響のどちらかによって形成されているという意見は概ね一致している。
リンク生成を2つの要因の混合モデルとしてモデル化する。
さらに, 球面空間におけるホモフィリー因子と双曲空間における影響因子をモデル化し, 1) ホモフィリーがサイクルに, (2) 影響がネットワークの階層化に繋がるという事実を満たす。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:13:16 GMT)
Towards evaluations-based safety cases for AI scheming [37.4] 本論では,安全事例がスケジューリングに有効である,という3つの論点を提案する。
第一に、フロンティアAIシステムの開発者は、AIシステムはスケジューリングができないと主張するかもしれない。
第二に、AIシステムはスケジューリングによって害を与えることができない、という主張もある。
第三に、AIシステムが意図的にそれらを覆そうと試みても、AIシステムを取り巻く制御手段が受け入れられない結果を防ぐと論じることもできる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:18:26 GMT)
MEG: Medical Knowledge-Augmented Large Language Models for Question Answering [37.4] 本稿では,医療知識を付加したLCMのパラメータ効率向上手法であるMEGを提案する。
本手法は,4つの医用マルチチョイスデータセットを用いて評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:57:14 GMT)
LDAdam: Adaptive Optimization from Low-Dimensional Gradient Statistics [37.2] 大規模なモデルをトレーニングするためのメモリ効率のよい勾配であるLDAdamを紹介する。
LDAdamは,言語モデルの精密かつ効率的な微調整と事前学習を可能にする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:00:45 GMT)
Conformalized Credal Regions for Classification with Ambiguous Ground Truth [37.0] 分類問題において、クレダル領域は現実的な仮定の下で証明可能な保証を提供することができるツールである。
そこで本研究では, コンフォメーション法により, 干潟域を直接構築できることを示す。
合成データと実データの両方について実験により検証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:39:29 GMT)
Needle Threading: Can LLMs Follow Threads through Near-Million-Scale Haystacks? [36.8] 我々は17大言語モデル(LLM)の能力を評価する。
興味深いことに、多くのモデルは驚くほどスレッドセーフで、パフォーマンスに大きな損失を被ることなく、同時に複数のスレッドをフォローできる。
有効なコンテキスト制限はサポート対象のコンテキスト長よりも大幅に短く,コンテキストウィンドウが大きくなるにつれて精度が低下することがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:27 GMT)
MediQ: Question-Asking LLMs and a Benchmark for Reliable Interactive Clinical Reasoning [36.4] 我々は積極的に質問を行い、より多くの情報を集め、確実に応答するシステムを開発する。
LLMの問合せ能力を評価するためのベンチマーク - MediQ を導入する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:30 GMT)
On the Intrinsic Self-Correction Capability of LLMs: Uncertainty and Latent Concept [36.3] 大規模言語モデル(LLM)は、自己補正(self-correction)と呼ばれる機能によって、その応答を改善することができる。
内在的な自己補正は、様々な応用で明らかであるが、それが有効である理由や理由は不明である。
内在的な自己補正は徐々に改善され、収束状態に近づくことができることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:30:58 GMT)
Orbit: A Framework for Designing and Evaluating Multi-objective Rankers [36.2] Orbitは、Objective-centric Ranker Building and Iterationの概念的なフレームワークである。
我々はOrbitを対話型システムとして実装し、利害関係者が直接対象空間と対話できるようにする。
われわれはOrbitを12名の業界実践者によるユーザスタディを通じて評価した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:38:14 GMT)
Quantum Neural Network Classifier for Cancer Registry System Testing: A Feasibility Study [36.0] 本稿では,既存の機械学習モデルではなく,量子機械学習モデルであるEvoMaster内での利用可能性を検討するために,Qlinicalを提案する。
結果は、QlinicalがEvoClassに匹敵するパフォーマンスを達成できることを示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:22:02 GMT)
IGDrivSim: A Benchmark for the Imitation Gap in Autonomous Driving [35.6] textbfIGDrivSimはWaymaxシミュレータ上に構築されたベンチマークである。
実験の結果,この認識ギャップは安全かつ効果的な運転行動の学習を妨げることが示された。
本研究は,模倣と強化学習を組み合わせることで,禁止行為に対する簡単な報奨を生かし,これらの失敗を効果的に軽減することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:28:52 GMT)
Beyond Aesthetics: Cultural Competence in Text-to-Image Models [35.0] CUBEは、テキスト・ツー・イメージ・モデルの文化的能力を評価するための最初のベンチマークである。
CUBEは、異なる地理的文化圏の8か国に関連する文化的アーティファクトをカバーしている。
CUBE-CSpaceは、文化的多様性を評価する基盤となる文化的アーティファクトのより大きなデータセットである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:26:21 GMT)
ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset [34.5] ファサードセマンティックセグメンテーションは、フォトグラムとコンピュータビジョンにおける長年の課題である。
本稿では,国際都市モデリング標準に基づく新しい階層型ファサードクラスであるLoFG(Level of Facade Generalization)を紹介する。
現在までに最大のセマンティック3Dファサードセグメンテーションデータセットであり、LoFG2とLoFG3の5クラスと15クラスで6100万のアノテートポイントを提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:58:18 GMT)
ProEdit: Simple Progression is All You Need for High-Quality 3D Scene Editing [33.4] ProEditは、拡散蒸留によって誘導される高品質な3Dシーン編集のためのフレームワークである。
我々のフレームワークはFOSのサイズを制御し、全体的な編集タスクを複数のサブタスクに分解することで一貫性を低下させる。
ProEditは、様々な場面で最先端の結果を達成し、編集作業に挑戦する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:54 GMT)
ProGraph: Temporally-alignable Probability Guided Graph Topological Modeling for 3D Human Reconstruction [32.9] 現在のモノクルビデオからの3Dモーション再構成手法は、現在の再構成ウィンドウ内の特徴に依存している。
図形トポロジカルモデリングによる3次元再構成(ProGraph)を提案する。
欠落した部分の回復のために、運動列全体にわたる明示的な位相認識確率分布を利用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:28:24 GMT)
CodeLutra: Boosting LLM Code Generation via Preference-Guided Refinement [32.5] 我々は、低パフォーマンスな大規模言語モデルを強化する新しいフレームワークであるCodeLutraを紹介する。
従来の微調整とは異なり、CodeLutraは正しい解と間違った解を比較するために反復的な選好学習メカニズムを採用している。
挑戦的なデータ分析タスクでは、わずか500個のサンプルを使用して、Llama-3-8Bの精度を28.2%から48.6%に改善し、GPT-4の性能に接近した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:51:07 GMT)
Gradient Localization Improves Lifelong Pretraining of Language Models [32.3] WebスケールのテキストコーパスでトレーニングされたLarge Language Models (LLM) は、それらのパラメータの世界の知識をキャプチャする。
本研究では,時間的に敏感なエンティティに関する2種類の知識について検討し,それぞれのタイプがLLM内の異なるパラメータ集合に局所化されていることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:43:50 GMT)
Precision or Recall? An Analysis of Image Captions for Training Text-to-Image Generation Model [32.1] テキスト・ツー・イメージ・モデルトレーニングにおけるキャプション精度とリコールの重要な役割について分析する。
我々は、大規模視覚言語モデルを用いて、学習のための合成キャプションを生成する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:00:37 GMT)
ReCapture: Generative Video Camera Controls for User-Provided Videos using Masked Video Fine-Tuning [32.1] 本稿では,新規なカメラトラジェクトリを用いた新しいビデオ生成手法であるReCaptureについて述べる。
提案手法により,既存のシーンの動きを全く異なる角度から,撮影カメラの動きで再現することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:45 GMT)
Alopex: A Computational Framework for Enabling On-Device Function Calls with LLMs [32.0] AlopexはFox Large Language Modelsを使ってデバイス上で正確な関数呼び出しを可能にするフレームワークである。
データミキシング戦略は破滅的な忘れを軽減し、関数呼び出しデータと教科書データセットを組み合わせて様々なタスクのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:15:17 GMT)
Learning from Pattern Completion: Self-supervised Controllable Generation [31.7] 本稿では,脳の連想力に寄与する神経機構にインスパイアされた,自己制御型制御可能生成(SCG)フレームワークを提案する。
実験により,モジュール型オートエンコーダは機能的特殊化を効果的に実現することが示された。
提案手法は,より難易度の高い高雑音シナリオにおいて優れたロバスト性を示すだけでなく,自己管理的な手法により,より有望なスケーラビリティの可能性を秘めている。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 08:27:16 GMT)
Defending Deep Regression Models against Backdoor Attacks [31.6] ディープレグレッションモデルは、さまざまな安全クリティカルなアプリケーションで使用されているが、バックドア攻撃に対して脆弱である。
本稿では,画像領域の深部回帰モデルがバックドアされているか否かを識別する最初のディフェンスであるDRMGuardを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:49:03 GMT)
CHATTER: A Character Attribution Dataset for Narrative Understanding [31.5] 我々はChatterのサブセットであるChatterEvalを人間のアノテーションを用いて検証し、映画スクリプトの文字属性タスクの評価ベンチマークとして機能させる。
ChatterEvalは、言語モデルの物語理解と長文モデリング能力を評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:37:30 GMT)
CUIfy the XR: An Open-Source Package to Embed LLM-powered Conversational Agents in XR [31.5] 大言語モデル (LLM) は音声テキスト (STT) とテキスト音声 (TTS) モデルを備えた非プレーヤ文字 (NPC) を用いており、XR のより自然な対話型ユーザインタフェース (CUI) を促進するために、従来の NPC やプレスクリプトの NPC よりも大きな利点をもたらす。
我々はコミュニティに対して,様々なLLM, STT, TTSモデルとの音声ベースのNPCユーザインタラクションを容易にする,オープンソースでカスタマイズ可能な,プライバシ対応の Unity パッケージ CUIfy を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:55:17 GMT)
Unlearning in- vs. out-of-distribution data in LLMs under gradient-based method [31.3] この研究は、生成モデルにおける未学習の品質を評価するための指標を定式化する。
学習しない品質とパフォーマンスのトレードオフを評価するために、それを使用します。
さらに,古典的漸進的アプローチの下で,サンプルの記憶と難易度が未学習にどのように影響するかを評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:02:09 GMT)
BendVLM: Test-Time Debiasing of Vision-Language Embeddings [31.0] 視覚言語モデル(VLM)埋め込みは、トレーニングデータに存在するバイアスを符号化する。
VLMを微調整するデバイアスングアプローチは、しばしば破滅的な忘れ物に悩まされる。
本稿では,VLM埋込脱バイアスに対する非線形,微調整不要なアプローチであるBend-VLMを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:16:15 GMT)
PASSION for Dermatology: Bridging the Diversity Gap with Pigmented Skin Images from Sub-Saharan Africa [29.4] アフリカでは皮膚科医が大幅に不足しており、人口は100万人に満たない。
これは、皮膚疾患に苦しむ小児人口の80%が皮膚疾患に悩まされている皮膚科医に対する高い需要とは対照的である。
PASSIONプロジェクトは、このデータをオープンソース化することを目的として、サブサハラ諸国の皮膚疾患の画像を収集し、この問題に対処することを目的としている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:11:37 GMT)
Principled Probabilistic Imaging using Diffusion Models as Plug-and-Play Priors [29.2] 拡散モデル(DM)は、最近、複雑な画像分布をモデル化する際、優れた機能を示した。
一般的な逆問題に対する後続サンプリングを行うマルコフ連鎖モンテカルロアルゴリズムを提案する。
提案手法の有効性を6つの逆問題に適用した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:31:00 GMT)
FinCon: A Synthesized LLM Multi-Agent System with Conceptual Verbal Reinforcement for Enhanced Financial Decision Making [28.4] 大規模言語モデル(LLM)は、複雑なタスクの実行において顕著な可能性を示し、様々な金融アプリケーションでますます活用されている。
本稿では,多様なFINancialタスクに適した概念的言語強化を備えたLLMベースのマルチエージェントフレームワークであるFinConを紹介する。
FinConのリスクコントロールコンポーネントは、体系的な投資信条を更新するための自己基準機構をエピソード的に開始することで、意思決定の品質を高める。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 00:54:30 GMT)
Semantic-Aware Resource Management for C-V2X Platooning via Multi-Agent Reinforcement Learning [28.4] 本稿では,マルチエージェント強化学習(MARL)を用いたマルチタスクのための意味認識型マルチモーダルリソースアロケーション(SAMRA)を提案する。
提案手法はセマンティック情報を利用して通信資源の割り当てを最適化する。
C-V2X小隊シナリオにおけるQoE(Quality of Experience)と通信効率の大幅な向上を実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:55:35 GMT)
Can CDT rationalise the ex ante optimal policy via modified anthropics? [28.3] 我々は、Newcombのような一般的な問題を考慮し、合理的な自己配置の信念を形成しようとする。
我々は、世界をエージェントの動作シミュレーションとしてモデル化するアプローチを検討する。
我々は、ある条件下では、これらが元最適ポリシーを含むことを証明している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:23:38 GMT)
NaturalConv: A Chinese Dialogue Dataset Towards Multi-turn Topic-driven Conversation [28.1] 本稿では,中国におけるマルチターン話題駆動型会話データセットであるNaturalConvを提案する。
私たちのコーパスには、6つのドメインからの19.9Kの会話と、平均20.1のターン数で400Kの発話が含まれています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:08:46 GMT)
Watching the Watchers: Exposing Gender Disparities in Machine Translation Quality Estimation [28.0] 男性求心性翻訳は女性求心性翻訳よりも高く、性中立性翻訳はペナル化される。
コンテキスト対応のQEメトリクスは、男性らしい参照のエラーを減らすが、女性参照の対処に失敗する。
この結果から,QE指標の男女差に対処する必要性が示唆された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:50:46 GMT)
Towards Open Respiratory Acoustic Foundation Models: Pretraining and Benchmarking [27.7] 呼吸器オーディオは幅広い医療応用の予測力を持っているが、現在はまだ探索されていない。
OPERA(OPEn Respiratory Acoustic foundation model Pretraining and benchmarking system)を紹介する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:23:59 GMT)
Instruct, Not Assist: LLM-based Multi-Turn Planning and Hierarchical Questioning for Socratic Code Debugging [27.7] ソクラテス質問は効果的な教育戦略であり、批判的思考と問題解決を奨励する。
TreeInstructは、学生が個別にエラーを特定し、解決するのを助けるために、探索的な質問をする。
学生の概念的・統語的知識を推定し、その反応と現在の知識状態に基づいて質問ツリーを動的に構築する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:00:14 GMT)
Maximizing User Connectivity in AI-Enabled Multi-UAV Networks: A Distributed Strategy Generalized to Arbitrary User Distributions [27.6] 本稿では,未知のユーザパターンを持つ環境における分散ユーザ分布について検討する。
最適化を容易にするために,マルチエージェントCNN拡張ディープラーニング(CDQL)アルゴリズムを提案する。
学習効率を向上し、最適な局所性を避けるため、生のUDを連続密度マップに変換するヒートマップを開発した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:10:54 GMT)
BhasaAnuvaad: A Speech Translation Dataset for 14 Indian Languages [27.3] インド語における広く使われている自動音声翻訳システムの性能を評価する。
口語と非公式の言語を正確に翻訳できるシステムが存在しないことは顕著である。
BhasaAnuvaadを紹介します。これは、14の予定のインド言語を含む、AST用の最大の公開データセットです。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:33:34 GMT)
Optimal Allocation of Pauli Measurements for Low-rank Quantum State Tomography [26.8] 量子状態トモグラフィ(QST)の鍵となる課題は、再構成の精度が測定に使用される状態コピーの数に依存するかを知ることである。
我々は,QSTにおける測定設定数と繰り返し測定回数とのトレードオフに関する理論的理解を確立する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:59:04 GMT)
Perceptions of Linguistic Uncertainty by Language Models and Humans [26.7] 言語モデルが不確実性の言語表現を数値応答にどうマッピングするかを検討する。
10モデル中7モデルで不確実性表現を確率的応答に人間的な方法でマッピングできることが判明した。
この感度は、言語モデルは以前の知識に基づいてバイアスの影響を受けやすいことを示している。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 17:33:37 GMT)
Wave Network: An Ultra-Small Language Model [26.7] 本稿では,新しい超小言語モデルであるWave Networkにおいて,革新的なトークン表現と更新手法を提案する。
具体的には、複雑なベクトルを用いて各トークンを表現し、入力テキストのグローバルな意味論とローカルな意味論の両方を符号化する。
AG Newsテキスト分類タスクの実験では、ランダムなトークン埋め込みから複雑なベクトルを生成する場合、波動干渉で90.91%、波動変調で91.66%の精度が得られる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:38:41 GMT)
Neuro-Symbolic AI: Explainability, Challenges, and Future Trends [26.7] 本稿では,2013年度の191研究におけるモデル設計と行動の両面を考慮した説明可能性の分類を提案する。
我々は,表現の相違をブリッジする形態が可読かどうかを考慮し,これらを5つのカテゴリに分類する。
我々は、統一表現、モデル説明可能性の向上、倫理的考察、社会的影響の3つの側面で将来の研究を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:54:35 GMT)
Bridging the Gap: Representation Spaces in Neuro-Symbolic AI [26.7] ニューロシンボリックAIは、ニューラルネットワークとシンボリックラーニングの利点を組み合わせることで、AIモデルの全体的なパフォーマンスを改善する効果的な方法である。
我々は,2013年からの191の研究では,4段階の分類フレームワークを構築した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:10:44 GMT)
MegaPortrait: Revisiting Diffusion Control for High-fidelity Portrait Generation [26.5] MegaPortraitはコンピュータビジョンでパーソナライズされた肖像画を作成する革新的なシステムである。
Identity Net、Shading Net、Harmonization Netの3つのモジュールがある。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:30:30 GMT)
Typicalness-Aware Learning for Failure Detection [26.2] ディープニューラルネットワーク(DNN)は、しばしば自信過剰な問題に悩まされる。
そこで本研究では,本問題に対処し,故障検出性能を向上させるために,S typicalness-Aware Learning (TAL) と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:10:10 GMT)
SS3DM: Benchmarking Street-View Surface Reconstruction with a Synthetic 3D Mesh Dataset [26.0] ストリートビューシナリオのための正確な3D表面の再構築は、デジタルエンターテイメントや自動運転といったアプリケーションにとって不可欠である。
CARLAシミュレータからエクスポートしたtextbfSynthetic textbfStreet-view textbf3D textbfMeshモデルからなるSS3DMデータセットを提案する。
6台のRGBカメラと5台のLiDARセンサーを搭載した車両を、多様な屋外シーンで仮想的に駆動する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:37:50 GMT)
Robust Classification by Coupling Data Mollification with Label Smoothing [25.7] 本稿では,ラベルのスムーズ化を図り,ラベルの信頼度を画像劣化と整合させることにより,画像のノイズ化とぼやけという形でデータモリフィケーションを結合する手法を提案する。
CIFARおよびTinyImageNetデータセットの劣化画像ベンチマークにおいて、ロバスト性および不確実性の向上を実証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:23:34 GMT)
Towards Unifying Interpretability and Control: Evaluation via Intervention [25.5] 本稿では,解釈可能性の基本的な目標として介入を提案し,手法が介入を通してモデル動作をいかにうまく制御できるかを評価するために成功基準を導入する。
我々は4つの一般的な解釈可能性手法(オートエンコーダ、ロジットレンズ、チューニングレンズ、探索)を抽象エンコーダデコーダフレームワークに拡張する。
本稿では,介入成功率とコヒーレンス・インターベンショントレードオフの2つの新しい評価指標を紹介する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:52:18 GMT)
Statistical optimal transport [25.3] 本稿では,「Ecole d''Et'e de Probabilit's de Saint-Flour XLIX」の講義をもとに,統計的最適輸送の分野を紹介する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 16:31:48 GMT)
Video-Language Critic: Transferable Reward Functions for Language-Conditioned Robotics [25.2] Video-Language Criticは、簡単に利用可能なクロスボディデータに基づいてトレーニングできる報酬モデルである。
我々のモデルは、スパース報酬のみよりもメタワールドタスクにおける2倍のサンプル効率のポリシートレーニングを可能にします。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:40:54 GMT)
FreeCap: Hybrid Calibration-Free Motion Capture in Open Environments [25.2] 我々のシステムは、単一のLiDARと拡張可能な移動カメラを組み合わせることで、柔軟で正確な動き推定を可能にする。
特に,ローカル・グローバル・ポーズ・アウェア・クロスセンサー・ヒューマン・マッチング・モジュールについて紹介する。
我々の手法は最先端のシングルモーダル法よりも優れています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:39:50 GMT)
Kwai-STaR: Transform LLMs into State-Transition Reasoners [25.0] 我々は,LLMを状態遷移共振器に変換するKwai-STaRフレームワークを提案する。
本実験は, Kwai-STaR の有効性を検証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:38:25 GMT)
DynaMem: Online Dynamic Spatio-Semantic Memory for Open World Mobile Manipulation [25.0] DynaMemは、ロボットの環境を表現するために動的ワークセマンティックメモリを使用する、オープンソースのモバイル操作に対する新しいアプローチである。
DynaMemの力で、私たちのロボットは、新しい環境を探索し、記憶にない物体を探し出し、オブジェクトが動いたり、現れたり、消えたりするにつれて、記憶を継続的に更新することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:27 GMT)
Clustering in Causal Attention Masking [24.8] この研究は、ジェシコフスキーらによって提案された自己注意のダイナミクス(arXiv:2312.10794)を改良し、生成AIのためのトランスフォーマーアーキテクチャで使用される、実用的な、因果的にマスクされた注意を反映させるものである。
この相互作用する粒子系への修正は平均場勾配流と解釈することはできない。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:56:37 GMT)
Abstracted Shapes as Tokens -- A Generalizable and Interpretable Model for Time-series Classification [24.2] 時系列表現学習と分類のための事前学習,一般化,解釈可能なモデルであるVQShapeを提案する。
時系列データに新しい表現を導入することで、VQShapeの潜在空間と形状レベルの特徴との接続を構築できる。
分類タスクでは、VQShapeの表現を使って解釈可能な分類器を構築することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:07:17 GMT)
An Improved CNN-based Neural Network Model for Fruit Sugar Level Detection [24.1] 我々は,果実の可視/近赤外(V/NIR)スペクトルに基づいて,ニューラルネットワーク(ANN)を用いた果実糖度推定のための回帰モデルを構築した。
果実糖濃度を検出対象として,Gan Nan Navel と Tian Shan Pear の2種類の果実データを収集し,その比較実験を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:05:52 GMT)
Adversarial Robustness of In-Context Learning in Transformers for Linear Regression [23.7] 本研究は,線形回帰タスクの設定に焦点をあてたテキストハイザック攻撃に対するトランスフォーマにおける文脈内学習の脆弱性について検討する。
まず,一層線形変圧器が非破壊的であり,任意の予測を出力できることを示す。
次に, 逆行訓練は, ファインタニング時にのみ適用しても, ハイジャック攻撃に対するトランスフォーマーの堅牢性を高めることを実証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:25:58 GMT)
D$^3$epth: Self-Supervised Depth Estimation with Dynamic Mask in Dynamic Scenes [23.7] D$3$epthは動的シーンにおける自己教師付き深度推定の新しい手法である。
これは2つの重要な視点から、動的オブジェクトの課題に取り組む。
既存の自己教師付き単分子深度推定ベースラインよりも一貫して優れています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:07:00 GMT)
Solving Hidden Monotone Variational Inequalities with Surrogate Losses [23.6] 本稿では,変分不等式(VI)問題の解法として,ディープラーニングに適合する原理的な代理型アプローチを提案する。
提案手法は,予測ベルマン誤差の最小化と最小化に有効であることを示す。
深層強化学習では,より計算的かつ効率的なTD(0)の新たな変種を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:42:08 GMT)
Hardware and Software Platform Inference [23.4] textittextbfハードウェアとソフトウェアプラットフォーム推論(HSPI)を導入する。
HSPIは、(ブラックボックス)機械学習モデルの基盤となるGPUアーキテクチャとソフトウェアスタックを特定する。
ランダムな推測精度よりも最大3倍高い結果が得られる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:44:04 GMT)
HealthQ: Unveiling Questioning Capabilities of LLM Chains in Healthcare Conversations [23.1] デジタル医療において、大きな言語モデル(LLM)は質問応答能力を高めるために主に利用されてきた。
本稿では,LLMヘルスケアチェーンの問合せ能力を評価するための新しいフレームワークであるHealthQを提案する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:05:18 GMT)
Birdie: Advancing State Space Models with Reward-Driven Objectives and Curricula [23.1] 状態空間モデル(SSM)はトランスフォーマーよりも利点があるが、長期のコンテキスト内検索のようなテキストコピー、連想リコール、質問応答を必要とするタスクに苦労する。
本研究では,SSMのコンテキスト内検索能力を大幅に向上する新たな学習手法であるBirdieを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:23:14 GMT)
Statistical-Computational Trade-offs for Greedy Recursive Partitioning Estimators [23.1] 我々は,高次元回帰のためのグリーディアルゴリズムが局所最適点において立ち往生していることを示す。
低推定誤差を達成するために、greedyトレーニングには$exp(Omega(d))$が必要であることを示す。
また、greedyトレーニングは、O(log d)$サンプルだけで小さな推定誤差が得られることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:11:53 GMT)
FineTuneBench: How well do commercial fine-tuning APIs infuse knowledge into LLMs? [22.9] FineTuneBenchは、商用の微調整APIがいかに新しい知識や更新知識を学べるかを理解するための評価フレームワークであり、データセットである。
GPT-4oやGemini 1.5 Proなど,市販のファインチューニングAPIを用いて,5つのフロンティア大言語モデル(LLM)を分析した。
本結果から,全モデルにおいて,ファインチューニングにより新たな情報を効果的に学習する能力において,平均一般化精度が37%の欠点が明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:22:14 GMT)
Inverse Transition Learning: Learning Dynamics from Demonstrations [22.9] 我々は、オフラインモデルに基づく強化学習の文脈において、準最適専門家軌道から遷移力学を$T*$で推定する問題を考察する。
我々は,専門家の軌跡の限られた範囲を表現として扱う,制約に基づく逆遷移学習法を開発した。
我々は意思決定において重要な改善を示すだけでなく、転送が成功するかどうかを後部から知ることができることを実証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:27:29 GMT)
Prompt-Based Spatio-Temporal Graph Transfer Learning [22.9] 本稿では,データスカース領域における多変数タスクに適応可能なプロンプトベースのフレームワークを提案する。
2段階のパイプラインでドメインとタスクの転送を実現するために、学習可能なプロンプトを採用しています。
実験の結果,STGPは3つのタスクの予測,クリギング,外挿において,最先端のベースラインよりも10.7%向上していることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:41:07 GMT)
TableGPT2: A Large Multimodal Model with Tabular Data Integration [22.8] TableGPT2は、593.8K以上のテーブルと2.36Mの高品質なクエリテーブル出力を備えた、厳格に事前訓練および微調整されたモデルである。
TableGPT2の重要な革新の1つは、スキーマレベルとセルレベルの情報をキャプチャするために特別に設計されたテーブルエンコーダである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:32:44 GMT)
Interpreting CLIP: Insights on the Robustness to ImageNet Distribution Shifts [22.7] 種々のバックボーンと事前学習セットを持つ16の頑健なゼロショットCLIPビジョンエンコーダの表現空間を探索する。
頑健なゼロショットCLIPビジョンエンコーダにおいて、オフリー機能の存在を検知し、これらが非トランスフォーマーモデルで観測されるのはこれが初めてである。
我々は、モデルにおけるImageNetシフトのロバスト性を示すために、外部機能が存在することを発見した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:40:09 GMT)
Scaling Laws for Pre-training Agents and World Models [22.7] エンボディエージェントの性能は、モデルパラメータ、データセットサイズ、計算量を増やして改善されている。
本稿では,これらの課題におけるスケールの役割を,より正確に評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:57:40 GMT)
SG-I2V: Self-Guided Trajectory Control in Image-to-Video Generation [22.7] 画像からビデオへ生成する方法は、印象的な、写真リアリスティックな品質を実現した。
オブジェクトの動きやカメラの動きなど、生成されたビデオの特定の要素を調整することは、しばしば試行錯誤の面倒なプロセスである。
本稿では,自己誘導画像生成のためのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:56:11 GMT)
Multi-Lattice Sampling of Quantum Field Theories via Neural Operator-based Flows [22.3] いくつかの作用に対応するボルツマン分布から格子上の格子場構成をサンプリングする問題を考える。
本稿では,時間積分が自由理論と対象理論の関数分布のマッピングを提供する時間依存ニューラル演算子を近似することを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:29:41 GMT)
DimensionX: Create Any 3D and 4D Scenes from a Single Image with Controllable Video Diffusion [22.1] DimensionXは、ビデオ拡散を伴う単一の画像から3Dと4Dのシーンを生成するように設計されたフレームワークである。
提案手法は,3次元シーンの空間構造と4次元シーンの時間的進化の両方が,映像フレームのシーケンスを通して効果的に表現できるという知見から始まった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:07:31 GMT)
Intellectual Property Protection for Deep Learning Model and Dataset Intelligence [21.8] この研究は、一般的な、スキーム固有のパフォーマンス評価指標を体系的に要約する。
プロアクティブIP侵害防止とリアクティブIP所有権検証の観点から、既存のIPP手法を包括的に調査し分析する。
最後に、革新的な研究のガイドとして機能するであろう将来的な方向性の見通しを概説する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:02:41 GMT)
Fuzzy K-Means Clustering without Cluster Centroids [21.3] ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:59:23 GMT)
A Bayesian Mixture Model of Temporal Point Processes with Determinantal Point Process Prior [21.2] 非同期イベントシーケンスクラスタリングは、教師なしの方法で類似のイベントシーケンスをグループ化することを目的としている。
私たちの研究は、イベントシーケンスクラスタリングのためのフレキシブルな学習フレームワークを提供し、潜在的なクラスタ数の自動識別を可能にします。
これは、ニューラルネットワークベースのモデルを含む幅広いパラメトリック時間点プロセスに適用できる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:21:30 GMT)
Centrality Graph Shift Operators for Graph Neural Networks [21.1] 我々は,グローバルな集中度指標による隣接行列の正規化を行う中心性GSO(CGSO)について検討した。
CGSOがどんなグラフニューラルネットワークでもメッセージパッシング演算子として機能するかを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:32:24 GMT)
Pre-Finetuning for Few-Shot Emotional Speech Recognition [20.9] 我々は話者適応を数発の学習問題と見なしている。
そこで本研究では,知識を数発の下流分類対象に抽出する難解な課題に対する事前学習音声モデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:44:43 GMT)
HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images [20.8] このような不正な手を取り戻すためのHandCraftを提案する。
これは、手のためのマスクと奥行き画像を自動的にコンディショニング信号として構築することで実現される。
我々のプラグアンドプレイハンド修復ソリューションは、既存の事前訓練拡散モデルと互換性がある。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:14:39 GMT)
Distributionally robust risk evaluation with an isotonic constraint [20.7] 分布的に堅牢な学習は、不確実な分布の集合内で最悪のケースの統計性能を制御することを目的としている。
本稿では,未知のターゲット分布が推定値と異なる方法に関する事前情報を組み込んだDRLの形状制約手法を提案する。
合成データと実データの両方に関する実証研究は、提案した形状制約手法の精度の向上を実証している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:09:12 GMT)
Bayesian Calibration of Win Rate Estimation with LLM Evaluators [20.6] 本研究では,大言語モデル(LLM)を評価対象として,勝利率推定の精度を向上させる2つの手法を提案する。
我々は,ストーリ生成,要約,タスクの指示を含む6つのデータセット上で,我々の手法を実証的に検証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:32:40 GMT)
STAND-Guard: A Small Task-Adaptive Content Moderation Model [20.5] 本稿では,Small Task-Adaptive CoNtent MoDerationモデルであるSTAND-GUARDを提案する。
基本的な動機は、様々なコンテンツモデレーションタスクでインストラクションチューニングを行うことで、目に見えない(配布外)コンテンツモデレーションタスクで小さな言語モデル(SLM)のパワーを解き放つことができることである。
STAND-Guardは、40以上の公開データセット、および現実世界のビジネスシナリオから派生したプロプライエタリデータセットに比較して、GPT-3.5-Turboに匹敵することを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:19:24 GMT)
Differentiable Gaussian Representation for Incomplete CT Reconstruction [20.4] ニューラルネットやフルドーズCTデータを使わずに,新しいGaussian Representation for Incomplete CT Reconstruction (GRCT)を提案する。
アーキテクチャを変更することなく、複数のビューや角度に適用することができる。
複数のデータセットと設定の実験では、再構築品質のメトリクスと高い効率が大幅に改善された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:32:29 GMT)
Private Algorithms for Stochastic Saddle Points and Variational Inequalities: Beyond Euclidean Geometry [20.1] 我々は、$(epsilon,delta)$-differential privacy(DP)の制約の下で、サドル点問題(SSP)と変分不等式(SVI)を研究する。
強いSPギャップ上の$tildeObig(frac1sqrtn + fracsqrtdnepsilonbig)$のバウンドを得る。
我々は、$の強いVI-ギャップ上の有界値を得る最初の解析を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:45:05 GMT)
GENOT: Entropic (Gromov) Wasserstein Flow Matching with Applications to Single-Cell Genomics [20.0] 単細胞ゲノム学は、細胞行動の理解を深め、治療や精密医療の革新を触媒している。
従来の離散的なソルバは、スケーラビリティ、プライバシ、サンプル外推定の問題によって妨げられています。
我々は、OTマップをパラメータ化するニューラルネットワークベースの解法である、ニューラルOTソルバを提案する。
本研究は, 細胞開発研究, 細胞性薬物応答モデリング, 細胞間翻訳への応用を通じて, その汎用性と堅牢性を実証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:14:38 GMT)
DN-Splatter: Depth and Normal Priors for Gaussian Splatting and Meshing [19.4] カラー画像の勾配に基づく適応的な深度損失を提案し、様々なベースライン上での深度推定と新しいビュー合成結果を改善した。
我々の単純かつ効果的な正則化技術はガウス表現からの直接メッシュ抽出を可能にし、屋内シーンのより物理的に正確な再構築を可能にする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:34:24 GMT)
GTA: Generative Trajectory Augmentation with Guidance for Offline Reinforcement Learning [19.2] Generative Trajectory Augmentation (GTA) は、トラジェクトリを高次かつ動的に検証可能なように拡張することで、オフラインデータを豊かにするように設計されている。
以上の結果から,GTAは汎用的なデータ拡張戦略として,広く使用されているオフラインRLアルゴリズムの性能向上を図っている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:24:18 GMT)
Stem-OB: Generalizable Visual Imitation Learning with Stem-Like Convergent Observation through Diffusion Inversion [19.0] 我々は,事前学習した画像拡散モデルを用いて低レベルの視覚的差を抑えるStem-OBを提案する。
この画像逆転過程は、観測結果を共有表現に変換するのと似ている。
提案手法は, シンプルかつ高効率なプラグアンドプレイソリューションである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:56:16 GMT)
On Erroneous Agreements of CLIP Image Embeddings [18.9] MLLM(Multimodal Large Language Models)は,それらから異なる情報を抽出できることを示す。
CLIP画像埋め込みにおける抽出可能な情報は、CLIPの不十分な視覚言語アライメントによって明らかになる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:39:51 GMT)
An efficient dual-branch framework via implicit self-texture enhancement for arbitrary-scale histopathology image super-resolution [18.9] Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。
ISTEは、様々なスケーリング要因にわたる既存の固定スケールおよび任意のスケールのSRアルゴリズムより優れている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:58:50 GMT)
SciDFM: A Large Language Model with Mixture-of-Experts for Science [18.7] 我々は,SciDFMを紹介した。SciDFMは,スクラッチから訓練され,大学レベルの科学的推論を行うことができる。
ドメイン固有のデータベースのデータだけでなく、さまざまな分野の科学論文や書籍を含む大規模学習コーパスを収集する。
SciDFMはSciEvalやSciQなどの一般的な科学的ベンチマークにおいて高い性能を示し、類似サイズのモデル間のドメイン固有ベンチマークにおいてSOTA性能に達することを示す。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 05:38:31 GMT)
Peri-midFormer: Periodic Pyramid Transformer for Time Series Analysis [18.6] 時系列分析は、天気予報、異常検出、行動認識などの分野に広く応用されている。
従来の手法では1次元時系列を用いて時間変動を直接モデル化する試みがあった。
提案するPeri-midFormerは,5つの主流時系列解析タスクにおいて優れた性能を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:24:26 GMT)
Noisy Zero-Shot Coordination: Breaking The Common Knowledge Assumption In Zero-Shot Coordination Games [18.4] ゼロショットコーディネート (ZSC) は、新規パートナーと協調する強化学習 (RL) エージェントの研究に人気がある。
そこで本研究では,NZSC問題をZSC問題に還元する手法として,DEC-POMDPを基本構造とする拡張状態空間を持つメタデック-POMDPを設計する手法を提案する。
NZSCトレーニングでは、協調の(実際に)問題設定が一般的ではない場合でも、RLエージェントが新規パートナーとうまく協調するように訓練できることが示される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:50:14 GMT)
Enhancing Missing Data Imputation through Combined Bipartite Graph and Complete Directed Graph [18.1] BCGNN(Bipartite and Complete Directed Graph Neural Network)という新しいフレームワークを導入する。
BCGNN内では、観察と特徴は2つの異なるノードタイプとして区別され、観察された特徴の値はそれらをリンクする属性付きエッジに変換される。
並行して、完全な有向グラフセグメントは、機能間の複雑な相互依存性を網羅し、伝達する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:48:37 GMT)
Verification of Neural Networks against Convolutional Perturbations via Parameterised Kernels [18.1] 本研究では,ブラーリングやシャープニングなどの畳み込み摂動に対するニューラルネットワークの有効検証法を開発した。
入力摂動を定義するには、よく知られたカメラシェイク、ボックスのぼかし、カーネルをシャープする。
ニューラルネットワーク検証におけるそれらの使用を容易にするため、パラメータ化されたカーネルで与えられた入力を効果的に結合する方法を開発した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:25:20 GMT)
NeuroFly: A framework for whole-brain single neuron reconstruction [17.9] 本稿では,大規模な単一ニューロン再構築のための検証フレームワークであるNeuroFlyを紹介する。
NeuroFlyはプロセスを、セグメンテーション、接続、証明の3つのステージに分割する。
私たちの目標は、ニューロン再構築の課題に取り組むために、研究者間のコラボレーションを促進することです。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:56:13 GMT)
Robust and Efficient Fine-tuning of LLMs with Bayesian Reparameterization of Low-Rank Adaptation [17.8] 大規模言語モデル(LLM)は、その巨大なサイズのため、リソース集約性が高いため、微調整が可能である。
本稿では,評価器の分散を低減し,最終的なモデル出力の安定性を高めるために,低ランク微調整における効果的なパラメータ化の重要性を強調した。
提案手法はモンテカルロ推定法を用いて,低次パラメータの非バイアス後推定を低次分散で学習する手法である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:31:48 GMT)
Sampling-guided Heterogeneous Graph Neural Network with Temporal Smoothing for Scalable Longitudinal Data Imputation [17.8] そこで本研究では,Samping-Guided Heterogeneous Graph Neural Network (SHT-GNN) を提案する。
主観的なミニバッチサンプリングと多層時間平滑化機構を活用することで、SHT-GNNは大規模データセットに効率よくスケールする。
Alzheimer's Disease Neuroimaging Initiative (ADNI)データセットを含む、合成と実世界の両方のデータセットの実験は、SHT-GNNが既存の計算方法を大幅に上回っていることを実証している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:41:07 GMT)
Enabling Efficient On-Device Fine-Tuning of LLMs Using Only Inference Engines [17.5] 大規模言語モデル(LLM)は現在、大規模なクラウドサーバ上で事前トレーニングされ、微調整されている。
次のフロンティアはLLMパーソナライズであり、ファンデーションモデルをユーザ/タスク固有のデータで微調整することができる。
リソース制約のあるエッジデバイスの微調整は、かなりのメモリと計算要求のために大きな課題となる。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 01:52:17 GMT)
Security and Privacy on Generative Data in AIGC: A Survey [17.5] 我々はAIGCにおける生成データのセキュリティとプライバシについてレビューする。
プライバシ、制御性、信頼性、コンプライアンスの基本的な性質の観点から、最先端の対策が成功した経験を明らかにする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:39:07 GMT)
Enhancing Investment Analysis: Optimizing AI-Agent Collaboration in Financial Research [17.4] 本研究では,金融投資研究における意思決定の促進を目的とした,新たなマルチエージェントコラボレーションシステムを提案する。
ダウ・ジョーンズ指数にリストされた30社のうち、2023年のSEC10-Kの形式を分析して、ファンダメンタルズ、市場のセンチメント、リスク分析という3つのサブタスクに注目します。
この結果から,AIエージェントのタスク設定によるパフォーマンスの大幅な変化が判明した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:28:20 GMT)
Multivariate Probabilistic Time Series Forecasting with Correlated Errors [17.2] 本稿では,自動回帰モデルのための複数ステップでエラーの共分散構造を学習するプラグイン・アンド・プレイ手法を提案する。
RNNとTransformerアーキテクチャ上に構築された確率モデルについて,本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:38:23 GMT)
FinTeamExperts: Role Specialized MOEs For Financial Analysis [17.1] 我々は、金融分析のためのMixture of Experts (MOEs) として構成されたロール特化LDMフレームワークであるFinTeamExpertsを提示する。
このフレームワークは、マクロアナリスト、マイクロアナリスト、量的アナリストといった、異なる役割を専門とする各モデルをトレーニングすることで、協力的なチーム設定をシミュレートする。
我々は、異なるコーパス上の3つの8ビリオンパラメータモデルを訓練し、それぞれが特定の金融関連の役割に長けている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:11:04 GMT)
Differentially Private Continual Learning using Pre-Trained Models [17.1] 本研究は,連続学習(CL)と差分プライバシー(DP)の交わりについて考察する。
本稿では,学習環境におけるプライバシとパフォーマンスのトレードオフを解決するために,事前学習モデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:08:06 GMT)
Representing Domain-Mixing Optical Degradation for Real-World Computational Aberration Correction via Vector Quantization [17.1] 既存の学習に基づく計算収差補正(CAC)手法は、複雑で多面的な合成ドメイン間ギャップに直面している。
我々は、教師なしドメイン適応(UDA)の観点から、現実世界のCACに関する新しい洞察を提供する。
本稿では,QDMR(Quantized Domain-Mixing Representation)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:11:02 GMT)
ChartifyText: Automated Chart Generation from Data-Involved Texts via LLM [16.9] 科学研究、経済、公衆衛生、ジャーナリズムなどの様々な応用において、関連する数値を持つ文書が広く使われている。
この研究のギャップを埋めるために、この研究はグラフを自動的に生成し、基礎となるデータとアイデアを読者に正確に伝えることを目的としている。
本稿では,Large Language Models (LLMs) を利用して複雑なデータ関連テキストを表現型チャートに変換する,新しい完全自動化アプローチであるChartifyTextを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:48:18 GMT)
Towards Robust Federated Analytics via Differentially Private Measurements of Statistical Heterogeneity [16.7] 差分プライバシーの研究において、統計的に異質なデータセットを使用することで精度が著しく低下することはよくある問題である。
統計的不均一性を測る最も有望な3つの方法を探索し、その正確性について公式を与える。
我々は,ルート探索手法を組み込んだ分析機構を用いて,最適プライバシーパラメータを求める。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:03:44 GMT)
Generalizable Single-Source Cross-modality Medical Image Segmentation via Invariant Causal Mechanisms [16.7] 単一ソースドメインの一般化は、見当たらないターゲットドメインをうまく一般化できる単一のソースドメインからモデルを学ぶことを目的としている。
これはコンピュータビジョンにおいて重要なタスクであり、特にドメインシフトが一般的である医療画像に関係している。
我々は,領域不変表現の学習に関する因果性に着想を得た理論的洞察と拡散に基づく拡張の最近の進歩を組み合わせることにより,多様な画像モダリティの一般化を向上する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:35:17 GMT)
How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis [16.7] 大きな言語モデル(LLM)は、計画と推論を必要とするタスクで素晴らしいパフォーマンスを示しています。
そこで本研究では,複雑な論理的推論を行うネットワークの能力の基盤となる内部メカニズムについて検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:50:19 GMT)
GeNIe: Generative Hard Negative Images Through Diffusion [16.6] 生成AIの最近の進歩により、自然画像に似たデータを生成する、より洗練された拡張技術が実現された。
本稿では,テキストプロンプトに条件付き潜伏拡散モデルを利用した新しい拡張手法であるGeNIeを紹介する。
本実験は,本手法の有効性と先行技術よりも優れた性能を示すものである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:44:38 GMT)
Don't Look Twice: Faster Video Transformers with Run-Length Tokenization [16.6] Run-Length Tokenization (RLT) は、データ圧縮のラン長符号化にインスパイアされたビデオトランスフォーマーを高速化するシンプルな手法である。
提案手法では,異なるデータセットのチューニングを必要とせず,高速かつ無視できないオーバーヘッドを発生させる。
RLTは30FPS以上のトレーニングを100%以上スピードアップし、より長いビデオデータセットでは、トークン数を最大80%削減することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:32:12 GMT)
Automaton Distillation: Neuro-Symbolic Transfer Learning for Deep Reinforcement Learning [16.3] 強化学習(Reinforcement Learning, RL)は、シーケンシャルな意思決定プロセスにおいて最適なポリシーを見つけるための強力なツールである。
実践的なRL問題に必要とされるエージェントエクスペリエンスの収集は違法にコストがかかり、学習されたポリシーはトレーニングデータ分布外のタスクに対する一般化が不十分である。
本稿では,教師からのQ値推定を,オートマトンという形で低次元の表現に蒸留する,ニューロシンボリック・トランスファー学習の形式であるオートマトン蒸留を導入する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:38:34 GMT)
Uniformity testing when you have the source code [16.2] 古典回路や量子回路の出力確率分布の特性を検証するための量子アルゴリズムについて検討する。
出力分布が全変動距離から$[d]$または$epsilon$-farで均一であるかどうかを決定する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:48:29 GMT)
Trusting Your AI Agent Emotionally and Cognitively: Development and Validation of a Semantic Differential Scale for AI Trust [16.1] 感情的・認知的信頼のための27項目のセマンティック・ディファレンシャル・スケールを開発し,検証した。
我々の経験的発見は、信頼の感情的側面と認知的側面が相互にどのように相互作用し、AIエージェントに対する個人の全体的な信頼を形成するかを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:34:20 GMT)
The State and Fate of Summarization Datasets [16.0] 100以上の言語で133のデータセットにまたがる大規模な作業を調査します。
低リソース言語でアクセス可能な高品質なデータセットが欠如しているなど、重要な観察を行います。
また、ユーザが対話し、オントロジーやデータセットの収集を探索できるWebインターフェースも提供しています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:11:38 GMT)
ProverbEval: Exploring LLM Evaluation Challenges for Low-resource Language Understanding [15.9] ProverbEvalは,証明に基づく低リソース言語の評価ベンチマークである。
様々なLCMをベンチマークし、ベンチマークプロセスにおける変数を生成する要因を探索する。
我々は、選択の順序、プロンプト言語の選択、タスクの可変性、生成タスクに特別な注意を払わなければならないと論じている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:34:48 GMT)
End-to-end Inception-Unet based Generative Adversarial Networks for Snow and Rain Removals [15.8] 深層学習は、雪や雨のような大気の粒子を単一の画像から取り除くことにアプローチし、古典的なものよりもその使用を好んでいる。
しかし、深層学習に基づくアプローチは、サイズ、タイプ、透明性といった粒子の外観の特徴に関連する課題に依然として悩まされている。
本稿では,各粒子を個別に除去するGAN(Generative Adversarial Networks)とGAN(Generative Adversarial Networks)からなるグローバルフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:58:17 GMT)
MAG-SQL: Multi-Agent Generative Approach with Soft Schema Linking and Iterative Sub-SQL Refinement for Text-to-SQL [15.8] 近年,テキスト・トゥ・コンテクスト・タスクにおいて,インコンテキスト・ラーニングに基づく手法が顕著な成功を収めている。
これらのモデルのパフォーマンスと、複雑なデータベーススキーマを持つデータセット上でのヒューマンパフォーマンスとの間には、依然として大きなギャップがあります。
本フレームワークでは,データベース内の列の選択にテーブルの要約を含むエンティティベースの手法を用い,それらの複雑な質問を分解するために,新たな目標条件分解手法を導入する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:37:51 GMT)
Anonymous Public-Key Quantum Money and Quantum Voting [15.8] 量子マネースキームにおけるプライバシの形式的定義を開発する。
次に、これらのセキュリティ概念を満たす最初の公開鍵量子マネースキームを構築する。
量子力学の結果、非閉鎖原理は古典的に不可能なセキュリティ保証を備えたスキームの構築を可能にすることを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:21:28 GMT)
AMSnet-KG: A Netlist Dataset for LLM-based AMS Circuit Auto-Design Using Knowledge Graph RAG [15.6] 大型言語モデル(LLM)は電子設計自動化(EDA)アプリケーションのための強力なツールとして登場した。
本稿では,様々なAMS回路スキーマとネットリストを含むデータセットであるAMSnet-KGを紹介する。
LLMに埋め込まれた包括的知識を利用する自動AMS回路生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:49:53 GMT)
Plasticity Loss in Deep Reinforcement Learning: A Survey [15.5] 塑性は深層強化学習(RL)エージェントにとって不可欠である。
可塑性が失われると、データ分布の変化を考慮に入れないため、エージェントのパフォーマンスが低下する。
可塑性の喪失は、トレーニング不安定性、スケール失敗、過大評価バイアス、探検不足など、深いRLを悩ませる多くの問題と結びつくことができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:13:54 GMT)
Cross- and Intra-image Prototypical Learning for Multi-label Disease Diagnosis and Interpretation [15.3] 医用画像からの正確なマルチラベル診断と解釈のためのクロスタイプおよびイントライメージ型学習フレームワークを提案する。
本稿では,一貫性のある画像内情報を効果的に活用し,解釈の堅牢性と予測性能を向上させる2段階アライメントに基づく新たな正規化戦略を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:46:01 GMT)
On the Rigour of Scientific Writing: Criteria, Analysis, and Insights [15.1] リグールは、結果と結果の妥当性と妥当性を保証するため、科学的研究に不可欠である。
我々は、厳格な基準を自動的に識別し定義するためのボトムアップなデータ駆動フレームワークを導入します。
我々のフレームワークはドメインに依存しないので、様々な分野の科学的厳密さの評価に合わせることができる。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 17:25:45 GMT)
Performative Reinforcement Learning with Linear Markov Decision Process [14.8] 提案手法がマルコフ決定過程の報酬と遷移の両方に影響を及ぼすような表現的強化学習の設定について検討する。
大規模MDPの主要な理論モデルであるEmphlinear Markov決定過程を一般化する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:04:48 GMT)
Pruning the Path to Optimal Care: Identifying Systematically Suboptimal Medical Decision-Making with Inverse Reinforcement Learning [14.7] 本稿では, 同僚の行動に基づいて, 最適な臨床行為を識別する逆強化学習の新たな応用法を提案する。
このアプローチはIRLの2つの段階を中心とし、コンセンサスから大きく逸脱する行動を示す軌跡をプーンする中間段階を持つ。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:16:59 GMT)
Best Practices for Distilling Large Language Models into BERT for Web Search Ranking [14.6] LLM(Large Language Models)は、潜在的文書のランク付けリストを生成する。
LLMのランキングの専門知識をBERTのようなよりコンパクトなモデルに移行し、ランキングの損失を利用して、リソース集約の少ないモデルのデプロイを可能にします。
2024年2月現在,我々のモデルは商用ウェブ検索エンジンに統合されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:54:46 GMT)
Towards Improved Preference Optimization Pipeline: from Data Generation to Budget-Controlled Regularization [14.5] 我々は、嗜好データ生成と正規化の訓練技術について、より深く検討することで、嗜好最適化パイプラインの改善を目指している。
選好データ生成のために、ペアワイズ比較信号を用いて完了の選好ランキングを導出する反復的なペアワイズランキング機構を提案する。
正規化のトレーニングでは、LLMが好むサンプルの確率をわずかに減少させると、好みの最適化がよりよく収束する傾向が観察される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:03:11 GMT)
Finite-Sample and Distribution-Free Fair Classification: Optimal Trade-off Between Excess Risk and Fairness, and the Cost of Group-Blindness [14.4] グループフェアネス制約下の二項分類におけるアルゴリズムフェアネスとグループブレンドネスの強制効果を定量化する。
制御された過剰リスクを伴う分布自由かつ有限サンプルフェアネスを保証するフェア分類のための統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:46:19 GMT)
Rethinking Bradley-Terry Models in Preference-Based Reward Modeling: Foundations, Theory, and Alternatives [14.4] 報奨モデルにおけるBradley-Terryモデル(BT)モデルの使用の基礎を再考する。
我々は,下流最適化の観点から,BTモデルが必須選択ではないことを論じる。
既成のバイナリ分類器と互換性のある,単純で簡単な上行法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:57:03 GMT)
Sharp detection of the onset of Floquet heating using eigenstate sensitivity [14.4] 十分に低い駆動周波数のカオスフロケ系は、熱力学限界における無限温度アンサンブルまで加熱することが知られている。
本研究では,Floquet固有状態の無限小変形に対する感度(感受性)を提案する。
加熱開始付近の低周波では,Floquet固有状態は摂動に最も敏感であることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:11:52 GMT)
Discern-XR: An Online Classifier for Metaverse Network Traffic [14.3] 我々は、インターネットサービスプロバイダ(ISP)やルータメーカーがMetaverseサービスの品質を高めるのを支援するために、Disdisern-XRという独占的なMetaverseネットワークトラフィック分類器を設計する。
フレームベクトル表現アルゴリズム(FVR)とフレーム同定アルゴリズム(FIA)を併用して,生のネットワークデータから重要なフレーム関連統計データを抽出する。
A2R-OT(Augmentation, Aggregation, and Retention Online Training)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:07:49 GMT)
Online Relational Inference for Evolving Multi-agent Interacting Systems [14.3] オンライン推論(ORI)は、マルチエージェントインタラクションシステムの進化において、隠れた相互作用グラフを効率的に識別するように設計されている。
固定トレーニングセットに依存する従来のオフラインメソッドとは異なり、ORIはオンラインバックプロパゲーションを採用し、新しいデータポイント毎にモデルを更新する。
重要な革新は、AdaRelationと呼ばれる新しい適応学習技術によって最適化されたトレーニング可能なパラメータとして、隣接行列を使用することである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:54:07 GMT)
Pareto Set Identification With Posterior Sampling [14.1] 本稿では,PSIを有意な相関性を有する線形変換系で検討する。
既存のオラクルベースのアルゴリズムの計算コストを負担することなく,構造と相関を同時に扱うPSIPSアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:15:38 GMT)
Do Large Language Models Truly Grasp Mathematics? An Empirical Exploration From A Psychological Perspective [14.0] 近年の研究では、LLMが人間のような論理的推論を採用することを奨励することで、チェーン・オブ・シント・プロンプトが数学的推論を促進することが示唆されている。
以上の結果から,CoTプロンプトの使用にもかかわらず,最新のo1-previewモデルを含む主要なLLMは大きなエラー率を示し続けていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:25:04 GMT)
The impact of mobility, beam sweeping and smart jammers on security vulnerabilities of 5G cells [13.8] 攻撃を妨害する5Gネットワークの脆弱性が懸念されている。
本稿では,マルチジャマーが5Gセルの計測値,特にスループットと出力に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:45:15 GMT)
Toward Cultural Interpretability: A Linguistic Anthropological Framework for Describing and Evaluating Large Language Models (LLMs) [13.7] 本稿では,言語人類学と機械学習(ML)の新たな統合を提案する。
新たな調査分野、文化的解釈可能性(CI)の理論的実現可能性を示す。
CIは、言語と文化の間の動的関係がコンテキストに敏感でオープンな会話を可能にする方法を強調している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:01:50 GMT)
Pruning Literals for Highly Efficient Explainability at Word Level [13.2] Tsetlin Machine(TM)は、命題論理を用いた単語レベルの説明を提供する能力があるので、有望である。
本稿では,文中にランダムに置かれるリテラルを排除した節のポストホックプルーニングを設計する。
一般公開されたYELP-HATデータセットの実験では、提案されたプルーンドTMのアテンションマップが、バニラTMのアテンションマップよりも人間のアテンションマップと一致していることが示されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:28:38 GMT)
Experimental Secure Multiparty Computation from Quantum Oblivious Transfer with Bit Commitment [13.2] 不安定な転送をプリミティブ関数として使用することで、セキュアなマルチパーティ計算を実現することができる。
本稿では,量子セキュアな量子オブリバスト転送プロトコルの実験的実装について述べる。
実験では、2つの銀行が、他のデータを公開することなく、一般的な不審なアカウントを特定できる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:29:12 GMT)
UEVAVD: A Dataset for Developing UAV's Eye View Active Object Detection [13.2] 排除は、UAVベースの物体検出に挑戦する長年の困難である。
Active Object Detection (AOD)は、この目的を達成する効果的な方法を提供する。
我々は、UAV AOD問題の研究を促進するために、UAVの目視アクティブビジョンデータセットUEVAVDをリリースする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:10:05 GMT)
GPTKB: Building Very Large Knowledge Bases from Language Models [13.1] 我々は,大言語モデル(LLM)から大域的汎用KBを構築することを提案する。
プロトタイプとして、GPT-4o-miniを使用して、GPTKBを構築します。
NLPにとって、LLMの知識(または信念)に関するテキスト構築的な洞察を初めて提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:57:03 GMT)
GANESH: Generalizable NeRF for Lensless Imaging [13.0] GANESHは,レンズレス画像からの高精細化と新鮮視合成を実現するための新しいフレームワークである。
シーン固有のトレーニングを必要とする既存の方法とは異なり、本手法は各シーンで再トレーニングすることなく、オンザフライ推論をサポートする。
この領域の研究を容易にするために、最初のマルチビューレンズレスデータセットであるLenslessScenesも提示する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:47:07 GMT)
LightRAG: Simple and Fast Retrieval-Augmented Generation [12.9] Retrieval-Augmented Generation (RAG) システムは、外部知識ソースを統合することで、大規模言語モデル(LLM)を強化する。
既存のRAGシステムには、フラットなデータ表現への依存やコンテキスト認識の欠如など、大きな制限がある。
テキストインデックスと検索プロセスにグラフ構造を組み込んだLightRAGを提案する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 10:44:59 GMT)
EffiCANet: Efficient Time Series Forecasting with Convolutional Attention [12.8] EffiCANetは計算効率を維持しながら予測精度を向上させるように設計されている。
EffiCANetは最先端モデルに対するMAEの最大10.02%の削減を実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:54:42 GMT)
Fully Hyperbolic Rotation for Knowledge Graph Embedding [12.7] 知識グラフの埋め込みのために設計された,新しい完全双曲モデルを提案する。
我々のモデルは、知識グラフにおける各関係を、ヘッドエンティティからテールエンティティへのローレンツ回転とみなす。
我々のモデルはより少ないパラメータで競合する結果を得る。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:26:58 GMT)
Game-Theoretic Defenses for Robust Conformal Prediction Against Adversarial Attacks in Medical Imaging [12.6] 敵対的攻撃は、ディープラーニングモデルの信頼性と安全性に重大な脅威をもたらす。
本稿では,共形予測とゲーム理論の防衛戦略を統合する新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:20:04 GMT)
Towards Secured Smart Grid 2.0: Exploring Security Threats, Protection Models, and Challenges [12.6] 本稿では,電力網事業者,通信ネットワーク事業者,消費者の3つの利害関係者に対するセキュリティ脅威と防衛戦略について検討する。
調査を通じて、SG2のステークホルダーは特に、サブステーション攻撃/バンダリズム、マルウェア/ランサムウェアの脅威、ブロックチェーンの脆弱性、サプライチェーンの破壊に弱いことがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:52:08 GMT)
A Taxonomy of Multi-Layered Runtime Guardrails for Designing Foundation Model-Based Agents: Swiss Cheese Model for AI Safety by Design [12.6] 本稿では,多層ガードレールの特性と設計の選択肢を分類・比較するために,多層ガードレールの分類法を提案する。
ガードレール間の関係、それらが緩和するリスク、そしてエージェントアーキテクチャに影響を及ぼす品質特性を強調します。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 14:39:59 GMT)
Interpreting the Learned Model in MuZero Planning [12.5] MuZeroは、動的ネットワークを用いて、計画のための環境ダイナミクスを予測することで、様々なゲームで超人的なパフォーマンスを実現している。
本稿では,学習した潜伏状態の解釈により,MuZeroのモデルをデミスティフィケートすることを目的とする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:06:23 GMT)
ICH-SCNet: Intracerebral Hemorrhage Segmentation and Prognosis Classification Network Using CLIP-guided SAM mechanism [12.5] 脳内出血 (ICH) は脳卒中で最も致命的なサブタイプであり, 障害の発生頻度が高いことが特徴である。
既存のアプローチでは、これらの2つのタスクを独立して処理し、主にデータのみにフォーカスする。
本稿では,ICHセグメンテーションと予後分類の両方のために設計されたマルチタスクネットワークICH-SCNetを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:34:25 GMT)
AsEP: Benchmarking Deep Learning Methods for Antibody-specific Epitope Prediction [12.4] 抗体-抗原複合体構造データセット AsEP を導入する。
AsEPはその種類の中で最大であり、クラスタ化されたグループを提供する。
本稿では,タンパク質言語モデルとグラフニューラルネットワークによる構造モデリングの両方を活用する新しい手法WALLEを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:33:50 GMT)
TLCM: Training-efficient Latent Consistency Model for Image Generation with 2-8 Steps [12.4] 潜伏拡散モデル(LDM)を高速で採取できるものに蒸留することは、研究の関心を惹きつけている。
本稿では,これらの課題を克服するために,学習効率の高い遅延一貫性モデル(TLCM)を提案する。
A100 GPUでのトレーニング時間はわずか70時間で、SDXLから蒸留した3ステップのTLCMは、33.68のCLIPスコアと、MSCOCO-2017 5Kベンチマークで5.97の美的スコアを達成した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:29:26 GMT)
Integrating Large Language Models for Genetic Variant Classification [12.2] 大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:45:56 GMT)
Model and Deep learning based Dynamic Range Compression Inversion [12.0] DRCの反転は、元のダイナミクスを復元し、新しいミックスを生成したり、オーディオ信号の全体的な品質を改善するのに役立つ。
DRCインバージョンのためのニューラルネットワークを用いたモデルベースアプローチを提案する。
その結果,提案手法の有効性とロバスト性について,いくつかの最先端手法と比較した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:33:07 GMT)
Identifying Performance Issues in Cloud Service Systems Based on Relational-Temporal Features [11.8] クラウドシステムはパフォーマンスの問題の影響を受けやすいため、サービスレベルの合意違反や財政的損失を引き起こす可能性がある。
本稿では,メトリクスの相対的特徴と時間的特徴を併用した学習に基づく手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:03:49 GMT)
SciEval: A Multi-Level Large Language Model Evaluation Benchmark for Scientific Research [11.8] これらの問題に対処するための総合的・多分野評価ベンチマークSciEvalを提案する。
ブルームの分類に基づいて、SciEvalは科学的研究能力を体系的に評価する4つの次元をカバーしている。
主観的質問も主観的質問もSciEvalに含まれる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:20:46 GMT)
Evaluating the Economic Implications of Using Machine Learning in Clinical Psychiatry [11.7] 臨床精神医学における機械学習の利用に関する経済的な側面に関する文献はほとんどない。
本研究は,臨床精神医学におけるMLの経済的意義について検討した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:57:06 GMT)
SeafloorAI: A Large-scale Vision-Language Dataset for Seafloor Geological Survey [11.6] SeafloorAIは、5つの地質層にまたがる海底マッピングのための、初めてのAI対応データセットである。
このデータセットは、17,300平方キロメートルに及ぶ62の地理的分散データサーベイと、696Kソナー画像、827Kの注釈付きセグメンテーションマスク、696Kの詳細な言語記述で構成されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:41:32 GMT)
The Impact of Semi-Supervised Learning on Line Segment Detection [11.6] 本稿では,半教師付きフレームワークを用いた画像中の線分検出手法を提案する。
完全教師付き手法に匹敵する結果を示す。
本手法は,半教師付き学習のための近代的最先端手法を用いて,まず線検出を目標とすることを目的としている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:28:11 GMT)
Tiny Time Mixers (TTMs): Fast Pre-trained Models for Enhanced Zero/Few-Shot Forecasting of Multivariate Time Series [11.6] 本稿では,効率的な転送学習機能を備えたコンパクトモデルであるTiny Time Mixers (TTM)について紹介する。
TTMには、適応パッチ、多様な解像度サンプリング、およびさまざまなデータセット解像度の事前トレーニングを処理するための解像度プレフィックスチューニングなどのイノベーションが含まれている。
既存のベンチマークでは0/few-shot予測(4-40%)を上回り、計算要求を大幅に削減した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:07:22 GMT)
An Axiomatic Study of the Evaluation of Enthymeme Decoding in Weighted Structured Argumentation [11.6] 本稿では,ある基準に対するデコードを評価することを目的とした基準尺度の概念を紹介する。
このような測度を検証する必要があるので、公理と呼ばれるいくつかの望ましい性質を導入する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:26:54 GMT)
LoFi: Scalable Local Image Reconstruction with Implicit Neural Representation [11.5] 画像逆問題(LoFi)を解決するための座標ベースの局所処理フレームワークを提案する。
従来の画像再構成法とは異なり、LoFiは各座標でローカル情報を処理している。
LoFiは任意の連続座標で画像を復元することができ、複数の解像度で画像再構成が可能である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:58:57 GMT)
TAP-VL: Text Layout-Aware Pre-training for Enriched Vision-Language Models [11.5] TAP-VLは、光学文字認識情報を異なるモダリティとして扱い、任意のビジョン・ランゲージ(VL)モデルにシームレスに統合する。
実験は、トップパフォーマンスのVLモデルにTAP-VLを適用する際に、一貫した性能改善を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:54:01 GMT)
Emotion Classification in Low and Moderate Resource Languages [11.3] 世界中の人々の感情状態を分析することは重要である。
世界中で7100以上のアクティブ言語が話されており、各言語に対する感情分類を構築することは労働集約的である。
私たちは、Farsi、アラビア語、スペイン語、Ilocano、Odia、Azerbaijaniの6つの言語に対するアプローチの有効性を示します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:02:53 GMT)
Attack-Aware Noise Calibration for Differential Privacy [11.2] 差分プライバシー(DP)は、機密データに基づいて機械学習モデルをトレーニングする際のプライバシーリスクを軽減するために広く用いられるアプローチである。
プライバシとユーティリティのトレードオフを決定するため、追加されるノイズの規模は極めて重要です。
まず、ノイズスケールをプライバシー予算$varepsilon$に調整し、それからリスクを攻撃するためにepsilonを翻訳すると、過度に保守的なリスク評価につながることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:51:49 GMT)
Reshuffling Resampling Splits Can Improve Generalization of Hyperparameter Optimization [11.1] 驚くべきことに、各構成の分割をリシャッフルすることで、最終モデルの一般化性能が向上することが多い。
リシャッフルは固定スプリットの使用と競合するテストパフォーマンスをもたらすが、単一のトレインバリデーションのホールドアウトプロトコルの結果を大幅に改善する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:10:54 GMT)
Position Paper On Diagnostic Uncertainty Estimation from Large Language Models: Next-Word Probability Is Not Pre-test Probability [11.1] 大規模言語モデル(LLM)は、診断決定支援のために検討されている。
臨床的な意思決定に不可欠な事前検査の確率を推定する能力は依然として限られている。
本研究では,3つの診断タスクに関する電子的健康記録データを用いて,Mistral-7BとLlama3-70Bの2つのLSMを評価した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:39:04 GMT)
Entropy-regularized Diffusion Policy with Q-Ensembles for Offline Reinforcement Learning [11.0] 本稿では,オフライン強化学習(RL)のための訓練拡散政策の高度技術について述べる。
我々は、SDEが、オフラインデータセットの探索を改善するエントロピー正則化器(Entropy regularizer)を生成することで、ポリシーのログ確率を計算するのに使用できるソリューションを持っていることを示す。
オフラインRLにおけるエントロピー正規化拡散ポリシーとQアンサンブルを組み合わせることで,D4RLベンチマークのほとんどのタスクにおける最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:23:16 GMT)
GazeGen: Gaze-Driven User Interaction for Visual Content Generation [11.0] 本稿では,ユーザの視線で示される位置の視覚的コンテンツ(画像とビデオ)を生成するユーザインタラクションシステムであるGazeGenを紹介する。
オブジェクト検出と生成AIの高度な技術を使用して、GazeGenは画像オブジェクトの視線制御された画像の追加/削除、再配置、および表面物質の変化を実行し、静的イメージをビデオに変換する。
GazeGenの中心は、281Kパラメータしか持たない超軽量モデルであるDFT Gazeエージェントである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:22:38 GMT)
Public Procurement for Responsible AI? Understanding U.S. Cities' Practices, Challenges, and Needs [10.9] 7つの市町村で18名の市職員を対象に半構造化インタビューを行った。
都市が取得したAIは、しばしば従来の公的な調達プロセスを経ず、監視とガバナンスの課題を提起している。
私たちは、市職員が同僚、AIベンダー、そして一般の人々と対話する際に直面する責任あるAIの調達を活用するための5つの重要な課題を特定します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:58:16 GMT)
Navigating Trade-offs: Policy Summarization for Multi-Objective Reinforcement Learning [10.8] 多目的強化学習(MORL)は、複数の目的を含む問題を解決するために用いられる。
本稿では,MORL が生成する解集合をクラスタリングする手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:26:38 GMT)
A Reinforcement Learning-Based Automatic Video Editing Method Using Pre-trained Vision-Language Model [10.7] まず、シーン固有の特徴を抽出する以前の作品とは異なり、事前学習された視覚言語モデル(VLM)を活用する。
また,RLをベースとした編集フレームワークを提案し,編集問題を定式化し,仮想エディタを訓練し,より優れた編集判断を行う。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:20:28 GMT)
How to Delete Without a Trace: Certified Deniability in a Quantum World [10.5] 我々は,より包括的な削除概念を得るために,認証された識別可能性について検討する。
Certified deniabilityは、シミュレーションベースのセキュリティ定義を使用して、削除後にユーザが保持した情報が、最初に削除可能なオブジェクトを渡さなくても学べるようにしている。
量子ランダムオラクルモデルにおいて、証明された識別性を満足する2つの非相互作用プリミティブを定義し、構築する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:30:19 GMT)
Enabling Adaptive Agent Training in Open-Ended Simulators by Targeting Diversity [10.4] DIVAは複雑なオープンエンドシミュレータで多様なトレーニングタスクを生成するための進化的アプローチである。
実験の結果,DIVAの複雑なパラメータ化を克服し,適応剤の挙動を訓練するユニークな能力を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:27:12 GMT)
Beyond Accuracy: Ensuring Correct Predictions With Correct Rationales [10.4] 二重補正予測のための二相予測手法を提案する。
まず、視覚認識タスクに対して構造化された合理性を提供する新しいデータセットをキュレートする。
第二に,視覚的エビデンスを解消し,局所化する際のモデル案内のための有理形最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:22:56 GMT)
PAD: Personalized Alignment of LLMs at Decoding-Time [10.3] 本稿では,LLM出力を推論フェーズにおいて多様なパーソナライズされた嗜好と整合させる新しいフレームワークを提案する。
パーソナライズド・アライメント・アライメント・アライメント・アライメント・アット・デコーディング・タイム(PAD)フレームワークは、テキスト生成プロセスをパーソナライズされた好みから切り離す。
PADは、既存のトレーニングベースのアライメント手法を、多様な嗜好と整合するという点で上回るだけでなく、トレーニング中に見つからない嗜好に対する顕著な一般化性も示している。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 06:21:14 GMT)
Meta-Reasoning Improves Tool Use in Large Language Models [10.2] 外部ツールは、大言語モデル(LLM)が通常失敗するタスクを成功させるのに役立つ。
本稿では、カスタムの微調整LMヘッドを用いてタスクを優先的に処理し、候補ツールを出力する2相システムであるMeta-reasONing(TECTON)によるツールセレクションを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:48:33 GMT)
Dynamic Speculation Lookahead Accelerates Speculative Decoding of Large Language Models [10.2] DISCOは投機的ルックアヘッド(SL)を動的に選択する新しい手法である。
4つのデータセットによる実験により、disCOは最高の静的SLベースラインに比べて平均10%のスピードアップに達することが示された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:59:39 GMT)
ZipNN: Lossless Compression for AI Models [10.1] ZipNNはニューラルネットワークに適した無損失圧縮を提供する。
一般的なモデル(例えばLlama 3)では、ZipNNはバニラ圧縮よりも17%以上良いスペース節約を示している。
これらの手法は、Hugging Faceのような大きなモデルハブからダウンロードされたネットワークトラフィックを1ヶ月に1つ以上節約できると見積もっている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:28:23 GMT)
Mining the Minoria: Unknown, Under-represented, and Under-performing Minority Groups [9.9] マイノリティマイニング問題(英語版)を提案するが、そこでは属性空間のベクトルが、表現不足で性能の低い潜在的な群を明らかにする。
理論的解析とともに実世界のデータセットと合成データセットを用いて包括的実験を行う。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:59:23 GMT)
ESC-MISR: Enhancing Spatial Correlations for Multi-Image Super-Resolution in Remote Sensing [9.8] リモートセンシングにおけるマルチイメージ超解像(MISR-RS)は,リモートセンシングコミュニティにおいて重要な研究課題である。
HR画像再構成のための複数の画像の空間的時間的関係を完全に活用した,ESC-MISR(Enhancing spatial correlations in MISR)という新しいフレームワークを提案する。
提案手法は, ProBA-V データセットの2バンドでそれぞれ 0.70dB と 0.76dB cPSNR の改善を実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:45:04 GMT)
Synergy-Guided Regional Supervision of Pseudo Labels for Semi-Supervised Medical Image Segmentation [9.7] 擬似ラベリングは半教師あり学習において広く使われている戦略である。
既存の手法は、しばしば騒音汚染に悩まされ、モデルの性能を損なう。
本稿では,Synergy-Guided Regional Supervision of Pseudo Labels (SGRS-Net) フレームワークを紹介する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:41:04 GMT)
A Survey on Employing Large Language Models for Text-to-SQL Tasks [9.5] リレーショナルデータベースにおけるデータ量の増加は、ユーザがデータにアクセスして分析する上での課題を引き起こします。
Text-to-sql (Text2) は自然言語処理(NLP)技術を用いて自然言語のintsqlクエリを変換することで問題を解決する。
LLM(Large Language Models)の開発により、LLMベースのText2メソッドが出現した。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:26:58 GMT)
Mint: Cost-Efficient Tracing with All Requests Collection via Commonality and Variability Analysis [9.3] 我々は,エージェント側で"共通性+可変性"パラダイムを実装し,すべての要求をキャプチャできるコスト効率のよいトレースフレームワークMintを提案する。
我々の実験は、Mintがすべてのトレースを捕捉し、トレースストレージ(平均2.7%)とネットワークオーバーヘッド(平均4.2%)を最適化しながら、より多くのトレース情報を保持できることを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:40:07 GMT)
Scaling Law Hypothesis for Multimodal Model [9.2] 共有トークンと埋め込み空間内でテキスト、音声、画像、ビデオを処理するマルチモーダルモデルに対するスケーリング法則仮説を提案する。
本フレームワークは、モダリティ固有の圧縮とトークン化効率に基づいてモデル性能を予測し、テキストベースのデコーダモデルから混合モダリティシステムまで、確立されたスケーリング法則を拡張した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:46:23 GMT)
Poor Man's Training on MCUs: A Memory-Efficient Quantized Back-Propagation-Free Approach [9.2] バックプロパゲーション(BP)は、ニューラルネットワークトレーニングにおける勾配計算のデフォルトのソリューションである。
FPGA、マイクロコントローラ(MCU)、アナログコンピューティングプラットフォームなど、さまざまなエッジデバイス上でBPベースのトレーニングを実装することは、さまざまな課題に直面している。
本稿では、エッジトレーニングハードウェア設計を推論ハードウェア設計と同じくらい簡単にする、シンプルなBPフリートレーニングスキームをMCU上で提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:42:57 GMT)
Using AI-Based Coding Assistants in Practice: State of Affairs, Perceptions, and Ways Forward [9.2] 私たちは、開発者がAIアシスタントをどのように使っているのかをよりよく理解することを目指しています。
我々は、AIアシスタントの使用方法に関する大規模な調査を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:09:24 GMT)
An Empirical Study on the Potential of LLMs in Automated Software Refactoring [9.2] 自動ソフトウェアにおける大規模言語モデル(LLM)の可能性について検討する。
私たちは、ChatGPTが提案した176のソリューションのうち13と、Geminiが提案した137のソリューションのうち9が、ソースコードの機能を変更したり、構文エラーを導入したりすることを安全でないことに気付きました。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:35:55 GMT)
SuffixDecoding: A Model-Free Approach to Speeding Up Large Language Model Inference [9.1] SuffixDecodingは、投機的復号化を通じて大きな言語モデル(LLM)推論を加速するためのモデルなしのアプローチである。
当社のアプローチは,新たなモデルの維持と編成のオーバーヘッドを伴わずに,柔軟な木構造推測を可能にする。
プロプライエタリなマルチLLMテキスト・ツー・トーケンアプリケーションでは、SuffixDecodingは2.9倍の出力スループットと3倍のレイテンシを実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:49:33 GMT)
Deploying Multi-task Online Server with Large Language Model [9.1] 大規模言語モデルのための3段階のマルチタスク学習フレームワークを提案する。
タスクフィルタリング、続いて高リソースタスクの微調整、最後にすべてのタスクの微調整を行う。
我々のアプローチは、異なるベンチマークで例示され、最大90.9%のオーバーヘッドを削減しつつ、シングルタスク方式に匹敵するパフォーマンスを実現することができることを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:44:34 GMT)
Asynchronous Distributed Optimization with Delay-free Parameters [9.1] 本稿では,2つの分散アルゴリズム, Prox-DGD と DGD-ATC の非同期バージョンを開発し,無方向性ネットワーク上でのコンセンサス最適化問題を解く。
代替アルゴリズムとは対照的に,我々のアルゴリズムは,遅延に依存しないステップサイズを用いて,同期アルゴリズムの固定点集合に収束することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:40:37 GMT)
TexLiverNet: Leveraging Medical Knowledge and Spatial-Frequency Perception for Enhanced Liver Tumor Segmentation [9.0] 肝腫瘍に対する病変特異的テキストアノテーションを用いたデータセットを開発した。
TexLiverNetは、テキスト機能を視覚的特徴と効率的に統合するエージェントベースのクロスアテンションモジュールを使用している。
TexLiverNetは現在の最先端の手法よりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:26:38 GMT)
Series-to-Series Diffusion Bridge Model [8.6] 既存の拡散法を包含する包括的フレームワークを提案する。
拡散に基づく新しい時系列予測モデルであるシリーズ・ツー・シリーズ拡散ブリッジモデル(mathrmS2DBM$)を提案する。
実験の結果,$mathrmS2DBM$はポイントツーポイント予測において優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:37:34 GMT)
Capacities of Entanglement Distribution From a Central Source [8.6] 絡み合いの分布は、量子情報処理と量子ネットワークの実現において必須の課題である。
本研究では, 中心源がN粒子の絡み合った状態を準備し, それぞれの絡み合ったサブシステムをノイズのある量子チャネルを介してN受信機に送信するシナリオについて検討する。
その後、受信機は、無制限の古典的通信の支援により、ノイズチャネル出力からターゲット絡み合った状態を蒸留するローカル操作を行うことができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:50:51 GMT)
Automated Update of Android Deprecated API Usages with Large Language Models [8.5] 本稿では,大規模言語モデル(LLM)を用いてAndroid APIを更新する自動アプローチであるGUPPYを紹介する。
GUPPYは、非推奨のAPI使用率を更新し、旧APIレベルと新APIレベルの互換性を確保するために、最も強力なLCMの1つであるGPT-4を使用している。
最新のAPIレベル33,34から,20の非推奨APIから,さらに156の非推奨APIから,360度ベンチマークAPIを使用した評価を行った結果,GUPPYの最先端技術に対するメリットが示された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:01:50 GMT)
PIAST: A Multimodal Piano Dataset with Audio, Symbolic and Text [8.4] PIAST(PIAST, PIano dataset with Audio, Symbolic, and Text)は、ピアノ音楽のデータセットである。
われわれはYouTubeから9,673曲を収集し、音楽の専門家による2,023曲の人間のアノテーションを追加した。
どちらも、オーディオ、テキスト、タグアノテーション、そして最先端のピアノの書き起こしとビート追跡モデルを利用したMIDIの書き起こしである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:18:51 GMT)
Exploiting the Structure of Two Graphs with Graph Neural Networks [8.4] 本稿では,異なるグラフ上に定義された2組の信号が存在するタスクを処理するための,グラフに基づく新しいディープラーニングアーキテクチャを提案する。
複数のグラフからの情報を活用することで、提案されたアーキテクチャは、データ内のさまざまなエンティティ間のより複雑な関係をキャプチャすることができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:39:39 GMT)
Parameter Symmetry and Noise Equilibrium of Stochastic Gradient Descent [8.3] 勾配ノイズは、退化方向に沿ってパラメータ$theta$の体系的な相互作用を、一意に依存しない固定点$theta*$へと生成することを示す。
これらの点をノイズ平衡(it noise equilibria)と呼ぶのは、これらの点において、異なる方向からのノイズ寄与がバランスと整合性を持つためである。
勾配雑音のバランスとアライメントは、ニューラルネットワーク内でのプログレッシブ・シャープニング/フラット化や表現形成といった重要な現象を説明するための新しいメカニズムとして機能することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:39:30 GMT)
Prompt-Guided Internal States for Hallucination Detection of Large Language Models [8.2] 大規模言語モデル(LLM)の幻覚検出のための新しい枠組み、即時誘導型内部状態を提案する。
この構造を、異なるドメインのテキスト間でより健全で一貫性のあるものにします。
実験結果から,本フレームワークは既存の幻覚検出手法のクロスドメイン一般化を著しく促進することが明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:33:48 GMT)
Multi-Agents are Social Groups: Investigating Social Influence of Multiple Agents in Human-Agent Interactions [7.4] 我々は,AIエージェントの集団が,ユーザに対して同意を求める社会的プレッシャーを生じさせるかどうかを検討する。
その結果、複数のエージェントと会話することで、参加者が感じた社会的プレッシャーが増すことがわかった。
本研究は, 単一エージェントプラットフォームに対するマルチエージェントシステムの潜在的利点が, 意見変化を引き起こす可能性を示唆している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:00:46 GMT)
A Collaborative Content Moderation Framework for Toxicity Detection based on Conformalized Estimates of Annotation Disagreement [7.3] アノテーションの不一致を捉えることの重要性を強調する新しいコンテンツモデレーションフレームワークを導入する。
我々は、コメントアノテーションの曖昧さと、毒性と不一致を予測するモデル固有の不確実性の両方を考慮するために、不確実性推定技術、特にコンフォーマル予測を利用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:12:45 GMT)
Classification with Conceptual Safeguards [7.1] 確立された概念を用いた分類作業における安全性向上のための新しいアプローチを提案する。
コンセプトセーフガードと呼ばれる私たちのアプローチは、モデルの検証レイヤとして機能します。
我々は、実世界のデータセットと合成データセットの集合にアプローチをベンチマークする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:41:11 GMT)
Quantum Register Machine: Efficient Implementation of Quantum Recursive Programs [7.0] 本稿では、量子制御フローをサポートする最初の純粋量子アーキテクチャ(命令セットを含む)である量子レジスタマシンの概念を提案する。
本稿では,量子レジスタマシンをベースとして,量子再帰プログラムの包括的な実装プロセスについて述べる。
量子アルゴリズムの効率的な実装は、量子アルゴリズムの自動並列化も提供する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 01:20:35 GMT)
Social EgoMesh Estimation [7.0] 身体の社会中心性評価のための新しい枠組み(SEE-ME)を提案する。
我々のアプローチは、潜在確率拡散モデルのみを用いて着用者のメッシュを推定する最初の方法である。
全体として、SEE-MEは現在の最高の手法を超え、ポーズ推定誤差(MPJPE)を53%削減する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:28:49 GMT)
ComFairGNN: Community Fair Graph Neural Network [6.9] グラフニューラルネットワーク(GNN)におけるコミュニティレベルのバイアスを軽減するための新しいフレームワークを提案する。
提案手法では,GNNにおける局所分布の多様さから生じるバイアスに対処する,学習可能なコアセットに基づくデバイアス機能を用いる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:04:34 GMT)
PhoneLM:an Efficient and Capable Small Language Model Family through Principled Pre-training [6.8] デバイス上でのデプロイメントのための既存の小さな言語モデル(SLM)は、デバイスハードウェアの特性を考慮していない。
本研究は, SLM設計において, 事前学習前の(ほぼ)最適実行効率のアーキテクチャ探索という, シンプルかつ効果的な原理を提示する。
我々はPhoneLMファミリ(現在0.5Bと1.5Bバージョン)を開発し、同様のパラメータサイズを持つ人の間で、最先端の能力効率トレードオフを実現する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:19:00 GMT)
PentestAgent: Incorporating LLM Agents to Automated Penetration Testing [6.8] 手動浸透試験は時間と費用がかかる。
大規模言語モデル(LLM)の最近の進歩は、浸透テストを強化する新たな機会を提供する。
我々は,新しいLLMベースの自動浸透試験フレームワークであるPentestAgentを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:10:39 GMT)
Towards Competitive Search Relevance For Inference-Free Learned Sparse Retrievers [6.8] 推測のないスパースモデルは 検索の関連という点で はるかに遅れています スパースモデルと密集したサイムズモデルの両方と比較して
まず,IDF(Inverted Document Frequency)を導入したIFF対応のFLOPS損失を表現のスペーシングに導入する。
その結果、FLOPS正則化が検索関連性に与える影響を軽減し、精度と効率のバランスが良くなることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:46:43 GMT)
On the Inherent Robustness of One-Stage Object Detection against Out-of-Distribution Data [6.7] 画像データ中の未知物体を検出する新しい検出アルゴリズムを提案する。
モデルによって抽出された特徴に対する次元の呪いの影響を軽減するために、教師付き次元削減技術を利用する。
これは高解像度の特徴マップを用いて、教師なしの方法で潜在的に未知の物体を識別する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:15:25 GMT)
A multi-purpose automatic editing system based on lecture semantics for remote education [6.7] 本稿では,講義セマンティクスに基づく自動マルチカメラ指向/編集システムを提案する。
本システムは,専門的な指示規則に従いながら,クラスイベントを意味論的に分析することによって,ビューを指示する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:49:25 GMT)
BrainSegFounder: Towards 3D Foundation Models for Neuroimage Segmentation [6.5] 本研究は,医療基盤モデルの創出に向けた新しいアプローチを紹介する。
本稿では,視覚変換器を用いた2段階事前学習手法を提案する。
BrainFounderは、これまでの勝利ソリューションの成果を上回る、大幅なパフォーマンス向上を実演している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:28:50 GMT)
Fed-LDR: Federated Local Data-infused Graph Creation with Node-centric Model Refinement [6.5] 本稿では,ノード中心モデル再定義(Fed-LDR)アルゴリズムを用いたFederated Local Data-Infused Graph Creationを提案する。
Fed-LDR は FL と Graph Convolutional Networks (GCN) を活用し、都市環境における時空間データ分析を強化する。
その結果,Fed-LDRは平均絶対誤差(MAE)が20.15,17.30,Root Mean Square Error(RMSE)が32.30,27.15であった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:13:31 GMT)
Linguistic Collapse: Neural Collapse in (Large) Language Models [6.5] スケール(および正規化)で発展する$mathcalNC$プロパティは一般化と関連している。
我々の研究は、言語モデリングの斬新でより困難な設定にまで拡張されるにつれて、$mathcalNC$の一般性を強調します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:16:02 GMT)
DELIFT: Data Efficient Language model Instruction Fine Tuning [6.4] 本稿では,3段階の微調整におけるデータ選択を体系的に最適化する新しいアルゴリズムであるDELIFTを紹介する。
さまざまなタスクやモデルスケールにわたる実験により、DELIFTはパフォーマンスを損なうことなく、微調整データサイズを最大70%削減できることが示された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:38:29 GMT)
CardioSpectrum: Comprehensive Myocardium Motion Analysis with 3D Deep Learning and Geometric Insights [6.4] 従来のニューラルネットワークは微妙な接尾辞の動きを予測するのが難しい。
この問題に対処するための包括的アプローチを提案する。
私たちの3Dディープラーニングアーキテクチャは、ARFlowモデルに基づいて、複雑な3Dモーション分析タスクに最適化されています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:56:00 GMT)
Uncovering Hidden Subspaces in Video Diffusion Models Using Re-Identification [6.4] 我々は、特定の下流タスクのための合成データに基づいてトレーニングされたモデルが、実際のデータでトレーニングされたモデルよりも悪い性能を示すことを示した。
この違いは、トレーニングビデオのサブスペースであるサンプリングスペースが原因である可能性がある。
本稿では,潜在空間におけるプライバシ保護モデルのトレーニングが,計算効率が向上し,より一般化できることを最初に示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:32:00 GMT)
DISCO: DISCovering Overfittings as Causal Rules for Text Classification Models [6.4] ポストホックの解釈可能性法は、モデルの意思決定プロセスを完全に捉えるのに失敗する。
本稿では,グローバルなルールベースの説明を見つけるための新しい手法であるdisCOを紹介する。
DISCOは対話的な説明をサポートし、人間の検査者がルールベースの出力で突発的な原因を区別できるようにする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:12:44 GMT)
Pose2Trajectory: Using Transformers on Body Pose to Predict Tennis Player's Trajectory [6.3] テニス選手の身体関節データとボール位置から導かれるシーケンスとして,選手の将来の軌跡を予測するPose2Trajectoryを提案する。
我々は,ボール位置を持つ選手の関節および軌道情報に基づいて訓練されたエンコーダ・デコーダ変換器アーキテクチャを用いる。
複数のビデオから高品質なデータセットを生成し、物体検出と人間のポーズ推定手法を用いてテニス選手の動き予測を支援する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:50:58 GMT)
Fine-tuned Large Language Models (LLMs): Improved Prompt Injection Attacks Detection [6.3] 大きな言語モデル(LLM)は、幅広い言語ベースのタスクに対処する能力が大きく進歩しているため、人気ツールになりつつある。
しかし、LSMのアプリケーションはインジェクション攻撃に対して非常に脆弱であり、致命的な問題を引き起こす。
このプロジェクトでは,インジェクションのインジェクション攻撃に関連するセキュリティ脆弱性について検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:20:31 GMT)
Reciprocal Point Learning Network with Large Electromagnetic Kernel for SAR Open-Set Recognition [6.2] Open Set Recognition (OSR)は、未知のクラスを「未知」と表現しながら、既知のクラスを分類することを目的とする。
オープンセットSAR分類を強化するために,相互学習ネットワークを用いた散乱カーネルと呼ばれる手法を提案する。
大規模属性散乱中心モデルに基づく畳み込みカーネルの設計を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:26:20 GMT)
On the Computational Complexity of Schrödinger Operators [6.1] 実空間におけるシュル「オーディンガー作用素 $H = -Delta + V$ に関する計算問題について検討する。
i) シュル・オーディンガー作用素が生成する力学をシミュレートすると、普遍量子計算、すなわち、BQP-ハードであり、(ii) シュル・オーディンガー作用素の基底エネルギーを推定することは、符号問題のない局所ハミルトン多様体のエネルギーを推定するのと同じくらい難しいことを証明する。
一般ボソニックハミルトニアンの基底エネルギー問題は知られているので、この結果は特に興味深い。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:39:52 GMT)
Study of decoherence in radial local phonon hopping within trapped-ion string [6.1] キートラップパラメータの関数としてホッピングの減衰を測定し, 減衰時間と振動数の観点から解析する。
この研究は、フォノンホッピングコヒーレンスを評価する方法を確立し、基礎となるデコヒーレンス機構に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:05:58 GMT)
Measure-to-measure interpolation using Transformers [6.1] トランスフォーマーは、大規模言語モデルの最近の成功を支えるディープニューラルネットワークアーキテクチャである。
トランスフォーマーは、単位球上の特定の相互作用粒子系として実装された測度から測度マップとして機能する。
パラメータを明示的に選択することで、1つのTransformerが$N$任意の入力測度を$N$任意のターゲット測度にマッチさせることができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:18:39 GMT)
AWARE Narrator and the Utilization of Large Language Models to Extract Behavioral Insights from Smartphone Sensing Data [6.1] スマートフォンは健康関連行動や状況の追跡を促進し、デジタル表現に大きく貢献する。
本稿では,スマートフォンから収集したデータを構造化した時系列物語に体系的に変換する手法を提案する。
この枠組みを1週間にわたって大学生の収集したデータに適用し,個々の行動の要約に物語を活用する可能性を実証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:23:57 GMT)
Mining Glitch Tokens in Large Language Models via Gradient-based Discrete Optimization [6.0] LLM(Large Language Models)のGlitchトークンは予測不可能な振る舞いを引き起こす可能性がある。
GlitchMinerは、エントロピーを利用してグリッチトークンを効率よく識別し、予測の不確実性を定量化する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:43:04 GMT)
EarCapAuth: Biometric Method for Earables Using Capacitive Sensing Eartips [6.0] EarCapAuthは、48個の静電容量電極を2つの耳栓の軟質シリコンイヤーチップに埋め込んだ認証機構である。
識別のために、EarCapAuthは89.95%を達成している。
将来的には、EarCapAuthは高解像度の脳センサー電極チップに統合される可能性がある。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:35:02 GMT)
Differentially Private Integrated Decision Gradients (IDG-DP) for Radar-based Human Activity Recognition [6.0] 近年の研究では、レーダー歩行パターンから被写体や性別を認識する上で高い精度が示され、プライバシーの懸念が高まっている。
本研究では,レーダベースヒューマンアクティビティ認識(HAR)システムにおけるプライバシ脆弱性を調査することによって,これらの問題に対処する。
本稿では,IDGアルゴリズムによって導かれる属性によって駆動される差分プライバシー(DP)を用いた新たなプライバシー保護手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:53:14 GMT)
GaGSL: Global-augmented Graph Structure Learning via Graph Information Bottleneck [5.9] 我々は,TextitGlobal-augmented Graph Structure Learning (GaGSL) という新しい手法を提案する。
GaGSLの背景にある重要な考え方は、ノード分類タスクのためのコンパクトで情報的なグラフ構造を学ぶことである。
さまざまなデータセットにわたる包括的な評価は、最先端の手法と比較して、GaGSLの優れた性能と堅牢性を示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:23:48 GMT)
VTechAGP: An Academic-to-General-Audience Text Paraphrase Dataset and Benchmark Models [5.7] VTechAGPは、最初の学術から一般のテキストパラフレーズデータセットである。
また,新しい動的ソフトプロンプト生成言語モデルDSPT5を提案する。
トレーニングでは、動的プロンプトでキーワードを学習するために、コントラッシブ・ジェネレーション・ロス関数を利用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:06:00 GMT)
A Guide to Misinformation Detection Datasets [5.7] このガイドは、高品質なデータを取得し、より効果的な評価を行うためのロードマップを提供することを目的としている。
すべてのデータセットやその他のアーティファクトはhttps://misinfo-datasets.complexdatalab.com/.comで入手できる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:47:39 GMT)
Evaluating alignment between humans and neural network representations in image-based learning tasks [5.7] トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。
トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。
結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:21:56 GMT)
CataractBot: An LLM-Powered Expert-in-the-Loop Chatbot for Cataract Patients [5.6] CataractBotはインドの眼科病院と共同で開発された。
白内障手術に関連する質問に対して、キュレートされた知識ベースを問合せすることで、即座に答える。
システムに対する信頼は、専門家による検証によって確立されたと報告された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:16:23 GMT)
Beyond the Numbers: Transparency in Relation Extraction Benchmark Creation and Leaderboards [5.6] 本稿では,NLPにおけるベンチマーク作成の透明性と,NLPの進捗測定におけるリーダボードの利用について検討する。
既存の関係抽出ベンチマークは、ドキュメントが不十分で重要な詳細が欠如していることが多い。
議論の中心はREベンチマークとリーダボードの透明性ですが、議論する観察は他のNLPタスクにも広く適用できます。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:36:19 GMT)
Harnessing the Power of Gradient-Based Simulations for Multi-Objective Optimization in Particle Accelerators [5.6] 本稿では, 粒子加速器の深部微分可能強化学習アルゴリズムを用いてMOO問題の解法における微分可能性の効果を示す。
基礎となる問題は、個々の状態と行動の両方に厳密な制約を課し、ビームのエネルギー要求に対する累積的(グローバル)制約を課している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:55:05 GMT)
Distinguishing LLM-generated from Human-written Code by Contrastive Learning [5.6] 大規模言語モデル(LLM)は、様々なタスクに対して高品質なコンテンツを生成する能力があることが証明されたため、大きな注目を集めている。
ニュース、教育、ソフトウェア工学など、さまざまな分野における潜在的なリスクに対する懸念が高まっている。
コントラスト学習フレームワークとUniXcoderで構築したセマンティックエンコーダに基づく,新しいChatGPT生成コード検出器CodeGPTSensorを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:39:14 GMT)
Balancing Transparency and Accuracy: A Comparative Analysis of Rule-Based and Deep Learning Models in Political Bias Classification [5.6] この研究は、制約のないデータ摂取に対する現代の自己学習システムの感受性を強調している。
両モデルを左利き(CNN)と右利き(FOX)のニュース記事に適用し、元のトレーニングやテストセットを超えたデータ上での有効性を評価する。
深層学習モデルの不透明なアーキテクチャと言語情報に基づくルールベースモデルの透明性を対比する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:09:18 GMT)
TrajGPT: Controlled Synthetic Trajectory Generation Using a Multitask Transformer-Based Spatiotemporal Model [5.5] 本稿では,これらの問題に対処するために,トランスフォーマーベースのマルチタスク共同生成モデルであるTrajGPTを紹介する。
大規模言語モデルからインスピレーションを得て、TrajGPTは自然言語でテキストを埋め込むような制御された軌跡生成の問題を提起する。
公開およびプライベートデータセットを用いた実験により、TrajGPTは、制御された合成訪問生成に優れるだけでなく、次の位置予測タスクにおいて競合するモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:47:50 GMT)
Adaptively Robust and Sparse K-means Clustering [5.5] 本稿では,標準的なK-meansアルゴリズムのこれらの実用的限界に対処するため,適応的に頑健でスパースなK-meansクラスタリング(ARSK)を提案する。
頑健性のために,各観測値に冗長な誤差成分を導入し,グループスパースペナルティを用いて追加パラメータをペナルティ化する。
高次元ノイズ変数の影響に対応するために、重みを取り入れ、重みベクトルの空間性を制御するペナルティを実装することにより、目的関数を変更する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:02:32 GMT)
Thanos: Enhancing Conversational Agents with Skill-of-Mind-Infused Large Language Model [5.5] 本稿では,多様な社会的文脈を基盤とした,ミンドのスキル・オブ・アノテートされた会話データセットを提案する。
モデルサイズは1B, 3B, 8B である。
広範な実験により、これらのモデルはミルドのスキル・オブ・ミンド・プロセスの実証に成功し、強力な一般化性を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:46:06 GMT)
On the cohesion and separability of average-link for hierarchical agglomerative clustering [5.5] 平均リンクは階層的凝集クラスタリングを構築するための最も一般的で効果的な方法の1つとして広く認識されている。
本稿では,距離空間における平均リンクの性能について,分離性と凝集度を捉えるいくつかの自然な基準について検討する。
また, 実データを用いた実験結果から, 結合性および分離性の両方が重要な目標である場合, 平均リンクが他の関連手法よりも良い選択であることが示唆された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:31:00 GMT)
OneProt: Towards Multi-Modal Protein Foundation Models [5.4] 我々は、構造、配列、アライメント、結合サイトデータを統合する、タンパク質のためのマルチモーダルAIであるOneProtを紹介する。
金属イオン結合分類、遺伝子オントロジーアノテーション、酵素機能予測など、様々な下流タスクにおける最先端の手法を超越している。
この研究は、タンパク質モデルにおけるマルチモーダル能力を拡大し、薬物発見、生物触媒反応計画、タンパク質工学の応用への道を開く。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:54:54 GMT)
GD doesn't make the cut: Three ways that non-differentiability affects neural network training [5.4] 本稿では,非微分可能関数(NGDM)に適用される手法と,微分可能関数に対する古典的勾配降下(GD)との区別を批判的に検討する。
我々の研究は、強い仮定に対する過度な信頼から生まれた、影響力のある文学におけるアルゴリズムの批判的な誤解を識別する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:22:41 GMT)
A Generalisation of Voter Model: Influential Nodes and Convergence Properties [5.4] 我々は有権者モデルの一般化を紹介し,研究する。
そこで本研究では,いくつかのラウンド後に期待されるブルーノード数を最大化するために,種子のブルーノードを選択する問題について検討する。
実世界のグラフデータおよび合成グラフデータに関する実験により,提案アルゴリズムが他のアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:38:42 GMT)
Beyond Regrets: Geometric Metrics for Bayesian Optimization [5.3] 我々は4つの新しい幾何学的指標、すなわち精度、リコール、平均等級、平均距離を提案する。
これらの測定により、クエリポイントとグローバルオプティマの両方の幾何を考慮したベイズ最適化アルゴリズムやクエリポイントの比較が可能となる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:16:58 GMT)
Efficient single image non-uniformity correction algorithm [5.3] 本稿では,非冷却赤外線画像の非均一性(NU)を補正する新しい手法を提案する。
この方法はリアルタイムであり、1ピクセルあたり2つの操作しか必要としない。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:04:57 GMT)
Feature Importance in the Context of Traditional and Just-In-Time Software Defect Prediction Models [5.2] 本研究では,Apache Camelプロジェクトの公開データセットから,従来型およびJust-In-Timeアプローチを取り入れた欠陥予測モデルを開発した。
機械学習アルゴリズムと比較して,これらのデータセットに多層深層学習アルゴリズムを適用した。
深層学習アルゴリズムは80%と86%の精度を達成し, 従来型とジャスト・イン・タイムの欠陥予測では, それぞれ66%と78%の受信演算子曲線(AUC)のスコアが得られた。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:49:39 GMT)
Tracking and Decoding Rydberg Leakage Error with MBQC [5.2] 典型的な大きなエラーは、マルチキュービットゲートを実装する際のライドバーグ状態からのリークエラーである。
測定に基づく量子計算(MBQC)におけるそのようなリークエラーに対処する新しい手法を提案する。
本手法は誤差距離がd=dであり,CZゲート当たりのしきい値が1.7%に達する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:49:55 GMT)
Spatial Transformers for Radio Map Estimation [5.1] ラジオマップ推定(RME)は、受信した信号強度などの測定値を計測されていない場所で予測する。
現在最も人気のある推定器は、測定位置を通常の格子に投影し、畳み込み型ディープニューラルネットワークで測定テンソルを完了している。
本論文の最初のコントリビューションは,ラジオマップ推定のための空間トランスフォーマー (Spatial TransfOrmer) と呼ばれる注意に基づく推定器を用いて,これらの制約に対処するものである(ストーム)。
ストームは1つのレイトレーシングと2つの実測データセットによる実験によって広範囲に検証されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:51:44 GMT)
Constrained Latent Action Policies for Model-Based Offline Reinforcement Learning [5.0] オフラインの強化学習では、環境からの高価なフィードバックがなければ、静的なデータセットを使ってポリシーが学習される。
我々は,観察と行動の連関分布の生成モデルを学習する制約付き潜在行動ポリシー(C-LAP)を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:35:22 GMT)
PadChest-GR: A Bilingual Chest X-ray Dataset for Grounded Radiology Report Generation [4.9] グラウンドドラジオロジーレポート生成(GRRG)は、画像上の個々の所見の局所化を含む。
現在、GRRGモデルをトレーニングするための手動注釈付き胸部X線データセットは存在しない。
CXR画像のGRRGモデルのトレーニングを目的としたPadChest-GR(Grounded-Reporting)というデータセットを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:06:17 GMT)
Embedding with Large Language Models for Classification of HIPAA Safeguard Compliance Rules [4.9] コードパターン処理における従来のWord2Vec埋め込みの限界を特定します。
この問題を克服するために、データセットの属性にコンテキスト化された埋め込みを提供する多言語BERTを採用しています。
その結果,ロジスティック回帰は99.95%の精度で,分類を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:18:54 GMT)
Efficient quantum pseudorandomness under conservation laws [4.8] 局所的なユニタリ設計は、量子擬似ランダム性の統計的概念を捉えている。
特に、任意の局所対称回路が効率的に2次元設計を生成できるかどうかという問題は未解決のままである。
我々は、時間内に対称ユニタリな2-設計に収束する局所対称量子回路を明示的に構築する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:32:04 GMT)
Conditional Diffusion Model for Longitudinal Medical Image Generation [4.6] アルツハイマー病はゆっくりと進行し、生物学的因子間の複雑な相互作用を伴う。
縦断的医療画像データは、時間とともにこの進歩を捉えることができる。
しかし, 患者退院に伴うデータ不足, 不規則な経過観察間隔, 観察期間の変動など, 経時的データが頻繁に発生する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:44:47 GMT)
AGE2HIE: Transfer Learning from Brain Age to Predicting Neurocognitive Outcome for Infant Brain Injury [4.6] 低酸素性虚血性脳症(HIE)は新生児1,000人中1人から5人に影響を及ぼす。
深層学習モデルを用いたHIE関連神経認知結果の早期かつ正確な予測が重要である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:24:54 GMT)
Selecting Between BERT and GPT for Text Classification in Political Science Research [4.5] 低データシナリオにおけるBERTモデルとGPTモデルの有効性を評価する。
パフォーマンス、使いやすさ、コストの観点から、これらのアプローチを比較して結論付けます。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:29:39 GMT)
Algorithmic Autonomy in Data-Driven AI [4.5] アルゴリズムに絡み合った社会では、私たちの選択は、自動化されたシステムによって常に影響され、形作られています。
この収束は、データ駆動AIの時代における個人の自律性に対する重要な懸念を浮き彫りにする。
我々は、アルゴリズムの自律性の概念を探求し、アルゴリズムが社会に広まる影響に直面して、個人が自律性を持つことの意味を考察する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:16:20 GMT)
Deep-Graph-Sprints: Accelerated Representation Learning in Continuous-Time Dynamic Graphs [4.4] 連続時間動的グラフ(CTDG)は相互接続された進化するシステムのモデリングに不可欠である。
Deep-Graph-Sprints (DGS)は、低遅延推論要求のCTDG上での効率的な表現学習のために設計された、新しいディープラーニングアーキテクチャである。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 11:26:39 GMT)
EPIC: Enhancing Privacy through Iterative Collaboration [4.2] 従来の機械学習技術は、中央集権的なデータ収集と処理を必要とする。
医療データを集中ストレージにプールする場合、プライバシ、オーナシップ、厳格な規制の問題が存在する。
フェデレートラーニング(FL)アプローチは、中央アグリゲータサーバと共有グローバルモデルを設定することで、そのような問題を克服する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:10:34 GMT)
Estimating the Influence of Sequentially Correlated Literary Properties in Textual Classification: A Data-Centric Hypothesis-Testing Approach [4.2] スティロメトリーは、ジャンルやテーマといった要素とは異なる半意識的な選択を反映していると考えられる文学的特徴を分析して著者を区別することを目的としている。
主題的内容など一部の文学的特性は、隣接するテキスト単位間の相関関係として表される可能性が高いが、権威的なスタイルのように、その独立性を持つものもいる。
テキスト分類における逐次相関文学的特性の影響を評価するための仮説検証手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:28:40 GMT)
Simplicity Bias of Two-Layer Networks beyond Linearly Separable Data [4.1] 重みが小さい2層ニューラルネットワークの文脈における一般データセットの単純さバイアスを特徴付け、勾配流を訓練する。
XORのようなパターンを持つデータセットに対しては、学習した特徴を正確に識別し、後続のトレーニング段階で単純さのバイアスが強まることを示す。
これらの結果から,訓練中期に学習した特徴がOOD伝達に有用である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:44:22 GMT)
Evaluating The Explainability of State-of-the-Art Machine Learning-based Online Network Intrusion Detection Systems [4.1] 我々は、説明可能なAI(xAI)技術を用いて、最先端のMLベースのオンラインNIDSモデルを分析する。
我々は、所定のNIDSモデルに対してxAIメソッド間で生成された説明と、与えられたxAIメソッドに対してNIDSモデル間で生成された説明とを比較した。
インダクティブバイアスに対する各NIDSモデルの脆弱性(トレーニングデータから学習した成果)を評価する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:28:03 GMT)
Learning quantum states of continuous variable systems [4.1] 量子状態トモグラフィーは、測定データから未知の状態の古典的な記述を導出することを目的としている。
連続変数系のトモグラフィーは時間資源の点で極めて非効率であることを示す。
ガウス状態のトモグラフィーが効率的であることも証明する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:33:36 GMT)
Learning quantum states of continuous variable systems [4.1] 量子状態トモグラフィーは、測定データから未知の状態の古典的な記述を導出することを目的としている。
連続変数系のトモグラフィーは時間資源の点で極めて非効率であることを示す。
ガウス状態のトモグラフィーが効率的であることも証明する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 09:33:36 GMT)
MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation [4.0] 視覚計測(VO)は,室内環境におけるエンボディエージェントの正確なポイントゴールナビゲーションを可能にするために不可欠である。
近年の深層学習VO法は, 頑健な性能を示すが, トレーニング中のサンプル不効率に悩まされている。
エージェントが環境をナビゲートしている間に利用可能な動作先に基づいて、ロバストでサンプル効率の良いVOパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:36:49 GMT)
Talking the Talk Does Not Entail Walking the Walk: On the Limits of Large Language Models in Lexical Entailment Recognition [3.9] 本研究では,8つの大言語モデルが動詞間の語彙的含意関係を認識する能力について検討する。
以上の結果から,モデルが適度に良好な性能で語彙的包含認識タスクに対処できることが判明した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:15:23 GMT)
Fate of the spatial-temporal order under quantum fluctuation [3.8] 平均場近似を超えたダイナミクスについて検討する。
その結果, 空間時間格子は平均場レベルで融解するが, 量子揺らぎで残存することがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:18:44 GMT)
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning [3.8] この論文は、$d$-dimensional recursion approximation, $$theta_n+1=theta_n + alpha_n + 1 f(theta_n, Phi_n+1) $$$ ここで、Phi_n $は一般的な状態空間上の過程である。
主な結果は,ドスカー・バラダン・リャプノフドリフト条件(DV3): (i)適切なリャプノフドリフト条件(DV3)の,平均流とバージョンに関する追加条件の下で確立される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:59:59 GMT)
Which bits went where? Past and future transfer entropy decomposition with the information bottleneck [3.7] 相互情報と同様に、転送エントロピーは一般に共有変動の量をまとめた単一の値として報告される。
本稿では,移動エントロピーを分解し,情報フローの両側に変化のビットを局在させる手法を提案する。
そこで本手法を応用して, 複数回の合成繰り返し過程における伝達エントロピーの分解と, 同時行動および神経活動に関する実験マウスデータセットを構築した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:57:24 GMT)
Comparing Fairness of Generative Mobility Models [3.7] 本研究は、生成モビリティモデルの公平性を検証し、地理的領域にわたるモデルパフォーマンスにおいて、しばしば見落とされがちなエクイティの次元に対処する。
クラウドフローデータに基づいて構築された予測モデルは、都市構造や移動パターンを理解するのに有効である。
生成したトレースの有効性と公平性を測定することによって、公正性を評価するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:01:12 GMT)
Regularized stress tensor of vector fields in de Sitter space [3.7] ゲージ固定 (GF) 項が $frac12zeta (Amu,_;;, mu)2$ であるような巨大なベクトル場であるド・シッター空間のシュテッケルベルク場を研究する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:18:10 GMT)
CapS-Adapter: Caption-based MultiModal Adapter in Zero-Shot Classification [3.6] CapS-Adapterは、イメージとキャプションの両方の機能を活用して、トレーニング不要シナリオにおける既存の最先端技術を超える革新的な方法である。
提案手法は,19個のベンチマークデータセットのゼロショット分類結果に優れており,従来の先行手法よりも2.19%精度が向上している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:33:40 GMT)
Topological stabilizer models on continuous variables [3.6] 連続変数(CV)自由度に基づく2次元トポロジカル安定化符号の族を構築する。
これらのCV符号は、トポロジカルなキュート符号と局所的な符号化をCVに連結することで得られる符号を超えていると推測する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:57:36 GMT)
The Multiple Dimensions of Spuriousness in Machine Learning [3.5] データからの相関学習は、今日の機械学習(ML)と人工知能(AI)研究の基礎となる。
このようなアプローチは、ビッグデータコーパス内のパターン付き関係の自動発見を可能にするが、意図しない相関が捕捉された場合、障害モードの影響を受けやすい。
この脆弱性は、しばしば、パフォーマンス、公平性、堅牢性をモデル化する障害として批判される、急進性の尋問への関心を拡大した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:29:32 GMT)
Long-range entanglement from spontaneous non-onsite symmetry breaking [3.4] 非オンサイト対称性のSSBを示すフラストレーションフリー格子モデルを示す。
我々は、2重の基底状態の縮退と有限エネルギーギャップの存在を解析的に証明する。
本研究は,非オンサイト対称性のSSBのエキゾチックな特徴を明らかにし,トポロジカルホログラフィーの枠組みを越えている可能性がある。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:59:51 GMT)
Provable Mutual Benefits from Federated Learning in Privacy-Sensitive Domains [3.4] クロスサイロフェデレーション学習により、データ所有者は、互いにプライベートデータセットから利益を得て、正確な機械学習モデルをトレーニングできる。
プライバシーに敏感なドメインへのクライアントの参加を促進するために、FLプロトコルはプライバシー保証とエンドモデル精度の微妙なバランスをとる必要がある。
我々は、サーバがFLプロトコルを設計できる時期と方法について、すべての参加者にとって有益であるかどうかを調査する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:32:58 GMT)
Evaluating Quality of Answers for Retrieval-Augmented Generation: A Strong LLM Is All You Need [3.4] 本稿では,vRAG-Evalを用いた検索・拡張生成(RAG)アプリケーションにおける回答品質評価の総合的研究について述べる。
品質面の階調をバイナリスコアにマッピングし、受け入れまたは拒否の決定を示す。
このアプローチは、明確な意思決定の意見が不可欠である現実的なビジネスコンテキストに適合します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:03:04 GMT)
A Barrier Certificate-based Simplex Architecture for Systems with Approximate and Hybrid Dynamics [3.3] Bb-Simplexは、連続力学系の実行時保証のための新しい設計である。
バリア証明書は、ベースラインコントローラが安全を保証することを証明するために使用される。
Bb-Simplexは、複雑な連続時間とハイブリッドシステムのスイッチング条件を自動的に導出することができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:02:32 GMT)
Zero-Shot Temporal Resolution Domain Adaptation for Spiking Neural Networks [3.2] スパイキングニューラルネットワーク(SNN)は、生物学的にインスパイアされたディープニューラルネットワークであり、時間的情報を効率的に抽出する。
SNNモデルパラメータは時間分解能に敏感であり、エッジでのターゲットデータの時間分解能が同じでない場合、大幅な性能低下を引き起こす。
本稿では,ニューロンパラメータを適応させる3つの新しい領域適応手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:58:51 GMT)
DanceFusion: A Spatio-Temporal Skeleton Diffusion Transformer for Audio-Driven Dance Motion Reconstruction [3.2] 本稿では,音楽に同期したダンスの動きを再現・生成するための新しいフレームワークであるDanceFusionを紹介する。
このフレームワークは、TikTokのようなソーシャルメディアプラットフォーム上のショートフォームダンスビデオでよく見られる不完全で騒がしい骨格データを扱う。
総合的な評価は、DanceFusionが既存の手法を超越し、ダイナミックでリアルでスタイリスティックに多様なダンスモーションを生成する最先端のパフォーマンスを提供することを示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:11:11 GMT)
Progressive Multi-Level Alignments for Semi-Supervised Domain Adaptation SAR Target Recognition Using Simulated Data [3.2] 我々は、ソースドメインインスタンスを対応するプロトタイプに近づけるために、インスタンス-プロトタイプアライメント(AIPA)戦略を開発する。
また、ソースドメインインスタンスを対応するプロトタイプに近づけるための、インスタンス-プロトタイプアライメント(AIPA)戦略も開発しています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:53:13 GMT)
Quantum Advantage via Efficient Post-processing on Qudit Shadow tomography [3.2] 量子科学や人工知能などの分野において、$texttr(AB)$の計算は不可欠である。
計算量と記憶量の両方を指数関数的に削減するために,qudit shadow tomographyフレームワークによる量子的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:41:14 GMT)
Quantum Speedup for Polar Maximum Likelihood Decoding [3.2] 本稿では,Grover適応探索アルゴリズムに基づく極性符号のための新しいMLデコードアーキテクチャを提案する。
提案する量子デコーディングは,クエリの複雑性を2次的に高速化しながら,ML性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:05:57 GMT)
Finding Strong Lottery Ticket Networks with Genetic Algorithms [3.1] Strong Lottery Ticket仮説によると、ランダムな重みを持つ十分に大きなニューラルネットワークには、トレーニングされたスーパーネットワークと同様に、与えられたタスクのために既に機能しているサブネットワークが含まれている。
遺伝的アルゴリズムをベースとしたアプローチとして,トレーニングや勾配計算を行わずに,このような強力な宝くじのサブネットワークを見つける方法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:35:35 GMT)
ML-Promise: A Multilingual Dataset for Corporate Promise Verification [3.0] 本稿では,約束検証の概念を紹介する。
それは、約束の識別、証拠評価、検証のタイミングの評価などのステップを含む。
本稿では,英語,フランス語,中国語,日本語,韓国語を含む最初の多言語データセットML-Promiseを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:51:24 GMT)
Equivalence between face nonsignaling correlations, full nonlocality, all-versus-nothing proofs, and pseudotelepathy [3.0] 量子相関$p$ が局所点を持たない非シグナリングポリトープの面にあることを示し、p$ が非局所コンテンツ 1 を持つ場合に限る。
我々は、FNS=FN=AVN=PTの量子相関がベルの不等式を極大に破る必要はないことを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:18:31 GMT)
Equivalence between face nonsignaling correlations, full nonlocality, all-versus-nothing proofs, and pseudotelepathy [3.0] 量子相関$p$ が局所点を持たない非シグナリングポリトープの面にあることを示し、p$ が非局所コンテンツ 1 を持つ場合に限る。
我々は、FNS=FN=AVN=PTの量子相関がベルの不等式を極大に破る必要はないことを示した。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 11:18:31 GMT)
Respecting the limit:Bayesian optimization with a bound on the optimal value [3.0] 我々は、最小値の正確な知識があるか、または、おそらくその値に対するより低いバウンドを持つかのシナリオについて研究する。
本稿では,有界情報を組み込んだ新たなサロゲートモデルであるSlogGPについて述べる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:27:49 GMT)
Evaluating Robustness of Reinforcement Learning Algorithms for Autonomous Shipping [2.9] 本稿では,自律型海運シミュレータにおける内陸水路輸送(IWT)のために実装されたベンチマークディープ強化学習(RL)アルゴリズムのロバスト性について検討する。
モデルのないアプローチはシミュレーターで適切なポリシーを達成でき、訓練中に遭遇したことのないポート環境をナビゲートすることに成功した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:55:07 GMT)
Unsupervised Abnormal Stop Detection for Long Distance Coaches with Low-Frequency GPS [2.9] 本研究では,長距離客車に対する異常停止検出(ASD)の効率向上を支援する教師なし手法を提案する。
提案手法は,ASD問題を非教師付きクラスタリングフレームワークに変換し,正常停止と異常停止の両方を分解する。
提案手法は概念的には単純だが効率的であり,低ランクの仮定を利用して通常の停止点の処理を行うことで,ドメインエキスパートがコーチのASDを発見できる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:21:26 GMT)
FedDP: Privacy-preserving method based on federated learning for histopathology image segmentation [2.9] 本稿では,医用画像データの分散特性とプライバシ感受性について,フェデレート学習フレームワークを用いて検討する。
提案手法であるFedDPは,がん画像データのプライバシーを効果的に保護しつつ,モデルの精度に最小限の影響を与える。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:02:58 GMT)
Compactly-supported nonstationary kernels for computing exact Gaussian processes on big data [2.8] スパーシリティと非定常性の両方を発見およびエンコードできる代替カーネルを導出する。
我々は,既存の精密かつ近似的なGP法と比較して,新しいカーネルの性能を実証する。
また,1日当たりの最大気温を100万回以上測定し,時空間予測を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:07:21 GMT)
Enhancing Bronchoscopy Depth Estimation through Synthetic-to-Real Domain Adaptation [2.8] 本研究では, 深度ラベル付き合成データを用いた移動学習フレームワークを提案し, 実気管支鏡データの正確な深度推定にドメイン知識を適用した。
本ネットワークは,合成データのみによるトレーニングに比べて,実際の映像の深度予測の改善を実証し,本手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:48:35 GMT)
Robust Iris Centre Localisation for Assistive Eye-Gaze Tracking [2.8] アイリス中心の局所化を改善するためのセグメンテーションベースおよび回帰ベースアプローチに対するU-Net変種の適用について検討する。
得られた結果は最先端技術に匹敵するものであり、われわれの視線追跡プラットフォームのリアルタイムパフォーマンスを犠牲にしない。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:51:28 GMT)
Unification of Finite Symmetries in Simulation of Many-body Systems on Quantum Computers [2.8] 本稿では,量子コンピュータ上での多体系のシミュレーションに対称性群を組み込む統一的な枠組みを提案する。
提案した対称性適応サブルーチンの広い適用性と効率性は、多体系の量子シミュレーションにおいて指数的スピードアップを約束する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:06:16 GMT)
Sentiment Analysis of Spanish Political Party Tweets Using Pre-trained Language Models [2.8] 本研究では、BETOとRoBERTuitoを利用して、Twitter上でのスペインの政党間コミュニケーションにおける感情パターンについて検討した。
スペインの主要政党のツイートのデータセットを用いて、感情分布を分析し、感情表現と政党イデオロギーの関係を探る。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:53:09 GMT)
Neural Fingerprints for Adversarial Attack Detection [2.7] ディープラーニングモデルのよく知られた脆弱性は、敵の例に対する感受性である。
この問題に対処するために多くのアルゴリズムが提案され、一般に2つのカテゴリの1つに分類される。
我々は、攻撃者がネットワークと検出器の構成と重みを知っているホワイトボックス環境では、検出器を克服できると主張している。
この問題は、非常に優れたモデルでさえ安全性を確保するのに不十分なセキュリティアプリケーションで一般的である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:43:42 GMT)
Training-free Zero-shot Composed Image Retrieval via Weighted Modality Fusion and Similarity [2.7] 合成画像検索(CIR)は、参照画像と修正テキストの組み合わせとしてクエリを定式化する。
本稿では,ZS-CIRのためのトレーニングフリーアプローチを提案する。
提案手法は単純で実装が容易であり,FashionIQおよびCIRRデータセットを用いた実験によりその有効性が検証された。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 06:58:04 GMT)
DNN-based 3D Cloud Retrieval for Variable Solar Illumination and Multiview Spaceborne Imaging [2.7] 我々は3Dクラウド検索のための最初のスケーラブルなディープニューラルネットワークシステムを紹介した。
マルチビュー・クラウド・インテンシティ・イメージとカメラ・ポーズと太陽方向データを統合することで、回復の柔軟性を高めることができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:13:23 GMT)
Enhancing Reverse Engineering: Investigating and Benchmarking Large Language Models for Vulnerability Analysis in Decompiled Binaries [2.7] 新しくコンパイルされたバイナリコード脆弱性データセットであるDeBinVulを紹介します。
DeBinVulを使って最先端のLLMを微調整し、バイナリコード脆弱性の検出においてパフォーマンスが19%、24%、21%向上したことを報告します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:54:31 GMT)
Soft Hoeffding Tree: A Transparent and Differentiable Model on Data Streams [2.7] Hoeffding Treeのようなストリームマイニングアルゴリズムは、入ってくるデータストリームに基づいて成長する。
我々は,データストリームを無限に変化させる可能性のある,新しい微分可能かつ透明なモデルとして,ソフトなHoeffding Tree (SoHoT)を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:49:53 GMT)
MILPaC: A Novel Benchmark for Evaluating Translation of Legal Text to Indian Languages [2.6] 我々は、英語と9つのインド語で整列したテキスト単位を含む、最初の高品質な法定並列コーパスを構築した。
また、このコーパス上での多種多様な機械翻訳(MT)システムの性能をベンチマークする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:56:58 GMT)
On the hardness of learning ground state entanglement of geometrically local Hamiltonians [2.6] 局所ハミルトニアンの基底状態の絡み合い構造を特徴づけることは、量子情報の基本的な問題である。
特に、この問題は1Dでは大まかにファクタリングハード、2DではLWEハードであることを示す。
我々の研究は、物質のいわゆる「ゲップレス」フェーズを学習する問題は、難解かもしれないことを示唆している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:16:15 GMT)
One fish, two fish, but not the whole sea: Alignment reduces language models' conceptual diversity [2.6] 研究者は大規模言語モデル(LLM)を人間の行動研究の代替として使用することを提案した。
トレーニング後のアライメント(RLHFまたはRLAIF)がモデルの内部多様性に影響を及ぼすかどうかが議論されている。
我々は、シミュレーションされた個体の内部変動と集団レベルの変動を関連づけることで、合成合成LLMの「人口」の概念的多様性を測定する新しい方法を用いる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:38:58 GMT)
Deep learning empowered sensor fusion boosts infant movement classification [2.5] FM(Fidgety Movement)評価のためのセンサ融合手法を提案する。
様々な組み合わせと2つのセンサ融合法を用いて、マルチセンサシステムが単一モードアセスメントよりも優れた性能を発揮するかどうかを検証した。
三感融合(94.5%の分類精度)の性能は、評価されたどの単一モダリティよりも著しく高かった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:41:04 GMT)
DWFL: Enhancing Federated Learning through Dynamic Weighted Averaging [2.5] 本稿では,タンパク質配列分類のためのディープフィードフォワードニューラルネットワークに基づく強化フェデレーション学習法を提案する。
本稿では,動的重み付き連合学習(DWFL)について紹介する。
DWFLの有効性を評価するために,実世界のタンパク質配列データセットを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:24:23 GMT)
Many-body nonequilibrium dynamics in a self-induced Floquet system [2.5] 相互作用するリドベルクガス中の自励式フロケ系を実験的に実証した。
これは静磁場中での光イオン化荷電粒子の運動に由来する。
我々は、強いRydberg原子相互作用がフライング電荷から内部の駆動と競合する双安定状態における非平衡ダイナミクスを探索する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:13:02 GMT)
Dynamic Detection of Relevant Objectives and Adaptation to Preference Drifts in Interactive Evolutionary Multi-Objective Optimization [2.4] 意思決定過程を通じて進化し,目的の関連性に影響を与えるDM選好の動的性質について検討する。
このような変化が起こると、時代遅れや相反する好みを解消する手法を提案する。
実験により,提案手法は進化する嗜好を効果的に管理し,アルゴリズムが生成するソリューションの品質と望ましさを著しく向上することを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:09:06 GMT)
Optimal quantum algorithm for Gibbs state preparation [2.4] 最近導入された散逸進化は、量子コンピュータで効率的に実装できることが示されている。
十分な温度で、この進化はシステムサイズと対数的にスケールする時間でギブス状態に達することを証明している。
次に, 従来の古典的, 量子的アルゴリズムよりも優れた性能を示し, 分割関数を高温で推定する問題に適用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:21:26 GMT)
Machine learning and optimization-based approaches to duality in statistical physics [2.4] 双対性(英: duality)とは、ある物理系が2つの異なる数学的記述を持つことができるという考え方である。
この問題を数値的に解き、2次元イジングモデルのクラマース・ワニエ双対性を再発見できることを示す。
また、トポロジカルラインの写像の既知の特徴を利用して問題を減らし、双対ハミルトニアンのカップリングを最適化する別のアプローチについても論じる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:29:03 GMT)
Bell state generation and CNOT operation using on-demand identical photons from shape-controlled spatially ordered quantum dots [2.4] 設計正則配列に位置するメサトップ単一量子ドット(MTSQD)のプラットフォームを開発する。
ベル状態忠実度 0.825$pm$0.010 は、2つの光子干渉(TPI)可視度 0.947$pm$0.0015 をパーセルエンハンスメントなしで 4K で達成する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:04:11 GMT)
Predictive Analytics of Varieties of Potatoes [2.3] 本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:50:25 GMT)
Survey on Semantic Interpretation of Tabular Data: Challenges and Directions [2.3] 本調査は,セマンティックテーブル解釈の全体像を概観することを目的としている。
まず31の属性の分類を使ってアプローチを分類し、比較と評価を可能にします。
また、利用可能なツールを調べ、12の基準に基づいて評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:28:56 GMT)
Quantum Linear System Solvers: A Survey of Algorithms and Applications [2.3] 本論文では,量子線形系問題に対するアルゴリズムの背景にある主要な考え方を要約し,解析する。
我々は,誤り耐性と条件数に関して,最適下界への道を開いたHHL後の拡張に焦点を当てた。
本稿では,これらのアルゴリズムの微分方程式,量子機械学習,多体物理学への応用の可能性について論じる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:55:50 GMT)
Decoherence of quantum superpositions by Reissner-Nordström black holes [2.2] ライスナー・ノルドストロームブラックホールにおける静電荷体に対する脱コヒーレンス効果について検討した。
極端 Reissner-Nordstr"om ブラックホールの場合、量子重ね合わせのデコヒーレンスは完全に抑制される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:13:23 GMT)
Quantum state preparation with optimal T-count [2.1] 任意の$n$-qubit量子状態を誤差$varepsilon$に近似するために、Tゲートがいくつ必要かを示す。
また、これは任意の対角線$n$-qubitユニタリをエラー$varepsilon$に実装するための最適なTカウントであることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:29:33 GMT)
FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [2.1] FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。
現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。
AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:07:35 GMT)
A Security Risk Assessment Method for Distributed Ledger Technology (DLT) based Applications: Three Industry Case Studies [2.1] 本研究は,分散型台帳技術のサイバーセキュリティに対する意識を高めることを目的としている。
我々は,分散台帳技術に対するセキュリティ脅威と既知の攻撃の可能性のあるデータベースを開発した。
この方法はその後3つのケーススタディで評価された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:37:58 GMT)
Hybrid Top-Down Global Causal Discovery with Local Search for Linear and Nonlinear Additive Noise Models [2.1] 関数因果モデルに基づく手法は、ユニークなグラフを識別することができるが、次元性の呪いや強いパラメトリックな仮定を課すことに苦しむ。
本研究では,局所的な因果構造を利用した観測データにおけるグローバル因果発見のための新しいハイブリッド手法を提案する。
我々は, 合成データに対する実証的な検証を行い, 正確性および最悪の場合の時間複雑度を理論的に保証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:37:35 GMT)
Improved Multi-Task Brain Tumour Segmentation with Synthetic Data Augmentation [2.1] 本稿では,タスク1の勝利解とBraTSチャレンジのタスク3の第三位解について述べる。
本稿では, 成人グリオーマの分節化を改善するために, 合成データを用いて最先端のフレームワークを訓練することを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:35:31 GMT)
Brain Tumour Removing and Missing Modality Generation using 3D WDM [2.1] 本稿では,第8タスクのための第2の配置ソリューションとBraTS 2024タスク7タスクへの参加ソリューションを提案する。
臨床実践を支援するための自動脳分析アルゴリズムの採用が増加している。
これらのアルゴリズムの多くは、脳病変の存在や、特定のMRIモダリティの欠如に苦慮している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:29:55 GMT)
Enhancing the Expressivity of Temporal Graph Networks through Source-Target Identification [2.1] 我々は、TGNの定式化は、メッセージ上での予測や移動平均を表現できないことを示した。
本稿では,各インタラクションイベントメッセージにソースターゲット識別を追加することで,TGNの表現性を高めることを提案する。
提案手法であるTGNv2は,時間グラフベンチマーク(TGB)の動的ノード親和性予測データセットにおいて,TGNと現在のTGモデルを著しく上回っている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:51:08 GMT)
RRADistill: Distilling LLMs' Passage Ranking Ability for Document Re-Ranking of Long-Tail Queries in a Search Engine [2.0] 大規模言語モデル(LLM)は、クエリとドキュメント間の意味的関係を理解するのに優れている。
これらのクエリは、少ないユーザエンゲージメントと限られたフィードバックのため、フィードバックベースのランキングでは難しい。
本稿では,エンコーダモデルとデコーダモデルの両方に対して,効率的なラベル生成パイプラインと新しいsLLMトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:23:15 GMT)
Hypercube Policy Regularization Framework for Offline Reinforcement Learning [2.0] 本稿では,ハイパーキューブポリシーの正規化フレームワークを提案する。
これにより、エージェントは静的データセット内の同様の状態に対応するアクションを探索できる。
ハイパーキューブポリシーの正規化フレームワークは,元のアルゴリズムの性能を効果的に向上させることができることが理論的に実証された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:48:32 GMT)
Continuous Sign Language Recognition System using Deep Learning with MediaPipe Holistic [2.0] 手話はコミュニケーションに視覚を使う聴覚障害者の言語である。
アメリカ手話(ASL)、中国手話(CSL)、インド手話(ISL)など、世界中で約300の手話が実践されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:19:39 GMT)
Interpretable Measurement of CNN Deep Feature Density using Copula and the Generalized Characteristic Function [2.0] 畳み込みニューラルネットワーク(CNN)の深い特徴の確率密度関数(PDF)を測定するための新しい実証的アプローチを提案する。
意外なことに、主要ブロック後の非負の深いCNN特徴の1次元境界はガウス分布によってよく近似されていない。
我々は、ネットワーク深度が典型的な範囲内で増加するにつれて、深い特徴がますます独立化するのを観察する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:04:58 GMT)
Pushing Boundaries: Quantum-Enhanced Leader Election and the Limits of Consensus [1.9] 量子絡み合いは非同期ネットワークにおけるフィッシャー・リンチ・パターソンの不合理性定理(FLP)をバイパスしないことを示す。
我々は,概念実証としてリーダ選挙アルゴリズムを開発し,非同期遅延と競合しながら,絡み合いによって効率が向上することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:29:04 GMT)
Conjugate gradient methods for high-dimensional GLMMs [1.9] 一般化線形混合モデル(GLMM)は統計解析において広く用いられているツールである。
多くの計算手法の主なボトルネックは、ランダム効果に関連する高次元精度行列の逆転にある。
通常のGLMMに対して、元の精度がスパースである場合でも、Colesky因子は密であることを示す。
そこで我々は,特に共役勾配法 (CG) に近似した反復的手法に目を向ける。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:09:12 GMT)
When Quantum and Classical Models Disagree: Learning Beyond Minimum Norm Least Square [1.9] 変分量子回路(VQC)の収束特性について検討する。
量子モデルと古典モデルの分離をそれぞれの重みベクトルで特徴づける。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:18:38 GMT)
Green My LLM: Studying the key factors affecting the energy consumption of code assistants [1.7] 本稿では,GitHub Copilotのような大規模言語モデルに基づくコードアシスタントのエネルギー消費について検討する。
その結果,コードアシスタントのエネルギー消費と性能は,コンカレント開発者の数など,様々な要因に影響されていることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:00:29 GMT)
Subspace-Constrained Quadratic Matrix Factorization: Algorithm and Applications [1.7] 多様体学習における課題に対処するために,部分空間制約付き二次行列分解モデルを提案する。
このモデルは、接空間、正規部分空間、二次形式を含む重要な低次元構造を共同で学習するように設計されている。
その結果,本モデルは従来の手法よりも優れており,コア低次元構造を捉える上での頑健さと有効性を強調した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:57:53 GMT)
Knowledge Graphs of Driving Scenes to Empower the Emerging Capabilities of Neurosymbolic AI [1.6] ニューロシンボリックAIは、知覚から認知に至るまでのタスクに対する強力なアプローチとして浮上している。
ニューロシンボリックAIタスクに適した、広く利用可能な実世界のベンチマークデータセットがない。
私たちはDSceneKGを紹介します。これは、オープンな自律運転データセットから構築された実世界の高品質なシーンから構築された、運転シーンの知識グラフのスイートです。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:41:20 GMT)
Interplay between Federated Learning and Explainable Artificial Intelligence: a Scoping Review [1.6] フェデレートラーニング(FL)と説明可能な人工知能(XAI)の併用により、分散データからモデルのトレーニングが可能になる。
このスコーピングレビューは、FLとXAIを共同で扱う出版物をマッピングする。
37の研究が我々の基準を満たし、解釈可能性よりも説明法に焦点をあてた論文が多かった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:44:35 GMT)
VAIR: Visuo-Acoustic Implicit Representations for Low-Cost, Multi-Modal Transparent Surface Reconstruction in Indoor Scenes [1.6] 透明な表面からなる屋内シーンの暗黙的な表現を学習する新しいモデルを提案する。
画像空間におけるボリュームレンダリングや3次元幾何再構成を可能にするために,暗黙の表現をクエリできることを示す。
本手法は, 透明表面再構成における最先端技術よりも顕著に改善されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:40:17 GMT)
Semantic Security with Infinite Dimensional Quantum Eavesdropping Channel [1.5] 本稿では,ワイヤタップチャネルの直接符号化定理の証明法を提案する。
この方法はブロック長の増加とともに指数関数的に減衰する誤差を生じる。
セマンティックセキュリティの量子バージョンを保証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:27:30 GMT)
Benchmarking Single-Qubit Gates on a Noise-Biased Qubit Beyond the Fault-Tolerant Threshold [1.5] 量子システムのノイズは、量子情報処理の進歩を妨げる。
フォールトトレランスを実現する上で最も有望なプラットフォームの1つは、構造化ノイズを持つキュービットである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:34:18 GMT)
Convergence efficiency of quantum gates and circuits [1.4] ロックされたガジェット」モデルにより、ゲートと回路アーキテクチャの収束効率を評価・比較できる。
我々は、より高い位置にあるゲートの分析を行い、マルゴラス門が他のよく知られたゲートよりも優れていることを発見した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:40:19 GMT)
Regularized Projection Matrix Approximation with Applications to Community Detection [1.4] 本稿では,アフィニティ行列からクラスタ情報を復元するための正規化プロジェクション行列近似フレームワークを提案する。
3つの異なるペナルティ関数について検討し, それぞれが有界, 正, スパースシナリオに対応するように調整した。
合成および実世界の両方のデータセットで行った数値実験により、我々の正規化射影行列近似アプローチはクラスタリング性能において最先端の手法を著しく上回っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:12:55 GMT)
Controlling Human Shape and Pose in Text-to-Image Diffusion Models via Domain Adaptation [1.4] 本研究では、事前訓練されたテキスト・画像拡散モデルにおいて、人間の形状とポーズを条件付きで制御する手法を提案する。
これらの拡散モデルを微調整して新しい条件に適合させるには、大きなデータセットと高品質なアノテーションが必要である。
合成条件情報を分離することで画像品質を維持するドメイン適応手法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:02:41 GMT)
Fine-tuning Large Language Models for DGA and DNS Exfiltration Detection [1.4] 大規模言語モデル(LLM)は、リアルタイム検出タスクにおいてその習熟度を実証している。
本研究は, DGA および DNS ろ過攻撃を検出するための微調整 LLM の有効性を検証する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:57:27 GMT)
On fault tolerant single-shot logical state preparation and robust long-range entanglement [1.3] 我々は、任意の量子LDPC符号に対して、単発論理状態の準備が可能であることを証明した。
また、任意の量子LDPC符号で符号化されたGHZ状態の単発準備も行う。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:51:05 GMT)
Smoke Screens and Scapegoats: The Reality of General Data Protection Regulation Compliance -- Privacy and Ethics in the Case of Replika AI [1.3] 本稿では,AIコンパニオンサービスにおけるこれらの課題の複雑さを検討するために,批判的なアプローチをとる。
当社は、企業とその実践に関するメディアの記事を分析し、ポリシーで提供された情報の信頼性に関する洞察を得る。
その結果、プライバシーの通知にもかかわらず、データ収集のプラクティスはユーザーの完全な認識なしに個人データを収集する可能性があることが判明した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:36:19 GMT)
Benchmarking Large Language Models with Integer Sequence Generation Tasks [1.3] 本稿では,大規模言語モデル(LLM)がオンラインシーケンス百科事典(OEIS)から整数列を計算するコードを書かなければならない,新たなベンチマークを提案する。
ベンチマークの結果、OpenAI、Anthropic、Meta、Googleの他のフロンティアモデルよりも、簡単かつハードな整数シーケンス間の精度と不正なレートで、o1シリーズのモデルの方が優れていることが判明した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 02:05:43 GMT)
GenJoin: Conditional Generative Plan-to-Plan Query Optimizer that Learns from Subplan Hints [1.3] 我々は,クエリ最適化問題を共生生成タスクとして考える,新しい学習クエリであるGenJoinを提案する。
GenJoinは、よく知られた2つの実世界のベンチマークの最先端メソッドと同様に、大きく、一貫してパフォーマンスを向上する最初の学習クエリである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:31:01 GMT)
A Comprehensive Review of Multimodal XR Applications, Risks, and Ethical Challenges in the Metaverse [1.3] レビューでは、拡張現実性(XR)技術に関連する幅広い応用、リスク、倫理的課題について考察する。
XRは、教育における没入型学習、医学・専門教育、神経心理学的評価、治療介入、芸術、エンターテイメント、eコマース、リモートワーク、スポーツ、建築、都市計画、文化遺産などの分野に革命をもたらしている。
XRの拡張は、データプライバシのリスク、サイバーセキュリティの脆弱性、サイバーシック、中毒、解離、ハラスメント、いじめ、誤情報など、深刻な懸念を提起する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:57:56 GMT)
Field Assessment of Force Torque Sensors for Planetary Rover Navigation [1.3] 惑星探査機の受動的センサーは、状態推定と地形の理解と移動性能に役立っている。
力トルクセンサーは、相互作用力を直接測定する能力があるにもかかわらず、惑星航法のためには探索されていない。
本稿では,6輪ローバーから収集したデータに基づいて,力トルクセンサの性能評価と使用事例について述べる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:34:37 GMT)
Watermarking Language Models through Language Models [1.2] 本稿では,言語モデルが生成するプロンプトを通じて,言語モデルを透かし出す新しいフレームワークを提案する。
提案手法では,マルチモデル構成を用いて,透かし生成のためのPrompting言語モデル,生成されたコンテンツに透かしを埋め込むマーキング言語モデル,これらの透かしの存在を検証するための検出言語モデルを利用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:16:49 GMT)
Finding dense sub-lattices as low-energy states of a Hamiltonian [1.2] 格子ベースの暗号は、量子後暗号の最も顕著な候補の1つである。
最短ベクトル問題(SVP)は、与えられた格子の中で最短の非ゼロベクトルを見つけることである。
我々は、与えられた格子の最も密度の高い$K$-Densest Sub-lattice(K$-DSP)を求めるために、$K$-Densest Sub-lattice Problem(K$-DSP)として知られるSVPの自然な一般化を研究する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:39:03 GMT)
Engineering Fault-tolerant Bosonic Codes with Quantum Lattice Gates [1.2] ボソニック符号は、1つの連続可変ボソニックシステムで量子情報の符号化と保護にハードウェア効率のよいアプローチを提供する。
量子格子ゲートと呼ばれる1種類のゲート要素からなる新しい普遍量子ゲートセットを導入し、フォールトトレラント量子コンピューティングのためのボソニックコードステートを設計する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:18:38 GMT)
Generating Highly Designable Proteins with Geometric Algebra Flow Matching [1.2] 幾何生成物と高次メッセージパッシングを利用したタンパク質のバックボーン設計のための生成モデルを提案する。
我々は、タンパク質のバックボーン生成のための最先端フローマッチングモデルであるFrameFlowのフレームワークにそれを組み込むことで、アーキテクチャを評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:21:36 GMT)
A unified weighting framework for evaluating nearest neighbour classification [1.1] 従来型 (NN), ファジィ (FNN), ファジィ粗 (FRNN) の総合的および大規模評価を行った。
理論上最適なサムワース重みはカーネルに収束することを示す。
また, 距離とスケーリングの指標についても検討し, 相互に関連性を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:19:42 GMT)
Optimal Routing Protocols for Reconfigurable Atom Arrays [1.1] 我々は最先端の中性原子系に適用可能なルーティングモデルについて検討する。
現在の設計では、$Omega(sqrt N log N)$のステップで、$N$の原子を持つ2次元配列上の特定の置換を実行する必要がある。
また、簡単な実験的なアップグレードを提案し、ルーティングコストを$Theta(log N)$ stepsに削減することを示した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:51:34 GMT)
Holographic pseudoentanglement and the complexity of the AdS/CFT dictionary [1.1] 量子コンピュータは、AdS/CFT対応のCFT側をシミュレートすることで、量子重力に光を当てる可能性がある。
ホログラフィーにおける幾何学と絡み合いの関連性から, 幾何再構成は概ね困難である可能性が示唆された。
これは、ホログラフィック CFT 状態の特別な絡み合い構造を持つ状態であっても、幾何再構成は困難であることを示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:51:05 GMT)
Personalized Large Language Models [1.1] 本稿では,大規模言語モデル(LLM)のパーソナライズ手法について検討する。
その結果、パーソナライズされた微調整は、非パーソナライズされたモデルと比較してモデル推論を改善することが示された。
感情認識とヘイトスピーチ検出のためのデータセットの実験は、パーソナライズされた方法で一貫したパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:43:01 GMT)
In the Era of Prompt Learning with Vision-Language Models [1.1] ドメイン一般化のためのドメインに依存しない新しい学習戦略であるtextscStyLIP を紹介する。
StyLIPは、スタイルプロジェクタを使用してドメイン固有のプロンプトトークンを学習することで、CLIPsビジョンエンコーダの視覚スタイルとコンテンツを切り離す。
また,CLIPの凍結視覚バックボーンを利用した非教師なし領域適応(DA)のためのAD-CLIPを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:31:21 GMT)
LidaRefer: Outdoor 3D Visual Grounding for Autonomous Driving with Transformers [1.1] LidaReferは、大規模な屋外シーン用に設計されたトランスフォーマーベースの3DVGフレームワークである。
本稿では,デコーダのクエリを監督し,曖昧なオブジェクトをローカライズする,シンプルで効果的なローカライズ手法を提案する。
LidaReferは、自動運転のための3DVGデータセットであるTalk2Car-3Dで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:12:01 GMT)
Improve the Fitting Accuracy of Deep Learning for the Nonlinear Schrödinger Equation Using Linear Feature Decoupling Method [1.1] 我々は、FDD(Feature Decoupling Distributed)法を用いて、深層学習能力を高めて、シュロディンガー方程式(NLSE)に適合させる。
非結合モデルと比較してNLSE損失は著しく減少する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:08:12 GMT)
Normalized Space Alignment: A Versatile Metric for Representation Analysis [1.0] 正規化空間アライメント(NSA)と呼ばれるニューラルネットワーク表現のための多様体解析手法を提案する。
NSAは、同じソースから派生し、同じ大きさの2つの点雲間のペアワイズ距離を比較し、異なる次元を持つ可能性がある。
NSAは分析ツールと差別化可能な損失関数の両方として機能し、表現の比較と調整の堅牢な手段を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:10:28 GMT)
Quantum adiabatic optimization with Rydberg arrays: localization phenomena and encoding strategies [1.0] 我々は[Nguyen et al., PRX Quantum 4, 010316 (2023) で提案された符号化スキームの量子力学について検討する。
論文では,アディバティックプロトコルに沿ったシステムサイズによる最小ギャップスケーリングについて検討する。
このような局所化とその正解を求める成功確率への影響を観察する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:10:01 GMT)
The Role of AI in Financial Forecasting: ChatGPT's Potential and Challenges [0.9] 金融セクター、特に財務予測における人工知能(AI)の将来への展望。
ディープラーニング、強化学習、BlockchAInとモノのインターネットとの統合など、AI技術のダイナミクス。
AIの統合は、金融セクターにおける規制と倫理上の問題、およびデータプライバシ保護の意義に挑戦する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:35:16 GMT)
Robust Low-Cost Drone Detection and Classification in Low SNR Environments [0.9] ドローンを検知し、分類する能力について、様々な畳み込みニューラルネットワーク(CNN)を評価した。
本稿では,標準コンピュータ,ソフトウェア定義無線(SDR),アンテナを用いた低コストドローン検知システムについて紹介する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:35:32 GMT)
Learning dynamical systems from data: Gradient-based dictionary optimization [0.9] 本稿では,データから適切な基底関数を学習するための,勾配勾配に基づく新しい最適化フレームワークを提案する。
EDMD、SINDy、PDE-FINDと組み合わせて使う方法を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:15:27 GMT)
SpikeBottleNet: Spike-Driven Feature Compression Architecture for Edge-Cloud Co-Inference [0.9] エッジクラウドコ推論システムのための新しいアーキテクチャであるSpikeBottleNetを提案する。
SpikeBottleNetはスパイクニューロンモデルを統合し、エッジデバイスのエネルギー消費を大幅に削減する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 14:49:28 GMT)
Is network fragmentation a useful complexity measure? [0.8] ディープニューラルネットワーク分類器はフラグメンテーションを示すことができ、モデル関数は入力空間がトラバースされるにつれてクラスを急速に変更する。
我々はこの現象を画像分類の文脈で研究し、フラグメンテーションが一般化性能の予測可能かどうかを問う。
i) フラグメンテーションは入力空間に限らず, 隠蔽表現にも生じ, (ii) フラグメンテーションはトレーニングを通しての検証誤差の傾向に従い, (iii) フラグメンテーションは重量ノルムの増加による直接の結果ではない。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:27:37 GMT)
Local Padding in Patch-Based GANs for Seamless Infinite-Sized Texture Synthesis [0.8] 本稿では,パッチ・バイ・パッチ生成に基づくGANを用いて,任意のサイズのテクスチャ画像を生成する手法を提案する。
モデルはゼロパディングの代わりに、生成したパッチ間のバウンダリ機能を共有するジェネレータ内のテキストローカルパディングを使用する。
提案手法は,生成したテクスチャの品質と多様性の観点から,既存のGANをベースとしたテクスチャモデルよりも大幅に進歩している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:00:08 GMT)
Performance-Guided LLM Knowledge Distillation for Efficient Text Classification at Scale [0.8] 本稿では,生産用テキスト分類アプリケーションにおけるパフォーマンスガイド型知識蒸留(PGKD)について述べる。
PGKDは教師による知識蒸留を利用して、大規模言語モデルの知識を小さなタスク固有のモデルに抽出する。
PGKD は LLM よりも 130 倍高速で 25 倍安価であることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:45:29 GMT)
C3T: Cross-modal Transfer Through Time for Human Action Recognition [0.8] 我々は、Unsupervised Modality Adaptation (UMA) という、未研究のクロスモーダル・トランスファー・セッティングを定式化し、探求する。
学生教師(ST)、コントラストアライメント(CA)、時間経由のクロスモーダルトランスファー(C3T)の3つの方法を開発した。
その結果、C3Tは少なくとも8%のマージンで最も頑健で高い性能を示し、時間的ノイズがあっても監督された設定性能に近づいた。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 17:10:15 GMT)
Latent Diffusion Model for Conditional Reservoir Facies Generation [0.8] 貯水池環境の条件付き生成に特化して設計された新しい潜水拡散モデルが提案されている。
提案モデルでは条件付きデータを厳格に保存する高忠実度ファシリゼーションを実現する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:52:24 GMT)
GREI Data Repository AI Taxonomy [0.8] GREIは、リポジトリ管理全体にわたるAI統合をガイドするために、データリポジトリの役割に合わせたAI分類を開発した。
役割を、取得、検証、組織、強化、分析、共有、ユーザサポートといった段階に分類する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:14:58 GMT)
Taming Toxicity or Fueling It? The Great Ban`s Role in Shifting Toxic User Behavior and Engagement [0.7] 我々は,Redditが実施した最も大規模な非プラットフォーム的介入の一つであるThe Great Banの有効性を評価した。
約34万のユーザーが共有した5300万のコメントを分析した。
適度な利用者の15.6%がプラットフォームを放棄し、残りの利用者は全体の毒性を4.1%減らした。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:26:32 GMT)
An Effective Pipeline for Whole-Slide Image Glomerulus Segmentation [0.7] 腎疾患の正確な診断にはWSIの糸球体分離が不可欠である。
本稿では、パッチレベルとWSIレベルのセグメンテーションタスクの両方を効果的に強化するグロメラスセグメンテーションのための実用的なパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:22:32 GMT)
Dialectal Coverage And Generalization in Arabic Speech Recognition [0.7] 本研究は,事前学習における方言カバレッジの役割,方言固有の微調整の有効性,および未知の方言への一般化能力について検討した。
様々な方言の組み合わせにわたる広範な実験を通じて、我々の研究はアラビア語のような多中心言語のためのASRシステムの開発を進めるための重要な洞察を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:23:30 GMT)
An efficient likelihood-free Bayesian inference method based on sequential neural posterior estimation [0.7] SNPE技術はニューラルネットワークに基づく条件密度推定器を用いて逐次シミュレーションから後部を学習する。
SNPE法は、キャリブレーションカーネルを用いて観測データの周囲のサンプル重量を増大させ、集中的な損失関数をもたらす。
本稿では,適応キャリブレーションカーネルと分散低減技術を用いてSNPEの安定性を向上させることを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:52:39 GMT)
Solving Generalized Grouping Problems in Cellular Manufacturing Systems Using a Network Flow Model [0.6] 本稿では, セル製造システムにおける一般化グループ化問題に焦点をあてる。
本研究は,ネットワークフローアルゴリズムの広範かつ広範な利用に着想を得て,一般化グループ化のためのプロセス経路ファミリー形成を定式化した。
提案モデルでは, 生成する部品の数を事前に指定することなく, プロセス経路のファミリー形成問題を最適に解決する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:14:52 GMT)
Quantum limited imaging of a nanomechanical resonator with a spatial mode sorter [0.6] 我々は,ナノメカニカル共振器を画像化するための空間モードソータを探索する。
我々は、振動するナノリボンからガウスレーザービームを反射し、反射ビームを商用空間モードデマルチプレクサを通過させる。
この手法により,リボンのねじり振動を量子限界付近の精度で読み取ることができることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:52:18 GMT)
wav2sleep: A Unified Multi-Modal Approach to Sleep Stage Classification from Physiological Signals [0.6] wav2sleepは、トレーニングと推論中に入力信号の可変セットを操作するために設計された統一モデルである。
ECG、PSG、呼吸信号を含むテスト時間入力の組み合わせで、既存の睡眠ステージ分類モデルよりも優れています。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:01:36 GMT)
Achieving the volume-law entropy regime with random-sign Dicke states [0.6] 実数値波動関数の複雑さはランダムな符号構造を導入することで正確に調整できることを示す。
これらのランダム符号ディック状態の実践的実現は、浅い量子回路を持つ異なる物理プラットフォーム上で可能である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:56:12 GMT)
The Fibonacci Network: A Simple Alternative for Positional Encoding [0.6] 半周波数と四分周波数の入力が与えられたとき、非常に単純なスマートスは、非常に容易に周波数を出力できることを示す。
信号の周波数に対して各ブロックを訓練することにより、フィボナッチネットワークが任意に高い周波数を再構成可能であることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:46:23 GMT)
DynaSeg: A Deep Dynamic Fusion Method for Unsupervised Image Segmentation Incorporating Feature Similarity and Spatial Continuity [0.6] 我々は、革新的な教師なしイメージセグメンテーションアプローチであるDynaSegを紹介する。
従来の方法とは異なり、DynaSegは画像の特徴に柔軟に対応する動的重み付け方式を採用している。
DynaSegは、予測されたクラスタ数が1つに収束する可能性のある、過小評価の失敗を防ぐ。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:46:16 GMT)
Robust Offline Active Learning on Graphs [0.6] ネットワーク構造とノードの共変量の両方からの情報を明示的に組み込むことで,問合せノードを選択するオフラインアクティブラーニング手法を提案する。
我々の理論的結果は、アクティブラーニングにおける情報性と代表性の間のトレードオフを示している。
提案手法はグラフ上の回帰タスクと分類タスクの両方に適用できる。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 03:54:22 GMT)
Non-invertible symmetries act locally by quantum operations [0.6] 場の量子論と多体系の非可逆対称性は対称性の概念を一般化する。
非可逆対称性は量子演算によって局所作用素に作用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:04:19 GMT)
FQsun: A Configurable Wave Function-Based Quantum Emulator for Power-Efficient Quantum Simulations [0.5] 量子エミュレータのFQsunを提案する。
16ビット浮動小数点、32ビット浮動小数点、16ビット不動小数点、24ビット不動小数点、32ビット不動小数点を含む5つのFQsunバージョンがXilinx ZCU102 FPGA上に実装されている。
FQsunは、9,870回までの強力なCPU上の従来のソフトウェアシミュレータよりも優れたパワー遅延製品を実現している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:44:40 GMT)
Impact of Label Noise on Learning Complex Features [0.5] 事前学習は,ノイズの存在下での学習の複雑な機能や多様な特徴を促進することを示す。
実験により,ノイズラベルによる事前学習は,勾配降下を促進させ,代替のミニマを見つけることを実証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:47:18 GMT)
A Committee Based Optimal Asynchronous Byzantine Agreement Protocol W.P. 1 [0.5] 多値ビザンチン合意プロトコルは、非同期ネットワークにおけるアトミックブロードキャストおよびフォールトトレラントステートマシンレプリケーションに不可欠である。
本稿では,非同期ネットワークにおけるメッセージパターンを確率1で解析することにより,余分な通信ラウンドなしで合意を実現する,委員会ベースのMVBAプロトコル(cMVBA)を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:07:09 GMT)
Deep Learning Models for UAV-Assisted Bridge Inspection: A YOLO Benchmark Analysis [0.4] 最新の4種類のYOLO(YOLOv5, YOLOv6, YOLOv7, YOLOv8)に属する23のモデルをベンチマークする。
精度と処理速度の最適なバランスを提供するモデルとして, YOLOv8n, YOLOv7tiny, YOLOv6m, YOLOv6mを同定した。
その結果,UAVのモデル選択プロセスが促進され,より効率的で信頼性の高い橋梁検査が可能となった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:03:40 GMT)
LuxBank: The First Universal Dependency Treebank for Luxembourgish [0.4] ルクセンブルク語(Luxembourgish)は、西ゲルマンの約40万人が話している言語である。
ルクセンブルクにおける最初のユニバーサル依存(UD)ツリーバンクであるLuxBankを紹介する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:50:40 GMT)
Uncertainty Prediction Neural Network (UpNet): Embedding Artificial Neural Network in Bayesian Inversion Framework to Quantify the Uncertainty of Remote Sensing Retrieval [0.3] 放射移動モデル(RTMs)の逆転は、大規模植生の生物物理パラメーターを取得するために最もよく用いられる手法である。
近年、ニューラルネットワーク(ANN)に基づく手法は、高い精度と計算効率のため、RTMの反転の主流となっている。
ベイズ反転理論の解釈が欠如していることから、検索の不確実性を定量化する上での課題に直面している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:27:42 GMT)
Tibyan Corpus: Balanced and Comprehensive Error Coverage Corpus Using ChatGPT for Arabic Grammatical Error Correction [0.3] 本研究の目的は,ChatGPTを用いた文法的誤り訂正のためのアラビア語コーパス"Tibyan"を開発することである。
ChatGPTは、アラビア語の本から抽出された誤りのない文と一致した文法的な誤りを含む一対のアラビア語の文に基づいてデータ拡張ツールとして使用される。
私たちのコーパスには、正書法、構文、意味論、句読法、形態学、分割という7つのタイプを含む49のエラーが含まれていました。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:17:40 GMT)
Dual-isometric Projected Entangled Pair States [0.3] 本稿では,2つの等尺条件を組み込んだプロジェクト・エンタングルド・ペア・ステート(PEPS)を提案する。
この新たなクラスは、一般的な局所可観測関数と特定の2点相関関数の効率的な計算を容易にする。
我々は、このクラスが普遍量子計算を符号化し、位相的から自明な順序への遷移を表現できることを解析的に実証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:19:31 GMT)
Dual-isometric Projected Entangled Pair States [0.3] 本稿では,2つの等尺条件を組み込んだプロジェクト・エンタングルド・ペア・ステート(PEPS)を提案する。
この新たなクラスは、一般的な局所可観測関数と特定の2点相関関数の効率的な計算を容易にする。
我々は、このクラスが普遍量子計算を符号化し、位相的から自明な順序への遷移を表現できることを解析的に実証した。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 15:19:31 GMT)
Trends, Challenges, and Future Directions in Deep Learning for Glaucoma: A Systematic Review [0.3] PRISMA(Systematic Reviews and Meta-Analyses)における優先報告項目を用いたディープラーニング(DL)アルゴリズムによる緑内障検出の最近の進歩について検討する。
本研究では,DLに基づく緑内障検出フレームワークの3つの側面(入力データモダリティ,処理戦略,モデルアーキテクチャとアプリケーション)に焦点を当てた。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 23:35:05 GMT)
Approximate Frank-Wolfe Algorithm over Graph-structured Support Set [0.3] 我々は、元のアルゴリズムを分析し、実装し、それに基づいていくつかの拡張を導入した。
新しいDMO法では十分な改善が得られなかったが,バックトラックライン探索法は効率よくイテレーション数を削減した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:04:58 GMT)
Cybercrime Prediction via Geographically Weighted Learning [0.2] 地理的緯度と長手点を考慮したグラフニューラルネットワークモデルを提案する。
合成データセットを用いて,サイバーセキュリティの4クラス分類問題にアルゴリズムを適用した。
従来のニューラルネットワークや畳み込みニューラルネットワークよりも精度が高いことを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:46:48 GMT)
Deep Learning for Surgical Instrument Recognition and Segmentation in Robotic-Assisted Surgeries: A Systematic Review [0.2] ロボットによる最小侵襲手術における手術器具のアノテートのための深層学習(DL)の適用は,手術技術の大幅な進歩を示している。
これらの高度なDLモデルは、手術器具の検出と分節の精度と効率を顕著に改善した。
外科教育におけるDLの応用は変革的である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 07:52:59 GMT)
Leveraging LLMs to Enable Natural Language Search on Go-to-market Platforms [0.2] 販売者向けのZoominfo製品向けのソリューションの実装と評価を行い、自然言語による大規模言語モデルの実現を促す。
中間検索フィールドは、構文エラーの除去など、クエリ毎に多くの利点を提供する。
提案手法の有効性を実証するために, クローズド, オープンソース, 微調整 LLM モデルを用いた総合実験を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:58:38 GMT)
Mixing time of quantum Gibbs sampling for random sparse Hamiltonians [0.2] Chen, Kastoryano, Gily'en が新たに開発した量子ギブスサンプリングアルゴリズムは、非可換量子系の効率的なシミュレーションを提供する。
任意の温度で n 個のスパースハミルトニアンによるランダム n の様々な族に対する混合時間にポリログ(n) の上界を確立する。
この方法は、量子的に容易なハミルトニアンの低エネルギー状態を作成するために、他の効率的なアルゴリズムと同等にギブスサンプリングを行う。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:01:19 GMT)
Deploying Large Language Models With Retrieval Augmented Generation [0.2] Retrieval Augmented Generationは、大規模言語モデルのトレーニングセット外のデータソースからの知識を統合するための重要なアプローチとして登場した。
本稿では,LLMとRAGを統合して情報検索を行うパイロットプロジェクトの開発とフィールドテストから得られた知見について述べる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:11:51 GMT)
Remote Sensing-Based Assessment of Economic Development [0.2] 本プロジェクトの目的は、衛星データを用いて、選択された地域(シンガポール)の経済発展レベルを統計的に推定することである。
プロジェクトからの発見は、政策立案者に介入や経済開発イニシアチブの支援を必要とする地域について知らせる可能性がある。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 03:18:34 GMT)
Quantum Entanglement in Dirac Dynamics via Continuous-Time Quantum Walks in a Quantum Circuit Framework [0.2] 時間間隔や位置空間の大きさの変化が、Zitterbewegungと呼ばれる相対論的効果と量子絡み合いにどのように影響するかを示す。
その結果、量子情報理論の洞察を通じて、ディラック力学における内部空間と外部空間の間の相互作用の理解を深める。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:55:24 GMT)
On the average-case hardness of BosonSampling [0.1] ガウス永遠推定」予想を証明することは、量子優位の理論において中心的な問題となっている。
我々は、ほとんどのランダムなBosonSampling実験の出力確率に対して、$e-nlog n -n - O(ndelta)$加法誤差推定が$#P$-hardであることを証明する。
この結果により、ランダムなBosonSampling実験に対する古典的なサンプリング結果の難しさを初めて示すことができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:41:45 GMT)
FMEA Builder: Expert Guided Text Generation for Equipment Maintenance [0.0] 本稿では,重要資産に関する構造化文書作成のための基礎モデルの利用について論じる。
FMEA(Failure Mode and Effects Analysis)は、資産または機器の構成をキャプチャする。
本システムでは,大規模言語モデルを用いて,FMEA文書の高速かつ専門的な生成を可能にする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:11:03 GMT)
Why quantum state verification cannot be both efficient and secure: a categorical approach [0.0] 任意の量子状態を検証するために用いられる全てのカット・アンド・チョース・アプローチに対して、量子状態検証の基本的な限界を示す。
以上の結果から, カット・アンド・チョース技術は, 効率と安全性の両立した量子状態検証プロトコルを導出できないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:07:29 GMT)
What is lost in Normalization? Exploring Pitfalls in Multilingual ASR Model Evaluations [0.0] 本稿では,OpenAI Whisper,MetaのMMS,Seamless,アセンブリAIのConformerなど,主要なASRモデルのテキスト正規化ルーチンについて検討する。
我々の研究は、現在のテキスト正規化の実践が、公正な比較のためにASR出力を標準化することを目的としている一方で、Indicスクリプトに適用した場合、根本的な欠陥があることを明らかにする。
本稿では,言語学の専門知識を生かしたテキスト正規化ルーチン開発へのシフトを提案する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 04:55:29 GMT)
Upconversion of Phonon Modes into Microwave Photons in a Lithium Niobate Bulk Acoustic Wave Resonator Coupled to a Microwave Cavity [0.0] ニオブ酸リチウムバルク音響共振器の音響振動とマイクロ波共振器のマイクロ波光子とのカップリングについて, 4K付近の温度で検討した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:52:21 GMT)
Undermining Image and Text Classification Algorithms Using Adversarial Attacks [0.0] 本研究は,各種機械学習モデルを訓練し,GANとSMOTEを用いてテキスト分類モデルへの攻撃を目的とした追加データポイントを生成することにより,そのギャップを解消する。
実験の結果,分類モデルの重大な脆弱性が明らかとなった。特に,攻撃後の最上位のテキスト分類モデルの精度が20%低下し,顔認識精度が30%低下した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 04:05:58 GMT)
Towards quantum computing Feynman diagrams in hybrid qubit-oscillator devices [0.0] ハイブリッド量子オシレータデバイスにおける実験は、関数計算と経路積分のレンズを通して見ることができることを示す。
この接続は、ファインマン図形の観点から特徴関数の拡張を示唆する。
シュウィンガー・ケルディシュ形式主義を通じて、これらのアイデアを有限温度に一般化する方法について議論する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:17:00 GMT)
Topological obstruction to the training of shallow ReLU neural networks [0.0] 損失ランドスケープの幾何学と単純なニューラルネットワークの最適化軌跡との相互作用について検討する。
本稿では,勾配流を用いた浅部ReLUニューラルネットワークの損失景観におけるトポロジカル障害物の存在を明らかにする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:13:14 GMT)
Thermodynamics of coupled time crystals with an application to energy storage [0.0] 相互作用する2つの境界時間結晶の熱力学とゆらぎ挙動について検討する。
理論的導出を利用して、時間結晶の量子電池としての応用の可能性を探る。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:21:26 GMT)
The Translation of Circumlocution in Arabic Short Stories into English [0.0] この研究は、採用される翻訳戦略の適切性を評価するための枠組みとして、ニダの翻訳理論(1964年)を採用している。
その結果,アラビア割礼カテゴリーと英語のメタディスコースカテゴリーとの間に有意な類似性が認められた。
この研究は、翻訳者が周知のニュアンスを正確に伝達する困難に遭遇した事例も強調している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:46:42 GMT)
The New Dynamics of Open Source: Relicensing, Forks, & Community Impact [0.0] ベンダーは、人気のあるオープンソースプロジェクトをより制限的なライセンスに再ライセンスし、より多くの収益を生み出すことを期待している。
本研究は,フォークによるライセンス変更に基づく3つのケーススタディの組織関連データを比較した。
研究によると、これらの過激な出来事から生じるフォークは、当初のプロジェクトよりも組織的な多様性が増している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:21:45 GMT)
The Floquet Fluxonium Molecule: Driving Down Dephasing in Coupled Superconducting Qubits [0.0] そこで本研究では,フロッケフラッソニウム分子(Floquet fluxonium molecule)を,その量子ビット状態の不整合担持によるビットフリップ速度の最小化と,フラックスノイズの脱落に対する新しい2次不感度による位相フリップの抑制を提案する。
数値シミュレーションにより,ビットフリップ,位相フリップ,消去率を推定し,計算部分空間で約50msのコヒーレンス時間と約500$mu$sの消去寿命を予測した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:26:12 GMT)
The Concatenator: A Bayesian Approach To Real Time Concatenative Musaicing [0.0] 音声誘導コンカテネータ合成のためのリアルタイムシステム「The Concatenator」を提案する。
粒子フィルタを用いて最適コーパス状態をリアルタイムで推定する。
我々のシステムは数時間のコーパスにスケールするが、これは膨大なオーディオデータ収集の時代において重要な特徴である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:52:46 GMT)
The Aharonov-Casher Phase: Topological or Geometric? [0.0] Aharonov-Casher相は、磁場を受ける磁気モーメントを持つ粒子が取る経路の詳細に依存する幾何学的位相であることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:18:53 GMT)
Tailoring Dynamical Codes for Biased Noise: The X$^3$Z$^3$ Floquet Code [0.0] X$3$Z$3$Floquet符号を提案する。
我々の研究は、素量子誤り訂正符号候補として、X$3$Z$3$の符号を確立する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:49:16 GMT)
Survival of the Notable: Gender Asymmetry in Wikipedia Collective Deliberations [0.0] ウィキペディアにおける削除記事(AfD)の議論により、編集者は既存の記事の可読性を評価することができる。
編集長が女性削除の合意に達するまでに長い時間を要するにもかかわらず、女性の伝記は男性よりも早く削除にノミネートされていることが判明した。
歴史人物に関するAfDは、議論中の伝記を他の百科事典にリダイレクトまたはマージする傾向が強い。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:37:24 GMT)
Strong Quantum Mpemba Effect with Squeezed Thermal Reservoirs [0.0] 量子ムペンバ効果(Quantum Mpemba Effect、QMpE)は、量子系をその定常状態に指数関数的に加速することができる現象である。
条件が満たされた場合,QMpEは効果的に誘導できることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:02:34 GMT)
State preparation by shallow circuits using feed forward [0.0] 我々は,この4ステップ方式を用いて,フォールトトレラントな計算を行わず,短い,一定の深さの量子回路を強化する。
LAQCC回路は、一定の深さの量子回路では達成できない長距離相互作用を創出できることを示す。
我々は、任意の数の状態に対する一様重ね合わせのための3つの新しい状態準備プロトコルを作成する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:02:47 GMT)
Spin-1/2 XX chains with modulated Gamma interaction [0.0] モデルのハミルトニアンをフェルミオン化法で正確に対角化する。
エネルギーギャップを探索し、ギャップとギャップのない領域を同定する。
以上の結果から, モデルが1次, 2次, ギャップレスギャップレス, ギャップ付きギャップ付き位相遷移を行うことが明らかとなった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:40:48 GMT)
Solar potential analysis over Indian cities using high-resolution satellite imagery and DEM [0.0] 本研究では,高解像度衛星画像 (0.5 cm) とデジタル高度モデル (1 m) の入力と地上局の放射データを用いて,屋上太陽ポテンシャルを推定する新しい手法を実装した。
その結果, 季節変動や環境影響, ソーラーパネル構造などの技術的理由により, 最大50%の電力損失が生じることがわかった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:50:39 GMT)
Seeing is Deceiving: Exploitation of Visual Pathways in Multi-Modal Language Models [0.0] MLLM(Multi-Modal Language Models)は、視覚データとテキストデータを組み合わせた人工知能である。
攻撃者は視覚的またはテキスト的な入力を操作するか、あるいは両方を操作して、意図しないあるいは有害な応答をモデルに生成させる。
本稿では,MLLMの視覚的入力が様々な攻撃戦略によってどのように活用できるかを概説する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:21:18 GMT)
Saliency Assisted Quantization for Neural Networks [0.0] 本稿では,学習期間中にリアルタイムな説明を提供することにより,深層学習モデルのブラックボックスの性質に対処する。
我々は資源制約に対処するために確立された量子化手法を用いる。
提案手法の有効性を評価するため,量子化が畳み込みニューラルネットワークの解釈可能性や精度に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:16:26 GMT)
Role of Data Mining in Nigerian Tertiary Education Sector [0.0] データマイニングは、ナイジェリアの教育システム内での学生やスタッフのパフォーマンスを予測する上で、さまざまな方法で課題を解決するのに役立つ。
本稿では,ナイジェリア第三次機関の機能単位における問題解決に有効なデータマイニングツールと技術の役割について論じる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:59:27 GMT)
RetrieveGPT: Merging Prompts and Mathematical Models for Enhanced Code-Mixed Information Retrieval [0.0] インドでは、ソーシャルメディアのユーザーはローマ文字を使ってコードミキシングされた会話をすることが多い。
本稿では,コードミキシングによる会話から関連情報を抽出することの課題に焦点をあてる。
我々は、コードミキシングされた会話から最も関連性の高い回答を自動的に識別するメカニズムを開発する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:41:01 GMT)
Rethinking Deep Learning: Non-backpropagation and Non-optimization Machine Learning Approach Using Hebbian Neural Networks [0.0] NNにヘビアン学習を実装することにより,生体神経系を模倣する機械学習手法を開発した。
標準に基づく認識を用いて、個別に訓練されたNNの特性について検討し、特定のラベルで訓練されたNNが、そのラベルに強く反応することを示す。
このことは、Hebbian学習NNが客観的関数、バックプロパゲーション、最適化プロセスなしで手書き文字を認識できることを示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:35:01 GMT)
Realizing Negative Quantum States with the IBM Quantum Hardware [0.0] 本研究では、離散ウィグナー関数の枠組みを用いて記述された強絡み状態について検討する。
我々は,IBM の Emphibm_brisbane デバイス上でのトモグラフィ再構成により,状態生成のための量子回路を提案し,その検証を行う。
これらの絡み合った状態は、非マルコフ的エラーが頻繁に発生するシナリオにおいて、従来のベル状態の代わりに使われる可能性があると信じている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:49:08 GMT)
Real-time stress detection on social network posts using big data technology [0.0] Dreaddit: A Reddit dataset for Stress Analysis in Social Media" を用いて,オンライン投稿におけるストレス検出のリアルタイムシステムを開発した。
トレーニングには3,553行のラベル付きデータセットが作成された。モデルの構築とデプロイにはApache Kafka、PySpark、AirFlowが使用されている。
ロジスティック回帰は新たなストリーミングデータに対して最高の結果となり、精度は69,39%、F1スコアは68,97となった。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:41:13 GMT)
Quantum-Centric Study of Methylene Singlet and Triplet States [0.0] 本研究は、52量子ビット量子実験を用いて、(6e, 23o)系としてモデル化されたCH$$$$分子の電子構造を探索する。
我々は、量子中心超計算フレームワークにおけるサンプルベース量子対角化法(SQD)を適用し、基底状態三重項と最初の励起状態一重項におけるCH$$のエネルギーを計算することに焦点をあてた。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:11:24 GMT)
Quantum speedups in solving near-symmetric optimization problems by low-depth QAOA [0.0] 低深度量子アルゴリズムによる最適化問題の解法として,指数的量子スピードアップを実現するための新しい技術を提案する。
我々は、対称性を示し、植込み解を含む最適化問題の族に焦点をあてる。
我々は、すべての既知の古典的アルゴリズムが指数時間を必要とするインスタンスを発見する、最先端の古典的解法をベンチマークする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:51:44 GMT)
Quantum information with quantum-like bits [0.0] これまでの研究で、我々は巨大で複雑な古典システムを実現することができる量子のようなビットの構築を提案してきた。
本稿では、量子的資源の数学的構造を探究し、創発状態を操作することで任意のゲートをどのように実装できるかを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:19:43 GMT)
Quantum geometric tensor determines the i.i.d. conversion rate in the resource theory of asymmetry for any compact Lie group [0.0] 非対称性の資源理論(英: resource theory of asymmetric, RTA)は、非対称性を研究するための資源理論の枠組みである。
量子幾何テンソルは、最適近似変換率を決定する純粋状態に対する非対称性モノトンであることを示す。
また、RTAの可逆可換性について、Marvian-Spekkens予想を肯定的に証明する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:06:59 GMT)
Quantum Threshold is Powerful [0.0] 2005年、Hoyer と vSpalek は、多ビットファンアウトゲートで拡張された定数深さ量子回路は非常に強力であることを示した。
本稿では,Fanoutを高忠実度に演算するThresholdゲートを持つ量子回路が存在することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:30:31 GMT)
Quantum Speed Limit Time in two-qubit system by Dynamical Decoupling Method [0.0] 本稿では, 周期的動的デカップリング(PDD)法を用いて, 単純二量子系における量子相関の工学的検討を行った。
この結果は高速量子ゲートの実装に有用である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:48:02 GMT)
Quantum Imaging and Metrology with Undetected squeezed Photons: Noise Canceling and Noise Based Imaging [0.0] 未検出の励起光子に基づく量子イメージング装置は、感度位相測定および量子イメージングに使用される。
検出されていない光子を用いた従来の量子イメージングにもかかわらず、提案されたセットアップはホモダイン検出によって実現されている。
その結果, 画像品質と位相測定精度の指標として, ノイズ比の高い信号量を明らかにした。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:29:16 GMT)
Quantum Advantage with Faulty Oracle [0.0] オラクルが一元的でない(あるいは不可逆的な)ノイズにさらされるシナリオに焦点を当てる。
Regev and Schiff (ICALP'08) は、このノイズモデルの下での探索問題に対して量子的優位性が失われていることを示した。
これは、ノイズの多いオラクルに対する量子クエリアルゴリズムの非自明な堅牢化である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:10:07 GMT)
Quality Assurance Practices in Agile Methodology [0.0] ソフトウェアの複雑さは日々増加しており、ソフトウェアプロダクトの検証の必要性も増している。
ソフトウェアメトリクスを開発プロセスやソフトウェア製品に適用するプラクティスは重要なタスクであり、学習と規律を必要とする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:45:40 GMT)
Properties of BV-G structures + textures decomposition models. Application to road detection in satellite images [0.0] 異なる場合において、このモデルの振舞いを与える定理を証明します。
航空画像や衛星画像における道路網検出アプリケーションに適用された長細物体の検出アルゴリズムを導出する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:04:43 GMT)
Proof of the absence of local conserved quantities in the spin-1 bilinear-biquadratic chain and its anisotropic extensions [0.0] 一軸異方性場を持つスピン-1双線型双立方体モデルの可積分性と非可積分性を完全分類する。
既知の可積分系を除く全ての系が可積分であることは厳密に示される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:22:58 GMT)
Primordial power spectrum from an objective collapse mechanism: The simplest case [0.0] 本研究では,インフレ期における初期不均一性の物理的起源を分析する。
連続自発局所化(CSL)モデルに基づく客観的崩壊機構を組み込んだ。
我々は、宇宙マイクロ波背景からの観測と一致する標準スペクトルと同じ特徴を持つ原始スペクトルを得る。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:54:20 GMT)
Population estimation using 3D city modelling and Carto2S datasets -- A case study [0.0] カルト2Sシリーズの打ち上げにより、高解像度画像(0.6-1.0m)が取得され、使用することができる。
精度の良い高解像度ディジタル標高モデル(DEM)は、C2Sマルチビューとマルチ日付データセットを使用して生成することができる。
DEMは、デジタル地形モデル(DTM)を導出し、地球表面上の物体(建物と木)の正確な高さを抽出するためにさらに使用される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:52:57 GMT)
Phantom Edges in the Problem Hamiltonian: A Method for Increasing Performance and Graph Visibility for QAOA [0.0] 本稿では,新しいQAOAアンサッツについて述べる。
我々は、新しいアンザッツの一般式を$p=1$で導き、サイクルグラフの近似比の改善を解析的に示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:20:01 GMT)
Optimization of experimental quantum randomness expansion [0.0] 本稿ではベルの不等式違反に基づくQRNG(Quantum Random Number Generator)の設計と性能最適化について包括的に分析する。
我々は、ランダムネス消費とネットランダムネス生成のトレードオフをバランスさせるために、$gamma$と$p_Omega$の最適範囲を同定する。
以上の結果から,QRNG実装の大幅な発展と,ランダム性向上率の向上が示唆された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:12:58 GMT)
On the Robustness of Machine Learning Models in Predicting Thermodynamic Properties: a Case of Searching for New Quasicrystal Approximants [0.0] この研究では、準結晶データセットのネストした金属間近似を合成し、それらの上で様々な機械学習モデルを訓練した。
我々の質的かつより重要なことは、予測の違いを定量的に評価することで、トレーニングサンプルの異なる合理的な変化が、予測される新しい物質の全く異なるセットにつながることを明らかに示しています。
また,プレトレーニングの利点を示し,安定度を高めるためのシーケンシャルトレーニングの簡易かつ効果的な手法を提案した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:50:06 GMT)
On estimates of trace-norm distance between quantum Gaussian states [0.0] 平均ベクトルと共分散行列の観点から、2つの量子ガウス状態間のトレースノーム距離の推定を行った。
本論文では, 状態重なり量と呼ばれる忠実度に類似した量に基づいて, 異なる推定値を得る。
これらの導出は、ArXiv:2405.01431から有用な不等式を置き換えることを目的としていない。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 11:03:16 GMT)
On Gravity Implication in the Wavefunction Collapse [0.0] 重力効果下での巨大量子状態の空間重ね合わせの安定性について検討する。
固有状態実効質量によって生じる異なる時空曲率間の重力的自己相互作用が、重畳状態の局所状態の1つへの還元につながることを明らかにした。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:18:45 GMT)
Multistage Fine-tuning Strategies for Automatic Speech Recognition in Low-resource Languages [0.0] 本稿では,低リソース言語における音声認識(ASR)の性能向上を目的とした,新しい多段階微調整手法を提案する。
本稿では,言語的に類似した言語にモデルを逐次適応させることにより,限られたデジタルリソースを持つ言語を対象としたASRモデルを構築することを目的とする。
私たちは、南インドの西ガーツで約1万人が話していたドラヴィダ語であるマラサール語でこれを実験した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:57:57 GMT)
Multi-temporal crack segmentation in concrete structure using deep learning approaches [0.0] ひび割れはコンクリート構造物の劣化の最も初期の指標である。
本研究では, ひび割れのセグメンテーションにマルチテンポラルデータを活用することにより, セグメンテーションの品質を高めることができるか検討する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:09:29 GMT)
Multi-language Video Subtitle Dataset for Image-based Text Recognition [0.0] このデータセットには、オンラインプラットフォームからソースされた24のビデオから抽出された4,224の字幕イメージが含まれている。
タイ語の子音、母音、トーンマーク、句読点、数字、ローマ字、アラビア数字など様々な文字が特徴である。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:06:53 GMT)
Multi-axis inertial sensing with 2D arrays of matter waves [0.0] 原子干渉計(Atom Interferometery)は慣性力に敏感な精密な測定技術である。
同時光パルス原子干渉計の相関に基づく多軸慣性センシング法について報告する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:37:38 GMT)
Meta-Models: An Architecture for Decoding LLM Behaviors Through Interpreted Embeddings and Natural Language [0.0] 我々は「入力モデル」からアクティベーションを取り、入力モデルの振る舞いに関する自然言語質問に答える「メタモデル」を用いる。
選択したタスクタイプをトレーニングし,そのアウト・オブ・ディストリビューション性能を評価することによって,メタモデルの一般化能力を評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:30:38 GMT)
Measuring Software Innovation with Open Source Software Development Data [0.0] 本稿では,GitHub上のオープンソースソフトウェア(OSS)開発活動に基づいた,ソフトウェア革新の新たな尺度を紹介する。
リリース後2年間に28,000のユニークなパッケージから$sim$200,000のユニークなリリースで、依存関係の成長とリリースの複雑さを調べます。
OSSパッケージのメジャーリリースは、科学出版物、特許、標準を補完するイノベーションの単位として数えられる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:11:32 GMT)
Many-body physics and resolvent algebras [0.0] 非相互作用ボソンはソフト境界を持つコンパクト領域に閉じ込められている。
これらの系の力学は、増大する領域や粒子数に対して空間的に均質な力学に収束する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:19:42 GMT)
MCDFN: Supply Chain Demand Forecasting via an Explainable Multi-Channel Data Fusion Network Model [0.0] CNN,Long Short-Term Memory Network (LSTM), Gated Recurrent Units (GRU)を統合したハイブリッドアーキテクチャであるMulti-Channel Data Fusion Network (MCDFN)を紹介する。
我々の比較ベンチマークは、MCDFNが他の7つのディープラーニングモデルより優れていることを示している。
本研究は,需要予測手法を進歩させ,MCDFNをサプライチェーンシステムに統合するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:26:18 GMT)
Low-degree approximation of QAC$^0$ circuits [0.0] パリティ関数はQAC$0$で計算できないことを示す。
また、$n$ビットのパリティをおよそ計算する深さ$d$のQAC回路には、$2widetildeOmega(n1/d)$が必要であることも示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:51:04 GMT)
Long optical coherence times and coherent rare earth-magnon coupling in a rare earth doped anti-ferromagnet [0.0] 希土類イオンドープ結晶のスピンおよび光遷移に長いコヒーレンス時間が示されている。
希土類イオンドーパントに対する低ひずみスピンフリーホスト結晶はまだ証明されていない。
反強磁性秩序のガドリニウムバンデン酸ガドリニウム中のエルビウムドーパントで報告された長い光コヒーレンス時間は、別の方法を示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:59:28 GMT)
Learning Latent Space Dynamics with Model-Form Uncertainties: A Stochastic Reduced-Order Modeling Approach [0.0] 本稿では,複素系の低次モデリングにおけるモデル形式不確かさの表現と定量化のための確率論的アプローチを提案する。
提案手法は,プロジェクション行列のランダム化により近似空間を拡張することにより,これらの不確実性を捉える。
提案手法の有効性は, 推算演算子に対するモデル形状の不確実性の影響を同定し, 定量化することにより, 流体力学における正準問題に対して評価される。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 16:09:14 GMT)
Learn to Solve Vehicle Routing Problems ASAP: A Neural Optimization Approach for Time-Constrained Vehicle Routing Problems with Finite Vehicle Fleet [0.0] 車両の車両サイズが有限である時間制約付静電容量VRPを解くためのNCO手法を提案する。
この手法は、柔軟性と堅牢な一般化の両方を示す、適切で費用効率のよい解を見つけることができる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:16:36 GMT)
Krylov complexity as an order parameter for quantum chaotic-integrable transitions [0.0] クリロフ複雑性は、多体系における量子カオスを特徴付ける新しいパラダイムとして登場した。
最近の知見によると、量子カオス系では、Krylov状態の複雑性は時間進化の過程で顕著なピークを示す。
このKrylov複雑性ピーク(KCP)は量子カオスシステムの目印であり、その高さが量子カオスの「順序パラメータ」として機能することを提案する。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 09:22:34 GMT)
Investigating the Role of Quantum Entanglement in Heavy Ion Collisions through Elliptic Flow [0.0] 本稿では、重イオン衝突における初期異方性と最終状態運動量異方性の関係について検討する。
重イオン衝突における熱化に関する以前の研究に基づいて、Pb-PbおよびXe-Xe衝突における$nu$の$p_T$依存性まで解析を拡張した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:23:24 GMT)
Internal state cooling of an atom with thermal light [0.0] 単一原子の内部状態エントロピーをブロードバンド不整合光で照らすことにより2倍以上に小さくする光学冷却の最小の例を示す。
ここでは、コヒーレントで狭帯域のレーザー光による光ポンピングとは対照的に、光ファイバーを結合したブロードバンドの日光でも同じ仕事をする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:13:20 GMT)
Impact of white noise in artificial neural networks trained for classification: performance and noise mitigation strategies [0.0] ニューロンレベルでの加法的および乗法的なガウスホワイトノイズがネットワークの精度に与える影響を考察する。
我々はいくつかのノイズ低減手法を分類タスクの基本設定に適用する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:21:12 GMT)
Harnessing Wavelet Transformations for Generalizable Deepfake Forgery Detection [0.0] Wavelet-CLIPは、ウェーブレット変換とViT-L/14アーキテクチャに由来する機能を統合したディープフェイク検出フレームワークで、CLIP方式で事前トレーニングされている。
提案手法は,データ間一般化における平均AUC0.749,不明瞭なディープフェイクに対するロバスト性0.893を達成し,優れた性能を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:20:34 GMT)
Hardness of approximation for ground state problems [0.0] 基底状態のエネルギーに焦点をあてるのではなく、基底空間の計算特性を考えると、基底空間の計算特性のQCMA硬さを示すことができる。
本研究は,(1)基底状態接続問題 (GSCON) を近似するために N(1-eps) の範囲内でQCMA完全であり,(2) 局所ハミルトン基底状態の絡み合い量(GSE)を推定するために,同じ比内でQCMA完全であることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:11:00 GMT)
Ground state energy of dilute Bose gases in 1D [0.0] 密度$rho$の1Dボソンの気体の基底状態エネルギーを、散乱長$a$の一般の2体ポテンシャルを介して相互作用し、希薄な極限$rho |a|ll1$で研究する。
スピンレスフェルミオンと1D異方性対称性の拡張を含み、閉じ込められた3次元気体への応用について議論する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:43:37 GMT)
Gauge theory and mixed state criticality [0.0] 混合量子状態において、対称性の概念は強い対称性と弱い対称性の2つのタイプに分けられる。
本稿では,格子ゲージ理論モデルの基底状態図から始まる,強対称性のための様々なSSB位相を構築する方法を提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 01:40:56 GMT)
GPT-Guided Monte Carlo Tree Search for Symbolic Regression in Financial Fraud Detection [0.0] SR-MCTSは基本GPTモデルを用いてMCTSを誘導し、その収束速度と生成した表現の品質を大幅に向上させる。
我々の実験では、SR-MCTSは業界で広く使われている手法よりも、より効率的に不正を検知できることが示されている。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:12:38 GMT)
From bosons and fermions to spins: A multi-mode extension of the Jordan-Schwinger map [0.0] 我々は、いくつかのボゾンモードまたはフェルミオンモード上でスピン状態の完全な集合をアルゴリズム的に構築することで、ジョルダン・シュウィンガー写像を一般化する。
ボソニックケースにおける多モードスピン状態の縮退とガウスアンとの深い関係を明らかにする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:56:11 GMT)
From Electrode to Global Brain: Integrating Multi- and Cross-Scale Brain Connections and Interactions Under Cross-Subject and Within-Subject Scenarios [0.0] 脳波信号の個人差は、クロスオブジェクト運動画像(MI)分類において大きな課題となる。
トポロジカルな構造と接続のためのMI実験では、マルチスケールの空間データ分布の違いが人間の脳の本質的特性である。
本稿では,マルチスケール空間領域適応ネットワーク (MSSDAN) について,マルチスケール空間特徴抽出器 (MSSFE) と,マルチスケール空間領域適応 (MSSDA) と呼ばれる深部領域適応手法を提案,検証した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 09:12:13 GMT)
From CNN to ConvRNN: Adapting Visualization Techniques for Time-Series Anomaly Detection [0.0] 本稿では,ビデオデータから異常検出を行う時間分散convRNNによる学習プロセスに着目した。
その効果にもかかわらず、ニューラルネットワークは意思決定を説明することなく回答を提供することのできるブラックボックスとして認識されることが多い。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:45:23 GMT)
Fourier Analysis of Variational Quantum Circuits for Supervised Learning [0.0] VQCはフーリエ解析のレンズを通して理解することができる。
また, 回路の符号化ゲートによって, トラッピングされたフーリエ和のスペクトルが完全に決定されないことを示す。
与えられた選択リストのうち、どのVQCがデータに最も合うかを予測できることを示します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:10:41 GMT)
Financial Fraud Detection using Jump-Attentive Graph Neural Networks [0.0] 金融サービス部門の大部分は、トランザクションデータをモデル化するために、XGBoost、Random Forest、ニューラルネットワークなど、さまざまな機械学習アルゴリズムを使用している。
非類似ノードからのカモフラージュ検出と重要な特徴情報の保存に有効な効率的な近傍サンプリング手法を用いた新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:12:51 GMT)
Fermionic transport through a driven quantum point contact: breakdown of Floquet thermalization beyond a critical driving frequency [0.0] 誘導量子点接触(QPC)により結合された2つのフェルミオン鎖からなる量子系について検討する。
システムの進化を数値的に追跡し、臨界周波数以上の周波数では、QPCを通した電流が停止し、鎖間の粒子の不均衡が永遠に続くことを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:54:32 GMT)
Fast entangling gates for Rydberg atoms via resonant dipole-dipole interaction [0.0] 基底状態量子ビットと2つのリドベルク状態の4つの原子レベルを用いてゲートをエンタングする新しいスキームを導入する。
この相互作用は、最先端のRydbergゲートよりも高速で、Rydberg崩壊に敏感でない制御Zゲートを仲介できることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:00:08 GMT)
FRACTURED-SORRY-Bench: Framework for Revealing Attacks in Conversational Turns Undermining Refusal Efficacy and Defenses over SORRY-Bench (Automated Multi-shot Jailbreaks) [0.0] 本稿では,有害なクエリを一見無害なサブクエストに分解することで,敵のプロンプトを生成する手法を提案する。
提案手法は, GPT-4, GPT-4o, GPT-4o-mini, GPT-3.5-Turbo モデルに対して, 攻撃成功率 (ASR) を最大で+46.22%向上させる。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 15:48:11 GMT)
FASSILA: A Corpus for Algerian Dialect Fake News Detection and Sentiment Analysis [0.0] アルジェ方言(AD)は、注釈付きコーパスがないため、課題に直面している。
本研究では,Fake News(FN)検出・感情分析(SA)のための専門コーパスの開発プロセスについて概説する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:39:10 GMT)
Extendibility of Brauer states [0.0] 我々は$(n,m)$-extendibleと$n$-de Finetti-extendible Brauer状態を見つける一般的なレシピを見つける。
我々は、ヴェルナー状態、等方状態およびブラウアー状態の拡張性に関連するいくつかの一般的な性質を導出する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 10:28:25 GMT)
Exploring the Feasibility of Affordable Sonar Technology: Object Detection in Underwater Environments Using the Ping 360 [0.0] 本研究は、Ping 360ソナー装置が航法に主に用いられ、複雑な水中障害物を検出する可能性を探るものである。
この研究の主な動機は、デバイスが安価でオープンソースであることであり、より高価なソナーシステムに代わるコスト効率の高い代替手段を提供する。
低コストソナーデバイスの実現可能性を調べることで、この研究は、その限界と将来のAIベースの解釈の可能性に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 11:50:40 GMT)
Exploring entanglement and spectral split correlations in three-flavor collective neutrino oscillations [0.0] 本研究は,3自由度多体ニュートリノ発振におけるスペクトル分割の出現について検討する。
スペクトル分割の出現は平均場近似で見られる数と位置と似ているが、幅にはない。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:11:39 GMT)
Explicit large $N$ von Neumann algebras from matrix models [0.0] 我々は、大きな$N$極限において創発型III$_$フォンノイマン代数をもたらす量子力学系の族を構築する。
これらの系における実時間的有限温度相関関数を計算し、これらがIII$_$フォンノイマン代数によって大まかに$N$で記述されることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:14:44 GMT)
Explainable Search and Discovery of Visual Cultural Heritage Collections with Multimodal Large Language Models [0.0] 本稿では,最先端のマルチモーダル言語モデル (LLM) を用いて,ビジュアルコレクションのためのオープンで説明可能な検索・発見インターフェースを実現する手法を提案する。
我々は,視覚的な埋め込みをベースとした手法の共通の落とし穴を避けるために,新しいクラスタリングとレコメンデーションシステムを構築する方法を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:48:39 GMT)
Explainable AI through a Democratic Lens: DhondtXAI for Proportional Feature Importance Using the D'Hondt Method [0.0] 本研究では,DhondtXAI法におけるD'Hondtに基づく投票原則の統合について検討した。
DhondtXAIアプローチは、アライアンスの形成としきい値の設定を可能にし、解釈可能性を高める。
結果は、比例代表やアライアンスといった選挙原則をAI説明可能性に統合することで、ユーザの理解が向上することを示している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:43:29 GMT)
Equivariant Graph Attention Networks with Structural Motifs for Predicting Cell Line-Specific Synergistic Drug Combinations [0.0] がんは2番目の死因であり、化学療法が主要な治療法の1つである。
現在、インビトロやインビトロのような薬物併用スクリーニングの方法は、スターク時間と金銭的コストのために非効率である。
3次元回転, 翻訳, リフレクションと構造モチーフの同値なグラフアテンションネットワークを用いた幾何学的深層学習モデルを用いる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:29:05 GMT)
Enhancing classroom teaching with LLMs and RAG [0.0] 本研究は,データソースとして提供される教材を用いたRAGパイプラインが,K-12教育の学生にどのように役立つかを検討する。
最初の調査では、Redditを最新のサイバーセキュリティ情報のためのデータソースとして利用している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:39:34 GMT)
Enhancing Financial Fraud Detection with Human-in-the-Loop Feedback and Feedback Propagation [0.0] 本稿では,HITLフィードバックが従来の技術と高度な技術の両方に与える影響を,プロプライエタリなデータセットとパブリックなデータセットを用いて検討する。
その結果,HITLフィードバックはモデル精度を向上し,グラフベースの手法が最も有用であることがわかった。
人間の専門知識を活用することによって、このアプローチは、不正パターンの進化、データの分散、モデルの解釈可能性に関する課題に対処する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:22:36 GMT)
Efficient Preparation of Solvable Anyons with Adaptive Quantum Circuits [0.0] 適応有限深部局所単位(AFDLU)によるギャップ境界を持つ任意の理論の作成方法を示す。
具体的には、任意の位相位相において文字列-ネット基底状態を生成するために、AFDLUを実装したシーケンシャルなガウイング手順を導入する。
さらに,任意の長さの文字列演算子を任意の長さに適用するために,AFDLUを実装した逐次アンガングとリガグの手順を導入する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:55:09 GMT)
Efficiency of the hidden fermion determinant states Ansatz in the light of different complexity measures [0.0] Ans"atzeは、ニューラルネットワークの表現力を利用して、根本的な課題に対処する。
エンタングルメントエントロピーの体積法スケールを示す5種類のフェルミオンモデルについて検討した。
従来の手法が信頼性の高いパラメータ領域に近づくと、ニューラルネットワークのアプローチも信頼性と効率が向上することを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 08:36:37 GMT)
Efficiency of optimal control for noisy spin qubits in diamond [0.0] スピン反転制御パルスの形状が環境騒音の相関時間に与える影響について検討した。
本稿では,最適化実現可能性を検証する数値最適化パルスの実験的実現について述べる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 19:00:22 GMT)
Device-independent certification of desirable properties with a confidence interval [0.0] 厳密なデバイスに依存しない認証のための汎用的なソリューションを提供する。
PBRプロトコルとマーチンゲールベースのプロトコルがよく似た性能を示す。
また,マルティンゲールに基づくプロトコルの性能は,目撃者の選択に大きく影響している可能性が示唆された。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 06:24:19 GMT)
Developing and Sustaining a Student-Driven Software Solutions Center -- An Experience Report [0.0] インフォメーション・テクノロジー・ソリューション・センター(Information Technology Solutions Center、ITSC)は、シンシナティ大学の情報技術学部に属する組織である。
学生主導のソリューションセンターは、学生に産業顧客向けのソフトウェアソリューションの設計、開発、実行、保守の推進を与える。
ITSCは10年以上前に設立され、100人以上の学生を訓練し、いくつかの産業パートナーと毎年約20のプロジェクトを実行している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:55:48 GMT)
Deep Learning Predicts Mammographic Breast Density in Clinical Breast Ultrasound Images [0.0] マンモグラフィーの乳腺密度は 乳がんの最大の危険因子の1つです
乳房超音波(BUS)は、乳がんスクリーニング法の一種である。
本研究の目的は,BUS画像からBI-RADS乳房密度を予測する人工知能(AI)モデルを検討することである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:25:07 GMT)
Deep Heuristic Learning for Real-Time Urban Pathfinding [0.0] 本稿では,交通や気象条件などのリアルタイムな文脈データを活用するディープラーニングモデルに,従来のアルゴリズムを変換することで,都市パスフィニングへの新たなアプローチを提案する。
本稿では,現在の環境条件に基づいて経路を動的に調整する拡張A*アルゴリズムと,過去のデータとライブデータを用いて次の最適経路セグメントを予測するニューラルネットワークモデルを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 00:22:04 GMT)
DQC1-hardness of estimating correlation functions [0.0] 時間外相関関数は力学系の輸送特性を測定する。
すべての固有状態上でOTOCを推定する計算複雑性を特徴付ける。
One Clean Qubit Model (DQC1) の完全性を示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:12:25 GMT)
Crystallinity in Niobium oxides: A pathway to mitigate Two-Level System Defects in Niobium 3D Resonator for quantum applications [0.0] 2レベル系(TLS)欠陥は超伝導量子回路におけるデコヒーレンスの主要な原因である。
650degCでの10時間高真空加熱処理により3次元超伝導ニオブ共振器の2レベル系損失の低減を実証した。
論文参考訳(メタデータ) (Thu, 7 Nov 2024 16:08:57 GMT)
Consciousness is entailed by compositional learning of new causal structures in deep predictive processing systems [0.0] 人間では、そのような学習は特定の宣言的記憶形成を含み、意識と密接に関連している。
予測できない推論の階層的バインディングを通じて、オンラインで単例の新たな構造学習を追加することで予測処理を拡張する。
本提案では, 特徴結合, 繰り返し処理, 予測処理, 意識のグローバルな理論を自然に統一する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:38:18 GMT)
Concurrence speed limit and its connection with bounds in many body physics [0.0] 我々は、2つの量子ビットの一般に混合された量子状態の共起という量子相関の速度制限を導出する。
本稿では, 凝縮物質物理学の分野間領域や, 多くの体物理学, 量子情報科学における研究成果の関連について論じる。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:09:58 GMT)
Complexity of Local Quantum Circuits under Nonunital Noise [0.0] 非単位雑音の存在下での幾何的局所回路は、任意の次元$dgeq 1$において、中間回路計測なしで誤差を補正し、任意の深さまで拡張可能であることを示す。
これは、十分弱い非単位ノイズを受ける局所量子力学が計算的に普遍的であり、ノイズレス力学と同程度にシミュレートすることがほぼ困難であることを意味する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:57:31 GMT)
Clinicians' Voice: Fundamental Considerations for XAI in Healthcare [0.0] 臨床医との半構造化インタビューを行い、彼らの考え、希望、懸念について論じる。
臨床医は一般的に、臨床実習のためのAIベースのツールの開発を肯定的に考えている。
彼らは、これらがワークフローにどのように適合し、それが臨床医と患者の関係にどのように影響するかを懸念している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:47:06 GMT)
Circulant graphs with valency up to 4 that admit perfect state transfer in Grover walks [0.0] 完全状態移動を許容する4ドルまでの価を持つ循環グラフを特徴付ける。
一方、原子価4$の循環グラフは、2つの無限の族でしか完全な状態転移を認めない。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:44:49 GMT)
Characterizing stable regions in the residual stream of LLMs [0.0] モデル出力が小さいアクティベーション変化に敏感なままであるトランスフォーマーの残ストリーム内の安定領域を同定する。
これらの領域はトレーニング中に出現し、トレーニングの進行やモデルサイズの増加に伴ってより定義される。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:55:50 GMT)
Breaking The Ice: Video Segmentation for Close-Range Ice-Covered Waters [0.0] 北極海での急激な氷の後退は、2060年までには氷のない夏を予測し、新しい海航路を開くが、信頼できる航行手段を必要とする。
現在のアプローチは主観的専門家による判断に大きく依存しており、自動化されたデータ駆動型ソリューションの必要性を強調している。
本研究は, 船載光学データを用いた機械学習による氷条件の評価を行い, 946画像の微妙な注釈付きデータセットを導入した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:36:21 GMT)
Bounding the conditional von-Neumann entropy for device independent cryptography and randomness extraction [0.0] 本稿では,デバイス非依存型量子暗号とランダムネス抽出のシナリオにおいて,条件付きvon-Neumannエントロピーの下位境界を確立するための数値的枠組みを提案する。
このフレームワークは、実用的な量子暗号プロトコルに適応可能なツールを提供し、信頼できない環境でセキュアな通信を拡張する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:48:49 GMT)
Boosting the Efficiency of Metaheuristics Through Opposition-Based Learning in Optimum Locating of Control Systems in Tall Buildings [0.0] 対位法に基づく学習はメタヒューリスティックアルゴリズムの性能向上に有効な手法である。
工学的問題への反対戦略の適用に関する事例研究を行う。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:05:40 GMT)
Bipartite and tripartite entanglement in an optomechanical ring cavity [0.0] 絡み合いは量子情報技術のコアリソースとして機能する。
本研究は, 固定二分体と三分体との絡み合いを, 結合したオプティメカルリングキャビティで統一的に記述する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 21:30:44 GMT)
Bilinear Fuzzy Genetic Algorithm and Its Application on the Optimum Design of Steel Structures with Semi-rigid Connections [0.0] 本章では, 半剛性を有する鋼構造物の設計最適化のために, 改良された双線形ファジィ遺伝的アルゴリズム(BFGA)を導入している。
BFGAはファジィ論理と遺伝的アルゴリズムの強みを組み合わせて、構造設計問題の複雑さと不確実性を扱う。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:07:16 GMT)
Automated Image Color Mapping for a Historic Photographic Collection [0.0] 1970年代、アメリカ合衆国環境保護庁は、全国の環境課題を文書化する大規模な写真撮影イニシアチブを後援した。
ほとんどの画像はオリジナルの印刷物の破損したコピーからスキャンされた。
本研究は, プリントの基礎化学に基づいて, ヒストグラムマッチング手法を改良し, 評価する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 12:42:48 GMT)
Attention Masks Help Adversarial Attacks to Bypass Safety Detectors [0.0] 我々は,XAIモニタ下でのステルス性,説明性,効率的なPGD画像分類対向攻撃を実現するためのアテンションマスク生成のための適応的フレームワークを提案する。
具体的には、変異XAI混合物と自己教師型X-UNetをアテンションマスク生成に利用し、PGD攻撃を誘導する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:13:50 GMT)
Asymptotic regularity of a generalised stochastic Halpern scheme with applications [0.0] 我々は、クラスノセルスキー・マンセネク形式とチコノフ正則化項の2番目の写像を組み込んだ、一般ハルペルン型反復に対して、高度に均一な正則率を与える。
ここで提示されるスキームが学習の文脈でどのようにインスタンス化され、新しいQ-ラーニング法がもたらされるのかをスケッチする。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 16:32:50 GMT)
An efficient quantum state verification framework and its application to bosonic systems [0.0] 本稿では,大規模量子システムの効率的な検証のための一般的な枠組みを紹介する。
我々のフレームワークは、堅牢な忠実度証人と効率的な古典的後処理を組み合わせることで、測定バックプロパゲーションを実装します。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 13:19:22 GMT)
ACCIO: Table Understanding Enhanced via Contrastive Learning with Aggregations [0.0] ACCIO(tAble understanding enhanCed via Contrastive learnIng with aggregatiOns)は、テーブル理解を強化するための新しいアプローチである。
ACCIOは、最先端の手法と比較して、マクロF1スコア91.1の競争性能を達成している。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 05:35:39 GMT)
A study of Vietnamese readability assessing through semantic and statistical features [0.0] 本稿では,テキストの可読性を評価するための統計的および意味的アプローチを統合する新しいアプローチを提案する。
我々の研究はベトナムのテキスト可読性データセット(ViRead)、OneStop English、RASの3つの異なるデータセットを利用した。
SVM(Support Vector Machine)、ランダムフォレスト(Random Forest)、エクストラツリー(Extra Trees)など、さまざまな機械学習モデルを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 14:54:42 GMT)
A spin-optomechanical quantum interface enabled by an ultrasmall mechanical and optical mode volume cavity [0.0] ダイヤモンドおよびテレコム光モードにおける欠陥中心間のコヒーレントなメカニカルインタフェースを提案する。
集中器にグループIV空孔を配置することにより、極めて高いスピン-メカニカルカップリング速度を示す。
エンタングルメント・ヘラルディング・スキームで使用されるそのようなデバイスは、量子リピータ間の高忠実度ベル対を提供することができることを示す。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 20:21:27 GMT)
A Simple Packing Algorithm for Optimized Mapping of Artificial Neural Networks onto Non-Volatile Memory Cross-Bar Arrays [0.0] クロスバーアレイを用いたニューロモルフィックコンピューティングは、機械学習の計算効率を改善するための有望な代替手段として登場した。
本稿では,人工ニューラルネットワークの層を,チップにまたがるタイルに配置した物理的クロスバーアレイにマッピングする影響について検討する。
提案手法は, 物理タイル数, 最適配列次元, および各タイルが占有する最小面積を, 所定の設計目的のために推定するための簡易なマッピングアルゴリズムである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 15:50:42 GMT)
A Comparative Analysis of U-Net-based models for Segmentation of Cardiac MRI [0.0] 本稿では,心臓短軸MRI(Magnetic Resonance Imaging)画像のセマンティックセグメンテーションにおけるディープラーニング手法の適用について検討する。
焦点は、U-Netの派生品である様々なアーキテクチャの実装に焦点を当て、包括的な解剖学的および機能解析のために心臓の特定の部分を効果的に分離することである。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 18:43:06 GMT)
A Brief History of Named Entity Recognition [0.0] 名前付きエンティティ認識(英: Named Entity Recognition、NER)とは、エンティティを生のテキストから抽出、曖昧化、リンクするプロセスであり、洞察に富んだ構造化された知識ベースである。
我々は,NERに採用される手法の進化について検討し,教師なし学習法から教師なし学習法まで,結果を比較した。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 17:49:03 GMT)
$k$NN Attention Demystified: A Theoretical Exploration for Scalable Transformers [0.0] 我々は$k$NN注目のための理論的枠組みを確立し、ソフトマックス分布に対する期待として自己注意を再構築する。
また,効率的なサンプリング手法を活用することで,自己注意勾配を近似する新しいサブクワッドラティックアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 07 Nov 2024 22:44:09 GMT)