PVUW 2024 Challenge on Complex Video Understanding: Methods and Results [199.6] 我々は、MOSEデータセットに基づく複合ビデオオブジェクトトラックと、MeViSデータセットに基づくモーション表現ガイドビデオトラックの2つの新しいトラックを追加した。
2つの新しいトラックでは、挑戦的な要素を特徴とする追加のビデオとアノテーションを提供しています。
これらの新しいビデオ、文、アノテーションにより、より包括的で堅牢なビデオシーン理解の開発を促進することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:38:58 GMT)
In-context Pretraining: Language Modeling Beyond Document Boundaries [137.5] In-Context Pretrainingは、言語モデルが関連するドキュメントのシーケンスで事前トレーニングされる新しいアプローチである。
本稿では, 近接探索を効率的に行うための近似アルゴリズムを提案する。
より複雑なコンテキスト推論を必要とするタスクの顕著な改善が見られます。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:28:42 GMT)
LLMs assist NLP Researchers: Critique Paper (Meta-)Reviewing [106.5] 大規模言語モデル(LLM)は、様々な生成タスクにおいて顕著な汎用性を示している。
本研究は,NLP研究者を支援するLLMの話題に焦点を当てる。
私たちの知る限りでは、このような包括的な分析を提供するのはこれが初めてです。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:30:22 GMT)
The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources [100.2] ファンデーションモデル開発は、急速に成長するコントリビュータ、科学者、アプリケーションを引き付けている。
責任ある開発プラクティスを形成するために、我々はFoundation Model Development Cheatsheetを紹介します。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:55:49 GMT)
AutoDetect: Towards a Unified Framework for Automated Weakness Detection in Large Language Models [95.1] 大規模言語モデル(LLM)はますます強力になってきていますが、それでも顕著ですが微妙な弱点があります。
従来のベンチマークアプローチでは、特定のモデルの欠陥を徹底的に特定することはできない。
さまざまなタスクにまたがるLLMの弱点を自動的に露呈する統合フレームワークであるAutoDetectを導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:16:45 GMT)
QUBIQ: Uncertainty Quantification for Biomedical Image Segmentation Challenge [93.6] 医用画像分割作業の不確実性、特にラター間変動性は重要な課題である。
この可変性は、自動セグメンテーションアルゴリズムの開発と評価に直接影響を及ぼす。
バイオメディカル画像量化チャレンジ(QUBIQ)における不確実性の定量化のベンチマーク結果を報告する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:07:34 GMT)
Confidence Regulation Neurons in Language Models [91.9] 本研究では,大規模言語モデルが次世代の予測において不確実性を表現・規制するメカニズムについて検討する。
エントロピーニューロンは異常に高い重量ノルムを特徴とし、最終層正規化(LayerNorm)スケールに影響を与え、ロジットを効果的にスケールダウンさせる。
ここで初めて説明するトークン周波数ニューロンは、各トークンのログをそのログ周波数に比例して増加または抑制することで、出力分布をユニグラム分布から遠ざかる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:31:03 GMT)
GeoMFormer: A General Architecture for Geometric Molecular Representation Learning [84.0] 我々はこの目的を達成するためにGeoMFormerと呼ばれるトランスフォーマーに基づく新しい分子モデルを導入する。
我々は,GeoMFormerが,異なる型やスケールの不変タスクと同変タスクの両方において,高い性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:58:13 GMT)
LM-Infinite: Zero-Shot Extreme Length Generalization for Large Language Models [84.0] 大規模言語モデル(LLM)は通常、トランスフォーマーアーキテクチャの2次複雑さのために短いテキストセグメント(例:4Kトークン)でトレーニングする。
この研究は、この長大一般化失敗に寄与する3つの主要な要因を特定する。
本研究では,LLMの長期処理能力を高めるための簡易かつ効果的な手法であるLM-Infiniteを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:22:00 GMT)
On the Transformations across Reward Model, Parameter Update, and In-Context Prompt [83.5] 本稿では,パラメータ更新,報酬モデリング,コンテキスト内プロンプトという,一般的な3つの適応ツールの互換性を示す。
我々の研究は、既存の多くの研究を統一し、潜在的研究の方向性を示唆する総合的な見解を提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:42:32 GMT)
MEReQ: Max-Ent Residual-Q Inverse RL for Sample-Efficient Alignment from Intervention [81.6] 本稿では,人間の介入によるサンプル効率向上を目的としたMEReQ(Maximum-Entropy Residual-Q Inverse Reinforcement Learning)を紹介する。
MereQは、人間の専門家と以前の政策の根底にある報酬関数との相違を捉える残差報酬関数を推論する。
その後、Residual Q-Learning(RQL)を使用して、ポリシーをこの残留報酬関数を使用して人間の好みと整合させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:51:09 GMT)
Data Debiasing with Datamodels (D3M): Improving Subgroup Robustness via Data Selection [80.9] データモデルによるデータデバイアス(Data Debiasing with Datamodels, D3M)は、マイノリティグループにおけるモデルの障害を駆動する特定のトレーニング例を分離し、削除するデバイアス(debiasing)アプローチである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:51:01 GMT)
Provable Adaptivity of Adam under Non-uniform Smoothness [79.3] アダムは急速に収束するため、実用的な用途で広く採用されている。
アダムの既存の収束解析は、有界な滑らかさの仮定に依存する。
本稿では,ランダムにリシャッフルされたAdamの学習率の低下に伴う収束について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:33:17 GMT)
Adaptively Clustering Neighbor Elements for Image-Text Generation [78.8] 我々はtextbfACF と呼ばれるトランスフォーマーに基づく新しい画像テキスト生成モデルを提案する。
ACFは、視覚パッチをオブジェクト領域と言語単語に適応的にクラスタリングし、暗黙的にオブジェクト・フレーズのアライメントを学習する。
実験の結果,ほとんどのSOTAキャプションやVQAモデルよりも優れたACFの有効性が示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:45:10 GMT)
On Least Square Estimation in Softmax Gating Mixture of Experts [78.4] 決定論的MoEモデルに基づく最小二乗推定器(LSE)の性能について検討する。
我々は,多種多様な専門家関数の収束挙動を特徴付けるために,強い識別可能性という条件を確立する。
本研究は,専門家の選択に重要な意味を持つ。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:32:55 GMT)
Venturing into Uncharted Waters: The Navigation Compass from Transformer to Mamba [77.2] ディープニューラルネットワークアーキテクチャであるTransformerは、長年、自然言語処理などの分野を支配してきた。
マンバの最近の導入は、その優位性に挑戦し、研究者の間でかなりの関心を喚起し、マンバをベースとした一連のモデルが顕著な可能性を示している。
本研究は,総合的な議論をまとめ,本質的な研究の側面に潜り込み,(1)構造的状態空間モデルの原理に基づくマンバ機構の機能とその基盤,(2)提案されたマンバの様々なネットワークへの統合,(3)トランスフォーマーの代替としての可能性を探る。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:27:21 GMT)
A Comprehensive Survey on Relation Extraction: Recent Advances and New Frontiers [76.5] 関係抽出(RE)は、基礎となるコンテンツからエンティティ間の関係を識別する。
ディープニューラルネットワークはREの分野を支配しており、顕著な進歩を遂げている。
この調査は、現実世界のREシステムの課題に対処するための研究者の協力的な取り組みを促進することが期待されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:26:47 GMT)
Landscaping Linear Mode Connectivity [76.4] 線形モード接続(LMC)は理論と実用の両方の観点から関心を集めている。
ロスランドスケープがLCCに対して地形的にどのように振る舞う必要があるかのモデルを提供することで、その理解に向けて一歩前進する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:53:30 GMT)
CaLM: Contrasting Large and Small Language Models to Verify Grounded Generation [76.3] グラウンデッドジェネレーションは、言語モデル(LM)に、より信頼性が高く説明可能な応答を生成する能力を持たせることを目的としている。
本稿では,新しい検証フレームワークであるCaLMを紹介する。
我々のフレームワークは、より少ないパラメトリックメモリに依存する小さなLMを有効活用し、より大きなLMの出力を検証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:39:26 GMT)
Hallmarks of Optimization Trajectories in Neural Networks: Directional Exploration and Redundancy [75.2] 最適化トラジェクトリのリッチな方向構造をポイントワイズパラメータで解析する。
トレーニング中のスカラーバッチノルムパラメータは,ネットワーク全体のトレーニング性能と一致していることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:53:34 GMT)
Long Context Transfer from Language to Vision [74.8] ビデオシーケンスは貴重な時間情報を提供するが、既存の大規模マルチモーダルモデル(LMM)は非常に長いビデオを理解するには不十分である。
本稿では,言語モデルの観点からこの問題にアプローチする。
言語バックボーンの文脈長を単純に外挿することで、LMMはビデオトレーニングなしで桁違いに多くの視覚的トークンを理解できるようになる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:58:06 GMT)
Interpreting the Second-Order Effects of Neurons in CLIP [73.5] CLIPの個々のニューロンの機能をテキストで自動的に記述することで解釈する。
ニューロンから後続のアテンションヘッドに流れる影響を、直接出力に解析する「第2次レンズ」を提案する。
以上の結果から,ニューロンのスケーラブルな理解は,モデル騙しや新しいモデル機能の導入に有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:14:18 GMT)
Video-Infinity: Distributed Long Video Generation [73.3] 拡散モデルは近年,映像生成において顕著な成果を上げている。
提案手法は,約5分で最大2,300フレームの映像を生成し,従来の手法の100倍の速度で長大な映像を生成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:56:12 GMT)
Scaling and renormalization in high-dimensional regression [72.6] 本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:47:41 GMT)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [72.5] ネスト構造であるMamba-in-Mamba(MiM-ISTD)を開発した。
MiM-ISTDはSOTA法より8倍高速で、2048×2048$のイメージでテストすると、GPUメモリ使用率を62.2$%削減する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:06:56 GMT)
Theory on Mixture-of-Experts in Continual Learning [72.4] 継続学習(CL)は、時間とともに現れる新しいタスクに適応する能力のため、大きな注目を集めている。
モデルが新しいタスクに適応するにつれて、(古いタスクの)破滅的な忘れがCLの大きな問題として認識されるようになった。
MoEモデルは近年,ゲーティングネットワークを用いることで,CLの破滅的忘れを効果的に軽減することが示されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:29:58 GMT)
Finding Transformer Circuits with Edge Pruning [71.1] 自動回路発見の効率的かつスケーラブルなソリューションとしてエッジプルーニングを提案する。
本手法は,従来の手法に比べてエッジ数の半分未満のGPT-2の回路を探索する。
その効率のおかげで、Edge PruningをCodeLlama-13Bにスケールしました。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:40:54 GMT)
LangSuitE: Planning, Controlling and Interacting with Large Language Models in Embodied Text Environments [70.9] テキストエンボディの世界における6つの代表的具体的タスクを特徴とする多目的・シミュレーション不要なテストベッドであるLangSuitEを紹介する。
以前のLLMベースのテストベッドと比較すると、LangSuitEは複数のシミュレーションエンジンを使わずに、多様な環境への適応性を提供する。
具体化された状態の履歴情報を要約した新しいチェーン・オブ・ソート(CoT)スキーマであるEmMemを考案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:36:29 GMT)
Evaluating and Analyzing Relationship Hallucinations in LVLMs [69.8] 視覚関係の幻覚を評価するための新しいベンチマークであるR-Benchを紹介する。
R-Benchは、関係の存在に焦点を当てたイメージレベルの質問と、局所的な視覚的理解を評価するインスタンスレベルの質問を特徴としている。
我々は,関係関連性,主観関連性,関係対象性という,幻覚につながる3つの関係共起関係を同定する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:42:42 GMT)
Uncertainty-Aware Reward-Free Exploration with General Function Approximation [69.3] 本稿では、algと呼ばれる報酬のない強化学習アルゴリズムを提案する。
私たちのアルゴリズムの背後にある重要なアイデアは、環境を探索する上で不確実性を認識した本質的な報酬である。
実験の結果、GFA-RFEは最先端の教師なしRLアルゴリズムよりも優れ、あるいは同等であることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:37:18 GMT)
Toward Fairer Face Recognition Datasets [69.0] 顔認識と検証は、ディープ表現の導入によってパフォーマンスが向上したコンピュータビジョンタスクである。
実際のトレーニングデータセットにおける顔データとバイアスのセンシティブな性格による倫理的、法的、技術的な課題は、彼らの開発を妨げる。
生成されたトレーニングデータセットに階層属性のバランス機構を導入することにより、公平性を促進する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:33:21 GMT)
ShadowLLM: Predictor-based Contextual Sparsity for Large Language Models [68.0] 我々は,LLMの挙動を隠蔽し,より親密なパターンを強制できる新しい予測器であるShadowLLMを開発した。
ShadowLLMは最先端のDejaVuフレームワーク上で最大20%のスピードアップを達成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:41:08 GMT)
Evaluating the Quality of Hallucination Benchmarks for Large Vision-Language Models [67.9] 本稿では,既存の幻覚ベンチマークの信頼性と妥当性を評価するために,幻覚ベンチマーク品質測定フレームワーク(HQM)を提案する。
GPT-4oやGemini-Vision-Proを含む10以上の代表的なLVLMを広範囲に評価し、既存のモデルにおける幻覚の問題を詳細に分析する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:08:07 GMT)
Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.9] きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:19:34 GMT)
WARP: On the Benefits of Weight Averaged Rewarded Policies [67.0] ウェイトアベレード・リワード・ポリシー(WARP)という新しいアライメント戦略を導入する。
WARPは重量空間のポリシーを3つの異なる段階でマージする。
GEMMAポリシによる実験では、WARPが品質とアライメントを改善し、他のオープンソースLLMよりも優れています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:24:34 GMT)
Learning Temporal Distances: Contrastive Successor Features Can Provide a Metric Structure for Decision-Making [66.3] 時間的距離は、計画、制御、強化学習のための多くのアルゴリズムの中心にある。
このような時間的距離を設定内で定義しようとする以前の試みは、重要な制限によって妨げられている。
比較学習によって学習された後継特徴が,三角形の不等式を満たす時間的距離を形成することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:36:45 GMT)
Limited Out-of-Context Knowledge Reasoning in Large Language Models [65.7] LLM(Large Language Models)は、知識ベースとしての強力な能力と、コンテキスト内推論能力を示す。
本稿では、複数の知識を組み合わせて新しい知識を推論する、アウト・オブ・コンテクストの知識推論(OCKR: Out-of-context Knowledge Reasoning)について論じる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:59:54 GMT)
Losing Visual Needles in Image Haystacks: Vision Language Models are Easily Distracted in Short and Long Contexts [65.0] 視覚言語モデル(VLM)における長文抽出推論評価のためのベンチマークジェネレータであるLoCoVQAを提案する。
LoCoVQAは、数学的推論、VQA、そしてより長い視覚的コンテキストを持つ文字認識タスクのテスト例を拡張している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:58:03 GMT)
MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions [64.9] オープンエンド命令をサポートする自己教師付き画像検索モデルであるMagicLensを紹介する。
MagicLensは、重要な新しい洞察に基づいて構築されている。同じWebページで自然に起こるイメージペアは、幅広い暗黙の関係を含んでいる。
MagicLensは、さまざまな画像検索タスクの8つのベンチマークで、これまでの最高値に匹敵する結果を得る。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:41:29 GMT)
ALERT: A Comprehensive Benchmark for Assessing Large Language Models' Safety through Red Teaming [64.9] ALERTは、新しいきめ細かいリスク分類に基づいて安全性を評価するための大規模なベンチマークである。
脆弱性を特定し、改善を通知し、言語モデルの全体的な安全性を高めることを目的としている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:50:22 GMT)
Comprehensive Reassessment of Large-Scale Evaluation Outcomes in LLMs: A Multifaceted Statistical Approach [64.4] 評価の結果、スケーリング、トレーニングタイプ、アーキテクチャなどの要因がLLMのパフォーマンスに大きな影響を与えていることが明らかになった。
本研究は, これらのLCMの徹底的な再検討に着手し, 現状評価手法における不整合性に着目した。
これには、ANOVA、Tukey HSDテスト、GAMM、クラスタリング技術などが含まれる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:49:25 GMT)
Learning on Transformers is Provable Low-Rank and Sparse: A One-layer Analysis [63.7] 低ランク計算としての効率的な数値学習と推論アルゴリズムはトランスフォーマーに基づく適応学習に優れた性能を持つことを示す。
我々は、等級モデルが適応性を改善しながら一般化にどのように影響するかを分析する。
適切なマグニチュードベースのテストは,テストパフォーマンスに多少依存している,と結論付けています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:00:58 GMT)
From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models [63.2] この調査は、推論中に計算をスケールするメリットに焦点を当てている。
我々はトークンレベルの生成アルゴリズム、メタジェネレーションアルゴリズム、効率的な生成という3つの領域を統一的な数学的定式化の下で探索する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:45:59 GMT)
C-LLM: Learn to Check Chinese Spelling Errors Character by Character [61.5] 本稿では,C-LLMを提案する。C-LLMは,文字による誤り文字のチェックを学習する中国語のスペルチェック手法である。
C-LLMは既存の方法よりも平均10%改善する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:16:31 GMT)
Blending LLMs into Cascaded Speech Translation: KIT's Offline Speech Translation System for IWSLT 2024 [61.2] 大規模言語モデル (LLM) は現在,自動音声認識 (ASR) や機械翻訳 (MT) ,さらにはエンドツーエンド音声翻訳 (ST) など,さまざまなタスクを探索中である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:38:17 GMT)
EmoLLM: Multimodal Emotional Understanding Meets Large Language Models [61.2] マルチモーダル・大規模言語モデル(MLLM)は、目的とするマルチモーダル認識タスクにおいて顕著な性能を達成している。
しかし、主観的、感情的にニュアンスのあるマルチモーダルコンテンツを解釈する能力はほとんど解明されていない。
EmoLLMは、マルチモーダルな感情理解のための新しいモデルであり、2つのコア技術が組み込まれている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:33:02 GMT)
CoLM-DSR: Leveraging Neural Codec Language Modeling for Multi-Modal Dysarthric Speech Reconstruction [61.1] 変形性音声再建(DSR)は、変形性音声を正常な音声に変換することを目的としている。
話者の類似度は低く、プロソディの自然度は低い。
本稿では、ニューラルネットワークモデリングを利用して再構成結果を改善するマルチモーダルDSRモデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:09:42 GMT)
A Survey of AIOps for Failure Management in the Era of Large Language Models [60.6] 本稿では,LLM時代の障害管理のためのAIOps技術に関する包括的調査を行う。
これには、障害管理のためのAIOpsタスクの詳細な定義、AIOpsのデータソース、AIOpsに採用されているLLMベースのアプローチが含まれている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:39:17 GMT)
Multi-threshold Deep Metric Learning for Facial Expression Recognition [60.3] 本稿では,難易度検証を回避する多閾値深度学習手法を提案する。
その結果,三重項損失のそれぞれの閾値は本質的にクラス間変動の特異な分布を決定することがわかった。
埋め込み層はスライスで構成されており、より情報的で差別的な特徴である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:27:31 GMT)
LLMs Are Few-Shot In-Context Low-Resource Language Learners [59.7] In-context Learning (ICL) は、大規模言語モデル(LLM)に、表現不足の言語で多様なタスクを実行する権限を与える。
ICLとその言語間変動(X-ICL)を25の低リソース言語と7の比較的高リソース言語で検討した。
本研究は,LLMの低リソース理解品質向上における文脈内情報の重要性を論じる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:41:52 GMT)
Surgical Triplet Recognition via Diffusion Model [59.5] 外科的三重項認識は、次世代のコンテキスト対応手術室を実現するために必要不可欠なビルディングブロックである。
拡散モデルを用いた外科的三重項認識のための新しい生成フレームワークであるDifftを提案する。
CholecT45とColecT50データセットの実験は、手術用三重項認識のための新しい最先端性能を達成する上で、提案手法の優位性を示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:22:40 GMT)
RaTEScore: A Metric for Radiology Report Generation [59.4] 本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:49:28 GMT)
VideoHallucer: Evaluating Intrinsic and Extrinsic Hallucinations in Large Video-Language Models [59.1] 本稿では,大規模ビデオ言語モデル(LVLM)における幻覚検出のための最初の総合的ベンチマークであるVideoHallucerを紹介する。
VideoHallucerは幻覚を2つの主なタイプに分類する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:21:59 GMT)
Sparser is Faster and Less is More: Efficient Sparse Attention for Long-Range Transformers [58.6] SPARSEK Attention(SPARSEK Attention)は、計算およびメモリ障害を克服するために設計された、新しいスパースアテンション機構である。
提案手法では,各クエリに対して一定数のKVペアを選択するために,スコアリングネットワークと差別化可能なトップkマスク演算子であるSPARSEKを統合する。
実験結果から,SPARSEK注意は従来のスパースアテンション法よりも優れていた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:55:59 GMT)
BEEAR: Embedding-based Adversarial Removal of Safety Backdoors in Instruction-tuned Language Models [57.5] 大型言語モデル(LLM)における安全バックドア攻撃は、正常な相互作用中の検出を回避しながら、安全でない振る舞いをステルス的に引き起こすことができる。
モデル埋め込み空間において,バックドアトリガーが比較的均一なドリフトを引き起こすという知見を活かした緩和手法であるBEEARを提案する。
両レベル最適化手法は、不要な振る舞いを誘発する普遍的な埋め込み摂動を特定し、モデルパラメータを調整し、これらの摂動に対する安全な振舞いを強化する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:29:47 GMT)
Retrieval-Augmented Mixture of LoRA Experts for Uploadable Machine Learning [57.4] Low-Rank Adaptation (LoRA)は、大規模言語モデル(LLM)を微調整する効率的な方法を提供する。
本稿では,入力プロンプトに基づいて複数のLoRAを適応的に検索・構成するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:24:41 GMT)
Vision-Language Consistency Guided Multi-modal Prompt Learning for Blind AI Generated Image Quality Assessment [57.1] 視覚言語による多モーダル・プロンプト学習による画像品質評価(AGIQA)を提案する。
具体的には、コントラスト言語-画像事前学習(CLIP)モデルの言語と視覚の分岐に学習可能なテキストと視覚的プロンプトを導入する。
我々は、上記のマルチモーダルプロンプトの最適化を導くために、学習された視覚言語一貫性の知識を用いて、テキストから画像へのアライメント品質予測タスクを設計する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:45:31 GMT)
Towards Theoretical Understandings of Self-Consuming Generative Models [56.8] 本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:23:30 GMT)
One Thousand and One Pairs: A "novel" challenge for long-context language models [56.6] NoChaは、67冊の架空の書籍に関する1,001対の真偽の主張のデータセットである。
当社のアノテータは、NoChaにおけるペアの最大シェアは、本全体に対するグローバルな推論を必要としていることを確認しています。
平均的なモデルでは、文レベルの検索しか必要としないペアの方が、グローバルな推論よりもはるかに優れています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:03:57 GMT)
ESC-Eval: Evaluating Emotion Support Conversations in Large Language Models [56.4] Emotion Support Conversation (ESC)は、人間のストレスを減らし、感情的なガイダンスを提供し、人間の精神的および身体的幸福を高めることを目的としている。
ロールプレイングエージェントを用いてESCモデルと対話するESC評価フレームワーク(ESC-Eval)を提案する。
異なるESCモデルの対話型マルチターン対話において、包括的なヒューマンアノテーションを行う。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:24:52 GMT)
Cambrian-1: A Fully Open, Vision-Centric Exploration of Multimodal LLMs [56.4] 視覚中心のアプローチで設計したマルチモーダルLLM(MLLM)のファミリーであるCambrian-1を紹介する。
本研究は,様々な視覚表現を評価するためのインタフェースとして,LLMとビジュアルインストラクションチューニングを用いた。
モデルウェイト、コード、サポートツール、データセット、詳細なインストラクションチューニングと評価のレシピを提供しています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:42 GMT)
Modulating Language Model Experiences through Frictions [56.2] 言語モデルの過剰消費は、短期の未確認エラーを伝播し、長期の人間の能力を損なうリスクを出力する。
行動科学の介入にインスパイアされた言語モデル体験のための選択的摩擦を提案し,誤用を抑える。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:31:11 GMT)
On Computing Pairwise Statistics with Local Differential Privacy [55.8] 例えば$binomn2-1 sum_i ne j f(x_i, x_j)$, $x_i$ は$i$thユーザへの入力を表し、ローカルモデルでは差分プライバシ(DP)である。
この定式化は、Kendallの$tau$ coefficient、Area Under Curve、Giniの平均差、Giniのエントロピーなどの重要なメトリクスをキャプチャする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:06:09 GMT)
Agent-Driven Automatic Software Improvement [55.2] 本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。
継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。
我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:45:22 GMT)
MedBench: A Comprehensive, Standardized, and Reliable Benchmarking System for Evaluating Chinese Medical Large Language Models [55.2] メドベンチ(MedBench)は、中国の医学LLMの総合的、標準化され、信頼性の高いベンチマークシステムである。
まず、MedBenchは43の臨床専門分野をカバーするために、最大の評価データセット(300,901の質問)を組み立てる。
第3に、MedBenchは動的評価機構を実装し、ショートカット学習や解答記憶を防ぐ。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:25:48 GMT)
SafetyBench: Evaluating the Safety of Large Language Models [54.9] SafetyBenchは、大規模言語モデル(LLM)の安全性を評価するための包括的なベンチマークである。
11,435 の多様な選択質問が 7 つの異なるカテゴリーの安全問題にまたがっている。
ゼロショット設定と少数ショット設定の両方で、中国語と英語のLLMを25回以上テストしたところ、GPT-4よりも大幅にパフォーマンス上の優位性を示しました。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:04:21 GMT)
Improved Dynamic Regret for Online Frank-Wolfe [54.7] オンライン凸最適化のための効率的なプロジェクションフリーアルゴリズムであるFrank-Wolfe (OFW) の動的後悔について検討する。
本稿では,FWの高速収束率をオフライン最適化からオンライン最適化に拡張することにより,OFWの動的後悔境界の改善を導出する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:11:08 GMT)
Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images [54.6] 本稿では,3次元シーンをスタイリングするための簡易かつ効果的なパイプラインを提案する。
我々は、スタイル整列画像-画像拡散モデルにより生成されたスタイリング画像を用いて、ソースNeRFモデルを精細化し、3Dスタイルの転送を行う。
本手法は,現実の3Dシーンに多彩な芸術的スタイルを,競争力のある品質で伝達できることを実証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:04:23 GMT)
Anomaly Detection of Tabular Data Using LLMs [54.5] 我々は,事前訓練された大規模言語モデル (LLM) がゼロショットバッチレベルの異常検出器であることを示す。
本稿では,実異常検出におけるLCMの潜在性を明らかにするために,エンドツーエンドの微調整手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:17:03 GMT)
C-ICL: Contrastive In-context Learning for Information Extraction [54.4] c-ICLは、正しいサンプル構築と間違ったサンプル構築の両方を活用して、コンテキスト内学習のデモを作成する、新しい数ショット技術である。
各種データセットに対する実験により,c-ICLは従来の数発のインコンテキスト学習法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:34:56 GMT)
Coding schemes in neural networks learning classification tasks [52.2] 完全接続型広義ニューラルネットワーク学習タスクについて検討する。
ネットワークが強力なデータ依存機能を取得することを示す。
驚くべきことに、内部表現の性質は神経の非線形性に大きく依存する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:50:05 GMT)
UBiSS: A Unified Framework for Bimodal Semantic Summarization of Videos [52.2] Bimodal Semantic Summarization of Videos (BiSSV) という,より包括的なビデオ要約タスクに着目する。
BiSSVタスクのための統一フレームワーク UBiSS を提案し、ビデオ内のサリエンシ情報をモデル化し、TM-summary と VM-summary を同時に生成する。
実験により、我々の統合されたフレームワークは、多段階の要約パイプラインよりも優れたパフォーマンスを実現することが示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:55:25 GMT)
Automatically Generating UI Code from Screenshot: A Divide-and-Conquer-Based Approach [51.5] ウェブページデザインのUIコードへの変換を自動化するための分割型アプローチであるDCGenを提案する。
DCGenはまず、スクリーンショットを管理可能なセグメントに分割し、各セグメントについて記述を生成し、その後、スクリーンショット全体のUIコードに再組み立てする。
実世界のWebサイトとさまざまなMLLMで構成されたデータセットを用いて広範囲なテストを行い、DCGenが競合するメソッドに比べて最大14%の視覚的類似性を実現していることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:58:36 GMT)
Ragnarök: A Reusable RAG Framework and Baselines for TREC 2024 Retrieval-Augmented Generation Track [51.3] RAGベースの検索システムを構築、テスト、視覚化、体系的に評価するためのアリーナを持つことが不可欠である。
TREC 2024 RAG Trackを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:37:52 GMT)
QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds [51.1] QuadrupedGPTは、幅広い複雑なタスクを、ペットに匹敵する俊敏性でマスターするように設計された汎用エージェントである。
我々のエージェントは、大規模マルチモーダルモデル(LMM)を用いて、人間の命令と環境コンテキストを処理する。
長期的な目標を実行可能なサブゴールのシーケンスに分解できる問題解決機能を備えている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:14:24 GMT)
Instance Consistency Regularization for Semi-Supervised 3D Instance Segmentation [50.5] ラベルのないデータから純粋なインスタンス知識を探索し活用するための,新たな自己学習ネットワークInsTeacher3Dを提案する。
複数の大規模データセットの実験結果から、InsTeacher3Dは最先端の半教師付きアプローチよりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:35:58 GMT)
LVLM-Interpret: An Interpretability Tool for Large Vision-Language Models [50.3] 本稿では,大規模視覚言語モデルの内部メカニズムの理解を目的とした対話型アプリケーションを提案する。
このインタフェースは, 画像パッチの解釈可能性を高めるために設計されており, 応答の生成に有効である。
本稿では,一般的な大規模マルチモーダルモデルであるLLaVAにおける障害機構の理解に,アプリケーションがどのように役立つかのケーススタディを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:45:20 GMT)
Diffeomorphic Template Registration for Atmospheric Turbulence Mitigation [50.2] 大気の乱流により劣化した画像の集合体に基づく放射能の回復法について述べる。
画像の1つを参照として選択し、その画像から他の画像への光フローの集約により、この画像の変形をモデル化する。
単純さに拘わらず、最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:48:24 GMT)
Training-Free Exponential Extension of Sliding Window Context with Cascading KV Cache [49.6] キャッシュサイズが同じ長めのウィンドウコンテキストを格納する機構を提案する。
我々は,LongBench(LongBench)が5.6%向上し,ストリームパープレキシティ(PG19)が1.2%,言語理解(MMLU STEM)が0.6%向上したことを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:59:17 GMT)
Adapting Job Recommendations to User Preference Drift with Behavioral-Semantic Fusion Learning [49.3] 求人推薦システムは、オンライン求職における求職者と求職者の機会の整合に不可欠である。
ユーザは、雇用機会を継続的に確保するために、仕事の好みを調整する傾向があります。
セマンティック情報と行動情報の融合学習を通じてユーザの嗜好をモデル化するセッションベースフレームワークBISTROを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:38:04 GMT)
Hacking a surrogate model approach to XAI [49.2] 識別されたサブグループがブラックボックスADMシステムから肯定的な決定を下さない場合でも、対応するグループメンバーシップの問題は、必要に応じて低いレベルまで押し下げることができることを示す。
我々のアプローチは、他の代理モデルに容易に一般化できる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:18:02 GMT)
Dreamitate: Real-World Visuomotor Policy Learning via Video Generation [49.0] 本研究では,与えられたタスクの人間による実演の映像拡散モデルを微調整するビジュモータポリシー学習フレームワークを提案する。
我々は,新しいシーンの画像に条件付きタスクの実行例を生成し,この合成された実行を直接使用してロボットを制御する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:45 GMT)
Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning [48.5] 大規模言語モデル(LLM)は多くの自然言語タスクにおいて印象的な能力を示している。
LLMは多段階推論を行う際にエラー、幻覚、矛盾する文を生成する傾向がある。
本稿では,LLMの復号化過程を検討計画で導くためのフレームワークであるQ*を紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:50:56 GMT)
Towards Lightweight Graph Neural Network Search with Curriculum Graph Sparsification [48.3] 本稿では,有意義なグラフデータを通じて重要なサブアーキテクチャを識別する結合グラフデータとアーキテクチャ機構を設計することを提案する。
最適軽量グラフニューラルネット(GNN)を探索するために,グラフスペーシングとネットワーク・プルーニング(GASSIP)法を用いた軽量グラフニューラル・アーキテクチャ・サーチを提案する。
本手法は,探索したGNNとスペーサーグラフのモデルパラメータを半分以下にすることで,オンパーあるいはそれ以上高いノード分類性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:53:37 GMT)
Decentralized Task Offloading and Load-Balancing for Mobile Edge Computing in Dense Networks [48.2] 本稿では,多数のデバイスとエッジサーバを備えた高密度ネットワークにおける分散タスクオフロードとロードバランシングの問題について検討する。
提案手法は,平均フィールドマルチエージェントマルチアームバンディット(MAB)ゲームと,サーバの報酬を調整するロードバランシング技術を組み合わせることで,ターゲットの人口プロファイルを実現する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:18:36 GMT)
Data Augmentation of Multi-turn Psychological Dialogue via Knowledge-driven Progressive Thought Prompting [46.9] 大規模言語モデル(LLM)はマルチターン対話の実装を単純化した。
心理的対話のような低リソース領域で満足なパフォーマンスを実現することは依然として困難です。
心理学的対話を生成するための LLM 指導のための知識駆動型進歩的思考促進手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:02:56 GMT)
ResMaster: Mastering High-Resolution Image Generation via Structural and Fine-Grained Guidance [46.6] ResMasterは、解像度制限を超えて高品質な画像を生成するために、解像度制限付き拡散モデルに権限を与える、トレーニング不要の方法である。
パッチ・バイ・パッチで高解像度画像を作成するための構造的かつきめ細かいガイダンスを提供する。
実験では、ResMasterが高解像度画像生成のための新しいベンチマークを設定し、有望な効率を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:28:21 GMT)
Multi-LogiEval: Towards Evaluating Multi-Step Logical Reasoning Ability of Large Language Models [46.3] Multi-LogiEvalは、様々な推論規則と深さを持つ多段階論理推論を含む総合的な評価データセットである。
GPT-4, ChatGPT, Gemini-Pro, Yi, Orca, Mistralなどの大規模言語モデルの評価を行った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:02:56 GMT)
EasyEdit: An Easy-to-use Knowledge Editing Framework for Large Language Models [45.7] 本稿では,大規模言語モデルのための知識編集フレームワークであるEasyEditを提案する。
様々な最先端の知識編集アプローチをサポートし、よく知られたLLMにも容易に適用できる。
我々はLlaMA-2の知識編集結果をEasyEditで報告し、知識編集が従来の微調整よりも優れていることを示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:17:57 GMT)
WeatherQA: Can Multimodal Language Models Reason about Severe Weather? [45.4] 干し草、竜巻、雷雨などの激しい対流的な気象イベントは、しばしば急速に起こるが、大きな被害を招き、毎年何十億ドルもの費用がかかる。
このことは、気象学者や住民のリスクの高い地域での適切な準備のために、前もって厳しい天候の脅威を予知することの重要性を強調している。
我々は、気象パラメータの複雑な組み合わせを推論し、現実のシナリオで厳しい天候を予測するために、機械用に設計された最初のマルチモーダルデータセットであるWeatherQAを紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:55:30 GMT)
Reducing the Memory Footprint of 3D Gaussian Splatting [45.2] 3D Gaussian splattingは、高速なトレーニングとリアルタイムレンダリングにより、新しいビュー合成に優れた視覚的品質を提供する。
残念ながら、この方法のメモリ要求は不当に高い。
本稿では,効率よく分解能を考慮したプリミティブ・プルーニング手法を提案し,プリミティブ・カウントを半分に減らした。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:01:44 GMT)
ClickPrompt: CTR Models are Strong Prompt Generators for Adapting Language Models to CTR Prediction [45.2] クリックスルー率(CTR)の予測は、様々なインターネットアプリケーションにとってますます不可欠になっている。
従来のCTRモデルは、マルチフィールド分類データをワンホット符号化によりID特徴に変換し、特徴間の協調信号を抽出する。
我々は、CTRモデルを組み込んで対話対応ソフトプロンプトを生成する、新しいモデル非依存フレームワーク(ClickPrompt)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:26:42 GMT)
Advancing Surgical VQA with Scene Graph Knowledge [45.1] 我々は,シーングラフの知識を用いて,外科的文脈における視覚的質問応答を推し進めることを目指している。
我々は,楽器や解剖の空間的および行動的情報を用いた手術シーングラフを構築した。
軽量Scene-embedded Interaction Module(SIM)を用いた新しい手術用VQAモデルであるSSG-QA-Netを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:07:33 GMT)
Can Quantum Computers Do Nothing? [45.0] アイリングキュービットでは、情報は近隣のキュービットに'リーク'し、非局所分布となり、最終的にはアクセス不能となる。
内部力学による情報損失を定量化する情報理論プロトコルは存在しない。
我々はこのプロトコルを、IBMのFalcon 5.11シリーズの全プロセッサで4ヶ月にわたって実施された3500以上の実験で実装した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:45 GMT)
CLERC: A Dataset for Legal Case Retrieval and Retrieval-Augmented Analysis Generation [44.7] 我々は、大規模なオープンソース法定コーパスを、情報検索(IR)と検索拡張生成(RAG)をサポートするデータセットに変換する。
このデータセットCLERCは、(1)法的な分析のための対応する引用を見つけ、(2)これらの引用のテキストを、推論目標を支持するコジェント分析にコンパイルする能力に基づいて、モデルのトレーニングと評価のために構築される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:57:57 GMT)
COFFEE: A Contrastive Oracle-Free Framework for Event Extraction [44.3] オラクル情報を参照せずに文書コンテキストのみに基づいてイベントを抽出する,COFFEEと呼ばれる新しいフレームワークを提案する。
提案したCOFFEEは,イベント抽出タスクのオラクルフリー設定下での最先端のアプローチよりも優れており,ACE05で評価されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:59:05 GMT)
Large Language Models Are Cross-Lingual Knowledge-Free Reasoners [44.0] 推論タスクは、知識検索と知識のない推論の2つの部分に分けられる。
適応的で構築された知識自由推論データセットを用いて、知識自由推論能力は、様々なソースターゲット言語方向にほぼ完全に移行可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:03:04 GMT)
ReLLa: Retrieval-enhanced Large Language Models for Lifelong Sequential Behavior Comprehension in Recommendation [43.3] ゼロショットと少数ショットのレコメンデーションタスクのために、純粋に大きな言語モデルを適応し、強化することに重点を置いています。
ゼロショット設定と少数ショット設定の両方でレコメンデーションタスクを行うRetrieval-enhanced Large Language Model (ReLLa)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:44:28 GMT)
DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation [42.5] 先進的なマルチモーダルGPTモデルによって自動化された人間対応ベンチマークであるDreamBench++を提案する。
7つのモダンな生成モデルをベンチマークすることで、DreamBench++がより人間に近い評価をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:58:47 GMT)
An Embarrassingly Simple Approach to Enhance Transformer Performance in Genomic Selection for Crop Breeding [42.5] ゲノム選択(GS)は、食糧生産の増強と世界的な飢餓危機への対処において重要な役割を担っている。
最近の傾向は、ディープラーニングによってマーカー間の非線形関係を捉えることである。
シーケンス全体のエンドツーエンドのトレーニングを可能にする,シンプルで効果的なTransformerベースのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:56:35 GMT)
Hierarchical B-frame Video Coding for Long Group of Pictures [42.2] 本稿では、フレームの長いシーケンスでのトレーニング、レートアロケーション、推論によるコンテンツ適応を組み合わせたランダムアクセスのためのエンドツーエンドの学習ビデオを提案する。
一般的なテスト条件下では、ビデオのクラスによっては、YUV-PSNR BD-Rateの点でVTMに匹敵する結果が得られる。
平均して、VMAFとYUV BD-Ratesの点で、オープンLDとRAのエンドツーエンドソリューションを上回っている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:29:52 GMT)
Supervised learning of spatial features with STDP and homeostasis using Spiking Neural Networks on SpiNNaker [42.1] 本稿では,スパイクタイミング依存塑性(STDP)とホメオスタシスを用いて,スパイクニューラルネットワーク(SNN)の教師あり学習を行う新しい手法を提案する。
SNNは1つまたは複数のパターンを認識するように訓練され、ネットワークのパフォーマンスを測定するためにパフォーマンスメトリクスが抽出される。
空間パターンを検出するためのSNNの訓練方法は、静的画像のパターン認識やコンピュータネットワークのトラフィック解析に応用できる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:15:57 GMT)
Conformal time series decomposition with component-wise exchangeability [41.9] 本稿では,時系列分解を取り入れた時系列予測における共形予測の新たな利用法を提案する。
本手法は,よく構造化された時系列に対して有望な結果を与えるが,より複雑なデータに対する分解ステップなどの要因によって制限される可能性がある。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:23:30 GMT)
Bandits with Preference Feedback: A Stackelberg Game Perspective [41.9] 好みのフィードバックを持つ帯域は、未知のターゲット関数を最適化する強力なツールを提供する。
ゼロサムのStackelbergゲームをエミュレートしたMAXMINLCBを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:53:11 GMT)
Rethinking Pruning for Vision-Language Models: Strategies for Effective Sparsity and Performance Restoration [41.7] VLM(Vision-Language Models)は、複数のモードからの情報を統合し、様々なタスクで顕著な成功を収めた。
本研究は,異なるモダリティ特化モデルに対して空間分布を分散する方法と,刈り取ったスパースVLMの性能を回復する方法という,2つの重要な疑問に対処する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:37:45 GMT)
Debiased Recommendation with Noisy Feedback [41.4] 収集データ中のMNARとOMEから予測モデルの非バイアス学習に対する交差点脅威について検討する。
まず, OME-EIB, OME-IPS, OME-DR推定器を設計する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:42:18 GMT)
Improving In-context Learning via Bidirectional Alignment [41.2] 大規模言語モデル(LLM)は、コンテキスト内学習(ICL)を通じて、多くのタスクにおいて印象的な数ショットの一般化を示している。
我々は,学生モデルのICL能力を向上させるために,ICL事例に対するモデルの嗜好を十分に活用するための双方向アライメント(Bidirectional Alignment, BiAlign)を提案する。
具体的には、新しいランキング損失を取り入れることで、学生と教師のモデル間の入力好みのアライメントを導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:34:18 GMT)
FreeTraj: Tuning-Free Trajectory Control in Video Diffusion Models [41.0] 拡散モデル自体が、トレーニングを必要とせず、生成したコンテンツの適切な制御を可能にしている、と我々は主張する。
ノイズ構成とアテンション計算の両方に関するガイダンスを付与することにより、トラジェクトリ制御可能なビデオ生成を実現するためのチューニング不要のフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:56 GMT)
UniCoder: Scaling Code Large Language Model via Universal Code [40.2] 中間表現としてユニバーサルコード(UniCode)を導入する。
UniCoder-Instructは自然言語の質問、コードソリューション、および対応するユニバーサルコードから構成される。
中間普遍符号表現と最終符号解とのアライメントは、生成されたコードの品質を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:32:48 GMT)
AlleNoise -- large-scale text classification benchmark dataset with real-world label noise [40.1] 我々は、実世界のインスタンス依存ラベルノイズを持つ新しいキュレートされたテキスト分類ベンチマークであるAlleNoiseを提示する。
ノイズの分布は、主要なeコマースマーケットプレースの実際のユーザから来ており、人間のミスの意味を現実的に反映している。
このような実環境騒音に対処するには,雑音ラベルを用いた学習方法の代表的選択が不十分であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:29:14 GMT)
A Carrying Capacity Calculator for Pedestrians Using OpenStreetMap Data: Application to Urban Tourism and Public Spaces [40.0] 本稿では,OpenStreetMap(OSM)データに基づいて,ユーザ定義領域の歩行者輸送能力を算出するオンラインツールを提案する。
このツールは、歩行者当たりの面積、回転係数、補正要因、管理能力などのパラメータを組み込むことで、物理的、現実的、効果的な輸送能力を考える。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:44:38 GMT)
Interpretable Catastrophic Forgetting of Large Language Model Fine-tuning via Instruction Vector [39.8] 微調整された大きな言語モデルは、一般的な能力を失う可能性がある。
本稿では,そのような忘れ物の背後にある本質的なメカニズムについて考察する。
我々は,原図の保存を目的としたIV誘導学習を開発し,破滅的な忘れを緩和する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:29:28 GMT)
Portrait3D: 3D Head Generation from Single In-the-wild Portrait Image [39.7] 従来の3Dヘッド生成法はテキスト記述によって制限されており、画像ベースの手法は高品質なヘッドジオメトリを作成するのに苦労していた。
高品質な3Dヘッドを生成できる新しいフレームワークPortrait3Dを提案する。
広範にわたる実験により,高品質な3Dヘッドを高精度な形状とテクスチャで生成できることが実証された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:11:35 GMT)
Do As I Do: Pose Guided Human Motion Copy [39.4] モーションコピーは、人工知能とコンピュータビジョンにおいて興味深いが難しい課題だ。
既存のアプローチでは、通常、ターゲットのフェイクビデオを生成するために、L1またはL2損失の従来のGANを採用する。
連続学習を促進するために,ポーズ・ツー・アジュアンス生成におけるエピソード記憶モジュールを提案する。
提案手法は,PSNRとFIDをそれぞれ7.2%,12.4%改善した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:41:51 GMT)
Relaxing Continuous Constraints of Equivariant Graph Neural Networks for Physical Dynamics Learning [39.3] 離散同変グラフニューラルネットワーク(DEGNN)を提案する。
具体的には、幾何学的特徴を置換不変な埋め込みに変換することによって、このような離散同変メッセージパッシングを構築することができることを示す。
DEGNNはデータ効率が良く、少ないデータで学習でき、観測不能な向きなどのシナリオをまたいで一般化できることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:37:51 GMT)
MM-SpuBench: Towards Better Understanding of Spurious Biases in Multimodal LLMs [38.9] 非意味な入力属性と予測対象変数の急激な相関を利用する傾向にあるスパースバイアスは、単一のモダリティデータに基づいて訓練されたディープラーニングモデルに深刻な落とし穴があることを明らかにした。
本稿では,9つの異なる相関関係のカテゴリに対するMLLMの信頼度を評価するために,包括的視覚質問応答(VQA)ベンチマークであるMM-SpuBenchを紹介する。
以上の結果から,これらのモデルからの素因相関への依存の持続性を明らかにし,素因バイアスを緩和する新たな手法の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:29:16 GMT)
VideoScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation [38.8] 我々は、37.6K以上の合成ビデオで人為的なマルチアスペクトスコアを含む最初の大規模データセットであるVideoFeedbackをリリースした。
実験では、VideoScoreと人間の間のSpearman相関が、VideoFeedback-testで77.1に達することが示され、以前のベストメトリクスを約50ポイント上回った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:22:55 GMT)
Versatile Backdoor Attack with Visible, Semantic, Sample-Specific, and Compatible Triggers [38.7] 我々はtextbfVisible, textbfSemantic, textbfSample-lang, textbfCompatible (VSSC) と呼ばれる新しいトリガを提案する。
VSSCトリガは、効果的でステルス的で堅牢な同時実行を実現しており、対応するオブジェクトを使用して物理的シナリオに効果的にデプロイすることもできる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:40:01 GMT)
Task Oriented In-Domain Data Augmentation [38.5] 大規模言語モデル(LLM)は様々なアプリケーションや分野において優れた性能を示している。
法律や広告などの専門分野の性能向上のために、LLMはドメイン内のデータに基づいて事前訓練されることが多い。
タスク指向のドメイン内データ拡張フレームワークTRAITを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:58:11 GMT)
LLM-Assisted Content Conditional Debiasing for Fair Text Embedding [37.9] 本稿では,公正なテキスト埋め込みを学習するための新しい手法を提案する。
テキスト埋め込みのための新しい内容条件等距離(CCED)フェアネスを定義する。
また,異なる感度属性を持つテキストの埋め込みが,対応する中性テキストの埋め込みから同じ距離を保っていることを保証するために,コンテンツ条件脱バイアス(CCD)の損失も導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:49:16 GMT)
SimClone: Detecting Tabular Data Clones using Value Similarity [37.9] データセット間のデータクローンの存在は、クローンを使用したデータセットを使用してAIソフトウェアを構築する際に問題を引き起こす可能性がある。
構造情報に依存しない表形式のデータセットにおけるデータクローン検出のためのSimCloneと呼ばれる新しい手法を提案する。
以上の結果から,我々のSimCloneは,F1スコアとAUCの両面で,最先端の手法よりも20%高い性能を示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:16:32 GMT)
EasyInstruct: An Easy-to-use Instruction Processing Framework for Large Language Models [37.8] EasyInstructは、Large Language Models (LLMs)のための使いやすい命令処理フレームワークである。
EasyInstructは命令生成、選択、プロンプトをモジュール化し、それらの組み合わせと相互作用も考慮する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:10:23 GMT)
Exploring Cross-Domain Few-Shot Classification via Frequency-Aware Prompting [37.7] クロスドメインなFew-Shot Learningはメタラーニングの発展に大きく貢献している。
本稿では,相互に注意を向けた周波数対応プロンプト手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:14:09 GMT)
On Parameter Estimation in Deviated Gaussian Mixture of Experts [37.4] 本稿では, ガウス混合系のパラメータ推定問題について考察する。
データは$g_0(Y|X)$(null仮説)から生成されるか、あるいはその混合物全体から生成される。
我々は,最大推定値の収束率を捉えるために,新しいボロノイ型損失関数を構築した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:13:06 GMT)
NeST: Neural Stress Tensor Tomography by leveraging 3D Photoelasticity [36.8] 光弾性は、応力誘起複屈折による透明物体のフルフィールド応力解析を可能にする。
既存の技術は2Dスライスに限られており、オブジェクトを破壊的にスライスする必要がある。
我々は,3次元応力テンソル場を偏光測定による暗黙的表現として再構成するための解析バイシンセシス手法であるNeSTを紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:02:57 GMT)
ZeroG: Investigating Cross-dataset Zero-shot Transferability in Graphs [36.7] ZeroGは、クロスデータセットの一般化を可能にするために設計された新しいフレームワークである。
特徴の不整合、ラベル空間の整合、負の移動といった、固有の課題に対処する。
本稿では,抽出したサブグラフの意味情報と構造情報を豊かにするための,プロンプトベースのサブグラフサンプリングモジュールを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:34:02 GMT)
Towards Scalable Exact Machine Unlearning Using Parameter-Efficient Fine-Tuning [35.7] 本研究では,S3T (Sequence-aware Sharded Sliced Training) を導入し,非学習システムの削除能力を向上させる。
S3Tは不整合データスライスで順次レイヤをトレーニングすることでパラメータ分離を可能にする。
モデルを複数のデータシーケンスでトレーニングすることで、S3Tでは削除要求の増加を処理することができます。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:45:13 GMT)
Attention Instruction: Amplifying Attention in the Middle via Prompting [35.1] 言語モデルはいまだ位置バイアスに悩まされており、コンテキストの中央へのアクセスと使用が困難である。
本研究では,LSMの相対的位置認識と,プロンプトによる不均等注意の軽減の可能性について検討した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:35:11 GMT)
SWAP-NAS: Sample-Wise Activation Patterns for Ultra-fast NAS [35.0] トレーニング不要のメトリクスは、リソース集約型ニューラルネットワークトレーニングを避けるために広く使用されている。
我々は,新しい高性能トレーニングフリーメトリックであるSWAP-ScoreとSample-Wise Activation Patternsを提案する。
SWAP-Scoreは,様々な検索空間やタスクの接地構造と強く相関している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:18:29 GMT)
Non-rigid Structure-from-Motion: Temporally-smooth Procrustean Alignment and Spatially-variant Deformation Modeling [34.6] 非剛性構造移動(NRSfM)の研究が盛んに行われ、大きな進展が見られた。
広範に現実世界のアプリケーションを妨げる重要な課題はまだ残っている。
本稿では,空間時間モデルの観点から,上記の課題を解決することを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:30:48 GMT)
Knowledge Accumulation in Continually Learned Representations and the Issue of Feature Forgetting [34.4] 本研究では,知識蓄積と特徴忘れという,継続的に学習される表現の質に影響を及ぼす2つの現象の共存について検討する。
表現を忘れることが絶対的に小さいとしても、表現を忘れることは出力レベルで忘れることと同じくらい破滅的な傾向があることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:03:00 GMT)
Adversarial Contrastive Decoding: Boosting Safety Alignment of Large Language Models via Opposite Prompt Optimization [34.3] Adversarial Contrastive Decoding (ACD)は、プロンプトベースのコントラストデコーディングのための2つの逆のシステムプロンプトを生成する最適化ベースのフレームワークである。
ACDは、元の生成能力を犠牲にすることなく、従来のトレーニング不要復号法よりもはるかに優れた安全性を実現する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:51:30 GMT)
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization [34.3] character-Adapterは、参照文字の詳細を保持するイメージを生成するために設計されたプラグイン・アンド・プレイのフレームワークである。
プロンプト誘導セグメンテーションを使用して、参照文字と動的領域レベルのアダプタのきめ細かい地域特性を保証する。
一貫性のあるキャラクタ生成の最先端性能を実現し、他の手法と比較して24.8%向上した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:16:37 GMT)
OCALM: Object-Centric Assessment with Language Models [33.1] 本稿では,言語モデルを用いたオブジェクト指向アセスメント(OCALM)を提案し,強化学習エージェントに対して本質的に解釈可能な報酬関数を導出する。
OCALMは、リレーショナルな概念に焦点を当てた報酬関数を導出するために、言語モデルの広範な世界知識を使用する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:57:48 GMT)
On the Role of Long-tail Knowledge in Retrieval Augmented Large Language Models [33.1] 検索拡張現実(RAG)は,大規模言語モデル(LLM)の知識能力向上に際し,優れた性能を示す
本稿では,LLMの簡易かつ効果的なロングテール知識検出手法を提案する。
提案手法は,平均推定時間で4倍以上の高速化を実現し,下流タスクにおける一貫した性能向上を実現している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:17:59 GMT)
Seeking Certainty In Uncertainty: Dual-Stage Unified Framework Solving Uncertainty in Dynamic Facial Expression Recognition [32.7] ノイズは、論理的なラベル付けを損なう低品質なキャプチャや、アノテーションのバイアスによる誤ラベルに悩まされるインスタンスから生じます。
textbfSeeking textbfCertain data textbfIn extensive textbfUncertain data (SCIU)
このイニシアチブは、これらの不確実性のDFERデータセットを浄化することを目的としており、トレーニングプロセスでクリーンで検証されたデータのみが使用されることを保証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:25:02 GMT)
From Perfect to Noisy World Simulation: Customizable Embodied Multi-modal Perturbations for SLAM Robustness Benchmarking [32.5] エンボディードエージェントは、非構造環境で運用するために堅牢なナビゲーションシステムを必要とする。
ノイズの多いデータ合成のための,新しい,カスタマイズ可能なパイプラインを提案する。
我々はニューラル(NeRF)モデルと非ニューラルSLAMモデルの両方の障害に対する感受性を明らかにする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:57:05 GMT)
A Survey on Neural Topic Models: Methods, Applications, and Challenges [32.5] トピックモデルは何十年にもわたって普及し、潜在トピックを発見し、教師なしの方法で文書のトピックの割合を推測している。
ニューラルネットワークの台頭は、新しい研究分野であるニューラルトピックモデル(NTM)の出現を促している。
本稿では,手法,応用,課題に関するニューラルトピックモデルに関する包括的調査を行う。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:08:06 GMT)
Suppressing Uncertainties in Degradation Estimation for Blind Super-Resolution [31.9] ブラインド画像の超解像問題は、未知の劣化モードで低解像度(LR)画像から高解像度(HR)画像を復元することを目的としている。
既存のほとんどの手法は、ぼやけたカーネルを使って画像劣化過程をモデル化している。
盲目的のtextbf Super-textbfResolution フレームワークに対して,textbfUncertainty に基づく分解表現を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:58:43 GMT)
Evaluating Visual and Cultural Interpretation: The K-Viscuit Benchmark with Human-VLM Collaboration [31.7] 本稿では,文化的なVLMベンチマークを構築するための,半きめ細かいパイプラインを提案する。
VLMモデルは、ガイドライン、人間による注釈付き例、画像関連知識に基づいて質問を生成する。
このパイプラインは、K-Viscuitと呼ばれる韓国の文化に合わせてデータセットを作成するという、特定のアプリケーションを通じて実証されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:18:15 GMT)
Bosch Street Dataset: A Multi-Modal Dataset with Imaging Radar for Automated Driving [31.4] ボッシュストリートデータセット(BSD)は、高度自動運転(HAD)と高度運転支援システム(ADAS)の研究を促進することを目的とした、新しいマルチモーダルな大規模データセットである。
BSDは、高解像度イメージングレーダー、ライダー、カメラセンサーのユニークな統合を提供し、前例のない360度カバレッジを提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:40:56 GMT)
UniPSDA: Unsupervised Pseudo Semantic Data Augmentation for Zero-Shot Cross-Lingual Natural Language Understanding [31.3] 言語間の表現学習は、リソースに富んだデータからリソースに密着したデータへ知識を伝達し、異なる言語の意味理解能力を改善する。
言語間自然言語理解のためのunsupervised Pseudo Semantic Data Augmentation (UniPSDA) 機構を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:27:01 GMT)
Repulsive Score Distillation for Diverse Sampling of Diffusion Models [31.3] 反発性スコア蒸留(Repulsive Score Distillation、RSD)は、多様性を促進する粒子のアンサンブルの反発に基づく変動的な枠組みである。
RSDは、最先端の代替品に比べて多様性と品質のトレードオフが優れている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:43:02 GMT)
PISTOL: Dataset Compilation Pipeline for Structural Unlearning of LLMs [31.2] 訓練済みまたは微調整済みのモデルに格納された特定のデータを消去しようとする機械学習は、LLMにとって重要な保護措置として登場した。
構造的アンラーニング手法の開発を容易にするため,マルチシナリオデータセットをコンパイルするパイプラインであるPISTOLを提案する。
Llama2-7BモデルとMistral-7Bモデルの両方で4つの異なる未学習手法を用いてベンチマークを行う。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:22:36 GMT)
GC-Bench: A Benchmark Framework for Graph Condensation with New Insights [30.8] グラフ凝縮(GC)は、元のグラフの本質的な情報を保持する、はるかに小さなグラフを学習するために設計された新興技術である。
本稿では,複数の次元にわたる最近のGC手法を評価する包括的フレームワークであるGC-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:17:49 GMT)
PromptKD: Distilling Student-Friendly Knowledge for Generative Language Models via Prompt Tuning [30.7] 本稿では,学生に親しみやすい知識を伝達する生成言語モデルを実現するために,PromptKDを提案する。
命令追従データセットの実験は、PromptKDが最先端のパフォーマンスを達成することを示す。
さらに分析したところ、学生に親しみやすい知識の蒸留は、トレーニングプロセス全体を通して効果的に露光バイアスを軽減することが示唆された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:40:38 GMT)
SOUL: Unlocking the Power of Second-Order Optimization for LLM Unlearning [30.3] 大規模言語モデル(LLM)は、データ規則や倫理的AIプラクティスに従うための効果的な非学習メカニズムの必要性を強調している。
LLMアンラーニングの研究への関心は高まりつつあるが、LLMアンラーニングの選択の影響は未解明のままである。
我々はLLMアンラーニングにおける選択の重要性を初めて明らかにし、二階最適化と影響アンラーニングの明確な関連性を確立した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:24:53 GMT)
Towards Better Graph-based Cross-document Relation Extraction via Non-bridge Entity Enhancement and Prediction Debiasing [30.2] 文書間関係抽出は,異なる文書に存在する対象エンティティ間の関係を予測することを目的としている。
本稿では,非ブリッジエンティティ拡張と予測バイアスを用いたグラフベースのクロスドキュメントREモデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:08:28 GMT)
Improving robustness to corruptions with multiplicative weight perturbations [29.9] クリーン画像の精度を損なうことなく、広範囲の汚職に対してDNNの堅牢性を向上する代替手法を提案する。
まず、重み空間における乗法的摂動によって入力摂動が模倣できることを示す。
また,最近提案されたAdaptive Sharpness-Aware Minimization (ASAM) について検討し,逆乗法重み摂動下でのDNNの最適化を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:20:44 GMT)
Panza: A Personalized Text Writing Assistant via Data Playback and Local Fine-Tuning [29.7] そこで我々は,Panzaと呼ばれるメール生成用パーソナルアシスタントの特定のユースケースに対して,そのような自動アシスタントの新しい設計を提案する。
具体的には、Panzaはコモディティハードウェア上でローカルにトレーニングと推論を行うことができ、ユーザの書き込みスタイルに合わせてパーソナライズされる。
効率的な微調整法と推論法を組み合わせることで、Panzaは限られたリソースを使って完全にローカルに実行できることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:09:34 GMT)
Reducing Fine-Tuning Memory Overhead by Approximate and Memory-Sharing Backpropagation [29.1] この研究は、活性化関数と層正規化の観点から微調整におけるメモリオーバーヘッドを低減することを目的としている。
提案手法をバックプロパゲーショントレーニングに適用し,GELUおよびSiLU活性化関数のメモリ効率の代替を導出する。
さらに、メモリ共有バックプロパゲーション戦略を導入し、アクティベーションメモリを2つの隣接層で共有できるようにする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:09:15 GMT)
Make Graph Neural Networks Great Again: A Generic Integration Paradigm of Topology-Free Patterns for Traffic Speed Prediction [29.1] 本稿では,現在のGNN手法でトポロジフリーパターンを保存できる汎用モデルを提案する。
具体的には,空間変換器とテンポラル変換器を含むDual Cross-Scale Transformer (DCST) アーキテクチャを開発した。
そこで我々は,既存のGNNベースの手法を教師モデルとみなし,提案したDCSTアーキテクチャを学生モデルとみなす蒸留方式の学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:32:58 GMT)
Large Vocabulary Size Improves Large Language Models [28.8] 単語語彙サイズと大規模言語モデル(LLM)の性能の関係について検討する。
実験結果から,LLMの語彙サイズが大きくなると性能が向上することがわかった。
事前定義された語彙の代わりに新しい語彙を使用するための簡単な方法を導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:27:07 GMT)
$\text{Alpha}^2$: Discovering Logical Formulaic Alphas using Deep Reinforcement Learning [28.5] 深部強化学習(DRL)を用いたアルファ発見のための新しい枠組みを提案する。
DRLでガイドされた探索アルゴリズムは、潜在的なアルファ結果の値推定に基づいて探索空間をナビゲートする。
実世界の株式市場での実証実験は、さまざまな論理的かつ効果的なアルファを識別するtextAlpha2$の能力を実証している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:21:29 GMT)
When Parts are Greater Than Sums: Individual LLM Components Can Outperform Full Models [28.5] 本稿では,大規模言語モデルの出力を,注目頭やコンポーネントの個々のコントリビューションに分解することで,文脈内学習(ICL)について検討する。
モデルが貧弱な場合であっても、分類タスクで個別にうまく機能する優れたパフォーマンスのコンポーネント、偶然よりもはるかに悪いパフォーマンスのコンポーネント、常に同じラベルを予測するラベルバイアスのコンポーネント。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:13:13 GMT)
Geometry-Aware Score Distillation via 3D Consistent Noising and Gradient Consistency Modeling [28.4] 我々は,3次元一貫したノイズ発生,幾何に基づく勾配のゆらぎ,新しい勾配のゆらぎの損失を導入する。
我々は,テキスト・ツー・3次元生成タスクにおける幾何学的不整合を最小限のコストで解決し,既存のスコア蒸留モデルとの整合性を実現した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:58:17 GMT)
Prompting with Divide-and-Conquer Program Makes Large Language Models Discerning to Hallucination and Deception [28.1] 本研究では,DACプロンプトが性能向上に寄与する特定のタスクの特定を支援する。
実験結果が理論解析と一致した2つのケース(大整数算術と実数検証)を提示する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:49:29 GMT)
A General Theory for Softmax Gating Multinomial Logistic Mixture of Experts [28.1] 本稿では,入力をゲーティング関数に渡す前に変換する改良型ソフトマックスゲーティング関数を提案する。
その結果, 従来の相互作用は消失し, パラメータ推定率が大幅に向上した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:53:09 GMT)
Is Temperature Sample Efficient for Softmax Gaussian Mixture of Experts? [27.9] 本研究は,MoEの下での最大推定値に対する専門家(MoE)の密度-スパース混合の影響について検討する。
本稿では,線形層の出力を活性化関数にルーティングし,ソフトマックス関数に伝達する新しいアクティベーション・トゥ・スパースゲートを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:45:30 GMT)
EFUF: Efficient Fine-grained Unlearning Framework for Mitigating Hallucinations in Multimodal Large Language Models [27.7] ペア化データなしで幻覚を除去する,効率的な粒度の未学習フレームワーク(EFUF)を提案する。
本手法は, 高い計算オーバーヘッドで生成品質を保ちながら, 幻覚を常に低減する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 00:50:58 GMT)
Combining Supervised Learning and Reinforcement Learning for Multi-Label Classification Tasks with Partial Labels [27.5] 本稿では,強化学習の探索能力と教師あり学習の活用能力を組み合わせたRLベースのフレームワークを提案する。
文書レベルの関係抽出を含む各種タスクに対する実験結果から,フレームワークの一般化と有効性を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:36:19 GMT)
Laplacian Convolutional Representation for Traffic Time Series Imputation [27.5] トラフィック時系列の局所的傾向を特徴付けるための時間正則化にラプラシアンカーネルを導入する。
循環行列核ノルムとラプラシアン核化時間正規化を併用して低ランクラプラシアン畳み込み表現(LCR)モデルを開発する。
各種時系列行動のトラヒック時系列を計算するためのベースラインモデルよりもLCRの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:52:28 GMT)
Geometric Understanding of Discriminability and Transferability for Visual Domain Adaptation [27.3] 教師なしドメイン適応(UDA)のための不変表現学習は、コンピュータビジョンとパターン認識コミュニティにおいて大きな進歩を遂げている。
近年,移動可能性と識別可能性との実証的な関係が注目されている。
本研究では,幾何学的観点から,伝達可能性と識別可能性の本質を体系的に分析する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:31:08 GMT)
Reward Steering with Evolutionary Heuristics for Decoding-time Alignment [26.7] 報酬モデルガイダンスによる復号時間アライメントは、推論時間の増加を犠牲にして問題を解決する。
これを改善するために、これらの2つの側面を分離し、進化的な方法で実装します。
実証的な証拠は、この戦略が多くの選好最適化や復号時間アライメントアプローチより優れていることを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:36:11 GMT)
UniST: A Prompt-Empowered Universal Model for Urban Spatio-Temporal Prediction [26.7] 都市時間予測は、交通管理、資源最適化、出現応答などの情報的意思決定に不可欠である。
大規模言語モデルによる広範囲のシナリオにまたがる一般都市時間予測のためのユニバーサルモデルUniSTを紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:51:27 GMT)
Revisiting Referring Expression Comprehension Evaluation in the Era of Large Multimodal Models [26.5] Referring Expression comprehension (REC)は、テキスト記述に基づいてターゲットインスタンスをローカライズする。
RECの最近の進歩は、CogVLMのような大規模なマルチモーダルモデル(LMM)によって推進され、RefCOCOでは92.44%の精度を達成した。
本稿では、最新のRECモデルを評価するために特別に設計された総合RECベンチマークであるRef-L4を紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:58 GMT)
Reducing Privacy Risks in Online Self-Disclosures with Language Models [26.3] 我々は19の自己開示カテゴリの分類を開発し,4.8Kの注釈付き開示スパンからなる大きなコーパスをキュレートした。
検出のための言語モデルを微調整し、部分的なスパンを65%以上達成しました。
本稿では、開示をあまり具体的でない用語に言い換える自己開示抽象化の課題を紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:11:44 GMT)
PlagBench: Exploring the Duality of Large Language Models in Plagiarism Generation and Detection [26.2] 46.5Kの合成プラギアリズムケースからなる包括的データセットであるPlagBenchを紹介する。
次に,提案したデータを用いて,5つの近代LDMと3つの特殊プラジャリズムチェッカーの盗作検出性能を評価する。
以上の結果より, GPT-3.5はLlama2やGPT-4に比べ, 高い品質のパラフレーズや要約を生じる傾向が示唆された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:29:53 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [26.0] Adam-miniは、メモリフットプリントを45%から50%削減したAdamWよりも、オンパーまたは優れたパフォーマンスを実現している。
我々は,Adam-miniが,事前学習,教師付き微調整,RLHFのために125Mから7Bの様々な言語モデルでAdamWと同等以上の性能を示すことを確認した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:56:41 GMT)
FightLadder: A Benchmark for Competitive Multi-Agent Reinforcement Learning [25.9] 我々は、リアルタイムの格闘ゲームプラットフォームであるFightLadderを紹介し、競争力のあるMARL研究を促進する。
競争ゲームのための最先端のMARLアルゴリズムの実装と評価指標のセットを提供する。
シングルプレイヤーモードで12文字を連続的に打ち破る汎用エージェントを訓練することにより,このプラットフォームの実現可能性を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:38:46 GMT)
EAGLE-2: Faster Inference of Language Models with Dynamic Draft Trees [25.7] 本稿では,コンテキスト認識型動的ドラフトツリーの新しい手法を提案する。
我々は,3つの大言語モデル(LLM)と6つのタスクについて広範囲に評価を行った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:11 GMT)
MANO: Exploiting Matrix Norm for Unsupervised Accuracy Estimation Under Distribution Shifts [25.6] 現在のロジットベースの手法は過信問題に対して脆弱であり、特に自然変化の下では予測バイアスにつながる。
予測バイアスを低減するために,データ依存正規化を適用したMaNoを提案し,正規化ロジットの行列の$L_p$ノルムを推定スコアとする。
MaNoは、合成、自然、またはサブポピュレーションシフトの存在下で、さまざまなアーキテクチャで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:12:08 GMT)
Unlearnable Examples for Diffusion Models: Protect Data from Unauthorized Exploitation [25.6] 本研究では,不正な利用から画像を保護するために,Unlearnable Diffusion Perturbationを提案する。
この成果は、AI生成コンテンツに対するプライバシーと著作権の保護に寄与するため、現実世界のシナリオにおいて重要な意味を持つ。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:11:33 GMT)
GPTFUZZER: Red Teaming Large Language Models with Auto-Generated Jailbreak Prompts [25.3] GPTFuzzは、AFLファジィフレームワークにインスパイアされた、新しいブラックボックスジェイルブレイクファジィフレームワークである。
GPTFuzzは、高い成功率のジェイルブレイクテンプレートを連続的に生成し、人造テンプレートを上回っていることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:34:17 GMT)
Perceiver-based CDF Modeling for Time Series Forecasting [25.3] 本稿では,時系列データの累積分布関数(CDF)をモデル化するための新しいアーキテクチャであるPerceiver-CDFを提案する。
提案手法は,マルチモーダル時系列予測に適したコプラに基づくアテンション機構と,知覚アーキテクチャを組み合わせたものである。
単調かつマルチモーダルなベンチマークの実験は、最先端の手法よりも20%改善されていることを一貫して示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:31:38 GMT)
Reinforcement Learning via Auxiliary Task Distillation [24.9] 補助的タスク蒸留(AuxDistill)による強化学習について紹介する。
AuxDistillは、補助的なタスクから振舞いを蒸留することにより、強化学習により長距離ロボット制御問題を実行することができる。
我々は,AuxDistillが,実演や学習カリキュラム,事前訓練を受けたスキルを使わずに,多段階の具体的オブジェクト再構成作業を行うための画素対アクションポリシーを学習できることを実証した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:02:18 GMT)
StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal [24.9] この研究は、単色入力による高品質表面正規分布推定の課題に対処する。
我々の方法であるStableNormalは、推論分散を減らして拡散過程の室内性を緩和する。
透明で反射性のある表面に対して頑丈で、多くの物体が散らばっている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:58 GMT)
DemoRank: Selecting Effective Demonstrations for Large Language Models in Ranking Task [24.8] デモ選択をtextitretrieve-then-rerankプロセスとして定式化し、DemoRankフレームワークを導入する。
本フレームワークでは、まずLLMフィードバックを用いてデモレトリバーをトレーニングし、新しい依存性を考慮したトレーニングサンプルを構築し、デモリランカをトレーニングし、数発のICLを改善する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:10:13 GMT)
OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far? [24.7] 我々は、最近リリースされたClaude-3.5-Sonnet、Gemini-1.5-Pro、GPT-4oに焦点を当てている。
本稿では,各種分野にわたる総合的なパフォーマンスに基づいて,初めてオリンピック・メダリスト・テーブルを用いてAIモデルをランク付けする手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:31:12 GMT)
CausalFormer: An Interpretable Transformer for Temporal Causal Discovery [24.6] 本稿では、CausalFormerと呼ばれる、解釈可能なトランスフォーマーに基づく因果探索モデルを提案する。
因果対応変換器は、予測タスクを用いて時系列データの因果表現を学習する。
分解に基づく因果検出器は、訓練された因果変換器のグローバル構造を解釈する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:09:29 GMT)
Sphere Neural-Networks for Rational Reasoning [24.6] ベクトルから球面への計算ビルディングブロックの一般化による新しい拡張を提案する。
モデル構築と検査を通して人間のような推論を行うための球ニューラルネット(SphNN)を提案する。
SphNNは、合理性-時間的推論、否定と解離を伴う論理的推論、イベント推論、ニューロシンボリック統一、ユーモア理解など、様々なタイプの推論に進化することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:45:42 GMT)
Projection-free Online Learning over Strongly Convex Sets [24.5] 我々は,強い凸集合に対するオンライン学習の特別な事例について検討し,OWが一般凸集合の損失に対して$O(T2/3)$よりも良い後悔の限界を享受できることを最初に証明した。
一般凸集合に対する$O(sqrtT)$の後悔境界と強凸集合に対する$O(sqrtT)$の後悔境界を達成することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:35:02 GMT)
Why Transformers Need Adam: A Hessian Perspective [24.4] SGDはトランスフォーマーのかなりの差でAdamよりもパフォーマンスが悪いが、その理由は不明だ。
我々はヘッセンのレンズを通して説明する:トランスフォーマーは「異種」である
SGDは、ブロック間の不均一性を扱うことができないため、全てのブロックに1つの学習率を適用するため、性能が低下することがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:41:30 GMT)
Quantum Multi-Agent Reinforcement Learning for Cooperative Mobile Access in Space-Air-Ground Integrated Networks [24.2] キューブサットやHALE-UAVの数が増えると、各地上局(GS)のスケジューリングが増加する。
本稿では、GSとCubeSats/HALE-UAV間のスケジューリングのための量子マルチエージェント強化学習法(QMARL)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:12:04 GMT)
Articulate your NeRF: Unsupervised articulated object modeling via conditional view synthesis [24.0] そこで本稿では,頑健な部分を持つ明瞭な物体のポーズと部分分割を学習するための教師なしの手法を提案する。
本手法は,最初の観測から暗黙のモデルを用いて物体の形状と外観を学習する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:13:31 GMT)
Investigating the Influence of Prompt-Specific Shortcuts in AI Generated Text Detection [23.8] 我々はAIGT検出におけるプロンプト特異的ショートカットの影響を分析する。
フィードバックに基づく逆命令リスト最適化(FAILOpt)を提案する。
FAILOptは、敵対的なインコンテキストの例に基づく他の攻撃に匹敵するターゲット検出器の検出性能を効果的に低下させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:50:09 GMT)
RAG-RLRC-LaySum at BioLaySumm: Integrating Retrieval-Augmented Generation and Readability Control for Layman Summarization of Biomedical Texts [23.5] 本稿では,RAG-RLRC-LaySumフレームワークについて紹介する。
RAG-RLRC-LaySumフレームワークは、科学的知識を効果的に民主化し、生物医学的な発見への公的な関与を高める。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:13:16 GMT)
UNO Arena for Evaluating Sequential Decision-Making Capability of Large Language Models [23.1] 逐次意思決定とは、初期決定がその後の決定に影響を及ぼす環境のダイナミクスを考慮に入れたアルゴリズムを指す。
タスク間の強力な機能を示す大きな言語モデル(LLM)によって、私たちは次のように問うざるを得ない。
我々は,LLMの逐次意思決定能力を評価するためにUNOアリーナを提案し,なぜUNOを選択するのかを詳細に説明する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:47:34 GMT)
modeLing: A Novel Dataset for Testing Linguistic Reasoning in Language Models [23.1] modeLingはLinguistics Olympiadスタイルのパズルの新しいベンチマークで、AIシステムで数発の推論をテストする。
我々は,大規模なオープンソース言語モデルとGPTをベンチマークで評価した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:59 GMT)
CLIMATELI: Evaluating Entity Linking on Climate Change Data [23.1] 気候変動(CC)は世界的重要性のトピックであり、研究分野に注目が集まっている。
我々は3,087個のエンティティをWikipediaにリンクする最初の手動注釈付きCCデータセットであるCLIMATELIを提示する。
ELモデルの性能はトークンレベルとエンティティレベルの両方で人間に遅れていることが判明した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:36:00 GMT)
MonoBox: Tightness-free Box-supervised Polyp Segmentation using Monotonicity Constraint [23.0] 単調性に制約されたボックス教師付きセグメンテーション手法であるMonoBoxを提案する。
MonoBoxは、ユーザフレンドリーでないボックステトネス仮定からトレーニングを解放する。
パブリックシンセサイザーと社内のリアルノイズデータセットの実験は、MonoBoxが他のアンチ・ノイズ・オブ・ザ・アーティファクトを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:49:35 GMT)
Agent Design Pattern Catalogue: A Collection of Architectural Patterns for Foundation Model based Agents [22.9] ファウンデーションモデルに対応した生成人工知能はエージェントの開発と実装を容易にする。
本稿では、文脈、力、トレードオフを分析した17のアーキテクチャパターンからなるパターンカタログを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:32:27 GMT)
GIM: A Million-scale Benchmark for Generative Image Manipulation Detection and Localization [21.8] ローカル操作パイプラインは、強力なSAM、ChatGPT、生成モデルを組み込んだ設計である。
1)AIが操作する画像と実際の画像のペアが100万以上含まれる大規模なデータセット。
本稿では、シャドウトレーサ、周波数空間ブロック(FSB)、マルチウィンドウ異常モデリング(MWAM)モジュールからなる新しいIMDLフレームワークGIMFormerを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:10:41 GMT)
Can Protective Perturbation Safeguard Personal Data from Being Exploited by Stable Diffusion? [21.8] 元の画像構造を保ちながら保護された摂動を除去できる浄化方法を提案する。
実験により、安定拡散は、すべての保護方法において、精製された画像から効果的に学習できることが判明した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:44:42 GMT)
A Survey of Large Language Models for Graphs [21.5] 我々は、グラフ学習に適用された最新の最先端の大規模言語モデルについて、詳細なレビューを行う。
フレームワーク設計に基づいて既存の手法を分類する新しい分類法を提案する。
各フレームワークの長所と短所について検討し,今後の研究への可能性を強調する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:25:19 GMT)
MovieLLM: Enhancing Long Video Understanding with AI-Generated Movies [21.5] MovieLLMは、一貫した高品質なビデオデータを合成し、命令のチューニングをするための新しいフレームワークである。
実験により,MovieLLMが生成したデータにより,複雑な映像物語の理解において,マルチモーダルモデルの性能が著しく向上することが確認された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:55:28 GMT)
LLaMA-MoE: Building Mixture-of-Experts from LLaMA with Continual Pre-training [21.4] 大規模な環境でのMoEのスクラッチからのトレーニングは、依然としてデータ不足と不安定な問題に悩まされている。
この制限により、既存の高密度大言語モデルからMoEモデルを構築することを検討する。
我々のLLaMA-MoEモデルは、同様のアクティベーションパラメータを含む高密度モデルよりも著しく優れている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:43:07 GMT)
ConsistencyTTA: Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation [21.3] 拡散モデルは、世代毎の根底にあるデノナイジングネットワークへのクエリ数が過度に多いため、遅い推論に悩まされる。
本稿では,1つの非自己回帰型ネットワーククエリのみを必要とするフレームワークであるConsistencyTTAを紹介する。
そこで我々は「CFG対応潜時整合モデル」を提案し, 整合性生成を潜時空間に適応させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:51:55 GMT)
Continuous-time Autoencoders for Regular and Irregular Time Series Imputation [21.3] 時系列計算は、時系列の最も基本的なタスクの1つである。
最近の自己注意に基づく手法は、最先端の計算性能を示している。
連続時間リカレントニューラルネットワークに基づく計算法の設計は,長年にわたって見過ごされてきた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:53:23 GMT)
Towards Fast Multilingual LLM Inference: Speculative Decoding and Specialized Drafters [21.2] 大規模言語モデル(LLM)は自然言語処理に革命をもたらし、様々な商用アプリケーションに応用範囲を広げている。
本稿では,投機的復号化におけるアシスタントモデルのトレーニング手法について検討し,今後のトークンを目標LLMで検証する。
言語固有のドラフトモデルは,対象とする事前訓練とファイントゥン戦略によって最適化され,従来の手法に比べて推論時間の大幅に短縮されることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:06:50 GMT)
LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models [21.1] LlamaFactoryは、最先端の効率的なトレーニング方法を統合した統合フレームワークである。
組み込みのWeb UI LlamaBoardをコーディングすることなく、100以上のLLMの微調整を柔軟にカスタマイズできるソリューションを提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:20:04 GMT)
Enhancing Dropout-based Bayesian Neural Networks with Multi-Exit on FPGA [20.6] 本稿では,フィールドプログラマブルゲートアレイ(FPGA)ベースのアクセラレータを効率よく生成するアルゴリズムとハードウェアの共同設計フレームワークを提案する。
アルゴリズムレベルでは、計算とメモリのオーバーヘッドを低減した、新しいマルチエグジット・ドロップアウトベースのベイズNNを提案する。
ハードウェアレベルでは,提案する効率的なベイズNNのためのFPGAベースのアクセラレータを生成するための変換フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:25:04 GMT)
Make Large Language Model a Better Ranker [20.5] 本稿では,Aligned Listwise Ranking Objectives (ALRO)を用いた大規模言語モデルフレームワークを提案する。
ALROは、LLMの能力とランキングタスクの微妙な要求とのギャップを埋めるように設計されている。
評価研究により,ALROは既存の埋め込み型レコメンデーション法とLLMベースのレコメンデーションベースラインの両方より優れていることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:22:22 GMT)
GraphPipe: Improving Performance and Scalability of DNN Training with Graph Pipeline Parallelism [20.4] ディープニューラルネットワーク(DNN)のサイズは急速に拡大し続けており、単一のデバイスでトレーニングすることは不可能である。
本稿では,DNNをパイプラインステージに分割するパイプライン並列方式を提案する。
また,パフォーマンスと拡張性を備えたDNNトレーニングを実現するために,MME戦略を活用する分散システムであるGraphPipeを開発した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:32:51 GMT)
Bad Habits: Policy Confounding and Out-of-Trajectory Generalization in RL [20.4] 強化学習エージェントは、特定の政策の下でのみ有効となる習慣を発達させる傾向がある。
本稿では,この現象の数学的特徴について述べる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:06:44 GMT)
Prompt-Consistency Image Generation (PCIG): A Unified Framework Integrating LLMs, Knowledge Graphs, and Controllable Diffusion Models [20.2] 生成した画像と対応する記述とのアライメントを強化するための,拡散に基づく新しいフレームワークを提案する。
この枠組みは不整合現象の包括的解析に基づいて構築され,画像の表示に基づいて分類する。
次に、最先端の制御可能な画像生成モデルとビジュアルテキスト生成モジュールを統合し、元のプロンプトと整合した画像を生成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:12:16 GMT)
On-Device Soft Sensors: Real-Time Fluid Flow Estimation from Level Sensor Data [19.8] この研究は、クラウド上にソフトセンサーを配置する代わりに、デバイス上でのソフトセンサーの採用にシフトし、効率の向上とデータセキュリティの強化を約束する。
本手法は,無線センサネットワーク内のデバイスに直接人工知能(AI)を配置することにより,エネルギー効率を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:25:50 GMT)
Paraphrase and Aggregate with Large Language Models for Minimizing Intent Classification Errors [19.6] 大規模言語モデル(LLM)は,大規模な多クラス分類タスクにおいて高い性能を達成できるが,いまだに分類誤りを発生させ,さらに悪化させ,語彙外なクラスラベルを生成する。
本稿では、LLMが入力クエリ(並列クエリ)の複数のパラフレーズを生成するParaphrase and AGgregate (PAG)-LLMアプローチを提案する。
PAG-LLM は LLM が不確実なハードケースでは特に有効であり, 致命的誤分類と幻覚的ラベル生成誤差を低減させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:30:26 GMT)
DaLPSR: Leverage Degradation-Aligned Language Prompt for Real-World Image Super-Resolution [19.3] 本稿では, 精度, 精細度, 高忠実度画像復元のために, 劣化対応言語プロンプトを活用することを提案する。
提案手法は,特に実世界のケースにおいて,新しい最先端の知覚品質レベルを実現する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:30:36 GMT)
GIEBench: Towards Holistic Evaluation of Group Identity-based Empathy for Large Language Models [18.9] 大規模言語モデル(LLM)の共感評価のためのベンチマークであるGIEBenchを紹介する。
GIEBenchは11のアイデンティティディメンションを含み、97のグループアイデンティティをカバーする。
LLMを23個評価したところ、これらのLCMは異なるアイデンティティの観点から理解されているものの、これらの視点を採用するための明示的な指示なしでは、同一の共感を連続的に示さないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:57:18 GMT)
The Privileged Students: On the Value of Initialization in Multilingual Knowledge Distillation [18.9] 知識蒸留(KD)は、多くのNLPタスクにおいて、より小さなモデルの性能を向上させるための成功戦略であることが証明されている。
本稿では,多言語設定におけるKDの価値について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:59:26 GMT)
PIC2O-Sim: A Physics-Inspired Causality-Aware Dynamic Convolutional Neural Operator for Ultra-Fast Photonic Device FDTD Simulation [18.8] 我々は,光デバイスシミュレーションのための物理インスパイアされたAIベースの予測フレームワーク PIC2OSim を提案する。
PIC2O-Simは51.2%のロールアウト予測誤差を提供し、パラメータは最先端のニューラル演算子よりも23.5倍少ない。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:15:36 GMT)
Scaling Laws for Linear Complexity Language Models [18.8] 線形複雑性言語モデルのスケーリング法則を提示し、その拡張性の基礎を確立する。
この研究は、既存の線形複雑性言語モデルが従来のトランスフォーマーベースモデルと同様のスケーリング能力を示すことを示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:51:31 GMT)
Understanding is Compression [18.7] LMCompressは大規模モデルを用いたデータの理解に基づいている。
大きなモデルがデータを理解するほど、LMCompressは圧縮する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:58:11 GMT)
Machine Unlearning with Minimal Gradient Dependence for High Unlearning Ratios [18.7] ミニ・アンラーニング(Mini-Unlearning)は、批判的な観察を活かした新しいアプローチである。
この軽量でスケーラブルな方法は、モデルの精度を大幅に向上し、メンバシップ推論攻撃に対する耐性を高める。
実験の結果,Mini-Unlearningは非学習率が高いだけでなく,既存の手法よりも精度と安全性が優れていることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:43:30 GMT)
Nova: Generative Language Models for Assembly Code with Hierarchical Attention and Contrastive Learning [18.6] 大規模な言語モデル(LLM)はアセンブリコードに直接一般化しない。
本研究は,セマンティクスをより効果的に捉えるために,注目要約を構築する階層的注意機構を提案する。
また、LCMを訓練してアセンブリ最適化を学ぶために、対照的な学習目標を設計する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:18:59 GMT)
Mirror: A Multiple-perspective Self-Reflection Method for Knowledge-rich Reasoning [18.6] 大規模言語モデル(LLM)は、外部リソースにアクセスすることなく知識に富んだ問題に対処する。
知識豊富な推論のための多重パースペクティブ自己回帰法であるMirrorを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:05:24 GMT)
Latent Diffusion Model-Enabled Real-Time Semantic Communication Considering Semantic Ambiguities and Channel Noises [18.5] 本稿では, 遅延拡散モデル対応SemComシステムを構築し, 既存システムと比較して3つの改良点を提案する。
軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。
終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:41:23 GMT)
Cascade Reward Sampling for Efficient Decoding-Time Alignment [18.5] 我々は,高逆・高次テキストを生成するためのCARDSを提案する。
CARDSは、非常に低コストで高解像度かつ高解像度のテキストを生成することを保証している。
実験は、生成効率とアライメントレーティングの両方において、かなりの上昇を示します。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:08:35 GMT)
Algorithms for College Admissions Decision Support: Impacts of Policy Change and Inherent Variability [18.3] 先進的な応募者ランキングアルゴリズムからレースデータを除去することで、そのプールの学力を高めることなく、トップランクのプールの多様性を低減できることを示す。
個人に対する政策変更の影響を、政策変更に起因する応募者の仲裁と無作為性に起因する仲裁とを比較して測定する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:59:30 GMT)
Learning Action-based Representations Using Invariance [18.2] 我々は,制御に関係のある遠隔状態の特徴を割引する多段階制御可能性指標を学習するアクションビシミュレーション符号化を導入する。
我々は,報酬のない一様ランダムなデータに基づく行動ビシミュレーション事前学習が,複数の環境におけるサンプル効率を向上させることを実証した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:19:17 GMT)
CausalMMM: Learning Causal Structure for Marketing Mix Modeling [18.1] オンライン広告では、ブランドショップの総商品量(GMV)を予測するためにマーケティングミックスモデリング(MMM)が使用される。
従来のMMM手法は、マーケティングの複雑さを扱うのに失敗することがある。
本稿では,異なるチャネル間の因果関係を測定するために,Granger因果関係を変分推論フレームワークに統合するCausalMMMを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:33:47 GMT)
Robust Zero Trust Architecture: Joint Blockchain based Federated learning and Anomaly Detection based Framework [17.9] 本稿では,IoTネットワーク内の効率的なリモートワークとコラボレーションを支援する分散システムに適した,堅牢なゼロトラストアーキテクチャ(ZTA)を紹介する。
ブロックチェーンベースのフェデレーション学習原則を使用することで、当社のフレームワークは、漏洩したクライアントからの悪意のある更新を防止すべく、堅牢な集約メカニズムを備えている。
このフレームワークは異常検出と信頼計算を統合し、セキュアで信頼性の高いデバイスコラボレーションを分散的に保証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:15:19 GMT)
One-dimensional Fermi polaron after a kick: two-sided singularity of the momentum distribution, Bragg reflection and other exact results [17.9] 我々は、ポストキック緩和が終わったときに確立されたポーラロン運動量の分布を計算する。
最初のプロセスでは、全てのインパルスは、流体のフォノンのような励起を発生させることなく、ポーラロンに転送される。
後者の過程は、実際にはブリュアンゾーンの端にあるブラッグ反射である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:33:02 GMT)
PSAvatar: A Point-based Shape Model for Real-Time Head Avatar Animation with 3D Gaussian Splatting [17.8] PSAvatarは、アニマタブルヘッドアバター作成のための新しいフレームワークである。
詳細な表現と高忠実度レンダリングに3D Gaussian を使用している。
PSAvatarは多種多様な被験者の高忠実度頭部アバターを再構築でき、リアルタイムでアバターをアニメーションできることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:30:09 GMT)
WATT: Weight Average Test-Time Adaptation of CLIP [17.7] 完全テスト時間適応の先駆的アプローチであるCLIPのウェイト平均テスト時間適応(WATT)について述べる。
提案手法では,CLIPの既存のフレームワークを拡張し,テキストプロンプトに多種多様なテンプレートを用いる。
本研究は,WATTが多様なデータセットにまたがる性能向上に有効であることを示すものである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:31:00 GMT)
Lesion-Aware Cross-Phase Attention Network for Renal Tumor Subtype Classification on Multi-Phase CT Scans [17.7] 腎癌の術前診断にはCT(multi-phase Computed Tomography)が広く用いられている。
深層学習に基づくアプローチは、最近腎臓癌の鑑別診断のために研究されているが、ネットワーク設計におけるCTフェーズ間の関係を明示的にモデル化するものではない。
腎病変のCT位相間の時間的依存性を効果的に把握できる新しい病変認識型クロスフェーズアテンションネットワーク (LACPANet) を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:15:15 GMT)
Dynamic Pseudo Label Optimization in Point-Supervised Nuclei Segmentation [17.7] 我々は、textbfDynamic pseudo label textbfOptimization in point-supervised textbfNuclei textbfSegmentation を実現するDoNuSegというフレームワークを提案する。
DoNuSegは、クラスアクティベーションマップ(CAM)を利用して、アノテーション付きポイントに似た意味を持つ領域を適応的にキャプチャする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:20:53 GMT)
Cross-domain Transfer of Valence Preferences via a Meta-optimization Approach [17.5] CVPMはメタラーニングと自己教師型学習のハイブリッドアーキテクチャとして、ドメイン間の関心伝達を形式化する。
ユーザの好みに対する深い洞察を得て、差別化されたエンコーダを使って分布を学習する。
特に、各ユーザのマッピングを共通の変換とパーソナライズされたバイアスの2つの部分として扱い、そこでは、パーソナライズされたバイアスを生成するネットワークがメタラーナーによって出力される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:02:24 GMT)
Demystifying the Compression of Mixture-of-Experts Through a Unified Framework [17.4] 専門家の混合(MoE)アプローチは、専門家のサブセットのみを動的に選択し、活性化することによってこの問題に対処する。
MoEは潜在的な冗長性(パラメータなど)と余分なコスト(通信オーバーヘッドなど)を導入している。
まずこのギャップを,主流圧縮メソッドをシームレスに統合するだけでなく,MoE圧縮を体系的に理解する上でも有効である,最先端の統一フレームワークで埋める。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:51:23 GMT)
MIRReS: Multi-bounce Inverse Rendering using Reservoir Sampling [17.4] 本稿では,新しい2段階逆レンダリングフレームワークであるMIRReSを紹介する。
提案手法は, ステージ1で明示的な幾何(三角形メッシュ)を抽出し, より現実的な物理ベースの逆レンダリングモデルを導入する。
本手法は,自己陰影や内部反射を含む間接照明を効果的に推定する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:00:57 GMT)
Addressing Polarization and Unfairness in Performative Prediction [17.4] 性能予測解は, 重度の偏光効果とグループワイズ損失の相違を生じさせることを示した。
PP設定における安定性と公平性を両立できる新しい公正介入機構を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:03:57 GMT)
OpenDlign: Enhancing Open-World 3D Learning with Depth-Aligned Images [17.3] マルチモーダルアライメントのための奥行き整合画像を用いたオープンワールド3DモデルOpenDlignを提案する。
OpenDlignは、600万のパラメータを微調整するだけで、多様な3Dタスクで高いゼロショットと少数ショットのパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:21:17 GMT)
Robust Distribution Learning with Local and Global Adversarial Corruptions [17.2] 誤差を$sqrtvarepsilon k + rho + tildeO(dsqrtkn-1/(k lor2)$で有界な共分散を持つ場合、効率的な有限サンプルアルゴリズムを開発する。
我々の効率的な手順は、理想的だが難解な2-ワッサーシュタイン射影推定器の新たなトレースノルム近似に依存する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:53:33 GMT)
The GPT-WritingPrompts Dataset: A Comparative Analysis of Character Portrayal in Short Stories [17.2] 本研究では,人間と機械の両方の生成過程から,ストーリーテリングの感情的特徴と記述的特徴を6次元で定量化し比較する。
生成した物語は6次元すべてで人間ストーリーと大きく異なり、主主人公の物語的視点やジェンダーに応じてグループ化された場合、人間世代と機械世代は同様のバイアスを呈することがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:24:18 GMT)
Semantic Revolution from Communications to Orchestration for 6G: Challenges, Enablers, and Research Directions [16.8] 本稿では,KB-MANO(Knowledge Base Management and Orchestration)フレームワークを紹介する。
KB-MANOは、知識の更新と再配布に特化したネットワークおよびコンピューティングリソースの割り当てを目的としている。
KB-MANOと無線アクセスネットワークのリソース割り当ての統合を実証するために概念実証法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:04:09 GMT)
Probabilistic Subgoal Representations for Hierarchical Reinforcement learning [16.8] 目標条件付き階層的強化学習において、ハイレベルポリシーは、低レベルポリシーが到達するためのサブゴールを指定する。
既存の方法では、状態空間から潜在サブゴール空間への決定論的マッピングを提供するサブゴール表現を採用している。
本稿では,潜在サブゴアル空間に先行するGPを用いて,サブゴアル表現関数上の後部分布を学習する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:09:22 GMT)
When Invariant Representation Learning Meets Label Shift: Insufficiency and Theoretical Insights [16.7] 一般化ラベルシフト(GLS)は、シフト内の複雑な要因に対処する大きな可能性を示す最新の開発である。
主な結果は、不変表現学習が不十分であることを示し、一般化のためのGLS補正が不十分であること、および必要であることを証明した。
本稿では,カーネル埋め込みに基づく補正アルゴリズム(KECA)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:47:21 GMT)
Improved Regret Bounds for Bandits with Expert Advice [16.7] 我々は、最悪のケースの後悔に対して$sqrtK T ln(N/K)$の下位境界を証明し、そこでは$K$はアクションの数、$N>K$はエキスパートの数、$T$はタイムホライズである。
これは、前述した同じ順序の上界と一致し、$sqrtK T (ln N) / (ln K)$の最良の下界を改善する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:14:31 GMT)
CLEAR: Can Language Models Really Understand Causal Graphs? [16.7] 我々は言語モデルによる因果グラフの理解の先駆的な研究を行った。
言語モデルの振る舞いを評価することによって因果グラフ理解を定義する枠組みを開発する。
CLEARは3つの複雑性レベルを定義し,20の因果グラフに基づくタスクを包含する新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:46:15 GMT)
Model-Free Robust Reinforcement Learning with Sample Complexity Analysis [16.5] 本稿では,マルチレベルモンテカルロ法を用いたモデルフリーDR-RLアルゴリズムを提案する。
我々は,全変動,チ二乗発散,KL発散によって定義される不確実性集合のアルゴリズムを開発する。
注目すべきは、我々のアルゴリズムは、有限サンプルの複雑さを特徴とする初めてのモデルフリーDR-RLアプローチである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:35:26 GMT)
Fine-Grained Detection of Solidarity for Women and Migrants in 155 Years of German Parliamentary Debates [16.4] 我々は1867年から2022年にかけてのドイツ議会の議論において、女性や移民に対する連帯性について研究した。
2,864個の注釈付きテキストスニペットを用いて,Llama 3, GPT-3.5, GPT-4などの大規模言語モデル(LLM)を評価する。
GPT-4を使用して、155年間で18k以上のインスタンス(約500ユーロ)を自動的に注釈付けします。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:01:19 GMT)
Building on Efficient Foundations: Effectively Training LLMs with Structured Feedforward Layers [16.3] 大規模言語モデル(LLM)における最先端の結果は、しばしばスケールに依存し、計算コストがかかる。
このことが、これらのモデルのパラメータ数と計算コストを、性能に大きな影響を及ぼすことなく削減する研究の議題となった。
我々は,効率的な低ランク行列とブロック対角行列を組み合わせることで,FFNの線形層近似を3つの候補として検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:43:21 GMT)
EvalAlign: Evaluating Text-to-Image Models through Precision Alignment of Multimodal Large Models with Supervised Fine-Tuning to Human Annotations [16.2] EvalAlignは、その正確さ、安定性、微細な粒度を特徴とする計量である。
画像の忠実度とテキスト画像のアライメントという2つの重要な側面に焦点を当てた評価プロトコルを開発する。
24のテキスト・ツー・イメージ生成モデルに対する包括的なテストでは、EvalAlignは優れたメートル法安定性を提供するだけでなく、既存のメトリクスよりも人間の好みと密接に一致していることが示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:56:15 GMT)
Learning to utilize image second-order derivative information for crisp edge detection [16.2] エッジ検出はコンピュータビジョンの基本課題である。
最近のトップパフォーマンスエッジ検出手法は、厚くノイズの多いエッジラインを生成する傾向にある。
本稿では,2階微分に基づくマルチスケールコンテキスト拡張モジュールを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:07:14 GMT)
Towards Zero-Shot Text-To-Speech for Arabic Dialects [16.1] ZS-TTS (Zero-shot Multi-Speaker text-to-speech) システムは英語に進歩しているが、リソース不足のためまだ遅れている。
まず、既存のデータセットを音声合成のニーズに合わせて適応させることにより、アラビア語のこのギャップに対処する。
アラビア語の方言識別モデルを用いて、予め定義された方言ラベルが多言語環境でのZS-TTSモデルの改善に与える影響を探索する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:58:15 GMT)
What Do VLMs NOTICE? A Mechanistic Interpretability Pipeline for Noise-free Text-Image Corruption and Evaluation [16.0] 視覚言語モデル(VLM)における可読性評価パイプライン
SVO-Probes、MIT-States、Facial Expression Recognitionデータセットに関する実験により、VLM意思決定における重要な洞察が明らかになった。
この研究は、より透明で解釈可能なマルチモーダルシステムへの道を開いた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:13:19 GMT)
Repairing Catastrophic-Neglect in Text-to-Image Diffusion Models via Attention-Guided Feature Enhancement [16.0] テキスト・ツー・イメージ拡散モデル(T2I DM)は入力プロンプトと完全に一致しない画像を生成し、意味的な矛盾をもたらす。
本稿では,T2I DMにおける破滅現象に対処するため,Pacher という自動修復手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:38:30 GMT)
Hyperbolic Random Forests [16.0] 我々は、よく知られたランダムな森林を双曲空間に一般化する。
ホロスフィアを用いて分割の概念を再定義することでこれを実現できる。
また、最小の共通祖先に基づくクラスと、大マルジン損失のクラスバランスバージョンを結合する新しい手法についても概説する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:57:01 GMT)
USDC: A Dataset of $\underline{U}$ser $\underline{S}$tance and $\underline{D}$ogmatism in Long $\underline{C}$onversations [15.9] 我々はMistral LargeとGPT-4を使って2つのタスクにおける人間のアノテーションプロセスを自動化する。
764人のマルチユーザRedditの会話で、ゼロショット、ワンショット、および少数ショットのアノテーションに投票する多数派は、USDCデータセットをキュレートするのに役立ちます。
その後、USDCは5クラスのスタンスと4クラスのドクトマティズム分類タスクのために、複数のデプロイ可能な小さな言語モデルを微調整およびインストラクションチューニングするために使用される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:41:53 GMT)
Towards Comprehensive Preference Data Collection for Reward Modeling [15.5] Reinforcement Learning from Human Feedback (RLHF) は、大きな言語モデルと人間の好みの調整を容易にする。
そこで本研究では,プロセスを4段階に分解し,好みデータ収集のためのフレームワークを提案する。
この構造的アプローチは、人間の労働への依存を減らしながら、高品質な嗜好の収集を保証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:40:39 GMT)
Priorformer: A UGC-VQA Method with content and distortion priors [15.5] 本稿では,ブラインドビデオ品質評価(BVQA)モデルのための前処理型視覚変換器を提案する。
事前学習した2つの特徴抽出器からコンテンツと歪みの埋め込みを抽出することにより、コンテンツと歪みの先行を2つ導入する。
我々は、KoNViD-1K, LIVE-VQC, YouTube-UGCを含む3つの公開VQAデータセットに対して、最先端のパフォーマンスを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:49:52 GMT)
Chain-of-Instructions: Compositional Instruction Tuning on Large Language Models [15.4] チェーン・オブ・インストラクション(CoI)と呼ばれる新しい構成命令の概念を提案する。
従来の単一命令タスクの解法とは異なり,提案手法では各サブタスクを段階的に解き,最終的な解答に到達するまで解き明かす。
CoIチューニングは、複数のサブタスクからなる命令と、多言語要約のような目に見えない複合タスクを扱うモデルの能力を改善する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:43:57 GMT)
Continual Road-Scene Semantic Segmentation via Feature-Aligned Symmetric Multi-Modal Network [15.2] 我々は、密結合した特徴表現と対称情報共有スキームを強制することにより、マルチモーダルなセマンティックセマンティックセマンティクスのタスクを再構築する。
また,安全クリティカルな環境においても,提案手法の有効性と信頼性を実証する,アドホックなクラス増分連続学習手法も導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:01:20 GMT)
Static Application Security Testing (SAST) Tools for Smart Contracts: How Far Are We? [15.0] 近年,スマートコントラクトセキュリティの重要性が高まっている。
この問題に対処するため、スマートコントラクトの脆弱性を検出するために、多数の静的アプリケーションセキュリティテスト(SAST)ツールが提案されている。
本稿では,スマートコントラクトに対する45種類の脆弱性を含む,最新のきめ細かな分類法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:19:51 GMT)
Can Many-Shot In-Context Learning Help Long-Context LLM Judges? See More, Judge Better! [14.9] 我々は,GPT-4o-as-a-Judgeを単一回答グレーディングで支援するために,マルチショットインコンテキストプロンプトであるReinforcedとUnsupervised ICLの2つのバージョンを提案し,検討した。
設計したプロンプトに基づいて,テキスト内サンプルのスケールアップが評価の一致と品質に与える影響について検討する。
GPT-4oのような長文LLMは、ゼロショット方式よりも多ショット方式の方が優れていることを示す実験結果が得られた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:02:21 GMT)
Sim2Real Bilevel Adaptation for Object Surface Classification using Vision-Based Tactile Sensors [14.8] 我々は、物体表面を分類するための視覚ベースの触覚センサの分野におけるSim2Realギャップを橋渡しするために拡散モデルを訓練する。
我々は,YCBモデルセットから物体表面を均一にサンプリングして画像を生成するシミュレータを用いた。
これらのシミュレートされたイメージは、拡散モデルを使用して実際のドメインに変換され、自動的に分類器を訓練するためにラベル付けされる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:39:13 GMT)
EHRCon: Dataset for Checking Consistency between Unstructured Notes and Structured Tables in Electronic Health Records [14.7] EHRは、構造化されたデータ(例えば、医薬品)と詳細な臨床ノート(例えば、医師注記)を組み合わせることで、包括的な患者の医療記録を保存するのに不可欠なものである。
これらの要素は、簡単なデータ検索に不可欠であり、患者のケアに対する深い文脈的な洞察を提供する。
しかし、直感的なEHRシステム設計とヒューマンエラーにより、しばしば不一致に悩まされる。
EHRにおける構造化テーブルと非構造化ノート間のデータの一貫性を確保するために設計された新しいデータセットとタスクであるEHRConを開発した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:26:50 GMT)
Smurfs: Leveraging Multiple Proficiency Agents with Context-Efficiency for Tool Planning [14.6] Smurfs'は、大規模言語モデルの応用に革命をもたらすために設計された最先端のマルチエージェントフレームワークである。
Smurfは、余分なコストなしで複雑なタスクを解くモデルの能力を高めることができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:44:57 GMT)
Node-like as a Whole: Structure-aware Searching and Coarsening for Graph Classification [14.6] グラフトランスフォーマー(GT)は、グラフレベルのタスクにおいて顕著な成果を上げている。
グラフ構造全体をノード的に扱うことで、ハイレベルな機能を学ぶことができますか?
本稿では,構造認識探索と粗化による多視点グラフ表現学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:45:52 GMT)
OmAgent: A Multi-modal Agent Framework for Complex Video Understanding with Task Divide-and-Conquer [14.5] 広範なビデオの処理は、膨大なデータと処理要求のために大きな課題をもたらします。
我々はOmAgentを開発し、特定のクエリの関連ビデオフレームを効率的に保存し、検索する。
自律推論が可能なDivide-and-Conquer Loopを備えている。
より高度な自律性と堅牢なツールコールシステムを備えており、さらに複雑なタスクを達成できます。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:05:39 GMT)
Inception: Efficiently Computable Misinformation Attacks on Markov Games [14.5] 情報非対称性と誤情報によるマルコフゲームに対するセキュリティ脅威について検討する。
我々は、攻撃者の最適な最悪のケースポリシーを計算するために、最悪のケース合理性と現在のアルゴリズムの下で被害者のポリシーを導出する。
我々の研究は、誤った情報の下での標準的なゲームの仮定からセキュリティの脆弱性を露呈する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:01:43 GMT)
Pruning via Merging: Compressing LLMs via Manifold Alignment Based Layer Merging [14.1] 我々は,MKA(Manifold-based Knowledge Alignment and Layer Merging Compression)を提案する。
MKAは、多様体学習と正規化ペアワイズ・インフォメーション・ボトルネック測定を使用して、類似したレイヤをマージし、本質的な性能を維持しながらモデルサイズを削減している。
以上の結果から,MKAはモデル性能を保ちつつ,圧縮率も大幅に向上し,従来のプルーニング法よりも優れていた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:57:55 GMT)
P-Mamba: Marrying Perona Malik Diffusion with Mamba for Efficient Pediatric Echocardiographic Left Ventricular Segmentation [14.1] P-Mambaを導入し,Mixture of Experts(MoE)の概念を統合し,小児心エコー左室セグメンテーションの効率化を図る。
具体的には、視覚マンバから最近提案したViM層を利用して、モデルの計算およびメモリ効率を向上する。
提案するP-Mambaは,PMDのノイズ抑圧と局所特徴抽出機能と,グローバル依存性モデリングのためのMambaの効率的な設計を革新的に組み合わせている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:24:14 GMT)
Asymmetrical Siamese Network for Point Clouds Normal Estimation [13.8] 本稿では、非対称なシームズネットワークアーキテクチャを用いて、クリーンでノイズの多い点群から学習した本質的な特徴の一貫性について検討する。
異なる枝から抽出された特徴間の合理的な制約を適用することにより、正規推定の品質を高める。
ノイズレベルの異なる様々な形状を含む新しい多視点正規推定データセットを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:11:27 GMT)
Quantum Channel Simulation in Fidelity is no more difficult than State Splitting [13.7] 量子チャネルシミュレーションは、デフィネッティ還元(deFinetti reduction)と呼ばれる手法を用いることなく、量子状態分割(quantum state splitting)により直接実現できることを示す。
境界を用いて、量子逆シャノン定理をはるかに単純な方法で復元する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:27:30 GMT)
Efficient k-means with Individual Fairness via Exponential Tilting [13.7] 位置に基づくリソース割り当てのシナリオでは、全てのポイントを平等に扱うという原則を達成するために、個別に公平なクラスタリングがしばしば用いられる。
本稿では,クラスタリングにおける個別の公平性を実現することを目的とした,新しいアルゴリズムである傾きk平均(TKM)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:50:31 GMT)
ClaimVer: Explainable Claim-Level Verification and Evidence Attribution of Text Through Knowledge Graphs [13.6] ClaimVerは、ユーザの情報と検証のニーズを満たすように設計された、人間中心のフレームワークである。
各クレームをハイライトし、信頼された知識グラフに対して検証し、クレームの予測に対して簡潔で明確な説明を提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:08:24 GMT)
ClotheDreamer: Text-Guided Garment Generation with 3D Gaussians [13.2] ClotheDreamerは、テキストプロンプトから、ウェアラブルで生産可能な3D衣服の資産を生成する方法だ。
本稿では,Distangled Clothe Gaussian Splatting (DCGS)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:25:39 GMT)
Exploring Test-Time Adaptation for Object Detection in Continually Changing Environments [13.2] 連続的テスト時間適応(CTTA)は、継続的に変化するターゲットドメインから引き出されたデータに対して、徐々にソース学習されたモデルを適応させる、有望な手法として登場した。
我々はCTTAシナリオにおける検出モデルの性能向上を目的としたCTAODを提案する。
CTAODが既存手法よりも優れている対象検出のための4つのCTTAタスクに対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:30:03 GMT)
MambaTab: A Plug-and-Play Model for Learning Tabular Data [13.1] 本研究は,表データに対する構造化状態空間モデル(SSM)であるMambaTabに基づく革新的なアプローチを導入する。
MambaTabは、さまざまなベンチマークデータセットで実証的に検証されるように、パラメータを著しく少なくしながら、優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:58:06 GMT)
AND: Audio Network Dissection for Interpreting Deep Acoustic [13.0] $textitAND$は、高応答性オーディオに基づいて、音響ニューロンの自然言語説明を自動的に確立するフレームワークである。
さらに、オーディオマシンのアンラーニングに$textitAND$を使用する可能性を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:02:07 GMT)
Feature learning as alignment: a structural property of gradient descent in non-linear neural networks [13.0] ニューラルネットワークは特徴学習を通じて入力ラベル対から統計を抽出することを示す。
このアライメントは,SGDによって誘導される重量変化と,前活性化機能との相互作用によって引き起こされることが確認された。
我々は、任意の層におけるNFA相関を劇的に向上させ、学習した特徴の質を向上させるための単純な最適化ルールを導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:55:34 GMT)
Fine-tuning Diffusion Models for Enhancing Face Quality in Text-to-image Generation [12.9] テキストから画像生成における低品質で非現実的な人間の顔は、最も顕著な問題の一つである。
我々は、(良い、悪い)顔ペアのデータセットに基づいて、ImageRewardを微調整して、Face Score(FS)と呼ばれる新しいメトリクスを開発する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:39:59 GMT)
TRUCE: Private Benchmarking to Prevent Contamination and Improve Comparative Evaluation of LLMs [12.8] ベンチマークは LLM を評価するためのデファクト標準であり、その速度、複製性、低コストのためである。
最近の研究によると、今日入手可能なオープンソースベンチマークの大部分は、LLMに汚染されたり、リークされたりしている。
テストデータセットをプライベートに保持し、モデルにテストデータを公開せずにモデルを評価するソリューションであるPrivate Benchmarkingを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:28:18 GMT)
Low-Resource Multi-Granularity Academic Function Recognition Based on Multiple Prompt Knowledge [12.8] 微調整事前学習言語モデル(PLM)、例えばSciBERTは、最先端のパフォーマンスを達成するために大量の注釈付きデータを必要とする。
注釈付きデータへの依存を緩和する半教師付き手法であるMix Prompt Tuning (MPT)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:00:43 GMT)
Flow of Reasoning: Efficient Training of LLM Policy with Divergent Thinking [12.5] 大きな言語モデル(LLM)は、しばしば高品質で多様な推論を生成するのに苦労する。
本稿では,FoR(Flow of Reasoning,フロー・オブ・推論)を提案する。
FoR は初期状態から終状態へのマルコフフローとして多段階 LLM 推論を定式化する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:49:09 GMT)
VulDetectBench: Evaluating the Deep Capability of Vulnerability Detection with Large Language Models [12.5] 本研究では,Large Language Models(LLM)の脆弱性検出機能を評価するために,新しいベンチマークであるVulDetectBenchを紹介する。
このベンチマークは、LLMの脆弱性を特定し、分類し、発見する能力を、難易度を高める5つのタスクを通じて総合的に評価している。
本ベンチマークでは,脆弱性検出の特定のタスクにおいて,様々なLLMの能力評価を効果的に行うとともに,コードセキュリティの重要領域における今後の研究と改善の基盤となる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:02:57 GMT)
Inducing Group Fairness in LLM-Based Decisions [12.4] Prompting Large Language Models (LLMs) におけるグループフェアネスは、よく研究されている問題である。
我々は、プロンプトベースの分類器が不公平な判断につながる可能性があることを示す。
いくつかの修復手法を導入し、公平さとパフォーマンスのトレードオフをベンチマークします。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:45:20 GMT)
Visualization Literacy of Multimodal Large Language Models: A Comparative Study [12.4] MLLM(Multimodal large language model)は、MLLM(Multimodal large language model)とLLM(LLM)の固有の能力を組み合わせて、マルチモーダルコンテキストを推論する。
ビジュアライゼーションにおける最近の多くの研究は、可視化結果を理解し、解釈し、自然言語のユーザに対して視覚化の内容を説明するMLLMの能力を実証している。
本研究では,可視化リテラシーの概念を利用してMLLMを評価することにより,そのギャップを埋めることを目的とする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:52:16 GMT)
MRISegmentator-Abdomen: A Fully Automated Multi-Organ and Structure Segmentation Tool for T1-weighted Abdominal MRI [12.2] 複数の臓器や構造のボクセルレベルのアノテーションを備えた腹部MRIデータセットは公開されていない。
MRISegmentator-Abdomen(略してMRISegmentator)と呼ばれる3D nnUNetモデルをこのデータセットでトレーニングした。
このツールは、T1強調腹部MRIの62の臓器と構造の、自動的、正確で、堅牢なセグメンテーションを提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:05:06 GMT)
VulZoo: A Comprehensive Vulnerability Intelligence Dataset [12.2] VulZooは17の人気の脆弱性情報ソースをカバーする、包括的な脆弱性インテリジェンスデータセットである。
VulZooを一般公開し、今後の研究を容易にするためにインクリメンタルアップデートでメンテナンスしています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:39:07 GMT)
Testing the Limits of Jailbreaking Defenses with the Purple Problem [12.1] 言語モデルに対する「ジェイルブレイク」攻撃の台頭は、望ましくない反応を防ぐための防衛策の急増につながった。
i) 安全でない出力を構成するものを定義することと, (ii) 入力処理や微調整などの手法による定義を強制することである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:01:06 GMT)
FT-AED: Benchmark Dataset for Early Freeway Traffic Anomalous Event Detection [12.0] 異常検出のための大規模レーンレベル高速道路交通データセットを初めて導入する。
当社のデータセットは、ナッシュビルに向かう州間高速道路24号線の18マイル延長に沿って、4車線で収集された1ヶ月のレーダー検出センサーデータで構成されています。
本研究では,事故の75%を検知しながら,報告遅延を平均10分以上低減できることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:24:15 GMT)
EEGEncoder: Advancing BCI with Transformer-Based Motor Imagery Classification [11.7] 脳-コンピュータインタフェース(BCI)は、脳波信号を用いてデバイスを直接神経制御する。
脳波に基づく運動画像(MI)分類のための従来の機械学習手法は、手動の特徴抽出やノイズに対する感受性といった課題に遭遇する。
本稿では,これらの制限を克服するために改良型トランスフォーマーとTCNを用いたディープラーニングフレームワークであるEEGEncoderを紹介する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:02:17 GMT)
AdaTreeFormer: Few Shot Domain Adaptation for Tree Counting from a Single High-Resolution Image [11.6] 十分なラベル付き木を用いてソースドメインから学習し,限られたラベル付き木数で対象ドメインに適応するフレームワークを提案する。
実験の結果、AdaTreeFormerは最先端の技術をはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:07:52 GMT)
Safe Task Planning for Language-Instructed Multi-Robot Systems using Conformal Prediction [11.6] 本稿では,S-ATLAS for Safe plAnning for Teams of Language-instructed Agentsを提案する。
提案したプランナは,ヘルプリクエストの総数を最小限に抑えながら,ユーザ特定タスクの成功率を達成することができることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:27:35 GMT)
A Deep Learning Framework for Three Dimensional Shape Reconstruction from Phaseless Acoustic Scattering Far-field Data [11.6] 我々は単一入射波、単一周波数、位相なし遠距離データによる限られた情報を用いた形状復元のためのディープラーニングフレームワークを開発する。
これは、(a)3次元変分オートエンコーダによって学習されたコンパクトな確率的形状潜在空間と、(b)音響散乱情報をこの形状表現にマッピングするように訓練された畳み込みニューラルネットワークを用いて行われる。
提案するフレームワークは、一般的な3D形状認識データセットであるShapeNetと同様に、合成3Dデータセットで評価される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:58:49 GMT)
Structured Packing in LLM Training Improves Long Context Utilization [11.5] 本研究では,意味的相互依存を高めるための学習データの構造化について検討する。
本研究では,SPLiCe(Structured Packing for Long Context)法を提案する。
我々はSPLiCeを様々なサイズのモデルで実証的に検証した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:10:18 GMT)
A Non-autoregressive Multi-Horizon Flight Trajectory Prediction Framework with Gray Code Representation [11.3] FlightBERT++と呼ばれる新しいフレームワークが提案されている。
提案するフレームワークは,汎用エンコーダデコーダアーキテクチャによって実装されている。
実験の結果,提案フレームワークはFTP性能と計算効率の両面において,競合する基本性能を上回る性能を示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:34:19 GMT)
Crowd-Sourced NeRF: Collecting Data from Production Vehicles for 3D Street View Reconstruction [11.3] 実車から取得した大量のデータを利用して,NeRFモデルを用いてシーンを再構築するクラウドソースフレームワークを提案する。
我々は,データ選択,スパース3次元再構成,シーケンス外観の埋め込み,地表面深度監視,閉塞完了を統合した包括的フレームワークを提案する。
我々は、NeRFモデルを利用して3Dストリートビューを生成し、合成ビデオでドライバーを誘導する、ファーストビューナビゲーションというアプリケーションを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:30:20 GMT)
Wavelet Attention GRU for Efficient Industrial Gas Recognition with Novel Metrics [11.2] 我々はウェーブレットアテンション機構に基づくウェーブレットアテンションGRU(WAG)と呼ばれる新しいモデルを提案する。
WAGは、認証精度98.33%を取得しながら、75%に必要なセンサーの数を著しく減少させる。
これは、WAGがガス認識アルゴリズムの進歩の潜在的アプローチであることを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:05:01 GMT)
BrainMAE: A Region-aware Self-supervised Learning Framework for Brain Signals [11.0] 本稿では,fMRI時系列データから直接表現を学習するBrain Masked Auto-Encoder(BrainMAE)を提案する。
BrainMAEは、4つの異なる下流タスクにおいて、確立されたベースラインメソッドをかなりのマージンで一貫して上回っている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:16:24 GMT)
Can Differentiable Decision Trees Enable Interpretable Reward Learning from Human Feedback? [11.0] 微分決定木(DDT)を用いた嗜好から表現的・解釈可能な報酬関数を学習するための新しいアプローチを提案し,評価する。
CartPole、Visual Gridworld環境、Atariゲームなど、いくつかの領域にわたる実験により、学習した報酬関数のツリー構造が人間の嗜好に合致する範囲を決定するのに有用であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:43:30 GMT)
Acknowledging Good Java Code with Code Perfumes [10.9] 本稿では,リンティングに類似した単純なプログラム解析手法であるJavaのコードパーフュームを紹介する。
初心者から即時学習者への共通Java言語構造に関連する20のJavaコード香水カタログを提示する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:43:32 GMT)
Adaptively Perturbed Mirror Descent for Learning in Games [10.9] 本稿では,ペイオフ関数の勾配が単調なゲームにおいて,ミラーDescent(MD)アルゴリズムに対するペイオフ摂動手法を提案する。
その結果,アルゴリズムの収束が著しく加速していることが判明した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:06:29 GMT)
Bell nonlocality and entanglement in $e^{+}e^{-} \rightarrow Y\bar{Y}$ at BESIII [10.9] 電子-陽電子消滅で生成するハイパーオン-反ハイペロン系の非局所性と絡み合いを高精度なデータで調べる。
ハイパロンとその反ハイパロンの非消滅分極では、ハイパロン-反ハイパロン系の非局所性の運動領域は$tau+tau-$系よりも制限されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:51:52 GMT)
Large Language Models Assume People are More Rational than We Really are [10.9] AIが人と効果的にコミュニケーションするためには、意思決定の仕方を理解する必要があります。
以前の実証的な証拠は、これらの暗黙のモデルが正確であることを示唆しているようである。
人々の選択をシミュレートし、予測する場合は、実際にはそうではありません。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:15:27 GMT)
Automated Adversarial Discovery for Safety Classifiers [10.6] 安全分類器の自動対向探索のタスクを形式化する。
The CivilComments toxicity taskにおける既存の攻撃生成手法の評価は,その限界を明らかにしている。
我々の最も優れたプロンプトベースの手法でさえ、目に見えない攻撃の被害次元に対する新たな攻撃が、その5%しか成功していない。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:45:12 GMT)
CoLoR-Filter: Conditional Loss Reduction Filtering for Targeted Language Model Pre-training [10.5] 本稿では,ベイズに触発された経験的アプローチを利用して,単純で効率的な選択基準を導出するデータ選択手法であるCoLoR-Filterを提案する。
CoLoR-Filterは1.2bパラメータターゲットモデルをトレーニングして、ランダムに選択された25bトークン上でトレーニングされた1.2bパラメータモデルにマッチさせることができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:52:37 GMT)
ADVSCORE: A Metric for the Evaluation and Creation of Adversarial Benchmarks [10.4] 逆ベンチマークは、人間ではなく、愚かなモデルを提供するサンプルを提供することで、モデルの能力を検証する。
本稿では,敵対的データセットの識別と識別を定量化する指標であるADVSCOREを紹介する。
私たちはADVSCOREを使用して、高品質な逆境データセットを書くインセンティブを与えるデータセット生成パイプラインを基盤としています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:27:47 GMT)
Evaluation of Language Models in the Medical Context Under Resource-Constrained Settings [10.4] 医療領域における言語モデルに関する包括的調査を行う。
私たちのサブセットは53モデルで、1億1000万から13億のパラメータに対応しています。
この結果から,様々なタスクやデータセットにまたがる顕著なパフォーマンスが明らかになった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:52:02 GMT)
Compensate Quantization Errors: Make Weights Hierarchical to Compensate Each Other [10.3] 本稿では,量子化問題に対する高度な解法として,Learnerable Singular Value Increment(LSI)を導入する。
LSIはSingular Value Decompositionを用いて重みの特異な値を抽出し、重みがアクティベーション時に互いに補償するのに役立つように学習する。
重みのみ、重み付け、超低ビットシナリオによらず、様々な量子化設定で最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:52:52 GMT)
Annotation alignment: Comparing LLM and human annotations of conversational safety [10.1] GPT-4は平均アノテータ評価値と平均アノテータの相関値との平均アノテータの相関値との平均アノテータの相関値よりも高い$r = 0.59$のピアソン相関値が得られることを示す。
相関群と*群との間には相当な慣用的変動があり、人種と性別がアライメントの差を完全に捉えていないことを示唆している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:23:22 GMT)
Aligner: Efficient Alignment by Learning to Correct [10.1] モデルに依存しないプラグアンドプレイモジュールであるAlignerを導入し、好ましくない回答と好ましくない回答の補正残差を学習する。
トレーニングはワンオフで、さまざまなオープンソースおよびAPIベースのモデルに適用できるため、迅速なイテレーションに適している。
実験では、11の異なる言語モデルに同じAlignerモデルをデプロイすることで、パフォーマンスの向上を実証した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:55:16 GMT)
The MRI Scanner as a Diagnostic: Image-less Active Sampling [10.0] そこで我々は, 患者レベルにおいて, k空間のアンサンプから疾患を直接推測するために, 強化学習を通じて, 能動的サンプリング戦略を学習するMLベースのフレームワークを提案する。
我々は,Meniscus Tearをアンダーサンプル膝MRIで評価し,MLによる診断に匹敵する診断性能が得られた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:00:20 GMT)
Achieving Fairness Across Local and Global Models in Federated Learning [9.9] 本研究は,フェデレート学習環境における局所的およびグローバル的公正性を高めるために設計された,新しいアプローチであるtextttEquiFLを紹介する。
textttEquiFLは、フェアネスという用語を局所最適化の目的に取り入れ、局所的なパフォーマンスとフェアネスを効果的にバランスさせる。
textttEquiFLは、各クライアントにおいて、精度と公平性のバランスが良くなるだけでなく、グローバル公正性も達成できることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:42:16 GMT)
What Do Privacy Advertisements Communicate to Consumers? [9.8] 本稿では,プライバシマーケティングが消費者のキャンペーン提供組織に対する態度に与える影響について検討する。
以上の結果から,プライバシ機能に対する意識は,企業や製品に対する肯定的な認識に寄与する可能性が示唆された。
われわれの結果は、プライバシーキャンペーンはプライバシー機能に対する意識を高め、ブランドイメージを改善するのに役立つが、視聴者にプライバシー機能の使用方法を教える最も効果的な方法ではないことを示唆している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:04:31 GMT)
Segment Any Text: A Universal Approach for Robust, Efficient and Adaptable Sentence Segmentation [9.7] この問題を解決するために、新しいモデル、Segment any Text (SaT)を導入します。
頑健性を高めるため,句読点への依存度を低くする事前学習方式を提案する。
適応性に対処するために、パラメータ効率の良い微調整の余分な段階を導入し、異なる領域で最先端の性能を確立する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:36:11 GMT)
European Network For Gender Balance in Informatics (EUGAIN): Activities and Results [9.7] 本章では、情報学におけるジェンダーバランスのための欧州ネットワーク(EUGAIN, EU COST Action CA19122)の活動と成果について概説する。
ネットワークの主な目的と目的は、学部・大学院研究から学業・産業界の両方での参加・リーダーシップまで、あらゆるレベルの情報学者のジェンダーバランスを改善することである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:19:50 GMT)
Learning-Based Heavy Hitters and Flow Frequency Estimation in Streams [9.2] そこで本研究では,まず,大ヒット数,トップk,フロー周波数推定を識別する,LSSと呼ばれる競合カウンタベースのアルゴリズムを提案する。
以上の結果から, LSSは重打点, トップk, 流速推定において, スペースセービングの精度と効率を高めることができることが示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:31:00 GMT)
Intrinsic LoRA: A Generalist Approach for Discovering Knowledge in Generative Models [9.2] 生成モデルは、実際のシーンを忠実に模倣するイメージの作成に優れており、本質的にシーン表現をエンコードしていることを示唆している。
Intrinsic LoRAは、LoRA(Lo-Rank Adaptation)を用いて、様々な生成モデルから、正常、深さ、アルベド、シェーディングなどのシーン固有性を発見する一般的なアプローチである。
我々のアプローチは拡散モデル、GAN、自動回帰モデルにも適用でき、原画像と同じ出力ヘッドを用いて内在性を生成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:42:55 GMT)
Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimization [9.0] Federated Learning (FL)は、コラボレーションとプライバシ保護の機械学習のための有望なフレームワークを提供する。
FLとのかなりの通信コストは、その効率に重大な課題をもたらす。
本稿では,ゼロオーダー最適化技術を活用したFLのための新しい自由通信方式を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:52:25 GMT)
State Representation Learning Using an Unbalanced Atlas [8.9] 本稿では,非平衡アトラス(UA)を用いた,最先端の自己教師型学習手法を超越した新しい学習パラダイムを提案する。
DIM-UAの有効性は、Atari Annotated RAM Interfaceベンチマークのトレーニングと評価を通じて実証される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:19:44 GMT)
Improving the Diversity of Bootstrapped DQN by Replacing Priors With Noise [8.9] 本稿は,従来のノイズに置き換える可能性を探るとともに,ガウス分布からノイズをサンプリングして,このアルゴリズムにさらなる多様性を導入する可能性について考察する。
我々は,Bootstrapped Deep Q-Learningアルゴリズムの修正により,異なる種類のAtariゲームに対する評価スコアが大幅に向上することを発見した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:09:35 GMT)
Deep Reinforcement Learning with Swin Transformers [8.9] 本稿では,Swin Transformers: Swin DQNに基づくオンライン強化学習スキームについて紹介する。
既存の研究とは対照的に,アーケード学習環境における49のゲーム実験において,本手法は優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:54:37 GMT)
Carrot and Stick: Inducing Self-Motivation with Positive & Negative Feedback [8.9] 目標を達成するための自己モチベーションは、まだ計算の観点から研究されていない。
CArrot と STICk のデータセットを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:55:31 GMT)
Tolerance of Reinforcement Learning Controllers against Deviations in Cyber Physical Systems [8.9] 我々は,コントローラが望まれるシステム要件を満たすことができるかを記述する,新しい表現力のある寛容の概念を導入する。
本稿では, 与えられた要件に違反する小さな偏差の発見を伴って, トレランス・ファルシフィケーション問題と呼ばれる新たな解析問題を提案する。
本稿では,2層シミュレーションに基づく新しい解析フレームワークと,小さな耐障害性違反を見つけるための新しい探索手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:33:45 GMT)
Realizing a spatially correlated lattice interferometer [8.8] 原子干渉計は、物理定数を測定し、前例のない精度で基礎物理学を検証するための強力なツールを提供する。
本稿では,光格子を重力方向に移動させたコヒーレント物質波のラムゼー・ボード干渉計の実現について報告する。
この結果は理論シミュレーションとよく一致し、超低温原子を用いた高精度干渉計の道を開いた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:54:03 GMT)
SegNet4D: Effective and Efficient 4D LiDAR Semantic Segmentation in Autonomous Driving Environments [8.8] 4Dセマンティックセグメンテーションの既存の方法は、しばしばマルチスキャン入力のための計算集約的な4D畳み込みに依存している。
高速な動作特徴符号化のためのプロジェクションベースアプローチを活用した,新しいリアルタイムマルチスキャンセマンティックセマンティックセマンティクス手法であるSegNet4Dを紹介する。
提案手法は,複数のデータセットにまたがる最先端性能を示し,リアルタイムなマルチスキャンセマンティックセマンティックセグメンテーション手法として注目されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:01:08 GMT)
NARRepair: Non-Autoregressive Code Generation Model for Automatic Program Repair [8.8] Non-Autoregressive(NAR)メソッドは、巨大な推論遅延を避けるために、並列にターゲットコードを出力することができる。
APRタスクのための最初のカスタマイズされたNAARコード生成モデルであるNARRepairを提案する。
NARRepair は,1) 補修動作を用いて過補正問題を緩和し,2) AST から依存情報を抽出して単語間の依存情報の欠如を緩和し,3) 文脈情報の欠如を緩和するために2段階の復号を用いる,という3つの大きな特徴を特徴としている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:04:28 GMT)
AnnotatedTables: A Large Tabular Dataset with Language Model Annotations [8.6] 本稿では,多種多様な表データのアノテーションを機械学習で自動生成する方法を示す。
LLM生成アノテーションを備えた32,119のデータベースのコレクションであるAnnotatedTablesをリリースしました。
LLMによって同定された入力ターゲット列を持つ2,720のテーブル上で,ベイジアン事前訓練を行った最近のニューラルネットワーク分類器であるTabPFNの性能評価を行った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:44:14 GMT)
The Hidden Pitfalls of the Cosine Similarity Loss [8.6] 2点間のコサイン類似性の勾配は2つの未探索設定において0となることを示す。
反対に、点間のコサイン類似性を最適化することは、それらが大規模に成長することを証明している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:16:59 GMT)
M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models [8.0] 我々は,M2Lingualと呼ばれる多言語多言語命令微調整データセットの完全合成・新規分類法(Evol)を提案する。
M2Lingualには合計182KのIFTペアが含まれており、70の言語、17のNLPタスク、一般的な命令応答ペアをカバーしている。
M2Lingualで微調整されたLLMは、既存の多言語IFTデータセットと比較して、様々な評価ベンチマークで一貫して競合する結果が得られる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:45:13 GMT)
Federated Learning for Estimating Heterogeneous Treatment Effects [8.0] ヘテロジニアス処理効果(HTE)を推定するための現在の機械学習アプローチでは、処理毎にかなりの量のデータにアクセスする必要がある。
フェデレートラーニング(Federated Learning)を通じて,組織間におけるHTE推定者の協調学習のための新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:21:33 GMT)
Children's Speech Recognition through Discrete Token Enhancement [8.0] 本研究では,ASRの性能を著しく低下させることなく,個々の音声トークンを幼児の音声認識システムに組み込むことを入力として検討する。
その結果,子供用離散トークンASRは,約83%のパラメータでほぼ同等の性能を発揮することがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:31:59 GMT)
Lazy Safety Alignment for Large Language Models against Harmful Fine-tuning [7.9] 安全アライメントを備えた大規模言語モデル(LLM)は、有害なデータと混在するデータセットを微調整することで、脱獄することができる。
調整段階の状態を分離して、アライメントとユーザデータセットを最適化することで、脱獄効果を緩和できることを示す。
textbfLazy(textbfi) textbfalignment(textbfLisa)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:59:50 GMT)
One-Class Learning with Adaptive Centroid Shift for Audio Deepfake Detection [7.8] 本稿では, ボナフィド表現の重み付け平均を連続的にシフトさせることにより, セントロイド表現を更新する適応型セントロイドシフト(ACS)法を提案する。
提案手法では, ボナフィドサンプルのみを用いてセントロイドを定義する。
提案手法は,ASVspoof 2021ディープフェイクデータセットにおいて2.19%の誤差率(EER)を達成し,既存の全システムより優れていた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:21:50 GMT)
FASTC: A Fast Attentional Framework for Semantic Traversability Classification Using Point Cloud [7.7] 点雲を用いたトラバーサビリティ評価の問題に対処する。
本稿では,垂直に配置された点雲から特徴を捉えるために PointNet を利用した柱状特徴抽出モジュールを提案する。
次に、LIDAR点雲の密度問題に適切に対応できる多フレーム情報を融合する新しい時間的アテンションモジュールを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:01:55 GMT)
Deep Prompt Multi-task Network for Abuse Language Detection [7.6] 既存の検出手法は、学習済み言語モデル(PLM)の微調整技術を用いて下流タスクを処理していると論じる。
本稿では,乱用言語検出のための新しいDeep Prompt Multi-task Network (DPMN)を提案する。
提案したDPMNは3つの公開データセット上の8つの典型的な手法に対して評価される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:15:33 GMT)
Attribute Diversity Determines the Systematicity Gap in VQA [7.4] 視覚的質問応答における系統的ギャップについて検討する。
トレーニングデータの量の増加は、体系的なギャップを減らさないことが分かりました。
全体として、我々の実験は、トレーニング中に異なる属性タイプの組み合わせが見られるほど、結果のモデルがより体系的であることを示唆しています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:51:13 GMT)
Regularized Best-of-N Sampling to Mitigate Reward Hacking for Language Model Alignment [7.3] 本稿では,報酬ハッキングの軽減を目的とした正規化Best-of-N(RBoN)を提案する。
RBoNは、選好学習技術と同様に、応答選択における近接項を組み込んでいる。
実験の結果、RBoNで生成されたデータセットに基づいて訓練されたDPOモデルは、バニラBoNで生成されたDPOモデルより優れていた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 02:31:06 GMT)
Emerging NeoHebbian Dynamics in Forward-Forward Learning: Implications for Neuromorphic Computing [7.3] フォワード・フォワードアルゴリズム(FFA)は各層に局所学習規則を用いる。
局所学習を駆動する良さ関数として2乗ユークリッドノルムを用いる場合、FFAはネオ・ヘビアン学習規則と等価であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:33:56 GMT)
Effects of Research Paper Promotion via ArXiv and X [7.3] 我々は、アーリープレプリントの出版物の利用動向とArXivの改訂、コンピュータ科学と物理学におけるそのような論文の宣伝にXを使うことについて研究する。
本稿は,これらの近代的手当の使用が,学術出版物の引用数に与える影響を推定する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:22:04 GMT)
POPCat: Propagation of particles for complex annotation tasks [7.2] ビデオデータの多目的・時間的特徴を利用したPOPCatという時間効率な手法を提案する。
この方法は、セグメンテーションやボックスベースのビデオアノテーションのための半教師付きパイプラインを生成する。
この方法は、最良の結果よりもリコール/mAP50/mAPの改善率を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:43:08 GMT)
Positive concave deep equilibrium models [7.1] ディープ平衡モデル(Deep equilibrium Model, DEQ)は、標準的なニューラルネットワークに代わるメモリ効率のモデルである。
正凹深部平衡モデル(pcDEQ)と呼ばれる新しいDECモデルを導入する。
非線形ペロン・フロベニウス理論に基づく我々のアプローチは、正のオーサント上に凹む非負の重みと活性化関数を強制する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:08:46 GMT)
Song Data Cleansing for End-to-End Neural Singer Diarization Using Neural Analysis and Synthesis Framework [7.1] 提案モデルでは,ポピュラー音楽に共通する合唱歌唱で歌データを変換する。
我々は、事前訓練されたNANSY++を利用して、コーランの歌唱をクリーンでオーバーラップされていないオーディオに変換する。
注釈付きデュエット曲を用いてデータセットを用いて訓練したEDEモデルを実験的に評価した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:48:29 GMT)
Fusion of Movement and Naive Predictions for Point Forecasting in Univariate Random Walks [6.9] 本研究では,移動予測(二項分類)とナイーブ予測を融合した新しい予測手法を提案する。
S&P500指数とBitcoin価格の予測において、ARIMA、線形回帰、LSTMネットワークなどのベースラインモデルを上回る動き予測精度が0.55に低下し、ナイーブな予測を確実に上回っている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:40:40 GMT)
Machine Learning with Real-time and Small Footprint Anomaly Detection System for In-Vehicle Gateway [6.9] 我々は、自己情報理論を用いて、トレーニングとテストモデルの値を生成することを提案する。
提案手法は偽陽性率(FPR)の8.7倍,テスト時間が1.77倍,フットプリントが4.88倍である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:23:52 GMT)
SyROCCo: Enhancing Systematic Reviews using Machine Learning [6.8] 本稿では,システムレビュープロセスのナビゲートを支援する機械学習技術について検討する。
データ抽出やエビデンスマッピングといったレビューのその後の段階へのML技術の適用は、その初期段階にある。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:04:43 GMT)
Statistical ranking with dynamic covariates [6.7] 確率推定器 (MLE) を計算するための効率的な交互アルゴリズムを提案する。
馬の競馬やテニス競技を含む実世界のデータセットに提案したモデルの適用を実証するために,我々の理論的知見を裏付ける包括的数値的研究を行った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:26:05 GMT)
LOGCAN++: Local-global class-aware network for semantic segmentation of remote sensing images [6.7] LOGCAN++はリモートセンシング画像用にカスタマイズされたセマンティックセグメンテーションモデルである。
GCA(Global Class Awareness)モジュールとLCA(Local Class Awareness)モジュールで構成されている。
LCAモジュールは、グローバルクラス表現と間接的にピクセルを関連付けるために、中間知覚要素としてローカルクラス表現を生成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:12:03 GMT)
Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization [6.7] 本稿では、メモリを活用するRLアプローチであるMementOについて述べる。
本稿では,特にTraveing SalesmanとCapacitated Vehicle Routingのベンチマーク問題に対する有効性を検証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:18:19 GMT)
MD tree: a model-diagnostic tree grown on loss landscape [6.6] トレーニング済みのニューラルネットワーク(NN)を前提として、障害モードのセットから障害の原因を予測することが目標だ。
従来の診断アプローチでは、トレーニングと検証エラーを使用して、モデルが過度に適合しているか、過度に適合しているかを判断する。
NN性能に関する豊富な情報が最適化損失ランドスケープにエンコードされていることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:31:17 GMT)
Machine Learning Applications of Quantum Computing: A Review [6.6] このレビューでは、高度なデータ処理とアプリケーションに焦点を当てた、量子コンピューティングと機械学習の相互作用について論じている。
主にサイバーセキュリティにおける量子コンピューティングの重要性の増大に焦点を当てている。
このレビューは、量子化された機械学習アルゴリズムの進歩とサイバーセキュリティなどの分野における潜在的な応用を強調している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:30:24 GMT)
Bayesian temporal biclustering with applications to multi-subject neuroscience studies [6.5] 本研究では,時間不変な被検体の分割が時間変化による測定の分割を誘導するネスト分割を特徴とする時間的双クラスタリングのためのベイズモデルを提案する。
提案手法は,データ駆動による被検体数および測定クラスター数の決定と,測定分割における変化点数および位置の推定を可能にする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:41:37 GMT)
Understanding and Mitigating Tokenization Bias in Language Models [6.4] State-of-the-art言語モデルは自己回帰型であり、トークンとして知られるサブワード単位で動作する。
最大プレフィックスマッチングなどの符号化方式では,トークン化によってサンプリングバイアスが生じることを示す。
トークン化されたデータに基づいてトレーニングされたモデルからバイアスのない推定値を得るための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:38:02 GMT)
Prompting Explicit and Implicit Knowledge for Multi-hop Question Answering Based on Human Reading Process [6.4] 心理学的研究は、通過中の明示的な情報と読書中の人間の事前知識の間に重要なつながりがあることを示唆している。
本稿では,明示的知識と暗黙的知識を結び付けるためにプロンプトを利用するPmpting Explicit and Implicit Knowledge (PEI)フレームワークを提案する。
我々のモデルは、暗黙の知識の形式であるプロンプトによる型固有の推論を取り入れている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:03:18 GMT)
NaijaHate: Evaluating Hate Speech Detection on Nigerian Twitter Using Representative Data [6.4] ヘイトスピーチ検出(HSD)にアノテートされた最初のデータセットであるNaijaHateを紹介する。
バイアス付きデータセット上で評価されたHSDは,少なくとも2倍の速さで実世界の性能を過大評価する。
ナイジェリアのTwitterコンテキストに合わせた事前学習モデルであるNaijaXLM-Tを提案し、ドメイン適応型事前学習が果たす重要な役割を確立する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:31:35 GMT)
What Makes Two Language Models Think Alike? [6.2] 本稿では,メタラーニング符号化モデル(MLEM)に基づく新しい手法を提案する。
MLEMは、類似性と相違の原因となる特定の言語的特徴を特定することによって、透過的な比較を提供する。
このアプローチは、音声や視覚などの他の領域や、人間の脳を含む他の神経系にも直接拡張できる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:34:35 GMT)
Source-Free Domain Adaptation with Diffusion-Guided Source Data Generation [6.1] 本稿では、ソースフリードメイン適応(DM-SFDA)のための拡散モデルの一般化可能性を活用する新しいアプローチを提案する。
提案するDMSFDA法では,事前学習したテキスト・画像拡散モデルを微調整し,ソース・ドメイン・イメージを生成する。
私たちは、Office-31[39]、Office-Home [48]、VisDA [35]など、さまざまなデータセットにわたる包括的な実験を通じて、アプローチを検証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 00:37:16 GMT)
Speeding Up Image Classifiers with Little Companions [6.0] ニューラルネットワークのスケールアップは、大規模な言語とビジョンモデルの成功の鍵となるレシピである。
まず、軽量の"リトル"モデルを用いて、すべてのサンプルの予測を行う。
Little-Bigはまた、Intern Image-G-512をスピードアップし、90%のImageNet-1Kトップ1の精度を達成した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:11:46 GMT)
Unsupervised Concept Drift Detection from Deep Learning Representations in Real-time [6.0] コンセプト・ドリフト(英: Concept Drift)は、対象領域の基本的なデータ分布と統計的性質が時間とともに変化する現象である。
我々は、教師なしリアルタイム概念ドリフト検出フレームワークDriftLensを提案する。
深層学習表現の分布距離を利用して非構造化データに作用する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:41:46 GMT)
Finding (and exploiting) vulnerabilities on IP Cameras: the Tenda CP3 case study [6.0] 本稿では,IPカメラのセキュリティ分析と遠隔操作による脆弱性の同定手法について論じる。
既存の手法と比較して,本手法はターゲット装置のコンテキストを活用し,悪意ある呼び出しシーケンスの識別に重点を置いている。
CVSSスコアは7.5から9.8の5種類の新規CVEを同定した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:29:05 GMT)
EGTR: Extracting Graph from Transformer for Scene Graph Generation [5.9] SGG(Scene Graph Generation)は、オブジェクトを検出し、オブジェクト間の関係を予測するための課題である。
本稿では,DETRデコーダのマルチヘッド自己アテンション層で学習した様々な関係から関係グラフを抽出する軽量一段SGGモデルを提案する。
本稿では,Visual Genome と Open Image V6 データセットに対する提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:52:57 GMT)
CATBench: A Compiler Autotuning Benchmarking Suite for Black-box Optimization [5.9] 我々は、コンパイラ自動チューニングの複雑さを捉える包括的なベンチマークスイートであるCATBenchを紹介する。
CATBenchのベンチマークは、テンソル代数から画像処理、クラスタリングまで、機械学習指向の計算の範囲にまたがっている。
我々はCATBenchをいくつかの最先端アルゴリズムで検証し、その強みと弱点を明らかにした。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:15:04 GMT)
Reliable Simulation of Quantum Channels: the Error Exponent [5.8] 指数収束の最適速度を特徴付ける量子チャネルシミュレーションの誤差指数について検討する。
有限ブロック長設定における量子チャネルシミュレーションの達成可能性を得る。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:07:51 GMT)
Diff3Dformer: Leveraging Slice Sequence Diffusion for Enhanced 3D CT Classification with Transformer Networks [5.8] 拡散型3次元視覚変換器(Diff3Dformer)を提案する。
本手法は, 肺CTの2種類の小さなデータセットに対して, 改良された性能を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:23:18 GMT)
Simultaneous Generation of Quantum Frequency Combs across Distinct Modal Families in a Single $Si_3 N_4$ Whispering Gallery Mode Resonator [5.7] 量子周波数コム(Quantum frequency combs, QFCs)は、クラスター状態のような多モードの絡み合いのための汎用的な資源である。
オンチップ・ウィスパーリング・ギャラリーモード共振器(WGMR)は、これらの状態を極低しきい値のパワーで生成することができる。
そこで本研究では,1オンチップ$Si_3N_4$ WGMRを用いた3つのQFCの同時生成について述べる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:08:49 GMT)
Continuous drive heterodyne microwave sensing with spin qubits in hexagonal boron nitride [5.7] 本稿では、スピンを有効12T$の制限値に拡張する連続マイクロ波駆動に基づく制御方式を提案する。
この方式は、$eta approx 3-5 :mathrmmu T sqrtHz$の振幅感度と$eta_phi approx 0.076 :mathrmrads sqrtHz$の位相感度を達成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:24:45 GMT)
Learning the boundary-to-domain mapping using Lifting Product Fourier Neural Operators for partial differential equations [5.6] 我々は、任意の境界関数を領域全体の解にマッピングできる新しいFNOベースのアーキテクチャ、Lifting Product FNO(LP-FNO)を提案する。
2次元ポアソン方程式に対して提案したLP-FNOの有効性と分解能の独立性を実証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:45:37 GMT)
UNICAD: A Unified Approach for Attack Detection, Noise Reduction and Novel Class Identification [5.6] UNICADは、適応的なソリューションを提供するために様々な技術を統合する新しいフレームワークとして提案されている。
対象画像分類において、UNICADは正確な画像分類を達成し、未知のクラスを検出し、敵攻撃から回復する。
CIFAR-10データセットで行った実験は、UNICADが対向緩和および見知らぬクラス分類において有効であり、従来のモデルよりも優れていたことを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:10:03 GMT)
InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection [5.6] マルチモーダルサルカズム検出のための堅牢なフレームワークであるInterCLIP-MEPを提案する。
InterCLIP-MEPはCLIPの改良版であるInterCLIP(Interactive CLIP)をバックボーンとして導入している。
メモリ拡張予測器にInterCLIPを適用するための新しいトレーニング戦略が設計されている。
実験により、InterCLIP-MEPはMMSD2.0ベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:13:42 GMT)
Local primordial non-Gaussianity from the large-scale clustering of photometric DESI luminous red galaxies [5.5] 我々は、Dark Energy Spectroscopic Instruments(DESI)による局所原始非ガウス性パラメータ$fnl$を制約するために、光赤銀河の角度クラスタリングを用いる。
このサンプルは1200万以上の目標からなり、空の14,000平方度をカバーし、赤方偏移は0.2 z 1.35$である。
我々は, 銀河の絶滅, 調査深度, 天体観測を系統的誤りの主な原因とみなし, 大規模での非宇宙的余剰クラスタリングを緩和するために線形回帰と人工ニューラルネットワークを用いる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:56:28 GMT)
Investigating the impact of 2D gesture representation on co-speech gesture generation [5.4] 訓練データ(2次元または3次元の関節座標)の寸法がマルチモーダル音声合成モデルの性能に及ぼす影響を評価する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:19:00 GMT)
OTCE: Hybrid SSM and Attention with Cross Domain Mixture of Experts to construct Observer-Thinker-Conceiver-Expresser [5.4] 我々は、より生体模倣的なアイデアを持つ新しいアーキテクチャ、Observer-Thinker-Conceiver-Expresser (OTCE)を提案する。
OTCEは、有名な中規模のオープンソース言語モデルと、小規模の言語モデリングタスクで競合することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:05:23 GMT)
Teaching Theorizing in Software Engineering Research [5.3] この章は、ソフトウェア工学(SE)の研究者と教育者が理論の重要性と理論化のプロセスを教えることを支援することを目的としている。
この章は、理論化の中間製品12と、SEコンテキストにおける意味を提示する。
この章は、SEにおける理論化に関する12週間のコースのための提案された構造で終わる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:26:41 GMT)
Meta-GCN: A Dynamically Weighted Loss Minimization Method for Dealing with the Data Imbalance in Graph Neural Networks [5.3] そこで我々は,メタGCNというメタ学習アルゴリズムを提案し,サンプル重み付けを適応的に学習する。
我々は,Meta-GCNが最先端フレームワークや他のベースラインを精度で上回ることを示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:59:24 GMT)
Inferring stochastic low-rank recurrent neural networks from neural data [5.2] 計算神経科学における中心的な目的は、大きなニューロンの活動と基礎となる力学系を関連付けることである。
低ランクリカレントニューラルネットワーク(RNN)は、トラクタブルダイナミクスを持つことによって、そのような解釈可能性を示す。
そこで本研究では,低ランクRNNをモンテカルロ変分法に適合させる手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:57:49 GMT)
This actually looks like that: Proto-BagNets for local and global interpretability-by-design [5.0] 解釈可能性(Interpretability)は、高度なアプリケーションで機械学習モデルを使用するための重要な要件である。
本稿では,解釈可能なプロトタイプベースモデルであるProto-BagNetsを紹介する。
Proto-BagNetは、忠実で正確で臨床的に意味のあるローカルおよびグローバルな説明を提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:13:07 GMT)
Concentration Inequalities for $(f,Γ)$-GANs [5.0] GAN(Generative Adversarial Network)は、ジェネレータ分布を訓練する教師なし学習手法である。
最近の研究は、積分確率測度(IPM)に基づくGANの統計的整合性(例えば、1-ワッサーシュタイン測度に基づくWGAN)を証明している。
非線形目的関数の使用を可能にする GAN のより大きなクラスは、$(f,Gamma)$-divergences を用いて構築することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:42:03 GMT)
Sigma-point Kalman Filter with Nonlinear Unknown Input Estimation via Optimization and Data-driven Approach for Dynamic Systems [5.0] 共振状態と未知の入力推定のための導関数のない未知の入力シグマ点カルマンフィルタ(SPKF)を提案する。
SPKFは、非線形最適化とデータ駆動アプローチによって実装できる一般的な非線形UI推定器と相互接続されている。
提案したSPKF-nUIは, 既存の非線形状態-UIフィルタと比較して, 最低状態およびUI推定誤差を達成できることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:56:15 GMT)
Analyzing performance of $f$-deformed displaced Fock state in continuous-variable quantum teleportation [5.0] 理想的なテレポーテーションプロトコルの最適性能のための非ガウス的資源の成功確率について検討する。
非線形置換は、しきい値を超えるテレポーテーションの忠実度を増大させる。
絡み合った光子置換型フォック状態は、単一モードコヒーレント状態と圧縮状態のテレポートのための量子チャネルとして最大効率を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:17:52 GMT)
Security of Partially Corrupted Repeater Chains [4.9] 量子鍵分配(Quantum Key Distribution)は、2つのパーティが計算上の敵に対してセキュアな秘密鍵を確立することを可能にする。
我々は、Alice と Bob を繋ぐリピータ連鎖の連続部分集合を、相手がしか破壊できない場合を分析する。
我々は、この攻撃モデルを想定した厳密な有限鍵証明を導き、性能と耐雑音性の改善が可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:59:41 GMT)
Virtual Mines -- Component-level recycling of printed circuit boards using deep learning [4.8] 仮想鉱山」という概念は、生物の終末品から興味深い原料を効率よく回収する生産サイクルを指す。
本稿では, 回路基板を部品レベルでリサイクルする深層学習モデルに基づくパイプラインについて述べる。
ローカルに開発されたデータセットの結果を分析するために、事前トレーニングされたYOLOv5モデルが使用される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:29:30 GMT)
UCM-Net: A Lightweight and Efficient Solution for Skin Lesion Segmentation using MLP and CNN [4.8] UCM-NetはMulti-Layer Perceptrons(MLP)とConvolutional Neural Networks(CNN)を組み合わせた新しい皮膚病変セグメンテーションモデルである
50KB未満のパラメータで堅牢なパフォーマンスを示し、1秒あたり0.05ギガ操作(GLOP)を必要としない。
これは皮膚病変のセグメンテーションの効率性の潜在的なベンチマークであり、資源制約された設定での展開に適している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:29:38 GMT)
Investigating Confidence Estimation Measures for Speaker Diarization [4.7] 話者ダイアリゼーションシステムは、話者のアイデンティティに基づいた会話記録をセグメント化する。
話者ダイアリゼーションエラーは、話者のアイデンティティに依存する下流システムに伝播し、悪影響を及ぼす可能性がある。
これらのエラーを軽減する方法の1つは、下流システムにセグメントレベルのダイアリゼーション信頼スコアを提供することである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:21:38 GMT)
LatentExplainer: Explaining Latent Representations in Deep Generative Models with Multi-modal Foundation Models [4.7] 本稿では,深層生成モデルにおける潜伏変数の意味論的説明を自動的に生成するフレームワークであるLatentExplainerを紹介する。
LatentExplainerは、潜伏変数の意味の推測、帰納的バイアスによる説明の整合、さまざまな説明可能性の扱いの3つの主な課題に取り組む。
提案手法を実環境および合成データセット上で評価し,提案手法は潜伏変数の高品質な説明を生成する上で優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:30:34 GMT)
Comparing the Decision-Making Mechanisms by Transformers and CNNs via Explanation Methods [4.7] 本研究では、データセット全体に基づく深い説明アルゴリズムを適用して、異なる視覚認識バックボーンの意思決定について検討する。
TransformersとConvNeXtは、画像の複数の部分を共同で検討することで、より構成的であることが分かりました。
特徴利用の類似性に基づいて、異なるモデルのランドスケープをプロットする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:47:38 GMT)
Improving the Explain-Any-Concept by Introducing Nonlinearity to the Trainable Surrogate Model [4.6] EAC(Explain Any Concept)モデルは、意思決定を説明するフレキシブルな方法です。
EACモデルは、ターゲットモデルをシミュレートする訓練可能な1つの線形層を持つ代理モデルを用いている。
元のサロゲートモデルに追加の非線形層を導入することで、ERCモデルの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:28:08 GMT)
Homomorphisms and Embeddings of STRIPS Planning Models [4.6] 1つ目はGI完全であり、理論上は準多項式時間で解けることを示す。
残りの問題はNP完全であることが証明されているが、可能であれば同型を構築するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:43:18 GMT)
MLAAN: Scaling Supervised Local Learning with Multilaminar Leap Augmented Auxiliary Network [4.6] ローカル学習は、E2Eの代替として約束を守る新しいインタラクティブな訓練方法と考えられている。
従来の局所学習手法は, 局所的モジュール間相互作用が不十分なため, 高精度なモデル精度を実現するには不十分である。
マルチラミナリープ拡張補助ネットワーク(MLAAN)を用いたScaling Supervised Local Learningと呼ばれる新しいモデルを導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:30:55 GMT)
Classifying multiparticle entanglement with passive state energies [4.5] 極端受動的状態エネルギーは、SLOCCの下で等価な量子状態のクラスごとに一括して凸ポリトープを形成することを示す。
最終的に、SLOCCの下でのマルチパーティの絡み合いを分類するために、マルチパーティの受動的状態エネルギー基準を導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:25:14 GMT)
Extracting thin film structures of energy materials using transformers [4.4] 中性子変換器反射法と高度計算エンジン(N-TRACE)
中性子反射率データ解析にトランスフォーマーアーキテクチャを用いたニューラルネットワークモデルを導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:48:19 GMT)
Automated Privacy-Preserving Techniques via Meta-Learning [4.2] 最初の自動プライバシ保存手法であるAUTOPRIVを提案する。
メタラーニングを使用して、非識別プロセスを自動化することで、マシンラーニングタスクのためのデータのセキュアなリリースを容易にする。
我々は、新しい領域内で最適な近似を達成できるであろう最も有望なソリューションのランクリストを提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:53:45 GMT)
RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker [4.2] 本稿では,新しいRGB-Sonar(RGB-S)トラッキングタスクを提案する。
RGBとソナーモダリティの相互作用により、水中の標的の効率的な追跡を実現する方法について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:09:46 GMT)
SLOctolyzer: Fully automatic analysis toolkit for segmentation and feature extracting in scanning laser ophthalmoscopy images [4.2] Infrared Reflectance scanning Laser Ophthalmoscopy (SLO)画像に現れる網膜血管のオープンソース解析ツールキット。
セグメンテーションモジュールは、深層学習法を用いて網膜解剖を規定する。
測定モジュールは、血管の複雑さ、密度、靭性、口径などの重要な網膜血管の特徴を定量化する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:16:17 GMT)
LIR: A Lightweight Baseline for Image Restoration [4.2] 画像復元作業の本質的な特徴は、多くの作品で見落とされがちである。
LIRと呼ばれる画像復元のための軽量ベースラインネットワークを提案し、画像の効率よく復元し、劣化を除去する。
我々のLIRは、Pak Signal-to-Noise Ratio (PSNR)における最先端構造類似度指標(SSIM)および最先端モデルに匹敵する性能を達成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:27:44 GMT)
Minimax Optimality in Contextual Dynamic Pricing with General Valuation Models [4.2] 本稿では,問題に対する仮定を最小化しながら,改善された後悔境界を実現する新しいアルゴリズムを提案する。
本手法は, 一般関数空間を考慮し, 動的価格設定によく用いられる線形評価モデルを超えて拡張する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:43:56 GMT)
Who Plays First? Optimizing the Order of Play in Stackelberg Games with Many Robots [4.1] Branch and Play (B&P) は、社会的に最適な遊びの順序とスタックルバーグ均衡に収束する効率的かつ正確なアルゴリズムである。
本稿では,B&Pによる航空交通管制,群れ形成,輸送車両の配車における実用性を実証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:06:50 GMT)
A Dual-Channel Particle Swarm Optimization Algorithm Based on Adaptive Balance Search [4.1] 適応バランス探索(DCPSO-ABS)に基づく二重チャネルPSOアルゴリズムを提案する。
提案アルゴリズムは,選択した最先端アルゴリズムよりも高い一般化性能を有することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:09:31 GMT)
A large language model for predicting T cell receptor-antigen binding specificity [4.1] 本稿では,モデル一般化の限界を克服するMasked Language Model (MLM)を提案する。
具体的には、ランダムにシーケンスセグメントをマスキングし、tcrLMをトレーニングしてマスクセグメントを推論し、TCRシーケンスから表現的特徴を抽出する。
実験の結果,tcrLM は独立テストセットと外部検証セットで 0.937 と 0.933 の AUC 値を達成できた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:36:40 GMT)
Measuring the Recyclability of Electronic Components to Assist Automatic Disassembly and Sorting Waste Printed Circuit Boards [4.1] 本稿では, 廃プリント基板(WPCB)からの廃電子部品(WEC)のリサイクル性の測定に, 数学的革新モデルを用いて着目する。
この革新的なアプローチは、WECのリサイクルとリサイクルの難しさを評価し、分解とソートを改善するAIモデルを統合する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:33:56 GMT)
Pandora's White-Box: Precise Training Data Detection and Extraction in Large Language Models [4.1] 我々は,大規模言語モデル(LLM)に対する最先端のプライバシ攻撃を開発する。
事前訓練されたLLMに対する新たなメンバーシップ推論攻撃(MIA)は、ベースライン攻撃の数百倍の精度で実行される。
微調整では, ベースモデルと微調整モデルとの損失率に基づく単純な攻撃により, ほぼ完全なMIA性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:18:45 GMT)
Expert with Clustering: Hierarchical Online Preference Learning Framework [4.1] Expert with Clustering (EWC)は、クラスタリングのテクニックと予測を専門家のアドバイスと統合した階層的なコンテキスト的バンディットフレームワークである。
EWCはLinUCBベースラインと比較して後悔を27.57%減らすことができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:03:11 GMT)
neuROSym: Deployment and Evaluation of a ROS-based Neuro-Symbolic Model for Human Motion Prediction [4.0] NeuroSyMは空間的相互作用の表現のための定性的軌道計算にコンテキストを組み込むことに成功した。
実際のシナリオでロボットをデプロイするためのROパッケージであるneuROSymを提供するために,オリジナルアーキテクチャを拡張した。
我々は,これらのモデルであるNeuroSyMとベースラインSGANを,人間の動作パターンが異なる2つのシナリオで評価した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:13:06 GMT)
Natural Gradient Interpretation of Rank-One Update in CMA-ES [4.0] 我々は,CMA-ESにおけるランクワン更新の新しい解釈を,先行分布による自然勾配の観点から提案する。
我々は、平均ベクトルが進化経路の方向に存在すべきという考えに基づいて、事前分布を設定することにより、MAP-IGOフレームワークからのランクワン更新を導出する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:22:58 GMT)
Deep Reinforcement Learning: A Convex Optimization Approach [3.9] 本稿では,各エピソード毎に凸最適化を用いて,最適な$Q$関数の2層ニューラルネットワーク近似を求める。
安定な非線形系に対しては、アルゴリズムが収束し、トレーニングされたニューラルネットワークの収束パラメータを最適なニューラルネットワークパラメータに任意に近づけることができることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:23:42 GMT)
Improving Quaternion Neural Networks with Quaternionic Activation Functions [3.9] 四元数等級や位相を変更できる新しい四元数活性化関数を提案する。
提案した活性化関数は、勾配降下法で訓練された任意の四元数値ニューラルネットワークに組み込むことができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:36:58 GMT)
Cascade Generalization-based Classifiers for Software Defect Prediction [3.8] 本研究では,機械学習に基づくSDPモデルの予測性能を高めるために,カスケード一般化(CG)関数の展開を提案する。
CGに基づくNa"ive Bayes(NB)、Decision Tree(DT)、k-Nearest Neighbor(kNN)モデルの有効性をNASAのソフトウェア欠陥データセット上で検討した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:14:23 GMT)
Decomposing God Header File via Multi-View Graph Clustering [3.8] God Header Fileは、大きなコードサイズと大きなファイルインパクトを持つヘッダファイルを指す。
本稿では,マルチビューグラフクラスタリングに基づくGod Header Fileアプローチを提案する。
我々は、異なるプロジェクトから6つの現実世界のゴッドヘッダファイルとともに、合成データセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:52:20 GMT)
Faster Computation of Stabilizer Extent [3.8] 安定度を計算するための高速数値アルゴリズムを提案する。
我々のアルゴリズムは、ランダムな純状態に対する安定化器の忠実度と安定化器の範囲を最大$n=9$ qubitsまで計算することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:28:15 GMT)
DeepReShape: Redesigning Neural Networks for Efficient Private Inference [3.8] 近年の研究では、PIのFLOPは無視できず、高いレイテンシのペナルティを負うことが示されている。
我々は、PIの制約下でニューラルネットワークアーキテクチャを最適化するDeepReShapeを開発した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:34:40 GMT)
Mean-Field Langevin Dynamics for Signed Measures via a Bilevel Approach [3.8] 平均場ランゲヴィン力学(英: Mean-field Langevin dynamics、MLFD)は、多様体上の確率測度に対する凸最適化に取り組む相互作用粒子法の一種。
我々は,MFLDフレームワークを拡張して,符号付き測度よりも最適化問題を凸化する方法を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:15:12 GMT)
Cherry on the Cake: Fairness is NOT an Optimization Problem [3.7] 効率的なケーキカットは最適決定関数と等価であることを示す。
この接続が機械学習問題における公平性にどのように活用できるかを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:46:16 GMT)
RES-Q: Evaluating Code-Editing Large Language Model Systems at the Repository Scale [3.6] 大きな言語モデル(LLM)は、大規模なコードリポジトリへの編集のような複雑なタスクにアプローチすることができる。
我々は、textbfR$epository $textbfE$diting $textbfS$ystemsを評価するための自然言語命令ベースのベンチマークであるRES-Qを提案する。
我々は,Qurrent OS上に構築されたリポジトリ編集システムにおける言語エージェントとして,最先端のLLMを評価した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:08:17 GMT)
Data-driven Modeling in Metrology -- A Short Introduction, Current Developments and Future Perspectives [3.6] デジタル技術、拡張型センサーネットワーク、高性能コンピューティングは、データ駆動方式へのシフトを拡大している。
ここでは、データ駆動モデリングがもたらす様々な機会と、それらが既に様々な現実世界のアプリケーションで実装されている方法を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:09:45 GMT)
Cubic regularized subspace Newton for non-convex optimization [3.5] 我々は、ランダムな部分空間に定常正規化を適用すると解釈できる座標二階SSCNを解析する。
従来の一階法と比較して,大幅な高速化を示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:20:02 GMT)
Does Cross-Cultural Alignment Change the Commonsense Morality of Language Models? [3.5] 言語モデルを人間の好みに合わせることは、エンドユーザーにとって有用な言語モデルを作るための一般的なアプローチである。
ほとんどのアライメント作業は英語で行われ、人間の好みのデータセットは英語で支配されている。
日本語モデルと英語リソースの整合性は、非英語話者の嗜好を損なうかを検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:50:12 GMT)
EMVD dataset: a dataset of extreme vocal distortion techniques used in heavy metal [3.5] データセットは、長さ1秒から30秒の760のオーディオ抜粋で構成され、約100分間のオーディオ素材で構成されている。
このデータセット内の歪み分類は、4つの異なる歪み技法と3つの声効果を含む。
声道技術に関連する2つの分類課題に対して,最先端のディープラーニングモデルの性能を評価した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:50:52 GMT)
Cross-Care: Assessing the Healthcare Implications of Pre-training Data on Language Model Bias [3.5] 大規模な言語モデル(LLM)におけるバイアスと実世界の知識を評価するための最初のベンチマークフレームワークであるCross-Careを紹介する。
ThePile$のような事前学習コーパスに埋め込まれた人口統計バイアスがLLMの出力にどのように影響するかを評価する。
以上の結果から, LLMの病状有病率と, 集団間での実際の病状有病率との相違が明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:17:52 GMT)
Discrete-time Quantum Walks in Qudit Systems [3.5] 1次元量子ウォークを$d$次元量子領域に導入する。
任意の有限次元量子論理における回路実現の等価性を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:58:35 GMT)
Of Mice and Mates: Automated Classification and Modelling of Mouse Behaviour in Groups using a Single Model across Cages [3.4] 筆者らは, 家庭内の環境下でマウスを研究するためのツールを提供し, 生物学者に対して, 個人の行動の時間的側面をとらえる可能性を秘めている。
我々の主な貢献は、ケージにまたがるマウス群の共同行動を要約した、グループ行動モデル(GBM)である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:35:41 GMT)
Systematic Evaluation of Deep Learning Models for Log-based Failure Prediction [3.4] 本稿では,障害予測のためのログデータ埋め込み戦略とディープラーニング(DL)タイプの組み合わせを系統的に検討する。
そこで我々は,組込み戦略とDLベースのエンコーダの様々な構成に対応するモジュールアーキテクチャを提案する。
また,F1スコア測定値を用いて,Logkey2vecを用いたCNNベースのエンコーダが最適であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:36:05 GMT)
The Championship-Winning Solution for the 5th CLVISION Challenge 2024 [3.3] 第5回CLVision Challengeでは,従来の漸進的学習を超越した,独特な課題を提示した。
我々のアプローチは、各タスクに対して独立したパラメータ空間を割り当てるためのWinning Subnetworksに基づいている。
推論段階では、特定のサンプルの特定のクラスに対する予測が、そのクラスに対応する異なるワークの平均ロジットとなる、ワーク間の相互作用戦略を考案した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:55:06 GMT)
DEXTER: A Benchmark for open-domain Complex Question Answering using LLMs [3.2] オープンドメイン複合質問回答 (QA) は証拠検索と推論において難しい課題である。
我々は、オープンドメイン設定で、最先端の訓練済み高密度・スパース検索モデルを評価する。
BM25のような遅延相互作用モデルや驚くほど語彙的モデルは、事前訓練された高密度検索モデルと比較してよく機能する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:09:50 GMT)
Evaluating the Ability of Large Language Models to Reason about Cardinal Directions [3.2] 我々は,大規模言語モデルの代表集合が基準方向(CD)を判断する能力について検討する。
最初はChatGPTと共同で作成され、CDに関する世界的知識のリコールに重点を置いています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:07:01 GMT)
Are Vision xLSTM Embedded UNet More Reliable in Medical 3D Image Segmentation? [3.2] 本稿では,CNNとVision-xLSTM(Vision-xLSTM)モデルの統合について,UVixLSTMと呼ばれる新しいアプローチを導入することにより検討する。
Vision-xLSTMブロックは、CNN特徴マップから抽出されたパッチ内の時間的およびグローバルな関係をキャプチャする。
UVixLSTMは、公開データセットの最先端ネットワークよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:01:05 GMT)
Dwarf: Disease-weighted network for attention map refinement [3.1] 本研究は,医用画像解析における「ループから外れた人間」と「信頼」の問題に対処する。
本稿では、専門家のフィードバックを活用して、モデル妥当性と精度を高める病弱注意マップ改善ネットワーク(Dwarf)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:11 GMT)
The Uli Dataset: An Exercise in Experience Led Annotation of oGBV [3.1] ヒンディー語、タミル語、インド英語の3言語で性別による虐待に関するデータセットを提示する。
このデータセットは、女性や南アジアのLGBTQIAコミュニティのメンバーと同一視する専門家によって、性虐待の経験に関する3つの質問に沿って注釈付けされたツイートで構成されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:31:19 GMT)
METRIK: Measurement-Efficient Randomized Controlled Trials using Transformers with Input Masking [3.1] 計画的欠落設計(PMD)は、メトリクスを取り除くことなく収集されるデータ量を削減できる。
METRIKは、試験設計者の目的を満たすPMDを生成するために、新しいサンプリングと選択アルゴリズムを実装している。
MeTRIKは、時間とメトリクス間の相関を利用して、生成されたPMDの下でのサンプリング効率と計算性能を向上する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:47:47 GMT)
Personalized federated learning based on feature fusion [2.9] フェデレートされた学習により、分散クライアントは、クライアントのプライバシを保護するためにデータをローカルに保存しながら、トレーニングで協力することができる。
pFedPMと呼ばれる個人化学習手法を提案する。
このプロセスでは、従来のグラデーションアップロードを機能アップロードに置き換え、通信コストを削減し、異種クライアントモデルを可能にする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:16:51 GMT)
A Multi-Party, Multi-Blockchain Atomic Swap Protocol with Universal Adaptor Secret [2.9] 本稿では, ほぼ完全にオフチェーンで動作する, 新規なマルチパーティ原子スワッププロトコルを提案する。
共謀攻撃や悪意あるドロップアウトといった重要な課題に対処することにより、当社のプロトコルは、マルチパーティ原子スワップのセキュリティと効率を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:33:03 GMT)
Quantum Deep Reinforcement Learning for Robot Navigation Tasks [2.7] ハイブリッド量子古典的強化学習装置における量子回路は、複数のロボットナビゲーションシナリオにおいて最適なポリシーを学習可能であることを示す。
応用量子回路は、トレーニング可能なパラメータの数に等しくなると、古典的ニューラルネットワークのベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:08:33 GMT)
Noisy Neighbors: Efficient membership inference attacks against LLMs [2.7] 本稿では,組込み空間に雑音を付加することにより,対象試料のテクストノイズを発生させる効率的な手法を提案する。
提案手法はシャドウモデルの有効性と密に一致し,実際のプライバシー監査シナリオにおけるユーザビリティを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:02:20 GMT)
Multi-Modal Vision Transformers for Crop Mapping from Satellite Image Time Series [2.5] 既存の最先端アーキテクチャでは、SITSの空間次元に対する時間次元と畳み込みを処理するために自己アテンション機構を使用している。
単一モーダルSITSからの作物マッピングにおける純粋に注意に基づくアーキテクチャの成功により、我々は複数のマルチモーダルマルチテンポラルトランスフォーマーベースのアーキテクチャを導入する。
実験結果から, 畳み込みと自己認識の両コンポーネントによる最先端アーキテクチャの大幅な改善が示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:40:46 GMT)
Evaluation of Instruction-Following Ability for Large Language Models on Story-Ending Generation [2.5] 本稿では,大規模言語モデル(LLM)の物語生成の文脈における指示追従能力の評価に焦点をあてる。
本稿では,機械読影理解モデル(MRC)を用いた自動評価パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:53:36 GMT)
Migrating Software Systems towards Post-Quantum-Cryptography -- A Systematic Literature Review [2.5] ネットワークとそのコンポーネントには、後量子暗号(PQC)への移行が必要である。
最近の標準化努力は、すでに量子セーフネットワークを前進させています。
しかし、この文献は定義やベストプラクティスについてまだ合意に達していない。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:49:46 GMT)
CLUE: A Clinical Language Understanding Evaluation for LLMs [2.4] 大規模言語モデル(LLM)は、患者のケア、診断、管理プロセスに大きく貢献することが期待されている。
この敏感なアプリケーション領域に対するモデルの適合性を評価することは、非常に重要です。
臨床作業におけるLLMの評価に適したベンチマークであるCLUE(Ceriical Language Understanding Evaluation)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:32:41 GMT)
Graph-Augmented LLMs for Personalized Health Insights: A Case Study in Sleep Analysis [2.3] 大規模言語モデル(LLM)は、インタラクティブなヘルスアドバイスを提供する上で、有望であることを示している。
Retrieval-Augmented Generation (RAG) やファインチューニングのような従来の手法は、複雑で多次元で時間的に関係のあるデータを完全に活用できないことが多い。
本稿では,健康意識のパーソナライズと明確性を高めるために,グラフ拡張LDMフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:22:54 GMT)
Token-based Decision Criteria Are Suboptimal in In-context Learning [2.3] In-Context Learning (ICL) は通常、手動で選択したラベルトークンの確率から分類基準を利用する。
トークン確率を放棄し,LMの最後の隠蔽状態に最も近いセントロイドを使用するHiddenを提案する。
3つのモデルと10の分類データセットに関する実験は、Hiddenが現在のトークンベースのキャリブレーションを約20%上回っていることを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:16:26 GMT)
Orchestrating time and color: a programmable source of high-dimensional entanglement [2.3] 高次元量子状態は、高度に汎用的で効率的な量子情報科学(QIS)フレームワークの基礎を提供する。
ここでは、パラメトリックフォトニック最大絡み合ったTM状態に基づいて、任意のQISアプリケーションに対して重要なビルディングブロックを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:00:28 GMT)
Fundus: A Simple-to-Use News Scraper Optimized for High Quality Extractions [2.3] Fundusはユーザーフレンドリーなニューススクレイパーで、ユーザーはほんの数行のコードで何百万もの高品質なニュース記事を入手できる。
既存のニューススクレイパーとは異なり、手作業で作り上げたコンテンツ抽出機を使っています。
私たちのフレームワークは、クローリング(Webや大規模なWebアーカイブからHTMLを取得する)とコンテンツ抽出を1つのパイプラインに組み合わせています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:18:48 GMT)
General Binding Affinity Guidance for Diffusion Models in Structure-Based Drug Design [2.3] BadGERは、タンパク質-リガンド結合の改善に向けた拡散サンプリングプロセスの制御方法である。
提案手法は,従来の機械学習手法をはるかに上回り,生成した受容体の結合親和性を最大60%向上することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:31:41 GMT)
BitNet b1.58 Reloaded: State-of-the-art Performance Also on Smaller Networks [2.2] 本研究では,100Kから48Mパラメータの小さな言語と視覚モデルに対する1.58ビットの量子化について検討する。
我々は、量子化プロセスにおける平均よりも中央値に依存するビットネットb1.58の変種を導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:55:36 GMT)
Vaporetto: Efficient Japanese Tokenization Based on Improved Pointwise Linear Classification [2.2] 本稿では,ポイントワイド線形分類(PLC)フレームワークに基づく日本語トークン化のランタイム効率向上のためのアプローチを提案する。
PLCフレームワークの特性とタスク定義を活用することでトークン化を最適化する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:47:20 GMT)
An Optimal Tightness Bound for the Simulation Lemma [2.1] 定数要素を含む厳密なモデル不特定性に対する値予測誤差の有界性を示す。
これは、強化学習の基本的な結果である「シミュレーション補題」の直接的な改善である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:09:33 GMT)
Watermark Stealing in Large Language Models [2.1] 本研究では,透かし付きLLMのAPIをほぼリバースエンジニアリングにクエリすることで,実用的なスプーフィング攻撃を可能にすることを示す。
私たちは、自動化されたWSアルゴリズムを初めて提案し、それを、現実的な環境でのスプーフィングとスクラブの最初の包括的な研究で使用します。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:48:29 GMT)
LinkTransformer: A Unified Package for Record Linkage with Transformer Language Models [2.1] LinkTransformerは、人気のある文字列マッチングメソッドの親しみやすさと使いやすさを、ディープラーニングに拡張することを目的としている。
コアとなるのは、4行のコードでリンクを記録するためにトランスフォーマーモデルを適用する、既製のツールキットである。
LinkTransformerには、トレーニング済みのトランスフォーマーセマンティック類似モデルの豊富なリポジトリが含まれている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:01:58 GMT)
Extensively Not P-Bi-Immune promiseBQP-Complete Languages [2.1] まず、量子回路をシミュレートして古典的にシミュレートできる決定問題を決定する無限のインスタンスの存在を確立する。
次に、量子回路のどの制限の下で、無限に多くの古典的にシミュレート可能なインスタンスが存在するかを調べる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:21:18 GMT)
Vision Mamba-based autonomous crack segmentation on concrete, asphalt, and masonry surfaces [2.0] 本稿では, コンクリート, アスファルト, 石英表面のひび割れセグメンテーションのためのVision Mambaベースのフレームワークを提案する。
VMambaベースのエンコーダデコーダネットワークは、最大90.6%の低い浮動小数点演算で高解像度の画像入力を処理することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:47:45 GMT)
μ-Net: A Deep Learning-Based Architecture for μ-CT Segmentation [2.0] X線計算マイクロトモグラフィー(mu-CT)は、医学および生物学的サンプルの内部解剖の高解像度な3D画像を生成する非破壊的手法である。
3D画像から関連情報を抽出するには、興味のある領域のセマンティックセグメンテーションが必要である。
本稿では、畳み込みニューラルネットワーク(CNN)を用いて、Carassius auratusの心臓の完全な形態を自動分割する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:29:08 GMT)
Expected Runtime Comparisons Between Breadth-First Search and Constant-Depth Restarting Random Walks [2.0] 広帯域探索(BrFS)と一定深度再起動ランダムウォーク(RRW)の性能解析を行った。
RRW が BrFS よりも高速であることは,その目標深度に十分な目標がある場合に証明する。
我々の境界線は、木の分岐係数、ゴール深さ、ランダムウォーク深さの誤差とともに、交差点が直線的に成長することを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:00:59 GMT)
RaCIL: Ray Tracing based Multi-UAV Obstacle Avoidance through Composite Imitation Learning [1.9] 本研究では,無人航空機(UAV)における障害物回避の課題を,革新的な模倣学習アプローチによって解決する。
本研究は,障害物検出と回避能力向上におけるレイトレーシングの意義を明らかにするものである。
我々のアプローチは、混雑した環境や動的な環境での高度自律型UAV運用の道を開くものである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:43:24 GMT)
Multi-qubit state visualizations to support problem solving $-$ a pilot study [1.9] 数式-記号的ディラック表記法を単独で用いた場合, 学生のパフォーマンス, 時間, 認知負荷を, 単ビット系および多ビット系における円表記法や次元円表記法と組み合わせて比較した。
学生のパフォーマンスの全体的な違いは、提示された表現によってほとんど検出できないが、問題解決性能は学生に依存し、文脈に依存していることを観察する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:46:35 GMT)
Deep Learning and Chaos: A combined Approach To Image Encryption and Decryption [1.9] 本稿では,新しい3次元ハイパーカオスマップ,2次元メムリスタマップ,畳み込みニューラルネットワーク(CNN)からのハイパーカオス信号を用いた新しい画像暗号化と復号化アルゴリズムを提案する。
暗号アルゴリズムのロバスト性は、キー感度分析(キー要素に対するアルゴリズムの平均感度)によって示される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:56:22 GMT)
No More Sliding-Windows: Dynamic Functional Connectivity Based On Random Convolutions Without Learning [1.8] 本研究では,ランダムな畳み込みに基づく特徴拡張手法を提案する。
実データにおけるジェンダー差分法による研究により、ランダム畳み込み法はスライディングウインドウ法よりも多くの性別差を明らかにすることが明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:02:36 GMT)
A Wiener process perspective on local intrinsic dimension estimation methods [1.7] 近年,深層ニューラルネットワークと生成モデリングの進歩により,局所内在性(LID)推定法が注目されている。
本稿では、Wiener プロセスの観点から、最近の最先端パラメトリック LID 推定手法について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:27:13 GMT)
Artistic-style text detector and a new Movie-Poster dataset [1.7] 本稿では,Criss-Cross Attentionと高密度ブロックを用いて,芸術的テクスト検出の不完全かつ誤診断に対処する手法を提案する。
提案手法はMovie-Posterデータセットに優れ,複数のベンチマークデータセットに対して優れた結果が得られる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:10:28 GMT)
Are there identifiable structural parts in the sentence embedding whole? [1.6] 変圧器モデルからの文の埋め込みは固定長ベクトルで多くの言語情報を符号化する。
これらの埋め込みは、分離できる情報の重なり合う層で構成されているという仮説を探求する。
本稿では,既知のチャンク構造を持つ文と2つの言語知能データセットからなるデータセットを用いた場合について述べる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:58:33 GMT)
A Comprehensive Review of Emerging Approaches in Machine Learning for De Novo PROTAC Design [1.5] 標的タンパク質分解(TPD)は、細胞の自然分解経路を利用して細胞内のタンパク質レベルを調節することを目的としている。
プロテオリシス標的キメラ(PROTAC)はPD戦略の中心にある。
このような複雑な分子を設計するための伝統的な手法には限界がある。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:42:27 GMT)
Dynamic Provisioning of REST APIs for Model Management [1.5] モデル駆動工学(MDE)は、主要な成果物としてモデルに焦点を当てたソフトウェア工学の方法論である。
Webベースのモデリングツールを開発する際の一般的な要件は、モデル管理の迅速かつ効率的な方法を提供することである。
本稿では、モデリング・アズ・ア・サービスを提供するモデリングプラットフォームを構築するために使用できるモデル管理のためのサービスを提供するアプローチを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 23:28:00 GMT)
Compact Proofs of Model Performance via Mechanistic Interpretability [1.4] 本稿では,モデル性能に関する形式的保証を導出し,コンパクトに証明するために,機械的解釈可能性を用いることを提案する。
提案手法は, 最大K$タスクで訓練した151個の小型変圧器の精度について, 下限を正式に証明して試作する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:06:01 GMT)
Multi-Aperture Fusion of Transformer-Convolutional Network (MFTC-Net) for 3D Medical Image Segmentation and Visualization [1.4] 本稿では, トランスフォーマー・畳み込みネットワーク(MFTC-Net)のマルチアパーチャ融合について紹介する。
Swin Transformerの出力とそれに対応する畳み込みブロックを3D融合ブロックを使って統合する。
提案したアーキテクチャは、それぞれDiceとHD95に対して89.73と7.31のスコアを示している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:09:20 GMT)
Fault-tolerant embedding of quantum circuits on hardware architectures via swap gates [1.3] 短期量子コンピューティングデバイスでは、量子ビット間の接続はアーキテクチャ上の制約によって制限される。
本稿では,接続性に制約のある物理ハードウェアに抽象回路を埋め込むのに必要なスワップスキームを設計する戦略を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:05:07 GMT)
Collective preparation of large quantum registers with high fidelity [1.3] 我々は5612量子ビットの大規模な量子レジスタを作成し、前例のない高いグローバル忠実度は0.9956$である。
これは、改良された協調量子情報消去プロトコルを適用することで達成された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:08:48 GMT)
Quantum Variational Solving of Nonlinear and Multi-Dimensional Partial Differential Equations [1.3] 偏微分方程式を数値的に解く変分量子アルゴリズムがLubschらによって提案された。
より広範な非線形PDEと多次元PDEを包含する手法を一般化する。
数値シミュレーションにより,このアルゴリズムは単一集合ブラックスコール方程式のインスタンスを解くことができることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:08:37 GMT)
Efficient and practical Hamiltonian simulation from time-dependent product formulas [1.3] 本稿では,製品公式を用いた量子システムの時間進化手法を提案する。
我々のアルゴリズムは、進化演算子を量子コンピュータ上で直接実装可能な単純なユニタリの積に分解する。
理論的スケーリングは最先端のアルゴリズムと比較すると最適ではないが,提案するアルゴリズムの性能は実際は極めて競争力が高い。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:03:49 GMT)
Partial-transpose-guided entanglement classes and minimum noise filtering in many-body Gaussian quantum systems [1.2] 純粋な状態のものと類似した2モードのバイパルタイト絡み構造は、多体ガウス量子状態のクラスで見られる。
これらの2つの絡み合いクラスは、スカラー場真空から捕獲されたイオン鎖の局所軸運動モードへの理論的および実験的応用に関係している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:06:57 GMT)
Soley: Identification and Automated Detection of Logic Vulnerabilities in Ethereum Smart Contracts Using Large Language Models [1.1] GitHubのコード変更から抽出された実世界のスマートコントラクトのロジック脆弱性を実証的に調査する。
本稿では,スマートコントラクトにおける論理的脆弱性の自動検出手法であるSoleyを紹介する。
スマートコントラクト開発者が実際のシナリオでこれらの脆弱性に対処するために使用する緩和戦略について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 00:15:18 GMT)
Atomic diffraction by nanoholes in hexagonal boron nitride [1.1] 六方晶窒化ホウ素(h-BN)の異なる孔を通るヘリウム物質波の伝播について考察する。
量子力学モデルを用いて、ホール周辺のエッジ原子の偏光性を計算する。
得られた回折パターンは、最小の穴が半径6ドル(約6,500円)の穴の形状と大きさに影響されていることが判明した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:26:16 GMT)
A Systematic Review of Few-Shot Learning in Medical Imaging [1.0] 少ないショットの学習技術は、データの不足を減らし、医療画像分析を強化する。
この体系的なレビューは、医療画像における数ショット学習の概要を包括的に示すものである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:03:52 GMT)
Fault Detection for agents on power grid topology optimization: A Comprehensive analysis [1.0] 我々は、電力網の故障に注目し、パターンを特定し、それらを先入観として検出する。
クラスタ化によって、5つの異なるクラスタを検出し、異なる障害タイプを特定します。
故障を事前に検出し、5つの異なるモデルを評価するためのマルチクラス予測手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:20:43 GMT)
Exploring Biomarker Relationships in Both Type 1 and Type 2 Diabetes Mellitus Through a Bayesian Network Analysis Approach [1.0] 本研究では,上海1型と2型糖尿病データセットの分析にベイズネットワーク構造学習を適用した。
構築されたベイズネットワークは、特に2型糖尿病において、ルート平均2乗誤差(RMSE)が18.23mg/dLである顕著な予測精度を示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:27:34 GMT)
PenSLR: Persian end-to-end Sign Language Recognition Using Ensembling [1.0] Pen SLRは、IMU(Inertial Measurement Unit)とディープラーニングフレームワークによって駆動される5つのフレキシブルセンサーで構成されるグローブベースの手話システムである。
本稿では,スターアライメント(Star Alignment)と呼ばれる複数のシーケンスアライメントアルゴリズムを活用することで,新しいアンサンブル手法を提案する。
評価の結果,Pen SLRの単語精度は94.58%,96.70%であった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:59:34 GMT)
Exploring Factual Entailment with NLI: A News Media Study [0.9] 本稿では,FactRelの導入により,事実性と自然言語推論(NLI)の関係について検討する。
分析の結果,事実支援ペアの84%,不明な事実支援ペアの63%はNLIの関与や矛盾にはならないことがわかった。
我々は,新しいデータセットをペアで分類するモデルを用いて実験を行い,いくつかの場合において,注釈付きデータセットに基づいてGPT-4で合成データを生成することにより,性能が向上することを示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:47:55 GMT)
A hybrid quantum-classical framework for computational fluid dynamics [0.9] 現在の量子コンピューティングのパワーを解放するために、古典的および量子コンピューティングのハイブリッドCFDフレームワークが提案されている。
従来のCFDソルバは、量子線型代数ライブラリと弱い形で結合し、協調計算を実現する。
CFDにおける提案フレームワークの実現可能性と量子線形アルゴリズムの正しさを検証するために,いくつかの典型的なケースが実施されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:36:30 GMT)
Learning in Wilson-Cowan model for metapopulation [0.9] メタポピュレーションのためのWilson-Cowanモデルは、脳の異なる皮質下領域を連結ノードとして扱う。
このようなメタポピュレーションモデルのダイナミクスに安定したアトラクタを組み込むことで、高い画像とテキストの分類精度を達成できる学習アルゴリズムに変換する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:45:03 GMT)
Maximum Likelihood Estimation of the Direction of Sound In A Reverberant Noisy Environment [0.9] 残響環境における音の方向を音の伝搬の基本原理から推定する新しい手法について述べる。
音波分解後の方向成分の時間遅延とエネルギーからSNR適応特性を利用する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:42:22 GMT)
Deep-Learning Approach for Tissue Classification using Acoustic Waves during Ablation with an Er:YAG Laser (Updated) [0.8] レーザー手術において、周囲の組織への損傷を防ぐため、信頼性の高いフィードバックシステムが不可欠である。
レーザーアブレーション時に発生する音波を組織分類法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:25:33 GMT)
The Effects of Embodiment and Personality Expression on Learning in LLM-based Educational Agents [0.7] 本研究は,人格表現と体格が,教育的会話エージェントにおける人格認識と学習にどのように影響するかを考察する。
教育アプリケーションに適したLLMベースの会話支援を統合することで、既存のパーソナリティ駆動型会話エージェントフレームワークを拡張した。
1)対話を通して人格を伝達する対話のみのモデル,(2)対話のみで人格を表現するアニメーション人間モデル,(3)対話と身体と顔のアニメーションを通して人格を表現するアニメーション人間モデル,の3つのモデルを評価する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:38:26 GMT)
CTIBench: A Benchmark for Evaluating LLMs in Cyber Threat Intelligence [0.7] CTIBenchは、CTIアプリケーションにおける大規模言語モデルの性能を評価するために設計されたベンチマークである。
これらのタスクにおけるいくつかの最先端モデルの評価は、CTIコンテキストにおけるその強みと弱みに関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:14:26 GMT)
Incorporating Memory into Propagation of 1-Electron Reduced Density Matrices [0.7] 本稿では,時間依存構成相互作用における1ドル電子還元密度行列のメモリ依存性を理解するために,本手法を適用した。
我々の導出は、基底集合、電子の数、波動関数におけるスレーター行列式の選択に関係なく、任意のTDCI系に適用される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:48:37 GMT)
Detach-ROCKET: Sequential feature selection for time series classification with random convolutional kernels [0.7] ROCKETに基づくモデルにおいて, 逐次的特徴分離(Sequential Feature Detachment, SFD)を導入する。
SFDは、オリジナルの機能の10%しか使用せずに、より良いテスト精度でモデルを作成することができる。
また,特徴量とモデル精度の最適バランスを決定するためのエンドツーエンドの手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:36:56 GMT)
Accelerating Phase Field Simulations Through a Hybrid Adaptive Fourier Neural Operator with U-Net Backbone [0.7] ニューラル演算子学習の最近の進歩にインスパイアされた機械学習(ML)モデルであるU-AFNO(Adaptive Fourier Neural Operators)を提案する。
U-AFNOを使って、現在の時間ステップでフィールドを後の時間ステップにマッピングするダイナミクスを学習します。
高忠実度数値解法と同等の精度で重要なミクロ構造統計とQoIを再現する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:13:23 GMT)
Comparative Benchmarking of Failure Detection Methods in Medical Image Segmentation: Unveiling the Role of Confidence Aggregation [0.7] 本稿では,医療画像セグメンテーションにおける故障検出手法の評価を目的とした総合的なベンチマークフレームワークを提案する。
我々は、現在の障害検出指標の強度と限界を特定し、リスクカバレッジ分析を全体的評価アプローチとして推奨する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:46:49 GMT)
Link Prediction with Untrained Message Passing Layers [0.7] グラフニューラルネットワークにおける各種未学習メッセージパッシング層の利用について検討する。
トレーニングされていないメッセージパッシング層は、完全にトレーニングされたMPNNと比較して競争力があり、パフォーマンスも優れていることが分かりました。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:46:34 GMT)
Vastextures: Vast repository of textures and PBR materials extracted from real-world images using unsupervised methods [0.7] Vastexturesは50,000のテクスチャとPBR素材のリポジトリで、教師なしのプロセスを用いて現実世界の画像から抽出される。
天然画像から採取した2次元テクスチャと、これらのテクスチャから生成されたSVBRDF/PBR材料からなる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:36:01 GMT)
Quantum resolution limit of long-baseline imaging using distributed entanglement [0.7] それぞれの望遠鏡で空間モードソートを行う受信機は、望遠鏡から収集した光に作用する最も一般的なマルチモード干渉計を模倣することができる。
我々は、この絡み合い支援戦略が、何個もの望遠鏡を含む複雑な定量的イメージングタスクの量子制限精度を達成するためにどのように使用できるかについて論じる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:50:10 GMT)
Generation of Asset Administration Shell with Large Language Model Agents: Toward Semantic Interoperability in Digital Twins in the Context of Industry 4.0 [0.7] 本研究は,デジタル双生児におけるセマンティック・インターオペラビリティを実現するための新しいアプローチを提案する。
業界 4.0 におけるデジタル双対モデルとしてアセット管理シェル (AAS) の作成を支援する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:04:06 GMT)
Inference of Sequential Patterns for Neural Message Passing in Temporal Graphs [0.7] HYPA-DBGNNは、グラフ上の時系列データにおける異常なシーケンシャルパターンの推論を組み合わせた、新しい2段階のアプローチである。
本手法は超幾何グラフアンサンブルを利用して1階グラフと高階グラフの両方において異常なエッジを同定する。
我々の研究は、時間的および因果配列異常を利用した統計的に情報を得たGNNを初めて導入した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:41:12 GMT)
Collective Bit Flipping-Based Decoding of Quantum LDPC Codes [0.7] 可変次数-3(dv-3)QLDPC符号の繰り返し復号化による誤り訂正性能と復号遅延の両方を改善した。
我々の復号方式は、ビットフリップ(BF)デコーディングの修正版、すなわち2ビットビットフリップ(TBF)デコーディングを適用することに基づいている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:51:48 GMT)
Compressing Search with Language Models [0.6] 本稿では,探索データの次元性を低減するための新しい手法を提案する。
私たちは、ユーザー定義のルールなしで、個々の用語で多くの情報を保持します。
実世界の事象を検索データのみを用いて推定するための制約付き検索モデルであるCoSMoを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:43:49 GMT)
ammBoost: State Growth Control for AMMs [0.6] 自動市場メーカ(AMM)は、分散ファイナンス(DeFi)アプリケーションの主要な例である。
その人気と高いトレーディング活動により、数百万のオンチェーントランザクションが深刻なスケーラビリティの問題を引き起こしました。
本稿では,新しいサイドチェーンアーキテクチャをレイヤ2ソリューションとして利用することにより,AMMのオンチェーンストレージオーバーヘッド問題に対処する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:34:05 GMT)
Computational Approaches to the Detection of Lesser-Known Rhetorical Figures: A Systematic Survey and Research Challenges [0.6] 修辞的な人物は、テキストをより面白く、覚えやすく、説得力のあるものにすることで、日々のコミュニケーションにおいて重要な役割を担います。
テキストの意味を十分に理解するためには、修辞的な数字を計算的に検出することが重要である。
我々は、あまり知られていないレトリックフィギュアに対する計算手法の概要を概観する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:31:34 GMT)
Feature Fusion for Human Activity Recognition using Parameter-Optimized Multi-Stage Graph Convolutional Network and Transformer Models [0.6] この研究は、HuGaDB、PKU-MMD、LARa、TUGデータセットからの知覚データを用いている。
PO-MS-GCNとTransformerの2つのモデルが訓練され評価され、PO-MS-GCNは最先端モデルを上回った。
HuGaDBとTUGは高い精度とf1スコアを獲得し、LARaとPKU-MMDは低いスコアを示した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:44:06 GMT)
Benchmarking mortality risk prediction from electrocardiograms [0.6] 大規模な病院所有の心電図データベースは、患者の死亡をモデル化し予測するために使用することができる。
MIMIC-IV(英語: MIMIC-IV)は、2023年9月にリリースされた、アメリカ合衆国の病院システムから80,000のECGを含む、最初の同等のパブリックデータセットである。
これらのデータセットは、より広範な聴衆にECGサバイバルモデリングを探求するための優れたリソースを提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:37:17 GMT)
Towards a Science Exocortex [0.6] 我々はエージェントAIシステムにおける技術の現状をレビューし、これらの手法をどのように拡張して科学により大きな影響を与えるかについて論じる。
科学の外食はAIエージェントの群れとして設計することができ、各エージェントは特定の研究者のタスクを個別に合理化することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:32:32 GMT)
Incorporating temporal dynamics of mutations to enhance the prediction capability of antiretroviral therapy's outcome for HIV-1 [0.6] 歴史を包含するモデル(H)とそれを使用しないモデル(NH)を比較する。
重要なウィルコクソン試験の結果は、歴史的情報を組み込むことで、治療結果の予測精度が一貫して向上することを確認した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:07:56 GMT)
Digital Twinning of a Pressurized Water Reactor Startup Operation and Partial Computational Offloading in In-network Computing-Assisted Multiaccess Edge Computing [0.5] 本稿では,原子力プラントディジタルツイン(DT)における複雑なヒューマンアクション(HA)の表現の課題について述べる。
本稿では,オフロード決定,オフロード率,リソース割り当てを最適化する分散アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:13:00 GMT)
Sampling Strategies in Bayesian Inversion: A Study of RTO and Langevin Methods [0.5] 本稿では,逆問題に対する2種類のサンプリング手法について検討する。
本稿では,2つのアプローチの主な概念的,理論的相違点を強調し,実践的な観点から比較する。
サンプリング手法の選択が再現の質に重大な影響を及ぼし,RTO法がパラメータの選択に対してより堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:08:27 GMT)
Quantum Geometry and Entanglement in Two-dimensional Insulators: A View from the Corner Charge Fluctuation [0.5] 非相互作用電子系の一般的な$textitlattice$システムであっても、コーナー電荷のゆらぎは普遍的な情報を明らかにする。
また、角絡みエントロピーのレンズを通して量子幾何学と量子情報との間の顕著な接続を強調した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:03 GMT)
Causal Fair Machine Learning via Rank-Preserving Interventional Distributions [0.5] 我々は、個人が架空の、規範的に望まれる(FiND)世界で等しければ、規範的に等しくなると定義する。
本研究では,それが保持する特定のFiND世界を定義するために,ランク保存的介入分布を提案する。
我々のワープアプローチは、最も差別された個人を効果的に識別し、不公平を緩和することを示します。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:51:37 GMT)
Bayesian Deep ICE [0.5] ディープインディペンデントコンポーネント推定(DICE)は、機能エンジニアリング抽出法として、現代の機械学習に多くの応用がある。
本稿では,予測最大化(EM)とマルコフ・チェイン・モンテカルロ(MCMC)アルゴリズムによる全後方サンプリングによる両点推定が可能な,独立成分分析の潜在変数表現を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:18:58 GMT)
The Infinite-Dimensional Quantum Entropy: the Unified Entropy Case [0.5] 統一量子エントロピーの概念は無限次元系の場合にまで拡張されている。
導入された統一エントロピーの既知の(有限次元の場合)基本的性質の一部は、ケーススタディにまで拡張されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:47:16 GMT)
A practical existence theorem for reduced order models based on convolutional autoencoders [0.5] 部分微分方程式 (PDE) と還元次数モデリング (ROM) の分野ではディープラーニングが人気を博している。
CNNベースのオートエンコーダは、複雑な非線形問題に対処する際、低基底法などの確立された手法よりも極めて効果的であることが証明されている。
パラメーター対解写像が正則である場合、CNNベースの自己エンコーダに対して新しい実用的存在定理を提供する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:42:52 GMT)
A new model for natural groupings in high-dimensional data [0.5] クラスタリングは、一連のポイントをグループに分割することを目的としています。
最近の実験では、異なるバイナリグルーピングを形成するいくつかの高次元データセットが発見されている。
本稿では,この現象を説明できる確率モデルについて述べる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:02:32 GMT)
Unsupervised Domain Adaptation for Pediatric Brain Tumor Segmentation [0.4] 成人グリオーマから小児グリオーマへの非教師なし領域適応を行うためのドメイン適応nnU-Net(DA-nnUNet)を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:55:02 GMT)
Anvil: An integration of artificial intelligence, sampling techniques, and a combined CAD-CFD tool [0.4] 本稿では,CADモデリング用FreeCADとCFD解析用OpenFOAMを組み合わせたオープンソースのCAD-CFDツールAnvilを紹介する。
Anvilは、データ生成、CFD評価、形状最適化の3つのモードで形状最適化のための科学的機械学習ツールとして機能する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:29:22 GMT)
User Story Tutor (UST) to Support Agile Software Developers [0.4] User Story Tutor (UST)と呼ばれるWebアプリケーションを設計、実装、適用、評価しました。
USTは、可読性のために与えられたユーザストーリーの記述をチェックし、必要に応じて、改善のための適切なプラクティスを推奨します。
USTは、ユーザストーリーを書いたりレビューしたりする際に、アジャイル開発チームの継続的な教育をサポートするかもしれない。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 01:55:01 GMT)
Forecasting with Deep Learning: Beyond Average of Average of Average Performance [0.4] 予測モデルの評価と比較の現在のプラクティスは、パフォーマンスを1つのスコアにまとめることに集中しています。
複数の視点からモデルを評価するための新しいフレームワークを提案する。
このフレームワークの利点は、最先端のディープラーニングアプローチと古典的な予測手法を比較して示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:28:22 GMT)
Meta-learning and Data Augmentation for Stress Testing Forecasting Models [0.3] モデルがストレスにさらされていると考えられるのは、高次のエラーや不確実性の増加など、ネガティブな振る舞いを示す場合である。
本稿では,MAST(Meta-learning and data Augmentation for Stress Testing)と呼ばれる新しいフレームワークに貢献する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:59:33 GMT)
SmartML: Towards a Modeling Language for Smart Contracts [0.3] 本稿では,プラットフォームに依存しない,理解しやすいスマートコントラクトのモデリング言語であるSmartMLを提案する。
セキュリティ脆弱性に対処する上での役割に焦点をあてて、その形式的意味論と型システムについて詳述する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:39:00 GMT)
Bounding Random Test Set Size with Computational Learning Theory [0.3] 私たちは、この質問に答えるための確率論的アプローチが、テストコンテキストにどのように適用できるかを示します。
私たちは、ソースコードのカバレッジターゲットの数だけを知ることで、これを最初に実現しています。
大規模なJavaユニットと自律運転システムで、この境界を検証します。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:09:49 GMT)
Thinking Inside The Box: Privacy Against Stronger Adversaries [0.3] 統計的暗号プリミティブの拡張について検討する。
本研究では, 漏れ耐性の秘密共有, 非悪性抽出器, 免疫理想片道機能について検討した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:40:28 GMT)
Guardrails for avoiding harmful medical product recommendations and off-label promotion in generative AI models [0.3] ジェネレーティブAI(GenAI)モデルは、安全と有効性について十分な評価を受けていない医療製品の使用、あるいは規制当局の承認を受けることができる。
本稿では,潜在的に有害な製品レコメンデーションを同定するアプローチを提案し,近年のマルチモーダルな大規模言語モデルを用いてそれを実証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:50:26 GMT)
Identifying Easy Instances to Improve Efficiency of ML Pipelines for Algorithm-Selection [0.2] 本稿では,アルゴリズムの選択を必要とせず,ジェネリストソルバを用いて簡単に解決できる簡単なインスタンスを同定する手法を提案する。
これにより、機能計算に関連する計算予算が削減され、ASパイプライン内の他の場所で使用できるようになる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:25:04 GMT)
Evaluating the Robustness of Deep-Learning Algorithm-Selection Models by Evolving Adversarial Instances [0.2] ディープ畳み込みネットワーク(DNN)は、ニューラルネットワークドメインにおけるアルゴリズム選択の実行にますます利用されている。
逆のサンプルは、データセットによって元のインスタンスの最大56%から生成される。
進化的アルゴリズム(EA)を用いて、2つの既存のベンチマークからオンラインビンパッキングのためのインスタンスの摂動を見つけ、トレーニングされたDRNを誤分類させます。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:48:44 GMT)
Scalable Artificial Intelligence for Science: Perspectives, Methods and Exemplars [0.2] 複雑な問題に対処するためには,高性能コンピューティングプラットフォーム上での人工知能のスケールアップが不可欠である。
この視点は、認知シミュレーション、科学調査のための大規模言語モデル、医療画像分析、物理インフォームドアプローチといった科学的ユースケースに焦点を当てている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:29:29 GMT)
Enabling more efficient and cost-effective AI/ML systems with Collective Mind, virtualized MLOps, MLPerf, Collective Knowledge Playground and reproducible optimization tournaments [0.1] コミュニティの取り組みとして、AI、ML、その他の一般的なワークロードに対して、より安く、より速く、よりエネルギー効率の高いワークロードを自動で共同設計する取り組みを紹介します。
私は、急速に進化するオープンソースおよびプロプライエタリなAI/MLモデル、データセット、ソフトウェア、ハードウェアにわたる複雑なアプリケーションの構築、実行、プロファイリング、最適化という面倒なプロセスをモジュール化、自動化、仮想化するCMを開発しました。
CMとCM4MLOpsを寄付して、学界と業界を結びつけることで、AIやその他の新興ワークロードを、最も効率的かつコスト効率のよい方法で構築し、実行する方法を学びました。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:55:03 GMT)
eagerlearners at SemEval2024 Task 5: The Legal Argument Reasoning Task in Civil Procedure [0.0] 本研究では,3大言語モデルを用いたデータ分類におけるゼロショット法の性能について検討した。
私たちの主要なデータセットは、米国民事訴訟のドメインから来ています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:57:44 GMT)
Why Quantum-like Models of Cognition Work [0.0] 神経膜の状態点によって実行されるブラウン運動は、基板の拡散$sigma$の係数に代えて$hbar/m$のシュリンガー様方程式を生成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:25:57 GMT)
Validity condition for high-fidelity Digitized Quantum Annealing [0.0] 我々は,高忠実度デジタルアディバティックタスクに対する有効条件を開発する。
このようなハイブリッドモデルの性能は、断熱的妥当性に関する基本的な制約によって制限されていることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:55:14 GMT)
Validation of ML-UQ calibration statistics using simulated reference values: a sensitivity analysis [0.0] いくつかの一般的な機械学習不確実量化(ML-UQ)キャリブレーション統計は、予め定義された参照値を持っていない。
実際の不確実性から導出される合成校正データセットに基づく模擬参照値は,この問題を緩和するために提案されている。
本研究は, この問題の諸側面を考察し, 検証に使用する生成分布の選択に過度に敏感な統計結果を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:43:10 GMT)
Unambiguous Recognition Should Not Rely Solely on Natural Language Training [0.0] 擬似形式と擬似テキストの混合データセットに基づいて学習したテキスト認識モデルを提案する。
実験により,本手法は「バイアス」を低減し,テキスト認識の精度と堅牢性を向上することが示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:38:36 GMT)
Tunneling dynamics of the relativistic Schrödinger/Salpeter equation [0.0] サルペター方程式に従って進化する粒子波束の電位散乱とトンネル力学について検討した。
サルペーター方程式のトンネル特性は標準相対論的波動方程式と異なる。
これらの溶液は、クライントンネルの欠如と、光円錐の外側を伝播する送信波束の分画に対する電位の影響によって特徴づけられる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:49:34 GMT)
Towards Bayesian Data Selection [0.0] 例えば、セミ教師付き学習、アクティブラーニング、マルチアームのバンディット、ベイズ最適化などがある。
意思決定問題としてデータ選択をフレーミングすることで、このようなデータ追加を意思決定理論に組み込む。
半教師付き学習における自己学習の具体例について,各ベイズ基準を導出する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:27:13 GMT)
The Progression of Transformers from Language to Vision to MOT: A Literature Review on Multi-Object Tracking with Transformers [0.0] トランスフォーマーニューラルネットワークアーキテクチャは、自動回帰シーケンス・ツー・シーケンスモデリングを可能にする。
トランスフォーマーは様々なパターン認識タスク、特にコンピュータビジョンにも応用されている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:45:28 GMT)
The Fermionic Entanglement Entropy of the Vacuum State of a Schwarzschild Black Hole Horizon [0.0] 我々は、シュワルツシルトブラックホール水平線のフェルミオンエンタングルメントエントロピーを、無限遠における観測者の正規化真空状態に対して解析する。
変数の分離とディラックプロパゲータの積分表現を用いて、絡み合いエントロピーは事象の地平線上の占有角運動量モードの1倍の精度で計算される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:16:39 GMT)
The Efficacy of Conversational Artificial Intelligence in Rectifying the Theory of Mind and Autonomy Biases: Comparative Analysis [0.0] 本研究は、認知バイアスの是正と人間とAIの相互作用における影響の認識における会話型人工知能(CAI)の有効性を評価する。
この研究は、典型的なユーザとボットの相互作用をシミュレートする臨床ベースの仮想ケースシナリオを用いた構造化手法を用いている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:18:29 GMT)
The Born rule for quantum probabilities from Newton's third law [0.0] 本稿では、なぜ量子論における確率が波動関数あるいは振幅の正方形によって決定されるのかという古い疑問に対する単純な物理解を提案する。
本稿では、なぜ量子論における確率が波動関数あるいは振幅の正方形によって決定されるのかという古い疑問に対する単純な物理解を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:47:49 GMT)
Testing network clustering algorithms with Natural Language Processing [0.0] 本稿では,オンライン生産をソーシャル・グループに分類できる個人の集合として,文化に基づくオンライン・ソーシャル・グループの定義を提案する。
この分析の重要な結果は、自然言語処理分類との一致を利用して、コミュニティ検出アルゴリズムをスコアリングできることである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:54:32 GMT)
Testing multipartite productness is easier than testing bipartite productness [0.0] 我々は$Omega(n / log n)$コピーが必要であることを示す(固定$epsilon leq frac12$の場合)。
本稿では, グラフ状態のテストと, エンタングルメントの一般化幾何測度を計算することの意味について論じる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:36:57 GMT)
Tempora-Fusion: Time-Lock Puzzle with Efficient Verifiable Homomorphic Linear Combination [0.0] Time-Lock Puzzles (TLP) は、機密情報を未来へ安全に送信するために開発された。
ホモモルフィック TLP は、異なるクライアントのパズルの計算を可能にする TLP の重要な変種である。
既存の準同型TLPは、計算結果の正しさを検証するためのサポートを欠いている。
我々は,サーバが異なるクライアントのパズルの同型線形結合を実行することができるTLPであるTempora-Fusionを導入することで,この制限に対処する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:39:38 GMT)
Star+: A New Multi-Domain Model for CTR Prediction [0.0] 本稿では,スターモデルにインスパイアされたクリックスルーレート(CTR)予測のための新しいマルチドメインモデルであるStar+を紹介する。
産業用および公共用両方のデータセットに対する実験により、Star+は予測精度と効率を大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:03:35 GMT)
Small Circle Expansion for Adjoint QCD$_2$ with Periodic Boundary Conditions [0.0] 超対称性は随伴質量二乗の$g2 hvee/ (2pi)$で、$hvee$は$G$の双対コクセター数である。
我々はその結果を他のゲージ群G$に一般化する。この超対称性は随伴する質量二乗の$g2 hvee/ (2pi)$で、$hvee$は2つのコクセター数の$G$である。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:07:42 GMT)
Single-image camera calibration with model-free distortion correction [0.0] 本稿では,センサ全体をカバーする平面スペックルパターンの単一画像から,キャリブレーションパラメータの完全な集合を推定する方法を提案する。
デジタル画像相関を用いて校正対象の画像点と物理点との対応を求める。
プロシージャの最後には、画像全体にわたって、密度が高く均一なモデルフリーな歪みマップが得られる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:49:37 GMT)
Robust prediction under missingness shifts [0.0] 最高の予測性能は、欠落している価値の情報の性質を利用するモデルによって達成される。
ベイズ予測器は、欠落確率が観測データにのみ依存する無知なシフトによって変化しないことを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:39:30 GMT)
Response to "The measurement postulates of quantum mechanics are not redundant" [0.0] これらの理論のそれぞれがヒルベルト空間の光線ではない純粋状態を含むことを証明している。
また、これらの選択肢が混合状態の有限次元性に反することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:01:54 GMT)
Relation Extraction with Fine-Tuned Large Language Models in Retrieval Augmented Generation Frameworks [0.0] 関係抽出(RE)は、構造化されていないデータを知識グラフ(KG)のような構造化形式に変換するために重要である
プレトレーニング言語モデル(PLM)を活用した最近の研究は、この分野で大きな成功を収めている。
本研究では、微調整LDMの性能と、Retrieval Augmented-based (RAG) REアプローチへの統合について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:57:05 GMT)
Relating non-local quantum computation to information theoretic cryptography [0.0] 非局所量子計算(NLQC)は位置検証スキームの不正な方法であり、AdS/CFT対応の文脈に現れている。
我々は、NLQCの特別な場合として、$f$-routing(英語版)と呼ばれ、シークレットプリミティブの条件開示の量子アナログと等価であることを示す。
これらの暗号プリミティブに位置検証を関連付けることで、暗号文学における多くの結果がNLQCに新しい意味を与える。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:51:49 GMT)
Quantum fingerprints of self-organization in spin chains coupled to a Kuramoto model [0.0] フロッケ理論は周期駆動量子系の力学を記述するために広く用いられるフレームワークである。
創発的な対称性を持つ周期的な定常状態に達する自己組織化現象を示すドライブについて考察する。
この結果は、デジタルおよびアナログプラットフォームにおける短期量子デバイスで実験的に実装することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:22:29 GMT)
Quantum and classical symmetries [0.0] 我々は、単純な古典物理学の立場から、好奇的でパラドックス的な一連の集合に関するやや非標準的な見解を提案する。
これらの類似は、古典物理学の比較的単純でよく知られたモデルの例で従う。
このテキストは、量子力学の基礎に興味を持つ高校生や大学生に宛てたミニコースと見なすことができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:45:42 GMT)
Public Constitutional AI [0.0] AI当局の権限はますます強まりつつある。
AIシステムが効果的なガバナンスに必要な正当性を確保するには、どうすればいいのか?
このエッセイは、AIの正当性を確保するためには、AIシステムの設計と制約に一般市民が関与する方法が必要である、と論じている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:00:01 GMT)
Process Algebra Based Tool Coordination Architectures in Raku and Go [0.0] 本稿では,プロセス代数を用いたプロジェクトソフトウェア工学の現在進行中の研究について述べる。
この新しいシミュレーターは、プロセス代数に基づいたツールコーディネートアーキテクチャであるToolBusを使用する。
プログラミング言語のRakuとGoでは、ToolBusのプリミティブを実装しています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:54:17 GMT)
Probing universal critical scaling with scan-DMRG [0.0] 次数パラメータと3つの最小モデルに対する絡み合いエントロピーについて、高品質なデータ崩壊を示す。
我々は,磁化ウェス-ズミノ-ウィッテンおよびフラストレーションされたハルデン鎖の非磁性イジング転移に作用すると,スキャン-DMRGが普遍的臨界スケーリングを捕捉することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:34:40 GMT)
Probing Yu-Shiba Rushinov state via quantum noise and $Δ_T$ noise [0.0] スピン偏極型$Delta_T$ノイズは、YSR境界状態のプローブとしての$Delta_T$ノイズよりも優れたツールであることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:22:49 GMT)
Predicting Ising Model Performance on Quantum Annealers [0.0] ハードウェアネイティブなIsing Modelの特性と,その性能を,現在および次世代アニーラーで解析する。
次に、これらの実験をD-Waveの次世代デバイスのプロトタイプに拡張し、さらなる性能向上を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:26:31 GMT)
Phase driven exact and unconventional superradiance phase transition in non-Hermitian cascaded Rabi cavities [0.0] この研究は、非エルミタンカスケードラビ空洞における位相駆動対称性の破れと正確かつ非伝統的な超放射相転移を報告した。
他の$varphi$の場合、位相境界は$mathcalJ$と次元のない原子-光学場結合強度$g$で決定される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:13:50 GMT)
Phase diagram of non-Hermitian BCS superfluids in a dissipative asymmetric Hubbard model [0.0] 非エルミタン(NH)の非対称ホッピングと複素数値相互作用を持つフェルミ・ハッバードモデルについて検討する。
ホッピングの弱い非対称性は、BdGハミルトニアンの固有値の虚部のみに影響を与えるので、BCS超流動性には影響しない。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:37:04 GMT)
Peirce in the Machine: How Mixture of Experts Models Perform Hypothesis Construction [0.0] これは専門家の混在による機能的能力の増大によるものであると我々は主張する。
我々は、専門家の混合は、パーシアンな仮説構成の感覚における誘惑的推論の一種である、と結論づける。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:44:37 GMT)
Optimizing measurement tradeoffs in multiparameter spatial superresolution [0.0] セントロイドのジョイント推定と2つの非コヒーレントな点源の分離のためのクラムエル・ラオ境界は飽和できない。
本研究では,任意の点展開関数の最適測定値を求める。
我々の測定は一連のトレードオフの範囲内で調整可能であり、分離やセンタロイドからより多くの情報を抽出できると同時に、合計情報が可能な限り最大であることを保証することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:00 GMT)
Objectivity of classical quantum stochastic processes [0.0] 我々は、その観測可能な連続的な量子測定がコルモゴロフ整合条件を満たすとき、量子系について何を結論付けることができるかを検討する。
コルモゴロフの一貫した測定によって示唆される軌道解釈は、逐次測定以外の文脈にも適用できると言える。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:11:00 GMT)
OQuPy: A Python package to efficiently simulate non-Markovian open quantum systems with process tensors [0.0] オープンソースソフトウェアパッケージであるOQuPy(PythonのOpen Quantum System)のメジャーリリースを紹介します。
OQuPyは、この課題に対処する、最近開発された数値的な方法をいくつか提供する。
我々の目標は、量子化学、量子センシング、量子情報といった分野におけるオープン量子システムの研究者にとって、容易にアクセスできるツールを提供することです。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:59:34 GMT)
Non-Hermitian Floquet dynamics in absorption spectroscopy [0.0] 弱いプローブの極限では、リンドブラッド・マスター方程式は関連する定常状態コヒーレンスに対してより小さな線形方程式系に還元される。
媒体の複雑な感受性は、崩壊する着衣状態の個々の寄与の観点から表すことができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 11:52:50 GMT)
Noise-Robust Loss Functions: Enhancing Bounded Losses for Large-Scale Noisy Data Learning [0.0] 大きな注釈付きデータセットには、必然的にノイズのあるラベルが含まれており、ラベルを覚えやすいようにディープニューラルネットワークをトレーニングする上で大きな課題となる。
ノイズ・ロバスト損失関数はこの問題に対処するための重要な戦略として現れてきたが、過度に適合しないロバスト損失関数を作成することは依然として困難である。
本稿では,ロジットバイアス(logit bias)と表される新しい手法を提案し,ロジットに正しいクラスの位置で実数$epsilon$を付加する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:02:08 GMT)
Never Gonna Give You Up: Exploring Deprecated NULL Ciphers in Commercial VoWiFi Deployments [0.0] 多くのオペレーターがVoice over Wi-Fi(VoWiFi)を使って、顧客は自分のコアネットワークを公開インターネット上でダイアルできる。
WiFiまたはインターネットドメイン上の悪意あるアクターから保護するために、トラフィックは一連のIPsecトンネルを介して送信される。
クライアント側とサーバ側の両方で、商用のVoWiFiデプロイメント内のセキュリティ構成を分析したいと思っています。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:24:15 GMT)
Modelled Multivariate Overlap: A method for measuring vowel merger [0.0] 本稿では,母音重複の定量化手法を提案する。
英語の4方言におけるPIN-PEN統合をターゲットとしたコーパス音声データの評価を行った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:56:26 GMT)
Meta-experiments: Improving experimentation through experimentation [0.0] 我々は「メタ実験」と呼ばれる実験プロセスで実験を行う。
メタ実験の例を例に、このアプローチの課題について論じる。
また,実験スペシャリストが自身の実験を行う際の「ドッグフード」のメリットも指摘した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:23:00 GMT)
Lomas: A Platform for Confidential Analysis of Private Data [0.0] Lomasは、公共機関が保持するデータの潜在能力をフルに実現するために設計された、オープンソースの新しいプラットフォームである。
承認された研究者や政府アナリストなどの認証されたユーザは、機密データセット上でアルゴリズムを実行することができる。
Lomasはデータをユーザに公開せずにこれらのアルゴリズムを実行し、差分プライバシーによって保護された結果を返す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:16:58 GMT)
Leveraging Knowledge Distillation for Lightweight Skin Cancer Classification: Balancing Accuracy and Computational Efficiency [0.0] 皮膚がんは公衆衛生にとって大きな関心事であり、報告されているがんの3分の1を占めている。
本稿では,軽量ながら高い性能の分類器を作成するための知識蒸留に基づく手法を提案する。
高精度でコンパクトなサイズを持つため、われわれのモデルは、特に資源制約のある環境では、正確な皮膚がん分類の候補となる可能性がある。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:13:09 GMT)
It Is Not About What You Say, It Is About How You Say It: A Surprisingly Simple Approach for Improving Reading Comprehension [0.0] 3つのデータセットにまたがる9つの大きな言語モデルで実験した結果、質問の前にコンテキストを提示することで、モデルのパフォーマンスが向上することがわかった。
さらに、最良のメソッドは驚くほど単純で、入力にいくつかのトークンを連結するだけで、結果として最大36%の精度の改善が得られます。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:43:11 GMT)
Integrating Generative AI with Network Digital Twins for Enhanced Network Operations [0.0] 本稿では,ネットワークディジタル双生児と生成AIの相乗効果について検討する。
生成AIがネットワークデジタル双生児の精度と運用効率をいかに向上させるかを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:54:58 GMT)
Integrated thermo-optic phase shifters for laser-written photonic circuits operating at cryogenic temperatures [0.0] フェムト秒レーザー導波路書き込み(FLW)により作製したプログラマブルガラスフォトニック集積回路(PIC)について報告する。
両条件とも,電力消費が最小であり,温度勾配が制限された信頼性PIC操作を実現した。
この進歩は、レーザー書き型フォトニックチップで実現された完全に統合された量子アーキテクチャへの道を開く、低温で互換性のあるプログラム可能なFLW PICとして初めてのものである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:26:33 GMT)
Improving physics-informed DeepONets with hard constraints [0.0] 現在の物理学インフォームド(標準またはディープ演算子)ニューラルネットワークは、解いている微分方程式系の初期および/または境界条件を正確に学習することに依存している。
本稿では,初期および/または境界条件を学習する必要がなく,予測された解で正確に表現されるような,現在の物理インフォームド深層学習戦略を改善することを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:54:58 GMT)
Improving Generative Adversarial Networks for Video Super-Resolution [0.0] 本研究は,ビデオ超解像課題における生成的敵ネットワークの改善方法について検討する。
我々はPak Signal-to-Noise Ratio (PSNR) と構造類似度指数 (SSIM) を用いて評価を行った。
これらの手法の統合により、PSNRが11.97%改善し、SSIMが8%改善した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:57:51 GMT)
Impact of Loss Mechanisms on Linear Spectra of Excitonic and Polaritonic Aggregates [0.0] 空洞内に閉じ込められたキラル分子集合体のCDスペクトルの最初の数値探査を行った。
極性CDスペクトルに対する経験的損失の影響は、高度に部位依存性があると考えられる。
経路積分リンドブラッド力学の枠組みを深く活用する上でのこれらの効果について検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:16:33 GMT)
Hunting for Polluted White Dwarfs and Other Treasures with Gaia XP Spectra and Unsupervised Machine Learning [0.0] 太陽系外惑星物質によって汚染された白色小星 (WD) は、太陽系外惑星の内部を観測する機会を与える。
大気中の複数の金属を含むWDの数を大幅に増やすことを目標としている。
この選択法により, 大気中の5種以上の金属種を含む既知のWDの数が, 桁違いに増加する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:11:57 GMT)
Generalized Gibbs ensembles in weakly interacting dissipative systems and digital quantum computers [0.0] 本稿では,積分可能性の活性化を示すためにデジタル量子コンピュータを提案する。
散逸は、周期的にアンシラをリセットする結合系の量子ビットによって実現される。
我々は、トロッタライズド・ダイナミクスに有効な運動方程式を導出する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:11 GMT)
Fate of non-Hermitian free fermions with Wannier-Stark ladder [0.0] ワニエ・スタークの局在は非エルミート自由フェルミオンの絡み合い挙動を動的に変化させる。
定常状態半鎖絡みのエントロピーを観察し、2つの異なる地域法域を同定する。
本研究は,非エルミート皮膚効果と無障害局所化との相互作用から出現する新規な絡み合い相について考察した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:15:36 GMT)
FairytaleQA Translated: Enabling Educational Question and Answer Generation in Less-Resourced Languages [0.0] 本稿では,幼児の物語理解能力の評価と向上を目的とした,有名なQAデータセットであるFairytaleQAの機械翻訳版を紹介する。
我々は、翻訳データセット内の質問生成(QG)タスクとQAタスクのベンチマークを確立するために、微調整された、控えめなスケールのモデルを採用している。
本稿では,質問応答対の生成モデルを提案し,質問適合性,回答可能性,妥当性,子どもの適合性などの品質指標を取り入れた評価を行った。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:39:17 GMT)
Exactly solvable non-unitary time evolution in quantum critical systems I: Effect of complex spacetime metrics [0.0] 一次元量子クリティカルシステムにおいて、正確に解ける非単位時間進化について検討する。
本研究では,そのような単位時間進化の普遍的特徴を,正確に解ける設定に基づいて検討する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:19:10 GMT)
Evaluation of LLMs Biases Towards Elite Universities: A Persona-Based Exploration [0.0] 我々の研究は、LLMがスタンフォード大学、ハーバード大学、カリフォルニア大学、バークレー大学、MITなどのエリート系大学に偏っているかどうかを調査した。
我々は、GPT-3.5、Gemini、Claude 3 Sonnetの製品担当副社長、製品担当ディレクター、プロダクトマネージャ、エンジニアリング担当副社長、エンジニアリング担当ディレクター、Microsoft、Meta、Googleのソフトウェアエンジニアといった職種に関する予測を調査した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 04:09:03 GMT)
Enhancing Scientific Figure Captioning Through Cross-modal Learning [0.0] 科学的研究データの量と多様性が急増し、チャートの数と多様性が増加した。
本稿では,研究データの明瞭さとアクセシビリティ向上に有効であることを示すため,学術チャートのタイトル生成に対する新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:08:19 GMT)
Enhancement of Opto-Electro-Mechanical Entanglement through Three-Level Atoms [0.0] 3レベル原子を含むオプトエレクトロメカニカルシステムにおいて, 動的バイパートライトの絡み合いに対処する。
その結果, 各サブシステム間の絡み合いは, 原子注入速度とともに増加することが示唆された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:42:40 GMT)
Enabling Accelerators for Graph Computing [0.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データを学ぶための新しいパラダイムを提供する。
GNNは従来のニューラルネットワークと比較して新しい計算課題を提示している。
この論文は、GNNが基盤となるハードウェアとどのように相互作用するかをよりよく理解することを目的としている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 19:43:21 GMT)
Divergences in classical and quantum linear response and equation of motion formulations [0.0] 量子デバイスを用いた分子特性の計算は、量子線型応答(qLR)または量子運動方程式(qEOM)によって行うことができる。
距離が恒等式ではないことを示すとともに、余剰軌道回転に依存することを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:22:31 GMT)
Directed Domain Fine-Tuning: Tailoring Separate Modalities for Specific Training Tasks [0.0] 本稿では,異なる領域内の各モダリティのタスクに特有の指導データセットを提案する。
我々は、ビデオ-LLaVAを使用して、書き起こしのない調理ビデオのレシピを生成する。
Video-LLaVAを微調整する我々のアプローチは、YouCook2データセットのベースラインであるVideo-LLaVAを2%向上させました。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:39:02 GMT)
Deterministic generation of concatenated graph codes from quantum emitters [0.0] フォールトトレラントな構造と損失を効率的に補正できるコードを組み合わせることは、これを実現するための有望なアプローチである。
メモリに結合した2つの量子エミッタまたは1つの量子エミッタからの多光子放射を用いたグラフコード生成手法を提案する。
これらの手法により,高光子損失と標準核融合ゲートを有する実用計算において,フォールトトレラント核融合に基づく量子状態が実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:44:23 GMT)
Demystifying the Effect of Receptive Field Size in U-Net Models for Medical Image Segmentation [0.0] この研究は、受信フィールド(RF)サイズとそのU-NetおよびAttention U-Netアーキテクチャへの影響について検討する。
その結果、より広いグローバルなコンテキストを捉えることと計算効率を維持することのバランスを保ちながら、最適なTRFサイズが存在することが示された。
また、U-Net(および注意U-Net)モデルのTRFを計算するツールも開発され、与えられたモデルとデータセットに対して適切なTRFサイズを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:04:14 GMT)
Demonstration of a Squeezed Light Source on Thin-Film Lithium Niobate with Modal Phase Matching [0.0] 集積フォトニック回路は、大規模量子コンピューティング回路を構築するためのスケーラブルで便利なプラットフォームを提供する。
薄膜窒化リチウム(TFLN)は、低伝搬損失、パラメトリックダウン変換、高速な電気光学変調により特に有望である。
我々は、TFLNプラットフォーム上で圧縮光源を実演し、0.46dBのショットノイズ低減を実現した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 10:46:55 GMT)
Deep Learning for Prediction and Classifying the Dynamical behaviour of Piecewise Smooth Maps [0.0] 本稿では,様々な深層学習モデルを用いたスムーズな地図の動的特性の予測について検討する。
深層学習モデルを用いて断片的滑らかな地図の力学を予測するための様々な新しい方法を示した。
長期記憶(LSTM)やリカレントニューラルネットワーク(RNN)のような深層学習モデルを用いて、2次元境界衝突分岐正規形マップの2つのパラメトリックチャートを再構成する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:12:03 GMT)
Cyber Protection Applications of Quantum Computing: A Review [0.0] スキャン検査は 815件の論文を 検討して行われました。
サイバー保護のための多くの量子コンピューティングアプリケーションと、データとプライバシを保護するための多くのテクニックが同定された。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:32:23 GMT)
Cusps in the quench dynamics of a Bloch state [0.0] 任意の部位の電位が突然変化した後、初期ブロッホ状態における粒子の生存確率のような量は周期的にカスプを示す。
この現象は、以前に観測された非滑らかな力学の、非摂動的現象である。
カスプの下方には、$-infty$から$+infty$までの等間隔のレベルからなる、完全に解決可能なモデルがある。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:45:09 GMT)
Convolutional neural network for Lyman break galaxies classification and redshift regression in DESI (Dark Energy Spectroscopic Instrument) [0.0] 我々は、DESI、Lyman Break Galaxies (LBGs)によって観測される1種類の物体に焦点を当てている。
目的は、スペクトルを用いて実際にLBGであるかどうかを判断し、もしそうなら、赤方偏移と呼ばれる現象を使って地球からの距離を決定することである。
これにより、これらの銀河をDESI 3Dマップ上に配置することができます。
この目的は、QuassarNETにインスパイアされた畳み込みニューラルネットワーク(CNN)を開発することである。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:35:51 GMT)
Computerized Tomography and Reproducing Kernels [0.0] 我々は、X線変換を再生ケルネルヒルベルト空間の間の作用素と考える。
この枠組みの中で、X線変換はユークリッド射影の自然な類似と見なすことができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 20:42:24 GMT)
Complete set of unitary irreps of Discrete Heisenberg Group $HW_{2^s}$ [0.0] 離散有限ハイゼンベルク・ワイル群のユニタリ既約表現の明示的な構成は、離散位相空間格子上の$HW_2s$である。
有限量子力学と量子計算の物理応用について論じる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:28:47 GMT)
Compact Model Parameter Extraction via Derivative-Free Optimization [0.0] 伝統的に、パラメータの完全なセットを小さなサブセットに分割することで、パラメータ抽出を手動で行う。
我々は、微分自由最適化を用いて、完全な数のシミュレーションを行うことなく、コンパクトモデルに最もよく適合する優れたパラメータ集合を同定する。
2つの半導体デバイスをうまくモデリングし,本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 06:52:50 GMT)
Comment on Chen et al.'s Authentication Protocol for Internet of Health Things [0.0] インターネット・オブ・メディカル・モノの急速な普及は、重大なセキュリティ上の課題をもたらす。
鍵合意プロトコルは、相互接続された医療機器間で共有暗号鍵を確実に確立するために使用される。
Chenらはセッション固有の一時的な情報攻撃や盗まれた検証者攻撃に対して脆弱であることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:16:29 GMT)
Classification of Geological Borehole Descriptions Using a Domain Adapted Large Language Model [0.0] GEOBERTje(GEOBERTje)は、オランダ語でフランドル(ベルギー語)の地質学的ボアホールの記述に基づいて訓練された大言語モデルである。
分類器はOpenAIのルールベースアプローチとGPT-4の両方より優れていることを示す。
本研究では,ドメイン適応型大規模言語モデルを用いて,複雑で非構造的な地質学的記述から情報抽出の効率と精度を高める方法を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 07:29:43 GMT)
Cheaper and more noise-resilient quantum state preparation using eigenvector continuation [0.0] サブスペース法は、量子コンピュータ上の基底状態を効果的に作成できる強力で耐雑音性のある方法である。
本研究では、固有ベクトル連続体を用いて、ハミルトニアン集合の低次状態から部分空間を構築する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:50 GMT)
Chaos and magic in the dissipative quantum kicked top [0.0] 無限範囲の相互作用量子スピン-1/2モデルについて検討し、周期的蹴りおよび散逸的に環境と結合する。
熱力学的限界におけるカオスとは無関係であるのに対して,非安定化剤性はトラジェクトリーよりも平均であり,古典的なカオス的挙動を反映していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:19:19 GMT)
Can the noble metals (Au, Ag and Cu) be superconductors? [0.0] 薄膜閉じ込め下における良金属中の超伝導のBCS理論の一般化について述べる。
我々は,金,銀,銅の超薄膜が低温でも実験で利用できる温度で超伝導体になる可能性があると予測した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 13:07:13 GMT)
Can a qudit carry more information than a dit? [0.0] 本稿では,情報通信事業者としてのクォーディットとディットの類似点と相違点について論じる。
量子ビットの量子特性を利用する単純な通信アプリケーションを提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:02:31 GMT)
CCC++: Optimized Color Classified Colorization with Segment Anything Model (SAM) Empowered Object Selective Color Harmonization [0.0] カラー化問題を多項分類問題に定式化し、次に重み付き関数をクラスに適用する。
クラスを最適化するために、カラークラス変換のために異なるビンサイズで実験する。
カラークラスアクティベーション比(CCAR)とTrue Activation比(TAR)の2つの新しいカラー画像評価指標を提案する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 05:29:10 GMT)
At First Sight: Zero-Shot Classification of Astronomical Images with Large Multimodal Models [0.0] VLM(Vision-Language Multimodal Models)は、天文学におけるゼロショット分類の可能性を提供する。
低表面輝度銀河と人工物のゼロショット分類のために, GPT-4o と LLaVA-NeXT の2つのモデルについて検討した。
自然言語により、これらのモデルがトレーニングや微調整を伴わずに、かなりの精度(典型的には80%以上)を達成したことが示される。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:17:54 GMT)
Assessing the role of clinical summarization and patient chart review within communications, medical management, and diagnostics [0.0] 本総説では,コミュニケーション,診断,管理における患者チャートレビューの意義と課題について,近年の文献および事例研究について概説する。
また、人工知能を臨床要約タスクに統合するための最近の取り組みや、臨床医の潜在能力に対する変革的な影響についても論じている。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 15:31:24 GMT)
Applications of Post-quantum Cryptography [0.0] レビューでは、2022年から2023年までの期間に制限された、体系的なスクーピングのレビューが採用されている。
このレビューでは、様々な分野における量子コンピューティングの適用について論じている。
本論文は格子ベース,ハッシュベース,コードベース,等質暗号など,様々なPQCアルゴリズムを解析する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:34:16 GMT)
Application of Haldane's statistical correlation theory in classical systems [0.0] 修正された統計的相関理論は、指数の形で非線型性をハルデンの原理論に含めることによって提案されている。
統計的相関の相違性への依存性を強調した。
中間統計学の準古典学では、微分の不識別性を区別可能なシステムに導入することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:13:06 GMT)
Anomalous localization in spin chains with tilted interactions [0.0] 格子ゲージ理論は、典型的には短距離相互作用粒子と力学場の力学を含む。
相互作用強度を持つスピン鎖の局在特性をシュウィンガーモデルと同様に鎖に沿って線形に成長させる。
本研究は,最先端の冷間原子/イオンデバイスに実装された格子ゲージ理論の量子シミュレーターに関係している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:52:37 GMT)
An Experimental Study on the Rashomon Effect of Balancing Methods in Imbalanced Classification [0.0] 本研究では,ラショモン効果を通した予測多重度に及ぼすバランス法の影響について検討した。
ブラインドモデルの選択は、ほぼ同じ精度のモデルの集合から危険であるからである。
その結果, バランス法は予測乗数に影響を及ぼし, 様々な結果が得られた。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 16:08:51 GMT)
All-optical production of Bose-Einstein condensates with 2 Hz repetition rate [0.0] 我々は2Hz以上の繰り返し速度でルビジウムBECの生成を報告した。
このシステムは、レーザービームの空間変調によって生じる動的に調整された光学ポテンシャルにおける強制的な蒸発に依存している。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 09:53:43 GMT)
Accurately Classifying Out-Of-Distribution Data in Facial Recognition [0.0] 現実のシナリオは通常、トレーニングディストリビューションのデータとは異なる、目に見えないデータを特徴付けます。
この問題は、未表現のグループからのデータが、トレーニングデータの均等な割合を表現せずにテストデータに現れるという社会正義の問題で最も多い。
ニューラルネットワークの性能は、分布外データの複数のデータセットで同時にトレーニングされたときに、分布外データの顔画像を改善することができるか?
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:19:39 GMT)
Absorption Spectroscopy of $^{40}$Ca Atomic Beams Produced via Pulsed Laser Ablation: A Quantitative Comparison of Ca and CaTiO$_3$ Targets [0.0] 本研究では, 各ターゲットのアブレーション羽根長, 横温度, 数密度, イオン生成, スポット寿命を測定した。
大気への21時間曝露前後のターゲットの原子線密度を比較した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 21:16:16 GMT)
AI for Equitable Tennis Training: Leveraging AI for Equitable and Accurate Classification of Tennis Skill Levels and Training Phases [0.0] 本研究の目的は、テニス選手のスキルレベルを分類し、テニスストロークをモーション特性を特徴とするフェーズに分類することである。
若手テニス選手が着用する慣性測定ユニット(IMU)からMotion Yaw, Roll, Pitchなどの動作データを収集した。
SVMモデルは、初心者または中間者としてプレイヤーを分類する際の全体的な精度が77%であった。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 03:40:41 GMT)
A solvable embedding mechanism for one-dimensional spinless and Majorana fermions in higher-dimensional spin-1/2 magnets [0.0] 固有スペクトルがジョルダン・ウィグナー変換によって解ける2次元量子スピン-1/2ハミルトニアンのクラスを書き留める。
一般的な構造は、XY または XX-Ising スピン鎖と ZZ-Ising スピン鎖からなる適切な格子に対応する。
提案したグリッド構造は、制御可能な量子ビットを持つ量子工学のアーキテクチャを提供することができる。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:12 GMT)
A quantum annealing approach to the minimum distance problem of quantum codes [0.0] 本稿では,量子安定化器符号の最小距離を準拘束的二項最適化問題として再定式化することで計算する手法を提案する。
D-Wave Advantage 4.1quantum annealerと比較することにより,本手法の実用性を示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 22:44:29 GMT)
A complete scheme for atom-mediated deterministic photonic graph state generation [0.0] 高絡み合い多光子グラフ状態は、フォトニック量子計算と通信において重要な資源である。
単一原子をベースとしたフォトニック操作を利用すれば、フォトニックグラフ状態の決定論的生成が可能になることを示す。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 12:47:21 GMT)
A Theoretical Analysis of Molecular Quantum (MolQ) Communication Channel in the Gut-Brain Axis Synapse [0.0] 腸-脳軸は、腸と脳の間のコミュニケーションリンクである。
本研究では,神経伝達物質がシナプスの裂孔から拡散する腸脳軸について検討する。
迷走神経(VN)膜、すなわちシナプスのシナプス後膜では、量子通信(QC)を行い、イオンチャネルの開口を開始する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 14:00:18 GMT)
A Symmetry Property of Christoffel Words [0.0] この対称性がChristoffelの単語を特徴付けることを示し、他の関連する結果を確立する。
長さによる因子の濃度列が対称である台詞的単語理論に動機付けられ、この対称性の多変数変種を導入する。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 08:05:21 GMT)
A Cooper-pair beam splitter as a feasible source of entangled electrons [0.0] 超伝導体クーパー対ビームスプリッタに取り付けられた2つの量子ドットからなる系から生じる絡み合った電子対の生成について検討する。
Crossed Andreev Reflection、Cotuneling、Coulombの3つのプロセスを考慮しています。
量子相互情報, 負性, 共起性などの絡み合い定量化器を用いて, 実験結果を検証した。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 17:03:47 GMT)
A CFT dual for evaporating black holes: boundary continuous matrix product states [0.0] マトリックス生成状態(MPS)は、大規模量子系における粒子同士の絡み合いを研究するための重要なツールである。
本稿では,境界連続行列状態(BCMPS)を新たに導入する。
それらのホログラフィック双対を探索し、それらをAdS/CFTの終末のブレーンとブラックホールのマイクロステートにリンクする。
論文参考訳(メタデータ) (Mon, 24 Jun 2024 18:00:03 GMT)