JailbreakBench: An Open Robustness Benchmark for Jailbreaking Large Language Models [123.7] ジェイルブレイク攻撃は、大きな言語モデル(LLM)が有害、非倫理的、またはその他の不快なコンテンツを生成する原因となる。
これらの攻撃を評価することは、現在のベンチマークと評価テクニックの収集が適切に対処していない、多くの課題を提示します。
JailbreakBenchは、以下のコンポーネントを備えたオープンソースのベンチマークである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:58:44 GMT)
WildVision: Evaluating Vision-Language Models in the Wild with Human Preferences [122.9] WildVision-Arena(WV-Arena)は、人間の好みを収集して視覚言語モデル(VLM)を評価するオンラインプラットフォームです。
WV-ベンチは、それぞれのVLMとClaude-3-Sonnetを比較し、WV-Arena Eloの0.94のスピアマン相関を達成している。
実世界の20万件のインタラクションを包括的に分析した結果,トップパフォーマンスのVLMの障害事例に対する重要な洞察が得られた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:53:25 GMT)
Model Editing Harms General Abilities of Large Language Models: Regularization to the Rescue [122.2] モデル編集は、大きな言語モデル(LLM)を編集し、リソース集約的な再学習なしに幻覚を緩和する技術である。
現在のモデル編集方法は、特定の領域におけるモデルの振る舞いを効果的に修正することができる。
彼らはしばしば、LLMの一般的な能力に対する意図しない副作用の可能性を見落としている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:27:34 GMT)
Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis [118.1] Video-MMEは、ビデオ解析におけるMLLMの完全なマルチモード評価ベンチマークである。
我々は,GPT-4シリーズやGemini 1.5 Pro,オープンソース画像モデルなど,最先端のMLLMを幅広く評価した。
我々の実験によると、Gemini 1.5 Proは最も優れた商用モデルであり、オープンソースモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:49:12 GMT)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Controllable Adversaries [94.8] 本稿では,新しい拡散制御型クローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
我々は,認知過程における敵対的項を通して,安全クリティカルなシナリオをシミュレートする新しい手法を開発した。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:23:52 GMT)
Outdated Issue Aware Decoding for Reasoning Questions on Edited Knowledge [93.5] 本稿では,従来のISsueを意識した復号化手法を提案する。
元のモデルと編集されたモデルとの確率分布の差を捉える。
我々は、古くなった問題を緩和するために、編集されたモデルにおけるトークン予測の違いを増幅する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:50:34 GMT)
ConTextual: Evaluating Context-Sensitive Text-Rich Visual Reasoning in Large Multimodal Models [92.6] テキストリッチな画像に対して文脈に敏感な推論を必要とする人為的な命令を特徴とする新しいデータセットであるConTextualを紹介した。
そこで本研究では,14の基盤モデルの性能評価実験を行い,人為的な性能基準を確立する。
GPT-4Vとヒトのパフォーマンスの30.8%の有意な性能差を観察した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:38:24 GMT)
AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models [91.8] 大型視覚言語モデル (LVLM) は幻覚を与える: 画像内の特定のコンテキストキューは、言語モジュールの過信と不正確な推論を異常または仮説的対象に対して引き起こす可能性がある。
我々は、様々な例を作成するためにいくつかの主要な戦略を利用する最初の自動ベンチマーク生成手法であるAUTOHALLUSIONを開発した。
言語モジュールの先行性に矛盾する基礎的真実性を持つイメージベースの質問を生成する。
モデルは、正しい答えに到達するためには、文脈的偏見や気晴らしを克服しなければなりませんが、誤った、あるいは矛盾した回答は幻覚を示します。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:44:43 GMT)
VideoPrism: A Foundational Visual Encoder for Video Understanding [90.0] VideoPrismは、単一の凍結モデルで多様なビデオ理解タスクに取り組む汎用ビデオエンコーダである。
我々は,36Mの高品質ビデオキャプチャ対と582Mの動画クリップを含む異種コーパス上で,VoicePrismを事前訓練した。
我々は、Webビデオ質問応答から科学用CVまで、ビデオ理解タスクの4つのグループでビデオPrismを広範囲にテストし、33の動画理解ベンチマークのうち31で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:56:08 GMT)
Data Shapley in One Training Run [88.6] 生成人工知能システムは、新しいテキスト、画像、ビデオ、その他のメディアを生成するために訓練されている。
このようなシステムは、データコントリビュータのトレーニングに関する著作権権に侵害されるのではないか、という懸念が高まっている。
本稿では,AI生成コンテンツ作成への貢献に比例して著作権所有者を補償する枠組みを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:09:24 GMT)
Toward Optimal LLM Alignments Using Two-Player Games [86.4] 本稿では,対戦相手と防御エージェントの反復的相互作用を含む2エージェントゲームのレンズによるアライメントについて検討する。
この反復的強化学習最適化がエージェントによって誘導されるゲームに対するナッシュ平衡に収束することを理論的に実証する。
安全シナリオにおける実験結果から、このような競争環境下での学習は、完全に訓練するエージェントだけでなく、敵エージェントと防御エージェントの両方に対する一般化能力の向上したポリシーにつながることが示されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:24:50 GMT)
How Do Nonlinear Transformers Learn and Generalize in In-Context Learning? [82.5] トランスフォーマーベースの大規模言語モデルでは、トレーニング済みのモデルが微調整なしで新しいタスクを処理できるような、コンテキスト内学習機能が印象的だった。
我々は、TransformerがICLを実現する方法の仕組みが、Transformerにおけるトレーニング問題の技術的課題にどのように貢献するかを分析する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:02:28 GMT)
Decoupling the Class Label and the Target Concept in Machine Unlearning [81.7] 機械学習の目的は、トレーニングデータの一部を除外した再トレーニングされたモデルを近似するために、トレーニングされたモデルを調整することだ。
過去の研究では、クラスワイド・アンラーニングが対象クラスの知識を忘れることに成功していることが示された。
我々は、TARget-aware Forgetting (TARF) という一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:07:49 GMT)
A Systematic Investigation of Distilling Large Language Models into Cross-Encoders for Passage Re-ranking [79.4] 大規模言語モデル (LLM) から蒸留したクロスエンコーダは、手動でラベル付けされたデータに微調整されたクロスエンコーダよりも効果的であることが多い。
我々は新しい蒸留データセットである Rank-DistiLLM を構築し,リリースする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:43:02 GMT)
Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.6] 我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:10:16 GMT)
GUI-WORLD: A Dataset for GUI-oriented Multimodal LLM-based Agents [73.9] 本稿では,人間のMLLMアノテーションを巧みに作成するGUI-Worldという新しいデータセットを提案する。
各種GUIコンテンツの理解において,ImageLLMs や VideoLLMs などの最先端MLLMの能力を評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:56:53 GMT)
EE-LLM: Large-Scale Training and Inference of Early-Exit Large Language Models with 3D Parallelism [70.1] 大規模学習のためのフレームワークであるEE-LLMについて述べる。
Megatron-LMをベースとして、EE-LLMは様々なアルゴリズムの革新と早期終了に適したパフォーマンス最適化を実装している。
解析的および実証的研究により、EE-LLMは無視可能な計算オーバーヘッドで優れたトレーニング効率を達成することが示された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:37:25 GMT)
Investigating Video Reasoning Capability of Large Language Models with Tropes in Movies [69.3] 本稿では、これまで見過ごされていた2つの重要なビデオ推論スキルを探索するためのテストベッドとして設計された、新しいデータセットであるTropes in Movies (TiM)を紹介する。
映画ストーリーテリングのトポロジを利用して、TiMは最先端のLCMベースのアプローチの推論能力を評価する。
これらの欠陥に対処するために、FEVoRI(Face-Enhanced Viper of Role Interactions)とConQueR(Context Query Reduction)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:58:31 GMT)
To Cool or not to Cool? Temperature Network Meets Large Foundation Models via DRO [68.7] LFMを改善するために,小型だが一般化可能な温度予測ネットワーク(TempNet)を学習するための基本的枠組みを提案する。
LLMとCLIPモデルに関する我々の実験は、TempNetが既存のソリューションやモデルの性能を大幅に改善することを示した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:43:39 GMT)
A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.5] 我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
本稿では,250以上の科学LLMを包括的に調査し,それらの共通点と相違点について考察するとともに,各分野とモダリティに関する事前学習データセットと評価タスクを要約する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:03:24 GMT)
OWSM v3.1: Better and Faster Open Whisper-Style Speech Models based on E-Branchformer [67.8] Open Whisperスタイルの音声モデル(OWSM)は、公開データとオープンソースツールキットを使用してOpenAI Whisperを再現するための最初のステップである。
OWSM v3.1 は100M から 1B のパラメータを含む一連の E-Branchformer ベースのモデルを示す。
OWSM v3.1は、ほとんどの評価ベンチマークにおいて、以前のOWSM v3よりも優れ、推論速度は25%向上した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:33:38 GMT)
ViD-GPT: Introducing GPT-style Autoregressive Generation in Video Diffusion Models [66.8] ビデオ拡散モデル(VDM)の大多数は、自己回帰的な方法で長いビデオを生成する。
我々は、VDMに因果生成(すなわち一方向)を導入し、過去のフレームを将来のフレームを生成するプロンプトとして利用する。
我々のVD-GPTは、長大なビデオ生成において、定量的かつ質的に最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:37:22 GMT)
Adaptive Query Rewriting: Aligning Rewriters through Marginal Probability of Conversational Answers [66.6] AdaQRは、シードデータセットからの限定的な書き直しアノテーションと完全にパスラベルのないクエリ書き換えモデルをトレーニングするフレームワークである。
会話クエリに条件付き回答の確率を用いて,これらの候補に対する検索者の嗜好を評価する新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:09:05 GMT)
CBGBench: Fill in the Blank of Protein-Molecule Complex Binding Graph [66.1] CBGBenchは構造ベースドラッグデザイン(SBDD)のベンチマークである
既存のメソッドを属性に基づいて分類することで、CBGBenchは様々な最先端メソッドを実装している。
我々は,これらのモデルを薬物設計に不可欠なタスクに適応させてきた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:20:24 GMT)
Improving Adversarial Robustness via Decoupled Visual Representation Masking [65.7] 本稿では,特徴分布の観点から,ロバストな特徴の2つの新しい特性を強調した。
現状の防衛手法は、上記の2つの問題にうまく対処することを目的としている。
具体的には、分離された視覚的表現マスキングに基づく、シンプルだが効果的な防御法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:29:41 GMT)
Can LLMs Understand the Implication of Emphasized Sentences in Dialogue? [64.7] 強調は人間のコミュニケーションにおいて重要な要素であり、対話における純粋テキストを超えて話者の意図と含意を示す。
本稿では,強調の意味を抽出した強調注釈付き対話サンプルを用いたベンチマークであるEmphasized-Talkを紹介する。
オープンソースと商用の両方で様々な大規模言語モデル(LLM)を評価し,その性能を重要視して評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:41:44 GMT)
Comparing Hallucination Detection Metrics for Multilingual Generation [63.0] 本稿では,各言語にまたがって生成した伝記要約における幻覚を,様々な事実の幻覚検出指標がいかによく識別するかを評価する。
自動測度が相互にどのように相関するか, 事実判断に一致しているかを比較検討した。
我々の分析によると、語彙指標は非効率であるが、NLIベースのメトリクスはよく機能し、多くの設定における人間のアノテーションと相関し、しばしば教師付きモデルよりも優れている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:44:28 GMT)
CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving [61.7] インド語から英語のテキストへのコード変更音声の音声翻訳(ST)の問題に焦点をあてる。
本稿では、事前訓練された自動音声認識(ASR)と機械翻訳(MT)モジュールを足場として、新しいエンドツーエンドモデルアーキテクチャCOSTAを提案する。
COSTAは、多くの競合するカスケードおよびエンドツーエンドのマルチモーダルベースラインを3.5BLEUポイントまで上回っている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:10:51 GMT)
Light Up the Shadows: Enhance Long-Tailed Entity Grounding with Concept-Guided Vision-Language Models [61.2] 我々は,Concept-Guided視覚言語モデルを用いた2段階フレームワークであるCOGを紹介する。
このフレームワークは、長い尾を持つエンティティのイメージテキスト対を効果的に識別するConcept Integrationモジュールと、説明可能性を提供し、人間の検証を可能にするEvidence Fusionモジュールとを備える。
包括的実験により,COGはベースラインよりも長い尾を持つ画像とテキストのペアを認識する精度が向上するだけでなく,柔軟性や説明性も向上することが示された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:49:00 GMT)
FoodieQA: A Multimodal Dataset for Fine-Grained Understanding of Chinese Food Culture [60.5] 中国各地の食文化の複雑な特徴を捉えた、きめ細かい画像テキストデータセットであるFoodieQAを紹介する。
視覚言語モデル(VLM)と大規模言語モデル(LLM)を,新たに収集した未確認食品画像およびそれに対応する質問に対して評価する。
以上の結果から,食品とその文化的意味の理解は依然として困難かつ未解明の方向にあることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:59:32 GMT)
TrafficBots V1.5: Traffic Simulation via Conditional VAEs and Transformers with Relative Pose Encoding [59.3] TrafficBots V1.5は、トラフィックエージェントのクローズドループシミュレーションのベースライン手法である。
オープン・シム・エージェント・チャレンジ(WOSAC)2024で3位を獲得した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:20:49 GMT)
Imperceptible Face Forgery Attack via Adversarial Semantic Mask [59.2] 本稿では, 対向性, 可視性に優れた対向性例を生成できるASMA(Adversarial Semantic Mask Attack framework)を提案する。
具体的には, 局所的なセマンティック領域の摂動を抑制し, 良好なステルス性を実現する, 対向型セマンティックマスク生成モデルを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:38:11 GMT)
FSGS: Real-Time Few-shot View Synthesis using Gaussian Splatting [58.4] 本稿では,3次元ガウススプラッティングに基づく数ショットビュー合成フレームワークを提案する。
このフレームワークは3つのトレーニングビューでリアルタイムおよびフォトリアリスティックなビュー合成を可能にする。
FSGSは、さまざまなデータセットの精度とレンダリング効率の両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:30:43 GMT)
A Peek into Token Bias: Large Language Models Are Not Yet Genuine Reasoners [58.2] 本研究では,大規模言語モデル (LLM) が真の推論能力を持つかどうかを評価するための仮説検証フレームワークを提案する。
我々は,相補的誤りとシロメトリクス問題を含む,注意深く制御された合成データセットを開発した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:22:53 GMT)
NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.0] Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:23:21 GMT)
ESCoT: Towards Interpretable Emotional Support Dialogue Systems [57.2] これまでの研究は主に、より良い応答を生成することに重点を置いていたが、信頼性の高い対話システムを構築する上で非常に重要である解釈可能性を無視している。
本稿では, 感情支援応答生成手法として, $textbfE$motion-Focused と $textbfS$trategy-Driven を提案する。
また,提案したESCoTの有効性と,生成した対話応答を検証するために,広範囲な実験と人的評価を行った。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:37:17 GMT)
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking [56.9] 本研究は、応答スタイルをプレゼンテーションスタイルとコンポジションスタイルに分解する。
SCAR(Style Consistency-Aware Response Ranking)を紹介する。
SCARは、そのレスポンススタイリスティックな一貫性に基づいて、トレーニングセット内の命令-レスポンスペアを優先順位付けする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:10:37 GMT)
Concept-skill Transferability-based Data Selection for Large Vision-Language Models [56.1] 視覚言語モデルを学習するための効果的でスケーラブルなデータ選択手法であるCOINCIDEを紹介する。
我々は,目標LVLMに必要な概念スキル構成を識別する小型モデルからの内部アクティベーションを用いて,トレーニングデータをクラスタ化する。
実験により、COINCIDEは8つの強いベースラインに対して、優れた性能とデータ選択効率を実現することが示された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:15:20 GMT)
Scientific Opinion Summarization: Paper Meta-review Generation Dataset, Methods, and Evaluation [55.0] 本稿では,論文レビューをメタレビューに合成する,科学的意見要約の課題を提案する。
ORSUMデータセットは、47のカンファレンスから15,062のメタレビューと57,536の論文レビューをカバーしている。
実験の結果,(1)人間による要約は,議論の深みや特定の領域に対するコンセンサスや論争の特定など,必要な基準をすべて満たしていないこと,(2)タスクの分解と反復的自己調整の組み合わせは,意見の強化に強い可能性を示唆している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:44:52 GMT)
Highlighting the Safety Concerns of Deploying LLMs/VLMs in Robotics [54.6] 本稿では,大規模言語モデル (LLMs) と視覚言語モデル (VLMs) をロボティクスアプリケーションに統合する際のロバスト性と安全性に関する重要な課題を強調する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:31:55 GMT)
Ontology Embedding: A Survey of Methods, Applications and Resources [54.3] オントロジはドメイン知識とメタデータを表現するために広く使われている。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
埋め込みに関する多くの論文が出版されているが、体系的なレビューの欠如により、研究者はこの分野の包括的な理解を妨げている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:49:19 GMT)
Teaching Large Language Models to Express Knowledge Boundary from Their Own Signals [53.3] 大規模言語モデル (LLM) は大きな成功を収めたが、時折そのコンテンツ作成(幻覚)は実用的応用を制限している。
本稿では,まず内部信頼度を用いてLLMの知識境界を探索し,探索結果を利用して知識境界の表現を抽出するCoKEを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:07:20 GMT)
PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling [53.1] ピラミッドKVは新規かつ効果的なKVキャッシュ圧縮法である。
提案手法は,KVキャッシュの12%しか保持せず,完全なKVキャッシュでモデルの性能と一致していることを示す。
メモリ効率を強調するシナリオでは、KVキャッシュのわずか0.7%しか維持されていないが、Praamid KVは他のKVキャッシュ圧縮技術を超え、TRECでは最大20.5の絶対精度の向上を実現している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:41:08 GMT)
PPFlow: Target-aware Peptide Design with Torsional Flow Matching [52.6] ペプチド構造設計のためのねじれ角の内部構造をモデル化するために,textscPPFlowと呼ばれるターゲット認識型ペプチド設計手法を提案する。
さらに, PPBench2024というタンパク質-ペプチド結合データセットを構築した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:33:54 GMT)
ExPLoRA: Parameter-Efficient Extended Pre-Training to Adapt Vision Transformers under Domain Shifts [52.2] 本稿では,事前学習された視覚変換器(ViT)のドメインシフト下での伝達学習を改善するために,ExPLoRAを提案する。
我々の実験は、衛星画像の最先端の成果を実証し、完全な事前学習や微調整のViTよりも優れています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:14:56 GMT)
Python is Not Always the Best Choice: Embracing Multilingual Program of Thoughts [51.5] 本稿では,多言語からの強みと多様性を生かしたMultiPoTというタスクとモデル非依存のアプローチを提案する。
実験の結果、Python Self-Consistencyを著しく上回ることがわかった。
特にMultiPoTはChatGPT(gpt-3.5-turbo-0701)で平均4.6%以上の改善を実現している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:29:50 GMT)
Large-scale Long-tailed Disease Diagnosis on Radiology Images [51.5] RadDiagは、様々なモダリティと解剖学にわたる2Dおよび3D入力をサポートする基礎モデルである。
私たちのデータセットであるRP3D-DiagDSは、5,568の障害をカバーする195,010のスキャンで40,936の症例を含む。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:35:52 GMT)
CrisisSense-LLM: Instruction Fine-Tuned Large Language Model for Multi-label Social Media Text Classification in Disaster Informatics [49.3] 本研究では,事前学習型大規模言語モデル(LLM)の強化による災害テキスト分類への新たなアプローチを提案する。
本手法では,災害関連ツイートから包括的インストラクションデータセットを作成し,それをオープンソース LLM の微調整に用いる。
この微調整モデルでは,災害関連情報の種類,情報化,人的援助の関与など,複数の側面を同時に分類することができる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:01:10 GMT)
Context versus Prior Knowledge in Language Models [49.2] 言語モデルは、事前学習中に学んだ事前知識と、文脈で提示された新しい情報を統合する必要があることが多い。
本稿では,モデルがコンテキストと先行するエンティティへの依存性を測定するための2つの相互情報ベースメトリクスを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:05:34 GMT)
Impact of the Availability of ChatGPT on Software Development: A Synthetic Difference in Differences Estimation using GitHub Data [49.2] ChatGPTは、ソフトウェア生産効率を向上させるAIツールである。
10万人あたりのgitプッシュ数、リポジトリ数、ユニークな開発者数に対するChatGPTの影響を見積もっています。
これらの結果は、ChatGPTのようなAIツールが開発者の生産性を大幅に向上させる可能性があることを示唆している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:11:15 GMT)
Linkage on Security, Privacy and Fairness in Federated Learning: New Balances and New Perspectives [48.5] この調査は、フェデレートラーニングにおけるプライバシー、セキュリティ、公平性の問題に関する包括的な説明を提供する。
プライバシーと公平性と、セキュリティと共有の間にはトレードオフがある、と私たちは主張する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:31:45 GMT)
Improving GFlowNets for Text-to-Image Diffusion Alignment [48.4] 報酬を直接最大化するのではなく,比較的高い確率で高解像度画像を生成する手法を探索する。
提案手法は,大規模テキスト・画像拡散モデルと報酬情報とを効果的に一致させることができる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:45:19 GMT)
Quantifying Multilingual Performance of Large Language Models Across Languages [48.4] 大規模言語モデル(LLM)は、英語、ドイツ語、フランス語のような高リソース言語で、低リソース言語の能力は依然として不十分である。
内部表現を用いたLLM性能に基づいて,言語をベンチマークし,ランク付けするための固有測度であるLanguage Rankerを提案する。
分析の結果,高リソース言語は英語との類似度が高く,性能が優れ,低リソース言語は類似度が低いことがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:24:32 GMT)
Towards Understanding Jailbreak Attacks in LLMs: A Representation Space Analysis [47.8] 大規模言語モデル(LLM)は、有害な内容を出力するためにLLMを誤解させるジェイルブレーキング(jailbreaking)と呼ばれるタイプの攻撃を受けやすい。
本稿では, LLMの表現空間における有害かつ無害なプロンプトの挙動を考察し, ジェイルブレイク攻撃の本質的特性について検討する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:38:48 GMT)
Knowledge Base Enabled Semantic Communication: A Generative Perspective [47.5] 本稿では, 意味的知識ベース(KB)の活用にひび割れを取り, 生成的セマンティックコミュニケーションの新しい時代を先導する。
セマンティックKBでは、ソースメッセージは所望の意味を妥協することなく低次元のサブスペースで特徴付けられる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:35:45 GMT)
Data Augmentation using LLMs: Data Perspectives, Learning Paradigms and Challenges [47.5] データ強化(DA)は、データ収集を必要とせずにトレーニング例を多様化することにより、モデルパフォーマンスを向上させる重要な手法として登場した。
本調査では,大規模言語モデル(LLM)がDAに与える影響,特に自然言語処理(NLP)以降の文脈において,それらが持つ固有の課題と機会に対処する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:50:50 GMT)
Mini Honor of Kings: A Lightweight Environment for Multi-Agent Reinforcement Learning [47.1] ゲームはマルチエージェント強化学習(MARL)の研究環境として広く利用されている
人気のモバイルゲーム「Honor of Kings」用の地図エディタを初めて公開し、軽量環境「Mini HoK」を設計する。
Mini HoKは非常に効率的で、実験をパーソナルPCやラップトップ上で行うことができるが、既存のMARLアルゴリズムには十分な課題がある。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:01:11 GMT)
Aligners: Decoupling LLMs and Alignment [47.0] 大きな言語モデル(LLM)は、ほとんどのアプリケーションで安全性と実用性を確保するために、人間の期待に沿う必要がある。
そこで本稿では,LLM とアライメントを,任意の基準をアライメントするためのアライメントモデルのトレーニングによって分離することを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:59:11 GMT)
Convergence Acceleration in Wireless Federated Learning: A Stackelberg Game Approach [46.7] 本稿では,FLOWN(Federated Learning over Wireless Network)における収束時間の共同最適化に関する問題点について検討する。
エネルギー制約下でのFLOWNの参加デバイス選択の基準とプロトコルを考察し,そのデバイス選択への影響を導出する。
本稿では,AoUに基づくデバイス選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:12:26 GMT)
On the Role of Entity and Event Level Conceptualization in Generalizable Reasoning: A Survey of Tasks, Methods, Applications, and Future Directions [46.6] エンティティとイベントレベルの概念化は、一般化可能な推論において重要な役割を果たす。
現在、概念化の定義、実行、適用に関する既存の研究を包括的に調べる体系的な概要が欠如している。
本稿では,150以上の論文を総合的に調査し,概念化に関連する様々な定義,資源,方法,下流のアプリケーションを統一分類に分類する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:32:41 GMT)
Enhancing Supermarket Robot Interaction: A Multi-Level LLM Conversational Interface for Handling Diverse Customer Intents [46.6] 本稿では,スーパーマーケットロボットのためのマルチレベルLLMインタフェースの設計と評価について述べる。
本手法を, GPT-4 Turbo を用いた特殊な GPT モデルと比較する。
パフォーマンス,ユーザ満足度,ユーザエージェントパートナーシップ,自己イメージ向上の4分野において,統計的に有意な改善が見られた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:13:01 GMT)
Invariant Probabilistic Prediction [45.9] 任意の分布シフトは、一般に不変かつ頑健な確率的予測を認めないことを示す。
Invariant probabilistic predictions called IPP, and study the consistency of the underlying parameters。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:32:09 GMT)
Diffusion World Model: Future Modeling Beyond Step-by-Step Rollout for Offline Reinforcement Learning [45.2] 拡散世界モデル (DWM) は多段階の将来の状態と報酬を同時に予測できる条件拡散モデルである。
我々はDWMをモデルベース値推定に統合し、DWMからサンプリングした将来の軌跡によって短期的回帰をシミュレートする。
絶対的なパフォーマンスという点では、DWMは1ステップのダイナミックスモデルを大きく上回り、パフォーマンスは44%上昇した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:35:37 GMT)
OWSM-CTC: An Open Encoder-Only Speech Foundation Model for Speech Recognition, Translation, and Language Identification [44.9] Connectionist Temporal Classification (CTC)に基づく新しいエンコーダのみの音声基礎モデルOWSM-CTCを提案する。
多言語自動音声認識(ASR)、音声翻訳(ST)、言語識別(LID)のための180k時間の公開音声データをトレーニングする。
エンコーダデコーダOWSMと比較して、OWSM-CTCはASRとSTの24%の相対的改善を達成し、より堅牢で推論の3倍から4倍高速である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:58:43 GMT)
Pre-training Cross-lingual Open Domain Question Answering with Large-scale Synthetic Supervision [44.0] 言語間のオープンドメイン質問応答は複雑な問題である。
CLQAは単一エンコーダデコーダモデルを用いて処理可能であることを示す。
ウィキペディア内の言語間リンク構造を利用した自己教師型手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:18:25 GMT)
Knowledge Distillation in Federated Learning: a Survey on Long Lasting Challenges and New Solutions [43.8] Federated Learning(FL)は、分散されたプライバシ保護機械学習パラダイムである。
これらの課題に対処するため、知識蒸留(KD)は2020年からFLで広く適用されている。
この記事では、上記の課題に対処することに焦点を当てた、KDベースのFLに関する包括的な調査を提供する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:12:16 GMT)
SportsMetrics: Blending Text and Numerical Data to Understand Information Fusion in LLMs [43.5] スポーツデータ分析を中心とした4つの新しいタスクを導入し,LLMの数値推論と情報融合能力を評価する。
これらのタスクは、LEMに詳細なプレイバイプレイのスポーツゲーム記述を提供し、敵のシナリオでそれらに挑戦する。
NBAおよびNFLゲームにおいて、これらのタスクにおけるLLMの性能を評価するための広範な実験を行う。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:43:50 GMT)
Evaluating the Performance of Large Language Models via Debates [43.4] 大規模言語モデル(LLM)間の議論に基づく自動ベンチマークフレームワークを提案する。
この方法は、ドメイン知識だけでなく、問題定義や矛盾認識といったスキルも評価する。
議論フレームワークを用いて様々な最先端LCMの性能を評価し,人間の入力に基づく人気ランキングと密接に一致したランキングを達成した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:02:31 GMT)
A Theory of Non-Linear Feature Learning with One Gradient Step in Two-Layer Neural Networks [43.3] 機能学習は、ディープニューラルネットワークの成功の根本的な理由の1つであると考えられている。
サンプルサイズとともに成長する学習率によって、このようなトレーニングが実際に複数のランクワンコンポーネントを導入していることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:44:54 GMT)
Mitigating Biases of Large Language Models in Stance Detection with Calibration [43.0] 大規模言語モデル(LLM)は多くの自然言語処理タスクにおいて顕著な進歩を遂げている。
スタンス検出タスクでは、LLMは感情バイアスの相関や特定の個人やトピックに対する嗜好による偏りのあるスタンスを生成する可能性がある。
我々はスプリアス(MB-Cal)を用いた姿勢検出におけるLCMのバイアス軽減法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:04:24 GMT)
Conversational SimulMT: Efficient Simultaneous Translation with Large Language Models [42.8] 同時機械翻訳(SimulMT)は、翻訳品質とレイテンシのトレードオフを示す。
LLMに基づくSimulMTの推論効率を向上させるための対話型SimulMTフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:25:13 GMT)
Promoting Data and Model Privacy in Federated Learning through Quantized LoRA [41.8] トレーニング中にモデルのパラメータの量子化されたバージョンを配布するだけでよい方法を紹介します。
我々は、この量子化戦略を、人気かつパラメータ効率の良い微調整法であるLoRAと組み合わせて、フェデレート学習における通信コストを大幅に削減する。
提案したフレームワークはtextscFedLPP と呼ばれ、フェデレートされた学習コンテキストにおけるデータとモデルのプライバシの両立を実現している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:23:07 GMT)
Leveraging Foundation Models for Multi-modal Federated Learning with Incomplete Modality [41.8] 我々は、事前学習完了(FedMVP)を用いた新しいマルチモーダル・コントラスト学習法、フェデレーション・マルチモーダル・コントラストVeトレーニングを提案する。
FedMVPは、大規模な事前トレーニングモデルを統合して、フェデレーショントレーニングを強化する。
実世界の2つの画像テキスト分類データセットよりも優れた性能を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:18:06 GMT)
TELEClass: Taxonomy Enrichment and LLM-Enhanced Hierarchical Text Classification with Minimal Supervision [41.1] 階層的なテキスト分類は、ラベル分類における各文書を一連のクラスに分類することを目的としている。
初期の研究は、大量の人間の注釈付きデータを必要とする完全または半教師付き手法に重点を置いていた。
我々は、最小限の監督量で階層的なテキスト分類に取り組んでおり、各ノードのクラス名のみを唯一の監督として使用しています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:10:39 GMT)
SUB-PLAY: Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning Systems [40.9] 攻撃者は被害者の脆弱性を迅速に悪用し、特定のタスクの失敗につながる敵のポリシーを生成する。
部分観測可能性の影響を軽減するために,複数のサブゲームを構築するという概念を取り入れた新しいブラックボックス攻撃(SUB-PLAY)を提案する。
我々は,敵対的政策によるセキュリティの脅威を軽減するための3つの防衛策を評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:27:17 GMT)
Toward Enhanced Reinforcement Learning-Based Resource Management via Digital Twin: Opportunities, Applications, and Challenges [40.7] 本稿では、ネットワークリソース管理の性能と信頼性を最適化することを目的とした、デジタルツイン(DT)強化強化学習(RL)フレームワークを提案する。
これらの課題に対処するため,総合的なDTベースのフレームワークが提案され,統一的なRLベースのリソース管理のための収束速度と性能が向上する。
提案するフレームワークは、安全な行動探索、長期的なリターンのより正確な推定、トレーニング収束の高速化、コンバージェンス性能の向上、様々なネットワーク条件へのリアルタイム適応を提供する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:46:06 GMT)
STAR: Scale-wise Text-to-image generation via Auto-Regressive representations [40.7] 本稿では,スケールワイズ自動回帰パラダイムを用いたテキスト・ツー・イメージ・モデルSTARを提案する。
STARは、忠実度、画像テキストの一貫性、美的品質の点で、既存のベンチマークを上回っていることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:45:45 GMT)
Exploring the Potential of Multimodal LLM with Knowledge-Intensive Multimodal ASR [40.5] 本稿では,スライドからの視覚情報を活用し,技術用語の精度を高めることによる科学会議映像の翻訳に焦点を当てたマルチモーダル科学ASR(Multimodal Scientific ASR)タスクを紹介する。
本稿では,SciVASR(SciVASR)フレームワークをベースラインとして提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:04:19 GMT)
Benchmarks Underestimate the Readiness of Multi-lingual Dialogue Agents [39.9] テキスト内学習が多言語TODに取り組むのに十分であることを示す。
我々は、中国語、英語、フランス語、韓国語、ヒンディー語、およびコードミキシングされたヒンディー語に12のドメインを持つ多言語TODデータセットX-RiSAWOZのアプローチを検証した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:45:23 GMT)
Joint stereo 3D object detection and implicit surface reconstruction [39.3] 本稿では,SO(3)の正確なオブジェクト指向を復元し,ステレオRGB画像から暗黙的な剛性形状を同時に予測できる学習ベースのフレームワークS-3D-RCNNを提案する。
方向推定のためには、局所的な外観を観測角度にマッピングする従来の研究とは対照的に、意味のある幾何学的表現(IGR)を抽出して進歩的なアプローチを提案する。
このアプローチは、知覚強度を1つか2つのビューからオブジェクト部分座標に変換するディープモデルにより、カメラ座標系において、直接自我中心のオブジェクト指向推定を実現する。
3次元境界ボックス内におけるより詳細な記述を実現するため,ステレオ画像からの暗黙的形状推定問題について検討する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:46:21 GMT)
SPEAR: Receiver-to-Receiver Acoustic Neural Warping Field [39.2] SPEARは、空間音響効果予測のための連続受信機から受信機への音響ニューラルワーピングフィールドである。
合成, フォトリアリスティック, 実世界の両方のデータセットにSPEARの優位性を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:40:26 GMT)
How Efficient is LLM-Generated Code? A Rigorous & High-Standard Benchmark [39.1] 大規模言語モデル(LLM)の開発は、プログラム合成のフロンティアを著しく押し上げている。
ほとんどの評価フレームワークは生成したコードの(機能的な)正しさに重点を置いています。
我々は,LLMの効率的なコード生成能力を評価するための厳格で高水準なベンチマークENAMELを開発した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:34:04 GMT)
RoseLoRA: Row and Column-wise Sparse Low-rank Adaptation of Pre-trained Language Model for Knowledge Editing and Fine-tuning [38.9] 事前学習された言語モデルは、様々なNLPタスクにまたがる強力な一般化性を示す。
特定のタスクのためにこれらのモデルを微調整するには、通常、リソース集約的な全てのパラメータを更新する必要がある。
我々は,textbfrowとctextbfolumn-wise spartextbfse textbflow-textbfrank textbfadaptation (RoseLoRA)を実行する新しいPEFT法を提案する。
RoseLoRAは、特定のタスクの最も重要なパラメータのみを特定し、更新し、効率を維持する
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:08:49 GMT)
Visual Hallucinations of Multi-modal Large Language Models [37.6] 視覚幻覚(VH)とは、マルチモーダル LLM が視覚的質問応答における画像に関する誤った詳細を想像することを意味する。
既存の研究は、既存の画像データセットにのみVHインスタンスを見つける。
多様なVHインスタンスを生成するために,VHTestを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:43:50 GMT)
DEEP-ICL: Definition-Enriched Experts for Language Model In-Context Learning [37.2] 大規模言語モデル(LLM)におけるパラメータの多さは、コンテキスト内学習(ICL)の能力を促進すると長い間考えられてきた。
ICL のための新しいタスク定義拡張 ExPert Ensembling Method である DEEP-ICL を紹介する。
ICLの改善はモデルのサイズに直接依存するのではなく、基本的にはタスク定義やタスク誘導学習の理解に起因している、と我々は主張する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:44:50 GMT)
PoinTramba: A Hybrid Transformer-Mamba Framework for Point Cloud Analysis [37.2] PoinTrambaはTransformerの分析能力とMambaの卓越した計算効率を組み合わせたハイブリッドフレームワークである。
当社のアプローチでは,まずクラウドをグループに分割し,Transformerが複雑なグループ内依存関係を正確にキャプチャする。
従来のMambaアプローチとは異なり、ランダムな順序付け効果の課題に取り組むために、双方向の重要度対応順序付け(BIO)戦略を導入する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:07:23 GMT)
A Rate-Distortion View of Uncertainty Quantification [36.9] 本稿では,この特性によって深層ニューラルネットワークを拡張できる新しい手法であるDistance Aware Bottleneckを紹介する。
本手法は,学習中に見られるすべての入力の圧縮表現を格納するコードブックを学習する。
結果として得られるモデルは訓練が簡単で、単一の前方通過による決定論的不確実性推定を提供する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:33:22 GMT)
FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema [36.7] 大規模言語モデル(LLM)のタスク性能向上のためのFIPO(Free-from Instruction-oriented Prompt Optimization)を提案する。
FIPOはモジュール型のAPOテンプレートを使用して、単純で最適化されたプロンプトを生成するために、ナイーブなタスク命令、オプションの命令応答、オプションの接地真理を動的に統合する。
5つの公開ベンチマークと3つのテストモデルでFIPOフレームワークを検証する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:29:03 GMT)
DIPPER: Direct Preference Optimization to Accelerate Primitive-Enabled Hierarchical Reinforcement Learning [36.5] DIPPER: 原始許容階層型強化学習の高速化のための直接選好最適化について紹介する。
直接選好最適化を利用する効率的な階層的アプローチであり、より高度な政策を学ぶために、そして低レベルの政策を学ぶために強化学習を行う。
標準的な嗜好に基づくアプローチではなく、直接選好最適化を使用することで、計算効率の向上を享受している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:49:41 GMT)
RAEmoLLM: Retrieval Augmented LLMs for Cross-Domain Misinformation Detection Using In-Context Learning based on Emotional Information [36.1] RAEmoLLMは、感情情報に基づくコンテキスト内学習を用いて、クロスドメインの誤情報検出に対処する最初のフレームワークである。
感情を意識したLLMを適用して、感情埋め込みの検索データベースを構築する。
その結果,RAEmoLLMは3つのデータセットのゼロショット法と比較して大幅な改善が得られた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:49:11 GMT)
Multi-UAV Multi-RIS QoS-Aware Aerial Communication Systems using DRL and PSO [35.0] 無人航空機(UAV)は、地上の利用者に無線サービスを提供する学術・産業の研究者の注目を集めている。
UAVの限られたリソースは、そのようなアプリケーションにUAVを採用する上での課題を引き起こす可能性がある。
システムモデルでは,地域をナビゲートするUAVスワムを考慮し,RISをサポートした地上ユーザへの無線通信により,UAVのカバレッジを向上させる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:53:56 GMT)
$α$-SSC: Uncertainty-Aware Camera-based 3D Semantic Scene Completion [34.7] 我々は不確実性を考慮したカメラによる3Dセマンティックシーン補完法(alpha$-SSC)を提案する。
我々のアプローチは、幾何学的完備化とセマンティックセグメンテーションを強化するために、深度モデルからの不確実性伝播フレームワークを含む。
幾何レベルでは、安全クリティカルクラスの占有リコールを大幅に改善する新しいKL発散に基づくスコア関数を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:27:45 GMT)
On a Novel Application of Wasserstein-Procrustes for Unsupervised Cross-Lingual Learning [33.3] 教師なしの単語埋め込みは、非常に大きな単言語テキストコーパスで事前訓練される。
We developed an approach to solve Wasserstein-Procrustes by a direct way。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:37:44 GMT)
ALPS: An Auto-Labeling and Pre-training Scheme for Remote Sensing Segmentation With Segment Anything Model [32.9] ALPS (Automatic Labeling for Pre-training in Pre-training in Remote Sensing) という,革新的な自動ラベリングフレームワークを導入する。
我々はSegment Anything Model(SAM)を利用して、事前のアノテーションや追加のプロンプトを必要とせずに、RS画像の正確な擬似ラベルを予測する。
提案手法は,iSAIDやISPRS Potsdamなど,様々なベンチマークにおけるダウンストリームタスクの性能を向上させる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:02:01 GMT)
Diffusion Actor-Critic with Entropy Regulator [32.8] エントロピーレギュレータ(DACER)を用いたオンラインRLアルゴリズムについて提案する。
このアルゴリズムは拡散モデルの逆過程を新しい政策関数として概念化する。
MuJoCoベンチマークとマルチモーダルタスクの実験は、DACERアルゴリズムが最先端(SOTA)性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:14:47 GMT)
Pick-or-Mix: Dynamic Channel Sampling for ConvNets [32.7] Pick-or-Mix (PiX) は動的チャネルサンプリングに有効な多目的モジュールである。
ネットワークダウンスケーリングおよび動的チャネルプルーニングアプリケーションにおいて、PiXが最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:33:09 GMT)
Eliminating Biased Length Reliance of Direct Preference Optimization via Down-Sampled KL Divergence [31.0] DPO(Direct Preference Optimization)は、大規模言語モデルと人間の好みとの直接的かつ堅牢なアライメントのための顕著なアルゴリズムとして登場した。
有望な有効性にもかかわらず、DPOは顕著な欠点に直面している。
また,この問題はDPOのアルゴリズム長依存性にも起因していると考えられる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:24:30 GMT)
Distilling Opinions at Scale: Incremental Opinion Summarization using XL-OPSUMM [30.7] eコマースプラットフォーム上の製品には数千のレビューがあり、各レビューは約10~15語である。
我々は,段階的に要約を生成するXl-OpSummというスケーラブルなフレームワークを提案する。
本フレームワークは, 平均ROUGE-1 F1ゲイン4.38%, ROUGE-L F1ゲイン3.70%を達成する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:36:41 GMT)
PyramidMamba: Rethinking Pyramid Feature Fusion with Selective Space State Model for Semantic Segmentation of Remote Sensing Imagery [30.5] 本稿では,新しいMambaベースのセグメンテーションネットワークであるPraamidMambaを提案する。
具体的には,高密度空間ピラミッドプーリング (DSPP) を設計し,多スケールな意味的特徴を符号化し,多スケールな特徴融合における意味的冗長性を低減するためにピラミッド融合マムバ (PFM) を符号化する。
PyramidMambaは3つの公開データセットで最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:43:40 GMT)
Robust Channel Learning for Large-Scale Radio Speaker Verification [30.3] 本稿では,現在の話者検証パイプラインの堅牢性を高めるために,Channel Robust Speaker Learning (CRSL) フレームワークを提案する。
本フレームワークでは,無線音声データセットの帯域幅変動を緩和する拡張モジュールを導入する。
また、大規模なトレーニング時間と大量のデータの必要性を低減できる効率的な微調整手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:17:57 GMT)
QUAR-VLA: Vision-Language-Action Model for Quadruped Robots [29.9] 中心となるアイデアは、ロボットの全体的な知性を高めることだ。
本稿では,VLAモデルのファミリである Quadruped Robotic Transformer (QUART) を提案する。
提案手法は,動作可能なロボットポリシーを導き,一貫した能力の獲得を可能にする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:49:46 GMT)
Hallo: Hierarchical Audio-Driven Visual Synthesis for Portrait Image Animation [29.9] この研究は、顔の動きを同期させ、視覚的に魅力的で時間的に一貫したアニメーションを作成する複雑さを掘り下げている。
我々の革新的なアプローチは、エンドツーエンドの拡散パラダイムを採用し、階層的な音声駆動視覚合成モジュールを導入しています。
提案した階層型音声駆動視覚合成は、表現の適応的な制御と多様性のポーズを提供し、異なるアイデンティティに合わせてより効果的なパーソナライゼーションを可能にする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:10:41 GMT)
MemDPT: Differential Privacy for Memory Efficient Language Models [29.9] 大きな言語モデルは、ユーザープライバシを潜在的なリスクに対して不注意に公開することができる。
MemDPTは、様々な差分プライバシーメモリ効率の良い微調整スキームに対応するために、エッジネットワークとリバースネットワークの設計を提供する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:11:41 GMT)
E-Bench: Towards Evaluating the Ease-of-Use of Large Language Models [29.8] 大規模言語モデル(LLM)はプロンプトに敏感であり、別の同義語表現やタイプミスはモデルに対して予期せぬ結果をもたらす可能性がある。
我々は,LLMの使いやすさを評価し,実際の使用状況をシミュレートしたE-Benchを構築した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:08:30 GMT)
Exploring the Limitations of Detecting Machine-Generated Text [29.1] テキストの書き方の違いを判定し,機械が生成したテキストを検出するための分類性能について批判的に検討する。
分類器は文体的変化やテキストの複雑さの違いに非常に敏感であることがわかった。
さらに,検出システムは,複雑なテキストに対して高い性能を保ちながら,読みやすいテキストを誤分類することが特に考えられる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:02:02 GMT)
Explore Spurious Correlations at the Concept Level in Language Models for Text Classification [28.8] 言語モデル(LM)は多くのNLPタスクで顕著な成功を収めた。
トレーニングデータやICLの実践者の不均衡なラベル分布から生じる急激な相関による堅牢性の問題に直面している。
本稿では,2つの主なコントリビューションを紹介する。まず,概念ラベルをテキストに割り当てるためにChatGPTを用い,テストデータ上での微調整時のモデルにおける概念バイアスやICLを評価する。
第2に,ChatGPT生成した反ファクトデータを組み込んだデータ再バランス手法を導入し,ラベル分布のバランスを保ち,突発的相関を緩和する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:28:49 GMT)
The Potential and Challenges of Evaluating Attitudes, Opinions, and Values in Large Language Models [28.7] 本稿では,大規模言語モデル(LLM)における態度,意見,価値(AOV)の評価に関する最近の研究の概要について述べる。
これにより、社会科学におけるモデル、人間とAIの整合性、下流の応用を理解するための可能性と課題に対処する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:59:18 GMT)
Exact Mean Square Linear Stability Analysis for SGD [28.7] 勾配降下(SGD)の線形安定性に必要かつ十分なステップサイズを明示的条件として提示する。
SGDの安定性閾値は、全バッチ勾配ステップw.p.$-p$と1サンプル勾配ステップw.p.$p$の混合プロセスと等価であることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:21:53 GMT)
Reminding Multimodal Large Language Models of Object-aware Knowledge with Retrieved Tags [28.4] MLLM(Multimodal Large Language Models)は、視覚的命令に対して正確かつ詳細な応答を提供するために必要な場合、重要な問題に対処する。
これらの問題を緩和する効果を示すが、大量の新しいデータを収集するコストがかかる。
本稿では、リッチなオブジェクト認識情報を含む検索拡張タグトークンを用いて、マッピングを強化することを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:20:12 GMT)
Deep Learning for Cross-Domain Data Fusion in Urban Computing: Taxonomy, Advances, and Outlook [28.1] 本稿では,都市コンピューティングに適した深層学習に基づくデータ融合手法の最近の進歩を体系的にレビューする最初の調査を提案する。
提案手法は,特徴ベース,アライメントベース,コントラストベース,生成ベース融合の4つのカテゴリに分類される。
さらに, 都市計画, 交通, 経済, 公共安全, 社会, 環境, エネルギーの7つのタイプに分類した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:16:00 GMT)
Diffusion Model With Optimal Covariance Matching [27.3] 我々は,最近提案された完全共分散モーメントマッチング手法を活用し,共分散を学習するための新しい手法を提案する。
本手法は,非マルコフ拡散モデルファミリと非マルコフ拡散モデルファミリのサンプリング効率を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 05:47:12 GMT)
InstructCMP: Length Control in Sentence Compression through Instruction-based Large Language Models [27.3] InstructCMPは文圧縮タスクへのアプローチであり、命令によって長さ制約を考慮できる。
長さプライミングを適用することで、ゼロショット設定と微調整設定の両方において、インストラクトCMPの性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:00:47 GMT)
Benchmarking Out-of-Distribution Generalization Capabilities of DNN-based Encoding Models for the Ventral Visual Cortex [26.9] textitMacaqueITBenchは、マカク下側頭葉(IT)皮質からの神経集団反応の大規模なデータセットである。
画像からOF-Distribution(OOD)トレインとテストスプリットに分割し,神経活動を予測するモデルに対する分布シフトの影響を検討した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:33:57 GMT)
Geometric Distortion Guided Transformer for Omnidirectional Image Super-Resolution [26.8] GDGT-OSR (Geometric Distortion Guided Transformer for Omdirectional Image Super-Resolution) について紹介する。
具体的には、変形可能な自己アテンションと統合された歪変調矩形ウィンドウ自己アテンション機構を提案し、歪みをよりよく知覚する。
新たなGDGT-OSRは既存の文献の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:38:33 GMT)
A$^{2}$-MAE: A spatial-temporal-spectral unified remote sensing pre-training method based on anchor-aware masked autoencoder [26.8] リモートセンシング(RS)データは、重要な空間情報、時間情報、スペクトル情報を含む、複数の次元にわたる地球観測を提供する。
RSデータの特徴に合わせた様々な事前学習手法にもかかわらず、重要な制限は持続する: 空間、時間、スペクトル情報を単一の統一モデルに効果的に統合できないことである。
本研究では,異なる種類の画像と地理情報から固有の補完情報を活用し,事前学習期間中にマスク付きパッチを再構築するアンカー・アウェア・マスク付きオートエンコーダ手法(A$2-MAE)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:05:25 GMT)
A Tutorial on the Non-Asymptotic Theory of System Identification [26.5] このチュートリアルは、最近開発されたシステム識別理論における非漸近的手法の紹介となる。
我々はこれらのツールを用いて、自己回帰モデルにおけるパラメータを識別する様々な最小二乗推定器の性能の合理化を図っている。
我々は、ここで提示されたアイデアがある種の非線形識別問題にどのように拡張できるかをスケッチして結論付ける。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:50:01 GMT)
THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation [26.1] 大規模言語モデル(LLM)の時代におけるメモリ拡張応答生成を再考する。
本稿では,LLMの応答生成をメモリタイムラインで拡張するフレームワークであるTheanineを紹介する。
Theanineとともに、反ファクト駆動の質問応答パイプラインであるTeaFarmを紹介します。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:17:46 GMT)
ConceptPsy:A Benchmark Suite with Conceptual Comprehensiveness in Psychology [25.8] ConceptPsyは、中国の複雑な推論と心理学における知識能力を評価するように設計されている。
本稿では、中国の複雑な推論と心理学における知識能力を評価するために設計されたConceptPsyについて述べる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:33:03 GMT)
Perceptual Assessment and Optimization of HDR Image Rendering [25.7] 高ダイナミックレンジレンダリングは、自然界の広い輝度範囲を忠実に再現する能力を持つ。
既存の画質モデルは、主に低ダイナミックレンジ(LDR)画像用に設計されており、HDR画像の品質に対する人間の認識とよく一致しない。
本稿では,HDR画像からLDR画像のスタックを分解するために,単純な逆表示モデルを用いるHDR品質指標のファミリを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:00:26 GMT)
Plugin Estimation of Smooth Optimal Transport Maps [25.2] 2つの分布間の最適輸送マップに対する多くの自然推定器が極小最適であることを示す。
我々の研究は、二次ワッサーシュタイン距離に対する対応するプラグイン推定子のリスクに関する新しい境界を提供する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:56:37 GMT)
Temporal Scaling Law for Large Language Models [24.1] 本稿では,LLMの試験損失が,トレーニングステップのスケールアップとともにどのように進展するかを考察する,時間スケーリング法の概念を提案する。
テスト損失全体を粗い粒度でモデル化するのとは対照的に、私たちはそれを分解して、各トークン位置のきめ細かいテスト損失に飛び込みます。
動的双曲法則におけるパラメータの時間的パターンを研究することにより、より正確な時間的スケーリング法則を導出する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:06:01 GMT)
Avoiding Copyright Infringement via Machine Unlearning [24.1] 我々は,Large Language Models (LLMs) のための新しいアンラーニングフレームワークであるSSU(Stable Sequential Unlearning)を提案する。
SSUは、タスクベクトルを使用して異なる時間ステップを通してLLMから著作権付きコンテンツを削除するためのより安定したプロセスを持つように設計されている。
SSUは、未学習の有効性とモデルの一般的な知識の維持のバランスが良好である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:12:37 GMT)
Bayesian Intervention Optimization for Causal Discovery [23.5] 因果発見は複雑なシステムを理解し、決定を下すのに不可欠である。
ベイジアンやグラフ理論的なアプローチのような現在の手法は意思決定を優先しない。
ベイズ因子に着想を得た新しいベイズ最適化手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:45:44 GMT)
HateCOT: An Explanation-Enhanced Dataset for Generalizable Offensive Speech Detection via Large Language Models [23.4] HateCOTはイングランドのデータセットで、様々な情報源から52,000以上のサンプルを収集している。
HateCOTはGPT-3.5Turboによって生成され、ヒトによって培養される説明を特徴としている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:55:25 GMT)
An LLM-enhanced Multi-objective Evolutionary Search for Autonomous Driving Test Scenario Generation [23.2] 多様な安全クリティカルなテストシナリオを生成する方法は、自律運転システム(ADS)テストにおいて重要なタスクである。
本稿では,ALS テストのための LLM 拡張シナリオ生成手法 LEADE を提案する。
産業レベルのフルスタックADSプラットフォームであるBaidu Apollo上でLEADEを実装し評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:05:56 GMT)
Alleviating Exposure Bias in Diffusion Models through Sampling with Shifted Time Steps [23.1] 拡散確率モデル (DPM) は高品質な画像の合成において顕著な有効性を示した。
これまでの研究は、トレーニング中に入力を摂動することでこの問題を緩和しようと試みてきた。
モデルを再学習することなく,提案する新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:12:11 GMT)
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning [23.0] 言語命令を利用して,より高レベルなポリシーのための静的報酬関数を生成する新しいHRLフレームワークを提案する。
言語誘導報酬はより低い原始的な振る舞いに影響されないため、LGR2は非定常性を緩和する。
弊社のアプローチは、難易度の高いスパークリワードロボットナビゲーションと操作環境において、70ドル以上の成功率を達成した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:28:45 GMT)
ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator [22.8] 大規模言語モデル (LLM) は、検索強化世代 (RAG) の恩恵を受けることが証明されている。
本稿では,ATM(Adrial Tuning Multi-agent System)を用いた検索拡張ジェネレータの最適化を提案する。
ATMは、補助的なアタッカーエージェントの助けを借りて、質問に答えるための有用な文書の堅牢な視点を持つように、ジェネレータを操縦する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:30:32 GMT)
"Violation of my body:" Perceptions of AI-generated non-consensual (intimate) imagery [22.7] AI技術は、超現実的な合成メディアであるディープフェイクの作成を可能にした。
我々は米国の315人の個人を対象に、それらを描いたディープフェイクの仮説的非合意創造に関する彼らの見解を調査した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:23:09 GMT)
Self-Evolution Fine-Tuning for Policy Optimization [22.6] 政策最適化のための自己進化微調整(SEFT)を導入する。
SEFTは、教師付き微調整の安定性と効率を保ちながら、注釈付きサンプルの必要性を排除している。
この手法の顕著な特徴の1つは、ポリシー最適化のために無注釈データを無制限に活用できることである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:38:02 GMT)
miniCodeProps: a Minimal Benchmark for Proving Code Properties [22.5] 私たちはLeanの証明アシスタントで177のプログラム仕様のベンチマークであるminiCodePropsを紹介します。
その単純さにもかかわらず、 miniCodeProps は現在の LLM ベースのプロデューサにとって困難であり、仕様の約25%を証明できた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:11:23 GMT)
Taking a Deep Breath: Enhancing Language Modeling of Large Language Models with Sentinel Tokens [21.6] 変換器をベースとした大規模言語モデル(LLM)は、長期のコンテキストをモデル化する際に性能が低下する。
本研究では,LLMが深呼吸を可能とし,個々のテキストチャンクに含まれる情報を要約する簡易かつ効果的な方法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:50:10 GMT)
Sensitivity-Informed Augmentation for Robust Segmentation [21.6] カメラ品質の変動やレンズ歪みなどの内部ノイズはセグメンテーションモデルの性能に影響を与える可能性がある。
我々は,学習ベースセグメンテーションモデルの堅牢性を高めるために,効率的で適応性があり,勾配のない手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:59:46 GMT)
Learning Relighting and Intrinsic Decomposition in Neural Radiance Fields [21.1] 本研究は,リライティングと本質的な分解を併用する手法を提案する。
シーン内の光の変動を利用して擬似ラベルを生成することにより、本手法は本質的な分解のガイダンスを提供する。
提案手法は,実世界の合成データセットと実世界のデータセットの両方で検証し,有望な結果を得た。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:10:37 GMT)
RWKU: Benchmarking Real-World Knowledge Unlearning for Large Language Models [20.9] 大きな言語モデル(LLM)は、必然的に、トレーニングコーパスから機密性、著作権、有害な知識を記憶する。
LLMアンラーニングのための実世界知識アンラーニングベンチマーク(RWKU)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:47:21 GMT)
Connecting the Dots: Evaluating Abstract Reasoning Capabilities of LLMs Using the New York Times Connections Word Game [20.6] 我々は,最先端の大規模言語モデル(LLM)の性能を,専門家や初心者に対して評価する。
以上の結果から,最高性能のLPMであるGPT-4oでもゲーム全体の8%しか解けないことがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:10:32 GMT)
A Comprehensive Study of Multilingual Confidence Estimation on Large Language Models [20.3] 大型言語モデル(LLM)は幻覚を生成し、予測に過剰な自信を示す。
モデル応答の信頼性の程度を示す信頼性または不確実性の推定は、信頼できるAIシステムの開発に不可欠である。
本稿では,LLM上でのtextbf Multitextbflingual textbfConfidence Estimation (textscMlingConf) について包括的に検討する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:28:26 GMT)
PRompt Optimization in Multi-Step Tasks (PROMST): Integrating Human Feedback and Heuristic-based Sampling [20.1] 与えられたタスクに対して,大きな言語モデル(LLM)に最適なプロンプトを見つけるための新しいフレームワークを導入する。
ProMSTには人間設計のフィードバックルールが組み込まれ、改善のための直接提案が自動的に提供される。
また、プロンプト候補から効率的にサンプリングするために、プロンプト性能を予測するための学習モデルも使用しています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:01:06 GMT)
Rethinking Kullback-Leibler Divergence in Knowledge Distillation for Large Language Models [20.0] Kullback-Leiber分散は、Large Language Models (LLM) の圧縮に知識蒸留 (KD) で広く使われている。
以前のアサーションとは対照的に、逆クルバック・リブラー(英語版)(RKL)の発散はモード探索であり、したがって平均シーキング前方クルバック・リブラー(英語版)(FKL)の発散よりも好ましい。
本稿では,FKLとRKLを組み合わせるために重みを適応的に割り当てる,単純で効果的な適応型Kulback-Leiber(AKL)分散法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:32:48 GMT)
On Convergence and Rate of Convergence of Policy Improvement Algorithms [19.7] 本稿では、連続時間エントロピー規則化制御問題に対するポリシー改善アルゴリズム(PIA)の収束をスクラッチから証明する。
提案手法はPDEとその微分の解に対するFeynman-Kac型確率表現式に基づいている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:31:26 GMT)
An Analysis on Quantizing Diffusion Transformers [19.5] ポストトレーニング量子化(PTQ)は、より小さなストレージサイズと推論時のメモリ効率の高い計算に対する即時対策を提供する。
低ビット量子化のために,アクティベーションの単一ステップサンプリング校正と重みのグループワイド量子化を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:18:35 GMT)
Beyond Single-Event Extraction: Towards Efficient Document-Level Multi-Event Argument Extraction [19.5] 複数項目の引数抽出モデルDEEIAを提案する。
ドキュメント内のすべてのイベントから引数を同時に抽出することができる。
提案手法は,4つの公開データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:26:37 GMT)
Boosting Medical Image Classification with Segmentation Foundation Model [19.4] Segment Anything Model (SAM)は、自然画像のゼロショットセグメンテーションにおいて印象的な機能を示す。
SAMのパワーを医療画像分類に活用する方法を示す研究はない。
そこで本研究では,SAMをベースとした斬新な拡張手法であるSAMAug-Cについて紹介する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:54:49 GMT)
Mixture-of-Subspaces in Low-Rank Adaptation [19.4] 計算効率が高く,実装が容易で,大規模言語,マルチモーダル,拡散モデルにも容易に適用可能なサブスペースインスパイアされたローランド適応法(LoRA)を提案する。
より柔軟にするために、元のLoRA重みとミキサーを併用して学習し、Mixture-of-Subspaces LoRAと呼ぶ。
MoSLoRAは、コモンセンス推論、ビジュアルインストラクションチューニング、主観駆動のテキスト・ツー・イメージ生成など、異なるモードのタスクでLoRAを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:19:49 GMT)
VELOCITI: Can Video-Language Models Bind Semantic Concepts through Time? [19.3] VELOCITIは、複雑な映像クリップ上に構築された新しいベンチマークで、ビデオ言語モデルにおける知覚とバインディングをテストする。
認識に基づくテストでは、類似のエンティティを共有するビデオキャプションペアを識別する必要があります。
私たちのバインディングテストでは、同じビデオに現れる異なるがもっともらしいエンティティを無視しながら、正しいエンティティを所定の状況に関連付けるモデルが必要です。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:42:21 GMT)
ULDP-FL: Federated Learning with Across Silo User-Level Differential Privacy [19.0] Differentially Private Federated Learning (DP-FL)は、正式なプライバシを保証するための協調的な機械学習アプローチとして注目を集めている。
Uldp-FLは,単一ユーザのデータが複数のサイロに属する可能性のあるクロスサイロFLにおいて,ユーザレベルのDPを保証するように設計された,新しいFLフレームワークである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:23:56 GMT)
Design and Optimization of Hierarchical Gradient Coding for Distributed Learning at Edge Devices [18.8] 本稿では,エッジノードからなる付加層を用いた階層型分散学習システムにおいて,ストラグラー効果を緩和する問題について検討する。
より優れたストラグラー緩和を実現する階層的勾配符号化フレームワークを提案する。
最適戦略を出力することにより,問題を数学的に解く効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:52:12 GMT)
PUMGPT: A Large Vision-Language Model for Product Understanding [18.7] PumGPTは、マルチモーダル製品理解タスク用に設計された最初の電子商取引専用LVLMである。
実験の結果,PumGPTは製品理解タスクにおいて,他の5つのオープンソースLVLMおよびGPT-4Vより優れていることがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:08:03 GMT)
Towards Efficient Target-Level Machine Unlearning Based on Essential Graph [18.4] 機械学習の既存の研究は、主に1つのクラスからインスタンスのクラスタやすべてのインスタンスを忘れる未学習の要求に焦点を当てている。
モデルから部分的対象を除去することに焦点を当てた、より効率的で効率的な非学習手法を提案する。
様々なデータセット上で異なるトレーニングモデルを用いた実験は、提案手法の有効性を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:17:13 GMT)
GNOME: Generating Negotiations through Open-Domain Mapping of Exchanges [18.3] 言語モデルは、元のトレーニングドメインを超えて一般化できないことを示す。
我々は、既存の人間アノテーション付きクローズドドメインデータセットを処理するGNOMEという自動フレームワークを提案する。
以上の結果から,我々のデータセットでトレーニングしたモデルは,ドメイン固有の戦略予測における過去の技術モデルよりも優れた性能を示すだけでなく,これまで見つからなかった領域よりも一般化されていることがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:26:17 GMT)
Score Function Gradient Estimation to Widen the Applicability of Decision-Focused Learning [18.0] 決定中心学習(DFL)パラダイムは、例えば後悔など、タスク損失を直接最小化するためのトレーニングによって制限を克服する。
そこで我々は,このような仮定をせずに,任意のタスク損失に作用するスコア関数推定とスムースに組み合わせた代替手法を提案する。
実験の結果、一般的に多くのエポックを必要とするが、専門的な手法と同等であり、特にソリューションの品質、スケーラビリティ、あるいはその両方の観点から、制約の不確実性に悩む問題に対して、特にうまく機能していることが示されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:38:00 GMT)
PhyloLM : Inferring the Phylogeny of Large Language Models and Predicting their Performances in Benchmarks [17.9] 本稿では,Large Language Models(LLMs)に系統解析アルゴリズムを適用するPhyloLMを紹介する。
本手法は, LLMの出力の類似性に基づいて, 系統的距離の指標を算出する。
我々の系統的距離は標準ベンチマークの性能を予測し,その機能的妥当性を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:39:20 GMT)
HAIChart: Human and AI Paired Visualization System [17.8] HAIChartは、ユーザフィードバックを取り入れて、与えられたデータセットに対して優れた視覚化を推奨するように設計された強化学習ベースのフレームワークである。
本稿では,モンテカルログラフ検索に基づく可視化生成アルゴリズムと合成報酬関数を組み合わせて,視覚化空間を効率的に探索し,優れた視覚化を自動的に生成する手法を提案する。
我々は定量的評価とユーザスタディの両方を行い、HAIChartは最先端の人力ツール(リコールでは21%、CPUでは1.8倍)とAIによる自動ツール(Hit@3とR10@30では25.1%、それぞれ14.9%)を大きく上回っていることを示した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:04:47 GMT)
"Flex Tape Can't Fix That": Bias and Misinformation in Edited Language Models [17.8] モデル編集手法は,編集後のモデルバイアスを予期せず増幅する方法について検討する。
具体的には、人種、地理的起源、性別などの人口特性に関するバイアスに焦点を当てる。
編集されたモデルは、アジア、アフリカ、および南米の被験者の属性に対する信頼性が低下するにつれて、様々な程度にバイアスのかかる行動を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:08:11 GMT)
ROME: Memorization Insights from Text, Logits and Representation [17.5] 本稿では、トレーニングデータの直接処理をバイパスするROMEという革新的な手法を提案する。
具体的には、コンテキスト非依存、従来型、事実の3つの異なるタイプに分類されるデータセットを選択します。
そこで本研究では,生成したテキストのロジットと表現を調べることで,記憶されたサンプルと記憶されていないサンプルの相違に着目した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:53:44 GMT)
Bias A-head? Analyzing Bias in Transformer-Based Language Model Attention Heads [17.5] そこで本研究では,PLMの定型バイアスに寄与する少数のバイアスヘッドを探索し,同定するためのバイアス分析フレームワークを提案する。
本稿では,トランスフォーマーをベースとした2種類のPLM(エンコーダベースBERTモデル)とデコーダベース自己回帰GPTモデル(デコーダベースGPTモデル)において,英語の性差と人種バイアスについて検討する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:33:03 GMT)
Really Unlearned? Verifying Machine Unlearning via Influential Sample Pairs [17.3] 本研究では,非学習要求が実行されたかどうかを判定する形式的検証手法であるIndirectVerifyを提案する。
ユーザは、トリガーサンプルに関する未学習リクエストを送信し、反応サンプルを使用して、未学習操作が成功したかどうかを確認する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:14:05 GMT)
ChatShop: Interactive Information Seeking with Language Agents [16.9] 新しい情報を戦略的に求める欲求と能力は 人間の学習に欠かせないものです
我々は,言語エージェントが戦略的探索を行う能力をテストするために設計された,人気のあるWebショッピングタスクを分析した。
提案課題は,エージェントが情報を探究し,徐々に蓄積する能力を効果的に評価できることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:24:12 GMT)
Large Language Models for Dysfluency Detection in Stuttered Speech [16.8] 音声言語におけるディファレンシを正確に検出することは、自動音声処理と言語処理の部品の性能を向上させるのに役立つ。
大規模言語モデル(LLM)を非語彙入力の普遍的な学習者やプロセッサとして展開する最近の傾向に触発されて,言語モデリング問題として多ラベルディフルエンシ検出の課題にアプローチする。
本稿では,音声エンコーダモデルから抽出した音響表現をLLMに自動音声認識システムと音響表現で生成し,英語とドイツ語を含む3つのデータセット上で,ディフルエンシラベルを予測するシステムを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:51:22 GMT)
LAIP: Learning Local Alignment from Image-Phrase Modeling for Text-based Person Search [16.8] 本稿では、双方向アテンション重み付き局所アライメント(BidirAtt)とマスクフレーズモデリング(MPM)モジュールを備えたLAIP(Local Alignment from Image-Phrase Modeling)フレームワークを提案する。
CUHK-PEDES、ICFG-PEDES、RSTPReidデータセットで実施された実験は、既存の手法よりもLAIPフレームワークの方が優れていることを示している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:37:24 GMT)
NOD-TAMP: Generalizable Long-Horizon Planning with Neural Object Descriptors [16.5] 一般化可能なオブジェクト中心機能を生成するニューラルオブジェクト記述子(NOD)と,多段階タスクを解決するための短軸スキルをチェーンするタスク・アンド・モーション・プランニング(TAMP)フレームワークの2つのパラダイムを組み合わせることを提案する。
我々は,少数の人間による実験から短い操作軌跡を抽出し,NOD特徴を用いてこれらの軌跡を適応させる,TAMPベースのフレームワークNOD-TAMPを紹介する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:25:46 GMT)
HO-Cap: A Capture System and Dataset for 3D Reconstruction and Pose Tracking of Hand-Object Interaction [16.4] ビデオ中の手や物体の3D再構成とポーズ追跡に使用できるHO-Capという新しいデータセットを紹介した。
そこで本研究では,手や物体の形状やポーズのアノテーションを半自動で取得する手法を提案する。
我々のデータキャプチャのセットアップとアノテーションフレームワークは、コミュニティがオブジェクトと人間の手の3D形状を再構築し、それらのポーズをビデオで追跡するために使用することができる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:51:53 GMT)
Don't Forget Too Much: Towards Machine Unlearning on Feature Level [16.3] 我々は特徴未学習と呼ばれる洗練された粒度未学習スキームを提案する。
まず、機能に関するアノテーション情報が与えられるかどうかに基づいて、2つのシナリオを探索する。
本稿では,特徴に対する影響を自動的に除去する逆学習手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:08:46 GMT)
garak: A Framework for Security Probing Large Language Models [16.3] garakは、ターゲットとするLarge Language Models(LLM)の脆弱性を発見し、特定するために使用できるフレームワークである。
フレームワークのアウトプットは、ターゲットモデルの弱点を記述し、ユニークなコンテキストで脆弱性を構成するものについての情報的な議論に寄与する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:18:43 GMT)
Bayesian Example Selection Improves In-Context Learning for Speech, Text, and Visual Modalities [15.9] 大規模言語モデル(LLM)は、文脈内学習(ICL)を通じて新しいタスクに適応できる
本稿では,ICLのための新しいベイジアン・イン・コンテクスト・サンプル・セレクション法(ByCS)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:49:00 GMT)
Efficient and Generalized end-to-end Autonomous Driving System with Latent Deep Reinforcement Learning and Demonstrations [15.9] インテリジェントな運転システムは、現在の環境と車両状態に基づいて、適切な運転戦略を動的に定式化すべきである。
本稿では,複雑かつ多様なシナリオを対象とした効率的なエンドツーエンド自動運転システム(EGADS)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:48:53 GMT)
SynthTree: Co-supervised Local Model Synthesis for Explainable Prediction [15.8] 本稿では,最小限の精度で説明可能性を向上させる手法を提案する。
我々は,AI技術を利用してノードを推定する新しい手法を開発した。
我々の研究は、統計的方法論が説明可能なAIを前進させる上で重要な役割を担っている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:43:01 GMT)
Eloquent: A More Robust Transmission Scheme for LLM Token Streaming [15.4] 現在のアプリケーションは不安定なネットワーク下でのストールの増加に悩まされていることを示す。
我々はEloquentを提案する。Eloquentは、新たに生成されたトークンに加えて、現在承認されていないトークンを次のパケットに配置する。
これにより、各パケットにはいくつかの新しいトークンが含まれており、その間、受信時に独立してレンダリングされる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:17:41 GMT)
Leading Whitespaces of Language Models' Subword Vocabulary Poses a Confound for Calculating Word Probabilities [15.1] 我々は、言語モデルのサブワードトークン化スキームによって生じる欠点を論じる。
後続する白色空間の確率を現在の単語の確率に再計算する簡単な復号法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:44:56 GMT)
Instruction Tuning with Human Curriculum [15.0] 本稿では,カリキュラム・インストラクション・チューニングについて紹介する。(2)多様なカリキュラム戦略を採用することの潜在的な利点を探求し,(3)合成命令・レスポンス・ジェネレーション・フレームワークを規定する。
我々の生成パイプラインは、人間の学習の逐次的かつ秩序的な特性をエミュレートするために体系的に構成されている。
本稿では,人間教育の様々な段階にまたがる,命令応答型データセットを生成する手法について述べる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:46:38 GMT)
New Solutions on LLM Acceleration, Optimization, and Application [15.0] 大規模言語モデル (LLM) は、様々な応用において人間のような文章を解釈・生成する能力を持つ非常に強力な機器となっている。
しかし、LLMのサイズと複雑さの増大は、トレーニングとデプロイメントの両方において大きな課題をもたらしている。
これらの課題に対処するための最近の進歩と研究の方向性について概観する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:56:50 GMT)
Fool Your (Vision and) Language Model With Embarrassingly Simple Permutations [14.8] 本研究は,複数選択プロンプトに対する応答集合の逆置換に対して,人気モデルが脆弱であることを示す。
これらの脆弱性は、様々なモデルサイズにまたがって持続し、非常に最近の言語とビジョン言語モデルに存在する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:10:40 GMT)
Analyzing Key Neurons in Large Language Models [14.7] 大規模言語モデル (LLM) はそのパラメータ内で膨大な量の知識を保有しており、この知識を探索し、編集する手法の研究を促す。
本稿では,LLMのキーニューロンを識別できるアーキテクチャに依存しない新しいフレームワークであるNeuron-Inverse Cluster Attribution (NA-ICA)を紹介する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:36:32 GMT)
Optimized Speculative Sampling for GPU Hardware Accelerators [14.7] 並列ハードウェアアクセラレータの投機的サンプリングを最適化し,サンプリング速度を向上する。
高速なオンチップメモリを用いて中間結果を保存し、読み込みと書き込みの遅い動作の頻度を最小化する。
本手法の有効性を検証するために,音声認識と要約タスクの両方について広範な実験を行った。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:19:23 GMT)
TorchOpera: A Compound AI System for LLM Safety [14.2] 本稿では,大規模言語モデルにおけるプロンプトと応答の安全性と品質を向上させる複合AIシステムであるTorchOperaを紹介する。
TorchOperaは、すべてのユーザプロンプトが安全で、コンテキスト的にグラウンディングされ、効果的に処理されていることを保証します。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:39:19 GMT)
SparseDet: A Simple and Effective Framework for Fully Sparse LiDAR-based 3D Object Detection [14.1] LiDARベースのスパース3Dオブジェクト検出は、自動運転アプリケーションにおいて重要な役割を果たす。
既存のメソッドでは、単一の中央のvoxelの機能をオブジェクトプロキシとして使用するか、フォアグラウンドポイントの集約されたクラスタをオブジェクトプロキシとして扱う。
本稿では,スパースクエリをオブジェクトプロキシとして設計するSparseDetを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:11:44 GMT)
Honesty is the Best Policy: On the Accuracy of Apple Privacy Labels Compared to Apps' Privacy Policies [13.8] Appleは2020年12月に、アプリのプライバシー動作を報告するためのプライバシーラベルを導入した。
Appleはラベルを検証していないが、開発者は重要な比較ポイントを提供するプライバシーポリシーを提供する必要がある。
BERTベースの言語モデルを微調整して,iOS App Storeの474,669アプリのプライバシポリシ機能を抽出しました。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:24:27 GMT)
WeShap: Weak Supervision Source Evaluation with Shapley Values [13.7] 弱監督源の平均貢献度を定量化する評価指標としてWeShap値を導入する。
動的プログラミングを用いて,WeShap値の効率的な計算を行う。
その結果,下流モデルの精度は4.8ポイント向上した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:02:27 GMT)
Large Language Models Can Better Understand Knowledge Graphs Than We Thought [13.3] 知識グラフ(KG) モデルパラメータの埋め込みはますますコストがかかる。
現在のプロンプト方式は、しばしばトライアル・アンド・エラー方式に依存している。
非順序線形化三重項は、流線型NLテキストと比較して、LLMのKG理解に有効であることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:16:56 GMT)
Understanding Understanding: A Pragmatic Framework Motivated by Large Language Models [13.3] チューリングテストの手法では、このフレームワークはエージェントのパフォーマンスのみをベースとしており、特にその答えの正確さに基づいている。
ランダムサンプリングによる高い信頼度と確率的信頼境界の適用性を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:37:08 GMT)
MV2Cyl: Reconstructing 3D Extrusion Cylinders from Multi-View Images [13.3] 2次元多視点画像から3次元を再構成する新しい手法であるMV2Cylを提案する。
本研究では,2次元スケッチと抽出パラメータ推定において最適な精度で最適な再構成結果を得る。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:54:38 GMT)
Complexity Matters: Dynamics of Feature Learning in the Presence of Spurious Correlations [13.1] 突発的な相関の下で特徴学習のダイナミクスを考察する。
以上の結果から, 最終層の再トレーニングの成功を正当化し, 急激な相関を除去できることが示唆された。
また、突発的特徴の早期学習を利用する一般的なデバイアスアルゴリズムの限界も特定する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:43:33 GMT)
Understanding Performance of Long-Document Ranking Models through Comprehensive Evaluation and Leaderboarding [12.7] 我々は、長い文書のランク付けのためのTransformerモデルを評価し、それらを単純なFirstPベースラインと比較した。
MS MARCO, TREC DLs, Robust04 では FirstP は NDCG と MRR で 5% 以上の性能を示した。
これは、モデルが長いコンテキストを処理できないことによるものではなく、関連するパスの位置バイアスによるものであると推測した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:12:14 GMT)
Bayesian Networks and Machine Learning for COVID-19 Severity Explanation and Demographic Symptom Classification [12.4] 新型コロナウイルスの隠れた情報を蒸留する3段階のデータ駆動方式を提案する。
第1段階では、バイエルンネットワーク構造学習法を用いて、新型コロナウイルスの症状の因果関係を同定する。
第2段階として、アウトプットは教師なし機械学習(ML)アルゴリズムをトレーニングするための有用なガイドとして機能する。
最終段階は、クラスタリングから得られたラベルを活用して、人口統計学的症状識別モデルをトレーニングする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 05:43:24 GMT)
Quantifying Generative Media Bias with a Corpus of Real-world and Generated News Articles [12.4] 大規模言語モデル(LLM)は、タスクやドメインにまたがってますます活用されてきている。
本研究では、政治バイアスに着目し、教師付きモデルとLLMの両方を用いて検出する。
ジャーナリストの領域内ではじめて、この研究は定量化実験の枠組みを概説した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:32:04 GMT)
RUPBench: Benchmarking Reasoning Under Perturbations for Robustness Evaluation in Large Language Models [12.1] RUPBenchは,多種多様な推論タスクにわたる大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
我々のベンチマークには15の推論データセットが組み込まれており、コモンセンス、算術、論理、知識集約推論に分類されている。
GPT-4o, Llama3, Phi-3, Gemmaといった最先端のLCMの原文および摂動データセットの性能を調べることにより, その堅牢性およびエラーパターンを詳細に解析する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:26:44 GMT)
Phased Instruction Fine-Tuning for Large Language Models [12.0] Phased IFT(Phased Instruction Fine-Tuning)を提案する。
GPT-4を用いて命令の難易度を評価し、命令データを難易度の高いサブセットに分割し、これらのサブセット上でモデルを逐次訓練する。
アルパカデータを用いたLlama-2 7B/13B/70B、Llama3 8/70B、Mistral-7Bモデルによる実験では、フェーズドIFTは1オフIFTよりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:20:29 GMT)
Reward Generalization in RLHF: A Topological Perspective [11.9] 本稿では,人間からのフィードバックによる強化学習における報酬一般化の理論的枠組みを紹介する。
木に基づく報酬モデルでは,ベースライン法に対して平均65%の勝利率が得られることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:25:50 GMT)
Global-Local Graph Neural Networks for Node-Classification [11.7] 本稿では,グローバル情報とローカル情報の両方を利用してノード分類GNNの性能を向上させることを提案する。
各ラベルについて適切なラベル特徴を学習するために、ラベルに属する特徴とノード特徴との類似性を最大化する。
次に学習したラベル機能を使ってノード分類マップを予測する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:13:30 GMT)
Exposing the Achilles' Heel: Evaluating LLMs Ability to Handle Mistakes in Mathematical Reasoning [11.6] 大言語モデル (LLM) は数学語問題 (MWP) に適用されている。
本稿では,ルールベース手法とより小さな言語モデルにより生成される正しい推論ステップと誤推論ステップをMWPに組み込んだ,新しいデータセットMWP-MISTAKEを提案する。
GPT-$oの誤り検出と修正における優れた性能と、より小さなモデルで直面する永続的な課題を強調した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:06:05 GMT)
Embodied Question Answering via Multi-LLM Systems [11.6] EQA(Embodied Question Answering)は,ユーザの質問に答える環境を探索するエージェントが関与する重要な問題である。
本研究では,複数の大規模言語モデル(LLM)をベースとしたエージェントが家庭環境に関する質問に独立して答えるマルチエージェントフレームワークとして,EQAを考察する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:46:40 GMT)
Adversarial Illusions in Multi-Modal Embeddings [11.5] マルチモーダル埋め込みは「逆錯覚」と呼ばれる攻撃に対して脆弱であることを示す。
敵の錯覚は埋め込み空間の近接を利用しており、従って下流のタスクやモダリティには依存しない。
本研究では,特定の下流タスク,ミスリード画像生成,テキスト生成,ゼロショット分類,音声検索の知識を必要とせず,逆方向の入力がどのように生成されるかを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:34:37 GMT)
Self-Bootstrapped Visual-Language Model for Knowledge Selection and Question Answering [11.2] 私たちはPassage Retrieval(DPR)を使って関連する知識を取得し、モデルが質問に答える手助けをします。
DPRは自然言語空間における検索を行うが、画像情報の総合的な取得は保証されない。
本稿では、視覚言語モデルを利用して、DPRが検索した重要な知識を選択し、質問に答える新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:04:48 GMT)
Exploiting Diffusion Prior for Out-of-Distribution Detection [11.1] 堅牢な機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
拡散モデルの生成能力とCLIPの強力な特徴抽出能力を活用する新しいOOD検出手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:55:25 GMT)
City-LEO: Toward Transparent City Management Using LLM with End-to-End Optimization [11.0] 本稿では,都市管理の効率化と透明性を高めるため,大規模言語モデル(LLM)に基づくエージェント(City-LEO)を提案する。
ヒューマンライクな意思決定プロセスでは、City-LEOは予測と最適化を相乗化するためにエンド・ツー・エンド(E2E)モデルも組み込んでいる。
計算結果から,City-LEOは実規模最適化問題に対するベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:25:08 GMT)
Taming the Tail in Class-Conditional GANs: Knowledge Sharing via Unconditional Training at Lower Resolutions [10.9] GANはより多くのサンプルを持つクラスを好む傾向があり、尾クラスの低品質で多様性の低いサンプルが生成される。
そこで我々は,より豊富な学習データを持つクラスから,テールクラスが豊富な情報から借用できる,知識共有の単純かつ効果的な方法を提案する。
いくつかのロングテールベンチマークとGANアーキテクチャの実験は、生成された画像の多様性と忠実さの両方において、既存の手法よりも大幅に改善されていることを示している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:11:56 GMT)
Quest: Query-Aware Sparsity for Efficient Long-Context LLM Inference [10.7] クエリ対応のKVキャッシュ選択アルゴリズムであるQuestを提案する。
Questは最大2.23倍の自己注意速度を達成できることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:33:02 GMT)
Multiple Sources are Better Than One: Incorporating External Knowledge in Low-Resource Glossing [10.6] 我々は,複数の言語的専門知識をコーディネートすることで,低リソース言語におけるデータ駆動グロスリングにおけるデータ不足問題に対処する。
従来の最先端技術に比べて単語レベルの精度は平均で5%向上した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:01:15 GMT)
Dynamic Byzantine-Robust Learning: Adapting to Switching Byzantine Workers [10.6] Byzantine-robust学習は、フォールトトレラントな分散機械学習フレームワークとして注目されている。
我々はダイナブロ(DynaBRO)という,ラウンドごとのサブ線形数の変化に耐えられる新しい手法を提案する。
本手法では,マルチレベルモンテカルロ勾配法をサーバに適用し,ワーカー更新を頑健に集約する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 05:08:35 GMT)
ptt5-v2: A Closer Look at Continued Pretraining of T5 Models for the Portuguese Language [10.4] この作業は、$texttptt5-v2$を導入し、ポルトガル向けのT5モデルの継続的な事前トレーニングを調査した。
ポルトガルの下流3つのタスクの微調整は、後者の2つにSOTAの結果をもたらす。
おそらく意外なことに、その影響はベースラインと比べて微妙だ。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 05:17:56 GMT)
Domain Generalisation for Object Detection under Covariate and Concept Shift [10.3] ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:23:31 GMT)
Hamilton-Jacobi Based Policy-Iteration via Deep Operator Learning [10.0] 我々は、DeepONetと最近開発されたポリシースキームを組み込んで、最適制御問題を数値的に解く。
ニューラルネットワークをトレーニングすると、最適制御問題とHJB方程式の解を素早く推測できる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:53:17 GMT)
Algorithm Selection for Optimal Multi-Agent Path Finding via Graph Embedding [9.8] 多エージェント経路探索(MAPF)は、衝突しない複数のエージェントの経路を見つける問題である。
MAPFの最適解を見つけることはNP-Hardであるが、現代の最適解法は数百のエージェントにスケールでき、場合によっては数千までスケールできる。
このエンコーディングが既存のエンコーディングと効果的に結合できることを示し、その結果、グラフ埋め込みによるMAPFアルゴリズム選択と呼ばれる新しいASメソッドが実現された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:41:58 GMT)
A Comprehensive Graph Pooling Benchmark: Effectiveness, Robustness and Generalizability [9.8] 最近のグラフプーリングアプローチの急増にもかかわらず、そのパフォーマンスを評価するための標準化された実験的設定と公正なベンチマークが欠如している。
我々は15のグラフプーリング手法と21のグラフデータセットを含む包括的なベンチマークを構築した。
このベンチマークは3次元のグラフプーリング法の性能を体系的に評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:32:17 GMT)
Let's Learn Step by Step: Enhancing In-Context Learning Ability with Curriculum Learning [9.7] 実証オーダリングは、文脈内学習(ICL)にとって重要な戦略である
In-Context Curriculum Learning (ICCL) と呼ばれるICLの簡易かつ効果的な実演順序付け手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:26:10 GMT)
"A good pun is its own reword": Can Large Language Models Understand Puns? [9.5] 修道女は、独自の構造と明確な定義のために、学術研究において重要な役割を担っている。
大規模言語モデル (LLM) における句の理解については, 十分に検討されていない。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:31:18 GMT)
Evaluating LLMs with Multiple Problems at once: A New Paradigm for Probing LLM Capabilities [9.2] LLMの多重問題処理能力を研究するための追加手法として,マルチプロブレム評価を提案する。
LLMは、一般に(ほぼ)シングルプロブレムタスクと同様に、マルチプロブレムタスクでも、有能なマルチプロブレム解決器であることがわかった。
また, LLMは, 様々な評価条件下でのマルチプロブレムタスクよりも, 2つの指標選択タスクにおいて有意に性能が低下していることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:52:32 GMT)
Self-Regulated Data-Free Knowledge Amalgamation for Text Classification [9.2] そこで我々は,複数の教師モデルから学習できる軽量な学生ネットワークを構築した。
そこで本研究では,各教師に適したテキストデータを生成するモデリングフレームワークSTRATANETを提案する。
本手法は,ラベルやドメインの異なる3つのベンチマークテキスト分類データセットを用いて評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:13:30 GMT)
HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies [9.1] 本稿では,この課題に対する潜在的な解決法として,HiddenTablesと呼ばれる協調ゲームを提案する。
エージェントがテーブルQAタスクを解く能力を評価するコード生成「r」と「Oracleウィンドウ」の間で「HiddenTables」が再生される。
複雑なクエリを一般化および実行できないLCMの集合性を実証する多種多様なテーブルの集合について明らかな実験を行う。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:53:29 GMT)
We're Calling an Intervention: Exploring the Fundamental Hurdles in Adapting Language Models to Nonstandard Text [9.0] 非標準テキストへの言語モデル適応の根底にある課題を理解するための一連の実験を提示する。
我々は、言語モデルの既存バイアスとの相互作用と、いくつかの種類の言語的変動を近似する介入を設計する。
学習データのサイズや性質の異なる言語モデル適応時の介入を適用することで、知識伝達がいつ成功するかについて重要な洞察を得ることができる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:09:44 GMT)
Rideshare Transparency: Translating Gig Worker Insights on AI Platform Design to Policy [8.9] 我々は透明性に関連した害、緩和戦略、労働者のニーズを特徴づける。
この結果から,既存のプラットフォーム設計とドライバが必要とする情報との透明性のギャップが明らかになった。
公共透明性レポートの公開をプラットフォームに要求する新たな規制は、労働者の幸福を改善するためのより効果的なソリューションになるかもしれない。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:46:49 GMT)
Improving Reward-Conditioned Policies for Multi-Armed Bandits using Normalized Weight Functions [8.9] 最近提案された報酬条件付き政策(RCP)は、強化学習において魅力的な代替手段を提供する。
従来の手法と比較して,RCPは収束が遅く,収束時に期待される報酬が劣っていることを示す。
我々は、この手法を一般化された余分化と呼び、その利点は、低い報酬に条件付けられた政策に対する負の重み付けが、結果の政策をそれらとより区別することができることである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:43:55 GMT)
Demonstration Notebook: Finding the Most Suited In-Context Learning Example from Interactions [8.9] 実験ノート」と呼ばれる新しい物体を中心に構築された新しいプロンプトエンジニアリングワークフローを提案する。
このノートブックは、LLMの過去のインタラクションから情報を収集して再利用することで、質問に対して最も適したコンテキスト内学習例を特定するのに役立つ。
実験により, 提案手法は, 自動的な実演構築と選択において, 既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:02:20 GMT)
A connection between Tempering and Entropic Mirror Descent [8.8] テンパリングSMCは,逆Kulback-Leibler分散に適用されるエントロピーミラー降下に対応することが確認された。
文献における他のベンチマークよりも優れた適応的テンパリングルールを導出する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:17:34 GMT)
Enhanced Classification of Heart Sounds Using Mel Frequency Cepstral Coefficients: A Comparative Study of Single and Ensemble Classifier Strategies [8.7] 本稿では,Mel Frequency Cepstral Coefficients (MFCCs) の有用性について検討した。
単一分類法とアンサンブル分類法という2つの分類法が用いられた。
精度はSVMでは93.59%、kNNでは91.84%、アンサンブル分類戦略では92.22%であった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:43:23 GMT)
Benign overfitting in Fixed Dimension via Physics-Informed Learning with Smooth Inductive Bias [8.7] 我々は,線形逆問題に対処する際,カーネルリッジ(レス)回帰のためのソボレフノルム学習曲線を開発した。
この結果から, 逆問題におけるPDE演算子は分散を安定化し, 固定次元問題に対して良性オーバーフィッティングを行うことが可能であることがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:34:27 GMT)
WundtGPT: Shaping Large Language Models To Be An Empathetic, Proactive Psychologist [8.5] WundtGPTは共感的で活動的な精神保健大言語モデルである。
精神科医の診断を支援し、対面コミュニケーションに消極的な患者が自分の心理状態を理解するのを助けるように設計されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:06:38 GMT)
Post-hoc Utterance Refining Method by Entity Mining for Faithful Knowledge Grounded Conversations [8.4] 幻聴音声の品質と忠実度を高めるために,REMというポストホック改善手法を提案する。
生成された発話が与えられた知識とソース信頼度スコアが低い場合、REMは知識のキーエンティティをマイニングし、発話の精製に暗黙的に使用する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:12:47 GMT)
Social Norms in Cinema: A Cross-Cultural Analysis of Shame, Pride and Prejudice [8.4] 恥や誇りといった社会的感情は社会における社会制裁や承認を反映している。
本稿では,5.4Kボリウッド映画とハリウッド映画から得られた,異文化間の恥と主情の映画対話データセットについて紹介する。
本研究は,アメリカとインドで観察された既知の文化的傾向と一致する,社会的感情や社会的規範の表現の多様性を明らかにする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:22:45 GMT)
Large Language Models for Automatic Milestone Detection in Group Discussions [8.4] 本研究は, 発話が散発的あるいは不整形であるグループ口頭コミュニケーションタスクの録音におけるLLMの性能について検討する。
任意の順序で達成可能ないくつかのマイルストーンを持つパズルを含むグループタスク実験を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:32:22 GMT)
StarLKNet: Star Mixup with Large Kernel Networks for Palm Vein Identification [7.9] 静脈識別技術は 高いセキュリティと利便性を提供する
ディープラーニングアーキテクチャの著名なクラスであるCNNは、静脈の同定に広く利用されている。
本研究では,大規模なカーネル畳み込みに基づくパームベイン識別ネットワークであるStarLKNetを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:06:21 GMT)
GMP-TL: Gender-augmented Multi-scale Pseudo-label Enhanced Transfer Learning for Speech Emotion Recognition [7.8] GMP-TLは、ジェンダー強化されたマルチスケール擬似ラベル(GMP)に基づくトランスファー学習を利用する新しいSERフレームワークである。
GMP-TLは80.0%のWARと82.0%のUARを達成でき、最先端のユニモーダルSER法よりも優れた性能が得られることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:35:23 GMT)
What is "Typological Diversity" in NLP? [7.6] いくつかの軸に沿って言語選択の多様性を近似する指標を導入する。
歪んだ言語選択は、過度に見積もられた多言語のパフォーマンスをもたらす可能性があることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:51:41 GMT)
Model Free Prediction with Uncertainty Assessment [7.5] そこで本研究では,深部推定パラダイムを条件付き平均推定を行うプラットフォームに変換する新しいフレームワークを提案する。
本研究では, 条件付き拡散モデルに対する終端収束率を開発し, 生成した試料の正規性を確立する。
数値実験により,提案手法の有効性を実証的に検証した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 05:30:25 GMT)
Interpretable Temporal Class Activation Representation for Audio Spoofing Detection [7.5] 我々は、wav2vec 2.0モデルと注意的発話レベルの特徴を利用して、解釈可能性を直接モデルのアーキテクチャに統合する。
ASVspoof 2019-LAセットのEERは0.51%、min t-DCFは0.0165である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:01:29 GMT)
Mpox-AISM: AI-Mediated Super Monitoring for Mpox and Like-Mpox [7.4] スーパーモニタリング」は人工知能(AI)とインターネット技術を用いたリアルタイム可視化技術である。
mpox-AISMは、ディープラーニングモデル、データ拡張、自己教師型学習、クラウドサービスを統合している。
ポックスの診断では94.51%の精度で6種類の同種皮膚障害、正常な皮膚を診断する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:24:15 GMT)
PICL: Physics Informed Contrastive Learning for Partial Differential Equations [7.1] 我々は,複数の支配方程式にまたがるニューラル演算子一般化を同時に改善する,新しいコントラスト事前学習フレームワークを開発する。
物理インフォームドシステムの進化と潜在空間モデル出力の組み合わせは、入力データに固定され、我々の距離関数で使用される。
物理インフォームドコントラストプレトレーニングにより,1次元および2次元熱,バーガーズ,線形対流方程式に対する固定フューチャーおよび自己回帰ロールアウトタスクにおけるフーリエニューラル演算子の精度が向上することがわかった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:37:26 GMT)
Self-supervised Pretraining and Finetuning for Monocular Depth and Visual Odometry [7.1] 我々は,我々の自己教師型モデルが「鐘と笛なしで」最先端のパフォーマンスに到達できることを実証した。
全てのデータセットに対して,本手法は,特に深度予測タスクにおいて,最先端の手法よりも優れている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:24:20 GMT)
On the Implicit Bias of Adam [7.0] ODEに現れる項は損失勾配の2ノルムを罰するので、有限ステップサイズが解を暗黙的に正則化することを証明している。
また、数値実験を行い、証明された事実が一般化にどう影響するかを議論する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:29:01 GMT)
Open-Vocabulary X-ray Prohibited Item Detection via Fine-tuning CLIP [6.9] 蒸留をベースとしたオープン語彙オブジェクト検出タスクをX線セキュリティ検査領域に導入する。
検知器が訓練された基準カテゴリを超えた、新しい禁止アイテムカテゴリを検出することを目的としている。
X線機能アダプタをOVODフレームワーク内のCLIPに適用し、OVXDモデルを開発する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:42:52 GMT)
Speech language models lack important brain-relevant semantics [6.6] 近年の研究では、テキストベースの言語モデルは、テキスト誘発脳活動と音声誘発脳活動の両方を驚くほど予測している。
このことは、脳内でどのような情報言語モデルが本当に予測されるのかという疑問を引き起こします。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:52:21 GMT)
Making Task-Oriented Dialogue Datasets More Natural by Synthetically Generating Indirect User Requests [6.3] 間接ユーザ要求(IUR)は、ヒューマン・ヒューマン・タスク指向の対話において一般的であり、聞き手からの世界的知識と実践的推論を必要とする。
大きな言語モデル(LLM)はこれらの要求を効果的に処理できるが、仮想アシスタントにデプロイされる小さなモデルはリソースの制約のためにしばしば苦労する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:20:34 GMT)
Step-level Value Preference Optimization for Mathematical Reasoning [6.3] SVPO(Step-level Value Preference Optimization)と呼ばれる新しいアルゴリズムを導入する。
提案手法ではモンテカルロ木探索(MCTS)を用いて,マルチステップ推論のためのステップレベルの選好を自動的にアノテートする。
学習からランクまでの観点から、暗黙の報酬モデルの振る舞いを再現するために明示的な価値モデルを訓練する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:06:17 GMT)
Generating Tables from the Parametric Knowledge of Language Models [6.3] 大規模言語モデル(LLM)のパラメトリック知識から表を生成することを検討する。
GPT-3.5, GPT-4, Llama2-13B, Llama2-70Bの表生成能力について検討した。
評価のために、100のキュレートされたウィキペディアテーブルを含む新しいベンチマークWikiTabGenを導入する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:55:55 GMT)
IG2: Integrated Gradient on Iterative Gradient Path for Feature Attribution [6.3] 反復勾配経路統合勾配(IG2)はディープニューラルネットワークの顕著な経路帰属法である。
IG2は逆ファクト勾配を反復的に積分経路に組み込み、新しい経路(GradPath)と新しいベースライン(GradCF)を生成する
XAIベンチマーク、ImageNet、MNIST、TRECの質問に対する回答、ウェハマップの失敗パターン、CelebAの顔属性の実験的結果は、IG2が優れた特徴属性を提供することを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:48:03 GMT)
Just rephrase it! Uncertainty estimation in closed-source language models via multiple rephrased queries [6.2] 元のベースクエリの複数の言い換えにより,クローズドソースの大規模言語モデルの不確かさを推定する。
本手法は, ベースラインと比較して不確実性推定の校正精度が著しく向上したことを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:49:53 GMT)
GenAI Mirage: The Impostor Bias and the Deepfake Detection Challenge in the Era of Artificial Illusions [6.2] 本稿では,認知バイアスが法医学およびデジタル法医学における意思決定に及ぼす影響について検討する。
バイアスを緩和し、意思決定を改善する既存の方法を評価する。
マルチメディアコンテンツの信頼性に疑問を呈する体系的な傾向として現れる小説「Impostor Bias」を紹介する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:28:40 GMT)
Unimodal Multi-Task Fusion for Emotional Mimicry Intensity Prediction [6.1] 第6回ワークショップおよび感情行動分析コンペティションの一環として,情緒的不安度(EMI)を評価するための新しい方法論を紹介した。
我々の手法は、広範囲なポッドキャストデータセットで事前トレーニングされたWav2Vec 2.0アーキテクチャを活用している。
我々は,個々の特徴をグローバル平均ベクトルと組み合わせた融合手法を用いて特徴抽出プロセスを洗練する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:21:39 GMT)
Guaranteed Sampling Flexibility for Low-tubal-rank Tensor Completion [6.1] Cross-Concentrated Smpling (t-CCS) は、テンソルフレームワーク内での行列のクロス集中サンプリングを前進させる、新しく簡単なサンプリングモデルである。
我々は,t-CCSがBernoulliとt-CURのサンプリングのギャップを効果的に埋めることを示し,様々なコンテキストにおける節約につながる柔軟性を提供する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:45:56 GMT)
Incorporating uncertainty quantification into travel mode choice modeling: a Bayesian neural network (BNN) approach and an uncertainty-guided active survey framework [5.8] 旅行モード選択モデルのための既存のディープラーニングアプローチは、予測の不確実性についてモデリング者に知らせることができない。
本研究では,説明可能な人工知能の分野における不確実性の概念を旅行モード選択モデルに導入する。
本稿では,ベイズ型ニューラルネットワークを用いた旅行モード予測モデル(BTMP)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:05:47 GMT)
KGPA: Robustness Evaluation for Large Language Models via Cross-Domain Knowledge Graphs [5.8] 本稿では,敵対的攻撃シナリオ下での大規模言語モデルの堅牢性を体系的に評価する枠組みを提案する。
筆者らの枠組みは知識グラフの三つ子から独自のプロンプトを生成し,毒殺によって敵のプロンプトを生成する。
GPT-4-turbo > GPT-4o > GPT-3.5-turbo としてChatGPTファミリーの対角的ロバスト性が評価された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:48:43 GMT)
Studying Differential Mental Health Expressions in India [5.6] インドの個人によって作られたRedditのメンタルヘルス投稿を分析した。
インドにおけるメンタルヘルスの議論は、悲しみを表し、否定を使い、現在に焦点を当てており、仕事や達成に関連している。
病気はインドと一意に相関しており、インドの患者のうつ病と身体の健康との関連が示唆されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:04:59 GMT)
Development and Validation of Fully Automatic Deep Learning-Based Algorithms for Immunohistochemistry Reporting of Invasive Breast Ductal Carcinoma [5.6] 本報告では, 深層学習に基づく半教師付き, 完全自動決定支援システム(DSS)について, 管癌のIHCスコアリングについて述べる。
本システムでは,Allred 標準に基づいて,腫瘍領域を自動的に検出し,アーティファクトやスコアを除去する。
Ki67, HER2, ER, PR染色の95, 92, 88, 82パーセントの合意を得た。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:52:38 GMT)
LLMFactor: Extracting Profitable Factors through Prompts for Explainable Stock Movement Prediction [5.5] LLMFactorと呼ばれる新しいフレームワークを導入し、ストックムーブメントに影響を与える要因を特定する。
キーフレーズや感情分析に頼っていた従来の手法とは異なり、このアプローチは株式市場のダイナミクスとより直接的に関係する要因を抽出することに焦点を当てている。
当社の枠組みは,LCMに対して,包括的戦略を通じて背景知識の創出を指示し,関連ニュースから株価に影響を及ぼす潜在的な要因を識別する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:20:50 GMT)
AgileCoder: Dynamic Collaborative Agents for Software Development based on Agile Methodology [5.2] アジャイル方法論をフレームワークに統合するマルチエージェントシステムであるAgileCoderを提案する。
このシステムは、Product Manager、Developer、Testerといった特定のAMロールを異なるエージェントに割り当て、ユーザ入力に基づいて協調してソフトウェアを開発する。
また、動的コードグラフ生成(Dynamic Code Graph Generator)も導入しています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:57:48 GMT)
On the Effectiveness of Supervision in Asymmetric Non-Contrastive Learning [5.1] 非対称非競合学習(ANCL)は、自己指導的表現学習において、対照的な学習よりも優れていることが多い。
教師付き表現学習のためのANCL(SupSiamとSupBYOL)について検討し,より優れた表現を実現するためにANCLのラベルを活用する。
分析の結果,ANCLの監督はクラス内ばらつきを低減し,最高の性能を達成するためには,監督の貢献を調整すべきであることが判明した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:43:15 GMT)
RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation [5.1] 本稿では,従来のリランカが行ったようなコンテキスト間の相対的関連性を提供する関連性推定器(RE)を提案する。
我々は,小型発電機(sLM)で訓練したREが,REとともに微調整されたsLMを改良するだけでなく,従来は未参照の大規模言語モデルも改善できることを示した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:28:24 GMT)
Initial Investigation of Kolmogorov-Arnold Networks (KANs) as Feature Extractors for IMU Based Human Activity Recognition [5.1] 我々はIMUに基づく人間活動認識タスクの機能抽出アーキテクチャとしてKanを実装した。
本研究では,4つの公開HARデータセット上でのkan-based feature extractorの性能評価を行った。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:56:03 GMT)
First-Order Manifold Data Augmentation for Regression Learning [4.9] 我々は、新しいデータ駆動型ドメイン非依存データ拡張法であるFOMAを紹介する。
分布内一般化と分布外ベンチマークに基づいてFOMAを評価し,いくつかのニューラルアーキテクチャの一般化を改善することを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:35:05 GMT)
Geometric-informed GFlowNets for Structure-Based Drug Design [4.9] 我々は生成フローネットワーク(GFlowNets)を用いて、薬物様分子の広大な空間を探索する。
三角的に一貫した埋め込みを組み込むことにより,GFlowNetフレームワークに新たな改良を加える。
CrossDocked 2020を用いて行った実験では、生成された分子とタンパク質ポケットの結合親和性が改善された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:32:19 GMT)
Diffusion Models Are Promising for Ab Initio Structure Solutions from Nanocrystalline Powder Diffraction Data [4.7] 本稿では,45,229の既知の構造をトレーニングした拡散モデルに基づく生成機械学習モデルを提案する。
我々のモデルであるPXRDnetは、対称性と複雑さの異なる200の材料にまたがる10アングストロームのシミュレーションナノ結晶を解くことに成功した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:45:03 GMT)
Parameter Blending for Multi-Camera Harmonization for Automotive Surround View Systems [4.7] 複数のカメラの色やトーンを調整するために縫合前に適用するハーモニゼーションアルゴリズムを提案する。
提案アルゴリズムは、視覚的品質と計算コストの両方において、グローバルカラー転送法より優れる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:43:50 GMT)
Effective Generative AI: The Human-Algorithm Centaur [4.6] 私たちは、多くの領域におけるAI開発と利用の未来は、センタウロスに焦点を合わせる必要があると論じています。
センタウロス(Centaurs)は、フォーマルな分析と人間の直感を組み合わせた、人間とアルゴリズムのハイブリッドAIモデルである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:44:41 GMT)
Enhancing Generative Networks for Chest Anomaly Localization through Automatic Registration-Based Unpaired-to-Pseudo-Paired Training Data Translation [4.6] 胸部X線画像(AL-CXR)におけるGAN-ITは異常領域の正確な位置決め法として有望である
本稿では,登録とデータ拡張を含む2段階のGAN-ITを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:52:15 GMT)
A MgNO Method for Multiphase Flow in Porous Media [4.5] 本研究はMgNOを時間依存性の多孔質媒質流問題に拡張し, 多相流の本質的側面を予測する精度を検証した。
この研究はMgNOが多相流問題を効果的にシミュレートする能力を示し、従来のシミュレーション法と比較してかなりの時間を節約できることを示した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:27:43 GMT)
Citation-Based Summarization of Landmark Judgments [4.4] 我々は,判断を引用する上で利用可能な文脈参照を活用し,対象判断の抽出的要約を作成する。
提案アルゴリズムは,インド裁判所の判断から得られた2つのデータセットに対して評価し,有望な結果が得られた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:27:16 GMT)
Saliency-guided and Patch-based Mixup for Long-tailed Skin Cancer Image Classification [4.4] 長い尾のコンテキストでは、いくつかの一般的な疾患カテゴリがデータの大半を占めており、まれな疾患カテゴリで利用できるサンプルはごくわずかである。
長期皮膚がん画像分類のための新しいアプローチである textbfSaliency-guided と textbfPatch-based textbfMixup (SPMix) を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:38:10 GMT)
Ultrafast-and-Ultralight ConvNet-Based Intelligent Monitoring System for Diagnosing Early-Stage Mpox Anytime and Anywhere [4.4] Fast-MpoxNetはわずか0.27Mパラメータで、CPU上の68フレーム毎秒(FPS)で入力画像を処理できる。
Mpox-AISM V2は、迅速に正確にmpoxを診断でき、公共のリアルタイムmpox診断サービスを提供するために、様々なシナリオに容易に展開できる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:48:40 GMT)
DR-RAG: Applying Dynamic Document Relevance to Retrieval-Augmented Generation for Question-Answering [4.4] RAGは最近、質問応答(QA)のような知識集約的なタスクにおいて、LLM(Large Language Models)のパフォーマンスを実証した。
重要な文書とクエリの間には関連性が低いものの,文書の一部とクエリを組み合わせることで,残りの文書を検索できることがわかった。
文書検索のリコールと回答の精度を向上させるために,DR-RAG(Dynamic-Relevant Retrieval-Augmented Generation)と呼ばれる2段階検索フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:33:17 GMT)
Imperceptible Rhythm Backdoor Attacks: Exploring Rhythm Transformation for Embedding Undetectable Vulnerabilities on Speech Recognition [4.2] 近年,音声認識システムにおいて,典型的なバックドア攻撃が研究されている。
攻撃者は、良質な音声スペクトログラムにいくつかの組み込まれた変更を加えたり、ピッチや音色などの音声成分を変更したりする。
データ中毒のステルス性を改善するために,ランダム・スペクトログラム・リズム・トランスフォーメーション (Random Spectrogram Rhythm Transformation) と呼ばれる非ニューラルかつ高速なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:29:21 GMT)
$\ell_1$DecNet+: A new architecture framework by $\ell_1$ decomposition and iteration unfolding for sparse feature segmentation [4.2] $ell_$DecNetは、$ell_$関連スパース正規化を組み込んだ変動分解モデルから派生した、展開されていないネットワークである。
我々は$ell_$DecNet+を開発し、 $ell_$DecNetと抽出されたスパース機能を操作するセグメンテーションモジュールからなる学習可能なアーキテクチャフレームワークを開発した。
医療用画像処理における網膜血管分割と,産業用異常識別における舗装き裂検出の2つの課題に対する $ell_$DecNet+ の有効性を検討した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:15:56 GMT)
Anyon Quantum Dimensions from an Arbitrary Ground State Wave Function [4.1] トポロジ的絡み合いエントロピーは、基底状態波動関数から非自明なトポロジ的順序を検出するために用いられる。
2次元の単一基底状態波動関数から全ての電子の量子次元を抽出するための単純な絡み合いベースのプロトコルを提案する。
このプロトコルは連続体で検証され格子上で検証され、様々な量子シミュレーションプラットフォームで実現可能であることを期待する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:53:56 GMT)
ShareLoRA: Parameter Efficient and Robust Large Language Model Fine-tuning via Shared Low-Rank Adaptation [4.1] 本研究では,共有低ランク適応(ShareLoRA)を実装することにより,事前学習言語モデル(PLM)に対するPEFT(Efficient Fine Tuning)の最適化手法を提案する。
異なるレイヤにShareLoRAを戦略的にデプロイし、それを自己アテンションレイヤのクエリ、キー、バリューコンポーネントに適用することにより、トレーニングパラメータの数とメモリ使用量を大幅に削減します。
この結果から、ShareLoRAはパラメータ効率を効果的に向上し、異なる言語モデルアーキテクチャにおけるスケーラブルで高品質な性能を確保します。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:52:28 GMT)
Schrödinger Bridge with Quadratic State Cost is Exactly Solvable [3.8] 本稿では,2次状態のコスト・ツー・ゴーを有するSchr"odinger橋の正規化変種を提案する。
従来のシュル・オーディンガー橋とは異なり、正規化は状態依存的な確率質量の殺害と生成の速度を誘導する。
この結果から,2次状態のSchr"odingerブリッジの計算に動的シンクホーン再帰を用いることが可能である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:33:43 GMT)
3D Gaze Tracking for Studying Collaborative Interactions in Mixed-Reality Environments [3.8] 本研究では,複合現実感設定に適した3次元視線追跡のための新しい枠組みを提案する。
提案フレームワークは,現状のコンピュータビジョンと機械学習技術を利用して障害物を克服する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:30:56 GMT)
Expressibility of linear combination of ansatz circuits [3.6] 変分量子固有解法は中規模雑音量子コンピュータに有望であると考えられている。
表現性は変分量子アンザッツ回路の能力を測定するための重要な指標である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:41:36 GMT)
A Learning-based Framework for Topology-Preserving Segmentation using Quasiconformal Mappings [3.5] 画像中の物体を位相特性を維持しながら抽出できる変形モデルを提案する。
このネットワークは、限られたデータでトレーニングされた場合でも、テンプレートマスクと同じトポロジを持つセグメンテーションマスクを生成する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:36:52 GMT)
Breaking Symmetry When Training Transformers [3.4] 出力トークン$n+1$のトランスフォーマーアーキテクチャに対して,位置エンコーディングのメカニズムや因果的アテンションの1つを使わずに,入力トークンの置換に不変であることを示す。
我々は、因果接続機構は、トランスフォーマーが順序が重要である入力シーケンスをモデル化できるという事実に責任を負わなければならないという議論を詳しく述べる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:18:36 GMT)
Federated Learning Optimization: A Comparative Study of Data and Model Exchange Strategies in Dynamic Networks [3.4] デバイス間で生データ、合成データ、または(部分的な)モデル更新を交換する選択について検討する。
私たちが考慮した様々なシナリオにおいて、時間限定の知識伝達効率は9.08%まで異なる可能性がある。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:46:23 GMT)
Deep neural networks with ReLU, leaky ReLU, and softplus activation provably overcome the curse of dimensionality for space-time solutions of semilinear partial differential equations [3.3] これは高次元非線形偏微分方程式(PDE)を解くための応用数学の難題である。
深層ニューラルネットワーク(DNN)を用いてPDEの解を近似する深層学習(DL)に基づくPDEの手法を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:59:29 GMT)
Biologically-Motivated Learning Model for Instructed Visual Processing [3.1] 生物学的にもっともらしい学習の現在のモデルは、ボトムアップ(BU)とトップダウン(TD)処理の皮質的な組み合わせを用いることが多い。
視覚野では、TD経路が視覚的注意の第二の主要な役割を担い、視覚過程を興味のある場所やタスクに導く。
本稿では,TDストリームの2つの主要な機能を自然に統合する,BUとTD処理の皮質的な組み合わせを用いたモデルを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:24:53 GMT)
Grading Massive Open Online Courses Using Large Language Models [3.1] 大規模なオープンオンラインコース(MOOC)は、コンピュータとインターネットアクセスを持つ人なら誰でも無料で教育を受けられる。
ピアグレーディング(Peergrading)は、しばしば直感的なルーリックによって導かれるもので、選択の方法である。
大規模言語モデル(LLM)を用いてMOOCのピアグレーディングを置き換えることの実現可能性について検討する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:42:11 GMT)
SPA: Towards A Computational Friendly Cloud-Base and On-Devices Collaboration Seq2seq Personalized Generation [2.9] 大規模な言語モデルは、低リソースのデバイスにかなりのメモリストレージを必要とする。
本稿では,デバイス上で高速な推論を行う軽量アーキテクチャであるSPA(Side on Adaption)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:27:11 GMT)
Stepwise Regression and Pre-trained Edge for Robust Stereo Matching [2.9] 本稿では,SR-Stereoと呼ばれる新しいステレオマッチング手法を提案する。
また,事前訓練されたエッジ(DAPE)に基づくドメイン適応手法を提案する。
これらの手法は,SceneFlow,KITTI,Middbury 2014,ETH3Dで広く評価されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:20:56 GMT)
Reinforcement Learning from Multi-role Debates as Feedback for Bias Mitigation in LLMs [2.8] 現在のバイアス軽減手法は、コストのかかる人的フィードバック、他のトピックへの転送可能性の欠如、パフォーマンスの低下に頼っている。
RLDF(Reinforcement Learning from Multi-role Debates as Feedback)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:34:42 GMT)
Revisiting Cosine Similarity via Normalized ICA-transformed Embeddings [2.8] 本稿では,コサイン類似性の新たな解釈を,軸上の意味的類似性の和として提案する。
正規化ICA変換埋め込みは,各軸に数個の大きな値と埋め込みにまたがる疎らさを示すことを示した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:44:37 GMT)
Fetch-A-Set: A Large-Scale OCR-Free Benchmark for Historical Document Retrieval [2.7] このベンチマークには、紀元前2世紀にさかのぼる膨大な文書が収められている。
文化遺産の領域における複雑な抽出作業に焦点をあてることで、文学における重要なギャップを埋める。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:59:29 GMT)
NBA: defensive distillation for backdoor removal via neural behavior alignment [2.7] バックドア除去のための新しい防御機構であるニューラル・ビヘイビア・アライメント(NBA)を提案する。
NBAは、知識の伝達を容易にするために、ネットワーク内での神経行動のハイレベルな表現を構築している。
NBAは6種類のバックドア攻撃を効果的に防ぎ、最先端の5つの防御を上回ります。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:39:15 GMT)
Latent Communication in Artificial Neural Networks [2.6] この論文は神経表現の普遍性と再利用性に焦点を当てている。
我々の研究から得られた顕著な観察は、潜在表現における類似性の出現である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:13:58 GMT)
Benchmarking Label Noise in Instance Segmentation: Spatial Noise Matters [2.5] 本研究は,各種モデルによるセグメンテーションマスクの品質について光を当てる。
ラベルノイズによる学習に対処するために設計された一般的な手法の有効性に挑戦する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:49:23 GMT)
A Notion of Complexity for Theory of Mind via Discrete World Models [2.5] ToM(Theory of Mind)は、社会的推論が必要な複雑なシナリオにおいて、LLM(Large Language Models)の機能を評価するために用いられる。
本稿では,ToMタスクの複雑さを計測するフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:46:55 GMT)
People will agree what I think: Investigating LLM's False Consensus Effect [2.4] 大規模言語モデル(LLM)は通信を必要とする対話型システムに広く採用されている。
モデルに対する誤った信念は、そのようなシステムのユーザビリティを損なう可能性があるため、LLMは人間が持っている認知バイアスを持ってはならない。
本稿では,偽の信念を反映してコミュニケーションを円滑に行うFalse Consensus Effect (FCE)に焦点を当てた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:29:28 GMT)
Event-Triggered Islanding in Inverter-Based Grids [2.3] この研究は、グリッドを自律島に分割できる適応的な隔離手法を提案する。
適応的な分離ロジックは、偽陽性を防止し、検出精度を高め、計算オーバーヘッドを低減するためにイベントトリガーされる。
シミュレーションの結果,22m秒以内で100%精度で異常な挙動を検知できることが示唆された。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:55:39 GMT)
Lifetime of Infrared Quantum Information in Qubits [2.3] 我々は、赤外偏光量子ビット力学における長期デコヒーレンス率を計算する。
穏健な準オフミック散逸では、この速度がハッブル定数を超えることが分かる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:15:07 GMT)
Reconsidering Sentence-Level Sign Language Translation [2.1] サンプル中の33%の文に対して,流用なDeafシグナ・アノテータは談話レベルの文脈から,クリップのキー部分のみを理解できた。
これらの結果は、機械学習を新しいドメインに適用する際の理解と健全性検査の重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:19:54 GMT)
Element-wise Multiplication Based Physics-informed Neural Networks [1.9] 本稿では,これらの問題を解決するために,EM-PINN( Element-wise multiplication based Physics-informed Neural Networks)を提案する。
要素ワイド乗算演算は、特徴を高次元非線形空間に変換するために採用され、PINNの表現能力を効果的に向上する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:15:40 GMT)
Two-level overlapping additive Schwarz preconditioner for training scientific machine learning applications [1.8] 我々は、科学機械学習アプリケーションのトレーニングを加速するための、2レベル重なり合う新しいシュワルツプレコンディショナーを紹介する。
提案したプレコンディショナーの設計は、非線形二段重なり合うシュワルツプレコンディショナーによって動機付けられている。
提案した2レベルプレコンディショナーは、標準(LBS)の収束を著しく高速化するとともに、より正確な機械学習モデルを生成することを実証する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:18:45 GMT)
Increasing Trust in Language Models through the Reuse of Verified Circuits [1.8] 言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。
数学的および論理的に定義されたフレームワークを使用して構築すれば、この標準を満たすようにモデルをトレーニングできることが示される。
両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:09:57 GMT)
Towards Supporting Legal Argumentation with NLP: Is More Data Really All You Need? [1.6] 訴訟における決定を正当化する法的推論と議論は、常にAIと法の中心であった。
法律NLPの最近の発展は、テキストから法的結論を統計的に分類することに集中している。
本稿では,AIと法学における伝統的な象徴的著作と,近年の法的NLPの進歩を概観する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:15:44 GMT)
Iterated Schrödinger bridge approximation to Wasserstein Gradient Flows [1.6] 我々は、同じ辺を持つシュリンガー橋を連続的に計算するワッサーシュタイン勾配流の新しい離散化スキームを導入する。
提案手法には2つの利点がある: 1つはスコア関数の使用を回避し、もう1つはシンクホーンアルゴリズムを用いて粒子ベースの近似を行うことができる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:23:26 GMT)
Kolmogorov Arnold Informed neural network: A physics-informed deep learning framework for solving PDEs based on Kolmogorov Arnold Networks [1.4] 偏微分方程式(PDE)のためのAIは特に物理情報ニューラルネットワーク(PINN)の出現に顕著な注目を集めている。
最近のコルモゴロフ・アルノルドネットワーク(KAN)の出現は、以前の特異点に基づくPINNを強化する可能性があることを示している。
我々はKolmogorov-Arnold-In Neural Network (KINN) ではなく Kan に基づく異なるPDE形式を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:07:06 GMT)
Make Your Home Safe: Time-aware Unsupervised User Behavior Anomaly Detection in Smart Homes via Loss-guided Mask [1.4] 自動エンコーダに基づく教師なしユーザ動作異常検出フレームワークであるSmartGuardを提案する。
まず、Los-Guided Dynamic Mask Strategy (LDMS) を設計し、モデルの頻繁な振る舞いの学習を促す。
次に,3段階の時間認識位置埋め込み (TTPE) を提案する。
第3に,騒音を考慮した重み付き再構成損失(NWRL)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:23:21 GMT)
Fine-grained Classes and How to Find Them [1.4] 粗いラベル付きデータからきめ細かいクラスを、きめ細かいレベルで監督せずに発見するFALCONを提案する。
FALCONは、未知のきめ細かいクラスと、粗いクラスときめ細かいクラスの間の基礎となる関係を同時に推論する。
8つの画像分類タスクと1つのセル分類タスクでFALCONを評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:55:19 GMT)
Teaching Digital Accessibility in Computing Education: Views of Educators in India [1.3] コンピュータサイエンス(CS)コースは、将来のプロフェッショナルがそのようなアクセス可能なソフトウェアを開発する準備をするべきであり、アクセシビリティに関連するトピックをほとんどカバーしていない。
欧米のコンピューティング教育にアクセシビリティーのトピックを取り入れることに関する文献が増えているが、グローバル・サウスではこれについてはほとんど研究されていない。
CSの教員がアクセシビリティを教えることはごくわずかであり、彼らが知覚する最上位の障壁は同じである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:39:38 GMT)
Evidential Uncertainty Sets in Deep Classifiers Using Conformal Prediction [1.2] 画像分類器に対して,共形予測セットを生成するためのEvidential Conformal Prediction (ECP)法を提案する。
本手法は,Evidential Deep Learning (EDL) にルーツを持つ非整合スコア関数に基づく。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:00:16 GMT)
CASE: Efficient Curricular Data Pre-training for Building Assistive Psychology Expert Models [1.1] 本研究では、自然言語処理(NLP)パイプラインを用いて、コンサルティングに使用されるオンラインメンタルヘルスフォーラムのテキストデータを解析する。
Case-BERTは既存の手法に比べて優れた性能を示し、抑うつのf1スコアは0.91、不安の0.88を達成している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:33:34 GMT)
Many-excitation removal of a transmon qubit using a single-junction quantum-circuit refrigerator and a two-tone microwave drive [1.1] 超伝導量子デバイスのリセットにおける単一接合型量子回路冷凍機 (QCR) の利用を実験的に実証した。
約500ドルnsまでの励振安定化時間を観察し,QCRと2トーン同時駆動による20ドルの高速化を行った。
結果は、エンジニアリングされた環境を用いた量子電気デバイスの最適化されたリセットと、散逸した状態の準備への道を開いた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:30:43 GMT)
Advancing Solar Flare Prediction using Deep Learning with Active Region Patches [1.0] 本稿では,アクティブ領域(AR)パッチの磁気グラムの形状特性を利用した新しい手法を提案する。
我々は,(i)ResNet34,(ii)MobileNet,(iii)MobileViTの3つのディープラーニングモデルを作成し,フレアを予測し,その有効性を評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:35:41 GMT)
Evaluating Supply Chain Resilience During Pandemic Using Agent-based Simulation [0.8] 将来のパンデミックは、短期的な利益性と長期的なサプライチェーンのレジリエンス計画の間に、企業オーナーのジレンマを生じさせる。
本稿では,サセプティブル・インフェクト・リカバード(SIR)疫学モデルとサプライ・アンド・デマンド・エコノミーモデルを統合したエージェント・ベース・シミュレーションモデルを提案する。
サプライチェーンのレジリエンスに対するバランスの取れたアプローチは、パンデミック時と非パンデミック時の両方において、極端な戦略よりも優れていることが分かりました。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 04:52:09 GMT)
Exponentially Enhanced Scheme for the Heralded Qudit GHZ State in Linear Optics [0.7] 高次元多部絡み合いは量子情報科学において重要な役割を担っている。
単一光子源を用いた$d$レベル$N$-partite GHZ状態とその線形演算を生成する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:50:59 GMT)
InteraRec: Screenshot Based Recommendations Using Multimodal Large Language Models [0.7] InteraRecと呼ばれる洗練されたインタラクティブなレコメンデーションフレームワークを紹介します。
InteraRecは、ユーザがWebサイトをナビゲートするときに、Webページの高周波スクリーンショットをキャプチャする。
ユーザに対して価値あるパーソナライズされたオファリングを提供する上で、InteraRecの有効性を実証する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:40:15 GMT)
Data Science Education in Undergraduate Physics: Lessons Learned from a Community of Practice [0.7] 我々は,データサイエンス教育実践コミュニティ(DSECOP)の知見と経験を紹介する。
DSECOPは、さまざまな機関の大学院生と物理学教育者を集めて、データサイエンスを学部の物理学教育に統合することから学んだベストプラクティスと教訓を共有する。
私たちのゴールは、データサイエンスを教育に統合し、次世代の物理学者をデータ駆動の世界に向けて準備する教育者へのガイダンスとインスピレーションを提供することです。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:47:56 GMT)
Scaling Synthetic Logical Reasoning Datasets with Context-Sensitive Declarative Grammars [0.7] 複数の言語を結合するフレキシブルなコンテキスト依存ルールを持つ宣言型フレームワークを提案する。
最大32の前提と1つの仮説を選択して一階述語論理問題を構築する。
生成中の意味的制約と述語に対する注意深い英語の動詞化は、自然な英語のタスクを損なうことなく論理的推論を促進することを実証する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:10:49 GMT)
Tender: Accelerating Large Language Models via Tensor Decomposition and Runtime Requantization [0.6] 大規模言語モデル(LLM)は、機械学習における様々なタスクにおいて優れたパフォーマンスを示す。
LLM推論のデプロイは、高い計算とメモリ要求のために問題となる。
我々は,低精度でLLM推論を効率的に展開できるアルゴリズム-ハードウェア共設計ソリューションであるテンダーを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:51:55 GMT)
chainBoost: A Secure Performance Booster for Blockchain-based Resource Markets [0.6] 分散資源市場のためのセキュアなパフォーマンス向上剤である chainBoost を提案する。
サービス関連の操作を高速化し、ブロックチェーンサイズを削減し、低オーバーヘッドでフレキシブルなサービス支払い交換モダリティをサポートする。
分散ファイルストレージ市場のための概念実証プロトタイプをユースケースとして実装する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:02:53 GMT)
A Survey on LLM-Based Agents: Common Workflows and Reusable LLM-Profiled Components [0.6] 大規模言語モデル(LLM)はエージェントを開発するための洗練されたフレームワークの開発を触媒にしている。
これらのフレームワーク r の複雑さは、粒度レベルでのニュアンス分化のハードルとなる。
本調査は, LLM-Profiled Components (LMPC) の共通性と再利用性を明らかにする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:59:27 GMT)
Generative AI and Digital Neocolonialism in Global Education: Towards an Equitable Framework [0.6] 本稿では、生成的人工知能(GenAI)が西洋以外の社会に西洋のイデオロギーをどう強制するかを批判的に論じる。
これは、地域の利害関係者や世界的な利害関係者がこれらの効果を緩和する戦略を示唆している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 02:57:15 GMT)
Pushing on Text Readability Assessment: A Transformer Meets Handcrafted Linguistic Features [0.5] 適切なトランスフォーマーと従来のMLモデルについて検討する。
自家製抽出ソフトウェアを用いて手作り言語特徴255点を抽出する。
我々はこれらを組み立てて複数のハイブリッドモデルを作成し、可読性評価において一般的なデータセットの最先端(SOTA)精度を達成する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:39:03 GMT)
Predicting the Understandability of Computational Notebooks through Code Metrics Analysis [0.5] 我々は、コード理解性に関連するユーザコメントを識別するために、微調整のDistilBERT変換器を使用している。
UOCU(User Opinion Code Understandability)と呼ばれる基準を確立しました。
私たちは、メトリクスのみに基づいてノートのコード理解可能性を予測するために、機械学習モデルを訓練しました。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:58:40 GMT)
Continuous-variable quantum state designs: theory and applications [0.5] 量子状態設計の概念を無限次元空間に一般化する。
まず、continuous-variable (CV) state $t$-designsの定義の下では、$tgeq2$に対する状態設計は存在しないことを証明します。
我々はCV状態設計の代替的定義を提案し、これをrigged $t$-designsと呼ぶ。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:26:15 GMT)
DocNet: Semantic Structure in Inductive Bias Detection Models [0.5] 本稿では,文書におけるバイアス検出の見過ごされがちな側面として,ニュース記事の意味的構造について考察する。
本稿では,新しい,インダクティブで低リソースなドキュメント埋め込みとバイアス検出モデルであるDocNetを提案する。
また、文書レベルのグラフ埋め込みに代表される、対立するパルチザン側からのニュース記事のセマンティック構造が顕著に類似していることも示している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:51:12 GMT)
Prompt-based Learning for Text Readability Assessment [0.5] 可読性評価のための事前学習されたSeq2seqモデルの新規適応を提案する。
与えられた2つのテキストからより難しいテキストを区別するために、Seq2seqモデルを適用できることを実証する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:50:50 GMT)
An integral-free representation of the Dyson series using divided differences [0.5] 我々は、時間順序と積分の両方から完全に自由なダイソン級数に対する代替表現を導入する。
この新たな形式主義において、ダイソン展開は指数関数の効率よく計算可能な分割差の和として与えられる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:12:04 GMT)
Curating Stopwords in Marathi: A TF-IDF Approach for Improved Text Analysis and Information Retrieval [0.4] ストップワードは、文書の意味や重要性を決定するのにはほとんど価値がないと考えられる言語で一般的に使われる単語である。
我々の研究は、マハコルプス(MahaCorpus)を用いてマラティア語で2480万の文で停止語をキュレーションすることを目的としている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:59:05 GMT)
Enriching the Machine Learning Workloads in BigBench [0.4] この作業は、改善されたBigBench V2を3つの新しいワークロードで強化し、マシンラーニングアルゴリズムのカバレッジを拡大する。
私たちのワークロードでは、複数のアルゴリズムを使用して、MLlib、SystemML、Scikit-learn、Pandasといった一般的なライブラリ間で、同じアルゴリズムの異なる実装を比較しています。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 08:32:28 GMT)
Universal Cross-Lingual Text Classification [0.4] 本研究は,言語横断テキスト分類における新たな視点を提案する。
我々のアプローチは、訓練中に異なる言語からの教師付きデータをブレンドして普遍的なモデルを作成することである。
主な目標は、ラベルと言語カバレッジを強化することであり、様々な言語のラベルの結合を表すラベルセットを目指している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:58:29 GMT)
Optimization of Armv9 architecture general large language model inference performance based on Llama.cpp [0.4] 本稿では、Int8量子化を行い、ラマ中の演算子をベクトル化し、コンパイルスクリプトを変更することにより、Qwen-1.8Bモデルの推論性能を最適化する。
Yitian 710実験プラットフォームでは、プリフィル性能が1.6倍に向上し、復号性能が24倍に向上し、メモリ使用量が元の1/5に減少し、精度損失はほぼ無視される。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:46:25 GMT)
Kibble-Zurek mechanism and errors of gapped quantum phases [0.3] キブル・ズレック機構は非平衡力学の領域と平衡における臨界特性を関連付ける。
本稿では,欠陥の概念を誤りにマッピングするスケーリング指数を推定する新しい数値スキームを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:14:43 GMT)
Intelligent Energy Management with IoT Framework in Smart Cities Using Intelligent Analysis: An Application of Machine Learning Methods for Complex Networks and Systems [0.2] 本稿では,スマートシティのエネルギー管理を目的としたIoTベースのフレームワークについて概観する。
データを収集、保存するだけでなく、監視、制御、システムの効率向上のためのインテリジェントな分析をサポートするシステムに注力する。
この結果から、IoTベースのフレームワークは、スマートな建物におけるエネルギー消費と環境への影響を低減できる重要な可能性を示唆している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:04:33 GMT)
Quantum Analogues for Two Simple Classical Channels [0.1] 我々は、古典的なガウス加法チャネルを量子アナログと対比し、量子バージョンが興味深い時間依存と量子化の直感的効果を持つキャパシティを特徴とすることを示した。
また、単純な2段階のシステムについても検討し、その能力の時間依存性についてコメントする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:28:16 GMT)
Ultrabroadband, ultranarrowband and ultrapassband composite polarisation half-wave plates, ultrabroadband composite polarisation pi-rotators and on the quantum-classical analogy [0.0] 複合パルスは、Bloch-Poincarの球面上の$theta = pi$による超広帯域、ウルトラナローバンド、ウルトラパスバンド$x$-,$y$-)回転を生成する。
量子古典的アナロジーでは、$X$ゲートのウルトラロバスト、ウルトラセンシティブ、ウルトラ2乗量子制御と$Z$ゲートのウルトラロバスト量子制御を得る。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:39:22 GMT)
Towards augmented data quality management: Automation of Data Quality Rule Definition in Data Warehouses [0.0] 本研究では,大規模組織で一般的に使用されているデータリポジトリとして,データウェアハウス内のデータ品質管理を自動化する可能性について検討する。
レビューでは、さまざまなソースから151のツールが紹介され、現在のほとんどのツールは、データウェアハウスではなく、ドメイン固有のデータベースのクリーニングと修正に重点を置いていることが明らかになった。
データウェアハウスでこれを実装することは言うまでもなく、DQルールを検出する能力を示したのは、限られたツール、特に10ツールだけだった。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:43:04 GMT)
To Ban or Not to Ban: Uses and Gratifications of Mobile Phones among Township High School Learners [0.0] 多様な社会経済的背景を持つ学習者の間で携帯電話の利用が急増し、学校当局はこれらの機器の禁止を意識するようになった。
本研究は, 高校生のモチベーションと利用パターンを, 提案された禁止に応えて探求することを目的とする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:32:39 GMT)
Threat Modelling and Risk Analysis for Large Language Model (LLM)-Powered Applications [0.0] 大規模言語モデル(LLM)は、高度な自然言語処理機能を提供することによって、様々なアプリケーションに革命をもたらした。
本稿では,LSMを利用したアプリケーションに適した脅威モデリングとリスク分析について検討する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:43:58 GMT)
The possible $K \bar{K}^*$ and $D \bar{D}^*$ bound and resonance states by solving Schrodinger equation [0.0] K barK*$およびD bar D*$の散乱過程について検討した。
シュロディンガー方程式の解法として、4つの共鳴状態が生じる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:54:43 GMT)
Simple loss-tolerant protocol for GHZ-state distribution in a quantum network [0.0] グリーンバーガー・ホーネ・ザイリンガー状態分布に対する簡易な損失耐性プロトコルを提案する。
我々のプロトコルは量子リピータを使用しず、現在の量子光学技術で実現可能である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:29:49 GMT)
Selection rules of linear and nonlinear polarization-selective absorption in optically dressed matter [0.0] 偏光構造を持つ光がフロケットの暗黒状態やフロケットの暗黒帯に課す選択規則を包括的に表した。
特に、我々の表はすべての非線形順序に対する非線形吸収を包含し、異なる非線形順序が異なる偏極選択規則に従うことを明らかにした。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:01:33 GMT)
Rethinking Digitalization and Climate: Don't Predict, Mitigate [0.0] デジタル化はグリーン・トランジションの中核的な要素である。
予測のほとんどの試みは、3つの暗黙の仮定に基づいている。
我々は、デジタルカーボンフットプリントは本質的に予測不可能であると主張している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:40:05 GMT)
Rectified Iterative Disparity for Stereo Matching [0.0] コストボリュームに基づく不確実性不確実性推定(UEC)を提案する。
画像対から得られるコストボリュームの豊富な類似性情報に基づいて,提案したUCCは,計算コストの低い競合性能を実現することができる。
提案手法を組み合わせた高性能ステレオアーキテクチャDR Stereoを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 13:47:40 GMT)
RATSF: Empowering Customer Service Volume Management through Retrieval-Augmented Time-Series Forecasting [0.0] ホテルのサービス量予測は、類似した歴史的データを特定し活用することに依存している。
時系列知識ベース (TSKB) を, 効率的な履歴データ検索のための高度な索引付けシステムにより開発する。
また,Retrieval Augmented Cross-Attention (RACA)モジュールを開発した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:59:13 GMT)
Quantum coupon collector with mixed-state encoding [0.0] そこで我々は,その集合を混合状態に符号化して量子クーポンコレクタを提案し,そこでは欠落した要素の情報をパウリ文字列でラベル付けする。
興味深いことに、符号化された混合状態は量子交絡状態を持たず、準備が容易である。
我々のプロトコルは、純粋なステートエンコーディングの場合、サンプルの複雑さを$O(n)$から$O(log n)$に減らします。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:54:38 GMT)
Proposal for many-body quantum chaos detection [0.0] 量子カオス」という用語は、ランダム行列理論で見られるものと類似したスペクトル相関を指す。
この構造が2つの物理量のクエンチダイナミクスによってどのように検出できるかを論じる。
システムがカオスから遠ざかるにつれて、相関穴は消え、可積分性や局所化のシグナルとなる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:22:30 GMT)
Predicting Exoplanetary Features with a Residual Model for Uniform and Gaussian Distributions [0.0] 2023年のアリエルデータチャレンジは、7つの太陽系外惑星の特徴の後方分布を予測するために開催された。
本稿で概説した手順は,この課題に対処するための2つのディープラーニングモデルの組み合わせを活用している。
均一分布のアンサンブルは、試験中に競合する結果が得られた。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:07:15 GMT)
Physics-Informed Deep Learning and Partial Transfer Learning for Bearing Fault Diagnosis in the Presence of Highly Missing Data [0.0] 本稿では,物理インフォームド深層学習技術を用いて合成ラベル付きデータを生成するPTPAI法を提案する。
不均衡なクラス問題と部分セット障害診断ハードルに対処する。
CWRUとJNUデータセットの実験結果は、提案手法がこれらの問題に効果的に対処していることを示している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 17:36:53 GMT)
Not All Bias is Bad: Balancing Rational Deviations and Cognitive Biases in Large Language Model Reasoning [0.0] 本稿では,大規模言語モデル(LLM)の意思決定過程におけるバイアスの役割について検討する。
合理的な偏差を調べることで、バランスの取れた場合の潜在的なメリットを強調します。
我々は,モデレーションの概念と禁忌オプションを導入し,不確実な解答をLLMが拒否できるようにする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:25:22 GMT)
Neural-Shadow Quantum State Tomography [0.0] ニューラルシャドウ量子状態トモグラフィー (NSQST) は、代替のニューラルネットワークベースの量子状態トモグラフィープロトコルである。
対象状態の古典的影を用いて不忠実さを推定する。
NSQSTは、誤差を緩和することなく、様々な種類のノイズに対して堅牢である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 03:25:33 GMT)
Minimal evolution times for fast, pulse-based state preparation in silicon spin qubits [0.0] シリコンハードウェア上での(マイクロ波と交換)パルスの最適化によって達成可能な最小進化時間(MET)を数値的に検討する。
最大交換振幅を10MHzから1GHzにすると、例えばH$$が84.3 nsから2.4 nsに加速することを示す。
本結果は,一般量子アルゴリズムにおける状態準備時間と,シリコンスピン量子ビットを用いた変分量子アルゴリズムの実行時間の両方に関係している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:27:21 GMT)
Majorana qubit readout by a point-contact detector under finite bias voltages [0.0] 点接触検出器(PC)による4つのMajorana-zero-modes (4-MZMs) qubitreadoutの問題を再検討する。
4-MZMs量子ビットの論理状態は、近くのPC検出器によってさらに測定されるトンネル結合量子ドット(QD)の異なる電荷占有に変換される。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 06:34:16 GMT)
MICL: Improving In-Context Learning through Multiple-Label Words in Demonstration [0.0] In-context Learning (ICL)では、サンプルラベルペアをデモとして使用することで、大規模な言語モデルで新しいタスクを実行することができる。
ICL性能を向上させるために,複数のラベル語を1つのサンプルラベル対で使用することを提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:11:46 GMT)
LLM-SAP: Large Language Models Situational Awareness Based Planning [0.0] 我々は、潜在的なリスクを予測し、積極的に軽減する方法論を開発するために、マルチエージェント推論フレームワークを使用します。
提案手法は,人間中心のインタラクションの複雑さを計画プロセスに組み込むことによって,従来のオートマトン理論から分岐する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:00:55 GMT)
LABCAT: Locally adaptive Bayesian optimization using principal-component-aligned trust regions [0.0] 信頼領域に基づくBOを拡張した LABCAT アルゴリズムを提案する。
このアルゴリズムは、最先端のBOや他のブラックボックス最適化アルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:22:52 GMT)
Khmer Semantic Search Engine (KSE): Digital Information Access and Document Retrieval [0.0] クメールのコンテンツは毎日発生しているが、カンボジア人は必要な文書を見つけるのに苦労している。
Googleでさえ、Khmerコンテンツに対して高い精度を提供していない。
本研究は,Khmer Semantic Search Engine (KSE) を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 19:08:34 GMT)
History-enhanced ICT For Sustainability education: Learning together with Business Computing students [0.0] 本研究は、ICT for Sustainability ICT4Sの分野における教育強化のためのヒストリーの利用について検討する。
ICT4Sの講師がヒストリーの講師と共同で、持続可能なビジネスとコンピューティングのユニットについて毎週教えている。
このプロジェクトは、コンピュータと歴史教育者として、私たちの課題にアプローチする方法を強化しました。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:20:35 GMT)
Global Geolocated Realtime Data of Interfleet Urban Transit Bus Idling [0.0] GRD-TRT-BUF-4Iは、都市交通バスの走行時間と走行時間を記録するリアルタイム検知システムである。
このシステムは、北米、ヨーロッパ、オセアニア、アジアにまたがる50都市から、毎日20万件のアイドリングイベントを検知する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:42:15 GMT)
Generalization and Knowledge Transfer in Abstract Visual Reasoning Models [0.0] 抽象的な視覚的推論領域におけるディープニューラルネットワークの一般化と知識再利用能力について検討する。
本稿では,4つの一般化規則を持つベンチマークであるAttributeless-I-RAVENを紹介する。
I-RAVEN-Meshはラインベースパターンからなる新しいコンポーネント構造でRPMを強化したデータセットである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:26:38 GMT)
GANmut: Generating and Modifying Facial Expressions [0.0] このプロジェクトの目的は、さまざまなデータセットをベンチマークすることで、このフレームワークの研究を拡張することだ。
これには、Aff-Wild2とAffNetという2つの感情的なデータセットを使用した一連の実験が含まれる。
最初の2つの実験は、Aff-Wild2データセットを使用して、RetinaFaceまたはMCCNNで処理されたGANmutのトレーニングに焦点を当てる。
続く2つの実験では、Aff-Wild2データセットとAffNetデータセットが統合され、Aff-Wild2の現実の変動性とAffNetの多様な感情ラベルが組み合わされる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:28:28 GMT)
Fuzzy Convolution Neural Networks for Tabular Data Classification [0.0] 畳み込みニューラルネットワーク(CNN)は、様々な領域における顕著な性能のために、多くの注目を集めている。
本稿では,表データに適したファジィ畳み込みニューラルネットワーク(FCNN)を提案する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 01:18:18 GMT)
FastPoseCNN: Real-Time Monocular Category-Level Pose and Size Estimation Framework [0.0] 2019年、CAMERAとREALという2つの新しいデータセットと共に、最初のカテゴリレベルのポーズとサイズ推定フレームワークが提案された。
我々のフレームワークは、異なるデコーダを用いて翻訳、回転、サイズ回帰問題を分離すると共に、効率的なResNet-FPNフレームワークを使用している。
提案手法の有効性を実証するために,精度と速度の観点から性能を十分に比較するための広範囲な試験を行った。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:37:32 GMT)
FENet: Focusing Enhanced Network for Lane Detection [0.0] この研究は、Focusing Smpling、Partial Field of View Evaluation、Enhanced FPN Architecture、Directional IoU Lossで拡張されたネットワークのパイオニアである。
実験では、均一なアプローチとは異なり、重要な遠隔の細部を強調しながら、集中サンプリング戦略を実証した。
今後の方向性には、道路上のデータ収集や、補完的な2つのフレームワークの統合などが含まれる。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:23:47 GMT)
Exploring the Efficacy of Federated-Continual Learning Nodes with Attention-Based Classifier for Robust Web Phishing Detection: An Empirical Investigation [0.0] Webフィッシングは動的脅威となり、検出システムが最新の戦術に迅速に適応する必要がある。
データを蓄積する従来のアプローチや、定期的にリトレーニングするモデルは、より多くなっています。
本研究では,フェデレーション学習と連続学習を組み合わせた新しいパラダイムを提案し,分散ノードが新たなフィッシングデータのストリーム上で,データを蓄積することなくモデルを継続的に更新することを可能にする。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 14:05:53 GMT)
Exploitation Business: Leveraging Information Asymmetry [0.0] Exploitation Business」は、情報非対称性を利用して必死の個人に製品やサービスを売る非専門家や詐欺師をターゲットとするビジネスに焦点を当てている。
この現象は、個人が限られた情報へのアクセス、専門知識の欠如、そして失敗の恐怖(Fear of Missing Out、FOMO)によって成長する。
近年のソーシャルメディアの進展とファンダムビジネスの高まりは、そのような搾取ビジネスモデルの普及を加速させている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 09:42:51 GMT)
Ergodic repeated interaction quantum systems: Steady states and reducibility theory [0.0] 定常分布を持つランダムな量子チャネルの列を対象とするオープン量子システムの時間進化を考察する。
反復相互作用モデルにおける様々な特定の障害モデルが検討されている。
我々は、この条件を伴わない一般的な定常ランダム反復相互作用モデルに対する再帰理論を開発する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:38:20 GMT)
Entanglement in $(1+1)$-dimensional Free Scalar Field Theory: Tiptoeing between Continuum and Discrete [0.0] 離散化理論のために発達した形式主義が連続理論の結果を得るためにどのように利用できるかを示す。
特定の座標系において、モジュラーハミルトニアン (modular Hamiltonian) は、リンドラー・ウェッジ上の自由体ハミルトニアン (free field Hamiltonian) の形を仮定する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:00:42 GMT)
Enhancing Class Diagram Dynamics: A Natural Language Approach with ChatGPT [0.0] 本研究では,高度なAI言語モデルであるChatGPTを用いて,クラスダイアグラムを動的に拡張する方法について検討する。
発見は、AI駆動のアプローチがクラスダイアグラムの正確性と完全性を大幅に改善することを示している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:30:55 GMT)
Enhanced Elephant Herding Optimization for Large Scale Information Access on Social Media [0.0] 本稿では,情報採集理論 (IFT) とゾウ群集最適化 (EHO) に触発された新しい情報アクセス手法を提案する。
まず,IFTに基づくソーシャルメディア情報アクセスモデルを提案する。
次に、元のEHOアルゴリズムを応用して情報アクセス問題に適用する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:48:41 GMT)
Dynamics of non-Hermitian Floquet Wannier-Stark system [0.0] 強結合近似の枠組みにおける非エルミートフロッケワニエ・スターク系の力学について検討する。
即時ハミルトニアンのエネルギー準位は依然として等間隔であり、時間$t$とホッピング項のエルミティシティとは独立である。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 11:12:43 GMT)
Dynamic Normativity: Necessary and Sufficient Conditions for Value Alignment [0.0] 我々は,人的目標と価値を人工システムで従うことができるような方法で表現する上での課題に,不必要な敵意を伴わない「調整」の問題を見出した。
この研究は、AIシステム開発に規範的理論をもたらす、しっかりとした哲学的基礎と実践的な実装を必要とする技術的哲学的問題としてのアライメントに対処する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 18:37:31 GMT)
Current state of LLM Risks and AI Guardrails [0.0] 大規模言語モデル(LLM)はますます洗練され、安全性と信頼性が最優先されるセンシティブなアプリケーションに広くデプロイされるようになる。
これらのリスクは、LSMを望ましい行動と整合させ、潜在的な害を軽減するために、"ガードレール"の開発を必要とする。
本研究は,LLMの展開に伴うリスクを調査し,ガードレールの実装とモデルアライメント技術に対する現在のアプローチを評価する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 22:04:10 GMT)
Breaking the Attention Bottleneck [0.0] 本稿では,注意やアクティベーションの代替として生成機能を開発する。
それぞれのトークンと前のトークンを比較することで、自動回帰文字を持つ。
注意の置き換えという概念は、https://gitlab.com/Bachstelzecausal_generationでAGPL v3ライセンスの下で配布されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 12:06:58 GMT)
Boundary deconfined quantum criticality at transitions between symmetry-protected topological chains [0.0] この研究は、非自明な位相位相の間の臨界性のリッチな未探索物理学を強調している。
これは、ギャップのない位相位相の急成長する分野に関する洞察を与える。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:08:38 GMT)
Beyond the Hype: A Cautionary Tale of ChatGPT in the Programming Classroom [0.0] 本論文は、より困難な演習を創出するためにプログラミングを教える学者や、教室の整合性を促進するためにChatGPTの使用に責任を負う方法についての知見を提供する。
過去のIS演習の実践的プログラミング事例を分析し,教員や講師が大学環境下で作成したメモと比較した。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 23:52:37 GMT)
Back to Bohr: Quantum Jumps in Schroedinger's Wave Mechanics [0.0] 我々は、短距離ポテンシャルとの相互作用により、アレイを貫通する粒子を検出できる高調波発振器の散乱配列について論じる。
散乱粒子の波動関数の進化は、波動力学において量子ジャンプが持続するというハイゼンベルクの主張と相まって、散乱が非弾性であれば波動関数が単一部位の周りに崩壊することを示している。
実際に基礎となる非弾性散乱事象は量子ジャンプに対応するが、連続的に進化する波動関数は異なる部位から散乱する確率振幅の進化を記述するのみである。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 16:37:57 GMT)
Automatic Speech Recognition for Biomedical Data in Bengali Language [0.0] 本稿では,ベンガルのバイオメディカルデータに特化して設計されたASR(Automatic Speech Recognition)システムの開発について述べる。
ベンガルASRの最近の進歩は奨励されているが、ドメイン固有のデータがないため、実用的な医療ASRモデルの作成が制限されている。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:49:21 GMT)
Against Bell's Theorem [0.0] ベルの定理は、量子力学と局所的で現実的な隠れ変数理論の間の矛盾を証明していると考えられている。
本稿ではベルの定理を証明しようとするすべての実験がこの目標を達成できないことを示す。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 10:18:33 GMT)
Acceleration Noise Induced Decoherence in Stern-Gerlach Interferometers for Gravity Experiments [0.0] SGI(Stern-Gerlach Interferometer)は磁場によって駆動される物質波干渉計であり、多くの重力実験のために提案されている。
加速度ノイズは、デフォーカス、コントラストの喪失、位置ローカライゼーションデコヒーレンスを含むSGIのデコヒーレンス問題を引き起こす。
本稿では,SGIの解析的時間進化演算子に基づいて,これらのデコヒーレンス機構を理論的に研究する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 07:54:34 GMT)
A systematic study of the role of dissipative environment in regulating entanglement and exciton delocalization in the Fenna-Matthews-Olson complex [0.0] 自然光ハーベストティングシステムFenna-Matthews-Olsonにおける大域的絡み合いとエキシトンコヒーレンス長の動的コヒーレンスについて検討した。
運動の非摂動的数値的正確な階層方程式を用いてシステムの力学を伝播する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 15:26:08 GMT)
A note on the emission spectrum and trapping states in the Jaynes-Cummings model [0.0] 初期の「トッピング状態」に対する蛍光スペクトルの新たな特徴を示す。
非ゼロ原子場デチューニングのためのトラップ条件を一般化する。
また、3つのピークを持つスペクトルにつながる2種類のトラップ状態も明らかにした。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 00:17:48 GMT)
A Unified View of Abstract Visual Reasoning Problems [0.0] タスクの統一的なビューを導入し、各インスタンスは、パネルの数、場所、役割に関する前提のない単一のイメージとしてレンダリングされる。
統一された視点の主な利点は、様々なタスクに適用可能な普遍的な学習モデルを開発する能力である。
Raven's Progressive Matrices と Visual Analogy Problems の4つのデータセットで実施された実験は、提案されたタスクの統一表現が、最先端のディープラーニング(DL)モデルや、より広範に、現代のDL画像認識方法に挑戦していることを示している。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 20:52:44 GMT)
A Labelled Dataset for Sentiment Analysis of Videos on YouTube, TikTok, and Other Sources about the 2024 Outbreak of Measles [0.0] 本稿では2024年1月1日から5月31日までに264のウェブサイトで公表された麻疹の流行に関する4011件のビデオデータを含むデータセットを提案する。
YouTubeとTikTokはそれぞれ48.6%と15.2%を占めている。
これらのビデオのそれぞれについて、ビデオのURL、投稿のタイトル、投稿の説明、およびビデオの公開日をデータセット内の別の属性として提示する。
論文参考訳(メタデータ) (Sun, 16 Jun 2024 21:10:55 GMT)