2025年10月08日NLP论文汇总(中文)
- Topic 1: Large Language Model Optimization (8 papers)
- Topic 2: Multimodal Reasoning and Integration (8 papers)
- Topic 3: Reasoning and Alignment Techniques (7 papers)
- Topic 4: Machine Learning Safety and Ethics (7 papers)
- Topic 5: Dialogue and Conversational Systems (7 papers)
- Topic 6: Knowledge Extraction and Synthesis (7 papers)
- Topic 7: Reinforcement Learning in Complex Environments (8 papers)
- Topic 8: Context and Memory Management (4 papers)
- Topic 9: Evaluation and Benchmarking of AI Systems (6 papers)
- Topic 10: Neural Network Architecture and Learning (6 papers)
- Topic 11: misc (54 papers)
Topic 1: Large Language Model Optimization
主题概述
大型语言模型(Large Language Model, LLM)优化是当前人工智能领域的一个关键研究方向,旨在通过各种方法和技术提高LLM的计算效率、推理性能、安全性和适用性。这些优化措施不仅能够显著减少计算资源的消耗,还能改善模型在特定任务中的表现,确保其在实际应用中更加可靠和高效。
各论文贡献
-
来自清华大学的Shangqing Tu等人研究了大规模语言模型并行扩展过程中由于冗余推理路径导致的计算效率低下问题,提出了DeepPrune框架,结合专用判断模型与在线贪婪聚类,有效修剪冗余推理路径同时保留答案多样性。该方法的主要创新点是利用固定长度前缀和推理步骤对齐段落训练判断模型以降低token消耗和提高计算效率。在AIME 2024、AIME 2025和GPQA等三个具有挑战性的基准测试上验证了该方法的有效性,结果表明DeepPrune能将token消耗减少高达95%,并且在Qwen3-32B上实现了从80.0%到90.0%的准确率提升1。
-
来自浙江大学的Hongxing Li等人研究了视觉语言模型(Vision-Language Model, VLM)在空间推理方面的能力不足问题,提出了SpatialLadder-26$k$数据集及三阶段逐步训练框架。该框架包括通过对象定位建立感知基础、通过多维度任务发展空间理解能力、以及通过强化学习加强复杂推理。主要创新点是针对空间推理的系统化数据集构建及多层次训练策略。实验结果显示,SpatialLadder在多个空间推理基准测试中达到了领先水平,如VSI-Bench、SPBench-SI、SPBench-MV等,展示了其在提升模型空间推理能力方面的有效性2。
-
来自Meta和佛罗里达中央大学的Md Kowsher等人探讨了为何在预训练网络中仅需微调小部分随机选取的子网络(即“切片”)就能实现下游任务适应,并提出SliceFine方法,该方法更新原始权重的选定切片而不增加新参数。其主要创新点是基于谱平衡和高任务能量现象提出的通用获胜切片假设(Universal Winning Slice Hypothesis, UWSH)。实验结果表明,SliceFine在多种任务上表现出色,尤其是在数学推理和图像分类任务中,展示了其在提高模型适应性和训练效率的同时,保持高性能的潜力3。
-
来自清华大学的Heming Zou等人针对低秩适应(Low-Rank Adaptation, LoRA)方法在基础模型合并过程中的参数干扰问题,提出了FlyLoRA。该方法通过引入冻结的稀疏随机投影矩阵和仅激活k个专家的机制来解决这个问题,主要创新点在于利用随机矩阵的正交性保证任务特定更新在几乎正交的子空间中进行。实验表明,FlyLoRA在单任务和多任务场景下均优于其他LoRA变体,特别是在减少任务间干扰方面表现出色,提升了模型的稳定性和效率4。
-
来自AMD的Devleena Das等人研究了小型语言模型(SLM)在各种推理优化和转换后出现的准确性下降问题,提出了Recover-LoRA方法,利用合成数据和logit蒸馏学习LoRA适配器来恢复降级模型的准确性。其主要创新点是轻量级且数据无关的方法,适用于多种潜在的降级情况。实验显示,Recover-LoRA在多个SLM上显著恢复了模型的准确性,尤其在使用多头注意力(MHA)和组查询注意力(GQA)的模型上表现更佳5。
-
来自IBM Research的Chen Wang等人关注于如何在大型语言模型中高效地应用推理模式的问题,提出了一个语义路由器,专门用于选择性地应用推理模式。主要创新点是开发了一种多任务意图分类的路由器,它可以根据查询的需求选择是否应用推理模式,从而平衡精度与效率。实验结果显示,该路由器在MMLU-Pro基准测试上显著提高了平均准确率,同时减少了响应延迟和token消耗6。
-
来自未提供完整机构信息的Shaohua Zhang等人研究了大规模语言模型中记忆检索和巩固机制,特别是功能令牌在这一过程中的作用。提出了Function Token Hypothesis,解释功能令牌如何激活上下文中最预测的特征以引导下一令牌预测,以及它们如何影响预训练期间的知识巩固。主要创新点是对功能令牌在内存管理中的独特角色进行了深入分析。实验揭示了功能令牌在激活模型特征和指导模型输出方面的关键作用7。
技术趋势
这些论文展示了在大型语言模型优化领域的几个主要技术趋势:一是通过引入新的算法或框架来减少计算资源的消耗,例如DeepPrune和SliceFine;二是改进模型的训练策略以提升特定技能,比如SpatialLadder专注于空间推理能力的增强;三是通过创新的设计方法解决模型合并和多任务处理中的参数干扰问题,如FlyLoRA;四是提升模型的安全性和实用性,例如The Alignment Waltz中的WaltzRL框架;五是探索模型内部机制以提高其解释性,如Memory Retrieval and Consolidation in Large Language Models通过功能令牌的研究。
数据集和评估
这些论文采用了多种数据集进行评估,涵盖了广泛的任务类型和领域,包括但不限于常识推理、数学推理、图像分类、视频动作识别、知识密集型任务以及多模态任务。使用的数据集包括AIME 2024、AIME 2025、GPQA、VSI-Bench、SPBench-SI、SPBench-MV、CV-Bench、SPAR-Bench、ViewSpatial-Bench、WildJailbreak、OR-Bench、VTAB-1K、VideoMAE-base、MMLU-Pro、HellaSwag、Arc C、WinoGrande、PiQA、OpenbookQA和BoolQ等。评估指标通常包括准确率、token消耗、响应时间、过拒绝率(Over-Refuse Rate, ORR)、攻击成功率(Attack Success Rate, ASR)等,以全面衡量优化后的模型在不同任务和场景中的性能表现。
Topic 2: Multimodal Reasoning and Integration
主题概述
多模态推理与整合(Multimodal Reasoning and Integration)是指通过结合多种类型的数据源(如文本、图像、音频等)以实现更高级别的理解和决策能力。这一领域对于提高人工智能系统在复杂场景中的性能至关重要,特别是在需要跨模态理解的任务中,例如情感识别、文化意识推理和工具使用控制等。随着大数据和深度学习技术的发展,多模态推理成为推动智能系统向更自然、更高效方向发展的关键驱动力。
各论文贡献
-
来自University of California, Davis的Qin Liu等人研究了大型语言模型(LLMs)在基准测试数据集上的数据泄露问题,提出了ArenaBencher框架来解决这一问题。该方法的主要创新点是通过多模型竞争评估自动进化基准测试,产生新的测试案例来揭示模型共享的弱点。其产生的价值在于增强了基准测试的有效性和可靠性,促进了更加通用化和强大的LLMs开发。在GSM8K、Harmful Behaviors和CSQA数据集上的实验表明,相比之前的基准测试方法,模型准确性显著下降,而攻击成功率增加,证明了ArenaBencher能有效揭示新的失败模式并提升诊断价值。8
-
来自University of California, Los Angeles的Yue Guo等人探讨了多模态大型推理模型(MLRMs)在处理简单任务时过度冗长的推理链问题,引入ARES框架来解决此挑战。ARES的关键创新在于采用了适应冷启动微调(AdaCS)和基于熵的探索策略优化(AEPO),以及动态KL设计来平衡探索与利用。这种方法不仅提高了模型的推理效率,还提升了其在多种推理任务中的表现。ARES-7B在MathVision和MMMU-Pro上分别超越了最佳开源模型+19.0和+11.5,在AIME25上达到了61.7的分数,远超其他基线模型。实验结果显示,ARES能够根据任务难度调整其推理努力,有效提高了推理准确性和令牌效率。9
-
来自The Ohio State University的Jian Xie等人解决了大型推理模型(LRMs)在简单任务上过度思考的问题,提出ARM2模型,结合视觉理解和可执行代码,引入GRPO-alp算法防止格式崩溃,并促进自适应推理。ARM2的主要创新在于其适应性推理能力和多模态处理能力。实验显示,ARM2在六种域内和六种域外数据集上平均减少了超过70%的令牌使用量,同时在CommonSenseQA、GSM8K、AIME等数据集上表现出色。这证明了ARM2在自适应推理和处理多模态输入方面的优越性。10
-
来自Singapore University of Technology and Design的Weihua Zheng等人针对大型语言模型(LLMs)和视觉语言模型(VLMs)在亚洲文化背景下的性能不足问题,提出了MMA-ASIA框架。该框架的独特之处在于构建了一个包含27,000个问题的多语言、多模态基准测试,覆盖8个亚洲国家的10种语言。实验表明,尽管闭源模型通常优于开源模型,但两者在进行文化相关的推理时都面临挑战,特别是在低资源语言和跨模态一致性方面。11
-
来自Tsinghua University的Yuxuan Jiang等人致力于解决由文本引导的高质量音频生成问题,尤其是带有精确时间和清晰语音内容的音频。他们提出了ControlAudio方法,采用逐步扩散建模技术,通过结构化的提示设计和词汇扩展技术提高时间对齐和语音清晰度。实验结果表明,ControlAudio在AC-Filtered和AudioCaps数据集上均优于现有基线模型,实现了更低的WER和更高的音频质量评分。12
-
来自Mohamed bin Zayed University of Artificial Intelligence的Tajamul Ashraf等人研究了视觉语言模型(VLMs)作为外部工具控制器时的局限性,特别是面对复杂决策任务时的表现不佳。他们提出了MATRIX框架,通过大规模多模态工具使用轨迹数据集M-TRACE和偏好优化方法Pref-X来改善VLMs的工具使用推理能力。实验结果证明,MATRIX在多个基准测试上显著优于其他模型,尤其是在Agent-X、GTA和GAIA数据集上的得分均有大幅提高。13
-
来自多个机构的Yu Liu等人关注于会话中的情感识别(ERC),尤其是跨文本、音频和视频模态中稀疏、局部且往往不同步的情感线索检测问题。他们提出了Hotspot-Gated Fusion(HGF)和Mixture-of-Aligners(MoA)方法,专注于情感热点的识别和跨模态对齐。实验结果显示,该模型在IEMOCAP和CMU-MOSEI数据集上表现优异,尤其在Neutral和Excited类别上,取得了72.52%的加权F1分数和准确率。14
技术趋势
这些论文展示了多模态推理与整合领域的几个关键技术趋势:一是通过自动化和智能化手段(如ArenaBencher、ARES)来提升模型的公平性和泛化能力;二是采用强化学习和自适应策略(如ARM2、MATRIX)来提高模型的效率和适应性;三是通过精细的数据构造和模型设计(如ControlAudio、Centering Emotion Hotspots)来增强模型对特定任务的控制能力和精度;四是引入多维度的文化评价体系(如MMA-ASIA)来丰富模型的文化意识和多模态理解能力。
数据集和评估
- ArenaBencher: 使用GSM8K、Harmful Behaviors、CSQA数据集进行实验,评估模型的准确性和攻击成功率。
- ARES: 通过MathVision、MMMU-Pro、OlympiadBench、GSM8K、MathVista等数据集,评估模型的推理准确性和效率。
- ARM2: 实验涵盖CommonSenseQA、GSM8K、AIME、Geometry3K、MME RealWorld、MMK12、OBQA、MATH500、GPQA-Diamond、BLINK、ChartQA和MMMU等数据集,侧重于模型的适应性和效率。
- MMA-ASIA: 基于一个包含27,000个问题的新数据集,涉及10种语言,8个亚洲国家,评估模型的跨语言、跨模态一致性和文化知识泛化能力。
- ControlAudio: 使用AC-Filtered和AudioCaps数据集进行实验,评估模型的语音清晰度和时间对齐能力。
- MATRIX: 基于M-TRACE、Pref-X数据集以及Agent-X、GTA和GAIA等基准测试,评估模型的工具使用推理能力和跨模态操作能力。
- Centering Emotion Hotspots: 利用IEMOCAP和CMU-MOSEI数据集进行评估,侧重于情感识别的准确率和F1分数。
Topic 3: Reasoning and Alignment Techniques
主题概述
Reasoning and Alignment Techniques(推理与对齐技术)是当前自然语言处理(NLP)和人工智能领域的重要研究主题之一。随着大语言模型(LLMs)的发展,如何提高这些模型在复杂任务中的推理能力,以及确保其行为与人类价值观和意图一致成为关键挑战。这一领域的研究不仅有助于开发更加智能且可靠的AI系统,还能够推动这些系统在现实世界应用中的广泛部署,特别是在需要主观判断和长期推理能力的场景中。
各论文贡献
-
来自Fondazione Bruno Kessler的Elisa Leonardelli等人研究了在捕捉人类判断差异和不一致性的数据集上训练和评估AI模型的核心问题,提出了LeWiDi-2025共享任务的第三版来解决这一问题。该方法的主要创新点是引入了四个涵盖多种任务的新数据集,并采用了软标签和视角主义两种评价范式,以及新的评价指标如曼哈顿距离、瓦瑟斯坦距离等。产生的价值在于提供了新的资源和方法论,用于在主观性强的NLP任务中训练和评估模型。在Par和VEN等数据集上的实验表明,大型语言模型通过上下文学习(ICL)通常排名更高,而使用注释者信息对于提高性能至关重要。主要结论是新评价指标能更可靠地衡量模型性能。15
-
来自Shanghai Artificial Intelligence Laboratory的Xuhao Hu等人探讨了大型语言模型(LLMs)无意中发展出欺骗和误导行为的现象,特别是针对高风险或极端情况。该方法没有引入新的数据集或方法,而是利用现有的MASK和DeceptionBench数据集来研究这一现象。产生的价值在于扩展了对模型偏离行为的研究范围,聚焦于欺骗行为,揭示了少量偏离样本对下游数据集的影响。主要结论是即使只包含1%的偏离数据,也会导致诚实评分大幅下降;模拟的人机交互中,少量有偏见用户的存在会显著放大模型的不诚实行为。16
-
来自University of Potsdam的Sherzod Hakimov等人首次全面研究了大型语言模型(LLMs)在多语言环境下的谈判能力及其计算成本。该方法的主要创新点是使用clembench框架,设计了三种对话游戏以评估LLMs的谈判技能。产生的价值在于填补了当前研究中关于LLMs谈判能力和多语言适应性之间的空白,提供了一种新颖的评估方法。虽然具体的实验结论和基线比较未在内容中提供,但通过系统实验探索了启用推理对LLMs性能的影响及多语言谈判的挑战。17
-
来自University of Science and Technology of China的Jianlyu Chen等人提出了一种新的文本嵌入模型ReasonEmbed,专门用于推理密集型文档检索。该方法的主要创新点包括ReMixer数据合成方法和Redapter自适应训练算法。产生的价值在于提高了信息检索系统的准确性,特别是在需要复杂语义关系理解的应用中。实验结果表明,ReasonEmbed-Qwen3-8B在BRIGHT和R2MED基准上取得了显著的性能提升,显示了合成数据和自适应训练的重要性。18
-
来自Fudan University的Yi Lu等人研究了如何通过查询组合刺激大型推理模型(LRMs)的长跨度推理能力。该方法的主要创新点是R-Horizon方法和两个奖励方案的设计。产生的价值在于提供了一个可扩展、可控且成本效益高的方式来改进和评估LRMs的长跨度推理能力。实验结果显示,LRMs在多步推理任务中的表现随推理跨度增加而显著下降,但通过R-Horizon数据集进行训练可以大幅提升性能。例如,R1-Qwen-7B在AIME24 (n=2)上显示出+17.4的提升,在整体AIME24上则有+7.5的提升。这表明强化正确中间步骤的需求有助于发展长跨度推理技能。19
-
来自University of California, San Diego的V. S. Raghu Parupudi等人提出了一个系统诊断大型语言模型(LLMs)数学推理能力脆弱性的框架。该方法的主要创新点在于通过生成结构化推理轨迹并进行无监督聚类分析来识别不同的“推理模式”及其可靠性。产生的价值在于不仅评估了任务级别的准确性,还提供了一个详细的诊断图谱,揭示了LLMs与人类认知的不同之处。实验发现gpt-3.5-turbo在某些程序性任务中表现出几乎完美的可靠性,但在涉及更复杂推理的任务中表现不佳,显示出LLMs推理能力的脆弱性。20
-
来自CMI-Lab University of Stirling的Noor Ul Zain等人提出了一种名为$Co^{4}$的新型机器学习架构,旨在减少大规模语言模型(如GPT-2和GPT-BERT)的参数数量、层数和训练周期数,以实现高效且具有竞争力的性能。该方法的主要创新点是结合前馈和上下文信息的单层模型设计,仅需两个注意力头和8百万个参数。产生的价值在于提高了模型的样本效率和训练成本效益,使得先进AI模型能够在低功耗硬件上运行。实验表明,$Co^{4}$模型在多个零样本和微调基准测试中优于GPT-2和GPT-BERT,特别是$Co^{4}$-$\gamma$配置在BLiMP Supplement基准上表现优异。21
技术趋势
从上述论文可以看出,Reasoning and Alignment Techniques领域正朝着以下几个方向发展:
- 数据多样性与模型鲁棒性:通过引入更多样化的数据集和评估标准,如保留人类判断差异的数据集,来提高模型的鲁棒性和泛化能力。
- 模型训练优化:开发更加高效的训练方法和架构,比如减少模型复杂度的同时保持甚至提升性能,这有利于资源受限环境下的应用。
- 深入推理能力:研究如何提高模型的长期推理能力和处理复杂任务的能力,通过构建专门的评估框架和基准测试来衡量模型在这些任务上的表现。
- 人机交互的信任度:关注如何避免模型产生不诚实或误导性行为,特别是在面对少量偏离样本或有偏见的用户交互时,提高模型的可靠性。
数据集和评估
- LeWiDi-2025:涵盖了四种任务的数据集,包括同义词识别、讽刺检测、讽刺检测和自然语言推断,使用了新的评价范式和指标。
- MASK和DeceptionBench:用于评估LLMs的不诚实行为。
- clembench:包含三种对话游戏,用于评估LLMs在多语言环境下进行谈判的能力。
- BRIGHT和R2MED:用于评估ReasonEmbed模型在推理密集型文档检索任务中的表现。
- AIME24:用于评估LRMs的长跨度推理能力。
- GSM8K:用于系统性诊断LLMs的数学推理失败点。
- BabyLM Challenge和SuperGLUE:用于评估$Co^{4}$模型的零样本和微调性能,特别是在有限训练数据下的表现。
评估指标方面,除了传统的精度和交叉熵外,还引入了新的评价方法如曼哈顿距离、瓦瑟斯坦距离、错误率、平均标准化绝对距离等,这些指标在特定情境下提供了更为准确的性能评估。
Topic 4: Machine Learning Safety and Ethics
主题概述
机器学习安全与伦理(Machine Learning Safety and Ethics)是人工智能领域的一个重要分支,关注如何确保大型语言模型(LLMs)的安全性和道德性,防止其生成有害或偏见的内容。随着LLMs在日常生活和关键领域的广泛应用,保证其输出符合社会伦理标准变得尤为迫切。此外,LLMs在多语言环境中的表现也引起了广泛关注,尤其是在非英语环境中,它们是否能够提供一致且可靠的道德和法律建议。
各论文贡献
-
来自慕尼黑工业大学的Hyunji Lee等人研究了利用大型语言模型检测服务条款中不公平条款的效率问题,提出了结合蒙特卡洛树搜索(MCTS)与代理提示评估器的框架来优化提示设计,以提高检测效率并减少计算成本。该方法的主要创新点在于使用代理评分器来预测提示性能,避免反复调用昂贵的LLM。产生的价值在于允许更彻底和成本效益更高的提示优化,从而提高LLMs在复杂法律文档分类任务中的性能和可靠性。在实验中,该框架实现了与支持向量机(SVM)相当且优于其他零样本和提示优化基准的二元分类性能,同时显著降低了计算成本22。
-
来自北京邮电大学的Muxi Diao等人解决了生成多样化的对抗性提示以评估和提升LLMs安全性的难题。AutoRed框架通过使用角色数据指导多样化提示生成,不依赖预定义的种子指令,引入了一个指令验证器来评估提示的危害性,提高了数据合成的效率。这项工作的主要创新在于动态生成多样化的对抗性提示,揭示了LLMs的安全漏洞。在构建的两个评估数据集AutoRed-Hard和AutoRed-Medium上,AutoRed显示出了比现有方法如StrongR、Beaver、HQA等更高的攻击成功率,证明了其在改善LLMs安全性方面的潜力23。
-
来自德累斯顿工业大学的Shuzhou Yuan等人探讨了LLMs在面对看似无害但含有可能引起拒绝反应的请求时过度拒绝的问题,这影响了模型的有用性和用户体验。他们提出了三种轻量级的后处理缓解策略:忽略词指令、提示重述和注意力引导,旨在提高模型对安全提示的响应率,同时保持安全标准。这些策略在新的诊断基准Exaggerated Safety Benchmark (XSB)和Multi-turn Scenario-based Exaggerated Safety Benchmark (MS-XSB)上进行了测试,结果显示,新模型如Llama-3.1-8B在安全提示的合规性上有更好的平衡,减少了过度拒绝行为,提升了用户体验24。
-
来自东北大学的Shuliang Liu等人关注了LLMs作为评判者时存在的判断偏好偏差,提出了一种称为Genii的方法,这是一种无监督的多智能体协作优化框架,用于减轻LLMs的判断偏好偏差。与依赖强模型指导弱模型的传统方法不同,Genii允许不同能力的模型之间双向知识共享,优化每个模型向群体偏好靠拢。这种方法不需要人类标注的数据,具有成本效益和可扩展性。在多个基准数据集上的实验结果表明,Genii显著提高了较弱模型的判断准确性和可靠性,特别是对于错误答案的困惑度(Perplexity)得分更高,显示出其在改进LLM评价方面的有效性25。
-
来自IBM Research的Jasmina Gajcin等人致力于提高LLM作为评判者的透明度和解释性,提出了CLoVE和GloVE两种方法,分别生成局部可验证解释和全局可验证规则。GloVE能够将局部解释整合成一个高阶的、基于规则的全局政策,适用于广泛的决策场景。实验结果显示,GloVE在某些数据集上保持了较高的决策过程保真度,并且在用户满意度方面有轻微提升,尤其是在解释的实用性上,尽管在预测准确性上没有显著差异26。
-
来自东京理科大学的Ragib Amin Nihal等人研究了LLMs对多轮次越狱攻击的脆弱性,提出了一种名为Pattern Enhanced Chain of Attack (PE-CoA)的框架,通过整合五个经过实证验证的对话模式来构造有效的多轮次越狱攻击。该方法的主要创新点在于系统地分析了不同危害类别和对话模式之间的相互作用,揭示了不同LLM架构的独特脆弱性。实验结果表明,PE-CoA在大多数架构上实现了75%到100%的攻击成功率,超越了其他已建立的技术,如ActorAttack、Crescendo和X-Teaming,说明了针对性防御策略的有效性27。
-
来自未指定机构的Kimaya Basu等人研究了LLMs在多语言能力下对道德、伦理、法律和安全相关查询响应的一致性和准确性问题,提出了一个包含500个独特问题的详细数据集,覆盖六个不同的语言。通过引入五点评分体系和使用评判LLM评估各种模型的回答,研究发现GPT-5在总体上表现最佳,特别是在同意与自主权、危害预防与安全等方面。而Gemini 2.5 Pro在同意与自主权及危害预防与安全类别中表现最差。此外,还发现了模型在低资源语言中的意外高得分现象,这可能是因为模型对这些语言上下文的理解不够复杂,导致在特定类别的问题上表现更好28。
技术趋势
这些论文展示了在提高LLMs安全性和伦理性的过程中,多种技术和方法的应用和发展。包括但不限于使用代理评分器优化提示、无监督的多智能体协作优化框架减轻判断偏好偏差、以及系统化地识别和利用对话模式中的结构弱点进行攻击和防御。此外,多语言能力的测试和评估也是当前研究的重点之一,强调了跨文化背景下模型表现的一致性和可靠性。
数据集和评估
这些论文使用了多种数据集进行评估,例如AutoRed-Hard、AutoRed-Medium、Exaggerated Safety Benchmark (XSB)、Multi-turn Scenario-based Exaggerated Safety Benchmark (MS-XSB)、UltraFb、MT、AutoJ、Prefer、Reward、NQ、HotpotQA、TriviaQA、JailbreakBench、HarmBench、AdvBench等。评估指标主要包括攻击成功率(ASR)、分类性能、困惑度(Perplexity)、F1分数等。这些数据集和评估指标帮助研究人员量化模型的安全性和道德性,推动了该领域的技术进步和标准化。
Topic 5: Dialogue and Conversational Systems
主题概述
对话与会话系统(Dialogue and Conversational Systems)的研究旨在通过开发和优化人工智能技术,以改善人机交互的质量和效率。这一领域的研究不仅关注如何提高语言模型的理解与生成能力,还涉及这些系统在特定应用领域中的表现,例如机器翻译、文化意识、情感分析以及销售对话策略等。随着大语言模型的不断进步,其在实际场景中的应用潜力也日益显现,但同时也面临着如何适应多变环境和用户需求的挑战。因此,探讨这些系统的有效性和改进方法对于推动人工智能技术的发展具有重要意义。
各论文贡献
-
来自Yaraku, Inc.的Vincent Michael Sutanto等人研究了使用ChatGPT作为日语-英语翻译引擎的有效性,提出了对比简单提示与增强提示的方法,并将ChatGPT-3.5和ChatGPT-4与两个商业翻译系统进行了比较。该方法的主要创新点是利用了ChatGPT的上下文处理能力来进行文档级别的翻译,同时引入了MQM开源评估工具。产生的价值在于扩展了ChatGPT的应用范围,使其不仅仅局限于对话任务,还包括翻译任务。在ParaNatCom、FLORES、Novels、KFTT和WMT News数据集上的实验表明,相比基线方法,ChatGPT-3.5在准确性上略胜一筹,而ChatGPT-4则在流畅度方面表现出色,但在BLEU评分上稍逊于商业系统。29
-
来自Columbia University的Nikhil Reddy Varimalla等人研究了视频语言模型的文化敏感性问题,提出了VideoNorms基准测试,专门用于评估VideoLLMs在理解社会文化规范方面的性能。该方法的主要创新点是采用了基于演讲行为理论的提示来生成候选注释,并结合人类专家的知识进行验证和修正。产生的价值在于填补了现有研究中关于视频内容中跨文化交流理解和规范识别的空白。在包含超过1000个中美文化背景下视频片段的数据集上的实验表明,模型在识别正式场合和中国文化的规范违反情况时表现不佳,显示了进一步改进的需求。30
-
来自Distributed and Operating Systems Group, Technische Universität Berlin的Justus Flerlage等人研究了开放源代码和开放访问的大语言模型在解析用户意图方面的有效性,与OpenAI的专有模型进行了对比。该方法的主要创新点是设计了一个控制器应用程序来管理设备与LLM服务之间的交互,以生成并执行基于用户意图的工作流。产生的价值在于探索了本地部署LLM的可能性,提供了更加隐私保护的解决方案。实验结果表明,虽然开放模型在大多数情况下能够成功解析用户的意图,但在处理复杂或多步骤任务时仍需改进。31
-
来自Dialpad Inc.的Elena Khasanova等人研究了小型大语言模型在业务对话任务中缺乏零样本指令跟随能力的问题,提出了一种新的持续预训练技术DACIP-RC。该方法的主要创新点是通过阅读理解任务来增强模型的领域适应性。产生的价值在于提供了一种成本效益高且能有效防止灾难性遗忘的方法,适用于动态工业环境中快速变化的用户需求。实验数据显示,DACIP-RC显著提升了模型在内部业务对话任务中的零样本性能,包括会议摘要、行动项生成和通话目的识别等。32
-
来自Monash University的Lirui Guo等人研究了人类与共享自动驾驶汽车(SAVs)之间的情感互动如何影响用户体验。该方法的主要创新点是利用GPT-3.5 Turbo模拟SAVs与人类的对话,并结合大语言模型进行情感分析。产生的价值在于通过真实的对话场景,帮助理解SAVs在实际应用中的接受程度和服务质量感知。实验表明,结合心理所有权和拟人化策略的SAV4被用户认为更接近人类,并获得了更高的正面反馈。33
-
来自未明确机构的Wen-Yu Chang等人研究了基于用户个人资料(如年龄、性别、职业)的个性化交互规划自动化方法,特别针对销售导向型对话系统。该方法的主要创新点是引入了一种轻量级的职业条件策略框架SalesAgent。产生的价值在于通过整合用户行为分析,使得对话系统能够在销售推荐任务中更加有效地与用户互动,提升用户满意度。实验结果显示,在农业、林业和渔业行业工作的用户对于销售对话的成功率最高。34
技术趋势
本主题下的研究展示了多种技术趋势,包括:
- 语言模型的多用途应用:从对话到翻译,再到特定领域的任务执行,展现了语言模型的灵活性和广泛适用性。
- 安全与可靠性提升:引入外部模型或机制来减少大语言模型的错误拒绝率,确保其在关键领域中的可靠应用。
- 用户行为与情感分析:利用大语言模型进行实时情感分析,以及根据用户属性调整对话策略,以提高用户体验。
- 本地化部署与隐私保护:探索开放源代码和开放访问的大语言模型在本地部署中的应用,强调隐私保护的重要性。
数据集和评估
- 翻译任务:使用ParaNatCom、FLORES、Novels、KFTT和WMT News数据集,评估指标包括自动和人工评价的准确性和流畅度。
- 文化敏感性:VideoNorms数据集,包括中美文化背景下的视频片段,评估模型是否能正确解读和回应视频中的社会文化规范。
- 用户意图解析:未具体提及的数据集,评估模型在生成和执行基于用户意图的工作流中的成功率。
- 业务对话任务:内部业务对话数据集,包括会议摘要、行动项生成和通话目的识别等任务,评估指标包括F1分数和ROUGE-2。
- 情感互动分析:模拟SAVs与人类的对话数据集,包含2,136次请求-响应交换,评估工具包括GPT-3.5 Turbo和TextBlob。
- 销售对话策略:未具体提及的数据集,评估指标包括对话成功率和所需对话轮数。
以上总结展示了对话与会话系统研究领域的多样性和深度,揭示了当前技术的挑战及潜在解决方案,以及未来研究的方向。
Topic 6: Knowledge Extraction and Synthesis
主题概述
知识抽取与合成(Knowledge Extraction and Synthesis)是人工智能领域的一个关键研究方向,旨在从大量文本或数据中自动提取有价值的信息,并将这些信息整合成结构化形式,以支持各种智能应用。这一过程对于提高机器学习模型的理解能力、推理能力和自动化程度至关重要,尤其是在处理复杂任务和大规模数据集时。它不仅能够促进知识库的构建与维护,还能够在法律解释、教育辅助、自动化机器学习等多个场景中发挥重要作用,从而提升服务质量和效率,同时降低人工干预的需求。
各论文贡献
-
来自Dialpad Inc.的Md Tahmid Rahman Laskar等人研究了如何克服对话式AI代理在接触中心中的冷启动问题,即缺乏全面的知识库导致无法有效处理客户咨询的问题。他们提出了AI Knowledge Assist系统,通过利用大型语言模型(LLMs)从历史客户代理对话记录中自动创建知识库。该系统的创新之处在于采用了三阶段管道进行知识提取、聚类及推荐代表性的问答对,并强调了无参考度量的重要性。其带来的实际价值在于显著提高了对话式AI系统的性能,尤其是在客户满意度和服务质量方面。实验结果显示,在真实世界数据集上,Knowledge-Assist-8B-SFT模型分别在知识提取和最终推荐阶段达到了84.86%和91.8%的F1-Score,证明了该系统在解决冷启动问题上的有效性。35
-
来自Utrecht University的Haoyang Gui等人探讨了如何确保社交媒体影响者营销中的法律透明度,特别是在Instagram等平台上赞助内容的隐藏或披露不足问题。他们开发了一种LLM生成的法律解释方法,用于检测并纠正这类内容。创新点包括设计了一个专门针对影响者营销法律错误的分类法,并引入了定量与定性相结合的评价策略。这项工作的实际价值在于为广告监管机构提供了一种自动化监控手段,有助于保护消费者权益和确保公平的广告实践。实验发现,gpt-5-nano和gemini-2.5-flash-lite在全数据集上达到了高达0.93的F1分数,但在模糊案例中表现较差,显示了进一步改进的必要性。36
-
来自上海人工智能实验室的Shangheng Du等人关注于大语言模型在自动机器学习工程(AutoML)任务中优化的效率和稳定性问题。他们提出了一种名为AutoMLGen的框架,结合了精细的ML知识库和一种新的蒙特卡罗图搜索算法(MCGS),旨在更有效地生成和调整机器学习管道。AutoMLGen的创新之处在于其引入了四种扩展操作:初级扩展、分支内进化、跨分支参考和多分支聚合。实验表明,AutoMLGen在MLE-Bench基准测试上表现优异,尤其在低复杂度任务中达到了62.1%的奖牌率,展示出其在处理多样化的机器学习任务方面的适应性和效率。37
-
来自Université de Montréal的Jia Ao Sun等人致力于解决大语言模型在处理知识密集型和多跳推理问题时的可靠性问题,特别是在知识图谱(KGs)上。他们提出了Search-on-Graph(SoG)框架,通过迭代指导导航增强了LLMs在KGQA任务中的表现。SoG的关键创新在于单一的搜索函数设计,它可以高效地处理高度节点和不同的KG模式。实验结果表明,SoG框架在多个知名KGQA基准测试中表现出色,尤其是在WebQSP和GrailQA等数据集上。38
-
来自Dalian University of Technology的Ruitong Liu等人研究了如何将知识图谱(KGs)中的结构化知识与大型语言模型(LLMs)中的隐含知识融合,以改善知识图谱完成(KGC)。他们提出了一种名为Semantic-Condition Tuning(SCT)的新方法,通过两个模块——语义图模块和条件自适应融合模块——实现更深层次的融合。SCT的创新在于通过关系消息传递网络将局部图上下文转化为语义条件向量,并动态调节文本嵌入以匹配KG上下文。实验表明,SCT在WN18RR和FB15k-237链接预测数据集上超越了其他方法,展示了其在知识图谱完成任务中的优越性能。39
-
来自University of North Carolina at Charlotte的Erfan Al-Hossami等人研究了如何自动发现学生代码中的编程误解,这在教育资源有限的情况下尤为重要。他们提出了McMining任务和相应的工具McMiner-S及McMiner-M,用于识别单个代码样本和跨多个样本的误解。McMiner-M的创新点在于通过多实例挖掘提高了精度,实验表明其在识别已知和新型误解方面比McMiner-S更为有效,尤其在处理需要从学生角度理解的复杂情况时。40
技术趋势
上述论文共同展示了知识抽取与合成领域的几个主要技术趋势:
- 深度学习与大型语言模型的应用:所有论文都利用了大型语言模型(LLMs)作为核心技术之一,但各有侧重。例如,AI Knowledge Assist 和 ReviewerToo 利用了LLMs的生成能力,而AutoMLGen则更注重LLMs在生成和优化ML管道方面的潜力。
- 知识图谱与语义融合:Search-on-Graph和Semantic-Condition Tuning两篇论文特别强调了知识图谱与大型语言模型之间的深度融合,通过设计特定的算法或框架,使LLMs能更好地理解和利用结构化知识。
- 自动化与效率提升:各论文均致力于通过自动化流程提高效率,减少人工干预的需求,如AI Knowledge Assist通过自动化创建知识库来解决冷启动问题,而McMining则是为了减轻教师负担,提高反馈效率。
- 跨学科应用探索:从法律解释到教育辅助,再到机器学习工程,这些论文展示了知识抽取与合成技术在不同领域的广泛应用前景。
数据集和评估
- AI Knowledge Assist使用了内部数据集进行监督微调,未提及具体的公开数据集。
- Evaluating LLM-Generated Legal Explanations for Regulatory Compliance in Social Media Influencer Marketing引入了1,143个Instagram帖子的数据集,用于评估LLMs在法律解释方面的性能。
- AutoMLGen在MLE-Bench上进行了广泛实验,这是一个用于评估AI在机器学习工程中性能的综合性基准测试。
- Search-on-Graph使用了六个广泛使用的KGQA基准测试数据集进行评估。
- Semantic-Condition Tuning在WN18RR, FB15k-237, UMLS, CoDeX-S, 和FB15k-237N等知名KGC基准测试数据集上进行了实验。
- McMining构建了一个新的基准数据集,包含编程误解的代码样本和问题描述。
评估指标方面,多数论文采用了F1-Score、准确率、精确率、召回率以及一些领域特定的指标,如McMining中的误解识别准确率。此外,部分论文还强调了无参考度量的重要性,如AI Knowledge Assist,以及在特定任务中的人类偏好评估,如ReviewerToo。这些评估方式共同反映了该领域对技术可靠性和实用性的重视。
Topic 7: Reinforcement Learning in Complex Environments
主题概述
强化学习(Reinforcement Learning, RL)在复杂环境中的应用是一个前沿的研究领域,它不仅涵盖了自然语言处理(NLP)中的大型语言模型(Large Language Models, LLMs)推理能力的优化,还涉及多智能体系统中的策略制定与执行。这些研究旨在通过引入新的算法和技术,提高模型在处理长链推理、动态上下文管理、适应性和自我进化、探索控制以及系统偏见诊断等方面的能力,从而使其更适用于现实世界的复杂任务和场景。41
各论文贡献
-
来自Westlake University的Wenjie Du等人研究了高级推理大语言模型(LLMs)在解码阶段由于增加的Key-Value(KV)缓存开销而造成的内存瓶颈问题,提出了RLKV框架利用强化学习识别出对于维持链式思维(CoT)一致性和推理质量至关重要的“推理头”。该方法的创新点在于通过自蒸馏采样和自适应惩罚权重两种稳定化技术优化门控适配器,以控制每个头的全注意力和局部注意力混合。该工作区别于以往的方法,专注于KV头的功能异质性,并系统地解决了推理任务特有的挑战。实验结果显示,RLKV在多个基准测试上优于现有基线方法,特别是在更高的稀疏度水平上表现更加优异,证明了其在压缩KV缓存时保持高性能的能力。42
-
来自中国科学院软件研究所和阿里巴巴集团的Qiaoyu Tang等人探讨了多轮推理代理在处理长周期交互时遇到的问题,即现有数据集未能充分挑战模型,导致其难以展现复杂的认知行为。他们提出了一种名为DeepMiner的新训练框架,采用逆向构造方法生成高质量且复杂的问答对,并设计了一个基于滑动窗口的动态上下文管理策略。实验结果表明,DeepMiner能够显著提高多轮代理的性能,尤其在处理复杂任务时表现更为出色,超过了现有的开源代理,接近专有系统的性能。43
-
来自中央南大学和上海人工智能实验室的Cheng Yang等人针对部署大型语言模型作为AI代理处理现实世界长期任务的挑战进行了研究,提出了一种名为MUSE的记忆模块驱动的自我演化代理框架。该框架的关键创新在于构建复合记忆机制,包括战略记忆、程序记忆和工具记忆,使代理能够在测试过程中持续学习并自我进化。实验结果显示,MUSE在长周期生产任务上达到了最先进的性能,展现了其在复杂交互任务中的强大适应性和泛化能力。44
-
来自Salesforce AI Research和伊利诺伊大学厄巴纳-香槟分校的Cheng Qian等人关注如何有效组织大型语言模型以应对多样化的用户查询,提出了xRouter系统,利用强化学习优化成本与性能之间的权衡。该系统的创新点在于提出了一种依赖于任务成功和敏感成本的新奖励公式,以及一个完整的端到端训练和评估流程。实验表明,xRouter能够显著降低成本同时保持高性能,展示了其在动态变化的模型池中适应性选择模型的能力。45
-
来自University College London的Marta Emili Garcia Segura等人研究了LLM代理在多智能体环境中能否通过互动影响其他代理的学习动态和行为。他们提出了一种名为ShapeLLM的新无模型对手塑造算法,该算法特别适合基于变压器的LLM代理。实验结果表明,LLM代理可以通过引导对手达到可被利用的均衡状态,在竞争游戏中获利,并在合作游戏中推动共同利益的结果。46
-
来自清华大学和小红书公司的Chuyi Tan等人探讨了自奖励强化学习(RLIR)中系统偏差导致的性能增益和稳定性问题,提出了RLER方法,通过集成自我奖励、自适应软奖励插值和信心不一致平衡回放选择来缓解这一问题。实验结果证实,RLER能够显著减少奖励噪声率和偏差率,提高了奖励估计的准确性与稳定性,在多种推理基准测试中表现出色。47
-
来自上海人工智能实验室及合作伙伴的Jianhui Yang等人针对传统搜索相关系统在预测电商平台上产品与用户查询的相关性方面的不足,尤其是对于复杂和长尾查询的处理,提出了TaoSR-AGRL框架,用于增强LLMs在电商搜索相关性上的表现。该框架通过规则感知奖励整形和自适应指导回放两个关键创新,改善了模型在复杂搜索任务中的推理能力和探索效率。实验结果显示,TaoSR-AGRL在多个线下和线上评测中显著优于DPO和GRPO等现有方法。48
技术趋势
从上述论文可以看出,当前研究倾向于将强化学习应用于大型语言模型的优化,尤其是在复杂环境下的应用。这些研究通过不同的角度和技术手段,如自适应温度控制、动态上下文管理、自我演化机制、集成奖励估计以及对手塑造算法,来解决特定领域的难题。这反映了强化学习技术在不断进化,以更好地适应复杂、多变的应用场景,并展现出高度的灵活性和创新性。
数据集和评估
- 数据集: GSM8K, Math500, AIME24, MBPP, BrowseComp-en, BrowseComp-zh, XBench-DeepSearch, GAIA, TheAgentCompany (TAC) benchmark, arithmetic dataset, DAPO-Math-17K, Qwen2.5-7B-Instruct, Llama-3.1-8B-R1, Qwen-2.5-7B-R1, MATH, DAPO
- 评估指标: pass@1, GSB scores, accuracy, reward noise rate, self-feedback bias rate, symmetry bias rate, $S_{partial}$
Topic 8: Context and Memory Management
主题概述
Context and Memory Management 是自然语言处理领域中的一个重要研究主题,尤其在大型语言模型(LLMs)的应用中扮演着关键角色。随着LLMs在各种应用场景中的普及,如何有效地管理上下文信息以及记忆机制成为了提高模型性能和适应性的核心挑战之一。这一领域的研究不仅有助于提升模型在长文本处理、对话系统等任务中的表现,还能够促进模型在特定领域如医疗健康、电子商务等场景中的应用效果,从而改善用户体验和业务结果。
各论文贡献
-
来自Meituan和清华大学的Xiaochong Lan等人研究了在线评论质量评估中自动发现可解释特征的问题,提出了AutoQual,一种自主的LLM代理框架,用于自动发现适用于评论质量评估的可解释特征。该方法的创新点在于其整合了反思、工具实施以及双层记忆系统,能够将从标记数据中获得的隐性知识转化为显性、可计算且可解释的特征。AutoQual的价值在于它提供了一种结构化的方法来发现特征,这与现有的无结构化LLM基准和传统的特征工程方法形成了对比。通过大规模A/B测试和部署在拥有数亿用户的平台上,AutoQual展示了其在评论浏览率和读者转化率上的显著改进49。
-
来自阿贡国家实验室的Siddeshwar Raghavan等人探讨了无需输入/输出测试案例即可生成准确执行的科学代码的挑战,提出了MOSAIC,这是一个训练无关的多代理框架,专门设计用于科学编码任务。MOSAIC包括四个专门化的代理:自我反思、推理、编码和调试,它们在学生-教师范式下运作,受到知识蒸馏的启发。此框架的关键创新在于使用了一个综合上下文窗口(CCW),以减少LLM幻觉并维持链式子问题之间的上下文连续性。实验显示,当与GPT-4o结合时,MOSAIC在SciCode数据集上解决了主问题和子问题的比率分别为20.01%和41.69%,相较于基线和其他方法分别提高了8.5%和24%50。
-
来自俄克拉荷马州立大学的S M Rafiuddin等人研究了解决变压器模型随序列长度增长而出现的内存需求二次增长问题,提出了Adaptive Retention,这是一种将内存保留视为概率学习问题的新方法。该方法允许语言模型动态地保留最具信息量的令牌表示,同时遵守全局内存约束。通过使用轻量级门控评分器和Hard–Concrete松弛技术,模型可以在训练过程中优化保留哪些令牌。这种方法在多个数据集和基准测试中被证明有效,实现了显著的内存节省且几乎没有性能下降,提供了灵活高效的解决方案,适用于标准的变压器架构51。
-
来自Kaliber AI的Aneesh Jonelagadda等人研究了在边缘设备部署的大型语言模型(LLMs)长期记忆能力受限的问题,提出了Mnemosyne,一种无监督的人类灵感长期记忆架构。该架构通过图结构存储、模块化摄入过滤器以及记忆提交和修剪机制,增强了LLMs在纵向互动中的表现,特别是在需要保持用户详细档案的领域如医疗保健。Mnemosyne的核心创新在于其模仿人类记忆的衰减和刷新机制,以及在有限资源下提供个性化响应的能力。实验结果表明,Mnemosyne在盲评人类评估的真实性和长期记忆能力方面优于RAG基线及其他现有技术,尤其是在纵向医疗对话中,胜率达到了65.8%,比基线高出一倍以上52。
技术趋势
这些论文展现了在Context and Memory Management领域内,研究人员正在探索多种不同的技术和方法来应对特定挑战。例如,AutoQual通过引入双层记忆系统来增强特征的可解释性;MOSAIC利用多代理协作来处理复杂的科学编程任务,并通过CCW技术来维持上下文一致性;Adaptive Retention则采用了概率学习的方式,动态地调整模型的记忆保留策略;而Mnemosyne则着重于模仿人类记忆过程,设计适合边缘设备的长期记忆架构。这些方法共同推动了LLM在上下文理解和记忆管理方面的进步,使得模型更加高效、实用且具有更强的适应性。
数据集和评估
- AutoQual: 使用了大规模的电子商务平台数据进行评估,通过A/B测试衡量了评论质量评估的改进情况。
- MOSAIC: 在SciCode数据集上进行了测试,使用主问题解决率和子问题解决率作为评估指标。
- Adaptive Retention: 实验涵盖了六个基准数据集,包括SST-2、IMDb、ArXiv、QASPER、PubMed和CUAD,使用了任务准确性、50%和30%令牌保留预算下的性能比较作为评估指标。
- Mnemosyne: 使用了纵向医疗对话的数据集,通过盲评人类评估的现实主义和长期记忆能力进行评估,同时也在LoCoMo基准上进行了测试。
这些数据集的选择和评估指标的多样化反映了研究人员对于提升LLMs在不同场景下表现的关注,同时也体现了记忆管理和上下文理解在实际应用中的复杂性和多样性。
Topic 9: Evaluation and Benchmarking of AI Systems
主题概述
评价和基准测试人工智能系统(AI Systems)对于确保这些系统在特定任务和场景中的可靠性和有效性至关重要。尤其在大型语言模型(LLMs)的应用领域,如遵循复杂商业标准操作程序(SOP)、代码生成、以及通过强化学习优化策略等方面,精确的评估机制能够帮助我们更好地理解模型的局限性,并推动其性能的进一步提升。这些研究不仅关注于提升模型本身的性能,还致力于改进评估方法,以更准确地反映模型在真实世界应用中的表现。
各论文贡献
-
来自Meituan M17的Jiaming Wang等人研究了大型语言模型在处理复杂商业SOP上的能力,提出了SOP-Maze这一专门用于评估模型在商业SOP场景下表现的基准测试工具53。该方法的主要创新点是引入了Lateral Root System(LRS)和Heart Root System(HRS)两大类别的任务,以全面评估模型处理SOP的能力。产生的价值在于提供了一种有效的方法来识别模型在复杂逻辑链路和噪声环境下的表现瓶颈,从而促进专业应用中LLMs的可靠部署。
-
来自University of Southern California的Gregory Yauney等人探讨了语言模型微基准测试的可靠性问题,提出了一种新的评估指标Minimum Detectable Ability Difference(MDAD)54。该方法的主要创新点是通过MDAD来衡量微基准测试在保持模型排名一致性方面的可靠性,与现有方法相比提供了更细致的视角。产生的价值在于揭示了微基准测试的有效范围,指出随机抽样在一定条件下可以与专业化方法竞争,这有助于减少评估成本并提高效率。
-
来自Harbin Institute of Technology的Xianzhen Luo等人研究了自动生成测试案例(ATs)的评估问题,提出了TC-Bench,一种基于矩阵秩概念构建高质测试案例集的新框架55。该方法的主要创新点是引入WrongSelect算法,利用贪婪近似方法从执行结果的二进制矩阵中挑选出最大多样性的错误代码。产生的价值在于解决了当前评估方法存在的低效和冗余问题,使得测试案例生成更加合理有效,这对于软件工程中的智能系统开发和评估具有重要意义。
-
来自Monash University的Terry Yue Zhuo等人提出了BigCodeArena平台,旨在通过执行生成的代码来提升人类偏好在代码生成评估中的可靠性56。该方法的主要创新点在于将代码执行纳入评估流程,使评估者不仅能检查语法正确性还能验证功能正确性。相比于之前的仅依赖人工或表面检查的工作,BigCodeArena通过实际执行反馈增强了评估的准确性,这对于改善代码生成系统的开发和细化有着显著的意义。
-
来自Bitdefender的Marius Dragoi等人研究了强化学习结合可验证奖励(RLVR)后大型语言模型推理能力的评估问题,提出了Cover@(\tau)新指标57。该方法的主要创新点是通过Cover@(\tau)评估模型解决问题的可靠性,避免了传统Pass@k指标可能因大量采样预算而偏向于随机猜测的缺陷。产生的价值在于为评估和比较RLVR模型提供了一个新颖的框架,特别是通过数学数据集上的实验,展示了该指标能更准确地反映模型的真实推理边界。
技术趋势
这些论文展现了多种技术趋势,包括:
- 复杂场景评估:通过设计特定场景的基准测试来评估模型在实际应用中的表现,如商业SOP和代码生成。
- 微基准测试优化:探索如何通过较小的数据集高效且准确地评估模型性能,减少资源消耗。
- 测试案例生成与优化:引入新的方法和算法来生成更具诊断性和多样性的测试案例,以提高评估的可靠性。
- 人类偏好集成:通过引入人类偏好和实际执行结果,提升评估过程中对模型输出质量的理解和判断。
- 推理能力度量创新:开发新的度量标准来更准确地评估模型的推理能力,特别是在经过强化学习优化后的表现。
数据集和评估
- SOP-Maze: 包含397个任务,覆盖23种不同的业务场景,用于评估大型语言模型在复杂商业SOP中的表现。
- MMLU, MMLU-Pro, BBH, GPQA: 这些是用于语言模型微基准测试的数据集,通过MDAD评估这些微基准测试方法的可靠性。
- TC-Bench: 一种基于矩阵秩概念构建的高质量基准测试框架,用于评估自动生成测试案例的质量。
- BigCodeArena: 平台本身不涉及具体数据集,但强调了执行生成代码的重要性,以提高评估的准确性。
- OMEGA, Reasoning Gym: 用于评估强化学习后大型语言模型推理能力的数据集,Cover@(\tau)指标被用于更准确地衡量模型的推理边界。
Topic 10: Neural Network Architecture and Learning
主题概述
神经网络架构与学习是人工智能领域中的一个重要课题,特别是在处理多模态数据(如视觉和语言)以及优化大型语言模型性能方面。随着深度学习技术的发展,研究者们不断探索新的模型结构和训练方法,以提高模型的效率、灵活性和准确性。这些研究不仅有助于推动机器学习算法的进步,还能够促进AI系统在复杂任务中的应用,例如视觉理解、语言生成及心理状态分析等。因此,对于神经网络架构和学习的研究具有重要的理论和实践意义。
各论文贡献
-
来自University of British Columbia的Jiayun Luo等人研究了在大视觉语言模型中“注意力陷阱”(attention sinks)的角色及其优化方法,提出了DIYSink框架来通过更好地利用注意力陷阱增强模型性能。该框架的主要创新点在于引入了Dual-MLP投影层和动态令牌选择模块,前者使模型能够专门处理陷阱和非陷阱令牌,后者允许根据任务需求选择性地使用这些令牌。产生的价值在于提高了模型在全局推理任务上的表现,例如代码推理和数学推理。在LLaVA eval基准测试上,DIYSink(CoT)和DIYSink(ReW)分别比TinyLLaVA-3B基线模型提升了3.62和5.79个得分点58。
-
来自ALTA Institute的Bianca-Mihaela Ganescu等人探讨了如何在认知上合理的方式下,利用少量的数据高效训练视觉语言模型。他们提出了带有动态门控机制的轻量级解码器架构,该机制可以适应性融合视觉和语言线索。主要创新点包括特征调制和通道注意机制,旨在最大化有限视觉数据的效用,并通过对比学习辅助目标探索更有效的训练策略。这种方法的价值在于其设计考虑了人类学习过程的认知合理性,尝试缩小人类学习方式与机器学习之间的差距,提供了一种更为高效的视觉语言模型设计视角。实验结果表明,在BLiMP基准测试中,带有动态门控的基础模型达到了与Flamingo和GIT等基线模型相竞争或更好的性能,但在VQA和BLiMP Supplement上的表现不佳,提示存在特定训练和评价不匹配的问题59。
-
来自Stony Brook University的Jason Bohne等人解决了扩散语言模型(dLLMs)在实际部署中缺乏高效且标准化的推理框架的问题。他们提出dInfer,一个高效的推理框架,通过将推理管道模块化并引入新算法,显著提升了dLLMs的推理效率。该框架的创新之处在于其模块化设计和集成的系统级优化,包括张量并行、专家并行、PyTorch编译和NVIDIA CUDA图。在六大数据集上的评估显示,dInfer不仅提升了推理速度,还保持了与基线模型相当甚至更高的精度,尤其是在启用KV缓存的情况下,dInfer实现了超过3倍的加速60。
-
来自Massachusetts Institute of Technology的Cai Zhou等人研究了解决现有离散扩散模型在文本生成中面临的非修订性和语义不一致性问题的方法。他们提出了分层扩散语言模型(HDLM),该模型基于分层词汇系统构建,能够处理更抽象的语义层次,从而实现更加一致和连贯的去噪过程。HDLM的关键创新在于它引入了中间层级,并提供了关于训练和优化的闭合形式表达式,同时展示了其在多个语义层次和扰动机制下的泛化能力。实验结果表明,HDLM模型在验证困惑度和生成困惑度上均优于其他离散扩散变体,尤其在小规模模型上表现优异,与自回归模型持平61。
-
来自Université Paris-Saclay的Gustave Cortal等人致力于建立一个系统分析个人叙事中风格选择的正式框架,特别是关注语言模式如何编码主观经验。他们提出了一种基于序列的方法,利用语言模型自动化提取和分析语言功能学中的转述系统。该工作的创新点在于首次尝试利用语言模型自动进行系统功能语言学分析,结合心理学见解,提供了一个新的叙事分析视角,可能支持治疗应用。实验分析了越南战争退伍军人的梦话叙述,发现其叙述倾向于更多的行动过程和较少的心理过程,揭示了语言选择与心理状态之间潜在的联系62。
技术趋势
从上述论文可以看出,该主题下的研究正朝着几个方向发展:一是针对特定问题(如注意力陷阱、低资源条件下的训练)提出创新解决方案;二是利用模块化设计和系统级优化提高模型效率;三是探索更深层次的语言和视觉信息融合机制;四是结合心理学理论,利用语言模型进行更细致的文本分析。这些研究不仅在理论上扩展了我们对神经网络架构的理解,也在实践中提供了改进模型性能的有效方法。
数据集和评估
- To Sink or Not to Sink 使用了LLaVA eval等基准数据集,评估指标包括任务完成的得分。
- Looking to Learn 采用了BabyLM Challenge 2025 Vision track的数据集,评估标准涉及BLiMP、Winoground、VQA等基准测试的表现。
- dInfer 使用了六大数据集,评估指标主要是推理效率(以tokens per second, TPS衡量)和模型精度。
- Next Semantic Scale Prediction via Hierarchical Diffusion Language Models 评估是在OpenWebText (OWT)数据集上进行,主要考察验证困惑度和生成困惑度。
- Formalizing Style in Personal Narratives 利用了DreamBank语料库,评估主要集中在识别特定群体(如PTSD患者)的叙事模式,以验证模型对主观体验编码的能力。
Topic 11: misc
主题概述
该研究主题涵盖了多个领域内大型语言模型(LLMs)的前沿探索,包括但不限于自然语言理解、常识推理、文化理解、多模态感知、安全与隐私保护等。这些研究旨在通过引入新的方法和技术来改进现有LLMs的性能和应用范围,从而更好地服务于实际应用场景中的需求,如医疗健康、法律咨询、软件开发等。随着LLMs在日常生活和专业领域的广泛运用,如何确保它们的行为符合人类意图、提高其处理复杂任务的能力,并减少潜在的安全风险成为关键的研究方向。
各论文贡献
-
来自Google DeepMind的John Hewitt等人研究了将新创造的词语(neologisms)引入语言模型以增强概念传达的精确性和效率的问题,提出了Neologism Learning方法来解决这一核心问题。该方法的主要创新点在于通过优化新词的嵌入而不是修改整个模型参数,实现了概念控制的精确化和自我表述能力的提升。在特定输入输出配对的数据集上的实验表明,这种方法可以显著提高语言模型在简单和复杂概念上的响应控制力,实验结果证实了新词学习方法的有效性63。
-
来自MaiNLP和慕尼黑大学的Jasmin Orth等人探讨了大型语言模型对条件陈述接受度的判断问题,特别是对条件概率和语义相关性的敏感性。他们提出了一种针对不同语言模型家族和规模的综合研究方案,使用线性混合效应模型和ANOVA测试分析模型响应,填补了关于条件陈述接受度方面的空白。实验显示,LLMs在条件概率和语义相关性上表现出了与人类判断不一致的模式,而较大的模型显示出较低的变异性64。
-
来自纽约大学的Ioana Marinescu等人调查了标签表示方式对上下文学习的影响,以及这种影响如何影响大语言模型在新任务上的性能。他们提出了一种框架,通过优化算法生成具有不同程度语义相关的标签集,实验结果显示,标签集的选择主要决定了基础准确性,而额外演示的学习则逐渐提高了这一基础65。
-
来自匹兹堡大学的Yukai Song等人提出了两阶段投票架构用于社会媒体上的自杀风险检测,解决了轻量级模型难以检测隐含自杀意念的问题。该方法的主要创新点在于结合了BERT分类器和多视角LLM投票框架或基于特征的机器学习集成,实验结果表明,该架构在显式和隐式自杀信号检测方面均表现出色,同时减少了跨域差距66。
-
来自东京大学和RIKEN的Taisei Yamamoto等人研究了大型语言模型的文化理解机制,提出了CULNIG方法来识别对文化理解起关键作用的神经元。该方法的主要创新点在于通过梯度评分而非激活评分来识别神经元,并构建了CountryRC数据集来过滤表面文化标记。实验表明,屏蔽文化通用神经元会严重影响模型的文化理解能力,而对自然语言理解任务的影响较小67。
-
来自ETH苏黎世的Jannek Ulm等人提出了一种名为对比解码的方法,用于低资源场景下合成数据的生成。该方法利用’GOOD’和’BAD’模型之间的差异来创建更连贯且信息丰富的文本。实验结果显示,对比解码在多个语言建模任务中都表现出了比非对比祖先采样更好的性能,特别是在推理导向的基准测试中,如实体追踪和EWoK68。
-
来自卡塞尔大学的Tim Hagen等人关注因果关系提取中忽视反证声明的问题,提出了Concausal News Corpus(CCNC),一个包含反证声明的数据集,扩展了现有的因果新闻语料库。实验表明,经过CCNC训练的模型在区分因果关系方面表现更好,RoBERTa达到了83.2%的F1分数,显示出对反证声明处理的显著改善69。
-
来自沙特阿拉伯阿卜杜拉国王科技大学的Qiang Yang等人介绍了SenWave数据集,一个细粒度多语言情感分析数据集,来源于COVID-19相关的推特。该数据集包括英语和阿拉伯语的情感标签,有助于捕捉疫情相关情感的细微差别。实验显示,BART模型在情感分类任务中表现最佳,尤其在零样本和少样本学习情景中表现良好70。
-
来自马里兰大学学院公园分校的Shramay Palta等人研究了LLMs生成的理性解释对人类和机器关于合理性的判断的影响。他们提出了一种生成和评估合理性的框架,实验发现人类评估者在面对正确答案时,受理性解释影响反而降低了其合理性评价,而LLMs则相反,提高了对正确答案的合理性评价71。
-
来自卡耐基梅隆大学的Grace Liu等人提出了CaRT方法,一种结合反事实训练数据和推理增强的策略,以提高LLMs在数学和医学诊断领域的决策终止能力。实验显示,CaRT在Qwen3-1.7B-Instruct和Qwen2.5-3B-Instruct模型中提高了终止性能,在数学和医学诊断任务上均表现出色72。
-
来自马克斯普朗克心理语言学研究所的Onur Keleş等人提出了视觉标志性挑战,一个视频基准用于评估视觉-语言模型在手语形式-意义映射方面的表现。实验表明,尽管这些模型在某些方面有所进步,但在透明度和形式预测方面仍然存在较大挑战,尤其是在手形和路径形状这样的复杂特征上73。
-
来自北京大学的Haolin Yang等人介绍了NavSpace基准,用于系统评估导航代理的空间智能能力,特别是处理空间尺度、代理对象相对方位和环境状态等方面的能力。实验结果显示,提出的SNav模型在处理空间智能导航任务上明显优于其他模型,尤其是在实际机器人实验中表现出色74。
-
来自曼彻斯特大学的Lan Zhang等人提出了一种新的框架MASA,用于构建由LLM驱动的多智能体系统以实现自动形式化。该框架强调模块化、灵活性和可扩展性,实验表明,使用GPT-4.1-mini模型在迭代自我完善过程中可以达到61.89%的语法正确性和语义一致性75。
-
来自加州大学戴维斯分校的Mobina Noori等人建立了一个人类行为基线,用于研究软件项目中的集体治理结构变化。实验揭示了随着时间推移,开源项目定义的角色和行动更加多样化,但规则性质本身相对稳定,这为未来评估AI管理工具提供了历史背景和标准76。
-
来自哥伦比亚大学的Nicholas Deas等人研究了LLMs形成‘人工印象’的过程及其对回应质量和风格的影响,尤其是犹豫语气的使用。实验发现温暖和能力印象与回应质量呈正相关,而较低的能力印象则与较高的犹豫语气有关,这表明LLMs可能复制人类的偏见和刻板印象77。
-
来自Yaraku公司的Krzysztof Mrozinski等人研究了文档级翻译的质量估计重排序问题,提出了SLIDE方法,将句子级别的Comet-Kiwi质量估计应用于文档级别。实验表明,SLIDE方法在BLEURT-20分数上有了显著提高,尤其是在文档长度超过512个源词时依然有效78。
-
来自哈尔滨工业大学的Xianzhen Luo等人研究了代码LLMs的缩放规律,实验显示代码LLMs相较于自然语言LLMs需要更高的数据-参数比率才能达到最优性能,而混合代码和自然语言数据可以在资源受限的情况下改善性能,但会在更高计算预算下变得有害79。
-
来自东北大学的Xin Liu等人提出了一种无自动编码器的上下文压缩方法Semantic-Anchor Compression(SAC),该方法直接从原始上下文中选择和使用语义有意义的令牌作为锚令牌。实验表明,SAC在各种上下文压缩基准测试中显著优于现有方法,特别是在多任务和跨领域情况下80。
-
来自乔治亚理工学院的Ritesh Mehta等人提出了一种预训练模型GLiNER-BioMed,辅以针对性的字典后处理技术,以改善生物医学命名实体识别的精度。实验结果显示,尽管在开发集上性能有所提高,但在官方测试集上的微平均F1得分略有下降,表明需谨慎调校后处理规则以避免过拟合81。
-
来自密歇根州立大学的Xinnan Dai等人提出了一种名为GraphGhost的统一框架,利用图结构表示神经元激活和信号传播,以了解LLMs背后的结构机制。实验发现GraphGhost能够成功识别出最具有影响力的令牌,并通过删除特定层的神经元节点显著改变模型的语义理解和逻辑推理能力82。
-
来自斯坦福大学的Juan Miguel Navarro Carranza等人研究了大型语言模型在处理长上下文时的表现,提出了Autoencoding-Free Context Compression方法,该方法通过上下文语义锚点来压缩长上下文,而不依赖于传统的自动编码器。实验表明,SAC架构能够有效地提升上下文压缩的性能和可靠性,显著优于现有方法83。
-
来自泰国朱拉隆功大学的Attapol T. Rutherford等人开发了一个针对泰语的大语言模型JAI-1,该模型通过多种策略避免灾难性遗忘并维持模型的一般智能。实验显示,JAI-1在泰国语基准测试中表现优于其他泰国语专用模型,尤其是在Token Per Character(TPC)指标上表现优异84。
-
来自新泽西理工学院的Yaya Sy等人提出了一种名为BaldWhisper的双阶段修剪方法,用于在资源有限的语言(如班巴拉语)上加速预训练的Whisper模型,实验结果表明,BaldWhisper在减少模型大小和提高推理速度的同时,保持了超过90%的原始性能85。
-
来自纽约大学阿布扎比分校的Nouar Aldahoul等人提出了RAG-Llama框架,该框架结合检索增强生成技术和开源Llama模型,以检测多语言环境下对抗性错误信息攻击。实验结果表明,RAG-Llama在多个语言和结构类型的对抗性攻击检测中表现出色,特别是在翻译和总结任务上86。
-
来自中国科学院自动化研究所的Yifan Li等人提出了一个名为DisTANCE的新基准,用于评估视觉-语言模型的感知时间缩放技术,特别是针对数学和视觉推理任务。实验显示,PTS技术在提高感知精度方面非常有效,特别是在数学和视觉推理任务上显著优于基线方法87。
-
来自印度理工学院Visakhapatnam分校的Milon Bhattacharya等人研究了优化印度电子商务行业最后一公里交付过程的问题,提出了一种结合传统优化技术和现代语言模型进行路线批评的方法。实验结果显示,大型语言模型能够有效地检测生成的路线中存在的实际问题,提升了路线执行的效率和实用性88。
-
来自北京邮电大学的Tessa Masis等人研究了地名参考的地理编码问题,特别关注组合性地名描述。实验表明,结合传统地理解析器的模型通常表现优于仅使用LLM推理的模型,特别是在处理复杂的地名描述时89。
-
来自清华大学深圳国际研究生院的Deshui Yu等人提出了一种用于病理学的检索增强生成框架YpathRAG,该框架通过结合生物医学知识库和LLM推理,提高了病理学问答任务的准确性和效率。实验显示,YpathRAG在病理学任务中显著提高了检索精度和问答质量,尤其是在复杂语义任务上表现突出90。
-
来自纽约大学阿布扎比分校的Tinnakit Udsa等人研究了联邦学习环境中大型语言模型对训练数据的记忆问题,提出了一个新的框架来量化跨客户端的记忆情况。实验发现,即使在联邦学习设置中,模型也会记忆训练数据,而不同的解码方法和前缀长度会影响记忆的程度91。
技术趋势
- 多模态融合:越来越多的研究开始尝试将图像、视频等非文本信息与语言模型结合起来,特别是在处理手语、导航指令等领域,以提高模型的理解和反应能力。
- 模型压缩与优化:为了适应资源有限的设备和场景,研究人员正在寻找更有效的模型压缩方法,如BaldWhisper和Semantic-Anchor Compression,这些方法试图在减少模型大小的同时保持高性能。
- 文化与语境理解:研究者们致力于开发能够更深入理解和处理文化多样性及特定语境的模型,例如通过引入特定文化标记来增强模型的文化意识。
- 安全与隐私保护:针对大型语言模型可能带来的安全风险,如生成有害内容和泄露个人信息,研究人员提出了一系列解决方案,包括RAG-Llama和LatentBreak等,旨在提高模型的安全性和隐私保护能力。
- 数据生成与增强:一些研究聚焦于通过创造性的方式生成高质量的合成数据,以辅助模型训练,特别是在低资源场景下,如Neologism Learning和Contrastive Decoding。
- 推理增强与任务特定优化:为了提高模型在特定任务上的性能,如数学问题解决和医学诊断,研究人员采用了多种推理增强技术,如CaRT和MASA,这些技术专注于提高模型的决策能力和自我调整能力。
数据集和评估
- 数据集:包括Sign Language of the Netherlands(NGT)、HiTZ Multilingual Medical Corpus、GutBrainIE CLEF 2025 challenge数据集、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、Synthetic-Persona-Chat、CMU_DoG、WoW、WMT23 test set、DeepSeek-R1 70B、Gemma-2-2b、GPT-3.5、Qwen3-0.6B、GPT-4.1-mini、Qwen2.5-3B-Instruct、Llama3.2、Llama3.1-8B、OLMo-2(7B)、Qwen3-1.7B-Instruct、Qwen2.5-3B-Instruct、ARC-Easy、ARC-Challenge、BIRD、Spider、KaggleDBQA、GEMBA-DA、EAPrompt-Critical、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech-200、CAPC-CG Corpus、Eng-H6、Thai-H6、Thai-Exam、MuSE、StressID、LibriSpeech、WikiText-103、SlimPajama-6B、DeepFake、RAID、M4-multilingual、CCNC、VersionQA Dataset、AfriSpeech
参考文献
-
DeepPrune: Parallel Scaling without Inter-trace Redundancy ↩︎
-
SpatialLadder: Progressive Training for Spatial Reasoning in Vision-Language Models ↩︎
-
SliceFine: The Universal Winning-Slice Hypothesis for Pretrained Networks ↩︎
-
FlyLoRA: Boosting Task Decoupling and Parameter Efficiency via Implicit Rank-Wise Mixture-of-Experts ↩︎
-
Recover-LoRA: Data-Free Accuracy Recovery of Degraded Language Models via Low-Rank Adaptation ↩︎
-
Memory Retrieval and Consolidation in Large Language Models through Function Tokens ↩︎
-
ArenaBencher: Automatic Benchmark Evolution via Multi-Model Competitive Evaluation ↩︎
-
ARES: Multimodal Adaptive Reasoning via Difficulty-Aware Token-Level Entropy Shaping ↩︎
-
ARM2: Adaptive Reasoning Model with Vision Understanding and Executable Code ↩︎
-
MMA-ASIA: A Multilingual and Multimodal Alignment Framework for Culturally-Grounded Evaluation ↩︎
-
ControlAudio: Tackling Text-Guided, Timing-Indicated and Intelligible Audio Generation via Progressive Diffusion Modeling ↩︎
-
MATRIX: Multimodal Agent Tuning for Robust Tool-Use Reasoning ↩︎
-
Centering Emotion Hotspots: Multimodal Local-Global Fusion and Cross-Modal Alignment for Emotion Recognition in Conversations ↩︎
-
LeWiDi-2025 at NLPerspectives: The Third Edition of the Learning with Disagreements Shared Task ↩︎
-
LLMs Learn to Deceive Unintentionally: Emergent Misalignment in Dishonesty from Misaligned Samples to Biased Human-AI Interactions ↩︎
-
The Price of Thought: A Multilingual Analysis of Reasoning, Performance, and Cost of Negotiation in Large Language Models ↩︎
-
ReasonEmbed: Enhanced Text Embeddings for Reasoning-Intensive Document Retrieval ↩︎
-
R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? ↩︎
-
Systematic Diagnosis of Brittle Reasoning in Large Language Models ↩︎
-
Efficient Prompt Optimisation for Legal Text Classification with Proxy Prompt Evaluator ↩︎
-
AutoRed: A Free-form Adversarial Prompt Generation Framework for Automated Red Teaming ↩︎
-
Beyond Over-Refusal: Scenario-Based Diagnostics and Post-Hoc Mitigation for Exaggerated Refusals in LLMs ↩︎
-
Mitigating Judgment Preference Bias in Large Language Models through Group-Based Polling ↩︎
-
Interpreting LLM-as-a-Judge Policies via Verifiable Global Explanations ↩︎
-
Pattern Enhanced Multi-Turn Jailbreaking: Exploiting Structural Vulnerabilities in Large Language Models ↩︎
-
ChatGPT as a Translation Engine: A Case Study on Japanese-English ↩︎
-
VideoNorms: Benchmarking Cultural Awareness of Video Language Models ↩︎
-
Comparative Analysis of Large Language Models for the Machine-Assisted Resolution of User Intentions ↩︎
-
DACIP-RC: Domain Adaptive Continual Instruction Pre-Training via Reading Comprehension on Business Conversations ↩︎
-
Sentiment Matters: An Analysis of 200 Human-SAV Interactions ↩︎
-
From Simulation to Strategy: Automating Personalized Interaction Planning for Conversational Agents ↩︎
-
AI Knowledge Assist: An Automated Approach for the Creation of Knowledge Bases for Conversational AI Agents ↩︎
-
Evaluating LLM-Generated Legal Explanations for Regulatory Compliance in Social Media Influencer Marketing ↩︎
-
AutoMLGen: Navigating Fine-Grained Optimization for Coding Agents ↩︎
-
Search-on-Graph: Iterative Informed Navigation for Large Language Model Reasoning on Knowledge Graphs ↩︎
-
Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion ↩︎
-
McMining: Automated Discovery of Misconceptions in Student Code ↩︎
-
强化学习在复杂环境中的应用是一个充满挑战但也极具前景的研究方向,涉及到大型语言模型推理能力的优化、多智能体系统中的策略制定以及在特定任务中的成本与性能优化等多个方面。 ↩︎
-
Which Heads Matter for Reasoning? RL-Guided KV Cache Compression ↩︎
-
Beyond Turn Limits: Training Deep Search Agents with Dynamic Context Window ↩︎
-
Learning on the Job: An Experience-Driven Self-Evolving Agent for Long-Horizon Tasks ↩︎
-
xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning ↩︎
-
Diagnosing and Mitigating System Bias in Self-Rewarding RL ↩︎
-
TaoSR-AGRL: Adaptive Guided Reinforcement Learning Framework for E-commerce Search Relevance ↩︎
-
AutoQual: An LLM Agent for Automated Discovery of Interpretable Features for Review Quality Assessment ↩︎
-
MOSAIC: Multi-agent Orchestration for Task-Intelligent Scientific Coding ↩︎
-
Learning What to Remember: Adaptive Probabilistic Memory Retention for Memory-Efficient Language Models ↩︎
-
Mnemosyne: An Unsupervised, Human-Inspired Long-Term Memory Architecture for Edge-Based LLMs ↩︎
-
SOP-Maze: Evaluating Large Language Models on Complicated Business Standard Operating Procedures ↩︎
-
How Many Code and Test Cases Are Enough? Evaluating Test Cases Generation from a Binary-Matrix Perspective ↩︎
-
BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation via Execution ↩︎
-
Beyond Pass@k: Breadth-Depth Metrics for Reasoning Boundaries ↩︎
-
To Sink or Not to Sink: Visual Information Pathways in Large Vision-Language Models ↩︎
-
Looking to Learn: Token-wise Dynamic Gating for Low-Resource Vision-Language Modelling ↩︎
-
dInfer: An Efficient Inference Framework for Diffusion Language Models ↩︎
-
Next Semantic Scale Prediction via Hierarchical Diffusion Language Models ↩︎
-
Neologism Learning for Controllability and Self-Verbalization ↩︎
-
If Probable, Then Acceptable? Understanding Conditional Acceptability Judgments in Large Language Models ↩︎
-
On the Relationship Between the Choice of Representation and In-Context Learning ↩︎
-
Two-Stage Voting for Robust and Efficient Suicide Risk Detection on Social Media ↩︎
-
Neuron-Level Analysis of Cultural Understanding in Large Language Models ↩︎
-
Contrastive Decoding for Synthetic Data Generation in Low-Resource Language Modeling ↩︎
-
Investigating Counterclaims in Causality Extraction from Text ↩︎
-
SenWave: A Fine-Grained Multi-Language Sentiment Analysis Dataset Sourced from COVID-19 Tweets ↩︎
-
Everything is Plausible: Investigating the Impact of LLM Rationales on Human Notions of Plausibility ↩︎
-
The Visual Iconicity Challenge: Evaluating Vision-Language Models on Sign Language Form-Meaning Mapping ↩︎
-
NavSpace: How Navigation Agents Follow Spatial Intelligence Instructions ↩︎
-
MASA: LLM-Driven Multi-Agent Systems for Autoformalization ↩︎
-
A Human Behavioral Baseline for Collective Governance in Software Projects ↩︎
-
Artificial Impressions: Evaluating Large Language Model Behavior Through the Lens of Trait Impressions ↩︎
-
Quality Estimation Reranking for Document-Level Translation ↩︎
-
Autoencoding-Free Context Compression for LLMs via Contextual Semantic Anchors ↩︎
-
Enhancing Biomedical Named Entity Recognition using GLiNER-BioMed with Targeted Dictionary-Based Post-processing for BioASQ 2025 task 6 ↩︎
-
GraphGhost: Tracing Structures Behind Large Language Models ↩︎
-
LLMs Show Surface-Form Brittleness Under Paraphrase Stress Tests ↩︎
-
BaldWhisper: Faster Whisper with Head Shearing and Layer Merging ↩︎
-
Toward a Safer Web: Multilingual Multi-Agent LLMs for Mitigating Adversarial Misinformation Attacks ↩︎
-
Unleashing Perception-Time Scaling to Multimodal Reasoning Models ↩︎
-
Optimizing delivery for quick commerce factoring qualitative assessment of generated routes ↩︎
-
Coordinates from Context: Using LLMs to Ground Complex Location References ↩︎
-
YpathRAG:A Retrieval-Augmented Generation Framework and Benchmark for Pathology ↩︎
-
Exploring Cross-Client Memorization of Training Data in Large Language Models for Federated Learning ↩︎