科技芯资讯是专业科技新媒体网站。网站著眼于新一代科技新闻的全面及时处理报导,让网民在外面第二时间交待全球新一代的科技资讯。内容涵括AI+、互联网、IT、创业投资、核定、区块链、智能硬件等领域

首页 >  网络动态 正文

出门问问3篇论文获自然语言处理和人工智能国际会议录用发表

juzi 1970-01-01 08:00:00 网络动态 0℃

7月15日至17日,第三届自然语言处理与人工智能国际会议(NLPAI2022)在四川大学举行。继语音情感合成论文入选全球语音领域顶级会议INTERSPEECH2022后,语音团队的三篇论文再次被NLPAI采用。NLPAI会议旨在为来自世界各地的研究人员、工程师和科学家提供一个国际会议平台,展示自然语言处理、人工智能等相关领域的技术进步和研究成果,每年吸引数千名学者和专家齐聚一堂,讨论学术观点,碰撞最新研究成果。所有被接受的论文将发表在Conference Proceedings上,Ei Compendex,Scopus检索,并提交给CPCI。

在星光熠熠的科技盛宴中,询问语音团队在语音技术领域做出的哪些精彩贡献。1.《Prosody Prediction With Oracle riminative Representation Method》《基于判别表示的韵律预测》作者: Jipeng Zhang Askar Hamdulla Xiaoqin Feng Xipeng Yang Yunlin Chen韵律是影响从文本到声音TTS的自然性和可理解性的重要因素,同时也面临着以下大的课题。1.获得统一的标记数据集需要依赖于严格的专业经验。2.在传统的概率统计方法的基础上,很大程度上依赖于特征工程等文本处理效果。针对这些问题,本文提出了一种基于韵律数据的独立预测系统。

这种新方法具有以下优点:1.减少了对联合数据的依赖性,灵活支持不同韵律等级的模型学习。2.提出了一种通用判别表示方法 Layer Look Up Table(LLUT),对不同韵律水平进行建模,导入了多任务训练。3.基于预训练方法的文本语义建模不需要特征工程。2.基于LPCNet的语调可控性研究随着Wenyu Gao Askar Hamdulla Xipeng Yang Yunlin Chen语音合成技术在大多数场景中的使用,修改音频音调有着广泛的用途。目前,大多数音高控制都是通过使用单独的神经网络来生成输入参数来实现的,但这种方法需要训练多个神经网络,如果没有说话者的适应,就无法控制。针对这一问题,提出了一种基于LPCNet语音编码器的音调显示控制方法。首先,在训练阶段,通过优化训练函数来优化语音编码器模型的合成效果和控制音调的鲁棒性。然后,在推理阶段输入控制曲线以调整基频,并使用声码器LPCNet将声学特性推断为波形点。最后是音频合成。实验结果表明,该方法可以灵活地控制音高,提高合成语音的音质。

培训阶段(Training Stage)

在测试阶段,这种新方法具有以下优点:1、灵活控制音调,提高音质。2.在控制阈值范围内,控制参数的调整不会显著降低音质。3.在随后的尝试中,将基频控制引入声学模型的声学特征生成中,并将其与声学模型的解码器模型结合起来,以产生更强大的音频。Ting Liang、Askar Hamdulla、Hao Yin、Yunlin Chen目前,端到端语音合成在语音助手、新闻广播、智能导航等多个领域已经达到了现实水平。但是,人类表现信息通常需要把重点放在重点上,在声音中添加及时的重音(Stress)起到强调的作用,可以表现出更好的观点。目前大多数语音合成研究都没有模拟重音特征,合成语音没有被强调,单个语调或重音的位置也无法控制。这样的声音缺乏表达力。本文提出了一种端到端的语音语音控制合成方法,该方法可以在不标记目标说话人的语音特征的情况下合成语音控制。

1.实现合成语音的三级控制(再强调/拖动/再强调)使用少量重音标签数据,您可以将重音功能迁移到没有重音数据的任何目标扬声器。3.合成语音更自然,更有表现力。聆听用户的声音三篇论文入选自然语言处理和人工智能国际会议,探索用户近距离语音技术(NLPAI2022)是在走出去询问全栈和硬核技术的进一步进步,此外,公司先后获得了吴文军人工智能技术进步奖、国家高新技术企业、北京专业新中小企业,之后评选出世界语音技术顶级INTERSPEECH2022等技术成果。这是尖端技术的又一突破。近年来,越来越成熟的语音技术逐渐落地到贴近用户的产品和服务上,倾听用户的心声,尊重用户的情感,深入挖掘用户的潜在需求。目前,该团队将语音转语音、拖曳、节奏、语调控制功能应用于AI配音神器“魔术车间”,并将语音转译、拖曳,许多早期的AI语音技术都实现了,让用户体验更感性、更真实的AI配音。人工智能基础技术的深度积累,将不断推动人工智能系统“智能化”的提升,更好地应用于智能出行、智能生活等行业,为用户提供卓越的智能体验。

Tags: 控制 语音