标贝科技歌声合成数据库上线
标贝科技2019年的第一个大动作,是献上筹备良久、精心打造的歌声数据库:多位专业歌手的中文歌声数据,包含多种音色和歌曲风格。
随着虚拟偶像文化的不断发展,语音合成、歌声合成技术,扮演着越来越重要的角色。
利用AI技术所打造的声音,也越来越受到青睐。标贝科技,利用自身的技术优势,正在努力帮助合作伙伴完成打造虚拟歌手的第一步。
歌声合成与语音合成相比,既有相似性,也有其特殊性。
一方面,歌声是依赖于歌谱的,歌声中的每个音节的音长或声调可以根据歌谱来做比较准确的预测。
另一方面,歌声的音域较宽,而且每个歌手都有适合自己的音域范围,如果超出范围的歌曲,合成效果可能会受到一定的影响。
合成歌声的质量在很大程度上取决于数据库的质量。
与语音相比,歌声的音高、音强、音长等变化组合繁复,需要从处理流程、处理方法和标注人员素质上“三管齐下”,才能出好声音。
作为定制化的数据服务提供商,标贝科技利用在语音数据处理领域的独到经验,针对复杂度更高的歌声合成,也设计了一套专业化的数据处理流程。
专业歌手
在音源选择上,经过训练的专业歌手可以保持在共振峰、爆发性和音域有更稳定的表现,对歌唱技巧把握更成熟。
专业录制
在专业录音棚环境下完成整个数据的采集,并且全程进行监督和指导,确保数据质量。
规模大
通过语料设计技术,优选数百首歌曲,降低模型训练的难度,改善预测效果。
精细化标注
在对声音数据的处理上,歌声比语音所包含的专业因素更多,需要标注人员对音乐有较深的理解,才能根据录制的人声演唱中所包含的音高、节拍、演唱技巧、歌词等内容进行精细标注。
在对音频标注的标注格式,采用兼容性强、记录音乐信息精确性高的 MusicXML 格式,对时值、升降号、节拍、谱号等乐谱属性进行记录。
为了减少标注的错误率,标贝在重音、顿音、假声、连音等音符的相关信息的区分和记录上做了大量工作。
甚至在对较难把握的颤音的处理上,也有专门的识别和标注记号。
歌曲合成的流程繁复,贯穿每个环节的质量控制是保质保量的生命线:更优质的数据,才有更优美的歌声。
(内容转载自“标贝科技”微信公众号,2019年1月18日)