金融界2024年3月16日消息,据国家知识产权局公告,上海哔哩哔哩科技有限公司申请一项名为“音频处理方法及装置“,公开号CN117711427A,申请日期为2023年12月。
专利摘要显示,本申请实施例提供一种音频处理方法,方法包括:获取预先构建的训练数据集,其中,训练数据集包括多个音频‑文本对,每一音频‑文本对中一个音频对应多个文本,文本为与文本对应音频不同角度的音乐描述;获取音频的音频特征,将音频特征输入至预先构建的音乐描述模型中生成音乐描述文本,根据音乐描述文本、音频‑文本对的文本和预先构建的损失函数训练音乐描述模型,以得到训练好的音乐描述模型;获取目标音频的目标音频特征;将目标音频特征输入至训练好的音乐描述模型中,利用训练好的音乐描述模型生成目标音频的目标音乐描述文本。本申请实施例提供的音频处理方法,可以对音乐提供多种角度的音乐描述,为用户提供更多的音乐信息。