(12)发明专利申请
(21)申请号 CN202010009945.5 (22)申请日 2020.01.06 (71)申请人 北京大学
地址 100871 北京市海淀区颐和园路5号北京大学
(10)申请公布号 CN111179959A
(43)申请公布日 2020.05.19
(72)发明人 曲天书;吴玺宏;彭超
(74)专利代理机构 北京君尚知识产权代理有限公司
代理人 司立彬
(51)Int.CI
权利要求说明书 说明书 幅图
(54)发明名称
一种基于说话人嵌入空间的竞争说话人数量估计方法及系统
(57)摘要
本发明公开了一种基于说话人嵌入空间的
竞争说话人数量估计方法及系统。本方法为:1)利用麦克风阵列采集多说话人的混合多通道信号;2)提取所述混合多通道信号的多通道幅度信息和多通道相位信息;3)利用深度神经网络分别估计所述多通道幅度信息的嵌入空间和多通道相位信息的嵌入空间;4)利用全连接层将两所述嵌入空间映射到说话人嵌入空间;其中,所述多通道幅度信息的嵌入空间、多通道相位信息的嵌入
空间和说话人嵌入空间均为相同维度的嵌入空间;5)估计所述说话人嵌入空间中的嵌入向量的平均协方差矩阵;6)对所述平均协方差矩阵做特征值分解,将得到的秩的个数判定为说话人的数量。本发明能够实现更精确的竞争说话人数量估计。
法律状态
法律状态公告日2020-05-19 2020-05-19 2020-06-12
法律状态信息
公开 公开
实质审查的生效
法律状态
公开 公开
实质审查的生效
权利要求说明书
一种基于说话人嵌入空间的竞争说话人数量估计方法及系统的权利要求说明书内容是....请下载后查看
说明书
一种基于说话人嵌入空间的竞争说话人数量估计方法及系统的说明书内容是....请下载后查看
因篇幅问题不能全部显示,请点此查看更多更全内容