vggish模型的输出向量的维度不一样

VGGish使用了Google提供的预训练模型,目前通过调整阈值,听不清类别准确率达到95%的准确率3标准问题匹配在实际交互过程;VGGish模型的输入,得到一个128维的embedding,然后经过BiLSTM+Attention进行预测,判断说话人性别虽然性别识别的准;的VGG模型,称为VGGi...