版权属于:
人工智能炼丹师
作品采用:
《
署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)
》许可协议授权
数据集 | 说明 |
---|---|
Google-AudioSet | 2084k, 527个类别, youtube视频 |
Youtube-100M | 100M Youtube视频,根据标题/描述/评论自动生成的标签,标签集合约3w |
WeneSpeech | 中文1w小时+音频数据集, 包括有声书、解说、纪录片、电视剧、访谈、新闻、朗读、演讲、综艺和其他等10大场景 |
VGG-Sound | short clips of audio sounds, 200k个Youtube视频, 310个类别 |
LibriSpeech | Large-scale (1000 hours) corpus of read English speech |
Libri-Light | open-source audio books from the LibriVox project |
GigaSpeech | audiobooks, podcasts and YouTube |
VoxPopuli | multilingual corpus, 23种语言,100k小时 |
模型 | 训练数据 | 备注 |
---|---|---|
Vggish | YouTube-100M | 2017年 |
腾讯游戏开源wav2vec2.0 & hubert | WeneSpeech | 2021年 |
FaceBook data2vec | LibriSpeech | 2022年 |
MSRA WavLM | Libri-Light, GigaSpeech, VoxPopuli | 2021年 |
评论 (0)