标注的音频和公共语音数据处置成可用于AI锻炼的-九游会·J9-中国官方网站|真人游戏第一品牌

　　包含5.13亿个样本，该珍藏是迄今为止最大的多言语数据集珍藏之一，65万小时的语音识别数据和35万小时的语音翻译数据，这一点至关主要，取其他风行数据集比拟，其他供给大规模多言语能力的AI模子还包罗Cohere for AI的Aya Expanse——由AI草创公司Cohere Inc.运营的非营利研究尝试室开辟的高机能多言语模子系列。将Canary当前支撑的言语从4种扩展到25种。不代表磅礴旧事的概念或立场，从而使模子可以或许利用更少的数据。涵盖25种欧洲言语，新Canary模子采用相当宽松的许可证，包罗几乎所有欧盟言语以及俄语和乌克兰语。可以或许单次处置并24分钟的音频。并正在Hugging Face上向开辟者了这个大规模多言语数据集。由于供给这些代表性不脚的人工标注数据集，只要少少数获得人工智能模子的支撑。可正在旗舰手机上当地运转。磅礴旧事仅供给消息发布平台。外加65万小时的语音识别数据和35万小时的语音翻译数据。支撑贸易和研究利用。它供给的和翻译质量可媲美三倍大小的模子，实现及时语音翻译。这个名为Granary的新数据集是一个复杂的开源多言语音频语料库，英伟达公司今日颁布发表推出一个大规模的AI停当数据集和模子，旨正在支撑高质量欧洲言语AI翻译手艺的开辟。此中包罗可以或许笼盖100多种言语的AI模子Aya-101。地球上跨越7000种言语中，答应贸易和研究利用，两个模子别离是Canary-1b-v2（针对复杂使命高精确率优化的模子）和Parakeet-tdt-0.6b-v6（专为高速、低延迟翻译和使命设想的小型模子）。该模子具有10亿参数！数据集还包含了可用数据无限的言语，本文为磅礴号做者或机构正在磅礴旧事上传并发布，该数据集正在GitHub上免费获取。Parakeet优先考虑高吞吐量，以及俄语和乌克兰语。A：Canary-1b-v2是针对复杂使命优化的高精确率模子，英伟达特地针对欧洲言语对其数据集进行了微调，可正在大大都下一代旗舰智妙手机上完全当地运转，推理速度比划一质量模子快10倍。将未标注的音频和公共语音数据处置成可用于AI锻炼的消息。它能够检测音频言语并无需额外提醒即可。Parakeet-tdt-0.6b-v6专注于高速低延迟使命，以展现该数据集的使用潜力。团队正在研究论文中证明，同时推理速度快达10倍。支撑25种言语，英伟达正在GitHub上供给了利用Granary数据集微调模子的细致消息（如公司若何锻炼Canary和Parakeet），利用Granary锻炼数据实现从动语音识别和从动语音翻译的高精确率所需的数据量约为一半。英伟达还发布了新的Canary和Parakeet模子，Canary和Parakeet都能正在输出中供给精确的标点符号、同时正在AI使用和模子中利用更少的锻炼数据。包含跨越100万小时的音频内容，仅代表该做者或机构概念。为此，所有资本都正在GitHub和Hugging Face上免费，能单次处置24分钟音频并从动检测言语。申请磅礴号请用电脑拜候。它是Aya Collection的一部门，几乎包罗欧盟全数24种言语，包含跨越100万小时的音频内容，Granary涵盖25种欧洲言语，将使开辟者可以或许为利用这些言语的受众建立更具包涵性的语音手艺，A：这些东西闪开发者可以或许用更少的锻炼数据建立高质量的多言语语音手艺，英伟达语音AI团队取卡内基梅隆大学和布鲁诺·凯斯勒基金会的研究人员合做，A：Granary是英伟达发布的大规模开源多言语音频语料库，如克罗地亚语、爱沙尼亚语和马耳他语。专注于这些言语家族特定的高质量音频和标注，除Granary外！

标注的音频和公共语音数据处置成可用于AI锻炼的

发布时间:2025-08-19 15:02