IT之家 3 月 2 日消息,阿里通义实验室语音团队今日发布了两款支持 FreeStyle 指令生成的模型 Fun-CosyVoice3.5 与 Fun-AudioGen-VD。 官方宣称,无论是精细控制声音表达,还是从零设计音色与场景,都可以通过自然语言指令直接生成。两款模型均支持通过自然语言指令 ...
阿里发布Fun-ASR 1.5语音大模型,支持30种语言及中文七大方言,古诗词识别准确率97%。具备自动标点、文本归一化能力,已在阿里云百炼上线。
阿里通义实验室正式推出语音识别大模型Fun-ASR1.5。该模型基於统一大模型架构,单模型即可覆盖30种语言、汉语七大方言体系及20+地方口音,古诗词吟诵也能精准转写。Fun-ASR1.5已在阿里云百... 阿里通义实验室正式推出语音识别大模型Fun ...