离不开『定制化』语音合成,重磅推出具有空前

作者: 金沙手机娱乐网址  发布:2019-09-24

原标题:拥有高质量的人机交互体验,离不开『定制化』语音合成

以语音合成为代表的AI技术已经在各行各业广泛应用,而语音合成技术的“情感化”,成为如今市场的迫切需求。

在人机交互中,语音交互已经成为必不可少的交互形式。自然、清晰、流畅的语音是交互体验中重要的一个环节,这就离不开语音合成技术。

捷通华声凭借深厚的行业及技术积累,重磅推出具有划时代意义的灵云情感语音合成技术,能够合成出带有语气、情绪等情感丰富、更接近真人的声音,并成功上线灵云平台,同时推出情感语音合成能力平台,让每一家企业都能轻松拥有更动听、更富感情的语音合成服务。

极限元的语音合成技术采用国际先进的数据驱动技术,利用精心设计的语音语料库进行声学模型和文本处理模型的训练,得到的模型深度挖掘了语音语言特性,合成的语音清晰、自然、亲切、具有高表现力,媲美真人发声。

奥门金沙堵场官方网站 1

而随着人机交互市场需求的不断变化,定制化语音合成成为发展趋势。以人机交互中家庭生活场景为例,智能音箱算是一个典型应用,市场上的智能音箱同质化严重,销售情况并不乐观,抓住用户痛点,调动用户使用频次,或许也是提高销售的一种有效手段。试想,拥有同样功能的智能音箱,如果声音是嗲气的小姐姐,或者是呆萌可爱的童声,又或者是喜欢的偶像声音,无论是哪一种,这样真实丰满的人设声音,是不是更容易打动用户,从而调动用户的使用频次。

十多年深耕技术 引领行业变革

奥门金沙堵场官方网站 2

十多年来,捷通华声一直专注技术研发与创新,依靠国内领先的灵云语音合成技术,在国内智能语音市场占有率超50%:

极限元的定制化语音合成服务能够满足丰富的个性化声音设定,如林志玲的嗲气十足,郭德纲幽默逗趣,稚气呆萌的童声、游戏动漫角色声、各类方言等。极限元的定制化语音合成服务支持录音人选型、录音采集、语料标注,还能实现模型迭代训练、合成引擎优化,支持在线、离线模式,适用于多种平台,可应用于多个领域。全方位地为有需要的企业和用户提供专属声音,满足用户在不同应用场景下的个性化音色需求。只需要提供少量发音人样本,通过快速自适应训练,即可合成出高自然度的个性化语音,极大的增强了用户的体验感。

2001年,捷通华声推出代表国际领先水平的jTTS世纪版;

极限元语音合成技术专业MOS分可达4.0,拥有标配版女声和男声,女声包括标准型甜美型、萝莉型;男声包括标准型、浑厚型、清爽型。极限元已与百度、腾讯、搜狗、奇虎360、语文出版社等众多客户建立了长期稳定的合作关系。

2007年,捷通华声成为建行、农行的唯一语音合成供应商;

奥门金沙堵场官方网站 3

2008年,灵云多语种语音合成技术成功服务北京奥运会;

让声音富有情感和表现力,一直是语音合成技术的一大难点。而极限元在情感语音合成领域,与国际接轨,其创始团队源自中科院自动化研究所并成立“智能交互联合实验室”,号称语音合成界的“黄埔军校”;在人工智能领域有近20年技术积累,在国际会议和期刊上发表论文400余篇,申请语音及音频领域专利100余项;作为负责人、科研骨干参与多项国家自然基金项目、国家863项目和国家重点研发计划等项目,获得音视频情感竞赛第二名、北京市科学进步二等奖、中国专利奖优秀奖、Eurospeech大会奖等多种奖项。

2010年,上海世博会采用灵云语音合成技术播报赛事;

极限元致力于为呼叫中心、智能机器人、智能家居、车载导航、有声读物等相关应用场景提供更加优质的语音合成服务,为用户提供高质量的智能交互体验。返回搜狐,查看更多

2015年,捷通华声已成功为上千家企业提供语音合适技术……

责任编辑:

如今,全新推出的灵云情感语音合成技术,让捷通华声能够更好地服务于金融、电信、能源、交通、政府、医疗、互联网等各领域,全新体验的语音合成产品能够引发行业内巨大变革,推动合成技术跨越式发展。

不论是智能客服、地图导航、机场广播的甜美女声,新闻播报、听书朗读的清爽男声,智能家电、机器人的可爱童声,捷通华声通过为企业提供稳定便捷的情感语音合成能力平台,都能让有各种需求的企业快速拥有更具竞争力的产品,让社会大众能够体验到富具情感、更声情并茂的听觉体验。

奥门金沙堵场官方网站 4

声情并茂 全新技术业内领先

灵云情感语音合成技术的先进性,源自于最新采用的深度学习技术建模,连同高音质声码器,产出个性细节丰富的声线效果,语气感真实。

声学模型训练方面:高鲁棒性预处理和建模框架,降低了以往对录音风格和稳定性的严格约束,普通人自然讲话、刻意带情绪讲话、角色模仿讲话,均可训练出保真、稳定的效果。

语音合成效果方面:灵云情感语音合成技术已经发布多样、个性的音色库:童声既有夸张俏皮的卡通配音,也有真实小孩的呆萌学语;女声既有林志玲般的嗲音气语,也有丹气十足的磅礴宣读;男声既有新闻主播型的正气播报,也有网络主播型的地气贫嘴,为各种应用场景提供合适的声音。

多语种合成方面:灵云语音合成技术已全面支持中文普通话、粤语、维吾尔语、英语、日语、德语、法语等21种语言。完备的用户自定义体系,可弥补基础合成的不足,保证合成效果稳定在高水准;中文腔调读英文的自定义词表,保证中英文混杂时的无缝自然过渡。

灵云情感语音合成技术采用高度自动化的数据加工标注,用户提供自己喜爱的录音,即可快速定制出音库。同时,捷通华声十多年来积累了大量的领域词库、预选音库,可为金融证券、天气预报、体育赛事、公交汽运、航空、税务、POI、排队叫号等众多领域提供更专业的语音合成播报。

奥门金沙堵场官方网站 5

奥门金沙堵场官方网站,私有云平台 技术接入更便捷稳定

除了在灵云平台上,利用SDK为产品接入情感语音合成技术,捷通华声为方便企业及系统集成商整合、调用语音合成能力,推出灵云情感语音合成能力平台,通过提供标准协议接口,以私有云的形式方便企业快捷、稳定地将灵云语音合成能力集成到各种应用系统中。

平台采用统一的负载均衡设计,合理调度服务资源,实现资源利用率最大化,核心服务支持多点热备,无单点故障,可保障平台稳定、高效运行;

同时,平台标准架构以及完善的系统设计,充分考虑了大规模语音应用的需求,具备良好的伸缩性,可方便企业用户实现快速无缝化的产品演进。

灵云情感语音合成技术的推出,让更多应用灵云语音合成技术的企业产品及服务在全行业实现革命性升级,助力提升企业核心竞争力。捷通华声也将继续秉承“合作共赢”的发展理念,携手合作伙伴,共同推动灵云情感语音合成技术在各领域的普及应用,用更动听、更富感情的声音为亿万大众的工作与生活带去轻松与便捷。

本文由奥门金沙堵场官方网站发布于金沙手机娱乐网址,转载请注明出处:离不开『定制化』语音合成,重磅推出具有空前

关键词: