2020年9月29日下午,以“创新、协作、共享”为主题的AIIA 2020人工智能开发者大会语言智能化与产业应用分论坛在北京市石景山区首钢园成功举办,共同探讨语言文字的新范式。中国信息通信研究院云计算与大数据研究所智能语音高级项目主管李荪主持本次论坛。
首先,中关村科技园区管理委员会产业发展促进处李顺超副处长进行致辞,表示数据是人工智能产业发展的基础支撑,尤其是在技术训练模型和场景应用发挥了至关重要的作用,并为语言学、语音学等基础科学提供了支持。他希望学术、产业数据的开源开放能够打通数据的孤岛,建立共享机制,促进人工智能的开发应用。
教育部语言文字应用研究所王敏副所长,首先向大家介绍了语言文字应用研究所的发展历程和研究成果,并表示可以与业界加强合作,贡献研究力量和资源。同时,她表示对于人工智能的发展,语言问题是需要解决的基础性、关键性的问题,需要让AI学会理解人类的语境和常识,因此成功实现语言应用的智能化需充分考虑到语言的本质特征。她期望学界、业界可通过本次论坛充分沟通,建立共识,从实际应用出发,跟随社会的需求,聚焦关键技术,促进人工智能技术日趋完善,实现我们共同的目标。
北京语言大学语言科学院曹文院长在论坛上向大家介绍了中国语言资源保护工程、不同国别学习者汉语语音语料库、面向AI的濒危语言语料库建设研究、中国语言志·普通话(库)、一带一路国家语言研究语料库等目前已建/在建的语言资源项目。其中,曹院长详细介绍了语保工程、不同国别学习者汉语语音语料库、濒危语言语料库建设的背景、研究成果、瓶颈及未来工作重点,并呼吁未来的语言资源建设应该和人工智能技术应用结合、语言学界和人工智能工程界加强合作、协作,双轮双驱、实现合作共赢。
希尔贝壳CEO卜辉向大家分享的主题内容是“智能语音技术背后的数据壁垒”,演讲中提到语音识别、语音合成、声纹识别这三类技术是推动智能语音产业蓬勃发展的三驾马车,而AI人工智能中的算法、算力、数据是开启智能语音大门的三把金钥匙。随着算法和算力的简洁化,数据成为智能语音技术的壁垒,人们从发声到让机器人听懂,需要底层数据的驱动,其中包括了大量的音频的数据和文本数据。他提到如何突破数据壁垒,需要从三个方面进行尝试,一是研发建设不完善的语言资源,二是结合图像、感知等的数据来形成多模态智能语音数据,三是开源开放基础数据。他希望可以探索多模态数据库应对AI技术的未来发展及应用,以更开放、共享的算法、算力、数据环境带动整个产业的发展。
海天瑞声技术总监、首席科学家郝玉峰博士分享的主题是《语言基础研究助力智能语音发展》,郝玉峰博士首先从数据的确权与安全性,语言学的代表性与平衡性,数据的质量、规模与服务的角度提出智能语音数据库——“可用、有用、好用”的衡量准则。他将语言学与AI智能语音相结合,从实例出发,分享了语音学、音系学、语法、句法、计算语言学、方言学等现代语言学基础研究成果,以及在智能语音数据库制作中的落地方案。未来团队将继续致力于智能语音产品和数据建设,并跟进标准化工作,产学研通力合作,推动语音技术的发展。
中国信息通信研究院云计算与大数据研究所智能语音高级项目主管李荪在论坛上介绍了智能语音语义技术产业现状,AIIA语音规范标准体系及2020 AIIA智能语音评估工作和结果解读。她介绍本次评估工作开展的是第二轮中文语音合成评测和首轮中文语音识别评测,参与企业有马上消费金融、思必驰和腾讯,均已通过测试并获得AIIA颁发的证书。基于评估规范《中文语音合成服务指标与评估方法》和《中文语音识别服务指标与评估方法》,她分别从语音合成、语音识别的多个维度和评测点对本次测试结果的进行了详细解读,并表示下一步工作方向将基于整个智能语音评估规范的框架,不断去完善技术标准,评估方法和评估指标。
好未来AI资深算法专家、数据挖掘算法负责人丁文彪在论坛上的演讲主题是《面向K-12的中英文口语表达能力评测》,首先他通过演示演讲能力评测系统,生动形象地展示了从口语表达的流利度、主题相关度、情感饱满度、语法准确性、词汇运用、语言逻辑、发音等多个维度评测的过程。同时,他详细介绍了智能评测服务技术框架的底层算法(包括语音识别、音频特征提取、图像分析等)、度评测算法、结果输出及产品化,结合实际案例说明口语评测的适用场景和落地情况,且目前在与业界合作共建口语表达能力评估标准,为教育行业赋能。
深圳黄鹂智能科技有限公司CEO刘志分享的主题是《浅析智能技术在语言教学中的应用》,他首先以自研产品人工智能通话降噪耳麦为例,向大家演示了其降噪效果;接下来对语言教学中应用的智能语音技术—语音识别、语音合成、声纹识别、语音增强等及其技术指标进行详细介绍。他表示对于智慧教学,智能语音技术是用来解决教育教学中的实际问题,促进技术的真正落地,而人工智能最有魅力的地方就是能够改变我们的生活,并呼吁各位专家、开发者们一起来致力于用人工智能去改善人类的生活与工作。
此次论坛上智能语音专家与开发者们碰撞思想、交流经验,共商技术数据开源开放趋势,共讨智能语音技术与应用开发,共推语言智能化产业发展。聆听语音之美,感叹语言之魅,创造精彩的语言智能化世界需要大家携手前行!