社科网首页|客户端|官方微博|报刊投稿|邮箱 中国社会科学网
“藏、维、彝民语语音参数数据库”成果鉴定会于2009年5月13日举行并通过鉴定
作者:郑玉玲 日期:2009-05-15
    教育部、国家语委民族语言文字规范标准建设及信息化项目,“藏、维、彝民语语音参数数据库” (MZ115-037) 成果鉴定会于2009年5月13日在中国社会科学院民族学与人类学研究所举行并通过鉴定。
    该项目由中国社科院民族学与人类学研究所、西藏语委、新疆大学和西南民族大学共同完成。项目建立了藏语、维吾尔语和彝语三个语言标准音(广播语)的语音特征声学参数数据库,建立了用于单一语言语音研究和多语言比较研究的索引库和应用软件平台。主要成果有:
    1.语音库
    藏语、维吾尔语和彝语容量7G的语音声样库。22K采样率,男女声共计11人次。录制的语料有单音节词、多音节词、句子和故事,语料涵盖该语言的全部语音系统及特色语音。
    2.索引库
    主要由功能字段和标音字段两部分10个字段组成。功能字段可以表明该词在数据库中的语种、序号、该民族文字、汉译和对应的声样名;标音字段有:SAMPA(Speech Assessment Method Phonetic Alphabet )、国际音标(IPA)和该语言的拉丁撰写,其中SAMPA是各语言共同的标音系统。
    3.语音声学参数库
    对三种语言共提取了5位(3男2女)发音人,4109个词(单音节和多音节)的语音声学参数,建立了15.82M大容量语音声学参数库。
语音声学参数库共有49个参数,其中35个声学参数和14个功能参数。
声学参数包含元音、辅音和声调的时域、频域参数。功能参数包含语言的种类、词的音节个数、音节类型、统一编码标准的标音、音素所处音节的位置和对应的声音文件,功能参数主要用于检索和统计。
    该参数库的设计特别考虑到各个语言的特殊语音现象。如元音的长短、松紧、鼻化元音 ;辅音的特殊语音,像闪音、唇颤音、浊塞擦音、清化鼻音、塞音韵尾,以及发声类型:清、浊;等都在语音参数库中有相应的参数可以体现。
    4.语音声学参数库应用软件平台
    用VB设计的语音声学参数库应用软件平台,可以对多语言语音参数库进行各类检索、排序;生成各类专题研究的参数库;可以对单一语言和多语言进行统计分析,用于语言音系系统的语音研究和比较研究。
    教育部语信司王奇副处长和7位鉴定专家吕士楠、曹剑芬、石峰、陶建华、毛拉、胡素华、江荻听取了研究组提出的研究工作报告,观看了研究成果展示,考查和鉴定了该项目的执行情况和研究成果,一致同意研究报告提出的各项内容,并认定了主要的研究成果,包括:
    1.国内首次建立了藏、维、彝民族语言语音声学参数数据库。数据容量大(9G),采用国际通用制作规范,标准化程度高,可直接用于单一语言语音研究和多语种比较研究,在少数民族语言语音研究上,达到国际先进水平。
    2.建立了统一平台参数库和管理软件,为成果的推广应用和开展深入的语音研究提供了可靠的客观依据。同时为国家建立系统性的多语种语音声学信息资源库提供了框架结构。
    3.建立了上述三种语言的SAMPA标准(草案)、数据采集和存储范式、声学参数库和检索方式。
    4.在上述数据库的基础上,进行了三种语言的语音学基础研究,取得了初步成果。
    该项目的研究成果为促进藏、维、彝三种民族语言标准音的推广使用,为语音系统研究、语音教学、言语工程研究和病理语音矫治等提供了有效的数据支撑,是国家信息化建设的重要基础信息资源,促进了少数民族语言资源的保护和开发。
                                       郑玉玲
                                      2009.5.14
相关主题:民语语音 数据库
文章来源:郑玉玲
版权所有:中国社会科学院民族学与人类学研究所
网站技术支持:中国社会科学院民族学与人类学研究所网络信息中心
地址:北京市中关村南大街27号6号楼 邮编:100081