2010年8月苏新春教授承担的国家社科基金项目“基于‘国家语委通用语料库’之上的义频词库的开发”通过全国哲学社会科学规划办公室鉴定,鉴定级别为优秀。专家认为该成果针对汉语基础理论和信息处理应用研究的前沿,课题结构庞大,内涵资源丰富,研究思路明晰,处理方法合理,数据严谨可信。具有创新特点和填补空白的性质。
课题研究过程围绕计算机词义自动标注进行,最终形成的核心资源有三个部分:一、建立了一系列语义知识库包括“现代汉语综合语料库”、“词义标注用机用义项库”、“现代汉语语义分类库”、“语法库”(借用“现代汉语语法信息词典”为主)、“词义标注规则库”、“义频库”、“验证库”。二、开发了贯穿课题的软件系统平台包括,语料整理平台、搭配规则发现平台、词义自动标注平台,使基于大规模语料的词义研究得以实现。三、对3775条多义词进行了全面的规则描写,并且统计出了义频统计结果。
课题对词义及词义形式特征进行了深入的基础性研究,既有重要理论意义又有十分广阔的应用前景,课题以义项为研究对象,围绕多义词、词义、词义形式特征及他们间的关系,探讨了一些基础理论问题。资源库和研究平台可以直接供对语言教学、词书编纂及自然语言理解相关领域使用也为相关研究提供了新的研究思路。
项目2004年立项,研究历时五年,有部分厦门大学及厦门大学嘉庚学院本科、硕士、博士同学参与。
李安
2010-10-11
文章录入:xwzumx 责任编辑:xwzumx |
|
|