《基于认知的汉语计算语言学研究》由北京大学出版社出版。
陆序
冯序
一、计算理论和语言研究
计算语言学的理论方法和研究取向
基于统计的语言处理模型的有用性和局限性
认知科学和汉语计算语言学
面向当代科技的语言研究的理论和方法
二、论元结构和描述框架
论元角色的层级关系和语义特征
一套汉语动词的论元角色的语法指标
汉语谓词的论元结构的描述框架
论元结构和句式结构互动的动因、机制和条件
——表达精细化对动词配价和句式构造的影响
三、信息抽取和语义标注
信息抽取的语义知识资源研究
用动词的论元结构跟事件模板相匹配
——一种由动词驱动的信息抽取方法
用逻辑和篇章知识来约束模板匹配
——逻辑结构和篇章结构知识在信息抽取中的运用
基于论元结构的语义标注的体系和规范
新闻语体真实文本的语义标注的实践
四、专题研究和个案分析
容器隐喻和套件隐喻及相关的语法现象
——词语同现限制的认知解释和计算分析
关于分词规范和规范词表的若干意见
中文信息处理中的语言难题问答
缓冲式移动通信及其发展方向
——一个语言学家的设计思想
走向多层面互动的汉语研究
五、附录
赵元任先生评传
朱德熙先生评传
后记
收入本书的18篇文章,都是我在90年代中期以后陆续写成的。其中,大部分是作为教育部“十五科研规划第一批(博士点基金)项目”——“面向信息抽取的语义标注研究”的子课题,而陆续完成的(项目批准号:01JB740006)。现在,我把它们收集在一起,根据文章的内容,大致分成4编,以便读者阅读。在这里,我要感谢教育部给我提供这笔基金,使我能够在一个比较优越的环境中进行研究、从容地写作。我还要感谢北京大学社会科学研究部提供了相应的配套经费,使我的研究有了比较充分的物质保障。虽然加在一起的资金并不多,但是足以让我感受到我们这一代学者的幸运,能够享受改革开放带来的伟大成果。这也促使我知恩图报,努力在自己所从事的专业领域中作出成绩,尽可能让自己的研究多少带有一点技术色彩,希望为国家的经济建设献出一点绵薄之力。
大家知道,计算语言学的研究有不同的思路(approach);而这跟不同的研究者对这门学科的理解,特别是他们的研究取向(orienta—tion)和知识背景有关。我比较喜欢那种对于语言研究和自然语言的计算机处理两头都有启发性的路子,于是免不了要走认知主义的道路,并坚持认知的本质是计算的观念;在此基础上,逐步形成基于认知并面向计算的语言研究的路子。当然,我不反对其他路子的计算语言学研究。这反过来也可以解释,为什么我对语言的认知研究跟一般的认知语言学或认知语法会如此大异其趣。
在学习和研究计算语言学的过程中,我先后得到黄昌宁、罗振声和董振东等老师的帮助和鼓励;跟白硕、王培、金茂兵、孙茂松、周明、姬东鸿和周强等学友的讨论,也使我大开眼界。特别是陆俭明老师鼓励我于1998年给研究生开设《计算语言学》课程,促使我对计算语言学的各种研究路子和教材体系作了系统的梳理。在此,谨向他们表示诚挚的谢意。
在学术研究领域,袁毓林可以说是一位勤奋的耕耘者。他的论文集《汉语语法研究的认知视野》(商务印书馆)于2004年出版,现在又推出了新的论文集《基于认知的汉语计算语言学研究》。我大略地翻阅了一下全书各篇的内容,论文集的书名“基于认知的汉语计算语言学研究”,点明了该书的基本内容——从认知的视角来研究计算语言学,特别是中文信息处理的问题。正文具体分四部分内容:
第一部分内容,作者取名为“计算理论和语言研究”,包括四篇文章:《计算语言学的理论方法和研究取向》、《基于统计的语言处理模型的有用性和局限性》、《认知科学和汉语计算语言学》和《面向当代科技的语言研究的理论和方法》。计算语言学的研究,大致可以分为两个层面,一个是理论模型的研究,一个是工程研究(或说具体的技术方法研究)。据我所知,袁毓林主要从事理论模型的研究,所以这一部分内容作者主要从宏观的角度介绍说明了计算语言学的理论方法和研究取向;评述了在自然语言处理中已运用过的基于规则和基于统计的两种处理模型,指出处理语言这种复杂的系统“必须走规则和统计相结合的道路”;从认知科学的视角作者把自己认为有价值的并且是可行的计算语言学研究模式介绍给读者,并结合作者自己的研究实践讨论说明了基于认知并面向计算的汉语语法研究的路线;展示了认知语言学和计算语言学相互结合的可能性。这部分内容对有兴趣了解或从事计算语言学研究的人来说,是值得一读的,是很有启迪意义的。
第二部分内容,作者取名为“论元结构和描述框架”,也包括四篇文章:《论元角色的层级关系和语义特征》、《一套汉语动词的论元角色的语法指标》、《汉语渭词的论元结构的描述框架》和《论元结构和句式结构互动的动因、机制和条件——表达精细化对动词配价和句式构造的影响》。袁毓林是我国最早研究配价问题的学者之一,特别是他第一个发表了有关汉语名词配价的研究成果,该成果被广为引用。