斌's profile随园厚生PhotosBlogLists Tools Help

Blog


    December 18

    Genuine Microsoft Software

    原来正版是这么说的。盗版呢?pirate copy.
    December 17

    语音实验室成立三周年

    今天是南京师范大学文学院语音实验室三周年庆典的日子。刘俐李教授丰硕的科研成果着实让我吃惊。借助实验语音学方法,完成了这么多的方言调查,并进行了深入细致的分析和思考,得到了大量的语音标注库,得出了一系列有价值的结论。让人十分敬佩。我想,南师大的语言学实力确实是比较强大的,在古代汉语有敦煌学专家黄征、汉语史专家董志翘教授,实验语音学刘俐李教授,计算语言学就不说了,神经语言学杨亦鸣教授、外国语学院的程琪龙教授,还有语言理论、对外汉语等。现在只是可惜结合的还比较少,没有形成综合实力。

    关于中心词分析法

    中心词分析法到底是从哪里来的呢?
    December 16

    昔者已已矣 来者尤可追

    老一辈的学者,就这样去了,他们留下的是中国的语言学足迹。
    翻开《中国语文》,我们看到中青年学者在功能、认知、类型学上的建树。
    Lamb said "just imagine there are 15G neurons in the brain, how can we know about the language".
    15G并不是一个天文数字,不久的将来,电脑可以模拟出庞大的图形网络。 问题是不知道他们如何工作。
    黑箱法,使用了很多年,内省法用的更久,脑科学、神经科学、实验心理学、计算语言学必须结合起来,语言学的科学性和人文性在不久的将来会分道扬镳。
    我们不知道国外的语言学界都在忙什么,Language上经常会有海外的汉语研究论文,……
    不说空的了,多研究问题,少谈些主义……
     

    怀念语言学的先辈

    公元1926年:王国维逝世。
    公元1936年:章炳麟逝世。
    公元1940年: 罗振玉逝世。
    公元1956年: 杨树达逝世。
    公元1958年: 罗常培逝世。
    公元1962年: 胡适在台湾逝世。
    公元1964年: 方光焘逝世。
    公元1965年: 高名凯逝世。
    公元1966年: 吴玉章、陈梦家、刘盼遂逝世。
    公元1968年: 郑奠逝世。
    公元1970年: 马叙伦、陆志韦、赵荫棠逝世。
    公元1975年: 金兆梓逝世。
    公元1977年: 陈望道逝世。
    公元1978年: 黎锦熙、郭沫若逝世。
    公元1979年: 唐兰逝世。
    公元1980年: 魏建功、袁家骅、洪诚、刘世儒逝世。
    公元1982年: 赵元任逝世。 
    公元1983年: 容庚、张弓逝世。
    公元1986年: 王力在北京逝世。
    公元1987年: 李方桂在美国逝世。
    公元1988年: 傅懋勣逝世。
    公元1988年: 丁声树、岑麒祥逝世。
    公元1991年: 商承祚、张寿康、廖秋忠、严学宭、徐中舒、张世禄逝世。
    公元1992年: 朱德熙在美国逝世。
    公元1993年: 周祖谟、蒋礼鸿、胡厚宣、孙竹、俞敏逝世。
    公元1996年: 陈亚川、罗竹风、龚千炎逝世。
    公元1997年: 张志公、许绍早、李新魁、石安石逝世。
    公元1998年: 吕叔湘、张清常、叶蜚声逝世。
    公元1999年: 日本汉学家太田辰夫逝世。
    公元1999年: 张拱贵、喻世长、于安澜逝世。
    公元2000年: 俄罗斯语言学家宋采夫逝世。
    公元2000年:高元白、马希文、吴继光逝世。
    公元2001年:倪宝元、胡裕树、王辅世逝世。
    公元2002年:李荣、刘坚、叶祥苓、陈乃雄、林杏光逝世。
    公元2003年:李格非逝世。
    公元2004年:邢公畹、陈原、陈建民、方经民逝世。
    公元2005年:启功、杨春霖、徐琳、王世华逝世。
    公元2006年:徐复、林焘、徐通锵、陈原、廖序东逝世。

    中国语言学损失严重的一年

    2006年,徐复、林焘、徐通锵、陈原、廖序东相继逝世。
    南京师范大学文学院教授、我国著名的语言文字学家、古文献整理与研究专家、教育家、中国民主同盟盟员徐复教授因病医治无效,不幸于2006年7月24日21时55分在南京去世,享年96岁。
    著名语言学家、北京大学中文系教授徐通锵先生因病于2006年11月25日19时50分辞世,享年75岁。
    10月26日凌晨5时,著名语言学家、翻译家、出版人陈原在北京协和医院因病去世,享年86岁。
    我国著名语言学家、北京大学中文系教授林焘先生因病于2006年10月28日辞世,享年85岁。林焘,字左田,福建长乐人,1921年出生于北京。
    著名语言学家廖序东先生,于12月12日下午,带着对汉语言研究的无限挚爱和眷恋,带着他无穷的睿智和学识,离我们而去。
    回顾历史……
    1976,叶帅、周总理、毛主席相继逝世。
    1977年10月29日,著名语言学家陈望道逝世,享年86岁。
    1980年,语言学家魏建功先生逝世
    1982年2月25日著名语言学家赵元任逝世 。
    1986年5月3日,中国著名语言学家王力在北京逝世。
    1992年1月,著名语言学家朱德熙教授在美国逝世。
    1998年4月9日,著名语言学家吕叔湘因病在北京逝世,享年94岁。
    2001年,我国著名语言学家、复旦大学教授、博士生导师胡裕树先生因病于11月22日在上海逝世,享年84岁。
    2002年,著名语言学家,我院语言研究所研究员、博士生导师刘坚因病医治无效,于12月17日在北京逝世,享年68岁。 刘坚先生,江苏省宝应县人,1934年7月生于上海。1951年考入北京大学中文系,1955年毕业后到中国科学院语言研究所
    2004,著名语言学家、南开大学文学院终身教授邢公畹先生因患癌症长期医治无效,于2004年7月7日凌晨3时25分在天津医科大学总医院逝世,享年90岁。
    2005年,我国著名语言学家、西北大学文学院教授杨春霖先生,因病医治无效,不幸于7月16日6时15分在西安逝世,享年84岁。...
    2006,著名的维吾尔语言学家哈米提·铁木尔(阿吉)于9月15日晚在乌鲁木齐病逝,享年75岁。哈米提·铁木尔教授生前系自治区语委会副主任,中央民族大学副校长,维吾尔著名的语言学家,也是现代维吾尔语正字法的创始人,一生学术著作丰富,桃李满天下。
    December 15

    什么是科学,尤其在人文学科

    科学所陈述的,是我们在不同程度的确定性上所知道的。
    大琛 11:29:32
    这些思考和结论往往无法测量,无法证明,双方的看法都可能对,这样就没有办法作真正的结论,到处是似是而非、模棱两可。
    大琛 11:30:17
    给你讲一个故事啊
    gothere 11:28:16

    大琛 11:30:36
    讲完这个故事我们就去吃饭
    gothere 11:28:21
    ok
    大琛 11:31:02
    一个心理学家弄了个长长的走廊,走廊的一侧有许多门,老鼠从这里进来;走廊的另一侧也有许多门,放着食物。他想看看他能不能训练老鼠,不管从哪儿放它们出来,它们都走进从放它们出来的门数起的第三个门。
    大琛 11:31:16
    结果,老鼠径直走向上次放食物的那个门。
    大琛 11:31:23
    老鼠怎么会知道这是以前的那个门?
    大琛 11:31:34
    走廊修得那么漂亮、那么均衡!显然这个门有不同于其他门的地方。
    大琛 11:31:45
    于是他把所有的门十分仔细地漆一遍,使门面上的纹理完全一样。
    大琛 11:32:03
    但是老鼠还是能够分辨。然后他想,也许老鼠是闻食物的气味。于是他每次实验时都用化学药品改变气味。但是老鼠还是能够分辨。然后他意识到,也许老鼠能够像普通人一样,通过看实验室里的灯光和布置来判断。于是他把走廊蒙起来,然而老鼠还是能够分辨。
    大琛 11:32:36
    最后,他发现,老鼠是依据它们跑过去时地板发出的声音来判断的。
    大琛 11:32:42
    只要把他的走廊放在沙地里,一切就搞定了。
    大琛 11:32:57
    他把所有可能的线索一个一个地掩盖掉,最后终于能够欺骗老鼠,让它们不得不学习走进第三个门,如果把条件放松任何一点点,老鼠就能分辨。
    大琛 11:33:59
    这不是自然科学的实验,而是心理学上的,但算得上是科学了。OK,我们吃饭去!
     
    总结:科学,依靠实验,得出确定性的结论。不过,这个实验,还没有得到一种理论,只是一个观察实验。还需要进一步讨论,人们对“科学”的认识,和重新定义“科学”的内涵。

    利用声源定位做噪声剔除

    我不是做语音处理的。但是突然冒出一个想法,如果利用声源定位做噪声剔除要比单纯利用声波来降噪要好很多。
    可以指定特定来源的声音作为过滤的目标或不过滤的目标。这样就不会对需要保留的声音损失过多。

    说谎者悖论

    说谎者悖论。其实在句法层不存在悖论,而是出在语义上。语义上,具体说是在全称判断所使用的词语上。而自然语言的特点是模糊的,或者说是特殊的句型如“所有的人都走了,只有他还在”。直接排除“他”本身。强调的重点不同。
    解决这个悖论,有2种途径。一种是提出元语言的说法,认为是2个层面的问题,不能搅和在一起。这种方法还是用纯逻辑的;另一种,就是把自然语言的特性揭示出来,说话人强调的重点是其他的人都怎么样,直接排除了自己。
    December 13

    南京大屠杀

    早上起来就听见外面长鸣的警报。这是南京特有的纪念方式,69年前那场大屠杀让人们记得“落后就要挨打”。不过,也得反思,“先进”就可以打人么,先进反而无道德。19世纪,欧洲的文化艺术非常发达,同时也是欧洲动荡、掠夺的岁月。这种掠夺延续到20世纪,直到今天,“先进”国家依然一副无赖面孔。联合国是一个良好的方式,“春秋无义战”的残酷方式应该加以改良,不否认“胜者为王”,但不要掠夺、残杀。人,总是与利益相联系;私有制导致利益不均;公有制又导致生产不足。和谐社会怎么去构建,只是政府的本能;而“大同世界”还得靠哲学家去思考,政治家去实践。柏拉图的理想国,希腊的公民国家何时才能降临?

    可笑的人工分词

      可笑的人工分词。有人还不知道分词只是为了信息处理的方便而采用的一种技术,反而主张日常写作也要分词连写。太搞笑了。
    看看下面这一段;打字就够烦了,还分词,迂腐!
    “语言学” 包括 所有 语言 的 基础 和 应用 研究。“学者” 是 从事 学术 研究 的 人。学者 不 分 级别,用 事实 说话。这 本 词典收集 的 学者 是 活跃 在 语言学 学术 事业 中 而且 具有 硕士 学位 或者 副教授 职称 及其 以上 学位 职称 的 语言 学者,其他 有 成果 的 语言 学者。记录 在 语言学 历史 上 流芳百世 的 人物 包括 已经 去世 或者 学术 上 不 活跃 的 人物 由 其他 相关 工具书 实现,本 词典 不 承担 这个 责任。

    从词类问题看语言学研究

    词类问题,是一个老话题。但是划分词类的标准经常引起争论。实际上,分类的标准只有1个,就是意义,就是人一看,就知道词类了。讲词类是为了讲语法,讲语法是为了制定语言规范和进行第二语言教学。所以兼类词和词类活用的问题并不棘手,人们总是可以根据意义进行判断,只是从理论上难以圆满。而且,语言学上分出来的类太大,比较模糊。
    当语言信息处理遇到词类问题时,就麻烦了,因为机器无法判断意义,所以词类问题不再只是一个理论问题,而涉及到了应用难题上。计算语言学界花了很多时间在词类的消歧上。所以,有的人也把词类划分得更细,减少模糊性和兼类词。不过,词一旦分类,总会损失个性信息,于是人们干脆提出来词汇化的方法,把词语的个性调查清楚,告诉计算机,再去让它计算。所以,词类不是被细化就是被词汇化。语言学应该走向现代化,精密化,不应该停留在模糊的定性的研究上。在计算机的帮助下,面向语言事实,做充分的描写和解释。

    《马氏文通》来源于普遍唯理语法是不太可信的

    《马氏文通》来源于普遍唯理语法是不太可信的。
    因为,陈保亚分析指出,《文通》有词法和语义两个平面。而《普遍唯理语法》一书重的是词法为主的,语义的内容也是“数”“格”等形态变化。语义结构是从哪里来的呢?

    google current

    google又出新产品了,googlecurrent 网络电视 http://www.current.tv/google
    百度在这方面没有大进展,但是看到了十大电影风云榜 十大畅销书风云榜 十大数码产品风云榜。其中,数码产品风云榜太搞笑了,居然都是类别词,而不是产品名称,可见百度在产品专名处理上还需要改进。
     
    December 12

    vivisimo的难题

    vivisimo不知道为什么,用VC下载它的网页老是出错。是不是因为它用的是二次链接呢?疑惑中
    December 11

    失语症

    不得不承认,我患有失语症。
    尤其在同别人交流的时候,稍微一紧张,或者有些顾虑的时候,就不知道该说什么,经常处于沉默之中。也不清楚自己的脑子里在想什么——呆住了。
    总记不住别人的名字,常常造成很尴尬的场面。用“你”实在是很蠢的行为。
    谈话也总是以别人为主,自己总是听众。
    游乎其外,徘徊而不前。遇到问题,难以直接揭示根由,老是在外围打圈。这样不好。芳说,不能光发牢骚,光说问题,要解决问题。是的。我需要变得冷静,遇事不慌,静下心来,慢慢地做。不过,跟别人交流的失语症,也许要靠跟能说会道的人学习了。
    December 10

    我不能糊涂了

    我不能糊涂了。
    还是陈嘉映的一句话,“过去的年轻人在成年时,要接受严酷的训练;现在的年轻人,太自由了,反而缺乏了生存技能,所以倍感压力。”对自己狠一点。要有点计划。
    恩,我对一个博士,尤其是计算语言学的博士的要求是:
    英语、编程、语言理论、逻辑、数学、计算理论、认知、统计、机器学习要有扎实的基础,懂得第二外语;对国内外的语言学和计算语言学、人工智能有清晰的认识和较为全面的把握;发表论文至少10篇以上,对于一些具体的研究课题有深入的研究和创新;要懂得科学史、哲学史。
     
    December 09

    硕士开题

    05级的硕士今天开题。他们表现得真好,基本上脱稿,层次比较清晰,声音也洪亮,比我当年强多了。突然感觉自己老了,没有希望了,呵呵。
    December 08

    初见陈嘉映

     

    初见陈嘉映

    今天上午去南大听课,中午回来突然看到了陈嘉映在南大有讲座,于是毅然走向了讲座的地点。

    陈嘉映的《语言哲学》我很早就买了,几乎是在刚出版的时候,但一直没有看。这个学期居然看了半本。不得不承认,陈嘉映的水平是不错的,我虽然是学语言学的,但也从他那里才弄明白了能指和所指的区别。当然,他对语言学不太熟悉,介绍乔姆斯基就有些勉强了。

    看到介绍,他去了华东师大,非常奇怪,牛人又跳槽了。

    今天他讲的内容是《科学与哲学》,我很感兴趣,因为张之沧给我们上课讲了不少这方面的内容,另外,我还去听了科技哲学的一个国际会议,在那次会上,一个老专家对“科学”和“技术”的区分非常透彻,主张应区别对待这样两种学科。

    那么,在半睡半醒地休息了40分钟后,等来了陈老先生。其实他不老,说“老”,是觉得他的智慧在中国已经达到了老者的水平。果然是搞语言哲学的,对词源(词语的源流)非常熟悉,分析哲学的方法也用的炉火纯青。讲话都非常严密,总是说,“我的意思是”,“我想说的是”,“我仅仅是说”,“不多引用,只谈一点感想”……。他说,17世纪以前,西方没有“science”一词。那么哲学(philosophy)就是科学。所以,很多哲学家都是科学家,牛顿的书也是“自然哲学的数学原理”。我当时想,终于明白了,Ph.D.还是这种意思。第二个大问题,使我大开眼界。他说,古希腊的哲学只是经验的,探寻的本质、真理,实际上是在谈人们对这些概念的认知方式与界定。比如,对“美”的争论。以前都觉得是在寻找美的本质,而实际上是在分析人们如何界定“美”的,并没有找出本质。哲学是不需要实验的,仅仅是谈论的、玄想的。而随着实验科学的兴起,实验超越了经验,所证明的东西是间接知道的,是纯思辨无法得到的。从这个意义上看,科学是一阶的,他研究的是世界,要创造新的体系来解释世界。哲学是二阶的,它是人们与世界相处的方式,探索意义,不断加深人们的理解。哲学用自然语言进行的所谓推理,比起数学和形式化的人工语言,无法进行系统而长久地的推理。而现代科学,更强调体系的建立,新的概念不断被创造,而且它们只在理论模型中有意义,模型可以被检验,具有可操作性。

    我觉得,只是典型的情况,其实在社会科学,建模是何等困难。有人就说,模型应该分两种,“解释性”和“预见性”的。语言的模型非常难以刻画,正是在这个意义上,乔姆斯基把语言理论高度形式化,想搞成科学的语言学。语言学中,最早科学化的是音位学和音系学的研究,模型具有解释性和预见性。但是在词汇、句法、语义、语用等方面,科学化至今也没有成功。这里,我把模型化当作了科学化的必然要求,我不知道这样是否正确,但目前没有办法,没有模型的刻画就没有完整的成系统的解释。当时,想问陈嘉映几个问题,但事前没有做好准备,尤其是在看他的书时遇到的一些问题没有带在身上。如果陈先生能够看到本文的话,我还是想问2个问题:

    1.维特根斯坦,到底伟大在什么地方。

    2.语言学,研究的东西非常特殊,是在用自己研究自己。当然,可以做语言和元语言的区分。我想,是不是可以这样说,要研究语言,也是要靠一个模型,这个模型的词语仅在体系内有效。建立一个公式化系统进行描写和演算。然而,问题就在这里,找到充分描写语言的体系几乎是不可能的。我们描写语音做到了,描写句法很勉强,但面向语义时几乎傻眼了。

    介绍

    陈嘉映,男,1952年生于上海,后随父母迁居北京。1977年考入北京大学西语系德语专业,1978年5月考上外哲所研究生,81年毕业后留校任教。1983年11月赴美留学,90年以《论名称》一文获博士学位,其后赴欧洲工作一年,1993年5月回国,重返北大任教,后调往华东师大哲学系。主要译著有《存在与时间》,《哲学中的语言学》,著有《海德格尔哲学概论》,《语言哲学教程》等。

    December 07

    The Logic Structure of Linguistic Theory笔记

     

    手稿的情况很特别,所以做一些回顾和说明。

    I 这本手稿现在出版的样子

    II 手稿55年以后的修正路线

    III 重新梳理写作这本手稿时候的思路。

     

    I 手稿完成与1955春,第四章加上一些背景说明后作为我在Pennsylvania大学的Ph.D. dissertationTransformational Analysis”。当时是在Harvard大学的第四年完成三年级的学业。在我参加的Society of Fellows中,得到了Nelson Goodman等人的帮助。

    1955年秋,我开始在MITModern Language Department教书 ,同时兼任Research Laboratory of Electronics。当时环境很好,我可以教大学生语言学、逻辑学、语言哲学的课程,在电子研究实验室,在Jerome Wiesner的引导下,我有了跨学科(interdisciplinary)的研究环境。能够和Moriis Halle继续合作,他在MIT工作了很多年,并聘用我。

    1955年秋季学期,我修改了LSLT中的若干章节。当时,被Harvard 图书馆缩拍了两个版本(一个是1955年版,一个是19661月修改版)。我没有数,但是这两个版本和1955的影印本至少有几百本。

    1956年春,我开始修改手写本,打算出版。第十章和最后一章本来是一个结论。我把结论放在了第一章。当年,我重写了第一章和原来的前5章。本书就是1956年改写的版本(1-6章)加上一个前言。第七八两章是56年春的修改本,九十两章没有改动。

    修改好以后,我把手稿的一部分提交给了MITTechnology Press。我被拒绝了,要求我在出版前必须在专业期刊上把相关内容发表。这个不容易,因为,我事前提交的一篇基于本书的论文已经被拒了。我用这个材料,在一些高校做了讲座,但是无法引起专业语言学家的兴趣。出版是不可能了,虽然我在19551956的会议上发表了一些论文。

    1956年,在Morris Halle的建议下,我把在MIT的大学课程上使用的讲义拿给Cornelis Van Schoonefeld看,他是Mouton出版社Janua Linguarum丛书的编辑,结果他同意出版。1957年,稍加修改的版本出版了,“Syntactic Structures(SS)”。这本书是LSLT的骨架和非正式的摘要,里面有有限状态文法和文法的形式化的性质,1956的内容。Robert Lees的书评引起了学界的兴趣。1960年,Lees出版了他MIT的博士论文,第一本转化生成语法的书“The Grammar of English Nominalizations”。E.S.KlimaG.H.Matthews也在该领域做了一些工作。同时,Zellig Harris出版了1955年在Linguistic Society(语言学会)上的Presidential Address(主席发言) Co-occurrence and transformation in linguistic structure”,与转化语法的方法不同,是他前面工作的继续。几年之间,很多语言学家在转换语法上研究,出现了重要的理论成果和对不同语言的描写研究。

    1958-1959,我在Princeton的高级研究院做了一年的研究,重写了LSLT。我修改了6章内容,增加了新的材料和一些技术进展。但1959春,我被生成音系学缠住了。1951年“Morphophonemics of Modern Hebrew(MMH)”中使用的方法,打算应用在英语上,同时作为LSLT第七章的附录。可是后来,没有时间完成其他部分的修改了。在本书出版的时候,考虑到这些内容一方面不完整,修改的内容也已在其他地方发表过,所以没有出版这些修改的内容。

    我经常和Zellig Harris讨论,他对本书I提出了很多批评。Bernard Bloch 鼓励我。Nelson Goodman,经常讨论。芝加哥大学的数学系的Paul Halmos讨论。

     

    1947Harris把他的"Methods in Structural Linguistics"给我读。我觉得太迷人了(intriguing),所以去Pennsylvania大学学习。我对历史语言学和希伯来语法比较熟悉。学习了一些逻辑和哲学的课程。

    Harris建议我对某种语言作系统的结构语法。我选择了希伯来语。跟一个informant(语料供应人; 讲本国语供外国人学习或研究的人)合作,使用了结构语言学的方法。结果让我不满意。不知道该怎么搞下去,我放弃这些努力,做了一些很自然的事情,就是,我尝试建立一套规则系统,来生成句子里面的语音形式,也就是现在的生成语法。我想也许可以设计出一套递归的规则系统来描写句子的形式和结构。把Harris的方法进行改造,,因此也许达到了那种我从历史语言学中看到的解释力量。从mlkking-malki(myking)-malka(queen)-mlaxim(kings)。从kx是一个后元音(a)位置上摩擦的结果。但是,考虑形式malxey(kings of)。这里,我们有了x在一个音位环境下,我们期望k(比较malki-malka)这种不规则,可以得到解释,如果我们假设摩擦是一个元音减弱的过程,使得malaxim成为mlaximmalaxey-X(kings of X).

    1953,我放弃了“发现程序”,并转向了生成语法。在Harris的建议下,我去学习逻辑学、哲学和数学基础。