谢谢版主,我想我对作者的意思和您的解释基本上已经了解!
但是我在我的上个回贴中还没有把我想要说的内容完全写出来。我下面的内容更多是关注自然语言理解方面,而不是机器翻译方面的。
首先我声明,就像我在这个论坛的级别是“新手上路”一样,我也是中文信息处理这一领域的初学者。不对的或者不严格的地方还请各位多多指正!!!!
据我这段时间的学习,我觉得现在大部分资料上讲的机器翻译的方法,总的一个思路就是,先输入原始语料(我们先考虑句子),然后生成它的句法树(或者其他形式化的方式),最后把句法树映射成其他语言,就算完成翻译过程了。整个过程可以分成两个部分,其一是自然语言理解的过程(具体指的是生成句法树的过程),其二是语言转化的过程。
如果我的上述理解基本正确的话,那么我认为,现在所谓的自然语言理解基本上形式上的理解,离真正的理解还相差甚远。
比方说现在要让计算机理解这样一句话:“C是AB的中点。”我想这是一句比较简单的句子,现在的翻译系统说不定也能翻译的很好,但是从计算机理解层面,只要它能判断出:“C”是主语,“是”是谓语,“AB的中点”是宾语,其中“AB”是定语,“中点”是宾语中心语就可以了。但是在数学领域里,这句表达实际上是个关系,说明A、B、C三点之间的一个关系。如果以(x1,y1)、(x2,y2)、(x3,y3)分别表示A、B、C三点的坐标的话,这个关系就是表示成后面两个方程式“x3=(x1+x2)/2; y3=(y1+y2)/2”,这种方程式的语言,现在的计算机是能够理解的。从某种角度来讲,计算机对这句话的理解不是停留在前面的语法结构层面,而是到了后面这种程度才能称之为真正理解了这句话的含义。
当然不同的情况对计算机理解的程度要求不同,如果纯粹为了把它翻译成英文,我们只要从语法结构层面上理解它就可以了。但如果要求计算机进行几何作图,显然必须要求达到后一种情况。这种情况也可以看作是机器翻译范畴,它要求把自然语言翻译成计算机能理解其本质意义的语言。但更确切的说是应该是自然语言理解范畴了。可以说上一个帖子中所说的专业领域自然语言理解也是指的这种程度的理解。
所以我认为如果作为某些专业应用软件辅助成分,在一个非常受限的语言环境里,开发一个理解程度非常高的专业自然语言理解系统应该是比较实际而且也能够带来具体应用价值的一件事。
欢迎大家对我这些话品头论足一番! |