吕振羽深深吸了一口气,脑子里回响着在家里的电脑上模拟各种翻译的成果。掌握了大量知识的小羽才能真正发挥语义和语用为平台的语音和新的全部功能。其实,翻译软件,严格地说只是语音平台的一个相当高级的插件而已,只不过,这个插件的功能之强大,会掩盖住语音平台的光芒。
语音平台是一个内外两层的大型程序,外部是语音的输入和输出,但真正关键的则是以智能核心为基础的语义和语用判断机制。而这个机制,同样是一个两层的结构,一层是语义和语用的甄别,另一层则是按照具体语用和语境,进行组织,从而生成具有相当强的可读性的句子,而作为这一层功能的底子,仍然是非常主流的结构语法学。结构语法学是有缺陷的,比如,在中文里,很多具体例子都无法用结构语法学去套用。比如“春风又绿江南岸”的这个绿字,语文老师们都会说这个绿字用得好,有色彩也有动态,但是从语法学上来说呢?绿是形容词,怎么就能做谓语呢?如果翻译成英语,江南岸green的词组来表示,但中文里怎么解释?现代汉语的语法是从欧洲对结构语法学的方法里脱胎而出的,而古文似乎从来不讲究什么语法。于是,老师们或许会说,中文就可以这么用,而到了后来,有一种解释很有趣,老师不说是主语谓语宾语,而是说占据主语位置占据谓语位置占据宾语位置。……这个解释算是通顺了,但对于程序员来说,如果没有一个出色的判断机制,是没有办法好好处理中文的翻译问题的,而其他语种之间,尤其是拉丁语系的语种之间,这个问题简单得多。结构语法学的惯例是主流,而例外相当少,至少,在日常使用的方面,例外相当少。文学……尤其是诗歌,那就没办法了。
吕振羽的翻译软件的机制很简单,同样调用语义和语用的判断机制,将输入的语音或者文本变成一个意义串,然后套用另一个语种的结构语法和词库,以这样的方法来完成翻译。这种翻译,已经能比较良好地进行整句/全文翻译,而最恐怖的功能,则是这个软件能进行同声口译。设想一下,高级口译证书是一个怎么样恐怖的东西,而那还只是中文与英文之间的口译,而吕振羽开发的这个基于语义和语用判断的翻译软件,只要需要,几乎可以进行任何语种之间的同声口译。
在开发这个软件的最初产品的时候,吕振羽将所有适用结构语法学的编程全部交给了小羽,而自己专心研究特例的处理,这项工程开始了没几天,已经取得了相当让人惊异的成果。小羽已经完成了数十种语言的结构语法学编程,对于小羽来说,这些工作只用了不到一个工作日。而吕振羽还在拼命研读各个语种的教材和字典,目前,英语的特例补充包基本完成了,法语完成了一部分,而中文……由于特例实在太多,只好一边分析一边建立这个库了。
吕振羽仍然是不紧不慢地将自己已经取得的成果说给大家听,当然,隐去了小羽在其中的极为重要的作用。看到大家看着他的目光渐渐变得狂热和崇拜,吕振羽的脸在发烧。
“你的这个软件什么时候能完成?”路德坤热切地问。他知道,这个软件只要一问世,肯定会掀起一阵狂潮,困扰中国人,尤其是中国学生多年的外语问题一下子就会变得不重要了。世界上的任何一个人,与素昧平生的任何一个外国人交流,也将变得轻松简单。当然,这都要这个软件足够完美,完美到不因为语种差异而产生误解。
“工作量太大了,所以我今天提出来,准备交给实验室继续完成阿。”吕振羽苦笑道,这种重复性的工作,小羽也已经出手帮忙了,但一方面,语言方面的数据处理量极大,而另一方面,吕振羽作为一个个人,能获得的语言资料也有限,根据他在市场上东奔西跑买来的各种资料构建的这个平台,肯定存在不少问题。
“这个项目交给我吧。”路德坤自告奋勇道。路德坤确实是最适合这个项目的,他基础扎实,有丰富的大型程序开发经验和团队团里经验。“应该聘请相当一些各国的语言学家来一起进行完善,光靠国内那帮外语教授什么的估计有问题。”路德坤认真地说。
“嗯,我也是这么想的,接下来的事情就交给你了。开发包和一些简单的文档我也写好了。”吕振羽窃喜,这个烫手山芋有人接下来再好不过,后期几乎都是重复性工作,太折磨人了。
楼家明突然问道:“全文翻译能达到一个什么水平?”
吕振羽嘿嘿笑了笑,从包里拿出几页打印纸,递给楼家明,说:“这是我用全文翻译功能翻译的安徒生童话里的《海的女儿》,完全没有作手动调整,只是后面套用了一下语音平台的雅致文本输出插件处理了一把。不过是按照英文译本再翻译过来的。”
楼家明接过打印稿,大致看了一下。整个故事翻译得语句通顺优美,用词华丽雅致,虽然有些细节上还稍稍有些生硬,但哪怕这个版本放到出版市场上,应该也称得上是一个不错的版本。楼家明的脸色从凝重变得轻松,转而又有了一丝苦笑,他说:“大学里学了那么多年英语,难道就白学了?你这个东西做出来,要抢光翻译的饭碗了啊。”
“没有白学,这个软件做到现在,英语我称得上精通了,法语德语意大利语俄语捷克语和希伯来语我也学了个遍……不会
喜欢数字生命请大家收藏:(m.7dshu.com),七度中文网更新速度最快。