2010年1月27日

異なる機械翻訳のモデル

A Crash Course in Machine Translationがシンプルながら要点をついて説明をしている。

Babelfishに代表される規則に基づく翻訳モデルはもう40年以上研究が続いているわけだが、いまだにその精度の低さははっきりと分かるし、言葉が進化している限りこれから続けていってもあまり意味がないのでは?と個人的にはあまり将来に希望が見えない。グーグルに代表される統計に基づく翻訳モデルは一部かなり筋が良いのだが、別の意味でとんちんかんな訳出をする事も少なくない。面白いのは、これはあまり知られていないのだが、グーグルも翻訳事業を立ち上げた時はBabelfishと同様、SYSTRANのシステムを利用していたという事。マイクロソフトは両方の良いとこ取りを狙っているが、最終的にはどちらも中途半端で終わりそうな予感(個人的意見。バルマー時代のマイクロソフトは優柔不断・中途半端が顕著なので…)。

それにしても、翻訳システム向上のために国連から2000億ワードの資料提供を受けたって、グーグルはやる事が半端じゃないね!