2013年10月8日

NAIST、文末を待たずに翻訳を開始する同時自動音声通訳技術を開発

NAIST、文末を待たずに翻訳を開始する同時自動音声通訳技術を開発

これは試みとしては面白いと思う。同時通訳を必要としている人には、誤解を恐れずにいえば、あまりクリティカルではない情報が多少損なわれてもスピードを重視したい人がいるわけで、その意味ではこの試みは重要な一歩になると思います。

今回の研究では、自動音声通訳の際に、翻訳の遅れが生じる問題を解決するために、文が終了する前に翻訳を開始する手法として、これまでの手法の文の発話終 了からそれぞれの処理が逐次的に行われていたのとは異なる、一文が完全に終わる前に適切なタイミングで通訳を行う技術を考案したという。

具体的には、句ごとに対応関係を対訳文から統計的に学習し、正解の確率が高い訳語を表現する「統計的フレーズ(句、単語列)ベース翻訳」を用いる。最初に その情報を利用して入力する言葉を「文」より短い「句」の単位に分割。ただし、翻訳の単位を短くすれば訳出タイミングを速くすることができるものの、単位 が短かすぎると、正確な訳出に必要な文脈情報が失われるため、翻訳に最も適切な単位を選択できるように、翻訳対象となる言語対の並べ替えやすさを考慮した パラメータを導入し、トレードオフの関係にあるスピードと精度の調整を可能にした。
特にこれからはGoogle Glassなどに代表されるように、wearableなデバイスが主流になってくると考えられている(定着するかどうかはわからないが・・・)ので、訳の正確性はもとより、いかに原文(発話)と訳文(表示)のタイムラグを最小化することが重要になってくると思います。「えっ、それってそんなに重要?」と感じる読者もいるかもしれませんが、考えてみてください。グーグルの検索に2秒かかったら嫌でしょう?そんなものです。速ければ速いほど快適だし、一度その快適さを体験したら、もう元には戻れません(笑)。

0 件のコメント: