AI音声入力・匿名化・機械翻訳・CCMS・デザイン

AI音声入力・匿名化・機械翻訳・CCMS・デザイン

機械翻訳 (Machine Translation) の注意点

機械翻訳(Machine Translation)の検証(1)でもわかる通り、ニューラル機械翻訳(NMT)を利用する場合に注意すべき課題がいくつか判明しました。弊社のTradosでの機械翻訳事例も含め、どんなことに注意すべきか?まとめました。

1)数値が正確に翻訳されない

2)単数複数の概念がない言語からの翻訳
例:ネジを締めてください。
Tighten the screw. か Tighten the screws.

3)単語の間にスペースが存在すると、違う単語と認識される

4)タグが多いデータになると、翻訳精度が低い

5)訳文が抜ける(一見綺麗に翻訳しているように見える文でも、ソース言語の内容が抜けるときがある)

6)全角文字・記号・符号を認識しない

7)大文字・小文字の認識の問題
例:on → ON

8)省略語が認識されない

9)用語集の用語が適用されない

10)日本語のカタカナが認識されない

11)スペルミス

12)セルをまたいで翻訳されてしまう

13)原文の順を間違える

ニューラル機械翻訳(NMT)での翻訳の精度は日々向上してますが、上記でアップしたような「えっ」というようなエラーもまだあります。その為、機械翻訳後の文章を必ず誰かが原文とチェック(クロスチェック)をして正しい文章に修正する作業(Post-Edit)が必要になります。
また、機械翻訳の精度、効率を上げるには

●翻訳原文を機械翻訳が翻訳しやすい文章にする(Pre-Edit)
●用語集をしっかりと作成して運用する
●TM(Translation Memory)とTB(Term Base)は常にアップデートする
●機械翻訳後の文章を正しい文章に修正する(Post-Edit)
 (ネイティブかネイティブと同等の言語力が必要です。)

といった項目が、今までの翻訳より要求されます。

悪いことばかりではありません。弊社の事例でも用語集をしっかりと管理することにより、Tradosでの翻訳の際、用語が適切に補完されて翻訳の精度が高くなるということは確認しております。ニューラル機械翻訳(NMT)を利用するには、今までの翻訳工程のさらなる見直しが必要になります。

機械翻訳の魅力は、なんと言ってもその翻訳のスピードだと思います。人が考えて翻訳する時間を機械に任せることができるだけでも、マンパワー節約に大きな効果が期待できます。またデータが蓄積されるほど安定した翻訳が生成されます。PangeaMTは少量のデータを学習させるだけで、学習したスタイルの翻訳文を生成できます。

機械翻訳そのものの翻訳品質は日進月歩で進化しています。機械翻訳は検証をして導入するという時代から、導入して機械翻訳をどのように運用したら翻訳費用を抑えながらスピードアップできるのかという時代に入っていると思います。PangeaMTのデモ、言語ペア、導入費用などの詳細については、下記のお問い合わせよりご相談ください。

機械翻訳サービス

対応言語や機械翻訳サービスの詳細についてなど、ご不明な点は以下よりご相談をお待ちしております。

ナビックスは、スペインの翻訳会社が開発している深層学習対応型機械翻訳(NMT)PangeaMT を既に使用し、販売も行っております。PangeaMT は、少量のデータ学習で機械翻訳(Machine Translation)を可能にするのが特徴の一つです。機械翻訳で世界の情報をどこよりも早く社内共有しませんか。
PangeaMT は、クローンという管理方法で、ユーザーが機械翻訳の学習を分類して管理できます。例えば、●機械と電気の分野で原文の用語が同じで訳文が違う ●ですます調と体言止めを分類して文章スタイルを学習 させることにより、目的にあった訳文の生成が PangeaMT では可能です。TMデータ(翻訳メモリ)があれば、そのデータをクローンエンジンに学習させて機械翻訳を始めることもできます。

  • 機械翻訳は日々進化しています。また使用することにより、機械翻訳の有効的な使用方法などがわかってきます。
  • 学習効果を実感するためには!
    どんな小さなファイルでも、翻訳完了後のTMをきれいにメンテナンスした後、必ず作成したクローンエンジンでトレーニングを行ってください。この作業を地道に重ねることにより、ある日『良い翻訳をするようになったな』と実感する日が来ます。弊社でも、いくつかの業務にクローンエンジンを使用しておりますが、最初は実感がなくても、本当に使用していて良かったなと思っています。
    Trados Studioを使用されている場合は、メンテナンスした翻訳メモリを「エクスポート」で「TMXファイル(*.tmx)」に出力、PangeaMT にドラッグ&ドロップで簡単にトレーニング(学習)させることができます。

電話03-3493-1691/webフォームはこちら

TO TOP