機械翻訳を使用した中国語ホンヤクの現状【中国語ホンヤクの世界】

f:id:simul2019:20231228180440j:plain

英語以外の言語の翻訳事情や、仕事のエピソード、スキルアップ情報などを、翻訳者がリレー形式で紹介します。今回は「中国語ホンヤクの世界」。日進月歩で進化する機械翻訳ですが、現在の実力はどれくらいなのでしょうか?気になる現在の機械翻訳の精度とは?

 

新型コロナウイルスの感染拡大に際し、あるニュースが一時話題になりました。日本人男性が「感染した中国人は日本に来ないでほしい」という意図で「不要来感染中国」というビラを電柱に貼り逮捕されたものです。

しかし、この中国語訳では「中国を感染させないで」と本人の意図とはかけ離れた意味になります。機械翻訳を使用したかについては不明であるものの、実際に機械翻訳にかけてみると、やはり「不要来感染中国」と出るのです。機械翻訳の精度とはどの程度のものなのでしょうか。いくつか例を挙げながら考えてみたいと思います。

機械翻訳利用の現状について

近来は、機械翻訳を使用してホームページを翻訳することも、まれではありません。ある自治体のホームページの日本語版と中国語版を比較してみると、たとえば「暮らしと手続き」や「健康・福祉」などの単語は「生活・手续办理」「健康・福利」と問題なく訳されています。

しかし、内容を見てみると、語順の間違いや、英語の散在、訳語の間違いなどは少なくありません。文章としての関連性がなかったりします。機械翻訳は単語の翻訳はできても、文章の翻訳は間違いが多いといえそうです。 これについて、いくつか原因を探ってみたいと思います。

意味を正しく理解した訳語の選択

日本語では同じ意味を持つひとつの言葉でも、中国語では複数の言い方をする場合があります。日本語の「枚」の訳し方を例として挙げると、以下のとおりです。

・薄い平たいもの・・・「片」「张」  
・少し厚みのあるもの・・・「块」  
・衣服など・・・「件」  
・絵など・・・「幅」

試しに機械翻訳を利用すると、次の結果が出てきます。

天麩羅(5枚) → 天妇罗(5件)
天麩羅(4枚) → 天妇罗(4个)
天麩羅(3枚) → 天妇罗(3片)
天麩羅(2枚) → 天妇罗(2个)
天麩羅(1枚) → 天妇罗(1片)

日本語は数字だけが異なりますが、「枚」の訳語はそれぞれになっており、正しい訳語が選択できていません

語順の配列

日本語の文は「主語」+「客語」+「述語動詞」の語順で配列しますが、中国語は「主語」+「述語動詞」+「客語」の順番です。そのせいか、機械翻訳では、語順が誤っている場合もあります

例として

「私は、ご当地グルメを食べながら映画を観ることや、音楽を聴きながら本を読むことが好きです。」

を機械翻訳に入れると、次の結果が出てきます。

「我喜欢在看美食,看音乐和看书的同时看当地的电影。」
(私は、おいしい食べ物を見たり、音楽を見たり、本を読んだりしながら、ローカルの映画を観ることが好きです。)

文脈

機械翻訳はロジックがありません。文脈は翻訳者にとっては、文章を理解することに役立ちますが、機械翻訳は前後に関係がある文だとしても、別々に訳します

例)2019年5月1日より、元号が「平成」から「令和」に変わった。これにより、2019年4月1日〜2020年3月31日の期間が「令和元年度」となる。
訳)从2019年5月1日起,时代名称由“平成”更改为“ Reiwa”。因此,从2019年4月1日到2020年3月31日将是“灵和1年”。

全体的な誤りはひとまず目をつぶるとして、「令和」に注目してみてみると「Reiwa」「灵和」と誤った訳語が出てきます。

また、昨今は旅行用のアプリや翻訳機など色々ありますが、機械翻訳は旅行には役立ちます。一部の製品には「私は○○へ行きたいです」「私は○○が欲しいです」などの例文と選択肢がたくさん登録されていて、利用するとき必要な選択肢を「○○」のところに代入することで、必要な文が表示されます。正しい訳が表示されるかどうかは、登録されている例文の数にもよります。

さらに、はじめから言葉を入力して使う製品もあります。その訳文を評価する仕事をいくつか受けたことがありますが、訳文は正しいとは言えないものの、実用的です。なぜなら、旅行においては、ほとんど直接会話をしますし、複雑な文章は必要ないからです。ちょっとしたミスがあっても、相手は雰囲気で理解してくれるでしょう。

進歩しつつある機械翻訳

2014年に日本へ旅行に行った時、トイレで「手纸,因为融解于水,请就那样流到正在厕所。」という文を見ました。原文は恐らく「トイレットペーパーは水に溶けるので、そのままトイレに流してください。」だったと思いますが、機械翻訳を用いたのか、実際は語順や訳語にかなり違和感がありました。

たとえば「溶ける」の訳語に「融」が使われていますが、正しくは「溶」です。「溶ける」の訳語は「溶化」「融化」「熔化」と3つあり、それぞれ使い方が異なります。

・融化:固体から液体になること。例)雪、氷→水
・熔化:加熱により固体から液体になること。例)鉄→溶銑
・溶化:固体が液体に溶けこみ、別の物質になること。例)砂糖+水→ガムシロップ

また「流」は、中国語では自動的に流れることを意味します。トイレットペーパーは人が流すものなので、本来は「冲」「使……流」を使用するべきです。さらに語順に着目すると、中国語では原因と結果を示すときは「因为(原因)……所以(結果)……」「由于(原因)……因此(結果)……」などの構文を使用します。以上のことから、正しく訳すと以下のようになります。

「因为手纸溶于水,所以请就那样冲入厕所」

いま「トイレットペーパーを〜」の日本文を機械翻訳にかけると、「厕纸溶于水,因此只需将其冲洗到马桶上即可。」と出てきます。結果を示す「因此」がありますが、原因を示す言葉がありません。また、流し先がトイレの「中」であるはずのものが、トイレの「上」になってしまっています。完璧とは言えませんが、それでもロジックがあり、ずいぶん進歩したと思います。

もちろん、機械翻訳の進歩はプログラマーの努力があってこそです。私はプログラミングが分かりませんので、この先機械翻訳がどこまで進歩できるかは予測できません。現時点では完璧とは言いにくいものの、あくまで参考として利用することはできそうです。


f:id:simul2019:20231228180437j:plain
C.Q.

大学の専門は生物化学なので、卒業後、バイオテクノロジー関連の会社で研究員をしていたことがあります。日本語のドラマが好きで、仕事の後、日本語の勉強を始めました。その後、日系企業の通訳や翻訳会社のコーディネーターを経て在宅翻訳者に至ります。時間があれば、旅行や撮影を行っています。



【あわせて読みたい】中国語ホンヤクの奥深い世界を知りたい方へ

 

通訳者・翻訳者
として働くなら
サイマルへ

サイマル・グループでは、世界との交流を共に支える通訳者・翻訳者を募集しています。あなたのキャリア設計や就業スタイルにあった働き方で、充実したサポート体制のもと、さらなる可能性を広げてみませんか。