こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

解決済みの質問

韓国語⇔日本語の機械翻訳の精度が高い理由

韓国語には、日本語由来の漢字語が多いというのは聞いたことがあるのですが、漢字ではなくハングル表記の文でも、非常に精確な翻訳が可能です。同音異義語が多い韓国語で、表音文字のハングルのみを用いているにもかかわらず、このように精度の高い翻訳が可能なアルゴリズムは一体どうなっているのでしょうか?

例:上記の文をGoogle翻訳にかけてみます。
「한국어는 일본어 유래의 한자어가 많다는 것은 들어 본 적이 있는데 한자가 아닌 한글 표기 문장에서도 매우 정확한 번역이 가능합니다. 동음 이의어가 많은 한국어로 표음 문자 한글만을 사용하고 있음에도 불구하고, 이와 같이 정확한 번역이 가능한 알고리즘은 도대체 어떻게되어있는 것입니까?」

これを再びGoogle翻訳で日本語に戻します。驚異的な再現率です。
「韓国語は日本語由来の漢字語が多いということは聞いたことがあるが漢字ではなくハングル表記の文でも、非常に正確な翻訳が可能です。同音異義語が多い韓国語で表音文字ハングルのみを使用しているにもかかわらず、このように正確な翻訳が可能なアルゴリズムは、一体どうなっているのでしょうか?」

英語でやってみます。(戻した日本語のみ)
「派生韓国語、日本語の漢字語は頻繁に私が聞いたことがあるということですが、ハングル表記のステートメントは、非常に正確な翻訳ではなく、漢字可能である。高精度な変換アルゴリズムは、これが可能であるかのように韓国のことが多い同音異義語では、唯一のハングル表音文字を使っているという事実にもかかわらず、私は地球上だったでしょう?」

同じ漢字を使う中国語(繁体字)でやってみます。
「中国語、日本語、韓国語語源の自己はしばしば聞いたが、韓国代表の声明、非常に正確な翻訳ではなく、中国語のテキストよりも、可能です。精度の高い翻訳アルゴリズムは、それが可能であれば韓国ではしばしば同音異義語は、唯一の韓国語のアルファベット文字という事実にもかかわらず、私は地球上だったでしょうか?」

一体全体どうなってるんでしょうか?!

投稿日時 - 2013-08-18 03:55:10

QNo.8224437

すぐに回答ほしいです

質問者が選んだベストアンサー

 現在の韓国・北朝鮮成立以前が重要ですから、この回答では朝鮮語と呼ぶことにします。

 日本語も朝鮮語も、アルタイ諸語に属していて、文法がよく似ています。主語がなくてもよく、述語があればいいという点などは、非常に似ています。

 アルタイ諸語同士の中でも、近い親戚みたいに近いとする説もあり、実は日本語と朝鮮語は同じ系列にあったのではないかと考える人もいるようです。

 ただ、相互に借用ではない共通の語彙はあまりないようです。それでも、渡来人として日本に定住・帰化する朝鮮半島人は古代から多くいました。日本人も積極的に半島に進出した経緯もあります。

 日本が中国と交流するときも、朝鮮半島を介してのことが多かったようです。

 近世では、それがいいか悪いかは別議論なので置いておくとして、日韓併合以降、日本の第二次大戦敗戦までは、非常に密接な交流になったことも、語彙の点では大きく影響したことは疑いありません。そのためか、手話はもっと似ているそうです(そのためか、日本語手話、朝鮮語手話とも、母国の通常の口語文法とは乖離している面がある)。

 これらは相互交流になりますから、言語も互いに影響します。中国と付き合う立場、態度も共通の面が強いですから、中国語との通訳・翻訳作業なども多くあり、その面でも協力が多かったのです。そして、共通語として漢文を使うこともしばしばでしたから(筆談は中国語で行われることが多かった等々)、やはり互いに影響します。

 一方、中国は大国であり、古代から近世まで、中華と称して周辺諸国に君臨し続けました。当然ですが、周辺諸国には自分から合わせていくのではなく、周辺諸国を自分に合わさせました。ただ、漢字は輸出して使わせても、周辺諸国が国内で漢字をどう使用するかは、特に要求はせず、周辺諸国の自由に任せています。

 こういう一方通行では、こちらとして文字・単語の借用はあっても、文法が相互に似てくるといったことは起こりにくく、全体として似てこない結果となります。

 文法は機械翻訳では非常に重要です。中国語は日本語の影響が少ないために似ておらず、英語(を含む印欧語)になると、ほとんど接点すらありませんでした。これでは文法が似てくるわけがありません。事実、全く異なります。

 そのため、翻訳は文の意図を文脈も踏まえてイメージでとらえて、イメージに従って全く異なる文章を書き起こす感じになります。機械翻訳はこういうことは未だに非常に苦手としています。そのため、相互に機械翻訳の品質は悪くなります。

 このことは、英語を含むヨーロッパ語では機械翻訳の精度が良いということにも表れています。英語が分かれば、他のヨーロッパ語は英語に翻訳すると誤訳の少ない翻訳となり、英語で正確に言えれば、それは意味を違えずに他のヨーロッパ語に機械翻訳できます。

 これは、ヨーロッパ語(もっと広くは印欧語)が相互に密接に影響しあいながら発達したためです。密接に影響したので、文法だけでなく単語もかなり共通性、類似性があります。そうなると機械翻訳は威力を発揮します。

投稿日時 - 2013-08-18 05:40:13

お礼

歴史的経緯や各国の文化受容の姿勢にまで言及した含蓄と示唆に富むお答えに感銘を受けました。
機械翻訳のアルゴリズムについては、日本語→英語のように、文章構造を変換しなくても、日本語→韓国語は、単に逐語訳をしていけば自然と同じ表現になるので再変換しても再現率が高いということなのでしょうね。もちろん、語彙の類似も貢献しているのだと思いますが。
ご回答有難うございました。

投稿日時 - 2013-08-19 00:10:14

このQ&Aは役に立ちましたか?

1人が「このQ&Aが役に立った」と投票しています

回答(2)

ANo.1

私の第二の言語ポルトガル語でやってみました。

単語は日本の私がよく聞くの漢字が、表現のハングルの文を導出され、翻訳ではなく、漢字の、可能な限り非常に正確です。同名しばしば朝鮮人で、それが可能であるように高精度で変換アルゴリズムならば、唯一の音声ハングル文字を使用したという事実にもかかわらず、私は地球上だったでしょう?...

かなりひどい翻訳です。ポルトガル語からスペイン語はかなり正確にできます。似ているからだと思います。日本語と韓国語は文章構造が似ているからでしょう。それとたぶん情報量が多いのでかなり正確にできるようになっているのだろうと思います。
たとえば日本語から英語はおかしいことはおかしいけど、情報量が多いので日本語からポルトガル語よりかなりマシなのだろうと思います。

投稿日時 - 2013-08-18 05:14:26

お礼

やはり文章構造が似ているからというのが大きいのでしょうね。ただ、最近の若者がフランクな言葉で書き込む掲示板などはめちゃくちゃな翻訳にしか見えなかったりするのが残念です。ありがとうございました。

投稿日時 - 2013-08-19 00:05:14

あなたにオススメの質問