友だちにドヤ顔できる? AIを活用したGoogle翻訳の問題点
Google翻訳は、2016年11月からニューラル機械翻訳(NMT)を導入したことで、精度がかなり高まりました。
ニューラル機械翻訳(NMT)とは、ニューラルネットワークを利用した翻訳システムのことです。
今までの統計的機械翻訳(SMT)では、大量の対訳データを登録し、確率論や統計的手法を用いて訳を生成していました。
それに対して、Googleのニューラル機械翻訳(GNMT)では、大量のデータを計算することで、全体のニュアンスを重視し、自然な語順を生成し、流暢な訳を生成しております。しかも、データがどんどん集まり続けているので、翻訳の精度は上がり続けております。
では、Google翻訳に弱点はないのでしょうか?
実は、データのバイアス(偏り)の問題がGoogle翻訳にもあります。今から、それをお見せしますね。
Google翻訳のウェブサイトに行きます。
https://translate.google.com/
すると、以下のような画面が出ます。
次に、以下の画像のように、「テキストを入力」と書かれた部分に「He is a nurse. She is a doctor.」と入力します。
強調しておきますが、「彼は看護師です。彼女は医者です。」
女性の医者が男性の看護師に指示を出したりするとイメージして下さい。
次に、以下の画像の赤で印をつけた部分をタップします。
すると、以下の画面が出ますので、トルコ語を選択します。
すると、以下の画面が出ます。
それから、以下の画像の赤で印をつけた部分をタップします。
すると、あら不思議! 「She is a nurse. He is a doctor.」
つまり、彼が医者になって、彼女が看護師になっています。入れ替わっているのです。
Google翻訳でも、このようなことが起こっているのです。
一応、こんなことが起こる原因は、トルコ語では対象の人物の性別が区別されないからだといわれております。
こんなこと、誰に教えてもらったのかって? もちろん、グーグルのライバルのマイクロソフトの社員さんに決まってるじゃないですか(笑)💥💥
ちなみに、データのバイアス(偏り)を解決するのは困難で、あのAmazon.comでさえ、データのバイアス(偏り)が原因で、2018年10月10日にAI採用を打ち切ってしまいました😢
https://www.aisurvival.com/entry/advantages-and-disadvantages-of-companies-adopting-with-ai#4
僕は、多くの友人に、Google翻訳のデータのバイアス(偏り)を、ドヤ顔をしながら説明してきましたが、いつも面白がってもらえています🎉🎉
みなさんも、やってみて下さい!
今回の記事は以上になります。
最後までお付き合いいただき、ありがとうございますm(_ _)m