Googleで言葉の壁を越える

2008051116550000.jpg
mixiやfacebookなどのSNSでつながっている方はご存知かもしれないけれど、私は「言語オタク」。

いや、「オタク」って言われるほど本格的でもなければ、本腰をいれて何かをやっているわけではないが、新しい言葉を覚えることに普通の人よりは多くの喜びを感じるタチだと思う。

 当然、機械翻訳にも興味がある。'80年代から、日本で発売されているもの、発売されていないものも含めて、いろいろな機械翻訳ソフトの製品を見たり、取材をしてきた。
 nobilogでも、日本語と韓国語の機械翻訳の精度の高さにビックリして、こんな記事を書いたことがある:
韓国語チャットの日々

ただ、これまでの機械翻訳技術には限界を感じていたのも事実。
それだけにGoogle社が翻訳エンジンを、SYSTRAN社製から自社製に切り替えたときには期待に胸が高まった。
小川さんとの共著「アップルとグーグル」(*1)でも、書いたが、このGoogle 翻訳(Google Translate)がなかなか凄い。
これまでの翻訳エンジンのように、言語学的に文章を解析して翻訳する、というよりも、もっとWeb 2.0的な発想で、Web上に無尽蔵にある世界各国語テキストの対応付けを見て、そこから訳文を割り出している。

このため「俺たちに明日はない」を英訳すれば「Bonny and Clyde」と出てくるし「愛と哀しみの果て」は「Out of Africa」になる(ある程度、話題の映画であり、かつ特徴的なタイトルでないと、うまくいかないことも多い)。

 本を書いたときまで、Google 翻訳といえば、ポップアップメニューに「英語からフランス語」、「ドイツ語から英語」といった「どの言語からどの言語」の組み合わせが用意されており、その組み合わせの範囲内でしか翻訳ができなかった。
 そして他の多くの機械翻訳ソフトがそうであるように、日本語と対応付けされているのは、英語だけ。
つまり、「日英」や「英日」の翻訳はできても、「日仏」や「独日」、「日伊」といった翻訳は英語を介して行うしかなかった。

 ところが、これが先月だったか、先々月だったかに突然変わった(いつだったかな...やはり、ブログは「感動」した瞬間にこまめにつけないとダメだな。反省!でも、ホラ、こうやってつい文が長くなってしまうのがわかっているので、どうしても途切れてしまう。ネタフルのコグレさんやみたいもんのいしたにさんに「潔い脳」を特訓してもらわないと)。

 「翻訳元の言語」と「翻訳先の言語」が共にポップアップメニュー形式になって、23カ国語が選べるようになったのだ。

Safari002

 切り替わったときから「Googleなら、どの言語か自動的に検出することも可能なんじゃないの」と、思っていたんだけれど、今、見たら23カ国語の一番上に、ちゃんと「言語検出」という項目も加わっている!(いつからだろう。最初からあった?)
 おかげで、例えばこのnobilog2をクロアチア語に翻訳なんていうことも簡単にできる。

Safari006

 最近、最近ではブータンやらチベットでも、パソコンが使われ始めていて、これらの国内での実情をインターネットを通じて世界に発信している人々がいるという。
 私はそっち方面は興味はあるけれど、うとくてよく知らない。
 ただ、実はMac OS Xに、バージョンv 10.5 "Leopard"から、チベット語を扱う機能が追加されているという動きもある(チベット語は、パソコンで扱うのが非常に難しい言語をいわれていました。記事の最後に参考文献をあげますが、自分でも検索して調べてみてください)。
 パソコンとインターネット(Google)を通して、今、世界が大きく変わろうとしていることを感じ取ることができる。


 もっとも、こうしたブログ記事なら、先月でも十分、書くことができた(し、書こうと思っていた。他にもnobilog2に書きたい記事が10はある)。

 それでもあえて今日になって記事を書こうと思ったのは、もっと身近な理由からだ。
 昨日、取材の後、カメラマンの友人にカメラを見せたら、「レンズの内側に大きなゴミが入っているよ」と言われてしまった。
 これは新しいレンズを買うしかないと思って、ずっとamazonを探していた。
 カメラはあまり詳しくないので、とりあえず自分のカメラで使えそうなレンズで、自分でも買える手頃なものを「ほしいものリスト」に加えたり、「新しいタブ」で開いたりして比べていた。
 Amazonにあげてあるスペックだけでは、どのくらいきれいに撮れるのかがわからないので、製品名をコピーして、さらにGoogle検索をかける。
 でも、日本語検索だと、販売ページばかりが上位にひっかかって、なかなかレビュー記事が見つからない。

 そんな時、検索結果のページを一番下までスクロールしてみると、こんな文言が表示されていることに気がついた。
英語のページの検索結果を日本語に翻訳して見る: シグマ 70-300mm F4-5.6 DG MACRO キヤノン用 (Sigma 70-300mm F4-5.6 DG MACRO for Canon)

Safari003

なんだろうと、思ってクリックをしてみると、同じ製品をレビューした英語の記事の検索結果が次々と出てくるではないか!
 私の場合、英語なら問題なく読めるので、翻訳記事に頼る必要はなかったが、それにしても日本語で検索して英語の翻訳記事がでてくるのはうれしい。
(でも、これってこのフォーマットではなかったけれど、もしかしたら、これまでの検索でも、普通に検索結果としてひっかかっていたかも知れない。そもそもGoogleは、アナウンスなしに、いつのまにか搭載されている機能も多く、フォローしていくのが大変だ。ただ、私に、以下の「気づき」を与えてくれたという意味を含めて、そのことは無視して書き続ける)。

Safari004
Safari005


 別に売っているのは同じものだし、日本語のレビュー記事がなければ、英語の記事を読めばそれですむこと。かくして私の問題は解決。

 私の頭のどこかに「日本で買うので、日本語の記事を探さなければならない」という発想があった(それに加えて、カメラに詳しくないので、このレンズが海外でも売っているものか知らなかったというのもある)。
 その発想の壁をGoogleが超えてくれた瞬間だ。

 この逆で、海外の人が、日本ならではの素晴らしい記事にめぐりあうチャンスがあるかどうかは、まだ確認できていない。
 しかし、Googleは、もちろん、それも視野にいれて開発を進めていることだろう。
 この機能が、いったいいつ頃から実装されているのかは知らないが、いい記事を、国境も言語の壁も乗り越えて広めてくれる素晴らしい機能だ。

 検索が言葉の壁を越える、そんな日も遠くないのかもしれない。

 このプロジェクト、Google社内の誰が研究している技術か知らないが、言語オタクとしてはぜひ応援していきたい!


参考文献:
機織り機からパソコンへの道
チベット語 情報化時代の伝承と発展
特徴:ユニコード準拠の互換性で、すべての環境でチベット語データを。
■Leopardに含まれるチベット語入力法Tibetan-Otani


*1)以前は自著のアフィリエイトの売り上げは貼らないことにしていたけれど、最近、方針を変えて、アフィリエイトを貼るかわりに収入は寄付することにしました。年末にお気に入りのNGOに寄付しようと思ったけれど、4月&5月分は、月単位で、まるまる四川大地震に寄付しようかと思っています(サイクロンにするか悩ましいけど)。もっとも、ブログ更新頻度も低いし、あまりアフィリエイトを貼らないようにしていたので、4月分で495円と、ほんと大したことないけど...(これに自分の気持ちを色づけするくらいかな)。AmazonのAPI公開とかで、自動的に振り込んでくれるとうれしいよなぁ...

投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2008年05月28日 | Permalink