AIの隠れた文化侵略


Midjourneyで生成したイメージ。私は描画AI全てに反対しているわけではない。絵描きが自分に合ったブラシを選ぶように選べる外部サービスとして提供される描画AIは問題がないと思っている。そうではなく、誰もが日々使わざるを得ないインフラとしてのOSに個性の強い描画AIを搭載していることに反対しているのだ。Midjourneyも最初はアメリカンテイストの絵しか描けなかったが、その後、日本の独特の描画ニーズに合わせて日本市場専用の描画AIを開発。現在は自分テイストの絵が描けるパーソナリゼーション昨日に力を入れている。OS開発者もいずれはこの動きに追随すると思うが、大事なのはこれからどうなるかではなく、そもそもどれだけこうしたことに「敏感か」だ。


「道具が人間を作る(„Unser Schreibzeug arbeitet mit an unseren Gedanken.")」
『善悪の彼岸』(1886)/ニーチェ

多くの知識人がこれと同様のことを述べている。
マーシャル・マクルーハンの「われわれは道具を形作り、その後、道具がわれわれを形作る(We shape our tools, and thereafter our tools shape us.)」やバックミンスター・フラーの「われわれの道具はわれわれの思考を変える。(Our tools reshape our thinking.)」あたりが有名だ。
 それにも関わらず、今日の社会で最も影響力のある道具、パソコン、スマートフォン、そしてAIを開発している多くの人々は、そうした影響力についてあまりにも無頓着だ。
 今のテクノロジー製品の作り方を変えようと「CalmTech Institute」を創設したAmber Caseは、かつて私が行ったWiredの記事用のインタビューでこう語っている。
 「法律家は法律の歴史を学ぶし、建築家は長い時間をかけて建築の歴史を学びます。でも、プログラマーは往々にして、道具の歴史や人類学、デザイン、そして人々について1週間も学ばずにものをつくり始めるのです」
 自分たちが生み出したものが、後の世にどのような影響を与えるか十分に考慮せず、ただ経済的成功を求めて大勢の人々に影響を与えるものをつくる。その姿は18世紀半ばに汚染された空気を吸いながら工業化を推し進めてきた人々にどこか重なる。

文化的押し付けの問題

問題が特にわかりやすいのが、OS開発者などのプラットフォーマーが採用する描画AI機能の提供だ。AIの問題というと、プライバシー情報の搾取などが大事な情報を盗まれることへの懸念が大きいが、私は一方的に価値観を押し付けられることも問題だと思っている。
 主要OSメーカーのOS標準の画像生成AIツールの紹介ページ、アップル社のImage Playground、グーグル社のGemini、マイクロソフト社のMicrosoft Designerだ。過剰なまでの色の使い方、動物のリアルさを保ったまま可愛らしさを誇張する絵の表現など、彼らが非常に近くて似通った表現の振れ幅を持った人たち——私の私見で判断させてもらえればアメリカンテイストの絵柄を足場に、これらのツールを作っていることは明白だ。
 世界のクリエイティブプロフェッショナルの多くが使っているはずのアドビ社の生成AIブランド、Fireflyのページも同様だ。



左上からアップル社Image Playground、グーグル社Gemini、マイクロソフト社Design、アドビ社Fireflyの公式ホームページ

 「そんなものプロンプト次第でどうにでも変わるし大した問題ではない」という意見の人もいるだろう。確かにアップルのImage Playground以外はプロンプト次第では、もっとシンプルな線画だったり、リアルな白黒イメージだったり、日本テイストの絵だったりを描くこともできる。ChatGPTの描く絵と比べると、どこか安い偽物のような雰囲気があるがジブリ風の絵を描かせることもできる。
 問題はそこではなく、これらのプラットフォーマーがOS標準のAI機能による文化侵略の可能性について、非常に無頓着かつ無神経だということを、もっとも視覚的にわかりやすい方法で晒してしまったことだと思う。
 AIに使用した学習データーによってバイアスが仕組まれている危険性は、世界中の多くの研究者がずっと以前から指摘し続けてきた。東京大学ではソニーとの協力の下作ったCreative Futurists Instituteなどでは、まさにこの「Tech Bias」をテーマにした数多くの研究が行われている。
 しかし、世の中で最も大きな影響力が大きく、それ故、最もこうした問題に繊細でなければならないデジタル系プラットフォーマーが、最も目で見てわかりやすい形で、自らの製品の核にバイアスだらけの知能を搭載したことを晒してしまったのだ。
 もちろん、これから「もっと日本風の絵が描けるようにして欲しい」という要望が多く出てくれば、今後、そうした絵をたくさん学習させて、ユーザーの要望に応えることはできるだろう。だが、何かの技術を作る時、とりあえず先に作ってしまって、何かを指摘される度に、パッチワークを重ねて方向修正をするのはあまり賢いやり方ではない。
 少なくとも私は、既に提供されているAI技術を0リセットしない限り、常にそのAIの核にあるのは、あのアメリカ文化を押し売りしたAIだと、どこかで感じ続けることになるだろう。
 AS時代(After Steve)と言われる1998年以降のアップルの本来の強みは、多様性あふれるデザインチームが何かをやりすぎて製品に変な色がついていないかを常にチェックして、スティーブ・ジョブズが言うところの「1000のことに"No"という」姿勢で考えの足りないアイディアを却下して、常に無色透明で、少し物足りないと感じるくらいまでミニマルなモノづくりをしていたことだ。この足りなさこそが、文化的思想的背景の違いや年齢差、性差などを意識せず、誰もが使いたくなる秘密だった。
 これは日本の禅の考え方に近い。茶碗は空だからこそお茶を注ぐことができる。長谷川等伯の絵など、日本の有名な絵画は描かれていない空白の部分があるからこそ、見る人がそこを自分の想像で埋めて自分だけの絵画体験ができる。
 最初の音楽再生機能しかなかったiPodや、アプリのなかったiPhoneも足りないからこそ、そこに使い手の工夫が加わって自分だけの存在になった。
 実はApple IntelligenceのImage Playgroundにもアップルらしさがないわけではない。あまり最初から色々なことをさせずに描ける画風を3種類に限定したり、文章力で差がつくプロンプトで絵を描くのではなく単語やアイコンを選んで、絵を装飾する方法で、あらゆる人がプロンプトに悩まずに絵を描けるようにしたこと、つまりユーザーインターフェースのデザインはもっとポジティブな評価を受けて良いと思う。しかし、その上で描かれる絵のテイストが、あまりにも偏っていた。もっと、ミニマルで特色のない絵柄からスタートしていれば、かなりイメージが変わっていたのではないかと思う。
 最もあまりにも個性が強すぎる絵柄を採用したおかげか、ソーシャルメディアを見ていてもImage Playgroundで描いた絵を投稿している人はほとんど目にしない(見かけた絵はほとんどApple Intelligenceの紹介記事のために描かれたものだ)。ChatGPTで無料ユーザーでもジブリ風の絵が描ける時代に、あえて制限の大きいImage Playgroundで描いた絵を投稿する人はいない。
 だからと言って、問題がないわけではなく、私はアップルという影響力のあるプラットフォーマー、一番、ミニマルアプローチの大事さをわかっていて、それだけに期待が大きかったプラットフォーマーが、こうしたImage Playgroundを出してしまったことに対する残念さを隠すことができない。

テクノロジーが習慣と能力に与える影響

 日本の50代以上の人間は、道具やテクノロジーが私たちの習慣や能力に与える変化を実感として持っている。
 1万以上の種類がある漢字を扱う日本語圏には、欧文圏のタイプライターに相当する存在がない。1980年代以降、16ビットパソコンが出てきて、JIS漢字コードという規格が広まったことで初めて多くの一般人が自分の手で活字を印刷できるようになった。
 この時、専用のキーボードを作るのではなく、広く世界中に普及している欧文用のキーボードで日本語文字入力をする方法を発明したのが日本コンピューター業界におけるレジェンドである浮川夫妻(夫で経営者の浮川 和宣と妻でプログラマーの浮川初)。彼らが発明した日本語入力操作は、1981年の開発開始から44年経った今でも、Mac、Windows、タブレットなどに関係なくすべてのデジタル機器で標準になっている。



1970年代から変わらないパソコンでの日本語文字入力。日本人は英文の書かれたキーボードを使ってローマ字という表記法で日本語の音を入力する。するとその文字が即座に「かな」という表音文字になって表示される。文章を最後まで入力し終わったら、スペースバーを押して文中のかな文字を漢字に変換する。一発でのぞみの候補が出ない場合にはスペースバーを正しい候補が出るまで連打し続ける。正しい候補が出たらreturnキーを押して確定して、次の文節の変換に進む。こちらの画像はWilipediaのもので、Windowsの画面だがMacでも同じだ。

 1980年代以降、多くの日本人が初めて手書きではない文書を手軽に作れるようになった。これは素晴らしいことだが、実はこの技術が行き渡ると日本人の間に変化が起き始めた。
 パソコンやワープロ(日本では1980年代中頃から10年間ほど、タイプライターの代わりとしてワープロ以外の用途に使えないコンピューター機器、「ワープロ」が普及した)を使い慣れた人々の間で、「漢字の書き方がわからなくなる」という現象が多発した。
 書かれた漢字を読むことはできるし、パソコンやワープロ上で正しい漢字を選択することはできるが、いざ、ペンを持って紙に書こうとするとディテールが思い出せない。
 文化庁が2006年に実施した国語に関する世論調査では、ワープロや携帯電話を日常的に使う人々のうち「漢字の書き方を忘れることが多くなった」と感じている人が50.8%に上り、特に20代~40代でその傾向が強いことが報告。特に40代では約6割が「漢字を手で書けなくなった」と回答している。
 私も頻繁にこの現象を経験しており、書類などを手書きする必要がある時は、スマートフォンを手元に置いて文字入力をし、表示された文字を拡大してそれを写している。
 浮川夫妻は、日本のデジタル化に多大な貢献をして感謝される一方で、この問題を多くの人に指摘されていたようで現在はiPadを使って手書き文字入力を支援するMetaMojiという会社を営んでいる。



学生たちは自力で漢字を書くことを求められるが、多くの成人はあまり使わない漢字の書き方を忘れてしまっていてスマートフォンに頼らないとちゃんと書くことができない。50.8%の人が漢字の書き方を忘れていると指摘しているが、私もその一人だ。調べてみると同様の問題は中国語圏でも起きているが、こちらはさらに深刻で83%が漢字を書くことに困難を感じており「携帯やPCに頼りすぎて漢字が書けない」現象を指す「提筆忘字」という言葉まで生まれているようだ。(Adobe Stockより)

今後に向けて

 OSプラットフォームとAI機能の融合は、私を含め多くの人が指摘していたにも関わらず文化的配慮が足りない形で最初の一歩を踏み出してしまった。
 最もこれから始まる長いAIの歴史において、今はまだスタートラインでしかない。
 プラットフォーマー企業には、AIに関してプライバシーの取扱いに関する透明性開示ももちろんだが、それに加えて学習データからバイアスを取り除く努力についても情報を開示し、そうした努力について他の企業と情報を共有する姿勢を見せて欲しいと思う。

この記事は元々、私がMedium用に書いた英語記事の日本語訳です。

投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2025年05月08日 | Permalink