AIの隠れた文化侵略


Midjourneyで生成したイメージ。私は描画AI全てに反対しているわけではない。絵描きが自分に合ったブラシを選ぶように選べる外部サービスとして提供される描画AIは問題がないと思っている。そうではなく、誰もが日々使わざるを得ないインフラとしてのOSに個性の強い描画AIを搭載していることに反対しているのだ。Midjourneyも最初はアメリカンテイストの絵しか描けなかったが、その後、日本の独特の描画ニーズに合わせて日本市場専用の描画AIを開発。現在は自分テイストの絵が描けるパーソナリゼーション昨日に力を入れている。OS開発者もいずれはこの動きに追随すると思うが、大事なのはこれからどうなるかではなく、そもそもどれだけこうしたことに「敏感か」だ。


「道具が人間を作る(„Unser Schreibzeug arbeitet mit an unseren Gedanken.")」
『善悪の彼岸』(1886)/ニーチェ

多くの知識人がこれと同様のことを述べている。
マーシャル・マクルーハンの「われわれは道具を形作り、その後、道具がわれわれを形作る(We shape our tools, and thereafter our tools shape us.)」やバックミンスター・フラーの「われわれの道具はわれわれの思考を変える。(Our tools reshape our thinking.)」あたりが有名だ。
 それにも関わらず、今日の社会で最も影響力のある道具、パソコン、スマートフォン、そしてAIを開発している多くの人々は、そうした影響力についてあまりにも無頓着だ。
 今のテクノロジー製品の作り方を変えようと「CalmTech Institute」を創設したAmber Caseは、かつて私が行ったWiredの記事用のインタビューでこう語っている。
 「法律家は法律の歴史を学ぶし、建築家は長い時間をかけて建築の歴史を学びます。でも、プログラマーは往々にして、道具の歴史や人類学、デザイン、そして人々について1週間も学ばずにものをつくり始めるのです」
 自分たちが生み出したものが、後の世にどのような影響を与えるか十分に考慮せず、ただ経済的成功を求めて大勢の人々に影響を与えるものをつくる。その姿は18世紀半ばに汚染された空気を吸いながら工業化を推し進めてきた人々にどこか重なる。

文化的押し付けの問題

問題が特にわかりやすいのが、OS開発者などのプラットフォーマーが採用する描画AI機能の提供だ。AIの問題というと、プライバシー情報の搾取などが大事な情報を盗まれることへの懸念が大きいが、私は一方的に価値観を押し付けられることも問題だと思っている。
 主要OSメーカーのOS標準の画像生成AIツールの紹介ページ、アップル社のImage Playground、グーグル社のGemini、マイクロソフト社のMicrosoft Designerだ。過剰なまでの色の使い方、動物のリアルさを保ったまま可愛らしさを誇張する絵の表現など、彼らが非常に近くて似通った表現の振れ幅を持った人たち——私の私見で判断させてもらえればアメリカンテイストの絵柄を足場に、これらのツールを作っていることは明白だ。
 世界のクリエイティブプロフェッショナルの多くが使っているはずのアドビ社の生成AIブランド、Fireflyのページも同様だ。



左上からアップル社Image Playground、グーグル社Gemini、マイクロソフト社Design、アドビ社Fireflyの公式ホームページ

 「そんなものプロンプト次第でどうにでも変わるし大した問題ではない」という意見の人もいるだろう。確かにアップルのImage Playground以外はプロンプト次第では、もっとシンプルな線画だったり、リアルな白黒イメージだったり、日本テイストの絵だったりを描くこともできる。ChatGPTの描く絵と比べると、どこか安い偽物のような雰囲気があるがジブリ風の絵を描かせることもできる。
 問題はそこではなく、これらのプラットフォーマーがOS標準のAI機能による文化侵略の可能性について、非常に無頓着かつ無神経だということを、もっとも視覚的にわかりやすい方法で晒してしまったことだと思う。
 AIに使用した学習データーによってバイアスが仕組まれている危険性は、世界中の多くの研究者がずっと以前から指摘し続けてきた。東京大学ではソニーとの協力の下作ったCreative Futurists Instituteなどでは、まさにこの「Tech Bias」をテーマにした数多くの研究が行われている。
 しかし、今の世の中で最も影響力が大きく、それ故、最もこうした問題に繊細でなければならないデジタル系プラットフォーマーが、最も目で見てわかりやすい形で、自らの製品の核にバイアスだらけの知能を搭載したことを晒してしまったのだ。
 もちろん、これから「もっと日本風の絵が描けるようにして欲しい」という要望が多く出てくれば、今後、そうした絵をたくさん学習させて、ユーザーの要望に応えることはできるだろう。だが、何かの技術を作る時、とりあえず先に作ってしまって、何かを指摘される度に、パッチワークを重ねて方向修正をするのはあまり賢いやり方ではない。
 少なくとも私は、既に提供されているAI技術を0リセットしない限り、常にそのAIの核にあるのは、あのアメリカ文化を押し売りしたAIだと、どこかで感じ続けることになるだろう。
 AS時代(After Steve)と言われる1998年以降のアップルの本来の強みは、多様性あふれるデザインチームが何かをやりすぎて製品に変な色がついていないかを常にチェックして、スティーブ・ジョブズが言うところの「1000のことに"No"という」姿勢で考えの足りないアイディアを却下して、常に無色透明で、少し物足りないと感じるくらいまでミニマルなモノづくりをしていたことだ。この足りなさこそが、文化的思想的背景の違いや年齢差、性差などを意識せず、誰もが使いたくなる秘密だった。
 これは日本の禅の考え方に近い。茶碗は空だからこそお茶を注ぐことができる。長谷川等伯の絵など、日本の有名な絵画は描かれていない空白の部分があるからこそ、見る人がそこを自分の想像で埋めて自分だけの絵画体験ができる。
 最初の音楽再生機能しかなかったiPodや、アプリのなかったiPhoneも足りないからこそ、そこに使い手の工夫が加わって自分だけの存在になった。
 実はApple IntelligenceのImage Playgroundにもアップルらしさがないわけではない。あまり最初から色々なことをさせずに描ける画風を3種類に限定したり、文章力で差がつくプロンプトで絵を描くのではなく単語やアイコンを選んで、絵を装飾する方法で、あらゆる人がプロンプトに悩まずに絵を描けるようにしたこと、つまりユーザーインターフェースのデザインはもっとポジティブな評価を受けて良いと思う。しかし、その上で描かれる絵のテイストが、あまりにも偏っていた。もっと、ミニマルで特色のない絵柄からスタートしていれば、かなりイメージが変わっていたのではないかと思う。
 最もあまりにも個性が強すぎる絵柄を採用したおかげか、ソーシャルメディアを見ていてもImage Playgroundで描いた絵を投稿している人はほとんど目にしない(見かけた絵はほとんどApple Intelligenceの紹介記事のために描かれたものだ)。ChatGPTで無料ユーザーでもジブリ風の絵が描ける時代に、あえて制限の大きいImage Playgroundで描いた絵を投稿する人はいない。
 だからと言って、問題がないわけではなく、私はアップルという影響力のあるプラットフォーマー、一番、ミニマルアプローチの大事さをわかっていて、それだけに期待が大きかったプラットフォーマーが、こうしたImage Playgroundを出してしまったことに対する残念さを隠すことができない。

テクノロジーが習慣と能力に与える影響


投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2025年05月08日 | Permalink

COVID-19からの学び2:更新されつづける情報とその残響


混乱を大きくした情報の残響


「新型コロナにはイブプロフェンが効く」、「英国でかえって症状を悪化させたと話題になっている」、「英国での改めて効果を検証中(2020/6/4時点)」。「マスクは無意味」、「一定の効果はある」、「マスクは必須」。
 コロナ禍、あらゆる情報が激しく揺れ動いた。
 
 そもそもこれが深刻な感染症のかの議論から始まり、感染率の高低、どうやってうつるのか(飛沫感染はあるのか)、どういう症状か、どんな薬が効くのか、どれくらい感染者がいるのか、どう対処したら良いのかなどなど、この数ヶ月間さまざまな重要情報が毎日のように大量に出てきては、早い場合は1日も経たないうちに覆った。
 (私も含め)最初は主張の一貫性を重視していた人達も、しばらくすると「知識が常に更新されつづけるのがサイエンス」と考えを改め、前言に固執するよりも最新の情報に基づいて柔軟に考えを変えつづける方が大事だと変容していった。
 そんな情報の乱流の中、混乱をひどくしていたのがソーシャルメディアだった。
 あきらかな悪意を伴ったデマや根拠のない断定口調という文字コミュニケーションに起因する問題もあるが、今のソーシャルメディアの仕様や使われ方にも問題点があり、これは正せる可能性がある。
 私が最大の問題と感じている問題に「残響情報」という名前をつけさせてもらった。
 皆さんは1日にソーシャルメディアを見ていて、何度、同じ情報を目にするかを思い返して欲しい。
 何かの事件が起きて、それがツイッターに流れる。例えばGeorge Floydさんの殺害事件などを例に挙げると、私はそもそものきっかけとなっていた動画のツイートを英語圏の友達のリツイート(再配信)で見ていた(あまりにショッキングだったのでリツイートできなかった)。
 その後、この事件はすぐに、CNNだ、APだ、Reuterだ、BBCだと、さまさまざまなニュースで取り上げられ、それらのツイッターアカウントからも情報が発信される。すると、次にそのニュースを見た人たちが、ニュースを拡散し始める。ただ公式RTをする人もいれば、ひとこと添えてリツイートを行う人もいる。さらにそれを見た人と第2波、第3波が重なってゆく。
 これだけでも同じ情報が何重にも重なって繰り返されるには十分だが、これで終わりではない。
 もう少し時間が経つと、さきほどのニュースメディアの人たちが、さきほどのツイートを見逃した人たちのために、一度ツイート済みの情報を繰り返しツイートを行う。ツイッター慣れをしていない人は違和感を感じるかも知れないが、つ1日中ツイッターを見ている人はいない。朝の通勤電車で見る人、ランチ中に見る人、夜しか見ない人もいるため、時間をずらして同じツイートを行うと、異なる層の人たちから大きな反響がくる。世界中で話されている英語でのツイートとなれば、時差の観点からも、これが重要になる。
 こうやって1つのニュースが、何百何千種類の記事になって、長い時では1週間くらいTwitterの上を還流し続けている。
 時間をおいて、再発信する行為そのものを否定するつもりはない。そもそも自分でもやっているので否定できる立場にない。
 だが、平常時なら許容できるこうした情報の流れが、緊急時には実害を伴う。
 例えばCOVID-19への対処方法に関するニュースが数日間還流している最中に、その情報が間違いで逆効果であるニュースが発せられたとする。
 メディア企業は新事実が発覚したと同時にそれを伝え、以後、古い記事を改めてツイートすることは避けるだろうし、ちゃんと古い記事には訂正を入れる。
 だが、読者となるとそうはいかない。ほとんどの人は、ニュースの日付なんか確認せず、ただ価値がある/面白いと思ったら拡散をしてしまう。こうして、いつまでも古い情報が環流を続ける。



デジタルツールの主流は情報堆積型


TwitterやFacebookなどのソーシャルメディアの投稿は削除ができないわけではないが、それをする人はほとんどおらず、基本的に次々と新しい投稿が追加される一方だ。
 ただ、あまりにもたくさんん新しい情報が追加され続けるるから、古い情報は遡れなくなって、どこかへと流れていってしまう。名付けてストリーム(川の流れ)型メディアとも呼ばれる(だからこそ、時差投稿が意味を持つ)。ストリームと書くと軽やかなイメージがあるが、見方を変えれば情報が堆積しつづけるメディアともいえる。
 東日本大震災後、IT技術が災害時にどう役だったか(あるいは役立たなかったか)、グーグルの依頼で山路さんと調査した(東日本大震災と情報、インターネット、Google)。この時もデマの対処法としてたどり着いた結論は、「デマの拡散量にまけないくらいたくさん正しい情報を流す」で、結局は情報をさらに増やす方向のものだった。

 だが、新聞や雑誌など紙媒体ではこうはいかない。1ページ辺りの文字量も、全体のページ数も決まっていて、デスクと呼ばれる人が、限られた紙幅でどの情報を載せるか常に取捨選択をしている。
 だから、情報の受け手は、膨大すぎる情報に押し潰されることなく、決まった読書量に凝縮された美味しいところどりの情報を得られる。
 これに対してインターネットの情報は、記事1つの長さも、1日にどれだけの量の記事を提供するかも制限がない。食べ終わっても、おかわりがで続けるわんこそばのようなものだ。
 人には1日24時間という時間の制約もあれば、次の食事を取るまでに活動できる量、1日に吸収できる情報の量といったもののキャパシティーが決まっている。デジタル情報はそうした身体性を無視して、ホワイトホール(ブラックホールの逆の存在)のように情報を出し続ける。
 Twitterは、そこに1投稿140文字の制限を設けて、情報を飲み込みやすくした。たが、1日に投稿できる数の制限はないのでホワイトホール感に変わりはない。
 気がつけばニュースサイト、ソーシャルメディア、メッセンジャーソフト、電子メール、どのデジタル情報ツールも永遠に終わりがやってこない巻き物のような構造あるいは閉まることのない蛇口から永遠に情報を浴びせられつづける構造だ。われわれはそこでおぼれ続けるしか道はないのか?



情報をまとめなおすというWikiのアプローチ


よく見渡すと、ストリーム型(情報堆積型)とは異なるアプローチのサービスが既に存在している。Wiki(ウィキ)という仕組みだ。
 知っている人は少ないかもしれないが、このWikiでつくられたWikipedia(ウィキペディア)なら知っているという人が多いだろう。
 Wikipediaは、どこかの出版社が無償提供している電子辞典サービスではなく、Wikiというインターネット上のワープロのような仕組みを使って、何万人もの人が言葉の定義を共同作業で編集してつくられている。善意の塊による辞典だ。
 面白いのは、既にあったWikipedia上の定義があとで間違いだとわかると、気がついた人が、既に書かれていた他の誰かがせっかく書いてくれた内容をバッサリ削除して、書き直す。
 ただ、ここがデジタルの素晴らしいところで、実はどの文章が削除され、どう書き換えられたかはちゃんと履歴が残っていて、いつでも古い状態に戻すこともできるのだ。
 だから、勘違いをしている人が書き直しをしてしまっても、ちゃんと前の元の状態に戻せる(勘違いした人がどうな書き換え、再訂正されたかの履歴も残る)。
 情報を延々と追加しつづけるのではなく、「まとめなおせる」というのがストリーム型メディアとの違いで、1つの文章を100人が編集したからと言って100人分の情報をつきつけられるのではなく、あくまでも目にする情報の量は見た目上は増えない(その代わりにすぐには見えない履歴は増え続ける)としたのがWikiの画期的なところだ。
 ストリーム型メディアのように1+1=2と情報が積み重なるのではなく、1+1=betterな1という感じで、情報の量を増やさず質だけを高めることができる。
 メッセージアプリ(やメール)での議論なども、誰かがWikiで決定事項をメモしていれば、途中から参加した人も、やりとりを冒頭からすべて読み直すのではなく、wikiで決定事項のまとめを見て、いきなり議論に参加することができる。
 残念ながらWikiはたくさん種類があるが、どれも操作方法が難しく、なかなかとっつきにくいという問題がある。
 だが、今ではMicrosoft WordやApple社のPagesなど多くのワープロソフトや、るGoogleドキュメントのクラウド版ワープロも同様の編集履歴の記録を備えており、これらをWiki的に活用することもできるはずだ。



新しい情報サービスへの期待


投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2020年06月05日 | Permalink

iPad発売の裏で、またまたUstreamの衝撃


<embed flashvars="loc=%2F&amp;autoplay=false&amp;vid=5935275&amp;hid=62382&amp;disabledComment=true&amp;beginPercent=0.6321&amp;endPercent=0.6861" width="480" height="386" allowfullscreen="true" allowscriptaccess="always" id="utv706641" name="utv_n_756118" src="http://www.ustream.tv/flash/video/5935275" type="application/x-shockwave-flash">

投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2010年04月04日 | Permalink

Ustreamの衝撃、ふたたび...

最近、つくづく思うのが、この1、2年で、一気に未来がやってきた、ということ。
流線型の宙に浮く車も、ホームヘルパーのロボットも現実にはなっていないけれど、
iPhoneやTwitter、Ustreamが、人々の日常を大きく変え始めている。

社会のこれまでの常識や、人々の暮らしぶりが、大きく変わり始めているのだ。

今日、私はたまたま2つの日本Ustream史に残る事件を目の当たりにした。
私と一緒に、同じ放送から同じ放送へと、移っていった人々は歴史の生き証人になったんじゃないか。

もう、深夜2:30AMなので、かいつまんで紹介しよう。


投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2010年03月14日 | Permalink

YouTube新サービスから考える「点と線」

iPadのインターフェースの凄さにもう1度、ビックリしようと思ってYouTubeを開いたら、別のことにビックリした。

iPadの動画の「再生バー」にCCと表示される。
ここでいうCCは「Creative Commons」ではなく、「Closed Caption(クローズドキャプション)」のこと。

最初はアップルがiPadをユニバーサルな製品と捉えて、CCをつけたのかと思っていたが、クリックしてみてビックリ。こんなメニューが表示された。


なんと、YouTubeが音声を認識して字幕に変換するサービスと、字幕をさらに翻訳して表示するサービスの実験を始めたようだ。
選んでみると、すぐさま、こんなダイアログが表示され、1分も経たないうちに字幕の表示が始まった。


投稿者名 Nobuyuki Hayashi 林信行 投稿日時 2010年03月09日 | Permalink