そして、いま最も話題になっているのが、米オープンAIが2022年11月に公開した対話AIの「ChatGPT」です。人間が質問を投げかけると、非常に巧みな文章を返してくるので、瞬く間に何百万人もの人が使うようになり、2023年1月にはユーザー数が1億人を突破しています(*3)。ですが、ChatGPTが生成した文章には真偽不明のことや、もっともらしいけれど事実ではないことが紛れ込んでいることがあって、賛否両論が巻き起こっています。

 たとえば、「AI倫理について企業が留意すべき点は何か」と問いかけると、ポリシーやガイドラインの策定から、ガバナンス体制の構築、社員のトレーニングまで必要なことをきちんと列挙して回答してくれます。でも、専門家でないとすべて正しいことかどうか、判断は難しい。

 私が、「松下幸之助について教えて」と質問した時は、実業家としての松下さんの経歴や数々の業績を並べた後に、「第○代の総理大臣でもあります」としれっと嘘を紛れ込ませていました。そういうことがあるので、ニューヨーク市教育局が市立学校でのChatGPTの利用を禁止するなど、教育分野で規制の動きが出ています(*4)。

 個人的には、正解のない課題設定についてアイデアを練る際などいい壁打ちの相手になると思いますが、生成系AIに対する社会の反応をどうご覧になっていますか。

柿沼 大きくは2つの反応があるのかなと思っていまして、一つは人間の権利を侵害しているんじゃないかという反応です。生成系AI用の学習済みモデルをつくる際には、インターネット上の画像やテキストデータを大量に学習していますから、そこで著作権などの権利が侵害されているのではないかという懸念や拒否反応ですね。

 もう一つは、そういうツールがどんどん出てくると、権利侵害うんぬんとは別に、自分の仕事が奪われるのではないかという不安です。この2つの感情がない交ぜになり、さらに拒否反応は強くなっているように感じます。

柿沼太一TAICHI KAKINUMA
弁護士
STORIA法律事務所

生成モデルによってAIは違うステージに入った

柿沼 生成系AIが生み出すコンテンツの著作権問題を考える際には、まず基本的なことでいいので技術的なことを知っておく必要があります。画像に絞って言うと、クリエーター側には、生成系AIは既存の著作物を使ったコラージュをつくっている、つまり、人がつくったものをつぎはぎしているだけだと主張する人がいます。それに対して、技術者側からすると、コラージュとは元の著作物がどんなものかがわかる、痕跡が残っているものをそう呼ぶのであって、生成系AIがつくったものはそれに該当しないと主張されます。たしかに学習用データとしては人の著作物を使っていますが、その結果でき上がった学習済みモデルの中に学習用データの痕跡が残っていることは通常はありません。その点を知っているか知らないかで、だいぶん違うのではないかと思います。

 その違いは大きいですね。生成系AIもディープラーニング(深層学習)技術を使っていますが、ディープラーニングは層構造が大量にあって、画像生成モデルで言えばその大量にある層構造の中で、テクスチャーとか雰囲気、スタイルといった抽象的なことを学習させていくこともできれば、画像のパーツを学習させることもできる。そのように全体としての画像を学習しているので、本当は人間の脳の学習構造に近い。

柿沼 そうですね。ディープラーニングとか、生成系AIで使われている拡散モデル(Diffusion Model)の原理を知っていれば、単なるコラージュでないことはすぐに理解できるのですが、AIが生成した画像だけを見てそれを理解するのは難しい。誰もが生成系AIの原理を知るべきだといってもそれは難しいでしょうから、そこは別の議論が必要かもしれません。

 ちなみに、拡散モデルは、画像認識でよく使われるディープラーニングの手法であるConvolutional Neural Net(CNN:たたみ込みニューラルネットワーク)や初期の画像生成モデルのGenerative Adversarial Network (GAN:敵対的生成ネットワーク)とは違ったものです。そのあたりも一般の人が理解するのはなかなか難しいですね。

柿沼 学習データである画像からエッセンスを抜き出して、それを大量に記憶しておいて、そこから指示内容に沿った絵を抜き出して、あるいは組み合わせて使っているんじゃないかというのが、一般の人たちのイメージだと思いますが、技術的にはまったく違うことをやっています。ただ、それを含めて社会がどう受け入れるのかという問題だと思います。

 AIに対する一般的なイメージは、決まったルールに従って自動化するとか、高速に計算するといったことだと思いますが、ディープラーニング以後のAI技術はまったく違います。決まり切ったことよりも、むしろクリエーティブなことのほうに有効に働く。生成系AIによって、そのことに多くの人たちが気づき始めたのがいまのステージだと思います。

柿沼 同じAIでも、画像認識と画像生成では人々の反応がまったく違います。大量の画像の中からAIが猫を認識したといっても、「あ、そうなんだ」という程度の反応でしたが、人間しかできないと思っていた創作がAIにもできるようになったとわかったインパクトはものすごく大きい。そういう意味でも、生成モデルによってAIは違うステージに入ったといって過言ではないでしょう。