リスクを軽減し、前進への道を築くには
この新しいパラダイムが意味するのは、企業は短期的にも長期的にも、自社を守るための新たな対策を講じる必要があるということだ。
AI開発者はモデルの訓練に使うデータの取得に関して、法律の遵守を徹底すべきである。その一環として、個人が所有する知的財産を訓練データに加えたい場合は、その個人に対し、ライセンスの契約やAIツールから生じた収益の分配などを通じて補償を行う必要がある。
AIツールの顧客は、提供者に対し、モデルの訓練データには保護されたコンテンツが含まれているか否かを問い質し、サービス利用規約とプライバシーポリシーを確認すべきだ。訓練データはコンテンツ制作者から適切にライセンスを供与されていること、またはAI企業が遵守するオープンソースのライセンスの対象であることを確認できない生成AIツールは、避ける必要がある。
開発者
長期的には、AI開発者はデータ調達のあり方に関してイニシアティブを取り、投資家はデータの出所を知っておく必要がある。
画像生成AIのステーブル・ディフュージョンやミッドジャーニーなどは、LAION-5Bのデータセットに基づいて構築されている。LAION-5Bは、大規模言語モデルに使用されているデータセットと同様、インターネット上で利用可能な情報を、ロボットを利用して収集し生成したデータセットである。ここにはウェブから無差別に抽出して集められた約60億のタグ付き画像があり、著作権のある創作物が多数含まれることが知られている。
ステーブル・ディフュージョンを開発したスタビリティAIは、同ツールの次期バージョンからアーティストは訓練データから自分の作品を除外するという選択(オプトアウト)が可能になると発表した。
だがこれは、使用前に知的財産を保護するようAI開発者に義務づけるのではなく、コンテンツ制作者に自分の知的財産を積極的に保護する責任を負わせるものである。そしてアーティストがたとえオプトアウトしても、その決定は次期バージョンのプラットフォームでしか反映されない。
企業は制作者のオプトアウトではなく、オプトインを求めるべきである。
開発者はさらに、AI生成コンテンツの来歴を保存することで、訓練データに含まれる作品の透明性を高める方法を検討しなくてはならない。
たとえば、コンテンツの制作に使われたプラットフォームや、使用された設定の詳細を記録し、初期データのメタデータを追跡する必要がある。AIからの報告を促進するために、生成に使われた元データや、制作に使われた具体的なプロンプトにタグをつけるなどの方法もある。
このような情報は、画像の真正性の証明を容易にして複製を可能にするのみならず、ユーザーの意図を証明することにもなる。したがってビジネスユーザーは、知的財産侵害の申し立てへの対応が必要な場合に自社を守ると同時に、成果物が意図的な模倣や剽窃によるものではないことを証明できるようになる。
こうした監査証跡を構築することで、顧客が契約の中でこれらの記録を要求し始めた場合に(間もなくそうなる可能性は高い)、企業は確実に備えることができる。これらの監査証跡は、ベンダーの作品が故意または意図せずに生成された無許可の二次的著作物ではないことを担保する保険となる。
さらに先を見据えれば、保険会社は、保有資産にAI生成作品を含むビジネスユーザーに対する従来の保険の補償範囲を広げるために、これらの報告を要求するかもしれない。
また、画像生成の訓練データに含まれる個々のアーティストの貢献を細かく明確にすることで、貢献者への適切な補償につながり、新たな創作物に原作者の著作権を埋め込むことにも役立つ。
制作者
個々のコンテンツ制作者、およびコンテンツ制作を行うブランドは、自身の知的財産ポートフォリオのリスク検証と保護に向けた対策を講じるべきである。そのためには、収集されたデータセットや大規模なデータレイクの中から、ロゴやアートワークなどのビジュアル要素や、画像タグなどのテキスト要素を含む自身の作品を、積極的に探すことが求められる。
数テラバイトから数ペタバイトに及ぶコンテンツデータの中から手作業で探すことは当然不可能だが、既存の検索ツールによってこの作業をコスト効率よく自動化できるはずだ。アルゴリズムによる学習を難読化する(それによって作品を保護する)ことが可能な新しいツールもある。
コンテンツ制作者はデジタルとソーシャルのチャネルを積極的に監視し、自身の作品から派生した可能性のある作品が現れていないかチェックすべきだ。守るべき貴重な商標を持つブランドにとっては、ナイキのスウッシュ(ロゴ)やティファニー・ブルー(色)のような、特定の要素を探すという単純な問題ではない。
ブランドは、商標と商品やサービスの全体的なイメージであるトレードドレスの監視を進化させる必要がありそうだ。そうすることで、ブランドの特定の画像群で訓練された結果生まれた可能性のある二次的著作物の「スタイル」を検証するのである。たとえAI生成画像にロゴや特定の色といった重要な要素がなくても、ほかのスタイル要素から、ブランドコンテンツに顕著な要素が二次的著作物の生成に使われたことが示唆されるかもしれない。
そのような類似性は、認識しやすい視覚要素や聴覚要素を用いることで一般消費者の好感を横取りしようという意図を持つかもしれない。模倣は最大の賛辞とも受け取れるが、ブランドの意図的な悪用にもなりうる。
商標権侵害に関して事業主にとって幸いな点は、商標を扱う弁護士が、侵害者に対する商標権の通告と行使の手段をしっかり確立していることだ。不正なブランディングを生じさせたのがAIプラットフォームか人間かにかかわらず、厳しい表現で侵害行為の停止を求める通告を出したり、ライセンスの取得を求める督促状を送ったり、商標権侵害の申し立てをただちに起こしたりできる。
企業
企業は取引条件を検証し、契約の中で保護条項を明文化すべきである。その第一歩として、生成AIプラットフォームに対し、AIに与える訓練データが適切なライセンスを受けていることを確約するサービス利用規約を求める必要がある。
また、AI企業が入力データの適切なライセンス取得を怠ったり、成果物に権利侵害の可能性があることを警告するための自己申告をAI自体が行わなかったことに起因する知的財産の侵害に対し、企業は広範な補償を要求すべきだ。
企業は少なくとも、ベンダーおよび顧客との契約、すなわちカスタマイズしたサービス、製品を提供する場合において、次の点を明らかにしておく必要がある。当事者のいずれかが生成AIを使用している場合、両当事者が知的財産権に対する理解と保護を徹底すること、そしてそれらの作品の著作者と所有権の登録を、各当事者がどのように支援するのか、である。
また、情報開示者側にとっての機密情報を、受領者がAIツールにテキストプロンプトとして入力することを禁止するために、ベンダーおよび顧客との契約には、機密保持規定に該当するAI関連の用語を含めるとよい。
一部の先進企業は、契約の変更に向けてAIに関する各条項を検証する「生成AIチェックリスト」をクライアント向けに作成し、使用に伴う意図せぬリスクを減らそうとしている。法律は急速に変化し続けるため、生成AIを使用する組織や、使用するベンダーと協業する組織は、使用の範囲と性質を自社の顧問弁護士に逐次報告する必要がある。
* * *
知的財産を十分に蓄積しているコンテンツ制作者は、AIプラットフォームを訓練し成長させるために独自のデータセットを構築するかもしれない。結果的にその生成AIモデルはゼロから訓練する必要がなくなり、合法的に調達されたコンテンツを使用したオープンソースの生成AIを活用できる。
これにより制作者は、自分の作風をみずから踏襲したコンテンツを制作し、自身のデータレイクに監査証跡を残すことができる。そしてステークホルダーに対し、AIの訓練データと成果物の両方に関する権利が明確な形で、データツールの使用にライセンスを供与できるようになる。
同様の考え方で、オンラインでフォロワーを持つコンテンツ制作者は、訓練データを調達する別の手段として、フォロワーとの共同制作を検討してもよい。その際、法の改正に合わせて更新されるサービス利用規約とプライバシーポリシーに即して、共作者にもコンテンツの使用許可の申請が行われるべきであることを認識しておく必要がある。
生成AIによってコンテンツ制作の本質が変わり、これまでごく少数の人のみが持つ能力や高度なテクノロジーでしか成しえなかったことを、多くの人々が高速で実行できるようになる。このテクノロジーが急速に発展する中、その誕生を可能にした人々、つまり生成AIによって、居場所を奪われかねないクリエイターたちの権利を、ユーザーは尊重しなくてはならない。
クリエイティブ関連の業界に属する人々の生計に対して、生成AIが及ぼす現実的な脅威を私たちは理解している。一方、画像などを用いて自社のアイデンティティを綿密につくり上げてきたブランドにとっても、生成AIはリスクとなる。
同時に、クリエイターと企業のステークホルダーはどちらも、自身の作品やブランド素材のポートフォリオを構築し、メタタグをつけ、独自の生成AIプラットフォームを訓練する絶好の機会を得ている。そのプラットフォームは、正式な権限と所有権を伴う(前払いまたはロイヤルティを徴収する)商品を、即時的な収入源として生み出すことができるのだ。
"Generative AI Has an Intellectual Property Problem," HBR.org, April 07, 2023.