令和6(2024)年3月、文化審議会 著作権分科会 法制度小委員会が作成した「AIと著作権に関する考え方について」(以下「考え方」といいます。)が公表されました。
「考え方」は、現時点の実務において、生成AIと著作権の関係についてガイドラインとしての役割を果たす資料となります。
「考え方」は、著作権法上の論点に関する整理を、大きく生成AIの開発・学習段階と生成・利用段階とに分けて説明しています。そこで本稿では、「考え方」における生成AIと著作権の関係の整理のうち、生成AIの開発・学習段階についてご紹介します。
「考え方」のポイント
- 開発・学習段階での複製行為は、著作権法30条の4の要件を充足すれば適法となるが、著作物に表現された思想又は感情の享受する目的が併存する場合は、著作権法30条の4の要件を欠く。
- 意図的に、学習データに含まれる著作物の創作的表現の全部又は一部を出力させることを目的とした追加的な学習(例えば、過学習・overfitting)を行うための著作物の複製は、享受目的が併存すると評価される。
- 具体的事案に応じて、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的と評価される追加的な学習のための著作物の複製も、享受目的が併存すると考えられる。
- 特定のクリエイターの作品である少量の著作物のみを学習データとして追加的な学習を行うことで、当該作品群の影響を強く受けた生成物を生成することを可能とする行為については、学習対象の著作物がアイデアのレベルで「作風」を共通して有しているにとどまらず創作的表現が共通する作品群となっている場合に、意図的にその創作的表現を出力させることを目的とした追加的な学習を行うため当該作品群の複製をするときは、享受目的が併存する。
- 著作権法30条の4ただし書への該当性を検討するに当たっては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、技術の進展や、著作物の利用態様の変化といった諸般の事情を総合的に考慮して検討することが必要と考えられる。
- 著作権法が保護する利益でないアイデア等が類似するにとどまるものが大量に生成される場合でも、当該生成物が学習元著作物の創作的表現と共通しないならば、著作権法30条の4ただし書には該当しないと考えられる。もっとも、生成行為が第三者の営業上の利益や人格的利益等を侵害する場合は、不法行為責任や人格権侵害に伴う責任が発生し得る。
- 侵害が成立する場合の措置として、著作権侵害の対象となった著作物が、将来においてAI学習に用いられることに伴って、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合、学習用データセットからの当該著作物の除去が認められ得る。
- AI学習により作成された学習済みモデルの廃棄請求は、通常、認められないものと考えられる。もっとも、学習済みモデルが、学習データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合は、学習データである著作物の創作的表現が当該学習済みモデルに残存しているとして、法的には、当該学習済みモデルが学習データである著作物の複製物であると評価される場合も考えられ、このような場合は、当該学習済みモデルの廃棄請求が認められる場合もあり得る。
解説
「考え方」の位置付け
「考え方」は、「生成AI と著作権に関する考え方を整理し、周知すべく、文化審議会著作権分科会法制度小委員会において取りまとめられたもの」[1]であり、作成名義も文化庁等ではなく、文化審議会 著作権分科会 法制度小委員会となっています。
文化審議会は、文部科学大臣又は文化庁長官の諮問に応じて調査審議を行い、意見を述べること等をその事務としています(文部科学省設置法20条1項)。その分科会や小委員会を含め、構成員はその分野の有識者ですので、「考え方」は審議を経て有識者の見解をまとめたものということはできます。
また、「考え方」自体にも以下の記載があるように、「考え方」は法的拘束力を持つものではありません[2]。
本考え方は、その公表時点における、本小委員会としての一定の考え方を示すものであり、本考え方自体が法的な拘束力を有するものではなく、また現時点で存在する特定の生成AIやこれに関する技術について、確定的な法的評価を行うものではないことに留意する必要がある。
とはいえ、文化審議会の運営には著作権法を所管する文化庁が携わっています。このことも踏まえると、「考え方」は、生成AIに関して何らかの立法措置が取られる見通しもない現時点の実務においては、有識者の見解をまとめたものとして、生成AIと著作権の関係についてガイドラインとしての役割を果たす資料であることは確かです。
「考え方」の構成
「考え方」の前半は「1.はじめに」「2.検討の前提として」「3.生成AIの技術的な背景について」「4.関係者からの様々な懸念の声について」との章立てであり、背景的な説明にも紙数が割かれています。
とはいえ、著作権法(以下「法」ともいいます。)の解釈に関わる整理を記載した「5.各論点について」が、やはり「考え方」の半分以上のボリュームを有しています。「5.各論点について」は
(1)開発・学習段階
(2)生成・利用段階
(3)生成物の著作物性について
(4)その他の論点について
との構成になっています。
本稿ではこのうち開発・学習段階について紹介し、生成・利用段階以降は次稿に譲ります。なお、本稿及び次稿は「考え方」の内容を網羅的に紹介するものではありません。
本稿の構成
以下、本稿では
- 開発・学習段階とは
- 開発・学習段階の複製が非享受目的として適法となる場合について
- 開発・学習段階の複製が著作権者の利益を不当に害することとなる場合について
- 侵害に対する措置について
の順にご説明します。
開発・学習段階とは
生成AIと著作物の利用の場面を整理すると、大きく「開発・学習段階」と「生成・利用段階」に分けられるとの理解が定着しています。
「考え方」には、開発・学習段階とは何かを説明する記載は特にありませんが、開発・学習段階を示す図として以下の図2が設けられています[3]。
この図2で示されているように、生成AIの開発・学習段階としては、生成AIの基盤モデル作成に向けた事前学習段階や、既存の学習済みモデルに対する追加的な学習段階が想定されます。そのそれぞれの段階で、学習用データセットの構築のための学習用データを収集・加工や、構築された学習用データセットの入力があり、複製①から④として示されるような著作物の複製行為が発生し得ます。
また、「考え方」は以下の図3も設けています[4]。
生成・利用段階では利用者の入力・指示によってAI生成物が生成されます。後述する検索拡張生成(RAG)と呼ばれる手法においては、生成AIへの指示・入力に用いるためのデータベースが作成されるところ、その際に図3の複製⑤で示す著作物の複製行為も発生し得ることも図示されています。
開発・学習段階の複製が非享受目的として適法となる場合について
法30条の4は、その各号に定める場合その他の著作物に表現された思想又は感情の享受を目的としない場合には、その必要と認められる限度において、その著作物を利用することができると定める規定です。
(著作物に表現された思想又は感情の享受を目的としない利用)
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合
生成AIの開発・学習段階においては著作物の複製が発生し得ますが(上記「考え方」の図2における複製①から④)、そうした生成AIの学習についても、法30条の4の要件を満たす場合は適法となります。
非享受目的と享受目的が併存する場合について
法30条の4は上記のとおり、「著作物に表現された思想又は感情の享受を目的としない場合」(これを非享受目的である場合と呼びます)において著作物の利用行為を適法とする規定です。
この点に関して「考え方」は、一個の利用行為には複数の目的が併存することもあり得るとしたうえで、この複数の目的のうちに一つでも「享受」の目的が含まれている場合、すなわち享受目的が併存する場合には、法30条の4の要件を欠くこととなり同条は適用されないとしています[5]。
そして「考え方」は、享受目的が併存する場合の例として、以下のように、意図的な過学習等、意図的に学習データに含まれる著作物の創作的表現を出力させることを目的とした追加的な学習を行う場合を示しています[6]。
既存の学習済みモデルに対する追加的な学習(そのために行う学習データの収集・加工を含む)のうち、意図的に、学習データに含まれる著作物の創作的表現の全部又は一部を出力させることを目的とした追加的な学習を行うため、著作物の複製等を行う場合。
(例)AI開発事業者又はAIサービス提供事業者が、AI学習に際して、いわゆる「過学習」(overfitting)を意図的に行う場合
さらに「考え方」は、上記の「学習データに含まれる著作物の創作的表現を出力させる」意図までは有していない場合についても、以下のとおり、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うため、著作物の複製等を行うときは、具体的事案に応じて学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であると評価されれば、享受目的が併存すると述べています[7]。
これに対して、「学習データに含まれる著作物の創作的表現の全部又は一部を出力させる意図までは有していないが、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うため、著作物の複製等を行う場合」に関しては、具体的事案に応じて、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられる。
なお、ここでいう「少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習」は、「考え方」において何度か登場しており、LoRA(Low Rank Adaptation)と言われる技術を念頭に置いた記述と思われます。
LoRAについて「考え方」では、生成AI に対する追加的な学習のうち「学習済みの生成AI に小規模なデータセットを用いて追加的な学習を行い、当該データセットに強い影響を受けた生成物の生成を可能とする技術」と紹介しています[8]。
「作風」の模倣について
「考え方」は、「特定のクリエイターの作品である少量の著作物のみを学習データとして追加的な学習を行うことで、当該作品群の影響を強く受けた生成物を生成することを可能とする行為」を特に挙げ、このような行為によって特定のクリエイターのいわゆる「作風」を容易に模倣できてしまうといった懸念について、著作権法上の考え方を述べています。
この点について「考え方」はまず、いわゆる「作風」は、これをアイデアにとどまるものと考えるとそれが共通すること自体は著作権侵害とならないとしています[9]。
もっとも、「考え方」は以下のとおり、アイデアのレベルで「作風」を共通して有しているにとどまらず創作的表現が共通する作品群となっている場合があり、そのような場合に、意図的にその創作的表現を出力させることを目的とした追加的な学習を行うことは、享受目的が併存すると述べています[10]。
他方で、アイデアと創作的表現との区別は、具体的事案に応じてケースバイケースで判断されるものであるところ、生成AIの開発・学習段階においては、このような特定のクリエイターの作品である少量の著作物のみからなる作品群は、表現に至らないアイデアのレベルにおいて、当該クリエイターのいわゆる「作風」を共通して有しているにとどまらず、創作的表現が共通する作品群となっている場合もあると考えられる。このような場合に、意図的に、当該創作的表現の全部又は一部を生成AIによって出力させることを目的とした追加的な学習を行うため、当該作品群の複製等を行うような場合は、享受目的が併存すると考えられる。
すなわち、このような場合は法30条の4によって適法とはされず、特定のクリエイターの作品群の学習に伴う複製行為が著作権侵害になるということです。
このように、「考え方」によれば、学習する作品群がアイデアでなく創作的表現が共通する作品群となっている場合には法30条の4の対象にならないことがあり得ます。この著作権法におけるアイデアと表現の区別は、場合によっては簡単な問題ではないのですが、「考え方」はその区別の基準について踏み込むものではありません。
享受目的の主張立証について
以上のように「考え方」は、享受目的の有無については、開発・学習段階においてどのような目的を有していたと評価されるかを問題としています。目的は主観的な要素ですが、その主張立証は通常、客観的な事実からの推認によることになると思われます。
そうした目的の立証に関して、「考え方」は以下のとおり、生成・利用段階においてAIが学習した著作物と創作的表現が共通した生成物の生成が著しく頻発するといった事情があれば、開発・学習段階における享受目的の存在を推認する上での一要素となり得ると述べています[11]。
なお、開発・学習段階における享受目的の有無については、開発・学習段階における利用行為の時点でどのような目的を有していたと評価されるかが問題となることから、生成・利用段階において、AIが学習した著作物と創作的表現が共通した生成物が生成される事例があったとしても、通常、このような事実のみをもって開発・学習段階における享受目的の存在を推認することまではできず、法第30条の4の適用は直ちに否定されるものではないと考えられる。他方で、生成・利用段階において、学習された著作物と創作的表現が共通した生成物の生成が著しく頻発するといった事情は、開発・学習段階における享受目的の存在を推認する上での一要素となり得ると考えられる
ただし「考え方」は、学習された著作物と創作的表現が共通した生成物の生成が頻発したとしても、それが、生成AI の利用者が既存の著作物の類似物の生成を意図して生成AI に入力・指示を与えたこと等に起因するものである場合は、AI 学習を行った事業者の享受目的の存在を推認させる要素とはならないと考えられることも指摘しています[12]。
検索拡張生成(RAG)について
検索拡張生成(RAG: Retrieval augmented Generation)等の手法においては、生成AIの学習データ以外の他のデータを生成AIによって検索し、その結果の要約等を行って回答が生成されます[13]。例えば、会社において社内データのデータベースを作り、生成AIがそのデータを検索して回答を生成するといった形で実装される例があります。RAGにはAIが虚偽の回答をする「ハルシネーション」を抑制する効果もあるとされています。
このRAG等を実装しようとする場合、生成AI自体の開発・学習のための著作物の複製等のほかに、既存のデータベースやインターネット上に掲載されたデータに含まれる著作物を収集・加工[14]してデータベースを作成すること等に伴い、著作物の複製等が生じ得ます。これは、上記の「考え方」の図3「生成AIへの指示・入力に用いるためのデータベースの作成に伴う著作物の利用行為」においても、複製⑤として図示されているところです。
「考え方」では、このような既存のデータベースやインターネット上のデータにおける著作物の複製等についても、法30条の4との関係が整理されています。その整理では以下のとおり、その複製等が生成に際して既存の著作物の創作的表現を出力することを目的としたものであるかどうかによって、非享受目的の利用行為として法30条の4が適用されるか否かが分かれるとされています[15] [16]。
また、既存のデータベースやインターネット上に掲載されたデータに著作物が含まれる場合でも、RAG等に用いられるデータベースを作成する等の行為に伴う著作物の複製等が、回答の生成に際して、当該データベースの作成に用いられた既存の著作物の創作的表現を出力することを目的としないものである場合は、当該複製等について、非享受目的の利用行為として法第30条の4が適用され得ると考えられる。
他方、既存のデータベースやインターネット上に掲載されたデータに著作物が含まれる場合であって、著作物の内容をベクトルに変換したデータベースの作成等に伴う著作物の複製等が、生成に際して、当該複製等に用いられた著作物の創作的表現の全部又は一部を出力することを目的としたものである場合には、当該複製等は、非享受目的の利用行為とはいえず、法第30 条の4は適用されないと考えられる。
開発・学習段階の複製が著作権者の利益を不当に害することとなる場合について
法30条の4ただし書は、以下のとおり、その著作物の種類・用途、利用態様に照らし著作権者の利益を不当に害することとなる場合は、その著作物を利用することができない旨を定めています。すなわち、この場合は法30条の4によって適法とはなりません。
ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
このただし書の適用有無が問題となるのは、法30条の4の本文を充足する場合、つまり享受目的が併存しない非享受目的の情報解析や複製と認められる場合です。
「考え方」もこのことを前提としつつ、ただし書の適用を検討する一般的な視点として、抽象的な基準ながら、以下のとおり、著作権者の著作物の利用市場と衝突するか、将来における著作物の潜在的販路を阻害するか、という点を挙げています[17]。
また、本ただし書への該当性を検討するに当たっては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、技術の進展や、著作物の利用態様の変化といった諸般の事情を総合的に考慮して検討することが必要と考えられる。
アイデア等が類似するものが大量に生成されることについて
「考え方」では、アイデア等が類似するにとどまるものが大量に生成されることについて、法30条の4ただし書の適用があるかどうかが整理されています。
その背景となる問題意識は、「考え方」23頁にて「著作権法が保護する利益でないアイデア等が類似するにとどまるものが大量に生成されることにより、特定のクリエイター又は著作物に対する需要が、AI 生成物によって代替されてしまうような事態が生じることは想定しうる」と記載されていることに表れています。具体的には、作風や画風といわれるものが類似する生成物が念頭に置かれているようです。
この点について、「考え方」はまず、著作権者の利益を不当に害することとなるか否かは法30条の4に基づいて利用される当該著作物(例:AI 学習のための学習データとして複製された著作物)について判断されることを指摘しています[18]。
その上で「考え方」は、作風や画風といったアイデア等が類似するにとどまり既存の著作物との類似性が認められない生成物は、これを生成・利用したとしても、既存の著作物との関係で著作権侵害とはならないと述べています[19]。
これらの記述に続き、「考え方」は以下のように、生成物が学習元の著作物の創作的表現と共通しない場合には、法30条の4ただし書には該当しないと述べています[20]。
著作権法が保護する利益でないアイデア等が類似するにとどまるものが大量に生成されることにより、特定のクリエイター又は著作物に対する需要が、AI生成物によって代替されてしまうような事態が生じることは想定しうるものの、当該生成物が学習元著作物の創作的表現と共通しない場合には、著作権法上の「著作権者の利益を不当に害することとなる場合」には該当しないと考えられる。
もっとも、「考え方」では以下のように、この点に関しては「著作権者の利益を不当に害することとなる場合」に該当し得ると考える余地があるとする意見が一定数みられたことをあえて付言しています[21]。議論が分かれるところであることが窺われます。
他方で、この点に関しては、本ただし書に規定する「著作権者の利益」と、著作権侵害が生じることによる損害とは必ずしも同一ではなく別個に検討し得るといった見解から、特定のクリエイター又は著作物に対する需要が、AI生成物によって代替されてしまうような事態が生じる場合、「著作権者の利益を不当に害することとなる場合」に該当し得ると考える余地があるとする意見が一定数みられた。
また、「考え方」は、生成行為が第三者の営業上の利益や人格的利益等を侵害する場合は、不法行為責任や人格権侵害に伴う責任が発生し得ることも記載しています[22]。
また、アイデア等が類似するにとどまるものが大量に生成されること等の事情が、法第30条の4との関係で「著作権者の利益を不当に害することとなる場合」には該当しない当該生成行為が、故意又は過失によって第三者の営業上の利益や、人格的利益等を侵害するものである場合は、因果関係その他の不法行為責任及び人格権侵害に伴う責任の要件を満たす限りにおいて、当該生成行為を行う者が不法行為責任や人格権侵害に伴う責任を負う場合はあり得ると考えられる
ここでいう営業上の利益や人格的利益の侵害について、「考え方」は具体的な例を示してはいませんので、一般論を述べるにとどまる記載ではありますが、作風や画風が類似するものが大量に生成されることを懸念する声への対応を意図した記載と思われます。
情報解析に活用できるデータベースの著作物について
法30条の4ただし書に該当する例として、令和5年5月に公表された「AIと著作権の関係等について」(別稿にて紹介しています。)において、既に「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に、当該データベースを情報解析目的で複製等する行為」が示されていました。
この点に関し、「考え方」は以下のとおり、法30条の4ただし書に該当する例として、インターネット上でデータベースの著作物が容易に情報解析に活用できる形で有償提供されている場合に、有償で利用することなく、当該データベースの著作物を情報解析目的で複製する行為を挙げています[23]。
これを踏まえると、例えば、インターネット上のウェブサイトで、ユーザーの閲覧に供するため記事等が提供されているのに加え、データベースの著作物から容易に情報解析に活用できる形で整理されたデータを取得できるAPIが有償で提供されている場合において、当該APIを有償で利用することなく、当該ウェブサイトに閲覧用に掲載された記事等のデータから、当該データベースの著作物の創作的表現が認められる一定の情報のまとまりを情報解析目的で複製する行為は、本ただし書に該当し、同条による権利制限の対象とはならない場合があり得ると考えられる
この例示は、典型的には新聞記事のデータベースを想定しているものかと思われます。
この議論は、そもそもデータベースの著作物として著作物性が認められることが前提である点にも注意が必要です。著作権法上、「データベースでその情報の選択又は体系的な構成によって創作性を有するもの」である場合にデータベースの著作物としての保護が認められますので(法12条の2)、まずこの要件を充足する必要があります。
また、「考え方」が述べる上記の「データベースの著作物の創作的表現が認められる一定の情報のまとまりを・・・複製する」における「データベースの著作物の創作的表現」についても、情報の選択又は体系的な構成による創作性が認められる必要があるでしょう。
海賊版等の権利侵害複製物をAI学習のために複製することについて
「考え方」では、海賊版等の違法にアップロードされている著作物も学習されてしまうことへの懸念の声[24]を受けて、海賊版等の権利侵害複製物をAI学習のために複製することについて法30条の4ただし書の項目で取り上げています。
この点について「考え方」はまず、インターネット上のデータが海賊版等の権利侵害複製物であるか否かの判断は、著作権者でなければ難しいことを指摘しています[25]。また、「考え方」では、権利侵害複製物をインターネット上で収集して開発・学習に利用する行為が法30条の4ただし書に該当するとの記述はありません[26]。
もっとも、「考え方」は、AI 開発事業者やAI サービス提供事業者においては新たな海賊版の増加といった権利侵害を助長するものとならないよう十分配慮した上で学習データの収集を行うことが求められると述べています[27]。
さらに「考え方」は、以下のとおり、AI 開発事業者やAI サービス提供事業者が、ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら当該ウェブサイトから学習データの収集を行った場合、その事実は、これにより開発された生成AI による生成・利用段階に生じる著作権侵害について、規範的な行為主体として侵害の責任を問われる可能性を高めるものとの考えを示しています[28]。
特に、ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行うといった行為は、厳にこれを慎むべきものである。この点に関して、生成・利用段階においては、後掲(2)キのとおり、既存の著作物の著作権侵害が生じた場合、AI開発事業者又はAIサービス提供事業者も、当該侵害行為の規範的な主体として責任を負う場合があり得る。この規範的な行為主体の認定に当たっては、当該行為に関する諸般の事情が総合的に考慮されるものと考えられる。
AI開発事業者やAIサービス提供事業者が、ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行ったという事実は、これにより開発された生成AIにより生じる著作権侵害についての規範的な行為主体の認定に当たり、その総合的な考慮の一要素として、当該事業者が規範的な行為主体として侵害の責任を問われる可能性を高めるものと考えられる
なお、ここでいう「規範的な行為主体として」について補足すると、著作権法の実務では、著作権法で定める利用行為を直接的に行っていない者に対しても、著作権者の利益を害する一定の場合に著作権法上の責任を認める解釈上の工夫が行われてきており、具体的には、規範的観点から直接的な利用行為者以外の者が利用行為の主体と認定されることがあります。
「考え方」が「規範的な行為主体としての侵害の責任を問われる」と記述しているのも、このような解釈によって、生成・利用行為に対する侵害の責任を負うことを指しているものでしょう。
また「考え方」は、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的として、海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集を行う場合については、以下のとおり、
- 開発・学習段階においては享受目的が併存すると評価され得ること(すなわち、法30条の4の適用を受けられない)
- 生成・利用段階においては当該生成AI により生じる著作権侵害について規範的な行為主体として侵害の責任を問われる可能性が高まること
を指摘しています[29]。
この点に関して、こうした海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集は、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的として行われる場合もあると考えられる。このような追加的な学習を行うことを目的として、学習データの収集のため既存の著作物の複製等を行う場合、開発・学習段階においては上記イ(イ)のとおり、具体的事案に応じて、学習データの著作物の創作的表現を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられるが36、これに加えて、生成・利用段階においては、これにより追加的な学習を経た生成AIが、当該既存の著作物の創作的表現を含む生成物を生成することによる、著作権侵害の結果発生の蓋然性が認められる場合があると考えられる。
そのため、海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集を行う場合等に、事業者において、このような、少量の学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行う目的を有していたと評価され、当該生成AIによる著作権侵害の結果発生の蓋然性を認識しながら、かつ、当該結果を回避する措置を講じることが可能であるにもかかわらずこれを講じなかったといえる場合は、当該事業者は著作権侵害の結果発生を回避すべき注意義務を怠ったものとして、当該生成AIにより生じる著作権侵害について規範的な行為主体として侵害の責任を問われる可能性が高まるものと考えられる。
侵害に対する措置について
「考え方」では、開発・学習段階における著作権侵害行為が認められた場合に、権利者はどの範囲で差止請求をすることができるかについても整理しています。
将来のAI学習に用いられる学習用データセットからの著作物除去の請求
一般に著作権侵害に対しては、侵害行為の差止請求(侵害行為の停止又は予防の請求)(法112条1項)と侵害の停止又は予防に必要な措置の請求(同条2項)が可能です。
これを踏まえ「考え方」では、AI学習に際して著作権侵害が生じた場合、AI学習のための複製を行った者に対し、学習用データセットから著作物を除去することの請求が認められるかについて、整理しています。
具体的には、「考え方」は以下のとおり、著作権侵害の対象となった著作物が、将来においてAI学習に用いられることに伴って複製等の侵害行為が新たに生じる蓋然性が高いといえる場合に、学習用データセットからの当該著作物の除去が認められ得ると述べています[30]。
将来の侵害行為の予防に必要な措置の請求は、将来において侵害行為が生じる蓋然性が高いといえる場合に、あらかじめこれを防止する措置を請求できるとするものである。そのため、著作権侵害の対象となった当該著作物が、将来においてAI学習に用いられることに伴って、複製等の侵害行為が新たに生じる蓋然性が高いといえる場合は、当該AI学習に用いられる学習用データセットからの当該著作物の除去が、将来の侵害行為の予防に必要な措置の請求として認められ得ると考えられる。
学習済みモデルの廃棄請求
「考え方」はまず、以下のとおり、AI学習により作成された学習済みモデルは、学習に用いられた著作物の複製物とはいえない場合が多いと考えられること、学習データである著作物と類似しないものを生成することができると考えられることから、AI学習により作成された学習済みモデルについての廃棄請求は、通常、認められないと述べています[31]。
AI学習により作成された学習済モデルは、学習に用いられた著作物の複製物とはいえない場合が多いと考えられ、「侵害の行為を組成した物」又は「侵害の行為によつて作成された物」には該当しないと考えられる。また、通常、AI学習により作成された学習済モデルは、学習データである著作物と類似しないものを生成することができると考えられることから、「専ら侵害の行為に供された機械若しくは器具」にも該当しないと考えられる。そのため、AI学習により作成された学習済モデルについての廃棄請求は、通常、認められないものと考えられる。
他方で「考え方」は、一定の場合には、学習データである著作物の創作的表現が当該学習済みモデルに残存しているとして、法的には、当該学習済みモデルが学習データである著作物の複製物であると評価される場合もあり得るとし、そのような場合には学習済みモデルの廃棄請求が認められることもあり得ると整理しています[32]。
そして、そのような場合の例として、以下のとおり、「当該学習済モデルが学習データである著作物と類似性のある生成物を高確率で生成する状態にある」場合が挙げられています[33]。
他方で、当該学習済モデルが、学習データである著作物と類似性のある生成物を高確率で生成する状態にある等の場合は、学習データである著作物の創作的表現が当該学習済モデルに残存しているとして、法的には、当該学習済モデルが学習データである著作物の複製物であると評価される場合も考えられ、このような場合は、「侵害の行為を組成した物」又は「侵害の行為によつて作成された物」として、当該学習済モデルの廃棄請求が認められる場合もあり得る。また、この場合は、当該学習済モデルが、学習データである著作物と類似性のある生成物の生成(すなわち複製権侵害を構成する複製)に専ら供されたとして「専ら侵害の行為に供された機械若しくは器具」として廃棄請求が認められる場合もあり得る。
コメント
生成AIの学習は、生成AI(学習済みモデル)を開発するAI開発事業者のみならず、追加的学習やRAGの実装という形でAIサービス提供事業者やAI利用者が行う場面もあります。その意味で、開発・学習段階の著作権に関する整理は、AIサービス提供事業者やAI利用者にとっても参考とすべきものといえます。
次稿では、生成AIの生成・利用段階及びAI生成物の著作物性について「考え方」の整理を紹介します。
脚注
————————————–
[1] 「考え方」表紙
[2] 「考え方」表紙
[3] 「考え方」18頁
[4] 「考え方」19頁
[5] 「考え方」19-20頁
[6] 「考え方」20頁
[7] 「考え方」20頁
[8] 「考え方」12頁
[9] 「考え方」21頁
[10] 「考え方」21頁
[11] 「考え方」21頁
[12] 「考え方」21頁
[13] 「考え方」12頁では、RAGについて「生成AIの開発の際に用いられなかったデータであっても、生成AIへの指示と関連するデータを検索・収集し、当該指示と合わせて生成AIへの入力として扱い、出力の予測を行う技術」との説明もされています。
[14] 具体的には、著作物の内容をベクトルに変換すること等が行われます。
[15] 「考え方」21~22頁
[16] なお、「考え方」22頁では、法30条の4が適用されない場合でも、RAG等による回答の生成に際して既存の著作物を利用することについては、法47 条の5第1項第1号又は第2号の適用があること、ただし同規定の要件として軽微利用や付随性があることに留意する必要があると指摘しています。
[17] 「考え方」23頁
[18] 「考え方」23頁
[19] 「考え方」23頁
[20] 「考え方」23頁
[21] 「考え方」23頁
[22] 「考え方」23-24頁
[23] 「考え方」25頁
[24] 「考え方」15頁
[25] 「考え方」27頁
[26] ただし、「考え方」28頁では、脚注として「当該複製物が海賊版等の権利侵害複製物である旨の認識を有しながら、又はその認識を有しないが通常有するべきであったにもかかわらず、海賊版等の権利侵害複製物である当該複製物をAI 学習に用いるため著作物の複製等を行った場合、本ただし書への該当可能性を高める要素となる、といった意見があった。」ことを記載しています。
[27] 「考え方」28頁
[28] 「考え方」28頁
[29] 「考え方」28-29頁
[30] 「考え方」30頁
[31] 「考え方」30頁
[32] 「考え方」30頁
[33] 「考え方」30頁
本記事に関するお問い合わせはこちらから。
(文責・神田雄)