ChatGPTのようないわゆる生成AIを利用する場合、著作権との関係ではどのような問題があり得るでしょうか。

生成AIを利用する場合、著作権との関係では、情報入力時に留意すべき問題、情報出力時及びその利用時に留意すべき問題があると考えられます。


1 問題となる場面の整理

 生成AIを利用する際に著作権が問題となる場面としては、①学習段階ないし生成段階における情報入力に関する問題と、②生成AIからの情報出力及び当該出力結果を利用する場合の問題があります(生成AI利用時の法的問題を上記①②のように分類して整理しているもの[1]のほか、「学習・開発段階」・「生成・利用段階」で2分して検討しているものもあります[2])。
 より具体的には、①については、既存の画像や文章を生成AIに入力し、モデルをファインチューニングする(再学習させる)場合(学習段階)や、生成AIに既存の画像や文章を入力して、新たな画像や文章を出力させる場合(生成段階。例えば、画像生成AIによるi2i(image to image)や、文章生成AIによる文章の翻訳、改変等)が考えられます。
 また、②については、生成AIから既存の著作物と同一又は類似する画像や文章等が出力されてしまった場合、また、当該出力された画像や文章等を利用する(例えば、これを複製し、インターネット上で配信する)場合が考えられます。

2 入力時の問題

 学習段階及び生成段階に既存の著作物を生成AIに入力する場面においては、当該著作物の複製等を伴うため、当該入力行為について権利者の著作権を侵害しないかという点が問題となります。
 もっとも、単に既存の著作物を生成AIに入力する場面では、下記のとおり著作権法30条の4第2号の規定が適用される場合が多いと考えられ、この場合には、著作権侵害を回避し得ます。
 著作権法30条の4によれば、「情報解析」等のいわゆる享受目的によらない著作物の利用については、その必要な限度において、原則として許容されます。
 享受目的とは、「著作物の視聴等を通じて、視聴者等の知的・精神的欲求を満たすという効用を得ること」などと考えられていますが[3]、学習段階及び生成段階における既存の著作物の生成AIへの入力行為自体は、生成AIによる既存著作物の解析(情報解析)を目的とする行為であり、人間の視聴等を目的とした行為ではないと考えられますので、当該行為は、非享受目的によるものといえ、原則として本条により許容されるということになります。
 ただし、当該行為の主たる目的が情報解析の用に供する場合のような非享受目的であるものの、これに加えて享受する目的が併存しているような場合には本条は適用されません(前記脚注2、3等参照)。
 例えば、入力段階の時点で既に「既存の著作物と同一又は類似の著作物を出力するようにAIを学習させよう」という目的で既存の著作物を学習させる場合には、既存の著作物についてユーザーが享受する目的があると考えられますので、本条が適用されない可能性が高いといえます。
 また、本条には、ただし書き(当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない)による例外が規定されています。具体的にどのような場合にこのただし書きに該当するかは明らかでありませんが[4]、少なくとも、「情報解析用に販売されているデータベースの著作物をAI学習目的で複製する場合」などは、明らかに本ただし書きに該当し、本条が適用されないと考えられます(前記脚注3参照)。

3 出力・利用時の問題

 生成AIが既存の著作物と同一又は類似の画像・文章等を出力してしまった場合、当該著作物の複製等が行われたことになるため、当該出力行為について権利者の著作権を侵害しないかという点が問題となります。また、当該出力結果をインターネット上で配信する場合等には、当該利用行為についても同様に著作権侵害が疑われます。

 出力された画像・文章等は、情報解析の結果であって、その出力・利用行為は、情報解析のために必要な行為ではないため、入力時と異なり著作権法30条の4は適用されません。
 また、著作権法47条の5によれば、「電子計算機による情報解析を行い、及びその結果を提供すること」を目的とする著作物の利用行為であり、その利用が軽微なものである場合には、原則としてその利用が許容されますが、既存の著作物と同一又は類似の画像・文章等そのものの出力(複製・翻案)は「軽微」な利用とはいえませんので、基本的に本条も適用されないと考えられます。

 そうすると、結局のところ、生成AIの利用者としては、既存の著作物の入力する場合、入力段階で著作権上の問題をクリアしたとしても、出力・利用時に著作権侵害のリスクが残るということになってしまいます。あるいは、利用者が既存の著作物を入力していないのに、生成AIが既存の著作物と同一又は類似の画像・文章等を出力する可能性もあります。
 このような事態を回避するため、利用者としては、そもそも第三者の著作物を出力することが予想されるような指示(例えば、画像生成AIに対しドラえもんの画像を入力する、又は、「ドラえもん」などとテキストを入力する、又は、既存の「ドラえもん」に近づくような細かいプロンプトを与えるなど。)は与えるべきでないと考えられます。

 また、著作権侵害の成立には依拠(他人の著作物に接し、それを自己の作品の中に用いること[5])の要件があり、また、著作権侵害に基づく損害賠償責任には故意・過失の要件がありますが、上記のように生成AI利用者が第三者の著作物と同一又は類似の出力結果を全く意図しておらず、偶々そのような出力が行われた場合にまでこれらの要件が充足されるのか、著作権侵害を回避し得るのはいかなる場合かについては学説においても様々な考えがあり[6]、明確な答えがない点であるため、慎重に検討する必要があります。

 したがって、利用者としては、学習用データの確認を行うことができれば確実性が増しますが、その学習用データの数からして確認は現実的ではない場合も多いと思われます[7]
 現時点でできる侵害回避策としては、生成されたものについて(インターネット検索等により)既存著作物と類似しないかを確認しておくことで侵害としてクレームがつくリスクを避けるとといった対応が現実的かと考えられます(上記のとおり、依拠性を否定できる場合もあると思われますが、その対応コストを考えると、可能な限り他の著作物類似の生成物を利用することは避けるべきといえます。)。なお、特定の作品や作家に特化した生成AIについては、生成AIの開発経緯や権利処理の状況を慎重に検討したうえで使用するといった配慮も必要です。

4 おわりに

 以上のとおり、生成AI利用時の著作権法上の留意点は多岐にわたりますので、安易に利用せず、よく検討してから利用を開始する必要があります(企業であれば、社内の利用ルールをガイドライン等で明確化することも有益です。)。
 なお、近年では、ユーザーが、生成AIサービスを利用した結果として第三者の著作権を侵害してしまった場合、当該サービスの提供者が一定額を補償してくれるサービスも見受けられますので[8]、利用規約類を検討し、そのような補償が充実しているサービスを選択して利用することも一案です。

2024年2月19日


[1] 一般社団法人日本ディープラーニング協会「生成AIの利用ガイドライン【簡易解説付】」https://www.jdla.org/document/#ai-guideline

[2] 例えば、文化庁「AI と著作権に関する考え方について(素案)」等。
https://public-comment.e-gov.go.jp/servlet/PcmFileDownload?seqNo=0000267588

[3] 文化庁著作権課「AIと著作権」
https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf (令和5年6月)

[4]「ただし書に該当するか否かは、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、技術の進展や、著作物の利用態様の変化といった諸般の事情を総合的に考慮して検討することが必要」などと説明されている一方で(前記脚注2)、「最終的には司法の場で個別具体的に判断されます。」などとも述べられており、判断の決め手に欠ける状況といえます(前記脚注3)。

[5] 「依拠」の解釈には様々な解釈がありますが、ここでは、中山信弘『著作権法〔第4版〕』(2023年・有斐閣)737頁における定義を引用しています。

[6] 例えば、元の著作物がAIの学習に用いられていれば、依拠性を認めてもよいのではないか、生成物結果、学習に用いられた元の著作物の表現と類似していれば、依拠性ありと推定してよいのではないかなどという考えもあります。文化庁「AIと著作権」(2023.6.19)https://www.bunka.go.jp/seisaku/chosakuken/pdf/93903601_01.pdf 等ご参照。また、生成AIと著作権を検討するうえでは、「①AI利用者が既存の著作物を認識していたと認められる場合」、「②AI利用者が既存の著作物を認識していなかったが、AI学習用データに当該著作物が含まれる場合」、「③AI利用者が既存の著作物を認識しておらず、かつ、AI 学習用データに当該著作物が含まれない場合」などの様々なパターンが考えられ(前記脚注2)、場合分けして検討する必要があります。

[7] なお、以前はある画像(と同一又は類似の画像)が画像生成AI「Stable Diffusion」などのトレーニングに利用されているオープンデータセットの「LAION-5B」の学習に利用されているか否かを検索できるサービスもありましたが(” Have I Been Trained?”https://haveibeentrained.com/)、LAION-5Bに児童性的虐待画像(CSAM)が含まれていることが明らかになったとの報道を受けてサービスが改変され、現在では画像検索機能が利用できない仕様となっています(2024年2月14日現在)。

[8] 例えば、OpenAI社が提供するAPIサービスやChatGPT Enterprise等に適用されますService Terms:1.API、3.ChatGPT Enterprise (b) Output indemnity.(2024年1月10日更新版)等。
https://openai.com/policies/service-terms