CATEGORY

著作権

学習データに著作物を利用した際の生成AI提供事業者の責任

1 著作権法30条の4との関係 著作権法30条の4では、学習データとして著作物を利用することが原則として許容されています。これは、AIの学習時に著作物を利用することは許容されていますが、生成時に許容されているわけではありません。したがって、生成AIの生成時には、著作権法30条の4とは別に、著作権侵害の要件である依拠性、類似性の観点から侵害の成否が問題となります。また、生成AIでは、依拠性について、 […]

AIの学習データとしてのデータ保護の観点

1 何が有益な情報か 生成AIの精度が日を追うごとに向上し、これからは何かの業務を行うに際しても、AIとの関係は切っても切れない関係になると思われます。その中で、生成AIの性能向上のためには学習データが欠かせません。したがって、あるタスクを実行させようとしたときに、それを人間が行ったデータがあるとすれば、生成AIの学習データとして用いることが可能という観点では非常に重要なデータです。例えば、取引デ […]

AIの学習に第三者の著作物を利用する場合の注意点

 日本では、AIの学習データのために第三者の著作物を利用する場合、著作権法30条の4の規定により許容されることが多いです(こちらの記事でも書いた通り)。 そして、著作権法30条の4を前提にすると、学習データに用いる著作物が海賊版サイトのように不正に取得されたソースから取得されたものであっても、基本的に許容されると考えられます。 一方で、例えばEUでは、DSM指令第4条によって、合法的にアクセスでき […]

AIの学習にスクレイピングは使っていい?(生成AIの学習と著作権の問題)

生成AIで使われるような LLM(大規模言語モデル) は、膨大なデータを学習することで高い性能を実現しています。 では、その学習データとして、インターネット上の文章をスクレイピング(自動収集)して使うことは、著作権法との関係で問題ないのでしょうか。 結論から言うと、他人の著作物をLLMの学習データとして使うこと自体は、原則として適法です。 ただし、学習後にAIが出力する内容には注意が必要です。 な […]