AIの学習に第三者の著作物を利用する場合の注意点
日本では、AIの学習データのために第三者の著作物を利用する場合、著作権法30条の4の規定により許容されることが多いです(こちらの記事でも書いた通り)。 そして、著作権法30条の4を前提にすると、学習データに用いる著作物が海賊版サイトのように不正に取得されたソースから取得されたものであっても、基本的に許容されると考えられます。 一方で、例えばEUでは、DSM指令第4条によって、合法的にアクセスでき […]
日本では、AIの学習データのために第三者の著作物を利用する場合、著作権法30条の4の規定により許容されることが多いです(こちらの記事でも書いた通り)。 そして、著作権法30条の4を前提にすると、学習データに用いる著作物が海賊版サイトのように不正に取得されたソースから取得されたものであっても、基本的に許容されると考えられます。 一方で、例えばEUでは、DSM指令第4条によって、合法的にアクセスでき […]
生成AIで使われるような LLM(大規模言語モデル) は、膨大なデータを学習することで高い性能を実現しています。 では、その学習データとして、インターネット上の文章をスクレイピング(自動収集)して使うことは、著作権法との関係で問題ないのでしょうか。 結論から言うと、他人の著作物をLLMの学習データとして使うこと自体は、原則として適法です。 ただし、学習後にAIが出力する内容には注意が必要です。 な […]