AIの学習にスクレイピングを使っていい?Part2(スクレイピングと契約)

AI

スクレイピングによりデータを集める場合、法律上の規制に該当することは限られた場面になりますが、契約に違反しないか、という点も気を付ける必要があります。

1 利用規約

インターネット上のデータにアクセスする際に、サイトに利用規約が掲げられていることがあります。利用規約には主に、一方的に利用規約のみが示されているケース(会員登録がないために同意の意思表示をする場面がないものの利用規約が定められているようなケース)、利用規約に同意の意思表示をするケース(会員登録の際に利用規約に同意する意思表示をし、その後にアクセスできるようなケース)があります。前者の場合、利用規約に対する合意形成がされているとは言い切れないため、利用規約は有効ではないケースが多いと思われます。一方で、後者の場合は、利用規約に同意しているため、原則として、利用規約は有効であるものと考えられます。
そして、利用規約が有効である場合において、利用規約(ないし契約)においてスクレイピングを禁止する条項がある場合、スクレイピングを行うと契約違反になりますので、会員登録を解除されたり、損害賠償請求を受ける可能性がありますので注意が必要です。

2 大手サイトの利用規約

例えば、amazonの利用規約
https://www.amazon.co.jp/gp/help/customer/display.html?nodeId=GLSBYFE9MGKKQXXM
では、
「…権利をお客様に許諾します(譲渡およびサブライセンス不可)。この利用許可には、アマゾンサービスまたはそのコンテンツの転売および商業目的での利用、製品リスト、解説、価格などの収集と利用、アマゾンサービスまたはそのコンテンツの二次的利用、第三者のために行うアカウント情報のダウンロードとコピーやその他の利用、データマイニング、ロボットなどのデータ収集・抽出ツールの使用は、一切含まれません」
と規定されていて、スクレイピングによるデータ収集は許諾されていません。

例えば、楽天の利用規約https://www.rakuten.co.jp/doc/info/rule/ichiba_shopping.html
では、
禁止事項として、「当社の事前の許可を得ることなく、自動化された手段(自動購入ツール・ロボットなどこれらに準ずる手段)を用いて商品を購入すること(商品ページ上の情報取得等を含む)」と規定されていて、やはりスクレイピングによるデータ収集は許諾されていません。

上記の例のように、メジャーなサイトには、スクレイピングが禁止されているサイトが数多くありますので、注意が必要です。

3 robots.txtにおける記載

WEBスクレイピングに関連して、robots.txtにより、検索エンジンのクローラーアクセスしてよいかどうか指示するためのテキストファイルがあります。ここで拒否されているものは、WEBサイトの主体がスクレイピングを拒否している可能性が高いので、トラブルを防止するため、スクレイピングしないことが無難です。この点、法的な意味でスクレイピングが禁止されているか(スクレイピングが契約違反に該当するか)、という視点で考えると、robotx.txtは人が把握することが前提ではなく、かつ合意形成するプロセスもないため、これをもって、契約上スクレイピングを禁止する効力が発生するかどうかはかなり疑問です。したがって、robots.txtにより拒否されているサイトをスクレイピングしたこと自体で法的責任を問われる可能性は低いでしょう。