AIを学習させるために、スクレイピングをしてデータを取得したいという場面があります。そして、スクレイピングに際して、著作権法上の問題や契約上の問題について触れましたが、その他にも、業務妨害という観点でも気を付ける必要があります。例えば、スクレイピング先のサーバーに高負荷をかけてしまうと、業務妨害罪等に該当する可能性(刑法233条の偽計業務妨害罪、刑法234条の威力業務妨害罪、刑法234条の2の電子計算機損壊等業務妨害罪など)が出てくるので注意が必要です。
刑法では、特に過失犯を規定している罪を除いては故意犯のみが罰せられます。そして、業務妨害罪は、過失犯が規定されているわけではないため、業務を妨害することを敢えて行おうという故意がなければ基本的に罪に該当することはありません。したがって、AIの学習データを集めるためにスクレイピングを行う場合、目的はスクレイピングであって相手のサーバーをダウンさせることではありませんので、基本的に故意を観念できないことになります。しかしここで厄介なのは、実務上「未必の故意」も故意の一種として認められます。つまり、このプログラムを使ってスクレイピングをすれば、相手のサーバがダウンしたり、何らか障害が起こるかもしれないと予想しながらそのままプログラムを回せば、未必の故意があるとして、業務妨害罪に該当する可能性が出てきます。これらの点を考えると、スクレイピングを行うとしても、相手のサーバーに迷惑にならない程度のプログラムにするよう配慮する必要があります。
これについて参考になる裁判例としては、岡崎市立中央図書館事件というものがあります。この事件では、岡崎市立図書館の蔵書システムから自作プログラムでクローリングしようとした男性が高頻度のリクエストを故意に送り付けたとして偽計業務妨害の容疑で逮捕された事件でした。被疑者男性は、サーバーに高負荷とならないよう1秒に1アクセス程度にプログラムを調整し、かつ、1台でアクセスするようにしていたとの事実が認定されており、この事件の顛末は結局のところ、「起訴猶予」ということになっています。
スクレイピングを行う場合、プログラムにより自動的にデータを取得するので、人間によるアクセスと比較すれば、短時間に大量のデータを取得することになります。したがって、相手のサーバには十分配慮し、一般的に考えてもサーバーダウンなど業務に支障が生じない範囲のアクセスをするように注意が必要です。