カリフォルニア州裁判所、AIトレーニング訴訟の棄却申し立てに判決
カリフォルニア州連邦裁判所は、自分たちの仕事が人工知能(AI)モデルを訓練してコードを生成するために使用されたと主張するコンピューター・プログラマーが起こした訴訟の棄却申し立てを支持する判決を下した。
ケースはJ. Doe 1 v. GitHub, Inc.
2022年に提出された最初の訴状では、J. Doe 1とJ. Doe 2として知られる開発者たちは、テキストプロンプトに応答してコンピュータコードを生成できるAIプログラムであるCopilotとCodexが、原告らの許可を得ずに原告らの著作権コードで訓練されたと主張している。
原告の当初の訴状では、GitHub(原告が問題のコードを公開し、Copilotも配布しているオープンソースプラットフォーム)、Microsoft(GitHubの所有者)、およびCodexをプログラム、訓練、および/または保守していたその他のOpenAI事業体を被告として挙げている。
原告のコードは広範なオープンソースライセンスの下で利用可能であったため、ジェネレーティブAI(GAI)に使用されるトレーニングデータの著作権をめぐる同様の訴訟で他の原告が主張したような直接的な著作権侵害を主張することはできなかった。
その代わりに、原告らは以下のような他の関連する主張を提起した:
- 原告のコードから著作権管理情報(CMI)が削除されたと主張したため、デジタルミレニアム著作権法(DMCA)に違反した。
- 彼らのコードが配布されたオープンソースライセンスには、AIモデルや彼らが作成した「新しい」コードには含まれていない著作者表示の記述が必要であったからだ。
- カリフォルニア州消費者プライバシー法違反。
- 原告の契約関係に対する不法行為。
被告側は棄却を申し立て、裁判所は2023年5月にこの申し立てに対する判決を下した。 特に裁判所は次のように述べた:
- 原告のコードがコーデックスやコパイロットの出力に複製される危険性があるため、原告には差止命令を求める資格があった。
- 原告側は、コパイロットの出力がすでに自分たちのコードを複製していることを示さなかったため、金銭的賠償を求める資格はなかった。
- 原告は、被告が意図的にAI出力からCMIを除去するようにプログラムを設計したと主張した。
原告側は訴状を修正し、今度はコパイロットが原告のコードをそのまま、あるいは些細な変更を加えて出力した例を提示した。
被告側は再び訴えの却下を申し立て、裁判所は再び訴えの一部を却下し、一部を認めた。
裁判所はそう判断した:
- AIの出力が原告のコードの一部をコピーした例を提示することで、原告らは著作権侵害による金銭賠償を求める資格を得た。
- DMCA第1202条(b)の違反は、「CMIが、著作権のある作品の同一のコピーから削除されたり、改変されたりした場合」にのみ起こるが、今回の場合はそうではない。
- 原告の州法に基づく請求は、連邦著作権法によって先取りされた。
興味深いことに、裁判所は、原告自身が著作権侵害の疑いのある出力を生成したGAIにプロンプトを入力した場合であっても、著作権侵害に対する金銭賠償を求める原告適格を有することができると判断した。
裁判所はこう指摘する。
被告はその立場を支持するために、原告は「現実世界のユーザーが、原告がその例で使用した種類のプロンプトを入力した、あるいは入力すると信じるに足る理由を与える事実を主張していない」と主張する。... 原告は、彼らのコードが「GitHubのリポジトリで頻繁に再利用されている」ことも、「誰もが彼らのコードをコピーしたいと思う」ことも説明していないと主張する。... そうかもしれないが、第三条は、金銭的損害賠償のための立件にそのような要件を課していない。 さらに、過去に被った損害に対する損害賠償額は、そもそも原告が損害賠償請求権を主張しているかどうかとは別の問題である。
(裁判所が指摘するように、合衆国憲法第3条は連邦司法権を「事件」と「論争」の解決に限定している。第3条が適用されない場合、連邦民事訴訟規則12(b)(1)に基づき、管轄権欠如を理由に却下される)。
著作権所有者がGAI企業に対して行った他の事例でも、著作権所有者は、彼らが入力したプロンプトが彼らの作品のコピーや派生物を生成したことに基づいて請求している。
Authors Guild v. OpenAI Inc.では、Authors Guild、John Grisham、Jodi Picoult、David Baldacci、George R.R. Martin、その他13人の作家がOpenAIに対して集団訴訟を起こした。
原告は、クラス期間中にOpenAIの言語モデルのトレーニングデータとして使用された作品の著作権を所有する米国内のすべての人々のクラスを代表することを求めている。
オーサーズ・ギルドはこう述べている、
訴状は、原告の書籍が海賊版の電子書籍リポジトリからダウンロードされ、GPT 3.5とGPT 4のファブリックにコピーされたという事実に注目している。 これらの「専門的に執筆され、編集され、出版された書籍」は、GPTがより優れた、より商業的なアウトプットを提供できるようにするため、訴状にあるように、「LLMの『トレーニング』データの特に重要な情報源」である。
ジョージ・R・R・マーティンの小説『ゲーム・オブ・スローンズ』シリーズの待望の第6巻と第7巻をGAIで生成する試みがなされている。
訴状では、"Open AIのLLMは二次的著作物、つまり原告の著作物を基にしたり、模倣したり、要約したり、言い換えたりしたものを吐き出すことができ、その市場に害を与える "と主張している。
(LLM」とは大規模な言語モデルのことで、特にテキストを認識・生成できるAIプログラムの一種である)。
作家組合は次のように告発している。
最近まで、ChatGPTは著作権のある文章をそのまま引用していました。 現在のところ、そのようなテキストの要約を作成することは容易である。 これらの要約は、それ自体が二次的著作物であり、その創作は本質的に違法にコピーされたオリジナルの著作物に基づいており、ChatGPTがなければ、根本的な著作物の作者によって、喜んでお金を払うライセンシーにライセンスされる可能性がある。
パブリッシャーズ・ウィークリー誌が報じたように、2月、連邦裁判所はオーサーズ・ギルドの訴訟における6つの請求のうち4つを棄却した。 裁判所は原告側に訴状を修正する許可を与えたが、著作権の直接侵害という核心的な主張は依然として有効である。
裁判所の命令は、次のような訴状に同意した。
OpenAIは原告の著作権で保護された書籍をコピーし、トレーニングデータセットに使用した。 .... 各原告が書いた本の要約を求められたとき、ChatGPTは本の内容とテーマの正確な要約を作成した。