ニューヨーク・タイムズがOpenAIとマイクロソフトを著作権侵害で提訴
12月末、ニューヨーク・タイムズ紙は、OpenAIとマイクロソフトを著作権侵害で提訴した。彼らの生成AI(GAIまたはGenAI)ツールは、タイムズ紙が掲載した記事を無断で学習させたものだとしている。
作家でパフォーマーのサラ・シルバーマンなど、同様の訴訟は過去にもあったが、タイムズ紙の訴訟は米国の主要メディアによる初めてのものだ。
69ページに及ぶ訴状によれば、GAIは独立ジャーナリズムにとって存亡の危機である:
独立したジャーナリズムは民主主義にとって不可欠である。 希少価値も高まっている。 タイムズ紙は170年以上にわたり、専門的で独立したジャーナリズムを世界に発信してきた。 タイムズのジャーナリストは、重要で差し迫った問題を国民に伝えるために、しばしば多大なリスクと犠牲を払いながら、記事のある場所に赴く。 紛争や災害の目撃者となり、権力の行使に対する説明責任を果たし、普通なら見ることのできない真実を照らし出す。 彼らの本質的な仕事は、法的、セキュリティ、運営上のサポートを提供する大規模で高価な組織と、ジャーナリズムが正確さと公正さの最高基準を満たしていることを保証する編集者の努力によって可能になっている。 この仕事は常に重要だ。 しかし、信頼性に欠けるコンテンツが氾濫し、情報の生態系が損なわれている中で、タイムズのジャーナリズムは、信頼できる情報、ニュース分析、論評を提供することで、国民にとってさらに価値のあるサービスを提供している。
被告がタイムズの著作物を不法に利用して、それと競合する人工知能製品を作成したことは、タイムズのサービス提供能力を脅かすものである。
訴状によると、被告らは大規模言語モデル(LLM)を学習させるために多くのソースからコピーしていたが、コンテンツの価値を認めてタイムズ紙のコンテンツを優先的に使用したという。
訴状には次のように記されている。
タイムズ紙の報道は、1918年の最初のピューリッツァー賞受賞以来、135のピューリッツァー賞(他団体の約2倍)を受賞するなど、業界や同業者から多くの称賛を得ている。
訴状では、マイクロソフトのBing Chat(最近 "Copilot "として再ブランド化された)とOpenAIのChatGPTが、"許可や支払いなしに代替製品を構築するために使用することで、タイムズのジャーナリズムへの巨額の投資にただ乗りしようとしている "と主張している。
訴状には、被告のGAIツールが「タイムズのコンテンツをそのまま引用し、綿密に要約し、その表現スタイルを模倣した出力を生成できる」ことを示す証拠資料が含まれている。
タイムズ紙は、ビングが「従来の検索エンジンが返すものよりかなり長く、詳細なタイムズ紙の記事の抜粋や詳細な要約を含む回答」を生成していると主張している。
これは、タイムズ 紙と読者との関係を損ない、損害を与えるものであり、タイムズ紙から購読料、ライセンス料、広告料、アフィリエイト収入を奪うものである、とタイムズ紙は言う。
GAIツールはまた、"虚偽の情報をタイムズ紙に誤って提供した "とされている。
これはAIの "幻覚 "として知られる現象だ。
IBMはこう説明する、
AIの幻覚とは、大規模な言語モデル(LLM)(多くの場合、生成AIチャットボットや コンピュータビジョンツール)が、人間の観察者には存在しない、あるいは知覚できないパターンやオブジェクトを知覚し、無意味な、あるいはまったく不正確な出力を作成する現象である。
一般的に、ユーザーが生成AIツールにリクエストする場合、プロンプト(質問に対する正しい答え)に適切に対応する出力を望む。 しかし、AIアルゴリズムが、学習データに基づかない、トランスフォーマーによって誤ってデコードされた、あるいは識別可能なパターンに従わない出力を出すこともある。 つまり、反応を "幻覚化 "するのだ。
言い換えれば、AIツールは物事をでっち上げるので、ある文脈においては正確な情報を得るために頼ることはできない。
例えば、6月にロイター通信が報じたように、ある弁護士が準備書面を調査するためにOpenAIのChatGPTプログラムを使用したところ、存在しない6つの事例を確認することなく法廷提出書類に引用され、制裁審問に直面した、
ロイター通信はこう述べている、
先週、テキサス州の連邦判事は、同判事が担当する事件の弁護士に対し、人間がその正確さをチェックすることなくAIを使って提出書類を作成していないことを証明するよう求めた。
タイムズ』紙は、他人の知的財産(IP)を利用することは被告にとって有利であると主張している:
マイクロソフトは、タイムズ紙で訓練を受けたLLMを製品ライン全体に配備することで、昨年だけで時価総額を1兆ドル押し上げた。 そして、オープンAIがChatGPTをリリースしたことで、その評価額は900億ドルにも達した。
タイムズ』紙によれば、数カ月にわたって被告との交渉による和解を試みてきたが、効果はなかったという。
訴状には次のように記されている。
タイムズ紙は、商業目的でタイムズ紙のコンテンツや商標を使用する前に、第三者から許可を得るよう求めており、何十年もの間、タイムズ紙は交渉によるライセンス契約に基づいてコンテンツをライセンスしてきた。 これらの契約は、The Timesがそのコンテンツとブランドをどのように、どこで、どのくらいの期間表示するかを管理し、第三者の使用に対して公正な対価を受け取ることを保証するのに役立ちます。 大手ハイテク・プラットフォームを含む第三者は、これらの契約の下、タイムズのコンテンツを狭義の目的で使用する権利と引き換えに、タイムズに多額のロイヤルティを支払っている。
被告側は、著作権で保護されたコンテンツの使用は新たな「変革的」目的を果たすものであるため、タイムズのIPの使用は米国の著作権法では「フェアユース」として認められると主張している。
タイムズ紙は、「被告のGenAIモデルの出力は、それを訓練するために使用された入力と競合し、密接に模倣しているため」、これはフェアユースではないと主張している。
訴状によると、被告OpenAIは2015年に非営利の研究会社として設立されたものの、"テスラやX社(旧Twitter社)のCEOであるイーロン・マスク氏、リンクトインの共同創業者であるリード・ホフマン氏、Yコンビネーターの元社長であるサム・アルトマン氏、ストライプの元最高技術責任者であるグレッグ・ブロックマン氏 "といった資金提供者から10億ドルのシードマネーを得ていた。
しかし、OpenAIはその後、数十億ドル規模の営利事業となった。
タイムズ』紙の記事はこう書いている、
訴訟には正確な金銭的要求は含まれていない。 しかし、被告は「タイムズ紙独自の価値ある著作物の違法なコピーと使用」に関連する「数十億ドルの法定および実際の損害賠償」に対して責任を負うべきだとしている。 また、タイムズ紙の著作権で保護された素材を使用したチャットボットのモデルやトレーニングデータを破棄することも求めている。