New York Times забранява съдържанието на публикациите в изданието да се използват за обучение на модели с изкуствен интелект. Медията актуализира своите Условия за ползване на 3 август 2023, за да забрани съдържанието — включително текст, снимки, изображения, аудио/видеоклипове, метаданни или компилации – да се използва в разработката на „всяка софтуерна програма, включително, но не само, обучение на система за машинно обучение или изкуствен интелект (AI).“
Актуализираните условия уточняват, че автоматизирани инструменти като роботи на уебсайтове, предназначени да използват, имат достъп или събират такова съдържание, не могат да се използват без писмено разрешение, а несъобразяването с тези нови ограничения може да доведе до санкции, информира The Verge.
Изданието предполага, че мерките може да са в отговор на актуализацията на политиката на Google, според която търсачката може да събира публични данни от мрежата, за да обучава различните си AI услуги, като Bard или Cloud AI. Много големи езикови модели, захранващи популярни AI услуги като ChatGPT също са обучени върху данни от защитени материали, извлечени от мрежата без разрешението на автора.
Организации като The Associated Press призовават за правила, които ще изискват прозрачност и съгласие на носителите на права за използване на данните за обучение.
Според друга публикация в NPR от миналата седмица New York Times обмисля да заведе съдебно дело срещу създателя на ChatGPT. Отначало са водени преговори за сключване на споразумение, по силата на което OpenAI да плаща възнаграждение, но на този етап нещата вървят към съд.
“ChatGPT в известен смисъл се превръща в пряк конкурент на медията, като създава текст, който отговаря на въпроси въз основа на оригиналните доклади на автори от медията. Допълнителен аргумент е практиката на технологичните компании, които вече използват генеративни AI инструменти в търсачките – напр. Microsoft инвестира милиарди в OpenAI, а сега захранва своята търсачка Bing с ChatGPT. Ако, когато някой търси онлайн, получи отговор с дължина от абзац от инструмент с изкуствен интелект, който използва репортажи от Times, необходимостта от посещение на уебсайта на издателя значително намалява, казва един от участниците в разговорите.”
Ако в съдебния спор съдът се произнесе, че OpenAI незаконно е използвал статиите на Times, за да обучи своя AI модел, съдът би могъл да нареди на компанията да разпореди компанията да работи само с данни, която може законно да използва, пише NPR.