New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.
Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.
New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей
https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
>>Click here to continue<<