От началото на 2024 година Фондация Уикимедия (организацията, която поддържа Уикипедия) отчита драматично увеличение на трафика към своите сървъри. Само за няколко месеца използваният трафик за изтегляне на мултимедийно съдържание е нараснал с цели 50%. Но причината не е внезапен скок в интереса на читателите към енциклопедичното съдържание.
Виновниците за това рязко увеличение са автоматизирани ботове за извличане на данни, които масово свалят статии, изображения, видеа и други файлове от платформите на Уикимедия. Целта им е ясна – да захранят с информация моделите за генеративен изкуствен интелект, които стават все по-гладни за качествено съдържание.
Това безпрецедентно натоварване на инфраструктурата на Уикипедия вече води до осезаеми проблеми. При събития, предизвикващи висок обществен интерес, достъпът до съдържание може да се забави значително.
Показателен пример е случаят с кончината на бившия американски президент Джими Картър през декември миналата година. Повишеният интерес към видеото от президентския му дебат с Роналд Рейгън доведе до забавяне на зареждането на страницата за някои потребители. Уикимедия обикновено е подготвена за такива пикове в човешкия трафик, но когато към тях се добави и непрестанното натоварване от AI ботове, системата започва да се задъхва.
Проблемът не е само в скоростта на достъп. Зад кулисите се крие финансово предизвикателство, което заплашва устойчивостта на целия проект. Екипът на Уикимедия обяснява това с начина, по който работи тяхната инфраструктура.
Когато много хора търсят една и съща информация – например актуална новинарска тема – Уикимедия създава кеш на това съдържание в центровете за данни, най-близки до потребителите. Това позволява бързо зареждане и ефективно използване на ресурсите.
Но ботовете за AI обучение действат по съвсем различен начин – те масово изтеглят и по-малко популярни страници, които не са кеширани и трябва да бъдат извлечени от основните сървъри на организацията. Това консумира повече ресурси и увеличава оперативните разходи на фондацията.
По-задълбочен анализ разкрива шокираща статистика – 65% от трафика, който изчерпва ресурсите на Уикимедия, идва именно от тези ботове. Това създава постоянни предизвикателства за екипа, които се грижи за надеждността на сайта, защото блокирането на огромното количество ботове поглъща огромна част от времето им. В същото време, организацията, която разчита на дарения, няма средства да увеличи броя на специалистите в този тим. Без нови поддръжници и дарители, бъдещето на Уикипедия е под въпрос.
Уикимедия вече планира през следващата фискална година да въведе платен достъп до съдържанието си от разработчици на AI модели. Това е станало неизбежно, тъй като организацията не вижда никакви признаци, че трафика генериран от AI ботове ще намалее в обозримо бъдеще.