Har samma problem hos många kunder. Det skrapas innehåll från nätet för att träna ai-modeller.
Eftersom robotarna varken respekterar robots.txt och går så våldsamt fram så hänger inte webbservrarna med.
Cloudflare kan vara till stor hjälp med avlastning av trafik.
Jag tweakade mycket MySQL och PHP för ett par månader sedan just pga detta.
Det är bara att hojta till så kan jag skicka lite förslag på konfigurationer.
Här är ett intressant projekt (finns liknande man kan köra inhouse):
Man lurar in robotarna i en labyrint, som genererar
fejkade länkar med nonsens, som robotarna följer i all oändlighet (utan att belasta databasen):
https://blog.cloudflare.com/ai-labyrinth/