Мне кажется что причина бездействия ботов - ограничение логов в 512 мб и зависание оных без возможности "обучаться".
помню на некоторых видеокартах раньше был видеовыход, играли в Quake 3 на старых черно-белых ламповых советских телевизорах, диагональ у них была наверное как у современных 24 дюймовых мониторах, значительно больше чем на компьютерных 14-15 дюймах и здесь Q3, скорее всего (судя по тому что он копался в логах и понял причину) алгоритм обучения с подкреплением был не правильно настроен, слишком большое вознаграждение давалось за избежание смерти и слишком маленькое за убийство, предвидеть это может было и трудно, тогда можно было изначально ботов делать не одинаковыми, по разному их учить, разным ботам разные вознаграждения, чтобы самый наглый не давал другим просто стоять, можно ещё генетический алгоритм добавить, случайно модифицирующий каждого бота, либо оставить слоты для людей, которые учили бы ботов уму разуму
Если нейронная сеть писала алгоритм для ботов, исходя из общих логов, то вариант возможен, но если для каждого по отдельности, то я думаю, да, красивая притча)