Почему мы всё ещё ждём революции в данных от Counter-Strike?
Из демонстрационной версии Counter-Strike можно собирать расширенные данные с каждым тиком. Однако этот потенциал ещё не используется в полной мере.
Появление продвинутой статистики и усиление отделов данных преобразовали традиционные виды спорта с начала тысячелетия. Книга и фильм «Человек, который изменил всё» о том, как данные и смелый генеральный менеджер привели посредственную команду Oakland Athletics в плей-офф подряд, вынесли эту концепцию на всеобщее обсуждение, но изменения с тех пор только ускорились.
В баскетболе в середине 2010-х наступила «эпоха трёхочковых бросков», когда команды стали чаще попадать в кольцо с линии трёхочковой дуги и из области рядом с ней.
В европейском футболе длинные передачи стали менее популярны, так как с появлением ожидаемых голов (xG) команды стали отдавать предпочтение созданию более качественных моментов, а не случайным ударам с низким процентом попадания.
Эти две тенденции легко представить, но они лишь поверхностны. Закулисные спортивные отделы сейчас неузнаваемы по сравнению с тем, что было двадцать лет назад. Эпоха скаутов, когда приоритетом были «тесты на зрение» и многолетний опыт, практически закончилась. Их навыки по-прежнему важны, но то, куда идут скауты, за кем они наблюдают и что ищут, — всё это решения, основанные на данных.
В Counter-Strike отделы данных едва ли станут реальностью, а может, и вовсе не понадобятся. Легко представить, что CS2 пойдёт по пути традиционных видов спорта и через несколько лет переживёт свой момент «Moneyball», когда команды будут нанимать генеральных менеджеров, разбирающихся в данных, чтобы каждая ростермания имела значение.
Можно утверждать, что нечто подобное трёхэре xG уже происходило: когда Astralis разработали точные комбинации гранат и положили начало эре сохранения, поскольку всё больше команд избегали повторных захватов. Но это не было началом великой революции в области данных.
Скаутинг в настоящее время всё ещё проводится примерно так же, как и в 2016 году. Тренер, игровой лидер и представитель организации садятся и просматривают длинный список кандидатов, полагаясь на свой опыт и наблюдая демонстрационные матчи, а также получая рекомендации от бывших товарищей игрока по команде.
Кассад говорит нам, что статистика не так важна при выборе новых игроков. Есть десятки более значимых факторов. В первую очередь он предпочитает получать отзывы от людей, которые работали с игроками, которых он хочет подписать. Затем идут демо-обзоры, в основном сосредоточенные на том, как игрок ведёт себя в ситуациях высокого напряжения, как он реагирует на определённые ситуации в середине раунда, достаточно ли у него инициативы для его позиции, как он принимает решения и так далее.
В интернете есть много сайтов с информацией на эту тему. [Посмотрите, что нашлось в поиске](https://ya.ru)
Легко провести параллели между этим статус-кво и антагонистическими скаутами старой школы, показанными в фильме «Деньги на мяч». Когда решение личное, в него включаются личные отношения. Нет необходимости доверять словам бывшего тренера, если вы сами работали с игроком раньше. Тогда легко подписать Йоакима «jkaem» Мирбостада и Неманью «nexa» Исаковича, потому что это известные игроки.
То же самое и с агентствами. Не случайно, когда все пятеро игроков Vitality приехали, они были подписаны в агентство Prodigy Жерома Купе.
Йеспер «JW» Векселль говорит, что из-за общения с бывшими игроками организация EYEBALLERS упустила «целое поколение» шведских талантов. Он заявил, что они пропустили несколько невероятно хороших игроков, потому что больше верили слухам, чем давали этим людям шанс проявить себя.
Но эта система в целом работает. Лучшие таланты всё равно попадают в лучшие команды. Spirit нашли Данила «donk» Крышкевца не с помощью суперсовременного алгоритма, а с помощью усовершенствованной системы поиска старой школы.
Слепое следование традиционным видам спорта может быть ловушкой, анахроническим применением принципов, которые кажутся хорошими, но просто не подходят для киберспорта, такого как Counter-Strike.
Для некоторых этот пример подходит к определённым позициям и ролям, поскольку сообщество усиливает внимание и тщательность, когда переход игрока кардинально меняет его игру. Раньше это могло оставаться без внимания, но теперь подписание Марио «malbsMd» Самайяо в G2 — явного вундеркинда с рейтингом 1,30 на 2024 год в M80 — вызвало вопросы на этом основании.
Я ненавижу тенденцию последних лет, когда все так зациклены на ролях, — сказал Ричард «Richard Lewis» Льюис в стриме, говоря о новом составе G2. Люди говорят о ролях так, как будто это неизменные и совершенно негибкие качества. Я из тех времён, когда роли были почти второстепенны: мы берём игроков, с которыми хорошо взаимодействуем, у нас есть хорошая тактическая система, и мы адаптируемся.
И всё же реальность такова, что эта общественная тенденция следует за ситуацией. Дискуссия о ролях и позициях просто догоняет то, что уже было проблемой.
Петер «dupreeh» Расмуссен часто говорил о том, что был недоволен тем, что в 2016 году его переместили на пассивную позицию, чтобы освободить место для Маркуса «Kjaerbye» Кьербая. Когда после прибытия Эмиля «Magisk» Рейфа он вернулся в состав команды, контролирующей карту, — что оказалось удачным стечением обстоятельств, учитывая, что их главной целью был ультраагрессивный Кристиан «k0nfig» Виннеке, — Astralis начали новую эру.
Януш «Snax» Погоржельски присоединился к MOUZ в 2018 году и, несмотря на победу на ESL One New York, не справился с непростой поддерживающей ролью Мартина «STYKO» Стайка и был исключён. SK пригласил сверхагрессивного Жоау «felps» Васконселлоса (который на самом деле является клоном Фернанду «fer» Алваренги) в качестве замены Линкольна «fnx» Лау, но стал выглядеть гораздо лучше после добавления Рикарду «boltz» Прасса.
Недавно Astralis даже не прошла квалификацию на Major, когда попыталась объединить в одной команде Бенджамина blameF Бремера, Мартина stavn Лунда и Якоба jabbi Найгаарда.
Игроки часто думают, что они более гибкие, чем есть на самом деле. Они говорят: «Мы можем сыграть любую роль», веря, что современная система может более равномерно распределять возможности для нанесения урона. И даже когда бывшие товарищи по команде сомневаются в его решении сменить роль в G2, сам игрок уверен, что сможет адаптироваться.
В основном этот шаг оправдал себя, хотя он превратился из безоговорочного победителя рейтинговых матчей с результатом 1,30 в «тёмную лошадку» с очевидным сокращением количества поединков, которые позволяют ему принимать его новые роли. Он всё ещё выигрывает бои, честно или нечестно, но их стало меньше.
Но другие команды идут другим путём, и ярким примером этого является GamerLegion с Эшли «ash» Бэтти во главе, который уделяет приоритетное внимание данным и позициям при поиске новых игроков.
«Я большой фанат «Ливерпуля», — говорит Эш сайту HLTV. — И они придерживаются такого подхода уже несколько лет: ищут людей по статистике, возможно, недооценённых, и берут их».
Базовый подход всё ещё примитивен и предполагает следующее: Эш и помощник Адриан «imd» Пипер составляют длинный список, просматривают как можно больше статистики, а затем используют эти статистические данные, чтобы сократить список до приемлемого количества игроков и посмотреть демоверсии.
Разница в используемых статистических данных.
«Скайбокс стал для нас настоящим спасением, — рассказал Эш. — Мы обнаружили, что статистика разбита по ролям. Можно выбрать пять команд, и система разделит показатели игроков по раундам на покупку, экономическим раундам и раундам против экономики и определит, какими они „должны“ быть в зависимости от их позиций».
Это похоже на собственный «целевой рейтинг» HLTV, который даёт игрокам приблизительный средний рейтинг, который можно ожидать, исходя из их позиций. Например, у игрока на стороне защиты рейтинг будет в среднем 1,10, а у Уильяма «mezii» Мерримана — 1,02. Следовательно, игрок, играющий в сложных ролях на защите и имеющий рейтинг 1,10, заслуживает внимания в большей степени, чем звёздный снайпер.
Skybox позволяет пойти ещё дальше и анализировать раунды между командами при полных покупках.
Статистика на HLTV может показывать 1,15, но если заглянуть на Skybox, можно увидеть, что у игрока ecos рейтинг против соперников 2,16 за год или что-то подобное, и это безумно завышает количество его раундов. Однако у некоторых игроков с таким же рейтингом 1,15 рейтинг против ecos за год может быть только 0,97.
В итоге мы нашли FL4MUS, у него были очень низкие показатели рейтинга и попыток открытия по сравнению с другими игроками, но во время раундов на покупку его показатели были очень высокими, а рейтинг превышал средний на 0,2 в каждой сыгранной им позиции по сравнению со всеми этими топовыми командами.
Сравните это с blameF из fnatic, который с 23 июля совершает 36 % попыток открытия в антиэко-раундах и только 18 % — при полном банке против полного банка.
Это было в начале года, когда GamerLegion думали, что пропустили крупный турнир в Копенгагене (и до того, как Nemiga и Тимур «FL4MUS» Марев привлекли к себе внимание), и искали замену для Николаса «Keoz» Дгуса.
«Я буквально понятия не имела, кто такой FL4MUS, — продолжила Эш. — Он просто выделялся. Затем он попал в шорт-лист, и мы посмотрели его выступление, поэтому я и увидела, что он невероятно прошёл проверку глазами. Потом я анализирую статистику шорт-листа, смотрю, достаточно ли хороши цифры, сможет ли он вписаться в систему, как он играет, и уже отталкиваюсь от этого».
Аш признаёт, что такое использование Skybox даже не соответствует основной цели поддерживаемого Андерсом Блаумом продвинутого сервиса. Поиск талантов — это естественное продолжение их главной задачи: автоматизации трудоёмкой работы аналитиков.
Наша главная цель — ускорить исследования, которые вы проводите в отношении противников.
У компании есть множество инструментов для этого: 2D-воспроизведение, на которое можно накладывать раунды, симулятор вето, таблицы лидеров по каждой позиции и вышеупомянутые фильтры экономики для статистики команды и игроков.
Но эти меры на самом деле не предназначены для целей рекрутинга. Страница «Плейбук», изображённая ниже, скорее представляет собой тип работы с данными, в котором Skybox хочет стать нишей: они проанализировали раунды каждой команды, чтобы показать тенденции (как часто они атакуют, используют определённые стратегии или действуют по умолчанию) и конкретные версии своих раундов.
В 24 % раундов Astralis используют B execute с дымовой завесой CT, что на 10 % больше, чем в среднем по командам. Такой факт мог бы заметить аналитик при детальном анализе демонстрационных записей, но такой инструмент, как Skybox, указывает на это более целенаправленно.
«Мы хотим сэкономить командам много времени, — продолжает Диц. — Мы хотим выполнять анализ, который они делают вручную, одним щелчком кнопки мыши».
Вы можете даже увидеть, насколько успешна ваша команда на точках установки бомбы, при повторном захвате и после установки — больше подсказок о том, где команда сильна, а что для неё важнее, где есть слабые места.
Скайбокс — это, без сомнения, фантастический инструмент, но он всё ещё находится в разработке, и пользователи зависят от команды разработчиков в плане новых функций. Можно оставлять отзывы, но по-прежнему может быть сложно получить индивидуальную статистику.
Поэтому нужны аналитики данных, услуги которых стоят очень дорого. По данным Indeed, средний аналитик данных в США зарабатывает 79 113 долларов в год. Обычной киберспортивной команде практически невозможно оправдать такие расходы.
Жидкий аналитик Джей «ДеМарс ДеРовер» Ли — редкий пример аналитика в Counter-Strike, который в первую очередь работает с данными.
«Я вообще не играл», — говорит он HLTV. «Liquid проявила большое терпение».
Скромный и застенчивый, он даже не уверен, что нанял бы сам себя. «Честно говоря, я не думаю, что разумно нанимать специалиста по данным. Эти навыки не пересекаются. Создание хорошего программного обеспечения, хорошая математика, понимание статистики и теории вероятностей или чего-то ещё, а также знание, что такое дефолт, и текущая мета — они совершенно не совпадают».
Традиционным аналитикам, по мнению Де Марса Де Ровера, проще использовать общедоступные инструменты, такие как Skybox или Leetify, для получения аналитических данных, чем изучать игру с нуля. Это не означает, что он считает данные в CS бесполезными, совсем нет. Просто с точки зрения начинающего аналитика, эта команда не то место, которое он бы порекомендовал.
В спорте революции в области данных способствуют команды и консалтинговые компании, нанятые командами. В Counter-Strike это внешние компании с открытым доступом, такие как Skybox и Leetify, а также профессора-любители, занимающиеся исследованиями, например Питер Ксенопулос, исследование которого привело к тому, что команды стали более агрессивно покупать игроков после проигрыша в раунде с пистолетом.
Главная причина этого — качество и доступность данных Counter-Strike. «Эти данные бесплатны, их очень дёшево получить, с ними очень легко работать, и многие алгоритмы парсинга уже написаны», — объясняет Ли.
Я не думаю, что какой-либо другой вид спорта, профессиональный или любой другой, может предоставить такие хорошие данные, как Counter-Strike. Я уверен, что могу это утверждать. Частота, точность, бесплатность, скорость загрузки, доступность после каждого матча.
В нашем разговоре прослеживается уважение Ли к традиционным аналитикам, роль которого он в основном взял на себя. Он говорит: «На данный момент я просто аналитик, который создал несколько инструментов и облегчил себе работу». В Liquid нет отдела данных Moneyball. Роланд «ultimate» Томковяк казался таковым, но теперь стало ясно, что это была традиционная работа скаута, которую выполнял Рассел «Twistzz» Ван Далкен.
Я бы сказал, что поиск игроков и трансферы — это лишь небольшая часть моей работы, — говорит Ли. — Аналитики не так опытны, как игроки, когда дело доходит до оценки, и у них нет такого влияния, как у тренеров, когда речь заходит о перемещениях в составе.
Статистика позволяет нам рассмотреть более широкий круг игроков. Возможно, у нас нет времени смотреть все демо второго уровня, но мы можем проанализировать их и составить короткий список.
Перестановки в составе настолько важны, на их совершение есть только пять попыток, и в них вложено так много, что сложно оправдать их одними лишь цифрами. Люди, которые вносят наибольший вклад, являются ключевыми фигурами в команде, а не просто специалистами по математике на заднем плане.
Итак, мы вернулись к тому, с чего начали. Данные используются для фильтрации длинного списка, но на них нельзя полагаться так же, как на зрительную оценку профессионального игрока.
Но это не всеобщее мнение.
«Вы должны рассматривать [отдел данных] как многолетние инвестиции. Главная причина, по которой вы хотите создать команду, которая сможет выполнять эту работу внутри компании, заключается в том, что это выделит вашу организацию среди других. Дело не в доступе к данным, а в том, как вы их используете».
Это Сохам «valens» Чоудхури, успешный тренер Cloud9, а теперь руководитель отдела Data Science в Evil Geniuses.
Организация не пользуется лучшей репутацией в Counter-Strike, это справедливо сказать. Аналитических данных valens оказалось недостаточно, чтобы проект «Blueprint» стал успешным, так как различные североамериканские составы подвели организацию, прежде чем она покинула игру в январе 2024 года.
Но нет сомнений, что работа Valens новаторская и выходит далеко за рамки того, что делает любая другая команда. И то, что она не принесла трофеев или не превратила Пайтина «джуниора» Джонсона в Александра «симпла» Костылева, не делает её менее интересной.
Ранее Evil Geniuses нанимали аналитиков данных для каждой игры, включая иногда пишущего для HLTV Хуана «Hepa» Борхеса. Сейчас команда сократилась и состоит из valens и годового стажёра, при этом большую часть «ручной работы за клавиатурой» выполняет технологический партнёр HP enterprises.
Ещё в 2019 году Валенс, магистр Стэнфорда, использовал данные из игры в сочетании с файлами общения, чтобы проанализировать, какие игроки слишком часто или недостаточно часто делают вызовы, основываясь на информации, которая была доступна из демонстрационных записей.
Внутри команды существует собственный рейтинг, который называется EGR и учитывает коммуникацию, полезность, качество выполнения задач, механические навыки и то, насколько хорошо игрок проявляет себя в ситуациях, которые, по выражению валента, «реально определяют исход игры».
Общение, если спросить кого-то другого, неосязаемо. Но в EG при проведении пробных матчей игроки используют общение как осязаемый навык, который можно проанализировать и превратить в количественные данные. Теоретические преимущества при наборе игроков очевидны.
Они также делают акцент на определённых типах ситуаций. Важна не общая статистика убийств, а сочетание того, сколько «честных дуэлей» выигрывает игрок и как часто он может сделать дуэль «нечестной» в свою пользу.
Сейчас они используют машинное обучение, а именно LTSM, для последовательной оценки эффективности игроков. Валенс признаёт, что это в некотором роде «чёрный ящик», но это важная часть EGR.
Но данные, даже для валента, не являются панацеей. Беглое ознакомление с результатами EG говорит о том же. Это вспомогательный инструмент, который повышает эффективность и позволяет тренерам или организации сэкономить время и деньги в межсезонье. Он не является чудо-средством.
В большинстве соревновательных шутеров необходимо чувствовать игру. Если вы теряете связь с происходящим, если начинаете думать, что противник сделает то, что обычно делает в подобных ситуациях, это не должно влиять на ваши действия вопреки указаниям команды о перемещениях противников.
Есть объективные данные — «эта команда слабее по В, чем по А в перестрелках с пистолетами». Но это не значит, что для лидера в игре объективно правильно всегда выбирать В в таких раундах.
Также трудно быть универсальным. Стоит ли всегда спасать команду? Рассмотрим ситуацию 2 на 3 на площадке А на карте Inferno, когда многие команды без раздумий пошли бы на спасение. Вероятность отбить атаку невелика, как ни готовься. Но что, если данные показывают, что ваш противник плохо действует после установки бомбы в этом месте?
Вы также хотите оставаться непредсказуемым. Делать одно и то же снова и снова редко бывает оптимальным в игре со столь сложным деревом решений, как CS, даже если на бумаге цифры говорят об обратном.
Борьба с антистратами со стороны традиционных аналитиков, сбор видеозаписей или использование таких инструментов, как Skybox, уже превратили это в игру в кошки-мышки. Можно выявить чёткую тенденцию в данных или демоверсии, но к решающей третьей попытке противник полностью всё меняет.
Это верно и для спорта. Злоупотребление данными и слепая вера в несовершенную модель — это ловушка.
Возвращение «Ливерпуля» на вершину английского футбола стало возможным благодаря союзу гуру данных Яна Грэма, бывшего видеоаналитика и специалиста по проверке зрения Майкла Эдвардса и тренера поколения Юргена Клоппа. Все три стороны должны были дополнять друг друга и закрывать слабые места друг друга.
Эдвардс и Грэм, которые были похожи на дуэт генерального менеджера и учёного по данным, часто спорили. На ранних этапах сотрудничества Эдвардс критиковал каждую часть моделей Грэма, указывал на все недостатки и пробелы. Только когда модель удовлетворяла Эдвардса, она становилась частью процесса принятия решений.
Потенциал данных в Counter-Strike безграничен. Каждые 64 секунды собирается информация, которая может дать ценные сведения. Все имеют свободный доступ к библиотекам данных, за которые спортивные команды борются изо всех сил.
Книга Рори Смита «Ожидаемые голы» начинается с истории об Эшли Флоресе, филиппинском «операторе данных». Его работа — смотреть футбольные матчи и каждый раз, когда что-то происходит, нажимать короткую клавишу на клавиатуре. В CS в этом нет необходимости, так как всё уже встроено в игру.
Но никому не удалось превратить это в трофеи. Ни одна команда не является нашим эквивалентом «Окленд Атс» или «Ливерпуля». Кто знает, как может выглядеть революция данных в Counter-Strike?
Очевидно, что командам было бы полезно уделять больше внимания позициям и специалистам, заниматься самоанализом на основе данных для снижения непредсказуемости и более тщательно подходить к процессу поиска новых игроков, ставя во главу угла аналитику: справедливые дуэли, оценку эффективности с учётом экономики и детальный анализ полезности и коммуникации.
Нужно быть смелым руководителем, чтобы инвестировать в киберспорт в разгар «зимы» этой сферы, когда до 2025 года осталось не так много времени. Финансовые вложения в данные на данный момент — это риск в области, которая в лучшем случае склонна к краткосрочному планированию.
Инновации всегда связаны с риском. Долгосрочное погружение в данные позволит увеличить количество успешных сделок (и, следовательно, сэкономить на выкупах), повысить эффективность и дать ранним последователям заметное преимущество. Мы знаем, что под горой есть золото, но не знаем, кто его найдёт.