Корпоративно-инвестиционный блок Сбербанка разработал модель прогнозирования выручки компаний, используя машинное обучение на основе транзакционных данных. Она построена для всех 8 млн компаний (ИП и юрлиц), присутствующих на российском рынке.
Разработанная модель позволяет получать прогнозы выручки текущего года по всем активным ИНН на девять месяцев раньше, чем данные результаты публикуются официально. Это дает возможность заранее планировать работу с компаниями. К тому же с помощью новой модели можно получать прогнозы в том числе и по ИП, информации о которых пока нет ни в одном открытом источнике.
В данном случае была использована модель класса black box, основанная на деревьях решений — Random Forest Regression.
Станислав Карташов, директор дивизиона «Корпоративные клиенты 360» блока «Корпоративно-инвестиционный бизнес» Сбербанка:
«ML-модель такого типа создается в течение как минимум трех месяцев и предполагает масштабное исследование более 1000 признаков. С ее помощью мы здесь и сейчас, не дожидаясь завершения календарного года и официальной бухгалтерской отчетности, видим потенциал клиента. Более того, она обогащает другие разрабатываемые нами модели, что позволяет нам предвосхищать ожидания и потребности наших клиентов».