Запатентованная разработка команды HeadHunter вошла в число финалистов конкурса Роспатента «Успешный патент» по выявлению наиболее коммерчески успешных изобретений, получивших экономический эффект по итогам 2020-2021 годов. В конкурсе приняли участие 129 отечественных правообладателей, имеющих патент на изобретение, выданный в 2020-2021 годах.
HeadHunter в 2020 году получил патент на способ автоматизированного поиска релевантных резюме и вакансий для рекомендательной системы Умного поиска hh.ru с использованием машинного обучения и с понижением размерности многомерных данных. Запатентованный компонент Умного поиска hh.ru был изобретен сотрудниками группы анализа данных и машинного обучения HeadHunter – Георгием Даньщиным, Виктором Реушкиным и Александром Сидоровым. Получение патента на эту разработку и подготовку заявки для участия в конкурсе осуществлял Юридический департамент HeadHunter в лице Юрия Донникова и Дарьи Першенковой.
Изобретение позволяет быстро, за сотни миллисекунд, выбирать из миллионов резюме и сотен тысяч вакансий и соотносить друг с другом те из них, у которых похож не только текст, но и смысл. И делает это лучше, чем явные, подобранные вручную правила
Благодаря этому улучшается качество рекомендаций резюме и вакансий и требуется меньше вычислительных ресурсов, мы экономим память и процессоры серверов.
В результате hh.ru уже в течение двух лет применяет более сложные ML-модели, с большим количеством признаков, чтобы рекомендовать вакансии. Запатентованные компоненты позволяют сильно уменьшать объем данных, сохраняя существенную часть их смысла. Затем эти данные используются для очень быстрого предварительного отбора вакансий и резюме, из которых потом модели более точно выбирают подходящие.
HeadHunter из больших полноразмерных данных получает сжатые, но сохраняющие определенный смысл, чтобы без потери качества и скорости обработки этих данных рекомендовать для вакансий резюме, а для резюме — вакансии.
Изобретение используется как для обработки запросов работодателей при поиске в базе резюме, так и для обработки запросов соискателей при поиске вакансий.
Александр Сидоров, руководитель направления анализа данных hh.ru, прокомментировал результаты и эффект применения запатентованного компонента Умного поиска, который был отмечен наградой Роспатента:
«Благодаря hh.ru сотни тысяч работодателей и соискателей находят друг друга как в России, так и за её пределами. Чтобы это происходило быстрее и оптимальнее, наши разработчики используют прикладной искусственный интеллект. Решения, которые у нас получаются, сильно отличаются от применяемых, к примеру, в веб-поиске, из-за очень большого разнообразия и специфики предметной области найма и работы, и очень высоких требований к качеству выдачи, которую видят работодатели и соискатели, причём не только первых нескольких десятков документов.
В 2018 нам потребовалось сделать рекомендации резюме для вакансий, с учётом географического местоположения и интересов работодателей и соискателей. Но тот момент в нашей базе уже было больше 40 млн резюме и 600 тыс. вакансий. И посчитать сложными математическим моделями, подобранными с помощью машинного обучения, вероятность, что каждое резюме пригласят на каждую вакансию – нельзя. Тем более в онлайн, за 50 мс, пока пользователь ждёт отрисовки веб-страницы или экранного мобильного приложения.
Для решения этой проблемы можно пытаться придумывать эвристики и классификаторы резюме и вакансий. Например, оцифровать резюме и вакансию, представить их в виде векторов чисел. Потом снизить размерность этих векторов, представив их в виде хешей. Причём использовать для вычисления этих хешей такую функцию, которая позволяла хешам быть похожими с точки зрения последовательностей отдельных битов информации, если работодатель с большой вероятностью пригласит соискателя с определённым резюме на собеседование на вакансию. Дальше – положить эти хеши в поля базы, и когда приходит работодатель с вакансией – делать запрос «выдать все резюме, хеш которых отличается не более чем на N бит». И уже дальше, получив несколько десятков тысяч резюме, применять к ним более сложные и ресурсоёмкие модели. Технические подробности этого – в нашем патенте.
В результате, мы смогли запустить рекомендации резюме на вакансии, и с тех пор их использование выросло настолько, что большинство соискателей по базе резюме работодатели приглашают не с помощью поиска, а из резюме, которые рекомендуются на их конкретные вакансии. Это позволяет тратить на то, чтобы найти подходящего кандидата и пригласить его на собеседование, примерно в 6 раз меньше времени, а значит сделать наем проще и быстрее и для работодателя, и для соискателя, опубликовавшего резюме.
Мы решили запатентовать это решение не только чтобы его защитить, но и чтобы им поделиться. Мы верим, что подобный подход может пригодиться и в других компаниях, которые применяют искусственный интеллект на практике, чтобы стать удобнее, полезнее, эффективнее для своих клиентов. Особенно в многосторонних маркетплейсах. И этим сделать жизнь людей немного лучше.
Мы очень рады и горды, что Российское патентное ведомство удостоило нашу разработку в сфере искусственного интеллекта такого внимания и признания!»
Идеальные кандидаты и где они обитают: 15 источников поиска
HeadHunter (hh.ru) — крупнейшая платформа онлайн-рекрутинга в России, клиентами которой являются свыше 450 тыс. компаний. Цель HeadHunter – помогать компаниям находить сотрудников, а людям – работу, и делать так, чтобы процесс поиска сотрудников и работы был быстрым и доставлял обеим сторонам только положительные впечатления. Обширная база компании содержит свыше 55 млн резюме, а среднее дневное количество вакансий в течение 2021 г. составило свыше 900 тысяч ежемесячно. По данным SimilarWeb, hh.ru занимает третье место в мире по популярности среди порталов по поиску работы и сотрудников. HeadHunter — аккредитованная Министерством цифрового развития ИТ-компания, она включена в Реестр аккредитованных ИТ-компаний России. Вся инфраструктура — локальная, на собственных серверах компании в московских дата-центрах. Безопасности данных ничего не угрожает. У HeadHunter нет никаких критичных завязок на иностранные сервисы. Это исключает сбои или приостановку проектов компании.
