项目作者: blanchefort

项目描述 :
Salary prediction for TrudHack
高级语言: Jupyter Notebook
项目地址: git://github.com/blanchefort/trudhack.git
创建时间: 2020-07-11T07:08:56Z
项目社区:https://github.com/blanchefort/trudhack

开源协议:MIT License

下载


Система определения предлагаемой заработной платы

Модель для предикта зарплаты по нескольким входящим параметрам:

  • Название вакансии
  • Тип занятости (код)
  • Тип графика (код)
  • Опыт (код)
  • Город

Модель архитектуры TabNet обучалась на выборочных данных портала HeadHunter за 2019-2020 гг.

Сейчас модель делает предикт для некоторых городов России, но имеется возможность сделать так, чтобы модель определяла зарплату для вакансии любой точки России.

Код

  • Ноутбук, в котором отображён процесс предобработки данных
  • Ноутбук, в котором отображён процесс обучения модели
  • Файл app.py содержит код, который загружает и инициализирует веса обученной модели и делает возможность обращаться к ней посредством REST API запросов.
  • Ноутбук, в котором показано, как получать предикты с помощью API.

Презентации

В файле notebooks/results.txt содержится пример результата работы модели. Там даны наименование вакансии, указанная зарплата и предсказанная моделью зарплата. Как видно, модель в ряде случаев несколько завышает зарплату по сравнению с официально заявленной для данной позиции. (Видимо, модель понимает реальное экономическое положение соискателей, и старается им помочь😻).

Как запустить файл app.py у себя

Установка и запуск:

  1. git clone https://github.com/blanchefort/trudhack.git
  2. cd trudhack
  3. python -m venv venv
  4. pip install -r requirements.txt

Запуск:

  1. python app.py

Или так:

  1. uvicorn app:app --port 5000 --host 0.0.0.0

Документация API:

  1. http://35.225.239.24:5000/docs
  2. http://35.225.239.24:5000/redoc

Контакты

  1. Игорь Шаталин
  2. +7 987 655 67 79
  3. shatalin.ip@gmail.com
  1. Андрей Лукин
  2. andrew.luckin2015@yandex.ru