Опыт работы
Цифровой двойник
Компания занимается разработкой систем поддержки принятия решений и математическим моделированием (dtwin.ru); г. Санкт-Петербург.
Аналитик данных
Март 2024 – Октябрь 2025
Работа над проектами для внешних заказчиков и внутренними продуктами:
1. Прогнозирование финансовых потоков и оптимизация портфеля заказов для металлургического комбината
- Разработал модель LightGBM для прогноза задержки оплат заказов (MAE = 1.74 дня — точность сопоставима с экспертной)
- Реализовал генетический алгоритм оптимизации портфеля заказов (SMAPE = 5–15%) для достижения целевых KPI
- Создал интерактивный прототип (Shiny) для расчёта сценариев и визуализации результатов
2. Мониторинг и анализ рыночных и закупочных цен на строительные материалы для застройщика
- Реализовал модели для анализа факторов ценообразования (CatBoost, LightGBM) и семантическое сопоставление записей (RuSBERT + FAISS) для унификации данных из разных источников
- Автоматизировал сбор и анализ рыночных цен на строительные материалы (ETL на Prefect, отчётность на Quarto)
3. Формирование системы прогнозов и отчётности по показателям социально-экономического развития (СЭР) субъектов РФ
- Построил факторную модель (PCA + HHT-EMD + ARIMA) для прогноза 80+ показателей СЭР по 85 регионам (MAPE = 4–20%)
4. Развитие системы технического обслуживания и ремонта оборудования для энергетической корпорации
- Спроектировал хранилище данных (PostgreSQL, EAV + SCD2) и автоматизировал загрузку и обновление таблиц объёмом 500M+ строк (R / Python, индексы и процедуры PL/pgSQL)
Smooth Drug Development
Компания проводит клинические исследования лекарственных препаратов (smoothdd.com); г. Санкт-Петербург.
Биостатистик
Июль 2022 – Февраль 2024
- Провёл статистический анализ данных более чем 20 клинических исследований (R, SQL)
- Автоматизировал подготовку воспроизводимых статистических отчётов с валидацией данных
- Применял методы регрессионного и дисперсионного анализа, анализа выживаемости и статистические тесты для оценки эффективности и безопасности препаратов
Навыки
Языки: Python, R, SQL
ML и обработка данных: NumPy, Pandas, Polars, scikit‑learn, CatBoost, LightGBM, XGBoost, PyTorch
Визуализация и прогнозирование: Matplotlib, Plotly, Shiny, SHAP, statsmodels, NeuralForecast
Инструменты и инфраструктура: PostgreSQL, ClickHouse, Git, Docker, Airflow, FastAPI, LLM
Сферы: Classical ML, Time Series, NLP