Привет! Меня зовут Ольга Раденович
, я начинающий аналитик данных.
В этом репозитории вы можете найти некоторые из моих проектов, выполненных во время обучения и практики.
- Инструменты анализа данных:
SQL
,Excel
: - Языки программирования и библиотеки:
Python
,Pandas
,math
- Системы управления базами данных:
MySQL
,PostgreSQL
- Средства визуализации данных:
PowerBi
,Matplotlib
,seaborn
- Инструменты для машинного обучения:
scikit-learn
,TensorFlow
Проект 1: Калькулятор юнит-экономики онлайн-школы
Что нужно было сделать:
- Задача №1. Просчитать на какую сумму мы могли бы увеличить расходы на основных сотрудников (Fixed costs / ФОТ) в апреле 2021 года при условии, что Маржинальность в этом месяце не должна упасть ниже 11%?
- Задача №2. Просчитать маржинальность за март 2021 года, если доля бесплатных уроков в нём упадёт на 10 процентных пунктов? P.S. При этом общее количество уроков не изменится - просто часть бесплатных уроков мы "продадим" за полную цену в 1 200 рублей?
Как решала: Рассчитала юнит-калькулятор (CAC, ЗП Учителя на 1 урок, Fixed costs на 1 урок, Маржа). Затем, изменяя показатели маржи, просчитала изменение расходов на ФОТ, Lifetime Revenue (LTR) и маржинальность.
Выводы (итоги):
- Итог №1: При условии, что маржинальность в апреле 2021 года не должна упасть ниже 11%, мы могли бы увеличить расходы на основных сотрудников (Fixed costs / ФОТ) на 1 урок до 220,51 руб, т.е. на 45,46 руб
- Итог №2: Если бы бесплатных уроков было на 10 процентных пунктов меньше, а уроков за 1200 рублей на то же количество уроков больше, выручка увеличилась бы и составила 9 179 160 рублей. Маржинальность в марте 2021 года, пересчитанная с учётом уменьшившейся доли бесплатных уроков, составила бы 0,02%
Проект 2: Калькулятор юнит-экономики онлайн-кинотеатра
Что нужно было сделать:
- Задача №1. Учесть в калькуляторе корректировку планов маркетинга
- Задача №2. Пересчитать план найма преподавателей
Как решала: Добавила в список параметров калькулятора показатель «Поправочный коэффициент на привлечение». Посчитала, сколько появится новых студентов за период 05.21–04.22, если значение поправочного коэффициента для периода станет 12%. С помощью «Поиска решений» составила новый план найма с ограничением: за месяц нельзя нанять более 70 преподавателей.
Выводы (итоги):
- Итог №1: Обновленный лист с калькулятором + новое количество студентов на 04.2022.
- Итог №2: Обновленный план по найму с количеством новых преподавателей по месяцам за период с 05.2021 по 04.2022.
Проект 3: Когортный анализ онлайн-кинотеатра с помощью SQL
Что нужно было сделать:
Задача: Проанализировать клиентский LTV по когортам и сделать выводы: какие когорты лучше, а какие хуже с точки зрения LTV.
Как решала: Построила сводную таблицу с абсолютным ретеншеном клиентов по месячным когортам. Построила таблицу с относительным базовым ретеншеном. На основании ретеншена рассчитала лайфтайм с помощью метода усредненных прямоугольников для каждой когорты. Рассчитала LTR для каждой когорты с помощью ARPU. Расположила значение ARPU в отдельной ячейке, чтобы на него было удобно ссылаться в вычислениях. Рассчитала LTV с помощью усредненных костов для каждой когорты.
Выводы (итоги): Сделаны выводы относительно хороших и плохих когорт с точки зрения LTV.
- Итог №1: Выделена когорта, которая показывает высокий LTV за счет высокого лайфтайма - 01.05.2021
- Итог №2: Выделена когорта, которая показывает высокий LTV за счет низких костов - 01.11.2020
- Итог №3: Выделена когорта, которая показывает низкий LTV за счет низкого лайфтайма - 01.03.2021
- Итог №4: Выделена когорта, которая показывает низкий LTV за счет высоких костов - 01.01.2021
Проект 4: Построение витрины для модели машинного обучения в банке
Что нужно было сделать: задача - Написать скрипт, который сделает витрину со следующими полями:
- Внутренний идентификатор клиента — поле id_client.
- Название города — поле name_city из таблицы skybank.region_dict.
- Тип выданного кредита — поле credit_type.
- Суммарный объем кредитов, выданных в этом городе.
- Доля данного кредита среди всех кредитов, выданных в этом городе.
- Суммарный объем кредитов, выданных в рамках указанного типа кредита.
- Доля данного кредита среди всех кредитов, выданных в рамках указанного типа кредита.
- Суммарный объем кредитов, выданных в рамках указанного типа кредита и города.
- Доля данного кредита среди всех кредитов, выданных в рамках указанного типа кредита и города.
- Количество кредитов, выданных в этом городе.
- Количество кредитов, выданных в рамках указанного типа кредита.
- Количество кредитов, выданных в рамках указанного типа кредита и города.
Как решала: Для решения поставленной задачи я работала с таблицей skybank.late_collection_clients. Используя условный оператор CASE WHEN, функции SUM, COUNT, а также оператор LEFT JOIN для объединения двух таблиц, я написала необходимый скрипт.
Выводы (итоги): Подготовлена витрина для создания модели машинного обучения в банке.
Проект 5: Моделирование изменения балансов студентов
Что нужно было сделать:
- Задача №1: Найти ответы на вопросы - сколько всего уроков было на балансе всех учеников за каждый календарный день и как это количество менялось под влиянием транзакций (оплат, начислений, корректирующих списаний) и уроков (списаний с баланса по мере прохождения уроков). Написать запрос, который собирает данные о балансах студентов за каждый "прожитый" ими день.
- Задача №2: Создать визуализацию (линейную диаграмму) итогового результата. Сделать выводы из получившейся визуализации?
Как решала: Узнала, когда была первая транзакция для каждого студента. Нашла все изменения балансов, связанные с успешными транзакциями. Нашла баланс студентов, который сформирован только транзакциями. Нашла изменения балансов из-за прохождения уроков. Чтобы узнать, как менялось общее количество уроков на балансах студентов, просуммировала поля `transaction_balance_change`, `transaction_balance_change_cs`, `classes`, `classes_cs`, `balance` из CTE `balances` с группировкой и сортировкой по `dt`. Создала визуализацию (линейную диаграмму) итогового результата и сформулировала выводы из получившейся визуализации.
Выводы (итоги):
- Итог №1: Написан запрос, который собирает данные о балансах студентов за каждый "прожитый" ими день. Выявлено, что студенты учатся "в долг", об этом гговорят отрицательные балансы.
- Итог №2: Создана визуализация. Из графика видно, что часть уроков осталась на балансе, они проплачены, но не пройдены. Пик оплат приходится на первые числа месяцев. В целом, отмечается рост продаж