Skip to content

olgaradenovich/my-portfolio

Repository files navigation

Портфолио: аналитик данных

Обо мне

Привет! Меня зовут Ольга Раденович, я начинающий аналитик данных.

В этом репозитории вы можете найти некоторые из моих проектов, выполненных во время обучения и практики.

Навыки и технологии


  • Инструменты анализа данных: SQL, Excel:
  • Языки программирования и библиотеки: Python, Pandas, math
  • Системы управления базами данных: MySQL, PostgreSQL
  • Средства визуализации данных: PowerBi, Matplotlib, seaborn
  • Инструменты для машинного обучения: scikit-learn, TensorFlow

Проекты

Проект 1: Калькулятор юнит-экономики онлайн-школы

Что нужно было сделать:

  1. Задача №1. Просчитать на какую сумму мы могли бы увеличить расходы на основных сотрудников (Fixed costs / ФОТ) в апреле 2021 года при условии, что Маржинальность в этом месяце не должна упасть ниже 11%?
  2. Задача №2. Просчитать маржинальность за март 2021 года, если доля бесплатных уроков в нём упадёт на 10 процентных пунктов? P.S. При этом общее количество уроков не изменится - просто часть бесплатных уроков мы "продадим" за полную цену в 1 200 рублей?

Как решала: Рассчитала юнит-калькулятор (CAC, ЗП Учителя на 1 урок, Fixed costs на 1 урок, Маржа). Затем, изменяя показатели маржи, просчитала изменение расходов на ФОТ, Lifetime Revenue (LTR) и маржинальность.

Ссылка на проект

Выводы (итоги):

  1. Итог №1: При условии, что маржинальность в апреле 2021 года не должна упасть ниже 11%, мы могли бы увеличить расходы на основных сотрудников (Fixed costs / ФОТ) на 1 урок до 220,51 руб, т.е. на 45,46 руб
  2. Итог №2: Если бы бесплатных уроков было на 10 процентных пунктов меньше, а уроков за 1200 рублей на то же количество уроков больше, выручка увеличилась бы и составила 9 179 160 рублей. Маржинальность в марте 2021 года, пересчитанная с учётом уменьшившейся доли бесплатных уроков, составила бы 0,02%

Проект 2: Калькулятор юнит-экономики онлайн-кинотеатра

Что нужно было сделать:

  1. Задача №1. Учесть в калькуляторе корректировку планов маркетинга
  2. Задача №2. Пересчитать план найма преподавателей

Как решала: Добавила в список параметров калькулятора показатель «Поправочный коэффициент на привлечение». Посчитала, сколько появится новых студентов за период 05.21–04.22, если значение поправочного коэффициента для периода станет 12%. С помощью «Поиска решений» составила новый план найма с ограничением: за месяц нельзя нанять более 70 преподавателей.

Ссылка на проект

Выводы (итоги):

  1. Итог №1: Обновленный лист с калькулятором + новое количество студентов на 04.2022.
  2. Итог №2: Обновленный план по найму с количеством новых преподавателей по месяцам за период с 05.2021 по 04.2022.


Проект 3: Когортный анализ онлайн-кинотеатра с помощью SQL

Что нужно было сделать:

Задача: Проанализировать клиентский LTV по когортам и сделать выводы: какие когорты лучше, а какие хуже с точки зрения LTV.

Как решала: Построила сводную таблицу с абсолютным ретеншеном клиентов по месячным когортам. Построила таблицу с относительным базовым ретеншеном. На основании ретеншена рассчитала лайфтайм с помощью метода усредненных прямоугольников для каждой когорты. Рассчитала LTR для каждой когорты с помощью ARPU. Расположила значение ARPU в отдельной ячейке, чтобы на него было удобно ссылаться в вычислениях. Рассчитала LTV с помощью усредненных костов для каждой когорты.

Ссылка на проект

Выводы (итоги): Сделаны выводы относительно хороших и плохих когорт с точки зрения LTV.

  1. Итог №1: Выделена когорта, которая показывает высокий LTV за счет высокого лайфтайма - 01.05.2021
  2. Итог №2: Выделена когорта, которая показывает высокий LTV за счет низких костов - 01.11.2020
  3. Итог №3: Выделена когорта, которая показывает низкий LTV за счет низкого лайфтайма - 01.03.2021
  4. Итог №4: Выделена когорта, которая показывает низкий LTV за счет высоких костов - 01.01.2021

Проект 4: Построение витрины для модели машинного обучения в банке

Что нужно было сделать: задача - Написать скрипт, который сделает витрину со следующими полями:

  1. Внутренний идентификатор клиента — поле id_client.
  2. Название города — поле name_city из таблицы skybank.region_dict.
  3. Тип выданного кредита — поле credit_type.
  4. Суммарный объем кредитов, выданных в этом городе.
  5. Доля данного кредита среди всех кредитов, выданных в этом городе.
  6. Суммарный объем кредитов, выданных в рамках указанного типа кредита.
  7. Доля данного кредита среди всех кредитов, выданных в рамках указанного типа кредита.
  8. Суммарный объем кредитов, выданных в рамках указанного типа кредита и города.
  9. Доля данного кредита среди всех кредитов, выданных в рамках указанного типа кредита и города.
  10. Количество кредитов, выданных в этом городе.
  11. Количество кредитов, выданных в рамках указанного типа кредита.
  12. Количество кредитов, выданных в рамках указанного типа кредита и города.

Как решала: Для решения поставленной задачи я работала с таблицей skybank.late_collection_clients. Используя условный оператор CASE WHEN, функции SUM, COUNT, а также оператор LEFT JOIN для объединения двух таблиц, я написала необходимый скрипт.

Ссылка на проект

Выводы (итоги): Подготовлена витрина для создания модели машинного обучения в банке.


Проект 5: Моделирование изменения балансов студентов

Что нужно было сделать:

  1. Задача №1: Найти ответы на вопросы - сколько всего уроков было на балансе всех учеников за каждый календарный день и как это количество менялось под влиянием транзакций (оплат, начислений, корректирующих списаний) и уроков (списаний с баланса по мере прохождения уроков). Написать запрос, который собирает данные о балансах студентов за каждый "прожитый" ими день.
  2. Задача №2: Создать визуализацию (линейную диаграмму) итогового результата. Сделать выводы из получившейся визуализации?

Как решала: Узнала, когда была первая транзакция для каждого студента. Нашла все изменения балансов, связанные с успешными транзакциями. Нашла баланс студентов, который сформирован только транзакциями. Нашла изменения балансов из-за прохождения уроков. Чтобы узнать, как менялось общее количество уроков на балансах студентов, просуммировала поля `transaction_balance_change`, `transaction_balance_change_cs`, `classes`, `classes_cs`, `balance` из CTE `balances` с группировкой и сортировкой по `dt`. Создала визуализацию (линейную диаграмму) итогового результата и сформулировала выводы из получившейся визуализации.

Ссылка на проект

Выводы (итоги):

  1. Итог №1: Написан запрос, который собирает данные о балансах студентов за каждый "прожитый" ими день. Выявлено, что студенты учатся "в долг", об этом гговорят отрицательные балансы.
  2. Итог №2: Создана визуализация. Из графика видно, что часть уроков осталась на балансе, они проплачены, но не пройдены. Пик оплат приходится на первые числа месяцев. В целом, отмечается рост продаж

Контактная информация

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published