Можно считать, что выборка несбалансирована, когда размеры классов отличаются более, чем в 10 раз. Больший класс называют доминирующим, меньший класс называется минорным. Качество можно повысить с помощью корректировки весов объектов, искусственной модификации датасета. Accuracy и AUC слабо изменяются при изменении модели, более чувствительна метрика F-Score.
- https://www.kaggle.com/mlg-ulb/creditcardfraud
- http://pages.cs.wisc.edu/~jdavis/davisgoadrichcamera2.pdf
- Презентация Богдана Мельника (ld86) про обучение на несбалансированных выборках
- What's AI
- Daniel Bourke
- Mark Saroufim
- Nicholas Renotte
- Abhishek Thakur
- Aladdin Persson
- CodeEmporium
- Jay Alammar
- Yacine Mahdid
- Henry AI Labs
- Smitha Kolan - Machine Learning Engineer
- AI Coffee Break with Letitia
- deeplizard
- The Independent Code
- Alfredo Canziani
- Cassie Kozyrkov
- AIEngineering
- Kapil Sachdeva
- AI Coding
- Valerio Velardo - The Sound of AI
- mildlyoverfitted
- cs.LG - Machine Learning: (new, recent, current month)
- stat.ML