Data Without Labels: Practical Unsupervised Machine Learning
Книга «Data Without Labels» представляет собой практическое руководство по методам машинного обучения без учителя (unsupervised learning). Автор Vaibhav Verdhan подробно рассматривает ключевые техники работы с немаркированными данными, которые составляют подавляющее большинство реальных данных в бизнесе и науке.
В первой части книги читатель знакомится с основами машинного обучения, типами данных и их подготовкой. Особое внимание уделяется кластеризации и уменьшению размерности — фундаментальным методам для выявления скрытых структур в данных. Автор объясняет, как эти методы помогают сегментировать клиентов, обнаруживать аномалии и сокращать сложность данных.
Вторая часть углубляется в более сложные темы: ассоциативные правила, продвинутые алгоритмы кластеризации и обработку текстовых данных. Практические примеры показывают, как применять эти методы для анализа поведения пользователей, выявления паттернов покупок и извлечения смысла из неструктурированного текста.
Заключительные главы посвящены современным подходам, включая автоэнкодеры, генеративно-состязательные сети (GAN) и генеративный искусственный интеллект. Книга завершается руководством по развертыванию моделей, что делает её ценным ресурсом для data scientists и ML-инженеров, стремящихся внедрить unsupervised learning в производство.









