Теория и практика анализа параллельных систем баз данных
В монографии представлен новый класс математических моделей для оценки характеристик производительности параллельных систем баз данных (ПСБД). Модели учитывают стохастическую природу процесса обработки запросов, особенности функционирования баз данных и параметры предметной области. Авторы предлагают аналитический подход, основанный на теории массового обслуживания и преобразованиях Лапласа-Стилтьеса, что позволяет оценивать среднее время выполнения запросов без необходимости проведения дорогостоящих натурных экспериментов.
Рассматриваются различные архитектуры параллельных систем, включая кластерные решения на основе строчных (row-based) и колоночных (column-based) СУБД, а также систем NoSQL. Проводится их сравнительный анализ с точки зрения производительности и стоимости владения (TCO). Особое внимание уделяется методологии выбора оптимальной архитектуры для конкретной задачи, например, для построения хранилищ данных.
Книга содержит множество практических примеров, иллюстрирующих применение разработанных теоретических методов. Разбираются случаи оценки времени выполнения SQL-запросов к одной и нескольким таблицам, запросов к хранилищам данных (ROLAP), а также алгоритмы выбора архитектуры ПСБД. Издание предназначено для специалистов в области баз данных, системных архитекторов и исследователей, интересующихся теоретическими основами и практическими аспектами повышения производительности распределенных информационных систем.









