Pandas. Работа с данными. 2-е изд

Pandas. Работа с данными. 2-е изд

Абдрахманов М.И. 2020 Devpractice Team

Книга посвящена библиотеке для работы с данным pandas. Помимо базовых знаний о структурах pandas, вы получите информацию о том как работать с временными рядами, считать статистики, визуализировать данные и т.д.. Большое внимание
уделено практике, все рассматриваемые возможности библиотеки сопровождаются подробными примерами.

Что такое pandas?

Pandas - это библиотека, которая предоставляет очень удобные, с точки зрения использования, инструменты для хранения и работы с данными. Если вы занимаетесь анализом данных или машинным обучением и при этом используете язык Python, то знание pandas значительно упростит вам работу.

Pandas входит в группу (https://www.numfocus.org/). проектов, Numfocus - спонсируемых это организация, numfocus которая поддерживает различные проекты и программное обеспечение научной тематики.

Официальный сайт pandas находится здесь http://pandas.pydata.org/. Стоит отметить, что у данного продукта хорошая документация, можете перейти по ссылке (http://pandas.pydata.org/pandas-docs/stable/) чтобы ознакомиться с ней.

Особенность pandas состоит в том, что эта библиотека очень быстрая и гибкая, а т.к. она используется с языком Python, который не отличается высокой производительностью, вопрос быстродействия, при работе с большими объемами данных, становится одним из ключевых. Pandas прекрасно подходит для работы с одномерными и двумерными таблицами данных, хорошо интегрирован с внешним миром: есть возможность работать с файлами CSV, таблицами Excel, может стыковаться с языком R.

Установка pandas

Для проведения научных расчетов, анализа данных и построения моделей в рамках машинного обучения, для языка Python существуют прекрасное решение - Anaconda. Anaconda - это пакет, который содержит в себе большой набор различных библиотек, интерпретатор языка Python и несколько сред для разработки.

Pandas присутствует в стандартной поставке Anaconda. Если же его там нет, то его можно установить отдельно. Для этого стоит воспользоваться пакетным менеджером, который входит в состав Anaconda, который называется conda.

Для его запуска необходимо перейти в каталог [Anaconda install path]\Scripts\ в Windows. В операционной системе Linux, после установки Anaconda менеджер conda должен быть доступен везде.

Введите командной строке:

conda install pandas

В случае, если требуется конкретная версия pandas, то ее можно указать при установке:

conda install pandas=0.13.1
При необходимости, можно воспользоваться пакетным менеджером pip, входящим в состав дистрибутива Python:

pip install pandas

Если вы используете Linux, то есть ещё одни способ установить pandas - это воспользоваться пакетным менеджером самой операционной системы. Для Ubuntu это выглядит так:

sudo apt-get install python-pandas

После установки необходимо проверить, что pandas установлен и корректно работает. Для этого запустите интерпретатор Python и введите в нем следующие команды (набор символов >>> вводить не нужно, это приглашение интерпретатора Python):

>>> import pandas as pd
>>> pd.test()

В результате, в окне терминала должен появиться следующий текст:

Running unit tests for pandas
pandas version 0.18.1
numpy version 1.11.1
pandas is installed in c:\Anaconda3\lib\site-packages\pandas
Python version 3.5.2 |Anaconda 4.1.1 (64-bit)| (default, Jul 5 2016,
11:41:13) [MSC v.1900 64 bit (AMD64)]
nose version 1.3.7
..........
-------------------------------------------------------------
Ran 11 tests in 0.422s
OK

Это означает, что pandas установлен и его можно использовать.

Для того чтобы скачать книгу, Вам необходимо Авторизоваться или пройти Регистрацию

Раскрыть комментарии 0

Пока к этой статье нет комментариев

Чтобы оставить комментарий , Вам необходимо Авторизоваться или пройти Регистрацию