Pandas. Работа с данными. 2-е изд
Книга посвящена библиотеке для работы с данным pandas. Помимо базовых знаний о структурах pandas, вы получите информацию о том как работать с временными рядами, считать статистики, визуализировать данные и т.д.. Большое внимание
уделено практике, все рассматриваемые возможности библиотеки сопровождаются подробными примерами.
Что такое pandas?
Pandas - это библиотека, которая предоставляет очень удобные, с точки зрения использования, инструменты для хранения и работы с данными. Если вы занимаетесь анализом данных или машинным обучением и при этом используете язык Python, то знание pandas значительно упростит вам работу.
Pandas входит в группу (https://www.numfocus.org/). проектов, Numfocus - спонсируемых это организация, numfocus которая поддерживает различные проекты и программное обеспечение научной тематики.
Официальный сайт pandas находится здесь http://pandas.pydata.org/. Стоит отметить, что у данного продукта хорошая документация, можете перейти по ссылке (http://pandas.pydata.org/pandas-docs/stable/) чтобы ознакомиться с ней.
Особенность pandas состоит в том, что эта библиотека очень быстрая и гибкая, а т.к. она используется с языком Python, который не отличается высокой производительностью, вопрос быстродействия, при работе с большими объемами данных, становится одним из ключевых. Pandas прекрасно подходит для работы с одномерными и двумерными таблицами данных, хорошо интегрирован с внешним миром: есть возможность работать с файлами CSV, таблицами Excel, может стыковаться с языком R.
Установка pandas
Для проведения научных расчетов, анализа данных и построения моделей в рамках машинного обучения, для языка Python существуют прекрасное решение - Anaconda. Anaconda - это пакет, который содержит в себе большой набор различных библиотек, интерпретатор языка Python и несколько сред для разработки.
Pandas присутствует в стандартной поставке Anaconda. Если же его там нет, то его можно установить отдельно. Для этого стоит воспользоваться пакетным менеджером, который входит в состав Anaconda, который называется conda.
Для его запуска необходимо перейти в каталог [Anaconda install path]\Scripts\ в Windows. В операционной системе Linux, после установки Anaconda менеджер conda должен быть доступен везде.
Введите командной строке:
conda install pandas
В случае, если требуется конкретная версия pandas, то ее можно указать при установке:
conda install pandas=0.13.1
При необходимости, можно воспользоваться пакетным менеджером pip,
входящим в состав дистрибутива Python:
pip install pandas
Если вы используете Linux, то есть ещё одни способ установить pandas - это воспользоваться пакетным менеджером самой операционной системы. Для Ubuntu это выглядит так:
sudo apt-get install python-pandas
После установки необходимо проверить, что pandas установлен и корректно работает. Для этого запустите интерпретатор Python и введите в нем следующие команды (набор символов >>> вводить не нужно, это приглашение интерпретатора Python):
>>> import pandas as pd
>>> pd.test()
В результате, в окне терминала должен появиться следующий текст:
Running unit tests for pandas
pandas version 0.18.1
numpy version 1.11.1
pandas is installed in c:\Anaconda3\lib\site-packages\pandas
Python version 3.5.2 |Anaconda 4.1.1 (64-bit)| (default, Jul 5 2016,
11:41:13) [MSC v.1900 64 bit (AMD64)]
nose version 1.3.7
..........
-------------------------------------------------------------
Ran 11 tests in 0.422s
OK
Это означает, что pandas установлен и его можно использовать.
Для того чтобы скачать книгу, Вам необходимо Авторизоваться или пройти Регистрацию
Метки
Раскрыть комментарии 0
Чтобы оставить комментарий , Вам необходимо Авторизоваться или пройти Регистрацию