Изучаем Spark: молниеносный анализ данных

Bibliographic Details
Main Author: Карау Х.
Other Authors: Конвински Э., Венделл П., Захария М.
Summary:Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala. Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она рассказывает, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.
Книга из коллекции ДМК Пресс - Информатика
Published: Москва, ДМК Пресс, 2015
Subjects:
rdd
Online Access:https://e.lanbook.com/book/90118
https://e.lanbook.com/img/cover/book/90118.jpg
Format: Electronic Book