Анализ больших наборов данных

Dades bibliogràfiques
Autor principal: Юре Л.
Altres autors: Ананд Р., Джеффри Д. У.
Sumari:Эта книга написана ведущими специалистами в области технологий баз данных и веба. Она будет в равной мере полезна студентам и программистам-практикам. Благодаря популярности веба и интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых можно применить методы добычи данных. В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.
Книга из коллекции ДМК Пресс - Информатика
Publicat: Москва, ДМК Пресс, 2016
Matèries:
Accés en línia:https://e.lanbook.com/book/93571
https://e.lanbook.com/img/cover/book/93571.jpg
Format: Electrònic Llibre
Descripció
Descripció física:498 с.
Sumari:Эта книга написана ведущими специалистами в области технологий баз данных и веба. Она будет в равной мере полезна студентам и программистам-практикам. Благодаря популярности веба и интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых можно применить методы добычи данных. В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.
Книга из коллекции ДМК Пресс - Информатика
ISBN:978-5-97060-190-7