Анализ больших наборов данных, пер. с англ.

Bibliographic Details
Main Author: Лесковец Ю. Юре
Other Authors: Раджараман А. Ананд, Ульман Дж. Джеффри
Summary:Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining).В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом при­менены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce важного средства распараллелива­ния алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показа­теля PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.Издание будет в равной мере полезна студентам и программистам-прак­тикам.
Language:Russian
Published: Москва, ДМК Пресс, 2016
Subjects:
Format: Book
KOHA link:https://koha.lib.tpu.ru/cgi-bin/koha/opac-detail.pl?biblionumber=319318
Description
Physical Description:498 с. ил.
Summary:Эта книга написана ведущими специалистами в области технологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы добычи данных (data mining).В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом при­менены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce важного средства распараллелива­ния алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показа­теля PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности.Издание будет в равной мере полезна студентам и программистам-прак­тикам.
ISBN:9785970601907