Анализ больших наборов данных
| Autor principal: | |
|---|---|
| Altres autors: | , |
| Sumari: | Эта книга написана ведущими специалистами в области технологий баз данных и веба. Она будет в равной мере полезна студентам и программистам-практикам. Благодаря популярности веба и интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых можно применить методы добычи данных. В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности. Книга из коллекции ДМК Пресс - Информатика |
| Publicat: |
Москва, ДМК Пресс, 2016
|
| Matèries: | |
| Accés en línia: | https://e.lanbook.com/book/93571 https://e.lanbook.com/img/cover/book/93571.jpg |
| Format: | Electrònic Llibre |
| Descripció física: | 498 с. |
|---|---|
| Sumari: | Эта книга написана ведущими специалистами в области технологий баз данных и веба. Она будет в равной мере полезна студентам и программистам-практикам. Благодаря популярности веба и интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых можно применить методы добычи данных. В книге описываются алгоритмы, которые реально использовались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Изложение начинается с рассмотрения технологии MapReduce – важного средства распараллеливания алгоритмов. Излагаются алгоритмы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о социальных сетях, машинном обучении и понижении размерности. Книга из коллекции ДМК Пресс - Информатика |
| ISBN: | 978-5-97060-190-7 |