Apache Spark (от англ. spark — искра, вспышка) — программный каркас с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабоструктурированных данных.
BPB Publications, 2022. — 554 p. This book provides the reader with an up-to-date explanation of Machine Learning and an in-depth, comprehensive, and straightforward understanding of the architectural techniques used to evaluate and anticipate the futuristic insights of data using Apache Spark
Manning Publications, 2016. — 472 p. — ISBN: 978-1617292606. Spark in Action teaches you the theory and skills you need to effectively handle batch and streaming data using Spark. Fully updated for Spark 2.0. Big data systems distribute datasets across clusters of machines, making it a challenge to efficiently query, stream, and interpret them. Spark can help. It is a...
Apress, 2018. — 375 p. — ISBN: 978-1-4842-2148-8. See a Mesos-based big data stack created and the components used. You will use currently available Apache full and incubating systems. The components are introduced by example and you learn how they work together. In the , the author begins by creating a private cloud and then installs and examines Apache Brooklyn. After that,...
СПб.: Питер, 2018. — 352 с.: ил. — (Серия «Бестселлеры O’Reilly»). ISBN: 978-5-4461-0705-6. Если у вас уже есть положительный опыт использования Spark для решения небольших задач, но вы по-прежнему ломаете голову – где та самая непревзойденная производительность Spark, позволяющая перемалывать колоссальные объемы данных – то эта книга для вас. Она расскажет, как эффективно...
O’Reilly Media, 2019. — 156 р. — ISBN: 1491944242. To build analytics tools that provide faster insights, knowing how to process data in real time is a must, and moving from batch processing to stream processing is absolutely required. Fortunately, the Spark in-memory framework/platform for processing data has added an extension devoted to fault-tolerant stream processing:...
Комментарии