Hadoop: The Definitive Guide


Author: Tom White
Publisher: "O'Reilly Media, Inc."
ISBN: 1449311520
Category: Computers
Page: 657
View: 7954
DOWNLOAD NOW »
Counsels programmers and administrators for big and small organizations on how to work with large-scale application datasets using Apache Hadoop, discussing its capacity for storing and processing large amounts of data while demonstrating best practices for building reliable and scalable distributed systems.

Big Data in der Praxis

Beispiellösungen mit Hadoop und NoSQL. Daten speichern, aufbereiten, visualisieren
Author: Jonas Freiknecht
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 3446441778
Category: Computers
Page: 448
View: 8605
DOWNLOAD NOW »
BIG DATA IN DER PRAXIS // - Für Analysten, BI-Verantwortliche, Data-Scientists, Consultants - Auf der DVD finden Sie: 18 fertige Projekte, die im Buch Schritt für Schritt entwickelt werden; Videotutorials u.a. zur Installation von Hadoop, Hive, HBase (Gesamtdauer: 80 Min.); Testdatensätze für die Wissensdatenbank Dieses Buch bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und bekommen aufgezeigt, wie Sie bestehende Systeme vorausschauend auf die mit dem Big Data-Trend einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu behandeln. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit dem Autor werden Sie ganz konkret Schritt für Schritt viele kleinere Projekte aufbauen bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen. AUS DEM INHALT // Einführung rund um Big Data // Hadoop installieren, konfigurieren & bedienen // HDFS, Map-Reduce & YARN: Daten speichern und verarbeiten // Hadoop-Ecosystem: Überblick über dessen Komponenten // Einführung in NoSQL // HBase installieren, einrichten & auf Daten zugreifen // Data-Warehousing mit Apache Hive // HiveQL als Abfragesprache, Hive Security, Hive & JDBC // Datenimport aus relationalen Datenbanken mit Sqoop // Big Data-Visualisierung: Diagrammarten, Tipps & Trends // Visualisierungs-Frameworks im Vergleich // D3.js: Entwicklung einiger Beispieldiagramme // Entwicklung einer abschließenden Big Data-Analyse-Lösung // Troubleshooting für die Arbeit mit Hadoop, Hive & HBase

Die Regeln der Arbeit


Author: Richard Templar
Publisher: books4success
ISBN: 3941493132
Category: Self-Help
Page: 250
View: 5386
DOWNLOAD NOW »
Für manche Menschen ist der Arbeitsalltag das schiere Vergnügen. Scheinbar ohne sich anzustrengen meistern Sie die Fallstricke der Büropolitik. Sie sagen und tun das Richtige, sie bekommen die Gehaltserhöhung, sie werden befördert. Was wissen diese Glücklichen, was alle anderen scheinbar nicht wissen? Sie kennen die Regeln. Die Regeln der Arbeit. Diese Regeln sind überraschend einfach zu lernen - und wenn man sie einmal kennt, dann kann man sie ebenso einfach im täglichen Leben beibehalten. Richard Templar hat sie in einem Buch zusammengefasst: den "Regeln der Arbeit". Erfahren Sie, wie Sie vorankommen, ohne Ihre Prinzipien aufgeben zu müssen; wie Sie das Selbstvertrauen und die Energie ausstrahlen, die Vertrauen und Respekt erzeugen; wie Sie die perfekte Nische für sich schaffen; wie Sie Konflikte lösen ohne die anderen vor den Kopf zu stoßen; und last but not least: wie Sie in den Schlüsselmomenten, die Ihre Karriere beflügeln können, aktiv, präsent und erfolgreich sind.

Hadoop

Zuverlässige, verteilte und skalierbare Big-Data-Anwendungen
Author: Ramon Wartala
Publisher: N.A
ISBN: 9783941841611
Category:
Page: 312
View: 9704
DOWNLOAD NOW »


Big Data

Die Revolution, die unser Leben verändern wird
Author: Viktor Mayer-Schönberger,Viktor; Cukier Mayer-Schönberger
Publisher: Redline Wirtschaft
ISBN: 3864144590
Category: Political Science
Page: 288
View: 7832
DOWNLOAD NOW »
Ob Kaufverhalten, Grippewellen oder welche Farbe am ehesten verrät, ob ein Gebrauchtwagen in einem guten Zustand ist – noch nie gab es eine solche Menge an Daten und noch nie bot sich die Chance, durch Recherche und Kombination in der Daten¬flut blitzschnell Zusammenhänge zu entschlüsseln. Big Data bedeutet nichts weniger als eine Revolution für Gesellschaft, Wirtschaft und Politik. Es wird die Weise, wie wir über Gesundheit, Erziehung, Innovation und vieles mehr denken, völlig umkrempeln. Und Vorhersagen möglich machen, die bisher undenkbar waren. Die Experten Viktor Mayer-Schönberger und Kenneth Cukier beschreiben in ihrem Buch, was Big Data ist, welche Möglichkeiten sich eröffnen, vor welchen Umwälzungen wir alle stehen – und verschweigen auch die dunkle Seite wie das Ausspähen von persönlichen Daten und den drohenden Verlust der Privatsphäre nicht.

JavaScript kurz & gut


Author: David Flanagan
Publisher: O'Reilly Germany
ISBN: 3868993894
Category: Computers
Page: 288
View: 8149
DOWNLOAD NOW »
JavaScript ist eine mächtige, objektorientierte Skriptsprache, deren Code in HTML-Seiten eingebettet und vom Browser interpretiert und ausgeführt wird. Richtig eingesetzt, eignet sie sich aber auch für die Programmierung komplexer Anwendungen und hat im Zusammenhang mit HTML5 noch einmal an Bedeutung gewonnen. Diese Kurzreferenz ist ein Auszug aus der überarbeiteten und ergänzten Neuauflage von JavaScript – Das umfassende Referenzwerk, 6. Auflage, der JavaScript-Bibel schlechthin. JavaScript kurz & gut befasst sich in den ersten neun Kapiteln mit der neuesten Version des Sprachkerns (ECMAScript 5) und behandelt die Syntax der Sprache, Typen, Werte, Variablen, Operatoren und Anweisungen sowie Objekte, Arrays, Funktionen und Klassen. All dies ist nicht nur für die Verwendung von JavaScript in Webbrowsern, sondern auch beim Einsatz von Node auf der Serverseite relevant. In den folgenden fünf Kapiteln geht es um die Host-Umgebung des Webbrowsers. Es wird erklärt, wie Sie clientseitiges JavaScript für die Erstellung dynamischer Webseiten und -applikationen verwenden und mit JavaScript auf die HTML5-APIs zugreifen. Diese Kapitel liefern Informationen zu den wichtigsten Elementen von clientseitigem JavaScript: Fenster, Dokumente, Elemente, Stile, Events, Netzwerke und Speicherung.

Mehr Hacking mit Python

Eigene Tools entwickeln für Hacker und Pentester
Author: Justin Seitz
Publisher: dpunkt.verlag
ISBN: 3864917530
Category: Computers
Page: 182
View: 3355
DOWNLOAD NOW »
Wenn es um die Entwicklung leistungsfähiger und effizienter Hacking-Tools geht, ist Python für die meisten Sicherheitsanalytiker die Sprache der Wahl. Doch wie genau funktioniert das? In dem neuesten Buch von Justin Seitz - dem Autor des Bestsellers »Hacking mit Python« - entdecken Sie Pythons dunkle Seite. Sie entwickeln Netzwerk-Sniffer, manipulieren Pakete, infizieren virtuelle Maschinen, schaffen unsichtbare Trojaner und vieles mehr. Sie lernen praktisch, wie man • einen »Command-and-Control«-Trojaner mittels GitHub schafft • Sandboxing erkennt und gängige Malware-Aufgaben wie Keylogging und Screenshotting automatisiert • Windows-Rechte mittels kreativer Prozesskontrolle ausweitet • offensive Speicherforensik-Tricks nutzt, um Passwort-Hashes abzugreifen und Shellcode in virtuelle Maschinen einzuspeisen • das beliebte Web-Hacking-Tool Burp erweitert • die Windows COM-Automatisierung nutzt, um einen Man-in-the-Middle-Angriff durchzuführen • möglichst unbemerkt Daten aus einem Netzwerk abgreift Eine Reihe von Insider-Techniken und kreativen Aufgaben zeigen Ihnen, wie Sie die Hacks erweitern und eigene Exploits entwickeln können.

Data Science für Dummies


Author: Lillian Pierson
Publisher: John Wiley & Sons
ISBN: 352780675X
Category: Mathematics
Page: 382
View: 6768
DOWNLOAD NOW »
Daten, Daten, Daten? Sie haben schon Kenntnisse in Excel und Statistik, wissen aber noch nicht, wie all die Datensätze helfen sollen, bessere Entscheidungen zu treffen? Von Lillian Pierson bekommen Sie das dafür notwendige Handwerkszeug: Bauen Sie Ihre Kenntnisse in Statistik, Programmierung und Visualisierung aus. Nutzen Sie Python, R, SQL, Excel und KNIME. Zahlreiche Beispiele veranschaulichen die vorgestellten Methoden und Techniken. So können Sie die Erkenntnisse dieses Buches auf Ihre Daten übertragen und aus deren Analyse unmittelbare Schlüsse und Konsequenzen ziehen.

Java EE kurz & gut


Author: Arun Gupta
Publisher: O'Reilly Germany
ISBN: 3868999590
Category: Computers
Page: 208
View: 3915
DOWNLOAD NOW »
Sie möchten die Schlüsselspezifikationen der Java EE 6-Plattform schnell und unkompliziert kennenlernen? Dann ist dieses Taschenbuch genau das Richtige für Sie. Es bietet einen Überblick über die wichtigsten Technologien, die auf der Plattform eingesetzt werden, sowie leicht verständliche Codebeispiele, die Ihnen demonstrieren, wie Java EE 6 die Entwicklung von Web- und Enterprise-Anwendungen drastisch vereinfacht. - Verstehen, wie die Java EE 6-Features mit Design Patterns in Web- und Enterprise-Anwendungen zusammenhängen - Die nötigen Spezifikationen finden, um die eigene Anwendung Java EE-fähig zu machen - Neuerungen bei Enterprise JavaBeans (EJB), JavaServer Faces (JSF) und anderen Komponenten kennenlernen - Java EE 6-Web Profile entdecken, die den früheren "One Size Fits All"-Ansatz ersetzen - Die Contexts and Dependancy Interjection (CDI) und die Java API für RESTful Webservices einsetzen - Die Java EE-Entwicklung mit Netbeans und GlassFish starten

Sterblich sein

Was am Ende wirklich zählt. Über Würde, Autonomie und eine angemessene medizinische Versorgung
Author: Atul Gawande
Publisher: S. Fischer Verlag
ISBN: 3104035849
Category: Self-Help
Page: 336
View: 625
DOWNLOAD NOW »
Ein Buch über das Sterben, das das Leben lehrt Die Medizin scheint über Krankheit und Tod zu triumphieren, doch sterben wir so trostlos wie nie zuvor. Der Bestsellerautor und renommierte Arzt Atul Gawande schreibt in seinem beeindruckenden Buch über das, was am Ende unseres Lebens wirklich zählt. Ungewöhnlich offen spricht er darüber, was es bedeutet, alt zu werden, wie man mit Gebrechen und Krankheiten umgehen kann und was wir an unserem System ändern müssen, um unser Leben würdevoll zu Ende zu bringen. Ein mutiges und weises Buch eines großartigen Autors, voller Geschichten und eigener Erfahrungen, das uns hilft, die Geschichte unseres Lebens gut zu Ende zu erzählen. »Dieses Buch ist nicht nur weise und sehr bewegend, sondern gerade in unserer Zeit unbedingt notwendig und sehr aufschlussreich.« Oliver Sacks »Die medizinische Betreuung ist mehr auf Heilung ausgelegt als auf das Sterben. Dies ist Atuls Gawandes stärkstes und bewegendstes Buch.« Malcolm Gladwell

Android-Programmierung


Author: Zigurd Mednieks,Laird Dornin,G. Blake Meike,Masumi Nakamura
Publisher: O'Reilly Germany
ISBN: 3955611418
Category:
Page: 624
View: 9512
DOWNLOAD NOW »
Android hat hierzulande die einstige Vorreiterstellung von Apple langst geknackt. Bei den Smartphones liegt das Betriebssystem von Google weit vorn, und auch bei den Tablets holt Android zugig auf. Zeit also, sich mit der App-Entwicklung fur Android zu beschaftigen! Dieses Buch wendet sich an Leser, die die Programmierung von Android-Apps von Grund auf lernen und auf professionellem Niveau betreiben mochten. Es richtet sich an Java-Entwickler und Leser mit Kenntnissen in einer anderen objektorientierten Sprache.

Data Science mit Python

Das Handbuch für den Einsatz von IPython, Jupyter, NumPy, Pandas, Matplotlib und Scikit-Learn
Author: Jake VanderPlas
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 3958456979
Category: Computers
Page: 552
View: 7120
DOWNLOAD NOW »
Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: ● IPython und Jupyter für datenintensive Berechnungen ● NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python ● Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten ● Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

MapReduce Design Patterns

Building Effective Algorithms and Analytics for Hadoop and Other Systems
Author: Donald Miner,Adam Shook
Publisher: "O'Reilly Media, Inc."
ISBN: 1449341985
Category: Computers
Page: 250
View: 6154
DOWNLOAD NOW »
Until now, design patterns for the MapReduce framework have been scattered among various research papers, blogs, and books. This handy guide brings together a unique collection of valuable MapReduce patterns that will save you time and effort regardless of the domain, language, or development framework you’re using. Each pattern is explained in context, with pitfalls and caveats clearly identified to help you avoid common design mistakes when modeling your big data architecture. This book also provides a complete overview of MapReduce that explains its origins and implementations, and why design patterns are so important. All code examples are written for Hadoop. Summarization patterns: get a top-level view by summarizing and grouping data Filtering patterns: view data subsets such as records generated from one user Data organization patterns: reorganize data to work with other systems, or to make MapReduce analysis easier Join patterns: analyze different datasets together to discover interesting relationships Metapatterns: piece together several patterns to solve multi-stage problems, or to perform several analytics in the same job Input and output patterns: customize the way you use Hadoop to load or store data "A clear exposition of MapReduce programs for common data processing patterns—this book is indespensible for anyone using Hadoop." --Tom White, author of Hadoop: The Definitive Guide

Die Berechnung der Zukunft

Warum die meisten Prognosen falsch sind und manche trotzdem zutreffen - Der New York Times Bestseller
Author: Nate Silver
Publisher: Heyne Verlag
ISBN: 3641112702
Category: Business & Economics
Page: 656
View: 2596
DOWNLOAD NOW »
Zuverlässige Vorhersagen sind doch möglich! Nate Silver ist der heimliche Gewinner der amerikanischen Präsidentschaftswahlen 2012: ein begnadeter Statistiker, als »Prognose-Popstar« und »Wundernerd« weltberühmt geworden. Er hat die Wahlergebnisse aller 50 amerikanischen Bundesstaaten absolut exakt vorausgesagt – doch damit nicht genug: Jetzt zeigt Nate Silver, wie seine Prognosen in Zukunft Terroranschläge, Umweltkatastrophen und Finanzkrisen verhindern sollen. Gelingt ihm die Abschaffung des Zufalls? Warum werden Wettervorhersagen immer besser, während die Terrorattacken vom 11.09.2001 niemand kommen sah? Warum erkennen Ökonomen eine globale Finanzkrise nicht einmal dann, wenn diese bereits begonnen hat? Das Problem ist nicht der Mangel an Informationen, sondern dass wir die verfügbaren Daten nicht richtig deuten. Zuverlässige Prognosen aber würden uns helfen, Zufälle und Ungewissheiten abzuwehren und unser Schicksal selbst zu bestimmen. Nate Silver zeigt, dass und wie das geht. Erstmals wendet er seine Wahrscheinlichkeitsrechnung nicht nur auf Wahlprognosen an, sondern auf die großen Probleme unserer Zeit: die Finanzmärkte, Ratingagenturen, Epidemien, Erdbeben, den Klimawandel, den Terrorismus. In all diesen Fällen gibt es zahlreiche Prognosen von Experten, die er überprüft – und erklärt, warum sie meist falsch sind. Gleichzeitig schildert er, wie es gelingen kann, im Rauschen der Daten die wesentlichen Informationen herauszufiltern. Ein unterhaltsamer und spannender Augenöffner!

Spark: The Definitive Guide

Big Data Processing Made Simple
Author: Bill Chambers,Matei Zaharia
Publisher: "O'Reilly Media, Inc."
ISBN: 1491912294
Category: Computers
Page: 606
View: 6660
DOWNLOAD NOW »
Learn how to use, deploy, and maintain Apache Spark with this comprehensive guide, written by the creators of the open-source cluster-computing framework. With an emphasis on improvements and new features in Spark 2.0, authors Bill Chambers and Matei Zaharia break down Spark topics into distinct sections, each with unique goals. You’ll explore the basic operations and common functions of Spark’s structured APIs, as well as Structured Streaming, a new high-level API for building end-to-end streaming applications. Developers and system administrators will learn the fundamentals of monitoring, tuning, and debugging Spark, and explore machine learning techniques and scenarios for employing MLlib, Spark’s scalable machine-learning library. Get a gentle overview of big data and Spark Learn about DataFrames, SQL, and Datasets—Spark’s core APIs—through worked examples Dive into Spark’s low-level APIs, RDDs, and execution of SQL and DataFrames Understand how Spark runs on a cluster Debug, monitor, and tune Spark clusters and applications Learn the power of Structured Streaming, Spark’s stream-processing engine Learn how you can apply MLlib to a variety of problems, including classification or recommendation

Practical Hadoop Ecosystem

A Definitive Guide to Hadoop-Related Frameworks and Tools
Author: Deepak Vohra
Publisher: Apress
ISBN: 1484221990
Category: Computers
Page: 421
View: 4579
DOWNLOAD NOW »
Learn how to use the Apache Hadoop projects, including MapReduce, HDFS, Apache Hive, Apache HBase, Apache Kafka, Apache Mahout, and Apache Solr. From setting up the environment to running sample applications each chapter in this book is a practical tutorial on using an Apache Hadoop ecosystem project. While several books on Apache Hadoop are available, most are based on the main projects, MapReduce and HDFS, and none discusses the other Apache Hadoop ecosystem projects and how they all work together as a cohesive big data development platform. What You Will Learn: Set up the environment in Linux for Hadoop projects using Cloudera Hadoop Distribution CDH 5 Run a MapReduce job Store data with Apache Hive, and Apache HBase Index data in HDFS with Apache Solr Develop a Kafka messaging system Stream Logs to HDFS with Apache Flume Transfer data from MySQL database to Hive, HDFS, and HBase with Sqoop Create a Hive table over Apache Solr Develop a Mahout User Recommender System Who This Book Is For: Apache Hadoop developers. Pre-requisite knowledge of Linux and some knowledge of Hadoop is required.