Data Wrangling with R


Author: Bradley Boehmke
Publisher: Springer
ISBN: 3319455990
Category: Computers
Page: 238
View: 3872
DOWNLOAD NOW »
This guide for practicing statisticians, data scientists, and R users and programmers will teach the essentials of preprocessing: data leveraging the R programming language to easily and quickly turn noisy data into usable pieces of information. Data wrangling, which is also commonly referred to as data munging, transformation, manipulation, janitor work, etc., can be a painstakingly laborious process. Roughly 80% of data analysis is spent on cleaning and preparing data; however, being a prerequisite to the rest of the data analysis workflow (visualization, analysis, reporting), it is essential that one become fluent and efficient in data wrangling techniques. This book will guide the user through the data wrangling process via a step-by-step tutorial approach and provide a solid foundation for working with data in R. The author's goal is to teach the user how to easily wrangle data in order to spend more time on understanding the content of the data. By the end of the book, the user will have learned: How to work with different types of data such as numerics, characters, regular expressions, factors, and dates The difference between different data structures and how to create, add additional components to, and subset each data structure How to acquire and parse data from locations previously inaccessible How to develop functions and use loop control structures to reduce code redundancy How to use pipe operators to simplify code and make it more readable How to reshape the layout of data and manipulate, summarize, and join data sets

Wirtschaftsrechnen


Author: Wilhelm Kalveram
Publisher: Springer-Verlag
ISBN: 3663128571
Category: Business & Economics
Page: 256
View: 2614
DOWNLOAD NOW »
Dieses Buch soll das Gesamtgebiet der kaufmännischen Arithmetik so dar stellen, daß es einmal ein selbständiges Eindringen in dieses Stoffgebiet ermöglicht, zum andern aber auch für die Verwendung an höheren Handels schulen und für die Vorbereitung auf kaufmännische Prüfungen an Hoch schulen und Universitäten in Betracht kommt. Es wurde deshalb besonderer Wert auf einen methodischen Aufbau gelegt. Das eingeschaltete knappe, aber typische übungsmaterial, dem die Lösungen beigegeben sind, soll den ge botenen Wissensstoff veranschaulichen. Der Vorkurs ist als Wiederholung und Auffrischung schon vorhandener Kenntnisse gedacht und deshalb auf das Wesentliche beschränkt. Die Finanz mathematik wird so weit behandelt, wie sie in der Praxis eines großen kauf männischen Unternehmens gebraucht wird. Ein tieferes Eindringen in die Zinseszins-, Renten-und Anleiherechnung mit Hilfe mathematischer Metho den wurde bewußt vermieden. Seit dem Erscheinen der zweiten Auflage dieses Buches haben sich die Preis und Währungsverhältnisse so weit stabilisiert, daß in dieser nun vorliegenden dritten Auflage Kurse, Preise und sonstige Zahlenaussagen den heutigen Ver hältnissen angepaßt, gleichzeitig aber konjunkturelle Schwankungen ausge schaltet werden konnten. Eine wesentliche Erweiterung hat die nun vorliegende dritte Auflage dadurch erfahren, daß drei neue Kapitel über Effektenrechnen, Devisenrechnen und Devisenarbitrage eingefügt wurden. Ihnen liegen Arbeiten meines Vaters auf diesen Gebieten zugrunde, die in ihrem Aufbau im wesentlichen unverändert gelassen wurden, wobei jedoch, wie schon erwähnt, den heutigen Verhält nissen weitgehend Rechnung getragen wurde.

Datenvisualisierung mit R

111 Beispiele
Author: Thomas Rahlf
Publisher: Springer-Verlag
ISBN: 3662548208
Category: Computers
Page: 494
View: 1679
DOWNLOAD NOW »
Dieses Buch führt in die Grundlagen der Gestaltung von Präsentationsgrafiken mit der Open Source Software R ein, die hinsichtlich der Visualisierungsmöglichkeiten praktisch keine Wünsche offen lässt und sich zunehmend als Standard im Bereich der Statistiksoftware etabliert. Anhand von 111 vollständigen Skript-Beispielen lernen Sie, wie Sie Balken- und Säulendiagramme, Bevölkerungspyramiden, Lorenzkurven, Streudiagramme, Zeitreihendarstellungen, Radialpolygone, Gantt-Diagramme, Profildiagramme, Heatmaps, Bumpcharts, Mosaik- und Ballonplots sowie eine Reihe verschiedener thematischer Kartentypen mit dem Base Graphics System von R erstellen. Für jedes Beispiel werden reale Daten verwendet sowie die Abbildung und deren Programmierung Schritt für Schritt erläutert. Das Buch ist damit ein wertvolles Nachschlagewerk für eine Fülle von Anwendungsfällen der Datenvisualisierung, zu deren traditionellen Anwendungsbereichen in Wissenschaft und Marketing vermehrt auch neue Gebiete wie Big-Data-Analysen oder Datenjournalismus hinzukommen. In der vorliegenden Auflage wurden Beispiele zu Cartogrammen, Chord-Diagrammen und Netzwerken sowie ein neues Kapitel zu interaktiven Visualisierungen mit Javascript aufgenommen.

Datenanalyse mit Python

Auswertung von Daten mit Pandas, NumPy und IPython
Author: Wes McKinney
Publisher: O'Reilly
ISBN: 3960102143
Category: Computers
Page: 542
View: 6664
DOWNLOAD NOW »
Erfahren Sie alles über das Manipulieren, Bereinigen, Verarbeiten und Aufbereiten von Datensätzen mit Python: Aktualisiert auf Python 3.6, zeigt Ihnen dieses konsequent praxisbezogene Buch anhand konkreter Fallbeispiele, wie Sie eine Vielzahl von typischen Datenanalyse-Problemen effektiv lösen. Gleichzeitig lernen Sie die neuesten Versionen von pandas, NumPy, IPython und Jupyter kennen.Geschrieben von Wes McKinney, dem Begründer des pandas-Projekts, bietet Datenanalyse mit Python einen praktischen Einstieg in die Data-Science-Tools von Python. Das Buch eignet sich sowohl für Datenanalysten, für die Python Neuland ist, als auch für Python-Programmierer, die sich in Data Science und Scientific Computing einarbeiten wollen. Daten und zugehöriges Material des Buchs sind auf GitHub verfügbar.Aus dem Inhalt:Nutzen Sie die IPython-Shell und Jupyter Notebook für das explorative ComputingLernen Sie Grundfunktionen und fortgeschrittene Features von NumPy kennenSetzen Sie die Datenanalyse-Tools der pandasBibliothek einVerwenden Sie flexible Werkzeuge zum Laden, Bereinigen, Transformieren, Zusammenführen und Umformen von DatenErstellen Sie interformative Visualisierungen mit matplotlibWenden Sie die GroupBy-Mechanismen von pandas an, um Datensätzen zurechtzuschneiden, umzugestalten und zusammenzufassenAnalysieren und manipulieren Sie verschiedenste Zeitreihen-DatenFür diese aktualisierte 2. Auflage wurde der gesamte Code an Python 3.6 und die neuesten Versionen der pandas-Bibliothek angepasst. Neu in dieser Auflage: Informationen zu fortgeschrittenen pandas-Tools sowie eine kurze Einführung in statsmodels und scikit-learn.

R für Dummies


Author: Andrie de Vries,Robert Leidenfrost
Publisher: John Wiley & Sons
ISBN: 3527812520
Category: Computers
Page: 414
View: 9520
DOWNLOAD NOW »


Data Wrangling

Munging in R with SQL and MongoDB for Financial Applications
Author: Patrick Houlihan,Alexander Moreno
Publisher: Apress
ISBN: 9781484206126
Category: Computers
Page: 280
View: 8910
DOWNLOAD NOW »
Use R to gather, clean, and manage financial data in structured and unstructured databases. Learn how to read and write the increasing volume and complexity of data from and between SQL and MongoDB databases. Data Wrangling teaches practitioners and students of financial data analysis the SQL and MongoDB database management skills they need to succeed in their analytic work. The authors, who have deep experience in the financial industry as well as in teaching quantitative finance, take most of the operational and programming examples that enrich their book from the financial arena, including both market data and text-based data. The concepts presented through these examples are nonetheless applicable to a wide range of fields, so data analysts from all industries will profit from this book. What You'll Learn Use a rich feature set of R for financial data analytics Employ an integrated comparison-based learning approach to SQL and NoSQL database management, including query and insert constructs Understand data wrangling best practices and solutions Be exposured to cutting-edge database technologies such as text-based analytics and their financial applications Study an abundance of practical examples from the real world of finance Who This Book Is For Data analysts in the financial industry, data analysts in nonfinancial fields, and those who deal with data in their professional or academic work

Hands-On Data Science with R

Techniques to perform data manipulation and mining to build smart analytical models using R
Author: Vitor Bianchi Lanzetta,Nataraj Dasgupta,Ricardo Anjoleto Farias
Publisher: Packt Publishing Ltd
ISBN: 1789135834
Category: Computers
Page: 420
View: 5572
DOWNLOAD NOW »
A hands-on guide for professionals to perform various data science tasks in R Key Features Explore the popular R packages for data science Use R for efficient data mining, text analytics and feature engineering Become a thorough data science professional with the help of hands-on examples and use-cases in R Book Description R is the most widely used programming language, and when used in association with data science, this powerful combination will solve the complexities involved with unstructured datasets in the real world. This book covers the entire data science ecosystem for aspiring data scientists, right from zero to a level where you are confident enough to get hands-on with real-world data science problems. The book starts with an introduction to data science and introduces readers to popular R libraries for executing data science routine tasks. This book covers all the important processes in data science such as data gathering, cleaning data, and then uncovering patterns from it. You will explore algorithms such as machine learning algorithms, predictive analytical models, and finally deep learning algorithms. You will learn to run the most powerful visualization packages available in R so as to ensure that you can easily derive insights from your data. Towards the end, you will also learn how to integrate R with Spark and Hadoop and perform large-scale data analytics without much complexity. What you will learn Understand the R programming language and its ecosystem of packages for data science Obtain and clean your data before processing Master essential exploratory techniques for summarizing data Examine various machine learning prediction, models Explore the H2O analytics platform in R for deep learning Apply data mining techniques to available datasets Work with interactive visualization packages in R Integrate R with Spark and Hadoop for large-scale data analytics Who this book is for If you are a budding data scientist keen to learn about the popular pandas library, or a Python developer looking to step into the world of data analysis, this book is the ideal resource you need to get started. Some programming experience in Python will be helpful to get the most out of this course

R in a Nutshell


Author: Joseph Adler
Publisher: O'Reilly Germany
ISBN: 3897216507
Category: Computers
Page: 768
View: 8368
DOWNLOAD NOW »
Wozu sollte man R lernen? Da gibt es viele Gründe: Weil man damit natürlich ganz andere Möglichkeiten hat als mit einer Tabellenkalkulation wie Excel, aber auch mehr Spielraum als mit gängiger Statistiksoftware wie SPSS und SAS. Anders als bei diesen Programmen hat man nämlich direkten Zugriff auf dieselbe, vollwertige Programmiersprache, mit der die fertigen Analyse- und Visualisierungsmethoden realisiert sind – so lassen sich nahtlos eigene Algorithmen integrieren und komplexe Arbeitsabläufe realisieren. Und nicht zuletzt, weil R offen gegenüber beliebigen Datenquellen ist, von der einfachen Textdatei über binäre Fremdformate bis hin zu den ganz großen relationalen Datenbanken. Zudem ist R Open Source und erobert momentan von der universitären Welt aus die professionelle Statistik. R kann viel. Und Sie können viel mit R machen – wenn Sie wissen, wie es geht. Willkommen in der R-Welt: Installieren Sie R und stöbern Sie in Ihrem gut bestückten Werkzeugkasten: Sie haben eine Konsole und eine grafische Benutzeroberfläche, unzählige vordefinierte Analyse- und Visualisierungsoperationen – und Pakete, Pakete, Pakete. Für quasi jeden statistischen Anwendungsbereich können Sie sich aus dem reichen Schatz der R-Community bedienen. Sprechen Sie R! Sie müssen Syntax und Grammatik von R nicht lernen – wie im Auslandsurlaub kommen Sie auch hier gut mit ein paar aufgeschnappten Brocken aus. Aber es lohnt sich: Wenn Sie wissen, was es mit R-Objekten auf sich hat, wie Sie eigene Funktionen schreiben und Ihre eigenen Pakete schnüren, sind Sie bei der Analyse Ihrer Daten noch flexibler und effektiver. Datenanalyse und Statistik in der Praxis: Anhand unzähliger Beispiele aus Medizin, Wirtschaft, Sport und Bioinformatik lernen Sie, wie Sie Daten aufbereiten, mithilfe der Grafikfunktionen des lattice-Pakets darstellen, statistische Tests durchführen und Modelle anpassen. Danach werden Ihnen Ihre Daten nichts mehr verheimlichen.

Deine Juliet

Roman
Author: Mary Ann Shaffer,Annie Barrows
Publisher: btb Verlag
ISBN: 3641184509
Category: Fiction
Page: 304
View: 5820
DOWNLOAD NOW »
Willkommen im Club der Guernseyer Freunde von Dichtung und Kartfoffelschalenauflauf London, Ende der vierziger Jahre: Die junge Schriftstellerin Juliet erhält einen ungewöhnlichen Brief. Absender ist Dawsey Adams, ein Bauer von der Kanalinsel Guernsey, der antiquarisch ein Buch erworben hat, das zuvor ihr gehörte. Zwischen den beiden entspinnt sich ein Briefwechsel, durch den Juliet von der Existenz der »Guernseyer Freunde von Dichtung und Kartoffelschalenauflauf« erfährt, einer literarischen Gesellschaft, die einige der Inselbewohner gründeten, um sich über die schwere Kriegszeit hinwegzuhelfen. Je mehr Juliet über Dawsey und die anderen erfährt, desto mehr wünscht sie sich diese Menschen zu treffen. Und so beschließt sie, auf die Insel zu reisen. Dort stößt Juliet auf die Geschichte von Elizabeth, einem verschollenen Mitglied des Clubs, und ihrer großen Liebe zu einem deutschen Offizier. Und sie lernt Dawsey immer besser kennen...

Data Analysis with R


Author: Tony Fischetti
Publisher: Packt Publishing Ltd
ISBN: 1785286447
Category: Computers
Page: 388
View: 9034
DOWNLOAD NOW »
Load, wrangle, and analyze your data using the world's most powerful statistical programming language About This Book Load, manipulate and analyze data from different sources Gain a deeper understanding of fundamentals of applied statistics A practical guide to performing data analysis in practice Who This Book Is For Whether you are learning data analysis for the first time, or you want to deepen the understanding you already have, this book will prove to an invaluable resource. If you are looking for a book to bring you all the way through the fundamentals to the application of advanced and effective analytics methodologies, and have some prior programming experience and a mathematical background, then this is for you. What You Will Learn Navigate the R environment Describe and visualize the behavior of data and relationships between data Gain a thorough understanding of statistical reasoning and sampling Employ hypothesis tests to draw inferences from your data Learn Bayesian methods for estimating parameters Perform regression to predict continuous variables Apply powerful classification methods to predict categorical data Handle missing data gracefully using multiple imputation Identify and manage problematic data points Employ parallelization and Rcpp to scale your analyses to larger data Put best practices into effect to make your job easier and facilitate reproducibility In Detail Frequently the tool of choice for academics, R has spread deep into the private sector and can be found in the production pipelines at some of the most advanced and successful enterprises. The power and domain-specificity of R allows the user to express complex analytics easily, quickly, and succinctly. With over 7,000 user contributed packages, it's easy to find support for the latest and greatest algorithms and techniques. Starting with the basics of R and statistical reasoning, Data Analysis with R dives into advanced predictive analytics, showing how to apply those techniques to real-world data though with real-world examples. Packed with engaging problems and exercises, this book begins with a review of R and its syntax. From there, get to grips with the fundamentals of applied statistics and build on this knowledge to perform sophisticated and powerful analytics. Solve the difficulties relating to performing data analysis in practice and find solutions to working with “messy data”, large data, communicating results, and facilitating reproducibility. This book is engineered to be an invaluable resource through many stages of anyone's career as a data analyst. Style and approach Learn data analysis using engaging examples and fun exercises, and with a gentle and friendly but comprehensive "learn-by-doing" approach.

Wahrscheinlichkeitsrechnung und Statistik


Author: Robert Hafner
Publisher: Springer-Verlag
ISBN: 3709169445
Category: Mathematics
Page: 512
View: 2438
DOWNLOAD NOW »
Das Buch ist eine Einführung in die Wahrscheinlichkeitsrechnung und mathematische Statistik auf mittlerem mathematischen Niveau. Die Pädagogik der Darstellung unterscheidet sich in wesentlichen Teilen – Einführung der Modelle für unabhängige und abhängige Experimente, Darstellung des Suffizienzbegriffes, Ausführung des Zusammenhanges zwischen Testtheorie und Theorie der Bereichschätzung, allgemeine Diskussion der Modellentwicklung – erheblich von der anderer vergleichbarer Lehrbücher. Die Darstellung ist, soweit auf diesem Niveau möglich, mathematisch exakt, verzichtet aber bewußt und ebenfalls im Gegensatz zu vergleichbaren Texten auf die Erörterung von Meßbarkeitsfragen. Der Leser wird dadurch erheblich entlastet, ohne daß wesentliche Substanz verlorengeht. Das Buch will allen, die an der Anwendung der Statistik auf solider Grundlage interessiert sind, eine Einführung bieten, und richtet sich an Studierende und Dozenten aller Studienrichtungen, für die mathematische Statistik ein Werkzeug ist.

R for Data Science

Import, Tidy, Transform, Visualize, and Model Data
Author: Hadley Wickham,Garrett Grolemund
Publisher: "O'Reilly Media, Inc."
ISBN: 1491910364
Category: Computers
Page: 520
View: 7903
DOWNLOAD NOW »
Learn how to use R to turn raw data into insight, knowledge, and understanding. This book introduces you to R, RStudio, and the tidyverse, a collection of R packages designed to work together to make data science fast, fluent, and fun. Suitable for readers with no previous programming experience, R for Data Science is designed to get you doing data science as quickly as possible. Authors Hadley Wickham and Garrett Grolemund guide you through the steps of importing, wrangling, exploring, and modeling your data and communicating the results. You’ll get a complete, big-picture understanding of the data science cycle, along with basic tools you need to manage the details. Each section of the book is paired with exercises to help you practice what you’ve learned along the way. You’ll learn how to: Wrangle—transform your datasets into a form convenient for analysis Program—learn powerful R tools for solving data problems with greater clarity and ease Explore—examine your data, generate hypotheses, and quickly test them Model—provide a low-dimensional summary that captures true "signals" in your dataset Communicate—learn R Markdown for integrating prose, code, and results

Text Mining with R

A Tidy Approach
Author: Julia Silge,David Robinson
Publisher: "O'Reilly Media, Inc."
ISBN: 1491981628
Category: Computers
Page: 194
View: 9244
DOWNLOAD NOW »
Much of the data available today is unstructured and text-heavy, making it challenging for analysts to apply their usual data wrangling and visualization tools. With this practical book, you’ll explore text-mining techniques with tidytext, a package that authors Julia Silge and David Robinson developed using the tidy principles behind R packages like ggraph and dplyr. You’ll learn how tidytext and other tidy tools in R can make text analysis easier and more effective. The authors demonstrate how treating text as data frames enables you to manipulate, summarize, and visualize characteristics of text. You’ll also learn how to integrate natural language processing (NLP) into effective workflows. Practical code examples and data explorations will help you generate real insights from literature, news, and social media. Learn how to apply the tidy text format to NLP Use sentiment analysis to mine the emotional content of text Identify a document’s most important terms with frequency measurements Explore relationships and connections between words with the ggraph and widyr packages Convert back and forth between R’s tidy and non-tidy text formats Use topic modeling to classify document collections into natural groups Examine case studies that compare Twitter archives, dig into NASA metadata, and analyze thousands of Usenet messages

Regression Analysis with R

Design and develop statistical nodes to identify unique relationships within data at scale
Author: Giuseppe Ciaburro
Publisher: Packt Publishing Ltd
ISBN: 1788622707
Category: Computers
Page: 422
View: 6995
DOWNLOAD NOW »
Build effective regression models in R to extract valuable insights from real data Key Features Implement different regression analysis techniques to solve common problems in data science - from data exploration to dealing with missing values From Simple Linear Regression to Logistic Regression - this book covers all regression techniques and their implementation in R A complete guide to building effective regression models in R and interpreting results from them to make valuable predictions Book Description Regression analysis is a statistical process which enables prediction of relationships between variables. The predictions are based on the casual effect of one variable upon another. Regression techniques for modeling and analyzing are employed on large set of data in order to reveal hidden relationship among the variables. This book will give you a rundown explaining what regression analysis is, explaining you the process from scratch. The first few chapters give an understanding of what the different types of learning are – supervised and unsupervised, how these learnings differ from each other. We then move to covering the supervised learning in details covering the various aspects of regression analysis. The outline of chapters are arranged in a way that gives a feel of all the steps covered in a data science process – loading the training dataset, handling missing values, EDA on the dataset, transformations and feature engineering, model building, assessing the model fitting and performance, and finally making predictions on unseen datasets. Each chapter starts with explaining the theoretical concepts and once the reader gets comfortable with the theory, we move to the practical examples to support the understanding. The practical examples are illustrated using R code including the different packages in R such as R Stats, Caret and so on. Each chapter is a mix of theory and practical examples. By the end of this book you will know all the concepts and pain-points related to regression analysis, and you will be able to implement your learning in your projects. What you will learn 1. Get started with the journey of data science using Simple linear regression 2. Deal with interaction, collinearity and other problems using multiple linear regression 3. Understand diagnostics and what to do if the assumptions fail with proper analysis 4. Load your dataset, treat missing values, and plot relationships with exploratory data analysis 5. Develop a perfect model keeping overfitting, under-fitting, and cross-validation into consideration 6. Deal with classification problems by applying Logistic regression 7. Explore other regression techniques – Decision trees, Bagging, and Boosting techniques 8. Learn by getting it all in action with the help of a real world case study. Who this book is for This book is intended for budding data scientists and data analysts who want to implement regression analysis techniques using R. If you are interested in statistics, data science, machine learning and wants to get an easy introduction to the topic, then this book is what you need! Basic understanding of statistics and math will help you to get the most out of the book. Some programming experience with R will also be helpful

Mastering Data Analysis with R


Author: Gergely Daroczi
Publisher: Packt Publishing Ltd
ISBN: 1783982039
Category: Computers
Page: 396
View: 7752
DOWNLOAD NOW »
Gain sharp insights into your data and solve real-world data science problems with R—from data munging to modeling and visualization About This Book Handle your data with precision and care for optimal business intelligence Restructure and transform your data to inform decision-making Packed with practical advice and tips to help you get to grips with data mining Who This Book Is For If you are a data scientist or R developer who wants to explore and optimize your use of R's advanced features and tools, this is the book for you. A basic knowledge of R is required, along with an understanding of database logic. What You Will Learn Connect to and load data from R's range of powerful databases Successfully fetch and parse structured and unstructured data Transform and restructure your data with efficient R packages Define and build complex statistical models with glm Develop and train machine learning algorithms Visualize social networks and graph data Deploy supervised and unsupervised classification algorithms Discover how to visualize spatial data with R In Detail R is an essential language for sharp and successful data analysis. Its numerous features and ease of use make it a powerful way of mining, managing, and interpreting large sets of data. In a world where understanding big data has become key, by mastering R you will be able to deal with your data effectively and efficiently. This book will give you the guidance you need to build and develop your knowledge and expertise. Bridging the gap between theory and practice, this book will help you to understand and use data for a competitive advantage. Beginning with taking you through essential data mining and management tasks such as munging, fetching, cleaning, and restructuring, the book then explores different model designs and the core components of effective analysis. You will then discover how to optimize your use of machine learning algorithms for classification and recommendation systems beside the traditional and more recent statistical methods. Style and approach Covering the essential tasks and skills within data science, Mastering Data Analysis provides you with solutions to the challenges of data science. Each section gives you a theoretical overview before demonstrating how to put the theory to work with real-world use cases and hands-on examples.

Data Science

Eine praxisorientierte Einführung im Umfeld von Machine Learning, künstlicher Intelligenz und Big Data
Author: Michael Oettinger
Publisher: tredition
ISBN: 3743936291
Category: Computers
Page: 208
View: 1660
DOWNLOAD NOW »
Data Scientisten (m/w) sind derzeit auf dem Jobmarkt heißbegehrt. In Amerika sind erfahrene Data Scientisten so beliebt wie eine Getränkebude in der Wüste. Aber auch in Deutschland ist eine steigende Nachfrage nach diesem Skillprofil erkennbar. Immer mehr Unternehmen bauen "Analytics"-Abteilungen auf bzw. aus und suchen entsprechende Mitarbeiter. Nur: was macht eigentlich ein Data Scientist? Irgendetwas mit künstlicher Intelligenz, Machine Learning, Data-Mining, Python-Programmierung und Big Data. So genau weiß es eigentlich niemand ... Das Buch ist eine Einführung und Übersicht über das weitumfassende Themengebiet Data Science. Es werden die Datenquellen (Datenbanken, Data-Warehouse, Hadoop etc.) und die Softwareprodukte für die Datenanalyse vorgestellt (Data-Science-Plattformen, ML Bibliotheken). Die wichtigsten Verfahren des Machine Learnings werden ebenso behandelt wie beispielhafte Anwendungsfälle aus verschiedenen Branchen.

Practical Data Wrangling

Expert techniques for transforming your raw data into a valuable source for analytics
Author: Allan Visochek
Publisher: Packt Publishing Ltd
ISBN: 1787283674
Category: Computers
Page: 204
View: 6616
DOWNLOAD NOW »
Turn your noisy data into relevant, insight-ready information by leveraging the data wrangling techniques in Python and R About This Book This easy-to-follow guide takes you through every step of the data wrangling process in the best possible way Work with different types of datasets, and reshape the layout of your data to make it easier for analysis Get simple examples and real-life data wrangling solutions for data pre-processing Who This Book Is For If you are a data scientist, data analyst, or a statistician who wants to learn how to wrangle your data for analysis in the best possible manner, this book is for you. As this book covers both R and Python, some understanding of them will be beneficial. What You Will Learn Read a csv file into python and R, and print out some statistics on the data Gain knowledge of the data formats and programming structures involved in retrieving API data Make effective use of regular expressions in the data wrangling process Explore the tools and packages available to prepare numerical data for analysis Find out how to have better control over manipulating the structure of the data Create a dexterity to programmatically read, audit, correct, and shape data Write and complete programs to take in, format, and output data sets In Detail Around 80% of time in data analysis is spent on cleaning and preparing data for analysis. This is, however, an important task, and is a prerequisite to the rest of the data analysis workflow, including visualization, analysis and reporting. Python and R are considered a popular choice of tool for data analysis, and have packages that can be best used to manipulate different kinds of data, as per your requirements. This book will show you the different data wrangling techniques, and how you can leverage the power of Python and R packages to implement them. You'll start by understanding the data wrangling process and get a solid foundation to work with different types of data. You'll work with different data structures and acquire and parse data from various locations. You'll also see how to reshape the layout of data and manipulate, summarize, and join data sets. Finally, we conclude with a quick primer on accessing and processing data from databases, conducting data exploration, and storing and retrieving data quickly using databases. The book includes practical examples on each of these points using simple and real-world data sets to give you an easier understanding. By the end of the book, you'll have a thorough understanding of all the data wrangling concepts and how to implement them in the best possible way. Style and approach This is a practical book on data wrangling designed to give you an insight into the practical application of data wrangling. It takes you through complex concepts and tasks in an accessible way, featuring information on a wide range of data wrangling techniques with Python and R

Spring im Einsatz


Author: Craig Walls
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 3446429468
Category: Computers
Page: 428
View: 6461
DOWNLOAD NOW »
SPRING IM EINSATZ // - Spring 3.0 auf den Punkt gebracht: Die zentralen Konzepte anschaulich und unterhaltsam erklärt. - Praxis-Know-how für den Projekteinsatz: Lernen Sie Spring mit Hilfe der zahlreichen Codebeispiele aktiv kennen. - Im Internet: Der vollständige Quellcode für die Applikationen dieses Buches Das Spring-Framework gehört zum obligatorischen Grundwissen eines Java-Entwicklers. Spring 3 führt leistungsfähige neue Features wie die Spring Expression Language (SpEL), neue Annotationen für IoC-Container und den lang ersehnten Support für REST ein. Es gibt keinen besseren Weg, um sich Spring anzueignen, als dieses Buch - egal ob Sie Spring gerade erst entdecken oder sich mit den neuen 3.0-Features vertraut machen wollen. Craig Walls setzt in dieser gründlich überarbeiteten 2. Auflage den anschaulichen und praxisorientierten Stil der Vorauflage fort. Er bringt als Autor sein Geschick für treffende und unterhaltsame Beispiele ein, die das Augenmerk direkt auf die Features und Techniken richten, die Sie wirklich brauchen. Diese Auflage hebt die wichtigsten Aspekte von Spring 3.0 hervor: REST, Remote-Services, Messaging, Security, MVC, Web Flow und vieles mehr. Das finden Sie in diesem Buch: - Die Arbeit mit Annotationen, um die Konfiguration zu reduzieren - Die Arbeit mit REST-konformen Ressourcen - Spring Expression Language (SpEL) - Security, Web Flow usw. AUS DEM INHALT: Spring ins kalte Wasser, Verschalten von Beans, Die XML-Konfiguration in Spring minimalisieren, Aspektorientierung, Zugriff auf die Datenbank, Transaktionen verwalten, Webapplikationen mit Spring MVC erstellen, Die Arbeit mit Spring Web Flow, Spring absichern, Die Arbeit mit Remote-Diensten, Spring und REST, Messaging in Spring, Verwalten von Spring-Beans mit JMX

Reguläre Ausdrücke


Author: Jeffrey E. F. Friedl
Publisher: O'Reilly Germany
ISBN: 3897217902
Category: Computers
Page: 556
View: 5727
DOWNLOAD NOW »
Reguläre Ausdrücke sind ein leistungsstarkes Mittel zur Verarbeitung von Texten und Daten. Wenn Sie reguläre Ausdrücke noch nicht kennen, wird Ihnen dieses Buch eine ganz neue Welt eröffnen. Aufgrund der ausgesprochen detaillierten und tiefgründigen Behandlung des Themas ist dieses Buch aber auch für Experten eine wahre Trouvaille. Die neue Auflage dieses anerkannten Standardwerks behandelt jetzt auch die Unterstützung regulärer Ausdrücke in PHP sowie Suns java.util.regex. Der klare und unterhaltsame Stil des Buchs hat schon Tausenden von Programmierern das an sich trockene Thema nähergebracht, und mit den vielen Beispielen zu Problemen aus dem Programmieralltag ist Reguläre Ausdrücke eine praktische Hilfe bei der täglichen Arbeit. Reguläre Ausdrücke sind überall Sie sind standardmäßig in Perl, PHP, Java, Python, Ruby, MySQL, VB.NET und C# (und allen Sprachen des .NET-Frameworks) sowie anderen Programmiersprachen und Werkzeugen eingebaut. Dieses Buch geht detailliert auf die Unterschiede und Gemeinsamkeiten bei der Behandlung regulärer Ausdrücke in diesen Sprachen und Werkzeugen ein. Besonders ausführlich werden die Regex-Features von Perl, Java, PHP und .NET behandelt. Reguläre Ausdrücke sind mächtig Reguläre Ausdrücke sind sehr leistungsfähig und flexibel. Dennoch bleibt ihre Anwendung oft unter ihren Möglichkeiten. Mit regulären Ausdrücken können Sie komplexe und subtile Textbearbeitungsprobleme lösen, von denen Sie vielleicht nie vermutet hätten, daß sie sich automatisieren lassen. Reguläre Ausdrücke ersparen Ihnen Arbeit und Ärger, und viele Probleme lassen sich mit ihnen auf elegante Weise lösen. Reguläre Ausdrücke sind anspruchsvoll Was in der Hand von Experten eine sehr nützliche Fähigkeit ist, kann sich als Stolperstein für Ungeübte herausstellen. Dieses Buch zeigt einen Weg durch das unwägbare Gebiet und hilft Ihnen, selbst Experte zu werden. Wenn Sie die regulären Ausdrücke beherrschen, werden sie zu einem unverzichtbaren Teil Ihres Werkzeugkastens. Sie werden sich fragen, wie Sie je ohne sie arbeiten konnten.