Ga naar de inhoud

Breaking

Flask and JSON A webserver from the command line Use the node.js server as restful app server Reading a CSV file and translate into dataframe Plotting in pandas

Data, data en nog ns data

Data, data en nog ns data

  • Home
  • A theory of data warehousing
  • About
  • Old pages
  • Toms’ Speeltuin
    • Home
    • Uncategorized
Uncategorized

Oh my God: how good is open source

tom 30 juli 2017 0Reacties

A few days ago, I had to write a Python script that would enable us to write some data to an Oracle database. At first, I had no idea how…

Uncategorized

Curl and elasticSearch

tom 21 februari 2017 0Reacties

One of the most useful utilities is “curl”. This wonderful tool can be used to transfer data from one platform to another. It is relatively easy to install in Windows,…

Uncategorized

ElasticSearch

tom 20 februari 2017 0Reacties

A new and popular nosql database is the Elastic Search database. This database is easy to install en easy to run. But is it easy to insert data and extract…

Uncategorized

Scala merging files

tom 6 februari 2017 0Reacties

In a previous post, I showed how two files can be merged in Scala. The idea was that RDDs were translated as data frames and a join was undertaken on…

Uncategorized

Merging files in Scala

tom 1 februari 2017 0Reacties

I understand that Scala may be used in an ETL context. In ETL, an important element is the merge of two files. We will get data from different sources and…

Uncategorized

Getting a histogram from Big Data with Scala

tom 30 januari 2017 0Reacties

Scala can be used as a tool to manipulate big data. If it is used in the spark context, we have a possibility to combine two strong tools: spark with…

Uncategorized

Scala

tom 29 januari 2017 0Reacties

Scala is a language that is used for general purposes. One may use it as a statistical tool, a tool to undertake pattern matching etc. Just like any other programming…

Uncategorized

Another Pyspark scripts

tom 5 januari 2017 0Reacties

In this note, I show yet another Pyspark with slightly different methods to filter. The idea is that file is read in a RDD. Subsequently, it is cleaned. That cleaning…

Uncategorized

The 1000th wordcount example

tom 3 januari 2017 0Reacties

I just discovered the 1000th wordcount example. It is based on Pyspark. The idea is actually quite simple. One creates a script. This script can be written in any editor.…

Uncategorized

Joining files with Pyspark

tom 3 januari 2017 0Reacties

Pyspark allows us to process files in a big data/ Hadoop environment. I showed in another post how Pyspark can be started and how it can be used. The concept…

Berichtnavigatie

1 2 … 4

Volgende pagina »

Recente berichten

  • Flask and JSON
  • A webserver from the command line
  • Use the node.js server as restful app server
  • Reading a CSV file and translate into dataframe
  • Plotting in pandas

Recente reacties

  1. tom op Sqoop

Archieven

  • april 2024
  • maart 2024
  • december 2023
  • september 2023
  • augustus 2023
  • oktober 2021
  • september 2021
  • augustus 2021
  • juli 2021
  • juni 2021
  • mei 2021
  • april 2021
  • maart 2021
  • februari 2021
  • januari 2021
  • september 2020
  • augustus 2020
  • juli 2020
  • juni 2020
  • mei 2020
  • april 2020
  • maart 2020
  • februari 2020
  • januari 2020
  • december 2019
  • november 2019
  • september 2019
  • augustus 2019
  • juli 2019
  • mei 2019
  • april 2019
  • maart 2019
  • februari 2019
  • januari 2019
  • december 2018
  • november 2018
  • oktober 2018
  • september 2018
  • augustus 2018
  • juli 2018
  • juni 2018
  • mei 2018
  • april 2018
  • februari 2018
  • januari 2018
  • december 2017
  • september 2017
  • juli 2017
  • mei 2017
  • februari 2017
  • januari 2017
  • december 2016
  • november 2016
  • augustus 2016
  • juli 2016
  • mei 2016
  • april 2016
  • maart 2016
  • februari 2016
  • januari 2016
  • december 2015
  • november 2015
  • oktober 2015
  • september 2015
  • augustus 2015
  • juli 2015
  • juni 2015
  • april 2015
  • januari 2015
  • december 2014
  • november 2014
  • oktober 2014
  • september 2014
  • augustus 2014
  • juli 2014
  • juni 2014
  • mei 2014
  • april 2014
  • februari 2014
  • december 2013
  • oktober 2013
  • augustus 2013
  • april 2013
  • maart 2013
  • februari 2013
  • december 2012
  • oktober 2012
  • september 2012
  • augustus 2012
  • juli 2012
  • juni 2012
  • maart 2012
  • februari 2012
  • december 2011
  • november 2011
  • september 2011
  • juli 2011
  • juni 2011
  • mei 2011
  • april 2011
  • maart 2011
  • februari 2011

Categorieën

  • a theory
  • Allgemein
  • data warehousing
  • nice to know
  • Niet gecategoriseerd
  • Uncategorized

Je miste

Niet gecategoriseerd

Flask and JSON

Niet gecategoriseerd

A webserver from the command line

Niet gecategoriseerd

Use the node.js server as restful app server

Niet gecategoriseerd

Reading a CSV file and translate into dataframe

Data, data en nog ns data

Copyright © All rights reserved | BlogArise door Themeansar.