Data Science: How to integrate Jupyter notebook and Apache spark in windows ? [Tested on Spark 1.6.1]

Thursday, July 21, 2016

How to integrate Jupyter notebook and Apache spark in windows ? [Tested on Spark 1.6.1]

Download Anaconda python and install it (https://www.continuum.io/downloads)
Open command prompt run command " ipython notebook" or "jupyter notebook"
Create a new python notebook and copy paste the below commands

import os

import sys

os.environ['SPARK_HOME'] = "C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6"

sys.path.append("C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6/bin")

sys.path.append("C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6/python")

sys.path.append("C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6/python/pyspark")

sys.path.append("C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6/python/lib")

sys.path.append("C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6/python/lib/pyspark.zip")

sys.path.append("C:/Spark1.6.1/spark-1.6.1-bin-hadoop2.6/python/lib/py4j-0.9-src.zip")

sys.path.append("C:/Program Files/Java/jdk1.8.0_73")

from pyspark import SparkContext

from pyspark import SparkConf

sc = SparkContext("local","test")

replace SPARK_HOME with your spark's home location similarly change the rest of the commands also.

Testing

textFile = sc.textFile("README.md")

textFile.count()

6 comments:

RstrainingsMarch 8, 2018 at 2:38 AM
it was a nice info,keep update,
Data science training
Data science training in madhapur
Data science training in hyderabad
Data science online training
ReplyDelete
Replies
yamunaFebruary 18, 2019 at 1:42 AM
Wow blog is very nice information thankyou soo much blog Hadoop training information very usfull to every one nice nlog
Hadoop Online Training
Datascience Online TRaining
ReplyDelete
Replies
yamunaFebruary 18, 2019 at 2:18 AM
Thanks for information blog
Hadoop Online Training
Datascience Online TRaining

ReplyDelete
Replies
bhargaviFebruary 20, 2019 at 3:46 AM
Thank for sharing this information.keep sharing like this.it will be very greatful.
Data Science Training in Hyderabad
Hadoop Training in Hyderabad

ReplyDelete
Replies
yamunaFebruary 26, 2019 at 3:17 AM
Wow Blog is very nice
Hadoop Online Training
Datascience Online TRaining
ReplyDelete
Replies
yamunaMarch 19, 2019 at 4:54 AM
Wow blog is very nice
Data Science Training in Hyderabad
Hadoop Training in Hyderabad
ReplyDelete
Replies

Subscribe to: Post Comments (Atom)