צרו קשר לפרטים נוספים

אני רוצה לקבל מידע בנושאי אירועים וקורסים מרם קדם

או באמצעות מייל:
ram@ramkedem.com

קורס Python – ניתוח ועיבוד נתונים

* הקורס רלוונטי לקבוצות מטעם ארגונים וחברות בלבד
 

על הקורס

  • קורס זה מתמקד ביכולות ה- Data Analysis של Python, ומקנה ידע נרחב ומעמיק בספריות (Libraries) הרלוונטיות של השפה. 
  • קורס זה הינו ראשון וייחודי בארץ – הן בצורת הלימוד, המותאמת לאנליסטים, הן בכמות תכניו הנרחבת והן באיכות התרגול, המדמה שימושים אמיתיים מן התעשייה.  
  • משך קורס: 40 שעות אקדמיות, 5 מפגשים

 

קהל יעד

  • הקורס מיועד לבעלי ניסיון מקצועי מעשי בתחום איחזור הנתונים. בין היתר, הקורס מתאים לאנליסטים, אנשי BI, כותבי קוד, מנהלי פיתוח, אנשי DB וראשי צוותים.  
  • הקורס דורש רקע ברמה בסיסית בשפת ה-SQL, וכן רקע בכתיבת קוד באמצעות Python.

 

יעדים מרכזיים

  • במהלך הקורס ירכשו המשתתפים ידע מעמיק בספריות Numpy, Pandas, Scipy ו- Matplotlib. 
  • הקורס מקנה את כל הידע הנדרש לניתוח מידע, החל מ- Subsetting בסיסי וכלה במיונים מורכבים, אגרגציות, שימוש באינדקסים, טכניקות Pivot ויישום פונקציות אנליטיות. 
  • הקורס מקנה ידע נרחב בעבודה עם סוגי קבצים שונים, כגון: CSV, Json, Excel, XML ועוד. 
  • התרגולים שיבוצעו במהלך הקורס מושתתים על Datasets אמיתיים מן התעשייה, אשר יאפשרו הבנה פרקטית, ויקנו יכולת יישום מהירה בסביבת העבודה האמיתית.

Part 1 - Data Analysis using NumPy

Module 1 – NumPy Basics

  • The need for numpy arrays
  • About numpy
  • Creating a simple numpy array
  • Inspecting the numpy array properties
  • Python lists vs numpy arrays

Module 2 – Generating Data Using NumPy

  • Creating customised numeric sequences
  • Create repeating sequences
  • Generate random numbers
  • Using random.choice()

Module 3 – Subsetting Numpy Arrays

  • Subsetting 1d numpy array
  • Subsetting 2d numpy array

Module 4 – Performing Calculations on a Numpy Array

  • 1D numpy Array arithmatics
  • Calculating two 1D numpy arrays
  • Performing calculations on 2D Numpy array

Module 5 – Filtering Data

  • Filtering 1d numpy array
  • Filtering 2d numpy array
  • Find elements within range
  • Using isin()
  • Using isnan()
  • Using any() & all()

Module 6 – Sort a NumPy Array

  • Using sort()
  • Using argsort()
  • Using lexsort()

Module 7 – Applying Functions

  • Working with numerics
  • Working with dates
  • The np.datetime64 object
  • Extracting specific Parts of the date
  • Datetime arithmetic
  • Adding months and years
  • Create a sequence of dates
  • Compare against dates
  • Apply functions on vectors
  • Np.vectorize()
  • Apply_along_axis()

Module 8 – Aggregate Functions

  • Basic functions
  • Dealing with nan values
  • Group by

Module 9 – Set Operations

  • Concatenate two arrays columnwise and row-wise
  • Union all
  • Union
  • Intersect
  • Subtract
  • Union / intersect / substract with 2d

Module 10 – Reshaping and Flattening Multidimensional arrays

  • Reshaping
  • Flatenning

Module 11 – NumPy's Structured Arrays

  • Introduction
  • Creating numpy's structured arrays
  • Loading csv into a structured array

Module 12 – Introduction to SciPy

  • What is SciPy
  • What is the difference between SciPy and NumPy
  • Solving Linear Algebra Equations with SciPy

Part 2 - Data Analysis using Pandas

Module 1 – Basic Select Operations

  • Selecting columns dataset
  • Calculations
  • Concatenations
  • Adding new columns
  • Renaming existing columns
  • Retreiving distinct list of values
  • Creating a simple dataframe from a python list
  • Getting info on your dataframe

Module 2 – Filtering & Sorting

  • Simple operators
  • Complex operators
  • Isin() method
  • Between() method
  • Text matching
  • Filtering empty values
  • Sort a dataframe
  • Using sort_values()
  • Understanding inplace
  • Understanding na_position
  • Sort_index()
  • Top-n rows
  • Filter by index
  • The query() method

Module 3 – Applying Scalar Functions

  • String functions
  • Numeric functions
  • Date functions
  • Conversion functions
  • Nan functions
  • Using the apply function

Module 4 – Aggregative Functions

  • Basic aggregations
  • The groupby() method
  • Filter a grouping set
  • Groupby() multiple columns

Module 5 – SET Operations

  • Union all
  • Union
  • Intersect
  • Minus / except

Module 6 – JOIN Opearions

  • Inner join
  • Outer join left
  • Outer join right
  • Outer join full

Module 7 – Schema Modifications

  • Adding / dropping a column
  • Renaming a column
  • Deleting rows
  • Updating rows
  • Create random samples

Module 8 – Pandas Indexes

  • The need for indexes
  • Basic methods
  • Retrieve rows by index label
  • Retreive rows by index position
  • Handling missing values
  • Setting multi-indexes
  • Extracting rows from multi-indexes
  • Using traspose()

Module 9 – Pivot operations

  • Using pivot_table()
  • Using melt()

Module 10 – Input / Output Operations

  • Using remote datasets
  • Working with CSV
  • Working with XML
  • Working with JSON
  • Reading multiple files

Module 11 – Working with Analytic Functions

  • Using RANK
  • LAG and LEAD
  • NTILE

Data Visualization using Matplotlib

MatplotLib Basics

  • Working with Matplotlib
  • types of matplotlib charts
  • basic customizations
  • advanced customizations
  • 3d graphing