
על הקורס
- פייתון (Python) היא שפת תכנות נפוצה מאוד, רבת עוצמה ובעלת שימושים רבים. פשטות ויעילות השפה הפכו אותה לאחת הפופולאריות בעולם, וכיום היא נמצאת בשימוש רב במגוון רחב של תחומים.
- קורס זה מלמד את בסיסי השפה ומתמקד ביכולות ה- Data Analysis של Python, תוך כדי הקניית ידע נרחב ומעמיק בספריות (Libraries) הרלוונטיות של השפה.
- קורס זה הינו ראשון וייחודי בארץ – הן בצורת הלימוד, המותאמת לאנליסטים, הן בכמות תכניו הנרחבת והן באיכות התרגול, המדמה שימושים אמיתיים מן התעשייה.
קהל היעד
- הקורס מיועד לבעלי ניסיון מקצועי מעשי בתחום איחזור הנתונים. בין היתר, הקורס מתאים לאנליסטים,אנשי BI, כותבי קוד, מנהלי פיתוח, אנשי DB וראשי צוותים.
- הקורס דורש רקע ברמה בסיסית בשפת ה-SQL, וכן רקע קודם בכתיבת קוד בשפה כלשהי
יעדים מרכזיים
- במהלך הקורס ירכשו המשתתפים היכרות עם בסיסי השפה וידע מעמיק בספריות Python המיועדות לניתוח נתונים
- הקורס מקנה את כל הידע הנדרש לניתוח מידע, החל מ- Subsetting בסיסי וכלה במיונים מורכבים, אגרגציות, שימוש באינדקסים, טכניקות Pivot, יישום פונקציות אנליטיות וחישובים סטטיסטיים.
- התרגולים שיבוצעו במהלך הקורס מושתתים על Datasets אמיתיים מן התעשייה, אשר יאפשרו הבנה פרקטית, ויקנו יכולת יישום מהירה בסביבת העבודה האמיתית.
- In our first session of the Python Data Analysis course, we will dive into the key elements of the Python language that we will heavily use throughout the course.
- Additionally, we will explore various environments suitable for running Python code.
- This foundational knowledge will empower us to conduct in-depth data exploration and visualization in subsequent lessons.
- Selecting columns in a dataset
- Performing basic calculations with data
- Concatenating data
- Adding new columns to the DataFrame
- Renaming existing columns
- Retrieving distinct list of values
- Creating a simple DataFrame from a Python list
- Getting info about your DataFrame
- Using simple operators for data filtering
- Employing complex operators for advanced data manipulation
- Using
isin()
andbetween()
methods - Text matching techniques
- Filtering empty or null values
- Using
- Sorting a DataFrame using
sort_values()
- Understanding
inplace
andna_position
parameters in sorting - Using
sort_index()
to sort DataFrame by index - Retrieving top-n rows
- Filtering by index
- Using the
query()
method for data selection
- Introduction to string functions in Python
- Applying numeric functions to data
- Date functions for time series data
- Conversion functions for data type modification
- Functions for handling missing values (NaNs)
- Using the
apply()
function to implement custom operations
- Performing basic aggregation operations
- Understanding and using the
groupby()
method - Filtering a grouping set for targeted analysis
- Applying
groupby()
method on multiple columns
- Understanding and applying Union All operation
- Performing Union operation on data
- Implementing Intersect operation
- Using Minus / Except operations for data manipulation
- Implementing Inner Join on datasets
- Performing Outer Join Left operation
- Applying Outer Join Right operation
- Using Outer Join Full to combine datasets
- Adding / dropping a column from DataFrame
- Renaming a column
- Deleting rows from DataFrame
- Updating rows in the DataFrame
- Creating random samples from data
- Understanding the need for indexes
- Learning basic methods for index handling
- Retrieving rows by index label
- Retrieving rows by index position
- Handling missing values in the DataFrame
- Setting up multi-indexes for complex data structures
- Extracting rows from multi-indexed DataFrame
- Using
transpose()
function to switch rows and columns
- Using
pivot_table()
for data reshaping - Employing
melt()
for data transformation
- Using remote datasets for real-world analysis
- Reading and writing data from/to CSV files
- Working with XML data
- Parsing JSON data
- Reading multiple files into DataFrames
- Using RANK function for data ranking
- Applying LAG and LEAD functions for lagged computations
- Employing NTILE function for binning data
- Introduction to Matplotlib and seaborn libraries
- Types of Matplotlib charts: line, bar, scatter, pie, histogram, boxplot
- Basic customizations of Matplotlib charts: title, labels, legends, axes, ticks
- Advanced customizations of Matplotlib charts: subplots, color maps, annotations
- The aim of this lesson is to provide an introduction to statistical analysis
- . In this module, students will learn the basic concepts of descriptive and inferential statistics that are used to extract useful insights from data.
עם איזה רקע צריך להגיע אל הקורס
רקע ב-SQL והבנה בסיסית בקונספטים הקשורים לעולם התכנות
ניתוח נתונים ב Python זה לא תכנות ב Python, אתם ממש לא חייבים להיות מומחי פיתוח קוד פיתון כדי לדעת לנתח נתונים באמצעותו. למען האמת – כדי להתחיל: לא צריך לדעת שורת קוד אחת. בקורס שאנו מעבירים, כמעט ואין נגיעה בתכנות "פרופר", ועדיין – בסיום הקורס אתם תגיעו די רחוק.
איך זה יכול להיות ?
גישת ההוראה שלנו מתמקדת בהקבלת\תרגום החשיבה ה-SQLית ל Python. בצורה הזו, הדגש הוא על Data Analysis, לא על תכנות.
אז לא צריך לדעת Python בכלל ?
כן ולא
אתם לא צריכים רקע קודם ב-Python. הקורס שלנו מתחיל בשיעור בו אנו מיישרים קו, ומלמדים את הנקודות המרכזיות שצריך להבין בשפה כדי לנתח נתונים באמצעותה. ועם זאת – הבנה בסיסית במושגי יסוד ונסיון קודם בשפת תכנות כלשהי הכרחיים. אל הקורס אתם צריכים לבוא כשאתם יודעים איך להגדיר ולכתוב אלמנטים בסיסיים כמו משנים, תנאים, לולאות, ופונקציות.
לאחר הקורס – אם תרצו להתעמק, להשתכלל ולהבין יותר, כן, אתם בהחלט תצטרכו ללמוד יותר Python.
למה ניתוח נתונים ב Python ולא SQL או Excel ?
כבודן של SQL ו-Excel במקומן מונח, ניתוח נתונים ב Python לא מחליף – אלא יותר נותן קונטרה, ומתאים לסיטואציות שלא תמיד מקבלות מענה במקומות אחרים. מה למשל ?
- עבודה עם כמעט כל סוג של דאטה-סט
- אוטומציה פשוטה ויעילה
- עבודה עם כמויות גדולות של נתונים
- האפשרות הניתנת לאחרים לייצר שוב, ולעבור בקלות על אנליזות שיצרתם
- כלים ל"ניקוי נתונים" בקלות ומהירות
- ספריות Statistics ו- Machine Learning עצומות
- יכולות מתקדמות ל Data Visualizations
- ועוד, ועוד 🙂
מה לומדים בתכלס?
מפורט בלשונית "נושאי הקורס"
מקבלים תעודה ?
מקבלים. ע"מ לקבל ישנה חובת נוכחות ב 80% מהמפגשים וחובת הגשה של כל המטלות.