
אנליסטים – ניסיון כבר יש לכם, אבל הייתם רוצים לקחת את הידע שלכם צעד אחד קדימה? מעוניינים להבין איך מנתחים דאטה באמצעות פיתון? איך מיישמים מודלים סטטיסטיים כדי להפיק יותר מהדאטה? רוצים להחשף לחלק היישומי בעולם ה- Data Science אשר ניתן לעשות בו שימוש בעבודה היומיומית שלכם?
הקורס הבא בשבילכם.
למה Python Data Analysis?
כל אנליזה שאנו עושים משתייכת לאחד מ-3 הסוגים הבאים:
- אנליזות על משתנה\עמודה בודדת (Univariate Analysis) – ממוצע, חציון, סטית תקן וכד'
- אנליזות על אינטראקציות בין 2 משתנים (Bivariate Analysis) – לדוגמא ממוצע שכר לפי מגדר, מתאם בין שכר לגיל, עד כמה האינטראקציות הללו מובהקות, ועוד.
- אנליזות על אינטראקציות בין 3 משתנים או יותר (Multivariate Analysis) – לדוגמא עד כמה משפיעים המגדר, איזור המגורים והגיל של האדם על רמת השכר שלו
על כל השאלות הללו אנו כאנליסטים צריכים לדעת לתת מענה. אך לרוב נעצרים בחלק הראשון, וקצת מגרדים את הבסיס של החלק השני.
למה? לרוב מ-2 סיבות –
- חוסר ידע ב-Python. עם כל הכבוד ל- SQL ואקסל, בניתוחים מורכבים מהסוג שציינו כלים אלו מוגבלים במידה מסויימת
- מחסום תפיסתי, לפיו מודלים סטטיסטיים בהם משתמש ה- Data Scientist פחות רלוונטיים ומידי מורכבים על-מנת שגם אנליסט יוכל להפיק מהם תועלת.
הגישה שלנו –
למה שאנליסט – אחד הגורמים בארגון שמבין את הביזנס הכי טוב, בעל תפיסה מתמטית גבוהה ולרוב עם רקע קודם בתכנות, לא ישתמש בכלים סטטיסטיים מתקדמים, או יריץ מודלים מהדומיין של ה- Machine Learning על-מנת להפיק יותר תועלת מהנתונים שעומדים לרשותו?
אם תשאלו אותנו – נאמר שאין שום סיבה, ושהכלים שנחשבים לנחלתו הבלעדית של ה- Data Scientist יכולים וצריכים להכנס לארסנל הכלים של האנליסט. וזו מטרת הקורס – להקנות לכם את הכלים הללו.
אז מה אנחנו מלמדים
הקורס שלנו נחלק ל-4 מודולים
- ניתוח נתונים "קלאסי" באמצעות Python, בדומה למה ששפת ה-SQL מאפשרת: פילטור, מיון, הקבצות, שילוב טבלאות, פעולות Pivot ועוד.
- חישובים סטטיסטיים – מימוש כלים סטטיסטיים על-מנת לקבל אומדן על הנתונים, להעלות השערות, ולבצע מבחנים שונים כגון T-Tests, ANOVA, Chi-squared, Correlations
- טכניקות לניקוי והכנת דאטה לקראת מודלים סטטיסטיים \ ML מורכבים
- מימוש מודלים פרקטיים מעולם ה-ML בעבודתנו כאנליסטים
מה הקורס יעניק לכם?
- יכולת לנתח נתונים, לבצע חישובים סטטיסטיים, ולהריץ מודלים של ML באמצעות Python
- למידה אינטנסיבית דרך הידיים – עשרות דאטה-סטים, וכמויות עצומות של תרגולים
- חומרי הדרכה מסודרים ומפורטים שישארו אתכם הרבה אחרי שהקורס יסתיים
- דוגמאות, תרגילים והסברים המבוססים על נסיון מהשטח
- יכולת לבניית תיק עבודות המבוסס על אנליזות באמצעות Python
- תמיכה שוטפת בכל שאלה, במהלך הקורס ולאחריו
איך לומדים
- משך הקורס – 12 מפגשים, אשר חלקם יועברו במתכונת פרונטלית (פיזית), חלקם יועברו במתכונת אונליין (Zoom)
- בסיום כל שיעור, את ההקלטה של המפגש, אליה תהיה לכם גישה במהלך הקורס, נפרסם בקבוצה ייעודית לתלמידי הקורס.
- במשך השבוע תקבלו משימות, אותן יש להשלים עד השיעור הבא.
- בכל בעיה בה תתקלו במהלך הדרך – ניתן להתייעץ עם המרצה, המתרגל, או חברי הקבוצה.
מובילי הקורס
- רם קדם – חי את עולם ה-Data כבר למעלה מ-15 שנה, הוביל פרויקטים מגוונים, ניהל מקצועית מכללות מובילות, הדריך עשרות אלפי אנשים , וכתב ספרות בתחום ה-Data אשר נמכרת ברחבי העולם
- מיכאל ווינר – מעל 5 שנות נסיון כמדען נתונים וכמנהל צוות בתחום, ו-10 שנות נסיון בתחום הדאטה, בעל נסיון בהובלה של פרוייקטים רבים בתחומי ביג דאטה, למידת מכונה ומודלים סטטיסטיים.
הרשמה
ניתן ליצור עמנו קשר על-מנת לקבל פרטים נוספים ולהרשם
- This module introduces the Pandas DataFrames, which may be one of the primary reasons that Python has become the most prominent language for data science. During this module we’ll learn how to create, modify, filter, sort and aggregate our data using Pandas DataFrames
- During this module we’ll also cover various visualisation methods using Matplotlib & Seaborn
This module demonstrates how to implement Descriptive and Inferential Statistics using Python, and focuses on the following subjects:
- Understanding & Applying Univariate Statistics
- Data distributions
- Point estimates and confidence intervals
- Hypothesis testing
- T-Tests and ANOVA
- Correlations
- Chi Squared Tests
- A/B Testing Essentials – Theory and Python Implementation
- Pre-processing refers to the transformations applied to our data before feeding it to the ML algorithm. Data Preprocessing is a set of techniques that are used to convert the raw data into a clean data set.
- During this module we'll mainly cover the following techniques:
- Train/Test split
- String Indexing scikit
- One hot encoding scikit
- Standardisation scikit + manual implement
- Data Imputation
- In the following lessons you will get hands-on with some of the most industry recognized algorithms such as linear regression, decision trees, xgboost, k-means and more.
- In each lesson, we will pay our focus on a different algorithm, and will go through:
- Basic theory and understanding of the algorithm
- Relevant documentation reading in scikit-learn and other packages
- Code sample walkthrough
- Homework assignment walkthrough
- More materials we believe are relevant for your understanding
- In addition, we will pave our way with some of the most common concepts in machine learning such as: data splitting, scaling, overfitting, hyperparameter tuning, gradient descent and more.
- The lessons themselves are divided into two groups: supervised learning and unsupervised learning.
- Supervised learning:
- Intro to ML, Linear Regression
- Logistic Regression
- Decision Trees
- Ensembles
- UnSupervised Learning:
- UnSupervised Learning in the real world, k-means
- DBSCAN
עם איזה רקע צריך להגיע אל הקורס
- הקורס מיועד לאנליסטים מנוסים, בעלי רקע קודם בניתוח נתונים
- מבחינת ידע – אנחנו דורשים הבנה ב SQL, Python
- רקע מקדים בסטטיסטיקה מהווה יתרון אך לא הכרחי
- הכניסה לקורס מותנית בשיחה לטובת היכרות מקצועית ותיאום ציפיות
מה לומדים בתכלס
מפורט בלשונית "נושאי הקורס"
מקבלים תעודה ?
מקבלים. ע"מ לקבל ישנה חובת נוכחות ב 80% מהמפגשים וחובת הגשה של כל המטלות.
מחזורים קרובים
17/02/2023
7/2023
מה תלמידים אומרים על הקורס






