לאחרונה יצא לי להתקל בסדרת הרצאות מעולות אשר פורסמה במיקרוסופט. הסדרה מומלצת לכל מי שרוצה להכיר את עולם ה Data Science ולהבין טוב יותר קונספטים בסיסיים.
החלק הראשון עוסק בשאלות עליהן ה Data Science עונה, ומסביר מהם: Classification Algorithms, Anomaly Detection Algorithms Regression Algorithms, Clustering Algorithms, ו- Reinforcement Learning Algorithms.
החלק השני עוסק בשאלה: כיצד ניתן לוודא כי המידע העומד לרשותינו תקין? ומסביר מהו Data רלוונטי, מה ההבדל בין Connected ל Disconnected Data, אמידת דיוק המידע, וכמות המידע הדרושה לניתוח.
החלק הבא מסביר כיצד ניתן לנסח שאלות מדוייקות, כיצד לבדוק האם קיים מידע זמין שיענה על השאלה, וכיצד, במידת הצורך, ניתן לנסח את השאלות מחדש.
חלק זה מתמקד בחיזוי נתונים, בהסתמך על הידע שהועבר בחלקים הקודמים, בנקודה זו אנו לומדים כיצד לבנות מודל אשר יאפשר לנו לחזות תשובות.
החלק האחרון מסביר כיצד ניתן למצוא דוגמאות Machine Learning כנקודת התחלה ללמידת הנושא.