fbpx

לשימוש במידע ישנו תפקיד מרכזי בהתפתחות המין האנושי, החל מהמהפכה הלשונית לפני כ-70 אלף שנה, דרך המהפכה החקלאית והופעת הכתב, היווצרות הכלכלה והפוליטיקה הגלובלית, וכלה בעידן ה-Big Data בו אנו חיים, ובעלייתה של "דת המידע"'.

בשנות ה-60, עם הופעת ניצני מערכות ניהול המידע הממוחשבות (DBMS), משתמשים החלו להשתמש במידע הדיגיטלי העומד לרשותם כדי לקבל תשובות לשאלות פשוטות (יחסית) ולקבל החלטות עסקיות. שנות ה-80 וה-90 הציגו שתי אבני דרך מרכזיות – מערכות ה-RDBMS וטכנולוגיית ה-OLAP, כלים אשר סללו את הדרך לעולם הבינה העסקית. כתוצאה מכך, תשאולי המידע התפתחו באופן משמעותי, ואפשרו למשתמשים תחקור מידע מתוחכם ומורכב יותר.

הסתפקות במצוי מעולם לא היתה הצד החזק של המין האנושי :). וכך במרוצת השנים, באבולוציות קטנות, צעד אחר צעד, נכנסנו אל עידן גוגל, ונחשפנו לתחום חדש ומרתק – למידת מכונה. המאמר הבא נועד לתת רקע בסיסי בתחום זה, ולהסביר קונספטים מרכזיים.

 

מהו Machine Learning

אם באמצעות בינה עסקית ניתן לקבל תשובות על שאלות מוגדרות, למידת מכונה מאפשרת לקבל תובנות על נושאים שלא בהכרח ניסינו לאתר. עם כמויות ה-Data המסיביות עימן חברות מתמודדות היום, קל לפספס נקודות מפתח. למידת מכונה  היא כלי המאפשר לסנן את כל "הרעש" מהנתונים, ובאמצעותה ניתן לחלץ מידע בלתי מפורש, לגלות קשרים חבויים, להבין תבניות ומגמות ואף לחזות דפוסים חדשים.

 

לדוגמה, באמצעות בינה עסקית, תוכל רשת סופרמקטים לנתח את הרכישות של השנה האחרונה ולשאול: באיזור גוש דן, לחתך הגילאים 30-40, מה היה המוצר הכי רווחי, ואיזה מבצע קידם אותו בצורה האפקטיבית ביותר?

באמצעות למידת מכונה , הרשת תוכל לגלות דפוסים שלא בהכרח היו ידועים לה, לדוגמה, מהם המוצרים אשר בסבירות גבוהה ימכרו יחדיו? על-סמך מכירות העבר, מה צפי המכירות לרבעון הבא? על סמך רכישות העבר של לקוח מסוים, מה ניתן להסיק על התנהגותו הצרכנית? אילו מוצרים ניתן להניח שהוא יקנה בפעם הבאה? כל התובנות הללו מעצימות את כוחה של החברה, ומספקות לה יתרון תחרותי.

 

אלגוריתמים ללמידת מכונה

אז איך מגלים תבניות ודפוסים חדשים? תחום למידת מכונה מושתת על אלגוריתמים. אלגוריתם בלמידת מכונה הוא קבוצה של חישובים מוגדרים מראש המייצרים דפוסים. כדי ליצור את אותו הדפוס, האלגוריתם מנתח את הנתונים אשר סופקו לו, ומחפש סוגים ספציפיים של תבניות, מחזורים, או מגמות חדשות. כל אלגוריתם מאפשר צורת ניתוח אחרת ומתאים למטרות שונות

ניתן לחלק את האלגוריתמים לשתי קבוצות עיקריות. האחת היא אלגוריתמים מקבוצת Supervised Learning שמטרתם להפיק תחזיות, והשניה היא Unsupervised Learning שמטרתם להבין את הקשרים בין הנתונים ולאגד אותם לקבוצות. נסקור בקצרה מספר אלגוריתמים מרכזיים.

 

Decision Trees

אלגוריתם ה-Decision Tree, ממשפחת ה- supervised learning, בודק את השפעתם של מאפיינים שונים על משתנה מטרה מסוים. באמצעותו ניתן לסווג תכונות למספר מוגדר של קבוצות, אשר יחדיו בונות נתיב לגיבוש החלטות.

חברה למוצרי טיפוח מעוניינת ביציאה לקמפיין פרסומי בו היא תפנה ללקוחותיה הקיימים ותציע להם ערכת התנסות חינם במוצריה החדשים. מאחר ועלותה של כל ערכה יקר, החברה מעוניינת לפנות אל הלקוחות בעלי הסבירות הגבוהה ביותר לרכישת הערכה המלאה (בתשלום).

בעבר השתמשה החברה בקמפיין דומה, ובקרב קהלי לקוחות מסוימים נרשמה הצלחה משמעותית. החברה רוצה לזהות את המאפיינים של אותם לקוחות ולפנות נקודתית אליהם.

 

desicion tree

 

decisiontrees

 

החברה החליטה להשתמש במאפיינים (Predictors) הבאים כדי לפלח את הלקוחות שלה: חתך גילאים, מגדר ועיר מגורים (כל לקוחותיה גרים בירושלים או תל-אביב). על סמך מאפיינים אלו היא גילתה כי: הנשים בחתך הגילאים 30-39 הגרות בת״א, והנשים בחתך הגילאים 40-49 הגרות בירושלים, הן הלקוחות אשר בעבר הגיבו בצורה החיובית ביותר לצורת פרסום זו. בהסתמך על נתונים אלו, החברה תדע לפנות רק אל הלקוחות הפוטנציאליים.

 

Clustering

אלגוריתם ה-Clustering, ממשפחת ה-unsupervised learning, נועד לאתר אשכולות מידע עם מאפיינים זהים. באמצעות ההקבצות ניתן לזהות חריגות, ולעיתים קרובות נעשה בו שימוש בתהליכי Fraud Detection.

חברה למתן אשראי, המנהלת מספר רב של לקוחות, רוצה לוודא כי קיימת התאמה בין רמת ההכנסה של המבקש ובין תקרת ההלוואה אותה הוא מבקש. בנוסף, החברה רוצה למנוע הונאות, לדוגמה, מצבים בהם אנשים טוענים כי משכורתם גבוהה ממה שהיא בפועל, בכדי לקבל הלוואה גדולה יותר או תנאים טובים יותר.
לפי נתוניה העכשויים, החברה בנתה הקבצות של עובדים לפי סוגי משרות, ומיפתה אותם על גרף עם שני צירים – שכר ותפקיד. הגרף המופיע מטה מציג קבוצות אנשים ממשרות שונות בתחום התמיכה הטכנית. לדוגמה, ה"ענן" האדום מייצג את מנהלי הצוותים ומשרטט באופן כללי את טווח המשכורות שלהם.

clustering1

אם אדם המזדהה כתומך טכני, טוען כי הוא מרוויח סכום גבוה מעל הממוצע לתחומו, על סמך מערכת זו, החברה תוכל לזהות חשד להונאה.

clustering2

יש לציין כי דוגמה זו מאוד בסיסית ונועדה רק להסביר את הרעיון הכללי. מערכות Clustering אמיתיות יכילו צירים והקבצות רבות. להבדיל מקוד סטטי המכיל התניות וחוקיות לפי קבוצות שונות, מערכת זו דינמית ו"לומדת" שינויים. כאשר תנועות בכלכלה יובילו לשינויי משכורות וההקבצות ישתנו, המערכת תשתנה יחד איתם ותמשיך לזהות חריגות.

 

Association Rules

אלגוריתם ה-Association Rules, ממשפחת ה-unsupervised learning, מאפשר גילוי יחסים בין נתונים. ואריאציות שונות של אלגוריתם זה ניתן למצוא במקומות רבים, מ-IMDB ו-Netflix, אשר יודעים להציע סרטים על סמך תכנים קודמים בהם התעניין הלקוח, דרך אמזון המציעה מוצרים על סמך רכישות קודמות,  ועד חברת Target האמריקאית שגילתה כי נערה מתבגרת נמצאת בהריון לפני שלאביה נודע על כך :).

 

Association Rules

 

Time Series Models

ניתן למצוא סדרת נתונים על פני זמן (Time Series) בענפי תעשיה רבים. המאפיין הבולט ביותר של נתונים אלו הוא הקשר החיובי בין תצפיות סמוכות. לדוגמה, אם המכירות של היום היו גבוהות יחסית רוב הסיכויים שגם מחר הן תהיינה גבוהות מהרגיל ולהפך.

ישנם מודלים\אלגוריתמים ממשפחת ה-supervised learning שיודעים לנצל את הקשר החיובי בין התצפיות על פני זמן ומסוגלים לחזות מגמות עתידיות.

לדוגמה, על סמך תנודות העבר, מה יהיה ערך מניה מסוימת בעוד 5 דקות? מה יהיה שוויה של דירה ברח' אבן גבירול בת"א בשנה הבאה? zillow.com למשל, משתמשים ב-Time Series כדי לחזות את מחירי הדירות בארה"ב. מה יהיו ביצועי השרת בעוד 10 דקות, אם המגמה בה הוא נמצא כעת תמשך? בית חולים יכול לשאול – על סמך נתוני העבר, כמה מיטות עומדות להיות תפוסות בערב שישי הקרוב? חברות יוכלו לשאול – על סמך נתוני ההכנסות וההוצאות בחצי השנה האחרונה, לאיזה סכום עלינו להגדיר את התקציב שלנו ברבעון הבא?

 

time series

 

לסיכום

למידת מכונה  היא טכנולוגיית ניתוח מידע המאפשרת חיזוי או קיבוץ נתונים. באמצעות אלגוריתמים שונים אנו יכולים לחשוף תבניות, מגמות, ודפוסים חדשים.

למידת מכונה  היא לא תהליך הנעשה ע"י גורם אחד בארגון, אלא תהליך המערב שלבים רבים – מהבנה עסקית, איתור המידע הרלוונטי, סינון ו"ניקוי רעשים", הגדרת האלגוריתם, ועד הערכת תוצאות הפלט ומימוש התוצאות.