הקדמה

לדעת איך לכתוב שאילתות היא מיומנות אחת. להבין דאטה ולקרוא נכון את הקשרים בין הטבלאות, היא מיומנות אחרת שתרגול זה בא לתת עבורה מענה. התרגילים הבאים הינם חלק ממאגר שאלות (בבנייה) אשר ממוקדים לאנליסטים ומאופיינים בדרישה להבנה עסקית לצד התחקורים הטכניים.

 

אודות

Stack Exchange מהווה רשת של אתרים אשר מאפשרת לקהילות שונות לחלוק ידע, לשאול, ולענות על שאלות בנושאים רבים. Movies & TV Stack Exchange – אחד מתוך אתרים אלו, ממוקד בשאלות ותשובות הנוגעות לסרטים וסדרות. מאגר נתונים זה בנוי על פיו ומדמה חלק מהנתונים אשר קיימים בו.

 

דיאגרמה



 

תיאור כללי

מאגר נתונים זה בנוי מ-4 טבלאות : משתמשים, פוסטים, תגובות, והצבעות.

  • פוסטים (Posts) – לכל פוסט יכולות להיות תגובות שונות, ועל כל פוסט יוזרים שונים יכולים להצביע (ע"מ לשפר את הדירוג שלו)
  • הצבעות (Votes) – כל הצבעה מורכבת ממספר הצבעה, מספר משתמש (FK), מספר פוסט (FK), ותאריך יצירה
  • תגובות (Comments) – פרטי התגובות השונות על הפוסטים
  • משתמשים (Users) – פרטי המשתמשים אשר הגיבו \ כתבו פוסט \ הצביעו

 

הורדה

את הסקריפט ליצירת מאגר הנתונים ניתן להוריד באמצעות הקישור הבא

 

תרגול

התרגילים הבאים בנויים בסדר קושי עולה. התרגילים הראשונים די פשוטים, מיועדים בעיקר להיכרות כללית עם הדאטה, התרגילים בניתוח המתקדם יכולים להיות די מאתגרים.

 
היכרות בסיסית

  1. כמה פוסטים נוצרו בכל שנה ?
  2. כמה הצבעות נוצרו בכל יום של השבוע (ראשון, שני, שלישי וכד') ?
  3. הציגו את כל התגובות אשר נוצרו ב-19 לדצמבר 2012
  4. הציגו את כל המשתמשים מתחת לגיל 33 אשר גרים בלונדון

ניתוח מתקדם

  1. הציגו את מספר ההצבעות עבור כל כותרת פוסט (Post Title)
  2. הציגו את התגובות אשר נוצרו בידי משתמשים הגרים באותו האיזור של יוצר הפוסט
  3. כמה יוזרים מעולם לא הצביעו ?
  4. הציגו את כל הפוסטים בעלי כמות התגובות הגבוהה ביותר
  5. עבור כל פוסט, כמה הצבעות מגיעות מיוזרים הגרים בקנדה ? מהו האחוז שלהם מהסך הכולל של ההצבעות ?
  6. כמה שעות בממוצע, לוקח לתגובה הראשונה להכתב (לאחר שפוסט חדש נוצר)
  7. מהו טג הפוסט הנפוץ ביותר ?
  8. צרו טבלת Pivot אשר מציגה כמה פוסטים נוצרו בכל שנה ובכל חודש

 

פתרונות