MLops: עליית פעולות הלמידה במכונה

עד כמה שקשה למדעני הנתונים לתייג נתונים ולפתח מודלים ללימוד מכונה מדויקים, ניהול מודלים בייצור יכול להיות מרתיע עוד יותר. זיהוי סחיפה של מודלים, הכשרה חוזרת של מודלים עם עדכון מערכי נתונים, שיפור ביצועים ושמירה על פלטפורמות הטכנולוגיה הבסיסיות הם פרקטיקות מדעיות נתונים חשובות. ללא תחומים אלה, מודלים יכולים לייצר תוצאות שגויות המשפיעות באופן משמעותי על העסק.

פיתוח דגמים מוכנים לייצור אינו דבר פשוט. על פי מחקר אחד של למידת מכונה, 55 אחוז מהחברות לא פרסו מודלים לייצור, ו 40 אחוז ומעלה דורשים יותר מ 30 יום לפרוס מודל אחד. הצלחה מביאה אתגרים חדשים, ו -41 אחוז מהנשאלים מודים בקושי בגירסת מודלים של למידת מכונה ושחזור.

הלקח כאן הוא שמופיעים מכשולים חדשים לאחר שמודלים של למידת מכונה נפרסים לייצור ומשמשים בתהליכים עסקיים.

ניהול מודלים ותפעול היו פעם אתגרים עבור צוותי מדע הנתונים המתקדמים יותר. כעת המשימות כוללות פיקוח על מודלים של למידת מכונות ייצור לסחיפה, אוטומציה של הסבה מחודשת של מודלים, התראה כאשר הסחף משמעותי והכרה מתי מודלים דורשים שדרוגים. ככל שיותר ארגונים משקיעים בלמידת מכונה, יש צורך גדול יותר לבנות מודעות סביב ניהול ותפעול מודלים.

החדשות הטובות הן פלטפורמות וספריות כגון קוד פתוח MLFlow ו- DVC, וכלים מסחריים של Alteryx, Databricks, Dataiku, SAS, DataRobot, ModelOp ואחרים מקלים על צוותי מדעי הנתונים על ניהול ותפעול. ספקי הענן הציבוריים חולקים גם פרקטיקות כגון הטמעת MLops עם Machine Machine Learning.

יש כמה קווי דמיון בין ניהול מודלים לבין devops. רבים מתייחסים לניהול מודלים ולפעולות כאל מלופס ומגדירים אותו כתרבות, פרקטיקות וטכנולוגיות הנדרשות לפיתוח ותחזוקת מודלים של למידת מכונה.

הבנת ניהול ותפעול מודלים

כדי להבין טוב יותר את ניהול המודל ואת פעולותיו, שקול את האיחוד בין שיטות פיתוח תוכנה לשיטות מדעיות.

כמפתח תוכנה אתה יודע כי השלמת גרסת היישום ופריסתה לייצור אינה טריוויאלית. אך אתגר גדול עוד יותר מתחיל ברגע שהיישום מגיע לייצור. משתמשי הקצה מצפים לשיפורים שוטפים, והתשתית, הפלטפורמות והספריות הבסיסיות דורשות תיקון ותחזוקה.

בואו נעבור לעולם המדעי שבו שאלות מובילות להשערות מרובות ולניסויים חוזרים. למדת בשיעורי מדע לשמור יומן של ניסויים אלה ולעקוב אחר המסע של צבירת משתנים שונים מניסוי אחד למשנהו. ניסויים מובילים לתוצאות משופרות, ותיעוד המסע מסייע לשכנע עמיתים שבדקתם את כל המשתנים ושהתוצאות ניתנות לשחזור.

מדעני נתונים המתנסים במודלים של למידת מכונה חייבים לשלב דיסציפלינות הן מפיתוח תוכנה והן ממחקר מדעי. מודלים של למידת מכונה הם קוד תוכנה שפותח בשפות כמו Python ו- R, שנבנה עם TensorFlow, PyTorch או ספריות למידה ממוחשבות אחרות, המופעל על פלטפורמות כגון Apache Spark, ונפרס לתשתית ענן. פיתוח ותמיכה של מודלים ללימוד מכונה דורשים ניסויים ואופטימיזציה משמעותיים, ועל מדעני הנתונים להוכיח את דיוק המודלים שלהם.

כמו פיתוח תוכנה, מודלים של למידת מכונה זקוקים לתחזוקה שוטפת ושיפורים. חלקם נובע משמירה על הקוד, הספריות, הפלטפורמות והתשתית, אך מדעני הנתונים חייבים להיות מודאגים גם מההיסחפות של המודל. במילים פשוטות, סחף המודל מתרחש כאשר נתונים חדשים הופכים לזמינים, והתחזיות, האשכולות, הפילוחים וההמלצות הניתנות על ידי מודלים של למידת מכונה חורגות מהתוצאות הצפויות.

ניהול מודלים מוצלח מתחיל בפיתוח מודלים אופטימליים

שוחחתי עם אלן ג'ייקובסון, מנהל נתונים וניתוח ראשי באלתריקס, על האופן שבו ארגונים מצליחים ומפתחים את פיתוח מודלים של למידת מכונה. "כדי לפשט את פיתוח המודלים, האתגר הראשון עבור מרבית מדעני הנתונים הוא להבטיח ניסוח בעיות חזק. ניתן לפתור הרבה בעיות עסקיות מורכבות בעזרת ניתוח פשוט מאוד, אך תחילה הדבר מחייב בניית הבעיה באופן שנתונים וניתוחים יוכלו לעזור במענה לשאלה. גם כאשר ממונפים מודלים מורכבים, החלק הקשה ביותר בתהליך הוא בדרך כלל מבנה הנתונים והבטחת השימוש בתשומות הנכונות הם ברמות האיכות הנכונות. "

אני מסכים עם ג'ייקובסון. יותר מדי יישומי נתונים וטכנולוגיה מתחילים בהצהרות לקויות או ללא בעיות ועם זמן מספיק, כלים ומומחיות בנושא כדי להבטיח איכות נתונים מספקת. תחילה על ארגונים להתחיל לשאול שאלות חכמות אודות ביג-דאטה, להשקיע ב- dataops ולאחר מכן להשתמש במתודולוגיות זריזות במדע הנתונים כדי לחזור על פתרונות.

ניטור מודלים של למידת מכונה להיסחפות המודל

קבלת הגדרת בעיה מדויקת היא קריטית לניהול שוטף ולניטור המודלים בייצור. ג'ייקובסון המשיך והסביר, "פיקוח על מודלים הוא תהליך חשוב, אך לעשות זאת נכון דורש הבנה חזקה של המטרות וההשפעות השליליות האפשריות המצדיקות צפייה. בעוד שרובם דנים במעקב אחר ביצועי מודל ושינויים לאורך זמן, מה שחשוב ומאתגר יותר במרחב זה הוא ניתוח ההשלכות הלא מכוונות. "

אחת הדרכים הקלות להבין את היסחפות המודל ואת ההשלכות הלא מכוונות היא לשקול את ההשפעה של COVID-19 על מודלים של למידת מכונה שפותחו עם נתוני אימונים מלפני המגיפה. מודלים של למידת מכונה המבוססים על התנהגויות אנושיות, עיבוד שפה טבעית, מודלים של דרישת צרכנים או דפוסי הונאה, הושפעו כולם משינויים בהתנהגויות במהלך המגיפה המתעסקים במודלים של AI.

ספקי טכנולוגיה משחררים יכולות MLops חדשות ככל שיותר ארגונים מקבלים ערך ומבשלים את תוכניות מדע הנתונים שלהם. לדוגמא, SAS הציגה אינדקס תרומות תכונות המסייע למדעני נתונים להעריך מודלים ללא משתנה יעד. Cloudera הכריזה לאחרונה על שירות ניטור ML התופס מדדי ביצועים טכניים וחיזוי מעקב אחר מודלים.

MLops מתייחס גם לאוטומציה ושיתוף פעולה

בין פיתוח מודל למידת מכונה וניטורו בייצור ישנם כלים נוספים, תהליכים, שיתופי פעולה ויכולות המאפשרים הגדלה של פרקטיקות מדעי הנתונים. חלק משיטות האוטומציה והתשתיות מקבילות ל- devops וכוללות תשתית כקוד ו- CI / CD (אינטגרציה רציפה / פריסה רציפה) עבור מודלים של למידת מכונה. אחרים כוללים יכולות מפתח כגון גרסאות דגמים עם נתוני ההדרכה הבסיסיים שלהם וחיפוש במאגר הדגמים.

ההיבטים המעניינים יותר של MLops מביאים מתודולוגיה מדעית ושיתוף פעולה לצוותי מדעי הנתונים. לדוגמה, DataRobot מאפשר מודל אלוף-מתמודד שיכול להריץ מספר מודלים ניסיוניים במקביל לאתגר את דיוק גרסת הייצור. SAS רוצה לעזור למדעני נתונים לשפר את המהירות לשווקים ואת איכות הנתונים. Alteryx הציגה לאחרונה את Analytics Hub כדי לסייע בשיתוף פעולה ושיתוף בין צוותי מדע הנתונים.

כל זה מראה כי ניהול למידות מכונות וקנה מידה בהן דורש הרבה יותר משמעת ותרגול מאשר פשוט לבקש ממדעני נתונים לקודד ולבדוק רשת עצבית אקראית, k-means או convolutional ב- Python.