פנדה 1.0 מביא לשינויים גדולים

פנדאס, ספריית ניתוח הנתונים של פייתון, הגיעה סוף סוף למועמד לשחרור 1.0. Pandas 1.0 מסיר הרבה מאוד פונקציונליות שהוצא משימוש ודורש Python 3.6 ומעלה. 

פנדות נוצרו לעבודה קלה עם נתונים בפורמטים מובנים, כגון טבלאות, מטריצות ונתוני סדרות זמן. פנדות מאפילות חלק ניכר מהפונקציונליות של מסגרות הנתונים של R, ועובדת היטב עם ספריות מחשוב מדעיות אחרות בעולם הפיתון.

עם Pandas 1.0, יוצרי Pandas מציגים שורה ארוכה של שינויים שבוצעו כבר זמן מה. הנה סקירה של המשמעותיים ביותר וכיצד לטפל בהם בהמשך.

Pandas דורש Python 3.6.1 ומעלה

השינוי הגדול ביותר ב- Pandas 1.0 הוא הורדת התמיכה בכל הגרסאות של Python מוקדם יותר מ- Python 3.6.1. Pandas הפילה את התמיכה ב- Python 2 והתחייבה באופן בלעדי ל- Python 3 החל משנת 2019, כך שזה בעיקר חידוד של מדיניות קיימת.

לפרויקט יש מדיניות תמיכה חדשה עבור גרסאות עתידיות של פנדה. כל טיפת תמיכה בגרסת Python תושק בגרסאות חדשות גדולות של Pandas (2.0, 3.0 וכו '). גרסאות קלות יפקיעו את התכונות, אך לא יסירו אותן; גרסאות מרכזיות יסירו תכונות.

ערך ה- NA החדש של פנדה

גרסאות קודמות של Pandas השתמשו בסוגים שונים כדי לייצג נתונים חסרים, בהתאם לסוג המכולה - אחד לסוגי זמן זמן, אחד לאובייקטים וכו '. כל אלה מוזגים לסוג נתונים חסר אחד הנקרא NA. נכון לעכשיו, התמיכה ב- NA מוגבלת לכמה סוגי אובייקטים והיא נחשבת לניסוי, ולכן עדיין אין להשתמש בה בייצור. 

אי תאימות API

בגלל מספר השינויים ב- Pandas 1.0, חלק ממשקי ה- API של Pandas אינם תואמים לאחור. זה כולל שינויים בהתנהגויות של אלמנטים נפוצים רבים:

  • DataFrame הסוג
  • pandas.array
  • arrays.IntegerArray

רבים מאי התאמות הללו יעלו אזהרות, אך עדיף לבדוק סקריפטים של פנדה קיימים זה לצד זה עם עמיתיהם Pandas 1.0 כדי לראות כיצד הם פועלים.

תכונות שהוצאו משימוש ב- Pandas 1.0

התיעוד של Pandas מפרט את כל התכונות שיש לשלול אך לא להסיר ב- Pandas 1.0. לחלקם פשוט שונה או ארגן מחדש, כמו מודול הבדיקה, בעוד שאחרים משנים את השימוש בפרמטרים מסוימים של פונקציות. בכמה מקרים, כמו עם Series.item()ו Index.item(), תכונות חולצו משימוש וימשיכו להיות זמינות.

אם אתה משתמש בגרסה של פנדה מוקדם יותר מאשר 0.25, היוצרים של פנדה מומלץ להעביר את פנדה 0.25  ראשון , מוודאים כול מתנהג קוד פנדה תלוי כצפוי,  אז מעבר ל פנדה 1.0. זאת על מנת להבטיח שכל קוד המשתמש בפונקציונליות שהוצא משימוש יסומן.

תכונות שהוסרו ב- Pandas 1.0

חלק מהתכונות העיקריות של פנדה הוסרו כליל ב- Pandas 1.0:

  • SparseSeriesו SparseDataFrame. השתמש במקום זאת Seriesאו DataFrameעם sparsevaluesהאפשרות.
  • רישום יחידת מטפלוטליב. זה כדי למנוע את השפעת Matplotlib בעת ייבוא ​​פנדות.
  • תכונות רבות אחרות שהוצאו משימוש בעבר.

שוב, זו סיבה נוספת לבדוק את מועמד השחרור של Pandas 1.0 זה לצד זה עם התקנת ה- Pandas הקיימת שלך, ולוודא שהסקריפטים שלך מתנהגים כמתוכנן.

התקנת פנדה 1.0

ניתן להתקין את Pandas 1.0 ישירות בתוך Python באמצעות מנהל חבילות ה- Pip, על ידי הקלדה pip install pandas. Pandas 1.0 זמין גם כחלק מהפצת Anaconda Python למחשוב מדעי.

בכל המקרים, עדיף להתקין פנדות בסביבה וירטואלית, במיוחד אם ברצונך להריץ בדיקות של סקריפטים של פנדה 1.0 זה לצד זה עם עמיתיהם בגרסה הקודמת.