כיצד לזהות מחלות צמחים באמצעות למידת מכונה: 6 שלבים
כיצד לזהות מחלות צמחים באמצעות למידת מכונה: 6 שלבים
Anonim
כיצד לזהות מחלות צמחים באמצעות למידת מכונה
כיצד לזהות מחלות צמחים באמצעות למידת מכונה

תהליך הגילוי והזיהוי של צמחים חולים תמיד היה תהליך ידני ומייגע המחייב בני אדם לבדוק באופן חזותי את גוף הצמח אשר עלול להוביל לאבחנה לא נכונה. כמו כן, ניבא כי ככל שדפוסי מזג האוויר העולמיים מתחילים להשתנות עקב שינויי אקלים, סביר שמחלות היבול יהפכו חמורות יותר ונפוצות יותר. מכאן שחשוב לפתח מערכות לנתח גידולים במהירות ובקלות ולזהות מחלה מסוימת על מנת להגביל נזקים נוספים ביבול.

במדריך זה נחקור מושג למידת מכונה המכונה "למידת העברה" לסיווג תמונות של צמחי אורז חולים. אותה שיטה ניתנת לשימוש מחדש לכל בעיה אחרת של סיווג תמונות.

שלב 1: סוגי מחלות אורז

סוגי מחלות אורז
סוגי מחלות אורז

אורז הוא אחד מגידולי המזון הפופולריים ביותר הגדלים בעיקר ברחבי אסיה, אפריקה ודרום אמריקה, אך הוא חשוף למגוון מזיקים ומחלות. ניתן להשתמש במאפיינים פיזיים כגון שינוי צבע העלים לזיהוי מספר מחלות העלולות להשפיע על גידול האורז. לדוגמה, במקרה של בראון-ספוט, מחלה פטרייתית המשפיעה על מעטפת ההגנה של העלים, העלים מכוסים בכמה כתמים חומים סגלגלים קטנים עם מרכזים אפורים ואילו במקרה של עלה-פיצוץ העלים מכוסים. עם נגעים חומים גדולים יותר. באופן דומה ניתן לזהות את העלים המושפעים ממזיק אורז היספה על ידי סימני השבילים הארוכים המתפתחים על פני העלה.

שלב 2: כיצד איתרו שיטות קודמות מחלות?

כיצד איתרו שיטות קודמות מחלות?
כיצד איתרו שיטות קודמות מחלות?

שיטות קודמות לסיווג אוטומטי של תמונות צמחים חולים כגון מסווגים מבוססי-כללים כפי שהשתמשו ב [1], מסתמכות על מערכת כללים קבועה כדי לפלח את העלה לאזורים מושפעים ולא מושפעים. חלק מהכללים לחילוץ תכונות כוללים התבוננות בשינוי הממוצע וסטיית התקן בין צבע האזורים המושפעים והלא מושפעים. כללים לחילוץ תכונות הצורה כרוכים בהצבה בנפרד של מספר צורות פרימיטיביות על האזור המושפע וזיהוי הצורה המכסה את השטח המרבי של האזור הפגוע. לאחר חילוץ התכונות מהתמונות, נעשה שימוש במכלול של כללים קבועים לסיווג התמונות בהתאם למחלה שעלולה להשפיע על הצמח. החיסרון העיקרי של מסווג כזה הוא שהוא ידרוש מספר כללים קבועים לכל מחלה, אשר בתורו עלולה להפוך אותה לרגישה לנתונים רועשים. התמונות לעיל מראות כיצד ניתן להשתמש בעץ החלטות המבוסס על חוק כדי לפלח את התמונה לשני אזורים.

1. Santanu Phadikar et al., "סיווג מחלות אורז באמצעות בחירת תכונות וטכניקות של יצירת חוק", מחשבים ואלקטרוניקה בחקלאות, כרך. 90, ינואר 2013.

שלב 3: העברת למידה

העברת למידה
העברת למידה

טכניקת סיווג התמונה המתוארת במדריך זה משתמשת במבנה הבסיסי של CNN המורכב מכמה שכבות מתפתלות, שכבת איחוד ושכבה אחרונה מחוברת במלואה. השכבות המתפתלות פועלות כמערכת מסננים המפיקים את התכונות ברמה גבוהה של התמונה. איגום מקסימום הוא אחת השיטות הנפוצות המשמשות בשילוב שכבות כדי לצמצם את הגודל המרחבי של התכונות שחולצו ובכך להפחית את כוח החישוב הנדרש לחישוב המשקולות עבור כל שכבה. לבסוף, הנתונים שחולצו מועברים דרך שכבה מחוברת במלואה יחד עם פונקציית הפעלה של softmax הקובעת את סוג התמונה.

אבל אימון CNN מותאם אישית מאפס לא יכול להניב את התוצאות הרצויות וייתכן שיהיה לו זמן אימון ארוך מאוד.

על מנת ללמוד את המאפיינים של תמונות האימון, אנו משתמשים בשיטה הנקראת העברת למידה, בה מוסרות השכבות 'העליונות' של מודל שהוכשר מראש ומוחלפות בשכבות שיכולות ללמוד את התכונות הספציפיות למערך האימונים. למידת העברה מקצרת את זמן האימון בהשוואה למודלים שמשתמשים במשקלים מאתחלים אקראיים. השיטה שלנו משתמשת בשישה דגמים שונים שהוכשרו מראש, כלומר AlexNet, GoogLeNet, ResNet-50, Inception-v3, ShuffleNet ו- MobileNet-v2.

התמונה מציגה את ארכיטקטורת GoogLeNet שבה משתמשים בכחול לשכבות מתפתלות, אדום לשכבה של שכבות, צהוב לשכבות softmax וירוק לשכבות קונקט. תוכל ללמוד עוד על העבודה הפנימית של רשת CNN כאן.

מאגר הנתונים של מחלת האורז מורכב מתמונות של עלים של צמחי אורז בריאים וחולים כאחד. ניתן לסווג את התמונות לארבע כיתות שונות כלומר Brown-Spot, Rice Hispa, Leaf-Blast ובריא. מערך הנתונים כולל 2092 תמונות שונות כאשר כל מחלקה מכילה 523 תמונות. כל תמונה מורכבת מדף בריא או חולה אחד המונח על רקע לבן.

חילקנו את מערך התמונות למערכי אימון, אימות ובדיקה. כדי למנוע התאמת יתר, אנו מגדילים את תמונות האימון על ידי קנה מידה והפוך של תמונות האימון כדי להגדיל את מספר דגימות האימון הכולל.

הקוד והתלות הם קוד פתוח וניתן למצוא אותם כאן: קוד GitHub

עבור יישומי סיווג תמונות שונים, אנו יכולים פשוט לשנות את מערך הנתונים של תמונות האימון.

שלב 4: אימון המודל

אימון המודל
אימון המודל
אימון המודל
אימון המודל
אימון המודל
אימון המודל

בהתאם לגודל הזיכרון הדרוש לכל דגם, הדגמים שהוכשרו מראש מסווגים לדגמים גדולים וקטנים יותר. הדגמים הקטנים יותר צורכים פחות מ -15 MB ולכן הם מתאימים יותר ליישומים ניידים.

בין הדגמים הגדולים יותר, Inception-v3 היה בעל זמן האימון הארוך ביותר של כ -140 דקות ואילו ל- AlexNet היה זמן האימון הקצר ביותר של כ -18 דקות. בין הדגמים הקטנים יותר המיועדים לנייד, ל- MobileNet-v2 היה זמן האימון הארוך ביותר של כ -73 דקות ואילו ל- ShuffleNet היה זמן האימון הקצר ביותר של כ -38 דקות.

שלב 5: בדיקת המודל

בדיקת המודל
בדיקת המודל
בדיקת המודל
בדיקת המודל
בדיקת המודל
בדיקת המודל

בין הדגמים הגדולים יותר, Inception-v3 היה בעל דיוק הבדיקות הגבוה ביותר של כ -72.1% ואילו ל- AlexNet היה דיוק הבדיקה הנמוך ביותר של כ -48.5%. בין הדגמים הקטנים יותר המיועדים לנייד, MobileNet-v2 היה בעל דיוק הבדיקות הגבוה ביותר של 62.5% ואילו ל- ShuffleNet היה דיוק הבדיקה הנמוך ביותר של 58.1%.

MobileNet-v2 הציגה ביצועים טובים באופן משמעותי בעת סיווג תמונות של עלים חומים, עלים-פיצוץ ועלים בריאים תוך ביצוע מספר סיווגים שגויים של רייס היספה עם דיוק של 46.15%בלבד.

Inception-v3 הציג תוצאות סיווג דומות כמו MobileNet-v2.

שלב 6: בדיקות נוספות

בדיקות נוספות
בדיקות נוספות
בדיקות נוספות
בדיקות נוספות

התמונה למעלה מראה כיצד הדגם של MobileNet-v2 מסווג בצורה לא נכונה תמונה של עלה דשא על רקע לבן בשם רייס היספה.

בדקנו גם את הדיוק של MobileNet-v2 על תמונות חתוכות של רייס היספה שבהן הרקע הלבן היה ממוזער כך שהעלה תופס שטח מקסימלי בתוך התמונה. עבור תמונות חתוכות של רייס היספה, צפינו לדיוק של כ 80.81% כלומר לתמונות חתוכות של רייס היספה, נצפה עלייה משמעותית בדיוק הסיווג על דגימות בדיקה לא קצוצות. מכאן שאנו מציעים שיישומים בעולם האמיתי של גילוי מחלות אורז באמצעות רשתות עצביות מתפתלות חייבים לחתוך את תמונות הבדיקה כדי להסיר רעשי רקע על מנת לשפר את הדיוק.