תוכן עניינים:
2025 מְחַבֵּר: John Day | [email protected]. שונה לאחרונה: 2025-01-13 06:57
בפרויקט זה אנו הופכים רדיו למראה מסודר למספר סיפורים אינטראקטיבי המאפשר קול. העתיד, הנה אנחנו מגיעים!
אספקה
חוּמרָה
- ערכת Starter של Raspberry Pi 3B+ או ערכת Starter של Raspberry Pi 4
- ערכת קול AI של Google v1
- החלף
- רדיו רטרו
- מברגים
- ציוד הלחמה - אופציונלי
תוֹכנָה
- פלטפורמת הענן של Google
- זרימת דיאלוג של Google
בתור עמית אמזון אני מרוויח מרכישות מתאימות שאתה מבצע באמצעות הקישורים השותפים שלי.
שלב 1: פרוייקט וידאו
שלב 2: רדיו
כמו רוב הפרויקטים המתחדשים, גם זה מתחיל בכמה אלקטרוניקה ישנה, אם לדייק, ב- Bjazzo Ts של Telefunken, שנעשה מתישהו במהלך שנות השישים במערב גרמניה.
ראשית, קביעת מה ניתן לשימוש חוזר. הדרך הטובה ביותר לברר זאת היא על ידי פירוק הטכנולוגיה הוותיקה שלנו. שלב זה שונה בכל מכשיר, אך הסרת כל הברגים בהם אתה נתקל היא התחלה מצוינת.
למזלנו, אנו יכולים להציל את הרמקול המקורי ולחצן ההפעלה/כיבוי. אנו גם שומרים על החלק שמחזיק את כל הכפתורים.
לאחר פעולה מוצלחת זו אנו נותרים עם כמה רכיבים לשימוש חוזר ומסגרת ריקה למחצה.
שלב 3: חומרה
עם החלל החדש שנוצר וחלקינו הניתנים לשימוש חוזר, אנו עוברים לשלב הבא ומוסיפים חומרה משלנו.
המטרה היא להפוך מכשיר לשליטה ואינטראקטיבי, המספר סיפורים. המשמעות היא שאנו זקוקים למיקרופון ולרמקול, בשילוב עוצמת עיבוד כלשהי. ערכו את ערכת הקול של Google AIY, חבילת חומרה מושלמת למאמץ שלנו.
ההנחיות לבנייה שלהן פשוטות, אך במקום הרמקול והכפתור המסופק, אנו מחברים את אלה ששחזרנו מהרדיו הישן שלנו. כאשר כל החומרה מורכבת ומוכנה, כעת אנו יכולים להריץ כל אחת מהדוגמאות שניתנו.
שלב 4: סיפור
לפני שנוכל לבנות את הסיפור שלנו, עלינו להמציא נושא הולם. כאמור, הרדיו שלנו יוצר מתישהו במהלך שנות השישים במערב גרמניה. זה היה במהלך המלחמה הקרה במיקום חיוני.
כשחושבים על המלחמה הקרה, אנחנו חושבים על ריגול, ובדיוק ככה יש לנו את הנושא שלנו, ריגול!
יש עוד דבר אחד לפני שנמשיך לבניין הצ'אט בוט, מבנה הסיפור. מכיוון שאנו רוצים שהעלילה שלנו תשתנה בהתאם לקלט המשתמשים, עלינו לעצב עץ החלטות. לאחר שסיימנו כולנו מוכנים להתגנב לשלב הבא.
שלב 5: צ'אט בוט
בהצלחה, כשהסיפור הושלם אנו יכולים להתחיל בצ'אט בוט. באופן אידיאלי תהיה לנו תוכנה שעוזרת בבחירת התגובה הנכונה, הן בהפקת משמעות מהטקסט המדובר והן בקבלת ההחלטות העלילתיות.
זה בדיוק מה שפלטפורמת צ'אט בוט מספקת, הן לזהות משמעות בטקסט ('עיבוד שפה טבעית') והן לקבל החלטות.
יש הרבה ספקים בחוץ, ואתה יכול לבחור כל אחד מהם, עם זאת, בחרנו ב- Google Dialogflow כי הוא בחינם וקל לשימוש. ל- Dialogflow יש מדריך נהדר לתחילת העבודה כאן.
לאחר התקנה וכתיבה יצירתית הצ'אט בוט מוכן לצאת לדרך. כעת אנו מחברים את החומרה המקומית עם הצ'אט בוט, והופכים את ההמצאה שלנו לבוט קולי אמיתי.
הקוד המלא נכלל במאמר זה, זו זרימת הנתונים:
1 המיקרופון קולט מישהו מדבר ומקליט את השמע.
2-3 בעזרת קצת קסם AI של Google (דיבור-לטקסט) אנו מחלצים את הטקסט המדובר מהאודיו.
4-5 טקסט זה נשלח לצ'אט בוט שלנו (Dialogflow) והוא מותאם לתגובה הנכונה, שנשלחת בחזרה ל- Raspberry Pi.
6-7 בעזרת עוד וודו של בינה מלאכותית, טקסט זה משמש ליצירת דיבור מלאכותי.
8 אודיו זה משודר לאדם באמצעות הרמקול.
הערה: כל התהליך מופעל רק כאשר כפתור הרדיו מופעל למצב 'מופעל'.
שלב 6: תוצאה
אחרי כל העבודה הקשה הזו, סוף סוף הגיע הזמן להירגע, להירגע ולחקור את כל האפשרויות השונות שיש למספר האינטראקטיבי שלנו להציע.