הוסף את צליל ההתחלה של Trigger ל- Google AIY Voice Kit: 6 שלבים (עם תמונות)
הוסף את צליל ההתחלה של Trigger ל- Google AIY Voice Kit: 6 שלבים (עם תמונות)

וִידֵאוֹ: הוסף את צליל ההתחלה של Trigger ל- Google AIY Voice Kit: 6 שלבים (עם תמונות)

וִידֵאוֹ: הוסף את צליל ההתחלה של Trigger ל- Google AIY Voice Kit: 6 שלבים (עם תמונות)
וִידֵאוֹ: Буква Ю, вертел на киЮ. Финал + пару каток в Isaac ► 3 Прохождение Prodeus 2025, יָנוּאָר
Anonim
Image
Image
שלב 2: בדוק את קובץ Voicehat.py למידע נוסף
שלב 2: בדוק את קובץ Voicehat.py למידע נוסף

הדרכה זו היא די פשוטה. מאוד נהניתי מהערכה הקולית של Google AIY, אבל מאוד אוהב את הרעש שהם עושים מהבית הרגיל שלי ב- Google Home כדי לאשר שהם מקשיבים באופן פעיל. זה אינו מוגדר כברירת מחדל באף אחת מהדוגמאות הטעונות מראש בתמונת AIY Voice Kit.

אני מצרף גם קישור למניות קולות התחלה ואישור שהקלטתי מ- Google Home בפועל עם מקליט הזום שלי.

הנה, ההנחיה הראשונה שלי!

שלב 1: חומרים וקבצים נדרשים

  1. ערכת Google AIY Voice Kit פונקציונלית לחלוטין להגדרת הערכה שלך בקר בדף הרשמי של AIY Voice Kit.
  2. יכולת גישה למסוף ה- Pi שלך באמצעות SSH, VNC, או עם צג ומקלדת
  3. קובץ WAV שברצונך לשחק כאשר Pi מקשיב לקלט קולי-אם אינך משתמש בקובץ מותאם אישית, הורד כאן קובץ סטנדרטי מסוג "St art Talking" או הורד אותו מהקישור המצורף.
  4. (אופציונלי) עורך אודיו שיכול להמיר קבצים ולשנות את קצב הסיביות והדגימה שלהם

שלב 2: שלב 2: בדוק את קובץ Voicehat.py למידע נוסף

חָשׁוּב

אינני משתמש בתמונה האחרונה בערכת הקול שלי הכוללת את הקוד עבור ערכת הקול והוויז'ן כאחד (כלומר aiyprojects-2018-01-03.img). אני משתמש בקוד מהענף Voice Kit שניתן למצוא ב- Google AIY Raspbian GitHub. דעתי האישית היא פשוט להשתמש בסניף ערכת הקוליות כדי לשמור על פשטות ואין צורך להתמודד עם קוד החזון כאשר אתה עובד עם ערכת הקול שלך

ממשיך הלאה…

שלב זה אינו חובה לחלוטין, אך הוא יראה לך היכן גוגל קברה את ההנחיות לעבודה אם אתה רוצה לקחת את זה צעד קדימה או להבין מדוע הקוד שאני מוסיף עובד.

pi@פטל: cd AIY-voice-kit-python/src/aiy/

לאחר מכן נבדוק את הקובץ voicehat.py בתיקייה זו:

pi@פטל: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

התמונה המצורפת מראה היכן ניתן ללמוד על ממשקי משתמש סטטוס וכיצד להשתמש בצליל במהלך ההדק.

בסדר, עכשיו הוסף קצת קוד לאחד מקבצי הדוגמה כדי שהדבר הזה יעבוד.

שלב 3: שלב 3: הוסף קוד צליל טריגר לקוד הדגמה

שלב 3: הוסף קוד צליל טריגר לקוד הדגמה
שלב 3: הוסף קוד צליל טריגר לקוד הדגמה

ראשית, נווט לתיקיית AIY-voice-kit-python והפעל את קוד המקור

cd AIY-voice-kit-python

מקור env/bin/activ

cd src

לאחר מכן השתמש ב- 'sudo nano' לתוך 'assistant_grpc_demo.py' או 'assistant_library_demo.py'

ההבדל בין שני הקבצים הוא ש- assistant_grpc_demo.py משתמש בלחצן להפעלת Google Assistant ו- assistant_library_demo.py משתמש במילת ההפעלה "Ok, Google" כדי להפעיל את Google Assistant.

עבור שני הקבצים האלה אתה רק צריך להוסיף שורת קוד אחת:

status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')

זה מניח שהצבת את צליל ההתחלה שלך בתיקייה/home/pi/ושמה אותו googlestart.wav. שנה את אלה על סמך מה ששמנת את הקובץ שלך ובכל מקום שבו מצאת אותו.

שורת הקוד אותה אנו מחפשים נמצאת להלן:

status_ui.status ('האזנה')

אנחנו רוצים להוסיף את שורת הקוד החדשה שלנו לפני שורת הקוד הזו …

לדוגמא 'assistant_library_demo.py' ניתן למצוא אותה כאן:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# ועכשיו הוסף את הקוד status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('האזנה')

לדוגמא 'assistant_grpc_demo.py' ניתן למצוא אותה כאן:

button.wait_for_press ()

# ועכשיו הוסף את הקוד status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('האזנה')

זה מניח שהצבת את צליל ההתחלה שלך בתיקייה/home/pi/ושמה אותו googlestart.wav. שנה את אלה על סמך מה ששמנת את הקובץ שלך ובכל מקום שבו איתרת אותו.

לחץ על CTRL-X & Y כדי לשמור הכל.

*** הערה: מצאתי משהו קצת מטופש. לא נראה שהוספת 'צליל_הספרייה_דמו -.פי' הוספת צליל ההדק לא משנה שום דבר בתפקוד זיהוי הדיבור. עם זאת, עבור 'assistant_grpc_demo.py', נראה שכאשר אתה מיישם את צליל ההדק הוא חותך את המילה הראשונה או שתיים שאתה אומר. לא לגמרי בטוח למה. עדיין מנסה להבין את זה.

שלב 4: שלב 4: הפעל את הקוד וודא שהכל בסדר

pi@פטל: cd AIY-voice-kit-python

ותטען את הווירטואלי

pi@פטל: ~/AIY-voice-kit-python $ source env/bin/activ

והפעל אותו!

(env) pi@פטל: ~/AIY-voice-kit-python $ src/assistant_library_demo.py

אוֹ

(env) pi@פטל: ~/AIY-voice-kit-python $ src/assistant_grpc_demo.py

עכשיו אמור "אוקיי, גוגל" או לחץ על הכפתור הזה ובדוק אם זה עובד!

הדף הבא יעזור לך אם יש לך קובץ מותאם אישית משלך ושיעורי הסיביות והדוגמאות המתאימים לקובץ.wav שלך

שלב 5: שלב 5: צור קובץ.wav משלך

שלב 5: צור קובץ.wav משלך
שלב 5: צור קובץ.wav משלך

אם אינך מעוניין להשתמש בקובץ ה- wav שלי של צליל ההתחלה הרגיל של Google Home, יהיה עליך ליצור קובץ.wav משלך. נדרש קצת ניסוי וטעייה כדי שהסיבית והקצב המדגם הנכונים יעבדו בשבילי.

השתמשתי ב- Logic Pro X לביצוע כל העריכה שלי (בתמונה), שהיא DAW מן המניין ליצירת והפקת מוזיקה. שתי אפשרויות שמצאתי שיכולות להיות מתאימות הן Switch או MediaHuman Audio Converter. אני מניח שתוכל לעשות זאת עם Garageband אם יש לך Mac, אך לא ניסיתי זאת.

ישנם שלושה חלקים מרכזיים בקובץ שלך הדרושים כדי שהוא יעבוד עם קוד ההדגמה.

  1. חייב להיות קובץ שמע של MONO
  2. שיעור הדגימה חייב להיות 32000
  3. חייב להיות קובץ.wav
  4. (אופציונלי) רזולוציית 16 סיביות עבדה הכי טוב בשבילי

שלב 6: שלב 6: הוספת צליל האישור?

כאן אני תקוע אם למישהו יש מחשבות. אשמח להוסיף את רעש האישור אם המערכת תזהה את הקלט הקולי כמו בדף הבית הרגיל של Google.

צירפתי למטה את רעש אישור המלאי למטה לנוחותך.

תהנה!