מקלדת? כמה מוזר

עידן החיפוש הקולי והתוכנה המופעלת בקול בפתח. כמפתח אני חי ומת על ידי המקלדת, אבל אני כבר יכול לראות את הסימנים: כמו אנשים רבים, למשל, אני מדבר עם טלפון האנדרואיד שלי (למשל, "נווט אל Lowes [או Starbucks או Harris Teeter]") אל לקבל הוראות.

בדו"ח המגמות האינטרנטיות של מרי מיקר משנת 2016, היא מדווחת כי שאילתות החיפוש של Google Voice עלו בפקטור שבע מאז 2010. שמתי לב גם שבני בן ה -12 עושה כמעט את כל החיפושים שלו באמצעות קול - ואת שלי חברה מסמסת לי את זה בצורה קבועה. כמו כן, החברה בה אני עובד, Lucidworks, הודיעה לאחרונה על שותפות חדשה עם IBM לשילוב יכולות ווטסון וטקסט לדיבור במוצר החיפוש הארגוני שלנו. 

הטכנולוגיה עובדת הרבה יותר טוב מבעבר, וקל יותר להשתלב ביישומים. אם אתה מתפתח עבור Android או iOS, אתה יכול להתחבר בקלות לממשקי ה- API לזיהוי דיבור. אך זיהוי דיבור אינו מתחיל ונגמר בפקודות דיבור לטקסט ופשוטות פשוטות.

הבנת כוונת החיפוש היא משימה מאוד קשרית, במיוחד בשפה המדוברת. יתר על כן, אנשים נוטים להשתמש במילים רבות יותר בשפה המדוברת הטבעית מאשר כאשר הם ניצבים מול סרגל חיפוש. יש יותר "מילות רעש" בשפה המדוברת מאשר בחיפוש טקסטואלי רגיל.

אלה אתגרים משמעותיים של AI. אך ככל שנתגבר על בעיית ההקשר, מפתחים ילמדו שניתן לעשות יותר באמצעות קול מאשר עם טקסט. הקשר רגשי ישחק תפקיד. אם אתם מחפשים תחנת דלק, האם אתם רוצים את הזולה ביותר או את הקרובה ביותר? התוכן הרגשי של הקול שלך יכול לרמוז על כך. בטח, אולי תבהיר, אבל אולי לא תצטרך.

העתיד המדבר שלך

העידן מונע הקול אינו עוסק בחיפוש בלבד. זה ישפיע על כל הדרך בה אנו מתקשרים עם מחשבים. בעתיד הלא רחוק, מקלדות ייחשבו "מוזרות", כפי שסקוטי תיאר אותם ב"מסע בין כוכבים הרביעי ".

אבל השינוי הזה דורש גם ממשק משתמש חדש לגמרי. הנה המחשה עתיקה למה אני מתכוון: כשיצא Windows 95, IBM שילבה פקודות קוליות במחשבים שלה. באותה תקופה עבדתי כאיש מכירות באופיס דיפו, ומהר מאוד התברר כמה פקודות קוליות אינן מעשיות. ממשק החלונות כלל לא הושלם לצורת אינטראקציה זו.

זאת אומרת, איך לעזאזל אתה מזיז חלון מהדרך של חלון אחר ומשנה את גודל שניהם כך שיתאימו למסך בצורה יעילה עם פקודות קוליות? אתה לא. אתה מעלה את החלונות האלה (וכנראה את Windows) לגמרי. ממשק משתמש מונע קול אינו משתמש באותם מוטיבים. אתה אף פעם לא רואה ממשק חלון ב"מסע בין כוכבים ".

אם כבר מדברים על "מסע בין כוכבים", כאשר אנשים מתחילים לקודד או לעשות משהו טכני, הם תמיד עוברים לממשק מישוש (בסדר, לא בדיוק מישוש - זה נראה יותר כמו מקלדת מיקרוגל מעוטרת בתמונות ארט-נובו של לוח מעגלים). אך האם יש צורך ברגרסיה ל"הקלדה "? נכון, אני לא יכול לדמיין להשתמש בממשק קולי לקידוד בסקאלה. אולי יפותחו שפות חדשות (נטולות סוגריים, בניגוד לסקאלה - והמאמרים שלי) המותאמות במיוחד לקול.

אתרים בוודאי לא ייראו זהים ויציעו פרדיגמות ניווט חדשות. אתה תגיד "תראה לי מבצעים על נעליים", ומה שאתה מקבל בחזרה יהיה כנראה מאורגן יותר ורגיש יותר בהקשר מאשר האתר הממוצע שלך ("מבצעים" && "נעליים"). יתר על כן, אני לא ארצה לגלול או לומר "העמוד הבא" הרבה, כך שיהיה צורך להתאים אישית את האינטראקציות. המערכת צריכה כבר לדעת שאני רוצה נעלי גברים ואני לא רוצה נעליים עם עקב בגלל דלקת בגיד אכילס. אולי זה יודע שאני מעדיף צבעים כהים. אולי אמרתי את זה או אולי זה ניתח את ההתנהגות שלי.

האם זה אתר בכלל? בטח, אם אני קונה נעליים, אני ארצה ייצוג חזותי, אבל אם אני מדבר אולי המכונה מדברת חזרה. אולי זה מראה לי נעליים ואז שואל: "האם אתה מחפש סוג מסוים של נעליים? לאיזו מטרה הנעליים האלה נועדו? האם אתה נועל אותן בטיולים או למסיבה?"

עידן החיפוש הקולי ישנה הכל החל מאופן האינטראקציה שלנו עם מכונות ועד לקידוד. רבות מהטכנולוגיות שאנו זקוקים להן כבר זמינות עבורנו כיום, בעוד שאחרות טרם הומצאו. ההשפעה על ממשקי המשתמש יכולה להיות עמוקה יותר מהמעבר מכרטיסי ניקוב למקלדות.

השינוי הגורף הזה לא יבוא בבת אחת. היום זה לא היום לזרוק את המקלדת. אבל זה יכול להיות היום להתחיל לחשוב על עיצוב מחדש של אתר האינטרנט שלך כך שיהיה נגיש לקול באמת.