คีย์บอร์ด? แปลกตาแค่ไหน

ยุคของการค้นหาด้วยเสียงและซอฟต์แวร์สั่งงานด้วยเสียงกำลังมาถึงเราแล้ว ในฐานะนักพัฒนาฉันใช้ชีวิตและตายด้วยแป้นพิมพ์ แต่ฉันก็เห็นสัญญาณแล้วเช่นฉันคุยโทรศัพท์ Android (เช่น "นำทางไปยัง Lowes [หรือ Starbucks หรือ Harris Teeter]") เพื่อ ขอเส้นทาง

ในรายงานแนวโน้มอินเทอร์เน็ตปี 2016 ของ Mary Meeker เธอรายงานว่าข้อความค้นหาของ Google Voice เพิ่มขึ้นถึง 7 เท่านับตั้งแต่ปี 2010 ฉันสังเกตด้วยว่าลูกชายวัย 12 ปีของฉันทำการค้นหาเกือบทั้งหมดด้วยเสียง - และของฉัน แฟนส่งข้อความหาฉันด้วยวิธีนี้เป็นประจำ นอกจากนี้ บริษัท ที่ฉันทำงานให้ Lucidworks เพิ่งประกาศความร่วมมือครั้งใหม่กับ IBM เพื่อรวมวัตสันและความสามารถในการอ่านออกเสียงข้อความเข้ากับผลิตภัณฑ์การค้นหาระดับองค์กรของเรา 

เทคโนโลยีนี้ทำงานได้ดีกว่าที่เคยเป็นมามากและง่ายต่อการรวมเข้ากับแอปพลิเคชัน หากคุณพัฒนาสำหรับ Android หรือ iOS คุณสามารถเชื่อมต่อกับ API สำหรับการรู้จำเสียงได้อย่างง่ายดาย แต่การรู้จำเสียงไม่ได้เริ่มต้นและจบลงด้วยคำสั่งพูดเป็นข้อความและเสียงง่ายๆ

การทำความเข้าใจจุดประสงค์ของการค้นหาเป็นงานที่มีบริบทมากโดยเฉพาะกับภาษาพูด ยิ่งไปกว่านั้นผู้คนมักจะใช้คำในภาษาพูดที่เป็นธรรมชาติมากกว่าเมื่อพวกเขาเผชิญหน้ากับแถบค้นหา มี "คำที่เป็นเสียง" ในภาษาพูดมากกว่าในการค้นหาข้อความปกติ

นี่คือความท้าทายที่สำคัญของ AI แต่เมื่อเราเอาชนะปัญหาบริบทได้นักพัฒนาจะได้เรียนรู้ว่าสามารถทำได้ด้วยเสียงมากกว่าการใช้ข้อความ บริบททางอารมณ์จะเข้ามามีบทบาท หากคุณกำลังมองหาปั๊มน้ำมันคุณต้องการสถานีที่ถูกที่สุดหรือใกล้เคียงที่สุด? เนื้อหาที่แสดงอารมณ์ของเสียงของคุณอาจบ่งบอกถึงสิ่งนั้น แน่นอนคุณอาจชี้แจง แต่คุณอาจไม่จำเป็นต้องทำ

อนาคตที่ช่างพูดของคุณ

ยุคที่ขับเคลื่อนด้วยเสียงไม่ได้เกี่ยวกับการค้นหาเพียงอย่างเดียว มันจะส่งผลต่อวิธีทั้งหมดที่เราโต้ตอบกับคอมพิวเตอร์ ในอนาคตอันไม่ไกลนี้คีย์บอร์ดจะได้รับการพิจารณาว่า "แปลกตา" ตามที่สก็อตตี้กล่าวถึงพวกเขาอย่างโด่งดังใน "Star Trek IV"

แต่การเปลี่ยนแปลงนั้นยังต้องการ UI ใหม่ทั้งหมด นี่คือภาพประกอบโบราณของสิ่งที่ฉันหมายถึง: เมื่อ Windows 95 ออกมา IBM ได้รวมคำสั่งเสียงไว้ในพีซี ตอนนั้นฉันทำงานเป็นพนักงานขายที่ Office Depot และเห็นได้ชัดอย่างรวดเร็วว่าคำสั่งเสียงที่ใช้ไม่ได้นั้นเป็นอย่างไร อินเทอร์เฟซแบบหน้าต่างไม่ได้ให้ยืมตัวเองกับรูปแบบการโต้ตอบนี้เลย

ฉันหมายความว่านรกคุณย้ายหน้าต่างออกจากหน้าต่างอื่นและปรับขนาดให้พอดีกับหน้าจออย่างมีประสิทธิภาพด้วยคำสั่งเสียงได้อย่างไร? คุณไม่ทำ คุณทิ้งหน้าต่างเหล่านั้น (และอาจเป็น Windows) ทั้งหมด UI ที่ขับเคลื่อนด้วยเสียงไม่ได้ใช้ลวดลายเดียวกัน คุณไม่เคยเห็นอินเทอร์เฟซแบบหน้าต่างบน "Star Trek"

เมื่อพูดถึง "Star Trek" เมื่อผู้คนเริ่มเขียนโค้ดหรือทำอะไรทางเทคนิคพวกเขามักจะเปลี่ยนไปใช้อินเทอร์เฟซแบบสัมผัส (ตกลงไม่ใช่แบบสัมผัส - ดูเหมือนแป้นพิมพ์ไมโครเวฟที่ซ้อนทับด้วยการแสดงผลแบบอาร์ตนูโวของแผงวงจร) แต่การถดถอยเพื่อ "พิมพ์" จำเป็นหรือไม่? จริงอยู่ฉันนึกไม่ถึงว่าจะใช้อินเตอร์เฟสเสียงเพื่อเขียนโค้ดใน Scala บางทีภาษาใหม่ ๆ (ไม่มีวงเล็บซึ่งแตกต่างจาก Scala - และบทความของฉัน) อาจได้รับการพัฒนาให้เหมาะกับเสียงโดยเฉพาะ

เว็บไซต์จะไม่เหมือนกันอย่างแน่นอนและจะนำเสนอกระบวนทัศน์การนำทางใหม่ คุณจะพูดว่า "ขอแสดงข้อตกลงเกี่ยวกับรองเท้า" และสิ่งที่คุณได้รับกลับมาอาจจะจัดระเบียบได้ดีกว่าและมีความอ่อนไหวตามบริบทมากกว่าเว็บไซต์ทั่วไปของคุณ ("ดีล" && "รองเท้า") นอกจากนี้ฉันไม่ต้องการเลื่อนหรือพูด "หน้าถัดไป" มากนักดังนั้นการโต้ตอบจะต้องเป็นแบบส่วนตัว ระบบควรรู้อยู่แล้วว่าฉันต้องการรองเท้าผู้ชายและฉันไม่ต้องการรองเท้าส้นแข็งเนื่องจากเอ็นร้อยหวายอักเสบ บางทีมันอาจจะรู้ว่าฉันชอบสีเข้ม บางทีฉันบอกมันหรือบางทีมันอาจจะวิเคราะห์พฤติกรรมของฉัน

นี่คือเว็บไซต์เลยหรือ แน่นอนว่าถ้าฉันกำลังซื้อรองเท้าฉันจะต้องการภาพแทน แต่ถ้าฉันกำลังพูดอยู่บางทีเครื่องจักรกำลังพูดกลับ บางทีมันอาจจะแสดงรองเท้าให้ฉันดูแล้วถามว่า: "คุณกำลังมองหารองเท้าประเภทใดประเภทหนึ่งใช่หรือไม่รองเท้ารุ่นนี้มีไว้เพื่ออะไรคุณใส่เดินป่าหรือไปงานปาร์ตี้?"

ยุคของการค้นหาด้วยเสียงจะเปลี่ยนทุกอย่างตั้งแต่วิธีที่เราโต้ตอบกับเครื่องจักรไปจนถึงวิธีการเขียนโค้ด เทคโนโลยีมากมายที่เราต้องการมีอยู่แล้วสำหรับเราในปัจจุบันในขณะที่เทคโนโลยีอื่น ๆ ยังไม่มีใครคิดค้น ผลกระทบต่ออินเทอร์เฟซผู้ใช้อาจมีความลึกซึ้งมากกว่าการเปลี่ยนจากการ์ดเจาะเป็นคีย์บอร์ด

การเปลี่ยนแปลงที่เกิดขึ้นทั้งหมดนี้จะไม่เกิดขึ้นพร้อมกัน วันนี้ไม่ใช่วันที่จะทิ้งคีย์บอร์ดของคุณ แต่อาจถึงวันที่คุณจะต้องเริ่มคิดถึงการออกแบบเว็บไซต์ของคุณใหม่ให้สามารถเข้าถึงได้ด้วยเสียงอย่างแท้จริง