"الصوت أولًا".. عندما يصبح "حلم" التواصل بين الآلة والإنسان ممكنًا

“أين يقع أقرب مطعم يقدم الوجبات السريعة؟” “ما هو أفضل مكان لتعلم اللغة الفرنسية؟”.. هذه الأسئلة وغيرها التي يبحث عنها الناس على الإنترنت أصبح بوسع سكان عدد من المدن في كولومبيا أن يبحثوا عنها فقط باستخدام أصواتهم وليس بالكتابة عبر محرك البحث الأشهر “جوجل”.

فمن أجل مساعدة هؤلاء الذين يقطنون في مدن فقيرة في كولومبيا على الوصول إلى المعلومات التي يريدونها بصورة سريعة وصحيحة في ظل عدم امتلاك معظمهم جوالات ذكية، وفرت “جوجل” خطا هاتفيا يمكن الاتصال به عن طريق أي هاتف أرضي أو جوال، ثم يطرح عليه المتصل السؤال الذي يريد الاستفسار عنه قبل أن يقوم محرك البحث بتقديم الإجابة في صورة رسالة مسموعة للمتصل.
بداية قوية
وعلى الرغم من أن هذا الأمر ليس جديدًا، وأنه جزء من تكنولوجيا “الصوت أولًا” التي تعتبر بمثابة مكون رئيسي في “إنترنت الأشياء”، إلا أن المبهر هنا مدى التقدم الذي وصلت إليه ظاهرة “الصوت أولًا” والتي تسمح لمحرك بحث عملاق للغاية مثل جوجل بتقديم مثل هذه الخدمة (ذات الأبعاد الإنسانية في المرحلة الحالية والتجارية لاحقًا بكل تأكيد).
وبدأت ظاهرة تكنولوجيا الصوت أولًا منذ 3-4 أعوام مع طرح آبل للمساعد الإلكتروني “سيري” في “آيفون” والذي يقوم بإجراء المكالمات الهاتفية والبحث على شبكة الإنترنت وكتابة رسالة نصية وإرسالها عن طريق سماع الأوامر الصوتية من صاحب الجوال.
كما ظهرت أيضا سماعات “أمازون إيكو” والتي تقوم بالتواصل مع مالكها وتنفيذ أوامره الصوتية بتشغيل بعض ملفات الصوت أو عمل “أجندة أسبوعية” بمواعيده أو البحث عن حالة الطقس في مكان محدد أو منتج أو مطعم وما إلى ذلك وتقديم الرد مسموعًا وليس مقروءا.
ومن المقرر أن تشهد الأسواق ظهور نماذج أخرى مثل “أمازون إيكو” ولكنها ستكون سماعات داخل الأذن، وتقوم بنفس الوظائف وربما ما هو أكثر، غير أن ما يعترض طرح مثل تلك السماعات الصغيرة في الأسواق عقبات متعلقة بالبطاريات المستخدمة، غير أن الحديث بدأ بالفعل عن “صوت” آلي سيبدأ الكثير من الناس في سماعه “داخل” آذانهم فور أن يطرحوا عليه سؤالًا ما.

توسع لافت
وبرزت العديد من البيانات التي من شأنها التأكيد على اتساع نطاق تكنولوجيا “الصوت أولا” (voice first) ولعل أبرزها أن هناك أكثر من مليار عملية بحث باستخدام الصوت تتم شهريًا، بينما 40% من مستخدمي الإنترنت يجرون عملية بحث واحدة على الأقل باستخدام الصوت يوميًا.
ووفقا لـ”مايكروسوفت” فإن هناك أكثر من 130 مليون عملية بحث شهرية تتم باستخدام المساعد الصوتي لها “كورتانا” (Cortana)، بينما تقول “آبل” إن 20% من حاملي جوال “آيفون” يستخدمون برنامج المساعد الذكي (الصوتي) “سيري” مرة على الأقل يوميًا، وأنه تتم واحدة من كل خمس عمليات بحث باستخدام الصوت في الولايات المتحدة.
وتشير الإحصاءات أيضًا إلى أن 41% من مستخدمي البحث الصوتي بدأوا في استخدام هذه الطريقة خلال الأشهر الستة الماضية فحسب، بما يؤشر لتزايد كبير في أعداد المستخدمين واتساع قاعدتهم، وأن 11% منهم فحسب بدأوا في استخدام تلك التكنولوجيا بعد إطلاقها منذ 3 أعوام بينما البقية توالت بشكل متسارع، كما أن كافة البرامج المساعدة بالصوت سواء لـ”أمازون” أو “جوجل” أو “آيفون” أو “آبل” أو “أليكسا” تزداد نسبة مستخدميها بمعدلات مختلفة.
عقبة رئيسية   
وتشير التقديرات إلى أن 50% من عمليات البحث اليومية ستتم باستخدام الأوامر الصوتية خلال عامين فحسب، بل إن 50% من تعامل الإنسان مع الكمبيوتر سيتم باستخدام أوامر صوتية أيضًا في غضون الـ10 سنوات المقبلة، حتى أنه يتوقع ظهور أجهزة لا تحتوي على شاشة أو وسيلة إدخال.
ويشير موقع “تيك بروك” إلى أن ميزة وسائل “الصوت أولًا”  إلى بساطتها وعدم تعقيد تكوينها بمعنى أنها لا تحتاج إلى شاشة عرض ولا تحتاج إلى وسيلة إدخال، بما يجعلها موفرة للغاية في تصنيعها ويعني أيضا أنها مستقبلًا ستكون أرخص كثيرًا من أجهزة التكنولوجيا المتاحة بما يعني انتشارها على نطاق أوسع ووصولها لطبقات أفقر.

والأزمة التي تعترض التوسع في استخدام تكنولوجيا “الصوت أولًا” هو حقيقة أنها تحتاج إلى استثمارات أخرى من أجل التوافق مع اللغات واللهجات المختلفة، حيث إن غالبية عمليات البحث التي تتم في يومنا هذا باللغة الإنجليزية ثم باللغتين الفرنسية والإسبانية لتبقى اللغات الأخرى محدودة للغاية في الاستخدام.
كما أن درجة تطور برامج الذكاء الصناعي للآلات ستتحكم كثيرًا في المدى الذي سيصل إليه “التواصل الصوتي” بين الإنسان والآلة، حيث سيمكن للآلة حينها فهم بعض التعبيرات المجازية، أو حتى تصحيح بعض الأخطاء عند فهمها لحديث مالكها من أجل تواصل أفضل وأكثر سلاسة.

الكاتب geek

geek

مواضيع متعلقة