آینده دستگاه‌های هوشمند با قابلیت پردازش زبان طبیعی (محاوره‌ای)

آینده دستگاه‌های هوشمند با قابلیت پردازش زبان طبیعی (محاوره‌ای)

اینترنت اشیا و هوش مصنوعی عمیقاً با یکدیگر مرتبط هستند. دستگاه‌های IoT داده‌های بسیار حجیم تولید می‌کنند و پردازش این دادها نیازمند روش‌های هوشمندی است که با هوش مصنوعی و یادگیری ماشین امکان پذیر می‌گردد. ازاین‌رو، با گسترش سریع دستگاه‌ها و سنسورهای متصل و شبکه‌ای، نقش فناوری‌های هوشمند در این حوزه به شدت در حال رشد است.

اینترنت اشیا و هوش مصنوعی عمیقاً با یکدیگر مرتبط هستند. دستگاه‌های IoT داده‌های بسیار حجیم تولید می‌کنند و پردازش این دادها نیازمند روش‌های هوشمندی است که با هوش مصنوعی و یادگیری ماشین امکان پذیر می‌گردد. ازاین‌رو، با گسترش سریع دستگاه‌ها و سنسورهای متصل و شبکه‌ای، نقش فناوری‌های هوشمند در این حوزه به شدت در حال رشد است. امروزه هوش مصنوعی کاربردهای متنوعی در حیطه‌های مختلف IoT دارد. در این مقاله، یک کاربرد خاص که پردازش زبان طبیعی (محاوره‌ای) می‌باشد، بررسی می‌شود.

قابلیت و توانمندی ادراک گفتار:

یکی از مفاهیم اصلی پردازش زبان طبیعی، توانایی ادراک گفتار انسانی است. واضح است که لازمه کنترل دستگاه‌های هوشمند از طریق فرامین صوتی، قابلیت و توانمندی ادراک گفتار است که از طریق روش‌های NLP امکان پذیر می‌گردد.

در IoT، ارزش تشخیص گفتار بیش از حد ارزشمند است. رابط‌های صوتی که بدون نیاز به استفاده از دست امکان ارتباط و تعامل با کاربر را مهیا می‌سازند مزایای بسیاری را به همراه دارند. این رابط‌ها قابلیت استفاده مؤثر از سیستم را ارتقا می‌دهند. به عنوان یک قاعده کلی می‌توان گفت هر چه یک سیستم پیچیده‌تر باشد طراحی یک رابط کاربری یا رابط وب برای کنترل آن نیز سخت‌تر خواهد بود. رابط‌های صوتی، با توجه به ماهیت بصری خود و تعامل صوتی و گفتاری، کاربری ساده و مؤثرتری داشته و یادگیری استفاده از آن‌ها برای کاربران بسیار ساده‌تر است.

گاهی اوقات، یک رابط صوتی صرف‌نظر از ویژگی‌های قابلیت استفاده از سیستم، می‌تواند در ارتقای ایمنی سیستم ایفای نقش نماید. تصور کنید یک تکنسین در ارتفاع 150 فوت روی دکل خطوط برق فشارقوی مشغول به کار است. اگر این فرد بتواند بدون نیاز به استفاده از دست و انگشتان خود و تنها از طریق دستورات صوتی، ابزارهای دیجیتال خود را کنترل نموده و یا با افراد دیگر در ارتباط باشد، احتمال وقوع حوادث خطرناک برای او به شدت کاهش می‌یابد.

در بازارهای مصرف نیز محبوبیت کنترل گفتاری در حال افزایش است. حدود 50 درصد خانوارهای ایالات متحده از صدا برای دسترسی به محتوای آنلاین استفاده می‌کنند. بنابراین، افزایش مصرف تجهیزات عمومی الکترونیک که توسط صدا فعال یا کنترل می‌شوند، یک گام طبیعی از تکامل این تکنولوژی است.

یکی از مزایای دیگر NLP قابلیت بومی‌سازی سیستم‌ها می‌باشد. به عبارت دیگر می‌توان به جای ارائه یک رابط کاربری عمومی با زبان بیگانه برای کشورهای دیگر، رابط‌های بومی‌شده و منطبق با زبان محلی کاربران ارائه نمود. برای این منظور می‌توان موتور پردازش NLP را بر اساس زبان محلی موردنیاز انتخاب نمود. این روش بسیار مؤثرتر از ترجمه می‌باشد و حس خوشایندتری را برای کاربران به همراه دارد. این قابلیت می‌تواند به عنوان یک مترجم نیز مورد استفاده قرار گیرد.

به عنوان مثال، شرکت ژاپنی ili، یک محصول قابل پوشیدن را ارائه کرده است که می‌تواند عبارات ساده را برای مسافران خارجی، بدون دسترسی به اینترنت ترجمه کند. محصول مشابه دیگری نیز با عنوان pilot یکی دیگر از دستگاه‌های متصل است که امکان ترجمه در حال حرکت را دارد. برخلاف ili، این سیستم قادر به گفتگوی دوطرفه نیز می‌باشد یعنی pilot نه‌تنها زبان‌های مختلف را درک می‌کند، بلکه می‌تواند پاسخ مربوط به یک زبان خارجی را نیز سنتز کند.

دستیارهای صوتی:

یکی از دیگر کاربردهای NLP سیستم‌های دستیاری است که قادر به پاسخگویی سؤالات هستند. این سیستم‌ها ما را قادر می‌سازند تا سؤالات خود را به صورت طبیعی و گفتاری مطرح کنیم و سیستم پاسخ ما را یافته و ارائه می‌نماید. در حال حاضر، سیستم‌های متنوعی با این قابلیت موجودند که دراین‌بین می‌توان به دستیار Alexa از کمپانی آمازون، Google Home از شرکت گوگل و یا HomePod از شرکت اپل اشاره نمود. این دستیارها با ارتباط گفتاری فعال و کنترل شده و قادر به پاسخ به سؤالات مختلف هستند و در نتیجه به مردم کمک می‌کنند تا سریعاً به اطلاعات مورد نیاز دسترسی پیدا کنند. این قابلیت را می‌توان به یک منشی هوشمند و همواره در دسترس نیز تشبیه نمود.

این قابلیت برای کاربردهای خاص مثل کاربردهای پزشکی و یا نظارت بر سلامت از اهمیتی بیشتر برخوردار می‌گردد. به عنوان مثال بیمارستان متعلق به دانشگاه Thomas Jefferson با همکاری شرکت IBM Watson محصول مشترکی ارائه نموده‌اند که مشابه یک پرستار مجازی هوشمند برای بیمار عمل می‌کند. این محصول اولاً قادر به پاسخگویی سؤالات بیمار است و ثانیاً شرایط محیطی اتاق بیمار را نیز مثل میزان روشنایی و غیره را بنا به خواست و فرمان صوتی بیمار کنترل می‌کند.

یک قابلیت دیگر این حوزه، امکان استخراج اطلاعات خاص برای کاربر می‌باشد. مثلاً اطلاعات خاصی از یک مقاله یا از یک کتاب را استخراج نماییم. استفاده از این سیستم‌ها در اتومبیل نیز در حال گسترش است و می‌توانند به‌عنوان دستیار به راننده کمک کنند. مثلاً راننده می‌تواند تقاضای یافتن مسیر نماید و یا در مورد وضعیت ترافیکی راه‌ها از این دستیار سؤالاتی بپرسد.

ادراک احساس:

به‌طورکلی ادراک گفتار از ادراک محتوای متنی بسیار پیچیده‌تر است. دلیل این امر آن است که متن فاقد احساس است در حالیکه گفتار حاوی اطلاعاتی بیشتر که همانا احساس است نیز می‌باشد. به عبارت دیگر با بیان یک جمله متنی یکسان ولی با لحن‌های متفاوت می‌توان معانی یا مفاهیم متفاوتی را ارائه داد.

به همین دلیل شاخه جدیدی در هوش مصنوعی با عنوان آنالیز احساس ایجاد گردیده است و تجهیزاتی که امکان ادراک احساس از گفتار را داشته باشند بسیار مؤثرتر عمل می‌نمایند. 
به‌عنوان‌مثال محصول API از شرکت IBM Watson قادر به تشخیص احساساتی مثل حس توافق، حس احساس مسئولیت و غیره می‌باشد. شرکت Disney نیز محصولی که از طریق پردازش تصویر احساساتی مثل ترس، تعجب و غیره را تشخیص می‌دهد برای آنالیز نحوه تأثیر گزاری فیلم روی بیننده را به کار گرفته است.

سخن آخر:

درنهایت همان‌طور که می‌بینید، IoT نه‌تنها اشیا را باهم مرتبط می‌کند، بلکه فن‌آوری‌های مختلف را نیز باهم متصل می‌سازد. جهانی شامل دستگاه‌هایی در کنار انسان‌ها که باهم کار می‌کنند را تصور کنید که پرسش‌های یکدیگر را می‌فهمند، نیازهای همدیگر را می‌سنجند و پاسخ‌های مربوطه را ارائه می‌کنند. چشم‌اندازی بسیار روشن و مطلوب در پیش رو می‌باشد.