سیستم عادی‌سازی متنی، یکی از گام‌های مهم و اساسی در پردازش سیستم‌های زبان طبیعی است.
سوالی که در این بین به وجود می‌آید، نحوه کارکرد این سیستم هوشمند است. در حال حاضر دستیار هوشمند آمازون بر پایه هزاران قاعده عادی‌سازی برای تاریخ، آدرس ایمیل، شماره، مخفف و سایر عبارات کار می‌کند.

به گزارش ایتنا از رایورز به نقل از ونچربیت، این قاعده عادی‌سازی برای زبان انگلیسی، اشکال چندان خاصی ندارد، ولی در زبان‌های دیگر به مشکل برمی‌خورد. به همین خاطر، دانشمندان آمازون در پی یافتن راهی برای توسعه مهارت‌های دستیار هوشمند خود بر پایه یادگیری ماشین هستند.
 
دانشمندان هوش مصنوعی با استفاده از تکنیک‌های یادگیری ماشین قصد دارند کلمات را به بخش‌های کوچک‌تری تبدیل کنند و سپس به دستیار هوشمند الکسا آموزش دهند.
دانشمندان به این نتیجه رسیده‌اند که با آموزش 500000 نمونه به دستیار هوشمند، 75 درصد خطاهای گذشته کمتر شد.
 
دانشمندان همچنین تلاش کردند کلمات را به شکلی به دستیار هوشمند آموزش دهند که حتی اگر با کلمه ناآشنایی مواجه شد، ابتدا آن را به بخش‌های کوچک‌تر تقسیم کند و ببنید که آیا آن بخش‌های کوچک در بین بخش‌هایی قبلاً به آن آموزش داده شده است، وجود دارد یا نه؟ در صورت وجود داشتن آن بخش‌ها(حتی یکی از از بخش‌ها) سیستم حدس می‌زند که نزدیک‌ترین معنی برای کلمه ناآشنا چیست.

 

محققان پس از آموزش اصول و قواعد بیشتر مانند ضرب‌المثل‌ها، جملات خاص، احساسات حاکم بر جملات مختلف و... توانستند اشتباهات موجود در سیستم‌های هوشمند عادی‌سازی گفتار را تا 81 درصد کاهش دهند و نرخ خطای کلمات را به 0.2 درصد برسانند.
 
در همین خصوص، دانشمندان فعال در زمینه الکسا در مقاله‌ای تحت عنوان «عادی‌سازی متنی عصبی با واحدهای کوچک‌تر از واژه» به صورت کامل به فرآیند مطالعات و نتایج خود پرداختند و روش کار خود را به صورت  کاملاً شفاف بیان کردند.

شایان ذکر است که این مطالعات به پایان نرسیده است و تا بهبود حداکثری عادی‌سازی گفتار در الکسا همچنان ادامه دارد.
 

منبع : سایت خبری فناوری اطلاعات (ایتنا) | " جذاب ترین " نقشی در تولید محتوای این مطلب ندارد، مطلب منتشر شده با ذکر منبع می باشد.