سیستمهای هوش مصنوعی تاکنون نمیتوانستند بهصورت همزمان دو کار را انجام دهند، اما حالا محققان واحد متا AI که پیشتر با نام فیسبوک AI شناخته میشد، الگوریتمی ساختهاند که میتواند بهطور همزمان شناسایی تصاویر، متون یا گفتار را به شبکههای عصبی بیاموزد.
فیسبوک در پستی در وبلاگ خود میگوید این الگوریتم Data2vec نام دارد و نه تنها فرآیند یادگیری را یکپارچه میکند، بلکه در هر سه حوزه بهصورت یکسان خوب عمل میکند. این پروژه بر اساس رویکردی موسوم به یادگیری خودنظارتی انجام شده است. در این رویکرد شبکههای عصبی یاد میگیرند که خودشان الگوها را بدون نیاز به راهنما از میان مجموعهای از دادهها پیدا کنند.
الگوریتم هوش مصنوعی فیسبوک چگونه کار میکند؟
الگوریتم Data2vec از یک شبکه عصبی دانشآموز و یک شبکه عصبی معلم استفاده میکند. ابتدا شبکه معلم با تصاویر، متون و گفتارها آموزش داده میشود تا بعدا بتواند در زمان مواجهه با نمونههای جدید انواع دادهها را تشخیص دهد. مثلا وقتی تصویر یک سگ را میبیند، بتواند تشخیص دهد که در تصویر سگ وجود دارد.
ولی تفاوت در اینجاست که در این مرحله شبکه دانشآموز لازم نیست خودش حدس بزند که یک داده چیست، بلکه باید حدس بزند شبکه معلم در صورت مواجهه با این داده چه حدسی میزد. از آنجایی که شبکه دانشآموز سعی نمیکند برای خود تصویر یا متن حدس بزند و فقط کافی است به تفسیر معلم درباره تصویر یا متن برسد، نیازی نیست که الگوریتم را برای هر نوع داده بهصورت جداگانه آموزش و تغییر دهیم.
مشکل الگوریتمهای یادگیری تاکنون این بوده که نمیتوانستند چند مهارت را بهصورت همزمان فرا بگیرند. یعنی اگر به یک الگوریتم تشخیص تصاویر را میآموختید، برای تشخیص تصویر باید کار را از صفر شروع میکردید. اما محققان متا متوجه شدهاند که سیستم آنها در مقایسه با تکنیکهای فعلی در شناسایی تصاویر و گفتارها بهتر عمل کرده و در زمینه درک متون در حد مدلهای زبانی پیشرو ظاهر شده است.
متا حالا سعی دارد قابلیتهای سیستم خود در زمینه یادگیری همزمان کارهای مختلف را افزایش دهد. مارک زاکربرگ میگوید این فناوری میتواند در متاورس استفاده شود. برای مثال اگر در حال آشپزی بودید و یادتان رفت که یکی از مواد را درون قابلمه بریزید، هوش مصنوعی این موضوع را به شما یادآوری میکند.