مدل‌های زبانی بزرگ در درک گفتار انسانی به‌سطح قابل‌قبولی رسیده‌اند و به‌نظر می‌رسد اکنون تمرکز این فناوری روی ارتباطات با حیوانات معطوف شده است.
تصور کنید بتوانیم با استفاده از گوشی هوشمند، آنچه را که پرندگان به یکدیگر می‌گویند رمزگشایی کنیم یا بفهمیم فیل‌های آفریقایی به یکدیگر چه می‌گویند. خبر خوب این است که ظاهراً زمان زیادی تا رسیدن به فناوری تشخیص گفتار حیوانات باقی نمانده و درواقع این موضوع، بخشی از آینده‌ی فناوری پروژه‌ی گونه‌های زمین (ESP) است.

ESP سازمانی غیرانتفاعی است که آزا راسکین، مؤسس آزمایشگاه موزیلا و بریت سلویل از اعضای تیم بنیان‌گذار توییتر آن را تأسیس کرده‌اند. هدف این سازمان، رمزگشایی ارتباطات غیرانسانی با استفاده از هوش مصنوعی است.

درک افکار درونی حیوانات خانگی می‌تواند جذاب باشد. البته مزیت‌های درک ارتباطات حیوانات بسیار فراتر از گوش دادن به مکالمه‌ی میان سگ‌های خانگی با سگ‌های همسایه‌ها است. درواقع قابلیت رمزگشایی ارتباطات حیوانات، پیامدهای مستقیمی روی حفاظت از محیط‌زیست و سیاره‌ی ما دارد.

رمزگشایی ارتباطات حیوانات می‌تواند به توسعه‌ی ابزارهایی منجر شود که می‌توانند به تحقیقات حفاظت از محیط‌زیست کمک کنند. دانشمندان قادر خواهند بود با اطلاع از ویژگی‌های کشف‌نشده‌‌ی حیوانات، روش ارتباط گونه‌های خاص، نحوه‌ی شکار، غذا خوردن، ایجاد ارتباط با دیگر حیوانات و روش پردازش اطلاعات دریافتی از محیط اطراف آن‌ها را کشف کنند.

آیا یک گربه‌ی وحشی از ماهیت انسان‌ها اطلاع دارد؟ آیا حافظه‌ی فیل می‌تواند به انتقال داستان‌های زندگی آن‌ها از نسلی به نسل دیگر کمک کند؟

ما می‌توانیم ازطریق تکنیک‌های یادگیری ماشینی، رمزگشایی داده‌های بیوآکوستیک و سپس ترجمه‌ی این اطلاعات به زبان طبیعی انسان، اطلاعات بسیار زیادی از ارتباطات حیوانات به‌دست آوریم. این داده‌ها می‌توانند به تلاش‌های بشر برای محافظت از محیط‌زیست و همچنین تحقیقات علمی قابل‌اطمینان‌ درمورد گونه‌های مختلف جانوری و ارزیابی جمعیت حیات‌وحش کمک کنند. البته دستیابی به این هدف همان‌قدر که جذاب و نوآورانه به‌نظر می‌رسد، واقعاً سخت است.

بسیاری از تحقیقات مرتبط با رمزگشایی ارتباطات حیوانی، براساس مدل‌های زبانی بزرگ انجام می‌شود که روش کارکرد آن‌ها دقیقاً مشابه مدل‌هایی است که برای بهبود عملکرد گوگل Bard یا ChatGPT مورد استفاده قرار می‌گیرند. ابزارهای هوش مصنوعی مولد، تسلط بسیار خوبی در درک زبان دارند؛ زیرا یادگیری ماشینی می‌تواند زبان‌های مختلف، سبک‌ها و زمینه‌های متفاوت را به‌خوبی درک کرده و پاسخ‌های مناسبی ارائه دهد.

ZDNet می‌نویسد، مدل‌های زبانی بزرگ در طول بسیاری از مراحل آموزش، با حجم بسیار زیادی از داده‌ها تغذیه می‌شوند. این مدل‌ها ورودی‌های مختلف را برای درک ارتباطات میان کلمه‌ها و معنی آن‌ها یاد می‌گیرند. اساساً حجم بالای داده‌های متنی از منابع مختلف مثل وب‌سایت‌ها، کتاب‌ها، تحقیقات و غیره دردسترس این مدل‌ها قرار می‌گیرد.

مدل‌های زبانی بزرگ در مرحله‌ی بعد تحت‌نظر مربیان انسانی قرار می‌گیرند و با آن‌ها گفت‌وگو می‌کنند تا بدین‌ترتیب مفاهیم مختلف را بهتر یاد بگیرند و زمینه‌های گفت‌وگو را بهتر درک کنند. این مرحله همچنین باعث می‌شود مدل‌های زبانی بزرگ از احساسات انسانی مطلع شده و روش کارکرد زبان را به‌طور دقیق را یاد بگیرند.

اگرچه زبان‌ انسان‌ها در نواحی مختلف جهان با یکدیگر تفاوت دارد اما همه‌ی آن‌ها، ارتباط میان مردم را امکان‌پذیر می‌کنند. از آنجا که هوش مصنوعی براساس هوش انسانی توسعه داده شده است، ایجاد مدل برای پردازش زبان طبیعی بشر بسیار آسان‌تر از ساخت مدل‌هایی است که ارتباطات میان حیوانات را درک می‌کنند.

بزرگ‌ترین چالشی که ESP برای رمزگشایی ارتباطات حیوانات با آن مواجه شده، نبود داده‌های اساسی است. هیچ زبان نوشتاری حیوانی برای آموزش این مدل‌ها وجود ندارد و فرمت‌های ارتباطی متفاوت بین گونه‌ها، چالش دیگری ایجاد می‌کند.

ESP در حال جمع‌آوری اطلاعات از حیوانات وحشی سرتاسر جهان است. محققان همچنین درحال ضبط ویدیو و صداهای حیوانات هستند. این داده‌ها اولین گام‌ برای ساخت مدل‌های پایه‌ای است که توانایی رمزگشایی گفتار طیف وسیعی از گونه‌های جانوری را ارائه خواهند داد.

اینترنت اشیاء (IoT) نیز به افزایش حجم داده‌های سبک‌های ارتباطی مختلف میان حیوانات کمک می‌کند. تنوع زیاد دوربین‌های ارزان‌قیمت، دستگاه‌های ضبط صدا و غیره یعنی دانشمندان می‌توانند داده‌ها را از نقاط مختلف جهان جمع‌آوری و آن‌ها را برای تجزیه‌وتحلیل آماده کنند.

راسکین یکی از بنیان‌گذاران ESP می‌گوید احتمالاً طی ۱۲ تا ۳۶ ماه آینده به فناوری موردنیاز برای ایجاد صداهای مولد و جدید دست خواهیم یافت و در آن زمان می‌توان از تکنولوژی مذکور برای رمزگشایی ارتباطات حیوانات استفاده کرد.