بازار؛ گروه بین الملل: چین در ارائه مدلهای زبان بزرگ متن باز مانند دیپ سیک پیشرو بوده است. این بدان معناست که دولتها و شرکتها در آسیای جنوب شرقی میتوانند راحتتر و ارزانتر به آنها دسترسی داشته باشند. اما چالشهایی در بومیسازی و دستیابی به استقلال دادهها وجود دارد.
ظهور مدل زبان بزرگ دیپ سیک در ژانویه ۲۰۲۵ نقطه عطف مهمی از دیدگاه فناوری، تجاری و سیاسی بود. دیپ سیک نشان داد که مدل های زبان بزرگ را میتوان با استفاده از ۹۰٪ قدرت محاسباتی کمتر نسبت به پلتفرمهای تثبیتشدهتر مانند چت جی پی تی آموزش داد و توسعه آنها را ارزانتر کرد. ظهور دیپ سیک همچنین نکته دیگری را برجسته میکند: آنچه سیلیکون ولی میتواند انجام دهد، هانگژو در آن سوی اقیانوس آرام نیز میتواند انجام دهد.
با توجه به رقابت فناوری چین و ایالات متحده آمریکا، ایجاد دیپ سیک پیامدهای مهمی برای آسیای جنوب شرقی و سایر مناطق نوظهور دارد. ظهور مدل های زبان بزرگ کمهزینه دسترسی کسبوکارها، دولتها و محققان به آنها را افزایش میدهد و فرصتی را برای کشورهای جنوب شرقی آسیا فراهم میکند تا استقلال دادههای خود را اثبات کنند. این جایگزینهای رایگان، هوش مصنوعی باز را تحت فشار قرار میدهند تا قیمتها را کاهش داده و هزینههای کلی خدمات مدل زبان بزرگ را کاهش دهد.
اولین نکته مهم این است که مدل های زبان بزرگ دیپ سیک تا حد زیادی مبتنی بر فناوری متنباز هستند. این بدان معناست که کد منبع، دادههای آموزشی و روششناسی برای اصلاح و بهبود در دسترس هستند. مدلهایی مانند دیپ سیک بر اساس «متن باز» در دسترس قرار میگیرند. در حالی که این امر امکان کپی و تنظیم مدل را فراهم میکند، روشهای مورد استفاده برای آموزش مدلها آشکار نمیشوند.
شرکتهای فناوری چینی سالهاست که در توسعه مدلهای هوش مصنوعی (AI) متنباز فعال بودهاند. استراتژی آنها که توسط دانشگاههای چین و دولت پشتیبانی میشود، میتواند به عنوان مدل نوآوری باز برای تسریع توسعه فناوری و پیشی گرفتن از ایالات متحده آمریکا تلقی شود.
با این حال، شرکتهای چینی تنها شرکت هایی نیستند که در هوش مصنوعی متنباز سرمایهگذاری میکنند. متا و گوگل نیز مدل های زبان بزرگ متنباز را به عنوان بخشی از استراتژی تجاری با هدف کاهش هزینههای توسعه مدل زبان بزرگ، جذب استعدادها و رقابت مؤثرتر با مدل های زبان بزرگ اختصاصی توسعه دادهاند.
یک استراتژی رقابتی رایج برای کسبوکارهای فناوری، تلاش برای کالاییسازی مکمل است - ارزان و در دسترس کردن محصولات یا خدمات تکمیلی برای افزایش تقاضا برای پیشنهاد اصلی. برای کسبوکارهایی که از چت جی پی تی بسته استفاده میکنند، سرمایهگذاری در جایگزینهای متنباز میتواند یک حرکت هوشمندانه باشد. این جایگزینهای رایگان، هوش مصنوعی باز را تحت فشار قرار میدهند تا قیمتها را کاهش داده و هزینههای کلی خدمات زبان بزرگ را کاهش دهد.
مدلهای هوش مصنوعی توسعهیافته محلی میتوانند رشد بهرهوری را در اقتصاد گستردهتر افزایش دهند و تضمین میکنند ارزش توسط کسبوکارهای محلی به جای شرکتهای خارجی به دست میآید
مدل های زبان بزرگ و هزینههای کمتر فناوری در جنوب شرقی آسیا
در دسترس بودن مدل های زبان بزرگ با کیفیت بالا و با وزن آزاد، دسترسی آسانتر و ارزانتری را برای دولتها و شرکتهای جنوب شرقی آسیا فراهم میکند. این امر به دولتها اجازه میدهد تا مدل های زبان بزرگ خود را اداره کنند، استقلال دادهها را حفظ کنند و از انتقال اطلاعات حساس به خارج از کشور جلوگیری کنند، که منعکسکننده دستور محلیسازی دادههای ویتنام برای پلتفرمهای رسانههای اجتماعی در سال ۲۰۲۲ است.
کاهش سریع هزینههای آموزش مدل هوش مصنوعی برای بومیسازی دادهها و هوش مصنوعی از نظر اقتصادی ضروری است. طبق گزارشها، سنگاپور ۵۲ میلیون دلار آمریکا برای توسعه مد های زبان بزرگ SEA-LION خود هزینه کرده است، هشت برابر بیشتر از آنچه دیپ سیک ادعا میکند هزینه کرده است.
با نگاهی فراتر از بخش دولتی، مدل های زبان بزرگ متنباز همچنین زمینه بازی تجاری را با استارتآپهای جنوب شرقی آسیا که اکنون به همان مدل های زبان بزرگ اصلی استارتآپهای چین و ایالات متحده دسترسی دارند، ایجاد میکنند. مدلهای هوش مصنوعی توسعهیافته محلی میتوانند رشد بهرهوری را در اقتصاد افزایش دهند، در حالی که تضمین میکنند ارزش توسط مشاغل محلی به جای شرکتهای خارجی به دست میآید.
مدل های زبان بزرگ غربی یا چینی ممکن است نسبت به سلسله مراتب اجتماعی، آداب و رسوم و اصطلاحات محلی بیتفاوت باشند
با این حال، ظهور هوش مصنوعی چینی یک مشکل فرهنگی متفاوت را نیز برجسته کرده است. مدل های زبان بزرگ چینی به گونهای آموزش دیدهاند که نسخه حزب کمونیست چین (CCP) از تاریخ و دیدگاههای سیاسی آن را تکرار کنند، بنابراین با سیستم سانسور در چین مطابقت دارند. به همین ترتیب، مدلهایی که عمدتاً بر اساس متون انگلیسی آموزش دیدهاند، جهانبینی عمدتاً غربی دارند.
به ویژه در جنوب شرقی آسیا با تنوع فرهنگی، مذهبی و زبانی زیاد، مدل های زبان بزرگ غربی یا چینی ممکن است نسبت به سلسله مراتب اجتماعی، آداب و رسوم و اصطلاحات محلی بیتفاوت باشند. مدلهای آموزشندیده ضعیف مبتنی بر منابع نامناسب میتوانند خطرات اجتماعی قابل توجهی را ایجاد کنند. درست همانطور که گفته میشود فیسبوک به خشونتهای بین قومی در میانمار کمک کرده است، مدلهای جدید هوش مصنوعی میتوانند تنشهای اجتماعی موجود را تشدید کنند.
بومیسازی فناوری بسیار مهم است
ویژگی متنباز در توسعه مدل زبان بزرگ به این معنی است که کشورهای جنوب شرقی آسیا اکنون فرصتی برای اعمال استقلال بسیار بیشتر در استفاده و بهکارگیری چنین مدلهایی دارند.
اول اینکه این کشورها باید از اندازه کوچکتر مدل های زبان بزرگ جدید استفاده کنند که باعث میشود استقرار، استفاده و آموزش مجدد آنها به صورت محلی بدون تکیه بر ارائه دهندگان فناوری خارجی بسیار ارزانتر شود.
دوم این کشورها باید ظرفیت بازآموزی مدل های زان بزرگ را توسعه دهند و آنها را برای زبانهای محلی مفیدتر و نسبت به فرهنگ محلی حساستر کنند. سرمایهگذاری در بازآموزی مدل زبان بزرگ میتواند به عنوان یک کالای عمومی تلقی شود و در دانشگاههای محلی تثبیت شود، در نتیجه استعدادهای محلی پرورش یافته و تحقیق و توسعه پیشرفت میکند.
به نظر میرسد چین دری را برای آسیای جنوب شرقی باز کرده است تا به رهبران فناوری در جهان بپیوندند
آیا آسیای جنوب شرقی واقعاً میتواند از این مزیت بهرهمند شود؟
کشورهای جنوب شرقی آسیا باید مدلهای خود را برای جمعآوری دادههای خود توسعه دهند. با توجه به محتوای دیجیتالی محدود تولید شده در برخی از زبانهای منطقهای، جمعآوری و گردآوری حجم کافی از متون، منبعی ضروری برای بهبود مدل های زبان بزرگ محلی است. به جای حجم زیادی از اطلاعات که توسط شرکتهای خارجی استفاده میشود، چنین دادههایی در حالت ایدهآل باید توسط سازمانهای محلی ذخیره و استفاده شوند.
به نظر میرسد چین با نسل فعلی مدل های زبان بزرگ منبع باز خود، دری را برای آسیای جنوب شرقی باز کرده است تا به رهبران فناوری برسد. با این حال برای اینکه آسیای جنوب شرقی بتواند از این مرحله عبور کند، نه تنها به سرمایهگذاری در زیرساختها و قابلیتهای محلی، بلکه به ادعای واضح استقلال دادهها و هوش مصنوعی نیز نیاز دارد.
نظر شما