هوش مصنوعی نو CM3Leon، برترین ابزار تبدیل متن به تصویر
به گزارش کیوسک خبری آشنا، مدل هوش مصنوعی نو CM3Leon متا مدعی است که در مقایسه با نمونه های رقیب ازجمله مدل DALL-E 2، برترین عملکرد را دارد.
به گزارش دیجیاتو، طی دو سال اخیر مدل های هوش مصنوعی فراوری تصویر رواج بالایی پیدا نموده اند و موانع فنی استفاده از آن ها تقریباً رفع شده است. البته این بدان معنا نیست که عملکرد این مدل ها پایدار شده و به سطح مناسبی رسیده است؛ ولی متا ادعا می نماید که با مدل نو CM3Leon دستاورد مهمی داشته و برترین نمونه را در این حوزه ساخته است.
متا امروز از مدل هوش مصنوعی نوی به نام CM3Leon (یا همان Chameleon یا آفتاب پرست) رونمایی نموده و می گوید این سیستم می تواند در تبدیل متن به تصویر برترین عملکرد را به نمایش بگذارد. این مدل بعلاوه یکی از اولین مدل هایی است که می تواند برای تصاویر شرح یا کپشن بنویسد.
CM3Leon یک مدل مبدل یا ترنسفورمر است که با استفاده از مکانیزمی موسوم به توجه (Attention) سعی می نماید ارتباط داده های موجود ازجمله متن یا تصاویر به یکدیگر را ارزیابی کند. این توجه در کنار دیگر ویژگی های مربوط به معماری در مدل های ترنسفورمر می تواند سرعت آموزش مدل ها را افزایش دهد. ساخت مدل های ترنسفورمر بزرگ تر با افزایش توان پردازشی ممکن می گردد.
توان مورداحتیاج برای CM3Leon متا پنج برابر کمتر از مدل های مشابه است
متا ادعا می نماید که CM3Leon از بیشتر مدل های ترنسفورمر بهینه تر است، چون به پنج برابر توان پردازشی کمتر احتیاج دارد و می تواند با پایگاه کوچک تری از داده ها آموزش داده گردد. این شرکت برای آموزش مدل خود از میلیون ها تصویر از شرکت Shutterstock استفاده نموده است.
قوی ترین نسخه از CM3Leon حدود 7 میلیارد پارامتر دارد که تقریباً دوبرابر مدل DALL-E 2 از شرکت OpenAI است. یکی از قابلیت های کلیدی مدل هوش مصنوعی نو متا که به افزایش قدرت آن یاری نموده، تکنیکی موسوم به بهینه سازی نظارتی (SFT) است. این تکنیک قبلاً در مدل های متنی مثل ChatGPT استفاده شده بود و حالا در مدل های تصویری هم خود را ثابت نموده است.
مدل CM3Leon متا می تواند فرمان های مربوط به ویرایش تصاویر موجود را نیز درک کند. علاوه براین، همان طور که گفتیم، این مدل قادر است برای تصاویر شرح کوتاه یا بلند بنویسد. عملکرد CM3Leon در این زمینه حتی از مدل های مخصوص خلق کپشن برای تصاویر مثل Flamingo و OpenFlamingo هم بهتر است.
متا هنوز اعلام ننموده که قصد عرضه مدل هوش مصنوعی CM3Leon را دارد یا نه و اگر پاسخ این سؤال مثبت است، این اتفاق چه زمانی خواهد افتاد.
منبع: فرارو