باور می کنید این تصویر را هوش مصنوعی ساخته است؟
به گزارش خبرگزاری رودخان و به نقل از دیجیاتو محققان انویدیا دانشگاه MIT و «دانشگاه چینهوا» چین مدل هوش مصنوعی جدیدی با نام Sana معرفی کرده اند که می تواند در چند ثانیه تصاویری با وضوح ۴۰۹۶ در ۴۰۹۶ پیکسل تولید کند.
محققان در صفحه گیت هاب Sana توضیح می دهند برخلاف مدل های هوش مصنوعی قدیمی که تصاویر را ۸ برابر فشرده می کنند Sana می تواند تصاویر را ۳۲ برابر فشرده کند و تعداد توکن های موردنیاز را کاهش بدهد.
علاوه براین Sana از مدل زبانی Gemma به جای رمزگذار متن خود برای بهبود عملکرد درک و استنتاج سریع استفاده می کند. محققان همچنین برای کاهش مراحل نمونه گیری آن از مکانیزمی با نام «Flow-DPM-Solver» استفاده کرده اند که اساساً تعداد مراحل نمونه گیری را از ۲۸-۵۰ به ۱۴-۲۰ کاهش می دهد.
تصاویر زیر با هوش مصنوعی Sana تولید شده اند:
عملکرد Sana در برابر سایر مدل های هوش مصنوعی
آن ها ادعا کرده اند مدل Sana-۰.۶B می تواند با مدل های غول پیکر مدرن مانند Flux-۱۲B رقابت کند و ۲۰ برابر کوچک تر و بیشتر از ۱۰۰ برابر در اندازه گیری سریع تر باشد. همچنین Sana-۰.۶B را می توان روی پردازشگر گرافیکی لپ تاپ ۱۶ گیگابایتی اجرا کرد.
نمودار زیر مدت تولید تصویر توسط مدل Sana را با سایر مدل ها مقایسه می کند. طبق این نمودار برای مثال مدل SANA-۱.۶B با ۱.۶ میلیارد پارامتر می تواند در ۱.۲ ثانیه تصویری با وضوح ۱۰۲۴ در ۱۰۲۴ پیکسل تولید کند.
هم اکنون از طریق گیت هاب می توانید نسخه اولیه Sana را آزمایش کنید و محققان وعده داده اند کد منبع آن را به زودی منتشر می کنند.
۲۲۷۳۲۳
آیا شما به دنبال کسب اطلاعات بیشتر در مورد "باور می کنید این تصویر را هوش مصنوعی ساخته است؟" هستید؟ با کلیک بر روی پزشکی، آیا به دنبال موضوعات مشابهی هستید؟ برای کشف محتواهای بیشتر، از منوی جستجو استفاده کنید. همچنین، ممکن است در این دسته بندی، سریال ها، فیلم ها، کتاب ها و مقالات مفیدی نیز برای شما قرار داشته باشند. بنابراین، همین حالا برای کشف دنیای جذاب و گسترده ی محتواهای مرتبط با "باور می کنید این تصویر را هوش مصنوعی ساخته است؟"، کلیک کنید.