پیشرفت 3 هوش مصنوعی بزرگ در تولید تصاویر

پیشرفت 3 هوش مصنوعی بزرگ در تولید تصاویر بازار مقاله: مدتی است که با تصاویر تولیدشده توسط هوش مصنوعی زندگی می نماییم، اما این هفته، تعدادی از بازیگران اصلی این حوزه، قدمهای بزرگی رو به جلو برداشته اند. به طور دقیقتر در اینجا در مورد بروزرسانی های مهم میدجرنی(Midjourney)، مدل جدید گوگل و گروک(Grok) صحبت می نماییم.


به گزارش بازار مقاله به نقل از ایسنا، هر یک از شرکتها نشان می دهند که فناوری با سرعت و در جهات مختلف درحال تکامل است و هر شرکت نشان میدهد که پیشرفت ها تا کجا پیش رفته است.
به نقل از دیجیتال ترندز، با میدجرنی(Midjourney) شروع نماییم که بی سر و صدا یک ویرایشگر وب جدید را اواخر روز پنجشنبه منتشر نموده است که برخی از ابزارهای مفید دستکاری تصویر را در یک رابط کاربری جمع می کند.
پیش از این، عملکردهایی مانند قاب بندی مجدد، رنگ آمیزی مجدد گسترش مرزهای تصویر و تولید محتوا برای پر کردن آن و بزرگنمایی همگی نیاز به ابزار خاص خود داشتند و در چندین لیست قرار گرفته بودند و از سازندگان خواسته می شد که دائما بین این لیست ها جابه جا شوند. این رابط کاربری جدید پروسه ویرایش منسجم تر و ساده تری را ارائه می دهد.
بگفته دیوید هولز(David Holz)، مدیر عامل میدجرنی در دیسکورد، ویرایشگر وب جدید به شکلی طراحی شده است که ویرایش تصاویر تولید شده با هوش مصنوعی را آسان تر و بدون مشکل تر می کند. او نوشت: ما فکر می نماییم که این کار ویرایش تصاویر را بسیار آسان تر از قبل می کند و گام بزرگی رو به جلو است.
این شرکت همین طور ابزار گزینش جدیدی را معرفی کرده است که مانند یک قلمو دیجیتال کار می کند و جایگزین ابزار انتخاب مربعی و بیضی می شود.
ویرایشگر جدید برای همه کاربران میدجرنی که قبل از این بالاتر از ۱۰ تصویر روی پلت فرم ساخته اند، در دسترس می باشد. واکنش های اولیه از طرف جامعه تا حد زیادی مثبت بوده است.
این ویرایشگر دو هفته بعد از انتشار میدجرنی ۶.۱ ارائه می شود که کیفیت و انسجام تصویر مانند تعداد صحیح انگشتان و همین طور زمان پردازش و درک دقت متن را بطور قابل توجهی بهبود بخشید.
گروک-۲(Grok-2) هیولا را آزاد می کند
بروزرسانی میدجرنی نیز تنها دو روز بعد از انتشار گروک-۲ توسط استارت آپ xAI ایلان ماسک ارائه می شود که اتفاق بزرگ بعدی این هفته است.
محبوبیت قابلیت های تولید تصویر گروک به علت کیفیت تصویر چشم گیر و قابلیت استفاده رایگان، به سرعت در حال افزایش می باشد.
بزرگترین بحث در مورد گروک-۲ فقط کیفیت آن نیست، بلکه دستورالعمل های ظاهرا تعریف نشده آنست. برخلاف خیلی از تولیدکننده های تصویر هوش مصنوعی، به نظر می آید گروک-۲ از نظر دستورالعمل های مربوط به مالکیت معنوی، خشونت و سایر محتواها چیز کمی برای گفتن دارد.
مردم قبل از این محدودیت های آنرا آزمایش کرده اند و انواع تصاویر وحشتناک و عجیب و غریب را به وجود آورده اند که روزهای اولیه تولید تصویر هوش مصنوعی را تداعی می کند. اما اگر به سخنان ماسک اعتقاد دارید، فقدان دستورالعمل های گروک-۲ هدفمند به نظر می آید و در نهایت می تواند به چگونگی تکامل این فناوری در آینده شکل دهد.
گوگل با ایمجن ۳(Imagen 3) خود وارد رقابت شد
در نهایت، گوگل مدل جدید هوش مصنوعی ایمجن ۳(3 Imagen) خودرا معرفی نمود که در روز پنجشنبه برای همه کاربران آمریکایی منتشر گردید. گوگل آنرا «با کیفیت ترین مدل تبدیل متن به تصویر» خود می نامد که حالا می تواند «جزئیات بهتر، نور غنی تر و مصنوعات کمتری نسبت به مدلهای قبلی» تولید نماید. گوگل همین طور می گوید که ایمجن ۳ در رندر کردن متن بهتر است و الان در نسخه های مختلفی ارائه می شود.




منبع:

1403/05/28
10:01:34
5.0 / 5
193
تگهای خبر: شركت , فرم , فناوری , كاربران
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب
نظر شما در مورد این مطلب
نام:
ایمیل:
نظر:
سوال:
= ۹ بعلاوه ۳
بازار مقاله MarketDoc
marketdoc.ir - حقوق مادی و معنوی سایت بازار مقاله محفوظ است

بازار مقاله

فروش مقالات و کتب علمی