“Black Myth Wukong” که به طور جادویی تغییر یافته است تا Midjourney را شکست دهد.

وقتی ایده‌گرام‌های هوش مصنوعی بر سر واقع‌گرایی و هنر با هم رقابت می‌کنند، Ideogram مسیر دشواری را باز کرده است: می‌تواند متن را با دقت روی تصاویر تولید کند و فونت‌ها و طرح‌بندی‌ها زیبا هستند.

این تقاضا برای تولید پوسترها و تصاویر بدون نیاز به P-pictureها با یک کلیک بسیار مناسب نیست و برای افراد عادی که چیزی در مورد طراحی نمی دانند بسیار مناسب است.

قبلاً در مورد نسخه 1.0 Ideogram نوشتیم . در 21 آگوست، نسخه 2.0 آمد. واقع گرایی بهتر است، پوسترها بیشتر طراحی شده اند و مهارت ویژه متن نیز قوی تر است.

شاید هرگز در مورد آن نشنیده باشید. این یک محصول هوش مصنوعی است که توسط کارمندان سابق گوگل ساخته شده است.

راهنما 👉 https://ideogram.ai/

هوش مصنوعی می خواهد بداند در مورد کدام ووکانگ صحبت می کنید؟

Ideogram یک ویژگی مخصوصاً تازه کار دارد: "نکات جادویی".

شما مستقیماً کلمه سریع چینی را وارد می‌کنید و به شما کمک می‌کند آن را به انگلیسی ترجمه کنید و در عین حال به شما کمک می‌کند آن را بهینه کنید. به عنوان یک محصول خارج از کشور، این نوع عملیات می تواند قلب مردم را به دست آورد.

در عین حال، Ideogram بر پنج سبک تمرکز دارد: معمولی، واقعی، طراحی، سه بعدی و انیمیشن، همه آنها به راحتی قابل درک هستند، بنابراین انتخاب گیج کننده نخواهد بود.

اجازه دهید با یک کلمه ساده چینی شروع کنم، «سان ووکونگ که یک چاقو طلایی در دست دارد»، سبک انیمه، اجازه دهید هوش مصنوعی به من کمک کند تا آن را ترجمه و بهینه کنم و ببینم چگونه می توان آزادانه از آن استفاده کرد.

وقتی نسخه "Dragon Ball" ووکونگ توسط Shui Lingling منتشر شد، وقتی به دستورات نگاه کردم، هوش مصنوعی Sun Wukong را به "Son Goku" ترجمه کرد، بنابراین تعجب آور نیست.

علاوه بر این، من همچنین می‌خواهم از ایدئوگرام بپرسم که آیا برای پرداخت حق امتیاز بیش از حد آشکار است؟

به منظور جلوگیری از سوء تفاهم بیشتر توسط هوش مصنوعی، هنگام وارد کردن کلمه سریع از تنبلی خودداری کردم و تأکید کردم که "سان ووکانگ" "سان ووکنگ" است نه "سون گوکو".

این بار سبکی واقع گرایانه در پیش گرفتیم و حکیم بزرگ زرهی به تن دارد و در دستش یک حلقه طلایی ایستاده است لحن، پایین تصویر می گوید "افسانه سیاه: Wukong" (افسانه سیاه: Wukong).

هیچ خطایی در متن وجود ندارد، حروف بزرگ تاثیر زیادی دارند و حال و هوای غار بودایی نیز ایجاد شده است، اما خلق و خوی "حکیم بزرگ" کمی خفیف است، تصویر کمی آتاویستیک است. هیچ نوری در چشمانش نیست

از همان کلمات سریع برای تولید Midjourney یک بار استفاده کنید. متن هم اشتباه است و هم هیچ حسی از طراحی ندارد، اما کمی زیباتر "Monkey King" و سبک بازی وب این را جبران می کند.

▲ میانه سفر ایجاد شد

من تمایلی به آشتی نداشتم، دوباره سبک 3 بعدی را امتحان کردم.

در نتیجه، نتیجه تولید شده توسط Ideogram بسیار شبیه به تصویر تبلیغاتی یک سری جعبه کور به سبک چینی است پادشاه میمون نیز شبیه ارلنگ شن کشیده شده است.

و هوش مصنوعی نیز خودش را نشان داد، اگرچه در رندر کردن متن انگلیسی بسیار خوب بود، این نقص از 1.0 تا 2.0 ادامه داشت.

به نظر می رسد که محصولات خارج از کشور به اندازه کافی فرهنگ سنتی داخلی را درک نمی کنند.

تیم Ideogram گفته است که نسخه 2.0 به خوبی Flux و DallE است. اخیراً، عکس‌های سخنرانی TED تولید شده توسط نسخه واقعی LoRA توسط Flux، بسیاری از کاربران اینترنتی را فریب داده است، زیرا تشخیص واقعی یا جعلی بودن آنها دشوار است. سپس بیایید آزمایش کنیم که نتایج تولید شده توسط Ideogram چقدر شبیه عکس هستند.

▲ تولید شار

پس از انتخاب سبک واقع گرایانه، کلمات سریع چینی، عکس های گفتگوی TED را وارد کردم و عنوان اسلاید "Ideogram 2.0 Release" بود: "متن دقیق"، "در طراحی خوب" و "واقعی تر". گوینده زن جلوی تخته سفید ایستاد، چند نفر در پس زمینه هستند.

مشاهده می شود که درک معنایی ایده گرام خوب است و تمام عناصر لازم را دارد.

با این حال، جزئیات به اندازه کافی خوب مدیریت نمی شوند، اگرچه هیچ مشکلی با متنی که باید تولید شود وجود ندارد، برخی از کاراکترهای کوچک که به طور تصادفی ظاهر می شوند، گلدان را خراب می کنند، و انگشتان و بدن شخصیت ها کاملاً درست نیستند. در حال حاضر بسیار بهتر از نسخه قبلی 1.0 است.

در مورد طراحی پوستر، می توان گفت که Ideogram در "منطقه راحتی" سایر هوش مصنوعی های Vincentian قرار دارد.

اگر از باکس آفیس موفق "بیگانه" به عنوان سوال تست استفاده شود، آیا هوش مصنوعی می تواند آن احساس وحشت وصف ناپذیر را طراحی کند؟

من یک سبک طراحی را انتخاب کردم، از کلمات سریع برای توصیف عناصر تصویر استفاده کردم، و به طور خاص جمله ای را در پایین پوستر ذکر کردم: "بینندگان زیر سن قانونی با احتیاط تماشا می کنند."

اثر کلی چشم نواز است و یک رشته متن طولانی با موفقیت ایجاد شده است، تنها یک خطای کوچک وجود دارد، اما واقع بینانه نیست و بیشتر شبیه یک سبک کتاب مصور است که با فیلم لایو اکشن مطابقت ندارد.

سپس از فیلم تابستانی بد "A Dream Mansions" به عنوان الهام بخش استفاده کردم و از Ideogram خواستم که یک پوستر تولید کند کلمات سریع واقعا خوب است.

البته عنوان فیلم به درستی نوشته شده است، اما به نظر می رسد فونت آن از ارباب حلقه ها قرض گرفته شده باشد، کمی دراماتیک است و سبک کلی آن بیشتر شبیه به انیمیشن مولان است.

"سبک طراحی" ایدئوگرام بیشتر دو بعدی و منحصر به فرد است، اما برعکس، این امر سناریوهای استفاده از پوسترها را نیز محدود می کند.

به طور خلاصه، Ideogram یک محصول گرافیکی بسیار منحصر به فرد هوش مصنوعی است که سطح واقع گرایی آن شبیه به Flux است و حس هنری آن با Midjourney متفاوت است.

▲ الگوی "تابستان بارانی".

با این حال، دارای سطح منحصر به فردی از تولید متن است و بیشتر برای تولید پوستر، تصویرسازی، تبلیغات، شکلک، چاپ تی شرت و غیره مناسب است.

نتایج ارزیابی انسانی نشان می‌دهد که Ideogram 2.0 از Flux Pro و DALL·E 3 از نظر هم‌ترازی سریع کلمات، عملکرد کلی و کیفیت رندر متن بهتر است.

▲ اما این بیانیه خود ایدئوگرام است

بسیار قابل پخش و ساده، شما ممکن است دسرهای بیشتری از هوش مصنوعی مانند این داشته باشید

Ideogram در 22 آگوست سال گذشته و دقیقا یک سال پس از انتشار نسخه 2.0 معرفی شد.

تیم موسس مجموعاً 7 نفر از Google Brain، دانشگاه کالیفرنیا، برکلی، دانشگاه کارنگی ملون و دانشگاه تورنتو دارد که 4 نفر از آنها نویسندگان مقاله تحقیقاتی Imagen مدل انتشار نمودار Google Vincent هستند.

علاوه بر انتشار نسخه 2.0 این بار، Ideogram یک برنامه iOS را نیز راه اندازی کرده است که می توان آن را مستقیماً در چین دانلود کرد.

▲رابط تلفن همراه

ایده‌گرام در حال حاضر برای همه کاربران رایگان است، اما سهمیه آن بسیار محدود است، پس از تولید 20 عکس در 5 بار، ایده‌گرام به من یادآوری کرد که 10 امتیاز تمام شده است، لطفاً فردا مراجعه کنید. (البته Midjourney همسایه 25 عکس را به صورت رایگان تولید می کند که چندان چشمگیر به نظر نمی رسد.)

اگر به ندرت با نمودارهای وینسنتین تماس می گیرید و می خواهید یک AI نمودار وینسنتین برای شروع کار داشته باشید، Ideogram انتخاب خوبی است.

وارد کردن کلمات سریع چینی، استفاده از «اعلان‌های جادویی» برای ترجمه و بهینه‌سازی یک چیز است.

ارائه طیف محدودی از گزینه‌ها برای کاربران برای «کلیک کردن»، تعامل را آسان‌تر از تکمیل «ورودی» در یک کادر ورودی خالی می‌کند. هر تناسب، سبک و لحنی که بخواهید، Ideogram به شما امکان انتخاب می دهد.

▲ "دختری با گوشواره مروارید خوردن مک دونالد" در رنگ های مختلف

اگر نمی‌دانید چگونه کلمات سریع بنویسید، می‌توانید آن‌ها را نیز ترسیم کنید و اجازه دهید Ideogram به ما کمک کند تا امور روزمره را به جادو تبدیل کنیم.

برای مهارت ضعیفم در طراحی متاسفم، اما هوش مصنوعی معنی را فهمید، خطوط و رنگ ها را بهینه کرد و پس زمینه اضافه کرد و سبک ناگهان بهبود یافت. با هوش مصنوعی، چه کسی قلم جادویی ما لیانگ نیست؟

علاوه بر این، در زیر کادر ورودی نسخه وب، آثاری وجود دارد که توسط دیگران تولید شده است، وقتی با مواردی که دوست داریم مواجه می شویم، می توانیم کلمات درخواستی را مشاهده کرده و به آنها مراجعه کنیم. Ideogram می‌گوید که کاربرانش در سال گذشته بیش از 1 میلیارد تصویر قابل مشاهده برای عموم تولید کرده‌اند.

اگر می‌خواهید یک شی خاص تولید کنید اما نمی‌دانید چگونه کلمه اعلان را بنویسید، Ideogram عملکرد جستجوی کتابخانه عمومی ایجاد با متن را نیز راه‌اندازی کرده است، اما این تابع در حال حاضر نیاز به عضویت دارد.

▲ نتایج جستجو برای "گربه"

در مجموع، Ideogram یک محصول Vincent قابل بازی است.

این می تواند محتوای متنی مورد نیاز کاربران را با دقت بیشتری تولید کند و با سبک های مختلف تصاویر سازگار شود.

▲ وبلاگ ایده گرا

گاهی اوقات، می تواند ارزش عاطفی به ارمغان بیاورد و جاه طلبی را از طریق تصاویر بیان کند، اگرچه شکلک های تولید شده بیش از حد نسبت به زیبایی شناسی اینترنت اروپایی و آمریکایی تعصب دارند.

▲ «می‌خواهم بسته شکلک «Black Myth: Wukong» را بازی کنم

کیفیت کلی Ideogram بد نیست، عملکرد متن قدرتمند، تازه کار، آسان برای استفاده، و تعاملات دلپذیر است. هنگامی که ابزارهای هوش مصنوعی خلاقیت، راحتی و ارزش اشتراکی را با هم ترکیب می‌کنند، برای افراد آسان می‌شود که گرفتار شوند.

دنیایی که از قالب ها حک شده است بسیار کسل کننده است همچنین تشخیص یک نیاز کوچک و سپس ساختن راه حل برای اولین بار در صنعت بسیار جالب است.

محصولات زیادی در جهان وجود دارد و با تعداد مخاطبان بیشتر، می‌توان انتظار چنین «دسرهایی» با هوش مصنوعی را داشت.

مانند یخبندان پاییزی تیز است و می تواند بلایای بد را دفع کند. ایمیل کاری: [email protected]

# خوش آمدید به دنبال حساب عمومی رسمی وی چت Aifaner: Aifaner (شناسه WeChat: ifanr در اسرع وقت در اختیار شما قرار خواهد گرفت).

Ai Faner |. لینک اصلی · مشاهده نظرات · Sina Weibo