معرفی یک استارتاپ ناشناخته؛ پشت پرده هوش مصنوعی مولد تصویر ایلان ماسک چه میگذرد؟
شبکه اجتماعی ایلان ماسک اکنون پذیرای قابلیت تبدیل متن به تصویر است که بهآسانی میتواند اسلحه و مواد مخدر را به تصویر بکشد.
به گزارش دنده6 : هوش مصنوعی گروک که در پلتفرم ایکس در دسترس کاربران قرار دارد، اخیراً به قابلیت ساخت تصویر با استفاده از دستورات متنی مجهز شدهاست. البته ایلان ماسک برای افزودن این قابلیت به شبکه اجتماعی خود، از یک استارتاپ کمتر شناختهشده کمک گرفته است که در ادامه به معرفی آن خواهیم پرداخت.
چرا ایلان ماسک بهسراغ استارتاپ Black Forest Labs رفته است؟
چتبات Grok یکی از موارد استثنائی در نوع خود بهشمار میرود؛ زیرا زبان طعنهآمیزی دارد و سانسور کمتری را در مقایسه با رقبای خود روی محتوا انجام میدهد. این سرویس مبتنیبر هوش مصنوعی بهتازگی پذیرای ویژگی تولید خودکار عکس بوده است که آزادی عمل بیشتری را در اختیار کاربران قرار میدهد. برای مثال میتوانید عکس دونالد ترامپ هنگام مصرف مواد مخدر را روی آن ایجاد کنید؛ بدون آنکه با محدودیت خاصی مواجه شوید. پس از ساخت تصاویر، امکان آپلود مستقیم آنها روی پلتفرم ایکس نیز وجود دارد.
البته ایلان ماسک برای بهرهمندی از ویژگی تبدیل متن به تصویر در چتبات هوش مصنوعی خود، از استارتاپ Black Forest Labs کمک گرفته و به سراغ توسعه بومی این قابلتی نرفته است. مجموعه xAI چندی قبل آغاز همکاری خود را با این استارتاپ اعلام کرده بود و اکنون چتبات گروک میتواند با استفاده از مدل FLUX.1 اقدام به تولید تصویر نماید. استارتاپ مذکور در زمینه ساخت خودکار تصویر و ویدئو تمرکز دارد و به نظر میرسد که اهداف مشترکی را با ایلان ماسک دنبال میکند. برای مثال هردوی آنها بهدنبال مقابله با جنبش ووک (Woke) هستند و به همین دلیل میتوانند رقیب بالقوه برای سرویسهای دارای محدودیتهای اخلاقی یا سیاسی مثل Dall-E و Imagen گوگل محسوب شوند.
استارتاپ Black Forest Labs در کشور آلمان تأسیس شده و اخیراً موفق به کسب ۳۱ میلیون سرمایه شدهاست. از سرمایهگذاران مطرح آن میتوان به مدیرعامل فعلی شرکت Y Combinator و مدیرعامل اسبق Oculus اشاره کرد. همچنین در میان همبنیانگذاران، اسامی پژوهشگران دخیل در توسعه نسخه ابتدایی Stable Diffusion نیز به چشم میخورد.
طبق بررسیهای صورت گرفته از سوی مؤسسه Artificial Analysis، مدل مولد تصویر FLUX.1 از لحاظ کیفی میتواند سرویسهای Midjourney و Dall-E را پشتسر بگذارد. استارتاپ مورد اشاره، ادعا دارد که میخواهد مدل خود را در دسترس طیف وسیعی از کاربران قرار دهد و به همین منظور، کد منبع آن را بهصورت متنباز در گیتهاب و پلتفرم Hugging Face در اختیار علاقهمندان قرار داده است. همچنین گفتهشده که بهزودی مدل تبدیل متن به ویدئوی آن هم توسعه خواهد یافت.
سازنده مدل FLUX.1 هنگام انتشار اولیه آن، عنوان کرده بود که قصد دارد میزان ایمنی این ابزار در ارائه خروجی را افزایش دهد. البته به نظر میرسد که این هدف چندان محقق نشده است؛ زیرا اکنون شبکه اجتماعی ایکس با حجم زیادی از تصاویر مربوط به سیاستمداران و افراد مشهور اشباع شده که توسط کاربران و با استفاده از همین هوش مصنوعی ساختهشدهاند. برای مثال در برخی تصاویر اسلحه و سایر موارد حساس به چشم میخورد؛ درحالیکه سرویسهای رقیب مثل Imagen و Dall-E امکان دریافت چنین خروجی را به کاربران خود نمیدهند. همچنین به نظر میرسد که تصاویر تحت حمایت قانون کپیرایت برای تمرین دادن مدل استارتاپ آلمانی مورد استفاده قرار گرفتهاند؛ مسئلهای که احتمال دارد در آینده برای این شرکت و پلتفرم ایکس مشکلاتی را ایجاد کند.
میتوان گفت که سطح پایین ایمنی یا بهتعبیری دیگر، سانسور و فیلتر اندک روی خروجیها، باعث شدهاست تا ایلان ماسک، مدل توسعهیافته توسط استارتاپ Black Forest Labs را برای چتبات خود انتخاب کند. او در گذشته عنوان کرده بود که افزایش ایمنی مدلهای هوش مصنوعی میتواند در نهایت به کاهش امنیت آنها منتهی شود و از خطر تبدیل هوش مصنوعی به ابزاری برای ترویج ایدههای جنبش ووک، هشدار دادهبود. اکنون باید دید که آیا استفاده از مدل مذکور موجب وارد شدن انتقادهای بیشتر به چتبات گروک خواهد شد یا میتواند مشکلات جدیتری را برای پلتفرم ایکس و ایلان ماسک بهدنبال داشتهباشد.