هوش مصنوعی و رباتیک, اخبار گوناگون, اخبار و مقالات, رسانه و سرگرمی

هنرمندان VFX نشان می‌دهند که هالیوود می‌تواند از هوش مصنوعی برای خلق استفاده کند، نه بهره‌برداری

ارسال شده توسط ستایش

هالیوود ممکن است در درگیری‌های مستمری باشد که به تعارضات مرتبط با هوش مصنوعی مربوط می‌شود، اما این تکنولوژی مدت‌ها پیش در صنعت فیلم و تلویزیون وارد شده است. در جشنواره SIGGRAPH در لس‌آنجلس، ابزارهای الگوریتمی و تولیدی در مکالمات و اعلان‌های بی‌شماری به نمایش گذاشته شدند. ممکن است هنوز ندانیم که مانند GPT-4 و Stable Diffusion کجا قرار دارند، اما طرف خلاقیت در تولید آماده است که آن‌ها را پذیرفته و به کار گیرد – اگر بتواند به نحوی انجام شود که هنرمندان را تقویت کند نه جایگزین.

SIGGRAPH (تا کنون برای 50 سال!) کنفرانسی درباره تصویرسازی رایانه‌ای و اثرات تصویری است و موضوعات طبیعتاً در سال‌های اخیر بیشتر به یکدیگر همپوشانی پیدا کرده‌اند.

امسال، مسئله اصلی در پس‌زمینه این کنفرانس اعتصاب بود و تعداد کمی از ارائه‌ها و مکالمات به آن می‌پرداختند؛ با این حال، در مهمانی‌ها و رویدادهای شبکه‌سازی، تقریباً اولین چیزی بود که هر کسی بیان می‌کرد. با این وجود، SIGGRAPH به طور قاطع یک کنفرانس درباره یکپارچه کردن ذهن‌های فنی و خلاقیت است، و احساسی که من داشتم این بود: “بد هست، اما در میانه‌ی این همه، می‌توانیم رشته کاری‌امان را بهبود ببخشیم.”

ترس‌ها درباره هوش مصنوعی در تولید، نه اینکه بگوییم واقعیتی ندارند، اما قطعاً کمی گمراه‌کننده هستند. هوش مصنوعی تولیدی مانند مدل‌های تصویر و متن به طرز چشم‌گیری بهبود یافته‌اند، که به وجود نگرانی‌هایی منجر شده که احتمال جایگزینی نویسندگان و هنرمندان را دارند. و قطعاً مدیران استودیوها آرزوهای مخرب و غیر واقعی را در مورد جزئی از جایگزینی نویسندگان و بازیگران با ابزارهای هوش مصنوعی مطرح کرده‌اند. اما هوش مصنوعی مدت‌هاست در صنعت فیلم و تلویزیون حضور داشته و وظایف مهمی به دست هنرمندان انجام داده است.

من این موضوع را در تعداد زیادی پنل، ارائه‌های مقالات فنی و مصاحبه‌ها دیدم. البته تاریخچه هوش مصنوعی در اثرات تصویری جالب خواهد بود، اما در حال حاضر برخی از راه‌هایی که هوش مصنوعی در اشکال مختلف خود به عنوان لبه تازه اثرات و کارهای تولیدی به نمایش گذاشته شده است، آورده شده است.

هنرمندان Pixar’s از یادگیری ماشینی (ML) و شبیه‌سازی‌ها بهره‌گرفتند

یکی از مثال‌های اولیه این موضوع در دو ارائه‌ی Pixar در مورد تکنیک‌های انیمیشن استفاده شده در آخرین فیلم آن‌ها، با عنوان “Elemental” آمده است. شخصیت‌های این فیلم به نسبت دیگران بیشتر انتزاعی هستند، و ایجاد یک شخصیت که از آتش، آب یا هوا ساخته شده باشد کاری آسان نیست. تصور کنید که پیچیدگی فراکتال این مواد را به یک بدنی تبدیل کنید که بتواند با وضوح عمل کند و ابراز نماید در حالی که همچنان “واقعی” به نظر آید.

همانطور که انیماتورها و هماهنگ‌کنندگان اثر توضیح می‌دهند، تولید روندی بود که در اصل به آن اعتماد کردند، شبیه‌سازی و پارامتری کردن شعله‌ها، موج‌ها یا بخارهایی که تشکیل دهنده ده‌ها شخصیت بودند. ساخت و انیمیت کردن هر پدیده‌ی کوچکی از شعله یا ابری که از شخصیتی پخش می‌شود هیچ‌وقت یک گزینه نبود – این کار بسیار خسته‌کننده، نیازمند زمان و تخصص فنی بود به جای کار خلاقانه.

اما همانطور که ارائه‌ها روشن کردند، هر چند که برای ایجاد اثرات مورد نظر به شدت به شبیه‌سازی های پیچیده مواد نیاز داشتند، تیم هنری و روند تولید نزدیک به حدی با سمت مهندسی ترکیب شده بود. (آن‌ها همچنین با پژوهشگران دانشگاه اتریش در این زمینه همکاری می‌کردند.)

یکی از مثال‌ها به شکلی بود که به ظاهر کلی شخصیت اصلی به نام Ember که از شعله‌ها ساخته شده است. به اندازه‌ی شبیه‌سازی شعله‌ها و تنظیم رنگ‌ها یا تنظیم دیال‌های مختلف برای تأثیرگذاری بر نتیجه کافی نبود. در نهایت، شعله‌ها باید ظاهری داشته باشند که هنرمند می‌خواست، نه فقط شکلی که شعله‌ها در واقعیت دارند. به این منظور از “انتقال سبک عصبی حجمی” یا NST استفاده کردند؛ انتقال سبک یک تکنیک یادگیری ماشینی است که اغلب با تغییر عکس سلفی به سبک “ادوارد مونک” و موارد مشابه تجربه شده است.

در این مورد، تیم از واکسل‌های خام “شبیه‌سازی پیرو” یا شعله‌های تولیدی استفاده کرد و آن را از طریق شبکه انتقال سبکی که بر اساس نمایش یک هنرمند از آنچه که می‌خواست شکل شعله‌های شخصیت به نظر بیاید، عبور دادند: شکلی که بیشتر سبک‌شده و کمتر شبیه‌سازی شده باشد. واکسل‌های حاصل دارای نگاه طبیعی و پیش‌بینی‌نشده‌ای از یک شبیه‌سازی هستند اما همچنان به نمایی که هنرمند انتخاب کرده، شباهت دارند.

بدیهی است که انیماتورها حساس به ایده هستند که فیلم را فقط با استفاده از هوش مصنوعی ایجاد کرده‌اند، که این موضوع درست نیست.

“اگر کسی به شما بگوید که Pixar از هوش مصنوعی برای ساخت فیلم Elemental استفاده کرده، اشتباه می‌کند”،پل کانیوک از Pixar با تأکید در حین ارائه گفت: “ما از انتقال سبک عصبی حجمی برای تغییر لبه‌های سیلوئت او استفاده کردیم.”

(برای روشنی، NST یک تکنیک یادگیری ماشینی است که به عنوان یک بخش از گستره هوش مصنوعی تشخیص داده می‌شود، اما نکته‌ای که کانیوک اشاره کرد این بود که از آن به عنوان یک ابزار برای دستیابی به یک نتیجه هنری استفاده شده است – هیچ چیز به سادگی “با استفاده از هوش مصنوعی ساخته نشده است.”)

بعداً، اعضای دیگر تیم‌های انیمیشن و طراحی توضیح دادند که چگونه از ابزارهای روندی، تولیدی یا انتقال سبک برای انجام کارهایی مانند تغییر رنگ مناظر به منظور تطبیق آن با پالت هنرمند یا تابلوی خلق و خوی یا پر کردن بلوک‌های شهری با ساختمان‌های منحصر به فردی که از “hero” دست‌کشیده شده‌اند، استفاده کردند. موضوع روشن این بود که هوش مصنوعی و ابزارهای مرتبط با آن به منظور خدمت رسانی به اهداف هنرمندان و تسریع فرآیندهای دستی خسته‌کننده و ارائه تطابق بهتر با نمای مورد نظر وجود داشتند.

هوش مصنوعی گفتگو را تسریع می کند

مارتین برتران، محقق ارشد هوش مصنوعی در DNEG، شرکت VFX و پس‌تولید که به تازگی فیلم بسیار زیبا و جذاب “نیمونا” را انیمیشن کرده است، یادداشتی مشابهی داشت. او توضیح داد که بسیاری از خطوط تولید و اثرات موجود، بسیار نیروی کار می‌طلبند، به ویژه توسعه نمایی و طراحی محیط. (DNEG همچنین ارائه‌ای به نام “زمانی که روش تولیدی به عملکرد می‌پیوندد” داشت که به این موضوعات اشاره می‌کند.)

برتران به من گفت “مردم متوجه نمی‌شوند که در فرآیند ایجاد مقدار زیادی زمان تلف می‌شود” او ادامه داد: کار با یک کارگردان برای یافتن نمای درست برای یک تصویر ممکن است هفته‌ها طول بکشد، در طی این زمان کمبود ارتباط یا برقراری ارتباط نادرست منجر به لغو هفته‌ها کار می‌شود. این بسیار ناراحت‌کننده است، ادامه داد، و هوش مصنوعی یک راه عالی برای شتاب بخشیدن به این فرآیند و فرآیندهای دیگری که هیچ‌کدام به محصولات نهایی نزدیک نیستند، بلکه اکتشافی و کلی هستند، است.

او گفت: “هنرمندان با استفاده از هوش مصنوعی می‌توانند “گفت‌وگو بین خالقان و کارگردانان” را ممکن کنند. جنگل بیگانه، مطمئناً – اما شبیه به این یا شبیه به این؟ یا غار مرموز، شبیه به این یا شبیه به این؟ برای یک داستان که توسط خالقان هدایت می‌شود و دارای تصاویر پیچیده است مانند “نیمونا”، بازخورد سریع به ویژه مهم است. ضایع کردن یک هفته برای اجرای یک نمایی که کارگردان آن را یک هفته بعد رد می‌کند، به تأخیر جدی در تولید منجر می‌شود.

در واقع، سطوح جدیدی از همکاری و تعامل در کارهای خلاقانه اولیه مانند پیش‌نمایش قبلی به دست آمده است، همانطور که یک ارائه توسط مدیرعامل Sokrispy به نام سام ویکرت توضیح داد. شرکت او مسئول انجام پیش‌نمایش برای صحنه شیوع در ابتدای مینی‌سریال HBO به نام “آخرین مردم” بود – یک صحنه پیچیده با دوربین حرفه‌ای، بازیگران بی‌شمار، حرکات دوربین و اثرات.

اگرچه استفاده از هوش مصنوعی در آن صحنه واقع‌گرایانه‌تر محدود بود، اما آسان است ببینید که چگونه بهبود ترکیبی از سنتز صدا، تولید محیط مرجع و ابزارهای دیگر می‌تواند به این فرآیندی که به سمت فناوری پیش می‌رود کمک کند.

واندر داینامیکس که در چند ارائه و کنفرانس کلیدی به عنوان مثال دیگری از استفاده از فرآیندهای یادگیری ماشینی در تولید مطرح شد، نمونه دیگری از استفاده از فرآیندهای یادگیری ماشینی در زمینه تولید فیلم کاملاً تحت کنترل هنرمندان وجود دارد. مدل‌های پیشرفته تشخیص صحنه و اشیاء تصویری، تصاویر عادی را تجزیه و تحلیل می‌کنند و فوراً بازیگران انسانی را با مدل‌های سه‌بعدی جایگزین می‌کنند، یک فرآیندی که قبلاً هفته‌ها یا ماه‌ها طول می‌کشید.

اما همانطور که چند ماه پیش به من گفتند، وظایفی که اتوماسیون می‌شوند وظایف خلاقانه نیستند – این کارهای خسته‌کننده و تکراری (گاهی اوقات به نام roto) هستند که تقریباً تصمیم خلاقانه‌ای ندارند. “این کار تخریبی در کارهایی که آن‌ها انجام می‌دهند ایجاد نمی‌کند؛ بلکه 80-90٪ از کارهای موثر VFX را اتوماتیک می‌کند و آن‌ها را با کارهای ذهنی ترک می‌کند”، بنیانگذاران نیکولا تودورویچ در آن زمان گفت. من با او و بنیانگذارش، تای شریدان، بازیگر در SIGGRAPH آشنا شدم و آنها از اینکه نان تست شهر بودند و موفقیت زیادی در صنعت دارند خوشحال بودند. واضح بود که صنعت در جهتی حرکت می‌کند که آن‌ها سال‌ها پیش در آن شروع کرده‌اند. (ضمناً، در سپتامبر می‌توانید تای شریدان را در صحنه هوش مصنوعی در TechCrunch Disrupt ببینید.)

اما با این حال، هشدارهای نویسندگان و بازیگران در مورد اعتصاب به هیچ‌کدام از طرفداران جامعه VFX رد نمی‌شود. به واقع، آن‌ها این هشدارها را تکرار می‌کنند و نگرانی‌های آن‌ها مشابه هستند – اگرچه احتمالاً به اندازه انسانیت مهم نیستند. برای یک بازیگر، تشابه یا اجرای او (یا برای نویسنده، خیال و صدای او) معاش و زندگی اوست، و تهدید کامل وقتی است که آن برای اخذ و اتوماتیک شدن به تمامیت تهدید می‌شود.

برای هنرمندان دیگری که در مراحل دیگر تولید فیلم مشغول به کار هستند، تهدید اتوماسیون نیز واقعی است و همچنین بیشتر یک مشکل مربوط به انسان‌ها از تکنولوژی است. بسیاری از افرادی که با آن‌ها صحبت کردم، با این موافق بودند که تصمیمات بد از سوی رهبران ناشی از عدم آگاهی مشکل واقعی است.

برتران گفت: “هوش مصنوعی به نظر زیبا می‌آید تا این‌جا که ممکن است فرآیند تصمیم‌گیری خود را به دستگاه منتقل کنید”. و اگر انسان‌ها وظایف خود را به دستگاه‌ها منتقل کنند، اینجاست که اتفاقات ترسناکی رخ می‌دهد.

اگر هوش مصنوعی بتواند به منظور بهبود یا تسریع فرآیند خلاقانه به کار گرفته شود، مانند کاهش زمان صرف شده در وظایف تکراری یا امکان دهد به خالقان با تیم‌ها یا بودجه‌های کوچک‌تر تا به تطابق با همکاران با منابع بهتر برسند، این می‌تواند تغییرآفرین باشد. اما اگر فرآیند خلاقانه به هوش مصنوعی مختص شود، مسیری که برخی از مدیران به نظر می‌آید مایل به بررسی آن هستند، آنگاه علی رغم اینکه تکنولوژی از قبل در هالیوود وجود دارد، اعتراضات همچنان ادامه دارند.

وبلاگ

هنرمندان Pixar’s از یادگیری ماشینی (ML) و شبیه‌سازی‌ها بهره‌گرفتند

هوش مصنوعی گفتگو را تسریع می کند

دیدگاهتان را بنویسید لغو پاسخ