
هالیوود ممکن است در درگیریهای مستمری باشد که به تعارضات مرتبط با هوش مصنوعی مربوط میشود، اما این تکنولوژی مدتها پیش در صنعت فیلم و تلویزیون وارد شده است. در جشنواره SIGGRAPH در لسآنجلس، ابزارهای الگوریتمی و تولیدی در مکالمات و اعلانهای بیشماری به نمایش گذاشته شدند. ممکن است هنوز ندانیم که مانند GPT-4 و Stable Diffusion کجا قرار دارند، اما طرف خلاقیت در تولید آماده است که آنها را پذیرفته و به کار گیرد – اگر بتواند به نحوی انجام شود که هنرمندان را تقویت کند نه جایگزین.
SIGGRAPH (تا کنون برای 50 سال!) کنفرانسی درباره تصویرسازی رایانهای و اثرات تصویری است و موضوعات طبیعتاً در سالهای اخیر بیشتر به یکدیگر همپوشانی پیدا کردهاند.
امسال، مسئله اصلی در پسزمینه این کنفرانس اعتصاب بود و تعداد کمی از ارائهها و مکالمات به آن میپرداختند؛ با این حال، در مهمانیها و رویدادهای شبکهسازی، تقریباً اولین چیزی بود که هر کسی بیان میکرد. با این وجود، SIGGRAPH به طور قاطع یک کنفرانس درباره یکپارچه کردن ذهنهای فنی و خلاقیت است، و احساسی که من داشتم این بود: “بد هست، اما در میانهی این همه، میتوانیم رشته کاریامان را بهبود ببخشیم.”
ترسها درباره هوش مصنوعی در تولید، نه اینکه بگوییم واقعیتی ندارند، اما قطعاً کمی گمراهکننده هستند. هوش مصنوعی تولیدی مانند مدلهای تصویر و متن به طرز چشمگیری بهبود یافتهاند، که به وجود نگرانیهایی منجر شده که احتمال جایگزینی نویسندگان و هنرمندان را دارند. و قطعاً مدیران استودیوها آرزوهای مخرب و غیر واقعی را در مورد جزئی از جایگزینی نویسندگان و بازیگران با ابزارهای هوش مصنوعی مطرح کردهاند. اما هوش مصنوعی مدتهاست در صنعت فیلم و تلویزیون حضور داشته و وظایف مهمی به دست هنرمندان انجام داده است.
من این موضوع را در تعداد زیادی پنل، ارائههای مقالات فنی و مصاحبهها دیدم. البته تاریخچه هوش مصنوعی در اثرات تصویری جالب خواهد بود، اما در حال حاضر برخی از راههایی که هوش مصنوعی در اشکال مختلف خود به عنوان لبه تازه اثرات و کارهای تولیدی به نمایش گذاشته شده است، آورده شده است.
هنرمندان Pixar’s از یادگیری ماشینی (ML) و شبیهسازیها بهرهگرفتند
یکی از مثالهای اولیه این موضوع در دو ارائهی Pixar در مورد تکنیکهای انیمیشن استفاده شده در آخرین فیلم آنها، با عنوان “Elemental” آمده است. شخصیتهای این فیلم به نسبت دیگران بیشتر انتزاعی هستند، و ایجاد یک شخصیت که از آتش، آب یا هوا ساخته شده باشد کاری آسان نیست. تصور کنید که پیچیدگی فراکتال این مواد را به یک بدنی تبدیل کنید که بتواند با وضوح عمل کند و ابراز نماید در حالی که همچنان “واقعی” به نظر آید.
همانطور که انیماتورها و هماهنگکنندگان اثر توضیح میدهند، تولید روندی بود که در اصل به آن اعتماد کردند، شبیهسازی و پارامتری کردن شعلهها، موجها یا بخارهایی که تشکیل دهنده دهها شخصیت بودند. ساخت و انیمیت کردن هر پدیدهی کوچکی از شعله یا ابری که از شخصیتی پخش میشود هیچوقت یک گزینه نبود – این کار بسیار خستهکننده، نیازمند زمان و تخصص فنی بود به جای کار خلاقانه.
اما همانطور که ارائهها روشن کردند، هر چند که برای ایجاد اثرات مورد نظر به شدت به شبیهسازی های پیچیده مواد نیاز داشتند، تیم هنری و روند تولید نزدیک به حدی با سمت مهندسی ترکیب شده بود. (آنها همچنین با پژوهشگران دانشگاه اتریش در این زمینه همکاری میکردند.)
یکی از مثالها به شکلی بود که به ظاهر کلی شخصیت اصلی به نام Ember که از شعلهها ساخته شده است. به اندازهی شبیهسازی شعلهها و تنظیم رنگها یا تنظیم دیالهای مختلف برای تأثیرگذاری بر نتیجه کافی نبود. در نهایت، شعلهها باید ظاهری داشته باشند که هنرمند میخواست، نه فقط شکلی که شعلهها در واقعیت دارند. به این منظور از “انتقال سبک عصبی حجمی” یا NST استفاده کردند؛ انتقال سبک یک تکنیک یادگیری ماشینی است که اغلب با تغییر عکس سلفی به سبک “ادوارد مونک” و موارد مشابه تجربه شده است.
در این مورد، تیم از واکسلهای خام “شبیهسازی پیرو” یا شعلههای تولیدی استفاده کرد و آن را از طریق شبکه انتقال سبکی که بر اساس نمایش یک هنرمند از آنچه که میخواست شکل شعلههای شخصیت به نظر بیاید، عبور دادند: شکلی که بیشتر سبکشده و کمتر شبیهسازی شده باشد. واکسلهای حاصل دارای نگاه طبیعی و پیشبینینشدهای از یک شبیهسازی هستند اما همچنان به نمایی که هنرمند انتخاب کرده، شباهت دارند.
بدیهی است که انیماتورها حساس به ایده هستند که فیلم را فقط با استفاده از هوش مصنوعی ایجاد کردهاند، که این موضوع درست نیست.
“اگر کسی به شما بگوید که Pixar از هوش مصنوعی برای ساخت فیلم Elemental استفاده کرده، اشتباه میکند”،پل کانیوک از Pixar با تأکید در حین ارائه گفت: “ما از انتقال سبک عصبی حجمی برای تغییر لبههای سیلوئت او استفاده کردیم.”
(برای روشنی، NST یک تکنیک یادگیری ماشینی است که به عنوان یک بخش از گستره هوش مصنوعی تشخیص داده میشود، اما نکتهای که کانیوک اشاره کرد این بود که از آن به عنوان یک ابزار برای دستیابی به یک نتیجه هنری استفاده شده است – هیچ چیز به سادگی “با استفاده از هوش مصنوعی ساخته نشده است.”)
بعداً، اعضای دیگر تیمهای انیمیشن و طراحی توضیح دادند که چگونه از ابزارهای روندی، تولیدی یا انتقال سبک برای انجام کارهایی مانند تغییر رنگ مناظر به منظور تطبیق آن با پالت هنرمند یا تابلوی خلق و خوی یا پر کردن بلوکهای شهری با ساختمانهای منحصر به فردی که از “hero” دستکشیده شدهاند، استفاده کردند. موضوع روشن این بود که هوش مصنوعی و ابزارهای مرتبط با آن به منظور خدمت رسانی به اهداف هنرمندان و تسریع فرآیندهای دستی خستهکننده و ارائه تطابق بهتر با نمای مورد نظر وجود داشتند.
هوش مصنوعی گفتگو را تسریع می کند
مارتین برتران، محقق ارشد هوش مصنوعی در DNEG، شرکت VFX و پستولید که به تازگی فیلم بسیار زیبا و جذاب “نیمونا” را انیمیشن کرده است، یادداشتی مشابهی داشت. او توضیح داد که بسیاری از خطوط تولید و اثرات موجود، بسیار نیروی کار میطلبند، به ویژه توسعه نمایی و طراحی محیط. (DNEG همچنین ارائهای به نام “زمانی که روش تولیدی به عملکرد میپیوندد” داشت که به این موضوعات اشاره میکند.)
برتران به من گفت “مردم متوجه نمیشوند که در فرآیند ایجاد مقدار زیادی زمان تلف میشود” او ادامه داد: کار با یک کارگردان برای یافتن نمای درست برای یک تصویر ممکن است هفتهها طول بکشد، در طی این زمان کمبود ارتباط یا برقراری ارتباط نادرست منجر به لغو هفتهها کار میشود. این بسیار ناراحتکننده است، ادامه داد، و هوش مصنوعی یک راه عالی برای شتاب بخشیدن به این فرآیند و فرآیندهای دیگری که هیچکدام به محصولات نهایی نزدیک نیستند، بلکه اکتشافی و کلی هستند، است.
او گفت: “هنرمندان با استفاده از هوش مصنوعی میتوانند “گفتوگو بین خالقان و کارگردانان” را ممکن کنند. جنگل بیگانه، مطمئناً – اما شبیه به این یا شبیه به این؟ یا غار مرموز، شبیه به این یا شبیه به این؟ برای یک داستان که توسط خالقان هدایت میشود و دارای تصاویر پیچیده است مانند “نیمونا”، بازخورد سریع به ویژه مهم است. ضایع کردن یک هفته برای اجرای یک نمایی که کارگردان آن را یک هفته بعد رد میکند، به تأخیر جدی در تولید منجر میشود.
در واقع، سطوح جدیدی از همکاری و تعامل در کارهای خلاقانه اولیه مانند پیشنمایش قبلی به دست آمده است، همانطور که یک ارائه توسط مدیرعامل Sokrispy به نام سام ویکرت توضیح داد. شرکت او مسئول انجام پیشنمایش برای صحنه شیوع در ابتدای مینیسریال HBO به نام “آخرین مردم” بود – یک صحنه پیچیده با دوربین حرفهای، بازیگران بیشمار، حرکات دوربین و اثرات.
اگرچه استفاده از هوش مصنوعی در آن صحنه واقعگرایانهتر محدود بود، اما آسان است ببینید که چگونه بهبود ترکیبی از سنتز صدا، تولید محیط مرجع و ابزارهای دیگر میتواند به این فرآیندی که به سمت فناوری پیش میرود کمک کند.
واندر داینامیکس که در چند ارائه و کنفرانس کلیدی به عنوان مثال دیگری از استفاده از فرآیندهای یادگیری ماشینی در تولید مطرح شد، نمونه دیگری از استفاده از فرآیندهای یادگیری ماشینی در زمینه تولید فیلم کاملاً تحت کنترل هنرمندان وجود دارد. مدلهای پیشرفته تشخیص صحنه و اشیاء تصویری، تصاویر عادی را تجزیه و تحلیل میکنند و فوراً بازیگران انسانی را با مدلهای سهبعدی جایگزین میکنند، یک فرآیندی که قبلاً هفتهها یا ماهها طول میکشید.
اما همانطور که چند ماه پیش به من گفتند، وظایفی که اتوماسیون میشوند وظایف خلاقانه نیستند – این کارهای خستهکننده و تکراری (گاهی اوقات به نام roto) هستند که تقریباً تصمیم خلاقانهای ندارند. “این کار تخریبی در کارهایی که آنها انجام میدهند ایجاد نمیکند؛ بلکه 80-90٪ از کارهای موثر VFX را اتوماتیک میکند و آنها را با کارهای ذهنی ترک میکند”، بنیانگذاران نیکولا تودورویچ در آن زمان گفت. من با او و بنیانگذارش، تای شریدان، بازیگر در SIGGRAPH آشنا شدم و آنها از اینکه نان تست شهر بودند و موفقیت زیادی در صنعت دارند خوشحال بودند. واضح بود که صنعت در جهتی حرکت میکند که آنها سالها پیش در آن شروع کردهاند. (ضمناً، در سپتامبر میتوانید تای شریدان را در صحنه هوش مصنوعی در TechCrunch Disrupt ببینید.)
اما با این حال، هشدارهای نویسندگان و بازیگران در مورد اعتصاب به هیچکدام از طرفداران جامعه VFX رد نمیشود. به واقع، آنها این هشدارها را تکرار میکنند و نگرانیهای آنها مشابه هستند – اگرچه احتمالاً به اندازه انسانیت مهم نیستند. برای یک بازیگر، تشابه یا اجرای او (یا برای نویسنده، خیال و صدای او) معاش و زندگی اوست، و تهدید کامل وقتی است که آن برای اخذ و اتوماتیک شدن به تمامیت تهدید میشود.
برای هنرمندان دیگری که در مراحل دیگر تولید فیلم مشغول به کار هستند، تهدید اتوماسیون نیز واقعی است و همچنین بیشتر یک مشکل مربوط به انسانها از تکنولوژی است. بسیاری از افرادی که با آنها صحبت کردم، با این موافق بودند که تصمیمات بد از سوی رهبران ناشی از عدم آگاهی مشکل واقعی است.
برتران گفت: “هوش مصنوعی به نظر زیبا میآید تا اینجا که ممکن است فرآیند تصمیمگیری خود را به دستگاه منتقل کنید”. و اگر انسانها وظایف خود را به دستگاهها منتقل کنند، اینجاست که اتفاقات ترسناکی رخ میدهد.
اگر هوش مصنوعی بتواند به منظور بهبود یا تسریع فرآیند خلاقانه به کار گرفته شود، مانند کاهش زمان صرف شده در وظایف تکراری یا امکان دهد به خالقان با تیمها یا بودجههای کوچکتر تا به تطابق با همکاران با منابع بهتر برسند، این میتواند تغییرآفرین باشد. اما اگر فرآیند خلاقانه به هوش مصنوعی مختص شود، مسیری که برخی از مدیران به نظر میآید مایل به بررسی آن هستند، آنگاه علی رغم اینکه تکنولوژی از قبل در هالیوود وجود دارد، اعتراضات همچنان ادامه دارند.