اخبار گوناگون

هوش مصنوعی VASA-1 مایکروسافت می تواند تصویر هر کسی را تکان دهد و صحبت کند!

Mona Lisa 800x420 1

مایکروسافت یک ابزار هوش مصنوعی جدید برای همگام سازی لب معرفی کرده است که می تواند یک عکس ثابت از چهره یک شخص را به یک کلیپ انیمیشنی تبدیل کند که در آن صحبت می کند یا آواز می خواند.

قابلیت های VASA-1

همگام سازی لب عالی: VASA-1 نه تنها می تواند حرکات لب را به طور “بی عیب و نقص” با صدا همگام کند، بلکه می تواند “طیف وسیعی” از ظرافت های صورت و حرکات طبیعی سر را نیز ثبت کند که به حس واقعی بودن و زنده بودن می افزاید.

مدل سازی پیشرفته: مایکروسافت از “دینامیک کامل صورت” و یک مدل تولید حرکت سر که در فضای نهان صورت کار می کند استفاده می کند. این شرکت ادعا می کند که این مدل “به طور قابل توجهی از روش های قبلی پیشی می گیرد.”

محدودیت ها و نگرانی ها:

در حال حاضر فقط یک نسخه تحقیقاتی است: VASA در حال حاضر فقط یک نسخه ی نمایشی تحقیقاتی است و هیچ برنامه ای برای انتشار آن به عنوان یک محصول یا ارائه API به دیگران وجود ندارد.

پتانسیل سوء استفاده: VASA می تواند برای ایجاد دیپ فیک های متقاعد کننده استفاده شود، که می تواند برای انتشار اطلاعات نادرست یا آسیب رساندن به شهرت افراد استفاده شود.

تشخیص دشوار: در حال حاضر، ویدیوهای تولید شده توسط VASA هنوز دارای مصنوعات قابل تشخیص هستند، اما با پیشرفت فناوری، تشخیص آنها دشوارتر خواهد شد.

موضع مایکروسافت:

تمرکز بر کاربردهای مثبت: مایکروسافت می گوید که تحقیقات آنها بر روی “ایجاد توانایی های احساسی بصری برای آواتارهای هوش مصنوعی مجازی با هدف کاربردهای مثبت” متمرکز است.

تلاش برای جلوگیری از سوء استفاده: آنها اذعان می کنند که این فناوری می تواند برای ایجاد محتوای گمراه کننده یا فریبنده سوء استفاده شود و متعهد به همکاری با دیگران برای توسعه فناوری های تشخیص جعل هستند.

کلام نهایی:

در حالی که VASA-1 یک فناوری چشمگیر است، نگرانی های اخلاقی قابل توجهی را نیز به همراه دارد. مهم است که از پتانسیل سوء استفاده از این فناوری آگاه باشیم و برای کاهش خطرات آن اقداماتی انجام دهیم.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *