وقتی عکس ها به حرف می آیند!

به گزارش مجله کامپیوتر، پژوهشگران آزمایشگاه هوش مصنوعی شرکت سامسونگ در روسیه، سیستمی توسعه داده اند که می تواند تنها از روی تصاویر افراد، مدل صحبت کردن آن ها را شبیه سازی کند.

وقتی عکس ها به حرف می آیند!

به گزارش مجله کامپیوتر و به نقل از سی نت، پیشرفت فناوری خوب است، اما در گاهی موارد ترسناک می گردد؛ چراکه اکنون هوش مصنوعی سامسونگ می تواند تنها از روی تصاویر افراد، مدل صحبت کردن آن ها را شبیه سازی کند؛ برای مثال ممکن است در آینده افراد بتوانند تنها از روی عکس شما در حساب کاربریتان در شبکه های اجتماعی مدل صحبت کردن شما را ببینند.

غول فناوری کره ای اخیراً یک سیستم هوش مصنوعی دیپ فیک (deepfake) جدیدی را توسعه داده است که می تواند تنها با داشتن یک تصویر از افراد، نحوه حرف زدن آنها را شبیه سازی کند.

البته این فناوری آنچنان که فکر می کنید ترسناک هم نیست و می توان به عنوان نوعی سرگرمی هم به آن نگاه کرد؛ چراکه توسط آن می توانید مدل حرف زدن مشاهیر دنیا را نیز شبیه سازی کنید.

برای مثال شاید برای بعضی همواره یک معما بود که مونالیزا چگونه حرف می زد، اما اکنون تنها با وارد کردن پرتره او به این سیستم می توانید این معما را حل کنید. این نرم افزار دیپ فیک نیز همانند فتوشاپ با استفاده از یادگیری ماشین می تواند مدل صحبت کردن افراد را شبیه سازی کند.

آزمایشگاه هوش مصنوعی سامسونگ، سیستم خود را صحبت عصبی واقع گرایانه (realistic neural talking heads) نامید. اصطلاح talking heads اشاره به ژانر ویدئویی دارد که این سیستم می تواند ایجاد کند. کلمه عصبی (neural) نیز به شبکه های عصبی مرتبط است. شبکه های عصبی نوعی سیستم یادگیری ماشین هستند که ساختار مغز انسان را تقلید می نمایند.

به گفته محققان می توان از این سیستم در بازی های ویدئویی و یا فیلم ها استفاده کرد. آن ها افزودند: چنین سیستمی کاربردهایی در فناوری دورحضوری یا حضور از دور (Telepresence) نیز دارد. دورحضوری به فناوری ای گفته می گردد که به فرد اجازه می دهد حضورش را از راه دور در مکانی دیگر احساس کند، گاهی این حضور می تواند به صورت تله رباتیک یا کنفرانس ویدئویی باشد.

از آن جایی که در توسعه این سیستم در ابتدا تعداد زیادی عکس از یک فرد مورد احتیاج بود، بنابراین محققان تصاویر زیادی از افراد مشهور (هنرمندان یا سیاستمداران) را به آن وارد کردند.

جمله معروف قبل از هر چیز دیگر، آمادگی کلید موفقیت استِمبتکر، دانشمند و مخترع تلفن الکساندر گراهام بل الهام بخش سامسونگ برای طراحی این سیستم بوده است. این سیستم با یک مرحله طولانی به نام فرا یادگیری (meta-learning stage) آغاز می نماید و در آن مرحله تعداد زیادی از فیلم ها را تماشا می نماید تا بدانند چهره انسان چگونه هنگام صحبت حرکت می نمایند و پس از آن با داشتن یک یا چند تصویر می تواند مدل صحبت کردن افراد را شبیه سازی کند.

منبع: خبرگزاری ایسنا

به "وقتی عکس ها به حرف می آیند!" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "وقتی عکس ها به حرف می آیند!"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید