تحول الصورة إلى فيديو.. أداة ذكاء اصطناعي جديدة على «تيك توك»
كشفت شركة «ByteDance»، المالكة لتطبيق «TikTok»، تفاصيل عن استخدامها لـ «OmniHuman-1»، وهو نظام ذكاء اصطناعي يمكنه إنشاء مقاطع فيديو واقعية لأشخاص يتحدثون ويتحركون من صورة واحدة.
ويتفوق OmniHuman بشكل كبير على الأساليب الحالية، إذ ينتج مقاطع فيديو بشرية واقعية للغاية بناءً على مدخلات الإشارة الضعيفة، وخاصة الصوت، كما جاء في ورقة بحثية حول الأداة نُشرت يوم الأحد الماضي، كما أنه يدعم مدخلات الصور بأي نسبة، سواء كانت صور شخصية أو صور لنصف الجسم أو لكامل الجسم، مما يوفر نتائج أكثر واقعية وعالية الجودة عبر سيناريوهات مختلفة.
وفي موقع إلكتروني باسم «OmniHuman-1»، يشارك الباحثون نماذج من مقاطع الفيديو التي تعرض قدرات أداة الذكاء الاصطناعي، إذ توضح الأمثلة حركات اليد والجسم من زوايا متعددة، وشخصيات متحركة وحيوانات وشخصيات تاريخية تم إعادتها إلى الحياة.
وفي أحد المقاطع التي تم نشرها ضمن النماذج، وكانت باللون الأبيض والأسود ظهر عالم الفيزياء الشهير ألبرت أينشتاين، وهو يتحدث أمام السبورة، ويتخلل كلماته بإيماءات اليد وتعبيرات الوجه الدقيقة، إذ جعل هذا المقطع من يشاهده يعود بالزمن للوراء كأنه يُشاهد عالم الفيزياء النظرية الشهير وهو يلقي محاضرة جامعية، إذ أن اللقطات تبدو وكأنها تم تصويرها حديثًا.
على الجانب الآخر، ترى سامانثا جي وولف، الأستاذة المساعدة في كلية شتاينهارت للثقافة والتعليم والتنمية البشرية بجامعة نيويورك ومؤسسة PitchFWD، وهي شركة استشارية لتسويق التكنولوجيا الناشئة، أن هناك مخاطر محتملة في أدوات مثل «OmniHuman»، قائلة إن إنشاء شيء من مجرد صورة وجعله يبدو وكأنه يتحدث ويتحرك حقًا هو أمر رائع من وجهة نظر تكنولوجية، ولكن يمكن أن يكون له الكثير من العواقب السلبية المحتملة أيضًا.
وأضافت: «عندما يبدأ الأمر في أن يبدو أكثر فأكثر مثل الواقع، وأكثر فأكثر مثل البشر الذين يفعلون ذلك بالفعل، فإن احتمال تصديق الناس له يصبح أكبر بكثير».