قبل عامين، انتشر التلاعب المعمّق وأثار ضجّة ومخاوف واسعة بين الشبكات الاجتماعيّة، حين طُلب منها أن تتحرك بسرعة كي تقوم بكبحه. ويستخدم التلاعب المعمق، أي deepfake، الذكاء الاصطناعي لإنشاء مقاطع فيديو مفبركة لأشخاص يفعلون أو يقولون أشياء لم يفعلوها أو يتفوهوا بها، وهو أثار مخاوف كبيرة قبل الانتخابات الرئاسيّة الأميركيّة العام الماضي، حيث واجهت الشركات ضغوطا واسعة لكبح التزييف. لكنّ هذا النوع من التزييف لم يعد المصيبة الكبرى التي تعاني منها الشبكات. ففي ظلّ استهداف الولايات المتحدة الأميركية بهجمات فدية وقرصنة تطاول العديد من الشركات وتعتبر خطراً على الأمن القومي، ظهر نوعٌ جديد من التزييف، بنفس الاسم، يستهدف استنساخ الأصوات. وأصبحت تقنية استنساخ الصوت أكثر فاعلية وتقدماً، وقد لا تميز الأذن بين الصوت الأصلي والصوت المصنوع، هذا جعلها ذات أهمية أكبر بالنسبة لمجرمي الإنترنت. ويحدث استنساخ الصوت عندما يتم استخدام برنامج كمبيوتر لإنشاء نسخة تركيبية قابلة للتكييف من صوت الشخص.
قدرات وتطبيقات كبرى
من خلال تسجيل شخص يتحدث، يكون البرنامج قادراً على تكرار صوته أو نطقه بأي كلمات أو جمل تُكتب على لوحة مفاتيح. ولا يلتقط البرنامج اللهجة فقط، بل كذلك طابع الصوت وطبقته ووتيرة تدفق الكلام والتنفس.
ويمكن تعديل الصوت المستنسخ لتصوير أي عاطفة مطلوبة، مثل الغضب أو الخوف أو السعادة أو الحب أو الملل. ويمكن أيضاً استخدام استنساخ الصوت لترجمة الكلمات إلى لغات مختلفة، مما يعني، على سبيل المثال، أن شركات إنتاج الأفلام الأميركية لن تحتاج بعد الآن إلى توظيف ممثلين إضافيين لعمل نسخ مُدبلجة من أفلامها لتوزيعها في الخارج.
"التزييف المعمَّق" بات يطاول الأصوات بعد الفيديوهات
وتقول شركة Resemble AI الكندية إنها تستطيع الآن تحويل الأصوات الإنكليزية المستنسخة إلى 15 لغة أخرى. ويقول رئيسها التنفيذي، زهيب أحمد، إن إنشاء نسخة عالية الجودة من صوت شخص ما يحتاج إلى تسجيل شخص يتحدث لمدة لا تزيد عن 10 دقائق.
جرائم إلكترونية
هذا التطور في استنساخ الصوت أدى أيضاً إلى مخاوف متزايدة من إمكانية استخدامه في الجرائم الإلكترونية والخداع. فإلى جانب مقاطع الفيديو المزيفة التي يتم إنشاؤها بواسطة الكمبيوتر، يُطلق على استنساخ الصوت أيضاً اسم "التزييف العميق".
ويقول خبير الأمن السيبراني، إيدي بوبريتسكي، لـ"بي بي سي"، إن هناك "خطراً أمنياً كبيراً" يأتي مع الأصوات الاصطناعية. ويتابع أنه "عندما يتعلق الأمر بالبريد الإلكتروني أو الرسائل النصية، فمن المعروف منذ سنوات أنه من السهل جداً انتحال شخصية الآخرين"، "ولكن حتى الآن، كان التحدث عبر الهاتف مع شخص تثق به وتعرفه جيداً أحد أكثر الطرق شيوعاً للتأكد من أنك تعرف هذا الشخص بالفعل".
ويقول بوبريتسكي على سبيل المثال "إذا اتصل المدير بموظف يطلب معلومات حساسة، وتعرف الموظف على صوت، فإن الرد الفوري هو أن يفعل ما هو مطلوب. إنه طريق الكثير من الجرائم الإلكترونية".
وسبق أن غطّت صحيفة "وول ستريت جورنال" مثل هذه الحالة عام 2019، حين قيل إن مديراً بريطانياً تعرض للخداع لتحويل مبلغ 220 ألف يورو (260 ألف دولار) إلى محتالين استخدموا نسخة مستنسخة من صوت رئيسه الألماني. ويضيف بوبريتسكي: "يجب اتخاذ خطوات للتعامل مع هذه التكنولوجيا الجديدة والتهديدات التي تجلبها معها".