كشف باحثان أمنيان مؤخراً عن الأسرار والركائز التقنية التي يمكن اعتمادها لتحديد الحسابات المزيفة التي تهدف لزيادة عدد المتابعين.
ونشر الباحثان جوردن رايت Jordan Wright وأولابود أنيس Olabode Anise من شركة Duo Security -المختصة في خدمات التحقق من الهوية تمتلكها شركة Cisco Systems- تدوينة وضّحا فيها كيف استطاعوا اكتشاف 7000 حساب وهمي (بوت Bot) على تويتر لنشر المحتوى آلياً خلال يوم واحد فقط من خلال تحليل البيانات.
وتأتي هذه الخطوة للتغلب على أحد أكبر المشاكل التي تُعاني منها منصة تويتر في الفترة الأخيرة، حيث إن هذه الحسابات الوهمية التي يُطلق عليها بوتات Bots تعمل على توسيع نطاق وصول المحتوى لمستخدمي المنصة بشكل مزيف من خلال زيادة إعادة التغريد والإعجاب، وتستخدم للتأثير على الرأي العام حول مواضيع محددة، أو من أجل زيادة المتابعين للحسابات الفردية.
وقضى الباحثان ثلاثة أشهر في تحليل 88 مليون حساب عام على تويتر وأكثر من نصف مليار تغريدة، حتى يتمكنوا من تحديد حسابات تويتر الوهمية أو ما يُطلق عليه بوتات التضخيم Amplification Bots، وعرضوا المنهجية التي تم اتباعها في مؤتمر بلاك هات 2018 Black Hat الذي أقيم خلال شهر أغسطس الماضي في لاس فيغاس، كما تم نشر النتائج التي توصلوا إليها في ورقة بحثية تحمل عنوان: Don’t @ Me: Hunting Twitter Bots at Scale.
ولمعرفة كيفية قيام تويتر بإنشاء معرفات المستخدم user IDs، جمع الباحثان مجموعة بيانات من 88 مليون ملف شخصي عام على تويتر تتألف من معلومات الحساب القياسية الممثلة في واجهة التطبيقات البرمجية لتويتر مثل: اسم الحساب، وعدد التغريدات، وعدد الحسابات المتابعة له، والحسابات التي يُتابعها، والصورة والوصف.
أنشأ الباحثان قاعدة بيانات تضم 576 مليون تغريدة وقاما بفرزها لتحديد التغريدات التي حصلت على أكثر من 50 إعادة تغريد، وحاولا تحديد ما يمكن اعتباره سلوك طبيعي. ووجد الباحثان إلى أن نصف التغريدات التي تم تحليلها قد تم الإعجاب بها ضعف عدد المرات التي تم إعادة تغريدها (2:1). وحوالي 80% من هذه التغريدات كانت قد حظيت بعدد إعجابات أكثر من إعادة التغريد.
وبناء على ذلك، توصل الباحثان إلى أن التغريدة التي يتم إعادة تغريدها بشكل مزيف سيكون معدل إعادة تغريدها أكبر من عدد الإعجابات التي حصلت عليها، وأحد الأمثلة التي تم إبرازها في تدوينة الباحثان كانت تحتوي على 969 من إعادة التغريد ومما لا يقل عن 164 إعجاب، وهو ما يمثل نسبة 6 من إعادة التغريد لكل إعجاب واحد.
وبناء على هذا التحليل حدد الباحثان نسبة يتم من خلالها الحكم على أي تغريدة أنه قد تم تضخيمها بشكل مزيف، وهي أنه لا بد أن تكون نسبة إعادة التغريد إلى عدد الإعجاب لهذه التغريدة أكبر من 1:5، أي أكثر من 5 مرات من إعادة التغريد مقابل الإعجاب الواحد.
كما يؤكد الباحثان أيضاً أن التوقيت يلعب دوراً مهماً في تحديد الحسابات الوهمية، حيث إن المستخدم الحقيقي تجده يقوم بالتغريد في ترتيب زمني منتظم، ولكن من ناحية أخرى ستجد أن الحساب الوهمي يتخذ نهج غير منظم للنشر.
واعتماداً على هذه القرائن ابتكر الباحثان منهجية لتحديد الحسابات الوهمية أو بوتات التضخيم على تويتر .
الركائز الأساسية لتحديد الحسابات الوهمية
النقطة الأولى: كثرة إعادة تغريد منشورات الحسابات الأخرى، إذا كان أكثر من 90% من مشاركات الحساب هي إعادات تغريد فقط فهذا دليل على أن هذا الحساب وهمي.
النقطة الثانية: تحليل عدد هذه التغريدات التي تم تضخيم الإعجابات وإعادة التغريد لها، فإذا كان نصفهم على الأقل لديه نسبة إعادة تغريد إلى الإعجاب أكبر من 1:5، فهذا دليل آخر على أن هذا الحساب وهمي.
النقطة الثالثة: هي النظر في توقيت التغريدات من أجل حساب عدد التغريدات وهل هي ضمن ترتيب زمني أم لا.
وذكر الباحثان بأن هذه المنهجية مكنتهم من اكتشاف أكثر من 7000 حساب وهمي على تويتر خلال يوم واحد فقط، ولكن في الورقة البحثية يشرح الباحثان كيف أنه من المستحيل تحديد الحسابات الوهمية التي تُستخدم لتضخيم المحتوى من خلال إبداءات الإعجاب، حيث لا توجد نقطة نهاية رسمية لواجهة التطبيقات البرمجية الخاصة بتويتر API لالتقاط الإعجابات وتسجيلها.
وبغض النظر عن ذلك فهذه مشكلة يعمل على حلها كل من الباحثين الأمنيين وتويتر بالتوازي، ولكن ما يهمنا هي بوتات التضخيم التي تبدو للوهلة الأولى غير ضارة، ولكن اتضح لنا مدى الضرر الذي سببته خلال عام 2016 وخاصة خلال الانتخابات الأمريكية حيث تم استخدامها من قبل جهات خارجية لتشكيل الرأي العام.
وكما يشرح الباحثان فإن إعادة التغريد لا تؤثر فقط على كيفية انتشار المحتوى ولكن تؤثر أيضاً على مصداقيته وتأثيره على الوعي، وأنه يتم استخدامها في الاحتيال خلال التسويق عبر الشخصيات المؤثرة على منصات التواصل الاجتماعي Influencer Marketing والذي يُعتقد أنه يكلف قطاع التسويق 100 مليون دولار سنوياً.
ونشر الباحثان جوردن رايت Jordan Wright وأولابود أنيس Olabode Anise من شركة Duo Security -المختصة في خدمات التحقق من الهوية تمتلكها شركة Cisco Systems- تدوينة وضّحا فيها كيف استطاعوا اكتشاف 7000 حساب وهمي (بوت Bot) على تويتر لنشر المحتوى آلياً خلال يوم واحد فقط من خلال تحليل البيانات.
وتأتي هذه الخطوة للتغلب على أحد أكبر المشاكل التي تُعاني منها منصة تويتر في الفترة الأخيرة، حيث إن هذه الحسابات الوهمية التي يُطلق عليها بوتات Bots تعمل على توسيع نطاق وصول المحتوى لمستخدمي المنصة بشكل مزيف من خلال زيادة إعادة التغريد والإعجاب، وتستخدم للتأثير على الرأي العام حول مواضيع محددة، أو من أجل زيادة المتابعين للحسابات الفردية.
وقضى الباحثان ثلاثة أشهر في تحليل 88 مليون حساب عام على تويتر وأكثر من نصف مليار تغريدة، حتى يتمكنوا من تحديد حسابات تويتر الوهمية أو ما يُطلق عليه بوتات التضخيم Amplification Bots، وعرضوا المنهجية التي تم اتباعها في مؤتمر بلاك هات 2018 Black Hat الذي أقيم خلال شهر أغسطس الماضي في لاس فيغاس، كما تم نشر النتائج التي توصلوا إليها في ورقة بحثية تحمل عنوان: Don’t @ Me: Hunting Twitter Bots at Scale.
ولمعرفة كيفية قيام تويتر بإنشاء معرفات المستخدم user IDs، جمع الباحثان مجموعة بيانات من 88 مليون ملف شخصي عام على تويتر تتألف من معلومات الحساب القياسية الممثلة في واجهة التطبيقات البرمجية لتويتر مثل: اسم الحساب، وعدد التغريدات، وعدد الحسابات المتابعة له، والحسابات التي يُتابعها، والصورة والوصف.
أنشأ الباحثان قاعدة بيانات تضم 576 مليون تغريدة وقاما بفرزها لتحديد التغريدات التي حصلت على أكثر من 50 إعادة تغريد، وحاولا تحديد ما يمكن اعتباره سلوك طبيعي. ووجد الباحثان إلى أن نصف التغريدات التي تم تحليلها قد تم الإعجاب بها ضعف عدد المرات التي تم إعادة تغريدها (2:1). وحوالي 80% من هذه التغريدات كانت قد حظيت بعدد إعجابات أكثر من إعادة التغريد.
وبناء على ذلك، توصل الباحثان إلى أن التغريدة التي يتم إعادة تغريدها بشكل مزيف سيكون معدل إعادة تغريدها أكبر من عدد الإعجابات التي حصلت عليها، وأحد الأمثلة التي تم إبرازها في تدوينة الباحثان كانت تحتوي على 969 من إعادة التغريد ومما لا يقل عن 164 إعجاب، وهو ما يمثل نسبة 6 من إعادة التغريد لكل إعجاب واحد.
وبناء على هذا التحليل حدد الباحثان نسبة يتم من خلالها الحكم على أي تغريدة أنه قد تم تضخيمها بشكل مزيف، وهي أنه لا بد أن تكون نسبة إعادة التغريد إلى عدد الإعجاب لهذه التغريدة أكبر من 1:5، أي أكثر من 5 مرات من إعادة التغريد مقابل الإعجاب الواحد.
كما يؤكد الباحثان أيضاً أن التوقيت يلعب دوراً مهماً في تحديد الحسابات الوهمية، حيث إن المستخدم الحقيقي تجده يقوم بالتغريد في ترتيب زمني منتظم، ولكن من ناحية أخرى ستجد أن الحساب الوهمي يتخذ نهج غير منظم للنشر.
واعتماداً على هذه القرائن ابتكر الباحثان منهجية لتحديد الحسابات الوهمية أو بوتات التضخيم على تويتر .
الركائز الأساسية لتحديد الحسابات الوهمية
النقطة الأولى: كثرة إعادة تغريد منشورات الحسابات الأخرى، إذا كان أكثر من 90% من مشاركات الحساب هي إعادات تغريد فقط فهذا دليل على أن هذا الحساب وهمي.
النقطة الثانية: تحليل عدد هذه التغريدات التي تم تضخيم الإعجابات وإعادة التغريد لها، فإذا كان نصفهم على الأقل لديه نسبة إعادة تغريد إلى الإعجاب أكبر من 1:5، فهذا دليل آخر على أن هذا الحساب وهمي.
النقطة الثالثة: هي النظر في توقيت التغريدات من أجل حساب عدد التغريدات وهل هي ضمن ترتيب زمني أم لا.
وذكر الباحثان بأن هذه المنهجية مكنتهم من اكتشاف أكثر من 7000 حساب وهمي على تويتر خلال يوم واحد فقط، ولكن في الورقة البحثية يشرح الباحثان كيف أنه من المستحيل تحديد الحسابات الوهمية التي تُستخدم لتضخيم المحتوى من خلال إبداءات الإعجاب، حيث لا توجد نقطة نهاية رسمية لواجهة التطبيقات البرمجية الخاصة بتويتر API لالتقاط الإعجابات وتسجيلها.
وبغض النظر عن ذلك فهذه مشكلة يعمل على حلها كل من الباحثين الأمنيين وتويتر بالتوازي، ولكن ما يهمنا هي بوتات التضخيم التي تبدو للوهلة الأولى غير ضارة، ولكن اتضح لنا مدى الضرر الذي سببته خلال عام 2016 وخاصة خلال الانتخابات الأمريكية حيث تم استخدامها من قبل جهات خارجية لتشكيل الرأي العام.
وكما يشرح الباحثان فإن إعادة التغريد لا تؤثر فقط على كيفية انتشار المحتوى ولكن تؤثر أيضاً على مصداقيته وتأثيره على الوعي، وأنه يتم استخدامها في الاحتيال خلال التسويق عبر الشخصيات المؤثرة على منصات التواصل الاجتماعي Influencer Marketing والذي يُعتقد أنه يكلف قطاع التسويق 100 مليون دولار سنوياً.