إن شبكة الإنترنت مليئة بمجهولي الهوية: المستخدمون الذين يختبئون وراء أسماء مستعارة ــ لأسباب وجيهة في بعض الأحيان، مثل التحدث بحرية، وأحياناً لارتكاب أفعال قذرة. ولكن يبدو أن عصر الخصوصية على الإنترنت قد وصل إلى نهايته. يُظهر الاختبار أن نماذج اللغات الكبيرة (LLMs) قادرة على تحديد أصحاب هذه الحسابات بشكل جماعي.

لسنوات عديدة، كان هناك رأي مفاده أنه على الرغم من أن إلغاء إخفاء الهوية ممكن من الناحية النظرية، إلا أنه في الواقع يستغرق وقتًا طويلاً ومعقدًا ومكلفًا. يدعي مؤلفو الدراسة، المنشورة في نسخة أولية على arXiv، أن LLM أصبحت قوية بما يكفي لتكليفهم بهذا العمل. ولاختبار فرضيتهم، قام الفريق بتطوير نظام آلي يحاكي عملية اتخاذ القرار للباحث.
البحث عن أشخاص مجهولين
سيقوم الذكاء الاصطناعي أولاً بتحليل سجل نشر المستخدم على Reddit أو Hacker News من خلال فحص النص غير المنظم. هذه معلومات أولية وغير منظمة: تعليقات، ونكات، وإشارات إلى التعليم، وتفاصيل أسلوب الكتابة. ثم يقوم بتحويل هذه البيانات الدقيقة إلى تمثيل رياضي للملف الشخصي للشخص للعثور على التطابقات المحتملة بين ملايين الملفات الشخصية الأخرى – سواء على شبكة الإنترنت العامة أو على المواقع الفردية مثل LinkedIn.
عندما يجد الذكاء الاصطناعي تطابقات، فإنه يزن الأدلة التي تشير إلى أن كلا الملفين الشخصيين ينتميان إلى نفس الشخص. يقوم النموذج بعد ذلك بتعيين درجة الثقة لتوقعاته. إذا لم تكن متأكدة من النتيجة، فإنها لن تتخلى عن أي شيء. يساعد هذا على التأكد من أن النظام لا يقوم بتخمينات عشوائية.
اختبر الباحثون نظامهم على ما يقرب من 1000 ملف شخصي على موقع LinkedIn لمعرفة ما إذا كان بإمكانه مطابقتها مع حسابات Hacker News. للاختبار، تم اختيار الملفات الشخصية التي لها علاقات بأشخاص حقيقيين معروفين للمجموعة؛ قبل بدء التجربة، تمت إزالة أسمائهم وانتماءاتهم وغيرها من المعلومات التعريفية الواضحة من ملفاتهم الشخصية.
المباراة كانت ناجحة
نجح النظام المدعوم بالذكاء الاصطناعي في ربط الحسابات بدقة 67% ومستوى ثقة 90%. أي أنه عندما يكون لدى النموذج ثقة بنسبة 90% أو أكثر في إجاباته، فإن معدل دقة تنبؤاته يبلغ 67%. إن أفضل الممارسات التي لا تستخدم الذكاء الاصطناعي في مثل هذه المهام لن تؤدي إلى أي نتائج.
يمكن للذكاء الاصطناعي أيضًا ربط الأشخاص عبر مجتمعات Reddit المختلفة، حتى لو قام المستخدمون بنشر نشاطهم عبر حسابات وفترات زمنية مختلفة. ويقدر الباحثون أن تحديد المستخدمين أمر غير مكلف: ما بين 1 إلى 4 دولارات من قوة الحوسبة لكل حساب تم إلغاء إخفاء هويته بنجاح.
ويلخص مؤلفو الدراسة أن “التخفي العملي، الذي كان يحمي المستخدمين بأسماء مستعارة لفترة طويلة… لم يعد فعالاً”. “يجب على المستخدمين الذين ينشرون تحت الإدارة الدائمة أن يفترضوا أن المهاجمين يمكنهم ربط حساباتهم بأشخاص حقيقيين أو ببعضهم البعض، ويزداد احتمال ذلك مع كل جزء من البيانات الجزئية التي ينشرونها.”
وأظهرت النتائج أنه مع مزيد من التطوير، يمكن تطبيق هذا النظام في العديد من المجالات، مثل تطبيق القانون والأمن السيبراني.