أعلنت شركة Reddit عن خطوة جديدة تهدف إلى الحد من وصول الأرشيف الرقمي الشهير "Internet Archive" إلى محتواها بعد اكتشافها أن شركات الذكاء الاصطناعي تقوم بجمع بيانات من خلال أداة "Wayback Machine" التابعة للأرشيف، والتي تحفظ نسخًا من صفحات الإنترنت عبر الزمن.

القرار الجديد سيؤدي إلى منع الأرشيف من أرشفة معظم صفحات Reddit التفصيلية مثل المشاركات والتعليقات وملفات المستخدمين بحيث يقتصر الأرشيف على أرشفة الصفحة الرئيسية فقط، مما يعني أن المحتوى المتاح عبر الأرشيف سيكون محدودًا للغاية.

الأسباب وراء هذا القرار

صرح المتحدث باسم Reddit تيم راثشميدت بأن الأرشيف الرقمي يقدم خدمة هامة للويب المفتوح، لكنهم اكتشفوا حالات لانتهاك سياسات المنصة من قبل شركات الذكاء الاصطناعي التي تستخدم البيانات المجمعة من "Wayback Machine" بطريقة مخالفة لا تحترم خصوصية المستخدمين ولا تحذف المحتوى الذي تم حذفه من الموقع، لذلك قررت Reddit حماية مستخدميها من خلال تقليص وصول الأرشيف إلى بياناتها.

الحدود الجديدة ستبدأ بالتطبيق التدريجي اعتبارًا من تاريخ الإعلان، وقد أخبر Reddit فريق الأرشيف مسبقًا بقرارها لضمان التنسيق وتقليل المفاجآت.

سياق الأزمة وأثرها على منصات الإنترنت

تأتي هذه الخطوة في ظل تصاعد النزاعات بين منصات الإنترنت الكبرى وشركات الذكاء الاصطناعي، حيث أصبحت الأخيرة تعتمد بشكل مكثف على جمع كميات ضخمة من البيانات من المواقع المختلفة لتدريب نماذجها، مما أثار مخاوف بشأن حقوق النشر وخصوصية المستخدمين، و Reddit نفسها قد اتخذت إجراءات مشابهة في السابق حيث أبرمت اتفاقيات مدفوعة مع بعض الشركات الكبرى مثل جوجل وأوبن إيه آي للسماح باستخدام بياناتها،

بينما منعت الوصول المجاني للبيانات من محركات البحث وأدوات الجمع الأخرى.

وفي سياق متصل رفعت Reddit دعوى قضائية ضد شركة Anthropic بسبب استمرارها في جمع البيانات من Reddit رغم تأكيدها توقفها عن ذلك، مما يعكس التشدد المتزايد في حماية المحتوى.

رد فعل Internet Archive

من جهته، أوضح مارك جراهام مدير مشروع Wayback Machine أن الأرشيف يحتفظ بعلاقة طويلة الأمد مع Reddit ويجري حاليًا مناقشات مستمرة معهم بشأن هذه المسألة في محاولة لإيجاد حلول توازن بين الحفاظ على المحتوى وحماية خصوصية المستخدمين.