يقول خبير سيمالت كيف تم تقنين تجريف بيانات الويب مع حكم قضائي

في حين أنه قد يكون من غير القانوني استخراج البيانات من مواقع الويب دون إذن صريح من مالكي الموقع ، فقد حكم قاضي بخلاف ذلك في ظل ظروف معينة. قامت hiQ Labs مؤخرًا برفع دعوى قضائية ضد LinkedIn لمنعها من استخراج البيانات من صفحات LinkedIn.

لقد كانت صدمة وقحة لمعظم الناس أنه تم إخبار LinkedIn بمنح الشركات الناشئة إمكانية الوصول المجاني إلى صفحات الويب الخاصة بها. استخدمت hiQ خوارزمياتها للكشف عن الوقت الذي يبحث فيه مستخدم LinkedIn عن وظيفة بناءً على التغييرات التي يجريها المستخدم على ملفه الشخصي العام.

تعمل الخوارزميات على البيانات المستخرجة من صفحات الويب على LinkedIn. كما هو متوقع ، لم يعجب LinkedIn بذلك وتم وضع إجراءات مضادة لمنع hiQ من استخراج المزيد من البيانات. بصرف النظر عن الحواجز التقنية التي تم وضعها ، تم إصدار تحذيرات قانونية شديدة اللهجة أيضًا.

لم يكن أمام الشركة الناشئة خيار سوى تناول القضية بشكل قانوني. كان على hiQ التماس الإنصاف القانوني. طلبت الشركة من LinkedIn إزالة الحواجز التقنية. كما أرادت hiQ تقنين عملية استخراج البيانات على LinkedIn.

لحسن الحظ بالنسبة للشركات الناشئة ، حصلت على ما تريد. وكان الحكم لصالح hiQ. تم أمر LinkedIn بإزالة جميع الإجراءات المضادة التي تعوق hiQ من إلغاء صفحات الويب (LinkedIn) الخاصة بها وإعطاء hiQ الحرية مجانًا حيث أن القانون قانوني تمامًا. ألقى القاضي حكمه على حقيقة أن hiQ تريد أن تتخلص من البيانات التي تم عرضها للعامة.

لم يأمر القاضي المدعى عليه فقط بإزالة جميع الآليات الوقائية الموضوعة ضد hiQ ، ولكنه أمر أيضًا بأن يكف المدعى عليه عن مثل هذه الأفعال في المستقبل.

الترويج لبيانات الويب المفتوحة

في حين أن القرار لا يزال أمرًا مؤقتًا ، فمن المؤسف أن نسمع أن القانون يدعم بيانات الويب المفتوحة والوصول المجاني إلى المعلومات على الإنترنت كما يؤكد هذا الحكم ذلك. حتى إذا كان القرار النهائي لصالح المدعى عليه ، فقد تم بالفعل إثبات هذه الحقيقة.

قام القاضي بترويج هذه السياسة من خلال إغلاق جميع حجج LinkedIn تقريبًا. بينما حاولت LinkedIn إثبات أن المدعي ينتهك خصوصيته ، عارضها القاضي بحقيقة أن المدعى عليه يبيع أيضًا البيانات.

عندما لم تحتج الحجة بالماء ، ذكر المدعى عليه أيضًا أن فعل hiQ كان في انتهاك جسيم لقانون الاحتيال وإساءة استخدام الكمبيوتر (CFAA) لأن الشركة الناشئة دخلت إلى خوادمها لجمع البيانات بشكل غير قانوني. مرة أخرى ، تم ثقب الجدل. تم رفضه على أساس أن hiQ كانت تتخلص من المحتوى فقط على الصفحات العامة غير المحمية.

وقارن القاضي القضية على أنها شخص يسير في متجر مفتوح خلال ساعات العمل. مثل هذا الشخص لا يمكن أن يقال إنه تجاوز. لذلك ، لم يكن hiQ التعدي على ممتلكات الغير. ومن المثير للاهتمام أن القاضي ذهب إلى أبعد من ذلك لشرح سبب كون حكمه يخدم المصلحة العامة.

باختصار ، قبلت المحكمة أنه من المصلحة العامة السماح بالزحف إلى البيانات واستخراجها وتحليلها. لذلك ، ستكون سياسة ضارة لتشجيع وضع الحواجز أمام التدفق الحر للمعلومات.

ما يجب أن تتعلمه من الحكم

بينما قد لا يكون لديك أسباب لاستخراج البيانات مباشرة من LinkedIn ، يجب عليك أن تتعلم من الحكم. من الأفضل أن تلعب بأمان من خلال قراءة واحترام ملف robots.txt لجميع مواقع الويب. تذكر ، أن الحكم لا يزال أمرًا مؤقتًا. يمكن أن يكون في النهاية لصالح LinkedIn.

في حين أن القرار قد لا يؤثر عليك بشكل مباشر ، إلا أنه من دواعي السرور أن المحكمة الفيدرالية تتمسك بسياسة إبقاء الويب مفتوحًا للجمهور. لذا ، يجب أن تكون المعلومات متاحة ومتاحة لمن يمكنهم البحث عنها والاستفادة منها.

بيانات الويب مفيدة للغاية للجميع ، وخاصة محللي الوسائط والمطورين وعلماء البيانات وبعض المهنيين الآخرين. على هذا النحو ، فإن الحكم هو تطور مرحب به.

mass gmail