Data Science in the Political Scene.

By: Tagwa Warrag

موضوعنا الليلة ما تيكنيكال شديد زي  باقي المقالات ال هنا، بس قصص متفرقة لاقتنا، و لكن فيها قواسم مشتركة و نقاط تستاهل الزول ال شغال حاجة ليها علاقة بي تحليل البيانات يخت باله منها

القاسم المشترك بين القصص دي انو الناس كانت بتحاول تحارب الفساد بي مساعدة البيانات و اساليب التحليل بمختلف اشكالها. مع انو الموضوع ما دايركت و مافي طريقة واحدة هي الصح، الا انو التجارب المختلفة و القصص ساعدتنا نعمل هايلات على كم نقطة

المحاربة هنا ما بالضرورة تكون انو الفساد ينتهي من جذوره و اقصى درجات الطموح وكدا. لكن لمن يتوفر فهم لموضوع الفساد دا من بعد تاني و باستخدام ادوات مختلفة، احتمال دا يساعد في مجهودات التقليل او الحد منو. حتى لو ما قدرنا نقلل او نغير حاجة، ممكن على الاقل نفهم لي ظواهر معينة ليها علاقة بالسياسة حصلت. او احتمال تظهر لينا صلات بين عوامل ما كانت ظاهرة لينا و احنا بنستخدم في الطرق التقليدية

ياتو بيانات لكن؟

اسألة بتجي في البال هو اصلا ياتو نوع من البيانات هو ال حيساعد في محاربة الفساد؟

انت و سؤالك. دا البيحدد انتا محتاج لي ياتو نوع من البيانات

امكن مثلا عايزين المرشح الفلاني فاز على المرشح العلاني في الانتخابات الفاتت دي ليه؟ و ياتو شخصيات ليها علاقات بي بعض في قضية الفساد الفلانية؟ مثلا يعني

قوانين حرية الوصول للمعلومات و البيانات المفتوحة

و حتى لو عرفنا احنا محتاجين لي البيانات الفلانية، لكن البلد مقفلة و شغالة حاجاتها بالجابس تحت تحت و الوصول للبيانات دي شبه معدوم او صعب جدا، الزول يتصرف كيف؟ يحنس ناس انونيموس يخترقو ليهو سيرفرات احتمال فيها داتا؟ يكسر الحنك؟ و هل من حق جهات حكومية معينة مثلا انها تمنع وصول افراد لي بيانات معينة؟ في قوانين منظمة القصة دي؟

هو طبعا توفر البيانات مرتبط بي مقياس الشفافية. لكن ما كل الدول واحد في الرانك بتاع الشفافية دا. كل ما كان الدولة ترتيبها في الشفافية منخفض اعرف طوالي انو بالتالي حيكون في مشاكل و تعقيدات في التحصل على البيانات اللي ممكن الشغل التحليلي عليها يساعد في حكي قصص و تقارير مهمة. بس ما كل الدول بتشجع و تدعم البيانات المفتوحة

مرات اصلا الداتا ما قاعدة اونلاين، او انها قاعدة لكن ما عايزين يدوك ليها، و احتمال الدولة ال انتا فيها اصلا ما فيها قوانين منظمة لحرية الوصول للمعلومات

الناس مرات بتقوم تعمل شنو: حتى لو الدولة ال بتفتش لي معلومات متعلقة بيها دي ما بتدي المعلومات، ف الدولة دي اكيد بتتعامل مع دول تانية في شغل بيزنيس او اتفاقيات او غيرو، و الدول التانية دي عندها قوانين منظمة لحرية الوصول للبيانات\المعلومات. انتا تركز مع الدول التانية الاتعاملت قبل كدا مع الدولة الرافضة تتيح ليك بيانات او معلومات. في صحفيين افريقيين كتار بيعملو كدا، و بيستفيدو من القوانين البريطانية بالذات لمن يكونو شغالين على قصص او تقارير و اتعذر عليهم يلاقو الداتا من دولهم، خاصة اذا القصة تتضمن تدفق او حركة اموال. هؤلاء الصحفيين بيمشو لي ناس ال تنمية العالمية

The Department of International Development

موقع تاني ممكن يساعد اسمو

asktheEU.org

بتقدم فيهو طلب لي بيانات معينة و بتكون مستني رد عليهو، سواء بالقبول و توفير البيانات، او بالرفض مع ذكر اسباب الرفض. احتمال يكون في بيانات متعلقة بي الدولة الافريقية مثلا ال انتا بتفتش ليها بيانات. الحاجة ال احنا ما متأكدين منها هنا اذا زول من برة الاتحاد الاوروبي ممكن يقدم طلب بيانات او معلومات عبر المنصة دي ولا لأ. زول من السودان مثلا

حاجة تانية مهمة هي الخلفية. بنسميها هنا

The domain knowledge

اللي هيا انك تكون خلفية سياسية عن الموضوع و فاهم الكونتيكست بتاع القصة، ما تكون جايي زول بتاع احصاء و كودينق و خلاص لو عايز تطبق شغل تحليل البيانات في بيانات سياسية. نفس الشي لي المجالات التانية؛ يكون مثلا عندك خلفية اقتصادية لو البيانات الشغال عليها تبع ظواهر اقتصادية معينة و عايز تجاوب على سؤال اقتصادي بمساعدة البيانات

Read more on the importance of domain knowledge in machine learning.

الموضوع مرات ما بيكون خطير شديد او سوفيستيكيتد. مجرد انك شلتا بيانات رقمية و مثلتها في شكل صوري دا . بيخلي المعلومة بقت اكثر وصولا و فهما. ما الا يكون في شغل زكاء اصطناعي و ماشين ليرنينق و بتاع

التحليل الاستكشافي – Exploratory Data Analysis

في الداتا ساينس او الماشين ليرنينق، عندنا مرحلة بتسبق شغل الماشين ليرنينق زاتو، اسمها التحليل الاستكشافي. التحليل الاستكشافي دا بتعملو في البداية بس عشان تكششف عموما كدا للداتا و تشوف الموضوع دا من جوا عامل كيف. ال”كششيف” دا يا إما بنعملو بي الفيجوالايزيشن –التمثيل الصوري- او نقوم نستخدم طرق احصائية – بالارقام بدل الصور يعني، و بعد داك الارقام او المقاييس الاحصائية دي بيكون عندها معنى او دلالة بتساعد في تحديد الخطوات التالية. في التحليل الاستكشافي دا انت بتكون يا دوبك بتتقصى كدا عن الوضع العام

انت و الداتا كدا قاعدين سوا لأول مرة و بتتعرفو على بعض. الناس مرات بتعمل الخطوة دي اول حتن بعد داك يكوسو موضوع عايزين يطبقوا خوارزميات ماشين ليرنينق ولا لأ

في حتات مختلفة زي الكاميرون و البرازيل و الارجنتين، الناس استفادت من البيانات المفتوحة عشان تخليها مفهومة اكتر لعامة الشعب، عن طريق التمثيل الصوري –الفيجوالايزيشن

في الكاميرون مثلا، في مثال ظريف لي كيف انو باحث جرب يشتغل في البيانات بتاعت الانتخابات بتاعتهم. بياناتهم كانت في شكل

اعمار المرشحين التسعة

و في كل ولاية عدد الناس المسجلين للانتخابات، عشان نعرف ياتو ولاية فيها عدد اكبر من المصوتين مثلا

و في كل ولاية عدد الناس المسجلين للانتخابات، عشان نعرف ياتو ولاية فيها عدد اكبر من المصوتين مثلا

و الولاية المعنية دي مثلا، هل هي أغلبية مسلمة ولا مسيحية

حنعرف برضو انو اكبر عدد مصوتين جايي من الولاية ذات المساحة الجغرافية الاكبر، ولا مافي علاقة؟

ياتو ولاية ممكن تضمن للمرشح الفوز؟ عشان المرشح بعد داك يقدر يعرف يركز حملته الانتخابية و دعاياتو وين

و لو في ولاية فيها عدد مسجلين للتصويت قليل بشكل ملحوظ، هل في مثلا احداث عنف او شي معين كان السبب؟ عشان برضو المرشحين يعرفو السبب و يحاولو يتفادوهو مثلا. ربط الاحداث بي بعض ممكن يطلع لينا بي اسباب محتملة لي حصول حاجة

ممكن نعمل الشغل دا بالارقام او بالتمثيل الصوري. ال مثال بتاع ال كاميرون دا عبارة عن شغل بتاع تحليل استكشافي بس. مشروح بالتفصيل و الكود بتاع البايثون هنا

في مشكلة صغييييرة ممكن تواجه الزول و اللي انا شفتها شخصيا: انو الارقام تقول كلام ما جايي على هوا المتلقي، بيكون في نوع من المقاومة و عدم الاقتناع بموضوع الارقام دا بتاتا. زي كأنك تقول لي زول متفائل انو نسبة نجاح حاجة معينة ضئيل حسب الارقام. او انو في بعض الناس بتشوف في النظر لأحداث معينة ك”أرقام” فيهو نوع من اللاإنسانية. لكن مدام الواحد اصلا عايز يحكي قصة من ورا الارقام دي، فالقصة دي زاتها عمل انساني مبني على حقائق، و ما بالضرورة بيهمل الجانب بتاع المشاعر و الآمال و الهموم و عدم اليقين و غيره

البرازيل

اوبيريشن لافا جاتو بالبرتغالي، يعني “عملية غسيل العربات” هي عملية مشهورة جدا في البرازيل ساهمت في كشف فساد و جرايم كتيرة داخل فيها مسؤولين و ناس كبار و مهمين. لغاية هسه التحقيق في لافا جاتو مستمر، و بسببو طلع عشرين في المية من أعضاء الكونغرس البرازيلي  خاشين في قصص الفساد دي. خمس الكونغرس عديل طلعوا بتاعين رشاوي و غسيل اموال و تهرب ضريبي

هو التحقيق بتاع الفساد ال بدتو الشرطة مستمر لغاية الآن. حتى عملو عنو فيلم عديل الموضوع دا (كششفو للتريلر هنا). لكن لمن جات التكنولوجيا و خشت في النص، خلت ظهور الحقائق المدفونة اكثر امكانية للوصول. القصة بي اختصار انو في ستارت-أب بتاعت تحليل البيانات الضخمة اللي ليها علاقة بالقانون، اسمها دايقيستو، مع ستارت-أب تانية بتاعت صحافة و قانون اسمها جوتا، اشتغلو سوا و طوروا محرك بحث بيساعد او بيسهل من التعرف على روابط الفساد المدفونة تحت كمية الملفات و المعلومات

و جزء من الشغل بتاعهم تضمن تمثيل صوري او فيجوالايزيشن

عملو شراكة مع مايكروسوفت باور بي آي، و منظمات زي ترانسبيرانسي انترناشونال

في المثال بتاع البرازيل دا، شغل الداتا و تحليل البيانات ما كان السبب الرئيسي و الاول في كشف الفساد ال كان في البرازيل (تحقيقات الشرطة هي السبب الرئيسي)، لكن كان المسبب لتسهيل التعرف على روابط الفساد دي. كلام زيادة عن محرك البحث او التوول الاتعملت دي تلقوهو هنا

الكلام بتاع علاقة البيانات و الطرق التحليلية بي المشاكل المتعلقة بي الفساد او السياسة او الاقتصاد ما بينتهي هنا. و حنكتب فيهو زيادة لي قدام لو اتسهلت. كل نقطة اتزكرت ممكن تبقى مقالة منفصلة بي تفاصيل اكتر، و ال حيساعد اكتر انو نعرف التحديات المحلية لي تطبيق او مجرد تجربة كلام زي دا، عشان احتمال ال حلول بتاعت الخواجات ال جاية من برة دي ما تكون اصلا مناسبة معانا

Data enables transparency.

Advertisements

One thought on “Data Science in the Political Scene.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s