القائمة الرئيسية

الصفحات

علم البيانات

                       علم البيانات:

  مجال علم البيانات من أكثر المجالات طلبا في عصرنا الحالي يرتكز على إستعمال مجموعة من التقنيات والخوارزميات واللأدوات المختلفة ،اللتي يتم من خلالها إستنباط  معلومات مهمة من داخل بيانات تستخدمها شركات سواء كانت هذه البيانات منظمة أو غير منظمة.

ويمكن تعريف علم البيانات أيضا على أنه إستخدام لأجهزة إلكترونية ومعداتها ، وانظمة برمجية وخوارزميات الغاية منها حل وتفسير مشاكل وظواهر فعلية وذلك إستناذا بنضريات مستمدة من علوم أخرى كعلم الإحصاء والرياضيات ونظم المعلومات وعلم االحاسوب .

الهدف من علم البيانات : 

تستخدم الشركات علم البيانات لتحويل البيانات لميزة تنافسية عن طريق تحسين المنتجات والخدمات ، نذكر بعض تجليات حالات إستخدام  علم البيانات :

  • تحليل بيانات سلوك الزوار وتفضيلاتهم في المتاجر الإلكترونية و مواقع الويب 
  • الكشف عن السلوكيات الغير قانونية والإحتيالية على المواقع 
  • تحليل مشاعر وسلوك المستخدمين على منصات التواصل الإجتماعي بهدف الإستفادة منها أتناء القيام بحملات إعلانية  
  • التنبؤ أو إستنباط الزمن الذي سيتوقف خلاله الزبون من دفع إشتراك ما 
  • كشف الإحتيالات في الخدمات المالية من خلال التعرف على السلوكيات المشبوهة 
  • تحديد خسارة العملاء من خلال تحليل البيانات المجمعة من مراكز الإتصال بحيت يمكن لقسم  .التسويق أخد الإجرتءات اللازمة 

أهمية علم البيانات :

 يعتبر علم البيانات من أكثر المجالات طلبا في القرن الواحد والعشرين ،حيت من خلال علم البيانات إستطاعت گوگل بناء أقوى محرك بحث و تسلى بصناعة سيارات ذاتية القيادة وشركات أخرى إستطاعت تصنيع ربوتات تخدم الإنسان حتى نت فلكس كذلك يتنبأ بالأفلام التي قد تعجب المشاهدين بإستخدام علم البيانات و الأرصاد الجوية المتطورة تتنبأ بالأرصاد بدقة عالية بإستخدامها لعلم البيانات.

لقد اعطت شركات كثيرة أولوية لعلم البيانات وتستثمر فيه بكثافة ,كما جاء وفق مكتب العمل الأمريكي (S. Bureau of Laborأنه سيتواجد ما يقرب 11,5 مليون عالم بيانات حول العالم قبل حلول عام 2026. إضافة إلى أن موقع   لينكد-إن  اللذي يصنف وظيفة عالم البيانات من بين أعلى الوظائف الناشئة عليه.

  كل هذه الدراسات توضح مدى أهمية علم  البيانات حاليا ومستقبلا ، نضرا لسرعة وثيررة تطورها وزيادة الحاجة إليها . 


آلية عمل علم البيانات :

عمليا لا توجد طرق أو خطوات محددة متفق عليها يمكن من خلالها التعامل مع البيانات من خلال باستخدام علوم البيانات . إلا أن هناك بعض المراحل الأساسية التي يمر بها علماء البيانات خلال إشتغالهم على المشاكل المراد إستنباط حلول لها والتي يمكن تلخيصها في المراحل التالية : 

 تحديد الأهداف من البحث :

يقوم علماء البيانات في هده المرحلة الأولية بتقديم وثيقة متعلقة بالمشروع ، توضح الهدف منه ومعلومات أخرى متعلقة بنطاق تطبيق البحت مع توضيح كيفية الإستفادة منه وماهي البيانات والمصادر المطلوبة في عملية البحت ، إضافة إلى الإطار الزمني والعناصر المطلوب تسليمها في نهاية البحت .

جمع البيانات :

وذالك من خلال جميع أكبر قدر ممكن من البيانات المتعلقة بالمشروع ، و التي تكون عبارة ،عن جداول ، صور و مقاطع فيديو... سواء من خلال قواعد بيانات المؤسسة المعنية بالأمر الأنترنيت أو الإستفتاءات وغيرها من الطرق شرط أن تكون هذه البيانات بأعلى دقة ممكنة بحيت يمكن إستخدامها في مشاريع تحليل البيانات   (كل ما تعددت مصادر البحت كلما تحسنت جودة البيانات).

                                                                                    معالجة وتنظيم البيانات :

معضم البيانات الموجودة في العالم ليست جاهزة للإستخدام بشكل مباشر . مما يجعل خطوة المعالجة  تستهلك وقت أطول من عالم البيانات يصل أحيانا إلى 70٪ من وقت المشروع  بالنسبة للبيانات الضخمة . ففي هذه المرحلة يقوم عالم البيانات بتنظيف وجرد البيانات وذلك عن طريق التحقق من عدم وجود أي خلل أو تناقض في البيانات التي تم جمعها سابقا ، و التعامل مع البيانات المفقودة والسجيلات الغير مكتملة . (كل ما كانت البيانات أكثر دقة كلما تم إستبعاد نسبة الخطأ و الخروج عن نطاق العمل ),

إستكشاف البيانات:

ترتكز عملية إستكشاف البيانات على تكوين فهم أعمق  للبيانات ، التي تم تنظيفها وجردها سابقا ، وكذلك  تحديد العلاقة القائمة بين المتغيرات وتحديد إن كانت هنالك قيم شادة  أو متطرفة في البيانات .وذلك بإستخدام البرمجة  الإحصائيات الوصفية  و طرق التمثيل المبياني  ومن أشهر هذه الأدوات في العالم حاليا الجداول و الباور بي أي(Power BI) كما تسمى هذه العملية بالتحليل الإستكشافي .

بناء نماذج و خوارزميات:

في هذه المرحلة يستخدم عالم البيانات مجموعة من الخوارزميات ونماذج البيانات Data model (التي هي عبارة عن مجموعة وصفية للبيانات التي سيتم تخزينها في قواعد البيانات ) التي تمكن من حل مشكل ما عن طريق تحليل مجموعة من السيناريوهات في وقت وجيز مما يقودنا إلى إتخاد قرار أكتر فعالية خلال فترة قصيرة من الزمن إضافة إلى علم الإحصاء، وتعلم الآلة، وبحوث العمليات او علم إتخاد القرار اللذي سبق ذكره 
وتعتبر عملية بناء النماذج العملية تكرارية، تتضمن: تحديد متغيرات النموذج، وتنفيذ ه وفحصه بعد الانتهاء.

معاينة البيانات:

في هذه المرحلة يتم  الإعتماد على مجموعة من المقاييس التي تخول  فحص أداء النمودج المتوصل إليه عن طريق تحديد أدائه , إذ لم يكن أدائه كما هو مطلوب يستلزم علينا تغيير الشيفرة المستعملة أو تغيير في البيانات التي تم الإعتماد عليها في الخطوات السابقة .



تعليقات