البيانات الضخمة – BIG Data

البيانات الضخمة – BIG Data

 ا.م.د. مازن سمير الحكيم

رئيس قسم تكنولوجيا المعلومات

الجامعة اللبنانية الفرنسية – اربيل

 نعيش اليوم في عصر تتراكم فيه البيانات بشكل كبير جدا "كل لحظة"، فلم يسبق للبشرية ان راكمت مثل هذا الكم من البيانات بأي شكل من الأشكال. ففي "كل يوم" منذ عام 2012 يقوم البشر بتخزين أكثر من بيتابايت (مليون مليار) من البيانات، وتشير الدراسات بأن90%  من البيانات المتوفرة في العالم تم إنشاءها في أخر سنتين, نظرا لما وفرته الإنترنت من سهولة لإدخال المعلومات ومشاركتها وخزنها. ويتوقع في العام 2015 أن يكون هناك 3 بليون شخص على الإنترنت يقومون بنشر معلومات بحجم 8 زيتا بايت (الف مليار مليار) "يوميا". لذلك في السنوات الأخيرة، بدأ يظهر مفهوم البيانات الضخمة (BIG Data) كتحدي للمؤسسات التجارية والأكاديمية والبحثية.

البيانات الضخمة (BIG Data) هي مجموعة ضخمة من البيانات المعقدة و المتداخلة بشدة (كالتغريدات على تويتر، الدردشة على الجات، الرسائل النصية، الاعجابات بمنتج او منشور معين، مشاركة الحالة أو فيديو مع الأصدقاء، حجم تداول الأسهم، مؤشرات وأخبار الطقس، وغيرها الكثير جدا) مما يصعب معالجتها وإدارتها باستخدام أداة واحدة من أدوات إدارة قواعد البيانات أو بالطرق التقليدية لمعالجة البيانات. وهي تنمو بوتيرة متسارعة للغاية، وفي طريقها للمزيد. كما وفي كل يوم تضاف أدوات أكثر وأكثر لادخال البيانات كالهواتف الذكية، مستشعرات الفضاء، ومحددات المواقع الجغرافية، قارئات التأمين الاجتماعي، قارئات بيانات السير والمرور، مدخلات معلومات التلاميذ والطلاب والموظفين والعمال في العالم كله.

تعد البيانات الضخمة مفهوم نسبي للمؤسسات فبعض المؤسسات قد ترى أن البيانات التي تتعامل معها ضخمة جدا بينما تكون لا تساوي شيئا بالنسبة لمؤسسة أخرى... ويعتمد ذلك على الإبعاد الثالثة للبيانات الضخمة والتي تقيس مدى حجمها (Volume)، وتنوع هذه البيانات وإختلاف أنماطها وتعقيدها (Variety)، و سرعة معالجة البيانات والأداء الخاص بمعالجتها (Velocity).

Description: http://www.etusolution.com/images/3v.png

فعلى سبيل المثال، يراكم سوق الأوراق المالية بنيويورك NYSE (nyse.nyx.com) 1 تيرابايت من البيانات في كل عملية تبادل تجاري، ووصل حجم البيانات الضخمة التي يخزنها 80 بيتابايت فى عام 2010. بينما تحتوي قواعد بيانات متجر walmart (walmart.com) في الولايات المتحدة (وهي شركة بيع بالتجزئة تعد أكبر شركة في العالم من حيث الإيرادات حيث تعالج مليون عملية تجارية كل ساعة) على 2.5 بيتابايت وهو ما يساوى 167 ضعف جميع البيانات الموجودة في كل كتب مكتبة الكونجرس. بينما موقع امازون (amazon.com) بجانب عمليات البيع التقليدية يوميا، يقوم بمعالجة استفسارات البائعين مما جعله منذ عام 2005 يمتلك أكبر ثلاث مركز للبيانات في العالم.

شبكة الفيسبوك الاجتماعية (facebook.com) كذلك يعالج 50 مليار صورة فى بيانات مستخدميه، اما شبكة لينكد ان الاجتماعية (linkedin.com) المتخصصة فى العمل والوظائف، تستخدم نتائج البيانات الضخمة لتوليد مليار اقتراح كل شهر على عملائها. ناهيك عما تحتويه قواعد بياناتgoogle  و yahoo! وغيرها ...

هناك جهود جهات عديدة فى العالم تسعى لاستخدام البيانات الضخمة بعد تحليل معطياتها لاتخاذ القرارات الصائبة فيما يتعلق بالتعليم والصحة والمرور وغيرها، وقد ازداد عدد الأوراق البحثية المنشورة في مجال البيانات الضخمة في العامين السابقين بشكل كبير جدا مما يعكس اهمية هذا المجال خلال العصر الحالي.

لا حدود لما يمكن للبيانات الضخمة ان تفعله، فتشير الدراسات بأن الشركات التى تستخدم البيانات الضخمة قد حققت نمو بنسبة 20%، كما ويمكن للبيانات الضخمة ان تتيح للمؤسسات التجارية مثلا تحليل ملايين التغريدات على تويتر مثلا لإتخاذ قرار بخصوص منتج او عقار او ترويج لتوجة معين بناء على آراء وتعليقات المغردين!

كما أنه يمكن استعمالها في القطاع الصحي لمعرفة وتوقع الأمراض وربط الخصائص واكتشاف علاقتها بالأمراض والعقاقير. ويمكن القياس على ذلك لنصل الى القرارات الحكومية التي بدأت تعمل على ربط قراراتها وتوجهاتها بناء على تحليل البيانات الضخمة المتراكمة لديها.


Copyright © 2013.College of Science. All Rights Reserved.