ݺߣ

ݺߣShare a Scribd company logo
تطبيقات  وخ وارزميات  التنقيب في قواعد البيانات  في  المجال  الأمني والاستخباراتي إعداد د /  أحمد أبو الفتوح
تقديم يعد  التنقيب في قواعد البيانات  من التكنولوجيات الحديثة التي تهدف  إلى استخلاص المعلومات المخبأة فيها . ويوفر إ ستخدامها  للمؤسسات وأجهزة الأمن في جميع المجالات القدرة على استكشاف   -   والتركيز على   -  أهم المعلومات في قواعد البيانات . و تركز تقنيات التنقيب على بناء التنبؤات المستقبلية واستكشاف السلوك والاتجاهات، مما يسمح بتقدير القرارات الصحيحة واتخاذها في الوقت المناسب . تجيب تقنيات التنقيب على العديد من الأسئلة، وفي وقت قياسي، بخاصة تلك النوعية من الأسئلة التي كان من الصعب الإجابة عليها   -   إن لم يكن مستحيلاً   -   ب إ ستخدام تقنيات  الإحصاء  الكلاسيكية، والتي كانت إن وجدت فإنها تستغرق وقتاً طويلاً والعديد من إجراءات التحليل .
التقنيات الحديثة للتنقيب في قواعد البيانات 1 –  الجار الأقرب  :  Nearest Neighbor 2 –  التجزئة العنقودية  :  Cluster Analysis 3 –  شجر القرار  :  Decision Trees 4 –  الشبكات العصبية  :  Neural Networks 5 –  استقراء القاعدة  :  Rule Induction
1 -  خوارزمية الجار الأقرب Nearest Neighbor  وهي من تقنيات التنقيب في قواعد البيانات التي ت ستخدم  في المجال الأمني  للكشف عن مرتكبي جريمة ما وذلك بأن يتم استخدام المعلومات الخاصة بالجرائم الشبيهة التي تم ارتكابها سابقاً بهدف تحديد هوية مرتكب الجريمة الحالية عن طريق تحديد عدد من السجلات التجريبية ثم استخدامها بهدف التنبؤ بالقيمة المطلوبة   . فمثلا ، إذا كان لدينا مجموعة من الجرائم ذات طابع معين والتي تم ارتكابها سابقاً فإن استخدام هذه الخوارزمية سيكون بأن يتم بحث حالة الجوار لطبيعة المجرمين الذين ارتكبوا تلك الجرائم . الجوار  في هذه الحالة هو  الصفات الأساسية لأولئك المجرمين، كالعمر والمستوى التعليمي والوضع الاجتماعي بالإضافة لدوافع ارتكابها ، ولكن هذا لا ينفي أنه يمكن أن يتم اكتشاف صفة أو طبيعة جوار محددة ولم تكن بالحسبان بحيث تؤدي إلى كشف المجرم المطلوب   .
2  -  التحليل بالتجزئة العنقودية  Cluster Analysis هي عملية تجميع السجلات المتشابهة في مجموعات، ويتم ذلك بهدف الاستكشاف عالي المستوى لما يجري داخل قاعدة البيانات . ففي مجال الأمن عادة ما يستخدم التحليل العنقودي في تجزئة الأشخاص، أو السكان بشكل عام، إلى مجموعات يمكن دراستها بشكل مباشر ومحدد . كذلك يمكن استخدامها في تجزئة مجموعة من الأشخاص المرتبطين بقضية معينة بهدف استكشاف الروابط والفوارق التي يمكن أن يستفاد منها في فك رموز القضية . فمثلاً عند دراسة معدلات ارتكاب الجريمة بشكل مفصل لكل فئة عمرية يمكن أن نستنتج أن هذا المعدل يقل بشكل عام لكنه يتزايد لفئة عمرية معينة .
التجزئة الهرمية
و بشكل عام، تهدف التجزئة العنقودية إلى وضع العناصر المتجانسة في مجموعات منفصلة . ويتم  ضم أي عنصر في مجموعة  بناءا على  أن يكون  هذا  العنصر مائلاً للتشابه بعنصر منها أكثر من أن يكون شبيهاً لعنصر من مجموعة أخرى . أمثلة على التجزئة العنقودية
3 -  شجر القرار Decision Trees شجرة القرار هي نموذج استكشافي يظهر على شكل شجرة .  و يمثل كل  فرع من فروعها سؤالاً تصنيفياً  وتمثل  أوراقها أجزاءاً من قاعدة البيانات   تنتمي للتصنيفات التي تم بنائها .
تقسيم  الجرائم المرتكبة في  أحدى ا لمناطق  باستخدام خوارزمية شجر القرار إجمالي حوادث القتل التي وقعت 100 السؤال :  جريمة القتل عمداً ؟ إجمالي حوادث القتل العمد 60 السؤال :  عمر القاتل  >   30  ؟ إجمالي حوادث القتل الخطأ 40 حوادث القتل العمد، العمر  < 30 السؤال :  الدافع هو السرقة ؟ 40 حوادث القتل العمد، العمر  >  من  30 20 حوادث القتل العمد، العمر  > 30  والدافع ليس السرقة 10 حوادث القتل العمد، العمر  < 30  والدافع هو السرقة 30 لا لا نعم نعم نعم لا
استخدام شجرة القرار في التنبؤ ومن المهم جداً عند بناء خوارزمية شجرة القرار أن يؤخذ بعين الاعتبار أن تكون قابلة للتطبيق بقدر الإمكان وبشكل مثالي على كل البيانات المتوفرة . القاعدة الأساسية في بناء شجرة القرار هي إيجاد أفضل سؤال عند كل فرع من فروع الشجرة بحيث يقسم هذا السؤال البيانات إلى قسمين، القسم الأول منها ينطبق عليهم السؤال والقسم الثاني لا ينطبق، وهكذا يتم من خلال سلسلة من الأسئلة بناء شجرة القرار بفروعها المتسلسلة .
الفرق بين شجر ة القرار والتجزئة العنقودية تهدف تقنية شجرة القرار إلى تقسيم قاعدة البيانات بهدف معين سبق وأن تم تحديده . قد تكون شجرة القرار أكثر تعقيداً من التجزئة العنقودية ولكنها تؤدي إلى نتائج يمكن إظهارها بشكل مبسط وفائدة عالية المستوى .
4  –  الشبكات العصبية Neural Networks تعتبر الشبكات العصبية هي وأشجار القرار من أهم تقنيات التنقيب في البيانات، نظراً للنتائج الدقيقة التي يتم التوصل إليها باستخدام هذه الخوارزميات ولإمكانية تطبيقهما في حل العديد من المشاكل وبكافة الأنواع، هذا بالرغم من صعوبتهما والتي أدت لعدم الانتشار بشكل واسع لهما . خوارزمية الشبكة العصبية تشبه في تركيبتها تركيبة مخ الإنسان، فهي تعمل بنفس الطريقة كما يعمل المخ في نقل ومعالجة المعلومات والتوصل إلى الاستنتاجات واكتشاف الأنماط والتنبؤات ونستطيع من خلالها تطبيق بعض ما يطبقه المخ الطبيعي، رغم أن العلماء لا يزالون حتى اليوم يكتشفون المزيد ولم يلموا بكل تفاصيل عمل مخ الإنسان .
المفهوم الشبكات العصبية الطبيعية . الشبكات العصبية الأصطناعية  ANN . المكونات معمارية الشبكة العصبية الأصطناعية اسلوب المعالجة فى الشبكات العصبية الأصطناعية حالة توضيحية لأحد تطبيقات الشبكات العصبية الأصطناعية . خاتمة  . * طريقة عمل خوارزمية  الشبكات العصبية الأصطناعية كأحد  تطبيقات  علم الذكاء الأصطناعى
لقد تعلم الانسان من خلقته التى خلقه الله عليها  .  فالشبكات العصبية فى عقل الأنسان تعمل بطريقة غاية فى الدقة والتعقيد  .  وأستطاع الانسان مــــن خلال فهمه لتركيبة تلك الشبكة الطبيعية وطريقـة تخزينها ومعالجتها للمعلـومات أن يحــاكى ذلـــك بإستعمال شبكات عصبية إصطناعية داخــــــــــل برامج الحاسب تقوم بحل العديد من المســــــــائل واتخاذ العديد من القرارات  .
و تعد الشبكات العصبية الأصطناعية أحد  تطبيقات  علم الذكاء الأصطناعى  AI   والذى يحظى بإهتمام كبير من الباحثين فى مجال علوم الحاسب وتكنولوجيا المعلومات ، لمـــــا تتيحه هذه النظم من قدرة كبيرة وسرعـــة عاليــــة فى إسترجاع كميات كبيرة من المعلومات والقدرة المتميزة فى التعرف على الأشكال نتيجة الأرتكاز على اسلــــوب المعالجة المتوازية  Parallel processing . *
ويمكن القــول بأن الشبكات العصبيـــة الأصطناعية  ANNs  هى عبارة عن تقنية معالجــــة المعلومات  المنبثقة عن علم دراسة المخ  Brain   والنظــــــام العصبى  Nervous system   فى الأنسان . ولقد شهدت هذه التقنية دراسات عديدة من الباحثين  تطورت مع التقدم فى علم دراسة الأعصاب لفهم آليات العقل فى عمليات الأستنتاج المنطقى والمعالجــــــــة ، لتحاكى بذلك العقل البشرى  . 12.16
المفهوم (1)  الشبكة العصبية البشرية  ( الطبيعية ) Biological Neural Networks يتكون مخ الأنســـان من بلايين من الخلايــــــا العصبية  Neurons   وأنواعها عديدة ومختلفة . تنتشر هذه الخلايا فى مجموعات تسمى شبكــات  Networks   شديدة التداخـــــــــــل  فيما بينها  Interconnected   ولذلك ينظر لها علــــــى  أنها تجمع من الشبكات العصبية  . * 12.18
يوجد بكل خلية عصبية  نواة عصبية  Nucleus   فى  المنتصف ولها بعض النهايات العصبية  Dendrites   وهى المسئولة عن المدخلات  Inputs   للخلية . يوجد بالخلية كذلك موصل طرفى  Axon   مسئول عن نقل المخرجات  output   من خلية الى اخرى ..  الخ . * 12.19
والواقع أن هذه الأطراف أو النهايات العصبية لجسم الخلايا العصبية تتصل بأطراف الخلايا الأخرى عن طريق مايسمى بنقطة المرور  Synapse   والتى تنتقل عبرها الأشـــــارات العصبيـــة  وتتحكم فى زيادتهـا أو نقصانها . 12.20
* 12.22
عن طريق محاكاة طرق الاستنتاج المنطقى عند الأنســـــــــــــــان  Human Resoning   ، وفى ظل إستحداث اسلــوب المعالجة المتوازية  Parallel processing   أمكن بناء حـــــــاسبات وبرمجيات ذكية ذات إمكــــــــانيات معمارية ومعـــالجية تحاكى بعض إمكانيات المعالــــــــج التى يقوم بها ذلك العقل البشرى  . ولقد اطلق على تلك التقنية التى تحاكى  العقل البشرى إسم ”الحساب العصبى“ Neural Computing  أو الشبكات العصبية الأصطناعية Artificial Neural Networks (ANNs)   * 12.23
هى نموذج معالجة معلومات مستوحى من طرق النظــم العصبية الحيوية ليحاكى بذلك الشبكة العصبية الطبيعية . ترتكز تقنية المعالجة فى الشبكة العصبية الأصطناعيــــة  علـــى مايعرف بعناصر المعالجــــــــــــة  Processing Element (PE)  والتى تسمى أيضا بالخلايا العصبية  الأصطناعيـــــــــــة  Artificial Neurons   والتى تتصل  فيما بينهــا  فى شبكـة معمارية تعمل فى تنسيق لحل مشاكـــل معينـــــــة  وهذه الخلايا الأصطناعية تناظر الخلايـــــــــا العصبية الطبيعية . 12.24 المفهوم ( إستمرار ) (2)  الشبكة العصبية الأصطناعية   Artificial Neural Networks
تابع المخرجات الناتجة من الخلية الأصطناعية والتى تناظـــر الأشارات  الخارجة من الخلية الطبيعية عن طريـــــــق  الموصل الطرفى  Axon   تكون على شكل إشــــــارات صناعية يمكن تغييرها بطريقة تشـــابه تلك التى تحـــدث فى نقطــــة المــــــــرور  Synapes  بالشبكة الطبيعية
التطبيقات التي ترتكز على إستخدام   الشبكات العصبية الأصطناعية الشبكات العصبية أعطت حلولاً ذات كفاءة عاليـة للكثير من التطبيقات في العديد من المجالات نذكـر منها : تمييز الأنماط والتعرف على الصور .  القدرة على التعرف على الصور المشوهة .  إكمال الصور التي فقدت جزء منها، مثل الصور المرسلة بواسطة الأقمار الصناعية .  عمليات التصنيف إلى عدد من الفئات .  مثل تصنيف الحيوانات إلى أليفة و مفترسة .
(3) مكونات الشبكة العصبية الأصطناعية تتكون الشبكة العصبية الأصطناعية  ANN   من مجموعة من عناصر المعالجة  (  PE )  تركب بطرق مختلفة  .  وكل عنصر معالجة يستقبل أى عدد من المدخلات أو المتغيرات ويعطى أشارة خارجة واحدة  . المدخلات يمكن ان تكون على صورة بيانات خام او تكون هى المخرجات من عناصر معالجة أخرى  .
مكونات الشبكة  ( تابــــــع ) الأشارة الخارجة من نموذج الشبكة يمكن أن تكون النتيجة النهائية للمشكلة المطلوب حلها بإستخدام الشبكة أو تكون مدخلا لعنصر معالجة آخر  . الشكل التالى يوضح نموذج عنصر المعالجة فى الشبكة العصبية الأصطناعية التى تحاكى الخلية العصبية فـــى العقل البشرى  .
An Artificial Neuron w 1j w 2j w 3j w ij x 1 x 2 x 3 x i f (x) y
شكل يحاكى فكرة الخلية العصبية الطبيعية
(4)  معمارية الشبكة العصبية الأصطناعية ANN Toplogy يتم تجميع عناصر المعالجة فى مجموعات موزعة فى طبقات  Layers   لتكوين معمارية الشبكة العصبية الأصطناعية  . يتألف معمار الشبكة العصبية الأصطناعية من مجموعة طبقات  layers   متتالية من عناصر المعالجة والترابطات  .
معمارية الشبكة (  تابع ) وتتعدد طوبولوجيات الشبكة العصبية الأصطناعية بمعنى اتصال الخلايا العصبية بطرق مختلفة مما يعطى أشكالا عديدة للشبكة  . أبسط تركيب ممكن لشبكة عصبية هو التركيب الذى يتكون من طبقة واحدة من العناصر تربط ربطا مباشرا مدخلات الشبكة مع مخرجاتها  .
شبكة إصطناعية أحادية الطبقات مخرجات الشبكة مدخلات الشبكة
شبكة إصطناعية ثنائية الطبقات Adjustable Weights Output Values Input Signals (External Stimuli)
تابــــــــــــع نتيجة القصور فى أداء التركيب السابق ظهرت معماريات أخرى للشبكات تحتوى تراكيبها على أكثر من طبقة من عناصر المعالجة والتى تعرف بالشبكات متعددة الطبقات  Multi Layer Networks   والتى تتكون من  : طبقة المدخلات  Input layer الطبقة  /  أو الطبقات الخفية  Hidden Layers طبقة المخرجات  Output Layer
شبكة إصطناعية متعددة الطبقات الطبقة الخفية الأولى طبقة المخرجات طبقة المدخلات عنصر معالجة (PE) الطبقة الخفية الثانية
تابــــــــــــــع فى ضوء المعماريات السابقة يستخدم الباحثون  أنواع وتقنيات متعددة فى تصميم الشبكات العصبية الأصطناعية   : 1 -  شبكات التغذية الأمامية   . Feed-Forward Networks وهى تسمح للاشارات بالمرور فى اتجاه واحد فقط  one way   من المدخل الى المخرج  . والشبكات العصبية من هذا النوع تميل الى ان تكون شبكات ربط المدخلات بالمخرجات مباشرة  .
مثال لشبكة عصبية ذات تغذية أمامية طبقة الاخراج  طبقة مخفية داخلية  طبقة الادخال مخرجات مدخلات
تابع 2-  شبكات الانتشارالخلفى  ( أو العكسى ) : Back- propagation   Networks وهى تحتوى على إشارات تمر فى كلا الاتجاهين بإدخال حلقات تكرار فى الشبكة  . هذا النوع من الشبكات قوى جدا ومعقد الى درجة كبيرة هذا النوع من الشبكات تتغير حالاتها بإستمرار الى أن تصل الى نقطة التوازن  .
مثال لشبكة عصبية ذات تغذية عكسية طبقة الاخراج  طبقة مخفية داخلية   طبقة الادخال مخرجات مدخلات
(5)  معالجة المعلومات فى  بيئة الشبكات العصبية الأصطناعية ترتكز عملية معالجة المعلومات على مجموعة من العناصر  : المدخلات  Inputs  كل مدخل هنا يمثل صفة مميزة واحدة  attribute  . المخرجات  Outputs وهى تمثل قرار  ( ناتج )  حل المشكلة التى نحن بصددها .
تابع  الأوزان  Weights -  يعتبر الوزن هو العنصر الرئيسى  key element   فى الشبكات العصبية الأصطناعية  ANN   . -  يعبر الوزن عن الأهمية النسبية أو القيمة الحسابية للبيانات المدخلة الى عناصر المعالجة .
تابـــــع  دالة الجمع  Summation function تقوم هذه الدالة بحساب الوزن المتوسط لكل المدخلات الى عنصر المعالجة وذلك بضرب كل قيمة مدخلة  X j )  )  فى وزنها النسبى  ( W j )  فيتم إيجاد المجموع  (  Y  )  كالآتى  : لخلية عصبية واحدة   Y =  Σ   n j   X i  W j لأكثر من خلية عصبية  j Y j =  Σ   j   X i  W jj
a) Single neuron S j f(S j ) Y j x o x 1 x 2 x n +1 w j0 w j1 w j2 w jn
b) Several neurons X1 X2 W11 W22 W21 W12 W23 PE PE PE Y1 Y2 Y3 Y1=x1w11+x2w21 Y2=x1w12+x2w22 Y3=x2w23
تابـــــــع دالة الأنتقال  : وهى الدالة المسئولة عن تعديل وتحويل القيمة الناتجة  عن عملية الجمع إلى أحد القيم التي يفترض أن تكون ضمن نواتج الشبكة المرغوب بها   وذلك فى ضوء مستوى الأستثارة  ( أو التفضيل )   Activation level   الذى تتسم به كل خلية عصبية   . ويرمز للقيمة المحولة  Transformed   للمجموع بالرمز   Y t Y t  =  1 1+e -y
تابـــــــــع وتهدف عملية التحويل الى تحسين مستويات المخرجات الى قيمة معقولة بين  (1)  و  (0) .  خاصة وأن قيمة المخرجات يمكن ان تكون كبيرة جدا فى حالة وجود أكثر من طبقة . والقيمة  Y t   أحيانا تسمى بالقيمة المعدلة  Normalized   وعملية التعديل يمكن أن تتم على القيمة الجارية من كل عنصر معالجة أو تتم على القيمة النهائية الناتجة من الشبكة  .
Example of ANN Function Summation function: Y=3(0.2)+1(0.4)+2(0.1)=1.2 Transformation (Transfer) function : Y t  =   1 1+e -1.2 = 0.77 X 1 =3 S j f(S j ) Y=1.2 W 1 =0.2 X 2 =1 X 3 =2 W 2 =0.4 W 3 =0.1
تابــــــــــع دالة التعلم  Learning function تتعلم الشبكة العصبية الأصطناعية من أخطائها  . تشمل عملية التعلم  ثلاثة مهام  : -  حساب المخرجات  . -  مقارنة المخرجات مع إجابات محددة مسبقا  ( الناتج المستهدف ). -  تعديل الأوزان وإعادة المعالجة   .
تابــــــــــع وتبدأ المعالجة  بوضع قيم عشوائية للأوزان حسب قيمة الأنحراف  وهو الفرق بين المخرجات الحقيقية  (  Y  )  والمخرجات المطلوب تحقيقها من الشبكة وهى  (  Z  )   وبتعديل قيم الأوزان تصل قيمة الأنحراف الى الصفر  .  وعندها تكون المخرجات الحقيقية هى نفسها المخرجات المطلوبة  .
شكل يوضح نموذج دالة التعلم Compute  Output Adjust Weights Stop Is Desired output Achieved? No Yes
طرق تعليم شبكة عصبية تتعلم الشبكة عن طريق إعطائها مجموعة من الأمثلـــة، التي يجب أن تكون مختارة بعناية، لأن ذلك سيساهم في سرعة تعلم الشبكة .  ومجموعة الأمثلة هذه تسمى  فئـــة التدريب . وتنقسم  طرق تعليم شبكة عصبية   إلى قسمين  حسب فئة التدريب التي تعرض على الشبكة .  وهما :
تابع التعليم بواسطة معلم Supervised Learning:  في هذه الطريقة تكون  فئة التدريب  التي تعرض على الشبكة عبارة عن زوجين من المتجهات،  متجه المدخلات  وهو عبــارة عن القيم المدخلة للشبكة،  ومتجه المخرجات  وهو عبـــارة عن القيم التي يجب أن تخرجها الشبكة . مثال : Input:(0 1 0 1 0 0 0 1) Output:(0 1 1) 
تابع التعلم الذاتى ( بدون معلم ) Unsupervised learning: في هذه الطريقة تكون فئة التدريب عبارة عن متجـــه المدخلات فقط دون عرض المخرجات على الشبكة . فى هذه الحالة تقوم الشبكة بتعديل الأوزان بنفسها دون تدخل من المعلم للوصول الى القيمة المستهدفة .
مثال تطبيقي لكي يتم التنبؤ باستخدام الشبكة العصبية، يتم إدخال قيم المتغيرات المعلومة في العقد المخصصة للإدخال، ويصبح لكل عقدة قيمة المتغير الذي تم إدخاله، بعد ذلك يتم ضرب قيمة كل عقدة بقيمة الرابط المتصل بها لنحصل على النتيجة . وهنا  تم اعتبار أنه إذا كانت النتيجة  1  يكون من المتوقع إقدام الشخص على ارتكاب الفعل المذكور، وإذا كانت  0  فيكون من المتوقع عدم الاستجابة . تم التعبير عن العمر بقيمة تقع بين  0.0  و  1.0  وهي  هنا   0.47 ، وهذا يمثل عمر  47  سنة، والدخل بالقيمة  0.65 ، وهذا يمثل دخلاً بقيمة  65000$ . بالنسبة ل لوصلات والتي تعبر عن الأوزان فقد تم تقديرها بالقيم  0.7 ،  0.1  على الترتيب  وذلك بناء على معرفتنا بسجلات سابقة من قاعدة البيانات . بعد ضرب قيم العقد في قيم الوصلات وجمعها نحصل على قيمة المتغير الذي نريد التوقع له فيكون هنا  0.39   وهو رقم أقرب للصفر منه للواحد الصحيح وبذلك تكون النتيجة هي  عدم احتمال ارتكاب الشخص للفعل المذكور .
شكل توضيحي للمثال الشكل التالي  يبسط ما تم عمله في المثال السابق
العقد المخفية في الشبكات العصبية قد تحتوي خوارزمية الشبكة العصبية على نوعية أخرى من العقد والتي تسمى العقد المخفية . مهمة هذه العقد استشارية ولا يؤخذ بقيمها إلا بعد أن يتم اعتماد استشارتها في حالة صحتها وبعد التجربة الفعلية .   ومثلما يحدث في الجيش، فالقائد يستمع إلى العديد من الاستشارات ممن حوله من المستشارين قبل اتخاذ قرار معين، ولكنه بعد اتخاذ القرار واستكشاف نتائجه ومدى صحته، يصبح بإمكانه تمييز المستشارين الجيدين والذين كانت آرائهم أقرب للقرار الذي كان من المفترض أن يكون أنسب، وبالتالي سوف يعتمد آرائهم في المستقبل ويأخذ بها أكثر من آراء غيرهم، وهكذا، فالعقد المخفية تلعب نفس هذا الدور، كلما تم تطبيق الخوارزمية يتم تطوير وتحديث العقد الأصلية بأن تأخذ بالاعتبار قيم العقد المخفية المناسبة والتي تدعم الحصول على نتائج أكثر دقة، وبالمقابل يتم إهمال قيم العقد المخفية التي لم تحقق ذلك .
5 –  استقراء القاعدة Rule Induction أن تقنية استقراء القاعدة من التقنيات الأساسية في التنقيب في البيانات وأكثرها شيوعا في مجال استكشاف المعرفة، وهي أقرب ما تكون إلى ما يسمى بعملية التنقيب بحد ذاتها، والذهب في هذه الحالة هو  &quot; القاعدة” . تبين  هذه القاعدة ما يجري داخل قاعدة البيانات وتظهر لنا ما لم نكن نعرفه من قبل، وربما أيضاً ما لن نستطيع أن نعرفه  إلا من خلالها .
كيف ن س تكشف القاعدة في تحليل قاعدة بيانات سجلات الجريمة في الشرطة يمكن أن نستكشف القاعدة الشيقة التالية :  &quot; إذا ارتكب المجرم الجريمة من النوع  A   فإنه يرتكب الجريمة من النوع  B   معها باحتمال  80% ، وهذه الثنائية تحدث بإجمالي  3%  من كافة الجرائم المسجلة &quot;   . ولكي تكون القاعدة مكتملة وذات فائدة، فإنه يلزم لها تقييم، وهو عبارة عن نوعين إضافيين من المعلومات التي يجب أن تلازمها، وهذه المعلومات الإضافية هي  : الصحة  Accuracy  :  كم هي نسبة صحة القاعدة  ( وقوع النتيجة في حال وقوع السبب ). التغطية  Coverage  :  كم نسبة السجلات المحققة للقاعدة إلى كافة السجلات في قاعدة البيانات .
مثال تطبيقي لطريقة تقييم القاعدة في أحد أمثلة تحليل قاعدة بيانات الحوادث، ليكن لدينا القاعدة التالية : &quot;  إذا ارتكب السائق  10  مخالفات سير فإنه يرتكب حادث يؤدي إلى القتل  &quot; والأعداد التالية كما يلي : T   = 100 :  العدد الكلي للسجلات في قاعدة البيانات K   = 30  :  عدد سجلات السائقين الذين ارتكبوا حادث أدى إلى القتل L   = 40  :  عدد سجلات السائقين الذين ارتكبوا  10  مخالفات سير  B   = 20  :  عدد سجلات السائقين الذين ارتكبوا  10  مخالفات سير وحادث أدى إلى القتل معاً  . فتكون نسبة صحة القاعدة هي حاصل قسمة عدد سجلات السائقين الذين ارتكبوا  10  مخالفات سير وحادث أدى إلى القتل معاً مقسوماً على عدد سجلات السائقين الذين ارتكبوا  10  مخالفات سير .  وتكون في هذه الحالة مساوية لـ  40/20=50%. أما التغطية فتكون حاصل قسمة عدد سجلات الذين ارتكبوا  10  مخالفات سير مقسوماً على العدد الكلي للسجلات في قاعدة البيانات .  وهي هنا تساوي  40/100 = 40 %. 
رسم توضيحي للمثال كل الحوادث حوادث سير أدت للقتل مرتكبو  10  مخالفات مرتكبو  10  مخالفات وحادث مؤدي للقتل ليس من المجموعتين
استثمار القاعدة إن استخدامات القاعدة كثيرة، فمن الممكن تحديد الكثير من القرارات المبنية على قواعد يتم استكشافها في قواعد البيانات . مثلاً، يمكن لأجهزة الأمن أن تستكشف كافة القواعد الخاصة بارتكاب جريمة معينة، بان تكون طرفاً مستقلاً فيها  ( الأيمن ) ، وتتفحص مدى تأثير وقوعها على وقوع الجرائم الأخرى، أو حتى على ارتباطها بصفات معينة لدى المجرم   وهل من الضروري اتخاذ خطوات معينة في خطتها للحد من هذه الجريمة، أو إذا أرادت وضع قيود معينة فهل سيكون هناك تأثير على ارتكاب الجرائم الأخرى .
اختيار تقنية التنقيب المناسبة أخيراً، لا يوجد  نظرية  محددة يتم بناء عليها اختيار تقنية من تقنيات التنقيب، ويتم الاختيار عادة بناءاً على الخبرة في هذا المجال والتجربة الفعلية للتقنيات ومدى فاعليتها، ومن جهة أخرى قد تكون المفاضلة أيضاً بين التقنيات التقليدية والتقنيات الحديثة بقدر ما يكون هناك توفراً للأدوات المناسبة ،  ومع ازدياد الخبرة نستطيع أن نقيّم الخيارات ونحدد منها المناسب ونطبقه .
تخطيط عمليات التنقيب في  قواعد  البيانات إن تخطيط عمليات التنقيب في قواعد البيانات من الأمور المهمة للحصول على أفضل النتائج، فالتخطيط الجيد يؤدي للنتائج الجيدة . ويمكن تلخيص الخطوات الأولية للتنقيب في قواعد البيانات في ما يلي : 1 –  تحديد المشكلة المراد بحثها وإيجاد الحلول لها 2  –  بناء قاعدة بيانات التنقيب 3  –  استكشاف البيانات 4  –  تحضير البيانات للتنقيب 5  –  بناء نموذج التنقيب المناسب 6  –  تطبيق النموذج 7  –  استخراج النتائج
مراحل تطور استخدام تكنولوجيا المعلومات ونوعية الأسئلة التي وفرت لنا إجاباتها في كل مرحلة التنقيب في قواعد البيانات Data Mining (Emerging Today) ماذا يمكن أن يحدث لطبيعة الجرائم المرتكبة في مدينة الرياض الشهر القادم، ولماذا ؟ مستودعات البيانات ودعم القرار Data Warehousing & Decision Support (1990s) ”  ما نوعية الجرائم التي وقعت في مدينة الرياض في شهر مارس الماضي ، مع مقارنة لكل المدن الأخرى ؟ ” الوصول للبيانات Data Access (1980s) ” ما نوعية الجرائم التي وقعت في مدينة الرياض في شهر مارس الماضي؟” تجميع البيانات Data Collection (1960s) ”  كم كان مجموع الجرائم في السنوات الخمس الأخيرة ؟ ” مرحلة التطور في استخدام تكنولوجيا المعلومات السؤال الذي توفر إجابته تلك التكنولوجيا
تطبيقات عملية في  المجال الأمني والاستخباراتي في المجال الجنائي في مجال شرطة المرور   في مجال الدفاع المدني   في مجال الاستخبارات الاقتصادية والتجارية   في مجال الاستخبارات بشكل عام   استخدامات عامة
قواعد بيانات قواعد بيانات قواعد بيانات تنسيق وتعاون تنسيق وتعاون تحليل وتنقيب معرفة حقيقية سياسات وخطط ولوائح تنفيذية وإجراءات الأمن

More Related Content

الفصل الثامن

  • 1. تطبيقات وخ وارزميات التنقيب في قواعد البيانات في المجال الأمني والاستخباراتي إعداد د / أحمد أبو الفتوح
  • 2. تقديم يعد التنقيب في قواعد البيانات من التكنولوجيات الحديثة التي تهدف إلى استخلاص المعلومات المخبأة فيها . ويوفر إ ستخدامها للمؤسسات وأجهزة الأمن في جميع المجالات القدرة على استكشاف - والتركيز على - أهم المعلومات في قواعد البيانات . و تركز تقنيات التنقيب على بناء التنبؤات المستقبلية واستكشاف السلوك والاتجاهات، مما يسمح بتقدير القرارات الصحيحة واتخاذها في الوقت المناسب . تجيب تقنيات التنقيب على العديد من الأسئلة، وفي وقت قياسي، بخاصة تلك النوعية من الأسئلة التي كان من الصعب الإجابة عليها - إن لم يكن مستحيلاً - ب إ ستخدام تقنيات الإحصاء الكلاسيكية، والتي كانت إن وجدت فإنها تستغرق وقتاً طويلاً والعديد من إجراءات التحليل .
  • 3. التقنيات الحديثة للتنقيب في قواعد البيانات 1 – الجار الأقرب : Nearest Neighbor 2 – التجزئة العنقودية : Cluster Analysis 3 – شجر القرار : Decision Trees 4 – الشبكات العصبية : Neural Networks 5 – استقراء القاعدة : Rule Induction
  • 4. 1 - خوارزمية الجار الأقرب Nearest Neighbor وهي من تقنيات التنقيب في قواعد البيانات التي ت ستخدم في المجال الأمني للكشف عن مرتكبي جريمة ما وذلك بأن يتم استخدام المعلومات الخاصة بالجرائم الشبيهة التي تم ارتكابها سابقاً بهدف تحديد هوية مرتكب الجريمة الحالية عن طريق تحديد عدد من السجلات التجريبية ثم استخدامها بهدف التنبؤ بالقيمة المطلوبة . فمثلا ، إذا كان لدينا مجموعة من الجرائم ذات طابع معين والتي تم ارتكابها سابقاً فإن استخدام هذه الخوارزمية سيكون بأن يتم بحث حالة الجوار لطبيعة المجرمين الذين ارتكبوا تلك الجرائم . الجوار في هذه الحالة هو الصفات الأساسية لأولئك المجرمين، كالعمر والمستوى التعليمي والوضع الاجتماعي بالإضافة لدوافع ارتكابها ، ولكن هذا لا ينفي أنه يمكن أن يتم اكتشاف صفة أو طبيعة جوار محددة ولم تكن بالحسبان بحيث تؤدي إلى كشف المجرم المطلوب .
  • 5. 2 - التحليل بالتجزئة العنقودية Cluster Analysis هي عملية تجميع السجلات المتشابهة في مجموعات، ويتم ذلك بهدف الاستكشاف عالي المستوى لما يجري داخل قاعدة البيانات . ففي مجال الأمن عادة ما يستخدم التحليل العنقودي في تجزئة الأشخاص، أو السكان بشكل عام، إلى مجموعات يمكن دراستها بشكل مباشر ومحدد . كذلك يمكن استخدامها في تجزئة مجموعة من الأشخاص المرتبطين بقضية معينة بهدف استكشاف الروابط والفوارق التي يمكن أن يستفاد منها في فك رموز القضية . فمثلاً عند دراسة معدلات ارتكاب الجريمة بشكل مفصل لكل فئة عمرية يمكن أن نستنتج أن هذا المعدل يقل بشكل عام لكنه يتزايد لفئة عمرية معينة .
  • 7. و بشكل عام، تهدف التجزئة العنقودية إلى وضع العناصر المتجانسة في مجموعات منفصلة . ويتم ضم أي عنصر في مجموعة بناءا على أن يكون هذا العنصر مائلاً للتشابه بعنصر منها أكثر من أن يكون شبيهاً لعنصر من مجموعة أخرى . أمثلة على التجزئة العنقودية
  • 8. 3 - شجر القرار Decision Trees شجرة القرار هي نموذج استكشافي يظهر على شكل شجرة . و يمثل كل فرع من فروعها سؤالاً تصنيفياً وتمثل أوراقها أجزاءاً من قاعدة البيانات تنتمي للتصنيفات التي تم بنائها .
  • 9. تقسيم الجرائم المرتكبة في أحدى ا لمناطق باستخدام خوارزمية شجر القرار إجمالي حوادث القتل التي وقعت 100 السؤال : جريمة القتل عمداً ؟ إجمالي حوادث القتل العمد 60 السؤال : عمر القاتل > 30 ؟ إجمالي حوادث القتل الخطأ 40 حوادث القتل العمد، العمر < 30 السؤال : الدافع هو السرقة ؟ 40 حوادث القتل العمد، العمر > من 30 20 حوادث القتل العمد، العمر > 30 والدافع ليس السرقة 10 حوادث القتل العمد، العمر < 30 والدافع هو السرقة 30 لا لا نعم نعم نعم لا
  • 10. استخدام شجرة القرار في التنبؤ ومن المهم جداً عند بناء خوارزمية شجرة القرار أن يؤخذ بعين الاعتبار أن تكون قابلة للتطبيق بقدر الإمكان وبشكل مثالي على كل البيانات المتوفرة . القاعدة الأساسية في بناء شجرة القرار هي إيجاد أفضل سؤال عند كل فرع من فروع الشجرة بحيث يقسم هذا السؤال البيانات إلى قسمين، القسم الأول منها ينطبق عليهم السؤال والقسم الثاني لا ينطبق، وهكذا يتم من خلال سلسلة من الأسئلة بناء شجرة القرار بفروعها المتسلسلة .
  • 11. الفرق بين شجر ة القرار والتجزئة العنقودية تهدف تقنية شجرة القرار إلى تقسيم قاعدة البيانات بهدف معين سبق وأن تم تحديده . قد تكون شجرة القرار أكثر تعقيداً من التجزئة العنقودية ولكنها تؤدي إلى نتائج يمكن إظهارها بشكل مبسط وفائدة عالية المستوى .
  • 12. 4 – الشبكات العصبية Neural Networks تعتبر الشبكات العصبية هي وأشجار القرار من أهم تقنيات التنقيب في البيانات، نظراً للنتائج الدقيقة التي يتم التوصل إليها باستخدام هذه الخوارزميات ولإمكانية تطبيقهما في حل العديد من المشاكل وبكافة الأنواع، هذا بالرغم من صعوبتهما والتي أدت لعدم الانتشار بشكل واسع لهما . خوارزمية الشبكة العصبية تشبه في تركيبتها تركيبة مخ الإنسان، فهي تعمل بنفس الطريقة كما يعمل المخ في نقل ومعالجة المعلومات والتوصل إلى الاستنتاجات واكتشاف الأنماط والتنبؤات ونستطيع من خلالها تطبيق بعض ما يطبقه المخ الطبيعي، رغم أن العلماء لا يزالون حتى اليوم يكتشفون المزيد ولم يلموا بكل تفاصيل عمل مخ الإنسان .
  • 13. المفهوم الشبكات العصبية الطبيعية . الشبكات العصبية الأصطناعية ANN . المكونات معمارية الشبكة العصبية الأصطناعية اسلوب المعالجة فى الشبكات العصبية الأصطناعية حالة توضيحية لأحد تطبيقات الشبكات العصبية الأصطناعية . خاتمة . * طريقة عمل خوارزمية الشبكات العصبية الأصطناعية كأحد تطبيقات علم الذكاء الأصطناعى
  • 14. لقد تعلم الانسان من خلقته التى خلقه الله عليها . فالشبكات العصبية فى عقل الأنسان تعمل بطريقة غاية فى الدقة والتعقيد . وأستطاع الانسان مــــن خلال فهمه لتركيبة تلك الشبكة الطبيعية وطريقـة تخزينها ومعالجتها للمعلـومات أن يحــاكى ذلـــك بإستعمال شبكات عصبية إصطناعية داخــــــــــل برامج الحاسب تقوم بحل العديد من المســــــــائل واتخاذ العديد من القرارات .
  • 15. و تعد الشبكات العصبية الأصطناعية أحد تطبيقات علم الذكاء الأصطناعى AI والذى يحظى بإهتمام كبير من الباحثين فى مجال علوم الحاسب وتكنولوجيا المعلومات ، لمـــــا تتيحه هذه النظم من قدرة كبيرة وسرعـــة عاليــــة فى إسترجاع كميات كبيرة من المعلومات والقدرة المتميزة فى التعرف على الأشكال نتيجة الأرتكاز على اسلــــوب المعالجة المتوازية Parallel processing . *
  • 16. ويمكن القــول بأن الشبكات العصبيـــة الأصطناعية ANNs هى عبارة عن تقنية معالجــــة المعلومات المنبثقة عن علم دراسة المخ Brain والنظــــــام العصبى Nervous system فى الأنسان . ولقد شهدت هذه التقنية دراسات عديدة من الباحثين تطورت مع التقدم فى علم دراسة الأعصاب لفهم آليات العقل فى عمليات الأستنتاج المنطقى والمعالجــــــــة ، لتحاكى بذلك العقل البشرى . 12.16
  • 17. المفهوم (1) الشبكة العصبية البشرية ( الطبيعية ) Biological Neural Networks يتكون مخ الأنســـان من بلايين من الخلايــــــا العصبية Neurons وأنواعها عديدة ومختلفة . تنتشر هذه الخلايا فى مجموعات تسمى شبكــات Networks شديدة التداخـــــــــــل فيما بينها Interconnected ولذلك ينظر لها علــــــى أنها تجمع من الشبكات العصبية . * 12.18
  • 18. يوجد بكل خلية عصبية نواة عصبية Nucleus فى المنتصف ولها بعض النهايات العصبية Dendrites وهى المسئولة عن المدخلات Inputs للخلية . يوجد بالخلية كذلك موصل طرفى Axon مسئول عن نقل المخرجات output من خلية الى اخرى .. الخ . * 12.19
  • 19. والواقع أن هذه الأطراف أو النهايات العصبية لجسم الخلايا العصبية تتصل بأطراف الخلايا الأخرى عن طريق مايسمى بنقطة المرور Synapse والتى تنتقل عبرها الأشـــــارات العصبيـــة وتتحكم فى زيادتهـا أو نقصانها . 12.20
  • 21. عن طريق محاكاة طرق الاستنتاج المنطقى عند الأنســـــــــــــــان Human Resoning ، وفى ظل إستحداث اسلــوب المعالجة المتوازية Parallel processing أمكن بناء حـــــــاسبات وبرمجيات ذكية ذات إمكــــــــانيات معمارية ومعـــالجية تحاكى بعض إمكانيات المعالــــــــج التى يقوم بها ذلك العقل البشرى . ولقد اطلق على تلك التقنية التى تحاكى العقل البشرى إسم ”الحساب العصبى“ Neural Computing أو الشبكات العصبية الأصطناعية Artificial Neural Networks (ANNs) * 12.23
  • 22. هى نموذج معالجة معلومات مستوحى من طرق النظــم العصبية الحيوية ليحاكى بذلك الشبكة العصبية الطبيعية . ترتكز تقنية المعالجة فى الشبكة العصبية الأصطناعيــــة علـــى مايعرف بعناصر المعالجــــــــــــة Processing Element (PE) والتى تسمى أيضا بالخلايا العصبية الأصطناعيـــــــــــة Artificial Neurons والتى تتصل فيما بينهــا فى شبكـة معمارية تعمل فى تنسيق لحل مشاكـــل معينـــــــة وهذه الخلايا الأصطناعية تناظر الخلايـــــــــا العصبية الطبيعية . 12.24 المفهوم ( إستمرار ) (2) الشبكة العصبية الأصطناعية Artificial Neural Networks
  • 23. تابع المخرجات الناتجة من الخلية الأصطناعية والتى تناظـــر الأشارات الخارجة من الخلية الطبيعية عن طريـــــــق الموصل الطرفى Axon تكون على شكل إشــــــارات صناعية يمكن تغييرها بطريقة تشـــابه تلك التى تحـــدث فى نقطــــة المــــــــرور Synapes بالشبكة الطبيعية
  • 24. التطبيقات التي ترتكز على إستخدام الشبكات العصبية الأصطناعية الشبكات العصبية أعطت حلولاً ذات كفاءة عاليـة للكثير من التطبيقات في العديد من المجالات نذكـر منها : تمييز الأنماط والتعرف على الصور . القدرة على التعرف على الصور المشوهة . إكمال الصور التي فقدت جزء منها، مثل الصور المرسلة بواسطة الأقمار الصناعية . عمليات التصنيف إلى عدد من الفئات . مثل تصنيف الحيوانات إلى أليفة و مفترسة .
  • 25. (3) مكونات الشبكة العصبية الأصطناعية تتكون الشبكة العصبية الأصطناعية ANN من مجموعة من عناصر المعالجة ( PE ) تركب بطرق مختلفة . وكل عنصر معالجة يستقبل أى عدد من المدخلات أو المتغيرات ويعطى أشارة خارجة واحدة . المدخلات يمكن ان تكون على صورة بيانات خام او تكون هى المخرجات من عناصر معالجة أخرى .
  • 26. مكونات الشبكة ( تابــــــع ) الأشارة الخارجة من نموذج الشبكة يمكن أن تكون النتيجة النهائية للمشكلة المطلوب حلها بإستخدام الشبكة أو تكون مدخلا لعنصر معالجة آخر . الشكل التالى يوضح نموذج عنصر المعالجة فى الشبكة العصبية الأصطناعية التى تحاكى الخلية العصبية فـــى العقل البشرى .
  • 27. An Artificial Neuron w 1j w 2j w 3j w ij x 1 x 2 x 3 x i f (x) y
  • 28. شكل يحاكى فكرة الخلية العصبية الطبيعية
  • 29. (4) معمارية الشبكة العصبية الأصطناعية ANN Toplogy يتم تجميع عناصر المعالجة فى مجموعات موزعة فى طبقات Layers لتكوين معمارية الشبكة العصبية الأصطناعية . يتألف معمار الشبكة العصبية الأصطناعية من مجموعة طبقات layers متتالية من عناصر المعالجة والترابطات .
  • 30. معمارية الشبكة ( تابع ) وتتعدد طوبولوجيات الشبكة العصبية الأصطناعية بمعنى اتصال الخلايا العصبية بطرق مختلفة مما يعطى أشكالا عديدة للشبكة . أبسط تركيب ممكن لشبكة عصبية هو التركيب الذى يتكون من طبقة واحدة من العناصر تربط ربطا مباشرا مدخلات الشبكة مع مخرجاتها .
  • 31. شبكة إصطناعية أحادية الطبقات مخرجات الشبكة مدخلات الشبكة
  • 32. شبكة إصطناعية ثنائية الطبقات Adjustable Weights Output Values Input Signals (External Stimuli)
  • 33. تابــــــــــــع نتيجة القصور فى أداء التركيب السابق ظهرت معماريات أخرى للشبكات تحتوى تراكيبها على أكثر من طبقة من عناصر المعالجة والتى تعرف بالشبكات متعددة الطبقات Multi Layer Networks والتى تتكون من : طبقة المدخلات Input layer الطبقة / أو الطبقات الخفية Hidden Layers طبقة المخرجات Output Layer
  • 34. شبكة إصطناعية متعددة الطبقات الطبقة الخفية الأولى طبقة المخرجات طبقة المدخلات عنصر معالجة (PE) الطبقة الخفية الثانية
  • 35. تابــــــــــــــع فى ضوء المعماريات السابقة يستخدم الباحثون أنواع وتقنيات متعددة فى تصميم الشبكات العصبية الأصطناعية : 1 - شبكات التغذية الأمامية . Feed-Forward Networks وهى تسمح للاشارات بالمرور فى اتجاه واحد فقط one way من المدخل الى المخرج . والشبكات العصبية من هذا النوع تميل الى ان تكون شبكات ربط المدخلات بالمخرجات مباشرة .
  • 36. مثال لشبكة عصبية ذات تغذية أمامية طبقة الاخراج طبقة مخفية داخلية طبقة الادخال مخرجات مدخلات
  • 37. تابع 2- شبكات الانتشارالخلفى ( أو العكسى ) : Back- propagation Networks وهى تحتوى على إشارات تمر فى كلا الاتجاهين بإدخال حلقات تكرار فى الشبكة . هذا النوع من الشبكات قوى جدا ومعقد الى درجة كبيرة هذا النوع من الشبكات تتغير حالاتها بإستمرار الى أن تصل الى نقطة التوازن .
  • 38. مثال لشبكة عصبية ذات تغذية عكسية طبقة الاخراج طبقة مخفية داخلية طبقة الادخال مخرجات مدخلات
  • 39. (5) معالجة المعلومات فى بيئة الشبكات العصبية الأصطناعية ترتكز عملية معالجة المعلومات على مجموعة من العناصر : المدخلات Inputs كل مدخل هنا يمثل صفة مميزة واحدة attribute . المخرجات Outputs وهى تمثل قرار ( ناتج ) حل المشكلة التى نحن بصددها .
  • 40. تابع الأوزان Weights - يعتبر الوزن هو العنصر الرئيسى key element فى الشبكات العصبية الأصطناعية ANN . - يعبر الوزن عن الأهمية النسبية أو القيمة الحسابية للبيانات المدخلة الى عناصر المعالجة .
  • 41. تابـــــع دالة الجمع Summation function تقوم هذه الدالة بحساب الوزن المتوسط لكل المدخلات الى عنصر المعالجة وذلك بضرب كل قيمة مدخلة X j ) ) فى وزنها النسبى ( W j ) فيتم إيجاد المجموع ( Y ) كالآتى : لخلية عصبية واحدة Y = Σ n j X i W j لأكثر من خلية عصبية j Y j = Σ j X i W jj
  • 42. a) Single neuron S j f(S j ) Y j x o x 1 x 2 x n +1 w j0 w j1 w j2 w jn
  • 43. b) Several neurons X1 X2 W11 W22 W21 W12 W23 PE PE PE Y1 Y2 Y3 Y1=x1w11+x2w21 Y2=x1w12+x2w22 Y3=x2w23
  • 44. تابـــــــع دالة الأنتقال : وهى الدالة المسئولة عن تعديل وتحويل القيمة الناتجة عن عملية الجمع إلى أحد القيم التي يفترض أن تكون ضمن نواتج الشبكة المرغوب بها وذلك فى ضوء مستوى الأستثارة ( أو التفضيل ) Activation level الذى تتسم به كل خلية عصبية . ويرمز للقيمة المحولة Transformed للمجموع بالرمز Y t Y t = 1 1+e -y
  • 45. تابـــــــــع وتهدف عملية التحويل الى تحسين مستويات المخرجات الى قيمة معقولة بين (1) و (0) . خاصة وأن قيمة المخرجات يمكن ان تكون كبيرة جدا فى حالة وجود أكثر من طبقة . والقيمة Y t أحيانا تسمى بالقيمة المعدلة Normalized وعملية التعديل يمكن أن تتم على القيمة الجارية من كل عنصر معالجة أو تتم على القيمة النهائية الناتجة من الشبكة .
  • 46. Example of ANN Function Summation function: Y=3(0.2)+1(0.4)+2(0.1)=1.2 Transformation (Transfer) function : Y t = 1 1+e -1.2 = 0.77 X 1 =3 S j f(S j ) Y=1.2 W 1 =0.2 X 2 =1 X 3 =2 W 2 =0.4 W 3 =0.1
  • 47. تابــــــــــع دالة التعلم Learning function تتعلم الشبكة العصبية الأصطناعية من أخطائها . تشمل عملية التعلم ثلاثة مهام : - حساب المخرجات . - مقارنة المخرجات مع إجابات محددة مسبقا ( الناتج المستهدف ). - تعديل الأوزان وإعادة المعالجة .
  • 48. تابــــــــــع وتبدأ المعالجة بوضع قيم عشوائية للأوزان حسب قيمة الأنحراف وهو الفرق بين المخرجات الحقيقية ( Y ) والمخرجات المطلوب تحقيقها من الشبكة وهى ( Z ) وبتعديل قيم الأوزان تصل قيمة الأنحراف الى الصفر . وعندها تكون المخرجات الحقيقية هى نفسها المخرجات المطلوبة .
  • 49. شكل يوضح نموذج دالة التعلم Compute Output Adjust Weights Stop Is Desired output Achieved? No Yes
  • 50. طرق تعليم شبكة عصبية تتعلم الشبكة عن طريق إعطائها مجموعة من الأمثلـــة، التي يجب أن تكون مختارة بعناية، لأن ذلك سيساهم في سرعة تعلم الشبكة . ومجموعة الأمثلة هذه تسمى فئـــة التدريب . وتنقسم طرق تعليم شبكة عصبية إلى قسمين حسب فئة التدريب التي تعرض على الشبكة . وهما :
  • 51. تابع التعليم بواسطة معلم Supervised Learning: في هذه الطريقة تكون فئة التدريب التي تعرض على الشبكة عبارة عن زوجين من المتجهات، متجه المدخلات وهو عبــارة عن القيم المدخلة للشبكة، ومتجه المخرجات وهو عبـــارة عن القيم التي يجب أن تخرجها الشبكة . مثال : Input:(0 1 0 1 0 0 0 1) Output:(0 1 1) 
  • 52. تابع التعلم الذاتى ( بدون معلم ) Unsupervised learning: في هذه الطريقة تكون فئة التدريب عبارة عن متجـــه المدخلات فقط دون عرض المخرجات على الشبكة . فى هذه الحالة تقوم الشبكة بتعديل الأوزان بنفسها دون تدخل من المعلم للوصول الى القيمة المستهدفة .
  • 53. مثال تطبيقي لكي يتم التنبؤ باستخدام الشبكة العصبية، يتم إدخال قيم المتغيرات المعلومة في العقد المخصصة للإدخال، ويصبح لكل عقدة قيمة المتغير الذي تم إدخاله، بعد ذلك يتم ضرب قيمة كل عقدة بقيمة الرابط المتصل بها لنحصل على النتيجة . وهنا تم اعتبار أنه إذا كانت النتيجة 1 يكون من المتوقع إقدام الشخص على ارتكاب الفعل المذكور، وإذا كانت 0 فيكون من المتوقع عدم الاستجابة . تم التعبير عن العمر بقيمة تقع بين 0.0 و 1.0 وهي هنا 0.47 ، وهذا يمثل عمر 47 سنة، والدخل بالقيمة 0.65 ، وهذا يمثل دخلاً بقيمة 65000$ . بالنسبة ل لوصلات والتي تعبر عن الأوزان فقد تم تقديرها بالقيم 0.7 ، 0.1 على الترتيب وذلك بناء على معرفتنا بسجلات سابقة من قاعدة البيانات . بعد ضرب قيم العقد في قيم الوصلات وجمعها نحصل على قيمة المتغير الذي نريد التوقع له فيكون هنا 0.39 وهو رقم أقرب للصفر منه للواحد الصحيح وبذلك تكون النتيجة هي عدم احتمال ارتكاب الشخص للفعل المذكور .
  • 54. شكل توضيحي للمثال الشكل التالي يبسط ما تم عمله في المثال السابق
  • 55. العقد المخفية في الشبكات العصبية قد تحتوي خوارزمية الشبكة العصبية على نوعية أخرى من العقد والتي تسمى العقد المخفية . مهمة هذه العقد استشارية ولا يؤخذ بقيمها إلا بعد أن يتم اعتماد استشارتها في حالة صحتها وبعد التجربة الفعلية . ومثلما يحدث في الجيش، فالقائد يستمع إلى العديد من الاستشارات ممن حوله من المستشارين قبل اتخاذ قرار معين، ولكنه بعد اتخاذ القرار واستكشاف نتائجه ومدى صحته، يصبح بإمكانه تمييز المستشارين الجيدين والذين كانت آرائهم أقرب للقرار الذي كان من المفترض أن يكون أنسب، وبالتالي سوف يعتمد آرائهم في المستقبل ويأخذ بها أكثر من آراء غيرهم، وهكذا، فالعقد المخفية تلعب نفس هذا الدور، كلما تم تطبيق الخوارزمية يتم تطوير وتحديث العقد الأصلية بأن تأخذ بالاعتبار قيم العقد المخفية المناسبة والتي تدعم الحصول على نتائج أكثر دقة، وبالمقابل يتم إهمال قيم العقد المخفية التي لم تحقق ذلك .
  • 56. 5 – استقراء القاعدة Rule Induction أن تقنية استقراء القاعدة من التقنيات الأساسية في التنقيب في البيانات وأكثرها شيوعا في مجال استكشاف المعرفة، وهي أقرب ما تكون إلى ما يسمى بعملية التنقيب بحد ذاتها، والذهب في هذه الحالة هو &quot; القاعدة” . تبين هذه القاعدة ما يجري داخل قاعدة البيانات وتظهر لنا ما لم نكن نعرفه من قبل، وربما أيضاً ما لن نستطيع أن نعرفه إلا من خلالها .
  • 57. كيف ن س تكشف القاعدة في تحليل قاعدة بيانات سجلات الجريمة في الشرطة يمكن أن نستكشف القاعدة الشيقة التالية : &quot; إذا ارتكب المجرم الجريمة من النوع A فإنه يرتكب الجريمة من النوع B معها باحتمال 80% ، وهذه الثنائية تحدث بإجمالي 3% من كافة الجرائم المسجلة &quot; . ولكي تكون القاعدة مكتملة وذات فائدة، فإنه يلزم لها تقييم، وهو عبارة عن نوعين إضافيين من المعلومات التي يجب أن تلازمها، وهذه المعلومات الإضافية هي : الصحة Accuracy : كم هي نسبة صحة القاعدة ( وقوع النتيجة في حال وقوع السبب ). التغطية Coverage : كم نسبة السجلات المحققة للقاعدة إلى كافة السجلات في قاعدة البيانات .
  • 58. مثال تطبيقي لطريقة تقييم القاعدة في أحد أمثلة تحليل قاعدة بيانات الحوادث، ليكن لدينا القاعدة التالية : &quot; إذا ارتكب السائق 10 مخالفات سير فإنه يرتكب حادث يؤدي إلى القتل &quot; والأعداد التالية كما يلي : T   = 100 : العدد الكلي للسجلات في قاعدة البيانات K   = 30  : عدد سجلات السائقين الذين ارتكبوا حادث أدى إلى القتل L = 40  : عدد سجلات السائقين الذين ارتكبوا 10 مخالفات سير B   = 20  : عدد سجلات السائقين الذين ارتكبوا 10 مخالفات سير وحادث أدى إلى القتل معاً . فتكون نسبة صحة القاعدة هي حاصل قسمة عدد سجلات السائقين الذين ارتكبوا 10 مخالفات سير وحادث أدى إلى القتل معاً مقسوماً على عدد سجلات السائقين الذين ارتكبوا 10 مخالفات سير . وتكون في هذه الحالة مساوية لـ 40/20=50%. أما التغطية فتكون حاصل قسمة عدد سجلات الذين ارتكبوا 10 مخالفات سير مقسوماً على العدد الكلي للسجلات في قاعدة البيانات . وهي هنا تساوي 40/100 = 40 %. 
  • 59. رسم توضيحي للمثال كل الحوادث حوادث سير أدت للقتل مرتكبو 10 مخالفات مرتكبو 10 مخالفات وحادث مؤدي للقتل ليس من المجموعتين
  • 60. استثمار القاعدة إن استخدامات القاعدة كثيرة، فمن الممكن تحديد الكثير من القرارات المبنية على قواعد يتم استكشافها في قواعد البيانات . مثلاً، يمكن لأجهزة الأمن أن تستكشف كافة القواعد الخاصة بارتكاب جريمة معينة، بان تكون طرفاً مستقلاً فيها ( الأيمن ) ، وتتفحص مدى تأثير وقوعها على وقوع الجرائم الأخرى، أو حتى على ارتباطها بصفات معينة لدى المجرم وهل من الضروري اتخاذ خطوات معينة في خطتها للحد من هذه الجريمة، أو إذا أرادت وضع قيود معينة فهل سيكون هناك تأثير على ارتكاب الجرائم الأخرى .
  • 61. اختيار تقنية التنقيب المناسبة أخيراً، لا يوجد نظرية محددة يتم بناء عليها اختيار تقنية من تقنيات التنقيب، ويتم الاختيار عادة بناءاً على الخبرة في هذا المجال والتجربة الفعلية للتقنيات ومدى فاعليتها، ومن جهة أخرى قد تكون المفاضلة أيضاً بين التقنيات التقليدية والتقنيات الحديثة بقدر ما يكون هناك توفراً للأدوات المناسبة ، ومع ازدياد الخبرة نستطيع أن نقيّم الخيارات ونحدد منها المناسب ونطبقه .
  • 62. تخطيط عمليات التنقيب في قواعد البيانات إن تخطيط عمليات التنقيب في قواعد البيانات من الأمور المهمة للحصول على أفضل النتائج، فالتخطيط الجيد يؤدي للنتائج الجيدة . ويمكن تلخيص الخطوات الأولية للتنقيب في قواعد البيانات في ما يلي : 1 – تحديد المشكلة المراد بحثها وإيجاد الحلول لها 2 – بناء قاعدة بيانات التنقيب 3 – استكشاف البيانات 4 – تحضير البيانات للتنقيب 5 – بناء نموذج التنقيب المناسب 6 – تطبيق النموذج 7 – استخراج النتائج
  • 63. مراحل تطور استخدام تكنولوجيا المعلومات ونوعية الأسئلة التي وفرت لنا إجاباتها في كل مرحلة التنقيب في قواعد البيانات Data Mining (Emerging Today) ماذا يمكن أن يحدث لطبيعة الجرائم المرتكبة في مدينة الرياض الشهر القادم، ولماذا ؟ مستودعات البيانات ودعم القرار Data Warehousing & Decision Support (1990s) ” ما نوعية الجرائم التي وقعت في مدينة الرياض في شهر مارس الماضي ، مع مقارنة لكل المدن الأخرى ؟ ” الوصول للبيانات Data Access (1980s) ” ما نوعية الجرائم التي وقعت في مدينة الرياض في شهر مارس الماضي؟” تجميع البيانات Data Collection (1960s) ” كم كان مجموع الجرائم في السنوات الخمس الأخيرة ؟ ” مرحلة التطور في استخدام تكنولوجيا المعلومات السؤال الذي توفر إجابته تلك التكنولوجيا
  • 64. تطبيقات عملية في المجال الأمني والاستخباراتي في المجال الجنائي في مجال شرطة المرور في مجال الدفاع المدني في مجال الاستخبارات الاقتصادية والتجارية في مجال الاستخبارات بشكل عام استخدامات عامة
  • 65. قواعد بيانات قواعد بيانات قواعد بيانات تنسيق وتعاون تنسيق وتعاون تحليل وتنقيب معرفة حقيقية سياسات وخطط ولوائح تنفيذية وإجراءات الأمن