شرح التصنيف الائتماني – بيان المشكلة
حيث أن التصنيف الائتماني هو أحد التطبيقات المالية العالمية المثيرة للاهتمام التي قد يواجهها عالم البيانات فيما وراء تصنيف مجموعة بيانات و تختلف عن المشاكل على مستوى الفصول الدراسية.
التصنيف الائتماني/Credit Scoring
إذن ما هو التصنيف الائتماني؟ وفقًا للموسوعة الاستثمارية (إنفستوبيديا/Investopedia):
التصنيف الائتماني هو تحليل إحصائي يقوم به المقرضون والمؤسسات المالية للوصول إلى الجدارة الائتمانية للشخص.
ويُستخدم المقرضون التصنيف الائتماني للمساعدة في اتخاذ قرار بشأن تقديم الائتمان أو رفضه.
بعبارة واضحة، عندما يطلب العميل قرضاً /الحصول على ائتمان من مقرض، يتعين على المقرض أن يعرف مدى خطورة إقراض ذلك العميل للأموال، ويتم التعبير عن هذه المخاطرة باستخدام ما يسمى بتصنيف الائتمان؛ حيث عادة ما تكون لدى مكاتب الائتمان مجموعة من المعايير فيما يتعلق بكيفية حساب التصنيف وتحديد ترجيحات معينة لمختلف السمات المالية، مثل تاريخ سداد العملاء، والديون، وطول فترة الائتمان، وما إلى ذلك.
في حالة العميل الذي ليس لديه حسابات بنكية، قد يكون من الصعب حساب هذه النتيجة نظرًا لأن معظم السمات المطلوبة مفقودة أو يصعب الحصول عليها. تتمثل إحدى الطرق التي يتغلب بها مقدمو القروض على هذا في مطالبة العملاء بتقديم مجموعة من المستندات المالية التي تشير إلى قدرتهم على سداد القرض. في بعض الأحيان يتم عمل زيارات ميدانية إضافية لمتابعة والاستعلام عن الأصول المملوكة ومستوى المعيشة والسمعة في العمل .. إلخ.
يقرر مسؤول القرض الحكم النهائي بشأن الموافقة على طلب القرض أم لا بعد تقييم طلب العميل والمعلومات الأخرى التي تم جمعها، حيث يتضح أن هذه العملية تتطلب قدر كبير من العمالة وتكون غير فعالة وقد لا تتناسب مع حجم الطلبات الواردة، كما أن القرار النهائي يكون عرضة لانحياز مسؤول القرض، مما يشكل تحديًا كبيرًا في التعامل مع المشكلة.
عمل إطار للتصنيف الائتماني مثل إطار مشكلات التعلم الآلي
إن صياغة مشكلة التصنيف الائتمانية مثل مشكلة التعلم الآلي الخاضعة للإشراف لتعالج العديد من قيود العملية اليدوية وذلك بهدف محاكاة القرار الصادر عن الطرف المُقرض، فإن النهج الأكثر وضوحًا هو صياغة المشكلة كمشكلة تصنيف ثنائي مع متغير مستهدف يحدد حالة العميل؛ لتتم الموافقة على القرض المطلوب أو رفضه. نود في الأساس أن يحل نموذجنا مكان مراجع (مراجعي) الطلب، لذلك سنقوم بإدخال نفس البيانات التي يعالجها مسؤول القروض، وهو ما يقودنا إلى جوهر أي تقنية تعتمد على البيانات.
البيانات
أحد مصادر بيانات الإدخال الرئيسية التي من شأنها أن تغذي نموذج طلب العميل جنبًا إلى جنب مع المعلومات التي تم جمعها مسؤول القرض بمزيد من الاستفسارات. قد يكون مصدر البيانات:
المعلومات الشخصية: مثل الاسم والجنس والعمر والعنوان والمسمى الوظيفي والحالة الاجتماعية وملكية المنزل.
السمات المالية: مثل الدخل ومبلغ الإيجار وحدود بطاقات الائتمان والتأمين والرهون العقارية القائمة.
تجدر الإشارة إلى أنه إذا أراد الطرف المُقرض تقليل تكلفة العمالة للعملية، أي تقليل الزيارات الميدانية، فمن الأفضل عدم تضمين السمات التي تم جمعها من تلك الزيارات في بيانات الإدخال. إذا كان مقدم الطلب عميلاً دائمًا، أي أنه سبق تقديم طلب للحصول على قرض، فإن مصدر البيانات الآخر الذي يمكن أن يكمل البيانات المذكورة أعلاه هو البيانات التاريخية لسداد القرض، وقد يشمل ذلك:
حالة طلب القرض السابق: تشير إلى ما إذا كان العميل قد تم قبوله أو رفضه مسبقًا
حد القرض السابق: يشير إلى مبلغ القرض المطلوب في طلب سابق
مدفوعات القرض: المبلغ المسدد من القروض الممولة السابقة
التأخر في السداد: السداد في الموعد، متأخر أو مبكر
وهذا ليس سوى جزء من كل بالنسبة للسمات الممكنة، فقد تكون جميع السمات المذكورة أعلاه مفيدة للغاية للنموذج، إلا أن مجموعات البيانات الأولية ليست كذلك في العادة.
تأتي مجموعات البيانات في العالم الواقعي مع مجموعة من التحديات الخاصة بها، مثلما الحال في القول "فأما الزبد فيذهب جفاء"، لذلك يجب أن تكون البيانات ذات جودة. علاوة على ذلك، قد تكون تكلفة التنبؤ الخاطئ في أحد التطبيقات المالية باهظة الثمن، ويمكن التخفيف من حدتها عن طريق تحسين جودة البيانات. لهذه الأسباب، يتم إنفاق قدر كبير من الوقت في تحليل البيانات وإزالة السمات غير ذات الصلة والقضاء على تسرب البيانات ومعالجة التحيز وتحويل المدخلات الأولية إلى سمات نموذج قابلة للقراءة وأكثر من ذلك بكثير من أجل التغلب على بعض التحديات والصعوبات الشائعة التي تواجه بيانات التصنيف الائتماني في مقالة خاصة بها.
النتيجة
في الختام، في هذه المقالة تم شرح مشكلة التصنيف الائتماني العامة بالإضافة إلى قيود تنفيذ العملية بطريقة يدوية، ليتم بعد ذلك تحديد إطار عمل التعلم الآلي الذي يحاكي قرار الطرف المُقرض لمعالجة تلك القيود. وأخيرًا، تم طرح مصدرين محتملين للبيانات التي يمكن أن يستخدمها النموذج.
Comments