Discriminant Analysis of Hematological Parameters in Breast Cancer Patients and Healthy Women: A Comparative Statistical Study
DOI:
https://doi.org/10.69667/ajs.25323Keywords:
Breast cancer; hematological parameters; discriminant analysis; statistical differences.Abstract
This research aims to analyze the differences in basic hematological parameters between healthy women and breast cancer patients. The goal is to understand the physiological effects of the disease on blood components and to evaluate the ability of these indicators to predict health status using one of the most important multivariate statistical methods: linear discriminant analysis. The sample consisted of 200 women (100 breast cancer patients and 100 healthy women). Data were collected from the records of the National Cancer Institute in Sabratha between August 2023 and January 2024. The data included six major hematological variables: red blood cells (RBCs), hemoglobin (Hb), hematocrit (HCT), mean corpuscular volume (MCV), white blood cells (WBCs), and platelets. The research employed an independent samples t-test to measure the differences between the two groups, in addition to applying discriminant analysis to identify the variables that contributed most to the segregation. The t-test results showed statistically significant differences in all hematological parameters. Breast cancer patients exhibited a marked decrease in platelets (HCT, Hb, and RBC) and a significant increase in white blood cells (WBC), reflecting physiological changes associated with the disease. Statistical hypothesis tests confirmed the validity of the data for discriminatory analysis, including the homogeneity of the variance-covariance matrices and the absence of multicollinearity among the variables. The discriminatory analysis demonstrated that the extracted function had high power to separate the two groups, with a canonical correlation of 0.899, a latent root value of 3.80, and a Wilkes lambda of 0.208, indicating high explanatory power. The structure matrix showed that HCT, Hb, and RBC were the most significant contributors to the discriminatory effect. The discriminatory function achieved an overall classification accuracy of 91%, demonstrating the effectiveness of the predictive model for classification based on hematological parameters.
يهدف هذا البحث إلى تحليل الفروق في المعايير الدموية الأساسية بين النساء الأصحاء ومرضى سرطان الثدي، وذلك بهدف فهم التأثيرات الفسيولوجية للمرض على مكوّنات الدم، وتقييم قدرة هذه المؤشرات على التنبؤ بالحالة الصحية باستخدام أحد أهم أساليب الإحصاء متعدد المتغيرات، وهو تحليل التمييز الخطي. اشتملت العينة على 200 امرأة بواقع (100 مريضة بسرطان الثدي و100 سليمة)، وتم جمع البيانات من سجلات المعهد القومي للأورام بصبراتة خلال الفترة من أغسطس 2023 حتى يناير 2024، وشملت خمسة متغيرات دموية رئيسية هي: كريات الدم الحمراء (RBC)، الهيموجلوبين (Hb)، الهيماتوكريت (HCT)، كريات الدم البيضاء (WBC)، والصفائح الدموية (Platelets).اعتمد البحث على اختبار (t) لعينتين مستقلتين لقياس الفروق بين المجموعتين، إضافةً إلى تطبيق تحليل التمييز لتحديد المتغيرات الأكثر مساهمة في عملية الفصل. أظهرت نتائج اختبار (t) وجود فروق دالة إحصائياً في جميع المؤشرات الدموية، حيث سجّلت مريضات سرطان الثدي انخفاضاً واضحاً في Platelets) HCT, Hb, (RBC, مقابل ارتفاع دال في (WBC) وهو ما يعكس التغيرات الفسيولوجية المرتبطة بالمرض. كما أكدت اختبارات الافتراضات الإحصائية صلاحية البيانات لتحليل التمييز، بما في ذلك تجانس مصفوفات التباين–التغاير وعدم وجود تعدد خطي بين المتغيرات. وبيّن تحليل التمييز أن الدالة المستخرجة تمتلك قدرة عالية على الفصل بين المجموعتين، إذ بلغ الارتباط الكنسي 0.899 ، وقيمة الجذر الكامن 3.80 ، ولامبدا ويلكس 0.208 ، مما يشير إلى قوة تفسيرية مرتفعة. وأظهرت مصفوفة البنية أن متغيرات (HCT, Hb, RBC) كانت الأكثر إسهاماً في التمييز. كما حققت الدالة التمييزية دقة تصنيف كلية بلغت 91%، مما يدل على فعالية النموذج التنبؤي في التصنيف المبني على المعايير الدموية
Downloads
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Alqalam Journal of Science

This work is licensed under a Creative Commons Attribution 4.0 International License.





