[ Détection d’accouchement des femmes par voie césarienne en utilisant l’apprentissage automatique ]
Volume 39, Issue 1, March 2023, Pages 156–172
MASIKA MUYISA Dorcas1, Héritier Nsenge Mpia2, and KAHAMBU KYAVARANGA Gisèle3
1 Département d’Informatique de Gestion, Université de l’Assomption au Congo, B.P. 104, Butembo, Nord-Kivu, RD Congo
2 Département d’Informatique de Gestion, Université de l’Assomption au Congo, B.P 104, Butembo, Nord-Kivu, RD Congo
3 Département d’Informatique de Gestion, Université de l’Assomption au Congo, B.P. 104, Butembo, Nord-Kivu, RD Congo
Original language: French
Copyright © 2023 ISSR Journals. This is an open access article distributed under the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
The aim of this study was to determine, using Machine Learning (ML) algorithms, whether a pregnant woman will give birth by caesarean or not. The study is based on quantitative analysis using secondary data from the obstetric department of the Wanamahika Hospital in the city of Butembo, the Democratic Republic of Congo, over a period of one year and seven months in 2019 and 2020. The used dataset comprises 1501 records. Six ML models, namely: the Decision Tree, the Support Vector Machines, the Artificial Neural Networks, the k-Nearest Neighbors, the Random Forest as well as the Logistic Regression (LR), were built to predict the mode of women deliveries. The evaluation metrics used to evaluate those models were accuracy, f1-score, precision and recall. The authors found that cesarean deliveries represented 33.8% of their study sample while vaginal deliveries represented 66.2%. Of those six ML models created, LR was validated as it performed better with an accuracy reaching 98.85%, a recall, a precision, and a f1-score of 0.99, respectively. At the end of the investigation, the researchers retained LR in order to deploy a Web application that detect the mode of women deliveries in the hospital using Flask. Nineteen features revealed to be predictors of delivering in caesarean mode in the City of Butembo that are Referred by the health center, Age of the mother, Origin of the mother, Age of the pregnancy, HIV test result, Antepartum hemorrhage, Uterine rupture, Eclampsia and pre-eclampsia, Active management of the third period of labor, Indications for cesarean section, Number of previous cesarean sections, Episiotomy, Theobald, Cytotec, Sex of live birth, Obstetric formula, Weight of newborn in grams, Number of days in hospital, Number of days before delivery.
Author Keywords: Cesarean delivery, Machine Learning, Data Mining, Data Analysis.
Volume 39, Issue 1, March 2023, Pages 156–172
MASIKA MUYISA Dorcas1, Héritier Nsenge Mpia2, and KAHAMBU KYAVARANGA Gisèle3
1 Département d’Informatique de Gestion, Université de l’Assomption au Congo, B.P. 104, Butembo, Nord-Kivu, RD Congo
2 Département d’Informatique de Gestion, Université de l’Assomption au Congo, B.P 104, Butembo, Nord-Kivu, RD Congo
3 Département d’Informatique de Gestion, Université de l’Assomption au Congo, B.P. 104, Butembo, Nord-Kivu, RD Congo
Original language: French
Copyright © 2023 ISSR Journals. This is an open access article distributed under the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Abstract
The aim of this study was to determine, using Machine Learning (ML) algorithms, whether a pregnant woman will give birth by caesarean or not. The study is based on quantitative analysis using secondary data from the obstetric department of the Wanamahika Hospital in the city of Butembo, the Democratic Republic of Congo, over a period of one year and seven months in 2019 and 2020. The used dataset comprises 1501 records. Six ML models, namely: the Decision Tree, the Support Vector Machines, the Artificial Neural Networks, the k-Nearest Neighbors, the Random Forest as well as the Logistic Regression (LR), were built to predict the mode of women deliveries. The evaluation metrics used to evaluate those models were accuracy, f1-score, precision and recall. The authors found that cesarean deliveries represented 33.8% of their study sample while vaginal deliveries represented 66.2%. Of those six ML models created, LR was validated as it performed better with an accuracy reaching 98.85%, a recall, a precision, and a f1-score of 0.99, respectively. At the end of the investigation, the researchers retained LR in order to deploy a Web application that detect the mode of women deliveries in the hospital using Flask. Nineteen features revealed to be predictors of delivering in caesarean mode in the City of Butembo that are Referred by the health center, Age of the mother, Origin of the mother, Age of the pregnancy, HIV test result, Antepartum hemorrhage, Uterine rupture, Eclampsia and pre-eclampsia, Active management of the third period of labor, Indications for cesarean section, Number of previous cesarean sections, Episiotomy, Theobald, Cytotec, Sex of live birth, Obstetric formula, Weight of newborn in grams, Number of days in hospital, Number of days before delivery.
Author Keywords: Cesarean delivery, Machine Learning, Data Mining, Data Analysis.
Abstract: (french)
L’objectif de cette étude a été de déterminer, à l’aide d’algorithmes de Machine Learning (ML), si une femme enceinte accouchera par césarienne ou non. L’étude a été basée sur une analyse quantitative utilisant des données secondaires du service d’obstétrique de l’hôpital Wanamahika dans la ville de Butembo, en République démocratique du Congo, sur une période d’un an et sept mois, 2019 et 2020. L’ensemble de données utilisé comprend 1501 enregistrements sur les données des femmes. Six modèles ML, à savoir: l’arbre de décision, les machines à vecteur de support, les réseaux neuronaux artificiels, les k-voisins les plus proches, la forêt aléatoire ainsi que la régression logistique (RL), ont été construits pour prédire le mode d’accouchement des femmes. Les mesures d’évaluation utilisées pour évaluer ces modèles étaient l’exactitude, le f1-score, la précision et le rappel. Les auteurs ont constaté que les accouchements par césarienne représentaient 33,8 % de leur échantillon d’étude, tandis que les accouchements par voie vaginale en représentaient 66,2 %. Parmi les six modèles ML créés, c’est le modèle RL qui a été validé car il a donné les meilleurs résultats avec une exactitude atteignant 98,85 %, un rappel, une précision et un f1-score de 0,99, respectivement. À la fin de l’étude, les chercheurs ont retenu RL afin de déployer une application Web qui détecte le mode d’accouchement des femmes dans l’hôpital en utilisant Flask. Dix-neuf caractéristiques se sont révélées être des prédicteurs de l’accouchement par césarienne en Ville de Butembo, à savoir: orientation par le centre de santé, âge de la mère, origine de la mère, âge de la grossesse, résultat du test VIH, hémorragie antepartum, rupture utérine, éclampsie et pré-éclampsie, Gestion active de la troisième période du travail, Indications pour une césarienne, Nombre de césariennes précédentes, Épisiotomie, Théobald, Cytotec, Sexe du nouveau-né vivant, Formule obstétricale, Poids du nouveau-né en grammes, Nombre de jours d’hospitalisation, Nombre de jours avant l’accouchement.
Author Keywords: Accouchement par césarienne, Machine Learning, Data Mining, Analyse des données.
How to Cite this Article
MASIKA MUYISA Dorcas, Héritier Nsenge Mpia, and KAHAMBU KYAVARANGA Gisèle, “Detecting women’s cesarean deliveries using machine learning,” International Journal of Innovation and Applied Studies, vol. 39, no. 1, pp. 156–172, March 2023.