Computer science student at UANL, and aspiring data scientist.
Contact: ismael.sandoval.aguilar@gmail.com
View My LinkedIn Profile
“mpExtractor” es un conjunto de scripts, escritos en python, que permiten obtener las calificaciones de maestros del sitio web “MisProfesores.com” en un dataframe o archivo csv.
Para utilizar los scripts “htmlToDataframe.py” y “dataAnalyzer” es necesario instalar las siguientes librerías a traves del gestor de paquetes pip.
pip install requests
pip install beautifulsoup4
pip install pandas
Si se desea exportar los resultados a un archivo PDF, es necesario instalar las siguientes librerías.
pip install dataframe-image
pip install fpdf
También es necesario tener Google Chrome instalado.
Únicamente ejecutar el script “mpExtractor” e introducir una URL válida del sitio MisProfesores.com que corresponda a una facultad o escuela. Por ejemplo:
https://www.misprofesores.com/escuelas/UANL-FCFM_2263
Posteriormente se desplegarán una serie de opciones como:
El orden toma en cuenta el número de reseñas de cada maestro: es decir, tiene más peso un maestro con 9 de calificación pero (por ejemplo) 20 reseñas, que uno con la misma calificación pero solo con 5 reseñas. Además, tambien se encuentra en una de las carpetas una Jupyter Notebook, por si se desea experimentar directamente con el dataset.
Al ingresar la URL se obtiene la siguiente tabla que muestra el top de profesores con mejores puntuaciones y mayor número de reseñas:
Apellido, Nombre | # de calif. | Promedio | |
---|---|---|---|
0 | Gómez Pérez , Diego Gerardo | 46 | 9.9 |
1 | Guajardo , Elizabeth | 43 | 9.6 |
2 | Guerrero Ceja , Yazmany Jahaziel | 60 | 9.4 |
3 | arias , adriana | 40 | 9.3 |
4 | Barragan Amigón , Abraham Benito | 37 | 9.1 |
5 | Tlahuice Flores , Alfredo | 38 | 9.1 |
6 | Garza Garza , Luis Gerardo | 31 | 8.6 |
7 | Rodríguez , rodrigo | 30 | 8.5 |
8 | Rodriguez , Victoria Celeste | 42 | 8.3 |
9 | Contreras Mendoza , Abigail | 47 | 8.2 |
10 | Moller Garza , Jonathan Ricardo | 72 | 8.1 |
Este proyecto es un prototipo y podría contener errores. Además, también podría modificarse completamente en el futuro.