Ismael Sandoval

Logo

Computer science student at UANL, and aspiring data scientist.

Contact: ismael.sandoval.aguilar@gmail.com

View My LinkedIn Profile

View My GitHub Profile

mpExtractor

Ver proyecto en GitHub

“mpExtractor” es un conjunto de scripts, escritos en python, que permiten obtener las calificaciones de maestros del sitio web “MisProfesores.com” en un dataframe o archivo csv.

Instalación

Para utilizar los scripts “htmlToDataframe.py” y “dataAnalyzer” es necesario instalar las siguientes librerías a traves del gestor de paquetes pip.

pip install requests 
pip install beautifulsoup4
pip install pandas 

Si se desea exportar los resultados a un archivo PDF, es necesario instalar las siguientes librerías.

pip install dataframe-image
pip install fpdf

También es necesario tener Google Chrome instalado.

Uso

Únicamente ejecutar el script “mpExtractor” e introducir una URL válida del sitio MisProfesores.com que corresponda a una facultad o escuela. Por ejemplo:

https://www.misprofesores.com/escuelas/UANL-FCFM_2263

Posteriormente se desplegarán una serie de opciones como:

El orden toma en cuenta el número de reseñas de cada maestro: es decir, tiene más peso un maestro con 9 de calificación pero (por ejemplo) 20 reseñas, que uno con la misma calificación pero solo con 5 reseñas. Además, tambien se encuentra en una de las carpetas una Jupyter Notebook, por si se desea experimentar directamente con el dataset.

Ejemplo

Al ingresar la URL se obtiene la siguiente tabla que muestra el top de profesores con mejores puntuaciones y mayor número de reseñas:

Apellido, Nombre # de calif. Promedio
0 Gómez Pérez , Diego Gerardo 46 9.9
1 Guajardo , Elizabeth 43 9.6
2 Guerrero Ceja , Yazmany Jahaziel 60 9.4
3 arias , adriana 40 9.3
4 Barragan Amigón , Abraham Benito 37 9.1
5 Tlahuice Flores , Alfredo 38 9.1
6 Garza Garza , Luis Gerardo 31 8.6
7 Rodríguez , rodrigo 30 8.5
8 Rodriguez , Victoria Celeste 42 8.3
9 Contreras Mendoza , Abigail 47 8.2
10 Moller Garza , Jonathan Ricardo 72 8.1

Notas adicionales

Este proyecto es un prototipo y podría contener errores. Además, también podría modificarse completamente en el futuro.