SKILLPC

PCCOMPONENTES

/usr/local/scraping/pccomponentes/

Orden de scripts:

  1. coger_todos_procesadores_de_web.py
  2. acortar_model_number.py
  3. comprobar_campos.py
  4. actualizar_info.py

coger_todos_procesadores_de_web.py

Este script recoge todos los procesadores que tiene pccomponentes en venta y coge sus datos.

Después guarda los datos en un json para que si falla el ingreso de los datos a la base de datos los tengamos para hacerlo manualmente.

acortar_model_number.py

Este script coge los procesadores con el campo model_number en null junto al nombre que lo recorta adecuadamente para añadirlo al campo model_number.

comprobar_campos.py

Comprueba todos los campos null de todos los procesadores y al tener un campo url, entra e intenta de nuevo recoger los campos en null y llenarlos.

actualizar_info.py

Este script se ejecuta en un periodo de tiempo que se cambia en el crontab dependiendo de si son ofertas o no.

Comprueba el precio y los datos relevantes que se muestran en la web para ver si hay cambios.

HARDWARE

HARDWARE

PROCESADORES AMD

Entramos a https://www.amd.com/es/products/specifications/processors.html
y le damos a descargar 

image.png

 

Se descarga un excel que se mete a Y:\amd y entramos a scraping a la dirección /usr/local/scraping/amd/

y ejecutamos el script formato.sh

Esto creará el csv limpio.

image.png

Ahora vamos al phpmyadmin y le damos a config-pablo y a importar.

image.png

Para la primera vez hacemos lo siguiente.

image.png

HARDWARE

PROCESADORES INTEL

Entramos a https://www.intel.la/content/www/xl/es/support/articles/000005505/processors.html