Integración y ajuste de los métodos de aprendizaje por refuerzo:DQN y PPO, para redes de comunicación inalámbricas asistidas por drones con múltiples usuarios, validación de los resultados del entrenamiento evaluación de los algoritmos. Con cargo al proye