Innovando la educación en la tecnología. Группа авторов. Читать онлайн. Hotlib. HOTLIB.NET

Innovando la educación en la tecnología

de aprendizaje para cada weight de la red neuronal.

Adam utiliza los gradientes elevados al cuadrado para escalar la velocidad de aprendizaje como el algoritmo RMSprop (Tieleman y Hinton, 2012) y aprovecha el impulso al usar la media móvil de los gradientes en lugar de solo la gradiente como el algoritmo stochastic gradient descent.

Para estimar los momentos, Adam utiliza promedios móviles exponenciales, calculados en el gradiente evaluado en un minilote actual:

Donde m_t y v_t son los promedios móviles, g es la gradiente del minilote actual y los β son los hiperparámetros del algoritmo. Ambos tienen un valor default de 0,9 y 0,999, respectivamente

La fórmula para obtener el promedio móvil m_t también puede ser representada por la siguiente ecuación:

Después de esto se necesita realizar un paso llamado “bias correction”, esto quiere decir que se necesita corregir el valor inicial de m_t y v_t, para ello se realizan las siguientes transformaciones:

Para finalizar, se utilizan estos promedios móviles y para escalar la learning rate individualmente para cada parámetro. La forma en que se hace en Adam es simple, para realizar una actualización de weights hacemos lo siguiente:

Donde W_t es una matriz weights y la η es el tamaño del step (Zhang, Ma, Li y Wu, 2017).

2.4 Impacto de las noticias positivas

Para poder validar la hipótesis se decidió usar el test PANAS (Positive and Negative Affect Schedule).

Fue desarrollado en 1988 por Watson, Clark y Tellegen con el objetivo de medir de una forma más pura el efecto negativo o positivo de algún evento en específico (Watson, Clark y Tellegen, 1988). En un inicio el test PANAS contaba con 60 ítems (sentimientos) para determinar el sentimiento negativo o positivo, pero luego se realizó una reducción de la lista, basada en el coeficiente de importancia, y al final se obtuvieron 20 ítems, 10 para el sentimiento negativo y 10 para el sentimiento positivo (Watson, Clark y Tellegen, 1988).

Los resultados de este cuestionario fueron alentadores, porque fueron acertados, presentando los siguientes porcentajes: para la escala de sentimiento positivo, el coeficiente alfa de Cronbach (Cronbach, 1951) fue de 0,86 a 0,90; para la escala de sentimiento negativo, 0,84 a 0,87 (Watson, Clark y Tellegen, 1988).

3. RESULTADOS

3.1 Validación del modelo LSTM

Luego de haber implementado el modelo, se probó su eficacia utilizando el método de validación cruzada k-folds con un k=10 (Kohavi, 1995). Los resultados fueron los siguientes:

Tabla 2

Resultados de la validación cruzada k-folds

Validación cruzada k-folds (k=10)
Folds (k)	Accuracy
1	86,56 %
2	85,36 %
3	86,85 %
4	89,37 %
5	88,29 %
6	85,67 %
7	89,95 %
8	91,51 %
9	88,30 %
10	87,92 %
	Promedio: 87,98 %

Elaboración propia

Para comparar la efectividad del modelo se implementaron otros dos métodos que también son usados en la actualidad:

1) Naive Bayes

2) Red neuronal recurrente (RNN)

El método usado para la validación, por consistencia, fue el de validación cruzada k-folds (k=10).

1) Naive Bayes

Tabla 3

Resultados de la validación cruzada k-folds

Validación cruzada k-folds (k=10)
Folds (k)	Accuracy
1	79,89 %
2	83,25 %
3	79,28 %
4	81,59 %
5	83,17 %
6	79,03 %
7	79,98 %
8	80,55 %
9	81,71 %
10	82,99 %
	Promedio: 81,14 %

Elaboración propia

2) Red neuronal recurrente RNN

Tabla 4

Resultados de la validación cruzada k-folds

Validación cruzada k-folds (k=10)
Folds (k)	Accuracy
1	82,79 %
2	81,90 %
3	83,58 %
4	81,27 %
5	82,90 %
6	83,51 %
7	84,95 %
8	80,11 %
9	82,76 %
10	80,56 %
	Promedio: 82,43 %

Elaboración propia

Luego de ver estos resultados, se puede afirmar que el modelo propuesto, una variación de la red neuronal recurrente LSTM tiene un mejor accuracy que el método de Naive Bayes y la red neuronal recurrente.

3.2 Procedimiento experimental

Test PANAS

Para validar la hipótesis se realizó un experimento basado en encuestas, con la participación de 520 personas de edades diferentes (entre 20-45 años) y de diferentes géneros (320 mujeres, 200 hombres). La encuesta se realizó antes y después de haber leído las noticias. La muestra se dividió de la siguiente forma:

Después de haber realizado las encuestas, los resultados fueron los siguientes:

4. CONCLUSIONES

Luego de haber realizado este reporte, implementando tanto el modelo de LSTM, para poder clasificar las noticias escritas en español en positivas o negativas, como el test de PANAS, con una población variada para poder determinar el efecto de las noticias positivas en ellas, se pueden concluir dos grandes puntos:

a) El modelo propuesto basado en las redes neuronales LSTM cuenta con un accuracy del 87,98 %, esto es bueno comparado con el método de Naive Bayes y la red neuronal recurrente.

b) Los resultados del test de PANAS nos demuestran que todas las personas que han leído las noticias positivas han mejorado su estado de ánimo.

5.

Скачать книгу