Automatizar las noticias en el portal

Hola a todos,

Llevo tiempo comentando con @Miguel_Useche la poca cantidad de artículos que tenemos en la sección de noticias del portal, así como la falta de voluntarios para crearlas.

En los últimos tres artículos hemos llevado a cabo un experimento. Queríamos validar si el uso de servicios de traducción asistida podía aumentar la velocidad con la que traducíamos artículos del blog oficial de Mozilla de forma que participar en ello fuera una tarea rápida, gratificante y que sólo llevara unos poco minutos.

Dado que no queríamos invertir tiempo en desarrollar nada, hemos estado usando el servicio web gratuito de Google Translate para hacer estas pruebas.

En general hemos sido capaces de generar artículos de forma rápida con una calidad aceptable el mismo día que se publicaban en inglés.

Actualmente el proceso aún lleva varios pasos manuales que esperamos poder automatizar, por eso también abro este tema, para ver quién estaría interesado en hacer un desarrollo pequeño para automatizar todo el proceso.

Proceso actual:

  • La URL original se pega en Google Translate.
  • El resultado se copia y pega en un borrador de Wordpress, lo cual mantiene el formato, enlaces e imágenes.
  • Con el visor de código de WP se copia y pega el texto a un editor para arreglar problemas comunes.
  • El resultado se pega de vuelta a WP, se pone un extracto, imagen destacada y se pega.

Todo el proceso se puede realizar en entre 5 y 15 minutos (pudiendo quedar en 5 min. máximo si lo automatizamos), la mayor parte del tiempo se emplea en arreglar los problemas comunes:

  • Limpiar los enlaces generados a los que google translate añade sus URLs (automatizable)
  • Eliminar dobles espacios y espacios antes de comas y puntos (automatizable)
  • Cambiar tratamientos de usted a tú (automatizables en su mayoría)
  • Leer el texto e identificar alguna expresión rara y corregirla (no más de 3 por artículo, manual)

Para este desarrollo lo ideal sería:

  • Se proporciona una URL con el artículo original.
  • La app lee la URL y recupera la traducción de Google Translate (u otro servicio)
  • Se aplican los arreglos automatizables
  • Se presenta el resultado al usuario con formato, enlaces e images, listo para ser pegado en WP y revisado antes de publicar.

¿Quién se anima? :smiley: Esto puede dar mucha actividad a la comunidad en español y nos evitaría estar esperando a los medios para poder contar lo que Mozilla está haciendo a nuestras comunidades y usuarios.

3 me gusta

Técnicamente la app deber ser capaz de:

  • Formulario para pedir la URL original al usuario.
  • Usar la URL para descargar el HTML (idealmente solo la parte del cuerpo del artículo)
  • Hacer una petición a un API con el contenido y almacenar la respuesta.
  • Aplicar ciertas reglas y expresiones regulares para limpiar el contenido.
  • Presentar el resultado de vuelta al usuario.
1 me gusta

Bueno algo asi como crear una app yo si no puedo apoyar pero para estar traduciendo y publicando entradas y publicando si que puedo ademas de crearles su banner a cada una desde el equipo creativo. Así que podria sumarme a ello.

¡Gracias @keikkun! :smiley:

Si somos capaces de automatizar esto, el proceso ya no implicaría tanto traducción si no más “revisión” o “edición” del texto ya en español, y no debería implicar más de 5 minutos por artículo, lo cual creo que permitiría a mucha más gente participar y sería una tarea bastante más gratificante y entretenida.

Un saludo.

Hola que tal,

Creo que es necesario pagar una suscripción a Google para usar el servicio de translate.

Creo que podría ayudarlos en hacer algo para automatizar el proceso de tomar los post del blog oficial y ponerlos en el blog hispano y marcados como draft.

También está la API de Yandex que da un api key gratis, con 1 000 000 caracteres por día y menos de 10 000 000 por mes.

La calidad de yandex es muy cuestionable, las pruebas que hice dieron resultados muy malos.

Este fin de semana intentaré tener un MVP :slight_smile:

1 me gusta

En el blog de Mozilla hay un nuevo artículo por si alguien quiere probar el proceso:

https://blog.mozilla.org/firefox/block-autoplay/

Hola me gustaría a apoyar a traducir este y otros documentos. Necesito una cuenta para el blog ? oe como puedo enviar las traducciones ?

Creo que por el momento no puedo apoyar en la creación del app, no cuento el tiempo suficiente sorry :frowning:

pero si puedo dedicar mi tiempo para ayudar a traducir los nuevos post para el blog.

saludos

Dejo la idea a futuro, no para el MVP, pero sería genial automatizar el rss del blog de Mozilla con creación de borradores en el wordpress de MH con las traducciones auto y simplemente listos para revisar por un humano :stuck_out_tongue:

Hola,

@kirbylife ha subido ya el código de un script python para traducir noticias del blog de mozilla

Se necesita una clave de API para Google Cloud Translate (el free trial te da 300$ por un año).

Habría que documentar un poco más el script y ver si podemos montarlo de forma que los redactores habituales tuvieran acceso para generar noticias.

/cc @willyaranda @stripTM @Miguel_Useche