jschwindt admin
En Venganzas del Pasado desde el sábado, 01 de marzo de 2008 a las 02:22 AM
¡Hola! Ya subí todos los 5500 archivos que contribuyó DavidV (ver https://venganzasdelpasado.com.ar/users/davidv/contributions) y ahora estoy ejecutando el lento proceso de las transcripciones, para que a futuro se pueda buscar por texto.
¡Gracias DavidV!
No hubo últimamente ninguna contribución de FerCoun.
Estoy trabajando en lo que mandó DavidV, pronto va a estar online, pero son más de 5500 audios que tengo que agregar...
Me alegro que así sea! Fue gracias a la insistencia de un usuario ;-)
Para la transcripción uso Whisper de OpenAI y funciona muy bien: https://github.com/openai/whisper https://openai.com/research/whisper
@Ciudadano32 acá subí el script find_show_start_cmd: https://gist.github.com/jschwindt/c82e7f6f0ee8e112e9b0aaf3c27ab5b6.
Tenés que usar python3 e instalar el paquete openai-whisper como está indicado en el gist.
En las siguientes líneas de ruby https://github.com/jschwindt/Venganzas-del-Pasado/blob/master/script/select_source.rb#L30-L37 hace lo siguiente:
Espero que se entienda, cualquier cosa, decieme.
Bueno, parece que funcionó bien el asunto de detectar el comienzo del programa y cortar/eliminar todo el audio previo.
Para las transcripciones del sitio estoy usando Whisper de OpenAI: https://github.com/openai/whisper. Tiene CLI y también se puede usar desde Python.
Con la inspiración de @Krank estoy haciendo para que automáticamente recorte el audio y empiece justo con el comienzo del programa, veremos cómo me va con eso ;-)
@Krank vor Liebe: tenía pensado algo así para automatizar la eliminación de los minutos iniciales hasta el comienzo del programa. Voy a ver si lo implemento. Saludos!
Ahí puse otra versión, avísenme si tiene problemas. ¡Gracias!
Hola Leog! Probaste con el buscador de transcripciones? Por ejemplo: https://venganzasdelpasado.com.ar/search/texts?q=Bachelet
¡Gracias Mauro José, gran hallazgo! Ya quedó arreglado, y voy a tratar de recuperar el de ayer completo también.
Lamentablemente RadioCut tiene todos esos cortes donde empiezan a hablar en inglés, se convirtió en algo inusable :(
Voy a ver si consigo una versión mejor, gracias!
¡Está arreglado!
¡Gracias a todos por avisar, ya lo arreglé!
Ahí ya subí una versión con mejor audio. ¡Saludos!
@Ingrid: No te creas, la gente sabe valorar lo bueno; muy al principio de los tiempos pedía donaciones y recibía suficientes como para cubrir los costos de hosting. Después, cuando el tráfico fue aumentando y le puse publicidad, ya no hizo más falta.
Lo que dice @Ingrid es tal cual. Lo mío es el software y la programación, y todo lo que sea automatizar me sale bastante bien. Es gracias a eso que este sitio existe desde hace años, de lo contrario sería inviable, pero a veces lo automático falla y tengo que hacer cambios.
No tengo nada en contra de la gente de Comunidad Vengadora, al contrario, valoro la dedicación que le ponen para limpiar los audios diariamente.