Encontrá todos los archivos de audio en MP3 del programa de radio La Venganza Será Terrible de Alejandro Dolina

La venganza será terrible del 11/04/2023

Comentario #71580

Krank vor Liebe

Krank vor Liebe el sábado, 15 de abril de 2023 a las 12:10 AM en La venganza será terrible del 11/04/2023 dijo:

Ciudadano32, ya que mencionás dos de mis mejores amigos, SoX y FFmpeg (salgo poco, me llevo mejor con las máquinas que con las personas, etcétera), ¿sería posible automatizar el corte de los bloques que te interesan a partir de un archivo de texto que contuviera timestamps para cada programa en particular?

Doy un ejemplo concreto para un solo bloque: de la transcripción del programa «lavenganza_2023-04-11.mp3» pueden extraerse las marcas de comienzo y final del primer bloque, que comienza a los 422 segundos y termina a los 2.621 segundos (los momentos en que Aliverti termina de decir «Nuestros intérpretes» y que Barton dice «El WhatsApp de La Venganza», respectivamente). Entonces, a la línea de comando:

ffmpeg -ss -t -i

pueden pasársele los parámetros:

ffmpeg -ss 422 -t 2199 -i "lavenganza_2023-04-11.mp3" "lavenganza_2023-04-11_chunk-1.mp3"

para generar el audio del primer bloque («2199» es evidentemente la resta de las marcas de final e inicio).

No me detengo en la concatenación de bloques y cosas así por ser problemas demasiado simples de resolver; sí me parece interesante la posibilidad de aprovechar la transcripción automática para generar un archivo de texto que contenga la información necesaria:

,...

En el ejemplo práctico escribí una macro en UltraEdit-32 (más que nada porque ya estaba abierto en ese momento) para procesar el texto de la transcripción: convertir hh:mm:ss en duración en segundos para simplificar, buscar los strings necesarios mediante RegExp (para minimizar las inexactitudes de la transcripción), extraer de esas líneas las marcas de tiempo de inicio y final, y pasar todos los parámetros a la línea de comando de FFmpeg; todo esto sería muy fácil de implementar en un script de Python, aunque el punto crítico sigue siendo la transcripción del audio como fuente de marcadores. (En ese sentido, LVST tiene la ventaja de ser un programa casi fijo en su estructura textual, al menos durante períodos bastante prolongados.)

Trabajo casi diariamente con samples musicales (algunos propios, la mayoría robados), y el comando silence de SoX me ahorra muchísimo tiempo en operaciones que debería hacer manualmente; sin embargo, puede que su comportamiento sea imprevisible en un programa de radio en vivo.

En lo personal (¿a quién puede interesarle?), me gustan los archivos completos con noticias, publicidades, etcétera, porque me resultan útiles como información contextual (especialmente en programas antiguos) y porque me permiten enfurecerme hasta el paroxismo con la locutora que pone voz de adolescente-ser-de-luz-nosotros-somos-buenos-y-ellos-son-malos-el-amor-vence-al-odio-etcétera en el minuto 50:15 de La Venganza Será Terrible del 05/04/2023, justamente en un momento que en quizá convendría demostrar cierta voluntad de poder y ferocidad, al menos a los efectos de la comunicación.