Hacía mucho que no escuchaba la intro del programa, siempre lo escuchaba por canales de youtube que se la removían (a mi gusto mejor, es tiempo muerto y repetido).
Ahora escucho que la intro dice "Patricio Barton, que todas las noches es aplastado por estampidas de oyentes desertores que se pasan a otra radio".
Lo tomo como el ninguneo que el negro pretendió al crear la intro. Parece que finalmente se tuvo que tomar una decisión y se eligió el recambio de oyentes por los mas nuevos (las viejas que andan mandandole saludos a dolina por youtube a pesar de que claramente son canales truchos, los que dejan mensajes con horrores ortograficos diciendo de donde son y los tan poco agraciados "Martin de Palermo" que gustan de defender y demostrar sus gustos personales por radio. En otras palabras, los oyentes menos exigentes.
Estoy grabando los programas con FFMPEG a las 00:15 para evitar las noticias y un script que estoy testeando y que con suerte (y usando sox) me permitiria remover intro, tandas y segmento musical (aunque voy a tener que andar metiendo mano igualmente); todo mas con fines de archivo que otra cosa. En un futuro, cuando estén ordenados y taggeados los subiré al archivo en github.
No tuve un buen resultado dividiendo las secciones automaticamente:
Sox detecta los silencios en los audios para hacer los cortes de secciones; hay dos problemas:
1. Dolina deja unos baches de 2-3 seg sin hablar a veces (el corte queda mal hecho, se hace en cualquier lado)
2. Las tandas las pegan con fade muchas veces, esto genera que no haya cortes con silencio o estos sean tan cortos que generen el problema del punto 1.
La opción bruta sería programar la grabacion por secciones usando un promedio de tiempo fijo por sección, pero en un programa de radio es complicado, teniendo en cuenta que nunca son "relojitos" es decir que van a quedar mal cortados en más de una ocación; aun así, me parece que la unica opción seria esa.
Seguiré investigando la manera y revisando opciones. Quizás mientras tanto pueda subir los programas cortados de manera brusca, es decir empezados (tratando de eliminar las noticias antes del programa y la agenda del programa) y cortados sin el segmento musical completo, con las tandas publicitarias, pero con buena calidad de audio.
Ya sé que es decepcionante pero es lo que puedo hacer por el momento hasta que le encuentre una vuelta.
Ciudadano32, ya que mencionás dos de mis mejores amigos, SoX y FFmpeg (salgo poco, me llevo mejor con las máquinas que con las personas, etcétera), ¿sería posible automatizar el corte de los bloques que te interesan a partir de un archivo de texto que contuviera timestamps para cada programa en particular?
Doy un ejemplo concreto para un solo bloque: de la transcripción del programa «lavenganza_2023-04-11.mp3» pueden extraerse las marcas de comienzo y final del primer bloque, que comienza a los 422 segundos y termina a los 2.621 segundos (los momentos en que Aliverti termina de decir «Nuestros intérpretes» y que Barton dice «El WhatsApp de La Venganza», respectivamente). Entonces, a la línea de comando:
para generar el audio del primer bloque («2199» es evidentemente la resta de las marcas de final e inicio).
No me detengo en la concatenación de bloques y cosas así por ser problemas demasiado simples de resolver; sí me parece interesante la posibilidad de aprovechar la transcripción automática para generar un archivo de texto que contenga la información necesaria:
,...
En el ejemplo práctico escribí una macro en UltraEdit-32 (más que nada porque ya estaba abierto en ese momento) para procesar el texto de la transcripción: convertir hh:mm:ss en duración en segundos para simplificar, buscar los strings necesarios mediante RegExp (para minimizar las inexactitudes de la transcripción), extraer de esas líneas las marcas de tiempo de inicio y final, y pasar todos los parámetros a la línea de comando de FFmpeg; todo esto sería muy fácil de implementar en un script de Python, aunque el punto crítico sigue siendo la transcripción del audio como fuente de marcadores. (En ese sentido, LVST tiene la ventaja de ser un programa casi fijo en su estructura textual, al menos durante períodos bastante prolongados.)
Trabajo casi diariamente con samples musicales (algunos propios, la mayoría robados), y el comando silence de SoX me ahorra muchísimo tiempo en operaciones que debería hacer manualmente; sin embargo, puede que su comportamiento sea imprevisible en un programa de radio en vivo.
En lo personal (¿a quién puede interesarle?), me gustan los archivos completos con noticias, publicidades, etcétera, porque me resultan útiles como información contextual (especialmente en programas antiguos) y porque me permiten enfurecerme hasta el paroxismo con la locutora que pone voz de adolescente-ser-de-luz-nosotros-somos-buenos-y-ellos-son-malos-el-amor-vence-al-odio-etcétera en el minuto 50:15 de La Venganza Será Terrible del 05/04/2023, justamente en un momento que en quizá convendría demostrar cierta voluntad de poder y ferocidad, al menos a los efectos de la comunicación.
Aclaración: olvidé que el sitio interpreta el texto que se encuentra entre los signos «menor que» y «mayor que» como tags HTML, así que algunas líneas de mi mensaje anterior parecen tener menos sentido aún del poco que ya tenían. Reemplazo esos signos por comillas, y queda:
@Krank vor Liebe: tenía pensado algo así para automatizar la eliminación de los minutos iniciales hasta el comienzo del programa. Voy a ver si lo implemento. Saludos!
Krank vor Liebe
Gran idea la de las transcripciones, aunque confieso que estoy escuchando los programas de estos ultimos 4 dias, y se me estan yendo las ganas de tomarme el tiempo para hacer todo esto... realmente el "nuevo estilo" (ultracensurado/politicamente correcto/desganado/"sale con fritas") y la nueva camada de oyentes, me estan haciendo pensar que quizás no valga tanto la pena poner tanto craneo en esto.
Quizás solamente subir los programas "cortados a cuchillo" (recordando mi odio compartido con el negro, hacia las empanadas victimas del capitalismo) y minimamente taggeados sea lo mejor para mi. Pondria foco solamente en renombrar los programas de manera que queden bien en una playlist sin mayores problemas (fecha con formato americano), algun adorno (cover) y el año.
Deberé decidir si hago cortes fijos entre secciones (más desprolijo aún) o dejo el programa semi-completo (empezaria a grabar mas tarde para evitar las noticias y la agenda) y lo terminaria mas temprano (evitando parte del segmento musical) pero esto vendría a eliminar la posibilidad de describir cada segmento en el nombre de archivo y tags.
De todas formas me da curiosidad y me gustó la solución que propones.
La unica app que encontre para hacer las transcripciones en github, no tiene CLI, lo cual viene a romper todo el esquema de automatizacion. (https://github.com/raryelcostasouza/pyTranscriber).
El segundo escoyo es convertir los strings de tiempo del timestamp a segundos solamente para poder pasárselos al ffmpeg.
Quizas Juan pueda abordar el tema mejor que yo y sepa como hacerlo facilmente.
Para las transcripciones del sitio estoy usando Whisper de OpenAI: https://github.com/openai/whisper. Tiene CLI y también se puede usar desde Python.
Con la inspiración de @Krank estoy haciendo para que automáticamente recorte el audio y empiece justo con el comienzo del programa, veremos cómo me va con eso ;-)
Buen día foristas:
En Youtube Audio Visual Clips logró recortar presentación, tandas, noticieros y espacio musical, pero dejaron de subir programas a mediados de Marzo, https://www.youtube.com/watch?v=V84mxq7w7Sw es el último disponible.
Gracias por el link pero no suben mas programas tampoco. Era una chica y aparentemente hacia todo manualmente. Además le ponia su propia publicidad al principio y al final que con sox yo removia facilmente (grandilocuencias de los youtubers...). Otro tema que tenia era que subia los programas con cualquier nombre y me trastornaba el rename de los archivos, la fecha la ponia en formato argentino lo cual causa que al ponerlos en una playlist los archivos quedasen ordenados por dia y no por mes (escuchabas primero todos los 1ro de todos los meses, luego los 2 de cada mes y así).
Tambien estaban afanando los de realpolitikfm, para llevar gente a su molino. Esos dejaban el programa completo, pero con sox podia dividirlo bastante bien, ya que no sé de donde sacaban el audio del programa pero era una grabacion cruda, sin las tandas, parecida a la de spotify (la de spotify tiene las tandas) entonces quedaban baches entre los segmentos de unos cuantos segundos, ideal para sox. Solamente tenia que borrar el segmento musical ahi, y lo hacia automaticamente.
Los unicos canales que estan, son los que no retransmiten los programas nuevos.
Despues tenes a la "competencia" de esta pagina, "comunidad vengadora" donde siguen subiendo los programas nuevos pero enteros, creo que sin publicidad (no me acuerdo bien); el tema es que este tipo usa un hosting que encripta los archivos y solamente podes bajarlos desde el link que entrega él en su pagina. La pagina en si es parecida a la pagina que hizo homero simpson, se fue por las ramas hasta el infinito y mas allá. No encontré manera de rippear esos programas automaticamente.
Hacía mucho que no escuchaba la intro del programa, siempre lo escuchaba por canales de youtube que se la removían (a mi gusto mejor, es tiempo muerto y repetido).
Ahora escucho que la intro dice "Patricio Barton, que todas las noches es aplastado por estampidas de oyentes desertores que se pasan a otra radio".
Lo tomo como el ninguneo que el negro pretendió al crear la intro. Parece que finalmente se tuvo que tomar una decisión y se eligió el recambio de oyentes por los mas nuevos (las viejas que andan mandandole saludos a dolina por youtube a pesar de que claramente son canales truchos, los que dejan mensajes con horrores ortograficos diciendo de donde son y los tan poco agraciados "Martin de Palermo" que gustan de defender y demostrar sus gustos personales por radio. En otras palabras, los oyentes menos exigentes.
Estoy grabando los programas con FFMPEG a las 00:15 para evitar las noticias y un script que estoy testeando y que con suerte (y usando sox) me permitiria remover intro, tandas y segmento musical (aunque voy a tener que andar metiendo mano igualmente); todo mas con fines de archivo que otra cosa. En un futuro, cuando estén ordenados y taggeados los subiré al archivo en github.
Ciudadano32: Sin intro, sin noticias, sin publicidad, sin segmento musical. Excelente. Avisá cuando empieces a subirlos. Muchas gracias
somosmuytibios
No tuve un buen resultado dividiendo las secciones automaticamente:
Sox detecta los silencios en los audios para hacer los cortes de secciones; hay dos problemas:
1. Dolina deja unos baches de 2-3 seg sin hablar a veces (el corte queda mal hecho, se hace en cualquier lado)
2. Las tandas las pegan con fade muchas veces, esto genera que no haya cortes con silencio o estos sean tan cortos que generen el problema del punto 1.
La opción bruta sería programar la grabacion por secciones usando un promedio de tiempo fijo por sección, pero en un programa de radio es complicado, teniendo en cuenta que nunca son "relojitos" es decir que van a quedar mal cortados en más de una ocación; aun así, me parece que la unica opción seria esa.
Seguiré investigando la manera y revisando opciones. Quizás mientras tanto pueda subir los programas cortados de manera brusca, es decir empezados (tratando de eliminar las noticias antes del programa y la agenda del programa) y cortados sin el segmento musical completo, con las tandas publicitarias, pero con buena calidad de audio.
Ya sé que es decepcionante pero es lo que puedo hacer por el momento hasta que le encuentre una vuelta.
Te dejo el link para que te bajes (si te interesa) los programas viejos sin tanda, con tags, etc....
https://github.com/LaVenganzaArchivo/La-venganza-sera-terrible-Archivo
*ocasión 🥴
Ciudadano32, ya que mencionás dos de mis mejores amigos, SoX y FFmpeg (salgo poco, me llevo mejor con las máquinas que con las personas, etcétera), ¿sería posible automatizar el corte de los bloques que te interesan a partir de un archivo de texto que contuviera timestamps para cada programa en particular?
Doy un ejemplo concreto para un solo bloque: de la transcripción del programa «lavenganza_2023-04-11.mp3» pueden extraerse las marcas de comienzo y final del primer bloque, que comienza a los 422 segundos y termina a los 2.621 segundos (los momentos en que Aliverti termina de decir «Nuestros intérpretes» y que Barton dice «El WhatsApp de La Venganza», respectivamente). Entonces, a la línea de comando:
ffmpeg -ss -t -i
pueden pasársele los parámetros:
ffmpeg -ss 422 -t 2199 -i "lavenganza_2023-04-11.mp3" "lavenganza_2023-04-11_chunk-1.mp3"
para generar el audio del primer bloque («2199» es evidentemente la resta de las marcas de final e inicio).
No me detengo en la concatenación de bloques y cosas así por ser problemas demasiado simples de resolver; sí me parece interesante la posibilidad de aprovechar la transcripción automática para generar un archivo de texto que contenga la información necesaria:
,...
En el ejemplo práctico escribí una macro en UltraEdit-32 (más que nada porque ya estaba abierto en ese momento) para procesar el texto de la transcripción: convertir hh:mm:ss en duración en segundos para simplificar, buscar los strings necesarios mediante RegExp (para minimizar las inexactitudes de la transcripción), extraer de esas líneas las marcas de tiempo de inicio y final, y pasar todos los parámetros a la línea de comando de FFmpeg; todo esto sería muy fácil de implementar en un script de Python, aunque el punto crítico sigue siendo la transcripción del audio como fuente de marcadores. (En ese sentido, LVST tiene la ventaja de ser un programa casi fijo en su estructura textual, al menos durante períodos bastante prolongados.)
Trabajo casi diariamente con samples musicales (algunos propios, la mayoría robados), y el comando silence de SoX me ahorra muchísimo tiempo en operaciones que debería hacer manualmente; sin embargo, puede que su comportamiento sea imprevisible en un programa de radio en vivo.
En lo personal (¿a quién puede interesarle?), me gustan los archivos completos con noticias, publicidades, etcétera, porque me resultan útiles como información contextual (especialmente en programas antiguos) y porque me permiten enfurecerme hasta el paroxismo con la locutora que pone voz de adolescente-ser-de-luz-nosotros-somos-buenos-y-ellos-son-malos-el-amor-vence-al-odio-etcétera en el minuto 50:15 de La Venganza Será Terrible del 05/04/2023, justamente en un momento que en quizá convendría demostrar cierta voluntad de poder y ferocidad, al menos a los efectos de la comunicación.
Aclaración: olvidé que el sitio interpreta el texto que se encuentra entre los signos «menor que» y «mayor que» como tags HTML, así que algunas líneas de mi mensaje anterior parecen tener menos sentido aún del poco que ya tenían. Reemplazo esos signos por comillas, y queda:
1:
ffmpeg -ss «start time secs» -t «duration secs» -i «input file» «output file»
2:
ffmpeg -ss 422 -t 2199 -i "lavenganza_2023-04-11.mp3" "lavenganza_2023-04-11_chunk-1.mp3"
3:
«StartTime1, EndTime1»«StartTime2, EndTime2»«StartTime3, EndTime3»,...
@Krank vor Liebe: tenía pensado algo así para automatizar la eliminación de los minutos iniciales hasta el comienzo del programa. Voy a ver si lo implemento. Saludos!
Krank vor Liebe
Gran idea la de las transcripciones, aunque confieso que estoy escuchando los programas de estos ultimos 4 dias, y se me estan yendo las ganas de tomarme el tiempo para hacer todo esto... realmente el "nuevo estilo" (ultracensurado/politicamente correcto/desganado/"sale con fritas") y la nueva camada de oyentes, me estan haciendo pensar que quizás no valga tanto la pena poner tanto craneo en esto.
Quizás solamente subir los programas "cortados a cuchillo" (recordando mi odio compartido con el negro, hacia las empanadas victimas del capitalismo) y minimamente taggeados sea lo mejor para mi. Pondria foco solamente en renombrar los programas de manera que queden bien en una playlist sin mayores problemas (fecha con formato americano), algun adorno (cover) y el año.
Deberé decidir si hago cortes fijos entre secciones (más desprolijo aún) o dejo el programa semi-completo (empezaria a grabar mas tarde para evitar las noticias y la agenda) y lo terminaria mas temprano (evitando parte del segmento musical) pero esto vendría a eliminar la posibilidad de describir cada segmento en el nombre de archivo y tags.
De todas formas me da curiosidad y me gustó la solución que propones.
La unica app que encontre para hacer las transcripciones en github, no tiene CLI, lo cual viene a romper todo el esquema de automatizacion. (https://github.com/raryelcostasouza/pyTranscriber).
El segundo escoyo es convertir los strings de tiempo del timestamp a segundos solamente para poder pasárselos al ffmpeg.
Quizas Juan pueda abordar el tema mejor que yo y sepa como hacerlo facilmente.
Para las transcripciones del sitio estoy usando Whisper de OpenAI: https://github.com/openai/whisper. Tiene CLI y también se puede usar desde Python.
Con la inspiración de @Krank estoy haciendo para que automáticamente recorte el audio y empiece justo con el comienzo del programa, veremos cómo me va con eso ;-)
Buen día foristas:
En Youtube Audio Visual Clips logró recortar presentación, tandas, noticieros y espacio musical, pero dejaron de subir programas a mediados de Marzo, https://www.youtube.com/watch?v=V84mxq7w7Sw es el último disponible.
somosmuytibios
Gracias por el link pero no suben mas programas tampoco. Era una chica y aparentemente hacia todo manualmente. Además le ponia su propia publicidad al principio y al final que con sox yo removia facilmente (grandilocuencias de los youtubers...). Otro tema que tenia era que subia los programas con cualquier nombre y me trastornaba el rename de los archivos, la fecha la ponia en formato argentino lo cual causa que al ponerlos en una playlist los archivos quedasen ordenados por dia y no por mes (escuchabas primero todos los 1ro de todos los meses, luego los 2 de cada mes y así).
Tambien estaban afanando los de realpolitikfm, para llevar gente a su molino. Esos dejaban el programa completo, pero con sox podia dividirlo bastante bien, ya que no sé de donde sacaban el audio del programa pero era una grabacion cruda, sin las tandas, parecida a la de spotify (la de spotify tiene las tandas) entonces quedaban baches entre los segmentos de unos cuantos segundos, ideal para sox. Solamente tenia que borrar el segmento musical ahi, y lo hacia automaticamente.
Los unicos canales que estan, son los que no retransmiten los programas nuevos.
Despues tenes a la "competencia" de esta pagina, "comunidad vengadora" donde siguen subiendo los programas nuevos pero enteros, creo que sin publicidad (no me acuerdo bien); el tema es que este tipo usa un hosting que encripta los archivos y solamente podes bajarlos desde el link que entrega él en su pagina. La pagina en si es parecida a la pagina que hizo homero simpson, se fue por las ramas hasta el infinito y mas allá. No encontré manera de rippear esos programas automaticamente.