En 2019 escribí una tesis de máster en la Universidad Carlos III sobre el jazz como bandera de resistencia frente a la industria fonográfica. Siete años después dirijo un estudio unipersonal de ingeniería de inteligencia artificial. Tardé en darme cuenta de que estoy haciendo lo mismo. Soporte distinto. Misma estructura.

MOVIMIENTO 01 · LA ESCENA REPETIDA

Una esquizofonía y luego otra

A finales del siglo XIX, el fonógrafo separa por primera vez el sonido de su fuente. Murray Schafer le puso nombre: esquizofonía. Lo que se cantaba en un porche de Nueva Orleans podía oírse, idéntico, en una sala de Chicago, Buenos Aires o Tokio. Una grieta tecnológica —disco de pizarra, bocina, aguja— provoca una grieta cultural: el «aura» benjaminiana del intérprete único se rompe, y con ella se rompe también el monopolio que la tradición europea de partitura ejercía sobre lo que merecía ser escuchado.

En la grieta entra otra cosa. Lo que el TFM llama, siguiendo a Archie Green y a Michael Denning, lo vernáculo: la música «nacida en casa» de la clase trabajadora urbana, mezcla de blues, ragtime, espirituales, marchas, contradanzas francesas, habaneras cubanas. No es folclore preservado en formol. Es un lenguaje vivo que en ese momento, por primera vez en la historia, puede viajar sin sus cuerpos.

Cien años después la operación se repite. Otra esquizofonía, esta vez algorítmica. Lo que se escribió en un blog, lo que se conversó en un foro, lo que se subió a un repositorio público bajo licencia libre, se desprende de su fuente y se convierte en pesos numéricos dentro de un modelo de lenguaje. El gesto humano —tu manera de explicar algo, mi manera de cerrar un mail, la cadencia con que una comunidad escribe su jerga— se vuelve commodity reproducible al infinito. Como el jazz al pasar al disco, lo digital empieza a poder copiarse sin marca de origen, sin atribución, sin contrato.

No es accidente que la palabra «modelo» en machine learning haya heredado la misma ambigüedad que tenía en la música industrial: algo que captura un patrón, sí, pero que también lo estandariza en el acto de capturarlo. Cuaderno de trabajo, Madrid, marzo 2026

Y como entonces, alguien intenta cobrar peaje en el camino entre la fuente y la copia.

MOVIMIENTO 02 · TIN PAN ALLEY

La industria que blanquea y la industria que concentra

Tin Pan Alley fue, a comienzos del siglo XX, un puñado de manzanas en Manhattan donde editoriales musicales blancas compraban canciones por dólares, las arreglaban en partituras simples y las vendían como producto de masas. Esa industria tomaba lo que en Storyville o en Harlem se tocaba con timbre sucio, síncopa imposible de notar y armonía «desafinada respecto del piano templado europeo» —y lo limpiaba—. Lo cuadraba en compases regulares. Lo blanqueaba en sentido literal: contrataba cantantes blancos para canciones negras, borraba la procedencia, vendía la copia como original.

La respuesta de la comunidad afroamericana fue lo que la industria llamó race records: sellos pequeños que grababan a músicos negros para públicos negros, sin pasar por el filtro de Tin Pan Alley. No era un mercado de nicho. Era una infraestructura paralela. Una manera de que el vernáculo siguiera siendo vernáculo incluso cuando ya viajaba en disco.

Hoy la operación equivalente se llama cloud propietario. No es una analogía floja, es —argumenta— estructuralmente la misma. Tres o cuatro empresas —AWS, Azure, GCP, OpenAI, Anthropic— concentran la capacidad de computar, almacenar y servir modelos de lenguaje. Los datos que entrenan esos modelos vienen, en gran medida, de comunidades concretas: foros técnicos, blogs personales, repositorios open source, hilos de Stack Overflow, libros escaneados. El proceso es el mismo que el de Tin Pan Alley: tomar, estandarizar, revender. La diferencia no es ética, es de escala. Cecilia Rikap habla de capitalismo intelectual monopolista y describe con precisión técnica cómo unas pocas corporaciones se han apropiado del dominio computacional global de la misma manera que las majors se apropiaron, en su día, de la distribución sonora.

NOTA AL MARGEN

El paralelismo no es retórico. Cuando un modelo cerrado se entrena con código GPL —licencia que obliga a compartir el derivado bajo la misma licencia— y luego se revende como SaaS sin liberar pesos ni datos de entrenamiento, está ocurriendo, en términos de propiedad intelectual, exactamente lo mismo que cuando Tin Pan Alley compraba un blues por veinte dólares y registraba el copyright a nombre de un autor blanco. El soporte es digital. El gesto, idéntico.

MOVIMIENTO 03 · LA POLÉMICA ADORNO/BENJAMIN

El ruido también es teoría

En el TFM tuve que tomar partido en una de las polémicas centrales de la teoría crítica del siglo XX. Por un lado, Theodor Adorno: el jazz, para él, era pseudo-individualización. Una mercancía de la industria cultural disfrazada de espontaneidad. La síncopa, decía, no es libertad sino el truco rítmico que el sistema necesita para vender estandarización como rebeldía. Adorno tenía razón en algo importante: la industria cultural existía y devoraba todo lo que tocaba.

Pero también se equivocaba, y se equivocaba por la razón que Walter Benjamin —su amigo y antagonista cordial— supo nombrar: la reproducción técnica destruye un aura, sí, pero crea otra cosa. Crea cercanía. Crea posibilidad de que las masas, por primera vez, tengan acceso a su propia voz amplificada. Jacques Attali llevó esa idea al terreno político: el ruido —lo que la armonía oficial no puede notar— es una profecía. Anuncia la sociedad que viene antes de que esa sociedad sepa pronunciarse.

La pregunta que escribí en 2019 —si el jazz era mercancía o profecía— vuelve hoy en otra forma. ¿La inteligencia artificial es nada más que la próxima ola de la industria cultural, donde lo que antes se vendía como canción ahora se vende como token? ¿O hay, en algunas de sus prácticas, ruido en sentido attaliano —es decir, profecía—?

Mi respuesta hoy es la misma que entonces, con un pequeño desplazamiento: depende de quién toca y dónde se toca. El jazz comercial blanqueado de Tin Pan Alley era industria cultural pura. El jazz vernáculo grabado en race records, escuchado y citado por otros músicos negros que aprendían unos de otros a través del disco, era profecía. La diferencia no estaba en la tecnología —el disco era el mismo— sino en quién controlaba la cadena de producción y distribución, y para quién.

Lo mismo vale ahora. Un modelo cerrado servido desde un datacenter en Virginia, cuyo contrato te impide saber qué se hizo con tu prompt, es industria cultural en estado puro. Un modelo de pesos abiertos —Llama, Mistral, Qwen, los que vienen— ejecutándose en un Mac Mini a 30 vatios, en el despacho del cliente, bajo control técnico verificable, sin que nada salga de su red, es —si se quiere usar la palabra grande— una pequeña audiotopía.

MOVIMIENTO 04 · AUDIOTOPÍA Y LOCAL-FIRST

Una topología ética del trabajo

Josh Kun llamó audiotopía al espacio sónico utópico donde contradicciones que la realidad social no puede sostener sí pueden coexistir. Un disco de Billie Holiday, decía, es audiotopía: en él conviven la herida del linchamiento, la belleza imposible de su voz, la complicidad del público blanco, la insurrección del público negro. Todo en tres minutos.

Cuando hablo con mis clientes —despachos legales, clínicas, pequeñas fintechs— y les explico por qué les propongo desplegar modelos en su propia infraestructura en lugar de enviar todo a un endpoint de OpenAI, la palabra que uso en el contrato es local-first. Pero la palabra que pienso por dentro es audiotopía. Porque lo que estamos negociando no es una diferencia técnica de latencia. Lo que estamos negociando es una topología ética: dónde vive el dato, quién puede mirarlo, bajo qué jurisdicción, con qué consumo energético, y bajo el control verificable de quién.

Mark Fisher describió el realismo capitalista como esa atmósfera difusa que hace «más fácil imaginar el fin del mundo que el fin del capitalismo». Franco «Bifo» Berardi nombró semiocapitalismo a la fase en la que lo que se explota no es ya la fuerza muscular sino la atención y el lenguaje. Éric Sadin escribió contra la algocracia —el gobierno por la sugerencia automatizada—. Yuk Hui pidió tecnodiversidad: un mundo con muchas técnicas, no una técnica monocultural impuesta como destino. David Graeber mostró que los bullshit jobs son consecuencia, no avería, de un sistema que prefiere coordinar humanos antes que liberarlos.

Todos estos autores apuntan, desde ángulos distintos, a lo mismo: hay un problema de arquitectura. No de maldad individual. De arquitectura. Y la respuesta —si hay respuesta— también es arquitectónica. No basta con criticar el cloud propietario. Hay que construir las race records del siglo XXI.

Lo que sostuvo al jazz vernáculo no fue la denuncia. Fue una infraestructura paralela, modesta, que permitió que la música siguiera siendo de quien la hacía. La denuncia ayuda. Pero sola no toca un disco. Reflexión de cuaderno, abril 2026
MOVIMIENTO 05 · LO QUE SÍ SE PUEDE HACER

El timbre sucio como criterio de ingeniería

Una de las observaciones más finas del TFM —que a mí mismo me sorprendió cuando la escribí— era que el jazz se reconoce no por las notas correctas sino por las notas sucias. El timbre con grano, el vibrato amplio, la voz ronca, el acento por detrás del beat. Lo que la notación occidental no podía capturar es, precisamente, lo que identifica al género. El jazz es lo que la partitura no puede escribir.

Trabajando en ingeniería de IA he aprendido a leer ese principio en otra clave. Lo que distingue una arquitectura responsable de una arquitectura genérica no es lo que cumple el checklist —cualquiera cumple el checklist—. Es lo que el checklist no puede capturar. La fricción del cliente, su jerga interna, las decisiones que toma cuando nadie mira, el dato que jurídicamente no puede salir de su red, el caso particular que rompe la generalización del modelo. Eso es el timbre sucio. Y como el timbre sucio del jazz, solo se sostiene si la cadena de producción —el hardware, el modelo, el dato— sigue estando del lado de quien lo produce.

No es romanticismo. Es ingeniería. Un modelo cerrado servido por terceros tiene un sesgo estructural hacia la respuesta promedio, porque ese es el negocio que lo hace rentable. Un modelo abierto ajustado en local sobre el corpus específico de un despacho puede equivocarse, sí, pero se equivoca en el idioma del despacho. Y esa diferencia, que parece sutil, es la que separa una herramienta útil de una herramienta domesticadora.

El paralelismo cierra ahí. El jazz vernáculo no derrotó a Tin Pan Alley. Convivió con él. Se infiltró en él. Lo transformó desde dentro mientras seguía existiendo —en sus grabaciones de race records, en sus clubes pequeños, en sus formatos largos cuando Duke Ellington forzó a la industria a aceptar piezas de seis minutos en lugar de tres— por su cuenta. La IA local-first no va a derrotar al cloud propietario. Pero puede convivir con él en posición de negociar. Puede infiltrarse. Puede transformarlo desde dentro mientras existe, paralela, en racks pequeños, en Mac Minis silenciosos, en clusters Tailscale entre despachos. Una infraestructura modesta pero verificable.

Eso es lo que escribió Volpi de 2019 sin saberlo. Eso es lo que firma Volpi de 2026 cuando entrega un contrato.

REFERENCIAS · LECTURAS QUE ESTRUCTURAN ESTE ENSAYO
  1. Volpi, E. (2019). Jazz como bandera de resistencia en la revolución cultural amplificada fonográficamente. TFM, Universidad Carlos III de Madrid.
  2. Adorno, T. W. (1989). On Jazz. Discourse, 12(1). (Original 1936.)
  3. Benjamin, W. (1989). La obra de arte en la época de su reproductibilidad técnica. En Discursos interrumpidos I. Buenos Aires: Taurus. (Original 1936.)
  4. Attali, J. (1995). Ruidos. Ensayo sobre la economía política de la música. México: Siglo Veintiuno. (Original 1977.)
  5. Schafer, M. R. (2013). El paisaje sonoro y la afinación del mundo. España: Intermedio. (Original 1977.)
  6. Kun, J. (2005). Audiotopia. Music, race, and America. California: University of California Press.
  7. Denning, M. (2015). Noise uprising: the audiopolitics of a world musical revolution. London-New York: Verso.
  8. Horkheimer, M. y Adorno, T. (2018). Dialéctica de la Ilustración. Madrid: Trotta. (Original 1944.)
  9. Fisher, M. Realismo capitalista. ¿No hay alternativa?
  10. Berardi, F. La fábrica de la infelicidad / The Soul at Work.
  11. Sadin, É. La inteligencia artificial o el desafío del siglo.
  12. Hui, Y. Fragmentar el futuro: ensayos sobre tecnodiversidad.
  13. Rikap, C. Capitalism, Power and Innovation. Intellectual Monopoly Capitalism Uncovered.
  14. Graeber, D. Bullshit Jobs.
Si querés ver cómo este pensamiento se traduce en doctrina técnica: los seis principios de ingeniería del estudio están publicados en versión extendida — cada uno acompañado de su linaje crítico (Fisher, Berardi, Sadin, Hui, Rikap, Bauman, Graeber, Jevons). Lectura larga, ~12 minutos.
→ Leer el manifiesto extendido

La pregunta que dejo abierta: si la grieta del fonógrafo dio lugar al jazz vernáculo y a toda una infraestructura paralela —race records, clubes, sellos pequeños— para sostenerlo, ¿qué infraestructura paralela estamos construyendo nosotros para que la grieta algorítmica de hoy no se cierre solamente como Tin Pan Alley?

No tengo una respuesta cerrada. Tengo prácticas concretas, un estudio que insiste en local-first, contratos que prohíben la salida de datos del cliente, y una sospecha de que es ahí —en las prácticas modestas y verificables, no en los manifiestos gritados— donde se juega esto. Si llegaste hasta acá y querés seguir la conversación, escribime. Las mejores cosas que he aprendido los últimos meses vinieron por correo.

emilianovolpi@digitalrealism.io