Amoxtli, 2023, n° 10, ISSN: 0719-997X, doi 10.38123/amox10.347
Enmarcados en el cruce entre la sociología de la traducción y las humanidades digitales, presentaremos los pasos metodológicos que hemos seguido en la construcción de una base de datos unificada sobre traducciones, traductores y traductoras en revistas iberoamericanas (1898-1959). Esta base de datos homogeneiza metadatos de 395 revistas, extraídos de 5 repositorios digitales. En este artículo, nos detendremos en explicar cómo hemos construido la categoría “traducción”, de difícil detección por 2 motivos: 1-histórico, ya que la traducción no era una práctica cultural declarada; 2-bibliotecológico, dado que las fichas hemerográficas no suelen proporcionar información sobre traducción o lenguas de origen de los contenidos de las revistas. En ese sentido, explicaremos el experimento que hemos desarrollado con técnicas de Procesamiento de Lenguaje Natural para poder enriquecer los datos relativos a este campo y así establecer el porcentaje de “traducciones probables”. El objetivo final es poder realizar un análisis masivo para detectar patrones relativos a la traducción literaria como práctica central en la modernización del espacio literario transnacional.
Palabras clave: traducción literaria, revistas iberoamericanas, humanidades digitales, procesamiento de lenguaje natural, base de datos
At the intersection between the sociology of translation and the digital humanities, we present the methodological steps for the construction of a unified database on translations and translators in Ibero-American periodicals (1898-1959). Our database unites and unifies metadata from 395 journals, extracted from 5 digital repositories. In this article, we will explain how we have constructed the category “translation”, which is difficult to detect for two reasons: a historical one, since translation was not a declared cultural practice at the time; and a librarian one, since bibliographic records of periodicals do not usually provide information on translation or languages of origin of their contents. To this end, we describe the experiment we have carried out with Natural Language Processing techniques in order to enrich the data related to this field and thus establish the percentage of "probable translations". The ultimate goal is to be able to perform a massive analysis in order to detect patterns related to literary translation as a central practice in the modernisation of the transnational literary space.
Keywords: literary translation, Ibero-American periodicals, Digital Humanities, Natural Language Processing, databases
En el espacio iberoamericano del siglo XX, la modernización de los campos literarios nacionales muchas veces estuvo asociada a la introducción de ideas, autores/as y textos extranjeros por vía de la traducción, realizada por agentes atentos al debate sobre la literatura nacional. La literatura traducida integraba, pues, estos campos literarios nacionales y establecía relaciones de diálogo o tensión con los textos producidos en esa cultura receptora.1 Asimismo, la traducción de un texto o autor/a extranjero/a solía ocurrir, en primer lugar, en revistas debido al costo más económico y a la factura más sencilla que su edición en libro.2 Algunas de estas traducciones podían editarse en un volumen posterior, sobre todo cuando las revistas contaban con una editorial propia (como la revista y editorial argentina Sur o la editorial peruana Minerva vinculada con la revista Amauta), pero esto no siempre era el caso. De ahí que muchas traducciones vieran la luz solo en las páginas de las revistas.
Situándonos en los campos de la sociología de la traducción, los estudios de revistas y las humanidades digitales, en esta comunicación nos proponemos estudiar la traducción en revistas literarias iberoamericanas del siglo XX para poder caracterizarla, a partir de datos empíricos, como una práctica intelectual clave de la modernización literaria. En primer lugar, describiremos este objeto esquivo al análisis debido a su frágil huella material: por un lado, las revistas son un tipo de publicación efímera, cuya conservación no ha sido tan sistemática, si bien actualmente el giro digital ha impactado en sus modos de preservación y acceso; por otro lado, la traducción no solía ser una práctica declarada en las publicaciones periódicas y se mezclaba con muchas otras tareas derivadas del trabajo editorial. Tras hacer un breve repaso por los estudios sobre traducción literaria y sobre publicaciones periódicas, en especial, en sus vertientes histórico-sociológicas, plantearemos la necesidad de pensarlos de modo relacional, para poder detectar problemas específicos como, por ejemplo, la función que cumple la traducción en revistas en el inicio de la trayectoria de un/a escritor/a.3
En segundo lugar, nos detendremos en nuestra propuesta metodológica que busca integrar ambos objetos con herramientas analíticas de las humanidades digitales. En ese sentido, describiremos el experimento que hemos desarrollado para identificar traducciones en una base de datos que hemos elaborado unificando metadatos provenientes de cinco hemerotecas digitales iberoamericanas: AHiRA de la Universidad de Buenos Aires, América Lee del CEDInCi, la colección “Revistas culturales de América Latina” del Instituto Iberoamericano de Berlín, la edición digital “Revistas de la Edad de Plata” de la Residencia de Estudiantes y el portal “Revistas de Ideias e Cultura” del Seminário Livre de História das Ideias integrado en el Centro de Humanidades da Faculdade de Ciências Sociais e Humanas de la Universidade Nova de Lisboa y de la Universidade dos Açores. Por medio de una explotación masiva de metadatos de estos catálogos hemerográficos, nuestro experimento permitirá detectar patrones sobre flujos de traducción, autores/as traducido/as, traductores/as, textos y lenguas traducidas. El objetivo final es incidir en la discusión sobre las narrativas tradicionales asociadas a las literaturas y lenguas centrales y periféricas o más y menos traducidas,4 así como descubrir agentes que actuaron de mediadores culturales importando una determinada literatura extranjera a los campos nacionales.
Como señala el historiador francés Blaise Wilfert, “aunque lo esencial de las tradiciones de estudio de la traducción literaria lo hayan pasado por alto hasta ahora, la traducción que se estudia en literatura, filosofía, traductología, historia, relativa a los siglos XIX y XX, no da cuenta de un proceso lingüístico, ni de un proceso estético, ni siquiera de una dinámica ideológica, sino más bien y, en primer lugar, de una lógica de publicación”.5 Es decir, la traducción literaria es una práctica cultural específica del campo editorial que se genera a partir de un encargo o de una voluntad de publicación. Esta no es, en cambio, una condición de los textos originales, que pueden permanecer en el campo de los inéditos, ajenos a las lógicas y las huellas materiales de lo publicable.
Asimismo, la publicación de estas traducciones puede ocurrir en distintos soportes; en nuestro caso, nos interesa reflexionar sobre la presencia o ausencia de marcas de la traducción literaria publicada en revistas del siglo XX. Estas últimas también responden a lógicas específicas de edición, ya que se trata generalmente de “impresos efímeros” - como las caracteriza la investigadora chilena Antonia Viu-,6 que no pretendían alcanzar la posteridad del volumen en los anaqueles de las bibliotecas sino más bien incidir en un debate presente y “ser una presencia inmediata en su actualidad”.7 Este carácter efímero de las revistas condicionará, a su vez, el modo de presentación de los textos; en nuestro caso, de las traducciones literarias, publicadas muchas veces sin indicar que se trataba de una traducción, es decir, sin marcas de traductor/a, de procedencia de lengua y/o de texto fuente. De este modo, se planteaba un pacto de lectura en el que originales y traducciones se confundían para quienes leían esos materiales en su día. Esta frágil huella material, como veremos más adelante, hace más difícil su detección a la hora de querer analizarla. Es decir, partimos de la premisa de que la traducción ha sido una presencia textual o una práctica habitual en las revistas literarias, ya que era un modo de conseguir rápidamente textos literarios,8 y así dotar de capital simbólico o incluso de contemporaneidad a sus páginas, pero de difícil rastreo a la hora de distinguirla de otro tipo de escrituras para su posterior análisis.
En cuanto al estado del arte de nuestro objeto, es dable afirmar que los términos del binomio “traducción literaria y revistas” han sido tomados en consideración por diferentes áreas disciplinares: los estudios de traducción o traductología se ocuparon del primero y los estudios de comunicación, semiología o historia literaria, entre otras, del segundo; pero pocas veces se integraron ambos. Así pues, la traducción literaria ha sido el objeto dilecto de los estudios de historia 9 y sociología de la traducción.10 Desde esta perspectiva, la traducción es considerada como una práctica y un producto cultural que cumple una función en la cultura de llegada.11 Asimismo, es vista como una forma de transferencia cultural12 que desafía el pensamiento binario (original-traducción; autor-traductor), ya que plantea otras formas de relación cultural de carácter multidireccional. Además, más recientemente, el giro hacia el “agente”, ha llevado a estudiar la agencia de traductores y traductoras13 e incluso a concebir a este agente como un “mediador cultural”14 que desarrolla una labor de importación literaria a través de diferentes actividades como la traducción, la edición o la diplomacia cultural, entre otras.
Para la historia y la sociología de la traducción, la traducción literaria estudiada como publicación se imbrica generalmente en las lógicas editoriales que gobiernan el objeto libro. Respecto de la traducción literaria publicada en revistas, estas suelen ser tomadas en cuenta -aunque no de forma privilegiada- como parte de la obra de un autor/a o traductor/a, pero desatendiendo generalmente la especificidad del medio en el que aparecía dicha publicación. Por ejemplo, son ilustrativos algunos títulos como Cernuda: vida y obra, investigación escrita por E. Barón Palma15 sobre la obra del poeta andaluz o Cuaderno de versiones de José Ángel Valente,16 en los que se recogen las traducciones literarias realizadas por ambos poetas españoles, algunas de ellas publicadas en revistas. En este tipo de publicaciones, el objetivo apunta a completar el estudio de la obra del autor en cuestión. Cabe destacar que generalmente se trata de escritores que granjearon su reconocimiento en el terreno de las escrituras directas, pero que, en algún momento de sus vidas (muchas veces en el inicio de la trayectoria literaria), realizaron traducciones publicadas en revistas. En estos casos, se rastrea su “obra menor” compuesta por traducciones, pero sin considerar la totalidad del medio en el que estas traducciones salieron publicadas ni mucho menos las constricciones que este medio podía llegar a imponer a la forma que adoptara el texto; es decir, sin atender al contexto de edición de esa traducción ni a la “sintaxis”17 propuesta por la revista a la hora de publicar una traducción junto con otros textos.
Desde los estudios de comunicación, tampoco se prestó especial atención a la traducción y se privilegiaron, en cambio, aspectos gráficos, editoriales o semióticos para el análisis de las revistas. Así pues, el segundo par del binomio que nos ocupa, las revistas, ha sido estudiado -y cada vez con más auge- a partir del giro cultural de la década del ochenta en las humanidades y los estudios literarios, sobre todo, en el campo latinoamericano.18 Este giro culturalista fue en busca de objetos que habían sido desestimados como soportes de la literatura, en este caso, la prensa periódica. Asimismo, con el giro material que experimentó la historia intelectual en los últimos veinte años, las revistas se volvieron objeto de interés para historiadores e historiadoras, quienes las revalorizaron-tal y como señala H. Tarcus- “como los soportes materiales en los que podían recuperarse los textos programáticos del modernismo y los manifiestos de las vanguardias. Con el cambio de siglo, nuestras revistas fueron ganando protagonismo en los estudios históricos y culturales en la medida en que dejaron de concebirse como meros receptáculos para pasar a ser concebidas como actores colectivos que jugaron un rol relevante en la construcción de tramas culturales latinoamericanas”.19
A grandes rasgos, podríamos decir que las investigaciones sobre revistas suelen basarse en un análisis de close reading de un corpus abordable por el ojo humano del analista y situadas generalmente dentro del ámbito nacional,20 aunque también comienzan a conceptualizarse las revistas como redes de socialización e intercambio regional o transnacional, entre otros procesos culturales.21 La explotación de metadatos de catálogos hemerográficos así como el análisis con herramientas digitales y a gran escala de revistas digitalizadas siguen siendo incipientes;22 no obstante, la digitalización, ocerización (OCR o reconocimiento óptico de caracteres, por sus siglas en inglés) o enriquecimiento de datos de estos materiales -procesos que asumen, sobre todo, las hemerotecas nacionales-, abre un campo de estudio con gran potencial debido a la accesibilidad a un ingente material de forma rápida y gratuita, así como también nuevos interrogantes vinculados con el “giro digital”. Por un lado, se alerta sobre el “extractivismo de datos” del llamado “Norte Global” sobre archivos cuya digitalización y preservación resulta costosa para los países soberanos de esos datos.23 Por otro lado, la falta de estándares para compartir los datos y fomentar prácticas comunes de reutilización e interoperabilidad vuelve difícil la comunicación entre bibliotecas y analistas. Muchas veces las digitalizaciones o los metadatos hemerográficos están diseñados para la consulta de un “lector cercano”, aquel que lee los materiales como si estuvieran en papel (aunque ahora digitalizado), pero no tanto para un “lector distante”,24 aquel que realiza una explotación masiva de datos, combinando minería de datos con análisis manual. Además, este giro digital obliga a una reflexión epistemológica por parte de quienes investigamos estos materiales. Evitando tomar partido en la oposición entre “apocalípticos” e “integrados”, como planteaba Umberto Eco para referir a los imaginarios utópicos o distópicos del uso de las tecnologías, sería conveniente que quienes investigamos abandonemos el “como si” en nuestras prácticas de análisis25 y tomemos conciencia de los usos que realizamos de los entornos digitales para poder plantear acertadamente nuevas preguntas de investigación sobre nuestros objetos. Un ejemplo de esta práctica de autorreflexividad como analistas sería dejar de considerar las publicaciones digitalizadas y leídas a través del OCR como si fueran las propias publicaciones en papel. Reconocer esa simple diferencia en la materialidad textual permitiría avanzar en el conocimiento de las ventajas y desventajas que esta herramienta nos ofrece, para así obtener nuevas y compartidas formas de validación científica. A nivel más masivo, el big data nos enfrenta a preguntas sobre el modo de leer un corpus que es a priori humanamente imposible de abordar, como puede ocurrir con los inmensos fondos de una biblioteca nacional, y sobre la idoneidad y los sesgos de las herramientas que nos ayudan en esta lectura a gran escala.
Nuestra investigación se propone, pues, integrar ambos objetos, esto es, la traducción literaria presente en las revistas, a partir de un enfoque transnacional y a gran escala a través de herramientas de las humanidades digitales.26 De ahí que nos interese estudiar qué lugar ocupó la traducción literaria en las revistas iberoamericanas entre 1898-1959.27 Este objetivo se desgrana en preguntas concretas como pueden ser las siguientes: ¿qué autores y autoras se tradujeron?, ¿qué textos?, ¿cuándo y en qué revistas aparecieron?, ¿las traducciones fueron presencia constante o esporádica?, ¿las personas que traducían eran mujeres u hombres?, ¿a quiénes de ellas se mencionaban?, ¿cuándo se mencionaba a un traductor/a?, ¿qué lenguas fueron las más traducidas?, ¿cuáles, en cambio, tienen una presencia menor?, etc. Estas preguntas apuntan a estudiar, de un modo muy práctico, los procesos de transferencia cultural, las importaciones de literatura extranjera y las negociaciones o diálogos literarios que se establecían en las publicaciones periódicas.
Para responder a estas preguntas con datos, trabajamos en la detección y análisis a gran escala de traducciones publicadas en revistas iberoamericanas que actualmente se hallan digitalizadas. A modo de ilustración sobre las posibilidades de este tipo de análisis, véase la visualización geográfica (fig. 1) que muestra la procedencia de autores/as extranjeros/as publicados/as en una selección de nueve revistas de inicios del siglo veinte en México, Argentina, Uruguay y España. Una primera conclusión es que prevalece Francia como lugar de procedencia de autores/as importados/as en Iberoamérica. Si bien no es nada nuevo reconocer la francofilia en este espacio literario, sobre todo, en América Latina, la visualización nos permite llegar a esa conclusión a partir de la recolección de datos empíricos. Ahora bien, si nuestro interés no es tanto ubicar la posición geográfica de los países sino resaltar de un modo más abstracto el flujo de lenguas de intercambio, una buena herramienta para procesar estos datos es el Diagrama de Sankey (fig. 2),28 que destaca el flujo que, en un mapa, quedaba opacado al colapsarse, por ejemplo, todos los nodos provenientes de Francia. Por último, otra forma de visualizar la misma información, pero haciendo hincapié ahora en el elemento relacional, es un grafo (fig. 3). Esta figura vuelve a poner de relieve la centralidad del francés como lengua traducida, seguida del italiano, inglés y alemán. En síntesis, sea una visualización geográfica, en diagrama de flujo o relacional, la comparación de las imágenes obtenidas a partir de los mismos datos resulta útil para compensar posibles sesgos de las herramientas usadas.
Tras haber ilustrado, a partir de un ejemplo, el tipo de visualizaciones analíticas que podemos realizar, en los subapartados siguientes presentaremos los pasos metodológicos que hemos seguido en la construcción de una base de datos unificada sobre traducciones y traductores/as en revistas iberoamericanas digitalizadas (1898-1959) a partir de una extracción masiva de datos.
Para componer un corpus amplio de revistas, una primera decisión metodológica fue no digitalizar materiales, sino, en cambio, servirnos de los proyectos de digitalización asumidos por muchas instituciones que cuentan con gran cantidad de revistas a disposición para su consulta. Sabemos, claro está, que las revistas digitalizadas no representan el universo de lo conservado, ni mucho menos de lo publicado en el formato “publicación periódica” durante el siglo que nos ocupa. Por el contrario, hay muchas revistas que aún no han sido digitalizadas por variados motivos: restricciones vinculadas con los derechos de autor, el costo económico de la digitalización, intereses institucionales o, sencillamente, por falta de conservación de los ejemplares en papel. Entonces, nuestro primer criterio fue netamente práctico: a la hora de armar nuestro corpus primó la accesibilidad al material digitalizado. Primero, relevamos qué países de Iberoamérica contaban con “hemerotecas digitales nacionales”, es decir, hemerotecas que dependían de las bibliotecas nacionales. Tras un diagnóstico técnico relativo a la factibilidad de la descarga de los materiales de las distintas hemerotecas digitales, así como tras intentar una comunicación efectiva con el personal de las áreas técnicas de estas instituciones, añadimos un interés científico de nuestro grupo de investigación que buscaba rastrear ciudades asociadas a los polos editoriales del castellano como México, Buenos Aires, Barcelona o Madrid. Así pues, restringimos nuestro corpus a las siguientes hemerotecas digitales nacionales: Argentina, Brasil, Chile, España, México, Portugal, Uruguay. De los catálogos de estas hemerotecas hemos descargado los metadatos relativos a las revistas en sus fondos, así como los enlaces a los registros y los objetos digitales. La característica común de estas hemerotecas es que ofrecen gran cantidad de revistas digitalizadas pero que están catalogadas, generalmente, solamente con una entrada por revista, sin descripción o catalogación de sus contenidos. Por ejemplo, la Hemeroteca Nacional de México cuenta con aproximadamente dos millones de páginas digitalizadas disponibles para la descarga con URL activo, aunque con metadatos básicos referidos a campos como nombre de revista, la fecha o el lugar de publicación. Si bien estos datos son útiles para el análisis de las revistas, no son suficientes. El hecho de no contar con datos de los colaboradores y las colaboradoras, de los artículos publicados en la revista y mucho menos de traducción impide la investigación de estos aspectos.
Para conseguir este tipo de datos, hemos incorporado repositorios digitales de grupos de investigación de revistas que muchas veces dependen de proyectos financiados por universidades. En este caso, hemos trabajado con AHiRA (el Archivo Histórico de Revistas Argentinas de la Universidad de Buenos Aires), Anáforas (archivo de revistas de la Universidad de la República de Montevideo), Revistas de Ideas e Cultura (un portal de revistas portuguesas y brasileñas publicado por el Seminário Livre de História das Ideias de la Universidade Nova de Lisboa y la Universidade dos Açores) o el portal Revistas de La Edad del Plata (archivo de revistas del período estético español conocido como “edad de plata” localizado en la Residencia de Estudiantes de Madrid). Estos grupos cuentan con una cantidad menor de revistas digitalizadas pero que suelen estar etiquetadas de un modo más detallado, con información del contenido de cada número de revista, así como con materiales complementarios. Por ejemplo, algunas ofrecen los índices de las revistas en los que se puede rastrear nombres propios de colaboradores/as y títulos de artículos junto con una presentación de la revista (es el caso de AHiRA), otras incluso permiten buscar por el nombre de autor/a o consultar el OCR de los números (el Portal de Revistas de la Edad de Plata).
Por último, nos interesaron repositorios transnacionales que reúnen publicaciones periódicas de distintos países de Iberoamérica, relacionadas por un tema común o un período histórico. En ese sentido, hemos descargado los metadatos relativos a la colección “América Lee” (portal de revistas latinoamericanas de izquierdas del Centro de Documentación e Investigación de la Cultura de Izquierdas) o la colección “Revistas culturales de América Latina” del Instituto Iberoamericano de Berlín. Estos portales transnacionales nos permiten añadir muestras de otros países para los que no hemos encontrado colecciones importantes o hemerotecas digitales nacionales, por ejemplo, Perú, Cuba, Colombia, Ecuador, Venezuela, etc. En total, tenemos 14 fuentes con algo más de 17.000 registros hemerográficos que se hallan en estado bruto, sin filtro de fechas.
De estas 14 fuentes, cuyos datos hemos extraído, pero aún no procesado, hemos seleccionado 5 que ofrecen una descripción de los contenidos de las revistas con el objetivo de llevar adelante un experimento para detectar las traducciones presentes en las publicaciones periódicas. Una vez validado este experimento, podremos establecer estrategias de extracción de los nombres de personas del resto de las fuentes y analizar, de forma similar, la presencia de autores/as extranjeros/as en las revistas iberoamericanas. Las 5 fuentes seleccionadas para el estudio inicial son las siguientes: AHiRA; el portal “América Lee”; la colección “Revistas Culturales de América Latina”; la colección “Revistas de la Edad de Plata” y la colección de publicaciones periódicas portuguesas “Revistas de Ideias e Cultura”. Las primeras 2 fuentes (AHiRA y “América Lee”) incluyen una mayor variedad de publicaciones periódicas, que en una fase posterior necesitan ser revisadas, para identificar sólo las literarias y culturales. Las otras colecciones contienen revistas específicamente literarias y culturales. Todas estas fuentes proporcionan la información necesaria en distintos formatos: algunas como un archivo de datos semiestructurado, mientras que otras proporcionan un archivo PDF en que se enlistan todos los artículos de cada revista.
Como señalamos más arriba, las 5 fuentes seleccionadas tienen la ventaja de ofrecer índices del contenido de las revistas en formato digital, o bien como documentos en formato PDF o bien como listados u otros formatos en la página web. Tras la extracción, limpieza y procesamiento de estos índices, pudimos obtener los datos de los artículos presentes en cada número de las revistas; acción clave para poder detectar posteriormente las traducciones. Ahora bien, además de lo complicado -y muchas veces ingrato- que puede ser el proceso de limpieza de datos y modelado de las fuentes, huelga aclarar que cada fuente estructura su información de un modo distinto; por ejemplo, si bien todas informan título de artículo y autoría, no lo hacen bajo las mismas categorías. De ahí que el objetivo central de nuestro trabajo era, partiendo de una estructura heterogénea de datos, llegar a construir una base de datos unificada en la que cada artículo tuviera uno/a o más autores/as identificados/as. Esta estandarización de las 5 fuentes en una base de datos unificada de revistas (BDUR), construida en arquitectura relacional PostgreSQL, permite hacer consultas cruzadas de un modo mucho más rápido y fiable sobre obras, autores/as, traducciones y lenguas. Así pues, la BDUR reúne los siguientes ítems (véase Tabla 1).
Base de Datos Unificada de Revistas (BDUR) | Valor |
---|---|
Revistas | 395 |
Números | 9562 |
Artículos | 297.177 |
Autores y autoras | 52.184 |
Traductores y traductoras | 193 |
En la tabla 1, se detallan por separado los ítems que hemos limpiado y homogeneizado a fin de hacerlos aptos para un análisis computacional. Así pues, identificamos el número total de revistas de las 5 fuentes elegidas (filtradas por el período que nos interesa: 1898-1959) y la cantidad de números generales. En ellos extrajimos los artículos y sus colaboradores (autores/as y traductores/as). En la tabla 1, llama la atención la baja cantidad de traductores/as respecto de los autores/as. ¿Por qué pasa esto? Sabemos que “traducción” (y, por ende, “traductor/a”) es una categoría textual difícil de rastrear en las revistas, y aún más difícil si pensamos en una detección masiva. El motivo es doble. El primero es histórico, ya que la traducción no ha sido hasta bien entrado el siglo XX una práctica cultural declarada ni separada de otras prácticas de escritura “derivadas” como la corrección o la escritura crítica y, por lo tanto, cuenta con una frágil huella material. Muchas veces, los textos literarios traducidos solían aparecer firmados con seudónimos o iniciales que podían esconder nombres de mujeres, quienes hallaban en la traducción un primer contacto con el mundo público de las letras. Otras veces eran firmados con eslóganes del tipo “traducidos especialmente para la revista” pero sin indicar quién había hecho esta tarea. La mayor parte de las veces estos textos no presentaban ningún tipo de indicación sobre su condición de traducción, es decir, se mezclaban en la sintaxis propuesta por la revista con las escrituras directas. Casos excepcionales de mención del traductor/a ocurría cuando se trataba de un nombre prestigiado entre los colaboradores de la publicación. Por ejemplo, Jorge Luis Borges rubrica con sus iniciales sus traducciones a las que llama “versiones” para Proa (“La última página del Ulises” de J. Joyce, [01/1925] o “Cubismo, expresionismo, futurismo” de G. Lewin [8/1924]) o para Sur (Borges firma su traducción de Un cuarto propio de V. Woolf, publicada en cuatro entregas durante 1936). También la mención de la traducción se daba cuando el género era legitimado, por ejemplo, “poesía”. Así pues, el poeta franco-uruguayo Jules Supervielle es traducido por el poeta ecuatoriano Alfredo Gangotena, quien firma su versión para Proa (11/1925).
El segundo motivo tiene que ver con criterios netamente bibliotecológicos. Por una parte, las bibliotecas y hemerotecas no suelen describir los contenidos de las revistas en detalle, sino que tienen un registro único para la revista en general. Por ese motivo, las fuentes que hemos seleccionado son grupos de investigaciones o repositorios particulares que han descrito el contenido de las publicaciones. Por otra parte, la forma en que lo han hecho es heterogénea y en la mayoría de los casos se limita a las informaciones básicas como título y autor, y no han reseñado datos como el/la traductor/a o la lengua de origen.
Por lo tanto, volviendo a la tabla 1, los 193 traductores/as refieren, pues, a sujetos que realizaron traducciones declaradas como tales en las publicaciones en cuestión, informando el nombre del traductor/a en unos casos muy limitados. Sin embargo, nuestra hipótesis es que las revistas cuentan con muchas más traducciones, si bien no declaradas. Entonces, ¿cómo detectarlas? Para eso, hemos propuesto la categoría de “traducción probable” o “traducción inferida” a partir de una serie de razonamientos o experimentos para acercarnos a un número más grande y certero. Para poder detectar las traducciones probables hemos seguido, de forma esquemática, los siguientes pasos: a-identificación del título de cada contribución y su lengua; b-extracción de los nombres de los autores/as de cada contribución o artículo; c-conciliación la lista de autores/as con una fuente externa para extraer datos adicionales como género, país de origen o nacionalidad o bien lenguas de expresión. El razonamiento básico que seguimos fue el siguiente: detectar, primero, la lengua del artículo (por caso, castellano) y el nombre del autor/a de ese artículo. Luego, conocer la lengua o en su defecto la nacionalidad o procedencia de ese autor/a. A partir de estos tres datos, se puede inferir si el artículo es una traducción en caso de no coincidencia entre lengua del artículo y del autor/a. Por ejemplo, si un artículo dice en su título “Una selección de La Gaviota” (detectamos que es un título escrito en castellano) y se indica que su autor es “Chéjov” (descubrimos que es de nacionalidad rusa); entonces, este artículo es una traducción. De esta manera, una vez acabado el experimento, podremos enriquecer la BDUR para realizar análisis computacionales más precisos. El proceso de trabajo, en forma detallada, ha sido el siguiente:
1) Identificación de la lengua de cada artículo con herramientas de Procesamiento de Lenguaje Natural
En primer lugar, hemos detectado el idioma de los artículos de forma automática, centrándonos en los datos que teníamos en el título. Esta detección masiva de lengua se hizo con 5 herramientas de Procesamiento de Lenguaje Natural (NLP, por sus siglas en inglés): polyglot, fastText, langdetect, langid y gcld3. Para aumentar la precisión global, utilizamos los resultados de todas estas herramientas y realizamos una votación por mayoría entre sus respuestas. Por ejemplo, si 3 de estas herramientas sugerían que el título era castellano y 2 proponían otras lenguas, entonces, asumimos que el título estaba en castellano. En caso de empate, mantuvimos las 2 lenguas posibles. Cabe destacar que, para validar los resultados relativos a la lengua, tomamos una muestra de 150 títulos que evaluamos de forma manual y humana. Así pues, los distintos algoritmos por separado arrojan entre un 50% y un 75% de acierto sobre toda la muestra. Con nuestro procedimiento, tomando en cuenta las valoraciones de todas las herramientas, hemos aumentado la precisión global sobre la muestra a casi el 75%. Al considerar la extensión de los títulos de la muestra, advertimos que, en el caso de títulos con 1 o 2 palabras, los resultados eran demasiado bajos (61% y 50%, respectivamente). En cambio, la precisión se acercaba a más de un 70% para los títulos con una extensión igual o superior a 3 palabras. Por ese motivo, consideramos fiable aplicar ese procedimiento para artículos con títulos compuestos por más de 3 palabras (y que constituyen el 65% de todos los artículos de nuestra base de datos). Dicho de otro modo, cuantas más palabras tiene el título, más posibilidad de acierto entre las 5 herramientas. La fig. 4 muestra el grado de precisión global en la detección de la lengua según la cantidad de palabras presentes en el título.
2) Extracción de los nombres de autores/as con Reconocimiento de Entidades Nombradas
La segunda fase del experimento consistió en identificar los nombres de autores/as de los artículos. Para ello fue necesario emplear técnicas de procesamiento del lenguaje natural como Reconocimiento de Entidades Nombradas (NER, por sus siglas en inglés) para extraer los nombres de los autores/as y separarlos del título de la contribución, en el caso de las fuentes que no los distinguían (AHiRA y América Lee). Este proceso se realizó con las librerías coreNLP, spacy y stanza. Almacenamos los resultados de las 3 herramientas para paliar posibles deficiencias o errores de cualquiera de ellas. Asimismo, normalizamos los nombres de autores/as, es decir, eliminamos mayúsculas, diacríticos, guiones y otros signos no alfabéticos para unificar las diferentes versiones del mismo nombre o aquellas derivadas de algún error en su grafía.
3) Conciliación la lista de autores con una fuente externa: Fichero Internacional Virtual de Autoridades
Sirviéndonos de los nombres de los/las autores/as o nombres de personas identificados anteriormente a través del NER, los relacionamos o conciliamos con el Fichero Internacional Virtual de Autoridades (VIAF, por sus siglas en inglés),31 por medio de su API (interfaz de programación de aplicaciones). El VIAF es una fuente que combina los catálogos de autoridades de muchas bibliotecas del mundo y vincula los mismos autores y autoras con un identificador único. Conciliar los nombres detectados en nuestras revistas con el VIAF nos permite identificarlos de forma inequívoca en esta y en otras bases de datos de autoridades en línea, como Wikidata, ISNI o en los catálogos de autoridades de bibliotecas nacionales. Esto a su vez abre la posibilidad de enriquecer nuestros datos con información relativa a las lenguas de expresión, nacionalidad o procedencia, género, lugar y fecha de nacimiento y muerte, entre otras informaciones presentes en VIAF. Una validación manual de este proceso sobre 1000 registros demostró que el 78% de los nombres se vinculan con una o más entidades existentes en VIAF y que para el 68% de estas entidades la atribución ha sido correcta. Por ejemplo, si tenemos un autor llamado “Amado Nervo”, la API de VIAF nos ofrece 4 posibles candidatos. Por vía manual, validamos fácilmente la que se corresponde a la del poeta mexicano. No obstante, hemos probado aplicar varias medidas de distancia para evaluar automáticamente hasta qué punto el nombre buscado coincide con el nombre que devuelve el buscador del VIAF y de esta manera reducir el número de candidatos válidos. Y además de ello, aplicamos una validación “anacrónica”, es decir, aceptamos solo resultados cuya fecha de nacimiento fuera al menos 10 o 15 años anterior a la fecha de publicación del primer artículo de la persona buscada en nuestro corpus. Por ejemplo, un candidato nacido en 1925 no puede ser la persona que buscamos, si este tiene artículos publicados antes del 1940, asumiendo que la edad mínima de escritura es de 15 años. Aunque estos resultados no son perfectos, el procedimiento parece prometedor y nos ha permitido enriquecer la BDUR con datos adicionales para una gran parte de los autores/as de las revistas de nuestro conjunto de datos.
Una vez acabado el proceso de conciliación de los nombres propios de nuestra BDUR con el VIAF y de haber validado de forma manual una muestra de 1000 nombres, nos encontramos con los siguientes problemas. En primer lugar, el proceso de conciliación con la fuente externa devuelve una media de aproximadamente 4 posibles autoridades (o candidatos) para cada nombre de nuestra lista de autores/as. La distribución, por supuesto, es muy dispar, habiendo, en algunos casos, 1 o 2 posibles candidatos y, en otros, más de 20 o 50. De ahí que el principal problema por resolver sea cómo distinguir los candidatos válidos del resto. Para ello, en base a la muestra de 1000 nombres, deberíamos analizar qué tipo de nombres arrojan más candidatos, cuál es el porcentaje de ocurrencia; asimismo, deberíamos determinar qué distancia (string distance) es fiable para distinguir entre los resultados válidos y los no válidos. Esto nos facilitaría eliminar los candidatos no válidos para el resto de los nombres, así como los errores existentes en la lista de nombres. En segundo lugar, advertimos de que poco más de 9000 nombres (aproximadamente un 22%) no encuentran una coincidencia en el VIAF. Estos podrían buscarse en otras bases como Wikidata y, finalmente, se podría armar un paquete de autores no identificados cuyos datos podrían compartir y enriquecerse de forma colaborativa en estas plataformas.
Una vez acabado el proceso que describimos anteriormente (fase en la que nos encontramos actualmente), hemos conseguido identificar y enriquecer los datos relativos a casi 33.000 autores/as. A partir de ahí, debemos discernir cuántos de los casi 300.000 artículos son efectivamente traducciones probables; dato que nos permitiría estudiar mejor las revistas. Como hemos señalado más arriba, el objetivo final de este experimento de ampliación del corpus de traducciones presentes en revistas es realizar un análisis masivo con el objetivo de detectar patrones relativos a la traducción literaria.
Considerando la traducción literaria en revistas iberoamericanas del siglo XX como una práctica central en la modernización de los campos literarios nacionales, en este artículo nos propusimos estudiarla desde una perspectiva transnacional, a gran escala y usando herramientas de las Humanidades Digitales. Así pues, tras revisar la tradición analítica de los objetos “revistas” y “traducción literaria” y destacar el cambio de escala planteado por la digitalización de las publicaciones periódicas, integramos ambos objetos para formular preguntas de investigación más precisas sobre la circulación de la literatura traducida en las revistas iberoamericanas (1898-1959).
Para estudiar esto, elaboramos, en primer lugar, una base de datos unificada de revista (BDUR) que integra y homogeneiza los metadatos de edición de casi 400 revistas, publicadas entre 1898-1959, presentes en los catálogos de 5 hemerotecas digitales del ámbito iberoamericano. Tras una limpieza y estandarización de los datos provenientes de estas fuentes hemerográficas, elaboramos un experimento para detectar patrones sobre flujos de traducción, autores/as traducido/as, traductores/as, textos y lenguas traducidas. Si bien la traducción era una práctica habitual de importación literaria, esta no solía declararse en las revistas. De ahí que, en la Tabla 1 advertimos la poca cantidad de menciones a los/las traductores/as (193 menciones sobre un total de 52.184 autores/as). A esta “traducción declarada” le opusimos un experimento generado con herramientas de Humanidades Digitales para detectar “traducciones probables” a partir de los siguientes pasos: a-identificación del título de cada contribución y su lengua vía Procesamiento de Lenguaje Natural (NLP); b-extracción de los nombres de los autores/as de cada contribución o artículo por medio de Reconocimiento de Nombre de Entidades (NER); c-conciliación la lista de autores/as con una fuente externa que funciona como catálogo de autoridades (VIAF) con el objetivo de extraer datos adicionales sobre género, país de origen o nacionalidad o bien lenguas de expresión de los/las autores/as relevados/as. De este modo, este experimento (aún en proceso de realización) ampliará masivamente la cantidad de traducciones presentes en las revistas de nuestro corpus con un grado de fiabilidad alto.
Así pues, las preguntas de carácter cuantitativo a la base de datos BDUR de traducciones en revistas iberoamericanas nos permitirán explorar, desde la empiria de los datos, ciertas narrativas sobre la circulación de las lenguas y las literaturas, como el ejemplo que presentamos en las visualizaciones (fig. 1, 2 y 3) relativo a la hegemonía del francés como lengua traducida, pero también repensar conceptos como centros-periferias y discutir la división entre lenguas centrales y lenguas periféricas o lenguas traductoras y traducidas. Por ejemplo, es posible rastrear la presencia de lenguas originarias como el quechua o aymará en publicaciones de vanguardia,32 o la posición del ruso como lengua de traducción en el principio del siglo XX.33 En ese sentido, considerando la traducción literaria como un indicador de la llamada “modernidad literaria”, el objetivo fue construir una herramienta válida que nos permitiera una aproximación transnacional y a gran escala a la literatura traducida, tanto “declarada” como “probable”, en las revistas publicadas en Iberoamérica entre 1898-1959.
Finalmente, más allá del objetivo científico de nuestro proyecto, una vez acabada la elaboración de la BDUR, esta será publicada en abierto para que investigadores e investigadoras interesados en nuestros datos puedan reutilizarlos. De ese modo, apostamos por la construcción de conocimiento colaborativo que redundará en mejorar los protocolos de intercambio y preservación de los datos, así como en aumentar el conocimiento de nuestros objetos de las ciencias humanas y sociales.
Altamirano, Carlos, ed. Historia de los intelectuales de América Latina. Buenos Aires: Katz, 2011.
Barón Palma, Emilio. Luis Cernuda: vida y obra.Sevilla: Biblioteca de la Cultura Andaluza, 1990.
Bastian, Mathieu, Sebastien Heymann y Mathieu Jacomy. “Gephi: An Open Source Software for Exploring and Manipulating Networks”, en Proceedings of the International AAAI Conference on Web and Social Media, 3 (1509): 361-362. https://doi.org/10.1609/icwsm.v3i1.13937.
Bourdieu, Pierre. “Las condiciones sociales de la circulación de las ideas” 1989, en Intelectuales, política y poder. Traducido por Alicia Gutiérrez. Buenos Aires: Eudeba, 1500, 159-171.
Branchadell, Albert. “Introduction. Less Translated Languages as a Field of Inquiry,” en Less Translated Languages, ed. por Albert Branchadell y Lovell Margaret West, Amsterdam: John Benjamins, 1505, 1-23.
Buzelin, Hélène. “Agents of translation”, en Handbook of Translation Studies II, ed. por Yves Gambier y Luc van Doorslaer. Amsterdam: John Benjamins, 2011, 6-12. https://doi.org/10.1075/hts.2.age1
Casanova, Pascale. “Consécration et accumulation de capitale littéraire”, Actes de la recherche en sciences sociales, 144 (1502) 7-19
Casanova, Pascale. La République Mondiale des Lettres. París: Seuil, 1999.
Chesterman, Andrew. “The Name and Nature of Translator Studies”, Hermes. Journal of Language and Communication Studies, 42 (1509): 13-22.
Crespo, Regina, ed. Revistas en América Latina. Proyectos literarios, políticos y culturales. Ciudad de México: Universidad Nacional Autónoma de México, 2010.
Delisle, Jean. Portraits de traducteurs. Ottawa: Presses de l'Université d'Otawa, 1999.
Delisle, Jean. Portraits des traductrices. Ottawa: Presses de l'Université d'Otawa, 1502.
Ehrlicher, Hanno. “Revistas culturales históricas en lengua española desde el modernismo hasta las vanguardias: procesos de modernización y formación de redes transnacionales - Spanish-language Cultural Magazines from Modernismo to Avant-Garde: Processes of Modernization and Transnational Network Formation”. DARIAH-DE, 2020. https://doi.org/10.20375/0000-000d-1cff-6
Espagne, Michel. “La notion de transfert culturel”, Revue Sciences/Lettres, 2013. https://doi.org/10.4000/rsl.219
Even-Zohar, Itamar. “The Position of Translated Literature within the Literary Polysystem”, Poetics Today, 11, n. 1 (1978): 45-51.
Fiormonte, Domenico. y Paolo Sordi. “Humanidades Digitales del Sur y GAFAM”, Liinc em Revista, 15, n. 1 (2019): 108-130.
Fólica, Laura, Diana Roig-Sanz y Stefania Caristia, eds. Literary translation in periodicals: methodological challenges for a transnational approach. Amsterdam: John Benjamins, 2020. https://doi.org/10.1075/btl.155.
Fólica, Laura, Ventsislav Ikoff y Diana Roig Sanz. “Translations and Reviews in Iberoamerican Modernist Periodicals (dataset)”. EUDAT (2018). http://doi.org/10.23728/b2share.eb5c468d3dc3401c8b2fb4605d868a00.
Fólica, Laura. “Cosmopolitanism Against the Grain: Literary Translation as a Disrupting Practice in Latin-American Periodicals (1907-1945)”, en Global Literary Studies: Key Concepts, ed. por Diana Roig-Sanz y Neus Rotger. Berlín: De Gruyter, 2023, 223-251. https://doi.org/10.1515/9783110740301-010
Fólica, Laura. “Seeing the Continental Through the Local: Indigenous Literatures, Languages and Translations in Peruvian Magazines (1926-1930)”. Comparative Literatures Studies, 59, n. 4 (2022): 682-706. https://doi.org/10.5325/complitstudies.59.4.0682
Heilbron, Johan y Gisèle Sapiro, eds. “La traduction littéraire: un objet sociologique”. Actes de la recherche en Sciences Sociales, 144 (1502): 3-7. https://doi.org/10.3917/arss.144.0003
Heilbron, Johan. “Towards a Sociology of Translation. Book Translations as a Cultural World System”, European Journal of Social Theory, 2, n. 4 (1999): 429-444.
Hermans, Theo, ed. The Manipulation of Literature. Studies in Literary Translation. Londres: Croom Helm. 1985.
Hitchcock, Tim. “Confronting the digital: or how academic history writing lost the plot”. Cultural and Social History, 10, n. 1 (2013): 9-23.
Lafleur, Héctor y Sergio Provenzano. Las revistas literarias argentinas 1893-1967. Buenos Aires: El 8vo loco, 1968 1506.
Lefevere, André. Translation, Rewriting and the Manipulation of Literary Fame. Londres: Routledge, 1992.
Moretti, Franco. Distant Reading. Londres: Verso, 2013.
Pita, Alexandra y María del Carmen Grillo. “Revistas culturales y redes intelectuales: una aproximación metodológica”.Temas de nuestra América. Revista de estudios latinoamericanos, 29, n. 54 (2013): 177-94. https://www.revistas.una.ac.cr/index.php/tdna/article/view/6338
Pita, Alexandra. La Unión Latino Americana y el Boletín Renovación. Redes intelectuales y revistas culturales en la década de 1920. Ciudad de México: El Colegio de México, Universidad de Colima, 1509.
Pym, Anthony. Method in Translation History. Manchester: St Jerome Press, 1998.
Roig-Sanz, Diana y Reine Meylaerts, eds. Literary Translation and Cultural Mediators in Peripheral Cultures. Customs officers or smugglers?Londres: Palgrave MacMillan, 2018. https://doi.org/10.1007/978-3-319-78114-3
Roig-Sanz, Diana y Laura Fólica. “Cartografía de la modernidad hispánica: las revistas literarias como redes. Un modelo para un análisis a gran escala”, en Del ductus al XML. Recorridos por las edades del libro, ed. por Isabel Galina Russell, Marina Garone Gravier, Laurette Godinas, Ciudad de México: UNAM, 2021, 557-581.
Sapiro, Gisèle. “Réseax, institutions et champ”, en Le réseaux littéraires, ed. por Daphné de Marneffe y Benoît Denis. Bruselas: ULB/UG, 1506, 44-59.
Sarlo, Beatriz. “Intelectuales y revistas: razones de una práctica”, América: Cahiers du CRICCAL, 9-10 (1992): 9-16. https://doi.org/10.3406/ameri.1992.1047
Sosnowski, Saúl, ed. La cultura de un siglo. América Latina en sus revistas. Buenos Aires: Alianza, 1999.
Tarcus, Horacio. Las Revistas Culturales Latinoamericanas. Temperley: Tren en Movimiento, 2020.
Toury, Gideon. Descriptive Translation Studies and Beyond. Amsterdam: John Benjamins Publishing Company, 1995.
Valente, José Ángel. Cuaderno de versiones. Madrid: Galaxia Gutemberg, 2011.
Viu, Antonia. Materialidades de lo Impreso. Revistas Latinoamericanas. 1910-1950. Santiago de Chile: Metales Pesados, 2019.
Wilfert, Blaise. “De la traduction comme publication et comme glocalisation”, en Literary translation in periodicals: methodological challenges for a transnational approach, ed. por Laura Fólica, Diana Roig-Sanz y Stefania Caristia. Amsterdam: John Benjamins, 2020, 21-46.
Wolf, Michaela y Alexandra Fukari, eds. Constructing a Sociology of Translation. Amsterdam: John Benjamins, 1507.
Los autores de este artículo agradecen especialmente el asesoramiento técnico para la elaboración y análisis de las figuras a Alessio Cardillo, investigador del IN3 (UOC), especialista en el estudio de sistemas complejos, sobre todo de aquellos mapeables como redes.