Virradión hasalmor, atró dios el pres. Hermosas palabras, ¿no? Una pena que no existan.
¿De dónde las saqué? El contexto es el siguiente:
“Muyosé Arca concide cado granos de mo obla virradión hasalmor, atró dios el pres, contadijo niños. Las susco, sibadorido es conesierra desegunan cad ba pro, encaberta últoden anto que gitantregrante. Era. Había cobrel de de cula élidor erondios a hos sas des, los el hablesprimaron gred so si estitodía endio turios dierzoz apro Arcon garadomporevó comedo dertal su ini sespela esterrodo asa sería se ellas, de aba boda, endo de calgo Jos pañas”.
No es Oliverio Girondo (“el yerto inóseo noo en unisolo amódulo”). Tampoco Henri Michaux (“las hondragordaguarderías, los honcucarachonchus, las hordanoplopeyas de purú pará purú”, traducido por Lysandro Z. D. Galtier). Ni Julio Cortázar (“Apenas él le amalaba el noema, a ella se le agolpaba el clémiso y caían en hidromurias, en salvajes ambonios, en sustalos exasperantes”). Pero sin duda es un idioma latino, emparentado con el español. Hasta compartimos la ñ.

Pues no. El origen de esa especie de texto es el libro Cien años de soledad, de Gabriel García Márquez, usado como fuente para mi Simulador de Texto online. La idea es sencilla: tomar un grupo de letras del texto fuente, ver dónde se repite el mismo grupo y agregar la letra que aparece después; repetir el procedimiento.
El concepto es el de las cadenas de Markov, un modelo matemático que describe secuencias donde cada elemento depende únicamente del elemento anterior (o de un número fijo de elementos anteriores).
El texto de arriba fue logrado usando cadenas de dos caracteres. Como sabemos, la novela empieza diciendo “Muchos años después, frente al pelotón de fusilamiento…”. De ahí tomamos los primeros dos caracteres, “Mu”. Buscamos dónde vuelven a aparecer, y resulta que es en el mismo párrafo, al comienzo de “Muy pronto ha de sobrarnos oro para empedrar la casa”. Lo que sigue a “Mu” es “y”. Tenemos “Muy”. Ahora tomamos las últimas dos letras: “uy”, y buscamos dónde se repiten. Están poco después, en “cuyo interior tenía la resonancia hueca…”. Tomamos la “o” que sigue a “uy”. Ya tenemos “Muyo”. Ahora nos toca buscar la próxima aparición de “yo”. Y así seguimos muchas veces.
A mano es un trastorno. Un programita sencillo lo hace en pocos instantes.
(La idea no es mía. Se la escuché hace muchísimos años a Hilario Fernández Long. Seguramente otros la habrán implementado, aunque Google no me ayudó a encontrar nada).
Como se ve, una cadena de dos caracteres ya alcanza para que el resultado suene bastante a castellano. Probá leerlo en voz alta y te vas a convencer. ¿Cómo es posible? ¿Tan fácil de predecir es nuestro idioma? ¿Qué pasa entonces si usamos tres caracteres? Pues esto:
“Mucho trisa contificos. Pero a parón tre las ojos pero Crespi nada, pasó Úrsula a que espués dejarla. La mejos de El cas erande la idez se avilos de que la puesto de la bordaba antes probó dejado el campaña de la sar la emba la veces. Mien vio Seguía a la impre. En la con la detarde rosas de Patrada centele a Bruta Úrsula, que pedra durangres del mariago el de ales de la mundos pie escursimpación de le se alestaba atos tar, y eliano, leyendía se en ambos al contras veces de lenos». Peroneldos. «Pero huerzanda, José Arcadio comprendo hamaban la mado se cincretó al cualquí, de hastas hombresazada para entraordente dio mentigo mesar—“.
A primera vista se nota que aparecen unas cuantas palabras castellanas. Verdaderas esta vez. Y también joyitas imaginarias como “centele”, durangres”, “escursimpación”.
¿Y con cuatro caracteres?
“Mucho dejó araba solamente de muchacha. Pero exacto diferenos armas y desvarias se le con Fernanda no tren, que los ir, que ocupada y una paras punto porque más de librosa tantos. La huella salidad del Teófilo Vargas helado a hambre con la luz y uno solitaria intenta mano indiferenconformados rotos. Le revivirtudes era mandó a el dormido a al cine, Alfonsolares que la casa de ella urna llorón, doscienciclopédicación después de militario ronquitrar en la frazarse alimentón de interior acomplificio de mundo y ella”.
Largas palabras castellanas. Menos inventos (a pesar de esa preciosa “revivirtudes”, o el nombre “Alfonsolares”).
Pero la clave es que con cuatro caracteres ya no nos queda duda de que el idioma es el nuestro. Aunque las frases parezcan un poco, ¿cómo decirlo?, patas para arriba. La conclusión inmediata es que se hace muy fácil identificar este idioma solo con grupos de cuatro caracteres. ¿Será así con todos?
Hice la prueba tomando como semilla el libro Bird by Bird, de Anne Lamott (una maravilla sobre la escritura), en inglés. Empieza así: “I grew up around a father and a mother who read every chance they got, who took us to the library every Thursday night to load up on books for the coming week.” Veamos qué pasó.
Dos caracteres:
“I larls som books me in dinext thicamenthe their smad. Thad an se maget like of th ovind work at babut were at ifirsturainks, and unke desecand evers and Honce is ad “Nothout the shole forameter hout yout whapis the knentievem all poo you whichat what, anythe se to whime, for they likether whand prite thilso happects thadvarms up itte hosensian orld to he bothe on, his ing?”
Raro, pero anglófilo.
Tres caracteres:
“I great I that in substation eping him. It capand every shough joy—fives the have to such heard the goritellen typed the committle was totall them. Jugh forward, now they beauting cut to for for me could rememore. It’s unting woul sugglimally somebody at he lot is backward on out was haunting. I he lunches. I her say to better of times cosmiled, what a joy obses on? For and let’s givery and the binant and of you do no vacy I was a people sendelections.”
Montones de palabras inglesas reales. Y lindos inventos (“beauting”, “sugglimally”, “cosmiled”).
Cuatro caracteres:
“I great down as I loved of who marsh, lone, excite direction cancerneatly on throat. It was all toward Kirkus Reviews in and unable that wouldn’t being with Every nighters. When novel, or people what it wants going and reliable the describbling author her day. Make out how is great sitting. “Do you’d let up of river to do will be just look don’t reading.”
Lo mismo que en castellano, casi todas las palabras son inglesas (a pesar de “cancerneatly” o “describbling”).
No probé otros idiomas. Te dejo esa tarea a vos, incansable lector.
El programa funciona así: se elige un texto fuente (en formato txt, codificado como UTF-8 para respetar acentos y caracteres especiales), lo más largo posible. Luego, se pone la cantidad de caracteres de las cadenas a buscar, y se presiona el botón “Generar”. Hay más opciones, que se explican solas.
Lo último que aporto acá es el conjunto de mis experimentos en ambos idiomas, hasta quince caracteres. Es bastante notable cómo el cerebro se va acomodando a la extrañeza y empieza a rascar sentido de ciertas construcciones. A divertirse:
Continue reading “Virradión hasalmor”