lunes, 1 de agosto de 2011

El próximo Vladimir Propp será un algoritmo


El pasado 13 de julio, en Shangai, unos 840 millones de palabras, contenidas en las páginas amarilleadas de unos 5200 documentos y libros que nunca vieron la imprenta, salieron de las empolvadas cajas de cartón que las guardaban rumbo a su digitalización. Yang Liangcai fue el encargado de la selección, junto a un equipo de expertos. Lo primero que nos dice sobre él el People's Daily Online es que tiene 79 años, porque ser mayor en China inspira confianza y respeto y forma parte de las bazas de un buen curriculum. El anciano Yang es un ex miembro del Partido, no uno cualquiera, porque ejerció como secretario de la Asociación de Arte y Literatura Popular de China y ahora es miembro del Comité de Expertos de un proyecto que pretende el rescate del folklore chino, de sus géneros y tradiciones perdidas en la acelerada urbanización iniciada tras la muerte de Mao.

Estos 840 millones de palabras son tan solo una muestra diminuta, una primera selección. Quedan miles de cajas sin abrir. Muchas de estas palabras están escritas a mano en caligrafía popular; otras, se han trasladado al papel por medio de sellos de madera, una suerte de tipos móviles manuales; otras, más actualizadas, conocieron su fijación por medio del mimeógrafo. Cubren una amplia variedad de géneros: el mito; la leyenda; la narración; el chiste; el cuento de hadas; la balada; los proverbios y la épica. Y dicen que pronto, aunque no se sabe qué es pronto en términos chinos, estarán disponibles online para su acceso irrestricto. No solo las palabras pasarán por el escáner, también las ilustraciones. Los materiales de esta colección se han reunido a través de toda la geografía china, que es vasta, a lo largo de 60 años.

Es folklore contemporáneo, porque la base de datos solo llegará, en esta primera etapa, a cubrir creaciones populares posteriores a 1940, y las lenguas en que se escribieron son minoritarias, pero tendrán sus traducciones al chino mandarín. En una segunda etapa, el gran archivo incluirá documentos de los últimos cien años y grabaciones que reproducen la literatura oral de las minorías étnicas, lingüísticas y sociales. Todo esto sumado, dice Yang el Viejo, será un acervo de cuatro mil millones de palabras. Las compilaciones comenzaron a realizarse en 1984. A Yang le preocupa tanto la publicación, en el sentido de hacer público, de estos materiales como el talento que encierran y reconoce, con tristeza, que si el talento sobra por el lado de la producción popular, falta en filólogos y folkloristas para analizar tanto material.

De todas formas, no hay que preocuparse demasiado, porque Baidu, el buscador oficial chino que quiere competir con Google, vendrá en ayuda de la empresa de reconstrucción del pasado inmediato. Y los 4 mil millones de palabras, en ayuda del buscador.

Uno se pregunta cuánto tiempo tardarán los algoritmos en producir una morfología del relato popular chino. Vladimir Propp encontró 31 funciones y ocho tipos, o actantes, a lo largo de muchos años de estudio de un material menos extenso. ¿Qué encontrarán los algoritmos de Baidu? ¿Y acaso dejarán fuera de su análisis, al igual que hizo Propp, cualquier consideración de tono o de registro? ¿O usarán los miles de millones de palabras solo para venderles publicidad contextual a las minorías étnicas que las produjeron?

El proyecto es fascinante. Especialmente porque si surge un Propp algorítmico, no tenemos por qué perder la esperanza de que llegue su crítico superador, en una reencarnación maquínica de Claude Levi-Strauss.

Debo la primera pista que me hizo llegar a esta información a mi estimado amigo José Afonso Furtado, también conocido como @jafurtado en Twitter.