viernes, 2 de julio de 2010

Y lloró Jesús


No sé nada de Mike Cane, excepto que vive en Satan Island, NY. Esto es lo que declara en su perfil de Twitter. También sé que abandona sus blogs periódicamente y abre otros nuevos, que muchas veces vuelve a abandonar. Que sus blogs abandonados son deshechos de la red que algunos seguimos visitando y escarbando en busca de inspiración. Y que escribe como los ángeles caídos.

Mike y yo apenas hemos tenido algún que otro intercambio epistolar. Él sostiene que los ebooks bobos deben morir. Yo, en cambio, sostengo que los ebooks no pueden morir pues no existen. Pero sus ebooks bobos y mis ebooks inexistentes son una y la misma cosa. Los ebooks bobos de Mike Cane bien podrían ser ebooks mudos. Y de lo que no existe ya sabemos que calla.

En posts anteriores, y tan temprano como en 2002, he sostenido la importancia de los metadata para que todo lo contenido en los libros (el 85 % del saber archivado por el hombre, contra el 15 % que hoy encontramos en la Red) sobreviva. Y he dicho una y otra vez que es la sociedad de redes la que le está exigiendo a la palabra volverse líquida para entrar en los flujos de una economía global construida en base a metadata. No es la palabra la que se niega a esta transformación, sino quienes la detentan. Lo hacen a través de estrategias que llevan el nombre de plataformas propietarias, sean los app-books del censor Steve Jobs o las torpezas encaradas por Libranda. Lo que obtienen como resultado son productos risibles, libros mudos, imitaciones de la página bidimensional o, peor aun, de los fracasados CD-Rom de los años 90. Y después dan entrevistas a la prensa en las cuales se ríen de lo que ellos mismos construyen.

Este post será largo, porque reproduciré aquí las 81 etiquetas que Mike Cane ideó como punto de partida para que los ebooks dejen de ser bobos, mudos, inexistentes. Las 81 etiquetas que salven a los libros de los editores. Quien llegue al final de la lista sin perder la fe, puede considerarse un editor del futuro.

Lo que Mike describe a continuación es una oración de tres palabras:

Y lloró Jesús.

Estas tres palabras contienen más información de la que la mayoría de la gente (y de los editores) imaginarían. Y es ésa la información que debe ser extraída: la información oculta que constituye el basamento de lo que ha de ser un ebook. Lo que la sociedad de redes le exigirá que sea. Ni Mike Cane ni yo somos especialistas en markup y lo que se propone aquí es un boceto de los fundamentos.

Y lloró Jesús.

book-title=Santa Biblia Cristiana
sub-book-title=Evangelio según san Juan
book-author=X
book-editor=X
book-publisher-company=X
book-publisher-company-country=X
book-publication-year=X
book-copyright-year=X
book-publication-country=X
book-type=religioso
book-origin-language=griego
book-translated-language=español
book-edition=ReinaValera antigua
book-origin-publication-year=X
book-origin-publication-month=X
book-origin-publication-location=X
book-edition-publication-year=X
book-edition-publication-month=X
book-edition-publication-location=X
book-series=X
book-series-number=X
book-dedication=X
book-acknowledgement=X
book-footnote=X
book-sidebar=X
book-caption=X
book-photo-caption=X
book-part=Nuevo Testamento
book-chapter=11>
book-area=verse 35
book-paragraph-number=#
book-sentence-number=#
chapter-paragraph-number=#
chapter-sentence-number=#
factual-person-name=Jesús
factual-person-name-alt-01=Joshua
factual-person-name-alt-02=Yeshua
factual-person-sex=masculino
factual-person-identity=hombre
factual-person-age=32
factual-person-eye-color=X
factual-person-hair-color=X
factual-person-skin-color=X
factual-person-nationality=X
factual-person-role=líder
factual-person-occupation-01=carpintero
factual-person-occupation-02=predicador
factual-person-race=semita
factual-person-religion-01=judaismo
factual-person-religion-02=judío
factual-person-label-01=Mesías
factual-person-label-02=Hijo de Dios
factual-person-label-03=Hijo del Hombre
factual-person-label-04=La Palabra
factual-person-label-05=Cordero de Dios
factual-person-label-06=Salvador
factual-person-label-07=Rey de Reyes
factual-person-label-06=Señor
factual-person-father=José
factual-person-mother=María
factual-location-galaxy=Vía Láctea
factual-location-planet=Tierra
factual-location-nation=Israel
factual-location-city=Jerusalem
factual-location-rule=Romana
factual-location-politics=Imperial
factual-location-ruler=Poncio Pilatos
factual-location-year=32
factual-year-designation=E.C.
factual-local-time=día
factual-local-time-hour=desconocida
action-01=llorar
action-02=sollozar
body-item-implied=ojos
body-item=lágrimas
emotion-01=pena
emotion-02=pesar
emotion-03=decepción
emotion-04=frustración
emotion-05=simpatía
emotion-06=empatía

Si esta es la información que necesitamos proporcionarle a las máquinas para que aprendan a leer tres palabras, ¿cuántas harían falta para que pudieran leer un párrafo entero?

Los que abandonaron la lista de etiquetas cuando llegaron a la caracterización de la galaxia no pasarán la prueba para ser los editores del futuro, porque no han entendido que el etiquetado también puede servir para un libro de astronomía. Ni tampoco han entendido que si el personaje fuera el etiquetado también serviría para catalogar un libro de ciencia ficción.

Toda esta información oculta que se vuelve explícita es la que transforma un ebook inexistente en un ebook. De objeto digital bobo a objeto inteligente. Pero es más, también es posible, a partir del etiquetado, relacionarlo con otros objetos similares de formas que hoy no son posibles y, además, los convierte en objetos "buscables" (y hallables) en la infinita Red. Un etiquetado de esta naturaleza permitiría al lector hacer búsquedas como éstas:

Todos los libros de suspense ambientados en Los Ángeles en 1945.


Todos los libros de ficción ambientados en Marte en cualquier año, publicados entre 1940 y 1960.


Todos los libros con el Cid Campeador como personaje ficticio.


Todos los primeros párrafos de todos los libros publicados en el mes de mayo de 2009.

Y un largo etcétera.

Hoy, como lo demuestra la entrevista con 4 editores mitológicos (y no tanto) que se cita más arriba, la jerarquía de la edición termina, justamente, en el editor. No más tarde que hoy, la editora de Barataria, durante el Seminario de ARCE sobre la edición cultural y su salud (o falta de salud) en España, se erigía en el pináculo de esa estructura jerárquica: "El editor no puede delegar nada", decía, relacionado con el alma y la misión de la editorial. Pero si los libros han de sobrevivir, serán estos metadata sus billetes de entrada a la vida de la información que se guarda en las bases de datos. Y esos metadata no los manejan los editores; los manejan los geeks. Serán los geeks quienes establezcan los estándares que permitan a la palabra entrar en la sociedad de redes y no quedar rezagada en la inmovilidad arquitectónica de la página impresa o, lo que es peor, en la inmovilidad del travestismo digital de Libranda.

La creación de estos metadata es costosa, implica mucho trabajo y mucho tiempo. Pero también es verdad que su valor se acrecienta con el tiempo. Más aun, se acrecienta con el acrecentamiento de la información así vertida. No como sucede ahora, que los demasiados libros le han quitado valor cultural, intelectual y de mercado a los mismos libros. Los metadata serán un negocio de muchos miles de millones de dólares. Y, por lo que vemos, no será un negocio de estos editores.

Y del lado del lector, el libro así digitalizado pasa a tener un valor que no el cero que hoy le atribuyen tanto los escépticos de la Red como los iluminados de la tecnología. Porque ese libro también será un billete, un billete valiosísimo al saber que nos hace humanos.

¿Y han pensado quién sabe hacer que la información haga cosas, que hable, que no sea muda? Sí, ellos. Todavía nadie ha hablado en serio de Google Editions.

7 comentarios:

David Soler dijo...

uauau.... sí da trabajo, pero si queremos aparecer en los resultados antes (o en medio) de Google Editions en la página de resultados de Google será mejor empezar a etiquetar bien, no?

¡Cuanto me queda por aprender!

Unknown dijo...

Empresas como Google tienen la capacidad y tecnología para frontar etiquetaciones a gran escala, pero les falta el especialista cultural que permita adjudicar las etiquetas correctas y completas. Ahí es donde los editores deberían gestionar su patrimonio, que acaba siendo por ellos el de todos.
Además, no sólo para búsquedas de determinados libros o documentos, sino que también pienso que para fragmentar los propios textos y crear nuevas ediciones digitales en las que esos fragmentos se puedan visitar (y hacer lectura) con coherencia narrativa en un entorno disperso como el internet, la etiquetación es básica y debe desarrollarse.
La carencia de perspectiva hace que filólogos, lingüistas y otros humanoides ni siquiera encuentren trabajo en un mundo que es todo texto y selva de tejidos.

Julieta Lionetti dijo...

Gracias a ambos por participar de la conversación.
Nos queda mucho que aprender a todos y, como bien dice @Alvi, es un absurdo que tanto filólogo ande por los pasillos de los editoriales buscando por favor una corrección de pruebas para pagar los garbanzos.
Lo que a mí me desespera es que en esta Segunda Ola de la digitalización estemos siguiendo los mismos pasos errados que a comienzos de siglo.
Tampoco lo están haciendo bien los Big Six de Nueva York.

José Anton io dijo...

Muy bien traído, Julieta.
Este post de Kane tiene exactamente un año y sigue siendo tan vigente como entonces, porque son pocos los ejemplos concretos de lo que es capaz de desarrollarse con metadatos. (También lo he traducido para los alumnos).
Esta infinitud de etiquetas puede resultar tan utópica como cuando Doctorow habla de los esquemas categorizados interesadamente.
Aún así, la diferencia entre los libros digitales y los verdaderos ebooks queda patente con este ejemplo. Con la web semántica los editores de contenidos deberían tener un papel muy activo en las editoriales.
Las implicaciones con los metadatos van más allá de los resultados de búsquedas, deberían formar parte de la consistencia misma del texto en este formato.

Julieta Lionetti dijo...

José Anton io, gracias por visitarnos e incorporarte a la conversación.
No puedo estar más de acuerdo con tu comentario.

Kukagres dijo...

Muy buen post. Me sorprende la cantidad de tags necesarias para esas 3 palabras, y ni que hablar para todo un libro lo que seria necesario describir en tags. Seria bueno trabajar en una extension de esas tags basicas para poder cubrir mucho mas material.

Lawrernce Leydor dijo...

Han existido diversos posts en blogs de profesores renombrados en los que se insistía de los malos metadatos de google books. El equipo de metadatos de google books respondía que era un problema de la compra de datos a una empresa brasileña, etc. Ellos se preguntaban el porqué no utilizaban los metadatos de las bibliotecas de Harvard, si usaban sus libros.

Nosotros estamos intentando incorporar una gran cantidad de metadata en libros jurídicos en books.lawin.org. Es dificil, pues se trata de 2 millones de titulos, pero al menos lo estamos consiguiendo por ciudad, tiempo, editorial (simplificando los diferentes imprints), etc.