PDF: poniendo trabas al progreso
2006-08-09 - 13:30 / Comentarios (5)

Supongamos que el Dr. Zutano debe preparar un artículo científico para su publicación.

Con la exquisita habilidad de un monje cartujo, empieza las operaciones de gathering de todas las referencias disponibles e imaginables. Es posible que en el proceso navegue por miríadas de bases de datos, cada una con su propia interfaz de navegación, campos propios, etcétera. Si utiliza un sistema de manejo de referencias le bastará media horita para que las referencias de interés se congreguen en una sola base de datos y sean de fácil exportación.

Pero nuestro héroe también quiere el artículo completo. En PDF, porque es manejable, bonito, y sale bien impreso. Cuando lo consigue, si lo consigue, es un documento con un layout magnífico, pero una pesadilla para todo lo demás. Cuando lo baja, el fichero no tiene el nombre del artículo, con el autor y la fecha: nada de eso. Al terminar el download, el PDF tiene un título incognoscible, primigenio - en el sentido de Lovecraft. Un galimatías de letras y números en el mejor de los casos, o un mero nombre por defecto en el peor. De tal guisa, el Escritorio se le llena de archivos anónimos, que toca abrir con el lentísimo lector de Adobe.

Antaño los artículos se organizaban en preciosas carpetas colgantes, acumulando polvo y micropartículas de papel que le daban al despacho un entrañable aspecto mohoso. Pero ahora, con las Nuevas Tecnologías, esto ya no es necesario. El Dr. Zutano empieza a organizar sus PDFs en preciosas carpetas virtuales, temáticas. Se percata de que los PDFs no tienen metadatos importables en bases de datos típicas, ni siquiera los meta-tags ID3 que tienen todos sus ficheros Mp3 o los datos EXIF de sus fotos. Maldice a los editores por crear títulos en varias líneas que no se pueden cortar y pegar directamente como nombre de fichero, porque contienen saltos de líneas, símbolos reservados, etcétera. Algunos salen incluso como ensaladas de letras.

Investigando un poco - procrastinando - descubre que el estándar PDF contempla la existencia de meta-datos, sí, y que de alguna forma se puede incrustar XML dentro de los ficheros. Pero que los editores pasan de ello un kilo o dos, y que existen cosas como BibTeX, LaTeX y DocBook, estándares que la mayoría de portales de búsqueda bibliográfica no utilizan, y mucho menos en determinadas ramas del conocimiento.

Entonces, arremangándose, sigue haciendo su labor minuciosa de copy&paste artesanal, imprecando en arameo.

AddThis Social Bookmark Button
Ciencia - Comentarios (5) -

Referencias (TrackBacks)

URL de trackback de esta historia http://fbenedetti.blogalia.com//trackbacks/42128

Comentarios

1
De: Estefanía Fecha: 2006-08-09 14:05

je je je... >:P



2
De: ifrit Fecha: 2006-08-09 15:41

http://www.foxitsoftware.com/pdf/rd_intro.php
Usa Foxit Reader, que es más ligero que el lector de Adobe...
Para todo lo demás hay pocas soluciones...



3
De: mewt Fecha: 2006-08-09 18:29

LaTeX, la solución es LaTeX... y los artículos indizados con sus correspondientes tags en CiteULike, con tu correspondiente copia privada por si el artículo no está públicamente disponible ;-)



4
De: JJ Fecha: 2006-08-09 19:13

Donde se ponga el docbook...



5
De: J.Lo. Fecha: 2006-08-12 02:31

Pense que yo era torpe.
Ahora veo que es así.

Aunque arameo no se.



Nombre
Correo-e
URL
Dirección IP: 38.103.63.59 (a42ee40689)
Comentario

Todos los posts
Categorías

Condiciones de Lectura
Acerca del autor

Mi wishlist / lista de deseos







Creative Commons License



who's online



Blogs Hispanos:

Atalaya
BioMaxi
Camarada Bakunin
Cambalache v3.0
Crisei (Rafa Marín)
Desbarradas de Akin
Diario de un Debianita
Diencéfalo
El Árbol de la Ciencia
El Cajón de Bronch 2.0
Emilio Molina Cazorla
Frikitecaris
Hitting the Fan 2.0
Kirai
La Biblioteca de Babel
La Decadencia del Ingenio
La Lágrima de un Bufón
La Materia Oscura
Las Penas del Agente Smith
La Segunda Parte
Noche Cerrada
Planet Castellón
Pjorge.com
Pseudolog
Reductio ad Absurdum 2.0
SalaBecarios
Servidora
Velocidad de Escape v2.0
YolandaX

Blogs Italiani:

Beppe Grillo
Giusec
Il Tao dei Blog
Personalitá Confusa

Blogs en inglés:

And then came the shot
BoingBoing
DaveZilla
DilbertBlog
PatentSilly









©2002-2008 Fabrizio Ferri Benedetti · Quién Soy · Condiciones de Lectura · Se ve mejor con Opera o Firefox

IBSN: 1982-2003-4-4