




Las tecnologías de compresión de imágenes "monolíticas" como JPEG no son apropiadas para documentos en color. Representar digitalmente un documento en color, fiel al original, requiere alta resolución (un mínimo de 300dpi), con lo cual una página DIN-A4 genera un archivo superior a los 20MB. Para comprimir este archivo a un tamaño manejable con tecnologías como JPEG, el camino es aplicar factores de compresión medios o altos, que comprometen seriamente la legibilidad de los textos y la fidelidad al documento original.
La respuesta de DjVu es radicalmente mejor: ¿porqué usar una resolución de 300dpi para los elementos gráficos de la imagen cuando, en realidad, sería suficiente una resolución menor? ¿Porqué aplicar una técnica creada para comprimir color para comprimir texto, si el texto normalmente es bitonal (blanco y negro)?. En definitiva, la revolucionaria respuesta de DjVu es segmentar (separar) el documento en distintas capas que serán comprimidas independientemente, con tratamientos específicos para cada tipo de elemento.
DocumentExpress con DjVu usa la tecnología de segmentación de imágenes más avanzada que se ha desarrollado hasta el momento. Esta es clave de su habilidad para crear documentos visualmente fieles al original pero con factores de compresión sorprendentes. Además, su inteligencia para separar con precisión el texto de los gráficos permite mejorar de forma dramática los resultados de OCR, incluso en documentos color de gran complejidad. Esta metodología sigue las especificaciones Mixed Raster Content, suscritas por la International Telecommunications Union (ITU).
DjVu segmenta una página en tres capas: capa de fondo (background), capa superior (foreground), capa blanco y negro. La capa blanco y negro es opcional y cuando no se ha generado su información reside en la capa superior
Contiene los colores de los textos, líneas y contornos finos (almacenados en la capa bitonal). En algunas ocasiones, las dos capas estan agrupadas en una sola capa, la capa superior.
Contiene texto y líneas bitonales (blanco y negro). Si estos elementos tienen una coloración adicional será almacenada en la capa superior (foreground).
Contiene fotos, gráficos, tintes y texturas del papel.