Van Metro naar Mars en terug: Adobe, PDF en XML

16 december 2006

Op de XML 2006-Conference in Boston heeft Adobe een radicale bèta bekend gemaakt van wat de volgende versie zou kunnen zijn van het Portable Document Format, een nieuwe versie die volledig is gebaseerd op XML. Hoewel de bestaande versie van PDF de maker van het document toestaat om XML-beschrijving(en) van de tekst in het document toe te voegen, zullen de documenten in dit nieuwe bestandsformaat (met als code Mars) volledig gecomprimeerd worden in XML, zo vertelt Joel Geraci, de 'evangelist' van Adobe inzake PDF-ontwikkeling. Het onderzoekslaboratorium van Adobe heeft de benodigde bèta-software vrijgegeven voor publieke review. Als de review positief is en het management van Adobe het nieuwe formaat daadwerkelijk accepterrt, dan zou Mars de nieuwe generatie PDF kunnen vormen, en zou het een onderdeel kunnen gaan worden van het aanbod van Adobe, en waarschijnlijk al met de eerste grote nieuwe release van Acrobat. 'PDF is over 15 years old. It predates XML. The technology it’s not at the same level compatibility as XML, where there are a lot of tools and knowledge about how to work with XML', zo geeft Philip Levy, PDF en XML architect van Adobe, die meegewerkt heeft aan de ontwikkeling van Mars. 'So moving the PDF technology onto an XML base gives us a lot better integration with the rest of the world'.

Net zoals de documenten aangemaakt in Microsoft's nieuwe XML-formaten zijn de in Mars aangemaakte documenten een verzameling van gezipte individuele bestanden. Een plain-text Scalable Vector Graphics (SVG)-bestand bevat niet alleen de documenttekst maar ook expliciete instructies om de precieze presentatievorm en layout van het document te reconstrueren. De gezipte verzameling bestanden bevat ook elk image of figuur die in het document zijn geïncorporeerd. Adobe's gebruik van SVG kan een belangrijke stap voorwaarts zijn voor dit op XML gebaseerde bestandsformaat, zo zegt Levy. SVG doorstaat nog steeds groeistuipen. Het is een XML-formaat 'that describes how to depict visual elements in a presentation, with precise controls on where each element appears on the layout. Adobe will also add its own XML-based extensions to cover visual elements not handled by standardized SVG tags', zo zegt Levy. Qua performance zal het formaat net zo goed functioneren als het huidige PDF, zo stelt Levy. Hoewel XML-programmering uiterst veel woorden kan tellen, zal de zip-compressie ervoor zorgen dat de bestandsgrootte acceptabel blijft. 'Also, the processing power needed for rendering should be about on par with current PDFs', zo geeft Levy aan. 'Eventually, the new format should be able to have all the advanced features, such as security, that the current PDF offers'. Door PDF volledig XML te maken zullen organisaties beter in staat zijn om de documenten in hun werkstroom te incorporeren, en is het ook makkelijker om documenten te genereren en data uit documenten te halen. Een van de grote voordelen van het nieuwe formaat is dat ook documenten uit databases te maken zijn, waardoor specifieke records tot een Mars-document gemaakt kunnen worden. 'While today, external actions on PDFs can be done using Adobe PDF libraries, developers can find these libraries difficult to work with', zo voegt Levy toe. 'XML should come far easier, because the syntax is familiar and can be readily incorporated into Java and other programming languages'. 'The goal is an XML description of a PDF-file that does everything PDF does', zegt Andrew Shebanow, een wetenschapper bij Adobe. 'The benefits is for IT people and developers who have thes amazing toolsets for manipuloating XML documents. This makes it easier for developers using those toolsets to create PDF files, read those files, extract data, manipulate data, or pull things out of databases and make PDF's'. Mars incorporeert SVG, PNG, JPG, JPG2000, Open Type, Xpath en XML standaarden. Het wordt niet gezegd, maar het is logisch dag Adobe met Mars zijn software beter wil laten concurreren met het XPS-formaat van Microsoft, dat voorheen Metro genoemd werd. XPS is een op XML gebaseerd documentformaat dat op ieder platform op dezelfde manier getoond wordt, functionaliteit die vergelijkbaar is met PDF. XPS wordt standaard door Vista ondersteund en is via een plugin ook beschikbaar voor Office 2007. Adobe probeert met Mars zijn marktpositie te beveiligen. Een blog omschreef het als volgt: 'The Adobe guys made it clear that MARS is not intended as a replacement for the current PDF format–there's just too much installed infrastructure and dependency on PDF for that to happen quickly and MARS isn't 100% complete over PDFs features (mosly around support for high-end printing workflows, I would guess). But it seems reasonable to think that, like MS Office, Adobe will slowly raise the profile of the XML version of PDF until it can make it the default format rather than the alternative. But I would expect that to take at least five years or more, given the speed with which the publishing industry, in particular, changes (which is more or less glacial)'.

