Freitag, 27. April 2007

ODF - OpenXML Converter

Das Open Document Format (ODF) des OASIS Konsortium beschreibt einen offenen Dateistandard für Officedokumente. Dabei handelt es sich um XML-Dateien die in einem gezippten Archiv abgelegt sind.

Microsoft Office 2007 speichert Daten in einem neuen Dokumentenformat ab: OpenXML. Das Format ist in ECMA 376 spezifiziert. OpenXML verwendet den gleichen technologischen Ansatz wie ODF: XML-Dateien in gezippten Archiven.

Ziel des Projektes ist, Konverter für die verfügbaren Anwendungen zu erstellen.
  • Writer <-> Word
  • Calc <-> Excel
  • Impress <-> PowerPoint
  • Data <-> Access
Im Wesentlichen handelt es sich um einen Schema-Konverter. Daten werden entsprechend dem Input Schema übernommen und gemäss dem Output Schema abgelegt (Microsoft behält sich vor, binäre Versionen des Dokumentes ebenfalls einzubinden. Im ersten Schritt sollen diese proprietären Blobs nicht analysiert und konvertiert werden).

Skills: Programmiersprache C++ | C# | Python, XML

5 Kommentare:

Unknown hat gesagt…

Unrealistisch. An sowas wird seit einiger Zeit professionell von mehreren Firmen gearbeitet (http://odf-converter.sourceforge.net/) und das Resultat ist immer noch dürftig und überdies nur auf Word beschränkt.

Zu glauben, dass eine Gruppe von ein paar Schülern oder Studenten innerhalb von 2-3 Monaten einen funktionierenden Konverter für _alle_ Dokumententypen coden könnte, verdient den Optimismus-Award des Jahres. (Alleine schon das Studium der 700 Seiten starken ODF-Spezifikation und der 6000 Seiten starken OpenXML-Spezifikation braucht schon Unmengen an Zeitaufwand.)

Ganz zu schweigen von der Wartung, die mit so einem Projekt einhergeht und mit einem Sommerprojekt sicher nicht annähernd gewährleistet ist.

Vielleicht sollte diese Projektidee umformuliert werden, um in Zusammenarbeit mit dem erwähnten SourceForge-Projekt tatsächlich etwas weiterbringen zu können.

Anonym hat gesagt…

Wofür man da C++ braucht möchte ich schon wissen. Das ist eine klare XSLT Gschicht.
Das Projekt ist auf jeden Fall viel zu Umfangreich und die Aufgabenstellung sollte auf etwas realistisches reduziert werden.

Wolf hat gesagt…

- Danke für den Award für Optimismus :-)
- Das Projekt ist ehrgeizig, ja. War nicht für Schüler gedacht.
- Auch die Umsetzung eines Konverters mit eingeschränkter (aber ausbaubarer) Funktionalität ist zulässig.
- Eventuell hat schon jemand Vorarbeiten geleistet und will diese hier nutzen.
- Die Konverter von MS/Novell sind Plugins und daher als C++ und Python UNO Implantate realisiert.

Unknown hat gesagt…

> Die Konverter von MS/Novell
> sind Plugins und daher als
> C++ und Python UNO
> Implantate realisiert.

Nur bedingt. Von der Website:

"The converter is based on XSL transformations between two XML formats, along with some pre- and post-processing to manage the packaging (zip / unzip), schema incompatibility processings and the integration into Microsoft Word."

Also, ja, XSL-Transformationen als Hauptwerkzeug.

Anonym hat gesagt…

Attribut "unrealistisch", mit besten Empfehlungen für den Einsatz von OpenOffice