Konvertieren von Dokumenten vom Markdown in Microsoft Word -Format

Konvertieren von Dokumenten vom Markdown in Microsoft Word -Format
Unter anderem gehört das Schreiben und Bearbeiten von Textdokumenten zu den häufigsten Aktionen, für die wir unsere (Desktop-) Computer verwenden. Die genaue Art und Weise, wie es geschehen ist. Zu unserem Nachteil verfügt jedes Tool mit einem eigenen nativen Dokumentformat sowie einer Auswahl anderer unterstützter Dokumentformate. Die Qualität der Umwandlung zwischen diesen Formaten variiert stark und kann zu großer Frustration führen, wenn die Formatgrenzen überschreiten.

In diesem Artikel sehen wir uns die Konvertierung zwischen Markdown [1] und DOCX an - das native Dokumentformat von Microsoft Word, das seit 2007 verwendet wird. Sie fragen sich vielleicht, warum sich ein Enthusiast von Markdown und Asciidoc (wie ich) mit diesem Fall befasst. Die Zusammenarbeit mit einer Gruppe anderer Autoren kann zu einer Situation führen, während ein oder mehrere Teilnehmer DOCX als Ausgabeformat anfordern. Lassen Sie niemanden im Stich und finden Sie stattdessen heraus, welche Einschränkungen existieren und wie wir versuchen können, alle Gruppenmitglieder glücklich zu machen.

Was ist Markdown?

Wie bereits in „Einführung in den Markdown“ [2] erwähnt, ist die Absicht für den Markdown ein einfacher Text zur HTML -Konvertierung. Die Idee dahinter war es, Webseiten, Dokumentationen und insbesondere Blogeinträge so einfach wie das Schreiben einer E-Mail zu machen. Bis heute ist es das De-facto-Synonym für eine Klasse von leichten Markup-Beschreibungsprachen, und das Ziel kann wie erreicht gesehen werden.

Markdown verwendet eine einfache Textformatierungssyntax. Mit einem ähnlichen Ansatz wie HTML gibt eine Reihe von Markierungen Überschriften, Listen, Bilder und Referenzen in Ihrem Text an. Die wenigen folgenden Zeilen veranschaulichen ein Basic -Dokument, das zwei Überschriften (1. und 2. Stufe) sowie zwei Absätze sowie eine Listenumgebung enthält.
# Empfohlene Orte in Europa zu Besuch
## Frankreich
Dies ist eine Auswahl von Orten:
* Paris (_ile de France_)
* Strasbourg (_alsace_)
Für einen ordnungsgemäßen Besuchsplan ungefähr eine Woche.

Konvertierung zu DOCX

Um Ihr Markdown -Dokument in DOCX umzuwandeln, verwenden Sie das Tool Pandoc [3]. Pandoc ist eine Haskell -Bibliothek und beschreibt sich selbst als "der universelle Dokumentumrichter" oder als "Schweizer Armee für Dokumentumwandlungen". Es ist für eine Vielzahl von Plattformen wie Linux, Microsoft Windows, Mac OS X und BSD verfügbar. Pandoc ist üblicherweise als Paket für Linux -Verteilungen wie Debian GNU/Linux, Ubuntu und CentOS enthalten.

Ein einfacher Aufruf zur Konvertierung ist wie folgt:

$ pandoc -o Test.DOCX -Test.md

Der erste Parameter '-o' bezieht sich auf die Ausgabedatei, gefolgt vom Namen der Datei ('Test.docx '). Die Dateierweiterung hilft PANDOC, das gewünschte Ausgabeformat zu identifizieren. Der zweite Parameter nennt die Eingabedatei - in unserem Fall ist sie einfach "testen".MD '.

Die lange Version des oben gezeigten Befehls enthält die beiden Parameter '-F Markdown' und '-t docx'. Der erste hat den Begriff "Aroma" abkürzt und beschreibt das Format der Eingabedatei. Der zweite macht dasselbe für die Ausgabedatei und Abkürzes '-to' '.

Der vollständige Befehl lautet wie folgt:

$ pandoc -o Test.docx -f markdown -t docx test.md

Das Öffnen der konvertierten Datei mithilfe von Microsoft Word führt in der folgenden Ausgabe:

Für die verschiedenen Textelemente verwendet Pandoc Stylesheets. Auf diese Weise können Sie diese Elemente später an Ihre Bedürfnisse im gesamten Dokument anpassen. Die neueren Versionen von Pandoc bieten auch umgekehrt - Sie können eine DOCX -Datei wie folgt in Markdown umwandeln:

$ pandoc -o Test.MD -Test.docx

Anschließend hat die generierte Datei den folgenden Inhalt:

Empfohlene Orte, die Sie in Europa besuchen können
========================================
Frankreich
------
Dies ist eine Auswahl von Orten:
- Paris (*ile de France*)
- Straßburg (*Elsass*)
Für einen ordnungsgemäßen Besuchsplan ungefähr eine Woche.

Nützliche Befehlszeilenoptionen

Die Liste der Pandoc -Optionen ist ziemlich lang. Die folgenden helfen Ihnen, bessere Ergebnisse zu erzielen und Ihr Leben viel einfacher zu machen:

* '-P' (lange Version '-Preeserve-tabs'): Registerkarten bewahren, anstatt sie in Räume zu konvertieren. Dies ist nützlich für Codeblöcke mit eingedrückten Zeilen, die Teil Ihres Textes sind.

* '-S' (lange Version '-smart'): Typografisch korrekte Ausgabe produzieren.

Diese Option korrigiert Angebote, Bindestriche/Striche sowie Ellipsen („…“). Zusätzliche, nicht bahnbrechende Räume werden nach bestimmten Abkürzungen wie "MR" hinzugefügt.”.

* '-Track-Changes = Value': Gibt an, was mit Einfügen, Löschungen und Kommentaren zu tun ist, die mit Hilfe des Microsoft-Wortes „Änderungen verfolgen“ erstellt werden, die erstellt werden, die erstellt werden sollen. Der Wert kann entweder akzeptiert, ablehnen oder alle, um die im Dokument vorgenommenen Änderungen einzuschließen oder zu entfernen. Das Ergebnis ist eine flache Datei.

Weitere Optionen finden Sie in der Dokumentation und der manuellen Seite von Pandoc.

Zusammenfassung

Die Konvertierung zwischen Markdown und DOCX ist kein Rätsel mehr. Es geschieht innerhalb weniger Schritte und funktioniert sehr gut. Happy Hacking 🙂

Links und Referenzen

* [1] Markdown
* [2] Frank Hofmann: Einführung in den Markdown
* [3] Pandoc

Anerkennung

Die Autorin möchte Annette Kalbow für ihre Hilfe bei der Vorbereitung des Artikels danken.