Ordentliche Umlaute in mit LaTeX erstellten PDFs

Wenn man in LaTeX Umlaute verwenden möchte, gibt es einige Pakete, die man einbinden kann, um die deutschen Umlaute einfach und korrekt verarbeiten zu können. Die ngernman/babel- und utf8/inputenc-Konstrukte kennt man in der Regel bereits als erfahrener Anwender.

Allerdings steht man immer wieder vor dem Problem, dass das Kopieren von Umlauten aus mit pdflatex erzeugten PDF-Dokumenten schief läuft.

Intern werden in LaTeX (oder vllt. in pdflatex, wo auch immer) spezielle Zeichen aus mehreren Standardzeichen erstellt. Dies heißt, dass ein ä aus einem normalen a sowie aus den zwei Punkten ¨ besteht. Diese werden dann übereinander platziert, sodass die Anzeige im PDF-Betrachter und im Papierausdruck stimmen. Allerdings sind das immer noch zwei verschiedene Zeichen, sodass beim Kopieren in eine Textdatei die dritte Dimension verloren geht und die übereinanderplatzierten Zeichen sozusagen wieder auseinanderrutschen.

Um dem entgegenzuwirken, kann man das Paket fontenc mit der Option T1 einbinden. Allerdings muss man dann die hübsche Standardschriftfamilie mit dem lmodern-Paket manuell erzwingen.

Im Folgenden ein kleiner Beispielcode (HTML-Syntaxhervorhebung durch Kile-Export ftw!):

\documentclass[a4paper,10pt]{article}
\usepackage[utf8]{inputenc}
\usepackage[ngerman]{babel}
\usepackage[T1]{fontenc}
\usepackage{lmodern}

\title{Ümläuttäßt}
\author{Lyse}

\begin{document}
\maketitle

\section{„ÄÖÜäöüß“ --- oder wie man...}

„Hällö Wörlt“, sprach der Frosch und hüpfte aus dem übel riechenden
Fässlein Püreesoße.

\end{document}

Das Resultat nach pdflatex umlaute.tex sieht wie erwartet aus:

Ausgabe nach „pdflatex umlaute.tex“

Und kopiert sieht das ganze auch total brauchbar aus, gut die Zeilenumbrüche sind nicht ganz exakt gleich, aber man kann damit auf jeden Fall besser arbeiten als zuvor:

Ümläuttäßt
Lyse
27. September 2010
1
„ÄÖÜäöüß“ — oder wie man...
„Hällö Wörlt“, sprach der Frosch und hüpfte aus dem übel riechenden Fässlein
Püreesoße.

Im Vergleich dazu das kopierte Ergebnis ohne fontenc, man merkt sofort den Unterschied:

¨ a a
Uml¨utt¨ßt
Lyse
27. September 2010
1
¨ ¨ ¨ ao ¨
AOU¨¨uß“ — oder wie man...
”
H¨ll¨ W¨rlt“, sprach der Frosch und h¨pfte aus dem ubel riechenden F¨sslein
a o o
u
a
¨
”
P¨reesoße.
u