Sphinx und Umaute

Started by orinoco, 2025/11/27, 15:37:32

Previous topic - Next topic

orinoco

Hallo,

ich teste gerade Sphinx (https://www.sphinx-doc.org/). Bei meinen Tests verwende ich HTML als Ausgabeformat. Dabei ist mir aufgefallen, das z.B. Umlaute nicht in der üblichen (mir bekannten) Form umgewandelt werden. Beispiel: ä wird *nicht* zu ä umgewandelt, wie ich es als SELFHTML-Geschädigter der ersten Stunde erwarten würde. Ich habe dann auch mal ä direkt eingegeben und übersetzt wurde ä. Also & wird umgewandelt und der Rest so übernommen.

Jetzt stellen sich mir zwei Fragen:

1. Muss ich noch was in der conf.py anpassen?

Die Einstellung language = 'de' hab ich gesetzt.

2. Macht man das mittlerweile so, weil die modernen Browser mit utf-8 alles anzeigen können (sollten)?


hendrikL

Dies müsste im  resultierenden html header stehen.

<meta http-equiv="content-type" content="text/html; charset=utf-8">

Da ich Sphinx noch nicht genutzt habe. weiß ich nicht wie man das dort umsetzen kann.

orinoco

In der generierten index.html steht

<meta charset="utf-8" />

hendrikL

Das ist auch richtig.

Werden denn die Umlaute und Sonderzeichen richtig dargestellt?
Normalerweise sollte dies ja reichen.
Wenn trotzdem eine Umwandlung der Umlaute in html tags gewünscht ist, könnte man vielleicht mit Hilfe von sed eingreifen.


Wir nutzen pandoc und ein wenig latex und perl Magie um unser Handbuch als pdf und html, aus in Markdown geschrieben Artikeln, zu generieren.
Siehe: https://github.com/siduction/sidu-manual/tree/WIP



orinoco

Es wird halt mit älteren Betriebssystemen und Browsern nicht gut aussehen, wenn sie utf-8 nicht unterstützen. Wenn man als Hobbyist mit Retrohardware hantiert, fällt einem das auf. Ein Reparaturskript ist dann wohl angesagt.

hendrikL