Chairete! Ich nutze gerne typegreek.com um altgriechisch zu tippen. Neulich lese ich ein Dokument in dem steht “γάλα”, ich suche mit Strg-F nach “γάλα” aber finde nichts. Was ist das? Es stellte sich heraus, daß beide Wörter zwar identisch aussehen, aber unterschiedlich codiert sind. Und zwar codiert typegreek.com das Alpha als GREEK SMALL LETTER ALPHA WITH TONOS. Und im Dokument ist es codiert als GREEK SMALL LETTER ALPHA WITH OXIA. So wie ich das verstehe ist die Oxia die kanonische Form, und Unicode kämpft dagegen an, indem es den Tonos als alleinige Form durchsetzen will. Was ist von dem Kampf zu halten? Und ist das nicht ein Riesenproblem für die Textsuche, wenn die Dokumente im Internet mal mit Tonos mal mit Oxia codiert sind, und man weiß nicht wie und man kann nicht einheitlich googeln? Das kann doch alles nicht wahr sein!
Da ich viel copy&paste mache, habe ich nun in meinen eigenen Dokumenten scheinbar ein Mischmasch aus Wörtern mit Tonos und solchen mit Oxia. Wie kann ich die nun einheitlich machen? Ich kann ja nicht einfach ein paar Vokale mit find&replace ersetzen. Denn es gibt so ungefähr 30 verschiedene Vokale mit Tonos/Oxia.