Zur Homepage www.HI-Tier.de DIN SPEC 91379
Zurück Home Nach oben Weiter
Öffentlicher Bereich für Entwickler

 

Allgemeines

Grundlagen

Gemäß eines Beschlusses des IT-Planungsrates und der Innenministerkonferenz „Lateinische Zeichen in Unicode, Version 1.1 vom 27.1.2012“ (auch „String.Latin 1.1“ genannt) müssen Softwaresysteme, die dem Länder übergreifenden Austausch von Personen- und Adressdaten dienen eine definierten Zeichenvorrat handhaben können.

Als Weiterentwicklung dazu wurde März 2019 die DIN SPEC 91379:2019-03 verabschiedet zur Definition von "Unicode für die elektronische Verarbeitung von Namen und den Datenaustausch in Europa"

Schriftzeichengruppe

In der DIN SPEC 91379 werden Schriftzeichengruppe als Zusammenfassung von Schriftzeichen unter fachlichen Aspekten festgelegt.

bulletNormative Schriftzeichen
bulletTabelle 3: Normative lateinische Buchstaben (netto, ohne Kombination mit diakritische Zeichen)
bulletTabelle 5 (N1): Normative Nicht-Buchstaben, erforderlich für alle Namen
bulletTabelle 6 (N2): Sonstige normative Nicht-Buchstaben, erforderlich für nicht alle Namen
bulletTabelle 7 (N3): Normative Nicht-Buchstaben, erforderlich für Namen juristischer Personen
bulletTabelle 8 (N4): Normative Nicht-Buchstaben, für Namen ungeeignet
bulletErweiterte Schriftzeichen (nicht-normativ)
bulletA.1 Griechische Buchstaben
bulletA.2 Kyrillische Buchstaben
bulletA.3 Sonstige erweiterte Nicht-Buchstaben, erforderlich für nicht alle Namen

Datentypen und zugehörige Schriftzeichengruppe

Gemäß DIN SPEC gilt es folgende 5 Datentypen zu unterscheiden

Datentyp A: Namen natürlicher Personen

bulletDer Datentyp A gibt wieder, welche Schriftzeichen in hoheitlichen Dokumenten für Namen natürlicher Personen verwendet werden.
bulletDatentyp A ist definiert durch
bulletdie abschließenden Listen aller lateinischen Buchstaben nach Tabelle 3
bulletund der für alle Namen erforderlichen Nicht-Buchstaben nach Tabelle 5.
bulletAndere Schriftzeichen werden durch diesen Datentyp zurückgewiesen.

Datentyp B: sonstige Namen

bulletDer Datentyp B wurde vor allem für sonstige Namen, wie z. B. Ortsnamen und Straßennamen mit Hausnummer, entworfen.
bulletDatentyp B ist definiert durch
bulletdie abschließenden Listen aller lateinischen Buchstaben nach Tabelle 3,
bulletder für alle Namen erforderlichen Nicht-Buchstaben nach Tabelle 5
bulletund der sonstigen normativen Nicht-Buchstaben nach Tabelle 6.
bulletAndere Schriftzeichen werden durch diesen Datentyp zurückgewiesen.
 

Datentyp C: Alle nach DIN SPEC 91379 normativen Schriftzeichen

bulletDer Datentyp C wurde für alle normativen Schriftzeichen der DIN SPEC entworfen.
bulletEr ist somit die technische Umsetzung der Schnittstellenvereinbarung „Alle nach DIN SPEC 91379 normativen Schriftzeichen“.
bulletTexte mit griechischen oder kyrillischen Buchstaben oder mit erweiterten (nicht-normativen) Nicht-Buchstaben sind unzulässig.
bulletDatentyp C ist definiert durch
bulletdie abschließenden Listen aller lateinischen Buchstaben nach Tabelle 3, der für alle Namen erforderlichen
bulletNicht-Buchstaben nach Tabelle 5,
bulletder sonstigen normativen Nicht-Buchstaben nach Tabelle 6,
bulletder normativen Nicht-Buchstaben, erforderlich für Namen juristischer Personen nach Tabelle 7
bulletund der normativen für Namen ungeeigneten Nicht-Buchstaben nach Tabelle 8.
bulletAndere Schriftzeichen werden durch diesen Datentyp zurückgewiesen.

Datentyp D: Namen juristischer Personen und für Produktnamen

bulletDer Datentyp D wurde vor allem für Namen juristischer Personen und für Produktnamen entworfen.
bulletDatentyp D ist definiert
bulletdurch die abschließenden Listen aller lateinischen Buchstaben nach Tabellen 3
bulletund griechischen Buchstaben nach Tabellen A.1,
bulletder für alle Namen erforderlichen Nicht-Buchstaben nach Tabelle 5
bulletsowie der für Namen (im weiteren Sinne) geeigneten normativen und erweiterten Nicht-Buchstaben nach den Tabellen 6, 7 und A.3.
bulletAndere Schriftzeichen werden durch diesen Datentyp zurückgewiesen.


Datentyp E: Alle nach DIN SPEC 91379 normativen und nicht-normativen Schriftzeichen

bulletDer Datentyp E wurde für alle normativen und erweiterten Schriftzeichen der DIN SPEC entworfen.
bulletEin Einsatzgebiet dieses Datentyps kann der grenzüberschreitende Datenaustausch sein, wenn auch griechische und kyrillische Buchstaben benötigt werden.
bulletEr ist somit die technische Umsetzung der Schnittstellenvereinbarung „Alle nach DIN SPEC 91379 normativen und nicht-normativen Schriftzeichen“.
bulletTexte mit Buchstaben oder Nicht-Buchstaben, die in der DIN SPEC nicht enthalten sind, wie z. B. asiatische oder arabische Buchstaben, sind unzulässig.
bulletDatentyp E ist definiert durch
bulletdie abschließenden Listen aller lateinischen, griechischen und kyrillischen Buchstaben nach den Tabellen 3, A.1 und A.2
bulletsowie aller normativen und erweiterten Nicht-Buchstaben nach den Tabellen 5, 6, 7, 8 und A.3.
bulletAndere Schriftzeichen werden durch diesen Datentyp zurückgewiesen.

Übersicht Datentypen

Datentypen und Verwendung

Lateinische Zeichen in Unicode in HIT

bulletSeit Mitte 2020 ist in HIT/ZID die Übertragung von Lateinische Zeichen in Unicode gemäß "Datentyp E: Alle nach DIN SPEC 91379 normativen und nicht-normativen Schriftzeichen" realisiert.
bulletWelche Untermenge davon im jeweiligen fachlichen Kontext sinnvoll und erlaubt ist muss innerhalb der fachlichen Vorgaben für die Teilverfahren festgelegt werden und ist nicht Bestandteil der technischen Umsetzung.

HIT-Protokoll

bulletEine Änderung im HIT-Protokoll selbst ist nicht notwendig.
bulletEs genügt wenn der Client das HIT-Protokoll
bulletin Unicode UTF-8 kodiert auf dem Socket verwendet
bulletbzw. vor und nach der Verschlüsselung entsprechend kodiert und dekodiert, nähere Hinweise hier bei HIT-Verschlüsselung ...
bulletdem Server im ersten Befehl - dem LOGON dies mittels Parameter mitteilt
bulletEin Wechsel des Zeichensatzes bzw. der Zeichensatzkodierung innerhalb einer aufgebauten Verbindung ist nicht möglich.

HIT-Batch

bulletDer HitBach-Client kann seit 2020 entsprechend in Unicode UTF-8 mit dem Server kommunizieren.
bulletDazu sind lediglich in der HitBatch.INI im Kapitel [Global] Parameter folgendermaßen zu setzen
bulletStreamEncodingIn=UTF-8
bulletStreamEncodingOut=UTF-8
bulletUTF8=1   (beachte: hier ohne Strich)
bulletUm den vollen Zeichenumfang nutzen zu können müssen die Input/Outputdateien entsprechend kodiert sein. Gesteuert wird das mit den Parametern InFileCharset bzw. OutFileCharset
bulletWeitere Details siehe HitBatch INI-Parameter

HIT/ZID Oberflächen

Neue Weboberflächen / Meldeprogramme

bulletHIT V.3 - neues HIT Meldeprogramm
bulletZID V.2 - neues ZID Meldeprogramm

In den neuen Programmen werden die HTML-Seiten/Formulare UTF-8 kodiert ausgegeben und eingelesen, Damit werden alle relevanten Unicode Zeichen richtig dargestellt und entgegengenommen.

Bei den Suchfunktionen werden zur Zeit keine der von der DIN SPEC vorgeschlagenen "Gleichsetzungen" vorgenommen. Sonderzeichen werden nur exakt so gesucht wie sie im Suchkriterium angegeben sind.

Alte Weboberflächen / Meldeprogramme

bulletHIT V.1 - klassisches HIT Meldeprogramm
bulletHIT V.2 - REST Version 1 besitzt nur eine Testoberfläche
bulletZID V.1 - altes ZID Meldeprogramm, dient nur noch zur Anzeige historischer Daten und wird von Endkunden nicht mehr benutzt.

In den alten Programm wird keine Anpassung vorgenommen. Eingaben und Ausgaben sind nach wie vor nur in ISO / ANSI möglich. Geringfügige Darstellungsprobleme von nicht westeuropäischen Zeichen oder Sonderzeichen müssen akzeptiert werden, haben aber auf die Funktionsfähigkeit keine Auswirkung.


© 1999-2021 Bay.StMELF, verantwortlich für die Durchführung sind die  Stellen der Länder , fachliche Leitung ZDB: Frau Dr. Kaja.Kokott@hi-tier.de, Technik: Helmut.Hartmann@hi-tier.de
Seite zuletzt bearbeitet: 05. Mai 2023 14:15, Anbieterinformation: Impressum - Datenschutz - Barrierefreiheit