ANSI-Zeichensätze: ISO-8859 Reihe sowie Win 1252
Der Zeichensatz ASCII umfasst 128 Bitmuster, die verschiedenen Zeichen zugeordnet wurden. Dieser wurde im Laufe der Zeit erweitert, da 128 Zeichen/Steuerzeichen in der EDV nicht genug waren. Bei den Entwürfen für eine Erweiterung hat ANSI (American National Standards Institute) mitgewirkt, weshalb einige Zeichensätze als ANSI bezeichnet werden, obwohl es einen solchen Zeichensatz nicht gibt. Häufig werden diese auch erweiterter ASCII-Zeichensatz genannt.
Die grundlegende Erweiterung von ASCII bestand darin, das achte Bit zu verwenden und die Anzahl der Bitmuster auf 256 zu verdoppeln. Da man bereits annahm, dass auch 256 Zeichen nicht genug sein werden, hat man die Erweiterung variabel gestaltet. Das achte Bit sollte abhängig vom Sprachraum genutzt werden können, sodass die Bitmuster im asiatischen Sprachraum anderen Zeichen zugeordnet werden als im westeuropäischen Sprachraum. Hierfür wurden verschiedene Codepages festgelegt, die mit ISO-8859 beginnen und am Ende eine Versionsnummer enthalten, z.B. ISO-8859-1 für den westeuropäischen Sprachraum. Die Versionsnummern wurden wie folgt zugeordnet.
- 1: Westeuropäisch (Latin 1)
- 2: Mitteleuropäisch (Latin 2)
- 3: Südeuropäisch (Latin 3)
- 4: Nordeuropäisch (Latin 4)
- 5: Kyrillisch
- 6: Arabisch
- 7: Griechisch
- 8: Hebräisch
- 9: Türkisch (Latin 5)
- 10: Nordisch (Latin 6)
- 11: Thai
- 12: Wurde nicht entwickelt, existiert daher nicht
- 13: Baltisch (Latin 7)
- 14: Keltisch (Latin 8)
- 15: Westeuropäisch (Latin 9)
- 16: Südosteuropäisch (Latin 10)
Daneben gibt es weitere 8-Bit Zeichensätze, die in dieselbe Kategorie eingeordnet werden. Dazu zählt CP1252, der im Betriebssystem Windows verwendet und häufig Win 1252 genannt wird. In der Windows-Konsole wird dagegen CP850 verwendet. Damit die Abwärtskompatibilität gewährleistet ist, sind die Zeichensätze von 0 bis 127 identisch wie ASCII. Darüber hinaus werden die Bitmuster für den jeweiligen Sprachraum unterschiedlich genutzt.
Eine Besonderheit gibt es bei den Positionen 128 bis 159. In ISO-8859-1 sind diese nicht belegt, in Win 1252 sind sie jedoch gewissen Zeichen zugeordnet, z.B. das Eurozeichen an Position 128. Wenn für eine Website als Zeichenkodierung ISO-8859-1 angegeben wird, dann wird das Eurozeichen trotzdem angezeigt, da in den HTML-Standards festgelegt wurde, dass in solchen Fällen die Zeichenkodierung ISO-8859-1 wie Win 1252 zu behandeln ist und die meisten Browser halten sich daran. In der Art und Weise verhalten sich viele andere Programme, sodass man ISO-8859-1 mit Win 1252 gleichsetzen kann, obwohl sie genau genommen nicht identisch sind. Aus der folgenden Tabelle können die Zeichen in Win 1252 entnommen werden.
HTML | Dual | Hex | Dezimal | Zeichen | HTML | Dual | Hex | Dezimal | Zeichen |
---|---|---|---|---|---|---|---|---|---|
€ | 10000000 | 80 | 128 | € | À | 11000000 | C0 | 192 | À |
 | 10000001 | 81 | 129 | Á | 11000001 | C1 | 193 | Á | |
‚ | 10000010 | 82 | 130 | ‚ | Â | 11000010 | C2 | 194 | Â |
ƒ | 10000011 | 83 | 131 | ƒ | Ã | 11000011 | C3 | 195 | Ã |
„ | 10000100 | 84 | 132 | „ | Ä | 11000100 | C4 | 196 | Ä |
… | 10000101 | 85 | 133 | … | Å | 11000101 | C5 | 197 | Å |
† | 10000110 | 86 | 134 | † | Æ | 11000110 | C6 | 198 | Æ |
‡ | 10000111 | 87 | 135 | ‡ | Ç | 11000111 | C7 | 199 | Ç |
ˆ | 10001000 | 88 | 136 | ˆ | È | 11001000 | C8 | 200 | È |
‰ | 10001001 | 89 | 137 | ‰ | É | 11001001 | C9 | 201 | É |
Š | 10001010 | 8A | 138 | Š | Ê | 11001010 | CA | 202 | Ê |
‹ | 10001011 | 8B | 139 | ‹ | Ë | 11001011 | CB | 203 | Ë |
Œ | 10001100 | 8C | 140 | Œ | Ì | 11001100 | CC | 204 | Ì |
 | 10001101 | 8D | 141 | Í | 11001101 | CD | 205 | Í | |
Ž | 10001110 | 8E | 142 | Ž | Î | 11001110 | CE | 206 | Î |
 | 10001111 | 8F | 143 | Ï | 11001111 | CF | 207 | Ï | |
 | 10010000 | 90 | 144 | Ð | 11010000 | D0 | 208 | Ð | |
‘ | 10010001 | 91 | 145 | ‘ | Ñ | 11010001 | D1 | 209 | Ñ |
’ | 10010010 | 92 | 146 | ’ | Ò | 11010010 | D2 | 210 | Ò |
“ | 10010011 | 93 | 147 | “ | Ó | 11010011 | D3 | 211 | Ó |
” | 10010100 | 94 | 148 | ” | Ô | 11010100 | D4 | 212 | Ô |
• | 10010101 | 95 | 149 | • | Õ | 11010101 | D5 | 213 | Õ |
– | 10010110 | 96 | 150 | – | Ö | 11010110 | D6 | 214 | Ö |
— | 10010111 | 97 | 151 | — | × | 11010111 | D7 | 215 | × |
˜ | 10011000 | 98 | 152 | ˜ | Ø | 11011000 | D8 | 216 | Ø |
™ | 10011001 | 99 | 153 | ™ | Ù | 11011001 | D9 | 217 | Ù |
š | 10011010 | 9A | 154 | š | Ú | 11011010 | DA | 218 | Ú |
› | 10011011 | 9B | 155 | › | Û | 11011011 | DB | 219 | Û |
œ | 10011100 | 9C | 156 | œ | Ü | 11011100 | DC | 220 | Ü |
 | 10011101 | 9D | 157 | Ý | 11011101 | DD | 221 | Ý | |
ž | 10011110 | 9E | 158 | ž | Þ | 11011110 | DE | 222 | Þ |
Ÿ | 10011111 | 9F | 159 | Ÿ | ß | 11011111 | DF | 223 | ß |
| 10100000 | A0 | 160 | à | 11100000 | E0 | 224 | à | |
¡ | 10100001 | A1 | 161 | ¡ | á | 11100001 | E1 | 225 | á |
¢ | 10100010 | A2 | 162 | ¢ | â | 11100010 | E2 | 226 | â |
£ | 10100011 | A3 | 163 | £ | ã | 11100011 | E3 | 227 | ã |
¤ | 10100100 | A4 | 164 | ¤ | ä | 11100100 | E4 | 228 | ä |
¥ | 10100101 | A5 | 165 | ¥ | å | 11100101 | E5 | 229 | å |
¦ | 10100110 | A6 | 166 | ¦ | æ | 11100110 | E6 | 230 | æ |
§ | 10100111 | A7 | 167 | § | ç | 11100111 | E7 | 231 | ç |
¨ | 10101000 | A8 | 168 | ¨ | è | 11101000 | E8 | 232 | è |
© | 10101001 | A9 | 169 | © | é | 11101001 | E9 | 233 | é |
ª | 10101010 | AA | 170 | ª | ê | 11101010 | EA | 234 | ê |
« | 10101011 | AB | 171 | « | ë | 11101011 | EB | 235 | ë |
¬ | 10101100 | AC | 172 | ¬ | ì | 11101100 | EC | 236 | ì |
­ | 10101101 | AD | 173 | í | 11101101 | ED | 237 | í | |
® | 10101110 | AE | 174 | ® | î | 11101110 | EE | 238 | î |
¯ | 10101111 | AF | 175 | ¯ | ï | 11101111 | EF | 239 | ï |
° | 10110000 | B0 | 176 | ° | ð | 11110000 | F0 | 240 | ð |
± | 10110001 | B1 | 177 | ± | ñ | 11110001 | F1 | 241 | ñ |
² | 10110010 | B2 | 178 | ² | ò | 11110010 | F2 | 242 | ò |
³ | 10110011 | B3 | 179 | ³ | ó | 11110011 | F3 | 243 | ó |
´ | 10110100 | B4 | 180 | ´ | ô | 11110100 | F4 | 244 | ô |
µ | 10110101 | B5 | 181 | µ | õ | 11110101 | F5 | 245 | õ |
¶ | 10110110 | B6 | 182 | ¶ | ö | 11110110 | F6 | 246 | ö |
· | 10110111 | B7 | 183 | · | ÷ | 11110111 | F7 | 247 | ÷ |
¸ | 10111000 | B8 | 184 | ¸ | ø | 11111000 | F8 | 248 | ø |
¹ | 10111001 | B9 | 185 | ¹ | ù | 11111001 | F9 | 249 | ù |
º | 10111010 | BA | 186 | º | ú | 11111010 | FA | 250 | ú |
» | 10111011 | BB | 187 | » | û | 11111011 | FB | 251 | û |
¼ | 10111100 | BC | 188 | ¼ | ü | 11111100 | FC | 252 | ü |
½ | 10111101 | BD | 189 | ½ | ý | 11111101 | FD | 253 | ý |
¾ | 10111110 | BE | 190 | ¾ | þ | 11111110 | FE | 254 | þ |
¿ | 10111111 | BF | 191 | ¿ | ÿ | 11111111 | FF | 255 | ÿ |