Datoros viena simbola pierakstam parasti tiek izmantoti astoņi biti (viens baits). Šādi ir iespējams pierakstīt 256 simbolus (28) – no 0 līdz 255 decimālskaitīšanas sistēmā. Daļa no šiem simboliem dators uzver kā mašīnkodus. Pamatsimboli (latīņu burti, cipari un daži citi iekdienā pielietojami simboli) ir no 32 līdz 126 simbolam decimālskaitīšanas sistēmā, vai 20 līdz 7E heksadecimālajā skaitīšanas sistēmā:
| 0 1 2 3 4 5 6 7 8 9 A B C D E F 2| ! " # $ % & ' ( ) * + , - . / 3| 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 4| @ A B C D E F G H I J K L M N O 5| P Q R S T U V W X Y Z [ \ ] ^ _ 6| ` a b c d e f g h i j k l m n o 7| p q r s t u v w x y z { | } ~
Šo simbolus, ieskaitot pirmos 32, kas ir māšinas kodi, sauc par ASCI (American Standard Code for Information Interchange) simboliem.
Pamatā visi fonti nodrošina šādu burtu izkārtojumi. Protams, dažādi simbolu fontos attiecīgajiem kodiem ir piekārtotas dažādi izskata simboli, piemēram, izmantojot fontu „Animals”, burtu vietā būtu redzami dzīvnieki:
Tālāko simbolu izskatu nosaka izmantotā kodu tabula:
| 0 1 2 3 4 5 6 7 8 9 A B C D E F 8| € ‚ „ … † ‡ ‰ ‹ ¨ ˇ ¸ 9| ‘ ’ “ ” • – — ™ › ¯ ˛ A| ¢ £ ¤ ¦ § Ø © Ŗ « ¬ ® Æ B| ° ± ² ³ ´ µ ¶ · ø ¹ ŗ » ¼ ½ ¾ æ C| Ą Į Ā Ć Ä Å Ę Ē Č É Ź Ė Ģ Ķ Ī Ļ D| Š Ń Ņ Ó Ō Õ Ö × Ų Ł Ś Ū Ü Ż Ž ß E| ą į ā ć ä å ę ē č é ź ė ģ ķ ī ļ F| š ń ņ ó ō õ ö ÷ ų ł ś ū ü ż ž ˙
Šīs lapas galviņā ir pateikts, ka lapa atbilst „windows-1257” kodējumam, tādēļ vajadzētu būt redzamiem arī latviešu valodā izmantotajiem burtiem ar diakritiskām zīmēm.
Dažādu kodu lapu izmēģināšanai variet izmantot failu ANSI_HEX.html.
Izmantojot pārlūka piedāvātās iespējas nomainīt fontu vai koda tabulas, varat apskatīties, kur dotajā koda tabulā atrodas kāds simbols.
Piemēram, Mozilla kodu lappusi var izvēlēties zem View/Character coding/
, Operā 7 un Explorerī 5 zem View/Encoding/
.
Pilna simbolu kopa (0-255), kas atbilst Windows-1252 kodu tabulai, tiek saukta arī par ANSI simboliem.
Lai varētu rakstīt daudzvalodu tekstus, bieži ar 256 kodu tabulām ir par maz. Tādēļ viena simbola definēšanai tiek izmantoti divi vai vairāki baiti. Lai simbolu atainošana dažādās sistēmās būtu vienāda, ir apstiprināts Unicode standarts. Tīmekļa vajadzībām tiek izmantoti vairāki kodējumi, kas balstās uz šo standartu. Vairāk valodas teksta izmantošanas piemērs vienas lappuses ietvaros redzams failā UTF-8.html, kurā izmantots „UTF-8” kodējumu.
Koda tabulu norāda lappas galviņa izmantojot rindiņu:
<meta http-equiv="Content-Type" content="text/html; charset=koda_lappuse">
attiecīgi koda_lappuse vietā ierakstot vajadzīgo koda lappusi, piemēram:
<meta http-equiv="Content-Type" content="text/html; charset=windows-1257">
Dažādu kodu lapušu piemēri atrodami šeit (daži no tiem ar nodomu veidoti kļūdaini).
Pieļaujamie kodējumi latviešu valodā veidotām tīmekļas lappusēm ir 'ISO-8859-13', 'windows-1257' un 'UTF-8'.
Lapu izveides gaitā var ieviesties dažādas kļūdas, kas saistītas ar kodu lappuses nenorādīšanu, vai nepareizas koda lapuses izvēli. Daži piemēri un iespējamie risinājumi aplūkojami šeit -->.
|
Lappusi
«kodejumi.shtml» veidoja karlo@lanet.lv 2014.09.15-11:22 |
||||||||