Dažādu tautu alfabetu attēlošana tīmekļa lapās


Sākumlapa Iepriekšējā lappuse Nākošā lappuseKodu tabulas
Tīmekļa lappuse latviešu valodā


Saturs Iepriekšējā lappuse Lappas saturs Nākošā lappuse

Kodu tabulas

Datoros viena simbola pierakstam parasti tiek izmantoti astoņi biti (viens baits). Šādi ir iespējams pierakstīt 256 simbolus (28) – no 0 līdz 255 decimālskaitīšanas sistēmā. Daļa no šiem simboliem dators uzver kā mašīnkodus. Pamatsimboli (latīņu burti, cipari un daži citi iekdienā pielietojami simboli) ir no 32 līdz 126 simbolam decimālskaitīšanas sistēmā, vai 20 līdz 7E heksadecimālajā skaitīšanas sistēmā:

 | 0 1 2 3 4 5 6 7 8 9 A B C D E F
2|  ! " # $ % & ' ( ) * + , - . /
3| 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4| @ A B C D E F G H I J K L M N O
5| P Q R S T U V W X Y Z [ \ ] ^ _
6| ` a b c d e f g h i j k l m n o
7| p q r s t u v w x y z { | } ~  

Šo simbolus, ieskaitot pirmos 32, kas ir māšinas kodi, sauc par ASCI (American Standard Code for Information Interchange) simboliem.

Pamatā visi fonti nodrošina šādu burtu izkārtojumi. Protams, dažādi simbolu fontos attiecīgajiem kodiem ir piekārtotas dažādi izskata simboli, piemēram, izmantojot fontu „Animals”, burtu vietā būtu redzami dzīvnieki:

Fonts «Animal»

Tālāko simbolu izskatu nosaka izmantotā kodu tabula:

 | 0 1 2 3 4 5 6 7 8 9 A B C D E F
8| €   ‚   „ … † ‡   ‰   ‹   ¨ ˇ ¸
9|  ‘ ’ “ ” • – —   ™   ›   ¯ ˛  
A|    ¢ £ ¤   ¦ § Ø © Ŗ « ¬   ® Æ
B| ° ± ² ³ ´ µ ¶ · ø ¹ ŗ » ¼ ½ ¾ æ
C| Ą Į Ā Ć Ä Å Ę Ē Č É Ź Ė Ģ Ķ Ī Ļ
D| Š Ń Ņ Ó Ō Õ Ö × Ų Ł Ś Ū Ü Ż Ž ß
E| ą į ā ć ä å ę ē č é ź ė ģ ķ ī ļ
F| š ń ņ ó ō õ ö ÷ ų ł ś ū ü ż ž ˙

Šīs lapas galviņā ir pateikts, ka lapa atbilst „windows-1257” kodējumam, tādēļ vajadzētu būt redzamiem arī latviešu valodā izmantotajiem burtiem ar diakritiskām zīmēm. Dažādu kodu lapu izmēģināšanai variet izmantot failu ANSI_HEX.html. Izmantojot pārlūka piedāvātās iespējas nomainīt fontu vai koda tabulas, varat apskatīties, kur dotajā koda tabulā atrodas kāds simbols. Piemēram, Mozilla kodu lappusi var izvēlēties zem View/Character coding/, Operā 7 un Explorerī 5 zem View/Encoding/.

Pilna simbolu kopa (0-255), kas atbilst Windows-1252 kodu tabulai, tiek saukta arī par ANSI simboliem.

Lai varētu rakstīt daudzvalodu tekstus, bieži ar 256 kodu tabulām ir par maz. Tādēļ viena simbola definēšanai tiek izmantoti divi vai vairāki baiti. Lai simbolu atainošana dažādās sistēmās būtu vienāda, ir apstiprināts Unicode standarts. Tīmekļa vajadzībām tiek izmantoti vairāki kodējumi, kas balstās uz šo standartu. Vairāk valodas teksta izmantošanas piemērs vienas lappuses ietvaros redzams failā UTF-8.html, kurā izmantots „UTF-8” kodējumu.

Koda tabulu norāda lappas galviņa izmantojot rindiņu:

<meta http-equiv="Content-Type" content="text/html; charset=koda_lappuse">

attiecīgi koda_lappuse vietā ierakstot vajadzīgo koda lappusi, piemēram:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1257">

Dažādu kodu lapušu piemēri atrodami šeit (daži no tiem ar nodomu veidoti kļūdaini).


Saturs Iepriekšējā lappuse Lappas saturs Nākošā lappuse

Tīmekļa lappuse latviešu valodā

Pieļaujamie kodējumi latviešu valodā veidotām tīmekļas lappusēm ir 'ISO-8859-13', 'windows-1257' un 'UTF-8'.

Lapu izveides gaitā var ieviesties dažādas kļūdas, kas saistītas ar kodu lappuses nenorādīšanu, vai nepareizas koda lapuses izvēli. Daži piemēri un iespējamie risinājumi aplūkojami šeit -->.


Saturs Iepriekšējā lappuse Lappas saturs Nākošā lappuse


priede.bf.lu.lv Bioloģijas fakultāte Datorklase Sākumlapa Atsauksmēm un Jautājumiem
Pamatlapa BF Datorklase Sākums Raksti mums
Lappusi
«kodejumi.shtml»
veidoja
karlo@lanet.lv
2014.09.15-11:22
Lapa ir publicēta ar    CC    BY–SA    3.0 licenci. Ja lapā ir ietvertas daļas uz kurām attiecas cita licence, tas norādīts atsevišķi lapas tekstā.