Koda lappuses un izmantotais kodējums


Sākumlapa Iepriekšējā lappuse Nākošā lappuse

Izmantotie saīsinājumi:

Failu piemēri

Šajos failos nav ierakstīta metakomanda, ar kuru gan pārlūkprogrammai, HTML redaktoram, pasaka, kāda koda lappuse dotajā dokumentā tiek izmantota. Tādēļ atvērtajos faili var būt redzami it kā nepareizi burti. Katrā no piemēros dotajiem failiem lv-burti ir tikuši pierakstīti par savam, tādēļ katram failam ir jāpielieto savs risinājums, lai HTML redaktoros būtu redzami pareizi burti. Cilvēku izdomai nav robežu, tādēļ šeit apskatītie piemēri nebūt nav vienīgās iespējas, kā var būt sabojāti HTML dokumenti. Vienmēr jau pastāv iespējā, ka failā izmantotais kodējums neatbilst galviņā uzrādītajam kodējumam. Ja nepatikšanas ar lv-burtu attēlošanu sākas pēc izveidotās lapas publicēšanas tīmekļa serverī, tad, iepējams, ka serveris ir nokonfigurēts rādīt tikai noteikta simbolu kodējumu, parasti, UTF-8. Šajā gadījumā uzdotā koda lappuse HTML dokumenta galviņā netiek ņemti vērā.

Kā panākt, lai lv-burti redaktorā būtu pareizi redzami

Pirmais ieteikums – strādājiet ar faila kopiju, nevis oriģinālu. Meklējot risinājumus, faila saturu iespējams neatgriezeniski sabojāt.

ruukisi.001.html

Vienkāršākais gadījums. Burtiem WYSIWYG tipa redaktoros jau jābūt pareizi redzamiem, jo pierakstīti kā HTML Unicode simboli decimālformā (piemēram, ā). Ja burtu vietā redzami ķeburi, tad, visticamāk, izvēlētais HTML redaktors neuztur Unicode simbolus. Ir vērts apsvērt iespēju nomainīt redaktoru. Atverot ar «KompoZer», tekstam jābūt pareizi redzamam.

Šis fails sagādā citas neērtības:

  1. Tas ir nevajadzīgi liels. Šādā pierakstā ikviens lv-burts tiek pierakstīts ar sešiem simboliem, salīdzinot ar UTF-8, kur tiek izmantoti divi, vai Windows-1257, kur tiek izmantots tikai viens simbols;
  2. Tas ir nepārskatāms, ja nepieciešams failu labot ar VI.

Tādēļ šo failu ir ieteicams pārglabāt, izvēloties pareizu koda tabulu. Atveriet failu ar «KompoZer» un izvēlaties 'File/Save and Change Character Encoding'.

ruukisi.002.html

«KompoZer», atverot šo failu, rāda virkni ar ķeburiem (piemēram, ā). Regulāri atkārtojošies burti (Ä, Å), norāda, ka lv-burti pierakstīti izmantojot Unicode. Atkarībā no izvēlētais VI uztur vai neuztur Unicode simbolus, lv-burti varbūt redzami kā ķeburi vai arī kā pareiza izskata burti.

Lai panāktu, ka šāds fails ar «KompoZer» tiktu atvērts pareizi, vispirms tas jāatver ar VI. Dokumenta galviņā jāieraksta
<META HTTP-EQUIV="CONTENT-TYPE" CONTENT="TEXT/HTML; CHARSET=UTF-8">

Kad izmaiņas saglabātas, verot vaļa ar «KompoZer», burtiem jābūt redzamiem pareizi.

ruukisi.003.html

Gan atverot ar «KompoZer», gan ar VI, lv-burtu izskats neatbilst latviešu alfabeta burtiem, piemēram burtu 'āžš' vietā redzami 'âþð'. Tiesa, ja VI iestatīts, lai ANSI simbolus rāda kā 'Baltic' kodu tabulas simbolus, tad burtiem jābūt savās vietās.

Lai panāktu, ka šāds fails ar «KompoZer» tiktu atvērts pareizi, vispirms tas jāatver ar VI. Dokumenta galviņā jāieraksta
<META HTTP-EQUIV="CONTENT-TYPE" CONTENT="TEXT/HTML; CHARSET=Windows-1257">
vai
<META HTTP-EQUIV="CONTENT-TYPE" CONTENT="TEXT/HTML; CHARSET=ISO-8859-13">

Kad izmaiņas saglabātas, verot vaļa ar «KompoZer», burtiem jābūt redzamiem pareizi.

ruukisi.004.html

Atverot šo failu ar «KompoZer», rezultāts ir līdzīgs, kā tas bija atverot 'ruukisi.003.html'. Savukārt, atverot ar VI, skats ir līdzīgs, kā atverot 'ruukisi.001.html', ar to atšķirību, ka failā 'ruukisi.001.html' visi decimālsimboli bija lielāki par 255, bet failā 'ruukisi.004.html' tie neviens nepārsniedz 255.

Lai failu padarītu lasāmu ar «Kompozer», jārīkojas tāpat, ka ar failu 'ruukisi.003.html'. Kad fails atvērts ar «KompoZer» un burti rādās pareizi, tas jāpārglabā tāpat un aiz tādiem pašiem apsvērumiem, kā tas bija faila 'ruukisi.001.html' gadījumā.

ruukisi.005.

Mazliet sarežģītāks gadījums. Acīm redzot, fails ticis veidots WYSIWYG tipa redaktoru, kuram nav ne nojausmas ne par Unicode, ne par koda tabulām, atšķirīgām no Windows-1252. Simboli, kas nav ASCII simboli, tiek pierakstīti ar to vārdiskiem nosaukumiem, kas atbilst ISO/IEC 8859-1 kodējumam, piemēram, &acirc;.

Vispirms fails jāatver ar «KompoZer» un jāsaglabā, izmantojot Western ISO-8859-1 kodējums.

Tad jāatver saglabātais fails ar VI un dokumenta galviņa jāpielabo līdzīgi, kā tas bija faila 'ruukisi.003.html' gadījumā.

ruukisi.006.html

BUZ vietā rādās ķeburi gan ar «KompoZer», gan ar VI. Dotais fails saglabāts izmantojot koda lappusi, kuru nevajadzētu izmantot – ISO-8859-4.

Lai šādu failu ar «KompoZer» varētu atvērt pareizi, vispirms tas jāatver ar VI. Dokumenta galviņā jāieraksta
<META HTTP-EQUIV="CONTENT-TYPE" CONTENT="TEXT/HTML; CHARSET=ISO-8859-1">

Saglabāto failu jāatver ar «KompoZer». Ja burti ir savās vietās, fails jāsaglabā izmantojot piemērotāku kodējumu – ISO-8859-13, Windows-1257 vai UTF-8.

ruukisi.007.html

Kāds ir manāmi pacenties. Apskatot failu, var redzēt, ka tajā tiek izmantots UTF-8 kodējums. To liecina atkārtojošies simboli 'Ã'. Tikai izmantota tiek nepareiza Unicode lappuse. Jārīkojas tā, kā tas bija faila 'ruukisi.002.html' gadījumā. Atverot saglabāto failu ar «KompeZer», teksts redzams līdzīgi, ka tas bija atverot failu 'ruukisi.003.html'. Fails jāsaglabā izmantojot ISO-8859-1 kodējumu. Savukārt, šo saglabāto failu jātver ar VI un galviņā jāpārlabo izmantotā koda lappuse uz ISO-8859-13. Atverot šo failu ar «KompoZer», visiem burtiem jābūt savās vietās.


Saturs Iepriekšējā lappuse Lappas saturs Nākošā lappuse


priede.bf.lu.lv Bioloģijas fakultāte Datorklase Sākumlapa
Pamatlapa BF Datorklase Sākums
Lappusi
«kodejumu_mainja.shtml»
veidoja
karlo@lanet.lv
2014.09.15-11:24
Lapa ir publicēta ar    CC    BY–SA    3.0 licenci. Ja lapā ir ietvertas daļas uz kurām attiecas cita licence, tas norādīts atsevišķi lapas tekstā.