Hvad er meta charset?

En charset eller tegnsæt i fuld længde er i bund og grund et sæt af tegn, der genkendes af computeren på samme måde som lommeregneren kan identificere tal. Hvert af disse tegn er repræsenteret af et nummer kendt som kodepunkt, og dette skaber en kommunikationskanal til kodning og dekodning af indhold.

Et tegnsæt indeholder derfor tegn, der tjener et specifikt eller særligt formål. Computeren gemmer tegnene som en eller flere bytes. Et eksempel er ASCII-tegnsættet, som repræsenterer alle engelske tegn og specielle kontroltegn med numre fra 0-127.

Men de fleste tegnsæt fungerer kun for specifikke sprog og genkender begrænsede tegn, og dette gør kodning og kodning vanskelig eller umulig. I moderne tid er Unicode imidlertid det mest pålidelige og universelt accepterede tegnsæt på grund af dets evne til at oversætte koder og tal let.

Du kan se meta charset i headeren af din html-kode

<meta charset="utf-8>

Hvordan fungerer det?

Meta Charset er det, der bestemmer, hvordan tekst overføres og gemmes. Denne tekstdata konverteres normalt først til binær, og derefter skal der være en slags kode, der forbinder tegn med deres korrekte binære ækvivalenter.

Når disse data til sidst dekodes, skal tegnkodningen være kendt på forhånd, ellers kan der opstå komplikationer. Et eksempel på disse kan ses i browsere, når du kigger på en webside. Oplysninger om den anvendte tegnsæt kommer fra serveren eller er skrevet direkte af udvikleren. Desværre er der et utal af tegnsæt, og dette betyder forskellige måder at matche binære koder til tegn og bytes på.

For [indholdsudviklere] og forfattere, betyder valget af UTF-8 tegnsættet til dit indhold, at du kan bruge et enkelt tegnsæt til flere tegnbehov, hvilket forenkler tingene meget uden behov for at spore og konvertere flere gange. Dette betyder, at det ville være lettere at surfe gennem dit indhold uden at få forvirrende tegn og skrammel

AddType 'text/html; charset=UTF-8' html

Hvorfor er det vigtigt?

Når du tænker på det faktum, at hver eneste gang tekst overføres, skal den kodes i et specifikt tegnsæt og dekodes på den anden side, er vigtigheden af tegnsæt ret åbenlys. Dette betyder, at uden korrekt tegnkodning vil en browser vise uforståelig tekst, fordi den simpelthen ikke forstår, hvad der bliver lagt ind i den og er nødt til at lave et hurtigt uinformeret gæt.

Det er også vigtigt i html-formularer, fordi når du indtaster tekst i tekstbokse på websteder eller sociale medieplatforme, skal det kodes omhyggeligt. Hvis disse oplysninger er utilgængelige af en eller anden grund, kan den forkerte mapping føre til tab af vigtige oplysninger.

Charset code example

Hvad et tegnsæt gør, er at give en nøgle til at låse op og knække en kode, der passerer mellem brugeren og hjemmesiden.

Det er et sæt af strukturerede mappinger mellem bytes i computeren og tegnene i tegnsættet. Hvis denne nøgle mangler, ser dataene ud som skrevet vrøvl. Dette betyder, at når du indtaster tekst gennem et tastatur, forbinder tegnsættet de tegn, du vælger, til specifikke bytes i computerens hukommelse, og derefter for at vise teksten læser det bytes tilbage til tegnene.

Er det en rangeringsfaktor for SEO?

Tegnsættet er ikke en rangeringsfaktor for søgemaskineoptimering. De fleste søgemaskiner fokuserer på det vigtige mål at levere relevant, nyttigt indhold til dem, der søger det, og som sådan overvejer de ikke andre eksterne faktorer, der ikke bidrager til dette mål.

Så dit tegnsæt betyder noget på grund af, hvordan du transmitterer information, men søgemaskiner er ikke interesserede i det. Brug af andre tegnsæt end Utf-8 vil ikke mindske din SEO-rangering, fordi det i vid udstrækning er ligegyldigt, hvilken tegnkodning du bruger, så længe søgemaskinen er i stand til at få information til slutbrugerne.

Hvordan kan jeg tilføje det, hvis jeg har brug for det?

Du kan tilføje et tegnsæt til din hjemmeside ved at bruge følgende kode

<?phpheader( Content-Type: text/html; charset=iso-8859-1’)

For at dette skal fungere, skal du inkludere dette i PHP'en, der inkluderer din html-fil. Det er vigtigt at bemærke, at det muligvis ikke fungerer på alle websider, da koden ovenfor ikke er en funktion, men en erklæring, så du skal inkludere din side html. Dette er med tanke på, at php-websiden bruger Utf-8 tegnsæt i sin header.

Forskellige typer af tegnsæt

De fleste tegnsæt opstod fra individuelle producenter, der imødekom behovene hos deres kunder. De fleste tegnsæt er uforenelige med hinanden (med få undtagelser). De tre mest almindelige tegnsæt er, ASCII (1968), ISO 8859-1 (1987) og UTF-8 (1996).

ASCII

Charset for the English language. Contains 7-bits that are mapped to 128 characters. Each letter is assigned a number from 0 to 127. This code set is quite restricted, but being one of the pioneers sparked the creation of a character set for each of the other languages. Most computers use ASCII-koder til at repræsentere tekst.

ascii charset table

Unicode

Unicode blev skabt for at forene 135 moderne og historiske sprog under én standard. Unicode er en standard og ikke et tegnsæt i sig selv. Fra maj 2019, version 12.1, indeholder Unicode 137.994 tegn inklusive symboler og emojis. Unicode-standarden definerer UTF-8, UTF-16 og UTF-32

UTF-8

Nu den dominerende kode på internettet. UTF-8 bruges på 94% af websites. Det koder de mest almindelige tegn, grundlæggende tal og engelsk med 8-bit. UTF-8 bruger minimum 1 byte. UTF-8 er også identisk med ASCII for engelsk. Dette betyder, at enhver ASCII-tekst også er en UTF-8-tekst.

UTF-8 charset kodeeksempel

Billedkilde

UTF-16

Unicode med 16 bit. Mens det oprindeligt blev brugt med systemer som Windows og Java, blev det aldrig rigtig populært med Linux og macOS. I dag bruges UTF-16 med 0,01% af websiderne. UTF-16 bruger et minimum af 2 byte.

UTF-16 Unicode tegnsæt eksempel

Billedkilde

UTF-32

Unicode med 32 bit. Fordelen ved UTF-32 er, at Unicode-punkterne er direkte indekseret. Ulempen er, at det ikke er effektivt med sin brug af plads, da det altid bruger 4 byte. Dette betyder op til dobbelt størrelse af UTF-16 og fire gange så meget som UTF-8.

Afslutningsvis

Så hvad er SEO-fordelene ved charset? Selvom det ikke er en direkte rangeringsfaktor, skal du være opmærksom på dit charset. Hvis du ved et uheld viser 2 forskellige standarder i din meta charset eller ikke følger standardens regler korrekt, vil du få et dekodningsproblem, og dit indhold vil ikke blive vist korrekt. Dette vil påvirke din SEO negativt.

Hvis du implementerer dit tegnsæt korrekt, vil du hjælpe med at forhindre en høj afvisningsprocent, ikke give folk en grund til ikke at linke til dig, og søgemaskiner kan ikke fejlagtigt fortolke dit indhold, hvilket vil hjælpe dine SEO-indsatser.