Tonsky: The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 (Still No Excuses!) |
I en fjern fortid studerede jeg russisk sprog, historie og litteratur.
Dengang var det en lidt lusket affære at skulle angive tegnsætningen i hjemmesider. Den ene skulle have et særligt tegnsæt til at stå på dansk, den anden skulle angives ved tegnsætningen på russisk.
Hvis man så var rigtigt, rigtigt avanceret, så kørte man dem ind med Unicode – så man kunne blande dem! Og det var voldsomt magisk.
Men Unicode er jo ikke bare interessant, fordi det er en del af et samlet tegnsæt – det er jo også begyndt at indeholde emojis og andre ting. Og en del tegn defineres nu som en kombination af flere separate tegn.
Den linkede artikel beskriver noget om, hvordan Unicode er strikket sammen nu til dags, og hvordan man som udvikler skal forholde sig til det.