Minsan ang natanggap na e-mail ay maaaring sa halip na maglaman ang teksto ng isang napaka-kakaibang timpla ng mga simbolo at graphic na palatandaan, nakapagpapaalaala ng hieroglyphs, na kung saan, may "magaan na kamay," ng isang tao na tinawag na "kryakozyabra". Nangyayari ito hindi lamang sa teksto ng mga titik, kundi pati na rin sa nilalaman ng mga web page, ilang mga text file, at kahit na may mga inskripsiyon sa interface ng mga programa sa computer.
Kapag nagse-save at nagpapakita ng mga titik, numero, marka ng bantas at iba pang mga elemento ng teksto sa screen, ang operating system ng computer ay gumagamit ng mga espesyal na talahanayan. Sa kanila, ang lahat ng mga simbolong ito ay inilalagay sa isang mahigpit na tinukoy na pagkakasunud-sunod. Kapag nai-save mo ang anumang dokumento na naglalaman ng teksto, hindi ang mga titik at numero mismo ang nakasulat sa file, ngunit ang kanilang mga serial number sa talahanayan na ito. Kapag binuksan mo ang naturang dokumento, nangyayari ang kabaligtaran na operasyon - binabasa ng application ang mga numero ng character mula sa file at ipinapakita ang mga kaukulang character mula sa talahanayan sa pahina. Ang mga talahanayan na ito ay tinatawag na "mga character set" (CharSets para sa maikli) o "encodings".
Mayroong ilang mga tulad na mga talahanayan - maraming dosenang. Sa una, ang bawat nakikipagkumpitensya na tagagawa ng software ng computer ay lumikha ng sarili nitong talahanayan ng simbolo, pagkatapos ay nilikha ang mga talahanayan para sa iba't ibang mga pambansang alpabeto na may sapilitan na pagsasama ng Ingles, kung gayon, habang pinabuting ang mga operating system, ang kanilang mga pagkakaiba-iba ay nilikha para sa mga bagong posibilidad, atbp. Kung ang teksto na nakasulat at nai-save gamit ang isang naturang talahanayan ay pagkatapos ay buksan gamit ang isa pa, kung gayon ang resulta ay ang tatawagin nating salitang "kryakozyabry" - ang mga numero ng mga simbolo ay mananatiling pareho, ngunit ang mga simbolo na naaayon sa kanila sa talahanayang ito ay maging ganap na naiiba.
Ang isang pahiwatig ng pag-encode na dapat gamitin ng isang application ng computer upang maipakita ang nilalaman ng teksto ng isang file ay nakasulat sa larangan ng serbisyo ng file na ito. Kung ang teksto ay naipadala sa mga network, pagkatapos ay ang pahiwatig ng pag-encode ay ipinadala sa patlang ng serbisyo ng nailipat na packet ng impormasyon. Sa HTML-code ng mga web page, isang espesyal na tag ang ginagamit upang maiimbak ang pangalan ng ginamit na pag-encode. Sa isang mensahe sa e-mail, ang encoding ay ipinapadala sa mga patlang ng serbisyo kasama ang impormasyon tungkol sa nagpadala, tatanggap, atbp. Kung walang indikasyon ng pag-encode ng alinman sa mga pamamaraan sa itaas, pagkatapos ay kakailanganin mong harapin ang mga crackers - subukang piliin ang nais na pag-encode gamit ang mga paraan ng application na iyong ginagamit. Ang ganitong pag-andar ay ibinibigay kapwa sa browser at sa mail client, at isang text editor (halimbawa, Microsoft Word) mismo ang sumusubok na matukoy ang tamang pag-encode ng hindi direktang mga indikasyon.
Tila na ngayon ang isang pamantayan sa talahanayan ng character ay sa wakas ay nilikha na nababagay sa lahat - ito ay tinatawag na "Unicode". Ngunit ang paglipat dito ay ginagawa pa rin, kaya kakailanganin mong makitungo sa mallard duck sa loob ng maraming taon.