Podľa Medzinárodnej telekomunikačnej únie v roku 20042016 sa internet s určitou pravidelnosťou tešil tri a pol miliardy ľudí. Väčšina z nich ani nemyslí, že akékoľvek správy posielané prostredníctvom počítačov alebo mobilných gadgetov, ako aj texty, ktoré sa zobrazujú na všetkých druhoch monitorov, sú vlastne kombináciami 0 a 1. Takéto zobrazenie informácií sa nazýva kódovanie. Poskytuje a veľmi uľahčuje implementáciu jeho ukladania, spracovania a prenosu. V roku 1963 bolo vyvinuté americké kódovanie ASCII, ktoré je predmetom tohto článku.
Z hľadiska akejkoľvek elektronickej výpočtovej technikyText stroja je súborom jednotlivých znakov. Zahŕňajú nielen písmená, vrátane veľkých písmen, ale aj interpunkčné znamienka, čísla. Okrem toho sa používajú špeciálne symboly "=", "&", "(" a medzery.
Súbor znakov, ktoré tvoria text,sa nazýva abeceda a ich počet je moc (označený ako N). Na určenie použite výraz N = 2 ^ b, kde b je počet bitov alebo informatívna hmotnosť konkrétneho symbolu.
Je dokázané, že abeceda s kapacitou 256 znakov umožňuje zobraziť všetky potrebné symboly.
Vzhľadom k tomu, 256 je 8. mocnosť dvoch, hmotnosť každého symbolu je 8 bitov.
Jednotka 8 bitov sa nazýva 1 bajt, takže je zvykom povedať, že binárny kód ľubovoľného znaku v texte uloženom v počítači zaberá jeden bajt pamäte.
Všetky texty sa zadávajú v pamäti osobnéhopočítač pomocou klávesov klávesnice, na ktorých sú napísané čísla, písmená, interpunkčné znamienka a ďalšie symboly. V pamäti sú prenášané v binárnom kóde, tj, každý symbol je mapovaná na známu desiatkovom kódu pre osobu od 0 do 255, čo zodpovedá binárny kód - .. Z 00000000 na 11111111.
Umožňuje kódovanie bajtovprocesor vykonávajúci spracovanie textu, prístup ku každému symbolu samostatne. Zároveň stačí, aby 256 znakov reprezentovalo akékoľvek informácie o znakoch.
Táto skratka v angličtine znamená americký štandardný kód pre výmenu informácií.
Na začiatku informatizácie to bolo zrejmémôžete nájsť širokú škálu spôsobov kódovania informácií. Avšak na prenos informácií z jedného počítača do druhého, bolo potrebné vyvinúť jeden štandard. Takže v roku 1963 v USA existovala tabuľka kódovania ASCII. V ňom je v binárnom zobrazení priradený akýkoľvek symbol počítačovej abecedy sériové číslo. Spočiatku kódovanie ASCII bolo použité iba v Spojených štátoch a potom sa stalo medzinárodným štandardom pre počítač.
Kódy ASCII sú rozdelené na 2 časti. Medzinárodný štandard je len prvou polovicou tejto tabuľky. Obsahuje symboly s poradovými číslami od 0 (kódované ako 00000000) do 127 (kód 01111111).
Číslo poradového čísla N | ASCII textové kódovanie | symbol |
0 - 31 | 0000 0000 - 0001 1111 | Symboly s N od 0 do 31 sa nazývajú manažéri. Ich funkcia je "usmerňovať" proces odosielania textu na monitor alebo tlačové zariadenie, poskytovanie audio signálu atď. |
32 - 127 | 0010 0000 - 0111 1111 | Symboly s číslom N od 32 do 127 (štandardná časť- veľké a malé písmená latinskej abecedy, 10 číslic, interpunkčné znamienka, ako aj rôzne zátvorke, komerčné a iné symboly. Symbol 32 označuje medzeru. |
128 - 255 | 1000 0000 - 1111 1111 | Symboly s číslom N od 128 do 255 (alternatívna časťtabuľky alebo kódová stránka) môžu mať rôzne varianty, z ktorých každý má svoje vlastné číslo. Kódová stránka slúži na zadanie národných abecedít, ktoré sa líšia od latinčiny. Konkrétne je pomocou ASCII kódovaná pre ruské znaky. |
V kódovacej tabuľke vedú veľké a malé písmená v abecednom poradí za sebou a čísla - vo vzostupnom poradí hodnôt. Tento princíp sa zachováva aj pre ruskú abecedu.
Tabuľka kódovania ASCII bola pôvodne vytvorenána prijímanie a prenos informácií o zariadení, ktoré sa dlho nepoužívalo, ako teletyp. V tomto ohľade bola do znakovej sady zahrnutá nepotlač, používaná ako príkazy na ovládanie tohto zariadenia. Podobné príkazy boli použité v takýchto predkomputerových metódach ako Morseov kód atď.
Najčastejší symbol teletypu je NUL (00, "nula"). Stále sa používa vo väčšine programovacích jazykov, čo označuje znak konca riadku.
Americký štandardný kód je potrebný nielenzadajte textové informácie z klávesnice. Používa sa aj v grafike. Najmä v programe ASCII Art Maker obrázky rôznych rozšírení predstavujú rad ASCII znakových symbolov.
Podobné výrobky sa dodávajú v dvoch typoch: Vykonávanie funkcie grafických editorov konverziou obrázkov do textu a konvertovaním "výkresov" do grafiky ASCII. Napríklad známy smajlík je živým príkladom kódovacieho symbolu.
ASCII sa dá použiť aj pri vytváraní dokumentu HTML. V tomto prípade môžete zadať určitú sadu znakov a pri zobrazení stránky sa na obrazovke zobrazí symbol, ktorý zodpovedá tomuto kódu.
ASCII sa vyžaduje aj pri vytváraní viacjazyčných stránok, pretože znaky, ktoré nie sú súčasťou konkrétnej národnej tabuľky, sú nahradené kódmi ASCII.
Na kódovanie textových informácií v kódovaní ASCII sa pôvodne použilo 7 bitov (jedna bola prázdna), dnes však funguje ako 8-bitová.
Písmená umiestnené v stĺpcoch v hornej a dolnej časti sa navzájom líšia len o jeden bit. To výrazne znižuje zložitosť overovania.
Ak je to potrebné, tento typ kódovania textuinformácie môžu byť použité v textových editoroch spoločnosti Microsoft, napríklad v programe Poznámkový blok a Office Word. Pri písaní však v tomto prípade nebude možné použiť niektoré funkcie. Napríklad nebudete môcť urobiť výber tučným písmom, pretože kódovanie ASCII zachováva iba význam informácií a ignoruje jeho všeobecný vzhľad a formu.
ISO prijala normy ISO 8859. Táto skupina definuje osembitové kódovanie pre rôzne jazykové skupiny. Najmä ISO 8859-1 je rozšírená ASCII, ktorá je tabuľkou pre Spojené štáty a krajiny západnej Európy. A ISO 8859-5 je tabuľka používaná pre cyrilikovú, vrátane ruštiny.
Z viacerých historických dôvodov sa norma ISO 8859-5 nepoužívala veľmi dlho.
Pre ruský jazyk sa momentálne používa kódovanie:
Hlavná výhoda prvého štandardu CP866bolo zachovanie pseudo-grafických symbolov v rovnakých pozíciách ako v rozšírenej ASCII. To umožnilo bežať nezmenené textové programy, zahraničná produkcia, ako napríklad slávny Norton Commander. V súčasnosti sa program CP866 používa pre programy vyvinuté v systéme Windows, ktoré pracujú v textovom režime na celej obrazovke alebo v textových oknách, vrátane správcu FAR.
Počítačové texty, napísané v kódovaní CP866, boli nedávno zriedkavé, ale používajú sa na názvy ruských súborov v "Vindous".
V súčasnosti je najrozšírenejšiazískalo toto konkrétne kódovanie. Unicode kódy sú rozdelené na oblasti. Prvý (od U + 0000 do U + 007F) obsahuje znaky sady ASCII s kódmi. Potom sledujte oblasti znakov rôznych národných scenárov, ako aj interpunkčné znamienka a technické symboly. Okrem toho je časť kódov Unicode vyhradená v prípade, že je potrebné v budúcnosti zahrnúť nové symboly.
Teraz viete, že v kódovaní ASCII, každýZnak je reprezentovaný ako kombinácia 8 núl a jednotiek. Laik, táto informácia sa môže zdať zbytočná a nezaujímavé, ale nechcete vedieť, čo sa deje "v mozgu" počítača ?!
</ p>