border=0

Uniforme alfabetyske binêre kodearring. Byte koade

Yn dit gefal wurdt de binêre koade fan it primêre alfabet makke troch ketten fan lingte fan lingte, i. itselde oantal ynformaasje is lyk oan I ( A) = log 2 N is ferbûn mei alle tekens. It is net nedich om it teken fan it ein fan it teken te foarmjen, dus de lingte fan 'e koade te bepalen, kinne jo de formule K (A , 2) > log 2 N brûke. elemintêre sinjalen en ynterpretearret de ketting (fêstiget hokker karakter it oanbe>

In foarbyld fan unifoarmlike alfabetyske kodearring is de Bodo telegrafûmer, dy't de Morse koade ferfong. It orizjinele alfabet moat net mear as 32 tekens befetsje; dan K (A, 2) = log 2 32 = 5 , d. Elke teken fan it primêre alfabet befettet 5 bit of information en wurdt kodearre mei in teken fan 5 binêre tekens. De betingst N ≤ 32 is fansels folge foar talen basearre op it Latynske alfabet ( T = 27 = 26 + "romte"), mar yn it Russyske alfabet binne 34 letters (mei in romte) - dêrom moast it alfabet "komprimearre" wurde (lykas yn Huffman-koade) en kombinearje yn in inkeld karakter "e" en "e", lykas "b" en "b", dy't fan 'e tafel sjoen wurde kinne. 3.1. Nei sokke kompresje binne N = 32 lykwols gjin frije koades foar punktuaasjemarken, sadat se ôfwêzich binne yn 'e telegrammen of binne ferfangen troch letterkodings; Dit is gjin merkbere beheining, om't, as hjirboppe neamd, de redundancy fan 'e taal makket it maklik om de ynformaasjeynhâld fan it berjocht maklik te herstellen. De Bodo-koade redundancy foar de Russyske taal is Q (r , 2) = 0.148, foar de Ingelske taal Q ( e , 2) = 0,239.

In oar wichtich foarbyld fan ús unifoarme alfabetyske kodearring is de fertsjintwurdiging fan karakter (tekens) ynformaasje yn in komputer. Om de lingte fan 'e koade te bepalen, moatte jo begjinne mei it ynstellen fan it tal karakters yn it primêr alfabet. Computer-alfabet moat wêze:

· 26x2 = 52 letters fan it Latynske alfabet (ynklusyf boppe- en leger);

33 x 2 = 66 letters fan it Russyske alfabet;

· Digits 0 .. .9 - mar 10;

Tekeningen fan wiskundige operaasjes, punktuaasjemarken, spesjale tekens ≈ 20.

Wy krije dat it totaal oantal karakters N ≈ 148. No kinne wy ​​de lingte fan de koadeketten skatte: K (s, 2) ≥ log 2 148 ≥ 7,21. Omdat de koade-lengte as in ynteger útdrukt is, is it dúdlik dat K (s, 2 ) = 8. It is dizze kodingsmetoade dy't yn komputersysteem oannommen is: in elemint is in koade fan 8 binêre bits (8 bits). Dizze sekere wurdt bewarre en ferwurke as in gehiel (dat is gjin tagong ta ien inkele bitde) - dêrom is de breedte fan kompjûterapparaten ûntwurpen foar it bewarjen of ferwurkjen fan ynformaasje is in meardere fan 8. De set fan acht ferbûne bits wurdt bytes neamd , en de fertsjintwurdiging fan tekens - byte kodearring.

In byte tagelyk mei in bytsje kin brûkt wurde as in ienheid fan mjitten foar it bedrach fan ynformaasje yn in berjocht. Ien byte komt oerien mei de hichte fan ynformaasje yn ien karakter fan it alfabet mei har ekrôtableare distribúsje. Dizze metoade foar it mjitten fan it tal ynformaasje is ek fermogen neamd . Lit it in berjocht wêze (folchoarder fan tekens); It beoardieljen fan it bedrach yn dat neffens de probabilistyske oanpak dy't earder beskôge wurdt (gebrûk fan de Shannon-formule (2.17)) jout it leauwe en lit de mjitmjitting lykweardich wêze oan I vol ; De relaasje tusken dizze kwantingen folget fan (2.7):

It is in byte dy't fêststeld is as ienheid fan mjitten fan it bedrach fan ynformaasje yn it ynternasjonaal systeem fan ienheden fan SI. 1 byte = 8 bit. Mei in byte wurde gruttere ôflaatde ienheden brûkt om it tal fan ynformaasje te mjitten:

It brûken fan 8-bit keamers jout jo kodearring 2 8 = 256 tekens, dy't de boppe N skatte grutteret en makket it mooglik om de rêst fan 'e koade-tabel te brûken om ekstra tekens te fertsjinjen.

It is lykwols net genôch om te akseptearjen op in spesifike koade-lingte. It is dúdlik dat de kodearmetoaden, d. Der binne in protte opsjes foar it fergelykje de teken fan it primêr alfabet fan acht-bit keten. Dêrom freget de kompatibiliteit fan technyske apparaten en de mooglikheid om ynformaasje te ferwêzentlikjen tusken in protte konsumers nedich foar de koördinaasje fan koades. Dizze koördinaasje wurdt útfierd yn 'e foarm fan standerdisearring fan codetalen.

De earste saende ynternasjonale standert dy't brûkt waard op grutte computers wie it EBCDIC (Extended Binary Coded Decimal Interchange Code) - "Extended Binary Encoding of the Decimal Interchange Code". Yn persoanlike kompjûters en telecommunicationsystemen wurdt de Amerikaanske Standertkode foar ynformaasjeynformaasje (Amerikaanske standertkode foar ynformaasjeferwizing) brûkt.

It regelt de koades fan 'e earste helte fan' e koade-tabel (koade nûmeren fan 0 oant 127, dat is it earste bit fan alle koades fan 0). Koades foar haadletters en lytse letters Ingelsk, letters, punktuaasjemarken en wiskundige operaasjes, lykas guon kontrôletskoallen (getallen fan 0 oant 31), generearre as it brûken fan it toetseboerd, falle yn dit diel. Hjirûnder binne guon FSC- koades:

It twadde diel fan 'e koade-tabel - wurdt beskôge as in útwreiding fan' e haadkantoaren - Codes yn 't berik fan 128 oant 255 (it earste bit fan alle koades 1). It wurdt brûkt om de tekens fan nasjonale alfabetten te representearjen (bygelyks it Russysk), lykas pseudografyske karakteren. Der binne ek standerts foar dit diel, bygelyks foar de tekens fan 'e Russyske taal, dit binne KOI-8, KOI-7, ensfh.

Sawol yn 'e haadtafel en yn syn útwreiding korrespondearje de kodden fan brieven en nûmers har lexikografyske opdracht (d. De oarder fan it alfabet) - dit leveret de mooglikheid om de wordferwurking automatisearje te kinnen en snel it op.

In oar ynternasjonale kodearring standert, Unicode, is no ferskynd en wurdt hieltyd mear brûkt . Itselde eigenskip is dat it brûkt 16-bit kodearring, d. 2 Bytes wurde allocearre foar it werjaan fan elke karakter. Dizze lingte fan de koade soarget foar it opnimmen yn it primêr alfabet fan 65.536 persoanen. Hjirmei kinne jo tagelyk in single-koade-tabel meitsje en brûke foar alle mominten alfabetten.





Sjoch ek:

Serial data transmission

Eigenskippen fan it kommunikaasjekaniel

Algoritmyske Turing Machine

Datenstrukturen en har representaasje yn RAM

Seksje 2. ALGORITHMS. MODELS. SYSTEMS

Gean werom nei Tafel Ynhâld: Teoretyske Stiftingen fan Computer Science

2019 @ edudocs.fun