TietokoneetTietotekniikka

Tekstin tietojen koodaus tietokoneessa

Tietokone on monimutkainen laite, jonka avulla voit luoda, muuntaa ja tallentaa tietoja. Tietokone ei kuitenkaan toimi varsin ymmärrettävästi - graafiset, tekstimuotoiset ja numeeriset tiedot tallennetaan binäärit numeroita. Tässä artikkelissa tarkastelemme, miten tekstitiedot koodataan.

Mikä on teksti meille on symbolien sarja tietokoneelle. Jokainen symboli edustaa tiettyä nollia ja niitä. Merkkien alla tarkoitetaan vain latinalaisia aakkosia pieniä ja isoja kirjaimia , mutta myös välimerkkejä, aritmeettisia merkkejä, palvelusymboleja, erityisiä symboleja ja jopa tilaa.

Tekstitietojen binäärinen koodaus

Kun tiettyä näppäintä painetaan, sähköinen signaali lähetetään sisäiseen ohjaimeen, joka muunnetaan binäärikoodiksi. Koodi on sovitettu tiettyyn merkkiin, joka näkyy näytössä. Edustaakseen latinalaista aakkostoa digitaalisessa muodossa, luotiin kansainvälinen ASCII-koodausjärjestelmä. Se vaatii yhden tavun kirjoittaa yhden merkin, joten symboli koostuu kahdeksan numeron nollia ja nollia. Tallennusväli on 00000000 - 11111111, eli tekstitiedon koodaus tällä järjestelmällä mahdollistaa 256 symbolien esittämisen. Useimmissa tapauksissa tämä riittää.

ASCII on jaettu kahteen osaan. Ensimmäiset 127 merkkiä (00000000 - 01111111) ovat kansainvälisiä ja edustavat yksittäisiä merkkejä ja kirjaimia englanninkielisestä aakkostosta. Toinen osa - laajennus (10.000.000 - 11111111) - on tarkoitettu edustamaan kansallista aakkostoa, jonka kirjoittaminen on erilainen kuin latinaksi.

Tekstitiedon koodaus ASCII: ssä perustuu lisääntyvään sekvenssiin, toisin sanoen sitä suurempi on latinan kirjaimen määrä, sitä suurempi sen ASCII-koodin arvo. Numerot ja taulukon venäläinen osa on rakennettu samalle periaatteelle.

Maailmassa on kuitenkin useita muita koodaustyyppejä kyrillisille kirjaimille. Yleisimpiä ovat esimerkiksi KOI-8 (8-bittinen koodaus, jota käytettiin jo 1970-luvulla ensimmäisessä Unix-järjestelmässä), ISO 8859-5 (kansainvälisen standardointikomitean kehittämä), CP 1251 (tekstiinformaation koodaus, jota käytetään Nykyinen Windows-käyttöjärjestelmä) sekä 2-tavuinen Unicode-koodaus, jolla voit lähettää 65 536 merkkiä. Tällaiset erilaiset koodaukset johtuvat siitä, että niitä kehitettiin eri aikoina eri käyttöjärjestelmissä ja eri syistä. Tästä johtuen tekstin siirtäminen mediasta toiseen on usein vaikeaa - jos koodaukset eivät täsmää, käyttäjä näkee vain joukon käsittämättömiä kuvakkeita. Kuinka voit korjata tilanteen? Esimerkiksi Wordissa, kun avaat asiakirjan, saat viestin tekstin näyttämiseen liittyvistä ongelmista ja tarjoaa useita vaihtoehdot transkoodaukseen.

Joten tekstin tietojen koodaus ja käsittely tietokoneen syvyyksissä on melko monimutkainen ja aikaa vievä prosessi. Kaikki aakkosten symbolit edustavat vain tietyn binäärisysteemin numeroita , yksi solu on yksi tavu informaatiosta.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 fi.birmiss.com. Theme powered by WordPress.