4.5 Merkkitieto

Merkkitiedolla tarkoitetaan tässä merkkien, kuten kirjainten (a...ö, A...Ö), numeroiden (0...9) ja erikoismerkkien (!"#¤, jne.) esittämistä. Kuten luvut, myös merkit esitetään bittien avulla. Tällöin täytyy sopia jokin yhteinen merkkikoodi, jotta kunkin merkin ja sitä esittävän bittijonon vastaavuus olisi yksikäsitteisesti määrätty.

Yleisimmin käytetty merkkikoodi lienee ASCII-koodi (American Standard Code for Information Interchange), josta on olemassa sekä 7-bittinen että laajennettu 8-bittinen versio. 7-bittisessä koodissa kunkin 8 bitin rykelmän (tavun) ensimmäinen (vasemmanpuoleisin) bitti on oletuksena 0. Jos se vaihtuu ykköseksi, ei muutos vaikuta mitenkään tavun esittämään merkkiin, sillä vain 7 vähiten merkitsevää bittiä otetaan huomioon. Siten tällä versiolla voidaan esittää 128 (=27) erilaista merkkiä. 7-bittinen ASCII-koodi on sama kaikissa tietokoneissa ja ohjelmistoissa.

8-bittinen versio on nykyisin yleisimmin käytetty, sillä se mahdollistaa mm. skandinaavisten aakkosten åäöÅÄÖ käytön yhtäaikaa erikoismerkkien }{|][\ kanssa. Valitettavasti 8-bittisestä versiosta ei ole kaikille yhteistä standardia, joten eri tietokoneiden ja ohjelmistojen välillä on huomattaviakin eroja. Poikkeus on ASCII:n standardi ISO-885911, jota käytetään sekä Windowsissa että Unixissa.

8-bittisessä versiossa merkin esitykseen varataan siis yksi kokonainen tavu. Kaikki 256 (=28) mahdollista bittikombinaatiota vastaavat täten eri merkkejä. Toisaalta kutakin merkkiä vastaava bittikombinaatio voidaan myös tulkita kokonaislukuna. Esimerkiksi kirjaimen A bittikombinaatio kahdeksalla bitillä on 0100 0001, joka heksadesimaalilukuna on 41 ja 10-järjestelmän lukuna (desimaalilukuna) 65. Koodissa on mukana myös ns. kontrollimerkkejä, joilla mm. kerrotaan, miten tiedoston sisältö on jaettu riveille. Tavallisesti rivin lopun merkkinä käytetään kahta kontrollimerkkiä CR ja LF (ASCII-koodit 13 ja 10).

Seuraavassa taulukossa on lueteltu 8-bittisen ASCII-koodin merkistö, jota käytetään DOS-käyttöjärjestelmässä (ns. maakoodi 850). Merkit numerosta 127 alkaen voivat poiketa.

dec

hex

char

0

0

NUL

1

1

SOH

2

2

STX

3

3

ETX

4

4

EOT

5

5

ENQ

6

6

ACK

7

7

BEL

8

8

BS

9

9

TAB

10

A

LF

11

B

VT

12

C

FF

13

D

CR

14

E

SO

15

F

SI

16

10

DLE

17

11

DC1

18

12

DC2

19

13

DC3

20

14

DC4

21

15

NAK

22

16

SYN

23

17

ETB

24

18

CAN

25

19

EM

26

1A

SUB

27

1B

ESC

28

1C

FS

29

1D

GS

30

1E

RS

31

1F

US

32

20


33

21

!

34

22

"

35

23

#

36

24

$

37

25

%

38

26

&

39

27

'

40

28

(

41

29

)

42

2A

*

43

2B

+

44

2C

,

45

2D

-

46

2E

.

47

2F

/

48

30

0

49

31

1

50

32

2

51

33

3

52

34

4

53

35

5

54

36

6

55

37

7

56

38

8

57

39

9

58

3A

:

59

3B

;

60

3C

<

61

3D

=

62

3E

>

63

3F

?

64

40

@

65

41

A

66

42

B

67

43

C

68

44

D

69

45

E

70

46

F

71

47

G

72

48

H

73

49

I

74

4A

J

75

4B

K

76

4C

L

77

4D

M

78

4E

N

79

4F

O

80

50

P

81

51

Q

82

52

R

83

53

S

84

54

T

85

55

U

86

56

V

87

57

W

88

58

X

89

59

Y

90

5A

Z

91

5B

[

92

5C

\

93

5D

]

94

5E

^

95

5F

_

96

60

´

97

61

a

98

62

b

99

63

c

100

64

d

101

65

e

102

66

f

103

67

g

104

68

h

105

69

i

106

6A

j

107

6B

k

108

6C

l

109

6D

m

110

6E

n

111

6F

o

112

70

p

113

71

q

114

72

r

115

73

s

116

74

t

117

75

u

118

76

v

119

77

w

120

78

x

121

79

y

122

7A

z

123

7B

{

124

7C

|

125

7D

}

126

7E

~

127

7F

_

128

80

Ç

129

81

ü

130

82

é

131

83

â

132

84

ä

133

85

à

134

86

å

135

87

ç

136

88

ê

137

89

ë

138

8A

è

139

8B

ï

140

8C

î

141

8D

ì

142

8E

Ä

143

8F

Å

144

90

É

145

91

æ

146

92

Æ

147

93

ô

148

94

ö

149

95

ò

150

96

û

151

97

ù

152

98

ÿ

153

99

Ö

154

9A

Ü

155

9B

ø

156

9C

£

157

9D

Ø

158

9E

×

159

9F

ƒ

160

A0

á

161

A1

í

162

A2

ó

163

A3

ú

164

A4

ñ

165

A5

Ñ

166

A6

ª

167

A7

º

168

A8

¿

169

A9

®

170

AA

¬

171

AB

½

172

AC

¼

173

AD

¡

174

AE

«

175

AF

»

176

B0

¦

177

B1

¦

178

B2

¦

179

B3

¦

180

B4

¦

181

B5

Á

182

B6

Â

183

B7

À

184

B8

©

185

B9

¦

186

BA

¦

187

BB

+

188

BC

+

189

BD

¢

190

BE

¥

191

BF

+

192

C0

+

193

C1

-

194

C2

-

195

C3

+

196

C4

-

197

C5

+

198

C6

ã

199

C7

Ã

200

C8

+

201

C9

+

202

CA

-

203

CB

-

204

CC

¦

205

CD

-

206

CE

+

207

CF

¤

208

D0

ð

209

D1

Ð

210

D2

Ê

211

D3

Ë

212

D4

È

213

D5

_

214

D6

Í

215

D7

Î

216

D8

Ï

217

D9

+

218

DA

+

219

DB

¦

220

DC

_

221

DD

|

222

DE

Ì

223

DF

¯

224

E0

Ó

225

E1

ß

226

E2

Ô

227

E3

Ò

228

E4

õ

229

E5

Õ

230

E6

μ

231

E7

þ

232

E8

Þ

233

E9

Ú

234

EA

Û

235

EB

Ù

236

EC

ý

237

ED

Ý

238

EE

-

239

EF

´

240

F0

-

241

F1

±

242

F2

=

243

F3

¾

244

F4

245

F5

§

246

F6

÷

247

F7

¸

248

F8

°

249

F9

¨

250

FA

·

251

FB

¹

252

FC

³

253

FD

 

254

FE

 

255

FF

 

DOSissa voidaan merkki näppäillä sen ASCII-koodin avulla: pidetään näppäin Alt alas painettuna ja näppäillään koodiarvo näppäimistön oikean reunan numeerisesta näppäimistöstä (Num Lock päällä). Vapautettaessa Alt ilmestyy kursorin osoittamaan paikkaan haluttu merkki.

Yksi kuvaruudullinen tekstiä vie muistia 80*25 merkkiä eli 2000 tavua. Tämä voidaan ilmaista myös kilotavuina (kt), joka on 1024 tavua. Yksi kuvaruudullinen vie siis noin 2 kt muistia, mikä on suhteellisen vähän.