informatică în școală - caractere și șiruri

Procesarea cuvintelor - una dintre sarcinile cele mai comune de programare. Dacă doriți să proceseze orice date de text, fără cunoașterea materialului care va fi descrisă mai jos, pur și simplu nu pot face. Mai ales în cazul în care datele nu sunt generate de tine, și orice software terță parte, sau o altă persoană.







Simbolul - o singură unitate de text. Această scrisoare, un număr, un semn. Simbolul codebook este format din 256 de poziții, și anume fiecare personaj are propriul său cod unic de la 0 la 255. Simbolul cu un cod scris ca N: #N. La fel cum personajele și sunt indicate în codul de program. Deoarece codul de caractere este un număr mai mic de 255, este evident că, în memoria personajului are un octet, și are un cod numeric în conformitate cu tabelul de cod ASCII. După cum știți, mai puțin de o dimensiune octet nu este prezent. Mai precis, este - este un pic, dar pentru a lucra cu biți nu putem în program: bytes - unitatea minimă. Doar uita-te la masa de caractere și codurile lor, puteți utiliza standard de utilitate „Caracter Table“ inclus în Windows (shortcut localizat în meniul Start - Programs - Accesorii - Instrumente de sistem). Există și alte seturi de caractere în care un singur caracter este reprezentat nu de un singur octet, și doi. Acest Unicode (Unicode). În tabelul Unicode are toate limbile lumii. Din păcate, utilizarea de Unicode destul de complicată și sprijinul acordat până în prezent doar un caracter local. 2 octeți este, de asemenea, numit un cuvânt (cuvânt). De aici și numele tipului de date numerice respective - Word (numerele din memoria care ocupă 2 octeți, o valoare 0-65535). Numărul de „celule“ din tabelul Unicode este 65536, și că este suficient pentru a stoca toate limbile lumii. Dacă decideți că „1 byte - 256 de valori, apoi 2 octeți - 2 * 256 = 512 valori“, am sfătui să-și amintească principiul sistemului binar și stocarea datelor într-un calculator.

String. ea e text - este un set de caractere, oricare dintre secvența lor. În consecință, un caracter - este, de asemenea, o linie de text prea. șir de text are o anumită lungime. Lungimea liniei - numărul de caractere care le conține. Dacă un caracter este 1 octet, șirul de simboluri N, respectiv, ia N octeți.







Rând reprezintă o anumită formă de tablou unidimensional de caractere care are o diferență semnificativă. matrice de caractere are o lungime fixă ​​(număr de elemente), care este definit în descriere. Șirul are o lungime de două soiuri:

  • Lungimea totală a șirului. care caracterizează cantitatea de memorie alocată liniei în descriere;
  • Lungimea actuală linie (întotdeauna mai mică sau egală cu lungimea totală) care indică numărul de șiruri de caractere semantice în fiecare moment.

Pentru a lucra cu simboluri și linii există tipuri de date corespunzătoare:

Char - un caracter (adică 1 byte);
String - un șir de caractere, textul (N bytes).

În mod oficial, linia poate deține doar 255 de caractere. Există tipuri speciale AnsiString și datele WideString (acesta din urmă, de altfel, doi octeți, adică Unicode) pentru a stoca texte mari și caractere speciale.

Acțiuni cu simboluri
  • Pentru a seta valorile de text în ghilimele simple sunt utilizate Pascal (nu dublu!). Ie atunci când doriți să atribuiți un șir de caractere variabile o valoare, ar trebui să-l, astfel: ch: = „k“;
  • Un caracter nul este indicat prin două apostrofuri consecutive în picioare. Exemplu: ''.
  • În cazul în care un apostrof face parte dintr-un șir de caractere ca un literal, acesta dublează înregistrarea. Exemplu: '' ''.
Opera și Qi

Rezultatul - un simbol. care număr din tabelul ASCII corespunde unui anumit număr. De exemplu,

Caracteristicile standard uu
Proceduri și funcții pentru lucrul cu siruri de caractere.
  • Lungime (s: string): integer

Funcția returnează o valoare a parametrului curent de linie de lungime

Funcția fuzionează parametrii rânduri, care poate fi un număr arbitrar. Fiecare parametru este o expresie a tipului string. Dacă lungimea șirului, rezultatul este mai mare de 255 de caractere, este trunchiat la 255 de caractere. Această funcție este echivalentă cu operatorul de concatenare „+“ și este un pic mai puțin eficient decât operațiunea.

Funcția returnează subșirul extras din șirul de caractere sursă s, caractere conta lungi începând cu caracterul la numărul de index.

s: = 'Limbajul Turbo Pascal';

Procedura elimină string-uri parametrul subșir de caractere conta lungime care încep cu caracterul la numărul de index.

s: = 'Pascal Turbo';

Procedura este destinată pentru introducerea într-un șir de caractere sursă linie s, începând cu indicele șirului de simboluri.

Funcția caută șirul s substr subșir. Rezultatul funcției este numărul primei poziții subsirului în șirul inițial. În cazul în care subsirul nu este găsit, funcția returnează 0.

s: = 'Limbajul Turbo Pascal';

Procedura convertește expresia X numerice reprezentarea șir și plasează rezultatul în st.

  • Val (s string, u întreg, c întreg ...), unde s - un șir de caractere, u - numărul de linii, cu - un cod de eroare în cazul în care conversia eșuează.

Procedura convertește șirul de la reprezentarea numerică.