Obr. 17. Blokové zapojenie mikroprocesora (CPU) 8088 s registrami, frontou príkazov, adresovou sčítačkou a ALU pre aritmetické a logické operácie. CPU 8088 pozostáva z dvoch oddelených funkčných jednotiek, vykonávajúcej jednotky EU (Execution Unit) a jednotky styku so zbernicou BIU (Bus Interface Unit). Prepojenie obidvoch jednotiek uskutočňujú tri vnútorné zbernicové systémy, na obrázku označené A, B, C. V EU sa dekódujú a vykonávajú strojové inštrukcie, ktoré prichádzajú z BIU, kde boli zoradené do fronty. Fronta (v CPU 8088 o kapacite 4 bajty, v CPU 8086 o kapacite 6 bajtov) pracuje na princípe FIFO (First In First Out). Pri vykonávaní jednotlivých operácii v ALU sa nastavujú zodpovedajúce bity príznakového (flagového) registra. Ako zápisníková pamäť slúžia štyri univerzálne registre AX, BX, CX, DX.


obr. 18. Základné registre CPU v 16 bitovom a 32 bitovom formáte.


Obr.19. Použitie segmentových registrov pri adresovaní pamätí.

	Obr. 20. Adresovanie pomocou segmentov (napríklad adresa CS:IP ) ako dvojdimenzionálny proces.

a/	b/
Obr. 21. Objasnenie spôsobu ukladania a vyberania dát do a zo zásobníka: a/ pomocou inštrukcii Push a Pop; b/ pri prenose parametrov do podprogramu.


Obr.22. Štruktúra a formát registra príznakov (flagov) a porovnanie formátov rôznych procesorov.

	Obr. 24. Priame adresovanie (vhodné pre adresovanie jednoduchých operandov - bajtov alebo slov) pomocou posunutia (displacement)
.

	Obr. 25. Adresovanie pomocou obsahu regista {BX} a obsahu regista {BP}.

	Obr. 26. Adresovanie pomocou [BX+SI], resp. pomocou [BP+SI].

	Obr. 27. Adresovanie {BX+disp} pomocou obsahu regista BX a posunutia disp, resp. {BP+disp} pomocou obsahu regista BPa posunutia disp.

	Obr.28. Adresovací mód [BX+SI+disp].
	Obr.29. Adresovací mód [BP+SI+disp].

Obr. 30. Segmentované adresovanie fyzickej pamäte.
	Obr.31. Prevod logickej adresy na fyzickú.

segment:FFFF0H F0000H offset +0000H +FFF0H fyzicky:FFFF0H FFFF0H
Obr. 32. Prevod logickej adresy na fyzickú v reálnom móde.

	Obr. 33. Prevod logickej adresy na fyzickú v chránenom (protected ) a rozšírenom (enhanced) móde.

0038H:4321H -> (0038H):4321H =>	012340H
	+ 4321H
zodpovedá fyzickej adrese	016661H

q	Adresovanie: 24 bitmi do 16 MB reálnej pamäti a 30 bitmi do 1G virtuálnej pamäti.
q	Obvodová podpora: pre riadenie virtuálnej pamäti (memory management), pre ochranu pamäti (memory protection) a pre mnohoúlohovosť (multitasking). Hierarchická ochrana pamäte je založená na rozdelení úloh do privilegovaných úrovní:
	q	Jadro (kernel): úroveň 0, má najvyšší stupeň privilegovanosti. Patria sem programy riadenia virtuálnej pamäte, mapovanie (scheduling tasks), komunikácie medzi úlohami a pod.
	q	Supervízor: úroveň 1. Riadi vstupy/výstupy, umiestňuje vyrovnávaciu pamäť dát, plánuje globálne úlohy a pod. Tesne súvisí s funkciami jadra, viac však závisí od aplikácii.
	q	Podpora užívateľských programov: úroveň 2. Patria sem univerzálne použiteľné systémové programy, knihovne podprogramov a pod.
	q	Užívateľské programy: úroveň 3. Najnižšia úroveň privilegovanosti.
	Úloha môže byť spracovaná na ktorejkoľvek úrovni nezávisle na procedúre, ktorá sa práve vykonáva. To poskytuje možnosť štrukturovania operačného systému na množinu procedúr, ktoré môžu byť priamo volané, ale sú pred užívateľom chránené. Každá úloha má riadený prístup do dvoch oblastí virtuálnej pamäte: oblasti verejnej (public) a oblasti privátnej (private) pomocou:
	q	Tabuľky globálnych deskriptorov - zoznamu segmentov prístupných všetkým systémovým úlohám.
	q	Tabuľky lokálnych deskriptorov - zoznamu segmentov príslušných jednej úlohe. Takúto tabuľku zahrňuje každá úloha, ako popis svojho stavu.
	Deskriptor v systémoch 80286 predstavuje dátovú štruktúru o 8 bajtoch umiestnenú vo virtuálnej pamäti. Pre každý segment obsahuje:
	q	16 nulových bitov ako rezervu pre 32 bitové procesory, napr. 30386.
	q	Bázovú adresu segmentu (24 bit).
	q	Rozmer segmentu (16 bit) nazývaný limit.
	q	Atribúty, alebo pole riadenia prístupu (8 bit), ktoré definuje ako môže byť segment použitý (či platí zákaz čítania alebo zápisu a pod.)
	Obvodová podpora 80286 umožňuje činnosť v 2 voliteľných pracovných módoch:
	q	Mód reálnej pamäti - určený pre priame vykonávanie programov napísaných pre 8086. V tomto móde pracuje bez virtuálnej pamäti a bez funkcie ochrany pamäti, ale podstatne rýchlejšie ako staršie mikroprocesory.
	q	Mód chránenej virtuálnej pamäte, v ktorom sa plne využívajú možnosti novej architektúry. Zlučiteľnosť s programami 8086 je zabezpečená po rekompilácii.
	Architektúra 20286 používa 4 stupňnové zreťazenie, ktoré sa dosahuje zreťazením 4 subprocesorov:
	q	Jednotkou styku so zbernicou BU obsahujúcu aj frontu 6 bajtov inštrukcii.
	q	Jednotkou dekódera inštrukcii IU obsahujúcu aj frontu 3 dekódovaných inštrukcii.
	q	Operačnou jednotkou EU, ktorá približne zodpovedá EU u 8086.
	q	Adresovacou jednotkou AU, ktorá zaisťuje prevážnu časť funkcii súvisiacich s virtuálnou pamäťou. Obsahuje okrem iného aj sadu registrov, predstavujúcich rýchlu vyrovnávaciu pamäť (cache), udržujúcich virtuálnu adresu, limit a atribúty pre všetky segmenty virtuálnej pamäte vybrané pre aktuálnu úlohu (task). Táto pamäť umožňuje jednotke AU vytvoriť virtuálnu adresu za 1 periódu hodín. Vyrovnávaciu pamäť tvoria registre:
	q	Štyri segmentové registre po 64 bitoch. Každý obsahuje 16 bitový selektora 48 bitový deskriptor aktuálneho segmentu. Len v móde reálnej pamäte určuje selektor bázovú adresu segmentu. Ináč predstavuje len index v tabuľke deskriptora v hlavnej pamäti.
	q	Tri registre ukazujúce do 3 tabuliek deskriptorov (globálnej, lokálnej a prerušení).
	q	Register úlohy (tasku), ktorý ukazuje na segment rezervovaný pre popis stavu aktuálnej úlohy.
	Programove možno prechod medzi úlohami zaistiť jedinou inštrukciou volania, skoku alebo prerušením. Pre všetky neaktuálne úlohy sa príslušné informácie udržujú v hlavnej pamäti v segmente stavu úloh (task state segment).
	Zbernice : Adresová (30 bit), dátová (16 bit) sú oddelené.

q	Fronta obsahujúca 16 bajtov inštrukcii, tak ako sú prečítané z pamäti
q	Fronta obsahujúca 3 dekódované inštrukcie, pripravené k vykonaniu.

	Obr. 33b Zjednodušené blokové schéma procesora Pentium Pro.

q	Technológia dynamického spúšťania (Dynamic Execution Technology). Táto technológia umožňuje spúšťanie inštrukcii "mimo poradie". Nemusí sa dodržovať klasický postup pri ktorom je každá jednotlivá inštrukcia najprv prečítaná a následne nato ihneď vykonaná. Počas jediného hodinového cyklu môžu byť vykonané až 3 inštrukcie. Tieto dekódované inštrukcie sú uložené do vyrovnávacej pamäte, ktorá je schopná uschovať až 40 inštrukcii naraz. Tieto inštrukcie z bufferu sú spúšťané vo chvíli, keď sú dostupné ich operandy. V priebehu jediného hodinového cyklu môžu byť vykonané až 4 inštrukcie.
q	Superpipelining. Zatiaľ čo pipeline procesorov P6 pozostáva z priemerne 12 stupňov, procesor Pentium II vystačí len z 5. To umožňuje procesoru Pentium II dosiahnuť asi o 50% vyššiu rýchlosť .
q	Architektúra duálnych nezávislých zberníc (Dual Independent Bus - DIB Architecture) Architektúra procesora Pentium II obsahuje dve rozdielne zbernice:
	q	Systémovú zbernicu používanú na prístup k pamäti a k I/O operáciám.
	q	L2 cache zbernicu, ktorá pracuje na polovičnej frekvencii v porovnaní s jadrom samotného procesora. Rýchlosť zbernice L2 cache je jedným z najdôležitejších faktorov, ktoré kladne ovplyvňujú výkon systému.
q	Vysokovýkonná technológia MMX. Rozšírený inštrukčný súbor technológie MMX umožňuje zvýšenie výkonu programov na multimedialnej a komunikačnej platforme. Inštrukčný súbor obsahuje 57 inštrukcii orientovaných na paralelné spracovanie multimediálnych dát. Tieto inštrukcie používajú technológiu známu ako SIMD (Single Instruction, Multiple Data - jedna inštrukcia, viac údajov) a umožňuje rýchlejší beh aplikácii spracovávajúcich multimediálne dáta alebo komunikujúcich po sietiach s okolitými počítačmi. Táto technológia je plne kompatibilná s predchádzjúcimi technológiami Intelu.
q	Write Combining. Technológia Write Combining, ktorú umožňuje architektúra procesorov P6, sa používa na zvýšenie rýchlosti grafických operácii. Táto technológia používa viacnásobný zápis do pamäti, čím zlepšuje možnosti multimediálnych aplikácii, prehrávanie videa atď.
q	Cache (obr. 34)
	q	Procesor Pentium II disponuje 32 kB L1 cache, ktorá je rozdelená do dvoch častí: inštrukčnej a dátovej, z ktorých každá má 16 kB. Každá z týchto rýchlych pamätí pracuje s hodinovou frekvenciou samotného procesora, čím poskytuje rýchly prístup k často používaným dátam a inštrukciám.
	q	Procesor Pentium II má naviac 512 kB L2 cache, ktorá je jednotná pre inštrukcie a dáta. Táto cache používa 64 bitovú zbernicu, ktorá umožňuje vysokú rýchlosť prenosu dát medzi procesorom a cache L2.
q	Floating-point pipeline. Podporuje okrem 32 a 64 bitového formátu (kompatibilného s Pentiom a 486) aj 80 bitový formát procesora Pentium II .

	Obr. 34. Modul mikroprocesora v novej architektúre, ktorý sa k systémovej zbernici pripája cez konektor socket 7.

	Obr. 35 Bloková schéma architektúry systému s procesorom K6 firmy AMD. Pamäť cache L2 je pripojená na centrálnu zbernicu s frekvenciou 100MHz. Súčasťou karty mikroprocesora je aj SDRAM a AGP, ktoré sú pripojené k procesoru pomocou špeciálnej zbernice rozhrania I.

	Obr. 36 Príklad architektúry klasického počítačového systému súčasnosti. (Tmavšie bloky: Kontrolér pamäte + L2 cache, CPU - PCI most, VGA karta, zvuková karta sú integrované v systémoch s moderným mikroprocesorom, napríklad firmy Cyrix a AMD). CPU je spojený cez systémovú zbernicu s pamäťou a s L2 cache pomocou kontroléra pamäti a s ostatnými komponentami ho spája PCI most.

	Obr. 37. Architektúra počítačového systému s mikroprocesorom ("Všetko v jednom") MediaGX. (PCI sloty a ISA sloty nemusia byť integrované v systéme). Technologia XpressRAM dovoľuje vypustiť kontrolér pamäti a sekundárnu cache. Procesor pracuje podstatne efektívnejšie s operačnou pamäťou, bez zbytočných presunov údajov po zbernici, lebo presuny sa realizujú priamo v procesore. Ďalšia technológia - XpressGRAPHICS funguje ako špecializovaný grafický procesor, takže takýto systém nepotrebuje grafickú kartu a video pamäť. Technológia XpressAudiopreberá funkciu zvukovej karty.


MP- mikroprocesor LP - logické procesory (v operačnom systéme) Obr. 37b. Porovnanie činnosti klasického mikroprocesora s mikroprocesorom podporujúcim HyperThreading, z ktorého je zrejmý princíp nárastu výkonnosti mikroprocesora


Obr. 37c. Porovnanie "plnohodnotného" dvojprocesorového systému (a) so systémom využívajúcim mikroprocesor s technológiou HyperThreading (b)

Zhrnutie základov o mikroprocesoroch

S pohľadu programátora sú najpodstatnejšou súčasťou mikroprocesora jeho registre :

univerzálne,
segmentové,
pre špeciálne účely ako index, baza,
riadiace - IP, F a
ďalšie registre pre správu vituálnej pamäte.

Mikroprocesor podporuje adresovanie:

priame,
nepriame,
adresovanie za pomoci špecialnych registrov,
používanie relatívnej adresy ( posunutie- offset a bázová adresa).

Prístup k pamäťovej lokalite z integrovaného obvodu pamäťového čípu, pripojeného k mikroprocesoru pomocou zberníc sa nerealizuje zdanlivo najjednoduchšin spôsobom ako k fyzickej adrese lineárne usporiadanej oblasti pamäťových lokalít ale pomocou koincidenčného adresovania pomocou 2 registrov, napr. pomocou segmentu a offsetu ( štandardný zapis - CS:IP). Takáto tzv. logická adresa bola historicky použitá ako spôsob prístupu k 20 bitovej adrese pomocou 16 bitových registrov v PC XT. Normalizovaná adresa je modifikácia tejto logickej adresy, v ktorej je offset v rozmedzí 0 - FH. Výhodou koincidenčného spôsobu adresovania pomocou 2 registrov je zabezpečenie jednoduchého premiestnenia programových modulov. Výsledná tzv. efektívna adresa môže pozostávať zo složiek: segment +báza+index+posunutie.

Obdoba tohto koincidenčného spôsobu adresovania sa používa pre virtuálne adresovanie (48bitové slovo , pozostávajúce z 32 bitov adresy začiatku segmentu - bázy, spolu so 16 bitovým - selektorom, ktorý špecifikuje hraníce prideleného segmentu pamäti a prístupové práva k pamäti ). Selektor reprezentuje index do tabuľky segmentových deskriptorov so základnou adresou segmentu . ktorá sa potom štandardným adresovacím spôsobom pripočíta k offsetu na výslednú fyzickú adresu. S použitím tabuľky segmentových desktriptorov sa vytvára možnosť adresovať väčší adresový priestor ako je použiteľná pamäť na základe fyzického adresovania ( pre 32 bitový procesor adresovanie 2³²=4GB ). Virtuálny adresný priestor má v tomto prípade kapacitu 4GB*16kB= 64TB. Virtuálne adresa je dynamicky prekladaná na fyzikálnu adresu nie po adresách jednotlivých buniek pamäte ale po blokoch buniek pamäte, ktoré sa nazývajú stránky.

Jednotka správy pamäti zabezpečuje ochranu pamäti v systéme, v ktorom môže pracovať zároveň niekoľko programov. Jednotka správy pamäti musí zabrániť vzájomné narušenie činnosti bežiacich programov a operačného systému. Hierarchická ochrana pamäte je založená na rozdelení úloh do privilegovaných úrovní (kernel, supervízor, univesal user, user).

Potreba určitej štandardizácie hardvérového riešenia ako aj softvéru (operačný systém) si vyžaduje pridŕžať sa spätnej kompatibility so staršími typmi mikroprocesorov na základe požiadaviek určitej skupiny používateľov so starším hardvétom, čo predstavuje nevýhodu pre vývojarov - napr. už od určitého stupňa vývoja, ktorý prestavuje nástup Pentia Pro prestalo byť možným optimalizovať v tomto mikroprocesore vykonávanie kódu programu, pozostávajúceho z "nemoderných" 16 bitových inštrukcii.

Pomocou nových technológii možno:

rozmiestniť stále viac tranzistorov na ploche čípu, napr. sa predpokladá, že v roku 2007 sa objavia vo výrobe tranzistory s hrúbkou hradla 20nm.
zvyšovať výkon na základe zvyšovania pracovnej frekvencie jadra mikroprocesora (pre P4 4GHz), resp. systémovej zbernice (pre P4 800MHz);
zvyšovať výkon na základe zvyšovania počtu "fáz" (stupňov pipeline), v ktorých prebieha spracovanie zreťazených inštrukcii. V súvislosti s takými dlhými zreťazenými inštrukciami (hyper pipeline) treba minimalizovať výskyt pripadov nerealizovaného vetvenie programu (Advanced Branch )
zvyšovať výkon na základe súbežného spracovávania kódu (multithreading.) a súbežného spracovávania viacerých úloh (multitasking);
prispením superskalárnej architektúry na základe zdvojenia výkonných jednotiek (napr. 2*ALU, 2*AGP u P4);
zrýchlením komunikácie medzi procesorom, hlavnou pamäťou a grafickým systémom :

s využitím duálnej nezávislej zbernice DIB (Dual Independent Bus) k sekundárnej pamäti a k hlavnej pamäti. Dôležité je aj použitie oddeleného prepojenia grafického subsystému - AGP (Accelerated Graphics Port) s CPU a pamätiami pomocou špeciálnej zbernice s vysokou prenosovou rýchlosťou a veľkou šírkou zbernice , aby spracovanie obrazu mohlo pracovať paralelne a nezávisle od CPU;
s použitím špeciálneho grafického procesora - GPU (Graphic Processor Unit) na odbremenie CPU pri spracovaní grafickej informácie. Takýto výkonný čip potrebuje nielen dostatočne širokú zbernicu ( 256 bitov), ale aj podporu rýchlej pamäte;
s využitím prínosu integrovaného spracovania inštrukcii , napr. multimediálnych inštrukcii typu SIMD (Single Instruction Multiple Data), čo znamená, že jedna inštrukcia spracuje niekoľko operandov. Prínosom špeciálnych multimediálnych inštrukcii je urýchlenie výpočtov pre manipulácie v dvoj a troj rozmernej grafike, videu a audiu. Takzvané multimediálne inštrukcie sú v skutočnosti aritmetické a logické operácie na pakovaných typoch dát, napr. multimediálne inštrukčné rozšírenie - MMX (Matrix Manipulation eXtension) alebo VIS (Visual Instruction Set);

rok	mikročíp	počet tranzistorov	počet operácii /s
1982	Intel 286	134 tisíc	12 milión
1985	Intel 386	275 tisíc	33 milión
1989	Intel 486	1,2 milión	50 milión
1995	Pentium Pro	5,5 milión	200 milión
1999	Pentium 3	28 milión	732 milión
2003	Pentium 4	55 milión	3500 milión

	Win 1250	Návrat na stránku	HTML 4.0
Back				Next

Registre mikroprocesora

Najdôležitejšie príznaky:

Podpora adresovania u mikroprocesora 80x86

Fyzická organizácia pamäti

Virtuálna pamäť

Správa pamäti

Postup technologického vývoja mikroprocesorov

Moderné mikroprocesory - zhrnutie

4. Integrácia PC do čípu

Assembler

Zhrnutie základov o mikroprocesoroch