Forstå subtile forskjeller mellom adresseringsmodi i X86

Jack

2015-11-30 22:46:54 UTC

view on stackexchange narkive permalink

Jeg prøver å ha et helt bilde av alle mulige adresseringsmodi i X86-instruksjonene. Med utgangspunkt i dette studerte jeg Intel IA-32-referansen og flere sekundære referanser som ble funnet online.

Jeg vil gjerne forstå dem riktig, så her er min tvil:

mod == 0b11 : direkte verdi i registeret er tilgjengelig, ganske tydelig
mod! = 0b11 : dette er alle indirekte verdier, med valgfri 8 eller 16 bit forskyvning til den endelige verdien, så vi refererer til verdien i den beregnede adressen.

Min tvil:

16-biters forskyvning er signert eller usignert? F.eks. mov ax, [SI + 40000] vs mov ax, [SI - 1000]
hva er akkurat tilfellet mod == 0b00 & R / M == 0b110 ? Det er bare en indirekte absolutt verdi, f.eks mov cl, [1234h] , som masme kompilerer som 8b0e3412: mov cx, WORD PTR ds: 0x1234
er alle disse indirekte adresseringene alltid i forhold til et segment? Fra referansen høres det ut som at i 16-bits modus er alt alltid relativt til DS, med mindre BP er inneholdt i den indirekte adressen, i så fall brukes SS (eller det brukes en spesifikk segmentoverstyring). Så i utgangspunktet betyr [BP + SI + 10h] alltid SS: [BP + SI + 10h] der SS-segmentet forskyves med 4 bits til venstre.
som er den eksakte rollen til 67h-prefikset i denne sammenhengen? Hvis jeg bruker et 67h-prefiks, er det som å bytte tabell med 16-biters adresseringer med 32-biters adressering og viceversa? (i henhold til gjeldende utførelsesmodus).
og hva med 66h? Endrer det bare "størrelsen" på data som flyttes mellom 16 og 32 bits? For eksempel, å tvinge 32-biters operandstørrelse betyr at et 32-biters register vil bli valgt og alltid 4 byte minne vil bli hentet fra den indirekte adressen og omvendt?

Og nå 32-biters adresseringsmodi

mod == 0b11 : direkte verdi, som for 16 bit, ganske klar
mod == 0b00 && R / M == 0b101 : rå verdi som for 16 bits adresseringssak
mod! = 0b11 && R / M = = 0b100 : R / M spesifiserer ikke et register, men SIB-modus, så vi kan spesifisere et basisregister + et indeksregister + en skalaverdi

Her alt er nok tydelig, jeg bare lurte på, som for 16 bits om forskyvning i 32 bits er signert eller usignert? SIB og forskyvning kan enkelt kombineres hvis jeg forstår det riktig, f.eks. [EAX + EBX * 2 + 10] vil generere en mod == 01 med spesifikk SIB-byte og tillegg enkeltbyte for signert forskyvning. Betraktes disse verdiene som absolutte i et flatt minne, eller må segmenter også vurderes her?

Et ord til segmenter, hvorfor de hadde betydning, og ikke gjør det ( normalt) betyr noe mer:

Først, da 8086 ble introdusert, var det ment å erstatte den eldre 8080-prosessoren (og Z80, som var fra et annet selskap, kompatibel med 8080, men bedre og mer vellykket). 8080 hadde 64 kB maksimalt helt, så programmerere måtte presse alt - kode, data, stabling - inn i de 64 kB, og mesteparten av tiden ble en del av disse 64 kB brukt av maskinvare, så du hadde enda mindre .

Da 8086 og segmentregistrene ble designet, tenkte nok noen på intel "Vi gir folk mye mer plass - 64 kb kode OG 64 kb data OG 64 kb stabel, slik at programmer kan være mye større; vi kan multitaske mellom flere programmer, operativsystemet vil administrere segmentregistrene for å tildele plass til hvert program, og hvert program kan være så mye større enn i dag ".

Men faktisk, programmer ble raskt mye større, så ideen "segmentregister skal bare vedrøre operativsystemet" ble aldri brukt. I stedet måtte programmene sjonglere med seg selv, noe som var en viktig PITA for alle fra kompilatørbyggere til applikasjonsprogrammerere, og alle måtte lære - og vite - om dem for å få gjort noe.

Da 32-biters prosessorer startet, med 4 GB adresserbar på en lineær måte, ble segmenter plutselig store nok til at applikasjonsprogrammerere ikke lenger måtte bry seg om dem. I disse dager er det bare operativsystemets oppgave å sjonglere segmenter og tildele dem til minnekart, og på grunn av beskyttet modus kunne ikke programmene endre dem selv om de ville. Det som de fleste operativsystemer gjør, er å gi en enkelt flat minneblokk til programmet, og ha cs , ds , es og ss kart til den blokken identisk. Søknaden din ser bare 4 GB adresserbart minne (ikke alt dette trenger imidlertid å være virkelig kartlagt til fysisk minne), og det betyr ikke noe for applikasjonen lenger hvilket segmentregister det bruker - [DS: 1234] er det samme som [ES: 1234] er det samme som [SS: 1234] er det samme som [CS: 1234] .

Unntaket fra dette er de nye registrene FS og GS , for eksempel bruker Windows FS for Strukturert unntakshåndtering, og Linux bruker GS for Tråd lokal lagring. Disse segmentene er IKKE tilordnet standard 4 GB-blokken, men et program vil ikke legge merke til det, siden ingen av disse registrene noen gang blir brukt uten et eksplisitt prefiks. (Merk ES kan ikke brukes på samme måte, siden instruksjoner som stos [bwd] og movs [bwd] bruker ES : EDI som standard).