正文

[转]如何在实模式下直接访问4GB内存2005-01-09 13:06:00

【评论】 【打印】 【字体: 】 本文链接:http://blog.pfan.cn/book/100.html

分享到:

在DOS下编程因为实模式的限制,最大只能访问1M字节内存空间,就算加上打开A20线后可以访问的65520字节也只有区区1088K而已,而这么少的一点内存中还有大量区域被操作系统、BIOS和TSR等程序占用,真正能给程序员使用的空间少得可怜。好在计算机的发展给广大程序员提供了一些解决这个问题的办法。

  最常见的方法有以下几种:

    1. 精减程序的尺寸,同时尽量避免一次使用太多的内存 (有没有搞错?偶只是初学者,不是算法专家耶)
    2. 使用文件覆盖技术,只在使用指定代码时才将其读入内存,执行后释放 (偶的程序怎么就这么慢呢?硬盘狂转中...)
    3. 用标准的DOS扩展技术如EMS、XMS、DPMI (哇!功能好强,不过程序改起来好累啊)
    4. 自己写保护模式平台 (谁要这么做了别忘了发一份源程序给我啊)
    5. 转移到其他平台如Windows/UNIX/LINUX (拜托,我只想在DOS下运行啊)

  程序压缩效果再好也是有限,总不能达到50%以上吧,程序要用2M乃至10M内存呢?文件覆盖需要自己编写调度模 块,而且因为频繁读写硬盘,将导致程序运行速度变得很低;EMS、XMS、DPMI功能强大,兼容性强,尤其是DPMI规范不 但支持大内存访问,而且还可以在保护模式下运行代码并能超越64KB的段地址限制,实在是写大型程序时的首选。但EMS 、XMS只能将扩展内存当作高速硬盘使用,所有的访问都只能通过一系列中断调用来完成,对于经常需要小尺寸大批量内 存访问的程序就不太适合,而且使用它们均受制于实模式的64KB段地址空间,对于大数据量访问也不太方便;用DPMI当 然就没有这些限制,但它需要将所有的程序按保护模式的结构改写,这也是一件麻烦的事。自己写保护模式平台(汗!... 这个我想没有几个人做得到吧,我就算做得到也不会做的)。至于转移到其他平台那就不用我说了。

  看到这里,读者不禁会问:“那照这么说来没有一种方法是好的了?” 其实也不是这样,每种方法都有它的优点和缺点,要看你的需要来决定到底使用哪种方法。

  好了,废话说了这么多,再不切入正题的话估计会有人向我扔鸡蛋了,下面就来告诉大家怎么做到在实模式下访问4GB内存。这种技术需要保护模式支持,所以只能在80386以上的CPU中运行。

  学过一点保护模式的读者都知道,在保护模式下段地址寄存器中内容的不再象实模式那样是段的基地址,而只是描述符表中的一个索引,段的真正信息(基地址、限长、访问权限等)放在描述符表中, 当访问一数据时CPU会从描述符表取出段的描述信息来检查访问是否合法,不合法就产生异常,合法则允许访问。每次访问都要读出描述符信息再检查是一个比较费时的过程,为了提高内存访问的速度,Intel公司在CPU中为每个段寄存 器配备了一个高速缓冲器来存放段的描述符信息,这样访问内存时就不用频繁地访问描述表,只要从高速缓冲进行校验就行,只有在改变段寄存器的值时才访问描述符表将新的段描述符装入高速缓冲中。

  我们就利用CPU的这个特性来达成我们的目的。首先进入保护模式,把某个段寄存器设为基地址0H,限长4GB,然后再退回实模式。这样就可以通过该段寄存器直接访问4GB的内存了(实际上只能访 问你的机器上所有的内存而并不是4GB)!还有一点要注意的是一定要打开A20线,否则......别怪我言之不预!

  下面列出所需要的代码:

Make4GBSegment MACRO _seg
local MyGdt,PM_Service,Old_GDTR,GDTR,Real_Service,MyGdt
local _Exit
Push DS
Push ES
Pushad
Pushfd ;保护现场

Sub EBX,EBX
Mov BX,CS
Mov DS,BX

Shl EBX,4
Push EBX

Rol EBX,8
Mov BYTE Ptr MyGdt[8+7],BL
Mov BL,BYTE Ptr MyGdt[8+5]
Ror EBX,8
Mov DWORD Ptr MyGdt[8+2],EBX

Pop EBX
lea EBX,[EBX+MyGdt]
Mov DWORD Ptr [GDTR+2],EBX
Mov WORD Ptr [GDTR],31 ;建立新的GDTR
Cli

Sgdt FWORD Ptr [Old_GDTR] ;保存旧的GDTR
Lgdt FWORD Ptr [GDTR] ;设置新的GDTR
Mov EBX,CR0
Or BL,1
Mov CR0,EBX ;进入保护模式
DB 0eah
DW PM_Service
DW 8 ;跳转到保护模式代码执行

PM_Service:
Mov AX,16
Mov _seg,AX
Mov EBX,CR0
And EBX,0fffffffeh
Mov CR0,EBX
DB 0eah
DW Real_Service
DW seg Real_Service

Real_Service:
Lgdt FWORD Ptr [Old_GDTR]

Popfd ;恢复现场
Popad
Pop ES
Pop DS
Jmp _Exit

MyGdt DQ 0
DW -1,0,9a00h,0
DW -1,0,9200h,0cfh
DQ 0

Old_GDTR DW 0,0,0
GDTR DW 0,0,0
_Exit:
Endm

  在这里为了方便我只把FS改成4GB段,读者可以按需要自行决定使用哪个段寄存器。只要将这段代码拷贝到你的程序中,然后在开始的时候调用它,就可以通过该段寄存器直接访问大内存了,爽吧!

  最后还有一点一定要注意:如果你的程序运行时有任何扩展内存管理程序存在(HIMEM、EMM386等)都要千万小心,因为很容易会破坏到它们的内部数据或其他程序的数据,如果是这样就只有死机一条路可走了。切记切记!我的建议是最好从内存顶端开始使用扩展内存。这时破坏其他数据的可能要小一些。



在DOS实模式下直接存取4GB内存

梁肇新

作为软件开发人员,大多数对于保护模式都感到神秘和不易理解。本人在开发32位微内

核抢占式多线程操作系统过程中,深入了解到CPU的地址机理,在这里将分析CPU的工作原

理,解开保护模式的神秘面纱,读者将会发现保护模式其实与实模式一样简单和易于控制

。在此基础上用四五十行C语言程序做到进出保护模式和在实模式之下直接访问整个4GB内

存空间。

虽然有许多书籍对保护模式作解释,但没有一本能简单明了地解释清楚,冗长烦杂的

术语让人看着想打瞌睡,甚至还有许多用汇编写的(可能根本不能运行的)保护模式试验程

序,事实上用C语言本身就可以做保护模式的进出工作。

我们可能知道CPU上电后从ROM中的BIOS开始运行,而Intel文档却说80x86CUP上电总是

从最高内存下16字节开始执行,那么BIOS是处在内存的最顶端64K(FFFF0000H)还是1M之下

的64K(F0000H)处呢?事实上在这两个地方都同时出现(可用后面存取4GB内存的程序验证)。

为什么?为了弄清楚以上问题,首先要了解CPU是如何处理物理地址的?真的是在实模式下用

段寄存器左移4位与偏移量相加,在保护模式下用段描述符中的基地址加偏移量而两者是毫

无关联的吗?答案是两者其实是一样的。当Intel把80286推出时其地址空间变成了24位,从

8086的20位到24位,十分自然地要加大段寄存器才行,实际上它们都被加大了,只是由于

保护的原因加大的部分没有被程序看见,到了80386之后地址又从24位加大到32位(80386S

X是24位)。整个段寄存器如下图所示:

@@12A08400.GIF;图1@@

在8086中CPU只有“看得见部分”,从而也直接参与了地址形成运算,但在80286之后

,在“看不见部分”中已经包含了地址值,“看得见部分”就退化为只是一个标号再也不

用参与地址形成运算了。地址的形成总是从“不可看见部分”取出基址值与偏移相加形成

地址。也就是说在实模式下当一个段寄存器被装入一个值时,“看不见部分”的界限被设

成FFFFH,基址部分才是要装入值左移4位,属性部分设成16位0特权级。这个过程与保护模

式时装入一个段存器是同理的,只是保护模式的“不可见部分”是从描述表中取值,而实

模式是一套固定的过程。

对于CPU在形成地址时,是没有实模式与保护模式之分的,它只管用基址(“不可见部

分”)去加上偏移量。实模式与保护模式的差别实际上只是保护处理部件是否工作得更精确

而已,比如不允许代码段的写入。实模式下的段寄存装入有固定的形成办法从而也就不需

要保护模式的“描述符”了,因此保持了与8086/8088的兼容性。而“描述符”也只是为了

装入段寄存器的“不可见部分”而设的。

从上面的“整个段寄存器”可见CPU的地址形成与“看得见部分”的当前值毫无关系,

这也解释了为什么在刚进入保护模式时后面的代码依然被正确地运行而这时代码段寄存器

CS的值却还是进入保护模式前的实模式值,或者从保护模式回到实模式时代码段CS被改变

之前程序是正常地工作,而不会“突变”到CS左移4位的地址上去,比如在保护模式时CS是

08H的选择器,到了实模式时CS还是08H但地址不会突然变成80H加上偏段量中去。因为地址

的形成不理会段寄存器“看得见部分”的当前值,这一个值只是在被装入时对CPU有用。

地址的形成与CPU的工作模式无关,也就是说实模式与0特权级保护模式不分页时是一

模一样的。明白了这一机理,在实模式下一样可以处理通常被认为只有在保护模式才能做

的事,比如访问整个机器的内存。可以不必理会保护模式下的众多术语,或者更易于理解

,如选择器就是“看得见部分”,描述符是为了装入“不可见部分”而设的。

作为验证CPU的这种机理,这里写了一个实模式下访问4GB内存的C程序。有一些书籍也

介绍有同样功能的汇编程序,但它们都错误地认为是利用80386芯片的设计疏漏。实际上I

ntel本身就在使用这种办法,使得CPU上电时能从FFFFFFF0H处开始第一条指令,这种技术

在286之后的每一台机器每一次冷启动时都使用,只是我们不知道罢了。CPU上电也整个代

码段寄存器是这样的:

@@12A08401.GIF;图2@@

EIP=0000FFF0H

这样CS∶EIP形成了FFFFFFF0H的物理地址,当CPU进行一次远跳转重新装入CS时,基址

就变了。

为了访问4G内存空间,必须有一个段寄存器的“不可见部分”的界限为4G-1,基址为

0,这样就包含了4GB内存,不必理会可见部分的值。显然要让段寄存器在实模式下直接装

入这些值是不可能的。唯一的办法是让CPU进入一会儿保护模式在装入了段寄存器之后马上

回到实模式。

进入保护模式十分简单,只要建好GDT把CRO寄存器的位0置上1,CPU就在保护模式了,

从前面所分析CPU地址形成机理可知,这时不必理会寄存器的“看得见部分”值是否合法,

各种段寄存器是一样可用的,就像没进保护模式一样。在把一个包含有4GB地址空间的值装

入某个段寄存器之后就可返回实模式。

预先可建好GDT如下:

unsigned long GDT-Table[]={0,0, //空描述符,必须为零

0x0000FFFF,0xCF9A00, //32位平面式代码段

0x0000FFFF,0xCF9200 } , //32位平面式数据段

只是为了访问数据的话只要2个GDT就足够了,因为并没有重装代码段,这里给出3个G

DT只是为了完整性。

通常在进入保护模式时要关闭所有的中断,把IDTR的界限设置为0,CPU自动关闭所有

中断,包括NMI,返回实模式后恢复IDTR并开中断。

另外A20地址线的控制对于正确访问整个内存也很重要,在进入保护模式前要让8042打

开A20地址线。

在这个例子里FS段寄存器设成可访问4GB内存的基址和界限,由于在DOS中很少有程序

会用到GS、FS这两个386增加的段寄存器,当要读写4GB范围中的任一个地方都可通过FS段

来达到,直到FS在实模式下被重装入冲掉为止。

这个例子在386SX、386DX、486上都运行通过。例子里加有十分详细的注释,由于这一

程序是用BC 3.1编译连接的,而其连接器不能为DOS程序处理32位寄存器,所以直接在代码

中加入操作码前缀0x66和地址前缀0x67,以便让DOS实模式下的16位程序可用32位寄存器和

地址。程序的右边以注释形式给出等效的32位指令。要注意16位的指令中mov al, byte p

tr [BX]的指令码正好是32位的指令mov al, byte ptr[EDI]。

读者可用这个程序验证BIOS是否同时在两个区域出现。如果有线性定址能力的VESA显

示卡(如TVGA9440)还可进一步验证线性显示缓冲区在1MB之上的工作情况。

#include

unsigned long GDT-Table[]=

{

0,0, //NULL - 00H

0x0000FFFF,0x00CF9A00, //Code32 - 08h Base=0 Limit=4G-1 Size=4G

0x0000FFFF,0x00CF9200 //Data32 - 10h Base=0 Limit=4G-1 Size=4G

};

unsigned char OldIDT [6]={0}; //Save The IDTR before Enter Protect Mode.

unsigned char pdescr-tmp [6]={0}; //NULL The IDTR s Limit=0 CPU will

// disable all Interrupts, include NMI.

#define KeyWait() { while(inportb(0x64) &2); }


void A20Enable(void)

{

keyWait();

outportb(0x64,0xD1);

KeyWait();

outportb(0x60,0xDF); //Enable A20 with 8042.

KeyWait();

outportb(0x64,0xFF);

KeyWait ();

}


void LoadFSLimit4G(void)

{

A20Enable (); //Enable A20

//***Disable ints & Null IDT //***

asm

{

CLI //Disable inerrupts

SIDT OldIDT //Save OLD IDTR

LIDT pdescr-tmp //Set up empty IDT.Disable any interrupts,

} // Include NMI.


//*** Lodd GDTR //***

asm

{ // The right Code is Real, But BC++ s Linker NOT Work with 32bits Code.

db 0x66 //32 bit Operation Prefix in 16 Bit DOS.

MOV CX,DS //MOV ECX,DS

db 0x66 //Get Data segment physical Address

SHL CX,4 //SHL ECX,4

MOV word ptr pdescr-tmp [0],(3*8-1)

//MOV word ptr pdescr-tmp [0], (3*8-1)

db 0x66

XOR AX,AX //XOR EAX,EAX

MOV AX,offset GDT-Table

// MOV AX,offset GDT-Table

db 0x66

ADD AX,CX //ADD EAX,ECX

MOV word ptr pdescr-tmp [2], AX

//GDTR Base low16 bits

db 0x66

SHR AX,16 //SHR EAX,16

MOV word ptr pdescr-tmp [4],AX

//GDTR Base high16 bits

LGDT pdescr-tmp //Load GDTR

}


//**** Enter 32 bit Flat Protected Mode //****

asm

{

mov DX,0x10 // The Data32 Selector

db 0x66,0x0F,0x20,0xC0 // MOV EAX,CR0

db 0x66

MOV BX,AX // MOV EBX,EAX

OR AX,1

db 0x66,0x0F,0x22,0xC0

//MOV CRO,EAX // Set Protection enable bit

JMP Flsuh

} //Clear machine perform cache.


flush: // Now In Flat Mode, But The CS is Real Mode value.

asm

{ //And it s attrib is 16Bit Code Segment.

db 0x66

MOV AX,BX //MOV EAX,EBX

db 0x8E,0xE2 //MOV FS,DX

//Load FS Base=0 Size=4G now

db 0x66,0x0F,0x22,0xC0 //MOV CRO,EAX

//Return Real Mode.

LIDT OldIDT //LIDT OldIDT //Restore IDTR

STI // STI //Enable INTR

}

}


unsigned char ReadByte (unsigned long Address)

{

asm db 0x66

asm mov di,word ptr Address // MOV EDI, Address

asm db 0x67 //32 bit Address Prefix

asm db 0x64 //FS:

asm mov al,byte ptr [BX] // =MOV AL, FS: [EDI]

return -AL;

}


unsigned char WriteByte(unsigned Long Address)

{

asm db 0x66

asm mov di,word ptr Address //MOV EDI, Address

asm db 0x67 //32 bit Address Prefix

asm db 0x64 //FS

//------------------------------
网友fanoble写的:
# include

# define ASM __emit__
# define INT __int__
# define BYTE unsigned char
# define WORD unsigned int
# define DWORD unsigned long

/* 将FS设置为4GB的段 */
void SetFS()
{
ASM(0xE8,0x00,0x00,0xEB,0x1F,0x90,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0x00,0xFF,0xFF);
ASM(0x00,0x00,0x00,0x9A,0x0F,0x00,0xFF,0xFF,0x00,0x00,0x00,0x92,0xCF,0x00,0x17,0x00);
ASM(0x00,0x00,0x00,0x00,0x5B,0x83,0xEB,0x03,0x1E,0x0E,0x1F,0x01,0x9F,0x56,0x00,0x01);
ASM(0x9F,0x5E,0x00,0x01,0x9F,0x68,0x00,0x01,0x9F,0x6D,0x00,0x01,0x9F,0x73,0x00,0x01);
ASM(0x9F,0x7A,0x00,0x01,0x9F,0x7F,0x00,0x01,0x9F,0x93,0x00,0x01,0x9F,0xA6,0x00,0x6A);
ASM(0x00,0x0E,0x66,0x58,0x2E,0xA3,0xA8,0x00,0x66,0xC1,0xE0,0x04,0x2E,0xA3,0x10,0x00);
ASM(0x66,0x50,0x66,0x50,0x58,0x58,0x2E,0xA2,0x12,0x00,0x2E,0x88,0x26,0x15,0x00,0x66);
ASM(0x58,0x66,0x05,0x06,0x00,0x00,0x00,0x66,0x2E,0xA3,0x20,0x00,0x0F,0x01,0x16,0x1E);
ASM(0x00,0xFA,0xE4,0x92,0x0C,0x02,0xE6,0x92,0x66,0x0F,0x20,0xC0,0x0C,0x01,0x66,0x0F);
ASM(0x22,0xC0,0xEA,0x97,0x00,0x08,0x00,0x6A,0x10,0x0F,0xA1,0x66,0x0F,0x20,0xC0,0x24);
ASM(0xFE,0x66,0x0F,0x22,0xC0,0xEA,0xAA,0x00,0x00,0x00,0xFB,0x1F);
}

/* 禁用A20线 */
void DisableA20()
{
ASM(0xFA,0xE4,0x92,0x24,0xFD,0xE6,0x92,0xFB);
}

/* 读内存 adr 为32位地址 */
BYTE ReadByte(DWORD adr)
{
adr = adr;
ASM(0x57,0x66,0x8B,0x7E,0x04,0x67,0x64,0x8A,0x07,0x5F);
}

/* 写内存 adr 为32位地址,val为数据 */
void WriteByte(DWORD adr, BYTE val)
{
adr = adr;
val = val;
ASM(0x57,0x66,0x8B,0x7E,0x04,0x8A,0x46,0x08,0x67,0x64,0x88,0x07,0x5F);
}

void main
{
SetFS();
WriteByte(0x000B8000, 2);
WriteByte(0x000B8001, 2);
DisableA20();
}

阅读(5470) | 评论(0)


版权声明:编程爱好者网站为此博客服务提供商,如本文牵涉到版权问题,编程爱好者网站不承担相关责任,如有版权问题请直接与本文作者联系解决。谢谢!

评论

暂无评论
您需要登录后才能评论,请 登录 或者 注册