吕氏春秋8266 发表于 2011-1-13 21:05:19

裸奔程序7(下)-NAND芯片的读写及ECC检验软硬件实现

本帖最后由 吕氏春秋8266 于 2011-1-13 21:12 编辑

行检验码的生成过程:
根据异或规则,当一个数的ECC码第bit6位(En=1)时,将改变11位行检验码,显然,问题的关键是如何判断这11位行检验码。
当我们用i来表示字节在2048个字节中的位置时,由于2^11=2048,即i只取11位。

考虑如下:
   2048个字节中第i个字节,其值ECC码第6位为1
再让我们考虑一下行检验码的生成规则
将其进行2平分后异或
P8912_1=E1024+E1025+……+E2047(显然,i=1)
P8912_0=E0+E1……   +E1023(显然,i=0)
从以上规则可知:当i=1时,即i在1024~2047之间,将改变p8912_1的值
                当i=0时,即i在0~1024   之间,将改变p8192_0的值
将其进行4平分后交差取值异或
P4196_1=E512+…+E1023+E1536+…+E2047
P4196_0= E0+…+ E511+E1024+…+E1535
显然,对512~1023而言,i=01 1536~2047而言 i=11
      对0~511   而言, i=00 1024~1535而言i=10
从以上分析可以得知:我们只管i而不用管i(用以判断P8192_0/1的值)
   当i=1时,即i在512~1023、1536~2047之间,将改变p4196_1的值
   当i=0时,即i在0~511、   1024~1535之间,将改变p4196_0的值

同理,我们根据位置i每一位的值为0/1来判断要改变的行检验码。
通过以上分析,我们知道,i取值范围为0~2047共2048个字节,i为11位。正好对应需要改变的11位行检验码。程序描述如下:

for(i=0;i<2048;i++)
      {
                j=pData;                           //得到要检验的数值
                byte=Ecc_Table;                      //查表得到ECC结果
                list^=(byte&0x3f);                      //得到列检验码bit6位清零
if(byte&0x40)                           //判断第6位行检验码是否为1
{
   If(bit0(i)==1)    p8_1^=1;
       Else    p8_0^=1;

   ……………………………
   If(bit10(i)==1)    p8192_1^=1;
       Else    p8192_0^=1;
      }
      }
显然,通过一次循环及查表,我们就得到了6位列检验码和22位行检验码,我们将其按S3C2440内部定义的格式排列好就行了。
算法优化:
仔细观察第1109字节行校验码生成表示如下:

显然,我们可以定义两个标志Pn_0/1分别表示如上图:
Pn_0=p8_0, Pn_0=p16_0……pn_0=p8192_0
Pn_1=p8_1, Pn_0=p16_1……pn_0=p8192_1
根据异或规则,对0异或不改变其值,因此,要改变p8_1\p32_1\p128_1\p512_1\p8192_1
我们可以用i和Pn_1进行异或即可,同理,要改变其它行检验码的值,我们将i取反后与pn_0异或即可,故程度优化如下:
for(i=0;i<2048;i++)
{
      j=pData;//得到要检验的数值
   byte=Ecc_Table;//查表得到ECC结果
   list^=(byte&0x3f);//得到列检验码
   if(byte&0x40)//判断第6位为行检验码
   {
      row0^=((~i)&0x7ff);//取值11位pn_0
      row1^=(i&0x7ff);//pn_1
   }
}
好了,我们已经彻底了解了ECC校验算法的原理及实现,下面,我们再进行一个关键问题的研究,即ECC纠码错误位置确定。
ECC纠码错误
nandflash的每一页有两区:main区和spare区,main区用于存储正常的数据,spare区用于存储其他附加信息,其中就包括ECC校验码。当我们在写入数据的时候,我们就计算这一页数据的ECC校验码,然后把校验码存储到spare区的特定位置中,在下次读取这一页数据的时候,同样我们也计算ECC校验码,然后与spare区中的ECC校验码进行异或,结果全为0则说明读取的数据正确,如果为14个1位则表示有一位数据错误

吕氏春秋8266 发表于 2011-1-13 21:17:57

设定:
由于异或与顺序无关,我们设定除发生数据错误的第i个字节外的另2047个字节的ECC行校验码结果为P2047_1,P2047_0。
我们考虑2048个字节中第i个字节中一位发生错误(只考虑行检验码)。显然,一位发生错误,其En=bit(0)+bit(1)+bit(2)+ bit(3)+bit(4)+bit(5)+ bit(6)+bit(7)必将发生改变。分两种情况考虑:
1.En由0->1
未发生错误前,由于En=0,故不影响其它ECC行检验码,故其原始ECC行校验码
          P2047_1,P2047_0
发生错误后,由于En=1,根据行检验算法可知,新的ECC行检验码为:
          P2047_1^i,P2047_0^(~i)
新旧ECC行检验码异或得其结果为:
         P2047_1^(P2047_1^i)= (P2047_1^P2047_1)^i=0^I=i
      P2047_0^(P2047_0^(~i))= (P2047_1^P2047_1)^(~i)=0^(~i)=~i
2.En由1->0
未发生错误前,由于En=1,将影响其它ECC行检验码,故其原始ECC行校验码
          P2047_1^i,P2047_0^i
发生错误后,由于En=0,根据行检验算法可知,故不影响ECC行检验码:
          P2047_1,P2047_0
新旧ECC行检验码异或得其结果为:
          P2047_1^(P2047_1^i)= (P2047_1^P2047_1)^i=0^I=i
               P2047_0^(P2047_0^(~i))= (P2047_1^P2047_1)^(~i)=0^(~i)=~i
可见,新旧ECC校检验码异或结果已经包括了错误的字节的位置i。
if(byte&0x40)       //判断第6位为行检验码
{
   row0^=((~i)&0x7ff);
row1^=(i&0x7ff);
}
根据算法分析,新旧row1异或的结果其值就是i,其值为p8192_1/p4096_1等
同理,新旧ECC校检验码异或结果已经包括了错误的字节中哪一位错误的位置
总结如下:我们将异或结果中P8192_1/P4096_1/P2048_1……P8_1这些位取出组成一个11位的数,其值就是错误字节数在2048个字节中的位置。
同理,将p1_1/p2_1/p4_1取出,组成一个3位的数,其值就是字节中错误的列数。
好了,到此为止,我们对ECC校验算法进行了彻底的研究。搞清了它的生成原理和编程算法,以及确定错误位置的原理及算法。

三、S3C2440中硬件ECC检验算法的编程实现
在我们彻底研究了ECC检验算法的基础上,我们自然可以采取软件编程实现的方法来实现,但同时,s3c2440内部实现了ECC的硬检验。由于K9F2G08为8位NAND,因此,主要对以下几个寄存器进行操作。
NFMECC0:用于保存自动生成的位ECC码
NFMECC1:用于保存自动生成的位ECC码,不用。
NFMECCD0/1:将space区域ECC码写入,和NFMECC0寄存器内的ECC码异或
NFESTAT0:保存新旧ECC码异或结果。
根据资料,要启用ECC,
1.      NFCONT寄存器位4置1用以初始化ECC(在初始化代码中实现)
2.      NFCONT寄存器位5置0用以解开MAIN区域的ECC      
3.      读取2048个字节,以生成ECC码
4.      NFCONT寄存器位5置1用以锁定MAIN区域的ECC,即NFMECC0寄存器不再改变
当我们读取NAND第0页第1页和重读第0页数据时,其生成的ECC码如图

吕氏春秋8266 发表于 2011-1-13 21:20:43

从结果可以看出,三次读取页数据,其检验码只有在第一次读取0页时正确,第二次读取1页时错误,第三次重读0页时生成的竞是第1页的ECC码,当时差点让人崩溃。

为了找到问题的症结所在,决定在读取页数据前先查看一下NFMECC0寄存器的值,重启系统调试发现,三次读取页数据前,其值如下:

NFMECC0=0xf0ffffff

NFMECC0=0x50969569

NFMECC0=0xf0c3fc33

经过分析发现当读取页数据结束并锁定ECC值时,NFMECC0的值为

NFMECC0=NFMECC0^(~页ECC码)

第一次读取为0XF0FFFFFF^(~0X50969569[页0ECC码])=0X50969569

第二次读取为0X50969569 ^(~0X50AA96A5[页1ECC码])=0XF0C3FC33

第三次赢取为0XF0C3FC33^(~0X50969569[页0ECC码])=0x50aa96a5

通过分析,我们得知,要想得到正确的页ECC码,显然,NFMECC0寄存器其值必须保持为0XF0FFFFFF

找到了问题的症结所在,并在对NFMECC0赋值无效的情况下,查找资料发现。

好了,在解开ECC寄存器之后,重新对NFCONT位置1,NFMECC0寄存恢复原值0XF0FFFFFF,这样读取任意页均可得到正确的ECC码。

       在得到页ECC码的情况下,我们读取得到写页数据时生成的ECC码

并将该值放入NFMECCD0/1两个寄存器的相关位置,这样S3C2440将自动对两个ECC码进行异或,并根据结果设置NFESTAT0寄存器。我们可以根据该寄存器的值来判断我们读取页数据是否成功。

       经程序调试发现,对NFMECCD0/1寄存器赋值必须一次完成,否则检验结果不正确。

NFESTAT0位表示如下:

0 没有错误 1 一位错误可纠下 2不可纠下错误,3,ECC码错误

NFESTAT0位表示错误字节错误位的列数

NFESTAT0位表示错误字节的位置。

经过调试发现,其保存值均为反码,也就是说我们得到该位的值必须将其取反。
读取页数据其主要核心代码如下:
UN_MAINECC();
NF_RESTECC();               //使NFMECC0寄存器值复原

       for(i=0;i<512;i++)             //pData为32位,一次读取4字节

       {

         pData=NF_DATA();

       }

       LOCK_MAINECC();

       Ecc_Data=NF_DATA();      //得到写生成时的ECC码      

       NF_nFCE_H();

       //对寄存器赋值必须一次写完,否则检验结果将不正确

       NF_MECCD0()=((Ecc_Data)&0xff)|((Ecc_Data<<8)&0xff0000);                  

       NF_MECCD1() =((Ecc_Data>>16)&0xff)|((Ecc_Data>>8)xff0000);      

       Ecc_Stat=NF_STAT0();

       if((Ecc_Stat&0x3)==0) return true;         //数据没有错误

       if((Ecc_Stat&0x3)==1)                   //一位数据错误,纠正该错误位

       {

            row=~((unsigned int)(Ecc_Stat>>7));//取反

            row&=0x7ff;

            arr=~((unsigned int)(Ecc_Stat>>4));

            arr&=0x7;

            

            temp=((unsigned char *)pData);

            if(((temp>>arr)&0x1)==1)

            {

                     temp&=(unsigned char)(~(1<<arr));

            }

            else {

                     temp|=(unsigned char)(1<<arr);

            }

            ((unsigned char *)pData)=temp;            

            return true;

       }

体会:在对处围设置相关寄存器不同位赋值时,最好一次性完成,否则可能导致无法预测的结果。

吕氏春秋8266 发表于 2011-1-13 21:23:25

最后,附上源代码

xiaoqiang08wang 发表于 2011-1-14 19:26:37

看不懂呢咋

pzxsoso 发表于 2011-3-23 15:03:06

谢谢楼主分享!

txgc_wm 发表于 2011-4-1 21:38:41

感谢楼主!

txgc_wm 发表于 2011-4-1 21:44:45

请教一下,为什么地址是右移11位,而不是12位。我看列地址是12位呀!
页: [1]
查看完整版本: 裸奔程序7(下)-NAND芯片的读写及ECC检验软硬件实现