日本高清不卡中文字幕-一起草草视频在线观看-亚洲精品一区二区三区色-国产亚洲精品免费视频

您好,歡迎進(jìn)入深圳市穎特新科技有限公司官方網(wǎng)站!

您現(xiàn)在的位置:首頁(yè) 新聞資訊 >> 新聞?lì)^條 >> 說(shuō)說(shuō)NAND FLASH以及相關(guān)ECC校驗(yàn)方法
新聞資訊
NEWS INFORMATION

說(shuō)說(shuō)NAND FLASH以及相關(guān)ECC校驗(yàn)方法

關(guān)鍵字:ECC校驗(yàn)方法 存儲(chǔ)基礎(chǔ)知識(shí) 發(fā)布時(shí)間:2019-05-22

Flash名稱(chēng)的由來(lái),F(xiàn)lash的擦除操作是以block塊為單位的,與此相對(duì)應(yīng)的是其他很多存儲(chǔ)設(shè)備,是以bit位為最小讀取/寫(xiě)入的單位,F(xiàn)lash是一次性地擦除整個(gè)塊:在發(fā)送一個(gè)擦除命令后,一次性地將一個(gè)block,常見(jiàn)的塊的大小是128KB/256KB,全部擦除為1,也就是里面的內(nèi)容全部都是0xFF了,由于是一下子就擦除了,相對(duì)來(lái)說(shuō),擦除用的時(shí)間很短,可以用一閃而過(guò)來(lái)形容,所以,叫做Flash Memory。所以一般將Flash翻譯為 (快速)閃存。

NAND Flash 在嵌入式系統(tǒng)中有著廣泛的應(yīng)用,負(fù)載平均和壞塊管理是與之相關(guān)的兩個(gè)核心議題。Uboot 和 Linux 系統(tǒng)對(duì) NAND 的操作都封裝了對(duì)這兩個(gè)問(wèn)題的處理方法。 本文首先講述Nandflash基礎(chǔ)知識(shí),然后介紹現(xiàn)有的幾類(lèi)壞塊管理(BBM)方法,通過(guò)分析典型嵌入式系統(tǒng)的 NAND 存儲(chǔ)表,指出了輕量級(jí)管理方法的優(yōu)勢(shì)所在,分析了當(dāng)前廣泛使用的輕量級(jí)管理方法,指出其缺陷所在并詳細(xì)說(shuō)明了改進(jìn)方法。

基礎(chǔ)知識(shí) 

Flash的硬件實(shí)現(xiàn)機(jī)制

Flash的內(nèi)部存儲(chǔ)是MOSFET,里面有個(gè)懸浮門(mén)(Floating Gate),是真正存儲(chǔ)數(shù)據(jù)的單元。

在Flash之前,紫外線可擦除(uv-erasable)的EPROM,就已經(jīng)采用了Floating Gate存儲(chǔ)數(shù)據(jù)這一技術(shù)了。

典型的Flash內(nèi)存物理結(jié)構(gòu) 

數(shù)據(jù)在Flash內(nèi)存單元中是以電荷(electrical charge) 形式存儲(chǔ)的。存儲(chǔ)電荷的多少,取決于圖中的外部門(mén)(external gate)所被施加的電壓,其控制了是向存儲(chǔ)單元中沖入電荷還是使其釋放電荷。而數(shù)據(jù)的表示,以所存儲(chǔ)的電荷的電壓是否超過(guò)一個(gè)特定的閾值Vth來(lái)表示,因此,F(xiàn)lash的存儲(chǔ)單元的默認(rèn)值,不是0(其他常見(jiàn)的存儲(chǔ)設(shè)備,比如硬盤(pán)燈,默認(rèn)值為0),而是1,而如果將電荷釋放掉,電壓降低到一定程度,表述數(shù)字0。

NandFlash的簡(jiǎn)介

Nand flash成本相對(duì)低,說(shuō)白了就是便宜,缺點(diǎn)是使用中數(shù)據(jù)讀寫(xiě)容易出錯(cuò),所以一般都需要有對(duì)應(yīng)的軟件或者硬件的數(shù)據(jù)校驗(yàn)算法,統(tǒng)稱(chēng)為ECC。但優(yōu)點(diǎn)是,相對(duì)來(lái)說(shuō)容量比較大,現(xiàn)在常見(jiàn)的Nand Flash都是1GB,2GB,更大的8GB的都有了,相對(duì)來(lái)說(shuō),價(jià)格便宜,因此適合用來(lái)存儲(chǔ)大量的數(shù)據(jù)。其在嵌入式系統(tǒng)中的作用,相當(dāng)于PC上的硬盤(pán),用于存儲(chǔ)大量數(shù)據(jù)。 

SLC和MLC 

Nand Flash按照內(nèi)部存儲(chǔ)數(shù)據(jù)單元的電壓的不同層次,也就是單個(gè)內(nèi)存單元中,是存儲(chǔ)1位數(shù)據(jù),還是多位數(shù)據(jù),可以分為SLC和MLC。那么軟件如何識(shí)別系統(tǒng)上使用過(guò)的SLC還是MLC呢? 
Nand Flash設(shè)計(jì)中,有個(gè)命令叫做Read ID,讀取ID,讀取好幾個(gè)字節(jié),一般最少是4個(gè),新的芯片,支持5個(gè)甚至更多,從這些字節(jié)中,可以解析出很多相關(guān)的信息,比如此Nand Flash內(nèi)部是幾個(gè)芯片(chip)所組成的,每個(gè)chip包含了幾片(Plane),每一片中的頁(yè)大小,塊大小,等等。在這些信息中,其中有一個(gè),就是識(shí)別此flash是SLC還是MLC。 

 oob / Redundant Area / Spare Area

每一個(gè)頁(yè),對(duì)應(yīng)還有一塊區(qū)域,叫做空閑區(qū)域(spare area)/冗余區(qū)域(redundant area),而Linux系統(tǒng)中,一般叫做OOB(Out Of Band),這個(gè)區(qū)域,是最初基于Nand Flash的硬件特性:數(shù)據(jù)在讀寫(xiě)時(shí)候相對(duì)容易錯(cuò)誤,所以為了保證數(shù)據(jù)的正確性,必須要有對(duì)應(yīng)的檢測(cè)和糾錯(cuò)機(jī)制,此機(jī)制被叫做EDC(Error Detection Code)/ECC(Error Code Correction, 或者 Error Checking and Correcting),所以設(shè)計(jì)了多余的區(qū)域,用于放置數(shù)據(jù)的校驗(yàn)值。

Oob的讀寫(xiě)操作,一般是隨著頁(yè)的操作一起完成的,即讀寫(xiě)頁(yè)的時(shí)候,對(duì)應(yīng)地就讀寫(xiě)了oob。

關(guān)于oob具體用途,總結(jié)起來(lái)有:

  1. 標(biāo)記是否是壞快
  2. 存儲(chǔ)ECC數(shù)據(jù)
  3. 存儲(chǔ)一些和文件系統(tǒng)相關(guān)的數(shù)據(jù)。如jffs2就會(huì)用到這些空間存儲(chǔ)一些特定信息,而yaffs2文件系統(tǒng),會(huì)在oob中,存放很多和自己文件系統(tǒng)相關(guān)的信息。

Bad Block Management壞塊管理

Nand Flash由于其物理特性,只有有限的擦寫(xiě)次數(shù),超過(guò)那個(gè)次數(shù),基本上就是壞了。在使用過(guò)程中,有些Nand Flash的block會(huì)出現(xiàn)被用壞了,當(dāng)發(fā)現(xiàn)了,要及時(shí)將此block標(biāo)注為壞塊,不再使用。于此相關(guān)的管理工作,屬于Nand Flash的壞塊管理的一部分工作。

Wear-Leveling負(fù)載平衡

Nand Flash的block管理,還包括負(fù)載平衡。

正是由于Nand Flash的block,都是有一定壽命限制的,所以如果你每次都往同一個(gè)block擦除然后寫(xiě)入數(shù)據(jù),那么那個(gè)block就很容易被用壞了,所以我們要去管理一下,將這么多次的對(duì)同一個(gè)block的操作,平均分布到其他一些block上面,使得在block的使用上,相對(duì)較平均,這樣相對(duì)來(lái)說(shuō),可以更能充分利用Nand Flash。

 ECC錯(cuò)誤校驗(yàn)碼

Nand Flash物理特性上使得其數(shù)據(jù)讀寫(xiě)過(guò)程中會(huì)發(fā)生一定幾率的錯(cuò)誤,所以要有個(gè)對(duì)應(yīng)的錯(cuò)誤檢測(cè)和糾正的機(jī)制,于是才有此ECC,用于數(shù)據(jù)錯(cuò)誤的檢測(cè)與糾正。Nand Flash的ECC,常見(jiàn)的算法有海明碼和BCH,這類(lèi)算法的實(shí)現(xiàn),可以是軟件也可以是硬件。不同系統(tǒng),根據(jù)自己的需求,采用對(duì)應(yīng)的軟件或者是硬件。

相對(duì)來(lái)說(shuō),硬件實(shí)現(xiàn)這類(lèi)ECC算法,肯定要比軟件速度要快,但是多加了對(duì)應(yīng)的硬件部分,所以成本相對(duì)要高些。如果系統(tǒng)對(duì)于性能要求不是很高,那么可以采用軟件實(shí)現(xiàn)這類(lèi)ECC算法,但是由于增加了數(shù)據(jù)讀取和寫(xiě)入前后要做的數(shù)據(jù)錯(cuò)誤檢測(cè)和糾錯(cuò),所以性能相對(duì)要降低一些,即Nand Flash的讀取和寫(xiě)入速度相對(duì)會(huì)有所影響。

其中,Linux中的軟件實(shí)現(xiàn)ECC算法,即NAND_ECC_SOFT模式,就是用的對(duì)應(yīng)的海明碼。

而對(duì)于目前常見(jiàn)的MLC的Nand Flash來(lái)說(shuō),由于容量比較大,動(dòng)輒2GB,4GB,8GB等,常用BCH算法。BCH算法,相對(duì)來(lái)說(shuō),算法比較復(fù)雜。

筆者由于水平有限,目前仍未完全搞懂BCH算法的原理。

BCH算法,通常是由對(duì)應(yīng)的Nand Flash的Controller中,包含對(duì)應(yīng)的硬件BCH ECC模塊,實(shí)現(xiàn)了BCH算法,而作為軟件方面,需要在讀取數(shù)據(jù)后,寫(xiě)入數(shù)據(jù)之前,分別操作對(duì)應(yīng)BCH相關(guān)的寄存器,設(shè)置成BCH模式,然后讀取對(duì)應(yīng)的BCH狀態(tài)寄存器,得知是否有錯(cuò)誤,和生成的BCH校驗(yàn)碼,用于寫(xiě)入。

其具體代碼是如何操作這些寄存器的,由于是和具體的硬件,具體的nand flash的controller不同而不同,無(wú)法用同一的代碼。如果你是nand flash驅(qū)動(dòng)開(kāi)發(fā)者,自然會(huì)得到對(duì)應(yīng)的起nand flash的controller部分的datasheet,按照手冊(cè)說(shuō)明,去操作即可。

不過(guò),額外說(shuō)明一下的是,關(guān)于BCH算法,往往是要從專(zhuān)門(mén)的做軟件算法的廠家購(gòu)買(mǎi)的,但是Micron之前在網(wǎng)上放出一個(gè)免費(fèi)版本的BCH算法。

位反轉(zhuǎn)

Nand Flash的位反轉(zhuǎn)現(xiàn)象,主要是由以下一些原因/效應(yīng)所導(dǎo)致:

  1. 漂移效應(yīng)(Drifting Effects)

    漂移效應(yīng)指的是,Nand Flash中cell的電壓值,慢慢地變了,變的和原始值不一樣了。

  2. 編程干擾所產(chǎn)生的錯(cuò)誤(Program-Disturb Errors)

    此現(xiàn)象有時(shí)候也叫做,過(guò)度編程效應(yīng)(over-program effect)。

    對(duì)于某個(gè)頁(yè)面的編程操作,即寫(xiě)操作,引起非相關(guān)的其他的頁(yè)面的某個(gè)位跳變了。

  3. 讀操作干擾產(chǎn)生的錯(cuò)誤(Read-Disturb Errors)

    此效應(yīng)是,對(duì)一個(gè)頁(yè)進(jìn)行數(shù)據(jù)讀取操作,卻使得對(duì)應(yīng)的某個(gè)位的數(shù)據(jù),產(chǎn)生了永久性的變化,即Nand Flash上的該位的值變了。

對(duì)應(yīng)位反轉(zhuǎn)的類(lèi)型,Nand Flash位反轉(zhuǎn)的類(lèi)型和解決辦法,有兩種:

  1. 一種是nand flash物理上的數(shù)據(jù)存儲(chǔ)的單元上的數(shù)據(jù),是正確的,只是在讀取此數(shù)據(jù)出來(lái)的數(shù)據(jù)中的某位,發(fā)生變化,出現(xiàn)了位反轉(zhuǎn),即讀取出來(lái)的數(shù)據(jù)中,某位錯(cuò)了,本來(lái)是0變成1,或者本來(lái)是1變成0了。此處可以成為軟件上位反轉(zhuǎn)。此數(shù)據(jù)位的錯(cuò)誤,當(dāng)然可以通過(guò)一定的校驗(yàn)算法檢測(cè)并糾正。
  2. 另外一種,就是nand flash中的物理存儲(chǔ)單元中,對(duì)應(yīng)的某個(gè)位,物理上發(fā)生了變化,原來(lái)是1的,變成了0,或原來(lái)是0的,變成了1,發(fā)生了物理上的位的數(shù)據(jù)變化。此處可以成為硬件上的位反轉(zhuǎn)。此錯(cuò)誤,由于是物理上發(fā)生的,雖然讀取出來(lái)的數(shù)據(jù)的錯(cuò)誤,可以通過(guò)軟件或硬件去檢測(cè)并糾正過(guò)來(lái),但是物理上真正發(fā)生的位的變化,則沒(méi)辦法改變了。不過(guò)個(gè)人理解,好像也是可以通過(guò)擦除Erase整個(gè)數(shù)據(jù)塊Block的方式去擦除此錯(cuò)誤,不過(guò)在之后的Nand Flash的使用過(guò)程中,估計(jì)此位還是很可能繼續(xù)發(fā)生同樣的硬件的位反轉(zhuǎn)的錯(cuò)誤。

以上兩種類(lèi)型的位反轉(zhuǎn),其實(shí)對(duì)于從Nand Flash讀取出來(lái)的數(shù)據(jù)來(lái)說(shuō),解決其中的錯(cuò)誤的位的方法,都是一樣的,即通過(guò)一定的校驗(yàn)算法,常稱(chēng)為ECC,去檢測(cè)出來(lái),或檢測(cè)并糾正錯(cuò)誤。

如果只是單獨(dú)檢測(cè)錯(cuò)誤,那么如果發(fā)現(xiàn)數(shù)據(jù)有誤,那么再重新讀取一次即可。

實(shí)際中更多的做法是,ECC校驗(yàn)發(fā)現(xiàn)有錯(cuò)誤,會(huì)有對(duì)應(yīng)的算法去找出哪位錯(cuò)誤并且糾正過(guò)來(lái)。

其中對(duì)錯(cuò)誤的檢測(cè)和糾正,具體的實(shí)現(xiàn)方式,有軟件算法,也有硬件實(shí)現(xiàn),即硬件Nand Flash的控制器controller本身包含對(duì)應(yīng)的硬件模塊以實(shí)現(xiàn)數(shù)據(jù)的校驗(yàn)和糾錯(cuò)的。

Nand Flash的一些typical特性

  1. 頁(yè)擦除時(shí)間是200us,有些慢的有800us
  2. 塊擦除時(shí)間是1.5ms
  3. 頁(yè)數(shù)據(jù)讀取到數(shù)據(jù)寄存器的時(shí)間一般是20us
  4. 串行訪問(wèn)(Serial access)讀取一個(gè)數(shù)據(jù)的時(shí)間是25ns,而一些舊的Nand Flash是30ns,甚至是50ns
  5. 輸入輸出端口是地址和數(shù)據(jù)以及命令一起multiplex復(fù)用的
  6. Nand Flash的編程/擦除的壽命:即,最多允許10萬(wàn)次的編程/擦除,達(dá)到和接近于之前常見(jiàn)的Nor Flash,幾乎是同樣的使用壽命了。
  7. 封裝形式:48引腳的TSOP1封裝 或 52引腳的ULGA封裝

Nand Flash控制器與Nand Flash芯片

我們寫(xiě)驅(qū)動(dòng),是寫(xiě)Nand Flash 控制器的驅(qū)動(dòng),而不是Nand Flash 芯片的驅(qū)動(dòng),因?yàn)楠?dú)立的Nand Flash芯片,一般來(lái)說(shuō),是很少直接拿來(lái)用的,多數(shù)都是硬件上有對(duì)應(yīng)的硬件的Nand Flash的控制器,去操作和控制Nand Flash,包括提供時(shí)鐘信號(hào),提供硬件ECC校驗(yàn)等等功能,我們所寫(xiě)的驅(qū)動(dòng)軟件,是去操作Nand Flash的控制器

然后由控制器去操作Nand Flash芯片,實(shí)現(xiàn)我們所要的功能。

由于Nand Flash讀取和編程操作來(lái)說(shuō),一般最小單位是頁(yè),所以Nand Flash在硬件設(shè)計(jì)時(shí)候,就考慮到這一特性,對(duì)于每一片(Plane),都有一個(gè)對(duì)應(yīng)的區(qū)域?qū)iT(mén)用于存放,將要寫(xiě)入到物理存儲(chǔ)單元中去的或者剛從存儲(chǔ)單元中讀取出來(lái)的,一頁(yè)的數(shù)據(jù),這個(gè)數(shù)據(jù)緩存區(qū),本質(zhì)上就是一個(gè)緩存buffer,但是只是此處datasheet里面把其叫做頁(yè)寄存器page register而已,實(shí)際將其理解為頁(yè)緩存,更貼切原意。

而正是因?yàn)橛行┤瞬涣私獯藘?nèi)部結(jié)構(gòu),才容易產(chǎn)生之前遇到的某人的誤解,以為內(nèi)存里面的數(shù)據(jù),通過(guò)Nand Flash的FIFO,寫(xiě)入到Nand Flash里面去,就以為立刻實(shí)現(xiàn)了實(shí)際數(shù)據(jù)寫(xiě)入到物理存儲(chǔ)單元中了,而實(shí)際上只是寫(xiě)到了這個(gè)頁(yè)緩存中,只有當(dāng)你再發(fā)送了對(duì)應(yīng)的編程第二階段的確認(rèn)命令,即0x10,之后,實(shí)際的編程動(dòng)作才開(kāi)始,才開(kāi)始把頁(yè)緩存中的數(shù)據(jù),一點(diǎn)點(diǎn)寫(xiě)到物理存儲(chǔ)單元中去。

壞塊的標(biāo)記

具體標(biāo)記的地方是,對(duì)于現(xiàn)在常見(jiàn)的頁(yè)大小為2K的Nand Flash,是塊中第一個(gè)頁(yè)的oob起始位置的第1個(gè)字節(jié)(舊的小頁(yè)面,pagesize是512B甚至256B的Nand Flash,壞塊標(biāo)記是第6個(gè)字節(jié)),如果不是0xFF,就說(shuō)明是壞塊。相對(duì)應(yīng)的是,所有正常的塊,好的塊,里面所有數(shù)據(jù)都是0xFF的。

對(duì)于壞塊的標(biāo)記,本質(zhì)上,也只是對(duì)應(yīng)的flash上的某些字節(jié)的數(shù)據(jù)是非0xFF而已,所以,只要是數(shù)據(jù),就是可以讀取和寫(xiě)入的。也就意味著,可以寫(xiě)入其他值,也就把這個(gè)壞塊標(biāo)記信息破壞了。對(duì)于出廠時(shí)的壞塊,一般是不建議將標(biāo)記好的信息擦除掉的。

uboot中有個(gè)命令是

nand scrub

就可以將塊中所有的內(nèi)容都擦除了,包括壞塊標(biāo)記,不論是出廠時(shí)的,還是后來(lái)使用過(guò)程中出現(xiàn)而新標(biāo)記的。

nand erase

只擦除好的塊,對(duì)于已經(jīng)標(biāo)記壞塊的塊,不要輕易擦除掉,否則就很難區(qū)分哪些是出廠時(shí)就壞的,哪些是后來(lái)使用過(guò)程中用壞的了。

Uboot 的輕量級(jí)壞塊管理方法

NAND 壞塊管理都是基于壞塊表(BBT)的,通過(guò)這張表來(lái)標(biāo)識(shí)系統(tǒng)中的所有壞塊。所以,不同的管理方法之間的差異可以通過(guò)以下幾個(gè)問(wèn)題來(lái)找到答案。

  • 如何初始化和讀取壞塊表?
  • 產(chǎn)生新的壞塊時(shí),如何標(biāo)記并更新壞塊表?
  • 如何保存壞塊表?是否有保存時(shí)斷電保護(hù)機(jī)制?
  • 對(duì) NAND 寫(xiě)入數(shù)據(jù)時(shí),如果當(dāng)前塊是壞塊,如何找到可替換的好塊?

Uboot 是目前使用最為廣泛的 bootloader,它提供了兩種輕量級(jí)壞塊管理方法,可稱(chēng)之為基本型和改進(jìn)型。通過(guò)下表,我們可以看到兩者的差異。

雖然 uboot 的改進(jìn)型壞塊管理方法的做了一些改進(jìn),但它仍然有三個(gè)主要的缺點(diǎn)。

  1. 出現(xiàn)壞塊,則將數(shù)據(jù)順序?qū)懭胂乱粋(gè)好塊。如果 NAND 中存放了多個(gè)軟件模塊,則每個(gè)模塊都需要預(yù)留一個(gè)較大的空間作為備用的好塊,這會(huì)浪費(fèi)較多的 NAND 空間。通常,每個(gè)模塊預(yù)留的備用好塊數(shù)為 NAND 芯片所允許的最大壞塊數(shù),該值因不同的芯片而有所不同,典型值為 20 或 80。假設(shè) NAND 是大頁(yè)類(lèi)型,總共有 N 個(gè)模塊,則總共需要預(yù)留的空間大小為 N*80*128KB。
  2. 讀取 BBT 時(shí)僅檢查簽名,沒(méi)有對(duì) BBT 的數(shù)據(jù)做校驗(yàn)。
  3. 沒(méi)有掉電保護(hù)機(jī)制。如果在保存 BBT 時(shí)斷電,BBT 將丟失。

針對(duì)現(xiàn)有管理方法的缺陷,本文提出了一種更加安全高效的管理方法,將從以下三個(gè)方面闡述其實(shí)現(xiàn)原理。

共用好塊池機(jī)制

首先,使用一個(gè)統(tǒng)一的備用好塊池,為所有存放在 NAND 中的模塊提供可替換的好塊。這樣,就不需要在每個(gè)模塊后面放置一個(gè)保留區(qū),提高了 NAND 的空間利用率。

共用好塊池示意圖

共用好塊池示意圖

為了實(shí)現(xiàn)共用好塊池,需要建立一個(gè)從壞塊到好塊的映射,所以,除了 BBT 之外,還需定義一個(gè)替換表(SBT)。這樣一來(lái),當(dāng)讀第 i 個(gè)塊的數(shù)據(jù)時(shí),如果發(fā)現(xiàn) BBT 中記錄該塊為壞塊,就去 SBT 中查詢(xún)其替換塊;如果寫(xiě)第 i 個(gè)塊出錯(cuò),需要在 BBT 中標(biāo)記該塊為壞塊,同時(shí)從好塊池中獲取一個(gè)新的好塊,假設(shè)其序號(hào)為 j,然后將此好塊的序號(hào) j 寫(xiě)入 SBT 中的第 i 個(gè)字節(jié),而且 SBT 的第 j 個(gè)字節(jié)寫(xiě)序號(hào) i。SBT 中的這種雙向映射可確保數(shù)據(jù)的可靠性。此外,好塊池中的塊也有可能成為壞塊,如果掃描時(shí)發(fā)現(xiàn)是壞塊,則將 SBT 中的對(duì)應(yīng)位置標(biāo)記為 0x00,如果是在寫(xiě)的過(guò)程中出錯(cuò),則除了在 SBT 對(duì)應(yīng)位置標(biāo)記 0x00 之外,還要更新雙向映射數(shù)據(jù)。

 BBT/SBT 映射示意圖

 

安全的 BBT/SBT 數(shù)據(jù)校驗(yàn)機(jī)制

傳統(tǒng)方法僅檢查 BBT 所在塊的簽名,將讀到的前幾個(gè)字節(jié)和一個(gè)特征字符串進(jìn)行比較,如果一致,就認(rèn)為當(dāng)前塊的數(shù)據(jù)為 BBT,然后讀取接下來(lái)的 BBT 數(shù)據(jù),但并不對(duì) BBT 的數(shù)據(jù)做校驗(yàn)。如果 BBT 保存在 NAND 中,數(shù)據(jù)的有效性是可以得到驗(yàn)證的,因?yàn)?NAND 控制器或驅(qū)動(dòng)一般都會(huì)對(duì)數(shù)據(jù)做 ECC 校驗(yàn)。但是,大多數(shù)控制器使用的 ECC 算法也僅僅能糾正一個(gè) bit、發(fā)現(xiàn) 2 兩個(gè) bit 的錯(cuò)誤。如果 BBT 保存在其他的沒(méi)有 ECC 校驗(yàn)機(jī)制的存儲(chǔ)體中,比如 NOR Flash,沒(méi)有對(duì) BBT 的數(shù)據(jù)進(jìn)行校驗(yàn)顯然是不安全的。

為了更加可靠和靈活地驗(yàn)證 BBT/SBT 數(shù)據(jù),定義下面這個(gè)結(jié)構(gòu)體來(lái)描述 BBM 信息。

BBM 頭信息

typedef struct {
UINT8     acSignature[4];/* BBM 簽名 */
UINT32    ulBBToffset;/* BBT 偏移 */
UINT32    ulSBToffset;/* SBT 偏移 */
UINT16    usBlockNum;/* BBM 管理的 block 數(shù)目 */    
UINT16    usSBTstart;/* SBT 所在位置的起始 block 序號(hào) */
UINT16    usSBtop;/* SBT top block */
UINT16    usSBnum;/* SBT number */
UINT32    ulBBTcrc;/* BBT 數(shù)據(jù) CRC 校驗(yàn)碼 */
UINT32    ulSBTcrc;/* SBT 數(shù)據(jù) CRC 校驗(yàn)碼 */
UINT32    ulHeadcrc;/* BBM 頭信息 CRC 校驗(yàn)碼 */
} BBM_HEAD

BBT/SBT 的保存形式

BBT/SBT 的保存形式

使用三重 CRC 校驗(yàn)機(jī)制,無(wú)論 BBT 保存在哪種存儲(chǔ)體中,都可以更加嚴(yán)格地驗(yàn)證數(shù)據(jù)的有效性。

安全的掉電保存機(jī)制

傳統(tǒng)的方法僅保存一份 BBT 數(shù)據(jù),如果在寫(xiě) BBT 時(shí)系統(tǒng)掉電,則 BBT 丟失,系統(tǒng)將可能無(wú)法正常啟動(dòng)或工作。為安全起見(jiàn),本文所述方法將同時(shí)保留三個(gè)備份,如果在寫(xiě)某個(gè)備份時(shí)掉電,則還有兩個(gè)完好的備份。最壞的情況是,如果在寫(xiě)第一個(gè)備份時(shí)掉電,則當(dāng)前最新的一個(gè)壞塊信息丟失。

讀取壞塊表時(shí),順序讀取三個(gè)備份,如果發(fā)現(xiàn)三個(gè)備份的數(shù)據(jù)不一致,用記錄的壞塊數(shù)最多的備份為當(dāng)前的有效備份,同時(shí)立刻更新另外兩備份。

總結(jié)

本文介紹了NandFlash基礎(chǔ)知識(shí)和幾類(lèi) NAND 壞塊管理方法,指出了 uboot 的輕量級(jí)管理方法的缺陷,提出了一種改進(jìn)的方法,提高了 NAND 的利用率及壞塊管理的安全性,可對(duì)嵌入式開(kāi)發(fā)起到有很好的借鑒作用。

ECC定義

ECC校驗(yàn)是一種內(nèi)存糾錯(cuò)原理,它是比較先進(jìn)的內(nèi)存錯(cuò)誤檢查和更正的手段。ECC內(nèi)存即糾錯(cuò)內(nèi)存,簡(jiǎn)單的說(shuō),其具有發(fā)現(xiàn)錯(cuò)誤,糾正錯(cuò)誤的功能,一般多應(yīng)用在高檔臺(tái)式電腦/服務(wù)器及圖形工作站上,這將使整個(gè)電腦系統(tǒng)在工作時(shí)更趨于安全穩(wěn)定。

技術(shù)原理

內(nèi)存是一種電子器件,在其工作過(guò)程中難免會(huì)出現(xiàn)錯(cuò)誤,而對(duì)于穩(wěn)定性要求高的用戶(hù)來(lái)說(shuō),內(nèi)存錯(cuò)誤可能會(huì)引起致命性的問(wèn)題。內(nèi)存錯(cuò)誤根據(jù)其原因還可分為硬錯(cuò)誤和軟錯(cuò)誤。硬件錯(cuò)誤是由于硬件的損害或缺陷造成的,因此數(shù)據(jù)總是不正確,此類(lèi)錯(cuò)誤是無(wú)法糾正的;軟錯(cuò)誤是隨機(jī)出現(xiàn)的,例如在內(nèi)存附近突然出現(xiàn)電子干擾等因素都可能造成內(nèi)存軟錯(cuò)誤的發(fā)生。

為了能檢測(cè)和糾正內(nèi)存軟錯(cuò)誤,在ECC技術(shù)出現(xiàn)之前,首先出現(xiàn)的是內(nèi)存“奇偶校驗(yàn)(Parity)”。內(nèi)存中最小的單位是比特,也稱(chēng)為“位(bit)”,位有只有兩種狀態(tài)分別以1和0來(lái)標(biāo)示,每8個(gè)連續(xù)的比特叫做一個(gè)字節(jié)(byte)。不帶奇偶校驗(yàn)的內(nèi)存每個(gè)字節(jié)只有8位,如果其某一位存儲(chǔ)了錯(cuò)誤的值,就會(huì)導(dǎo)致其存儲(chǔ)的相應(yīng)數(shù)據(jù)發(fā)生變化,進(jìn)而導(dǎo)致應(yīng)用程序發(fā)生錯(cuò)誤。而奇偶校驗(yàn)就是在每一字節(jié)(8位)之外又增加了一位作為錯(cuò)誤檢測(cè)位。在某字節(jié)中存儲(chǔ)數(shù)據(jù)之后,在其8個(gè)位上存儲(chǔ)的數(shù)據(jù)是固定的,因?yàn)槲恢荒苡袃煞N狀態(tài)1或0,假設(shè)存儲(chǔ)的數(shù)據(jù)用位標(biāo)示為1、1、1、0、0、1、0、1,那么把每個(gè)位相加(1+1+1+0+0+1+0+1=5),結(jié)果是奇數(shù)。對(duì)于偶校驗(yàn),校驗(yàn)位就定義為1,反之則為0;對(duì)于奇校驗(yàn),則相反。當(dāng)CPU讀取存儲(chǔ)的數(shù)據(jù)時(shí),它會(huì)再次把前8位中存儲(chǔ)的數(shù)據(jù)相加,計(jì)算結(jié)果是否與校驗(yàn)位相一致。從而一定程度上能檢測(cè)出內(nèi)存錯(cuò)誤,奇偶校驗(yàn)只能檢測(cè)出錯(cuò)誤而無(wú)法對(duì)其進(jìn)行修正,同時(shí)雖然雙位同時(shí)發(fā)生錯(cuò)誤的概率相當(dāng)?shù)停媾夹r?yàn)卻無(wú)法檢測(cè)出雙位錯(cuò)誤。

通過(guò)上面的分析我們知道Parity內(nèi)存是通過(guò)在原來(lái)數(shù)據(jù)位的基礎(chǔ)上增加一個(gè)數(shù)據(jù)位來(lái)檢查當(dāng)前8位數(shù)據(jù)的正確性,但隨著數(shù)據(jù)位的增加Parity用來(lái)檢驗(yàn)的數(shù)據(jù)位也成倍增加,就是說(shuō)當(dāng)數(shù)據(jù)位為16位時(shí)它需要增加2位用于檢查,當(dāng)數(shù)據(jù)位為32位時(shí)則需增加4位,依此類(lèi)推。特別是當(dāng)數(shù)據(jù)量非常大時(shí),數(shù)據(jù)出錯(cuò)的幾率也就越大,對(duì)于只能糾正簡(jiǎn)單錯(cuò)誤的奇偶檢驗(yàn)的方法就顯得力不從心了,正是基于這樣一種情況,一種新的內(nèi)存技術(shù)應(yīng)允而生了,這就是ECC(錯(cuò)誤檢查和糾正),這種技術(shù)也是在原來(lái)的數(shù)據(jù)位上外加校驗(yàn)位來(lái)實(shí)現(xiàn)的。不同的是兩者增加的方法不一樣,這也就導(dǎo)致了兩者的主要功能不太一樣。它與Parity不同的是如果數(shù)據(jù)位是8位,則需要增加5位來(lái)進(jìn)行ECC錯(cuò)誤檢查和糾正,數(shù)據(jù)位每增加一倍,ECC只增加一位檢驗(yàn)位,也就是說(shuō)當(dāng)數(shù)據(jù)位為16位時(shí)ECC位為6位,32位時(shí)ECC位為7位,數(shù)據(jù)位為64位時(shí)ECC位為8位,依此類(lèi)推,數(shù)據(jù)位每增加一倍,ECC位只增加一位。總之,在內(nèi)存中ECC能夠容許錯(cuò)誤,并可以將錯(cuò)誤更正,使系統(tǒng)得以持續(xù)正常的操作,不致因錯(cuò)誤而中斷,且ECC具有自動(dòng)更正的能力,可以將Parity無(wú)法檢查出來(lái)的錯(cuò)誤位查出并將錯(cuò)誤修正。

示例

ECC(Error Checking and Correcting,錯(cuò)誤檢查和糾正)內(nèi)存,它同樣也是在數(shù)據(jù)位上額外的位存儲(chǔ)一個(gè)用數(shù)據(jù)加密的代碼。當(dāng)數(shù)據(jù)被寫(xiě)入內(nèi)存,相應(yīng)的ECC代碼與此同時(shí)也被保存下來(lái)。當(dāng)重新讀回剛才存儲(chǔ)的數(shù)據(jù)時(shí),保存下來(lái)的ECC代碼就會(huì)和讀數(shù)據(jù)時(shí)產(chǎn)生的ECC代碼做比較。如果兩個(gè)代碼不相同,他們則會(huì)被解碼,以確定數(shù)據(jù)中的哪一位是不正確的。然后這一錯(cuò)誤位會(huì)被拋棄,內(nèi)存控制器則會(huì)釋放出正確的數(shù)據(jù)。被糾正的數(shù)據(jù)很少會(huì)被放回內(nèi)存。假如相同的錯(cuò)誤數(shù)據(jù)再次被讀出,則糾正過(guò)程再次被執(zhí)行。重寫(xiě)數(shù)據(jù)會(huì)增加處理過(guò)程的開(kāi)銷(xiāo),這樣則會(huì)導(dǎo)致系統(tǒng)性能的明顯降低。如果是隨機(jī)事件而非內(nèi)存的缺點(diǎn)產(chǎn)生的錯(cuò)誤,則這一內(nèi)存地址的錯(cuò)誤數(shù)據(jù)會(huì)被再次寫(xiě)入的其他數(shù)據(jù)所取代。

聯(lián)系方式0755-82591179

傳真:0755-82591176

郵箱:vicky@yingtexin.net

地址:深圳市龍華區(qū)民治街道民治大道973萬(wàn)眾潤(rùn)豐創(chuàng)業(yè)園A棟2樓A08

莱西市| 凤山县| 察隅县| 盈江县| 乌拉特后旗| 五峰| 淳安县| 江西省| 望都县| 丰原市| 连平县| 红河县| 连城县| 柯坪县| 蒙山县| 法库县| 彝良县| 嫩江县| 综艺| 镇安县| 卢氏县| 喀喇| 晋城| 西充县| 龙胜| 宁波市| 泰和县| 阳山县| 北碚区| 珠海市| 开阳县| 阿合奇县| 云霄县| 婺源县| 剑河县| 通山县| 黔东| 玛纳斯县| 三河市| 逊克县| 赤峰市|