• <nav id="4o4s2"><nav id="4o4s2"></nav></nav>
  • <nav id="4o4s2"></nav>
  • 物聯網開發

    錯誤的閃存存儲:5個最常見的問題點

      在過去十年中,NAND閃存已經成為存儲和訪問各種數據的最受歡迎的設備,從視頻記錄和流媒體、個人存儲、操作系統的提供到數據記錄、應用加速等等。創新速度在速度和存儲容量方面都有多因素的提高。


      唯一減少的方面,至少從總體上說,是可靠性。由于新產品的推出周期非常短,只有幾個月的時間,不再有時間去充分測試和驗證復雜的功能。因此,不成熟的產品進入市場,后來依靠在現場的多次固件更新來消除客戶測試所發現的問題。


    閃存存儲


      在大多數情況下,這種情況沒有公布,NAND存儲的問題也沒有在受影響的公司之外分享,除非損害影響到更多的公眾。例如,特斯拉最近不得不召回13.4萬輛汽車,原因是一個尺寸不足的嵌入式多媒體卡(eMMC)的早期故障。


      關于固態盤(SSD)的故障,我們需要考慮兩個主要方面:硬件和固件。


      硬件定義了原始比特錯誤率(在通過糾錯單元之前有比特錯誤的塊讀數的百分比),單元的數據保留,以及支持的溫度范圍。固件需要管理閃存的平等磨損,執行位錯誤校正,并減輕溫度數據影響和電源損耗問題。


      下面是涉及到NAND閃存問題時的五大錯誤原因。


      1. 錯誤的NAND質量。


      NAND閃存是一種商品,需要保持每千兆字節的低成本。許多發展(3D NAND,QLC)主要是由這個目標驅動的。對于手機和個人電腦/筆記本電腦的使用,消費者質量的NAND已經足夠。但對于要求更高的應用,如企業存儲或工業/網絡和通信應用,就不是這樣了。


      標準化聯盟JEDEC已經定義了兩個主要的使用案例及其各自的質量要求。


      客戶端用例。PC用戶類型的工作負荷,8小時/天,40°C,不可更正的錯誤率(UBER)< 10-15


      企業用例。數據庫類型的工作負荷,24小時/天,55°C,不可更正的錯誤率(UBER)< 10-16


      10-15和10-16似乎都是極低的數字,但這一差異意味著客戶機硬盤的故障頻率比企業級硬盤高10倍。隨著現代固態硬盤的高吞吐量,固態硬盤的故障概率不再是可以忽略不計的。


      今天的NAND閃存的原始比特錯誤率,低級別的在10-2之間,高級別的技術在10-3之間。各種水平的糾錯將UBER率降低到要求的UBER水平。閃存質量等級和錯誤處理水平對銷售價格有直接影響。作為一個一般規則。不要把廉價的商業級SSD放在需要低錯誤率的應用中。


      2. 錯誤的NAND設計。


      三維NAND單元是一個由許多層組成的高度復雜的堆疊。目前,一些設備有超過140層。制造時需要在數百個多晶硅和氧化硅沉積物的夾層中蝕刻非常薄但又非常深的孔。由于蝕刻的性質,孔的下半部分比上半部分窄得多,導致晶體管的電氣性能不同。這使得可靠地讀取不同的單元非常具有挑戰性。再加上讀取和寫入之間的溫度變化,又增加了一個變化的維度。


      并非每個NAND設計都能在寫入和讀取之間的溫度變化時提供足夠好的數據。只要固態硬盤產品駐扎在熱控制良好的系統中--例如,在個人電腦、筆記本電腦、服務器或手持設備中,溫度變化太小,不會造成問題。


      對于工業或網通應用,對NAND的要求大大增加,NAND的設計和支持固件都需要支持廣泛的溫度波動。一旦系統必須在溫度波動的條件下運行,閃存產品的錯誤選擇會導致多種問題。


      3. 錯誤的機械穩定性。


      聽說過熱-機械應力嗎?當溫度波動影響到結合了不同熱膨脹系數的元素的結構時,就會發生這種情況,也就是說,在相同的溫度變化下,一些部件比其他部件延伸得更多。


      一塊固態硬盤由一塊PCB板組成,上面有焊接好的閃存包、一個控制器、連接器和小型被動元件。所有這些都隨著溫度的變化而表現得不同。由于封裝是焊接在PCB上的,不同的膨脹導致機械應力,最終導致互連線斷裂(圖1和2)。


      這種損害是在數百到數千次的溫度循環后發生的,甚至可能需要數年時間。但當涉及到長期在現場的工業系統時,它就非常重要了。


      4. 電源故障穩健性。


      對于一個總是優雅地關閉的筆記本電腦來說,電源故障魯棒性不是問題。對于一個簡單地拔掉插頭的醫療設備,或者在電源不穩定的環境中的NetCom路由器,突然斷電一定不會導致系統損壞。


      突然斷電可能在任何時候發生--在外部寫入SSD的過程中,在內部垃圾收集過程中,在固件更新過程中,甚至在從以前的斷電恢復過程中。如果固件不能正確管理電源損失,將影響數據損失的嚴重性。最好的情況是,它只是最后寫入的數據(實時數據);最壞的情況是,固件被損壞,固態硬盤不再工作。在許多關鍵任務的應用中,丟失哪怕是幾個比特的數據都是不可接受的。


      Swissbit對市場上常見的SSD進行了測試,在斷電測試中看到了各種類型的故障發生。


      5. 錯誤的固件架構。


      速度很重要,至少對于消費類硬盤而言。此外,速度測試通常是在硬盤是新的、空的、剛格式化的時候進行的。通常不考慮的是,當硬盤100%裝滿,多次被覆蓋,或者可能在高溫下運行時,還有多少性能。許多現有的固件架構關注的是性能規格,而不是在整個操作范圍內的最高耐久性或保留或持續性能。


      選擇一個沒有為長期使用而優化的固態硬盤,一旦硬盤的早期壽命過去,可能會導致不好的意外(圖3)。


      結論


      選擇正確的SSD或NAND閃存產品取決于許多標準。特別是當涉及到工業用途或苛刻的應用時,決策過程中應包括以下幾個方面。選擇合適的組件、機械結構、固件架構和電源故障的穩健性。這樣做是找到一個可靠的數據存儲設備的最好方法,可以在很長的使用壽命內存儲和檢索數據。


      鄭州博觀電子科技有限公司是一家提供科技類物聯網開發軟硬件定制化方案服務商、也是中原地區領先的物聯網終端設備解決方案提供商。致力共享換電柜、智能充電樁、共享洗車機、物聯網軟硬件等服務平臺的方案開發與運維??偛课挥诤幽鲜∴嵵菔懈咝聟^,已取得國家高新技術企業認證證書。經過10多年的業務開拓,公司已經形成了以中原地區為中心、業務遍布全國的經營格局。


    注:本站文章部分文字及圖片來自互聯網。如有侵權行為,請聯系我們,我們會及時刪除。