Ontrack Now

================================================================================
 ■■      ■             ■      豆知識  Vol.04-01
■  ■     ■             ■ ■   依頼品のHDD障害状況
■  ■ ◆■■ ■■■ ■ ■ ■■◆ ■■ ■ ■  ■  ■
■  ■ ■ ■ ■  ■■ ■  ■ ■   ■■  ■■ ■ ■■ ■ ■ ■
■  ■ ■ ■ ■  ■  ■  ■ ■ ■ ■ ■  ■ ■■ ■ ■ ■■■■
 ■■  ■ ■ ■■ ■   ■■◆ ■■ ■ ■ ■  ■ ■■  ■ ■
=============================================================2006.01.27=========

今月は、昨年度弊社がご依頼を受けたデータ復旧依頼物件の中で、HDDの障害内容に
ついてご報告致しましょう。

最初にお断わりしておかねばならない事は、弊社がご報告する数値は一般に報告される
PC使用環境での障害の発生状況とは大きく異なり、極端にハードウェア障害率が高い
点です。

その理由は

1. 弊社はデータ復旧ソフトウェア“Easy Recovery”という商品も
   販売しています。 お問合せを頂いた際、論理障害と思われるケースについては
   この試用をお勧めしています。 この為、削除、フォーマットといった誤操作に
   よる案件はご自身で試みられ、ソフトウェアでの回収が出来なかった場合などに
   限られていますので、これらの論理障害品の依頼が少ない事。

2. 弊社代理店の多くはPC販売、システム販売・サポート、保守サービス、
   データ復旧を自社にて行われている企業が多く、自社内で処理出来なかったものを
   ご紹介頂くケースが多い事。

3. PCメーカー、周辺機器メーカー等のサポート・センターや保守サービス部門
   からのご紹介が多く、このほとんどは物理障害である事。

といった点が上げられます。

では、以下 2004年度と2005年度の比較という形で見ましょう。

【復旧不能率】

データの回収が出来ないケース   2004年度    2005年度

  物理障害            16.0%     14.8%
  論理障害             4.2%      5.3%
             合計   20.2%     20.1%

【物理障害率】

                 2004年度    2005年度

 HDD物理障害が全体に占める割合 70.7%      73.6%

【HDD物理障害内容別構成比】

以下は、全依頼数に対する比率として算定しています。

                 2004年度    2005年度

  DCイレーズ           0.5%       0.2%
  ヘッドAssy+基板障害     2.6%       2.6%
  基板障害             8.8%       5.8%
  ヘッド障害           15.2%      15.3%
  VCM障害            0.5%       0.3%
  モータ障害(相断線/ショート)  0.3%       1.2%
  ベアリング障害(焼付き等)    0.8%       0.5%
  アライメント狂い         0.5%       0.5%
  中・軽度のクラッシュ       1.9%       2.0%
  重度のクラッシュ         7.7%       9.1%
  その他のパーツ障害        0.3%       0.5%
  ヘッド吸着            2.0%       2.5%
  物理制御情報消失         8.7%       8.0%
  リード・エラー         17.2%      22.7%
  動作不安定            2.3%       2.0%
  火災・冠水・水濡れ        1.4%       0.4%

  HDD正常=“論理障害”    15.0%      14.4%
  HDD以外の媒体(物理障害含む)14.3%      12.0%

2004年と2005年のもっとも大きな有意差
【2004年と2005年のもっとも大きな有意差】

“リード・エラー   5.5%増”

この差が如実に現れ始めたのは、依頼されるHDDの容量が120GB以上に急速に
シフトし始めた、2004年9月以降の事です。

弊社で受け付けるHDDの容量ベースでは、120GB以上のドライブやDisk
Arrayは、2004年9月では全体の13%程度に過ぎませんでしたが、
2005年12月時点では既に48%に達しています。

この差の原因のひとつは大容量化と価格競争による信頼性の低下であり、もうひとつは、
顧客の要望に沿った、過度の静音化でしょう。

これを表しているひとつが、ATA仕様とSCSI仕様との価格差でしょう。
現在のあるネットショップでの価格差は以下の様なものです。

ATA   Hitachi/IBM     HDS722516DLAT80 160GB/8MCash   0.83万
                      HDS722525DLAT80 250GB/8MCash   1.2万
                      HDS724040KLAT80 400GB/8MCash   2.7万
                      HDS725050KLAT80 500GB/8MCash   4.1万

SCSI  Hitachi/IBM     HUS103014FL3600 146GB          5.8万
                      HUS103030FL3600 300GB         11.2万
      Seagate         ST3146707LC     146GB          6.7万

ATAとSCSIの価格差は、従来3倍程度でしたが、現在では5〜8倍達しています。
SCSI仕様のHDDについてはプラッタ当りの容量増分と思われるコストダウン以外
にはありませんが、ことATA系については、正直どうすればここまで、というレベルの
価格低下と言えます。 確かにSCSIは用途が限定される為、生産量が少ない為も
ありますが。

この価格差が何を意味するかといえば、ATAドライブでは徹底したコストダウンが
図られているという事に繋がるのではないでしょうか。

たとえば、

 プラッタ    本来両面共に規格以下の不良スポットのものを使用していたものが、
         片面が規格外のものも使用する。
         80GBプラッタ/4ヘッド仕様の160GBと
         80GBプラッタ/3ヘッド仕様の120GBというシリーズで
         あればこれが可能です。

 ヘッド     ヘッド・アライメント(ヘッドAssyを構成するヘッドチップの
         記録ヘッド位置のずれ)の基準を甘くすれば、組立て工程での
         不良率は激減する代わりに、I/Oのマージンは少なくなります。 
         これをヘッド増幅アンプ等のゲインを制御して使用可能とする。
         また、組み立てた後、問題があるヘッドが1つであれば同じ部位が
         駄目なものを集めてロットを構成し、1つ下の容量のドライブに
         使用する。

(実際にここまでやっているかは分かりませんが、ロットによって同形式に4ヘッド
 ものと3ヘッドもの、3ヘッドでも上側だけ、下側だけといった製品が存在する為、
 パーツの調達が難しくなっているという事実は存在します。)

 ヘッドチップ  ジンバル(ヘッド・チップ支持のスプリング)を含め、共通化を
         図る。 例えば2.5”HDD用と共用する等。

 モータ     従来のネジ留めを止め、圧入にする。  等々

温度/湿度などの環境、振動、電源変動、電源リップル等ドライブ自体では制御出来ない
外部要因が加われば、アクセス・マージンは失われて行きます。 それでなくとも容量を
上げるためにいくつものトリックが使われている為、その分最初にリードエラーが
増えてくるのも当然かもしれません。

SCSIドライブはサーバー/DISK ARRAY等に使用され、24時間365日
止まることなく動作しているといって良いでしょう。 しかしながら、機械的障害の
多くは3〜5年の製品寿命を超えたところで発生するケースが多く、価格差分以上に
信頼度が高いと言っても過言ではありません。

私共のサーバー環境においても、ATAを使用したアクセス頻度の高いサーバーでは、
3年以内にほとんどのHDDがクラッシュやリードエラーの発生により交換せざるを
得なくなっています。

【障害内容の説明】

  DCイレーズ       電源シーケンスの異常、回路の誤動作等により、
               書込み回路のゲートが開いたままになり、その状態で
               記録面上をヘッドが移動し、物理フォーマットを
               含むデータを消磁してしまった状態をいう。

  ヘッド+基板障害     ヘッド巻線のショート、回路の損傷により、基板だけ
               でなく、ヘッドチップ、ヘッドアンプにも電気的損傷が
               及んでいる場合をいう。 異常の発生に伴い、リード
               エラー、フォーマット・コラプトを併発するケースが
               多い。

  基板障害         基板上の構成素子の障害
               昨今のセキュリティ・チップ搭載HDDではこれが
               致命障害となる。

  ヘッド障害        振動、衝撃、経年劣化等によりヘッドが損傷若しくは
               機能低下を起こし、正常な読取りが行えなくなっている
               ケースや増幅アンプの障害で、データへのアクセスが
               不能なもの。

  VCM障害        ヘッドはVCM(ボイス・コイル・モータ)という方式
               のモーターを使ってヘッドの位置決めをしています。
               永久磁石に挟まれたコイルに電流を流す事で駆動します
               が、この永久磁石が割れたり、ベアリングが破損したり
               といった障害が起きます。

  モータ障害        プラッタ(磁気記録盤)を廻す3相モータの何れかの
               相の異常および位置検出機能の異常によりモータが
               正常に回転しないもの。

  ベアリング障害      プラッタ駆動モータの軸受けのボール・ベアリングや
               流体軸受けに異常が生じ、必要な回転数に達さない場合
               や焼付きにより固着してしまっているもの。

  アライメント狂い     現在のHDDの多くは複数のヘッドを持っています。
               プラッタの容量は現行では60GB〜120GBに
               なっていますが、プラッタの両面が記録面ですので、
               プラッタの枚数と容量から1〜8個のヘッドが付いて
               います。 何等かの衝撃で1つのヘッドの位置が狂う、
               若しくは発熱等による金属膨張により記録の位置ズレが
               起きると、その部分が読めないという状況になります。

  クラッシュ        ヘッドと記録面が接触し、記録面が削られてしまった
               状態をいいます。 軽度の場合はヘッドに記録面を
               削ったカスが固着する程度ですが、進行するとプラッタ
               基材がガラスであれば素通し状態、アルミであれば
               バゥムクーヘン状に傷が付き、内部に削られたアルミの
               粉が飛散した状態になります。

  その他のパーツ障害    HDDの内部にはヘッドの暴走を規制する為のストッパ
               ヘッド退避用のガイド、内部のゴミを吸着する為の
               フィルタ、空気の流れを整形するガイド等、いくつかの
               部品がありますが、これらが衝撃等で破損してしまい、
               正常な動作を妨げている事があります。

  ヘッド吸着        3.5インチHDDの多くは駆動されていない時は、
               最内周部のヘッド退避域に強制的に退避する様になって
               おり、この領域は面を乱す事でヘッドと記録面の接触
               面積を減らし、モータの駆動トルクで起動可能な様に
               設計されています。 何等かの原因でヘッドがこの退避
               領域に戻らなかった時はヘッドが記録面に貼り付いて
               しまい、回転出来なくなります。 ここで無理に起動
               すると、ヘッドが捻られ、支えているジンバルが変形し
               クラッシュの原因となります。 2.5インチHDDは
               耐衝撃性向上の為、ヘッドを記録面の外側に設けられた
               ガイド部に強制的に戻す様になっていますが、電源遮断
               シーケンスに異常が起きたり、切れる瞬間に振動等が
               加わるとガイドに戻らずに記録面に貼り付いてしまい
               ます。

  物理制御情報消失     現在のHDDは記録密度を上げる為、記録面への記録
               方法をHDD及びファームウェア等のチップ上に記録
               した固有の情報によって制御しています。 この為、
               これらの情報が破損すると動作不能となります。
               この情報にはゾーンと呼ばれる同一記録密度で書かれた
               領域を制御するための情報や、元々記録面にある欠陥
               領域をバイパスするための情報などがあります。

  リード・エラー      書き込まれた情報が読み出せない状態の領域が出来て
               いる場合。 最近のHDDはドライブ自体が不良セクタ
               の検出とその置換えを行っていますが、その代替を行う
               余裕もなく読み取り不能となるとリードエラーという
               形で表に現れます。 この代替がHDD自体が許容する
               限度を超えるとHDDはデータ・アクセスに対し応答
               しなくなり、物理制御情報消失と同じ状態に陥ります。

【最終的にクラッシュ/フォーマットコラプトに至る迄の流れ】

表に出ないリードエラーの発生 (S.M.A.R.T.機能がこれを助長している)
     |
     |    Yes
  代替処理をした?−−−−−−−−−−−−|
     |No               |
     |                |
  この領域が広がる         代替領域が広がる(なんとなく遅い、
     |                |     動きがぎこちなくなる)
     |                |
  リードエラーが出る        代替領域がパンクする
     |                |
  無視して使う           フォーマットコラプト発生(認識不能)
  慌ててバックアップする
  データ復旧しようとする
     |
  急速にリードエラーが増える
     |
  ヘッド・クラッシュ(認識不能)

最近お客様からの症状報告に

・ エクスプローラでファイルは見えるのに、開けなくなったのでデータ復旧ソフトで
  復旧しようとしたら何時までたっても終らなかった。 中断し、再起動したら
  立ち上がらなくなった、ドライブが認識されなくなった。

・ 起動時にシステムファイルがないという類のメッセージが出たので、OSの
  再インストールをしようとしたら、インストールが正常に出来ず、起動不能に
  なってしまった。

といった内容が増えています。

この様なケースでは、症状が進行してしまっていて、最早手の下しようがないレベルに
至ってしまっているものが少からず存在します。

起動が不安定、時折ディスクから変な音が聞こえる、アクセス出来ないファイルが出来た
というケースのほとんどはディスク・クラッシュの予兆ですので、重要なデータであれば
お手元でなんとかしようとなさらない事をお勧め致します。

【物理障害で復旧不能となるケースで増えて来ている項目】

 もっとも多いのは個人情報保護法への対応から、HDD自体が持つセキュリティ機能や
 ドライブ単位の暗号化を使用した結果、データの回収が出来なくなるものです。

 a) ドライブの物理的制御層とOSのファイルシステムの間に組み込まれる形の暗号化
   ソフトを使用した場合、この解除及び回収はそのシステムの上でしか行う事が出来
   ません。 この為、回収出来る確率は大幅に下がります。

  ・ 暗号化システムのアドミニストレータ・パスワードを提供して頂けないと実機
    以外でのデータアクセスができない。

  ・ ドライブへのログオンは出来たとしても、OSが起動出来る形でディスクの
    イメージが取得出来なければ、データの回収は出来ない。

   といった制限があるものがほとんどです。

 b) ドライブのセキュリティ機能を用いた場合は、基板が壊れるもしくはファーム
   ウェアが壊れる、物理制御情報消失状態となるとディスクへのアクセスは不能
   になります。 これは、搭載されるセキュリティチップの機能から、基板の交換性
   に大幅な制限が加わる為です。

   但し、これはセキュリティ機能を使っていなくとも、物理制御情報消失状態となる
   と同じですので、このタイプのディスクを使用すれば好むと好まざるに関わらず
   このリスクを背負い込んでしまいます。

【ユーザーとして採れる自衛策】

ユーザーが採り得る対策は、障害発生確率の低減策としての熱対策/制振と1つ壊れても
問題を起こさない環境を作る為のバックアップに集約されます。

1. 熱対策      静音型を諦め、ファンを増設する。

2. 制振対策     HDD取り付け部に制振材をつける。

           これらはいずれも自作派の方でなければ取れない対策ですね。
           外付けHDD装置等は小型の扇風機で冷やす位でしょうか。

3. バックアップ   a) 出来ればPCを2台持ち、双方を全く同じ環境にし、
              2台の間でデータの同期バックアップを取る。
              こうしておけばメールなども1台のPCが死んでも
              ほとんど影響を受けずに済みます。

            b) 1台しかPCがない場合は増設し、内蔵HDDの内容を
              ソックリ複製する。 専用のソフトが必要ですが、
              こうしておけば、起動ドライブを切り換えるだけで
              直ちに再使用が可能になりますね。

            c) 外付けに必要なデータだけを複製する。

 PCに対する依存度とデータの重要性から、何れかを採って頂ければよいでしょう。
 これ以外にはデータ喪失に対する防御策はありません。

 システムを複雑にすればするほど、障害の発生要素は増えて行きます。 現在の
 個人情報保護等を含む環境の要請には逆行しますが、データの発生部門に近い処で
 シンプルなバックアップ方法で2重のバックアップを持つのが最も確実でしょう。
 このドライブを以前ご紹介した暗号化ソフトで暗号化しておけばよいのではない
 でしょうか。

                                     以上

================================================================================
   Ontrack Data Recovery Service--
======================================================豆知識===Vol.04-01=END====