Журнал «Компьютерра» № 8 от 27 фераля 2007 года | страница 6




Мифы о блинах

Прошедшая в калифорнийском Сан-Хосе компьютерная конференция FAST '07 принесла две интересные работы, анализирующие статистику отказов большого числа жестких дисков. Приведенные в этих научных трудах цифры показывают, что общепринятые представления о надежности и причинах поломок винчестеров справедливы далеко не всегда.

Одна из работ принадлежит перу специалистов Google Labs, обнародовавших статистические данные по обслуживанию дисковых массивов в инфраструктуре поискового гиганта. Тринадцатистраничный документ, составленный на основе мониторинга показателей SMART примерно 100 тысяч винчестеров, опровергает некоторые распространенные заблуждения. Как ни странно, повышение температуры и высокие нагрузки вовсе не являются причиной выхода накопителей из строя. А вот выявление артефактов при сканировании «блинов» с большой вероятностью означает скорый переезд харда на помойку (особенно в сочетании с некоторыми тревожными звоночками внутренней системы мониторинга SMART). Больше всего подвержено поломкам совсем новое оборудование (со сроком эксплуатации менее полугода) и «ветераны», отслужившие не менее четырех-пяти лет. Хотя сотрудники Google отмечают существенно различающуюся надежность разных моделей винчестеров, имен «отличников» и «двоечников» они, к сожалению, не называют. Зато пишут, что выявленные закономерности справедливы и для любой более узкой выборки по годам производства или марке, разве что абсолютные цифры будут отличаться.

Работа Google Labs получила высокую оценку специалистов, но почетного звания «Best Paper» на конференции удостоилась не она, а публикация Бьянки Шрёдер (Bianca Schroeder) из Университета Карнеги Меллона. Бьянка свела воедино статистику обслуживания нескольких суперкомпьютерных центров и систем интернет-провайдеров. Число наблюдавшихся «пациентов» - около ста тысяч - у нее примерно такое же, но работали они в гораздо менее однородной среде, чем диски Google, что делает работу Шрёдер еще интереснее. Основные ее выводы примерно таковы:

ў надежность дорогих винчестеров с «серьезными» интерфейсами SCSI и FC примерно такая же, как у массовых SATA-дисков;

ў декларируемое производителями время наработки на отказ (MTTF) в среднем завышено в три с половиной раза;

ў «отказоустойчивые» дисковые массивы RAID 5 не очень-то безопасны. При поломке одного диска довольно велика вероятность, что в течение нескольких часов откажет и второй;