Elements in grown defect list что это

Использование smartctl для проверки RAID контроллеров Adaptec под Linux

Elements in grown defect list что это. Смотреть фото Elements in grown defect list что это. Смотреть картинку Elements in grown defect list что это. Картинка про Elements in grown defect list что это. Фото Elements in grown defect list что это

Распознает ли Linux контроллер Adaptec RAID?

Для проверки Вы можете использовать следующую команду:

В результате выполнения команды получите следующее:

Загрузка и установка Adaptec Storage Manager для Linux

Необходимо установить Adaptec Storage Manager в соответсвии собранному дисковому массиву.

Проверяем состояния SATA диска

Команда для сканирования накопителя выглядит довольно просто:

В результате у Вас должно получится следующее:

Таким образом, /dev/sda — это одно устройство, которое было определено как SCSI устройство. Выходит, что у нас SCSI собран из 4 дисков, расположенных в /dev/sg <1,2,3,4>. Введите следующую smartclt команду, чтобы проверить диск позади массива /dev/sda:

Контроллер должен сообщать о состоянии накопителя и уведомлять про ошибки (если такие имеются):

Для SAS диск используют следующий синтаксис:

В результате получим что то похожее на:

А вот команда для проверки следующего диска с интерфейсом SAS, названного /dev/sg2:

В /dev/sg1 заменяется номер диска. Например, если это RAID10 из 4-х дисков, то будет выглядеть так:

Проверить жесткий диск можно с помощью следующих команд:

Использование Adaptec Storage Manager

Другие простые команды для проверки базового состояния выглядят следующим образом:

Обратите внимание на то, что более новая версия arcconf расположена в архиве /usr/Adaptec_Event_Monitor. Таким образом, весь путь должен выглядеть так:

Вы можете самостоятельно проверить состояние массива Adaptec RAID на Linux с помощью ввода простой команды:

# /usr/Adaptec_Event_Monitor/arcconf getconfig 1

Или (более поздняя версия):

Примерный результат на фото:

Elements in grown defect list что это. Смотреть фото Elements in grown defect list что это. Смотреть картинку Elements in grown defect list что это. Картинка про Elements in grown defect list что это. Фото Elements in grown defect list что это

По традиции, немного рекламы в подвале, где она никому не помешает. Напоминаем, что в связи с тем, что общая емкость сети нидерландского дата-центра, в котором мы предоставляем услуги, достигла значения 5 Тбит / с (58 точек присутствия, включения в 36 точек обмена, более, чем в 20 странах и 4213 пиринговых включений), мы предлагаем выделенные серверы в аренду по невероятно низким ценам, только неделю!.

Источник

Проверить состояние SAS дисков на физическом сервере

Есть физический сервер, на нем установлены 2 SAS диска на 146 гб.
Самостоятельно нужно мониторить состояние дисков.
Решил использовать smartctl, но мне не совсем понятен вывод некоторой информации.
Проверкой здоровья вроде как показывает, что все норм:

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 28 C
Drive Trip Temperature: 65 C

Manufactured in week 21 of year 2008
Specified cycle count over device lifetime: 50000
Accumulated start-stop cycles: 32
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 3064 0 0 0 743273.006 0
write: 0 0 0 0 0 297758.540 0

Non-medium error count: 27

No self-tests have been logged

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 26 C
Drive Trip Temperature: 65 C

Manufactured in week 47 of year 2006
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 36
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 2861 0 0 0 106968.637 0
write: 0 1014 0 0 0 20376.950 0

Non-medium error count: 83

No self-tests have been logged

Пожалуйста, помогите расшифровать этот вывод. На что следует обращать внимание?
К примеру. За что отвечают:

Источник

Русские Блоги

linux тестирует плохие сектора жесткого диска

Инструмент проверки статуса жесткого диска: smartctl 、 Badblocks 、 hdparm

Я чувствую, что использование smartctl происходит очень быстро, и вы можете быстро увидеть, исправен ли жесткий диск. Команда выглядит следующим образом:

smartctl 5.42 2011-10-20 r3458[i686-linux-2.6.18-194.el5PAE] (local build)

Copyright (C) 2002-11 by Bruce Allen,http://smartmontools.sourceforge.net

User Capacity: 146,815,733,760 bytes [146 GB]

Logical block size: 512 bytes

Logical Unit id: 0x5000c50004fa837f

Serial number: 3QN0EL91

Transport protocol: SAS

Local Time is: Fri Oct 31 10:45:58 2014 CST

Device supports SMART and is Enabled

Temperature Warning Disabled or NotSupported

Состояние работоспособности SMART: OK # Версия недоступна. Здесь также отображается другое изображение.

Current Drive Temperature: 30 C

Drive Trip Temperature: 68 C

Elements in grown defect list: 0 # Это плохой способ, широко известный как плохой способ роста.

Vendor (Seagate) cache information

Blocks sent to initiator = 3752023409

Blocks received from initiator = 3916316860

Blocks read from cache and sent to initiator = 4025399956

Number of read and write commands whose size

Number of read and write commands whose size > segment size = 2746

Vendor (Seagate/Hitachi) factoryinformation

number of hours powered up = 34120.02

number of minutes until next internal SMART test = 1

Errors Corrected by Total Correction Gigabytes Total

ECC rereads/ errors algorithm processed uncorrected

fast | delayed rewrites corrected invocations [10^9 bytes] errors

read: 248894024 0 0 248894024 248894024 85241.186 0

write: 0 0 0 0 0 30998.996 0

verify: 340001 0 0 340001 340001 141.757 0

Non-medium errorcount: 51 # Не средняя ошибка. Это означает, что это не проблема с диском, а в целом проблемы с кабелем, передачей и проверкой, которые можно игнорировать.

No self-tests have been logged

Long (extended) Self Test duration: 1740seconds [29.0 minutes]

Вы можете использовать команду для непосредственного просмотра качества жесткого диска:

smartctl 5.42 2011-10-20 r3458[i686-linux-2.6.18-194.el5PAE] (local build)

Copyright (C) 2002-11 by Bruce Allen,http://smartmontools.sourceforge.net

SMART Health Status: OK

smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.el6.x86_64] (local build)

Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===

SMART STATUS RETURN: incomplete response, ATA output registers missing

SMART overall-health self-assessment test result: PASSED

Warning: This result is based on an Attribute check.

Это нормально, что и OK, и PASSED принадлежат диску.

Badblocks Инструментальный тест проходит нормально и информации о битых секторах нет:

Команда badblocks может проверить поврежденные блоки на дисковом устройстве. При выполнении этой команды вы должны указать дисковое устройство, которое нужно проверить, и количество дисковых блоков для этого устройства.

Обратите внимание, что смонтированный жесткий диск не может быть обнаружен записью

Checking blocks 0 to 143374740

Checking for bad blocks (read-only test):done

Passcompleted, 0 bad blocks found.

Этот диск прошел проверку и не имеет сбойных секторов (сбойных блоков). Вы можете использовать его с уверенностью.

Независимо от типа сбойных секторов рекомендуется сначала выполнить резервное копирование данных! Создайте резервную копию важных данных и попытайтесь их восстановить. Если у вас есть важные данные, но вы не можете их прочитать (диск неисправен), немедленно прекратите использование диска и обратитесь к специалисту для его ремонта.

Используйте тест hdparm

Проверить скорость чтения и записи жесткого диска

Timing cached reads:

1918 MB in 2.00 seconds = 959.62 MB/sec

Timing buffered disk reads: 184 MB in 3.00 seconds = 61.26 MB/sec

hdparm может обнаруживать, отображать и устанавливать параметры жестких дисков IDE или SCSI.

hdparm [-CfghiIqtTvyYZ] [- a ] [- A ] [- c ] [- d ] [- k ] [- K ] [- m ] [- n ] [- p ] [- P ] [- r ] [- S ] [- u ] [- W ] [- X ] [устройство]

ссылка для скачивания: http://sg.danny.cz/sg/sg3_utils.html

VPD:Vital Product Data

Elements in grown defect list что это. Смотреть фото Elements in grown defect list что это. Смотреть картинку Elements in grown defect list что это. Картинка про Elements in grown defect list что это. Фото Elements in grown defect list что это

Относительно дополнения к командам жесткого диска интеллектуального обнаружения:

smartctl 5.40 2010-10-16 r3189 [i386-redhat-linux-gnu] (local build)

=== START OF INFORMATION SECTION ===

Device Model: HITACHI HTS543225L9SA00

Serial Number: 090131FB2F32YLG28JEA

Firmware Version: FBEZC48C

User Capacity: 250,059,350,016 bytes

ATA Standard is: ATA-8-ACS revision 3f

Local Time is: Wed May 25 10:10:39 2011 CST

Поддержка SMART: Включено Включено Указывает, что интеллектуальная поддержка включена

Если вы видите, что поддержка SMART: отключена, это означает, что SMART не включен, выполните следующую команду, чтобы запустить SMART.

smartctl 5.40 2010-10-16 r3189 [i386-redhat-linux-gnu] (local build)

=== START OF ENABLE/DISABLE COMMANDS SECTION ===

SMART Attribute Autosave Enabled.

SMART Automatic Offline Testing Enabled every four hours.

Теперь, когда функция SMART жесткого диска была включена, выполните следующую команду, чтобы просмотреть состояние жесткого диска.

smartctl 5.40 2010-10-16 r3189 [i386-redhat-linux-gnu] (local build)

=== START OF READ SMART DATA SECTION ===

SMART overall-health self-assessment test result: PASSED

Если регулярный вход на сервер для запуска smartctl затруднен, Linux также предоставляет системный процесс smartd, отредактируйте файл конфигурации: 1 vi /etc/smartd.conf

Большая часть этого файла конфигурации может быть закомментирована, вам нужно только записать конфигурацию, относящуюся к текущему жесткому диску:

-s (O /../.././ (00 | 06 | 12 | 18) | S /../.././ 01 | L /../../ 6/03) // в Выполняйте автономную самопроверку в 00:00, 06:00, 12:00 и 18:00 каждый день, а также выполняйте самопроверку в коротком формате с 01: 00-02: 00 каждый день и в 03: 6 каждую неделю: 00-04: 00 Выполнить самопроверку длинного формата

Источник

Как проверить состояние SAS дисков на физическом сервере?

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 28 C
Drive Trip Temperature: 65 C

Manufactured in week 21 of year 2008
Specified cycle count over device lifetime: 50000
Accumulated start-stop cycles: 32
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 3064 0 0 0 743273.006 0
write: 0 0 0 0 0 297758.540 0

Non-medium error count: 27

No self-tests have been logged

=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK

Current Drive Temperature: 26 C
Drive Trip Temperature: 65 C

Manufactured in week 47 of year 2006
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 36
Elements in grown defect list: 0

Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 0 2861 0 0 0 106968.637 0
write: 0 1014 0 0 0 20376.950 0

Non-medium error count: 83

No self-tests have been logged

Пожалуйста, помогите расшифровать этот вывод. На что следует обращать внимание?
К примеру. За что отвечают:
Specified cycle count over device lifetime: 50000
Specified cycle count over device lifetime: 10000
Non-medium error count: 27
Non-medium error count: 83

При каких значениях вывода лучше проводить замену?
И почему не отображается сам SMART?

Источник

Linux, Unix

Работа с RAID, SMART на контроллере LSI MegaSAS во FreeBSD

Один из вариантов починки развалившегося RAID. А так же вариант просмотра SMART дисков подключенных к аппартному RAID контроллеру. Конечно же во FreeBSD.

Посмотрим состояние RAID-массива:

Из строя вышел диск 6.

Загрузим драйвер для доступа к статистике SMART дисков, подключенных через RAID-контроллер:

В файловой системе устройств /dev появятся устройства pass, соответствующие дискам, подключенным к RAID-контроллеру.

Грубо говоря, если в выводе команд есть указанные ниже строки, значит с диском всё в порядке. В противном случае его стоит поменять.

Elements in grown defect list: 0
Если обнаружен неисправный диск, то его можно отключить:

Если это SATA— или SAS-диск в серверном шасси с собственным индикатором активности, то можно заменить жёсткий диск без выключения сервера. По низкой интенсивности мерцания светодиода (или по полному отсутствию мерцания) отключенного диска можно определить, какой именно диск нужно заменить.

Если судя по SMART диск оказался исправным, или диск уже заменён, то можно пометить его как исправный и добавить его в массив:

За процессом синхронизации данных можно наблюдать при помощи следующей команды:

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *