Считывание S.m.a.r.t. под Raid

Dima_AC · 17 Май 2009

Хто-нить знает, как считать S.M.A.R.T. oтдельных фестплат из под RAID1 и RAID5?

ter · 17 Май 2009

если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART

ter

Dima_AC · 17 Май 2009

Цитата

Со слов пользователя ter
если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART

ter

Да это понятно, но все же.. хотелось бы запустить диспетчера,
который сообщает о критических параметрах S.M.A.R.T. на
E-Mail. Когда RAID выбросит, уже будет поздновато. Серверов много в разных местах. Надо заблаговременно реагировать.

ter · 21 Май 2009

man smartctl

Under Linux and FreeBSD, to look at ATA disks behind 3ware SCSI RAID controllers, use syntax such as:
smartctl -a -d 3ware,2 /dev/sda
smartctl -a -d 3ware,0 /dev/twe0
smartctl -a -d 3ware,1 /dev/twa0

ter

пока · 23 Май 2009

Дима а разве запасной винт не ставишь?
Который в случае чего берёт на себя.

Ну и менять каждые 2-3 года все винты, в зависимости от того что за модели и сколько работают (365*24).

Хотя по вопросу не знаю ответа, тут конечно нужно знать обьёмы.
Если серверов десяток, то это одно, если пару сотен то это другое.

Дима по моему у "нормальных" котролеров есть функция высылать инфу по SNMP

Древняя Кровь · 23 Май 2009

Цитата

Со слов пользователя ter
если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART
ter

на смарт нужно периодически глазами смотреть

не все контроллеры/проги-монитры анализируют отдельные атрибуты, большинство опираются на короткое резюме смарта - "Я ОК" или "МНЕ ПЛОХО"

а смарт например всегда говорит ОК при наличии реллокейтов.
Сыпется платка по-тихоньку, процедура ремаппинга отрабатывает как ей положено, смарт поведением винта вполне доволен, raid контроллер вообще ни сном ни духом. Пока сыпанье не приймет лавинообразную форму и винт не сдохнет. Тогда уже поздно алармировать, винт нужно было еще при первых признаках менять.

Dima_AC · 24 Май 2009

Цитата

Со слов пользователя tomsk45
Дима а разве запасной винт не ставишь?
Который в случае чего берёт на себя.

Ну и менять каждые 2-3 года все винты, в зависимости от того что за модели и сколько работают (365*24).

Хотя по вопросу не знаю ответа, тут конечно нужно знать обьёмы.
Если серверов десяток, то это одно, если пару сотен то это другое.

Дима по моему у "нормальных" котролеров есть функция высылать инфу по SNMP

Показать весь код

Речь идет о ряде серверов для школ, гимназий итд. Моментальное реагирование не обязательно.
Тогда, когда конфигурировал, эти сервера планировались, как
низкобюджетные и был вставлен, соответственно, дешевый RAID-Controller. Потом колличество этих серверов постепенно возрасло до довольно крупных размеров и мне эта ситуация постепенно действует на нервы.
Собираюсь заменять все контроллеры на LSI.
Для Industriekunden стаюсь брать двухпрозессорные HP с RAID 5 (HP Proliant DL380R5) и одной резервной платой + 5 Jahre vor Ort Service Mit 4 Stunden Reaktionszeit.

пока · 25 Май 2009

Дима, под виндой есть спрятанный файлик (на каждой партишен) $badclus где винда прописывает "нехорошие", может хватит тебе batchом его считывать и отправлять на мыло? и выполнять раз в недели, хоть бы и через geplante task.

вполне возможно что тебе величины этого файлика как оценка винта хватит.

пысы понятно что Smart работает на другом уровне.
как идея.

забыл написать, скан сначала, результат (автоматом) в $badclus и информацию о нём оправлять.

Dima_AC · 25 Май 2009

Кажется $badclus прописывается только после выполнения комманды CHKDSK.
Или ты думаешь, что это происходит автоматически?

пока · 25 Май 2009

я добавил.

ну и в batch его, CHKDSK, и высылать размер $badclus по отношению к партишен размеру, уже принимать меры.

Dima_AC · 25 Май 2009

CHKDSK можно в моем случае выполнить только при перестартовке
сервера. C: системный диск, а на D: кроме файлов пользователей находятся еще и все виртуальные сервера.
Понятно, можно прописать batch, который раз в неделю сначала выключает все виртуальные сервера, потом запускает, к примеру chkdsk /f /r , перестартовывает сервер, считывает $badclus и посылает на E-Mail. Но частое перестартовывание тоже не очень хорошо. Хотелось бы придумать более элегантное решение без
перестартовки.

пока · 25 Май 2009

хм

I+L+Y+A · 25 Май 2009

Пошарился по инету. Нашел вот Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.
Конечно старовато, но мож тебя на мысль какую наведет :O

пока · 25 Май 2009

Дима,
глянь
Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.
на закладке есть конфигуратор на мыло
datei optionen warnungen
или это
Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.

Serega_Aachen · 22 Июн 2009

Кстати да, тоже появилась такая проблема,
Нужно считывать статус S.M.A.R.T. и количество свободных блоков и мылить всё это дело на мыло.

ЗЫ. Дима ты же вроде Selbststдndig был, а написал про школы, у нас же вроже как все школы Regio-IT админит.

Dima_AC · 22 Июн 2009

Цитата

Со слов пользователя Serega_Aachen
Кстати да, тоже появилась такая проблема,
Нужно считывать статус S.M.A.R.T. и количество свободных блоков и мылить всё это дело на мыло.

ЗЫ. Дима ты же вроде Selbststдndig был, а написал про школы, у нас же вроже как все школы Regio-IT админит.

Я работаю через удаленный доступ.
Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.

Если RAID на железном уровне не поддерживает S.M.A.R.T. , то
никакая программа это считать не сможет. Сейчас надо будeт
заменять RAID-контроллеры на 30-35 серверах. Выбрал LSI. Никто не заставляет, просто так спокoйнее. (За свой счет, между прочим...Учусь признавать свои ошибки ;()

Serega_Aachen · 22 Июн 2009

Туда куда надо воткнуть РАИД стоит софтовый, где планируется сделать там вроде уже железный контроллер стоит, но сервак не я админю поэтому точно не знаю.

ЗЫ. Неплохо у тебя клиенты раскиданы, а если железо менять или что то что удаленно не сделаеш то как? выезжаеш? Один админиш?

Dima_AC · 22 Июн 2009

Цитата

Со слов пользователя Serega_Aachen
а если железо менять или что то что удаленно не сделаеш то как? выезжаеш? Один админиш?

Выезжаю.
Вдвоем. Если большой проект, то беру ещe еxterne Mitarbeiter.

Поделиться