Хто-нить знает, как считать S.M.A.R.T. oтдельных фестплат из под RAID1 и RAID5?
Считывание S.m.a.r.t. под Raid
- Dima_AC
- Вопрос темы решён
-
-
если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART
ter
-
Цитата
Со слов пользователя ter
если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMARTter
Да это понятно, но все же.. хотелось бы запустить диспетчера,
который сообщает о критических параметрах S.M.A.R.T. на
E-Mail. Когда RAID выбросит, уже будет поздновато. Серверов много в разных местах. Надо заблаговременно реагировать. -
man smartctl
Under Linux and FreeBSD, to look at ATA disks behind 3ware SCSI RAID controllers, use syntax such as:
smartctl -a -d 3ware,2 /dev/sda
smartctl -a -d 3ware,0 /dev/twe0
smartctl -a -d 3ware,1 /dev/twa0ter
-
Дима а разве запасной винт не ставишь?
Который в случае чего берёт на себя.Ну и менять каждые 2-3 года все винты, в зависимости от того что за модели и сколько работают (365*24).
Хотя по вопросу не знаю ответа, тут конечно нужно знать обьёмы.
Если серверов десяток, то это одно, если пару сотен то это другое.Дима по моему у "нормальных" котролеров есть функция высылать инфу по SNMP
-
Цитата
Со слов пользователя ter
если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART
terна смарт нужно периодически глазами смотреть
не все контроллеры/проги-монитры анализируют отдельные атрибуты, большинство опираются на короткое резюме смарта - "Я ОК" или "МНЕ ПЛОХО"
а смарт например всегда говорит ОК при наличии реллокейтов.
Сыпется платка по-тихоньку, процедура ремаппинга отрабатывает как ей положено, смарт поведением винта вполне доволен, raid контроллер вообще ни сном ни духом. Пока сыпанье не приймет лавинообразную форму и винт не сдохнет. Тогда уже поздно алармировать, винт нужно было еще при первых признаках менять. -
Цитата
Со слов пользователя tomsk45
Дима а разве запасной винт не ставишь?
Который в случае чего берёт на себя.Ну и менять каждые 2-3 года все винты, в зависимости от того что за модели и сколько работают (365*24).
Хотя по вопросу не знаю ответа, тут конечно нужно знать обьёмы.
Если серверов десяток, то это одно, если пару сотен то это другое.Дима по моему у "нормальных" котролеров есть функция высылать инфу по SNMP
Речь идет о ряде серверов для школ, гимназий итд. Моментальное реагирование не обязательно.
Тогда, когда конфигурировал, эти сервера планировались, как
низкобюджетные и был вставлен, соответственно, дешевый RAID-Controller. Потом колличество этих серверов постепенно возрасло до довольно крупных размеров и мне эта ситуация постепенно действует на нервы.
Собираюсь заменять все контроллеры на LSI.
Для Industriekunden стаюсь брать двухпрозессорные HP с RAID 5 (HP Proliant DL380R5) и одной резервной платой + 5 Jahre vor Ort Service Mit 4 Stunden Reaktionszeit. -
Дима, под виндой есть спрятанный файлик (на каждой партишен) $badclus где винда прописывает "нехорошие", может хватит тебе batchом его считывать и отправлять на мыло? и выполнять раз в недели, хоть бы и через geplante task.
вполне возможно что тебе величины этого файлика как оценка винта хватит.
пысы понятно что Smart работает на другом уровне.
как идея.забыл написать, скан сначала, результат (автоматом) в $badclus и информацию о нём оправлять.
-
Кажется $badclus прописывается только после выполнения комманды CHKDSK.
Или ты думаешь, что это происходит автоматически? -
я добавил.
ну и в batch его, CHKDSK, и высылать размер $badclus по отношению к партишен размеру, уже принимать меры.
-
CHKDSK можно в моем случае выполнить только при перестартовке
сервера. C: системный диск, а на D: кроме файлов пользователей находятся еще и все виртуальные сервера.
Понятно, можно прописать batch, который раз в неделю сначала выключает все виртуальные сервера, потом запускает, к примеру chkdsk /f /r , перестартовывает сервер, считывает $badclus и посылает на E-Mail. Но частое перестартовывание тоже не очень хорошо. Хотелось бы придумать более элегантное решение без
перестартовки. -
хм
-
Пошарился по инету. Нашел вот Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.
Конечно старовато, но мож тебя на мысль какую наведет :O -
Дима,
глянь
Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.
на закладке есть конфигуратор на мыло
datei optionen warnungen
или это
Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу. -
Кстати да, тоже появилась такая проблема,
Нужно считывать статус S.M.A.R.T. и количество свободных блоков и мылить всё это дело на мыло.ЗЫ. Дима ты же вроде Selbststдndig был, а написал про школы, у нас же вроже как все школы Regio-IT админит.
-
Цитата
Со слов пользователя Serega_Aachen
Кстати да, тоже появилась такая проблема,
Нужно считывать статус S.M.A.R.T. и количество свободных блоков и мылить всё это дело на мыло.ЗЫ. Дима ты же вроде Selbststдndig был, а написал про школы, у нас же вроже как все школы Regio-IT админит.
Я работаю через удаленный доступ.
Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.Если RAID на железном уровне не поддерживает S.M.A.R.T. , то
никакая программа это считать не сможет. Сейчас надо будeт
заменять RAID-контроллеры на 30-35 серверах. Выбрал LSI. Никто не заставляет, просто так спокoйнее. (За свой счет, между прочим...Учусь признавать свои ошибки ;() -
Туда куда надо воткнуть РАИД стоит софтовый, где планируется сделать там вроде уже железный контроллер стоит, но сервак не я админю поэтому точно не знаю.
ЗЫ. Неплохо у тебя клиенты раскиданы, а если железо менять или что то что удаленно не сделаеш то как? выезжаеш? Один админиш?
-
Цитата
Со слов пользователя Serega_Aachen
а если железо менять или что то что удаленно не сделаеш то как? выезжаеш? Один админиш?
Выезжаю.
Вдвоем. Если большой проект, то беру ещe еxterne Mitarbeiter.