Считывание S.m.a.r.t. под Raid

  • если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART


    ter

  • Цитата

    Со слов пользователя ter
    если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART


    ter


    Да это понятно, но все же.. хотелось бы запустить диспетчера,
    который сообщает о критических параметрах S.M.A.R.T. на
    E-Mail. Когда RAID выбросит, уже будет поздновато. Серверов много в разных местах. Надо заблаговременно реагировать.

  • man smartctl



    Under Linux and FreeBSD, to look at ATA disks behind 3ware SCSI RAID controllers, use syntax such as:
    smartctl -a -d 3ware,2 /dev/sda
    smartctl -a -d 3ware,0 /dev/twe0
    smartctl -a -d 3ware,1 /dev/twa0



    ter

  • Дима а разве запасной винт не ставишь?
    Который в случае чего берёт на себя.


    Ну и менять каждые 2-3 года все винты, в зависимости от того что за модели и сколько работают (365*24).


    Хотя по вопросу не знаю ответа, тут конечно нужно знать обьёмы.
    Если серверов десяток, то это одно, если пару сотен то это другое.


    Дима по моему у "нормальных" котролеров есть функция высылать инфу по SNMP

  • Цитата

    Со слов пользователя ter
    если контроллер нормально с ней работает и не выбрасывает из raid, то ничего ненадо считывать. Если выбрасывает, можно подключить диск напрямую без контроллера и прочитать SMART
    ter


    на смарт нужно периодически глазами смотреть


    не все контроллеры/проги-монитры анализируют отдельные атрибуты, большинство опираются на короткое резюме смарта - "Я ОК" или "МНЕ ПЛОХО"


    а смарт например всегда говорит ОК при наличии реллокейтов.
    Сыпется платка по-тихоньку, процедура ремаппинга отрабатывает как ей положено, смарт поведением винта вполне доволен, raid контроллер вообще ни сном ни духом. Пока сыпанье не приймет лавинообразную форму и винт не сдохнет. Тогда уже поздно алармировать, винт нужно было еще при первых признаках менять.


  • Речь идет о ряде серверов для школ, гимназий итд. Моментальное реагирование не обязательно.
    Тогда, когда конфигурировал, эти сервера планировались, как
    низкобюджетные и был вставлен, соответственно, дешевый RAID-Controller. Потом колличество этих серверов постепенно возрасло до довольно крупных размеров и мне эта ситуация постепенно действует на нервы.
    Собираюсь заменять все контроллеры на LSI.
    Для Industriekunden стаюсь брать двухпрозессорные HP с RAID 5 (HP Proliant DL380R5) и одной резервной платой + 5 Jahre vor Ort Service Mit 4 Stunden Reaktionszeit.

    Сообщение было отредактировано 1 раз, последнее редактирование пользователем Dima_AC ().

  • Дима, под виндой есть спрятанный файлик (на каждой партишен) $badclus где винда прописывает "нехорошие", может хватит тебе batchом его считывать и отправлять на мыло? и выполнять раз в недели, хоть бы и через geplante task.


    вполне возможно что тебе величины этого файлика как оценка винта хватит.


    пысы понятно что Smart работает на другом уровне.
    как идея.


    забыл написать, скан сначала, результат (автоматом) в $badclus и информацию о нём оправлять.

    Сообщение было отредактировано 1 раз, последнее редактирование пользователем tomsk45 ().

  • Кажется $badclus прописывается только после выполнения комманды CHKDSK.
    Или ты думаешь, что это происходит автоматически?

  • я добавил.


    ну и в batch его, CHKDSK, и высылать размер $badclus по отношению к партишен размеру, уже принимать меры.

  • CHKDSK можно в моем случае выполнить только при перестартовке
    сервера. C: системный диск, а на D: кроме файлов пользователей находятся еще и все виртуальные сервера.
    Понятно, можно прописать batch, который раз в неделю сначала выключает все виртуальные сервера, потом запускает, к примеру chkdsk /f /r , перестартовывает сервер, считывает $badclus и посылает на E-Mail. Но частое перестартовывание тоже не очень хорошо. Хотелось бы придумать более элегантное решение без
    перестартовки.

    Сообщение было отредактировано 1 раз, последнее редактирование пользователем Dima_AC ().

  • Пошарился по инету. Нашел вот Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.
    Конечно старовато, но мож тебя на мысль какую наведет :O

  • Дима,
    глянь
    Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.
    на закладке есть конфигуратор на мыло
    datei optionen warnungen
    или это
    Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.

    Сообщение было отредактировано 1 раз, последнее редактирование пользователем tomsk45 ().

  • Кстати да, тоже появилась такая проблема,
    Нужно считывать статус S.M.A.R.T. и количество свободных блоков и мылить всё это дело на мыло.


    ЗЫ. Дима ты же вроде Selbststдndig был, а написал про школы, у нас же вроже как все школы Regio-IT админит.

  • Цитата

    Со слов пользователя Serega_Aachen
    Кстати да, тоже появилась такая проблема,
    Нужно считывать статус S.M.A.R.T. и количество свободных блоков и мылить всё это дело на мыло.


    ЗЫ. Дима ты же вроде Selbststдndig был, а написал про школы, у нас же вроже как все школы Regio-IT админит.


    Я работаю через удаленный доступ.
    Пожалуйста зарегистрируйся для просмотра данной ссылки на страницу.


    Если RAID на железном уровне не поддерживает S.M.A.R.T. , то
    никакая программа это считать не сможет. Сейчас надо будeт
    заменять RAID-контроллеры на 30-35 серверах. Выбрал LSI. Никто не заставляет, просто так спокoйнее. (За свой счет, между прочим...Учусь признавать свои ошибки ;()

    Сообщение было отредактировано 3 раз, последнее редактирование пользователем Dima_AC ().

  • Туда куда надо воткнуть РАИД стоит софтовый, где планируется сделать там вроде уже железный контроллер стоит, но сервак не я админю поэтому точно не знаю.


    ЗЫ. Неплохо у тебя клиенты раскиданы, а если железо менять или что то что удаленно не сделаеш то как? выезжаеш? Один админиш?

  • Цитата

    Со слов пользователя Serega_Aachen
    а если железо менять или что то что удаленно не сделаеш то как? выезжаеш? Один админиш?


    Выезжаю.
    Вдвоем. Если большой проект, то беру ещe еxterne Mitarbeiter.