Мониторинг работоспособности СЭД

Для отслеживания работоспособности отдельных узлов СЭД было разработано задание таймера SharePoint - HealthMonitoring. Задание выполняется каждые 15 минут и призвано оперативно оповещать администраторов СЭД по электронной почте о возникновении нештатных ситуаций, требующих их внимания. Задание разбито на модули, которые производят наблюдение за определенными параметрами системы. Каждый модуль может быть отключен независимо от остальных, а также может иметь дополнительные настройки в таблице [FlowPoint_Settings].[dbo].[CustomSettings]. Ниже перечислены существующие на данный момент модули:

  1. SpTimerModule - отслеживает состояние таймера SharePoint.

    Настройки:

    • HealthMonitoring.SpTimerModule.Enabled
      флаг, указывающий на то, что модуль включен.
    • HealthMonitoring.SpTimerModule.WorkItemActualTime.Minutes
      время, отведенное на обработку задач таймера SharePoint. По умолчанию - 120.
  2. UserModule - отслеживает состояние учетных записей пользователей СЭД.

    Настройки:

    • HealthMonitoring.UserModule.Enabled
      флаг, указывающий на то, что модуль включен.
  3. WorkflowInstanceModule - отслеживает состояние рабочих процессов.

    Настройки:

    • HealthMonitoring.WorkflowInstanceModule.Enabled
      флаг, указывающий на то, что модуль включен.
    • HealthMonitoring.WorkflowInstanceModule.NotStartedActualTime.Days
      период, по истечении которого все не запущенные процессы будут отменены. По умолчанию - 30.
    • HealthMonitoring.WorkflowInstanceModule.StartingActualTime.Minutes
      время, отведенное на старт процесса службой запуска (FlowPoint.WorkflowService). По умолчанию - 10.
  4. TaskModule - отслеживает состояние задач.

    Настройки:

    • HealthMonitoring.TaskModule.Enabled
      флаг, указывающий на то, что модуль включен.
    • HealthMonitoring.TaskModule.FinishActualTime.Minutes
      время, в течение которого ожидается реакция процесса на завершение задачи. По умолчанию - 10.

При обнаружении нештатной ситуации формируется сообщение с соответствующим заголовком и телом, которое содержит информацию, исходя из которой администратор может проанализировать возникший инцидент и принять меры для его оперативного устранения. По возможности, необходимые действия выполняются модулями автоматически, что также отражено в сообщении.