Счетчики
Счетчики собираются по серверам и сервисам.
Успешные счетчики: Для каждого процесса сервиса / системы (собираются процессом хоста-службы):
запущен (раз);
остановлен (раз);
перезапущен (раз).
Для каждого процесса сервиса / системы (собираются самими сервисами):
ОЗУ (МБ);
ЦП мин (%);
ЦП макс (%);
диск (МБ).
Системы (процессы адаптеров):
пришло из системы (сообщений);
ушло в систему (сообщений);
отправлено в узел (сообщений);
получено из узла (сообщений);
[web-only] Отправлено без ожидания (сообщений);
[web-only] Отправлено с ожиданием (сообщений).
Узел:
получено в определение функции (сообщений);
обработано успешно в определении функции (сообщений);
Загруженность очереди процессов (%).
Процесс:
поставлено в очередь (сообщений);
завершено успешно (процессов);
завершено с ошибкой (процессов);
ушло в ожидание (процессов);
возобновлено (процессов);
общее время исполнения (мс);
общее время сна (мс);
время ожидания запуска (мс).
Машина:
использование ЦП (%);
использование RAM (МБ);
свободно RAM (МБ);
свободно на диске (ГБ);
использование диска (ГБ);
очередь к диску.
Настройки кластера:
"counterSettings": {
"$type": "DT.ClusterConfiguration.CounterSettings, DT_Core",
"nodeStoreTime": 10000,
"modulePollInterval": 1,
}
Новый файл создается раз в сутки (в момент первого сохранения в сутки по времени UTC):
nodeStoreTime: срок хранения данных на диске узлом, в минутах.
modulePollInterval: частота отправки счетчиков с сервисов на узел.
После каждой отправки счетчики обнуляются и начинают считаться заново.
Описание всех счетчиков
Контроллер PlatformInfo
/info/counters
Пример ответа:
[
{
"$type": "DT.Diagnostics.Counters.CounterInfo, DT_Core",
"id": "11111111-0000-4766-b2a8-41121b95c5ee",
"name": "CPUMin",
"description": "Минимальное использование ЦП, %",
"measure": "%",
"type": "ModuleCounter"
}
]
Счетчики уровня ModuleCounter
Имя |
Описание |
Ед.изменения |
|---|---|---|
CPUMin |
Минимальное использование ЦП |
% |
CPUMax |
Максимальное использование ЦП |
% |
WorkingSet |
Использование памяти (working set) |
МБ |
Диск |
Использование диска |
МБ |
CообщенияПолученоОтУзла |
Получено сообщений модулем от узла |
сообщение |
CообщенияОтправленоУзлу |
Отправлено сообщений модулем узлу |
сообщение |
CообщенияПолученоОтСистемы |
Получено сообщений от системы |
сообщение |
CообщенияОтправленоВСистему |
Отправлено сообщений в систему |
сообщение |
CообщенияПолученоОтветныхСообщений |
Получено ответных сообщений от системы |
сообщение |
CообщенияОтправленоБезОжидания |
Отправлено сообщений в систему без ожидания ответа |
сообщение |
CообщенияОтправленоСОжиданием |
Отправлено сообщений в систему с ожиданием ответа |
сообщение |
ПроцессыУшлоВОжидание |
Процессов ушло в ожидание |
процесс |
ПроцессыЗавершеноУспешно |
Процессов завершено успешно |
процесс |
ПроцессыЗавершеноСОшибкой |
Процессов завершено с ошибкой |
процесс |
ПроцессыВозобновлено |
Процессов возобновлено |
процесс |
ПроцессыПоставленоВОчередь |
Процессов поставлено в очередь за период |
процесс |
ПроцессыОжиданиеСтарта |
Ожидающие старта процессы в реальном времени |
процесс |
ПроцессыВОбработке |
Выполняемые процессы в реальном времени |
процесс |
CообщенияЗапущеноОпределениеФункции |
Запущено определение функции |
сообщение |
CообщенияВыполненоУспешноОпределениеФункции |
Успешно определена функция |
сообщение |
ЗагруженностьОчередиПроцессов |
Отношение текущей длины очереди для модуля процессов к максимально настроенной |
% |
МодульЗапущен |
Количество запусков |
раз |
МодульОстановлен |
Количество остановок |
раз |
МодульПерезапущен |
Количество перезапусков |
раз |
ВремяИсполнения |
Время исполнения процесса, включая время сна |
мс |
ВремяОжидания |
Время сна |
мс |
ВремяОжиданияСтарта |
Время ожидания от поступления запроса на обработку до начала исполнения процесса |
мс |
Счетчики уровня NodeCounter
Имя |
Описание |
Ед. изменения |
|---|---|---|
CPUОбщая |
Загрузка ЦП всего |
% |
RAMОбщая |
Использование памяти всего |
МБ |
RAMСвободно |
Свободно памяти |
МБ |
ДискСвободно |
Свободно памяти на используемом логическом диске |
Гб |
ДискЗанято |
Занято памяти на используемом логическом диске |
Гб |
ДискОчередь |
Запросов к диску, ожидающих обработки |
запрос |
ВОжидании |
Процессов в ожидании возобновления |
процесс |
ВозобновленныеУспешно |
Возобновленные успешно процессы |
процесс |
ВозобновленныеПоТаймауту |
Возобновленные по таймауту процессы |
процесс |
Логирование данных счетчиков
Для сбора логов счетчиков необходимо задать настройки в кластере, изменения вступят после перезапуска платформы.
[
"counterAlwaysOn": false
"counterDiagnosticData": [
{
"$type": "DT.MdmCommon.CounterDiagnosticData, DT_Config",
"counterId": "00000000-0001-4766-b2a8-41121b95c5ee",
"logLevel": "Debug"
},
{
"$type": "DT.MdmCommon.CounterDiagnosticData, DT_Config",
"counterId": "00000000-0002-4766-b2a8-41121b95c5ee",
"logLevel": "Debug"
},
{
"$type": "DT.MdmCommon.CounterDiagnosticData, DT_Config",
"counterId": "00000000-0003-4766-b2a8-41121b95c5ee",
"logLevel": "Debug"
},
{
"$type": "DT.MdmCommon.CounterDiagnosticData, DT_Config",
"counterId": "00000000-0004-4766-b2a8-41121b95c5ee",
"logLevel": "Debug"
},
{
"$type": "DT.MdmCommon.CounterDiagnosticData, DT_Config",
"counterId": "00000000-0005-4766-b2a8-41121b95c5ee",
"logLevel": "Debug"
},
{
"$type": "DT.MdmCommon.CounterDiagnosticData, DT_Config",
"counterId": "00000000-0006-4766-b2a8-41121b95c5ee",
"logLevel": "Debug"
}
]
События регистрируются в журнале сервера:
В случае отсутствия запросов на сбор данных счетчиков более 10 мин. предусмотрена автоматическая остановка сбора. По истечении времени в логах отобразится сообщение: «Отправка данных счетчиков приостановлена по причине отсутствия запросов за последние 00:10:00 мин.»
Данный лог отображается в журнале сервера на уровне Debug или при условии, что в ЦМ для сервера или в ЦН для кластера включен дополнительный раздел журнала Counter