MON Hjelp om definisjoner av tjenester

Dette er andre og siste trinn for MON-konfigurasjon.

Standardverdier vises for obligatoriske tjenester . Se respektive hjelpeemne nedenfor for mer hjelp om tjenestedefinisjonene.

For "mail.alert" , må du forsikre deg om at sendmail er konfigurert og "sendmail" deamon startes på hostmachine.

Tjenestedefinisjoner

tjenesten tjeneste
En tjeneste definisjon begynner med de søkeord tjeneste etterfulgt av et ord som er koden for denne tjenesten.

Komponentene i en tjeneste er en definisjon av intervall, skjerm og en eller flere tidsperioder, som definert nedenfor.

Hvis et tjenestenavn "standard" er definert i en klokkegruppe kalt "dafault" (se over), vil standard / standarddefinisjonen brukes til å håndtere ukjente mon-feller.

intervall tidsperiode
Søkeordintervallet etterfulgt av en tidsverdi spesifiserer frekvensen for at et monitorskript vil bli utløst. Tidsverdier er definert som "30s", "5m", "1h", eller "1d", som betyr 30 sekunder, 5 minutter, 1 time eller 1 dag. Det numeriske partiet kan være en brøkdel, for eksempel "1,5 time" eller halvannen time. Dette formatet av en tidsspesifikasjon vil bli referert til som tidsavbrudd .

traptimeout tid
Dette nøkkelordet tar samme spesifikasjonsargument som intervall , og får tjenesten til å forvente en felle fra en ekstern kilde i det minste som ofte, ellers vil en feil bli registrert. Dette brukes til en hjerteslagstjeneste.

trapduration timeval
Hvis en felle mottas, vil statusen til tjenesten som fellen ble levert til normalt forbli konstant. Hvis trapduration er spesifisert, vil statusen til tjenesten forbli i en feiltilstand i den varigheten som er angitt av tidsperioden , og deretter vil den bli tilbakestilt til "suksess".

randskew tideval
I stedet for å planlegge monitoren skriptet til å kjøre ved begynnelsen av hvert intervall, tilfeldig justere intervallet angitt av intervallparameteren med pluss-eller-minus randskew. Skew verdien er angitt som intervall parameter: "30s", "5m", osv ... For eksempel hvis intervallet er 1m og randskew er "5S", så man vil planlegge skjermen manuset litt tid mellom hver 55 sekunder og 65 sekunder. Hensikten er å hjelpe til med å fordele belastningen på serveren når mange tjenester er planlagt med samme intervaller.

monitor monitor-name [arg ...]
Nøkkelordet skjerm etterfulgt av et skriptnavn og argumenter Angir skjer å kjøre når timeren utløper. Skjelllignende siteringskonvensjoner følges når du spesifiserer argumentene som skal sendes til monitorskriptet. Skriptet blir påkalt fra katalogen gitt med -s- argumentet, og alle følgende ord blir levert som argumenter til monitorprogrammet, etterfulgt av listen over verter i gruppen som det er referert til av den nåværende klokkegruppen. Hvis monitorlinjen slutter med ";;" som et eget ord, legges vertsgruppene ikke til i argumentlisten når programmet påberopes.

allow_empty_group
Alternativet allow_empty_group vil tillate en skjerm å bli påkalt selv når vertsgruppen for den klokken er tom på grunn av deaktiverte verter. Standard oppførsel er ikke å påkalle skjermen når alle verter i en vertsgruppe er deaktivert.

beskrivelse beskrivelsetext
Teksten som følger beskrivelse blir forespurt av klientprogrammer, overført til varsler og skjermer via en miljøvariabel. Den skal inneholde en kort beskrivelse av tjenesten, egnet for inkludering i en e-post eller på en webside.

ekskluder_hosts host [host ...]
Eventuelle verter som er oppført etter exclude_hosts vil bli ekskludert fra servicesjekk.

exclude_period periodspec
Ikke kjør en planlagt skjerm i løpet av tiden identifisert av periodspec .

er avhengig av avtrykk
Det avhengige nøkkelordet brukes til å spesifisere et avhengighetsuttrykk, som evalueres til enten sant for usant, i boolsk forstand. Avhengigheter er faktiske Perl-uttrykk, og må overholde alle syntaktiske regler. Uttrykkene blir evaluert i sin egen pakkeplass for ikke å ha en uønsket bivirkning ved et uhell. Hvis det blir funnet en syntaksfeil ved evaluering av uttrykket, logges det via syslog.

Før evaluering forekommer følgende substitusjoner på uttrykket: setninger som ser ut som "gruppe: tjeneste" erstattes med verdien av gjeldende driftsstatus for den spesifiserte tjenesten. Disse opstatus-erstatningene beregnes rekursivt, så hvis tjeneste A avhenger av tjeneste B, og tjeneste B avhenger av tjeneste C, så er tjeneste A avhengig av tjeneste C. Vellykkede driftsstatus (som vurderer til "1") er "STAT_OK", "STAT_COLDSTART "," STAT_WARMSTART "og" STAT_UNKNOWN ". Ordet "SELF" (i alle caps) kan brukes for gruppen (f.eks. "SELF: service"), og er en forkortelse for den nåværende klokkegruppen.

Denne funksjonen kan brukes til å kontrollere varsler for tjenester som er avhengige av andre tjenester, for eksempel en SMTP-test som er avhengig av at maskinen er tilgjengelig.

dep_behavior {a | m}
Evalueringen av avhengighetsgrafer kan kontrollere undertrykkelsen av enten varsling eller overvåke påkallinger.

Undertrykkelse av varsler . Hvis dette alternativet er satt til "a", vil avhengighetsuttrykket bli evaluert etter at monitoren for tjenestens utløp eller etter at en felle er mottatt. Et varsel vil bare bli sendt hvis evalueringen lykkes, noe som betyr at ingen av nodene i avhengighetsgrafen indikerer feil.

Overvåk undertrykkelse . Hvis den er satt til "m", vil avhengighetsuttrykket bli slettet før monitoren for tjenesten er i ferd med å kjøre. Hvis evakueringen lykkes, vil monitoren bli kjørt. Ellers kjøres ikke monitoren, og statusen til tjenesten vil forbli den samme.

 

Periode definisjoner

Perioder brukes til å definere forholdene som skal tillate at varsler skal leveres.

periode [label:] periodspec
En periode grupperer en eller flere alarmer og variabler som kontrollerer hvor ofte et varsel skjer når det er en feil. Periode nøkkelordet har to former. Den første tar et argument som er en periodespesifikasjon fra Patrick Ryan's Time :: Period Perl 5-modul. Se "perldoc Time :: Period" for mer informasjon.

Den andre formen krever en etikett etterfulgt av en periodespesifikasjon, som definert ovenfor. Etiketten er en kode som består av et alfabetisk tegn eller understrek etterfulgt av null eller flere alfanumeriske tegn eller understrekinger og slutter med et kolon. Denne skjemaet tillater flere perioder med samme periodedefinisjon. En bruk er å ha en definisjon av en periode som ikke har noen andre parametere eller endringer for en bestemt tidsperiode, og en annen for samme tidsperiode med et annet sett varsler som inneholder disse parametrene.

alertevery tid
Den alertevery ordet (i løpet av en periode definisjon) tar den samme type av argumentet som intervallet variabel, og begrenser antallet av ganger en melding sendes når tjenesten fortsetter å svikte. For eksempel, hvis intervallet er "1 t", vil bare varslene i periodeseksjonen bare utløses en gang hver time. Hvis nøkkelordet for alertevery er utelatt i en periodeoppføring , vil det bli sendt ut et varsel hver gang en feil oppdages. Hvis utdataene fra to påfølgende feil ikke endres, overstyres alertevery-intervallet som standard. Hvis ordet "sammendrag" er det siste argumentet, vil bare de sammendragte outputlinjene bli vurdert når du sammenligner resultatet av påfølgende feil.

alertafter num

altertafter num timeval
Det andre nøkkelordet (i en periodeseksjon ) har to former: bare med "num" -argumentet, eller med "num timeval" -argumentene. I den første formen vil et varsel bare bli påberopt etter "num" påfølgende feil.

I den andre formen er argumentene et positivt heltall etterfulgt av et intervall, som beskrevet av intervallvariabelen over. Hvis disse parametrene er spesifisert, vil varslene for den perioden bare bli kalt etter at mange feil oppstår i løpet av det intervallet. Hvis for eksempel blir gitt argumentene "3 30m", vil alarmet bli kalt hvis 3 feil oppstår i løpet av 30 minutter.

numalerts num

Denne variabelen forteller serveren å ikke ringe mer enn numvarsler under en feil. Varseltelleren holdes per periode og tilbakestilles etter hver suksess.

comp_alerts

Hvis dette alternativet er spesifisert, vil upalerts bare bli ringt hvis et tilsvarende "ned" -varsel er blitt ringt.

varslingsvarsel [arg ...]
En periode kan inneholde flere varsler, som utløses når tjenesten svikter. Et varsel blir spesifisert med varselordet, fulgt av en valgfri utgang parmeter, og argumenter som tolkes på samme måte som skjermen definisjon, men uten ";;" unntak. Avslutningen parameteren tar form av utgang = x eller utgang = xy, og har den virkning at varslingen er bare kalles hvis utgangsstatus for skjermen skriptet faller innenfor området av utløps parameter. Hvis for eksempel varselslinjen er alarm exit = 10-20 mail.alert mis, blir mail-alarm bare påberopt med mis som sine argumenter hvis monitorprogrammets exit-verdi er mellom 10 og 20. Denne funksjonen lar deg utløse forskjellige varsler med forskjellige alvorlighetsnivåer (som når ledig diskplass går fra 8% til 3%).

Se ALERT PROGRAMMER- seksjonen ovenfor for en liste over forhåndsmeldere som automatisk vil passere for å varsle programmer.

upalert varsling [arg ...]
En upalert er komplimentet til et varsel . En upalert kalles når en tjeneste gjør staten overgangen fra fiasko til suksess. Upalert- skriptet kalles for å levere de samme parametrene som varslingsskriptet , med tillegg av -u- parameteren som ganske enkelt brukes til å la et varslingsskript vite at det kalles som en upalert. Flere oppgraderinger kan spesifiseres for hver periodedefinisjon. Vær oppmerksom på at standardoppførselen er at en upalert vil bli sendt uavhengig av om det var sendt noen tidligere "down" -varsler, siden upalerts utløses ved en statlig overgang. Angi alternativet per periode comp_alerts for å parre upalerts med "ned" -varsler.

oppstartsalarm [arg ...]
En startupalert ringes bare når mon- serveren starter utførelsen.

oppover etter tid
Parameteren upalertafter er spesifisert som en streng som følger syntaksen til intervallparameteren ("30s", "1m", etc.), og kontrollerer utløsningen av en upalert . Hvis en tjeneste kommer opp igjen etter å ha vært nede i en tid som er større enn eller lik verdien av dette alternativet, vil en upalert bli kalt. Bruk dette alternativet for å forhindre at oppringninger blir ringt på grunn av "blips" (korte avbrudd).