Splunk On-Call (ehemals VictorOps) Bewertung und Alternativen
VictorOps ist ein Incident-Response-Paket. Der Dienst kann integriert werden, um mit anderen IT-Managementsystemen zusammenzuarbeiten. VictorOps ist jetzt eine Abteilung von Splunk .
Über VictorOps
VictorOps wurde 2012 gegründet und hat seinen Hauptsitz in Boulder, Colorado, in den Vereinigten Staaten. Im Juni 2018 wurde das Unternehmen von Splunk gekauft.
Das VictorOps-System wird als klassifiziert Vorfallmanagement Service. Es fungiert als Drehscheibe für Warnungen. Es stellt eine Schnittstelle zu Problemerkennungssystemen her und leitet diese dann als Warnungen an Entwicklungsteams weiter. Das VictorOps-System identifiziert weder Probleme noch verwaltet es deren Lösung. Der Hauptmarkt für VictorOps ist der Einsatz in DevOps.
Das System ist nicht für den Einsatz als Helpdesk-Umgebung konzipiert. VictorOps beinhaltet kein Ticketsystem oder Teamverwaltungsfunktionen. Es besteht jedoch die Möglichkeit, für einzelne Teammitglieder oder Gruppen Fachkompetenzen einzutragen, die dem System den Versand ermöglichen Benachrichtigungen an Ansprechpartner, wenn ein Problem auftritt.
Da VictorOps Teil von Splunk wurde, wurde sein Name in geändert Splunk-Bereitschaftsdienst . Wenn Sie also nach VictorOps suchen, erklärt der neue Name, warum es so schwer zu finden ist.
Splunk-Bereitschaftsdienst
Splunk On-Call ist besonders nützlich für IT-Betrieb Teams, die lebenswichtige 24-Stunden-Einsätze unterstützen – Systeme, die rund um die Uhr arbeiten, wie etwa die IT-Infrastruktur der Rettungsdienste, ein Prozessflusskontrollsystem für die Gasversorgung oder eine rund um die Uhr automatisierte Fabrik. In diesen Umgebungen gibt es keine „außerhalb der Geschäftszeiten“. Für ein realistisches Beschäftigungsmanagement ergänzt die Nachtschicht die Systemkompetenz jedoch möglicherweise nicht vollständig. Diese Spezialisten werden in diesen Fällen nicht im Büro sein, sondern „ Bei Anruf .“
Ein weiteres Szenario sind ausgelagerte Dienstleistungen. Beispielsweise vergeben die Managementteams wichtiger Systeme häufig Verträge für Wartungsunterstützung mit spezialisierten Beratungsunternehmen. Es gibt unterschiedliche Ansprechpartner für unterschiedliche Systemspezialisierungen oder eine Reihe von Kontakten zu unterschiedlichen Dienstleistern für unterschiedliche Aspekte des Systems; Die Umstellung der Vorfallbenachrichtigung auf ein anderes Ziel ist eine wichtige Aufgabe.
Dies sind die Funktionen, die Splunk On-Call ausführt. Es erfordert, dass diese Verbindungen zwischen Inzidenztypen und Respondern bestehen aufstellen . Die Anpassung des Dienstes an zu komplizierte Systeme kann diese Einrichtungsaufgabe zu einem zeitaufwändigen Schritt machen. Dies ist jedoch lediglich eine Möglichkeit, die Erinnerung an Verträge, Vereinbarungen und Pläne zu kodifizieren, die viele Systemmanager im Kopf haben.
Zentralisierung und dokumentieren Die Kontaktinformationen und die Entscheidungsprozesse der IT-Betriebsleiter bei der Entscheidung, wer im Notfall gerufen werden soll, sorgen für Kontinuität im Notfall. Dies führt dazu, dass die Menschen, die über dieses Wissen verfügen, urlaubs- oder krankheitsbedingt ausfallen oder das Unternehmen plötzlich verlassen.
Der Prozessablauf der Splunk On-Call-Operationen ist unten dargestellt.
Wie aus dem Diagramm ersichtlich ist, kann das System über Alarmmeldungen empfangen Locker Und Mannschaften . Das bedeutet, dass jeder Überwachungsdienst, der Benachrichtigungen von Slack generieren kann, mit Splunk On-Call zusammenarbeiten kann. Benachrichtigungen können auch von Microsoft Teams empfangen werden.
Sobald Splunk On-Call eine Benachrichtigung erhält, durchsucht es seine Datenbank nach durchzuführenden Aktionen und leitet diese Warnungen an die entsprechende Person weiter. Diese weitergeleitete Benachrichtigungen kann auch über Slack oder Microsoft Teams versendet werden.
Grundausstattung für den Bereitschaftsdienst
Das Herzstück der Splunk-Bereitschaftsdienst Der Dienst ist seine Kontaktdatenbank. Der richtige Ansprechpartner für ein bestimmtes Problem kann zu verschiedenen Tageszeiten ein anderer sein. Gelegentlich kann es notwendig sein, eine andere Person zu kontaktieren, wenn der Hauptansprechpartner nicht da ist. Mit Splunk On-Call ist es möglich, mehrere verschiedene Personen als Personen zu erfassen, die einen Zeitplan abarbeiten. Es ist also nicht nur notwendig, Kontaktinformationen einzugeben, sondern das System muss auch wissen, wann diese Person verantwortlich ist. Ein Terminkalender kümmert sich um dieses Problem in den Einstellungen des Bereitschaftssystems.
Ein weiteres Problem, mit dem Systemmanager konfrontiert sind, besteht darin, dass der Hauptkontakt nicht immer antwortet. Das On-Call-Paket beinhaltet automatisierte Eskalation , das nach einer Zeitverzögerung eine zweite Benachrichtigung implementiert. Dies kann die Kontaktaufnahme mit der Person umfassen, die für die Organisation oder Abteilung verantwortlich ist, zu der der Hauptansprechpartner gehört.
Webhooks ermöglichen die automatische Ausführung zusätzlicher Aktionen gleichzeitig mit der Weiterleitung einer Warnung. Solche Aktionen könnten beispielsweise das Zurücksetzen des Servers oder das Anzeigen einer Statusseite auf einer Website sein.
Schnelle Antwort
Der Vorfall-Dashboard von Splunk On-Call liefert ein Live-Protokoll aller Ereignisse, die sich auf die durch das System weitergeleitete Warnung beziehen. Dieser Bericht zeigt die Personen im Team, denen die Warnung zugewiesen wurde, sowie ein Protokoll der Kommunikation, die über ein mit dem On-Call-System verbundenes Nachrichtensystem erfolgt.
Der für das bedrohte System zuständige Manager kann die Aktivierung durchführen eine Telefonkonferenz über das On-Call-Dashboard, um den Fortschritt zu überprüfen. Das System speichert die Telefonnummern jedes zugewiesenen Teammitglieds und gruppiert und wählt sie automatisch, ohne dass der Manager jede Nummer sehen muss.
Der Systemmanager kann das auch Stakeholder informieren des Problembewusstseins und des Fortschritts bei der Lösung. Alle persönlichen und automatisierten Aktionen, die vom Managementteam des bedrohten Systems durchgeführt werden, werden in einer Zeitleiste protokolliert, einem wichtigen Protokoll, das für einen Teil davon wichtig ist SLA-Konformität Dokumentation.
Automatisierung von Vorfällen
Der Kernwert von VictorOps ist seine Fähigkeit zentralisieren die Verteilung der Verantwortlichkeiten im Zusammenhang mit einem Systemproblem. Dieser zentrale Verarbeitungspunkt für Warnungen ermöglicht es dem Tool, ähnliche Benachrichtigungen zu identifizieren. Wenn beispielsweise eine Produktionslinie stillsteht, lösen Sensoren an mehreren Stellen in der Fabrikhalle Alarme aus. Anstatt einfach nur eine Flut von Warnungen zu durchlaufen, bietet das VictorOps-System verschmilzt alle in einer Benachrichtigung.
Die einer Gruppe von Warnungen zugeordneten Berichte bewahren alle ursprünglich eingehenden Alarme. Diese Informationen sind hilfreich, da sie von Live-Überwachungssystemen stammen. Ein Systemingenieur kann schnell Logik anwenden, um die tatsächliche Fehlerquelle zu identifizieren, indem er prüft, woher alle Benachrichtigungen stammen.
Der Treiber des Benachrichtigungsroutings stammt von Alarmregeln in VictorOps. Diese Regeln müssen alle eingerichtet werden, sodass der für die Festlegung dieser Regeln zuständige Bediener genau wissen muss, wie das Alarmformat und die zugehörigen Auslöser zu gestalten sind. Regeln sind ein Paar von Ereignissen und Aktionen, die als Reaktion darauf ausgeführt werden müssen.
Obwohl Automatisierung Leitet Warnungen ohne manuelles Eingreifen weiter, der Systemmanager kann zu jeder Warnung Notizen hinzufügen, sobald sie an den zuständigen Ansprechpartner übermittelt wird. Es ist auch möglich, es einzurichten Anhänge Und Standardtext für jede Art von Warnung. Diese Hinweise können Sicherheitshinweise und Haftungshinweise oder Schulungs- und Fehlerbehebungsleitfäden umfassen.
Liefereinblicke
Das Delivery Insights-Modul ist eine attraktive Funktion für tätige DevOps-Teams eine CI/CD-Pipeline . Mithilfe dieser Analysefunktion können Entwicklungsteammanager erkennen, ob das Unternehmen zu viel Geld für schlecht getesteten Code verschwendet, der vor seiner Verifizierung in die Produktion geht.
Es kann teuer sein, Korrekturen vorzunehmen, bis ein Modul bereits in Produktion ist. Das Aufheben der Auswahl bestehender Systeme, um einen Verfahrensfehler zu ermitteln und ihn neu zuzuordnen, kann sich auf verwandte Systeme auswirken. Sie ließen Falscher Code Die Inbetriebnahme schadet dem Ruf des Unternehmens, da bei Kunden und der Öffentlichkeit der Eindruck entsteht, dass das Unternehmen seine Dienstleistungen nicht erbringen kann. Angesichts dieser Fehler fragen sich potenzielle Kunden möglicherweise, welche Servicequalität sie erwarten können.
VictorOps-Bereitstellungsoptionen
VictorOps ist nicht mehr als eigenständiges Produkt verfügbar. Man muss es sich ansehen Splunk-Bereitschaftsdienst stattdessen.
Splunk On-Call ist eine SaaS-Plattform . Es gibt keine On-Premise-Version. Der On-Call-Dienst umfasst die VictorOps-Software, die Rechenleistung für deren Ausführung sowie Speicherplatz für Protokolle und Statistiken. Abonnenten von AWS Und Azurblau Virtuelle Serverpläne können Splunk-Dienste im Marketplace ihrer bevorzugten Plattform hinzufügen.
Splunk On-Call-Preis
Die Preisgestaltung von Splunk On-Call ist etwas kompliziert, da es nicht als separates Modul angeboten wird. Stattdessen handelt es sich um eine Zusatzfunktion zum Splunk Observability Cloud Paket.
Splunk Observability Cloud ist ein Paket, das Folgendes beinhaltet: Überwachung der Splunk-Infrastruktur Und Splunk APM , ein Anwendungsleistungsmonitor. Das Bundle beinhaltet auch Splunk Log Observer , ein Protokollmanager und Datensuchprodukt.
Es gibt zwei Pläne für Splunk Observability Cloud und das niedrigste davon heißt Standard , beginnt bei 95 $ pro Monat und Host bei jährlicher Abrechnung. Der höhere Plan, genannt Plus , dazu zählt Splunk RUM , ein Paket von Tools zur Analyse von Live-Websites, dessen Startpreis bei jährlicher Abrechnung 110 US-Dollar pro Monat und Host beträgt.
Das Splunk On-Call-Add-on hat bei jährlicher Abrechnung einen Startpreis von 5 US-Dollar pro Benutzer und Monat. Darüber hinaus erhalten Sie eine 14-tägige kostenlose Testversion von Splunk On-Call und allen anderen Splunk-Modulen.
Stärken und Schwächen von Splunk On-Call
VictorOps, jetzt aufgerufen Splunk-Bereitschaftsdienst , hat seine Nische als Benachrichtigungsmanager für das Systemfehlermanagement. Dieses Tool funktioniert jedoch nicht unabhängig. Es leitet lediglich Warnungen weiter, die andere Softwarepakete ausgelöst haben. Wir haben einige Stärken und Schwächen von Splunk On-Call identifiziert.
Vorteile:
- Geeignet für den Einsatz durch DevOps-Teams, die interne Funktionen überprüfen, sobald diese live gehen
- Automatisiert den Benachrichtigungsprozess für Personen, die für die Unterstützung fehlerhafter Systeme verantwortlich sind
- Lässt sich mit anderen Splunk-Produkten und jedem Monitor integrieren, der Benachrichtigungen über Slack oder Teams versenden kann
- Umfangreiche Aktivitätsdokumentation für SLA-Compliance-Reporting
- Erkennt ähnliche Berichte, die sich auf denselben Vorfall beziehen
Nachteile:
- Bietet Funktionen, die von Überwachungstools zur Alarmauslösung bereits implementiert werden
- Die Qualität der Vorfallweiterleitung des Systems hängt von der Fähigkeit des Benutzers ab, genaue Regeln zu erstellen
Alternativen zu VictorOps
Alternativen zu VictorOps zu finden ist eine schwierige Aufgabe, da die Option von VictorOps in vielen Fällen darin besteht, nichts zu verwenden. Stattdessen VictorOps Routenwarnungen an bestimmte Personen und aufzeichnen die Benachrichtigungsereignisse. Viele der Überwachungstools, die in VictorOps einfließen könnten, bieten jedoch auch die Möglichkeit, Routing-Regeln zu schreiben, um Alarme an die richtige Person weiterzuleiten.
Wir haben mehrere Tools gefunden, die sich sehr gut zur Unterstützung eignen DevOps Teams bei der Fehlererkennung während des Übergangs zur Produktion und sobald neue Funktionen und Webseiten live sind.
Hier ist unsere Liste der fünf besten Alternativen zu VictorOps.
- SolarWinds Service Desk (KOSTENLOSE TESTVERSION) Dieses Paket umfasst Teamverwaltungs- und Aufgabenverwaltungsfunktionen in seinem Ticketsystem. Genau wie VictorOps kann SolarWinds Service Desk mit Jira für das Projektmanagement und Slack für Benachrichtigungen integriert werden. Sie können Überwachungswarnungen in das Ticketsystem einspeisen lassen und Routen einrichten, damit das System automatisch Arbeit zuweist. Darüber hinaus verfolgt es den Fortschritt und gibt jedem Techniker eine Aufgabenliste mit Fristen. SolarWinds Service Desk ist ein SaaS-System, auf das Sie im Rahmen einer 30-tägigen kostenlosen Testversion zugreifen können.
- Datadog APM + Continuous Profiler Der Application Performance Monitor von Datadog verfügt über zwei Pläne. Der höhere Plan umfasst einen Continuous Profiler und einen Error Tracker. Diese Funktionen ähneln denen des Splunk Observability Cloud-Pakets mit dem Splunk On-Call-Add-on. Dieses Tool erkennt nicht nur Probleme im Live-Code, sondern leitet sie auch an das Entwicklungsteam weiter. Abonnieren Sie das neue Datadog CI Visibility-Modul, um das CI/CD-Pipeline-Management hinzuzufügen, und schauen Sie sich das Incident Management-Modul an, um die Alternative zu VictorOps zu vervollständigen. Dies ist eine SaaS-Plattform und alle Module werden a angeboten 14-tägige kostenlose Testversion .
- PagerDuty ist ein sehr enger Rivale von Victor Ops. Es basiert auf Integrationen mit Slack und ServiceNow, um von anderen Überwachungstools ausgelöste Warnungen zu vermitteln und Warnungen gemäß den im Tool eingerichteten Regelwerken weiterzuleiten. Aber auch hier handelt es sich um ein SaaS-Paket, das Sie auf einem erhalten können 14-tägige kostenlose Testversion .
- Unbesiegbar Ein kontinuierlicher Testdienst, der die Entwicklung des Codes durch Tests verfolgt und seine Leistung weiterhin überprüft, um Fehler zu erkennen, wenn er live ist. Dieses Paket kann in JIRA integriert werden, um die Arbeitszuweisung und Aufgabenverwaltung für identifizierte Leistungsprobleme abzuschließen. Dieses Paket ist als SaaS-Plattform oder zur Installation auf Windows Server verfügbar. Eine Demo anfordern .
- OpsGenie ist ein Bereitschafts- und Alarmmanagementsystem von Atlassian, den Herstellern von Jira, dem Projektmanagement-Tool. OpsGenie bietet sorgfältiges Routing und lässt sich in Jira integrieren, um eine vollständige Entwicklungs- und Sanierungsplanung und -überwachung zu ermöglichen. Versuch es 14 Tage lang kostenlos .