Zum Inhalt springen

RTP-Analyse mit Wireshark – Sprachqualität objektiv bewerten

Netzwerkmitschnitte liefern viele Daten – aber erst die richtige Interpretation macht sie wertvoll. Das externe Analysetool Wireshark stellt dafür leistungsfähige Analysefunktionen speziell für RTP-Sprachdaten bereit.

In diesem Beitrag geht es darum, VoIP-Qualität messbar zu machen und typische Fehlerbilder korrekt einzuordnen.

Dieser Beitrag ist Teil 3 einer kleinen Informationsreihe rund um die Analyse von Problemen mit Echtzeitkommunikation (VoIP/SIP/RTP) und erklärt die Grundlagen der Analyse von VoIP-Sprachproblemen mit Wireshark.


RTP-Streams analysieren

Über das Menü:

Telephony → RTP → RTP Analysis

listet Wireshark alle erkannten RTP-Streams mit wichtigen Kennzahlen auf. Bereits diese Übersicht erlaubt eine erste Qualitätsbewertung. Über eine grafische Ansicht sind mitunter recht schnell Problemstellen zu ermitteln.

RTP Streamanalyse mit Wireshark und AGFEO

Die wichtigsten Kennzahlen

Packet Loss

Anteil verlorener Sprachpakete.

  • Ideal: 0 %
  • kritisch: > 1–2 %
  • unbrauchbar: zweistellig

Delta / Max Delta

Zeitabstand zwischen einzelnen RTP-Paketen.

  • Sollwert: ca. 20 ms
  • Große Ausreißer deuten auf Netzprobleme hin

Jitter

Schwankung der Paketlaufzeit.

  • gut: < 10 ms
  • kritisch: deutlich darüber

Codec

Zeigt, mit welchem Audiocodec gearbeitet wird (z. B. G.711).
Weitere Informationen dazu s.u.


Typische Praxisinterpretation

Ein häufiger Irrtum:

„Der Jitter ist niedrig, also muss die Qualität gut sein.“

In der Praxis können jedoch hohe Paketverluste selbst bei geringem Jitter zu massiv gestörter Sprache führen. Wireshark markiert solche Streams oft bereits automatisch als problematisch.


Sprachdaten abhören

Über den in Wireshark integrierten RTP Player lassen sich Sprachpakete direkt abhören.
Das ist besonders hilfreich, um:

  • Aussetzer
  • Knackser
  • Verzerrungen

direkt mit Messwerten in Verbindung zu bringen.

RTP Sprachdaten in Wireshark anhören - AGFEO TechBlog Beitrag

Tipp bei einseitigem Sprechweg:
Jede Verbindung verfügt grundsätzlich über 2 getrennte RTP-Datenstreams („Hinweg“ / „Rückweg“). Wurde der Mitschnitt von der Anlage erzeugt und fehlt hier z.B. der eingehende Datenstrom vom Gesprächspartner, so ist das Gespräch nur einseitig – was dann aber schon „vor der Anlage“ verursacht wird. In diesem Fall ist häufig eine restriktive Firewall oder ein falsches Routing die Ursache.

Hinweis: Datenschutzrechtliche Vorgaben sind zwingend zu beachten. (s.a. unsere Angaben im Teil 2 dieser Beitragsreiche zur VoIP-Sprachanalyse)


Zusatz-Tipps

Wenn Sprachprobleme auftreten, sollten sinnvollerweise weitere Werte kontrolliert werden.

Codec

Übernimmt Digitalisierung und Komprimierung analoger Schallwellen. Er bestimmt also die Qualität der Sprache. Qualität und Bandbreitenbedarf stehen dabei in direkter Abhängigkeit.

G.711 (PCMA/PCMU): Der Urvater der digitalen Telefonie. Schon bei ISDN der Standard-Codec. Findet sich im SDP eines Message Body des SIP Invites als Media Attribute, z.B. (a): rtpmap:8 PCMA/8000/1.

G.722: Ein Codec für High-Definition-Telefonie (HD). Ermöglicht eine besonders klare und natürliche Klangqualität. Erreicht wird dies mit einer komprimierten Übertragung des ansonsten doppelt so breitem Frequenzspektrums. Der Media Attribute-Eintrag dazu lautet
(a): rtpmap:9 G722/8000

Wichtig:
Die beteiligten Geräte müssen sich auf den selben Codec einigen. G.711 (PCMA) ist hierbei in der EU weitgehend der Standard. Kommen andere Codecs zum Einsatz, so sind entweder Verbindungen oder die Datenübertragungen gestört (problematisch z.B. für Fax-Übertragungen) oder die Gegenseite muss den anderen Codec zurück-„transcodieren“ – was je nach Implementierung zusätzliche Latenz, Qualitätsverluste oder Instabilitäten verursachen kann.

ptime

Dauer des Sprachsegments pro Paket. Die ptime kann man z.B. im SDP eines Message Body des SIP Invites ablesen (Media Attribute (a): ptime:20). Werden hochwertige Codecs wie G.711 oder G.722 verwendet, ist die ptime meist 20ms.

Wichtig:
Beide Geräte müssen denselben Wert nutzen, da es sonst zu Gesprächsproblemen kommt.

Quality of Service (QoS)

An sich werden alle Daten in einem Netzwerk weitgehend gleichberechtigt übertragen. Was für Internetsurfen, Mails und andere Anwendungen kein Problem ist, ist für Echtzeitkommunikation mitunter tödlich. Wenn Sprachdaten nicht umgehend transportiert werden, sind Gesprächsprobleme definitiv vorprogrammiert. Mit aktivem QoS werden Daten entsprechend gekennzeichnet, so dass diese vom Netzwerk priorisiert, also schneller bzw. bevorzugt, übertragen werden. Die AGFEO IP-Komponenten setzen die passende QoS-Markierung (DSCP: EF) weitgehend automatisch. Leider funktioniert das bei SoftPhone Nutzung unter MS Windows allerdings so nicht. Hier muss man die QoS-Markierung über eine Gruppenrichlinie zuvor manuell setzen!

Wichtig:
Nicht jedes Kundennetzwerk berücksichtigt die QoS-Markierung! Es braucht mitunter hochwertige, aktive Komponenten, die zudem passend konfiguriert werden müssen. Bei Fragen wendet Euch somit an Euren IT-Betreuer.

Filter nutzen

Wireshark bietet mächtige Filter-Funktionen. Um schnell mal eben alle VoIP-Verbindungen eines Mitschnitts auffinden zu können, nutzt den Menüpunkt /Telephony/VoIP-Calls als ersten Einstieg. Ansonsten nutzt die Filter, um spezifische Details und besondere Abhängigkeiten ermitteln zu können.

Tipp:
Nutzt z.B. gezielt die Farbfiltermöglichkeit auf die Call-ID eines SIP-Datensatzes, um schnell in einem kompletten Mitschnitt alle zu dieser Verbindung gehörigen Datenpakete sehen zu können – ohne den grundsätzlichen Kontext der Paketübertragungen aus dem Gesamt-Mitschnitt zu verlieren.


Grenzen der Analyse

Bei aktiver Verschlüsselung (z. B. SRTP):

  • SIP-Inhalte sind nicht sichtbar
  • RTP-Payload ist verschlüsselt

Kennzahlen wie Paketverlust oder Jitter bleiben jedoch weiterhin auswertbar.


Wireshark-Dokumentation (Anleitung zum Download)

Für alle, die tiefer in die Analyse einsteigen möchten, haben wir ergänzend eine kompakte Wireshark-Anleitung zur Analyse von SIP- und RTP-basierten VoIP-Sprachproblemen erstellt. Diese stellen wir hier allen Interessierten kostenfrei zum Download zur Verfügung. Auf knapp 24 Seiten zeigt diese Anleitung die ersten Schritte mit Wireshark, erklärt die sinnvolle Filternutzung bzgl. SIP und RTP Analysen und zeigt typische Ursachen und Lösungen bei VoIP-Echtzeitkommunikationsproblemen.

Zur Wireshark-Dokumentation (PDF):

Anleitung für Wireshark (Screenshot) - Hier klicken für Linkaufruf

Während der TechBlog die Zusammenhänge erläutert, dient die Dokumentation als kompakte Referenz für die praktische Arbeit mit Wireshark.


Fazit

Die RTP-Analyse mit Wireshark erlaubt eine objektive Bewertung der Sprachqualität – unabhängig von subjektiven Eindrücken.

Gerade im Zusammenspiel mit AGFEO Kommunikationssystemen lassen sich so:

  • Netzwerkprobleme eindeutig nachweisen
  • Ursachen eingrenzen
  • Fehlkonfigurationen außerhalb der Anlage identifizieren

Damit wird Wireshark zu einem unverzichtbaren Werkzeug im Support- und Projektalltag.

Hinweis/Disclaimer:
Wireshark ist ein unabhängiges Analysewerkzeug eines Drittanbieters. Alle Angaben und Empfehlungen ohne Gewähr und Produkthaftung. Vor Erstellen eines Mitschnitts und Einsatz solcher Analysetools sind die jeweiligen rechtlichen Rahmenbedingungen zu klären und entsprechend einzuhalten.
Das Titelbild wurde durch KI erstellt.

Lars Brückner (Projekte/PM)

Lars Brückner (Projekte/PM)

AGFEO Mitarbeiter seit 1999. Aufbau der Schulungsabteilung. Heute verantwortlich für das strategische Projektgeschäft (für Fachhändler mit Grosskunden und Filialgeschäften) und das Produktmanagement.

Veröffentlicht am:

21. Januar 2026