Datenaufkommen

Aus Freiheit statt Angst!

(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Festnetz Telefonie)
(Internet-Verbindungen)
Zeile 60: Zeile 60:
Varchar (20) Varchar (20) Time + date 64 bit (8byte)
Varchar (20) Varchar (20) Time + date 64 bit (8byte)
-
Bit Anzahl 160 160 64
+
Bit Anzahl 160 160 64

Version vom 23:28, 2. Jan. 2008

Berechnung des Datenaufkommen aufgrund der Vorratsdatenspeicherung


Festnetz Telefonie

Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen):


Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + Zeitpunkbeginn + ZeitpunktEnde ) * Kunden * Gespräche pro Tag * Speicherdauer


TelNr = 32 Bit

TelNrZiel = 32 Bit

Zeitpunkbeginn = 64 Bit

ZeitpunktEnde = 64 Bit


Datenaufkommen [in Bit] = (32 + 32 + 64 + 64 ) * Kunden * Gespräche pro Tag * 185 Tage


Datenaufkommen [in Bit] = (192) * Kunden * Gespräche pro Tag * 185 Tage


Kunden = unbekannte, weiviel Telefonanschlüsse gibt es Bundesweit?


Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik


Weitere Eckdaten:

Unternehmen Kundenanzahl

NetCologne 500.000

HansaNet 200.000

Arcor 1.600.000


Internet-Verbindungen

                Quell-IP	Ziel-IP	        Zeitpunkt t0 Aufruf	          x1		Kunden

Mögliche Datentypen


                Varchar (20)	Varchar (20)	Time + date 64 bit (8byte)			

Bit Anzahl 160 160 64


x1= Verbindungen pro Kunde


Anzahl Kommunikationsteilnehmer

laut Bundesnetzagentur (früher RegTP) gab es 2007:

53,7 Mio Festnetzanschlüsse (Kanäle),

96 Mio Mobilfunkanschlüsse,

3,9 Mio. VoIP Anschlüsse über DSL sowie

1,23 Mio. Sprachanschlüsse über TV-Kabel (Breitbandkabel).


Macht also insgesamt: 154,83 Mio. Telefonanschlüsse in Deutschland.



Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h. man benötigt pro Nummer mindestens 18 bytes.

Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String.

Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt noch ein Trennzeichen (Komma oder Semikolon) hinzu.

In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen pro Anschluss und Tag.

Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen.

Hier müssen auch die Informationen zur Identifikation der Funkzelle berücksichtigt werden, das sind nochmals mindestens 14 bytes.

Das, was hier beschrieben wurde, sind die minimalen Daten, die gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen Aufschlag von 50 - 100% berechnen.

Viele Grüße Bernhard.



Berichtigung: Die Angaben bei der Bundesnetzagentur sind *nicht* die Telefonanschlüsse sondern die Kanäle! Demzufolge gibt es nicht, wie ich irrtümlich schrieb 154,83 Mio. Anschlüsse sondern 154,83 Kanäle. Ein Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog. ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden. Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 wird die Gesamtanzahl der Telefonanschlüsse (OHNE Mobilfunk!) mit 38,12 Mio. angegeben. Wenn man noch den Mobilfunk dazurechnet gibt es:

38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk
96 Mio. Mobilfunkanschlüsse
=> 134,12 Mio. Telefonanschlüsse gesamt



Ich habe mal versuch die Daten in ein Python Script zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen.

Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben?

Ergänzungen zum Script sind willkommen.

==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten.

Wie führe ich das Skript aus?


Quellen:

http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25

http://www.bundesnetzagentur.de/media/archive/12016.pdf

Persönliche Werkzeuge
Werkzeuge