Datenaufkommen

Aus Freiheit statt Angst!

Wechseln zu: Navigation, Suche

Annahmen und Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen.

Inhaltsverzeichnis

noch zu betrachten

  • IP wird bei VoIP-Gesprächen gespeichert
  • SMS, MMS werden auch protokolliert
  • e-Mails gehen auch oft an mehr als einen Empfänger gleichzeitig
  • Anonymisierungsdienste ggf.

Festnetztelefonie

Bei Telefonaten über das Festnetz werden folgende Verbindungsdaten gespeichert:

  • Anschlussnummer Quelle (Anrufer)
  • Anschlussnummer Ziel (Angerufener)
  • Gesprächszeit
  • Gesprächsdauer

Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen):


Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn + ZeitpunktEnde ) * Kunden * Gespräche pro Tag * Speicherdauer


TelNr = 64 Bit

TelNrZiel = 64 Bit

ZeitpunktBeginn = 64 Bit

ZeitpunktEnde = 64 Bit

(Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.)

Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kunden * Gespräche pro Tag * 185 Tage


Datenaufkommen [in Bit] = (256) * Kunden * Gespräche pro Tag * 185 Tage


Kunden = unbekannte, weiviel Telefonanschlüsse gibt es bundesweit?


Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik?


Weitere Eckdaten:

Unternehmen Kundenanzahl

NetCologne 500.000

HansaNet 200.000

Arcor 1.600.000

Mobilfunk

   TelNrQuelle	    QuelleIMEI	 OrtQuell      TelNrZiel	ZielIMEI       Zeit_t0             Zeit_t1	  x1	Kunden 


   221–1234567   15 Stellen     ZelleIDy      221–9876543	15-Stellig     16.11.07:16.00      16.11.07:16.22			


Mögliche Datentypen

  Int 64bit, uns	Varchar (20)	Int 32bit, uns	  Inte 64bit, uns Varchar (20)	Int 32bit, un	Time + date       Time + date 		

20*8 20*8

Bitanzahl 32 160

(Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.)

Ort = Standort


Quellen:

http://www.rui.de/mobil/codes.html

Internet-Verbindungen

Bei Internet-Verbindungen (nicht TCP/IP-Verbindungen, sondern die Verbindung ins Internet als solche) werden folgende Daten erfasst:

  • zugewiesene IP
  • Einwahlzeitpunkt
  • Einwahldauer


               IP	       Zeitpunkt t0 Zeitpunkt t1 x1		Kunden

Mögliche Datentypen


                Varchar (15)	Time + date 64 bit (8byte) Time + date 64 bit (8byte)			


Bit Anzahl 120 64 64

  • IPs sind nur max. 15 Zeichen lang, man kann sie aber auch als Zahlencode Speichern.
  • Date-Time kann man als String oder auch als UNIX-Timestamp speichern.
  • afaik werden aber nicht nur die IP-s, sondern Hostnames, wenn nicht sogar URLs gespeichert, was erheblich mehr auffwand ist. --CeBe 02:50, 3. Jan 2008 (CET)

x1= Einwahlen pro Kunde



==> Ich habe an meinem heutigen Arbeitstag laut Firewall ~ 9.500 Verbindungen innerhalb von 24h gehabt.


>> Die Anzahl der Tabs etc. ist nicht relevant, da Seitenaufrufe nicht unter die Speicherungspflicht fallen. Das Datenaufkommen - beim Provider! - ist identisch, ob du nun 1 oder 100000 Seiten aufrufst.


E-Mail

Für jede im versandte E-Mail werden gespeichert:

  • Absender
  • Empfänger
  • Absender-IP (?)
  • Betreffzeile (?)

Das Fragezeichen bei der IP bezeichnet eine Unsicherheit. Die IP wird vermutlich gespeichert, da eine e-Mail-Adresse gefälscht werden kann und erst mit der IP eine brauchbare Information ergibt.

Das Fragezeichen hinter Betreffzeile bezeichnet eine Unsicherheit. Es war mehrfach im Gespräch, dass auch sie gespeichert werden müsste (auch wenn sie nicht zu den eigentlichen Verbindungsdaten zu rechnen ist)

Ich fände es fantastisch, wenn man hier mal einen Link auf brauchbare Quellen hätte, aus denen der Umfang der zu speichernden Daten hervorginge, weiß da jemand was? Bitte unten anfügen Danke! --Peu 21:57, 5. Jan 2008 (CET)


                         Absender	    Empfänger	        VonIP	        x1	    Kunden

Mögliche Datentypen

                        Varchar (50)	     Varchar (50)	Varchar (15)			

Bitanzahl


                        400 Bit	     400 Bit	        120 Bit	        	


(VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.)



x1= Anzahl Emails pro Kunde

Anzahl Kommunikationsteilnehmer

Stand: 03.01.2008

1. Anzahl der Telefonanschlüsse

Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 wird die Gesamtzahl der Telefonanschlüsse (OHNE Mobilfunk!) Ende 2007 mit 38,12 Mio. angegeben. Wenn man noch den Mobilfunk dazurechnet gibt es:

 38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk
 96 Mio.    Mobilfunkanschlüsse     
----------------------------------------------
134,12 Mio. Telefonanschlüsse gesamt
==============================================

2. Anzahl der Kanäle

Ein Telefon-Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog. ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden.

laut Bundesnetzagentur (früher RegTP) gab es 2007:

 53,7 Mio   Telefonkanäle im Festnetz (ISDN und PSTN),
 96 Mio     Kanäle im Mobilfunknetz,
  3,9 Mio.  VoIP Kanäle über DSL sowie
  1,23 Mio. Kanäle über Kabel-TV-Telefonie(Breitbandkabel).
-----------------------------------------------------------
154,83 Mio. Telefonkanäle in Deutschland gesamt
===========================================================


Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h. man benötigt pro Nummer mindestens 18 bytes.

Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String.

Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt noch ein Trennzeichen (Komma oder Semikolon) hinzu.

In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen pro Anschluss und Tag.

Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen.

Hier müssen auch die Informationen zur Identifikation der Funkzelle berücksichtigt werden, das sind nochmals mindestens 14 bytes.

Das, was hier beschrieben wurde, sind die minimalen Daten, die gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen Aufschlag von 50 - 100% berechnen.

Viele Grüße Bernhard.



Ich habe mal versuch die Daten in ein Python Script zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen.

Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben?

Ergänzungen zum Script sind willkommen.

==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten.

Wie führe ich das Skript aus?


Quellen:

http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25 und Seite 27

http://www.bundesnetzagentur.de/media/archive/12016.pdf

http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/

Persönliche Werkzeuge
Werkzeuge