Datenaufkommen
<imagemap>
Bild:Qsicon Ueberarbeiten.png|24px| default Überarbeiten desc none </imagemap> |
Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf bitte mit, ihn zu verbessern, und entferne anschließend diese Markierung. |
{{#ifeq: ||
}}
noch zu betrachten
- IP wird bei VoIP-Gesprächen gespeichert
- Dienstart wird ebenfalls gespeichert.
==>> SMS, MMS werden auch protokolliert
- e-Mails gehen auch oft an mehr als einen Empfänger gleichzeitig
- Anonymisierungsdienste ggf.
Festnetztelefonie
Bei Telefonaten über das Festnetz werden folgende Verbindungsdaten gespeichert:
- Anschlussnummer Quelle (Anrufer)
- Anschlussnummer Ziel (Angerufener)
- Gesprächszeit
- Gesprächsdauer
Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen):
Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn +
ZeitpunktEnde ) * Kundenanzahl * Gespräche pro Tag * Speicherdauer
TelNr = 64 Bit
TelNrZiel = 64 Bit
ZeitpunktBeginn = 64 Bit
ZeitpunktEnde = 64 Bit
(Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.)
Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kundenanzahl * Gespräche pro Tag * 185 Tage
Datenaufkommen [in Bit] = (256) * Kundenanzahl * Gespräche pro Tag * 185 Tage
Kunden = unbekannte, weiviel Telefonanschlüsse gibt es bundesweit?
Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik?
Weitere Eckdaten:
Unternehmen Kundenanzahl
NetCologne 500.000
HansaNet 200.000
Arcor 1.600.000
Mobilfunk
TelNrQuelle QuelleIMEI OrtQuell Dienstart TelNrZiel ZielIMEI Zeit_t0 Zeit_t1 x1 Kunden
221–1234567 15 Stellen ZelleIDy ka??? 221–9876543 15-Stellig 16.11.07:16.00 16.11.07:16.22
Mögliche
Datentypen
Int 64bit,un Varchar (20) Int32bit,uns ka? Int 64bit,uns Varchar(20) Int32bit,un Time + date Time + date
20*8 20*8
Bitanzahl 32 160
(Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.)
==> Zur IMEI: Derzeit hat die IMEI 15 Stellen, jedoch bei den Wachstums/Produktionszahlen von Mobilfunkgeräten u.ä. wird man in Zukunft die IMEI wohl vergrößern
Ort = Standort
Quellen:
http://www.rui.de/mobil/codes.html
Internet-Verbindungen
Bei Internet-Verbindungen (nicht TCP/IP-Verbindungen, sondern die Verbindung ins Internet als solche) werden folgende Daten erfasst:
- zugewiesene IP
- Einwahlzeitpunkt
- Einwahldauer
IP Zeitpunkt t0 Dauer x1 Kunden
Mögliche Datentypen
Varchar (15) Time+date 64 bit varchar(4) ???
Bit Anzahl 120 64 4
- IPs sind nur max. 15 Zeichen lang, man kann sie aber auch als Zahlencode Speichern.
- Date-Time kann man als String oder auch als UNIX-Timestamp speichern.
- afaik werden aber nicht nur die IP-s, sondern Hostnames, wenn nicht sogar URLs gespeichert, was erheblich mehr auffwand ist. --CeBe 02:50, 3. Jan 2008 (CET)
x1= Einwahlen pro Kunde
siehe auch http://anti-vorratsdatenspeicherung.mahakala.de/
Für jede im versandte E-Mail werden gespeichert:
- Absender
- Empfänger
- Absender-IP (?)
- Betreffzeile (?)
Das Fragezeichen bei der IP bezeichnet eine Unsicherheit. Die IP wird vermutlich gespeichert, da eine e-Mail-Adresse gefälscht werden kann und erst mit der IP eine brauchbare Information ergibt.
Das Fragezeichen hinter Betreffzeile bezeichnet eine Unsicherheit. Es war mehrfach im Gespräch, dass auch sie gespeichert werden müsste (auch wenn sie nicht zu den eigentlichen Verbindungsdaten zu rechnen ist)
- Ich fände es fantastisch, wenn man hier mal einen Link auf brauchbare Quellen hätte, aus denen der Umfang der zu speichernden Daten hervorginge, weiß da jemand was? Bitte unten anfügen Danke! --Peu 21:57, 5. Jan 2008 (CET)
AbsenderEmail EmpfängerEmail VonIP x1 Kunden
Mögliche Datentypen
Varchar (50) Varchar (50) Varchar (15)
Bitanzahl
400 Bit 400 Bit 120 Bit
(VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.)
Quellen http://www.abgeordnetenwatch.de/vorratsdatenspeicherung-636-140.html
x1= Anzahl Emails pro Kunde
Anzahl Kommunikationsteilnehmer
Stand: 03.01.2008
1. Anzahl der Telefonanschlüsse
Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 wird die Gesamtzahl der Telefonanschlüsse (OHNE Mobilfunk!) Ende 2007 mit 38,12 Mio. angegeben. Wenn man noch den Mobilfunk dazurechnet gibt es:
38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk 96 Mio. Mobilfunkanschlüsse ---------------------------------------------- 134,12 Mio. Telefonanschlüsse gesamt ==============================================
2. Anzahl der Kanäle
Ein Telefon-Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog. ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden.
laut Bundesnetzagentur (früher RegTP) gab es 2007:
53,7 Mio Telefonkanäle im Festnetz (ISDN und PSTN), 96 Mio Kanäle im Mobilfunknetz, 3,9 Mio. VoIP Kanäle über DSL sowie 1,23 Mio. Kanäle über Kabel-TV-Telefonie(Breitbandkabel). ----------------------------------------------------------- 154,83 Mio. Telefonkanäle in Deutschland gesamt ===========================================================
Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h.
man benötigt pro Nummer mindestens 18 bytes.
Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String.
Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt noch ein Trennzeichen (Komma oder Semikolon) hinzu.
In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen pro Anschluss und Tag.
Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen.
Hier müssen auch die Informationen zur Identifikation der Funkzelle berücksichtigt werden, das sind nochmals mindestens 14 bytes.
Das, was hier beschrieben wurde, sind die minimalen Daten, die gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen Aufschlag von 50 - 100% berechnen.
Viele Grüße Bernhard.
Ich habe mal versuch die Daten in ein Python Script zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen.
Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben?
Ergänzungen zum Script sind willkommen.
==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten.
Wie führe ich das Skript aus?
Quellen:
http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25 und Seite 27
http://www.bundesnetzagentur.de/media/archive/12016.pdf
http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/
http://www.tagesschau.de/ausland/meldung12910.html
Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen. Sie beruhen auf den im Gesetz festgelegten Speicherpflichten (http://www.bgblportal.de/BGBL/bgbl1f/bgbl107s3198.pdf ab §113a auf Seite 10).