Datenaufkommen

Aus Freiheit statt Angst!

(Unterschied zwischen Versionen)
Wechseln zu: Navigation, Suche
(Revert, offensichtlicher Vandalismusversuch)
Aktuelle Version (00:36, 10. Jan. 2009) (bearbeiten) (rückgängig)
K (Internet-Verbindungen)
 
(Der Versionsvergleich bezieht 20 dazwischen liegende Versionen mit ein.)
Zeile 1: Zeile 1:
-
Annahmen und Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen.
+
{{überarbeiten}}
 +
 +
== noch zu betrachten ==
 +
* IP wird bei VoIP-Gesprächen gespeichert
 +
* Dienstart wird ebenfalls gespeichert.
 +
==>> SMS, MMS werden auch protokolliert
 +
* e-Mails gehen auch oft an mehr als einen Empfänger gleichzeitig
 +
* Anonymisierungsdienste ggf.
== Festnetztelefonie ==
== Festnetztelefonie ==
Zeile 13: Zeile 20:
Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn +
Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn +
-
ZeitpunktEnde ) * Kunden * Gespräche pro Tag * Speicherdauer
+
ZeitpunktEnde ) * Kundenanzahl * Gespräche pro Tag * Speicherdauer
Zeile 27: Zeile 34:
(Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.)
(Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.)
-
Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kunden * Gespräche pro
+
Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kundenanzahl * Gespräche pro
Tag * 185 Tage
Tag * 185 Tage
-
Datenaufkommen [in Bit] = (256) * Kunden * Gespräche pro Tag * 185 Tage
+
Datenaufkommen [in Bit] = (256) * Kundenanzahl * Gespräche pro Tag * 185 Tage
Zeile 57: Zeile 64:
-
TelNrQuelle QuelleIMEI OrtQuell TelNrZiel ZielIMEI Zeit_t0 Zeit_t1 x1 Kunden
+
TelNrQuelle QuelleIMEI OrtQuell Dienstart TelNrZiel ZielIMEI Zeit_t0 Zeit_t1 x1 Kunden
-
221–1234567 15 Stellen ZelleIDy 221–9876543 15-Stellig 16.11.07:16.00 16.11.07:16.22
+
221–1234567 15 Stellen ZelleIDy ka??? 221–9876543 15-Stellig 16.11.07:16.00 16.11.07:16.22
Zeile 67: Zeile 74:
Datentypen
Datentypen
-
Int 64bit, uns Varchar (20) Int 32bit, uns Inte 64bit, uns Varchar (20) Int 32bit, un Time + date Time + date
+
Int 64bit,un Varchar (20) Int32bit,uns ka? Int 64bit,uns Varchar(20) Int32bit,un Time + date Time + date
20*8 20*8
20*8 20*8
Zeile 73: Zeile 80:
(Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.)
(Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.)
 +
 +
 +
==> Zur IMEI: Derzeit hat die IMEI 15 Stellen, jedoch bei den Wachstums/Produktionszahlen von Mobilfunkgeräten u.ä. wird man in Zukunft die IMEI wohl vergrößern
 +
Ort = Standort
Ort = Standort
Zeile 89: Zeile 100:
-
IP Zeitpunkt t0 Zeitpunkt t1 x1 Kunden
+
IP Zeitpunkt t0 Dauer x1 Kunden
Mögliche
Mögliche
Datentypen
Datentypen
-
Varchar (15) Time + date 64 bit (8byte) Time + date 64 bit (8byte)
+
Varchar (15) Time+date 64 bit varchar(4) ???
-
Bit Anzahl 120 64 64
+
Bit Anzahl 120 64 4
* IPs sind nur max. 15 Zeichen lang, man kann sie aber [http://de2.php.net/manual/de/function.ip2long.php auch als Zahlencode Speichern.]
* IPs sind nur max. 15 Zeichen lang, man kann sie aber [http://de2.php.net/manual/de/function.ip2long.php auch als Zahlencode Speichern.]
Zeile 108: Zeile 119:
-
==> Ich habe an meinem heutigen Arbeitstag laut Firewall ~ 9.500 Verbindungen innerhalb von 24h gehabt.
 
- 
- 
-
>> Die Anzahl der Tabs etc. ist nicht relevant, da Seitenaufrufe nicht unter die Speicherungspflicht fallen. Das Datenaufkommen - beim Provider! - ist identisch, ob du nun 1 oder 100000 Seiten aufrufst.
 
 +
siehe auch http://anti-vorratsdatenspeicherung.mahakala.de/
----
----
Zeile 120: Zeile 128:
* Absender
* Absender
* Empfänger
* Empfänger
-
* Absender-IP (woher stammt diese Information?)
+
* Absender-IP (?)
-
(* Betreffzeile)
+
* Betreffzeile (?)
----
----
-
(Ob die Betreffzeile gespeichert wird oder nicht ist irrelevant. Sie sollte hier nicht betrachtet werden. Die Vorratsdatenspeicherung gibt die Speicherung des Betreffs nicht her. Wenn der Betreff wirklich gespeichert wird, dann sollte man einen sicheren Beweis dafür haben. Ansonsten sollte man sich, alleine um glaubwürdig zu bleiben, auf das beschränken, was die Vorratsdatenspeicherung erlaubt. Was tatsächlich darüber hinaus ohne gesetzliche Grundlage gespeichert wird oder auch in der Vergangenheit vielleicht schon gespeichert wurde sollte für diese Berechnung des Datenaufkommens nicht betrachtet werden. Sonst wird das am Ende nur als "Verschwörung" oder unglaubwürdig abgetan. Künstliches Aufblähen der Datenmenge bringt es nicht, auch so wird sich schon eine gewaltige Menge ergeben.)
+
Das Fragezeichen bei der IP bezeichnet eine Unsicherheit. Die IP wird vermutlich gespeichert, da eine e-Mail-Adresse gefälscht werden kann und erst mit der IP eine brauchbare Information ergibt.
 +
 
 +
Das Fragezeichen hinter Betreffzeile bezeichnet eine Unsicherheit. Es war mehrfach im Gespräch, dass auch sie gespeichert werden müsste (auch wenn sie nicht zu den eigentlichen Verbindungsdaten zu rechnen ist)
 +
: Ich fände es fantastisch, wenn man hier mal einen '''Link auf brauchbare Quellen''' hätte, aus denen der Umfang der zu speichernden Daten hervorginge, weiß da jemand was? '''Bitte unten anfügen''' Danke! --[[Benutzer:Peu|Peu]] 21:57, 5. Jan 2008 (CET)
-
Absender Empfänger VonIP x1 Kunden
+
AbsenderEmail EmpfängerEmail VonIP x1 Kunden
Mögliche Datentypen
Mögliche Datentypen
Zeile 140: Zeile 151:
(VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.)
(VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.)
-
+
Quellen
 +
http://www.abgeordnetenwatch.de/vorratsdatenspeicherung-636-140.html
Zeile 229: Zeile 241:
http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/
http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/
 +
 +
http://www.tagesschau.de/ausland/meldung12910.html
 +
 +
Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen. Sie beruhen auf den im Gesetz festgelegten Speicherpflichten (http://www.bgblportal.de/BGBL/bgbl1f/bgbl107s3198.pdf ab §113a auf Seite 10).

Aktuelle Version

Dieser Artikel oder Abschnitt bedarf einer Überarbeitung. Näheres ist auf der Diskussionsseite angegeben. Hilf bitte mit, ihn zu verbessern, und entferne anschließend diese Markierung.


Inhaltsverzeichnis

noch zu betrachten

  • IP wird bei VoIP-Gesprächen gespeichert
  • Dienstart wird ebenfalls gespeichert.
==>> SMS, MMS werden auch protokolliert
  • e-Mails gehen auch oft an mehr als einen Empfänger gleichzeitig
  • Anonymisierungsdienste ggf.

Festnetztelefonie

Bei Telefonaten über das Festnetz werden folgende Verbindungsdaten gespeichert:

  • Anschlussnummer Quelle (Anrufer)
  • Anschlussnummer Ziel (Angerufener)
  • Gesprächszeit
  • Gesprächsdauer

Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen):


Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn + ZeitpunktEnde ) * Kundenanzahl * Gespräche pro Tag * Speicherdauer


TelNr = 64 Bit

TelNrZiel = 64 Bit

ZeitpunktBeginn = 64 Bit

ZeitpunktEnde = 64 Bit

(Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.)

Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kundenanzahl * Gespräche pro Tag * 185 Tage


Datenaufkommen [in Bit] = (256) * Kundenanzahl * Gespräche pro Tag * 185 Tage


Kunden = unbekannte, weiviel Telefonanschlüsse gibt es bundesweit?


Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik?


Weitere Eckdaten:

Unternehmen Kundenanzahl

NetCologne 500.000

HansaNet 200.000

Arcor 1.600.000

Mobilfunk

   TelNrQuelle	    QuelleIMEI	 OrtQuell     Dienstart TelNrZiel	ZielIMEI       Zeit_t0             Zeit_t1	  x1	Kunden 


   221–1234567   15 Stellen     ZelleIDy     ka???     221–9876543	15-Stellig     16.11.07:16.00      16.11.07:16.22			


Mögliche Datentypen

  Int 64bit,un   Varchar (20)	Int32bit,uns	ka?    Int 64bit,uns   Varchar(20)  Int32bit,un	  Time + date       Time + date 		

20*8 20*8

Bitanzahl 32 160

(Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.)


==> Zur IMEI: Derzeit hat die IMEI 15 Stellen, jedoch bei den Wachstums/Produktionszahlen von Mobilfunkgeräten u.ä. wird man in Zukunft die IMEI wohl vergrößern


Ort = Standort


Quellen:

http://www.rui.de/mobil/codes.html

Internet-Verbindungen

Bei Internet-Verbindungen (nicht TCP/IP-Verbindungen, sondern die Verbindung ins Internet als solche) werden folgende Daten erfasst:

  • zugewiesene IP
  • Einwahlzeitpunkt
  • Einwahldauer


               IP	       Zeitpunkt t0    Dauer   x1	Kunden

Mögliche Datentypen


             Varchar (15)     Time+date 64 bit        varchar(4)   ???			


Bit Anzahl 120 64 4

  • IPs sind nur max. 15 Zeichen lang, man kann sie aber auch als Zahlencode Speichern.
  • Date-Time kann man als String oder auch als UNIX-Timestamp speichern.
  • afaik werden aber nicht nur die IP-s, sondern Hostnames, wenn nicht sogar URLs gespeichert, was erheblich mehr auffwand ist. --CeBe 02:50, 3. Jan 2008 (CET)

x1= Einwahlen pro Kunde



siehe auch http://anti-vorratsdatenspeicherung.mahakala.de/


E-Mail

Für jede im versandte E-Mail werden gespeichert:

  • Absender
  • Empfänger
  • Absender-IP (?)
  • Betreffzeile (?)

Das Fragezeichen bei der IP bezeichnet eine Unsicherheit. Die IP wird vermutlich gespeichert, da eine e-Mail-Adresse gefälscht werden kann und erst mit der IP eine brauchbare Information ergibt.

Das Fragezeichen hinter Betreffzeile bezeichnet eine Unsicherheit. Es war mehrfach im Gespräch, dass auch sie gespeichert werden müsste (auch wenn sie nicht zu den eigentlichen Verbindungsdaten zu rechnen ist)

Ich fände es fantastisch, wenn man hier mal einen Link auf brauchbare Quellen hätte, aus denen der Umfang der zu speichernden Daten hervorginge, weiß da jemand was? Bitte unten anfügen Danke! --Peu 21:57, 5. Jan 2008 (CET)


                         AbsenderEmail	    EmpfängerEmail	        VonIP	        x1	    Kunden

Mögliche Datentypen

                        Varchar (50)	     Varchar (50)	Varchar (15)			

Bitanzahl


                        400 Bit	     400 Bit	        120 Bit	        	


(VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.)

Quellen http://www.abgeordnetenwatch.de/vorratsdatenspeicherung-636-140.html


x1= Anzahl Emails pro Kunde

Anzahl Kommunikationsteilnehmer

Stand: 03.01.2008

1. Anzahl der Telefonanschlüsse

Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 wird die Gesamtzahl der Telefonanschlüsse (OHNE Mobilfunk!) Ende 2007 mit 38,12 Mio. angegeben. Wenn man noch den Mobilfunk dazurechnet gibt es:

 38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk
 96 Mio.    Mobilfunkanschlüsse     
----------------------------------------------
134,12 Mio. Telefonanschlüsse gesamt
==============================================

2. Anzahl der Kanäle

Ein Telefon-Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog. ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden.

laut Bundesnetzagentur (früher RegTP) gab es 2007:

 53,7 Mio   Telefonkanäle im Festnetz (ISDN und PSTN),
 96 Mio     Kanäle im Mobilfunknetz,
  3,9 Mio.  VoIP Kanäle über DSL sowie
  1,23 Mio. Kanäle über Kabel-TV-Telefonie(Breitbandkabel).
-----------------------------------------------------------
154,83 Mio. Telefonkanäle in Deutschland gesamt
===========================================================


Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h. man benötigt pro Nummer mindestens 18 bytes.

Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String.

Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt noch ein Trennzeichen (Komma oder Semikolon) hinzu.

In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen pro Anschluss und Tag.

Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen.

Hier müssen auch die Informationen zur Identifikation der Funkzelle berücksichtigt werden, das sind nochmals mindestens 14 bytes.

Das, was hier beschrieben wurde, sind die minimalen Daten, die gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen Aufschlag von 50 - 100% berechnen.

Viele Grüße Bernhard.



Ich habe mal versuch die Daten in ein Python Script zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen.

Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben?

Ergänzungen zum Script sind willkommen.

==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten.

Wie führe ich das Skript aus?


Quellen:

http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25 und Seite 27

http://www.bundesnetzagentur.de/media/archive/12016.pdf

http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/

http://www.tagesschau.de/ausland/meldung12910.html

Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen. Sie beruhen auf den im Gesetz festgelegten Speicherpflichten (http://www.bgblportal.de/BGBL/bgbl1f/bgbl107s3198.pdf ab §113a auf Seite 10).

Persönliche Werkzeuge
Werkzeuge