Datenaufkommen
Aus Freiheit statt Angst!
(Revert, offensichtlicher Vandalismusversuch) |
|||
Zeile 1: | Zeile 1: | ||
- | + | Annahmen und Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen. | |
- | + | ||
- | + | ||
- | + | == Festnetztelefonie == | |
- | + | Bei Telefonaten über das Festnetz werden folgende Verbindungsdaten gespeichert: | |
+ | * Anschlussnummer Quelle (Anrufer) | ||
+ | * Anschlussnummer Ziel (Angerufener) | ||
+ | * Gesprächszeit | ||
+ | * Gesprächsdauer | ||
+ | ---- | ||
+ | Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen): | ||
+ | |||
+ | |||
+ | Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn + | ||
+ | ZeitpunktEnde ) * Kunden * Gespräche pro Tag * Speicherdauer | ||
+ | |||
+ | |||
+ | |||
+ | TelNr = 64 Bit | ||
+ | |||
+ | TelNrZiel = 64 Bit | ||
+ | |||
+ | ZeitpunktBeginn = 64 Bit | ||
+ | |||
+ | ZeitpunktEnde = 64 Bit | ||
+ | |||
+ | (Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.) | ||
+ | |||
+ | Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kunden * Gespräche pro | ||
+ | Tag * 185 Tage | ||
+ | |||
+ | |||
+ | Datenaufkommen [in Bit] = (256) * Kunden * Gespräche pro Tag * 185 Tage | ||
+ | |||
+ | |||
+ | |||
+ | Kunden = unbekannte, weiviel Telefonanschlüsse gibt es bundesweit? | ||
+ | |||
+ | |||
+ | Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik? | ||
+ | |||
+ | |||
+ | Weitere Eckdaten: | ||
+ | |||
+ | Unternehmen Kundenanzahl | ||
+ | |||
+ | NetCologne 500.000 | ||
+ | |||
+ | HansaNet 200.000 | ||
+ | |||
+ | Arcor 1.600.000 | ||
+ | |||
+ | ==Mobilfunk== | ||
+ | |||
+ | |||
+ | |||
- | + | TelNrQuelle QuelleIMEI OrtQuell TelNrZiel ZielIMEI Zeit_t0 Zeit_t1 x1 Kunden | |
- | Warum Religion überflüssig ist | ||
- | Sudoku bei WELT ONLINE | ||
- | Online-Sudoku | ||
- | + | 221–1234567 15 Stellen ZelleIDy 221–9876543 15-Stellig 16.11.07:16.00 16.11.07:16.22 | |
- | + | ||
- | + | ||
- | + | Mögliche | |
- | + | Datentypen | |
- | + | ||
- | + | Int 64bit, uns Varchar (20) Int 32bit, uns Inte 64bit, uns Varchar (20) Int 32bit, un Time + date Time + date | |
- | + | 20*8 20*8 | |
- | + | ||
+ | Bitanzahl 32 160 | ||
+ | |||
+ | (Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.) | ||
- | + | Ort = Standort | |
- | + | ||
- | + | ||
- | + | Quellen: | |
- | + | ||
- | + | http://www.rui.de/mobil/codes.html | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ==Internet-Verbindungen== | |
- | + | Bei Internet-Verbindungen (nicht TCP/IP-Verbindungen, sondern die Verbindung ins Internet als solche) werden folgende Daten erfasst: | |
- | + | * zugewiesene IP | |
+ | * Einwahlzeitpunkt | ||
+ | * Einwahldauer | ||
+ | ---- | ||
+ | |||
+ | IP Zeitpunkt t0 Zeitpunkt t1 x1 Kunden | ||
+ | Mögliche | ||
+ | Datentypen | ||
- | home > Politik | ||
- | Small logo welt | ||
- | URL: http://www.welt.de/politik/article1516290/Barack_Obama_schlaegt_Hillary_Clinton.html | ||
- | + | Varchar (15) Time + date 64 bit (8byte) Time + date 64 bit (8byte) | |
- | + | ||
- | + | ||
- | + | Bit Anzahl 120 64 64 | |
- | + | * IPs sind nur max. 15 Zeichen lang, man kann sie aber [http://de2.php.net/manual/de/function.ip2long.php auch als Zahlencode Speichern.] | |
- | + | * Date-Time kann man als String oder auch als [http://de.wikipedia.org/wiki/Unixzeit UNIX-Timestamp] speichern. | |
- | + | * afaik werden aber nicht nur die IP-s, sondern Hostnames, wenn nicht sogar URLs gespeichert, was erheblich mehr auffwand ist. --[[Benutzer:Cebe|CeBe]] 02:50, 3. Jan 2008 (CET) | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | x1= Einwahlen pro Kunde | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | Um zehn Uhr Iowa-Zeit trat der Sieger vor seine jubelnden Anhänger. Barack Obama sagte: „Sie behaupteten alle, dieser Tag würde nie kommen. Sie sagten, wir griffen zu hoch, das Land sei zu polarisiert. Aber in dieser Januarnacht, in diesem geschichtlichen Moment, habt ihr volbracht, was die Zyniker für ausgeschlossen hielten. Ihr habt gezeigt, was in fünf Tagen in New Hampshire möglich ist, und was Amerika in diesem Jahr 2008 schaffen kann: Der Wechsel in Amerika steht vor der Tür!“ Obama kam nach offiziellen Angaben und nach Auszählung aller Stimmen auf 37,58 Prozent, Clinton auf 29,47 Prozent, geschlagen noch von John Edwards mit 29,75 Prozent. | ||
- | So viele Parteianhänger wie nie zuvor hatten sich an den Vorwahlen beteiligt. Rund 232.000 Wähler gaben ihre Stimme ab, wie die Demokratische Partei mitteilte. Bei den vergangenen Vorwahlen 2004 waren es nur 125.000 gewesen. Experten hatte im Vorfeld vorausgesagt, dass vor allem Barack Obama von einer hohen Wahlbeteiligung profitieren würde. | ||
- | Die Enttäuschung für Hillary Clinton ist bitter, die Begeisterung im Lager Barack Obamas umso gewaltiger. Das Ehepaar Clinton hatte Iowa nach einigem Zögern zu einem Prüfstein der Attraktivität Hillarys im ländlichen Mittleren Westen erklärt – mit dem unausgesprochenen Anspruch auf den ersten Platz. | ||
- | + | ==> Ich habe an meinem heutigen Arbeitstag laut Firewall ~ 9.500 Verbindungen innerhalb von 24h gehabt. | |
- | UMFRAGE | ||
- | . | ||
- | Umfrage | ||
- | Wer wird Ihrer Meinung nach der nächste US-Präsident? | ||
- | Hillary Clinton | ||
- | John Edwards | ||
- | Rudy Giuliani | ||
- | Mike Huckabee | ||
- | John McCain | ||
- | Barack Obama | ||
- | Mitt Romney | ||
- | Jemand anderer | ||
- | abstimmen Ergebnis | ||
- | 38% Hillary Clinton | ||
- | 12% John Edwards | ||
- | 4% Rudy Giuliani | ||
- | 9% Mike Huckabee | ||
- | 3% John McCain | ||
- | 28% Barack Obama | ||
- | 4% Mitt Romney | ||
- | 2% Jemand anderer | ||
- | Aktuell: 8277 Stimmen | ||
- | Denn Obama hat nun bewiesen, dass er in einem nahezu rein weiß geprägten Bundesstaat siegen kann – und darauf, sagen nicht wenige Beobachter, warten viele Schwarze, die bislang unentschieden sind oder für Clinton votieren. Obama hat gezeigt, das er im nationalen Maßstab wählbar ist, und die unsichtbaren Schranken einer „schwarzen“ oder „weißen“ Kandidatur überwinden kann. Mit dem Caucus von Iowa wurde er von einem exotischen Ritter zu einem faszinierenden Kandidaten mit der Aura des gänzlich Neuen. Der frühere Senator John Edwards, der schon seit 2004 unablässig Iowa beackert hatte, kam ebenfalls nur auf 30 Prozent. Das ist viel gegen die bekannte Hillary Clinton, aber wenig gegen den gut aussehenden Obama, der mit seinem Slogan „Wandel, an den man glauben kann“ auch dem gut aussehenden Edwards die Wähler(innen) wegnahm. | ||
- | + | >> Die Anzahl der Tabs etc. ist nicht relevant, da Seitenaufrufe nicht unter die Speicherungspflicht fallen. Das Datenaufkommen - beim Provider! - ist identisch, ob du nun 1 oder 100000 Seiten aufrufst. | |
- | + | ---- | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ==E-Mail== | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | Für jede im versandte E-Mail werden gespeichert: | |
- | + | * Absender | |
- | + | * Empfänger | |
- | + | * Absender-IP (woher stammt diese Information?) | |
+ | (* Betreffzeile) | ||
+ | ---- | ||
+ | (Ob die Betreffzeile gespeichert wird oder nicht ist irrelevant. Sie sollte hier nicht betrachtet werden. Die Vorratsdatenspeicherung gibt die Speicherung des Betreffs nicht her. Wenn der Betreff wirklich gespeichert wird, dann sollte man einen sicheren Beweis dafür haben. Ansonsten sollte man sich, alleine um glaubwürdig zu bleiben, auf das beschränken, was die Vorratsdatenspeicherung erlaubt. Was tatsächlich darüber hinaus ohne gesetzliche Grundlage gespeichert wird oder auch in der Vergangenheit vielleicht schon gespeichert wurde sollte für diese Berechnung des Datenaufkommens nicht betrachtet werden. Sonst wird das am Ende nur als "Verschwörung" oder unglaubwürdig abgetan. Künstliches Aufblähen der Datenmenge bringt es nicht, auch so wird sich schon eine gewaltige Menge ergeben.) | ||
- | + | ||
- | + | Absender Empfänger VonIP x1 Kunden | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | Mögliche Datentypen | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | Varchar (50) Varchar (50) Varchar (15) | |
- | + | ||
- | + | ||
- | + | ||
- | + | Bitanzahl | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | Im US-Bundesstaat Iowa haben die ersten Vorwahlen für die Nachfolge von US-Präsident Bush stattgefunden. Bei den Demokraten setzte sich Barack Obama durch. Seine schärfste Konkurrentin Hillary Clinton verpasste sogar den zweiten Platz – eine bittere Enttäuschung. | ||
- | Kommentar * | ||
- | Ihr Name * | ||
- | Ihre E-Mail * | ||
- | + | 400 Bit 400 Bit 120 Bit | |
- | + | ||
- | + | ||
- | + | ||
- | Kommentar abschicken | ||
- | |||
- | read comment KOMMENTARE | ||
- | ernesto meint: | ||
- | 05.01.2008, 13:24 Uhr | ||
- | Hi, | ||
- | das finde ich aber Toll , ein schwarze als Präsident es wird sicher in die Geschichte eingehen und vielleicht irgendwann auch in Europa möglich sein. Mal seien wo zuerst? | ||
- | anonymouse meint: | ||
- | 04.01.2008, 12:45 Uhr | ||
- | @Marcel Reiling | ||
- | Bei den dems gibt es für den iowa caucus ein komplizierte formel, nach der Cbama 16, Clinton 15 und Edwards 14 Deligierte zur convention schickt. | ||
- | Wenn Obama Clinton in New Hampshire doch noch abhängt, dann ist das Rennen wieder völlig offen. | ||
- | Und Ron Paul als Independent würde viel eher den Demokraten schaden. Das sieht man daran, dass er bei den entrance polls sehr gut bei den Wählern abgeschnitten hat, die sich als "moderate" bezeichnen. | ||
- | Marcel Reiling meint: | ||
- | 04.01.2008, 12:30 Uhr | ||
- | Ich wollte mal fragen wie das jetzt abläuft. | ||
- | Bekommt Obama jetzt alle Delegierte des Staates Iowa für den Parteitag oder bekommen Clinton und Edwards auch noch Delegierte? | ||
- | LARRY meint: | ||
- | 04.01.2008, 11:39 Uhr | ||
- | @RON PAUL FOR PRESIDENT | ||
- | + | (VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.) | |
- | + | ||
+ | |||
+ | |||
+ | x1= Anzahl Emails pro Kunde | ||
- | + | == Anzahl Kommunikationsteilnehmer == | |
+ | ''Stand: 03.01.2008'' | ||
- | + | '''1. Anzahl der Telefonanschlüsse''' | |
- | + | Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 | |
+ | wird die Gesamtzahl der Telefonanschlüsse (OHNE Mobilfunk!) Ende 2007 mit 38,12 Mio. angegeben. | ||
+ | Wenn man noch den Mobilfunk dazurechnet gibt es: | ||
- | + | 38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk | |
+ | 96 Mio. Mobilfunkanschlüsse | ||
+ | ---------------------------------------------- | ||
+ | 134,12 Mio. Telefonanschlüsse gesamt | ||
+ | ============================================== | ||
- | + | '''2. Anzahl der Kanäle''' | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | -- | + | Ein Telefon-Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog. |
- | + | ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie | |
- | + | durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden. | |
- | + | ||
- | + | ||
- | 1 | + | |
- | + | laut Bundesnetzagentur (früher RegTP) gab es 2007: | |
- | + | ||
- | + | ||
- | + | ||
- | + | 53,7 Mio Telefonkanäle im Festnetz (ISDN und PSTN), | |
+ | 96 Mio Kanäle im Mobilfunknetz, | ||
+ | 3,9 Mio. VoIP Kanäle über DSL sowie | ||
+ | 1,23 Mio. Kanäle über Kabel-TV-Telefonie(Breitbandkabel). | ||
+ | ----------------------------------------------------------- | ||
+ | 154,83 Mio. Telefonkanäle in Deutschland gesamt | ||
+ | =========================================================== | ||
- | + | ---- | |
- | + | ||
- | + | ||
- | + | ||
- | Sind Sie ein Nachrichten-Profi? | ||
- | Wissen ist Macht. Aber im täglichen, bunten Info-Dschungel von TV, Internet und Radio kann man leicht den Durchblick verlieren. Was wissen Sie wirklich? mehr... | ||
- | alle Wissenstests und Gewinnspiele | ||
- | Top-Thema: US-Demokraten | ||
- | 78728007 Obama weiß, wie man Gegner schlecht macht | ||
- | Die Vorwahlen in den USA ziehen sich noch über Monate hin, doch Barack Obama hat durchaus das Zeug dazu, am Ende Präsidentschaftskandidat der Demokraten zu werden. Er ist ein begnadeter Redner, spricht die Herzen der Menschen an. Doch das strahlende Lächeln täuscht. Dahinter steckt ein eiskalter Machtpolitiker. | ||
- | + | Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h. | |
- | + | man benötigt pro Nummer mindestens 18 bytes. | |
- | + | Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also | |
- | + | (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die | |
- | + | Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String. | |
- | + | ||
- | + | ||
- | + | ||
- | + | Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt | |
- | + | noch ein Trennzeichen (Komma oder Semikolon) hinzu. | |
- | + | In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man | |
- | + | (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen | |
+ | pro Anschluss und Tag. | ||
- | + | Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit | |
- | + | durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt | |
- | + | ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen. | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | Hier müssen auch die Informationen zur Identifikation der Funkzelle | |
- | + | berücksichtigt werden, das sind nochmals mindestens 14 bytes. | |
- | + | ||
- | + | Das, was hier beschrieben wurde, sind die minimalen Daten, die | |
- | + | gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie | |
- | + | Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen | |
- | + | Aufschlag von 50 - 100% berechnen. | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | Viele Grüße | |
- | + | Bernhard. | |
- | + | ||
- | + | ||
- | + | ----- | |
- | + | ||
- | + | ||
- | - | + | |
- | + | ||
- | Wie gut kennen Sie sich in der Schule aus? | ||
- | Nahezu jeder hat die Klassenstufen eins bis sechs besucht. Aber was ist hängen geblieben? Testen Sie Ihr Wissen und finden Sie heraus, ob Sie schlauer sind als Ihr Kind. mehr... | ||
- | alle Wissenstests und Gewinnspiele | ||
- | Gewinnspiel | ||
- | + | Ich habe mal versuch die Daten in ein [http://pastebin.com/f65094054 Python Script] zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen. | |
- | + | ||
- | + | Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben? | |
- | + | ||
- | + | ||
- | + | Ergänzungen zum Script sind willkommen. | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten. | |
- | + | ||
- | + | ||
- | + | Wie führe ich das Skript aus? | |
- | + | ----- | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | =Quellen:= | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25 und Seite 27 | |
- | + | ||
- | + | http://www.bundesnetzagentur.de/media/archive/12016.pdf | |
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | ||
- | + | http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/ |
Version vom 16:03, 5. Jan. 2008
Annahmen und Berechnungen zum Datenvolumen, das bei den Internet- und Telefonie-Providern anfällt, wenn sie die Vorratsdatenspeicherung umsetzen.
Inhaltsverzeichnis |
Festnetztelefonie
Bei Telefonaten über das Festnetz werden folgende Verbindungsdaten gespeichert:
- Anschlussnummer Quelle (Anrufer)
- Anschlussnummer Ziel (Angerufener)
- Gesprächszeit
- Gesprächsdauer
Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen):
Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + ZeitpunktBeginn +
ZeitpunktEnde ) * Kunden * Gespräche pro Tag * Speicherdauer
TelNr = 64 Bit
TelNrZiel = 64 Bit
ZeitpunktBeginn = 64 Bit
ZeitpunktEnde = 64 Bit
(Die Faxnummer der deutschen Botschaft in Belgrad ist beispielsweise: +381 11 3064-303. 381113064303 passt nicht in 32 Bit, also brauchen man 64 Bit, wenn man es schon als Zahl speichern will.)
Datenaufkommen [in Bit] = (64 + 64 + 64 + 64) * Kunden * Gespräche pro Tag * 185 Tage
Datenaufkommen [in Bit] = (256) * Kunden * Gespräche pro Tag * 185 Tage
Kunden = unbekannte, weiviel Telefonanschlüsse gibt es bundesweit?
Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik?
Weitere Eckdaten:
Unternehmen Kundenanzahl
NetCologne 500.000
HansaNet 200.000
Arcor 1.600.000
Mobilfunk
TelNrQuelle QuelleIMEI OrtQuell TelNrZiel ZielIMEI Zeit_t0 Zeit_t1 x1 Kunden
221–1234567 15 Stellen ZelleIDy 221–9876543 15-Stellig 16.11.07:16.00 16.11.07:16.22
Mögliche
Datentypen
Int 64bit, uns Varchar (20) Int 32bit, uns Inte 64bit, uns Varchar (20) Int 32bit, un Time + date Time + date
20*8 20*8
Bitanzahl 32 160
(Telefonnummern auch hier 64bit, wie oben. Wenn die IMEI immer 15 Stellen hat, warum sollte man die in einem Varchar(20) speichern? Um das Datenaufkommen willkürlich zu erhöhen? Bitte ändern, wenn es dafür keinen Grund gibt. Und wenn wir gerade dabei sind: Warum speichert man Telefonnummern als Zahl, aber die IMEI als String? Das würde doch vermutlich beides den selben Datentyp nutzen.)
Ort = Standort
Quellen:
http://www.rui.de/mobil/codes.html
Internet-Verbindungen
Bei Internet-Verbindungen (nicht TCP/IP-Verbindungen, sondern die Verbindung ins Internet als solche) werden folgende Daten erfasst:
- zugewiesene IP
- Einwahlzeitpunkt
- Einwahldauer
IP Zeitpunkt t0 Zeitpunkt t1 x1 Kunden
Mögliche Datentypen
Varchar (15) Time + date 64 bit (8byte) Time + date 64 bit (8byte)
Bit Anzahl 120 64 64
- IPs sind nur max. 15 Zeichen lang, man kann sie aber auch als Zahlencode Speichern.
- Date-Time kann man als String oder auch als UNIX-Timestamp speichern.
- afaik werden aber nicht nur die IP-s, sondern Hostnames, wenn nicht sogar URLs gespeichert, was erheblich mehr auffwand ist. --CeBe 02:50, 3. Jan 2008 (CET)
x1= Einwahlen pro Kunde
==> Ich habe an meinem heutigen Arbeitstag laut Firewall ~ 9.500 Verbindungen innerhalb von 24h gehabt.
>> Die Anzahl der Tabs etc. ist nicht relevant, da Seitenaufrufe nicht unter die Speicherungspflicht fallen. Das Datenaufkommen - beim Provider! - ist identisch, ob du nun 1 oder 100000 Seiten aufrufst.
Für jede im versandte E-Mail werden gespeichert:
- Absender
- Empfänger
- Absender-IP (woher stammt diese Information?)
(* Betreffzeile)
(Ob die Betreffzeile gespeichert wird oder nicht ist irrelevant. Sie sollte hier nicht betrachtet werden. Die Vorratsdatenspeicherung gibt die Speicherung des Betreffs nicht her. Wenn der Betreff wirklich gespeichert wird, dann sollte man einen sicheren Beweis dafür haben. Ansonsten sollte man sich, alleine um glaubwürdig zu bleiben, auf das beschränken, was die Vorratsdatenspeicherung erlaubt. Was tatsächlich darüber hinaus ohne gesetzliche Grundlage gespeichert wird oder auch in der Vergangenheit vielleicht schon gespeichert wurde sollte für diese Berechnung des Datenaufkommens nicht betrachtet werden. Sonst wird das am Ende nur als "Verschwörung" oder unglaubwürdig abgetan. Künstliches Aufblähen der Datenmenge bringt es nicht, auch so wird sich schon eine gewaltige Menge ergeben.)
Absender Empfänger VonIP x1 Kunden
Mögliche Datentypen
Varchar (50) Varchar (50) Varchar (15)
Bitanzahl
400 Bit 400 Bit 120 Bit
(VonIP war auf unrealistische 50 Zeichen gesetzt, schon oben waren es nur 15. Dafür sind die anderen Felder viel zu klein.)
x1= Anzahl Emails pro Kunde
Anzahl Kommunikationsteilnehmer
Stand: 03.01.2008
1. Anzahl der Telefonanschlüsse
Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 wird die Gesamtzahl der Telefonanschlüsse (OHNE Mobilfunk!) Ende 2007 mit 38,12 Mio. angegeben. Wenn man noch den Mobilfunk dazurechnet gibt es:
38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk 96 Mio. Mobilfunkanschlüsse ---------------------------------------------- 134,12 Mio. Telefonanschlüsse gesamt ==============================================
2. Anzahl der Kanäle
Ein Telefon-Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog. ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden.
laut Bundesnetzagentur (früher RegTP) gab es 2007:
53,7 Mio Telefonkanäle im Festnetz (ISDN und PSTN), 96 Mio Kanäle im Mobilfunknetz, 3,9 Mio. VoIP Kanäle über DSL sowie 1,23 Mio. Kanäle über Kabel-TV-Telefonie(Breitbandkabel). ----------------------------------------------------------- 154,83 Mio. Telefonkanäle in Deutschland gesamt ===========================================================
Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h.
man benötigt pro Nummer mindestens 18 bytes.
Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String.
Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt noch ein Trennzeichen (Komma oder Semikolon) hinzu.
In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen pro Anschluss und Tag.
Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen.
Hier müssen auch die Informationen zur Identifikation der Funkzelle berücksichtigt werden, das sind nochmals mindestens 14 bytes.
Das, was hier beschrieben wurde, sind die minimalen Daten, die gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen Aufschlag von 50 - 100% berechnen.
Viele Grüße Bernhard.
Ich habe mal versuch die Daten in ein Python Script zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen.
Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben?
Ergänzungen zum Script sind willkommen.
==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten.
Wie führe ich das Skript aus?
Quellen:
http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25 und Seite 27
http://www.bundesnetzagentur.de/media/archive/12016.pdf
http://www.heuken.com/handy-geklaut-oder-verloren-handy-mit-der-imei-nummer-sperren/