O tak, tak, wydatek nr 1- LG Blue Ray
Przygotowanie bazy klientów podzieliłem na 3 etapy:
- formowanie zapytań,
- odpytywanie,
- oraz wyświetlanie.
Etap -wszy1 mam już za mną i niedziela z głowy ... dla lapka (:)). Odpytywanie zajmie pewnie dużo czasu jak i miejsca na dysku:
900 miast po 20.000 nazwisk w każdym, przyniesie ok. 18 milionów zapytań, w którym może być średnio 5 nazwisk na każde z nich. Wynika z tego ok. 90 milionów osób! pikuś
18 mln plików po 40kB, zajmie 720GB!!
(inaczej mówiąc będzie trzeba dokupić nagrywarkę Blue-Ray, najlepiej tanią i jednocześnie dobrej marki np. LG BLUE RAY. Na dwuwarswowej płytce zmieści się 50GB danych, czyli pliki wejdą na 15 płytek, jeśli łaska ;)
No cóź, dopiszemy to do rachunku ...
Szkoda tylko, że ściąganie potrwa 10 dni, przy założeniu, żę będzie 100 procesów ściągania jednocześnie. Niestety to nie komputery kwantowe ;)
Baza, niekoniecznie militarna
Właśnie zauważyłem, że gdzie "diabeł nie może, tam mnie pośle".
Okazało się, że bazy klientów - nowe i te starsze - są niewyobrażalnie drogie. Nie wierzycie? Zapytajcie Orange i Plusa, o Erze nie wspominając. 70.000 za bazę sprzed 2 lat?
Zapewne dlatego, że jest to mieszanka indywidualno-firmowa, coś jak wedlowskie przeboje. Tylko, że ten przebój nijak da się ugryźć. Z pewnością skutecznie odstrasza to wszelkich przyszłych konkurentów tych wielkich sieci.
I pomyśleć, że zaczynali od prostego pomysłu, na którym niejeden kreator wylądował na Tahiti wśród przepięknych tancerek.
I właśnie na tym pomyśle się skupmy. Skoro "góra nie przyjdzie do Mahometa, to Mahomet pójdzie do góry" (czy jakoś tak).
Bazy danych nikt nie jest w stanie skopiować z zaszyfrowanego konta serwera Orange, Plusa, czy Ery lub innej strony. Za to można odwrócić proces, odpytując wyszukiwarkę klientów.
Nie zdradzę tajników, bo widzę w tym setki tysięcy, ale dodam, że miesiąc albo dwa mam z głowy.
No to zacieramy rączki i do pracy. Tancereczki czekają ;))