Gdzie idą dane, które wrzucasz do AI? Czy model je zapamiętuje? Czy ktoś inny może je zobaczyć? Żeby odpowiedzieć uczciwie, trzeba zacząć od początku – od tego, czym model jest fizycznie.
Pytanie o bezpieczeństwo danych w AI jest uzasadnione – i zasługuje na lepszą odpowiedź niż „nasze systemy są bezpieczne”. Żeby naprawdę zrozumieć co się dzieje z danymi, które dajesz modelowi, musisz najpierw wiedzieć czym model jest. Nie w sensie marketingowym – w sensie fizycznym.
Warstwa 01
Model to plik. Duży plik liczb.
Zanim model odpowie na Twoje pytanie, gdzieś musi istnieć. I istnieje w formie, która jest zaskakująco prozaiczna: to plik na dysku. Zawiera miliardy liczb – każda z nich zakodowała jakiś wzorzec z treningu. Nie ma w nim zdań, wspomnień ani tabelek. Tylko liczby. Dla dużego modelu ten plik waży od kilkudziesięciu do kilkuset gigabajtów.
Żeby model mógł działać, ten plik trafia do pamięci kart graficznych – GPU – w centrum danych. Nie do zwykłego serwera, ale do specjalistycznych maszyn z dziesiątkami kart połączonych razem. Jedno Twoje pytanie uruchamia operację matematyczną na miliardach tych liczb, wykonywaną równolegle, w ułamku sekundy.
Plik wag nie zmienia się podczas rozmowy z Tobą. To jak uruchamianie programu – program się wykonuje, ale plik na dysku zostaje niezmieniony. Twoje dane wchodzą jako wejście, wynik wychodzi jako odpowiedź. Model wraca do punktu wyjścia.
Warstwa 02
Okno kontekstu – tymczasowa pamięć robocza
Skoro model to zamrożony plik liczb, to jak w ogóle „wie” o co pytasz? Przez tzw. okno kontekstu – tymczasową przestrzeń, do której trafia wszystko, co bierze udział w bieżącej rozmowie. Twoje pytanie, historia tej rozmowy, dane pobrane przez MCP, instrukcje systemowe. To wszystko jest obecne jednocześnie, jak dokumenty rozłożone na biurku przed ekspertem.
Gdy rozmowa się kończy – biurko jest czyszczone. Nic nie zostaje w modelu. Nic nie trafia do wag. Następna rozmowa zaczyna się od pustego biurka.
Warstwa 03
Wektory – słowo, które brzmi groźniej niż jest
Przy okazji AI często pojawia się słowo „wektor” albo „vector store”. Brzmi technicznie – i budzi niepokój. W rzeczywistości chodzi o sposób zamiany sensu na liczby.
Wyobraź sobie wielowymiarową przestrzeń, w której każde słowo i każde zdanie ma swoje miejsce. Słowa o podobnym znaczeniu są blisko siebie. „Faktura” i „rachunek” – blisko. „Przychód” i „dochód” – blisko. „Pies” i „traktor” – daleko. Wektor to po prostu zestaw współrzędnych w tej przestrzeni.
Vector store to baza takich reprezentacji – używana gdy chcesz, żeby model szybko znalazł właściwy fragment z dużego zbioru dokumentów. Ale model nie „mieszka” w tej bazie i jej nie wchłania. Zagląda do niej, bierze co potrzebne do okna kontekstu i odpowiada. To słownik, nie pamięć.
Warstwa 04
Kalkulator, maszynka statystyczna – a może coś trzeciego?
Mając już obraz tego jak model działa fizycznie, można uczciwie odpowiedzieć na pytanie z tytułu. Kalkulator jest deterministyczny – to samo wejście zawsze daje to samo wyjście, bez żadnego zrozumienia kontekstu. Maszynka statystyczna szuka wzorców w liczbach, ale nie łączy pojęć. Model językowy robi coś trzeciego: rozumie sens, łączy konteksty, wnioskuje – ale nie zapamiętuje Cię i nie uczy się od Ciebie na bieżąco.
Najbliższe określenie to ekspert bez pamięci epizodycznej. Przeczytał wszystko – ale każde spotkanie zaczyna od zera. Przynosisz dokumenty, omawia je z Tobą, wychodzi. Nie zabiera ich ze sobą. Nie dzieli się nimi z kolejnym klientem.
Warstwa 05
Co to znaczy dla bezpieczeństwa Twoich danych
Bez zgody na uczenie modelu Twoje dane nie trafiają do wag. Nie aktualizują modelu ogólnego, nie stają się częścią wiedzy, z której korzystają inni użytkownicy. Model, który odpowiedział na Twoje pytanie dziś, jest identyczny z tym sprzed Twojej rozmowy.
Twoje dane przepływają przez infrastrukturę dostawcy. Fizycznie, przez jego serwery. Dostawca widzi wywołania API. I tu kwestia bezpieczeństwa przenosi się z technikaliów na umowy, jurysdykcję i politykę prywatności – a nie na to, „czy model zapamięta moje dane”.
Odpowiedź na pytanie z tytułu
Nie kupujesz kalkulatora ani maszynki statystycznej. Kupujesz zamrożoną inteligencję z tymczasowym dostępem do Twoich danych.
Model nie uczy się od Ciebie. Nie zapamiętuje Twoich danych. Nie dzieli się nimi z innymi. To co wrzucasz do rozmowy – żyje tylko przez czas tej rozmowy, a potem znika. Plik wag na dysku pozostaje niezmieniony.
Prawdziwe pytanie o bezpieczeństwo nie brzmi „czy model zapamięta moje tajemnice”. Brzmi: „komu ufam że widzi moje wywołania API i czy ta umowa mnie chroni”. To pytanie do prawnika i do polityki prywatności dostawcy – nie do architektury modelu.
DataOrganizer · MCP
DataOrganizer łączy model z danymi Twojego sklepu przez MCP – bez uczenia modelu na Twoich danych, bez zbędnego przechowywania.