naukowcy minionych wieków stwierdzali, że pierwsze strony ich tablic logarytmicznych systematycznie zużywały się szybciej niż ostatnie. Inaczej mówiąc, mimo że nadreprezentacja małych liczb nie była celowym działaniem uczonych, częściej poszukiwano liczb zaczynających się od 1, 2 lub 3 niż tych, które zaczynają się od 7, 8 lub 9. Jak gdyby natura, oferując im takie, a nie inne liczby, sama tworzyła ową nierównowagę.
Ta obserwacja mogłaby im dać do myślenia. Niestety, większość z nich nie uznała tego zjawiska za godne uwagi. Łatwo przeoczyć oczywistość, gdy się jej nie szuka. Przez trzy stulecia naukowcy z całego świata mieli prawo Benforda tuż przed oczami – i nikt go nie zauważył.
Trzeba było poczekać do schyłku XIX wieku, by ktoś rzucił nieco światła na tę tajemniczą prawidłowość.
W 1881 roku kanadyjski astronom i matematyk Simon Newcomb opublikował artykuł zatytułowany Note on the Frequency of Use of the Differents Digits in Natural Numbers (O częstości użycia różnych cyfr w liczbach naturalnych). Jego tekst, wydrukowany na łamach „The American Journal Of Mathematics”, liczy zaledwie dwie strony. Newcomb wskazuje w nim na nierównomierne zużycie stron swoich tablic logarytmicznych i skrótowo rozważa kwestię rozkładu pierwszych cyfr, traktując ją jako ciekawostkę.
Pechowo dla naukowca jego odkrycie przechodzi prawie niezauważone.
Trzeba powiedzieć, że w oczach specjalistów matematyka stojąca za tym zjawiskiem jest dosyć prosta i niezbyt godna uwagi. Ale przecież nie same obliczenia są tutaj ważne, ale to, co mówią nam one o świecie. Wydaje się, że w 1881 roku nikt nie zrozumiał, że Newcomb odsłonił jeden z owych gigantycznych trybików napędzających zakulisową machinę wszechświata. Wobec czego trzeba było poczekać jeszcze pięćdziesiąt lat, aż Frank Benford dostrzeże doniosłość zjawiska i opisze je szczegółowo w swoim dwudziestostronicowym artykule.
Mimo lekkości, z jaką Newcomb potraktował temat, jego artykuł jest pouczający i zasługuje na to, by na chwilę się przy nim zatrzymać. Wypływa z niego prosty wiosek: rozkład liczb na świecie jest regularny, ale z multiplikatywnego punktu widzenia!
Tym samym, biorąc listę danych opisujących dowolne zjawisko naturalne, otrzymamy tyle samo liczb między 1 a 2 co między 2 a 4 oraz między 4 a 8. Po prostu dlatego, że pod względem multiplikatywnym odstępy między nimi okażą się równe. Każdy obejmuje interwał od pojedynczej wartości po jej dwukrotność. W sposób naturalny wynika z tego, że liczb zaczynających się od 1 lub 2 jest więcej niż tych, które rozpoczynają się od 7, 8 lub 9.
Jaśniej mówiąc, jeśli wydaje się nam, że wiodące cyfry liczb nie rozkładają się równomiernie, to dlatego, że skupiamy się na złej informacji: to ich logarytmy rozkładają się równomiernie. Weź listę cen z supersamu, średnic planet Układu Słonecznego czy długości rzek, a następnie znajdź ich logarytmy. Otrzymasz liczby, które zaczynają się z równą częstością od 1, 2, 3, 4, 5, 6, 7, 8 i 9. Logarytmom Napiera udało się tak przekształcić multiplikatywny rozkład świata, by dopasować go do naszego addytywnego postrzegania liczb.
Opierając się na tym twierdzeniu, Simon Newcomb stworzył teoretyczny schemat rozkładu liczb wiodących. Co za fart! Ów teoretyczny model idealnie pokrywa się z faktycznym rozkładem zaobserwowanym przez Franka Benforda pięćdziesiąt lat później. Kiedy teoria jest zgodna z wynikami doświadczeń, naukowcy promienieją szczęściem. Możemy wówczas mieć pewność, że właściwie rozumiemy to, co się dzieje w otaczającym nas świecie.
Okej, wiemy, że świat woli mnożenie, pozostaje jednak ostatnie pytanie: dlaczego? Dlaczego rzeczywistość zdaje się w każdym wypadku przedkładać jeden typ rozkładu nad inny?
Raz jeszcze odpowiedź nie tkwi w naturze, lecz w nieadekwatności postrzegania jej przez ludzi. Ponieważ prawo Benforda jest uniwersalne, nie ma żadnego powodu, by zależało od ludzkiej percepcji.
Na przykład europejscy geografowie z kontynentu mierzą rzeki w kilometrach, podczas gdy Anglicy robią to w milach. Tym samym, w zależności od tego, po której stronie kanału La Manche się znajdziemy, Nil będzie liczył albo 6650 km (podana wartość zaczyna się od 6), albo 4130 mil (zaczyna się od 4). Pierwsza cyfra długości każdej rzeki świata będzie się zmieniać zależnie od tego, czy dokonujemy pomiaru kontynentalnie czy po angielsku. Można by sądzić, że tego rodzaju zmiana jednostki miary przetasuje globalny rozkład cyfr wiodących i że angielscy uczeni nie korzystają ze swoich tablic logarytmicznych tak samo jak Europejczycy na kontynencie. Ale tak nie jest.
Kilometry i mile są ludzkim wynalazkiem, a natura ma w nosie to, jakiej arbitralnej jednostki używa się do jej opisu. W ujęciu indywidualnym pierwsza cyfra długości każdej rzeki będzie inna na kontynencie i na Wyspach, ale gdy stworzy się kompletną listę rzek świata, ogólny rozkład cyfr wiodących powinien pozostać taki sam.
Inaczej mówiąc, prawo Benforda jest niezmiennicze. Tak jak wynik mezopotamskiego mnożenia pozostaje identyczny bez względu na liczba brakujących przecinków i zer, jak odsetek liter E w odpowiednio długim tekście zawsze będzie bliski 8,91 % bez względu na treść, tak rozkład cyfr wiodących jest niezmienny bez względu na sposób, w jaki dokonujemy pomiaru natury i zbieramy dane.
Jeżeli wpadnie ci do głowy, by pobawić się w statystyka w supermarketach rozmieszczonych w różnych zakątkach świata, stwierdzisz, że prawa Benforda nie obchodzi, czy zebrane ceny są w juanach, dolarach czy dinarach. Będzie identyczne we wszystkich walutach.
Zmiana jednostki miary – nieważne, czy chodzi o przejście z kilometrów na mile, z euro na dinary, czy cokolwiek innego – polega na mnożeniu. Rzeka dwukrotnie dłuższa od innej rzeki zawsze będzie dwukrotnie dłuższa bez względu na jednostkę miary. Trzykrotnie droższy ser zawsze będzie trzykrotnie droższy bez względu na walutę. Zmiana jednostki miary nie zmienia różnicy multiplikatywnej. Biorąc pierwszą lepszą listę danych, znajdziemy więc ten sam stosunek liczb między 1 a 2 co między 2 a 4 i między 4 a 8. To tę właśnie rozbieżność multiplikatywną należy uwzględniać.
Oto dlaczego świat jest multiplikatywny. Oto dlaczego skale logarytmiczne są tak adekwatne. Oto dlaczego nasz system liczbowy bywa nieintuicyjny. I oto dlaczego prawo Benforda jest prawdziwe, piękne i uniwersalne.
W kolejnych latach prawo Benforda znalazło kilka konkretnych zastosowań.
W 1972 roku amerykański ekonomista Hal Varian zaproponował, by używać go do wykrywania oszustw. Zasada jest prosta: gdy ktoś fałszuje listę danych liczbowych na swoją korzyść, robi to źle. A dokładniej, wymyślone przez malwersanta liczby charakteryzują się nieodpowiednim rozkładem cyfr wiodących. Stwierdzono między innymi, że podrobione liczby zaczynają się od 5 lub 6 częściej, niż powinny. Być może dlatego, że oszustom wydaje się, że środkowe cyfry zostaną uznane za mniej podejrzane lub zwyklejsze niż liczby zaczynające się od 1 lub 9. Tak czy inaczej, owo błędne mniemanie sprawia, że 5 i 6 pojawiają się jako cyfry wiodące o wiele częściej, niżby należało. Zakres tej rozbieżności pozwala oszacować skalę potencjalnych oszustw. Metody tej użyto na przykład, by namierzyć nieprawidłowości statystyczne w deklaracjach podatkowych oraz by wykryć oszustwa wyborcze.
Trzeba jednak powiedzieć otwarcie: jeżeli pominąć kilka niemających ze sobą wiele wspólnego zastosowań, prawo Benforda wpływa na naszą codzienność tylko w niewielkim stopniu. To, że są mu podporządkowane ceny w twoim markecie, jest interesujące, ale niekoniecznie przydatne. W każdym razie nie bardziej niż świadomość, że podlegają mu również populacje miast, rzeki świata lub ciała niebieskie. Dobrze to czy źle, sam zdecyduj.
Ale droga, którą wiedzie nas ciekawość, obfituje w niespodzianki. Jasne, zrozumienie czegoś tylko po to, by to pojąć, jako ćwiczenie intelektualne dla zaspokojenia potrzeb umysłu, bez oczekiwania czegokolwiek w zamian, może być szalenie satysfakcjonujące. Jednak nawet najbardziej nieprzydatne