Sólin Sólin Rís 07:52 • sest 19:24 í Reykjavík
Tunglið Tunglið Rís 18:30 • Sest 08:08 í Reykjavík
Flóð Flóð Árdegis: 06:11 • Síðdegis: 18:31 í Reykjavík
Fjaran Fjara Árdegis: 00:03 • Síðdegis: 12:27 í Reykjavík
Sólin Sólin Rís 07:52 • sest 19:24 í Reykjavík
Tunglið Tunglið Rís 18:30 • Sest 08:08 í Reykjavík
Flóð Flóð Árdegis: 06:11 • Síðdegis: 18:31 í Reykjavík
Fjaran Fjara Árdegis: 00:03 • Síðdegis: 12:27 í Reykjavík
LeiðbeiningarTil baka

Sendu inn spurningu

Hér getur þú sent okkur nýjar spurningar um vísindaleg efni.

Hafðu spurninguna stutta og hnitmiðaða og sendu aðeins eina í einu. Einlægar og vandaðar spurningar um mikilvæg efni eru líklegastar til að kalla fram vönduð og greið svör. Ekki er víst að tími vinnist til að svara öllum spurningum.

Persónulegar upplýsingar um spyrjendur eru eingöngu notaðar í starfsemi vefsins, til dæmis til að svör verði við hæfi spyrjenda. Spurningum er ekki sinnt ef spyrjandi villir á sér heimildir eða segir ekki nægileg deili á sér.

Spurningum sem eru ekki á verksviði vefsins er eytt.

Að öðru leyti er hægt að spyrja Vísindavefinn um allt milli himins og jarðar!

=

Hvað er lögmál Benfords og hvernig er hægt að nota það?

Nanna Kristjánsdóttir

Spurningin í fullri lengd hljóðaði svona:

Ég rakst á nokkuð skemmtilegt lögmáli í dag sem heitir „Benford's law“ eða lögmál Benfords. Getið þið útskýrt fyrir mig hvað lögmálið gengur út á og hvernig það er notað í vísindaheiminum?

Lögmál Benfords er kennt við bandaríska rafmagnsverkfræðinginn og eðlisfræðinginn Frank Benford (1883-1948). Eins og spyrjandi nefnir er það vissulega skemmtilegt lögmál, eitt af þeim sem gefur aðra niðurstöðu en mætti ætla við fyrstu sýn.

Ímyndum okkur að við séum með gagnasett (e. dataset) af nokkrum stærðarþrepum, til dæmis um mannfjölda í löndum, lengd áa á Íslandi eða upphæð færslna á bankareikningi.[1] Ef við skoðum fyrsta stafinn í hverri tölu í gagnasettinu, hverjar eru þá líkurnar á að sú tala sé 1?

Í fyrstu mætti ætla að allar tölurnar sem í boði eru, það er tölurnar frá 1 og upp í 9, séu jafn líklegar til að vera fyrsta talan og að líkurnar á að 1 sé sú fyrsta séu því um 11%. Lögmál Benfords segir hins vegar að svo svo sé aldeilis ekki. Líkurnar á að fyrsta talan sé 1 eru nefnilega næstum þrefalt hærri, eða um 30%. Hvernig stendur á því?

Byrjum á að takmarka mjög fjölda talna sem gildin í gagnasettinu geta tekið. Ef við höfum aðeins tölurnar 1 og 2, þá byrja 50% þeirra talna á tölunni 1. Ef við hækkum hins vegar fjölda talna upp í tíu, þá byrja 20% þeirra á tölunni 1 (það er 1 og 10). Ef við fjölgum tölunum upp í 20, þá byrja 55% talnanna á 1 (1, 10, 11 o.s.frv.). Þegar við hækkum upp í 100 erum við aftur búin að lækka fjölda talnanna sem byrja á einum, niður í 12%.

Ef við höldum svona áfram með hærri og hærri tölur, þá segir lögmál Benfords okkur að fyrir hverja tölu $k$ frá 1 upp í 9, þá eru líkurnar á því að tala byrji á tölunni $k$, táknað $P(k)$ eftirfarandi$$P(k)=\log_{10}\bigg(1+\frac{1}{k}\bigg)$$ Þessa líkindadreifingu má sjá á myndinni hér fyrir neðan:

Líkindadreifing fyrir lögmál Benfords.

Líkurnar á að tala byrji á 1 eru því $$P(1)= \log_{10}\bigg(1+\frac{1}{1}\bigg)\approx0.30$$

Athugið að þetta gildir ekki fyrir hvaða gagnasett sem er. Ef ætlunin er til dæmis að skoða hæð fólks í metrum kemur það aldrei fyrir að tala yfir tveimur sé fremst. Þetta gildir hins vegar fyrir mjög mörg gagnasett og hefur lögmálið meðal annars verið notað til að koma upp um fjársvik. Í tilvikum þar sem svindlarar hafa búið til tölur, en ekki gætt að lögmáli Benfords, er hægt að greina tölurnar og ef þær fylgja lögmálinu ekki eru þær að öllum líkindum tilbúningur.

Skoða má ýmis gagnasett og sjá hversu vel þau fylgja lögmálinu. Myndin hér fyrir neðan sýnir til dæmis í hvaða hlutfalli tölur koma fram sem fyrsta talan þegar íbúafjöldi í 104 þéttbýlisstöðum á Íslandi árið 2024 er skoðaður.

Eins og sjá má fylgja hlutföllin lögmálinu nokkuð vel! Prófum að skoða óskylt gagnasett, eins og lengd brúa á Íslandi.

Þetta gagnasett fylgir lögmálinu líka vel!

Til gamans má geta að lögmálið gildir sama hvaða talnakerfi er notað. Ef við skoðum til dæmis tvíundarkerfið, þar sem tölur eru einungis táknaðar með 0 og 1, þá byrja allar tölur á 1. Grunntalan okkar er þá 2 og lögmál Benfords segir

$$P(1) = \log_2\bigg(1+\frac{1}{1}\bigg) = \log_2(2) =1$$ enda eru 100% líkur á að talan byrji á 1, sama hversu stórt safn af tölum eru skoðaðar.[2]

Tilvísanir:
  1. ^ Stærðarþrep þýðir hér tölur sem eru milli velda af 10, það er gagnasett þar sem tölurnar geta tekið gildi sitt í tugum, hundruðum, þúsundum eða milljónum þess vegna.
  2. ^ Hér er þó vert að slá þann varnagla að talan 1 í minni á tölvum er geymd í bita sem er af ákveðinni stærð og hefur þess vegna tiltekinn fjölda af 0 á undan tölunni.

Heimildir:

Mynd:

Ritstjórn Vísindavefsins þakkar Sigurði Erni Stefánssyni, prófessor í stærðfræði, fyrir yfirlestur og gagnlegar ábendingar.

Höfundur

Nanna Kristjánsdóttir

BS í hagnýttri stærðfræði og stundakennari við HÍ

Útgáfudagur

27.2.2025

Spyrjandi

Alexandra Aldís Heimisdóttir

Tilvísun

Nanna Kristjánsdóttir. „Hvað er lögmál Benfords og hvernig er hægt að nota það?“ Vísindavefurinn, 27. febrúar 2025, sótt 13. mars 2025, https://visindavefur.is/svar.php?id=69268.

Nanna Kristjánsdóttir. (2025, 27. febrúar). Hvað er lögmál Benfords og hvernig er hægt að nota það? Vísindavefurinn. https://visindavefur.is/svar.php?id=69268

Nanna Kristjánsdóttir. „Hvað er lögmál Benfords og hvernig er hægt að nota það?“ Vísindavefurinn. 27. feb. 2025. Vefsíða. 13. mar. 2025. <https://visindavefur.is/svar.php?id=69268>.

Chicago | APA | MLA

Senda grein til vinar

=

Hvað er lögmál Benfords og hvernig er hægt að nota það?
Spurningin í fullri lengd hljóðaði svona:

Ég rakst á nokkuð skemmtilegt lögmáli í dag sem heitir „Benford's law“ eða lögmál Benfords. Getið þið útskýrt fyrir mig hvað lögmálið gengur út á og hvernig það er notað í vísindaheiminum?

Lögmál Benfords er kennt við bandaríska rafmagnsverkfræðinginn og eðlisfræðinginn Frank Benford (1883-1948). Eins og spyrjandi nefnir er það vissulega skemmtilegt lögmál, eitt af þeim sem gefur aðra niðurstöðu en mætti ætla við fyrstu sýn.

Ímyndum okkur að við séum með gagnasett (e. dataset) af nokkrum stærðarþrepum, til dæmis um mannfjölda í löndum, lengd áa á Íslandi eða upphæð færslna á bankareikningi.[1] Ef við skoðum fyrsta stafinn í hverri tölu í gagnasettinu, hverjar eru þá líkurnar á að sú tala sé 1?

Í fyrstu mætti ætla að allar tölurnar sem í boði eru, það er tölurnar frá 1 og upp í 9, séu jafn líklegar til að vera fyrsta talan og að líkurnar á að 1 sé sú fyrsta séu því um 11%. Lögmál Benfords segir hins vegar að svo svo sé aldeilis ekki. Líkurnar á að fyrsta talan sé 1 eru nefnilega næstum þrefalt hærri, eða um 30%. Hvernig stendur á því?

Byrjum á að takmarka mjög fjölda talna sem gildin í gagnasettinu geta tekið. Ef við höfum aðeins tölurnar 1 og 2, þá byrja 50% þeirra talna á tölunni 1. Ef við hækkum hins vegar fjölda talna upp í tíu, þá byrja 20% þeirra á tölunni 1 (það er 1 og 10). Ef við fjölgum tölunum upp í 20, þá byrja 55% talnanna á 1 (1, 10, 11 o.s.frv.). Þegar við hækkum upp í 100 erum við aftur búin að lækka fjölda talnanna sem byrja á einum, niður í 12%.

Ef við höldum svona áfram með hærri og hærri tölur, þá segir lögmál Benfords okkur að fyrir hverja tölu $k$ frá 1 upp í 9, þá eru líkurnar á því að tala byrji á tölunni $k$, táknað $P(k)$ eftirfarandi$$P(k)=\log_{10}\bigg(1+\frac{1}{k}\bigg)$$ Þessa líkindadreifingu má sjá á myndinni hér fyrir neðan:

Líkindadreifing fyrir lögmál Benfords.

Líkurnar á að tala byrji á 1 eru því $$P(1)= \log_{10}\bigg(1+\frac{1}{1}\bigg)\approx0.30$$

Athugið að þetta gildir ekki fyrir hvaða gagnasett sem er. Ef ætlunin er til dæmis að skoða hæð fólks í metrum kemur það aldrei fyrir að tala yfir tveimur sé fremst. Þetta gildir hins vegar fyrir mjög mörg gagnasett og hefur lögmálið meðal annars verið notað til að koma upp um fjársvik. Í tilvikum þar sem svindlarar hafa búið til tölur, en ekki gætt að lögmáli Benfords, er hægt að greina tölurnar og ef þær fylgja lögmálinu ekki eru þær að öllum líkindum tilbúningur.

Skoða má ýmis gagnasett og sjá hversu vel þau fylgja lögmálinu. Myndin hér fyrir neðan sýnir til dæmis í hvaða hlutfalli tölur koma fram sem fyrsta talan þegar íbúafjöldi í 104 þéttbýlisstöðum á Íslandi árið 2024 er skoðaður.

Eins og sjá má fylgja hlutföllin lögmálinu nokkuð vel! Prófum að skoða óskylt gagnasett, eins og lengd brúa á Íslandi.

Þetta gagnasett fylgir lögmálinu líka vel!

Til gamans má geta að lögmálið gildir sama hvaða talnakerfi er notað. Ef við skoðum til dæmis tvíundarkerfið, þar sem tölur eru einungis táknaðar með 0 og 1, þá byrja allar tölur á 1. Grunntalan okkar er þá 2 og lögmál Benfords segir

$$P(1) = \log_2\bigg(1+\frac{1}{1}\bigg) = \log_2(2) =1$$ enda eru 100% líkur á að talan byrji á 1, sama hversu stórt safn af tölum eru skoðaðar.[2]

Tilvísanir:
  1. ^ Stærðarþrep þýðir hér tölur sem eru milli velda af 10, það er gagnasett þar sem tölurnar geta tekið gildi sitt í tugum, hundruðum, þúsundum eða milljónum þess vegna.
  2. ^ Hér er þó vert að slá þann varnagla að talan 1 í minni á tölvum er geymd í bita sem er af ákveðinni stærð og hefur þess vegna tiltekinn fjölda af 0 á undan tölunni.

Heimildir:

Mynd:

Ritstjórn Vísindavefsins þakkar Sigurði Erni Stefánssyni, prófessor í stærðfræði, fyrir yfirlestur og gagnlegar ábendingar.

...