Перайсці да зместу

Закон Ціпфа

З Вікіпедыі, свабоднай энцыклапедыі

Зако́н Ці́пфа (Зі́пфа) — эмпірычная заканамернасць размеркавання частаты сустракаемасці слоў натуральнай мовы ў вялікім тэксце. Закон Ціпфа быў вынайдзены Джорджам Ціпфам, які даказаў, што частата выкарыстання n-га найбольш часта выкарыстоўваемага слова ў натуральных мовах прыблізна зваротна прапарцыйная яго парадкаваму нумару n (рангу).

Сёння пад законам Ціпфа часцей за ўсё маюць на ўвазе заканамернасць ранг-частата, вядомую таксама як «універсальнае гіпербалічнае рангавае размеркаванне». Калі скласці спіс з усіх слоў тэксту і адсартаваць яго па парадку змяншэння частаты F выкарыстоўвання слоў, то для кожнага слова здабытак яго парадкавага нумара R у гэтым спісе на частату выкарыстання будзе роўны пастаяннай велічыні C.

 — у класічным выглядзе і  — з папраўкай Мандельброта, дзе F — частата выкарыстання слова, R — парадкавы нумар; С — пастаянная велічыня, а Y — блізкая да адзінкі пераменная велічыня, якая змяняецца ў залежнасці ад параметраў тэксту.