Закон Ціпфа

З пляцоўкі Вікіпедыя
Перайсці да: рух, знайсці

Зако́н Цíпфа (Зíпфа) – эмпірычная заканамернасць размеркавання частаты сустракаемасцi слоў натуральнай мовы ў вялікім тэксце. Закон Цiпфа быў вынайдзены Джорджам Цiпфам, якi даказаў, што частата выкарыстання n-га найбольш часта выкарыстоўваемага слова ў натуральных мовах прыблізна зваротна прапарцыйная яго парадкаваму нумару n (рангу).

Сёння пад законам Цiпфа часцей за ўсё маюць на ўвазе заканамернасць ранг-частата, вядомую таксама як «універсальнае гіпербалічнае рангавае размеркаванне». Калі скласці спіс з усіх слоў тэксту і адсартаваць яго па парадку змяншэння частаты F выкарыстоўвання слоў, то для кожнага слова здабытак яго парадкавага нумара R у гэтым спісе на частату выкарыстання будзе роўны пастаяннай велічыні C.

C = F*R – у клаciчным выглядзе i C = F*R^Y – з папраўкай Мандельброта, дзе F – частата выкарыстання слова, R – парадкавы нумар; С – пастаянная велічыня, а Y – блізкая да адзінкі пераменная велічыня, якая змяняецца ў залежнасці ад параметраў тэксту.

Спасылкі[правіць | правіць зыходнік]