[#] [Из песочницы] Как собрать биграммы для корпуса любого размера на домашнем компьютере
habrabot(difrex,1) — All
2016-10-12 23:30:03


В современной компьютерной лингвистике биграммы, или в общем случае n-граммы, являются важным статистическим инструментом. В статье мы расскажем с какими трудностями можно столкнуться при расчёте биграмм на большом корпусе текстов и приведём алгоритм, который можно использовать на любом домашнем компьютере.
[Читать дальше →][1]

[1]: https://habrahabr.ru/post/312490/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut