Эта работа является продолжением всего сказанного ранее в статье [«][1][Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II»][2]. В большинстве статей, посвященных анализу текстов, которые удалось изучить автору, под анализом текста понимается главным образом две совершенно практические задачи, связанные либо с извлечением какого-либо контекста, либо перевод текста с одного языка на другой. В первом случае речь, как правило, идет или об «очистке» анализируемого контента и сопоставлению какого-либо участка текста эталону в соответствии с заранее заданной таксономией[1][3] каких-либо сущностей. Например, разбор адресов, товаров и т.д. Во втором случае, о поиске соответствия одного блока текста, написанного на одном языке блоку, написанному на другом.
Объединяющим оба эти варианта является статистический, по сути, анализ участков контекстов, с учетом синонимов слов, устоявшихся выражений. При этом зам рамками такого рода анализ выходит анализ троп[2][4], риторических оборотов и много другого. Причина этого кроется в непонимании современной наукой даже на философском уровне некоторых базовых вопросов, связанных с логикой мышления и принятия решения, построения знаковых систем т.е. неразвитость семиотики и т.д.
[Читать дальше →][5]
[1]:
https://habrahabr.ru/post/328668/
[2]:
https://habrahabr.ru/post/328668/
[3]: #sdfootnote1sym
[4]: #sdfootnote2sym
[5]:
https://habrahabr.ru/post/352248/?utm_source=habrahabr&utm_medium=rss&utm_campaign=352248#habracut