Нашей компании в этом году исполняется 10 лет. Всё это время, мы занимались проблемами компьютерной обработки текстов на естественном языке. В частности, автоматическим определением тематики документов.

Был разработан "Способ позиционирования текстов в пространстве знаний на основе множества онтологий" (патент РФ № 2476927). Создана система и метод тематической категоризации текстов на основе онтологий (US Patent No.: US 8,782,051 "System and method for text categorization base on ontologies").

На основе данных патентов разработаны такие программы как "Тематический категоризатор" и поисковая система "Гитика".

Почти 8 лет наши технологии использовались для автоматической генерации раздела "Новости доменной индустрии" на сайте "Координационного Центра домена RU/РФ". С 2016 года технология тематической категоризации внедряется в ИА "ИТАР-ТАСС".

В настоящее время проект Гитика это уже далеко не только поисковая система, но целый набор приложений для работы с информационными массивами. Кроме тематики текстов Гитика различает более 160 000 персоналий и более 25 000 организаций. Это позволяет эффективно "просеивать" информационное пространство и создавать для пользователей автоматические индивидуальные информационные разделы.

Для демонстрации наших технологий, мы можем предложить ежемесячные рейтинги персоналий и организаций, которые автоматически составляются по данным трех тысяч интернет-источников. А также, как пример индивидуальных информационных разделов, автоматические подборки материалов по темам "Шанхайская организация сотрудничества", "Финансовый кризис" и " Оборонно-промышленный комплекс РФ".

Новости за последние двое суток по версии Гитики Это новости, содержащие темы, о которых мало кто пишет, но которые упоминаются в эти дни чаще, чем в среднем за последние три месяца.


Copyright © 2007-2017 ООО «РелТим»