Hakia является ярким примером использования
семантического подхода для поиска документов в web-сети, которые
семантически релевантны поисковому запросу. Как и в системах Ask Jeeves и True Knowledge, запрос пользователя для Hakia может быть представлен на естественном языке, система сама подберет ключевые слова.
Многие специалисты считают, что именно подход семантического поиска, разработанный в системе Hakia, является новым этапом развития
Современных технология поиска информации и поисковых систем. Однако, пока трудно однозначно сказать, лучше или хуже система Hakia, в сравнении с поисковой системой Google. Несмотря на это, данная система действительно является отлично разработанным, инновационным подходом к поиску информации.
Система Hakia базируется на трех технологиях:
- OntoSem – хранилище семантической информации,
- QDEX – технология индексации документов,
- SemanticRank – компонент ранжирования текстов по смыслу.
С использованием этих технологий система Hakia достаточно успешно справляется с задачей
анализа смысла текстов.
OntoSem является хранилищем отношений между концептами семантической модели, или разными терминами (словами), т.е. это лингвистическая база данных, где слова распределяются по категориям в зависимости от своих значений.
QDEX является аналогом обратного индексирования в традиционных подходах информационного поиска. Для каждого документа QDEX определяет список возможных вопросов к нему и использует эти вопросы в качестве индекса при поиске.
Компонент SemanticRank реализует специальный алгоритм, который используется для ранжирования результатов поиска по степени семантической близости. Для вычисления степени релевантности используется интеллектуальный алгоритм анализа выражения естественного языка и не применяются оценки соответствия по ключевому слову или по булевой логике.