OI Vitor,
Ele funciona como toda máquina de busca atual mais padronizada. Isso ficou bem claro.
O que queria saber é, por exemplo:
Sobre a indexação:
É utilizado algum algoritomo de conhecimento publico? Qual?
Qual a técnica de STEMMING utilizada? Você me falou que ele
identifica o idioma a partir disso usa um separador específico. O
algoritmo é próprio? E se próprio, tem alguma fundamentação no
algoritmo de Potter?
É gerado algum dicionário de dados para armazenamento dos índices? Como é esse processo?
Sobre a busca:
Vejo que vocês utilizam técnica de realimentação
de relevantes e que os resultados das consultas estão ordenados por
prioridade. Que critério de prioridade foi estabelecido? A relevância
tem interação com o usuário, ele pode opinar sobre quais documentos são
relevantes?
Que conceito de busca foi utilizado? Redes Bayesianas, redes neurais, ....?
Como é que se dá essa filtragem dos resultados que os usuários não têm permissão?