TREC - Text REtrieval Conference
Tarefas principais:
- Routing: Mesmas questões perguntadas a uma base de dados dinâmica.
- Ad hoc: Novas questões são perguntadas a uma base de dados estática.
Os dados usados atualmente nesta avaliação consiste de 2 Gb de textos:
- Contendo entre 500.000 e 1.000.000 de documentos completos
- Formado principalmente de textos jornalísticos e de agências de notícias.
- Também possui documentos oficiais e resumos de artigos sobre computação.