O CETEMPúblico (Corpus de Extractos de Textos Electrónicos MCT/Público) é um corpus de texto jornalístico do jornal Público compilado para fins de investigação e desenvolvimento em processamento de linguagem natural, pelo projecto Processamento computacional do português, ao abrigo de um protocolo assinado entre o Público e o Ministério da Ciência e da Tecnologia (MCT).
O CETEMPúblico apenas pode ser utilizado para fins de investigação e desenvolvimento tecnológico, sendo vedada a sua comercialização.
O Público deverá ser sempre referido como fonte do material utilizado em todas as apresentações públicas de trabalhos que tenham recorrido a esta ferramenta incluindo, designadamente, artigos, teses, comunicações e conferências.
Deverá ser cedido gratuitamente ao Público qualquer produto que venha a ser comercializado na sequência da execução de projecto de investigação e desenvolvimento em que o CETEMPúblico seja utilizado.
O presente CD inclui o CETEMPúblico em formato de texto, versão 1.0 (25 de Julho de 2000), dividido em 20 ficheiros diferentes para facilitar a cópia, compactados com o programa ZIP. Informação técnica mais pormenorizada encontra-se em http://cgi.portugues.mct.pt/cetempublico/