| Linguateca - 2005. |
Versão para impressão
O SultãoId é programa desenvolvido para gerar os relatórios globais referente a todos os participantes da avaliação conjunta HAREM. O SultãoId processa os ficheiros resultante do processamento do Ida2Id e exporta a informação final da avaliação, num formato tabular, para uma página HTML. A título de exemplo, imaginemos que temos os seguintes ficheiros para os quais queremos gerar um relatório global:
O Sultão seria capaz, assumindo que estes valores correspondem aos valores que estão no ficheiros, de gerar a seguinte tabela:
| Saída | Precisão (%) | Abrangência (%) | Medida F | Erro Combinado | Sobre-geração | Sub-geração |
| bengazi | 78.50289512680246 | 82.84146121711032 | 0.8061384593106955 | 0.2752097804515611 | 0.07912713472485769 | 0.07328794553464157 |
| luxor | 77.15464076483819 | 84.35080957593854 | 0.8059240598162852 | 0.27207083152925865 | 0.09134088417975886 | 0.035749950069902135 |
| cairo | 77.05932277127138 | 84.43128514543535 | 0.8057704083163916 | 0.27237961321309 | 0.0924170616113744 | 0.03495106850409427 |
Note-se que no início da tabela é colocado informação sobre a anonimização, por outras palavras, corresponde à chave da tabela e estabelece as correspondências entre os nomes fictícios atribuídos aos sistemas e a sua identidade. Como os relatórios globais são colocados na rede em Classificação é necessário remover e guardar esta chave de forma a não comprometer a identidade de cada concorrente.
Este processo de anonimização só faz sentido no âmbito de uma avaliação oficial. No entanto, e para tornar mais fácil a utilização do Sultão fora de um ambiente de competição, é possível configurar o Sultão para gerar a mesma tabela sem anonimização e contendo mais alguma informação útil (como, por exemplo, o número entidades utilizadas nos cálculos). Neste caso a tabela gerada seria:
| Saída | Precisão (%) | Abrangência (%) | Medida F | Erro Combinado | Sobre-geração | Sub-geração | Total na CD | Total Identificadas | Total Correctos | Espúrios | Em Falta | Total Correctos | Soma Parcialmente Correctos | Soma Parcialmente Incorrectos | Total Ocorrências Parcialmente Correctos |
| sistema1.alinhado.etq.verificado.avalida.total.altid.ida2id | 78.50289512680246 | 82.84146121711032 | 0.8061384593106955 | 0.2752097804515611 | 0.07912713472485769 | 0.07328794553464157 | 4994 | 5270 | 3937 | 417 | 366 | 3937 | 200.1025731824895 | 787.8974268175108 | 988 |
| sistema2.alinhado.etq.verificado.avalida.selectivo.altid.ida2id | 77.15464076483819 | 84.35080957593854 | 0.8059240598162852 | 0.27207083152925865 | 0.09134088417975886 | 0.035749950069902135 | 5007 | 5474 | 3985 | 500 | 179 | 3985 | 238.44503546724252 | 899.5549645327588 | 1138 |
| sistema3_nao_oficial.alinhado.etq.verificado.avalida.total.altid.ida2id | 77.05932277127138 | 84.43128514543535 | 0.8057704083163916 | 0.27237961321309 | 0.0924170616113744 | 0.03495106850409427 | 5007 | 5486 | 3989 | 507 | 175 | 3989 | 238.4744472319484 | 900.525552768053 | 1139 |
É de salientar que saídas oficiais têm o nome marcado a negrito e as selectivas estão em itálico. Estas formatações podem combinar-se entre si; por exemplo uma saída oficial e selectiva teria o nome a negrito e a itálico. Exaustivamente, podemos ter 4 combinações:
Resumindo, a função do SultãoId é compilar a informação gerada pelo Ida2Id e formatar essa informação de modo facilitar a sua posterior análise e interpretação.
O SultãoId é distribuído num ficheiro "Java Archive Resource" (JAR) --SultaoId.jar-- que inclui o código fonte: SultaoId.jar Para inspeccionar o código basta extrair os ficheiros do arquivo executando o seguinte comando numa shell do seu sistema: jar -xf SultaoId.jar Para invocar o SultãoId numa máquina com a JVM instalada, execute o comando:
O SultãoId deve ser invocado na directoria que contém os ficheiros (do Ida2Id) a serem compilados. Existem vários parâmetros que podem ser configurados e combinados entre si de modo a tornar o SultãoId mais flexível. O primeiro parâmetro apresentado, -filtro, diz respeito aos ficheiros que deverão ser utilizadas na geração dos relatórios. No exemplo dado, utilizamos o argumento total.altid.ida2id, este argumento indica ao SultãoId que todos os ficheiros terminados com a extensão total.altid.ida2id devem ser considerados na geração dos relatórios. Se mais do que um tipo de ficheiro é pretendido então é possível utilizar uma lista de extensões separadas por ':', como por exemplo em:
indica que os ficheiros em que os nomes começam por sistema1_nao_oficial ou sistema4 são para ser considerados não oficiais, implicando que a sua entrada na tabela de resultados não esteja a negrito.
O terceiro parâmetro visível no exemplo da invocação é o parâmetro -saidas que serve para indicar ao SultãoId as saídas que devem ser consideradas. Este parâmetro pode ser atribuído dois valores:
No primeiro caso só as saídas oficiais é que serão exportadas para o relatório final, no segundo, só as saídas não oficiais é que são consideradas. Por defeito se este parâmetro não for utilizado então todas as saídas são consideradas.
Por fim temos o parâmetro -depurar que pode ser atribuído os valores de:
Por defeito (no caso de omissão do parâmetro) o SultãoId assume que a informação para depuração não é para ser colocada no relatório e que a anonimização é para ser efectuada. Se o parâmetro for fornecido com o valor sim, então a anonimização não é efectuada e informação adicional, contida nos relatórios do Ida2Id, é colocada no relatório final.
O resultado do SultãoId será impresso para o standard output. Portanto é conveniente redireccionar a saída do SultãoId para um ficheiro, de forma a que estes resultados possam ser guardados e posteriormente analisados.