RELATÓRIO DE ATIVIDADES - ELABORAÇÃO DE VOCABOLÁRIOS CONTROLADOS E SELEÇÃO DE PONTOS DE ACESSO
PROCESSO Nº 23106.079575/2023-77
SUMÁRIO
INTRODUÇÃO
Apresentação
Objetivos
Método
Referencial
DISPOSIÇÕES PRELIMINARES
Os pontos de acesso do AtoM e o escopo do guia
O que são pontos de acesso
A seleção dos pontos de acesso
Teoria do Conceito
Sistemas de Indexação
BASE METODOLÓGICA
Diretrizes
Orientações gerais para a Seleção de Pontos de Acesso
CONSTRUÇÃO DE LINGUAGENS DOCUMENTÁRIAS
Pontos de Acesso de Nomes (Pessoas, Famílias e Entidades Coletivas)
Pontos de Acesso de Locais
Pontos de Acesso de Assuntos
CONSTRUÇÃO DE TESAUROS
Hierarquia dos termos
Apresentação dos termos e suas relações
Relações básicas em um tesauro
Aspectos gerenciais da elaboração de um tesauro
REFERÊNCIAS
INTRODUÇÃO
Apresentação
Este relatório visa ser um guia para padronizar os métodos, diretrizes, e meios para se selecionar os pontos de acesso que irão compor as descrições arquivísticas na Universidade de Brasília, sendo a base para a elaboração da linguagem documentária que será adotada para o AtoM-UnB, o sistema de acesso e difusão de documentos arquivísticos da Universidade.
Pontos de acesso são termos, descritores, palavras ou expressões, selecionados para representar conceitos presentes no conteúdo dos documentos, de modo que sejam usados para vincular esses documentos entre si numa organização lógica, formando conjuntos de documentos em comum.
Pontos de acesso são organizados de modo a constituírem uma linguagem documentária, uma vez que restringirão a maneira pela qual palavras, conceitos, e dados dos documentos serão referenciados, distanciando-se da linguagem natural. Desta forma, ao estabelecermos um método para a seleção de pontos de acesso, e, ao aplicarmos tal método num dado conjunto de informações contidas em um acervo, formar-se-á um vocabulário extraído, mas distinto, da linguagem natural contida nesse acervo.
Um mesmo objeto da realidade (referente), na linguagem natural, pode ser nomeado com palavras diferentes. Exemplo: “paciente”, “doente” e “enfermo” que se referem a aproximadamente, o mesmo conceito na linguagem natural. Essa diversidade de palavras da linguagem natural para um único conceito prejudica a eficiência de sistemas de busca manuais ou informatizados. Tal confusão se manifesta com homonímias, ambiguidades e outras situações em que o consulente perde informações, sendo muitas vezes forçado a filtrar manualmente os termos de busca, tornando-a imprecisa, trabalhosa e com baixo potencial de revocação.
Com a padronização da seleção de pontos de acesso, um vocabulário controlado se formará, permitindo a garantia da relação biunívoca entre termo e conceito. Assim, sistemas de busca, como os do AtoM-UnB, poderão ter maior precisão e uma maior garantia de revocação nas suas buscas, eliminando esforços desnecessários por parte do consulente.
Objetivos:
Objetivo Geral: padronizar as orientações e regras para guiar a seleção de pontos de acesso que irão compor a linguagem documentária do AtoM – UnB.
Objetivos Específicos:
Definir o que são pontos de acesso
Expor as normas e a teoria relacionadas à seleção de pontos de acesso.
Adaptar esses conceitos à realidade da UnB na forma de instruções.
Método
Este documento é o resultado de um levantamento de normas, teorias, benchmarkings e experiências empíricas sobre o tema, fazendo uso de termos usados por agentes descritores nas atividades de descrição do Arquivo Central, sobretudo os resultantes dos projetos de estágio supervisionado II.
Logo, este guia é a apresentação de uma pesquisa de natureza aplicada, com abordagem qualitativa, com procedimentos de pesquisa bibliográfica, documental, estudos de caso, e experiências empíricas, com objetivo explicativo.
Referencial
Não há normas declaradas para a seleção de pontos de acesso no Brasil, seja elas em forma de lei ou resoluções do CONARQ, como usualmente é o caso das normas arquivísticas do país. O que há são normas de temas adjacentes à seleção de pontos de acesso e diretrizes teóricas elaboradas pela academia e entidades técnicas.
Entre as normas de assuntos adjacentes pode-se elencar as normas de descrição arquivística, atividade pela qual se vê necessária, inicialmente, a estruturação dos pontos de acesso do AtoM na UnB. Dentre essas normas se incluem a ISAD(G), a ISAAR(CPF) e a NOBRADE, que reconhecem a necessidade dos pontos de acesso nas descrições arquivísticas. Faz-se crucial que as diretivas para a seleção de pontos de acesso estejam em harmonia com essas normas, visto que são pré-requisito para a boa descrição arquivística.
Entretanto, tais normas não são suficientes para se montar esquemas para a seleção de pontos de acesso. Isto posto, fez-se necessário buscar referências técnicas e teóricas sobre o tema, sobretudo nas áreas de arquivologia e biblioteconomia. Tais áreas, especialmente os subcampos da análise da informação, a representação arquivística, a indexação, a elaboração de resumos, elaboração de linguagens documentárias etc. estabelecem diversas diretivas úteis para a criação de pontos de acesso. Foram usados teóricos como Ingetraut Dahlberg, Derek Austin, Peter Dale, Claire Guinchat, Michel Menou, Jaime Robredo e F. W. Lancaster.
Além da teoria associada, também foram buscadas normas estrangeiras sobre o tema, que instruem diretamente os seus usuários quanto a seleção de pontos de acesso. Usou-se, nesta análise, regras como a RAD (Rules for Archival Descriptions) canadense, a DACS (Describing Archives: A Content Standards) estadunidense, e a Norma do Ministério da Cultura da Espanha de seleção de pontos de acesso. Visto os seus casos de sucesso, tem-se que a análise desses documentos constituem um bom benchmarking sobre o tema, servindo para uma elaboração técnica, correta e útil das normas de seleção.
Com esses recursos, somados à experiência adquirida com as atividades de descrição feitas no ACE, foi feita a proposição das padronizações contidas neste documento, bem como algumas diretrizes gerais que nortearão os servidores do ACE na tomada de decisões acerca das ações previstas ou imprevistas no que se refere a seleção de pontos de acesso e a elaboração de vocabulários controlados.
DISPOSIÇÕES PRELIMINARES
Os Pontos de acesso no AtoM e escopo deste guia
O AtoM, por padrão, adota 4 tipos de pontos de acesso:
locais;
nomes;
assuntos; e
gênero.
Figura 1: pontos de acesso de gênero na lista de navegação do AtoM de demonstração em sua página da Artefactual. Disponível em: <https://demo.accesstomemory.org/>
Os pontos de acesso de locais, nomes e assuntos são classificações mais tradicionais e serão tratados neste documento. Os pontos de acesso de gênero são pontos de acesso opcionais, que designam temas, formas documentais, e outras formas de dados e informações. Esses são próprios da RAD, regra canadense de descrição arquivística. Tais pontos de acesso não serão tratados neste documento.
O que são os pontos de acesso
Pontos de acesso, segundo o Dicionário Brasileiro de Terminologia Arquivística (2005, p. 134) é “Elemento de informação, termo ou código que, presente em unidades descrição, serve à pesquisa, identificação ou localização de documentos”.
Pontos de acesso de “nomes”, são relacionados aos “Registros de Autoridade” da ISAAR(CPF), de maneira que, idealmente, exista uma correlação biunívoca de correspondência entre o ponto de acesso e a “Forma autorizada do nome” do registro de autoridade. Destaca-se que a própria ISAAR(CPF) menciona a sua utilidade para criar pontos de acesso onomásticos: “Registros de autoridade arquivística podem ser usados para [...] controlar a criação e uso de pontos de acesso em descrições arquivísticas” (ISAAR(CPF). 2004, p. 11).
Pontos de acesso de nome farão referência aos tipos de entidades da ISAAR(CPF), incluindo pessoas, famílias e entidades coletivas. estas últimas, entidades coletivas, são quaisquer grupos de pessoas que façam uso de documentos, tais como órgãos, instituições, empresas, organizações, e quaisquer tipos de coletivos.
Pontos de acesso de locais farão referência a cidades, países, acidentes geográficos, vias, rios, logradouros, pontos de interesse e quaisquer entidades geográficas contidas no conteúdo do documento.
Pontos de acesso de assuntos denotam quaisquer elementos textuais relevantes no conteúdo do documento que não estejam inclusos nem em nomes e nem em locais. Logo, sua definição se dá por exclusão. Incluem-se assuntos, tópicos, temas, objetos, eventos, conceitos etc.
Esses pontos de acesso deverão ser extraídos do documento durante seu processo de descrição, em que essa própria seleção constituirá um conjunto de termos que, unidos, falarão muito sobre o documento descrito, constituindo uma espécie de “resumo” do documento e representando-o, possibilitando que qualquer consulente que veja esse conjunto de termos possa identificar sobre o que aquele documento trata. Não somente isso, forma-se, na seleção, uma vinculação entre o documento e seus termos e dos termos com seus documentos, permitindo que, em sistemas de busca, a informação associada ao termo seja recuperada. Este guia propõe dar as orientações para fazer essa seleção, e garantir que os termos estejam padronizados.
A Seleção dos Pontos de Acesso
O processo de seleção dos pontos de acesso se dá no ato da descrição dos documentos arquivísticos. O objetivo desta última atividade é representar o documento (ou qualquer um dos níveis tratados na NOBRADE, como fundo, seção, série etc.), permitindo que o consulente saiba do que se trata aquele nível de descrição. Dentro dessa atividade, está a seleção de pontos de acesso, que auxilia nessa representação ao se escolherem termos advindos dos seus elementos constituintes daquele nível de descrição.
Fonte
Este guia é destinado, principalmente, à seleção de pontos de acesso a nível de item documental, pois foi neste escopo em que a motivação da criação deste guia se originou. Para a seleção de pontos de acesso nesse nível, o agente descritor consultará as seguintes fontes, todas componentes do documento:
Título (intitulatio)
Direção (inscriptio, ou a quem se dirige)
Preâmbulo (prologus)
Conteúdo textual principal (incluindo narratio, dispositio, sanctio, valoratio/corroboratio)
Subscrição (subscriptio, ou quem assina)
Datação (tanto data crônica quanto tópica)
Precação (aprecatio, quando houver)
Todos esses elementos constituintes do conteúdo do documento são passíveis de serem alvo de seleção de pontos de acesso. A maior parte dos pontos de acesso serão extraídos do conteúdo textual principal, onde a ação, fato ou ato (actio) do documento serão relatados (conscriptio) “[...] para suporte e meio semântica e juridicamente credível” (BELLOTTO, 2008, p. 10). Nesta parte do documento, o agente descritor selecionará os pontos de acesso com base nos núcleos dos sintagmas nominais, e verbais contidos no texto, assim como alguns sintagmas adjetivais. Todos esses poderão gerar pontos de acesso de nome, locais e assuntos.
Exemplo: Na data tópica, podem ser extraídos pontos de acesso de locais. Hipoteticamente, caso um documento seja assinado em Brasília, tira-se daí um local (cidade) “Brasília”, que poderá ser normalizado com qualificadores para que se evitem ambiguidades: “Brasília (cidade, DF, Brasil)”.
Caso esse mesmo documento seja destinado a alguma instituição – o hipotético “Museu Automobilístico” – em “Brasília” bairro de Feira de Santana, na Bahia, extrai-se de seu inscriptio os termos “Museu Automobilístico (Feira de Santana)”, “Brasília (Feira de Santana, BA, Brasil)”.
Ainda neste mesmo documento, caso seu dispositio trate da doação de um automóvel antigo, uma Brasília, por exemplo, tira-se daí ainda outros pontos de acesso: “Brasília (automóvel)” e “Doação”, por exemplo.
Então, neste documento hipotético, algumas palavras retiradas dele poderiam ser selecionadas (e transformadas) em pontos de acesso:
Brasília (cidade, DF, Brasil)
Brasília (bairro, Feira de Santana, BA, Brasil)
Museu Automobilístico (Feira de Santana)
Brasília (automóvel)
Doação
Automóveis
Nota-se que essa seleção permite que se possa deduzir o conteúdo do documento apenas ao se observar os termos. Esse é o objetivo da representação arquivística e também da descrição como um todo, e a seleção de pontos de acesso é uma das atividades que as permitirá.
Também, num sistema informatizado como o AtoM, tais pontos de acesso estarão vinculados entre si, permitindo que uma busca por “Brasília (automóvel)” recupere todos os documentos que também tratem deste automóvel, ou quaisquer outros termos ou conjuntos de termos, usando até mesmo operadores booleanos para elaborar argumentos de busca que garantam uma elevada precisão e revocação.
Adaptação
Observa-se também, ainda no exemplo anterior, que os termos não foram simplesmente retirados do conteúdo do documento, mas sim, foram adaptados para que se tornem pontos de acesso, seja pela substantivação de verbos, ligeiras mudanças em tempos verbais ou conjugações, ou seja pela adição de qualificadores, entre parênteses, para melhor especificar o significado do termo, distinguindo-o de outros similares ou homônimos, bem como de subcabeçalhos, separados por hifens.
Vale ressaltar que o processo de seleção de pontos de acesso compõe o processo de descrição arquivística, estando incluso neste, e que, por isso, algumas regras maiores de descrição poderão interferir na seleção de pontos de acesso do item documental. Um exemplo é a diretriz de descrição multinível, que orienta o agente descritor a não repetir elementos contidos em níveis mais gerais em níveis mais específicos. Para o caso da UnB, instituição cujo os campi estão presentes em Brasília, Distrito Federal, atribui-se o ponto de acesso “Brasília (cidade, DF, Brasil)” a todo o nível de fundo, ou de entidade custodiadora (respectivamente níveis 1 ou 0), evitando-se a atribuição em nível de item.
Neste escopo, o exemplo ficaria assim:
Brasília (bairro, Feira de Santana, BA, Brasil)
Museu Automobilístico (Feira de Santana)
Brasília (automóvel)
Doação
Automóveis
Caso a seleção de pontos de acesso ocorra em níveis mais gerais, o perfil de trabalho variará. Em casos de dossiês e processos, a análise será bem próxima da de itens documentais, com o detalhe que, talvez, o agente descritor deverá fazer sua seleção por amostragem. Nestes casos, esse agente deverá trabalhar como usualmente se faz na indexação de livros, atividade similar à descrição arquivística em que também se selecionam pontos de acesso: o agente irá ler o processo, não integralmente, mas numa leitura rápida e de escaneamento, em que consultará a capa, folha de rosto, e quaisquer outras partes que identifique que possuam informações gerais e representativas daquele dossiê ou processo.
Nos casos de níveis ainda mais gerais, como séries, seções, fundos, etc. se requer que o agente descritor faça um trabalho de investigação e análise, mais generalista, similar a uma pesquisa histórica de todo aquele conjunto referente ao nível em que está. Em nível de fundo, por exemplo, se faz necessário investigar suas datas de origem e de fechamento (se tiver), detalhes da proveniência, nome dos usuários mais importantes, datas tópicas relevantes, detalhes da história administrativa e arquivística, etc. Todos esses podem ser elementos em que se escolhem pontos de acesso.
Teoria do Conceito
É proposto aqui que o sistema de seleção de pontos de acesso do AtoM-UnB seja embasado na teoria do conceito de Ingetraut Dalhberg (1978). O uso dessa teoria é crucial para a definição de uma linguagem documentária cujo os termos sejam elencados com vistas a um sistema de busca eficiente e útil para um usuário. E isso se manifesta na capacidade que a teoria do conceito tem de distinguir os objetos diferentes da realidade em relação aos termos linguísticos que os referenciam, que muitas vezes podem se confundir.
A linguagem natural, usada para a comunicação cotidiana, pode, eventualmente, designar uma mesma palavra ou locução para um determinado referente. Exemplos podem ser a palavra “manga”, que pode designar um fruto ou uma parte de uma peça de vestuário, ou “Granada”, que pode designar um armamento, uma pedra preciosa, um país insular (e também sua ilha), uma província espanhola, ou sua cidade capital.
Figura 2: Diagrama de Venn representando a multiplicidade de referências semânticas que uma palavra pode ter. Revelando uma relação não injetiva entre os objetos do mundo real e a linguagem natural. Imagem gerada a partir de outras retiradas da Wikipedia. Disponíveis em: <https://pt.wikipedia.org/wiki/Granada>
Apesar de os termos (palavras), no português, serem os mesmos, todas essas entidades são objetos distintos do mundo real. Os termos na língua portuguesa, isoladamente, não possuem a capacidade de distinguir esses referentes (objetos), sendo necessários mais elementos informacionais para a sua identificação. Logo, a simples designação de um termo a um objeto, sobretudo daqueles termos retirados da linguagem natural, é insuficiente para referenciar bijetivamente (relação de um para um) um referente numa linguagem, e isso é um pré-requisito de linguagens documentárias feitas para a busca.
Daí se extrai a utilidade da Teoria do Conceito de Ingetraut Dahlberg (1978), que consegue exprimir com precisão a relação entre os objetos do mundo e seus elementos simbólicos representativos, sejam elementos de linguagem ou não. Para essa teoria, todo objeto na realidade, seja ele uma “coisa”, um evento, um processo, um fenômeno, um atributo, acontecimento, ou qualquer outro, pode ter seu conceito formado por meio da coleção de afirmações verdadeiras sobre o objeto em questão.
“[…] é possível formular enunciados a respeito tanto dos conceitos individuais como dos conceitos gerais. É em base a tais enunciados que elaboramos os conceitos relativos aos diversos objetos. Cada enunciado verdadeiro representa um elemento do conceito […] Podemos também dizer que o conjunto de tais enunciados constitui o conceito.” (DAHLBER, Ingetraut. 1978, p. 102)
Desta forma, os exemplos dados anteriormente podem ser devidamente distinguidos,
por meio de afirmações verdadeiras (enunciados) dadas sobre eles:
Manga:
- é um fruto;
- vem da árvore “mangueira”;
- nativa do sudeste asiático; ...
Manga:
- parte de vestuário;
- cobre o braço;
- pode ser curta ou longa; ...
Um conceito é o conjunto do referente, sua forma verbal e de “todas” as afirmações verdadeiras de um objeto, mas apenas com uma fração dessas afirmações – ou seja, com apenas um subconjunto do conceito – já é possível distinguir a qual entidade da realidade aquele conceito se refere.
Com isso em vista, alguém que faça uma linguagem documentária deverá cuidar para que cada termo incluso na linguagem, faça referência a um determinado objeto da realidade de forma biunívoca, evitando as confusões da linguagem natural. E permitindo que o agente indexador selecione os termos da forma mais útil possível para o usuário final.
Figura 3: Diagrama de Venn mostrando termos de um vocabulário controlado, fazendo uso de meios para que a relação entre referentes e termos seja biunívoca. Imagem gerada a partir de outras retiradas da Wikipedia. Disponíveis em: <https://pt.wikipedia.org/wiki/Granada>
2.5 Sistemas de Indexação
Um sistema de indexação terá dois atributos que representarão a sua qualidade frente à comunidade que atende, que são os seus potenciais de revocação (recall) e precisão. O primeiro, é a razão entre os documentos relevantes encontrados numa busca pela totalidade de documentos relevantes no acervo alvo. O segundo é a razão entre os documentos relevantes encontrados na busca pela totalidade de documentos encontrados.
Revocação = Documentos Relevantes Encontrados/Documentos Relevantes do Acervo
Precisão = Documentos Relevantes Encontrados/Documentos Encontrados
No primeiro caso, quanto mais a razão se aproxima de um inteiro (1), maior é sua revocação, significando que o sistema possui uma maior capacidade de esgotar as possibilidades de correspondências entre o argumento de pesquisa e os documentos referenciados por tal argumento. No segundo caso, um número mais próximo de 1 significa que o sistema terá a capacidade de filtrar adequadamente falsas correspondências, entregando uma busca eficaz ao usuário e evitando que ele tenha trabalho em filtrar manualmente os resultados entregues pelo sistema.
Esses atributos são quase que inversamente proporcionais, pois para esgotar as possibilidades de correspondências, usualmente se fazem pesquisas mais incisivas, com maiores chances de ocorrerem falsas correspondências, enquanto resultados mais precisos comumente incidem numa pesquisa menos incisiva, havendo risco de se deixar passar correspondências relevantes.
Existem basicamente duas estratégias básicas para a construção de sistemas de indexação: o método pré-coordenado e o pós-coordenado. Tais métodos se referem à maneira pela qual os termos de indexação são selecionados, como são fatorados e listados. No primeiro caso, os termos são combinados previamente pelo indexador, que deverá prever as possíveis combinações de termos nas buscas, entregando ao usuário um sistema enxuto, simples, mas com baixa capacidade de otimização e baixos índices de revocação. O segundo terá seus termos mais bem fatorados e as combinações dos termos nas buscas serão feitas pelo usuário, que poderá fazer uso de buscas booleanas para filtrar seus resultados. Este último sistema envolve maior trabalho por parte do usuário e pode incidir em menor precisão de busca.
“A primeira fórmula (pré-coordenação) é mais precisa, mais rígida, e limita a recuperação da informação. A segunda (pós-coordenação) é exatamente inversa. Na prática, esta escolha é determinada pelas condições concretas de funcionamento do sistema documental; muitas vezes as duas fórmulas são associadas pela combinação de descritores pré-coordenados para obter a maior eficácia possível.” (GUINCHAT & MENOU, 1994, p. 141, Adaptação própria)
Os defeitos de cada estratégia podem ser mitigados por técnicas, estudos e ciência sobre a comunidade que se busca atender. Os sistemas pré-coordenados se tornarão mais eficientes na medida em que os indexadores conseguirem esgotar as combinações de termos possíveis para atender a sua comunidade. Os sistemas pós-coordenados poderão se tornar mais eficiente na seleção dos termos, combinado com o uso correto de operadores booleanos durante as buscas. Usualmente, sistemas informatizados de busca farão uso do método pós-coordenado, pois é melhor aproveitado com recursos computacionais e pode chegar a um satisfatório índice de precisão e revocação.
bASE METODOLÓGICA
Tendo em vista o que foi afirmado na seção 2, pode-se traçar quais são as diretrizes e orientações que este guia pretende formalizar para a atividade de seleção de pontos de acesso para o AtoM-UnB.
As principais referências para o estabelecimento de regras para a seleção de pontos de acesso neste documento são as “Diretrizes para o estabelecimento e desenvolvimento de tesauros monolíngues”, de Dereck Austin e Peter Dale, publicado no Brasil em 1993, e também a “Norma para la Elaboración de Puntos de Acceso Normalizados de Instituciones, Personas, Familias, Lugares y Materias en el Sistema de Descripción Archivistica de los Archivos Estatales” (ESPANHA. MINISTERIO DE CULTURA. 2010) que se mostrou a norma mais detalhada e compatível com a realidade da UnB.
Essas duas referências permitirão duas formas de estruturar a linguagem documentária que será usada: a primeira, orientará a construção de relações entre os termos, bem como algumas formas de fatoração e seleção dos termos uma vez identificados. A segunda, bem mais detalhada do ponto de vista sintático, permitirá uma maior normalização das regras de como os termos deverão ser escritos uma vez que serão escolhidos da linguagem natural.
Apesar de uma das fontes ser voltada para a construção de um tesauro, almeja-se criar uma linguagem simples para os pontos de acesso, como uma lista sistemática de descritores, bem como um índice onomástico para os registros de autoridade. Entretanto, nada impede que seja criado um tesauro no futuro a partir dos índices criados. Algumas das observações da construção de tesauros serão utilizadas, para viabilizar a expansão da linguagem de forma que ela possa abarcar relações entre os termos.
“As listas de descritores podem comportar apenas as listas dos termos escolhidos, em ordem alfabética, mas pode-se acrescentar alguns sinônimos da linguagem natural junto aos termos correspondentes. Pode-se, desta forma, organizar um pouco a linguagem, estabelecendo relações entre os descritores: obtém-se, assim, uma lista estruturada. É possível ainda reagrupar os descritores em conjuntos e subconjuntos: obtém-se desta forma uma lista sistemática.” (GUINCHAT & MENOU, 1994, p 145).
O cabeçalho de assuntos é uma linguagem documentária adequada a sistemas de busca pós-coordenados e poderá ser expandida com alguma facilidade para um tesauro no futuro. Também tentaremos fazer “classificação facetada” dos índices, agrupando-os em conjuntos com assuntos em comum. “As classificações facetadas ordenam os conceitos e objetos em classes, mas são multidimensionais, isto é, são ordenadas no interior de cada classe em função de diversos pontos de vista” (GUINCHAT & MENOU, 1994, p 143). Realizando as facetas dos termos, que também se configurarão como em termos (mais gerais), portanto, facilitando a possível expansão dos cabeçalhos em um tesauro.
Vale ressaltar que a criação de vocabulários controlados é um trabalho árduo e multitarefa, feito, na maioria dos casos, por equipes multidisciplinares e por longos períodos de tempo. A adoção de uma linguagem mais simples, como o cabeçalho de assuntos, é a opção mais ideal para a realidade do Arquivo Central, que possui poucos recursos humanos e tempo para a confecção de seu vocabulário, permitindo a entrega da linguagem documentária em tempo hábil, e garantindo que ela esteja o mais correta possível.
Diretrizes
As diretrizes para o controle de vocábulos estão listadas abaixo. Tais diretrizes formam a base do que o vocabulário deverá atender. A criação de novas orientações ou a reformulação de orientações já existentes deverão observar tais diretrizes.
A linguagem documentária deverá ser desenvolvida para o auxílio do usuário em suas buscas, tendo em vista o público-alvo da UnB, diverso por natureza, constituído de alunos, professores, técnicos-administrativos, e diversas outras espécies de grupos sociais dos mais variados tipos, exigindo que se observe a natural variação de conhecimentos e necessidades informacionais;
Os pontos de acesso deverão ser extraídos dos documentos a partir de suas partes constituintes e de forma a o representarem, permitindo a dedução de seu conteúdo apenas pela mera observação dos termos selecionados;
Um conceito é um formado pelo conjunto de afirmações verdadeiras sobre um determinado objeto observado na realidade (referente);
A relação das palavras da linguagem natural para os termos da linguagem documentária será uma relação sobrejetiva, com várias palavras remetendo a um único termo da linguagem documentária;
A relação entre os termos da linguagem documentária para os conceitos possíveis será biunívoca. Isso resultara em um único termo por conceito e, consequentemente, por referente.
Os termos da linguagem natural deverão ser selecionados de maneira a se mitigar totalmente as homonímias, ou seja, deve-se evitar que conceitos diferentes sejam referenciados pelos mesmos termos (preservando sua relação biunívoca);
Qualificadores poderão ser usados para mitigar as homonímias e ambiguidades, sendo que esses são palavras que contextualizam o termo, colocados ao final dele, entre parênteses;
Outros métodos podem ser utilizados para se garantir os pontos anteriores dessas diretrizes;
A seleção dos termos, para o AtoM, deverá ser voltada a uma linguagem documentária pós-coordenada, para melhor aproveitar os recursos computacionais usados pelo AtoM, que permite a construção de argumentos de pesquisa pela busca Booliana;
Essas diretrizes, assim como as orientações observadas neste guia, devem ser constantemente e periodicamente atualizados, garantindo-se a atualização de sistemas que façam uso de tais orientações, como o próprio AtoM.
Orientações Gerais para a Seleção de Pontos de Acesso
Natureza do público
A seleção de pontos de acesso deverá ser feita sempre com um objetivo em mente: permitir que um consulente, dentro do perfil do público-alvo de uma instituição, seja capaz de, por meio desses pontos, encontrar a informação que busca, ou o documento em sua integralidade.
“A indexação de assuntos é normalmente feita visando atender às necessidades de determinada clientela […], não há um conjunto ‘correto’ de termos de indexação para documento algum. A mesma publicação será indexada de modo bastante diferente […], se os grupos de usuários estiverem interessados no documento por diferentes razões.” (LANCASTER, 2004, p 9.)
Atende-se essa comunidade se extraindo os tópicos “centrais” de um texto, que, em seguida, seriam traduzidos para os termos de um vocabulário controlado. Entretanto, tendo-se em vista a natureza altamente diversa do público da UnB, considera-se que estabelecer esses tópicos centrais pode ser um desafio considerável. Um professor poderá ter interesse em um documento com vistas a realizar alguma de suas pesquisas; um técnico-administrativo poderá ter interesse em fazer levantamentos acerca de materiais adquiridos num determinado período; um aluno poderá querer buscar informações para complementar suas atividades acadêmicas, sendo que ele não terá conhecimento de pesquisa ou do uso de operadores booleanos, e poderá necessitar de um sistema mais simplificado que o de um professor, por exemplo.
Para se atender essas múltiplas espécies de demandas, sugere-se a adoção de um vocabulário vasto horizontalmente, em termos de temas e assuntos, podendo ser dividido em “facetas” temáticas, para melhor organizar essa vastidão temática, com o uso de uma seleção “exaustiva” de pontos de acesso (sem muita discriminação de quais termos são relevantes ou não, visto que o perfil do usuário é imprevisível) e com vistas a formar um sistema de busca pós-coordenado.
Considerando o critério técnico do AtoM e das demais ferramentas de descrição, assim como a necessidade de se suprir a demanda de intercâmbio de informações entre instituições arquivísticas, um perfil mais “rígido” do ponto de vista sintático é o melhor a ser empregado no âmbito da linguagem documentária do ACE/UnB. Entretanto, para atender as demandas informacionais de usuários menos técnicos e menos voltados para a ciência, deve-se empregar recursos auxiliares a essa pesquisa mais técnica, como as próprias facetas temáticas, pesquisas pré-montadas de temas recorrentemente pesquisados, uso de mídias sociais para a exposição de algum determinado assunto etc.
Análise conceitual
O trabalho de seleção de pontos de acesso muito se assemelha com o trabalho de indexação, como é tratado na biblioteconomia, que é constituído de duas etapas básicas:
Análise conceitual
Tradução
Tais etapas podem se confundir durante o processo de indexação, que muitas vezes é encarado como um processo único e indivisível pelo agente descritor, entretanto são tarefas intelectualmente distintas. “A análise conceitual, em primeiro lugar, implica decidir do que trata um documento – isto é, qual o seu assunto.” (LANCASTER, 2004, p. 9). Há, nesta etapa, um trabalho de interpretação do texto do documento, em que se identificam os tópicos relevantes capazes de representá-lo com vistas às necessidades informacionais de uma comunidade.
Na arquivologia, essa etapa possui algumas peculiaridades que precisam ser observadas. Deve se ter em mente que, de forma ligeiramente diferente da indexação de um livro, os pontos de acesso devem ser selecionados das partes constituintes do conteúdo do documento, como demonstrados anteriormente:
Título (intitulatio)
Direção (inscriptio, ou a quem se dirige)
Preâmbulo (prologus)
Conteúdo textual principal (incluindo narratio, dispositio, sanctio, valoratio/corroboratio)
Subscrição (subscriptio, ou quem assina)
Datação (tanto data crônica quanto tópica)
Precação (aprecatio, quando houver)
Dentro dessas partes constituintes extraem-se diversos elementos que podem ser de interesse para o consulente da UnB. E, como destacado anteriormente, sugere-se o emprego de uma descrição exaustiva, que será menos crítica quanto aos tópicos identificados a serem excluídos da lista de termos selecionados. Dessa forma, nessa etapa, um bom guia para se identificar quais serão os pontos de acesso relevantes de um documento é identificar todos os núcleos dos sintagmas nominais, verbais e adjetivais que possam ser identificados no documento. Desses serão extraídos todos os tipos de pontos de acesso: nomes, locais e assuntos.
Pontos de acesso de nomes, de maneira geral, são nomes de pessoas, famílias e entidades coletivas contidas sobretudo nas partes: título, direção, subscrição, precação, conteúdo textual principal e até mesmo no preâmbulo.
Em seguida, deve-se extrair quaisquer entes geográficos, localidades, vias, rios, lagos, edifícios, pontos de interesse ou logradouros que estejam presentes na: direção, preâmbulo, conteúdo textual principal, datação (data tópica). Tais elementos serão transformados em pontos de acesso de local.
Para a identificação de pontos de acesso de assuntos, usar-se-á os demais núcleos de sintagmas identificados que não sejam nomes ou locais (sua definição realmente se dá por exclusão), usualmente incluem objetos, ideias, conceitos científicos ou filosóficos, abstrações, tipos e categorias de documentos, tipos e grupos de pessoas, etc. Estão inclusos, usualmente, nas partes: título, preâmbulo, conteúdo textual principal, datação (datas crônicas) e precação. Os pontos de acesso de assuntos são os mais numerosos em diversidade temática, portanto, deve-se esgotar a identificação desses elementos.
Tradução
A tradução é a etapa de transformação dos temas, assuntos e elementos identificados na etapa de análise conceitual em termos do vocabulário controlado. Basicamente é a escolha dos termos que serão usados para representar o documento e compor o vocabulário.
Classicamente, a tradução pode ser feita por 2 métodos:
a indexação por extração; e
a indexação por atribuição
Na indexação por extração, “palavras ou expressões que realmente ocorrem no documento são selecionadas para representar seu conteúdo temático” (LANCASTER, 2004, p. 18). Na indexação por atribuição, o agente indexador atribuirá termos não presentes diretamente no conteúdo textual do documento, com base na correspondência do significado do termo atribuído com os assuntos identificados na etapa de análise conceitual.
A indexação por extração é fácil e pode ser feita por quaisquer colaboradores minimamente treinados. A indexação por atribuição demandará maior conhecimento e experiência do agente indexador quanto a atividade de indexação e quanto ao vocabulário usado na UnB. Usualmente, o indexador a fará automaticamente, ao se recordar de termos que remetam àquele assunto.
Exemplo, o indexador analisa um documento que diz: “Alterar o texto do documento X”. Neste caso, numa tradução por extração, é comum se selecionar os seguintes termos:
Alteração
Texto
Documentos
A seleção não está incorreta, mas caso outros documentos daquele acervo tratem deste assunto com o termo “Retificação” por exemplo, talvez o indexador, possa fazer uma indexação atribuída da seguinte forma:
Retificação
Documentos
As descrições são distintas e ambas não estão erradas, mas a segunda é mais concisa no estabelecimento de vínculos com os demais documentos do acervo pelo histórico de utilização do termo “Retificação”. Caso a primeira indexação seja adotada, enquanto a segunda já era adotada antes, o consulente terá que pesquisar a documentação de duas formas diferentes para garantir a revocação ótima de sua pesquisa.
Essas observações constituem conceitos gerais e basais do processo de seleção de pontos de acesso. Entretanto, necessita-se de maiores orientações para realizar essa tarefa, que será melhor detalhada nas seções seguintes.
CONSTRUÇÃO DE LINGUAGENS DOCUMENTÁRIAS
Almeja-se, nesta seção, fornecer os insumos metodológicos necessários para executar de fato o controle de vocábulos dos termos a serem usados como pontos de acesso e assim consolidar as linguagens documentárias que os reunirão.
Como dito anteriormente, são três os tipos de pontos de acesso: nome, locais e assuntos. Essa divisão não se dá apenas por tipo ou tema, mas também por metodologia de seleção. Enquanto locais e assuntos costumam ser tratados por métodos típicos da construção de tesauros, nomes possuem regras vinculadas à formação de registros de autoridades, conforme a ISAAR(CPF), que trará uma série de metadados, opcionais e obrigatórios, numa estrutura mais complexa e sem necessariamente traçar relações hierárquicas entre os registros.
Tanto tesauros de assuntos e locais, como registros de autoridade sistematizados são estruturas ideais para se consolidar seus pontos de acesso. Entretanto, tais formas de linguagens documentárias constituem um trabalho mais elaborado, que talvez o Arquivo Central não possa fazê-lo num primeiro momento. Isto posto, sugere-se aqui a criação de duas listas sistematizadas de descritores: uma para assuntos e outra para locais, e mais um índice onomástico para abarcar os nomes. Essas três linguagens irão apenas listar os termos, sem necessariamente as relacionar. Posteriormente, elas poderão ser estendidas para formas mais elaboradas, como o registro de autoridade e o tesauro.
Termos preferidos, não-preferidos e formas autorizadas do nome
Um termo é uma representação escrita de um conceito, podendo ser um substantivo ou uma frase substantivada. Na descrição, todos eles serão extraídos dos núcleos dos sintagmas nominais, verbais ou adjetivais do conteúdo do documento. Caso seja formado por mais de uma palavra, será um “termo composto”.
Há a inda a figura dos qualificadores, que são as palavras colocadas junto ao termo, quando necessário, para afastar homonímias e homógrafos e induzir o correto entendimento do conceito ao qual o termo se refere. São apostos ao termo após um espaço e entre parênteses, e separados entre si por vírgula e espaço.
Ex:
Ética
Telefones celulares
Contínuo (cargo)
O ponto de acesso é um termo que permite o acesso a um conteúdo. Os termos selecionados para serem os pontos de acesso podem ser chamados de “termos preferidos”, “termos preferenciais”, “descritores”, “termos de indexação” ou “termos oficiais”, caso o termo faça referência a um nome, usualmente ele é chamado de “forma autorizada do nome”.
Todos esses obedecerão mais ou menos a seguinte estrutura:
<Termo simples ou composto> <(qualificador 1, qualificador 2, … qualificador 3)>
Exemplo ilustrativo:
Universidade de Brasília. Coordenação de Arquivo Permanente (2014-)
Termos “não-preferidos” ou “não-oficiais” serão evitados como “pontos de acesso”, mas poderão compor um tesauro, como a indicação de uma palavra da linguagem natural que não deve ser usada como tal ou durante as buscas.
O conjunto de termos preferidos, por terem passado por uma seleção regrada e controlada, formará o produto da linguagem documentária. Abaixo, listam-se as regras para a composição dos pontos de acesso por tipo: nomes, locais e assuntos.
4.1 Pontos de acesso de Nomes (Pessoas, Famílias e Entidades Coletivas)
São usados para registrar pessoas, famílias ou entidades coletivas. Tais registros obedecem a normas como a Norma Internacional de Registro de Autoridade Arquivística para Entidades Coletivas, Pessoas e Famílias – ISAAR (CPF), que traz em seu item 5.1.2, “Forma autorizada do nome”, o que é necessário para o registro dos pontos de acesso de nome:
“Registre a forma normalizada do nome para a entidade que está sendo descrita de acordo com quaisquer convenções ou regras nacionais ou internacionais pertinentes aplicadas pela instituição que criou o registro de autoridade. Use datas, lugar, jurisdição, ocupação, epíteto e outros qualificadores apropriados para distinguir a forma autorizada do nome daquelas de outras entidades com nomes semelhantes. Especifique separadamente no elemento Regras e/ou convenções (5.4.3) quais as regras que foram aplicadas neste elemento.” (CIA, 2003, p. 17)
Percebe-se que a norma, que é de âmbito internacional, foi criada com vistas a respeitar as múltiplas possibilidades de normas que as diversas instituições arquivísticas possam adotar para formar seus registros de autoridade. Logo, como não há uma norma brasileira para a formação de pontos de acesso, cabe à própria UnB criar suas regras. Este guia as propõe.
4.1.1 Pontos de acesso de entidades coletivas
Incluem-se nesse escopo instituições dos seguintes tipos de entidades:
Com ou sem personalidade jurídica reconhecida;
Ministério da Fazenda;
Agência Tributária;
Subordinadas a outras instituições;
Subdireção Geral dos Arquivos Estatais;
Internacionais e supranacionais;
Organização das Nações Unidas;
Com poderes públicos;
Governo do Estado de São Paulo
Brasil. Congresso Nacional
Reino de Nápoles
Militares;
Regimento de Cavalaria Provincial de Voluntários das Filipinas;
Escola Naval (Brasil);
Famílias e instituições históricas e da nobreza;
Ducado de Veragua
Casa del Rey
De caráter social, laboral e profissional, econômico e financeiro, sanitário, educativo, cultural ou recreativo;
Brasiliense Futebol Clube
Associação dos Servidores da Fundação Universidade de Brasília
Partido Brasileiro (1822-1831)
Centro de Ensino Médio Elefante Branco
Instituições relacionadas com o transporte, as comunicações e a navegação espacial;
Aeroporto Internacional de Viracopos
National Space Agency
De meios de comunicação;
Revista Época
Sistema Brasileiro de Telecomunicações
Rede Record
De produção artística e intelectual;
Paramont Pictures
Som Livre
Religiosas;
Convento de Santa Teresa;
Sinagoga La Javurá
Temporárias;
Igreja Católica. Vaticano I (1846-1878)
Jogos Olímpicos de Barcelona
Assembleia Constituinte (1823, Brasil)
Plano, projeto ou operação onde atuam/atuaram um conjunto de pessoas.
Projeto Genoma Humano;
Painel Intergovernamental de Mudanças Climáticas;
Há também a figura dos cargos institucionais ou unipessoais como:
Presidente da República;
Cônsul Geral da Espanha em Chicago;
Esses são, idealmente, entidades coletivas, mas como eles também são entendidos como cargos na percepção comum, e como pode haver confusão ao separá-los dos demais cargos, opta-se por incluí-los como assuntos. Caso seja decidido colocá-los como entidades coletivas, as regras deverão ser as seguintes:
Não confundi-los com as instituições da qual fazem parte, ou com as entidades ou locais onde suas atribuições são desempenhadas.
Exemplo:
Governador do Distrito Federal;
E não
Governo do Distrito Federal;
e nem
Distrito Federal (unidade da federação, Brasil);
Fontes
Para se determinar quais os nomes a partir dos quais se formam a Forma autorizada do nome, podem-se consultar as seguintes fontes:
O documento de arquivo descrito;
Leis e normas oficiais;
Publicações e documentos da própria instituição;
Obras de referência, livros e artigos;
Escolha do nome e formalização
Para compor a forma autorizada do nome, usa-se apenas um único nome (simples ou composto) para representar a instituição, sendo ele de fonte legal, oficial, ou que seja popular. Quaisquer outras formas pelas quais a instituição seja conhecida deverão ser registradas como “Outras formas do nome” ou “Formas paralelas do nome” de acordo com a ISAAR(CPF).
Regra Geral
Será escolhida uma Forma autorizada do nome para cada instituição, que deverá conter todos os elementos para sua unívoca identificação. Este pode ser seu nome oficial, ou o mais popularmente conhecido. Escolhida a “forma autorizada do nome”, qualquer outra forma pela qual se conheça a instituição deverá ser registrada em “outras formas do nome” (ou “formas paralelas do nome” caso a instituição tenha nomes diferentes em línguas diferentes).
Os pontos de acesso normalizados serão iniciados pelos nomes oficiais (ou legais, convencionais, etc) das instituições, escritos de maneira direta, exceto as subordinadas, assim como aquelas que tenham jurisdição sob as quais se exercem poderes públicos, religiosos, militares, etc, que não esteja expresso no nome legal/oficial da instituição.
Para os cargos institucionais ou unipessoais, caso não sejam registrados como assuntos, se seguirão as mesmas regras e/ou recomendações daquelas usadas para o resto das instituições.
Qualificadores
Para uma entidade coletiva, os qualificadores poderão ser de:
Atividade:
Escrevem-se sempre em minúscula e no singular.
Lugar:
Coloca-se o local e/ou país onde se localiza a entidade.
Data:
Coloca-se as datas de existência da entidade, no caso de datas limites, apõe-se a data inicial e a final separada por um hífen. Caso a entidade ainda exista, apõe-se apenas o hífen. Datas não exatas serão indicadas especificamente: usar-se-á a abreviatura “ca.” (circa) antes da data, caso ela seja uma aproximação, sem espaço. Usa-se “?” ao final da data para indicar que a data mostrada é duvidosa. Os séculos são formados com algarismos romanos, precedidos da abreviatura “s.” em minúscula e separada por espaço. Intervalos de ciclos serão sinalizados por um hífen sem espaços.
Língua e Escrita
Instituições deverão ter seus nomes escritos preferencialmente em português, caso haja tais versões de seus nomes. Caso contrário, incluir-se-ão seus nomes oficiais em suas próprias línguas. Havendo o nome em português, os outros nomes serão inclusos como “formas paralelas do nome”.
Instituições que não usem o alfabeto ou sistema de escrita latino deverão ser transliterados segundo a norma ISO (37).
Os sinais, símbolos, pontos e sinais diacríticos de cada língua serão respeitados.
O uso de letras maiúsculas e minúsculas seguirão as normas ortográficas de cada língua.
Nome da Instituição
Quando o ponto de acesso for constituído apenas por um nome da instituição, far-se-á o seguinte:
Se a instituição tiver apenas um nome em todas as fontes consultadas, será este o nome escolhido.
Artigo no início do nome: será mantido quando fizer parte do nome.
Siglas e Abreviações: serão mantidos as que indicam o regime legal da instituição, ou acompanharam o nome desenvolvido de entidades cuja sigla seja consagrada.
Ex:
Petróleo Brasileiro S.A.
IGB ELETRONICA S.A (Gradiente)
Empresa Brasileira de Pesquisa Agropecuária (EMBRAPA)
O restante será desenvolvido.
Títulos Honorários: Não se incluirão, a não ser que componham a Forma autorizada do nome.
Exceções: títulos honorários podem ser dispensados na construção das Formas autorizadas do nome nos casos em que sejam mais populares os nomes sem esses títulos. Instituições religiosas com muitos títulos poderão ter suas Formas autorizadas do nome construídas com a exclusão dos tratamentos, tomando-se cuidado para que não sejam vulgarizados.
Vários nomes para uma mesma instituição
Caso as fontes indiquem mais de um nome usado na identificação da instituição, deve-se fazer como se segue:
Seleciona-se, para constituir a “Forma autorizada do nome”, a forma legal ou oficial do nome, a não ser que haja um outro consagrado como mais popular e que esteja registrado entre os documentos de arquivo ou outras referências. Deixam-se então as demais formas de nome para “Outras formas do nome”.
Mais de um nome oficial: será mantido o predominante segundo essa ordem:
As publicações e documentos da própria instituição;
As obras de referência sobre a instituição.
Instituições Religiosas
Usar-se-ão sempre, por mais conhecidos que sejam seus nomes consagrados popularmente, as formas legais ou formais de seus nomes, sendo as outras formas contempladas pelo campo “Outras formas do nome”.
Nomes trocados ao longo do tempo
Analisa-se primeiro se é realmente uma simples troca de nome ou se essa troca implicou na sua extinção seguida do surgimento de uma nova instituição. No primeiro caso registram-se os nomes antigos em “Outras formas do nome”, enquanto que a mais recente forma de nome será a “Forma autorizada do nome”. No segundo caso serão criadas duas “Formas autorizadas do nome”. Uma para cada instituição, constituindo dois registros de autoridade diferentes. Caso a nova instituição esteja assumindo os mesmos termos, competências e regime jurídico da anterior, será considerado como se fossem a mesma.
Siglas e acrônimos
Serão registrados em “Outras formas do nome”, em caixa-alta e sem espaço ou ponto entre as letras. A forma autorizada do nome sempre será composta da forma desenvolvida (escrita por extenso) da sigla ou acrônimo, e caso ela seja muito popular, essa sigla também comporá a forma autorizada do nome na forma de um qualificador.
Nome de instituições com jurisdição ou que exerçam poderes sobre uma área
Instituições contemporâneas que exercem poderes públicos sobre uma área também terão seus nomes escolhidos de acordo com seus nomes oficiais. Como essas podem ser referenciadas pelos nomes de suas áreas, essas serão registradas como outras formas do nome, junto com outros que forem pertinentes
Ex:
Forma autorizada do nome:
República Federativa do Brasil
Outras formas do nome:
Brasil
Instituições oficiais, judiciais ou legislativas, com jurisdição e/ou autonomia
Instituições oficiais governamentais, legislativas, judiciais ou militares, nacionais e autônomas: Incluir-se-á a jurisdição somente se o nome da instituição já não a incluir, colocando em seguida o nome da instituição separada por ponto e espaço em seguida da jurisdição. Assembleias Constituintes terão seus períodos de existência registrados como qualificadores.
Exemplo:
Brasil. Tribunal Superior do Trabalho
Espanha. Cortes Constitucionais (1931-1933)
Brasil. Assembleia Nacional Constituinte (1987-1988)
Instituições militares de âmbito nacional
Coloca-se suas jurisdições e seu nome, separados por ponto e espaço, apondo-se qualificadores quando necessário.
Exemplo:
Brasil. Rio de Janeiro. Brigada de Infantaria Paraquedista
Nome de Instituições hierarquicamente superiores
Quando a instituição indexada é subordinada a outra, o ponto de acesso normalizado será composto do nome da instituição e sua superior, separados por ponto e espaço, em ordem hierárquica decrescente. Só se incluirão instituições intermediárias na estrutura hierárquica se estas forem fundamentais para a correta identificação da instituição subordinada.
Exemplo:
Universidade de Cádiz. Secretaria-Geral. Oficina de Revisão Normativa e de Procedimentos
Universidade de Brasília. Coordenação de Arquivo Permanente
Instituição subordinada identificada de forma unívoca
São instituições subordinadas que não possuem homônimos numa instituição ou num país, por exemplo. O ponto de acesso normalizado será escrito usando o nome da entidade subordinada. Referências à instituição ou a instituições superiores serão feitas em outras formas do nome.
Exemplo 1:
Forma autorizada do nome:
Espanha. Subdireção Geral dos Arquivos Estatais
Outra forma do nome:
Espanha. Ministério da Cultura (2004-). Subdireção Geral dos Arquivos Estatais.
Exemplo 2:
Forma autorizada do nome:
Universidade de Brasília. Serviço de Microfilmagem
Outra forma do nome:
Universidade de Brasília. Arquivo Central. Coordenação de Gestão de Documentos. Serviço de Microfilmagem
Instituição subordinada identificada de forma não unívoca
São instituições que possuem homônimos numa mesma instituição ou território, como num país, mas que são subordinadas a outras. Essas serão encabeçadas pelo nome normalizado da instituição superior:
Caso existam homonímias com outras instituições ;
Quando o nome da entidade subordinada seja genérico de maneira que necessite de sua entidade superior para a sua compreensão;
Quando o nome da instituição subordinada recorra a algum termo que indique que seja parte de outra, como quando é um departamento, divisão, seção, ou quando implique uma subordinação administrativa, como comitê, comissão, etc, e não seja identificável por si mesma;
Quando a instituição subordinada tenha um nome que não deixe claro que ela seja uma instituição.
Nessas situações o ponto de acesso será criado tomando como termo inicial apenas a instituição superior que identifique a subordinada de forma unívoca.
Exemplo 1:
Universidade de Brasília. Faculdade de Direito
Universidade de São Paulo. Faculdade de Direito
Exemplo 2:
Universidade de Brasília. Instituto de Ciências Humanas. Conselho
Universidade de Brasília. Instituto de Ciências Sociais. Conselho
Universidade de Brasília. Instituto de Física. Conselho
Igreja Católica
Instituições seculares
Quando a instituição a ser indexada é comum a toda a Igreja ou a um órgão da Cúria Romana, o ponto de acesso normalizado poderá ser composto. O primeiro elemento será “Igreja Católica”, seguido do nome ou nomes, em ordem hierárquica decrescente, separados por ponto e espaço. Tal regra se aplicará aos órgãos seculares superiores ou iguais a dioceses mesmo que não sejam comuns a toda a Igreja.
Entretanto, quando a instituição corresponde a um organismo de nível inferior à Diocese, o primeiro elemento do ponto de acesso normalizado será o nome da própria instituição.
Exemplo:
Igreja Católica. Venerável Ordem Terceira da Penitência de São Francisco de Assis
Instituições regulares
O nome de uma instituição regular irá ser precedido do nome da ordem, congregação ou sociedade religiosa, a qual irá separada por ponto e espaço. Se indicará o nome mais conhecido da ordem, congregação ou sociedade segundo a seguinte ordem de preferência:
O nome em português pelo qual seus membros são conhecidos
O nome usado nas sedes brasileiras da ordem, congregação ou sociedade religiosa
O nome da ordem, congregação ou sociedade religiosa em sua língua de origem, se não tiver sede no Brasil.
Exemplo:
Ordem de São Bento. Abadia de Montmartre (1147-1790)
Concílios, Sínodos e Assembleias
O primeiro elemento será “Igreja Católica”, seguido do nome, separados por ponto e espaço. O nome do Concílio/sínodo/assembleia será redigido em português, incluindo os qualificadores e o número da ordem, se não o tem, em ordinal arábico, e as datas de existência.
Exemplo:
Igreja Católica. Vaticano I (1846-1878)
Outras igrejas e confissões
O nome da igreja irá anteceder o nome da instituição.
Exemplo:
Igreja Anglicana. Arcebispo de Canterbury
Instituições temporárias
Será constituído com o nome da instituição, e, como qualificadores, o número de ordem, se o tem, em ordinal Arábico, suas datas e lugar como qualificadores. Se o nome da instituição temporária conter o nome da entidade organizadora, o ponto de acesso será iniciado com ele, seguido do correspondente termo genérico que irá ser separado por ponto e espaço.
Exemplo:
Sociedade Espanhola de Ginecologia e Obstetrícia. Congresso (30º, 2009, Barcelona, Espanha)
Universidade de Brasília. Arquivo Central. Workshop de Gestão Documental (10º, 2022, Brasília, Distrito Federal, Brasil)
Entidades Compostas
Entidades compostas, como consórcios e convênios serão normalizadas pelos seus nomes próprios caso os tenham e com o seu tipo de entidades junto com os nomes das suas instituições componentes concatenados e separados por “/” como “outras formas do nome”. Caso não haja nome próprio, essa última forma será a sua forma normalizada do nome.
Exemplos:
Convênio Fundação Universidade de Brasília/Brasil. Ministério da Educação
4.1.2 Pessoas
Quando se observa a forma com que instituições arquivísticas ao redor do mundo criam pontos de acesso de nomes de pessoas, observa-se que não existe real padronização. Alguns optam por escrever esses nomes diretamente, como se observa na RADs canadense, sem inverter a posição do pré-nome e sobrenome. Outros apõe o último sobrenome primeiro, seguido do pré-nome e os sobrenomes restantes, como se observa da DACs americana.
Diversas universidades brasileiras adotam a forma direta de escrita do nome de pessoa, como se observa em alguns AtoMs de instituições de ensino superior brasileiras. Entretanto, percebe-se que tais instituições ainda não normalizaram seus pontos de acesso. A UnB vem adotando, até o presente momento, a forma direta de escrita. Essa forma também é adotada pela RADs, no Canadá. Já as normas espanhola e americana de descrição, adotam regras mais complexas, que fazem uso de inversão dos componentes do nome, supressão de preposições e conjunções etc.
Considerando o público brasileiro, sua tradição de valorizar o pré-nome em detrimento dos sobrenomes ao se referir às pessoas; o uso dessa forma em universidades brasileiras; e o trabalho que já era realizado na UnB, será adotada a forma direta de escrita de nomes de pessoas, similar à RADs.
Definição
O ponto de acesso de pessoa é uma referência a um indivíduo da espécie humana. É um nome dado a um indivíduo ou um nome pelo qual ele é conhecido. O ponto de acesso de nome de pessoa será uma combinação de termos que permitem a perfeita distinção entre pessoas diferentes, ainda que homônimas. Pode ser um nome real, pseudônimo, sobrenome ou qualquer outro, fazendo-se uso de qualificadores para evitar ambiguidades e garantir que cada pessoa tenha apenas um termo referente a ela. Esse termo único será a “forma autorizada do nome” dessa pessoa em seu registro de autoridade.
Fontes de Informação
Consulta-se:
Os documentos de arquivo sendo descritos;
Fontes oficiais como registros civis ou paroquiais, censos eleitorais, documentos expedidos pela Administração Pública ou apresentados perante ela.
Fontes de dados abertos sobre recursos humanos.
Obras de referência, monografias especializadas ou registros de autoridade.
Sua seleção se dá a critério dos responsáveis pela redação dos pontos de acesso, visto que o número de fontes é muito vasto.
Regra Geral
Cada pessoa a ser registrada só terá uma forma autorizada do nome, com os seus demais nomes (nomes de solteiro, divorciado, pseudônimos, nomes artísticos, ou formas autorizadas do nome de outras entidades) sendo registrados como “outras formas do nome”, ou “formas paralelas do nome” para nomes em outras línguas. Apenas um nome será o ponto de acesso normalizado, e ele deverá ser, preferencialmente, o nome completo legal ou oficial da pessoa em questão, mesmo que esta utilize outros sobrenomes ao longo de sua vida. Caso a pessoa seja mais conhecida por pseudônimos ou nomes artísticos, esses poderão ser usados, enquanto seus nomes oficiais deverão estar registrados em outras formas do nome.
Abreviações serão sempre desenvolvidas quando se tiver certeza, de acordo com as fontes, nas quais os nomes estejam associados. Caso contrário, serão mantidas.
Deverão ser evitados os hipocorísticos, que são diminutivos, eufemismos, designações familiares e outros recursos para atenuar o nome (Chico, em vez de Francisco), exceto quando esta seja a única forma com que a pessoa apareça nas fontes. Os nomes reais de hipocorísticos não deverão ser interpretados ou supostos.
Não serão criados pontos de acesso quando o único elemento identificador da pessoa seja apenas um pré-nome. Caso existam outros elementos que permitam sua identificação dentro do contexto, como sobrenomes, títulos, abreviações de sobrenomes, o ponto de acesso poderá ser criado com esses elementos.
Componentes
A forma autorizada do nome será formada pelos elementos que permitam distinguir inequivocamente as pessoas. Os componentes que constituem a forma autorizada do nome ou ponto de acesso normalizado onomástico são o nome da pessoa (nomes próprios e sobrenomes) e qualificadores.
Qualificadores
Serão redigidos em português, exceto aqueles em que são escritos em sua língua mãe estrangeira e não tenham sua versão equivalente em português.
Quando as datas de nascimento e morte forem conhecidas, essas serão obrigatoriamente inseridas como qualificadores, registradas em anos e em séculos. Serão separadas em hífen, sem espaços. Quando apenas a data de nascimento for conhecida, ou quando se tratar de pessoas vivas, colocar-se-á esta seguida de hífen. Caso conheça-se apenas a data de morte, coloca-se esta precedida de hífen.
No caso de se desconhecer as datas de existência da pessoa, poderão ser registrada as suas datas de atividade ou profissão, indicadas pela abreviação “fl.” (floruit) sem espaços, registrada em anos ou em séculos.
Quando houver incertezas das datas, serão incluídos:
“ca.” (circa) para indicar que as datas são aproximadas. Colocadas adiante da data de referência, sem espaços.
“?” para indicar que a data é duvidosa. Colocada atrás da data a que se refira, sem espaços.
Caso não seja possível indicar precisamente as datas, poder-se-á indicar os séculos. Eles serão indicados em números romanos e letras maiúsculas, precedidos da abreviação “s.” em minúscula e separada por um espaço. Para os intervalos de séculos, estes períodos serão sinalizados separados por um hífen sem espaços.
Formas autorizadas do nome de outros índices ou registros de autoridade
Deverão ser registrados como “Formas normalizadas do nome de acordo com outras regras”, se estiverem em português ou em “Formas paralelas do nome” se estiverem em outras línguas, copiadas conforme se manifestem.
Exemplo:
Forma autorizada do nome (para a UnB):
José Ortega y Gasset
Forma paralela do nome (para outras instituições espanholas):
Ortega y Gasset, José (1883-1955)
Forma normalizada do nome de acordo com outras regras (para uma instituição hipotética qualquer):
ORTEGA Y GASSET, José
Língua, escrita e grafia
Os nomes serão escritos na língua original da pessoa. Quando os documentos de arquivo de um mesmo nome apresentar diferentes formas linguísticas e, consultadas as obras de referência e fontes especializadas, exista um nome convencional consolidado em português, este será preferido como forma autorizada do nome. Reconhecendo-se os demais em “formas paralelas do nome”.
Se aparecerem várias versões do nome em múltiplas línguas nos documentos de arquivo e, consultadas as demais referências, não se puder decidir qual a nacionalidade da língua, escolher-se-á a mais frequente, dando-se prioridade à forma em português, se ela estiver equilibrada com as frequências nas demais línguas.
Nomes árabes, latinos, gregos, hebreus, etc. serão normalizados em português, de acordo com a regra geral, podendo-se fazer as devidas referências nos registros de outras formas do nome.
Nomes em sistemas de escrita não latinos serão transliterados ao alfabeto latino segundo a norma ISO 37.
Grafias antigas serão atualizadas, exceto quando se saiba com segurança e se possa constatar que a forma persiste na atualidade. Caso seja necessário fazer referências à grafia original, estas serão feitas em outras formas do nome.
Nomes próprios também serão atualizados para a língua de origem caso apareçam em latim ou em línguas românicas.
Partículas e sinais diacríticos formam parte do nome e, consequentemente, serão sempre conservados, ainda quando sejam resultados de uma transliteração.
As regras ortográficas vigentes determinarão as regras de maiusculização.
Serão escritos em maiúscula, tanto no elemento principal dos pontos de acesso como nos qualificadores, a letra inicial de nomes próprios, sobrenomes, nomes geográficos, nomes específicos de título de nobreza, “advocaciones” (dedicação de um lugar religioso), cada uma das letras constituintes de siglas de ordens religiosas, e cada elemento de numeração romana.
Em minúscula serão escritos: o nome comum de títulos de nobreza, os nomes de dignidade (rei, papa, bispo, etc.) e os literais que se indicam a continuação no ponto.
Nomes clássicos, gregos e latinos
Escolher-se-á o nome convencional consolidado em português, fazendo-se as referências oportunas a seu nome em latim ou em grego em “Formas paralelas do nome”.
Títulos de Nobreza
Será aplicado apenas se constituir uma forma consagrada do nome. Mas quando uma pessoa ostentar vários títulos de nobreza e alternar seu uso com o nome real, este título passará a ser “outra forma do nome” pelo qual a pessoa é conhecida. Se as fontes de informação não permitirem a identificação da pessoa porque só consta o título, caso frequente nos títulos estrangeiros, se incluirá na Forma autorizada do nome, como qualificador, a dignidade do título de nobreza entre parênteses e em minúscula.
Exemplo 1:
Forma autorizada do nome:
Ada Lovelace (1815-1852)
Outras formas do nome:
Augusta Ada Byron King (1815-1852)
Condessa de Lovelace (1815-1852)
Exemplo 2:
Forma autorizada do nome:
Leonor de Guzmán (-1441?)
Formas autorizadas de acordo com outras regras:
Condessa consorte de Arcos (-1441?)
Exemplo 3. Para o caso de, simuladamente, não se saber o nome do conde de Caxias da época do Brasil Império:
Caxias (conde, 1845-)
Pessoas que trocaram de nome
Caso a pessoa tenha feito uma troca oficial de nome, usar-se-á o último que ela tenha tido, fazendo referência aos outros nomes passados às outras formas do nome.
Pessoas que se casaram e, no processo, adquiriram o nome do cônjuge, também terão seus casos considerados como troca oficial do nome. Quando a pessoa casada não trocar legalmente seu nome, e só se conhecer ela pelo sobrenome do cônjuge, será usado o sobrenome do cônjuge como se fosse parte do próprio na Forma autorizada do nome.
Pseudônimos usados permanentemente serão considerados uma troca de nome e a Forma autorizada do nome se construirá seguindo a mesma regra que para a troca oficial.
Exemplo:
Forma autorizada do nome:
Lenin (1870-1924)
Outras formas do nome:
Vladimir Ilich Ulianov (1870-1924)
Formas normalizadas do nome de acordo com outras regras
Ulianov, Vladimir Ilich (1870-1924)
Nomes medievais
Nomes medievais formados habitualmente por um nome próprio seguido de um patronímico, gentílico, topônimo, apelido, ofício ou profissão, serão escritos diretamente.
Exemplo:
Forma autorizada do nome
Gonzalo de Berceo (ca.1197-ca.1264)
Sigla de ordem religiosa
Podem ser inseridas como qualificadores para diferenciar pessoas diferentes
Exemplo:
Forma autorizada do nome:
Ana de Jesus (OSC)
Ana de Jesus (OSST)
Caso seja necessário mais de um qualificador, serão inseridos na seguinte ordem: data, título de nobreza, e de ordem religiosa.
Nomes de papas, antipapas e dignidades de outras igrejas
O elemento inicial da Forma autorizada do nome será o nome próprio adotado pelo pontífice, em português, seguido do ordinal em cifras romanas e o qualificador “papa” ou “antipapa” em minúscula. Poderá ser registrado o nome oficial da pessoa em Outras formas do nome.
Exemplo:
Forma autorizada do nome
Pio X (1835-1914, papa)
Para as outras dignidades eclesiásticas (patriarcas, bispos, arcebispos, etc.) se seguirá a regra geral: o nome oficial completo e em ordem direta. Quando for necessário eliminar homonímias, serão usados o cargo como qualificador.
Nomes de santos e beatos
Se redigirão de maneira direta, sendo o elemento inicial o nome próprio com o qual tenham sido canonizados ou beatificados, em português, seguido do sobrenome, topônimo ou advocación e o qualificador “santo”, “santa”, “beato”, “beata”, “venerável”, etc. Em minúscula e entre parênteses. Quando se conheça seu nome oficial, se estabelecerão as referências oportunas, reconhecendo-o em outras formas do nome.
Exemplo:
Forma autorizada do nome:
São Bento de Núrsia (480-547, santo)
Outras formas do nome:
Benedito da Nórcia (480-547, santo)
Formas paralelas do nome:
Benedetto di Norcia
Nomes de Religião
Será o nome adotado pela pessoa ao ingressar na vida religiosa, seguido do sobrenome, advocación, lugar de origem, sempre de forma direta, suprimindo-se os tratamentos (frei, padre, madre, irmão, irmã). Quando se conheça o nome oficial, este será registrado em outras formas do nome.
Só serão adicionadas as siglas de ordens religiosas no qualificador, e apenas para mitigar homonímias.
Nomes de reis, imperadores, príncipes reinantes
A forma autorizada do nome será o nome próprio com o qual tenha exercido seu reinado, em português (se houver nome aportuguesado), seguido do ordinal, se o tiver, em cifras romanas, e se adicionará no qualificador, entre parênteses, o título em minúscula e o nome do reino, povo ou estado governado.
Exemplo:
Forma autorizada do nome:
Alfonso VI (1040-1109, rei de Leon e Castilla)
Nomes anteriores ao exercício ou outros títulos assim como sua condição de soberano de outros territórios, com seus ordinais correspondentes, poderão ser registrados em outras formas do nome.
Os apelidos, títulos e sobrenomes (por exemplo: sábio, breve, clemente, católico, cruel) não se incluirão no ponto de acesso normalizado de pessoa.
Para herdeiros ao trono, que não tenham chegado a reinar, e infantes, se aplicarão a regra geral, ou seja, o nome oficial completo em ordem direta, adicionando-se a dignidade e o território como qualificadores, entre parênteses.
Para os consortes de reis ou rainhas e regentes, também se aplicará a regra geral de nome de pessoa. Não obstante, se farão as referências oportunas de sua condição de consorte ou regente em outras formas do nome.
4.1.3 Pontos de Acesso de Famílias
Famílias podem ser de tipos especiais:
Casas: descendências ou linhagens que tem um mesmo sobrenome e vem de uma mesma origem.
Exemplo:
Casa de Barcelona
Dinastias: série de soberanos reinantes em um determinado território, pertencentes a uma família ou casa real.
Exemplo:
Dinastia Habsburgo
Títulos de nobreza hereditários: Títulos concedidos por um soberano a uma pessoa para recompensar serviços. Usualmente perpetua-se pela família por herança. Exemplo:
marqueses de Villamejor, condes de Agrela
Para cada família ou título de nobreza, será eleito um único ponto de acesso normalizado. Poderá ser um sobrenome que se refira à família, casa ou dinastia ou título de nobreza.
Regra geral
Cada família só poderá ter uma forma autorizada do nome. Qualquer outra forma pela qual ela seja conhecida poderá ser registrada como “Outras formas do nome”.
O ponto de acesso normalizado será escrito de maneira direta, registrando-se como elemento inicial o Sobrenome ou título de nobreza da família. No caso de família, casa ou dinastia, o primeiro elemento do ponto de acesso serão os Sobrenomes, no máximo dois deles, seguido por vírgula e espaço e o tipo correspondente em minúscula: “família”, “casa”, “dinastia”. Sempre que uma família tiver um título de nobreza associado, este será registrado como um qualificador entre parenteses.
Exemplo:
Hérnan Busaniche, família
Capeto, dinastia (Navarra)
Fernández del Pino, família (viscondes de Solís)
Sobrenomes separados por hífen, partícula integradora, preposições ou conjunções serão consideradas um só sobrenome, conservando-se sempre o hífen.
Exemplos:
Pacheco-Osorio, família (marqueses de Cerralbo)
Díez de Quijada y Obejero, família
Sobrenomes precedidos por componentes como: preposições, artigos, combinações de ambos, contrações ou outras partículas, as terão inseridas ao final do nome, que serão iniciados pelo próprio sobrenome, seguidos de vírgula e espaço, tipo de família e, em seguida, tais partículas.
Exemplos:
Fraile, família el
Ábalos, família de
Prado, família do
Casa, família da
Fuente, família la
Bismarck, família von
Weyden, família van der
Santos, família dos
L’Hôpital, família de
Annunzio, família d’
Conti, família dei
Se as fontes confirmam a existência de diferentes formas do nome, deverá ser escolhida a mais usada nos documentos de arquivo ou aquela que, com o passar do tempo, tenha se consolidado como a mais popular. Far-se-ão as referências oportunas em “Outras formas do nome” ou “Formas paralelas do nome”.
Exemplos:
Forma autorizada do nome
Zúniga, família (duques de Béjar)
Forma paralela do nome
Stúñiga, família (duques de Béjar)
Estúñiga, família (duques de Béjar)
Nomes de famílias que apareçam nas fontes em diversas línguas diferentes serão normalizados de acordo com o nome mais frequente. Caso as formas em português ou na língua de origem estiverem equilibradas, priorizar-se-á a em português, caso contrário, será utilizada a versão na língua original da família. Assim que for definida a forma autorizada do nome, as demais serão registradas em outras formas do nome (para as que estão em português) ou formas paralelas do nome (para as que estiverem em outras línguas)..
Exemplo:
Forma autorizada do nome:
Fúcar, família
Forma paralela do nome:
Függer, família
Famílias que tenham trocado de nome
Famílias que tenham trocado de nome deverão ter registradas como formas autorizadas do nome o seu último nome, com os anteriores podendo ser registrados como outras formas do nome.
Títulos de Nobreza Hereditários
Em casos de títulos de nobreza hereditários, o título será o elemento inicial do ponto de acesso normalizado, seguido de vírgula e espaço e o seu tipo.
Exemplo:
Forma autorizada do nome: Veragua, duques de
Quando o título de nobreza for precedido de artigo, preposição ou partículas similares, separado ou não por hífen, que façam parte dele, esses se anteporão ao título.
Exemplos:
Forma autorizada do nome: La Casta, marqueses de
Forma autorizada do nome: La Bisbal, condes de
Forma autorizada do nome: Mac-Mahón, marqueses de
Forma autorizada do nome: T’Serclaes, duques de
Quando aparecerem os títulos de nobreza hereditários e não se saibam a qual família ou indivíduos eles pertençam, registrar-se-á o título, seguido do nome genérico do título, separando-os por vírgula e espaço. Incluem-se títulos como: “duques de”, “marqueses de”, “condes de”, “viscondes de”, “senhores de”, “barões de”.
Exemplos:
Alameda, marqueses de
Badenberg, margraves de
Gorchacoff, príncipes de
Outros componentes dos nomes de famílias
Qualificadores
Devem ser escritos em português, ainda que o nome da família esteja em outra língua. Serão colocados entre parênteses após a designação de tipo (“família”, “casa”, “dinastia” ou a nome genérico do título de nobreza), separado por espaço e de acordo com a seguinte ordem:
De Atividade:
Referem-se às ocupações ou atividades realizadas pela família. Será redigido em minúsculo e no plural e serão usados apenas para se desfazer homonímias.
Exemplos:
Forma autorizada do nome:
Mora, família (arquitetos)
De data:
Usa-se para registrar as datas de existência ou atividade de uma família, registrando-se apenas os anos e/ou séculos. As datas-limite de existência de uma família irão separadas por hífen, e sem espaços. Só em caso de desconhecimento das datas da existência da família se poderá registrar um qualificador de data, ou datas, de atividade, que se indicarão precedidas da abreviação “fl.” (floruit) sem espaços.
Exemplos:
Forma autorizada do nome:
Artieta, família (comerciantes, s. XV)
Jin, dinastia (s. XII-s. XIII)
De lugar:
Permite diferenciar famílias com o mesmo nome que tenham exercido suas atividades em locais distintos. Usa-se apenas em homonímias.
Exemplos:
Trastámara, dinastia (Castilla)
Trastámara, dinastia (Aragão)
De Título de nobreza:
Um título de nobreza está formado pelo nome genérico do título (duques, marqueses, condes, viscondes, barões etc.) e o nome específico do título.
Sempre que uma família tenha um título de nobreza ele será registrado como qualificador. Será escrito de forma direta.
Exemplo:
Forma autorizada do nome:
Cárdenas, família (condes de Gómara)
Cárdenas, família (duques de Maqueda)
Quando uma família possuir mais de um título, apor-se-á na forma autorizada do nome o título de maior grau. Se houverem dois de mesmo grau, optar-se-á pelo mais antigo, exceto quando a família seja mais conhecida por outros títulos. Os demais serão mencionados em outras formas do nome.
Exemplo:
Forma autorizada do nome:
Téllez-Girón, família (duques de Osuna)
Outra forma do nome:
Téllez-Girón, família (duques de Arcos)
Téllez-Girón, família (conde-duques de Benavente)
Língua e escrita
Nomes árabes, latinos, hebreus, etc. usa-se o nome consolidado em português, fazendo-se as referências aos originais em outras formas do nome.
Nomes em sistemas de escrita não latinos serão transliterados seguindo a ISO 37.
Pontos de acesso normalizados de famílias se redigirão sempre na grafia atual, sendo atualizados caso estejam redigidos em grafias antigas, exceto quando se saiba que tal forma realmente persista na atualidade. Se for necessário fazer referência à grafia original, se poderá registrar estas em outras formas do nome.
Partículas e sinais diacríticos formam parte do nome e sempre serão conservados, ainda que sejam o resultado de uma transliteração.
As abreviações serão desenvolvidas sempre que, consultadas as fontes, saibam-se com segurança a quais nomes se refiram.
Usa-se a maiusculização de acordo com as regras ortográficas convencionais da língua em que estiver as formas do nome.
Fontes de Informação
Consulta-se os próprios documentos que estão sendo descritos, assim como fontes oficiais (registros civis, paroquiais, censos, documentos da administração pública) e obras de referência (monografias, registros de autoridade, etc.), sendo seu uso e priorização fatores de responsabilidade do agente descritor.
4.2 Pontos de Acesso de Locais
O ponto de acesso de lugar é um nome simples ou expressão composta que designam lugares e entidades geográficas, atuais ou antigas. Podem ser definidos por nomes comuns ou próprios, o primeiro designando a natureza geral do lugar, enquanto o segundo designa um lugar específico.
Ex:
Ponta do Seixas
Aqueduto dos Milagres
Cada entidade geográfica terá apenas um termo preferido. Outras formas do nome deverão ser considerados “Termos não-preferidos” ou “Termos preferidos equivalentes em outras línguas”.
Não se criarão pontos de acesso caso não se possa identificar com exatidão o local mencionado no documento descrito.
Composição do termo
Nome do lugar
Qualificadores (se forem pertinentes)
Formatação
Os nomes dos lugares serão escritos da maneira como constam em suas fontes;
Terão suas primeiras letras maiusculizadas, independentemente de serem nomes comuns ou próprios;
Artigo ao início: Caso o nome se inicie com um artigo, ele não será jogado ao final do nome, permanecerá no início;
Siglas e abreviações: serão evitadas, usando os seus nomes desenvolvidos em vez de suas formas abreviadas;
Trocas oficiais: Caso o local mude de nome com o tempo, o nome mais recente será o termo preferido, com os antigos constando como termos não-preferidos.
Fontes de informação
Para se determinar quais os nomes oficiais dos pontos de acesso de locais, deve-se consultar o documento que está sendo descrito, leis, documentos oficiais, obras acadêmicas e tesauros geográficos.
4.3.1 Entidades Geográficas
Contemplam-se os seguintes tipos de entidades geográficas:
Entidades geográficas sob as normas de alguma autoridade e que tenham povoação
São aquelas circunscrições de instituições que exercem poderes públicos, religiosos, senhoriais, ainda que tenham desaparecido com o tempo. São as paróquias, distritos, aldeias, municípios, bairros e cidades, ainda que não tenham jurisdição própria.
Entidades geográficas artificiais
Lugares construídos ou muito modificados pelo ser humano, como sítios arqueológicos, praças, avenidas, rotas de comércio, etc. Desde que não sejam obras de arquitetura, pois se enquadram em outra classe.
Entidades geográficas naturais
Lugares que tenham sofrido pouca ou nenhuma alteração do homem, como rios, montanhas, enseadas, baias, etc.
Países
Usa-se o nome do país e o qualificador (país). Casos de países insulares, em que o nome de seu governo se confunde com o nome da entidade geográfica natural onde se localiza, pode-se usar o nome da entidade geográfica natural como termo não preferido. Países que compõe outros deverão ter o nome do país ao qual compõe também como ponto de acesso.
Exemplo 1:
Brasil (país)
Portugal (país)
Exemplo 2:
Inglaterra (país, Reino Unido)
País de Gales (país, Reino Unido)
Exemplos 3:
Forma autorizada do nome:
Singapura (país)
Termo não preferido:
Singapura (ilha)
Exemplo 4:
Forma autorizada do nome:
Hong Kong (país)
Termo não preferido:
Ilha de Hong Kong
Municípios, comunas e cidades
Usa-se seu nome, junto a qualificadores que se referem ao seu tipo (usualmente o qualificador “cidade”), ao seu estado ou província em sigla, e em seguida, o nome do país de origem. Caso o País não seja o Brasil, usa-se a sigla de estado ou província apenas como forma de desambiguação. Caso não haja sigla para o estado ou província, usa-se seu nome por extenso. Caso um município ou entidade não seja homônima à cidade, registra-se ela com o qualificador de tipo “município”, “comuna” ou quaisquer outros tipos de entidades.
Exemplos:
São Paulo (cidade, SP, Brasil)
Osasco (cidade, SP, Brasil)
Samambaia (cidade-satélite, DF, Brasil)
Cápri (comuna, Itália)
Municípios contidos em arquipélagos ou ilhas, convém colocar como ponto de acesso, antecedendo o estado e o país, o nome da ilha ou arquipélago. Mas caso o nome da ilha ou da província sejam homônimos ao nome do município, omite-se este ou estes como qualificadores.
Exemplos:
Las Palmas (município, Ilhas Canárias, Espanha)
Cápri (comuna, Itália)
Entidades geográficas inferiores a municípios
Aplicar-se-ão as regras de município, considerando que o município entrará no rol dos qualificadores desta dada entidade. Adicionalmente, será colocado o nome comum do tipo de subdivisão do município antecedendo-o.
Exemplo:
Mitte (distrito, Berlim, Alemanha)
Asa Norte (bairro, Brasília, Brasil)
Se for o caso de ser uma divisão de município de país não reconhecido, dever-se-á atribuir como qualificador apenas o nome do país.
Exemplo:
Stepanakert (Nagorno-Karabakh)
Entidades geográficas superiores a município
Apõe-se o nome da entidade geográfica seguida do qualificador de tipo da entidade geográfica mais o qualificador do país ao qual ela se inclui.
Exemplo:
Minas Gerais (estado, Brasil)
São Paulo (estado, Brasil)
Alt Empordà (comarca, Espanha)
Entidades geográficas de caráter judicial, militar, eclesiástico, etc.
Será normalizado com um qualificador que indicará o tipo de entidade, que é seguido do nome do país.
Entidades geográficas históricas
São aquelas entidades geográficas que desapareceram ao longo da história. O nome será definido de acordo com os documentos descritos e com as fontes que existiam da época.
Os qualificadores serão: primeiramente, o nome comum do tipo de entidade geográfica, em minúscula e no singular e em seguida, as entidades atuais que integram o ponto de acesso. Caso o local tenha desaparecido, apõe-se o qualificador “entidade antiga”.
Exemplo:
Iugoslávia (país, entidade antiga)
Sete Quedas do Guaíra (cachoeira, Brasil, entidade antiga)
Pompeia (cidade histórica, Itália)
Entidades geográficas artificiais
Será composto de nome do lugar e qualificadores. O nome será uma composição do nome comum e o nome próprio. Serão inseparáveis e serão escritos diretamente. Em seguida, separados por um espaço, constarão os qualificadores, entre parenteses, que serão as entidades superiores a que pertencem, em ordem crescente, separadas por uma vírgula e um espaço. Serão qualificadores, o nome do município, estado e país.
Ex:
Praça dos Três Poderes (Brasília, DF, Brasil)
Avenida dos Campos Elísios (París, Ville de Paris, França)
Se o nome da entidade conter o nome da entidade maior, ela será omitida nos qualificadores.
Ex:
Rodoviária Interestadual de Brasília (DF, Brasil)
Se a entidade geográfica artificial estiver contida em duas entidades autônomas diferentes, elas serão colocadas nos qualificadores em ordem alfabética, separadas pela conjunção “e”. Se estiver contida em mais de duas, elas serão omitidas entre os qualificadores. O mesmo ocorrerá caso a entidade geográfica artificial se encontre entre países.
Ex:
Ponte da Amizade (Brasil e Paraguai)
Entidades Geográficas Naturais
O nome é composto de um nome comum do tipo de entidade geográfica e o nome próprio. Estes serão inseparáveis e serão escritos em ordem direta. Os qualificadores que serão registrados, quando pertinentes, são: município ou similar, estado ou similar e o país.
Ex:
Chapada Diamantina (BA, Brasil)
Países insulares terão sua entidade geográfica natural correspondente ao nome do seu país, sendo que o termo que referencia a entidade geográfica natural será incluída como termo não preferido.
Assim como entidades geográficas artificiais, as entidades geográficas naturais que estiverem contidas em dois países ou entidades geográficas jurisdicionais, deverão ter esses em seus qualificadores separados por “e”. Se forem mais de dois, eles deverão ser omitidos.
4.3 Pontos de acesso de Assunto
Serão os demais pontos de acesso que não se enquadram em nomes ou lugares. São classificados, usualmente, como abstrações, objetos ou eventos. Abstrações são ideias, noções abstratas ou coisas incorpóreas. Objetos são corpos materiais reais, tangíveis. Eventos são acontecimentos, eventualidades, fato imprevisto ou que pode acontecer, importante ou programado, de índole social, acadêmica, artística ou desportiva.
Seguem alguns exemplos de assuntos:
Abstrações ou noções abstratas: Arquivística; Liberdade de expressão;
Fenômenos naturais: Chuva; Clima;
Categorias de pessoas: Jovens, Aztecas, Pessoas com deficiência;
Categorias profissionais: Arquivistas, Advogados, Artesãos;
Grupos de pessoas de determinado povo, naturalidade ou país: Cubanos, Brasileiros, Franceses;
Movimentos, manifestações, tendências culturais, artísticas, científicas, sociopolíticas: Barroco, Modernismo;
Objetos animados ou inanimados: Flora, Fauna, Vegetais, Tigres, Trigo, Minerais;
Categorias ou tipos de instituições: Universidades, Arquivos, Bibliotecas;
Categorias ou tipos de normas e categorias de documentos de arquivo e tipos documentais: Tratados internacionais, Regulamentos, Processo criminal, Tratado de Tordesílhas, Lei Maria da Penha, Lei nº 8112/1990;
Tipos de jurisdições, unidades e federações, esferas legais e similares: Província, Estado, Município, Federação;
Deuses, anjos, demônios seres mitológicos e de crenças religiosas: Anjo Gabriel, Poseidon, Shiva;
Pessoas, instituições ou famílias fictícias, lendárias ou míticas: Aquiles, Don Quixote de la Mancha, Família Adams;
Locais individuais míticos, lendários ou fictícios: Atlântida, El Dorado, Camelot;
Lugares ou estados individuais das almas após a morte: Paraíso, Inferno, Purgatório, Nirvana;
Categorias de eventos e acontecimentos e seu significado geral: Conflitos armados, Rebeliões, Golpes de estado, Ditaduras, Jogos olímpicos, Sínodos;
Objetos fixos ou móveis, genéricos ou individuais, fruto da criação humana, incluindo categorias e tipos: Pontes, Muralhas, Astrolábios, Muro de Berlín (atentar-se para não os confundir com pontos de acesso normalizados de lugares);
Obras concretas de criação artística, cultural ou religiosa: Catedral de Burgos, Bíblia, A Ilíada;
Objetos individuais e materiais míticos, lendários ou de ficção: Pedra filosofal, Fonte da eterna juventude, Labirinto do minotauro;
Períodos cronológicos: Idade média, Renascimento, Paleolítico;
Acontecimentos históricos concretos e individuais, como guerras, conflitos, revoluções, acordos e tratados internacionais: Convenções de Genebra, 7 de Setembro, Ocupação Alemã da França, Batalha de Poitiers;
Fenômenos ou desastres naturais acontecidos em um determinado lugar: Terremoto de Lisboa, Furacão Katrina, Erupção do Étna; e
Eventos individuais míticos, lendários ou fictícios: Queda do Império Sith, Juízo Final, Titanomaquia.
4.3.1 Regra Geral
Cada assunto terá apenas um termo preferido, outras formas do nome serão “termos não-preferidos”.
Componentes: os termos preferidos serão compostos de:
O nome do assunto (simples ou composto)
Qualificadores
Fontes de informação
Para se estabelecer os termos preferidos pode-se usar: o documento descrito, leis e normas vigentes, obras de referência especializada e tesauros de assunto.
Maiusculização
A maiusculização deverá obedecer as regras gramaticais vigentes. Letra maiúscula na primeira letra, minúscula nas demais, com nomes próprios tendo as letras de seus elementos principais maiusculizadas. Conjunções, preposições, e demais partículas ou expressões conectoras serão escritas em minúscula.
Abreviações
Evita-se abreviações. Serão usadas apenas em casos de desconhecimento de suas formas desenvolvidas ou acompanhando as formas por extenso caso sejam popularmente consagradas.
Flexão de número
Objetos incontáveis (sujeitos à pergunta quanto é, em vez de quantos são) devem ser colocados no singular. Conceitos abstratos e aquilo que não pode ser quantificado usualmente se enquadram nessa categoria e são colocados na forma singular, exceto quando constituem uma classe de muitos elementos.
Ex:
Protestantismo
Água
Imigração
Flora
Fauna
El Niño
Carbono
Hércules
Usa-se o plural para entidades contáveis (documentos, partidos políticos, usinas, etc.), que são entidades cuja contagem pode ser expressa em correspondência com o conjunto dos números naturais, ainda que seus elementos sejam infinitos. Nestas, incluem-se partes do corpo múltiplas (mãos, pernas, olhos, etc.), classes de muitos membros, grupos de pessoas, grupos étnicos, espécies biológicas, aqueles que designam uma coletividade concreta de seres vivos, além de categorias e tipos de conceitos e objetos. Unidades de conceitos e objetos que não tenham forma no singular, e que não possam ser expressos no singular, são todos colocados no plural.
Ex:
Ciências Naturais
Direitos Políticos
Fenícios
Reservas biológicas
Palácios
Guerras
Categorias de normas, documentos ou tipos documentais serão escritos no plural. As unidades dessas categorias serão escritas no singular.
Ex:
Atos da Reitoria
Ato da Reitoria nº 0621/1988
Eventos e acontecimentos serão escritos com seus componentes escritos em ordem direta e no singular,
Ex:
Idade do Ferro
Belle Époque
Mas suas respectivas categorias serão escritas no plural
Ex:
Congressos
Descobrimentos geográficos
Festivais
Quando um termo, em sua flexão de número, obtiver significados diversos, suas formas flexionadas devem vir acompanhadas de qualificadores em parênteses. Em casos de termos com significados distintos em suas formas singulares e plurais, ambos deverão ser inseridos no vocabulário, serem vinculados como termos relacionados entre si, e deverão ter um qualificador especificando-os. Casos em que as grafias das formas singular e plural forem distintas, registra-se no tesauro as duas formas, escolhendo-se uma como a preferida.
Língua e escrita
Usa-se a ortografia mais amplamente aceita dos termos. Se houver mais de uma forma amplamente usada, e uma delas selecionada como termo favorito, com a outra se tornando um termo não-favorito, caso se faça um tesauro. A ortografia deve obedecer às formas vigentes de escrita, fazendo-se uso de dicionários ou glossários reconhecidos.
Palavras de outras línguas que são amplamente usadas devem ser incorporadas ao vocabulário, caso tenham formas traduzidas/aportuguesadas elas devem ser colocadas como termos não-preferidos.
Os termos preferidos escritos em português, podem ter possíveis referências de outras línguas.
Ex:
Termo preferido: Pinóquio (personagem fictício)
Termo não-preferido: Pinocchio (personagem fictício)
Termos que incorporem nomes geográficos serão escritos em sua forma oficial. Mas caso haja nomeação bilíngue, se preferirá o termo em português.
Casos de palavras antigas deverão ser atualizados para a escrita mais recente.
Sinais diacríticos (acentos, apóstrofos, etc) formam parte do termo e deverão ser conservados.
Transliterações ao alfabeto latino deverão obedecer a ISO 37.
Gírias e Jargões
Podem ser usados como termos preferidos quando não houver forma alternativa amplamente aceita. Caso haja forma amplamente aceita, a gíria/jargão deverá ser inserido como termo não-preferido. Usualmente isso ocorre em termos relacionados a novidades tecnológicas ou na linguagem de culturas menos conhecidas.
Termos que tenham nomes oficiais, que também possuam gírias populares deverão ser preferidos em detrimento de suas gírias, com essas sendo selecionadas como termo não-preferido caso seja muito conhecida.
Abreviações e Abreviaturas
Abreviaturas e abreviações devem ser evitadas. Muitas delas são homógrafas e podem gerar confusão. Entretanto, podem ser usadas quando são consensualmente reconhecidas e seus nomes estendidos são ignorados ou desconhecidos. Nessas situações, deve-se fazer as referências cruzadas da forma abreviada e a forma completa.
Homógrafos/polissemias
Palavras com a mesma grafia, mas com significados diferentes deverão ser acompanhadas de qualificadores entre parênteses.
Seleção do termo preferido
O termo preferido será, preferencialmente, um substantivo, termo substantivado ou expressão/frase substantivada. Esta última entra na categoria de termo composto e pode se subdividir em dois tipos:
Frase adjetiva:
Ex: Hospital Infantil
Frases preposicionadas:
Ex: Hospital para Crianças
Nesses casos o substantivo que derivou o adjetivo que modifica essas frases será um candidato a ser um termo independente, podendo fazer o “termo original” ser fatorado, dividido em dois ou mais.
4.3.2 Termo composto
É o que é formado por componentes que podem ser divididos morfologicamente, criando dois ou mais novos termos. Em sua maioria dividem-se entre um foco (ou cabeça, núcleo) e um modificador (ou diferença). O primeiro identifica a classe geral à qual pertence o termo, enquanto que o segundo o especifica, delimitando o subconjunto da classe geral do qual faz parte.
Ex:
Hospital Infantil = Hospital + Infantil.
Hospital Infantil é um subtipo da classe “Hospital” (sua cabeça) e seu subtipo é o “Infantil” (seu modificador).
O modificador as vezes pode se manifestar como uma combinação de preposição + substantivo: “Hospital para Crianças”. Cabeça e modificador também podem aparecer concatenados: “Aguardente”.
Ordem das Palavras
Todo termo composto na forma de frases substantivas adjetivadas ou preposicionadas deverão, preferencialmente serem inseridas de acordo com a ordem na linguagem natural, sem inversões.
No caso de frases adjetivas em línguas onde substantivos geralmente seguem os adjetivos, os seus próprios substantivos focais devem ser inseridos no tesauro, funcionando como termos superordenados em hierarquias. A forma invertida de uma frase preposicionada deve entrar como um termo não-preferido e deve ser feita uma referência ao termo preferido na ordem de sua linguagem natural.
Observações sobre classes de palavras
Substantivos e frases substantivadas
Como mencionado antes, um termo de indexação deve consistir, preferivelmente, em um substantivo ou frase substantiva. As frases substantivas são termos compostos, e aparecem como frases adjetivas ou frases preposicionadas.
Frases adjetivas incluem termos compostos que podem ser fatorados morfologicamente entre substantivos e modificadores com função adjetiva. Frases preposicionadas constituem-se de termos compostos formados por substantivo e locução adjetiva. Ambas devem ser consideradas como fontes potenciais da inserção de novos termos em um tesauro por meio da fatoração.
Quando o modificador for um adjetivo, o substantivo do qual ele foi derivado deverá ser considerado como um candidato a termo extra. Caso aceito, esses termos deverão estar relacionados, o termo extra e o seu termo completo (não fatorado).
Adjetivos
Adjetivos isolados (ex: amarelo, grande, vasto) devem ser evitados como candidatos a termos, exceto em casos específicos, como na língua inglesa onde um adjetivo pode abrir uma árvore de outros termos associados.
Advérbios
Advérbios e frases começadas por advérbios devem ser evitados na maior parte das vezes, exceto quando constituem jargões consolidados.
Verbos
Verbos não devem ser selecionados como termos se estiverem no infinitivo e no particípio, devem ser selecionados em suas formas substantivadas. Caso sua forma substantivada cause ambiguidades com outros termos, deve-se aplicar um qualificador.
Qualificadores
Estarão entre parênteses, escritos conforme as regras do português e estarão separados entre si por vírgula e espaço.
Ex:
Serras (cadeias de montanhas)
Serras (ferramentas)
Qualificadores podem ser de atividade, função, natureza, lugar, data, gênero artístico/literário etc. E podem ser empregados em termos demasiadamente confusos ou técnicos
Ex:
Tizona (espada)
Bucéfalo (cavalo)
Jumbo (avião)
Qualificadores de lugar:
Serão escritos com a primeira letra em maiúscula se forem nomes próprios.
Ex:
Palácio da Alvorada (Brasília)
Qualificadores de data:
Situa um assunto no tempo, podendo ser uma data ou um intervalo. Datas limites deverão ser separadas por hífen. Em datas dúbias, insere-se o advérbio “circa” abreviado: ca.
Ex:
Constituição Federal (1988)
Guerra do Paraguai (1864-1870)
Discóbulo de Míron (escultura, ca. 455 a.C)
Caso seja necessário mais de um qualificador, serão ordenados por atividade, função ou natureza, data e lugar.
4.3.3 Casos específicos
Nomes Comuns e Comerciais
Nomes de marcas famosas devem ser registradas como “registros de autoridade” se fizerem referência a entidades coletivas. Caso façam referência a produtos serviços ou elementos que não sejam entidades coletivas, serão registradas como com o qualificador “marca”. Caso se deseje fazer referência a um modelo específico de produto, apor-se-á o qualificador “produto”.
Exemplo:
Pentium (marca)
Inkjet (marca)
HP Deskjet 2600 (modelo)
Nomes Populares e Científicos
Costuma-se usar o termo que vai ser mais amplamente aceito pela comunidade, atribuindo-se o outro como não-preferido. Caso o Tesauro seja mais utilizado por um usuário comum, evita-se nomes científicos. Caso seja mais utilizado por profissionais cientistas e afins, prefere-se o termo científico. Sugere-se, para o caso particular da UnB, usar o nome popular de animais e plantas, com remissivas aos nomes científicos desses como termos não-preferidos.
Obras de arte e arqueológicas
Obras de arte e arqueológicas deverão ter seus termos escritos de acordo com seus nomes oficiais no português, ou pelos nomes os quais são mais conhecidas. O gênero da obra deverá ser incluído como qualificador, entre parenteses e em minúsculo, no singular.
Para evitar homonímias, usa-se os qualificadores na seguinte ordem: técnica, data ou o lugar onde se encontra.
Ex:
Venus de Willendorf (escultura)
Discóbulo de Míron (escultura, ca. 450 a. C.)
Don Quixote de La Mancha (literatura)
As Meninas (pintura, 1656)
As Meninas (pintura, 1957)
Obras de arquitetura
Serão escritos com seus nomes oficiais em português ou na forma com que são mais conhecidos. O lugar onde as obras estão serão colocados como qualificadores caso já não estejam no nome. Só em obras homônimas que serão incluídos os países como qualificadores.
Ex:
Catedral de Brasília
Palácio do Planalto (Brasília)
Pessoas, famílias e instituições da ficção
Serão escritos como são nomeados nas obras e será colocado o qualificador “ficção”.
Ex:
Rodion Romanovich Raskolnikov (ficção)
Sith (ficção)
Malebranche (ficção)
Acontecimentos históricos
Acontecimentos históricos, sociais ou culturais individuais ou concretos será escolhodo pelo nome próprio do acontecimento, escrito em sua forma mais comum, em português. Terá o qualificador obrigatório de sua data/intervalo de datas. Será inserido o nome do seu lugar de acontecimento à lista/tesauro de locais caso integre a sua forma conhecida de nome.
Ex:
Lista de termos:
Guerra do Paraguai (1864-1870)
Lista de locais:
Paraguai (país)
Fenômenos naturais, passados ou presentes
Será escrito em sua forma mais conhecida, colocando-se como qualificador obrigatoriamente a data, ou datas, do evento, e, também o seu local de ocorrência, se for pertinente e já não compor o nome.
Ex:
Tsunâmi no Brasil (1755)
Furacão Katrina (2005, Estados Unidos)
4.3.4 Fatoração de termos
A fatoração de termos é a divisão de termos compostos em termos com menos palavras, dividindo-o em dois ou mais termos distintos. Não há regras consensuais. Como regra geral, afirma-se que os termos deverão ser fatorados em elementos simples, exceto quando isso prejudicar a compreensão do usuário. Nessas condições, assuntos complexos seriam representados por combinações de termos isolados, que, em um sistema pós-coordenado, seriam representados por chaves de buscas independentes. Num sistema pré-coordenado, se constituiriam de componentes de entrada.
A fatoração de termos de um dado sistema de indexação não é assunto encerrado em termos de método, mas existem diretrizes propostas para se tentar garantir algum nível de consistência nesta tarefa. A fatoração de termos se dá por basicamente duas técnicas: a fatoração semântica e a sintática.
Fatoração semântica
Aplica-se em termos simples e compostos, dividindo seus conceitos em elementos que podem ser combinados para remeterem a diversos conceitos diferentes. Exemplo:
TERMÔMETRO: TEMPERATURA + MEDIDA + INSTRUMENTO
Cada um dos seus elementos pode ser combinado com uma diversidade de outros para comporem termos e assuntos diversos.
Não é recomendada pois há restrições de seu uso a sistemas de indexação pós-coordenada e é conhecido que esta técnica resulta em perda de precisão, sendo usada em situações onde é necessária a limitação do tamanho de um vocabulário.
Fatoração sintática
Aplica-se apenas a termos compostos, que quando submetidos a análise morfológica constituem elementos separados que podem ser elementos independentes do vocabulário. Exemplo:
CONSTRUÇÃO DE EDIFÍCIOS: EDIFÍCIOS + CONSTRUÇÃO
Se essa fatoração desfigurar um termo composto de uso comum pelo usuário ele deverá ser registrado como termo não-preferido e vinculado aos termos preferidos fatorados.
Decidir se um termo composto deverá ser fatorado ou mantido em sua forma pré-coordenada implica em analisar as suas partes, fazendo referência aos seus papéis e inter-relações. A maioria dos termos compostos, sejam frases adjetivas ou preposicionadas, pode ser analisada nos seguintes elementos:
Foco: Componente substantivo que identifica a classe genérica de coisas que o termo como um todo se refere. Análogo ao “Núcleo” de um nome composto.
Diferença (ou modificador): são os elementos que atribuem uma característica ou uma diferença lógica ao foco, restringindo seu significado.
Há, entretanto, uma categoria de termos que não são passíveis dessa análise, que são aqueles que apresentam as diferenças sincategoremáticas. As Diferenças Sincategoremáticas são “diferenças” que não especificam o significado do “foco”, e sim o alteram. Nesses casos o termo deverá ser preservado em sua forma pré-coordenada. Exemplo:
Ovos de chocolate: não é subtipo de "Ovo". Logo, deverá ser mantido.
Termos mantidos em forma composta
Os termos devem ser mantidos em suas formas pré-coordenadas nas seguintes condições:
Se a forma composta for muito conhecida, interferindo na compreensão dos termos quando fatorados (Processamento de Dados);
Se, quando fatorados, perdem significado ou geram ambiguidades (Plantas + Alimentos = Alimento para Plantas ou Plantas como Alimento?);
Nomes próprios e termos que incorporam nomes próprios (Álgebra Booleana);
Termos em que um dos componentes perdeu seu significado original (Esfera Celeste);
Termos que contêm diferenciadores que sugerem uma semelhança com um objeto ou evento não relacionado (Estrutura em Árvore; Configuração Estrela);
Termos que não podem ser expressos sem o uso de substantivo extra (Saídas de Incêndio = SAÍDA para que PESSOAS escapem do FOGO);
Termos com diferenças sincategoremáticas (Membros Artificiais; Peixes Fósseis).
Termos fatorados sinteticamente
Os critérios para a fatoração dos termos são considerados complexos e não são propostos como obrigações e sim como critérios gerais. Recomenda-se considerar os seguintes aspectos:
Indexação em campos específicos, que pode demandar tratamento especial de termos familiares a usuários;
Em um sistema pós-coordenado, o controle do tamanho do vocabulário e da quantidade de termos associados aos documentos. Pois um vocabulário menos extenso, com bastante fatoração de termos, resulta em vocabulários menores, mas também num maior número de termos associados aos documentos. Fatorar menos os termos usualmente resulta em menos termos associados aos documentos, entretanto, torna o vocabulário mais extenso.
Recomendações
As recomendações seguintes são propostas para casos semelhantes evidenciados, e também são demonstradas situações inversas, que exibem termos que usualmente não podem ser fatorados sem causar ambiguidade.
Um termo composto deverá ser fatorado se o foco se referir a uma propriedade/parte e a diferença representar o todo.
Ex:
Motores de Avião = Motores + Avião
Pessoal de Hospital = Hospitais + Pessoal
Acidez do Solo = Acidez + Solo
Inversamente, o nome do todo pode ser modificado pelo nome de sua parte ou propriedade:
Solo ácido
Pontes de concreto
Pessoal capacitado
O nome de uma ação transitiva não deve ser modificado pelo nome do sujeito passivo sobre o qual a ação foi exercida. Logo os termos deverão ser fatorados.
Ex:
Fundição de Aço = Aço + Fundição
Estampagem de Tecido = Tecido + Estampagem
Inversamente, o nome da coisa ou material pode ser modificado pelo nome da ação exercida sobre ele:
Aço fundido;
Plásticos prensados;
Tecidos estampados;
O nome da ação intransitiva não deve ser modificado pelo nome daquele que executa a ação.
Ex:
Migração de pássaros = Migração + Pássaros
Crescimento de plantas = Plantas + Crescimento
Deterioração de metais = Metais + Deterioração
Inversamente, o nome de um objeto pode ser modificado pelo nome da ação intransitiva na qual ele está ou estava ligado.
Plásticos degradados;
Pássaros migratórios;
Esteiras rolantes.
Tais recomendações servem para:
Evitar complexidade excessiva dos termos de indexação;
Obter tesauros estruturados baseados em princípios que possam ser objeto de uma explicação lógica e utilizado para ensino.
CONSTRUÇÃO DE TESAUROS
Com base nas “Diretrizes para o estabelecimento de Tesauros” do CNPq (1984), pode-se traçar algumas bases metodológicas para que se determine como os termos deverão ser organizados hierarquicamente e quais deverão ser alguns de seus metadados caso sejam apostos num tesauro.
Tesauros, usualmente, são linguagens documentárias típicas de “assuntos”, podendo incluir pontos de acesso de lugares e nomes, embora não sejam seu foco. Entretanto, como a teoria de elaboração de tesauros é muito relevante para a categorização hierárquica dos termos, é válido trazer suas definições inclusive para a aplicação em outras linguagens documentárias, tornando um índice de descritores, por exemplo, num índice estruturado ou sistematizado.
Uma linguagem documentária não necessariamente é um tesauro, podendo apresentar uma estrutura mais simples, como a lista de descritores e o índice onomástico que pretende-se construir para o ACE neste primeiro momento. Entretanto, faz-se necessário explanar a teoria da construção de um tesauro para que a lista de descritores possa vir a se tornar um, caso esse seja o curso de ação a ser adotado pelo Arquivo Central. Não somente isso, ao elaborar os termos com algumas das observações do Tesauro, seus respectivos vocabulários se aproveitarão de alguns dos benefícios dessa forma de linguagem documentária.
5.1 Hierarquia dos termos
Um termo oficial, num tesauro, terá os seguintes metadados, com praticamente todos eles indicando relações com outros termos (salvo a nota explicativa):
Termo Genérico (TG): Termo generalista, que possui vários outros termos específicos em seu escopo;
Termo Específico (TE): Termo menos geral, que está incluso em conjuntos maiores, denotados por termos genéricos;
Termo Relacionado (TR): Termo não relacionado hierarquicamente a outro, mas que possui associação horizontal com outro termo, sem serem sinônimos;
Termo Genérico Maior (TGM): Termo raiz, que denota a maior classe possível de uma dada ramificação de termos;
Usado para (UP): Indica relação entre termos oficiais e não-oficiais, onde o termo “Usado para” deverá ser preferido ao invés do outro indicado, usualmente são termos sinônimos da linguagem natural;
Use (USE): Indica relação entre termos oficiais e não-oficiais, onde o termo é preterido em detrimento do seguinte, mais indicado para fins da linguagem controlada.
Nota Explicativa (NE): usada para delimitar o conceito ao qual o termo se refere, caso seja necessário. Usualmente o intuito é que o termo seja autoexplicativo.
Rótulo nodal
Há também a figura do “Rótulo Nodal” (ou indicador de faceta), um termo falso, inserido na seção sistemática de alguns tesauros para indicar a base lógica sobre a qual se tenha dividido uma categoria.
Ex:
Avião
Por carga comercial (Rótulo Nodal)
Avião de Carga
Avião de Passageiro
Por usuário (Rótulo Nodal)
Avião Civil
Avião Militar
5.2 Apresentação dos termos e suas relações
São 3 métodos de uso comum que são utilizados por tesauros, de forma isolada ou combinada:
Apresentação alfabética, com notas explicativas e relações entre os termos indicadas em cada um deles;
Apresentação sistemática, auxiliada por um índice alfabético;
Apresentação gráfica, com uma seção alfabética.
Os tesauros de apresentação alfabética disponibilizarão todos os termos, preferidos ou não, de forma alfabética, fazendo uso de referências aos termos que se relacionam com ele e apondo em cada um deles a abreviação da relação.
Tesauros organizados sistematicamente terá duas partes: categorias ou hierarquias de termos ordenados de acordo com seus significados e inter-relações lógicas e um índice alfabético que direciona os usuários às partes apropriadas da seção sistemática. No índice haverá um código de endereçamento ao termo preferido na seção sistemática, servindo como referência. O código poderá ser numérico, alfanumérico, ou uma notação hierarquicamente expressa. Usualmente, nessas situações, o índice é considerado a parte complementar do tesauro.
Na apresentação gráfica os termos e suas inter-relações são apresentadas em uma figura bidimensional. Manifestam-se usualmente em estrutura de árvore ou na forma de gráficos flechados. Compõe-se de duas partes: a apresentação gráfica, usualmente limitada aos termos preferidos, e o índice alfabético, que contempla os termos preferidos e não preferidos junto às suas referências e notas explicativas. Neste caso, o índice alfabético é a parte principal do tesauro, muitas vezes sendo tão completo quanto um tesauro alfabético.
5.3 Relações básicas em um tesauro
São duas as relações de termos num tesauro:
Relações entre termos, onde se estabelece as relações hierárquicas entre os termos.
Relações entre categorias e subcategorias, em tesauros com apresentações sistêmicas
As relações entre termos se apresentam de 3 formas:
Equivalência;
Hierárquica;
Associativa.
Essas relações são recíprocas e devem ser representadas com abreviaturas ou outros símbolos.
Relação de equivalência
É a relação entre termo preferido e não-preferido, onde dois ou mais termos fazem referência ao mesmo conceito. As abreviações USE e UP (Use para) são usadas para se destacar qual dos termos deve ser preferido em detrimento do outro.
Exemplo:
Pássaros: USE Aves
Aves UP Pássaros
Tal relação costuma se aplicar a termos que são sinônimos ou quase-sinônimos (termos de significados diferentes, mas que, para fins de indexação, tem significados semelhantes. Exemplo: Umidade e Secura), e o termo preferido deverá ser escolhido de acordo com as necessidades do público-alvo baseando-se em algum critério (nome científico de animais em vez de nomes populares, por exemplo). Tais critérios, quando adotados, deverão ser persistentemente adotados ao longo de todo o tesauro para manter a consistência metodológica dele, abrindo-se mão desses critérios apenas nos casos em que se prejudique a indexação (caso não haja nome científico para o animal, por exemplo).
Envio do termo genérico
Nessa técnica, atribui-se equivalência entre um termo referente a uma classe geral e seus membros. Exemplo:
Rochas - UP:
Basalto
Granito
Ardósia
Isso reduz a quantidade de termos em um tesauro, mas seu uso deve ser evitado, aplicado apenas a termos da área periférica do campo temático do tesauro.
Relações hierárquicas
Define um tesauro estruturado em relação a uma lista de termos não estruturada. São usadas as abreviações TG (Termo Genérico) e TE (Termo específico) para designa tal relação.
Exemplo:
Linhas Aéreas TG: Serviços de transporte
Serviços de transporte TE: Linhas aéreas
Essas relações designam três situações lógicas diferentes, que são:
Relação genérica;
Relação hierárquica todo-parte;
Relação de exemplo.
Se defende usualmente que a relação hierárquica entre termos deverá se estabelecer em situações em que os dois termos a serem relacionados façam referência a um mesmo “tipo de termo”. METAIS (material) e FUNDIÇÃO (ação) não são do mesmo tipo, enquanto que METAIS e METAIS NÃO-FERROSOS são do mesmo tipo (referentes a materiais). Os casos que não possuem relação poderão ser associados ao termo na forma de elementos de um rótulo nodal.
Exemplo:
METAIS
Operações (rótulo nodal)
Fundição
Tempera
Relação Genérica
Relação estabelecida entre classe e elementos. Suscetível ao teste “Todos x alguns”.
Exemplo:
PÁSSAROS TE: PAPAGAIOS (alguns pássaros são papagaios, logo este é termo específico daquele)
PAPAGAIOS TG: PÁSSAROS (todos os papagaios são pássaros, logo este é termo geral daquele)
O teste “todos x alguns” auxilia em certas análises. Por exemplo, os termos PAPAGAIOS e ANIMAIS DE ESTIMAÇÃO não se estabelecem com esse tipo de relação, pois alguns papagaios são animais de estimação e alguns animais de estimação são papagaios, isso indica que não há relação hierárquica entre os termos e que ambos deveriam ser elencados simultaneamente para indexar um documento.
Usam-se abreviações adicionais caso se queira enfatizar relações genéricas:
TGG = Termo genérico (relação genérica)
TEG = Termo específico (relação genérica)
Relação Todo-parte
Relação onde, em qualquer contexto, o nome de uma parte implica o nome de seu possuidor. Diferencia-se da relação genérica pois se refere à própria constituição do objeto de análise. Cobre um número limitado de situações:
Exemplos:
Ciências
Biologia
Botânica
Zoologia
Abreviações próprias:
TGP = Termo genérico (relação hierárquica partiva)
TEP = Termo Específico (relação hierárquica partiva)
Relações Poli hierárquicas
Alguns termos podem se referir, em bases lógicas, a mais de uma classe hierárquica, em mais de um, ou não, tipo de relação hierárquica.
Exemplo:
Ossos
Crânio
Cabeça
Crânio
No exemplo o termo CRÂNIO tem relação genérica com o termo OSSOS e todo-parte com o termo CABEÇA.
Relações de exemplo
São relações de termos referentes a categorias e exemplos individuais dessa categoria.
Exemplo:
REGIÕES MONTANHOSAS
ALPES
HIMALAIA
Relações Associativas
É um tipo de relação difícil de se definir, pois não designa membros de um conjunto, tão pouco relação hierárquica, contudo indicam uma ligação mental que se faz entre os termos e que indicam outras formas de se realizar buscas. Devem estar explicitadas num tesauro. Essa relação é recíproca e é indicada pela abreviatura TR (Termo Relacionado).
Deve-se evitar julgamentos subjetivos para a associação dos termos. A análise para essa associação busca avaliar a relevância de um termo para o outro. Exemplo: o termo PÁSSAROS passa necessariamente pela explicação do conceito de ORNITOLOGIA.
A relação associativa pode ocorrer entre termos pertencentes à mesma categoria ou a categorias distintas. Quando aplicados a termos de mesma categoria, os termos usualmente são termos irmãos com significados sobrepostos. Tal relação não precisa ser representada em tesauros sistemáticos de hierarquia organizada, pois eles demonstrarão essa relação associativa, mas ela deverá ser evidenciada em tesauros alfabéticos. Já os termos de categorias (tipos conceituais) diferentes, onde um termo se infere facilmente a partir do outro, não necessitam ser associados, como, por exemplo: entre um campo de estudo e um objeto de estudo (Silvicultura e Bosque), Uma operação ou processo e seu agente ou instrumento (Controle de Temperatura e Termostatos), uma ação e seu resultado (Tecelagem e Tecido), uma ação e seu sujeito passivo (Colheita e Produtos agrícolas), conceitos e suas propriedades (Venenos e Toxicidade), conceitos relacionados às suas origens (Alemão e Alemanha), conceitos com dependência causal (Duelo e Morte), lago e seu contra-agente (Planta e Herbicidas), frases sincategoremáticas e os seus substantivos incluídos (Barcos para Armar e Barcos).
Relações entre as categorias
Quando os termos estão organizados sistematicamente em categorias, cabe considerar o relacionamento dessas categorias entre si, constituindo um tesauro sistemático com estruturação global. São usados dois métodos para se atingir esse objetivo, cada um com seu conjunto de vantagens:
Organização primária em campos ou disciplinas;
Organização primária por facetas;
A organização em campos é comum a tesauros que tratem de diversos temas que possam ser reunidos sob uma única área, como “Arte”, “Economia” e afins. Usualmente adapta o tesauro à forma de pensar do usuário, mas pode prejudicar o intercâmbio de informações de tesauros uma vez que este tipo de agrupamento pode ocorrer de maneira muito subjetiva.
A organização por facetas exige maior disciplina mental. Nela os termos são reunidos segundo os tipos básicos de conceitos que apresentam, sem considerar os campos aos quais pertencem. Para isso os conceitos deverão ser melhor distinguidos nas classes gerais. Suas vantagens são a menor necessidade de revisão quando um termo muda de campo e um maior nível de concordância em possíveis intercâmbios. Suas desvantagens são a usual dispensa de conceitos frequentemente associados a uma disciplina e uma menor evidência da base de organização do tesauro, tanto para indexadores como para usuários.
5.4 Aspectos gerenciais da elaboração de um tesauros
Métodos de compilação
A forma do tesauro (apresentação) deve ser decidida antes de se reunirem os termos. Dois métodos podem ser aplicados na elaboração do tesauro:
a) Método dedutivo: os termos são extraídos de documentos durante uma etapa preliminar de indexação. Nenhum controle é feito no vocabulário até se coletar um número suficiente de termos. Eles serão então revistos por especialistas. Primeiramente identifica-se termos que representam categorias genéricas e os termos restantes deverão ser relacionados nestas categorias conforme as suas relações lógicas. O controle de vocábulos é feito no momento em que se estabelecem as categorias.
b) Método indutivo: Os termos são admitidos no tesauro assim que aparecem nos documentos e o controle é realizado a cada termo à medida que são admitidos, sendo designados como membro de um ou mais categorias genéricas. O tesauro é organizado sobre uma base de termo específico a genérico, numa operação contínua.
A prática é bastante empírica e requer constante revisão e redirecionamento para se adaptar a melhor situação possível para o tesauro. A fatoração dos termos, os critérios de seleção, a criação de relações e outros elementos usualmente amadurece à medida que é feito o tesauro.
REFERÊNCIAS
ALVARES, Lillian. Linguagens Documentárias. 52 slides. Disponível em: <http://lillianalvares.fci.unb.br/phocadownload/Analise/Metodos/Aula41LD.pdf> Acessado em: 27 maio. 2019.
ARQUIVO NACIONAL (BRASIL). Dicionário Brasileiro de Terminologia Arquivística. Rio de Janeiro. 2005. 232p. Disponível em: <https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/dicionrio_de_terminologia_arquivistica.pdf>.
AUSTIN, Derek; DALE, Peter. Diretrizes para o estabelecimento e desenvolvimento de tesauros monolíngues. trad. Blanca Amaro de Meto. rev. Ligia María Café de Miranda. Brasília. IBICT/Senai. 1993.
BELLOTTO, Heloísa. Diplomática e tipologia documental em arquivos. 2 ed. rev. Maria Lúcia Vilar de Lemos. Briquet de Lemos Livros. Brasília. 2008. 106p.
BUREAU OF CANADIAN ARCHIVISTIS. Rules for Archival Descriptions (RAD). jul. 2008. 700p. Disponível em: <http://archivescanada.ca/ResourcesPublicationsD>.
CONARQ. NOBRADE: Norma Brasileira de Descrição Arquivística. Rio de Janeiro. 2006. 125p. Disponível em: <https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/nobrade.pdf>.
Conselho Internacional de Arquivos. ISDF: Norma internacional para descrição de funções. Tradução: Vitor Manoel Marques da Fonseca. 1 ed. Rio de Janeiro: Arquivo Nacional. 2008. 76p. Disponível em: <https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/ISDF.pdf>.
Conselho Internacional de Arquivos. ISDIAH: Norma internacional para descrição de instituições com acervo arquivístico. Tradução: Vitor Manoel Marques da Fonseca. Rio de Janeiro: Arquivo Nacional. 2009. 88p. Disponível em: <https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/ISDF.pdf>.
Conselho Internacional de Arquivos. ISAD(G): Norma geral internacional de descrição arquivística. 2 ed. Comitê de Normas de Descrição, Estocolmo, Suécia, 19-22 de setembro de 1999, versão final aprovada pelo CIA. Rio de Janeiro: Arquivo Nacional, 2000. 119 p. Disponível em: <https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/isad_g_2001.pdf>.
Conselho Internacional de Arquivos. ISAAR(CPF): norma internacional de registro de autoridade arquivística para entidades coletivas, pessoas e famílias. tradução de Vitor Manoel Marques da Fonseca. 2. ed., Rio de Janeiro: Arquivo Nacional, 2004. 99p. Disponível em: <https://www.gov.br/conarq/pt-br/centrais-de-conteudo/publicacoes/isaar_cpf.pdf>.
ESPANHA. MINISTERIO DE CULTURA. Norma para la Elaboración de Puntos de Acceso Normalizados de Instituciones, Personas, Familias, Lugares y Materias en el Sistema de Descripción Archivistica de los Archivos Estatales. jul. 2010. Disponível em: <https://www.culturaydeporte.gob.es/cultura/archivos/destacados/anteriores/norma-para-la-elaboracion-de-puntos-de-acceso-normalizados-en-las-descripciones-de-documentos-de-archivo.html> Acesso em:
GUINCHAT, Claire; MENOU, Michel. As Linguagens Documentárias. In:______ Introdução Geral às Ciências e Técnicas da Informação e Documentação. Brasília: IBICT. 1994. p 133-145.
ROBREDO, Jaime. Documentação de Hoje e Amanhã. Brasília. 2005. P. 124-127.
DAHLBERG, Ingetraut. Teoria do Conceito. Tradução: CAMPOS, Astério. Brasília, 22-25 jul. 1975. Rio de Janeiro. 1978. 7p.
LANCASTER, F.W. Indexação e resumos: Teoria e prática. 2. ed. Tradução: Antônio Agenor Briquet de Lemos. Brasília: Briquet de Lemos Livros. 2004. 395p.
SMIT, JOHANNA W. E KOBASHI, NAIR Y. Como elaborar vocabulário controlado para aplicação em arquivos. São Paulo: AESP/IMESP, 2003. (Como fazer, 10).
THE SOCIETY OF AMERICAN ARCHIVISTS. Describing Archives: A Content Standards – DACS. 2. ed. 2020. Disponível em: <https://saa-ts-dacs.github.io/>
| | Documento assinado eletronicamente por Michel Cordeiro Alvares de Oliveira, Arquivista do Arquivo Central, em 12/07/2023, às 15:19, conforme horário oficial de Brasília, com fundamento na Instrução da Reitoria 0003/2016 da Universidade de Brasília. |
| | A autenticidade deste documento pode ser conferida no site http://sei.unb.br/sei/controlador_externo.php?acao=documento_conferir&id_orgao_acesso_externo=0, informando o código verificador 9999342 e o código CRC 104148BC. |
| Referência: Processo nº 23106.079575/2023-77 | SEI nº 9999342 |