top of page

BIT-PROHPOR

A tradição dos estudos de Linguística Histórica é marcada pela natureza atomística das análises feitas nesse campo de estudo da língua. Esse caráter atomístico das análises dos fatos linguísticos, que, inicialmente, refletia concepções igualmente atomizadas (pré-saussurianas) do fenômeno linguístico, manteve-se na Linguística Histórica, mesmo quando essas concepções que o fundamentavam já estavam superadas, em boa medida devido à dificuldade de se proceder a uma observação sistemática, e, na medida do possível, exaustiva, dos materiais disponíveis.

 

A constituição de Banco de Textos visa exatamente a romper com essa tendência nos estudos de história da língua, possibilitando, com a facilidade de um amplo acesso aos materiais, a aplicação das novas teorias que propugnam uma apreensão globalizante do objeto através de sua estrutura interna (linguística) e daquelas que, ainda mais globalizantes, propõem a apreensão dos fatos através da interação do sistema de relações linguísticas com as disposições e relações nas quais esse sistema se atualiza (i. é. as relações sociolinguísticas).

 

Essa constituição tem em mente, por outro lado, a dificuldade, já destacada por Labov (1972), em relação aos dados para o estudo da língua no tempo real. Um obstáculo irrefutável, diante do qual só resta à ciência buscar contorná-lo, através da maximização dos recursos existentes, i. é. dos textos remanescentes escritos em fases pretéritas da língua.

 

Desde 1992, foi proposta, no âmbito do PROHPOR, a criação de um Banco Informatizado de Textos (BIT) para a história da língua portuguesa, por Rosa Virgínia Mattos e Silva (UFBA), e por Dante Lucchesi, hoje professor da UFBA, naquela ocasião, da Universidade Estadual de Feira de Santana (UEFS). Mas, somente em 2002, com melhores recursos para a digitalização e arquivamento de dados e com o significativo aumento do grupo de membros do Programa, foi possível implementar o BIT e, assim, os corpora de pesquisa do PROHPOR – editados na Filologia Tradicional, por pesquisadores do Programa ou por outros editores – passaram, então na dimensão virtual, a ser objeto de novas práticas de investigação:

 

Projeto BIT - Prohpor Edição de 2002

 

Com mais de 11 anos de existência, o Banco – organizado por critérios previamente definidos e, na medida do possível, uniformes, proporcionando um maior intercâmbio entre os estudos realizados sobre os diversos tópicos da língua – tem contribuído com os estudos de história da língua portuguesa, estando à disposição não somente do PROHPOR, mas de pesquisadores individuais e instituições que dele necessitem para o desenvolvimento de suas pesquisas.

 

O BIT é constituído de textos escritos em português, do século XIII ao século XVI (Português Arcaico) e do século XVII ao século XXI (Português do Brasil), observando-se, na sua seleção, a qualidade das edições disponíveis, com a finalidade de garantir que os materiais selecionados conservem o máximo de elementos presentes na feitura dos textos, os quais oferecem importantes indícios à análise linguística. São textos de natureza variada, tendo em vista que, por meio da diversidade de registros, pode-se entrever a variação sociocultural da língua. Junto aos textos, são apresentadas as informações extralinguísticas. No que diz respeito ao Português do Brasil, há uma parceria muito produtiva entre o BIT e o Projeto Nacional para a História do Português Brasileiro (PHPB), que tem, entre seus campos de atuação, o campo histórico-filológico, que visa à constituição de corpora diacrônicos de documentos de natureza vária, escritos no Brasil, a partir do século XVI.

 

Hoje, contando com melhores recursos tecnológicos, no universo das Humanidades Digitais, o BIT disponibiliza não somente edições semidiplomáticas, em PDF, mas também, por meio do estabelecimento de redes com projetos que desenvolvem a Linguística de Corpus – como os projetos Corpus Histórico do Português Tycho Brahe, coordenado por Charlotte Galves (UNICAMP), e Corpus Eletrônico de Documentos Históricos do Sertão, coordenado por Zenaide Carneiro e Mariana Oliveira (UEFS) – edições em linguagem XML, usando o eDictor, programa computacional desenvolvido por Kepler, Paixão de Souza e Faria (2007), para facilitar a edição eletrônica de textos antigos, que, anotada sintaticamente, permite a busca automática de dados no estudo linguístico. Como se vê, “Do feliz congraçamento entre as mais recentes tecnologias e a antiga Filologia, surgiu um novo universo de possibilidades para a preservação, disponibilização e análise de textos antigos, universo em que é possível oferecer ao leitor mais de uma edição do mesmo texto, permitindo que tenha ao seu dispor o texto editado, em diferentes versões, e o seu original.” (GONÇALVES; BANZA, 2013, p. 4)

 

O BIT tem sempre sido ampliado, com as novas edições, sobretudo de textos de português brasileiro, feitas, no âmbito de seu Mestrado e/ou Doutorado, por jovens que ingressam no PROHPOR, “com amor, paixão, rigor e paciência” (MATTOS E SILVA, 2013, p. 678). Essa ampliação dos corpora “favorece essencialmente uma Linguística descritiva, fortemente apoiada pelas novas tecnologias, e permite tomar como ponto de partida da descrição, a análise de quantidade significativa de dados autênticos, à semelhança do que se faz noutros domínios científicos. O uso de corpora permite a realização de descrições linguísticas de base empírica e promove, com isso, a discussão de questões teóricas solidamente fundamentadas.” (BACELAR DO NASCIMENTO, 2004, p. 1)

 

bottom of page