Mostrar mensagens com a etiqueta análise do vocabulário da mudança. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta análise do vocabulário da mudança. Mostrar todas as mensagens

sexta-feira, 8 de março de 2013

Da indigência

Helena Buescu apresentou na AR um "parecer" em que se refere obliquamente à análise que aqui fiz sobre o Vocabulário da Mudança. Insiste na fraude perpretada por Regina Rocha e publicada no Público, e diz que ela foi, cito:
objecto de contra-resposta que não apresentou qualquer comprovada anulação baseada em dados alternativos
Claro que não. Eu não me baseei em dados alternativos: baseei-me nos mesmos dados que Regina Rocha diz ter utilizado para obter os números que inventou.

E claro que não apresentei "qualquer comprovada anulação". Só forneço a tabela com todos os dados, todas as contas e todas as fórmulas a quem ma pedir (e desde a última vez que o mencionei já a forneci a mais três pessoas, subindo o total para cinco — uma das quais opositora ao AO (finalmente!), pelo menos por enquanto). Mais nada. Coisa pouca, bem sei. O que é isso comparado com todas as provas que a Regina Rocha fornece de que não inventou os seus números? Hm?

Já agora, que foi ao certo que Regina Rocha forneceu a quem quiser verificar a bondade dos seus dados e contas? É que estou aqui a puxar pela cabeça e não me lembro de nada.

Deve ser, decerto, falha na minha memória. Com certeza que há abundante materal comprovativo. Uma tabelinha com contas, talvez? Talvez feita em papel? Uns rabiscozinhos a lápis? Não?

Doutoramentos à portuguesa...

sábado, 16 de fevereiro de 2013

Notas finais à análise do Vocabulário da Mudança

E pronto. Foi isto. Não estou a ver bem que dados se possam tirar mais do Vocabulário da Mudança (mas se tiverem alguma ideia, continuo recetivo, se bem que não garanta que a ponha em prática... é que isto, parecendo que não, ainda deu uma trabalheira), mas já aqui ficam bastantes. Mais que suficientes para tornar cristalino até que ponto é treta o que certos "estudiosos" andam a dizer sobre a nova ortografia originar divergência em vez de convergência. É preciso uma grande vesguice de análise ou uma grande dose de má-fé para afirmar uma coisa dessas. Sim, há casos de divergência, mas há muitas vezes mais casos de convergência, o que faz com que, no global, a ortografia convirja. Como é óbvio. E quem vos disser o contrário, estará a tentar aldrabar-vos. Não deem ouvidos a aldrabões.

Notem que esta minha análise, porque parte do mesmo ponto de partida daquele lamentável simulacro de estudo da Maria Regina Rocha, incide só e apenas sobre o Vocabulário da Mudança. E o VdM não é exaustivo. Há bastantes palavras que ficaram de fora, não só as formas verbais de que já tinha falado num dos primeiros posts da análise, mas outras também. Na verdade, e apesar de muitas vezes tentarem sê-lo, nenhum vocabulário de uma língua viva é exaustivo, precisamente porque a língua é viva. Uma língua viva está constantemente a mudar, há constantemente palavras novas a serem criadas ou importadas de outras línguas, palavras a cair na obsolescência, palavras a ser resgatadas dessa obsolescência, etc. Porque todas as línguas vivas têm os seus utilizadores criativos — e ainda bem que assim é; que seria da literatura sem eles? — e esses não se contentam com o que há e inovam... e também porque todas as línguas vivas têm os seus utilizadores ignorantes — e tantos que eles são, até muitos que julgam não o ser — e esses não sabem bem o que há e deturpam. Uns e outros são os agentes da mudança, e a mudança é constante e imparável. E isso implica que o momento em que um putativo vocabulário ficasse completo seria o exato momento em que se tornaria obsoleto.

Portanto, o Vocabulário da Mudança não é, nem nunca seria, algo de completo. No entanto, nada indica que não se trate de uma amostragem fiel do que muda e como. Uma amostragem que permite ter uma ideia bastante aproximada (sujeita a erro, como todas as amostragens, mas com um erro bastante pequeno) das tendências globais da mudança ortográfica e do que lhes está subjacente. Os números totais de cada categoria em que o fui subdividindo ao longo da análise seriam certamente diferentes com um eventual vocabulário completo, mas as proporções entre uns números e outros deviam ser muito idênticas. E as tendências gerais também.

E pronto, fico-me por aqui. Foi uma trabalheira. Mas também foi divertido, e foi, com toda a certeza, bastante instrutivo.

Uma nota final: caso não tenham reparado, criei uma tag própria para a análise: "

O resto

E chegados a este ponto, restam 31 palavras no Vocabulário da Mudança que não sofreram alterações devido a nenhum dos casos de que falei antes. A grande maioria destas palavras sofrem alterações devido à supressão da acentuação diferencial em paroxítonas. Trata-se do que aconteceu ao antigo "pára" e derivados ("pára-brisas", por exemplo), ao antigo "pêlo", ao antigo "pêro", etc. Passaram a "para", "para-brisas", "pelo" e "pero", e fizeram-no em todo o espaço lusófono. Isto corresponde a 27 dessas 31 palavras, e em todos os casos menos um trata-se de grafias únicas que mudaram mas se mantiveram grafias únicas. A única exceção é a palavra "pólo", que tinha, no Brasil, dupla grafia, "pólo" e "pôlo". Com a supressão dos acentos essa dupla grafia desaparece e a grafia converge para "polo".

Restam apenas 4 palavras. Em todas havia divergência de grafia nas ortografias pré-AO, e todas a nova ortografia transforma em duplas grafias. "Forma" e "fôrma", "judo" e "judô", "húmido" e "úmido" e "lambugem" e "lambujem". Ou seja, na prática, estas 4 palavras continuam a escrever-se como dantes.

Em resumo, nestas últimas palavras do Vocabulário da Mudança encontram-se:
  • 4 casos de grafias divergentes que passam a duplas.
  • 26 casos de grafia única que se transformam noutras grafias únicas.
  • 1 caso de convergência para uma forma nova.
E para acabar isto resta-me só escrever umas notas finais. Noutro post.

Novos hífenes

As novas regras da hifenação tiveram como resultado o desaparecimento de centenas de hífenes da língua portuguesa, e desde logo o mais absurdo de todos: o hífen em "há-de" (por que raio se há de hifenar "há de" se não se hifeniza "terá de"?!). Mas também criaram alguns novos.

Assim, há, no Vocabulário da Mudança, 25 casos de palavras que não eram hifenadas e passaram a sê-lo. Tal como acontece com os hífenes preexistentes, também aqui a mudança é feita em conjunto e com uma uniformidade que só não é total porque algumas palavras incluem também alterações que têm a ver com outras regras. Os números são:
  • São 2 os casos de grafias divergentes que passam a grafias múltiplas.
  • São 21 os casos de grafia única que continua a ser única.
  • Não há casos de divergência.
  • São 2 os casos de convergência, um para a forma anteriormente usada no Brasil, o outro para uma forma nova.
E não há mais nada a dizer sobre os números deste caso. São baixos, mais também são bastante claros.

O hífen antigo

E eis-nos no último grande grupo de palavras que consta do Vocabulário da Mudança: as hifenadas. Aqui, embora houvesse alguma divergência ortográfica entre as regras brasieiras e as dos demais países, o grosso da evolução é feita em conjunto, com regras novas para todos e uma unidade generalizada na forma de usar o hífen. Dividi a análise em dois grupos: o das palavras que já continham hífen antes do AO90, quer em toda a lusofonia, quer só em parte dela, e o das palavras que não eram hifenadas e passaram a sê-lo. Aqui falo apenas do primeiro desses grupos.

Entre as palavras presentes no Vocabulário da Mudança, as que tinham hífen nas antigas ortografias eram bastante numerosas: 1060. Cerca de um sexto do total. Mas uma parte destas palavras estão no vocabulário devido a mudanças noutras questões, não no hífen. Aquelas em que existe mudanças no hífen são só 902. Subdividem-se da seguinte forma:
  • Existem 14 casos de ortografias anteriormente divergentes e que, apesar das mudanças na hifenação, passaram a duplas ou múltiplas grafias. Em todos esses casos a multiplicidade gráfica deve-se a outros fatores, não ao hífen.
  • Os casos de mudanças em toda a lusofonia, ou seja, os casos em que uma grafia comum passa a outra grafia comum, são de longe os mais numerosos: 821.
  • Existem 64 casos de convergência.
  • Há apenas 3 casos de divergência, todos devidos a alterações que não têm a ver com o uso do hífen.
  • Entre os casos de convergência, 17 fazem-se para a forma que anteriormente era a portuguesa.
  • São 31 os que se fazem para a anterior forma brasileira.
  • São 16 os que se fazem para uma forma nova.
No que toca ao hífen, portanto, e por confusas que as regras possam ser (e eu acho que algumas são, embora também ache que o problema está longe de ter solução simples), a unidade ortográfica é total. A divergência que existia antes do AO90, que já era reduzida para começar, deixou de existir.

E neste momento falta-me falar-vos de pouco mais de 50 palavras. Mais três posts e isto acaba. Ufa!

Outros ditongos e vogais duplas

Além dos dois casos anteriores, razoavelmente numerosos, há mais alguns casos de mudanças na acentuação de vogais duplas e ditongos, embora todos eles sejam bastante raros. São os seguintes:

O ditongo OI nem sempre era acentuado no O. Também havia, na anterior grafia brasileira, casos de acentuação no I, como em "maoísta". Este acento também desaparece, e portanto todas as palavras que, no Vocabulário da Mudança, mostravam esse ditongo passaram a escrever-se sem acento. São apenas 4, e todas convergem para a anterior forma portuguesa.

Algo mais numeroso é o caso do ditongo IU em que, na anterior grafia brasileira, se acentuava o U. O exemplo mais comum é o da palavra "feiúra". Este acento também desaparece, e são mais 11 palavras do Vocabulário da Mudança cuja grafia converge para a anterior forma portuguesa.

Quando a vogal se repete, como na palavra "voo", a anterior grafia brasileira acentuava o primeiro O com um acento circunflexo. É mais um acento que o AO90 faz desaparecer, e é, portanto, mais um caso de convergência total para as antigas formas portuguesas. O Vocabulário de Mudança inclui 10 palavras destas. De notar que a mesma regra serve para o desaparecimento do acento circunflexo em certas formas verbais, como "lêem". Mas como se trata de formas verbais e no VdM os verbos só surgem no infinitivo, essas palavras não aparecem nas listas.

Ao todo, portanto, são apenas pouco mais de duas dezenas de palavras a sofrer este tipo de alterações, mas em todas elas o processo é o mesmo: grafias que antes do AO90 eram diferentes passam a ser iguais à forma que anteriormente era a usada em toda a lusofonia à exceção do Brasil.

sexta-feira, 15 de fevereiro de 2013

Ei!

Ainda na acentuação de ditongos em palavras paroxítonas, temos agora um caso completamente diferente, embora o princípio que leva à mudança ortográfica seja o mesmo do post anterior: o do ditongo EI. Aqui, o uso anterior à nova ortografia era com frequência diferente no Brasil, onde o E era muitas vezes acentuado, e nos restantes países lusófonos, onde não era. Um exemplo: "europeia", que no Brasil se escrevia "européia".

Pois as palavras do Vocabulário da Mudança que incluem esse ditongo são 267 e, como o acento é suprimido, todas elas sofrem alterações. E aqui, a convergência é esmagadora. Temos que:
  • Não há um único caso de grafias divergentes nas antigas ortografias que se mantenham na nova como duplas grafias.
  • Existem 2 casos de uma grafia idêntica que é alterada para outra grafia idêntica.
  • 265 casos de convergência. Todos para as anteriores formas portuguesas.
  • Não existe uma única divergência.
De novo, os números falam por si e dispensam comentários. Resta-me apenas sublinhar que basta esta alteração introduzida pelo AO90 para fazer convergir mais vocábulos do que os que divergem somando todas as mudanças. Isso, confesso, diverte-me bastante quando penso no que se afirmava no artigo que me levou a fazer esta análise.

Oi?

Deixando para trás as consoantes mudas, voltamos aos acentos. Aqui falarei da acentuação do O nas palavras paroxítonas que incluem o ditongo OI. Essa acentuação, na nova ortografia, cai. Um exemplo: "heróico", que se escrevia assim em toda a lusofonia e passa, com o acordo ortográfico, a escrever-se "heroico".

E é isso o que acontece na vasta maioria dos casos: aqui, a mudança dá-se em uníssono, passando-se quase sempre de uma ortografia única antes do AO90 para outra ortografia única depois ao AO90. Quase sempre.

São, no Vocabulário da Mudança, 535 palavras que continham o ditongo OI acentuado, e em todas essas 535 palavras o ditongo perde o acento. O que acontece depois é o seguinte:
  • Há apenas 3 casos de grafias divergentes, devido a outros fatores, que passam a duplas grafias.
  • O número de palavras em que uma grafia idêntica é transformada noutra grafia idêntica é de 529. Quase a totalidade deste grupo de palavras.
  • Existem 3 casos de convergência.
  • Não há nem um único caso de divergência.
  • Entre as convergências, 2 fazem-se para a antiga forma portuguesa e 1 para uma forma nova.
E não há grandes comentários adicionais a fazer. Trata-se de uma mudança simples, que afeta por igual todos os utilizadores da língua.

Outros casos de emudecimento de consoantes

Além do P e do C, que emudecem em toda a lusofonia, embora em graus algo diferentes, há alguns casos de emudecimento de consoantes que só ocorrem nos dialetos brasileiros e que, portanto, só afetaram a anterior grafia brasileira. São invariavelmente casos em que o acordo ortográfico não teve qualquer impacto prático: embora as grafias anteriormente divergentes tenham passado a duplas, as palavras continuam após a adoção da nova ortografia a escrever-se tal e qual se escreviam antes: os brasileiros de uma forma, os outros de outra. E além disso a proporção dessas palavras é bastante baixa. Mas, por uma questão de completude desta análise, aqui ficam.

Na fonética brasileira, a sequência GD sofre ocasionalmente e num conjunto bastante restrito de palavras o emudecimento do G. Por conseguinte, na ortografia brasileira palavras como "amígdala" passam por vezes a "amídala". O número destes casos é bastante baixo: são apenas 16 as palavras do VdM que incluem essa sequência, e só 15 estão no vocabulário por causa do emudecimento do G. Todas elas tinham grafia divergente e passaram a ter dupla.

Também a sequência MN sofre em alguns casos, no Brasil, o emudecimento do M, e palavras como "amnistia" escrevem-se do outro lado do Atlântico sem M: "anistia". No Vocabulário da Mudança encontram-se 46 vocábulos que incluem essa sequência, mas só existe emudecimento do M em 31 deles. De novo, todas essas palavras tinham grafia divergente e passaram a tê-la dupla.

Na sequência NN não se pode falar propriamente de emudecimento, mas havia, e continua a haver, uma divergência no uso brasileiro e dos demais países. A palavra é "connosco", que do outro lado do Atlântico se escreve só com um N: "conosco". Mais uma grafia divergente que passa a dupla.

A sequência BD também sofre no Brasil, em casos muito raros, o emudecimento do B. O caso mais conhecido é a palavra "súbdito", que do outro lado do mar se escreve "súdito". No Vocabulário da Mudança encontram-se 21 vocábulos que incluem essa sequência, mas só 2 deles lá estão devido ao emudecimento do B. Em ambos, a grafia divergente passa a dupla.

Por fim, e ainda no Brasil, também na sequência BT se assiste por vezes ao emudecimento do B. O caso mais conhecido, "subtil", tinha antes do acordo ortográfico grafia dupla no Brasil, aceitando-se as formas "subtil" e "sutil". Há no VdM um total de 12 palavras a incluir essa sequência, embora só metade lá estejam por causa dela. Em todos esses 6 casos, as grafias divergentes passam a duplas.

Ao todo, são 55 vocábulos em mais de 6500. Muito pouca coisa.

O P como consoante muda: finalmente alguma divergência

É quando a consoante que tende ao emudecimento é o P que finalmente se encontra alguma divergência na nova ortografia. Tal como acontece com o C, há três casos distintos, um dos quais é bastante mais frequente do que os outros dois: O PT, o PC e o PÇ.

O caso mais abundante é, claro, o das palavras que incluem a sequência PT. São, no Vocabulário da Murança, em número de 300, embora em três dezenas delas haja alterações por outros motivos, não pelo emudecimento do P. Isto acontece apenas com 269 dessas palavras. E entre esses 269 vocábulos encontramos o seguinte:
  • São 151 os casos de grafias anteriormente divergentes que, na nova ortografia, passam a duplas. Bastante mais de metade.
  • Uma vez mais, não existem casos em que uma grafia anteriormente única continue a sê-lo.
  • Há apenas 15 casos de convergência, todos para a anterior forma brasileira.
  • Os casos de divergência são 103.
Aqui, como se vê, a divergência domina esmagadoramente, numa razão de quase 7:1. E domina ainda mais nas outras duas sequências consonantais cuja consoante muda tende a ser o P, apesar dos números absolutos serem muito menores.

A sequência PC conta 24 vocábulos no VdM, e todos lá se encontram devido precisamente ao emudecimento do P.
  • O número de casos de grafias anteriormente divergentes que passam a duplas é, aqui, de 6.
  • Não há nem qualquer caso de grafia anteriormente única que continue a sê-lo, nem nenhum caso de convergência.
  • Os casos de divergência são, portanto, 18.
Quanto à sequência PÇ, conta 22 vocábulos no VdM, também todos lá presentes devido ao emudecimento do P. Subdividem-se da seguinte forma:
  • São também 6 os casos de grafias anteriormente diferentes que continuam a sê-lo.
  • Volta a não haver nenhum caso de grafias iguais que continuem iguais.
  • 1 caso de convergência. Para a anterior forma brasileira.
  • Os casos de divergência são 15.
Tudo somado, estamos perante menos de 400 palavras, num universo de mais de 6500, entre as quais, realmente, a divergência é muito superior à convergência, apesar da maioria continuar a pertencer às palavras que tinham grafias divergentes antes do acordo ortográfico e passam agora a tê-la dupla. Todas as convergências se fazem para as anteriores formas brasileiras, como seria de esperar uma vez que só em Portugal permaneciam as consoantes mudas de origem etimológica.

Mas ainda há mais consoantes mudas. Esperem pelo próximo post.

Outras sequências consonantais com C

Além da sequência, CT, o Vocabulário da Mudança inclui palavras com outras duas sequências consonantais (ou só uma dependendo do ponto de vista) que incluem a letra C com tendência de emudecimento: a sequência CC e a sequência CÇ. A frequência de ambas é, no entanto, muito inferior à da sequência CT.

A primeira conta 146 palavras, no VdM, quase todas envolvidas na mudança. Aquelas em que o emudecimento do primeiro C leva a alterações ortográficas são 143. Entre estas, temos que:
  • Contam-se 58 casos de grafias anteriormente divergentes que hoje são duplas.
  • Não há nenhum caso de grafias anteriormente idênticas e que hoje continuem a sê-lo.
  • Existem 76 casos de convergência ortográfica.
  • 9 casos de divergência.
  • A convergência faz-se quase toda para as antigas formas brasileiras: são 74 palavras aquelas em que isto acontece.
  • De novo não há convergências para antigas formas portuguesas, mas há 2 para formas novas.
A novidade neste grupo de palavras é a convergência ser o subgrupo mais importante, ultrapassando até a situação que costuma ser mais comum: a de grafias divergentes antes do AO90 continuarem a sê-lo depois dele ou pelo menos admitirem grafias múltiplas. A razão convergência/divergência é, aqui, de mais de 8:1.

A outra, que inclui o C cedilhado, mostra números bastante semelhantes, embora algo inferiores. Num total de 125 palavras, das quais 124 estão envolvidas na mudança por causa do emudecimento do C, há:
  • 50 casos de grafias anteriormente divergentes que hoje são duplas.
  • De novo, não há nenhum caso de grafias anteriormente idênticas que continuem a sê-lo.
  • Os casos de convergência são 65.
  • Os casos de divergência são de novo 9.
  • As convergências são, na sua esmagadora maioria, para a anterior forma brasileira. São 62 os casos desses.
  • Uma vez mais, não há qualquer convergência para as antigas formas portuguesas, mas há 3 para formas novas.
E o comentário que se pode fazer a este grupo é em tudo idêntico ao anterior. Exceto a razão convergência/divergência, que é um pouco mais baixa. Só um pouco mais de 7:1.

E quanto ao C mudo estamos conversados. A convergência é esmagadora, embora, somando todos, continuem a predominar os casos em que a divergência prévia permanece, e ela faz-se esmagadoramente para anteriores formas brasileiras. Segue-se o P mudo. Noutro post.

quinta-feira, 14 de fevereiro de 2013

A sequência consonantal CT

E eis-nos no centro da polémica (em Portugal): a sequência consonantal CT, que tantas vezes tende para o emudecimento do C. Trata-se da mais abundante das sequências consonantais afetadas pelas mudanças na ortografia, e o Vocabulário da Mudança inclui um total de 1574 vocábulos que contém essa partícula. Nem todos, porém, sofrem alterações. Há uma parte desses vocábulos em que o C se articula sempre, logo se mudanças há na sua grafia elas devem-se a outros fatores. Neste último grupo contam-se pouco mais de 100 vocábulos; aqueles em que o emudecimento do C leva a alterações ortográficas somam 1470.

É uma fatia considerável do VdM, a segunda maior, logo atrás da acentuação da sílaba tónica. E o que acontece a essas palavras com a mudança ortográfica é o seguinte:
  • Contam-se 983 casos de grafias anteriormente divergentes que hoje são duplas, por vezes (quando ao emudecimento do C se somam outras alterações) triplas e num punhado de casos chegam a ser quádruplas.
  • O número de casos de grafias anteriormente idênticas e que continuam a ser idênticas é muito baixo: apenas 5.
  • 416 casos de convergência.
  • Os casos de divergência são 66.
  • Entre as convergências, a esmagadora maioria faz-se para a anterior forma brasileira: 409.
  • Não existe qualquer convergência para anteriores formas portuguesas. Mas há 7 para formas novas.
Esta sequência consonantal, sozinha, é responsável por cerca de 2/3 das convergências para a antiga grafia brasileira, e é por isso que os caturras (e principalmente os que ultrapassam a simples caturrice e entram de cabeça xenofobia dentro) tanto gostam de falar dela. Ao se "esquecerem" de todas as outras mudanças podem apontar para estes números e rasgar as camisas de indignação. O azar deles é que as outras mudanças também existem. E também contam.

Mas mesmo só olhando para aqui, falar-se em divergência ortográfica é completo disparate: a vantagem da convergência sobre a divergência é de mais de 6:1.

É também aqui que aparece a maior parte dos casos de que falo neste post.

Os números do trema

O trema é, de todas as alterações introduzidas na nova ortografia, aquela que oferece uma análise mais simples. Desaparece, pura e simplesmente, portanto todas as divergências ortográficas causadas pela sua existência também desaparecem. E em todos os casos, a convergência faz-se para a forma anteriormente usada em Portugal.

Simples, não?

Bem, quase.

É que há algumas palavras que, além do trema, sofrem também outras alterações, portanto nem todas as palavras de onde o trema desaparece passam a integrar o grupo das grafias unificadas. Os números são os seguintes:
  • No Vocabulário da mudança contam-se 321 palavras alteradas pelo desaparecimento do trema.
  • Entre estas, 313 convergem, todas para a anterior grafia portuguesa.
  • 8 destas palavras, apesar do desaparecimento do trema, mantém dupla grafia devido a outros fatores.
Uma curiosidade neste pequeno grupo de 8 palavras: Segundo o Vocabulário da Mudança, 5 destas palavras tinham anteriormente, no Brasil, não grafia dupla, mas quádrupla. Na nova ortografia passa a ser apenas dupla.

Outra curiosidade é estas 313 convergências para a anterior ortografia portuguesa corresponderem a exata metade de todas as convergências do mesmo género.

Também não deixa de ser interessante constatar que só as convergências causadas pelo trema já são em número muito maior que todas as divergências.

Os números da ortografia - Recapitulando

Com o aparecimento de alguns erros no tratamento da tabela do Vocabulário da Mudança, resolvi ir rever tudo o que ficou para trás. O resultado foi a descoberta de mais um erro, desta vez numa fórmula: quando calculei quantas das palavras convergentes convergiram para a anterior norma portuguesa e quantas convergiram para a anterior norma brasileira esqueci-me da possibilidade de haver convergências para uma ortografia nova, não utilizada até agora por ninguém. E de facto há algumas. Mais precisamente 20.

Por outro lado, nos verbos nenhuma mudança existe.

Ou seja, recapitulando, os números após correção dos erros são os seguintes:

  • O Vocabulário da Mudança contém um total de 6573 vocábulos
  • Entre esses, contam-se 3703 casos de grafias anteriormente divergentes que hoje são duplas (ou, em raríssimos casos, triplas). Na sua grande maioria são casos em que a prática anterior não muda.
  • Contam-se 1400 casos de grafias anteriormente idênticas que continuam hoje a ser idênticas (mas diferentes das anteriores).
  • Contam-se 1249 casos de convergência, grafias anteriormente diferentes que passaram a ser iguais.
  • Contam-se 221 casos de divergência, palavras que anteriormente se escreviam de forma igual mas passaram a aceitar dupla grafia.
  • Entre os casos de convergência, são 616 os que se fazem para a antiga norma portuguesa.
  • Entre os casos de convergência, são 613 os que se fazem para a antiga norma brasileira.
  • 20 casos de convergência para uma ortografia inexistente antes do AO90.
Em suma: há pequenas alterações nos valores, mas as tendências gerais não sofrem qualquer alteração.

O passo seguinte (que já está meio posto em prática) é analisar as mudanças caso a caso. Isso deve levar algum tempo, até porque tem uma componente manual relevante pois, se é fácil isolar automaticamente as palavras que incluem sequências consonantais, hífenes, tremas ou quaisquer dos outros detalhes que sofreram alterações com a nova ortografia, separar aquelas que as incluíam e continuam a incluir das que incluíam mas deixaram, total ou parcialmente, de incluir não é factível sem ir verificar os casos um a um. Ou pelo menos não o é sempre.

Trocando por miúdos, isto vai ainda durar vários dias.

O erro afinal era maior

Isto de ir fazer uma análise mais fina é engraçado. Descobri uma gralha no Vocabulário da Mudança que implica mais uma convergência (um uso antigo e brasileiro de "éi" que não estava acentuado). E acabei também de descobrir que os casos que levaram a este erro são mais que 16. As estações do ano incluem também a palavra "estio", e há mais três palavras que perdem a inicial maiúscula: "fulano", "beltrano" e "sicrano". Não me lembrava desta última alteração.

Tudo somado, portanto, são 21 palavras que estavam na coluna das grafias idênticas e passam para a das convergências. Pouca coisa, mas alguma coisa.

quarta-feira, 13 de fevereiro de 2013

Ah, espera lá. Há aqui um erro

E eis que detetei um erro na análise que tenho vindo a fazer ao Vocabulário da Mudança. As fórmulas que fazem a comparação entre as várias ortografias não são sensíveis à capitalização. Olham para "Abril", depois olham para "abril", e dizem que as palavras são iguais. Mas não são, não exatamente.

O que isto significa é que há mais 16 palavras que se escreviam diferentemente com as ortografias antigas e que passam a escrever-se de igual forma na nova: os nomes dos 12 meses e os das 4 estações do ano.

Ou seja: a convergência é um puco maior do que afirmo aqui.

Verbos na nova ortografia

Os verbos são um tipo de palavra muito particular, na medida em que tipicamente se expandem num conjunto de algumas dezenas de formas vocabulares diferentes consoante os seus vários tempos e pessoas. Assim, achei que seria interessante isolá-los do resto do Vocabulário da Mudança, para ver se as tendências que se encontram na "população geral" (chamemos-lhe assim) de palavras aí existentes também se verificam entre os verbos.

Para tal, identifiquei automaticamente, na minha folha de excel com as minhas formulazinhas, um conjunto de palavras com probabilidade de serem verbos, ou seja, as que terminam em -ar, -er ou -ir. São ao todo 232. Entre estas, fui de seguida isolar os verbos. Isto fiz à mão, e é a única coisa feita à mão de toda esta análise; ou seja, se houver algum erro será decerto neste passo. Assumindo que não há, que nem deixei nenhum verbo de fora nem chamei verbo a nada que o não seja, o total de verbos no Vocabulário de Mudança é de apenas 178. O que, já agora, é uma boa indicação de quão limitadas são as mudanças introduzidas pela nova ortografia: há larguíssimos milhares de verbos na língua portuguesa.

Mas adiante.

Fiz, para os verbos, uma análise idêntica à que fiz para todo o vocabulário e que apresentei neste post. Como a análise é semelhante, apresento os resultados também de forma semelhante. Ei-los:
  • O Vocabulário da Mudança contém um total de 178 verbos
  • Entre esses, contam-se 70 casos de grafias anteriormente divergentes que hoje são duplas.
  • Contam-se 36 casos de grafias anteriormente idênticas que continuam hoje a ser idênticas (mas diferentes das anteriores).
  • Contam-se 60 casos de convergência, grafias anteriormente diferentes que passaram a ser iguais.
  • Contam-se 12 casos de divergência, verbos que anteriormente se escreviam de forma igual mas passaram a aceitar dupla grafia.
Ou seja, e de novo, a convergência bate a divergência por larga margem, ainda que um pouco inferior à da população geral. São "só" 5 vezes mais casos de convergência do que de divergência. Mais curioso, a meu ver, é que enquanto a razão entre grafias divergentes/duplas e idênticas/idênticas é semelhante ao que acontece na população geral (3703 para 1421 na população geral, ou seja, 2,6 para 1; 70 para 36 nos verbos, ou seja, 1,9 para 1), a proporção de casos tanto de divergência como, sobretudo, de convergência é muito maior. O motivo para isto é simples: os verbos são sobretudo afetados pelas mudanças na grafia das consoantes mudas, tendo as outras mudanças instituídas pela nova ortografia muito pouco efeito sobre eles, ou mesmo nenhum. E o que isso quer dizer é que mesmo nas tão mal-afamadas supressões de consoantes mudas, por critérios fonéticos, o efeito genérico é sobretudo de convergência ortográfica, ao contrário do que tão propalado tem sido por aí.

Era gajo para jurar que isto é mais um pequeno prego no caixão de certas ideias. Que vos parece?

terça-feira, 12 de fevereiro de 2013

E qual o efeito da acentuação da sílaba tónica?

E qual o efeito da acentuação diferenciada da sílaba tónica, alguém sabe? Sabem de que palavras falo? Falo daqueles casos de dupla grafia gerados por a sílaba tónica aparecer acentuada com acento circunflexo no Brasil e agudo na restante lusofonia. Casos como Antônio/António, tônico/tónico, abstêmio/abstémio, etc.

Pois bem: eu, graças à tal tabelinha excel, sei.

São ao todo 2426. Isto corresponde a uma fração significativa de todo o Vocabulário da Mudança (36,9%) e é aqui que se concentra a vasta maioria das diferenças ortográficas que o AO90 não resolveu. Estas 2426 palavras são 61,8% de todas as 3924 duplas grafias que o VdM diz permanecerem na nova ortografia. Ou seja: é este o principal problema que ficou por resolver, e o mais certo será acabar por ser resolvido através da supressão pura e simples desses acentos, conforme era advogado no acordo de 1986, que, apesar de não ter sido posto em prática, constituiu a base do de 1990.

Até sei quantas palavras têm diferença na vogal O e quantas a têm na vogal E, vejam bem. As que diferem por um ô/ó são 1665; as que diferem por um ê/é são 761.

Note-se que, na esmagadora maioria destes casos, não há qualquer diferença entre o modo de escrever com a nova ortografia e com as antigas. Apesar de aparecerem estas duplas grafias nas listas, na prática tudo fica como estava.

Sobre múltiplas grafias

Uma das grandes diferenças entre as grafias anteriores ao acordo ortográfico no Brasil e nos demais países é a prevalência de múltiplas grafias entre este conjunto de palavras cuja grafia sofre mudanças e que consta do Vocabulário da Mudança. Recorrendo à tal folha excel é fácil contá-las, e os números dificilmente podiam ser mais díspares. Na grafia portuguesa pré-AO só se contam 4, o que corresponde a uns muito insignificantes 0,06% do total. Na grafia brasileira pré-AO, no entanto, são 1334, 20,3% do total.

A explicação para isto não é tão evidente como pode parecer à primeira vista. Dir-se-ia que a manutenção das consoantes mudas na ortografia portuguesa permitia disfarçar até que ponto a pronúncia dessas consoantes varia entre os falantes da língua, variabilidade essa que é natural e inevitável quando a língua está em transição, como é o caso — o processo de perda das sequências consonantais na língua portuguesa é uma das mais persistentes tendências da língua, e está bem estudado.

As opiniões sobre se esse disfarce é bom ou mau divergem, e todas são, em princípio, legítimas, mas a verdade é que ele não explica tudo. Por exemplo: a numerosa família de palavras em que se inclui elétrico e eletricidade (são quase 200!) tinha, no Brasil, dupla grafia, elétrico e eléctrico, eletricidade e electricidade. Tinha no Brasil, e agora continua a ter em toda a lusofonia. Mas não me é claro porquê. Todos os brasileiros com quem falei me dizem que no Brasil só se usam as versões sem c, que as versões com c já nem sequer se ensinam na escola. Alguns manifestam completa estupefação quando são informados de que "electricidade" é uma grafia que as regras em vigor no seu país aceitam. Uma pesquisa no Google restrita aos sites dos domínios ".br" devolve 5 540 000 resultados para "eletricidade" e apenas 226 000 para "electricidade" (96,1% contra 3,9%, respetivamente). Para "elétrico" os resultados são 43 000 000, ao passo que para "eléctrico" não passam de 1 080 000 (97,5% contra 2,5%). E não se apressem a dizer que isto prova que os brasileiros também usam as grafias com c, ainda que muito minoritariamente; não se esqueçam de que essas eram as grafias oficiais nos demais países de língua portuguesa até à entrada em vigor da nova ortografia, de que há textos portugueses e de outros países lusófonos publicados em sites, blogues e fora brasileiros, e de que essa foi também a ortografia brasileira durante muitos anos. Antes da internet, é certo, mas a internet tende a conservar todas as variantes ortográficas devido à transcrição de documentos antigos. Experimentem procurar qualquer ortografia anterior a 1911 que certamente a encontrarão, algures, nesta grande biblioteca digital a que chamamos net. A menos que escolham alguma palavra particularmente obscura, presumo.

Ou seja, não compreendo por que motivo os brasileiros mantém "eléctrico" como variante legítima. Parece não ser usada por ninguém lá por aquelas bandas, nem em texto escrito, nem na oralidade. E como essas quase 200 palavras "elétricas", várias outras há, a aumentar de uma forma que à primeira vista me parece desnecessária o número de duplas grafias existentes na antiga ortografia brasileira. E, por extensão, na nova ortografia comum.

Será, talvez, um aspeto a rever?

segunda-feira, 11 de fevereiro de 2013

Aaaaiiiii! É uma cedência ao Brasiiiilll!

Já os ouviram ou leram, não é verdade? Gente a rasgar as camisas, clamando que "Aaaaiiii! O AO é uma cedência ao Brasiiiiilllll! Querem-nos pôr a escrever brasileeeeirooooo! Às armaaaaas!" Conhecem o estilo, não é?

Pois. O giro de ter uma folhinha excel com todo o Vocabulário da Mudança é poder ir ver qual das grafias anteriores tem mais presença na nova. E eu, depois de ter publicado o post aqui em baixo (a ligação é só para quem veio ter a este sem passar pela casa de partida), de ter jantado e de me ter sentado outra vez ao computador a fazer coisas, achei engraçado ir ver isso mesmo.

Para tal, peguei nos tais 1228 casos de convergência e fui verificar em quantos a ortografia convergiu para a que se usava antes em Portugal e em quantos o fez para a que dantes se usava no Brasil. E quando vi os resultados soltei uma gargalhada.

É que são 615 casos em que a grafia unificada é a que anteriormente era portuguesa, e são 613 em que a unificada é a que anteriormente era brasileira. 615-613. Ganhamos nós.

Não é de ir às lágrimas de riso?