Que línguas se falavam antes da chegada do latim?
Os linguistas, desde o século XIX, estudam a história antiga das línguas, antes mesmo da escrita, através do método comparativo. Como funciona este método? Sabendo que as línguas tendem a divergir, presume-se que divergem de um ponto comum, no passado. Assim, comparando-as, conseguimos encontrar famílias de línguas com a mesma origem mais ou menos remota.
Todos sabemos, por exemplo, que as línguas românicas têm origem no latim. Há, aliás, alguns vestígios escritos que permitem chegar a essa conclusão — e há, acima de tudo, o próprio latim escrito com o qual podemos comparar as línguas românicas actuais, encontrando facilmente linhas de continuidade e divergência que apresentam muita regularidade.
No entanto, se não conhecêssemos o latim, conseguiríamos mesmo assim encontrar semelhanças suficientes entre as línguas latinas para reconstruir com alguma segurança muitas das características dessa língua-mãe.[1]
- Catalão: amor
- Espanhol: amor
- Francês: amour
- Italiano: amore
- Português: amor
- Romeno: amor
Se não soubéssemos latim, poderíamos concluir que estas proximidades são fruto da coincidência? É difícil, com tantas línguas a acertar na palavra. Podia ser uma questão de empréstimo? Sim: o islandês, por exemplo, também tem a palavra «amor». Aliás, se olhássemos para a palavra «rosa», pareceria que as línguas germânicas e as latinas têm a mesma origem:
- Francês: rose
- Alemão: Rose
- Holandês: roos
- Dinamarquês: ros
- Inglês: rose
- Espanhol: rosa
- Português: rosa
É por esta razão que o método comparativo não funciona com uma palavra isolada. Funciona com muitas palavras e traços gramaticais, rigorosamente comparados.
O certo é que as línguas latinas partilham muitas palavras e muitas características gramaticais que não partilham com as línguas vizinhas. Para chegar a esta conclusão é preciso estudar com afinco as palavras, as características gramaticais — e há muitas hesitações, caminhos errados, descobertas. Mas consegue-se. E consegue-se mais ainda: sabendo as alterações típicas de cada língua mais recente, podemos reconstruir a língua original.
No caso do latim, não temos de reconstruir a língua original. No entanto, este método (o método comparativo) permitiu-nos descobrir que o latim do qual descendem as línguas românicas não é exactamente o mesmo latim dos textos escritos clássicos. A língua da oralidade nunca é igual à da escrita. A língua formal nunca é igual à língua da rua. E, na verdade, as nossas línguas actuais descendem do latim da rua e não do latim dos livros.
Pois bem: se olharmos para o que veio antes do latim, não temos registos escritos. Mas o método comparativo deu os seus interessantíssimos frutos: descobriu-se que quase todas as línguas da Europa descendem duma língua comum. Essa língua deu também origem às línguas iranianas (o persa, por exemplo) e às línguas do Norte da Índia. Assim, o nome que lhe foi dado é este: proto-indo-europeu. As investigações linguísticas permitiram também descobrir onde vivia o povo que falava essa língua — com toda a probabilidade, no território que é hoje a actual Ucrânia.[2]
Essa tribo indo-europeia espalhou-se e invadiu os territórios vizinhos. O certo é que quase toda a Europa fala hoje línguas que descendem da língua desse povo. As excepções são curiosas: o turco, falado no pequeno território turco na Europa; o húngaro, finlandês e estónio, com origem em povos que chegaram à Europa já depois da expansão indo-europeia, vindos das profundezas da Sibéria; o maltês, aparentado com o árabe; e o basco, num recanto da Península Ibérica.
Bem, mas pensemos nesses indo-europeus, pais das línguas da Europa quase toda. Chegaram à nossa península ali entre os séculos VIII e VI a.C. Encontraram povos autóctones que podemos chamar de iberos, embora saibamos muito pouco deles. Estes invasores indo-europeus são muitas vezes referidos como celtas — por esta época já o povo indo-europeu estava dividido em várias famílias linguísticas e a primeira invasão foi desses celtas.
Foram esses povos que os romanos e os povos germânicos que se lhes seguiram vieram encontrar — note-se que, na península, o latim foi introduzido não apenas pelos romanos, mas pelos germanos que vieram governar a península e que já tinham adoptado o latim.
O que aconteceu depois da chegada do latim?

O latim apagou as línguas anteriores, tanto as pré-indo-europeias, como as indo-europeias — excepto o basco, que sobreviveu a isto tudo.[3] Diga-se que as línguas anteriores influenciaram a maneira como a população aprendeu latim — e terão tido influência no particular percurso do latim até às várias línguas ibéricas. Essa influência é particularmente importante quando uma população adulta aprende outra língua. Um adulto já não consegue aprender uma língua como se fosse um falante nativo: a máquina de reconstruir a gramática começa a desligar-se na adolescência. Ora, se uma população adulta aprende uma língua, aprende-a de forma simplificada e com características fonéticas da sua língua materna. Ora, se muitos habitantes da nossa península aprenderam latim já na idade adulta, aprenderam-no como estrangeiros — e é desse latim mal aprendido que nasceram as nossas línguas…
Ora porque tinha sido trazido por soldados, ora porque tinha sido trazido por germanos que o tinham aprendido como adultos, ora porque foi aprendido na idade adulta pelas populações da península, o certo é que, pelas ruas da Península, o latim da população era diferente do latim de Roma — e do latim da escrita. Claro que a norma terá tido o seu efeito: muitos aprenderam o latim clássico e talvez alguns falassem quase como em Roma. Mas é dessas correntes de profundas mudanças que nasceram as nossas línguas de hoje em dia.
Nesta história abreviada, chegamos ao século VIII. Chegam os muçulmanos. A península divide-se em duas zonas. A sul, os muçulmanos governam e a população continua a falar o tal latim da rua, mas agora com muita influência da nova língua de prestígio: o árabe.
A norte, cria-se uma série de reinos, principados e condados cujo principal propósito era reconquistar território aos muçulmanos, para sul. A língua era ainda o latim, mas o latim que se afastava cada vez mais do latim clássico.
Nestas guerras entre norte e sul e nesta expansão vemos a história das línguas e dos povos actuais — entre elas a história da origem da língua portuguesa.
Qual era a situação por volta do ano 1000?
É um bom ano para pararmos um pouco nesta nossa viagem: redondo e fácil de encontrar nas cronologias.
No sul da Península, temos um grande território sob domínio muçulmano. Lá em cima, uma faixa cristã. Tirando a elite de língua árabe no Sul, quase toda a população da península fala qualquer coisa que descende do latim. Os cristãos sob domínio muçulmano falam um latim tardio a que hoje chamamos moçárabe. É um romance com muitas palavras árabes (compreensivelmente). Há-de ter alguma importância na história que estou a contar.
Ali num canto, onde os Pirenéus encontram o Atlântico, um velho povo resiste com a sua língua pré-latina. Aliás, pré-indo-europeia. Falo dos bascos. Nesse canto, o latim não entrou. Ou melhor, entrou, mas não fez desaparecer a língua que lá havia antes.
Deixemos, para já, o basco no seu recanto (havemos de lá voltar). Toda a faixa norte está ocupada pelos reinos, condados e demais entidades mais ou menos duradouras que se ocupam a ir conquistando a península de cima para baixo.
As fronteiras entre os reinos são muito, mas mesmo muito maleáveis. Surgem e desaparecem reinos entre a manhã e a tarde do mesmo dia. Talvez exagere: mas entre o nascimento e a morte de um rei, entram e saem territórios com grande à-vontade. Imagino que muitas pessoas tenham vivido a sua vida sem saber muito bem a que reino pertenciam.
Conhecemos alguns nomes: Astúrias, onde se deu a famosa – e provavelmente mítica – batalha de Covadonga. Aragão. Leão. Castela. Catalunha. Galiza. Portugal…
A lista acima está desordenada – não importa. O que importa, agora, é pensar na questão das línguas.
Pois, as línguas ibéricas, muito por culpa do processo de conquista, foram criadas nessa faixa norte e, depois, expandiram-se para sul, comendo o território ao moçárabe (que, no entanto, não desapareceu por completo — influenciou essas mesmas línguas no processo de expansão para sul).
Uma história em cinco faixas
Para percebermos o que se passou, dividamos a tal faixa norte em cinco parcelas, mais ou menos iguais, que correspondem a cinco línguas.

Isto é uma simplificação. Nas fronteiras entre as parcelas, havia muita mistura – aliás, estamos perante um continuum dialectal, ou seja, um território onde não há fronteiras muito definidas entre línguas (excepto, neste caso, as fronteiras do basco).
Esta divisão em cinco parcelas ajuda-nos muito a perceber a origem – e a situação actual – das línguas ibéricas. A sua expansão foi na vertical: de norte para sul – embora a língua central tenha começado a engordar, atropelando as vizinhas.
Comecemos a história pelo V, encostado ao Mediterrâneo, para terminar no I, encostado ao Atlântico.
Na faixa V, desenvolveu-se a língua que hoje conhecemos, em geral, como catalão. O catalão está muito próximo do occitano, uma língua falada no sul de França[4]. Está também próximo do francês. Isto, no que toca ao léxico. Note-se, por exemplo, palavras como «parlar», «manjar»… Ou «por», muito mais próximo do «peur» francês do que do «miedo» castelhano.
O catalão foi a língua principal da corte dos soberanos da Coroa de Aragão. Barcelona era a principal cidade, embora a capital fosse dupla: Saragoça e Barcelona. As línguas da corte eram também duas: aragonês e catalão. No entanto, na verdade, o catalão era a língua de mais prestígio, língua de Barcelona, a principal cidade marítima do território, língua por excelência daquela Coroa e da sua expansão pelo Mediterrâneo. Ainda hoje temos vestígios dessa expansão: há uma terra na Sardenha onde o catalão ainda se ouve entre as gerações mais velhas. Note-se que, em Valência, o nome habitual que se dá à língua própria da região é «valenciano» — se o valenciano é uma língua própria ou um nome alternativo para o catalão é discussão que ocupa muitos valencianos. Os linguistas, em geral, consideram o valenciano como um glotónimo (nome de língua) do catalão.
Saltemos (por agora) por cima da faixa IV e avancemos para a faixa do meio, a III. Falamos do castelhano — esta língua acabou por ser a língua de uma importantíssima coroa. Ganhou prestígio. Expandiu-se para sul, a cavalo da coroa castelhana — e pelo mundo a cavalo da expansão marítima. Entretanto, começou também a ser chamada «espanhol». Desta forma, é uma língua com dois glotónimos: «castelhano» e «espanhol». Com estes dois nomes, é língua de muitos países e oficial em toda a Espanha.
Repare-se que o castelhano surgiu encostado ao basco. Ora, isto tem a sua importância. Há características muito castelhanas, que distinguem a língua das sua vizinhas, que talvez tenham vindo do basco. Um dos exemplos por vezes apontados é a pobreza vocálica: tanto o basco como o castelhano têm poucas vogais (apenas cinco), enquanto as línguas vizinhas (o catalão e o português, por exemplo) têm muitas mais. Apetece dizer que o castelhano era o romance ibérico falado por gente habituada a ouvir e a falar basco.
O II e o IV são as duas faixas em que as línguas mais se perderam. Hoje, nenhuma delas é oficial, embora sejam reconhecidas como património cultural pelas Astúrias e por Aragão. Nestas faixas, a expansão para sul ficou cortada pela expansão do castelhano e do catalão. Hoje em dia, estão em perigo de desaparecer. A língua da faixa II, no entanto, é oficial… em Portugal! Sim, esta língua tem vários nomes e variedades. É o asturiano, mas também o leonês — ou o mirandês! O mirandês faz parte desta segunda faixa.
Chegamos, por fim, à faixa I. O galego — e o português… Tudo indica que a nossa língua começou nesse noroeste da Península, muito antes da criação de Portugal. Ninguém lhe daria nome, mas como estamos na Galécia, podemos falar de galécio — ou galego.
Quando chegamos ao século XII, a língua na rua era o tal galego, designado pelos seus falantes usando a palavra «linguagem» — era a linguagem da fala dos galegos e dos novíssimos portugueses. A língua dos documentos oficiais era, ainda, o latim. Note-se que, antes de se tornar oficial em Portugal, a língua foi usada, com muito proveito, para as produções artísticas da corte de vários reis. O rei castelhano Afonso X escreveu boa poesia na nossa língua!
Quando Afonso Henriques criou o reino de Portugal, a faixa I das línguas ibéricas, a mais ocidental, ficou dividida por uma fronteira política que veio a revelar-se uma das mais resistentes de todo o mundo. O Reino de Portugal expandiu-se de norte para sul e levou com ele a língua, que sofreu influências do moçárabe. Algumas gerações depois, a corte de D. Dinis transformou a tal linguagem trazida do Norte na língua oficial do reino. Em breve, começaria o processo de criação de uma norma escrita. Mas essa já é outra história…[5]
Este artigo é baseado numa secção do meu livro O Galego e o Português São a Mesma Língua?, publicado pela Através.
Referências e notas
A parte inicial do capítulo aqui reproduzido foi publicada nesta página com o título: «Pequena História das Línguas». O mapa é baseado no mapa preparado por Miguel Durán para o livro.
[1] Há mais línguas latinas, mas deixei apenas alguns exemplos. Em dálmata — uma língua já desaparecida — a palavra era «amaur». Referi essa língua no artigo «O que perdemos quando morre uma língua?»
[2] Há vários livros sobre o indo-europeu. Um volume que uso, por vezes, é Indo-European Language and Culture: An Introduction (John Wiley & Sons, 2011), de Benjamin W. Fortson IV.
[3] O basco já foi personagem destas paragens em muitos artigos. Proponho o seguinte: «Qual é a língua mais antiga do mundo?»
[4] Há uma pequena região da Catalunha onde o occitano é língua oficial, em conjunto com o catalão e o espanhol. Chama-se Vale de Aran e a língua tem, por lá, o nome de «aranês».
[5] Em breve, será publicado um livro de Fernando Venâncio, com um estudo aprofundado sobre a origem da nossa língua.
“poucas vogais (apenas cinco), enquanto as línguas vizinhas (o catalão e o português, por exemplo) têm muitas mais. ”
O português tem mais que cinco vogais? Está a considerar as vogais acentuadas como outras vogais?
Estou a falar de vogais enquanto sons e não enquanto letras. O português (de Portugal; o português brasileiro é diferente neste ponto) tem nove vogais orais e cinco vogais nasais — e temos ainda duas semivogais, que permitem criar ditongos. Não sendo perfeito, o artigo da Wikipédia tem informações relevantes: https://pt.m.wikipedia.org/wiki/Fonologia_da_l%C3%ADngua_portuguesa
Deixo aqui outra descrição das vogais do português europeu: http://cvc.instituto-camoes.pt/cpp/acessibilidade/capitulo3_2.html. Será um bom tema para um artigo futuro. 🙂
Leituras sempre amenas e cativantes. Obrigado.
Gostei muito desta publicação que considero muito interessante. Aliás, é de extrema importância termos conhecimento das nossas origens nas suas mais diversas formas.
Isso e outros factores que nos vão enriquecendo através dos tempos contribuem para uma compreensão mais apurada de modos de viver, de sentir e de entender afinal. Muito grata pelas suas publicações !
Concordo inteiramente e por isso reforço está opinião.
Eu amo essas postagens sobre línguas romanicas .
Impossível, a qualquer amante de Línguas e Literatura, não dar um mergulho na História para melhor as entender!
Muito obrigada por este artigo! A Ucrânia aparece muito em pesquisas históricas. Quanto mais para trás se vai, mais aparece. Para mim, tem sido uma agradável surpresa 🙂
Obrigado pelo artigo Professor Marco Neves.
Tendo em conta o substrato comum do Indo-europeu e que os Roma já lidava com Celtas à 200 anos, será possível que os Romanos conseguiam ter uma conversa com os antigos habitantes do actual território Português sem precisar de tradutores? É que eu já li autores com Estrabão, Políbio, Tito Livio entre outros e não me lembro de referencia a tradutores. A única passagem que fala em dificuldades linguísticas é no norte junto ao Rio do esquecimento, o Letes. Talvez houvessem muitas palavras comuns e as mãos fariam o resto? Será que o peso da Latim não deveria ser ligeiramente desvalorizado em detrimento de uma maior importância ao substrato Celta?
Infelizmente não corrigi o texto correctamente. Peço desculpa pela falta de atenção e aqui vai a correção.
Obrigado pelo artigo Professor Marco Neves.
Tendo em conta o substrato comum do Indo-europeu e que Roma já lidava com os Celtas à 200 anos, será possível que os Romanos conseguiriam ter uma conversa com os antigos habitantes do actual território Português sem precisar de tradutores? É que eu já li autores como Estrabão, Políbio, Tito Livio entre outros e não me lembro de referencias a tradutores. A única passagem que fala em dificuldades linguísticas é no norte junto ao Rio do esquecimento, o Letes. Talvez houvessem muitas palavras comuns e as mãos fariam o resto? Será que o peso da Latim não deveria ser ligeiramente desvalorizado em detrimento de uma maior importância do substrato Celta? As palavras cognatas atribuem a quem? Aos Romanos ou aos Celtas?
Obrigado pela atenção.
Excelente reflexão, Duarte. Seria interessante um artigo sobre o peso das Línguas Célticas sobre a Língua que falamos hoje.
O senhor professor Marco Neves ir-me-á desculpar, certamente, por fazer comentários fora do contexto, nos quais os mesmos poderão ser produzidos. Sou um idoso novato nestas coisas.
Linguística, história e Paleografia, Genética, não referindo modernas tecnologias químicas e físicas, são ciências que muitas vezes se complementam no avanço do conhecimento do passado.
Gostaria de deixar aos interessados na investigação o possível contributo, especialmente nas línguas ibéricas, por um povo – os Yamna – que há cerca de 4 500 anos chegaram à Península Ibérica, vindos da margem norte do Mar Cáspio. (Ao tempo, o Latim estava por nascer!
Como ponto de partida para uma leitura mais aprofundada, deixo aqui a indicação de um artigo da Revista SUPER Interessante, nº 261, de Janeiro de 2020 – A Grande Invasão do Neolítico.
Pelo que li, este povo bélico, já teria encontrado, presumo, os Iberos. E que transformações, modificações, na língua já existente teriam originado. Parece-me um tema interessante para explorar, pelos que têm competência e meios para o fazer. Pela minha parte, fico à espera…
Obrigada pelo seu comentário. De vez em quando compro a super interessante, lembro-me de ter ficado naquela do compro não compro e acabei por não comprar esta. A palavra Yamna ressoou algures na minha mente talvez por ter folheado a tal revista. Vou ver se pesquiso mais sobre este povo. Obrigada, mais uma vez pela sugestão. A reforma dá tempo para estas coisas.
Gostei do artigo. A pré-história e a história “antiga”, assim como o desenvolvimento dos povos, interessa-me bastante. Vou tentar seguir.
Como sempre Marco Neves e leitores deslumbram quem se interessa pela língua portuguesa. Obrigado.
Prof. Marcos, recebo seus artigos com alegria, pois sou fascinada pelas línguas ibéricas, desde que por acaso descobri o falar catalão, o mirandês e as semelhanças da fala de meu avô com o falar galego. Como posso comprar o seu livro sobre o galego e o português, estando no Brasil? Há alguma representação da editora aqui no Brasil? Grata pelos caminhos fascinantes que seus artigos me abrem,
Ana
P.S. O Lagoa do meu nome surgiu na imigração do meu avô, que vinha de Tras-os-Montes, da Quinta da Lagoa. O Mascia é da minha avó, que vinha da Sardenha. Macia como o Francesc, que fez a consolidação da nacionalidade catalã (nome de uma das avenidas de Barcelona); e como os Macías que vivem na Galizia.
Na parte do texto com o título “Qual era a situação por volta do ano 1000?”, umas vezes o sul é também nomeado por “baixo” e o norte nomeado por “cima”.
Creio ser melhor guardar o “baixo” e o “cima”, apenas quando nos referimos a altitude.
Em muitos mapas antigos, era mais ou menos aleatória a posição da linha de costa em relação aos pontos cardeais. Os mapas faziam-se geralmente através de observações feitas do mar para a terra. Convencionou-se, a partir de dada altura, ser a parte de cima do mapa, a direção norte. Mas realmente as direções só têm sentido quando consideramos a horizontal. Assim “…de norte para o sul” em vez de “…de cima para baixo”.
Bom dia! Muito obrigado pelo comentário. Usar “cima” e “baixo” é uma forma de expressão habitual, ligada à orientação convencional dos nossos mapas. Não me parece que tire clareza ao texto. Mas tem toda a razão em relação à natureza convencional da orientação dos mapas. Escrevi uma crónica sobre o assunto, que lhe deixo, se me permitir: https://certaspalavras.pt/portugal-de-barriga-para-baixo/ Muito obrigado!
Ontem deveria ter começado por lhe dizer como tanto me agradam as suas crónicas e os seus livros. Só os conheci um pouco antes da pandemia. E realmente não valerá a pena ser tão purista. A língua vai andando por aí a fora, dando novos sentidos às palavras.
Muito interessante e instrutivo, obrigada.