Contrações coloquiais de palavras, começando por um apóstrofo

Bautastein

Member
Norwegian - Norway
Olá

Eu estou a tentar limpar dados de frequências de uso de palavras portuguesas, para usar num programa de computador. Infelizmente, os dados crus incluem contrações coloquiais. Muitas palavras no conjunto de dados começam por um apóstrofo. Por exemplo:

'cola
'paço
'pécie
'tado
'tudo

Nestes casos, vejo que substituir o apóstrofo por "es", normalmente faz sentido:

'cola -> escola
'paço -> espaço
'pécie -> espécie
'tado -> estado
'tudo -> estudo

A maioria das vezes, a forma não contraída tem frequência superior à forma contraída, como:

'cola (frequência 10055) -> escola (frequência 66716)

Algumas vezes é o inverso, que me leva a perguntar se a minha transcrição pode ser errada:

'telionato (frequencia 260)estelionato (frequência 219)
'tresse (frequência 207)estresse (frequência 147)
'copeta (frequência 149)escopeta (frequência 87)
'tocagem (frequência 61)estocagem (frequência 58)
'tipulação (frequência 58)estipulação (frequência 57)
'paguete (frequência 42)espaguete (frequência 24)
'tadualização (frequência 33)estadualização (frequência 9)
'frega (frequência 22)esfrega (frequência 23)

Portanto, eu pergunto ao forum: Vendo as formas à esquerda, acham que as formas à direita são complementares? Em particular, eu pergunto-me se a forma 'tresse pode ser uma contração da palavra "interesse" em vez de "estresse". Neste nível baixo de frequência, é também possível que as formas sejam erros de ortografia. Infelizmente eu não tenho acesso aos fontes com contexto.
 
Last edited:
  • Não reconheço qualquer dessas palavras como contrações válidas, que se dirá de coloquiais. Haverá aí algo que nos escapa. Suspeito que o ' não seja apóstrofo, mas algum tipo de coringa lógico, o que explicaria a frequência da palavra incompleta ser maior que a completa. Não tenho hipóteses para o caso inverso.
     
    Muito obrigado. Você diria a mesma coisa, que as palavras não são contrações validas, em relação às palavras na primeira lista também? Por exemplo: 'cola -> escola? Eu tentei pesquisar a palavra 'cola, (com apóstrofo), no corpo da Linguateca, todos juntos, e a pesquisa retornou grande número de resultados. Por exemplo:

    Nunca foi à 'cola.
    Quando eu 'tava no ginásio, um rapaz da 'cola se assumiu homossexual.
    Não, mas eles tiveram problemas na 'cola

    Nestes casos, a palavra "escola" parece-me um bom substituto. Portanto, parece-me que o ' tem de ser um apóstrofo, e não outra coisa. A pesquisa por 'telionato retornou muitos resultados que tinham a ver com algum tipo de fraude, como:

    Fui condenado a 13 anos por 'telionato
    Segundo a polícia, 'se tipo de investimento é considerado 'telionato

    A palavra "estelionato" parece-me muito rara, porque eu não a encontrei no dicionário de WordReference, eu só a encontrei no dicionário brasileiro "Dicio". Eu não coloquei um link porque eu acho que o WordReference não gosta de links para sítios comerciais. De qualquer modo, segundo o dicionário, "estelionato" significa um tipo de fraude.

    Eu também descobri que muitos dos textos no corpo são muito velhos, ou não comuns como transcrições de entrevistas feitas por linguistas, portanto pode ser que estas contrações sejam muito raras, como anomalias. Os dados de frequência provêm deste corpo.
     
    Last edited:
    Não entendo sinceramente o que possa ser isto. Esse ['] não servirá justamente para buscas digitais apenas? Como se em inglês se procurasse por 'ake, de que resultaria take, cake, fake, etc., sem que exista nenhuma palavra ou forma ake (acho eu).

    De tudo o que li, a única coisa que faz sentido é «eu 'tava no ginásio». Nunca encontrei nenhuma das outras palavras ou formas na escrita ou na fala. Lamento não poder ajudar mais que isto - mas fiquei intrigado :).
     
    Muito obrigado. Neste caso, parece que não é só minha falta de compreensão de português. Vou tentar descobrir se é possível contactar as linguistas que mantêm os corpos do projeto Linguateca.
     
    Você diria a mesma coisa, que as palavras não são contrações validas, em relação às palavras na primeira lista também?
    Julgo que toda codificação, canônica ou não, abonada pelos dicionários ou não, é válida se alguém a constrói com um propósito e outro alguém a compreende corretamente. Daí a vernacular vai caminho. Contrações são fenômenos afetos à fonologia, matéria na qual me confesso leigo. O que posso dizer é que, embora compreenda (dentro de um contexto) 'cola, eu não imagino em que situação essa forma possa ser usada naturalmente, na fala cotidiana.
     
    Não entendo sinceramente o que possa ser isto. Esse ['] não servirá justamente para buscas digitais apenas? Como se em inglês se procurasse por 'ake, de que resultaria take, cake, fake, etc., sem que exista nenhuma palavra ou forma ake (acho eu).
    É também o que pensei, já que, exceto por 'tar' (estar), nenhuma das outras palavras ocorre.
     
    Back
    Top