Publications des agents du Cirad

Cirad

La néographie dans un grand corpus de SMS français : 88milSMS

Roche M., Verine B., Lopez C., Panckhurst R.. 2016. In : García Palacios Joaquín (ed.), De Sterck Goedele (ed.), Linder Daniel (ed.), Maroto Nava (ed.) , Sánchez Ibáñez Miguel (ed.), Torres del Rey Jesús (ed.). La neología en las lenguas románicas: recursos, estrategias y nuevas orientaciones. Francfort : Peter Lang, p. 279-302. (Studien zur romanischen Sprachwissenschaft und interkulturellen Kommunikation, 110).

Depuis 2014, le corpus 88milSMS est disponible en téléchargement public (Panckhurst et al., 2014, http://88milsms.huma-num.fr/). Contenant plus de 88 000 SMS authentiques en français recueillis dans le cadre du projet sud4scienceLR (http://www.sud4science.org/), ce corpus anonymisé permet aux chercheurs d'analyser, en employant ou non des techniques de traitement automatique des langues (TAL), l'évolution de l'une des facettes de la langue française, l'écriture SMS (eSMS). Dans cet article, nous laisserons de côté la néologie dans sa dimension de créativité lexicale — dérivation, les mots-valises (cinglicité), les emprunts (now, wesh), l'écriture non intentionnée, correspondant souvent à des erreurs de saisie (tladucteur), ou l'écriture incluant des caractères spéciaux, des chiffres (resto+cine, Ar5gggggggh), (Détrie 2015), pour aborder plus spécifiquement la néographie, ou la créativité scripturale, bien que les frontières entre néologie (" une réalité difficile à cerner " selon Pruvost/Sablayrolles, 2012) et néographie soient parfois ténues (Cougnon 2015). Comme Anis (1998), nous désignons par néographie des variantes de graphie qui s'éloignent de la langue standardisée, souvent de manière délibérée, ludique, et qui sont très présentes et instables dans l'eSMS. Dans des travaux préliminaires, nous avons rencontré, entre autres, des phénomènes néographiques de substitution (o/eau, ossi/aussi, kikou/coucou, twa/toi), d'ajout (répétition de caractères/signes de ponctuation : booooooooof/bof, j'arrriiiiiiivvve !!!!!, ajouts de caractères : les zamours, représentations sémiologiques/frimousses/emoji, :), ^^, J), de suppression (signes diacritiques : europeen/européen, ponctuation), et de réduction, (abrègements morpho-lexicaux : mdr/mort de rire, apocopes : ordi/ordinateur, aphérèses : zou/bisou, suppression de consonnes doubles : ele/elle, fins de mots effacées : tro/trop, agglutinations : tetrangle, squelettes consonantiques : slt/salut, abréviations : qd/quand, abré

Documents associés

Chapitre d'ouvrage

Agents Cirad, auteurs de cette publication :