La liste Swadesh est une liste de mots appartenant à une partie du lexique la plus résistante au changement, établie par le linguiste et anthropologue américain Morris Swadesh, dans les années 1940-1950.
Elle est utilisée en linguistique comparée, en linguistique historique et aussi en anthropologie pour notamment identifier le lexique de base de toute langue étudiée pour la première fois, ainsi qu'établir le degré de proximité de deux ou plusieurs langues.
Swadesh étudia de nombreuses langues, surtout une vingtaine de langues amérindiennes du Canada, des États-Unis et du Mexique. Devant faire des recherches sur des langues presque éteintes, avec des moyens limités, il éprouva le besoin d’une procédure standardisée pour rassembler des données essentielles concernant la parenté entre langues. À cet effet, il créa une liste de mots selon le postulat suivant :
Bien que des mots disparaissent de toute langue, étant remplacés par d’autres au cours du temps, certaines parties du lexique sont moins exposées au changement que d’autres. C’est pourquoi on peut définir un lexique de base se rapportant à des notions véhiculées dans toutes les langues. Les pronoms, les numéraux, certains adjectifs (« grand », « petit », « long », « court »), certains termes désignant des degrés de parenté (« mère », « père »), des parties du corps (« œil », « oreille », « tête »), des événements ou des objets naturels (« pluie », « pierre », « étoile »), des états et des actions élémentaires (« voir », « entendre », « venir », « donner ») sont peu sujets au remplacement par des emprunts.
Par exemple, le lexique général de l’anglais est emprunté à 50 % environ, mais ce pourcentage diminue à 6 % pour ce qui est du lexique de base. Ainsi, dans la liste Swadesh de 100 mots de l’anglais, il n’y a qu’un seul mot qui ne provienne pas du lexique de base proto-germanique (mountain – « montagne », d’origine française, introduit par les Normands). Un autre exemple est celui de l’albanais et du grec moderne. L’albanais a perdu 90 % de ses mots propres d’origine indo-européenne, beaucoup plus que le grec, mais si l’on considère la liste Swadesh de 100 mots, le pourcentage de pertes est à peu près égal pour les deux langues (25 à 26 %).
Pour créer sa liste, Swadesh a choisi un lexique de base que l’on retrouve dans le plus de langues possible, le plus indépendant possible de l’environnement naturel et de la culture locale. Il a commencé par une liste de 225 mots, qu’il a réduite plus tard à 215, puis à 200, arrivant finalement à une variante de 100 mots. On utilise fréquemment une liste de 207 mots, formée de la liste de 200, plus sept de la liste de 100 absents de celle de 200.
Swadesh a utilisé sa liste pour mesurer la ressemblance, c’est-à-dire le degré de parenté de deux langues, par la méthode quantitative de la lexicostatistique, en établissant le pourcentage de mots d’origine commune. Plus la ressemblance entre les lexiques des deux langues est grande, plus elles sont proches génétiquement, et plus le temps écoulé depuis le moment où elles se sont séparées est court. Selon lui, si le lexique de base de deux langues contient des mots apparentés à raison de 70 %, on peut considérer qu’elles ont évolué à partir d’une même langue. Si ce pourcentage dépasse 90 %, alors ces langues sont des parentes proches.
Établir le degré de proximité de deux ou plusieurs langues données permet ensuite d'établir, à partir d’une matrice de ressemblances quantitativement pertinentes, un dendrogramme à portée phénétiques ou cladistiques des langues comparées. L'élicitation des concepts de la liste dans un ensemble précis de langues permet donc de mesurer les distances interlinguistiques à des fins phylogénétiques.
Dans ce but, Swadesh a pris comme postulat que le taux de perte du lexique de base initial ne change pratiquement pas, les mots étant remplacés à un rythme à peu près constant, alors que dans le cas du reste du lexique, qui est étroitement lié à des facteurs culturels, le taux de perte variant en fonction des contacts que les locuteurs ont eu avec des cultures qui leur sont étrangères. À cause de ce postulat, la méthode de datation des langues proposée par Swadesh fut comparée à la détermination de l’âge des fossiles à partir de la désintégration radioactive du carbone 14, qui est constante.
À la suite d’une recherche sur treize langues (indo-européennes pour la plupart) qui ont des attestations écrites sur une longue période, à partir de la liste Swadesh de 100 mots, on a calculé un taux de conservation de 86 % sur une période de 1 000 ans, qu’on a considéré comme constant et généralisé à toutes les langues.
Étant donné le pourcentage de mots d’origine commune et le taux de conservation du lexique de base sur 1 000 ans, le temps écoulé depuis la séparation de deux langues qui résultent d’une même langue d’origine peut être déterminé, avec une marge d’erreur calculable, selon la formule :
où c est le pourcentage de mots d’origine commune et r – le taux de conservation.
Par exemple, si le lexique de base de deux langues est apparenté à 70 %, alors on peut considérer qu’elles ont évolué à partir d’une même langue qui a existé douze siècles auparavant.
L’utilisation de la liste Swadesh fut contestée dès le début. On lui oppose les objections suivantes :
Malgré les objections, on reconnaît que la liste Swadesh et la lexicostatistique peuvent servir pour les investigations linguistiques de base, dans les situations où ni les techniques comparatives classiques ni la reconstitution interne ne sont praticables, ce qui était d’ailleurs l’idée de départ de Swadesh, ou comme simple outil de classification génétique préliminaire en anthropométrie,.
Un exemple d’une telle situation est celui où l’on ne dispose que de listes incomplètes de lexique, comme dans le cas de groupes de langues très grands, récemment attestées, telles les langues austronésiennes (1 000 environ) ou celles des aborigènes d'Australie (autour de 250). Pour de telles langues, la liste Swadesh peut être utilisée pour faire une première ébauche de leur répartition en groupes et sous-groupes, servant de point de départ pour une investigation historique à part entière, qui continue les classements et les reconstitutions.
À partir des mêmes principes, d’autres linguistes ont à leur tour élaboré des listes de lexique de base, en éliminant des mots de la liste Swadesh et en introduisant d’autres mots et/ou sens. Un exemple est la liste de 114 sens proposée par une équipe de l’Université russe d’État de sciences humaines, qui se trouve à la base du projet Global Lexicostatistical Database (Base de données lexicostatistique globale) (GDL). Une autre base de données de ce genre est Indo-European Lexical Cognacy Database (Base de données de mots apparentés indo-européens), à laquelle travaille une équipe de l’Institut de psycho-linguistique Max-Planck de Nimègue (Pays-Bas), à partir d’une liste de 200 mots proposée par Isidore Dyen.
Les mots en gras figurent également dans la liste de 100 mots.
This article uses material from the Wikipedia Français article Liste Swadesh, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Le contenu est disponible sous licence CC BY-SA 4.0 sauf mention contraire. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Français (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.